Étude de cas
Le challenge
Détecter les fakes avec précision avec un entraînement rapide, peu couteux et un modèle léger
- Pouvoir détecter les images de TOUS les modèles de diffusion. Le modèle ddoit fonctionner sur NanoBanana Pro mais aussi Midjourney, Stable Diffusion, DALL-E.
- Entraîner un modèle rapidement et à moindre coût. Pour ça réutiliser les connaissances pré-existantes d'un modèle de vision.
- Réussir à constiuer un jeu de données Nano Banana Pro par scrapping malgrés peu d'images disponibles. Puis combiner des datasets scrappés Midjourney/DALL-E/SD et Nano Banana Pro pour une détection généralisée.
- Avoir un modèle faible latence. Doit pouvoir détecter en quelques secondes sur mobile.
Résultats et évaluation
- 🎯 Précision élevée rapidement atteinte : 8,5/10 image détectées correctement sur le dataset de test de 2000 images Midjourney/DALL-E/SD/Nano Banana Pro
- ⌛ Entraînement en seulement 3 minutes juste avec un Mac Pro M1, 1 seule passe sur le jeu de donnée!
- 🧠 Fine-tuning d'un modèle très léger, le MobileNetV3 Large par Transfer Learning : tuning de la dernière couche du modèle, le classifieur uniquement pour un entraînement ultra rapide et efficace.
- 💰 Zéro coûts d'API lors de l'inférence étant donné que c'est un modèle personnel.
- ⚡ Le modèle a une faible latence.

Montoring dans LangSmith
Et voilà. De bons résultats pour un POC, sans optimisations et avec un modèle très léger pourtant.
Prendre contact
On discute ?
Remplissez le formulaire ci-dessous et je vous recontacte dans les 24-48 heures.

