21 points par narubrown 2026-01-01 | Aucun commentaire pour le moment. | Partager sur WhatsApp

Réduction de 96 % du coût de l’annotation d’images : dans un contexte où le budget et le temps manquent, ce cas concret d’ingénierie montre comment une fonctionnalité clé a été mise en œuvre en remplaçant le travail répétitif humain par un pipeline logiciel.

Résumé des points clés
• Constat du problème : il n’existait pas de modèle adapté à la reconnaissance et à l’enregistrement automatiques de poupées de personnages célèbres, et l’annotation humaine montrait clairement ses limites en coût, en vitesse et en passage à l’échelle.
• Approche : au lieu de se demander « faut-il mobiliser plus de personnes ? », le processus de jugement humain a été décomposé et transformé en pipeline système.

Conception d’un pipeline d’automatisation en 4 étapes
1. Filtrage CLIP – suppression massive des images inutiles pour réduire les coûts liés au LLM
2. Détection YOLO – recadrage du seul objet principal afin de réduire le périmètre d’analyse
3. Étiquetage LVM – utilisation d’un VLM haute performance uniquement sur les données nettoyées
4. Vérification LVM – validation conditionnelle fondée sur le niveau de confiance pour réduire encore le nombre d’appels

Résultats :
• coût de l’annotation humaine : environ 2,16 millions de wons → 90 000 wons
• environ 95,7 % de réduction des coûts, et un temps de travail ramené de plusieurs jours à quelques heures
• valeur fondamentale : au-delà d’une économie ponctuelle, mise en place d’un système réutilisable

Cela démontre que les limites du capital peuvent être dépassées par la technologie, et que le logiciel est un outil capable de transformer un problème de coût en problème de structure.

Aucun commentaire pour le moment.

Aucun commentaire pour le moment.