La stack de l’ingénierie IA
1. Structure en 3 couches de la stack d’ingénierie IA : tous les services IA sont construits sur trois couches clés.
1.1 Développement d’applications (Application Development)
- Grâce à l’utilisation de modèles de fondation (Foundation Models), tout le monde peut développer rapidement des applications IA.
- La différenciation du service dépend de la conception des prompts, de l’UI/UX utilisateur et du système d’évaluation.
- Comme de plus en plus d’équipes utilisent des modèles similaires, les interfaces conviviales et les outils d’automatisation de l’évaluation deviennent essentiels.
1.2 Développement de modèles (Model Development)
- Spécialisation autour du fine-tuning, de l’optimisation de l’inférence (Inference Optimization) et du dataset engineering.
- Usage et personnalisation de modèles à grande échelle, avec l’émergence de divers LLM open source et de modèles multimodaux.
- La fiabilité et la qualité sont au cœur du sujet (ex. : évaluation des réponses ouvertes, contrôle qualité des labels).
1.3 Infrastructure
- Déploiement des modèles, exploitation de clusters GPU à grande échelle, passage à l’échelle du service, monitoring et gestion des incidents.
- Le rythme d’innovation de l’infrastructure est relativement plus lent, mais son impact sur les performances et la maîtrise des coûts est majeur.
2. Ingénierie IA vs ingénierie ML : un changement de nature
2.1 Manière d’utiliser les modèles
- ML traditionnel : entraînement de ses propres modèles (Machine Learning from scratch).
- IA moderne : l’usage dominant consiste à appeler et exploiter de grands modèles préentraînés (using pre-trained models).
- L’évaluation devient une tendance plus importante encore que le développement de modèles (en particulier pour les résultats open-ended).
2.2 Évolution des ressources et des compétences d’ingénierie
- Capacité à exploiter des clusters de centaines à milliers de GPU (Scalable GPU infrastructure).
- Pour une mise en production réelle, il faut gérer de gros volumes de données et utiliser les ressources avec une grande efficacité.
2.3 Innovation dans l’évaluation (Evaluation)
- Évaluation à réponse courte (closed-ended) → nécessité de savoir traiter des sorties ouvertes (open-ended output).
- Développement actif de systèmes d’évaluation automatiques et semi-automatiques (Auto evaluation system).
3. Personnalisation des modèles : prompt vs fine-tuning
3.1 Basé sur les prompts (Prompt-based)
- Modification du comportement via le prompt engineering et la gestion du contexte (sans modifier les paramètres internes du modèle).
- Nécessite peu de données. Expérimentation rapide, faible coût.
- Limite : baisse de performance sur les tâches difficiles ou quand la complexité augmente.
3.2 Fine-tuning
- Modification directe des poids du modèle, nécessite beaucoup de données, adapté aux besoins de haute performance.
- Coût/temps en hausse, mais améliore à long terme la qualité du service, la vitesse et les coûts.
4. La granularité croissante de « l’entraînement »
- Pré-entraînement (Pre-training) : construction initiale des grands modèles de fondation, réalisée uniquement par quelques très grandes entreprises ou institutions.
- Fine-tuning : entraînement personnalisé à partir des poids d’un modèle existant, adapté à un problème précis ou aux données d’un client.
- Post-training : terme utilisé de façon variable, mais qui englobe en pratique à la fois le fine-tuning et les mises à jour continues.
5. Dataset engineering : changement de statut des données
- Transition vers des données non structurées (unstructured) comme les textes, images ou contenus multimodaux.
- Difficulté accrue du labelling : un vrai savoir-faire est nécessaire pour gérer des résultats ouverts et imprévisibles.
- La donnée devient l’essence même de la différenciation du service : disposer de datasets de haute qualité devient un avantage concurrentiel direct.
- L’importance de la qualité des données, ainsi que des enjeux d’éthique et de confidentialité (Privacy/Ethics), est également mise en avant.
6. Tendances du développement d’applications IA
- Alors que plusieurs organisations utilisent le même modèle de fondation (Foundation Model),
- le prompt engineering (conception des entrées),
- l’interface produit (UI/UX, chatbot, extension web, etc.),
- et la conception de la boucle de feedback utilisateur deviennent essentielles.
- La mise en œuvre de services IA légers sur l’edge et le mobile ouvre de nouvelles opportunités.
Évolution de l’approche de développement :
- Avant : conception des données/modèles → mise en produit ensuite
- Aujourd’hui : prototypage rapide du produit → investissement dans les données/modèles si nécessaire (Product first, Model/Data later)
7. IA vs ingénierie full stack : la disparition des frontières
- Le rôle des développeurs frontend et full stack web/mobile s’élargit.
- La capacité à combiner IA et interface devient un avantage concurrentiel en soi.
- À l’ère des modèles de fondation et des plugins, il devient possible de lancer facilement des services IA sans backend complexe.
- Schéma d’usage : prototypage rapide → feedback utilisateur → amélioration itérative.
8. Conclusion et perspectives
- L’ingénierie IA prolonge l’ingénierie ML existante tout en exigeant une scalabilité et une innovation sans précédent.
- Les modèles de fondation et l’écosystème IA open source sont au cœur de cette transformation.
- À l’ère de la surcharge informationnelle, le besoin de frameworks clairs et de best practices ne cesse de croître.
[Référence et rédaction du résumé]
- Original : Chip Huyen, 『AI Engineering』
Aucun commentaire pour le moment.