20 points par ashbyash 2025-07-23 | Aucun commentaire pour le moment. | Partager sur WhatsApp

La stack de l’ingénierie IA

1. Structure en 3 couches de la stack d’ingénierie IA : tous les services IA sont construits sur trois couches clés.

1.1 Développement d’applications (Application Development)

  • Grâce à l’utilisation de modèles de fondation (Foundation Models), tout le monde peut développer rapidement des applications IA.
  • La différenciation du service dépend de la conception des prompts, de l’UI/UX utilisateur et du système d’évaluation.
  • Comme de plus en plus d’équipes utilisent des modèles similaires, les interfaces conviviales et les outils d’automatisation de l’évaluation deviennent essentiels.

1.2 Développement de modèles (Model Development)

  • Spécialisation autour du fine-tuning, de l’optimisation de l’inférence (Inference Optimization) et du dataset engineering.
  • Usage et personnalisation de modèles à grande échelle, avec l’émergence de divers LLM open source et de modèles multimodaux.
  • La fiabilité et la qualité sont au cœur du sujet (ex. : évaluation des réponses ouvertes, contrôle qualité des labels).

1.3 Infrastructure

  • Déploiement des modèles, exploitation de clusters GPU à grande échelle, passage à l’échelle du service, monitoring et gestion des incidents.
  • Le rythme d’innovation de l’infrastructure est relativement plus lent, mais son impact sur les performances et la maîtrise des coûts est majeur.

2. Ingénierie IA vs ingénierie ML : un changement de nature

2.1 Manière d’utiliser les modèles

  • ML traditionnel : entraînement de ses propres modèles (Machine Learning from scratch).
  • IA moderne : l’usage dominant consiste à appeler et exploiter de grands modèles préentraînés (using pre-trained models).
  • L’évaluation devient une tendance plus importante encore que le développement de modèles (en particulier pour les résultats open-ended).

2.2 Évolution des ressources et des compétences d’ingénierie

  • Capacité à exploiter des clusters de centaines à milliers de GPU (Scalable GPU infrastructure).
  • Pour une mise en production réelle, il faut gérer de gros volumes de données et utiliser les ressources avec une grande efficacité.

2.3 Innovation dans l’évaluation (Evaluation)

  • Évaluation à réponse courte (closed-ended) → nécessité de savoir traiter des sorties ouvertes (open-ended output).
  • Développement actif de systèmes d’évaluation automatiques et semi-automatiques (Auto evaluation system).

3. Personnalisation des modèles : prompt vs fine-tuning

3.1 Basé sur les prompts (Prompt-based)

  • Modification du comportement via le prompt engineering et la gestion du contexte (sans modifier les paramètres internes du modèle).
  • Nécessite peu de données. Expérimentation rapide, faible coût.
  • Limite : baisse de performance sur les tâches difficiles ou quand la complexité augmente.

3.2 Fine-tuning

  • Modification directe des poids du modèle, nécessite beaucoup de données, adapté aux besoins de haute performance.
  • Coût/temps en hausse, mais améliore à long terme la qualité du service, la vitesse et les coûts.

4. La granularité croissante de « l’entraînement »

  • Pré-entraînement (Pre-training) : construction initiale des grands modèles de fondation, réalisée uniquement par quelques très grandes entreprises ou institutions.
  • Fine-tuning : entraînement personnalisé à partir des poids d’un modèle existant, adapté à un problème précis ou aux données d’un client.
  • Post-training : terme utilisé de façon variable, mais qui englobe en pratique à la fois le fine-tuning et les mises à jour continues.

5. Dataset engineering : changement de statut des données

  • Transition vers des données non structurées (unstructured) comme les textes, images ou contenus multimodaux.
  • Difficulté accrue du labelling : un vrai savoir-faire est nécessaire pour gérer des résultats ouverts et imprévisibles.
  • La donnée devient l’essence même de la différenciation du service : disposer de datasets de haute qualité devient un avantage concurrentiel direct.
  • L’importance de la qualité des données, ainsi que des enjeux d’éthique et de confidentialité (Privacy/Ethics), est également mise en avant.

6. Tendances du développement d’applications IA

  • Alors que plusieurs organisations utilisent le même modèle de fondation (Foundation Model),
    • le prompt engineering (conception des entrées),
    • l’interface produit (UI/UX, chatbot, extension web, etc.),
    • et la conception de la boucle de feedback utilisateur deviennent essentielles.
  • La mise en œuvre de services IA légers sur l’edge et le mobile ouvre de nouvelles opportunités.

Évolution de l’approche de développement :

  • Avant : conception des données/modèles → mise en produit ensuite
  • Aujourd’hui : prototypage rapide du produit → investissement dans les données/modèles si nécessaire (Product first, Model/Data later)

7. IA vs ingénierie full stack : la disparition des frontières

  • Le rôle des développeurs frontend et full stack web/mobile s’élargit.
    • La capacité à combiner IA et interface devient un avantage concurrentiel en soi.
  • À l’ère des modèles de fondation et des plugins, il devient possible de lancer facilement des services IA sans backend complexe.
  • Schéma d’usage : prototypage rapide → feedback utilisateur → amélioration itérative.

8. Conclusion et perspectives

  • L’ingénierie IA prolonge l’ingénierie ML existante tout en exigeant une scalabilité et une innovation sans précédent.
  • Les modèles de fondation et l’écosystème IA open source sont au cœur de cette transformation.
  • À l’ère de la surcharge informationnelle, le besoin de frameworks clairs et de best practices ne cesse de croître.

[Référence et rédaction du résumé]

  • Original : Chip Huyen, 『AI Engineering』

Aucun commentaire pour le moment.

Aucun commentaire pour le moment.