- Ingénieur logiciel avec plus de 10 ans d’expérience dans la création d’applications intensives en données. Principalement backend (legacy, cloud)
- (1) Est-ce une bonne idée de se réorienter ? (2) Certains l’ont-ils déjà fait ? (3) S’il n’y a pas de ML dans mon travail, comment puis-je m’y mettre ?
- Existe-t-il des postes d’ingénierie ML davantage centrés sur la gestion, le déploiement et le passage à l’échelle des modèles que sur leur construction ?
- Autrement dit, peut-on éviter d’apprendre toutes les mathématiques sous-jacentes ?
arnabgho
- Travaille comme tech lead MLE chez Snap et a posé les bases de l’infrastructure d’IA générative de Snap
- Recommande vivement la voie MLE, qui peut être une trajectoire de carrière très gratifiante
- Le livre "Designing Machine Learning Systems: An Iterative Process for Production-Ready Applications" est une très bonne introduction à la conception de systèmes de machine learning pour la production
- Recommande aussi vivement ce blog de l’autrice (Chip Huyen) comme introduction à la création de systèmes IA et ML de niveau production
Construire des applications LLM pour la production (avec lien vers un résumé et une traduction)
- Réponses aux questions
- (1) Oui, surtout à un moment comme aujourd’hui, qui marque un tournant dans l’époque
- (2) Oui
- (3) Voir ci-dessus pour des ressources sur la manière de débuter et de progresser en ingénierie ML
breckenedge
- S’y est mis il y a environ 7 mois dans le cadre d’un projet de 3 mois visant à créer un système de recommandation de contenu avec du ML
- A commencé avec une bibliothèque classique de filtrage collaboratif, puis a fini sur PyTorch, avec l’aide précieuse de ChatGPT
- Il aurait pu continuer dans cette voie, mais la direction voulait des résultats meilleurs et plus rapides, et trois mois étaient suffisants pour prendre le rythme quand on part de zéro
- Une grande partie du travail en ML a consisté à nettoyer et préparer les jeux de données, ce qui n’était pas très amusant
- Un dirigeant lui a recommandé d’essayer Amazon Personalize ; cela valait le coup, mais au final ça n’a pas abouti. Difficile de savoir si le problème venait des données ou du modèle de base
- Le principal problème avec les services ML en boîte noire est qu’on ne peut pas analyser ce qui se passe
- Amazon Personalize rend aussi difficile la modification de la couche de données, donc il est compliqué de savoir si l’on se rapproche d’une meilleure solution
- Un spécialiste ML expérimenté pourrait peut-être obtenir de meilleurs résultats avec Personalize
- Donc, si le ML vous attire, il vaut mieux faire un projet d’essai avant d’en faire une carrière, pour voir si cela vous plaît
nsyptras
- > Existe-t-il de l’ingénierie ML davantage centrée sur la gestion, le déploiement et l’extension des modèles que sur leur construction ?
- Oui, il s’est réorienté vers ce domaine en 2018. Cela s’appelle le MLOps. Avant, il était développeur mobile
- À l’époque, la transition était assez facile (même si la concurrence est peut-être plus forte aujourd’hui)
- Ce qu’il a fait :
- A mené seul un projet ML intensif et a réalisé qu’il aimait travailler sur toute la stack ML
- A aussi écrit un [article de blog]((https://www.nicksypteras.com/blog/aisu.html) sur ce projet
- A ensuite postulé dans une équipe MLOps en s’appuyant sur ce projet pour démontrer ses compétences et son expérience
- On peut peut-être éviter les maths, mais apprendre les bases rendra tout beaucoup plus facile
- Sans les bases mathématiques du ML, il aurait eu l’impression d’avancer complètement à l’aveugle
ilaksh
- Vous semblez penser au "MLOps". Le MLOps est lui aussi important
- Il conseille de s’exercer à déployer des modèles en Python avec HuggingFace et RunPod
- Il recommande aussi de chercher des tutoriels sur le pré-entraînement, le fine-tuning et l’évaluation des LLM, ainsi que de regarder Predibase
- Selon lui, le plus important aujourd’hui, ce sont les diffusion transformers
- Si vous trouvez de la documentation expliquant comment lancer des jobs d’entraînement pour cela, cela pourrait aider les gens
- Si vous voulez "tricher", regardez replicate.com.
cog peut aussi être utile pour auto-héberger des modèles ML en dehors de replicate.com
nottorp
- N’a pas exactement "basculé vers un poste d’ingénieur ML", mais a appris au cours des 2,5 derniers mois à utiliser des modèles publics, ainsi que des outils et API pour les entraîner et les exécuter
- A très peu codé et a surtout beaucoup lu
- Travailler avec une petite organisation (où l’on n’est pas enfermé dans un rôle et où l’on reçoit simplement des choses à faire) peut aider
trybackprop
- A écrit et partagé un billet de blog sur le sujet pour des ingénieurs logiciel expérimentés qui envisagent réellement de passer au ML
- Réponses
-
- Si vous aimez bricoler sur votre temps personnel, alors oui, cela peut être "judicieux". Avant de me réorienter, j’ai passé un an à étudier les ressources les soirs et week-ends, et c’est ainsi que j’ai commencé à vouloir en faire mon métier à plein temps
-
- Oui, et cela fait maintenant 7 ans que je travaille comme ingénieur ML après cette transition. Je suis actuellement responsable technique ML dans une FAANG. Avant cela, je travaillais dans l’infrastructure et le produit
-
- L’un des conseils qu’on m’a donnés il y a quelques années était de rejoindre une équipe proche des activités ML pour se familiariser avec ce à quoi ressemble le ML en production. On peut aussi commencer à s’entraîner à la pensée ML sur Kaggle.com
- Vous pouvez consulter d’autres billets de mon blog pour trouver des ressources afin d’apprendre l’IA/ML et les mathématiques nécessaires à ce métier
- Linear Algebra 101 for AI/ML – Part 1
- (avec un quiz interactif, les bases des vecteurs/matrices et une brève introduction à PyTorch, framework ML open source largement utilisé dans l’industrie).
deepGem
- Il recommande de regarder le cours fast.ai, "Practical Deep Learning for Coders
- Le contenu date de 2022, mais les principes qu’on y apprend restent aujourd’hui très valables et très utiles
- C’est particulièrement vrai pour le Self Attention, les transformers et les architectures récentes fondées sur ces concepts
- De nombreuses personnes ayant suivi le cursus fast.ai ont réorienté leur carrière non seulement vers l’ingénierie ML, mais aussi vers la recherche scientifique
- Ce n’est pas une formation facile, il faut donc y consacrer du temps libre
- Si vous vous intéressez au déploiement et au passage à l’échelle, vous pouvez même commencer directement par la leçon 2 de la partie 1. Jeremy est un excellent enseignant
- Comme je ne viens pas du monde académique, je trouve son style d’enseignement très sain
2 commentaires
Bonne lecture. Merci.
En Corée, il suffit de connaître le strict minimum, comme appeler une API ; les entreprises ne veulent pas investir de grosses sommes, mais elles veulent quand même suivre les tendances du moment... Une ambiance ambiguë, en somme.