Comment se réorienter vers un poste d’ingénieur en machine learning ?

xguru · 2024-07-02T11:16:02+09:00

Ingénieur logiciel avec plus de 10 ans d’expérience dans la création d’applications intensives en données. Principalement backend (legacy, cloud) (1) Est-ce une bonne idée de se réorienter ? (2) Certains l’ont-ils déjà fait ? (3) S’il n’y a pas de ML dans mon travail, comment puis-je m’y mettre ? Existe-t-il des postes d’ingénierie ML davantage centrés sur la gestion, le déploiement et le passage à l’échelle des modèles que sur leur construction ? Autrement dit, peut-on éviter d’apprendre toutes les mathématiques sous-jacentes ? arnabgho Travaille comme tech lead MLE chez Snap et a posé les bases de l’infrastructure d’IA générative de Snap Recommande vivement la voie MLE, qui peut être une trajectoire de carrière très gratifiante Le livre "Designing Machine Learning Systems: An Iterative Process for Production-Ready Applications" est une très bonne introduction à la conception de systèmes de machine learning pour la production Recommande aussi vivement ce blog de l’autrice (Chip Huyen) comme introduction à la création de systèmes IA et ML de niveau production Construire des applications LLM pour la production (avec lien vers un résumé et une traduction) Réponses aux questions (1) Oui, surtout à un moment comme aujourd’hui, qui marque un tournant dans l’époque (2) Oui (3) Voir ci-dessus pour des ressources sur la manière de débuter et de progresser en ingénierie ML breckenedge S’y est mis il y a environ 7 mois dans le cadre d’un projet de 3 mois visant à créer un système de recommandation de contenu avec du ML A commencé avec une bibliothèque classique de filtrage collaboratif, puis a fini sur PyTorch, avec l’aide précieuse de ChatGPT Il aurait pu continuer dans cette voie, mais la direction voulait des résultats meilleurs et plus rapides, et trois mois étaient suffisants pour prendre le rythme quand on part de zéro Une grande partie du travail en ML a consisté à nettoyer et préparer les jeux de données, ce qui n’était pas très amusant Un dirigeant lui a recommandé d’essayer Amazon Personalize ; cela valait le coup, mais au final ça n’a pas abouti. Difficile de savoir si le problème venait des données ou du modèle de base Le principal problème avec les services ML en boîte noire est qu’on ne peut pas analyser ce qui se passe Amazon Personalize rend aussi difficile la modification de la couche de données, donc il est compliqué de savoir si l’on se rapproche d’une meilleure solution Un spécialiste ML expérimenté pourrait peut-être obtenir de meilleurs résultats avec Personalize Donc, si le ML vous attire, il vaut mieux faire un projet d’essai avant d’en faire une carrière, pour voir si cela vous plaît nsyptras Existe-t-il de l’ingénierie ML davantage centrée sur la gestion, le déploiement et l’extension des modèles que sur leur construction ? Oui, il s’est réorienté vers ce domaine en 2018. Cela s’appelle le MLOps. Avant, il était développeur mobile À l’époque, la transition était assez facile (même si la concurrence est peut-être plus forte aujourd’hui) Ce qu’il a fait : A mené seul un projet ML intensif et a réalisé qu’il aimait travailler sur toute la stack ML A aussi écrit un [article de blog]((https://www.nicksypteras.com/blog/aisu.html) sur ce projet A ensuite postulé dans une équipe MLOps en s’appuyant sur ce projet pour démontrer ses compétences et son expérience On peut peut-être éviter les maths, mais apprendre les bases rendra tout beaucoup plus facile Sans les bases mathématiques du ML, il aurait eu l’impression d’avancer complètement à l’aveugle ilaksh Vous semblez penser au "MLOps". Le MLOps est lui aussi important Il conseille de s’exercer à déployer des modèles en Python avec HuggingFace et RunPod Il recommande aussi de chercher des tutoriels sur le pré-entraînement, le fine-tuning et l’évaluation des LLM, ainsi que de regarder Predibase Selon lui, le plus important aujourd’hui, ce sont les diffusion transformers Si vous trouvez de la documentation expliquant comment lancer des jobs d’entraînement pour cela, cela pourrait aider les gens Si vous voulez "tricher", regardez replicate.com. cog peut aussi être utile pour auto-héberger des modèles ML en dehors de replicate.com nottorp N’a pas exactement "basculé vers un poste d’ingénieur ML", mais a appris au cours des 2,5 derniers mois à utiliser des modèles publics, ainsi que des outils et API pour les entraîner et les exécuter A très peu codé et a surtout beaucoup lu Travailler avec une petite organisation (où l’on n’est pas enfermé dans un rôle et où l’on reçoit simplement des choses à faire) peut aider trybackprop A écrit et partagé un billet de blog sur le sujet pour des ingénieurs logiciel expérimentés qui envisagent réellement de passer au ML You Don't Need a Masters/PhD – How These 9 Engineers Broke Into ML L’article présente divers cas d’ingénieurs chez Meta, Google, Amazon et OpenAI qui ont effectué cette transition Vous pouvez voir quelles stratégies et tactiques ils ont utilisées Réponses Si vous aimez bricoler sur votre temps personnel, alors oui, cela peut être "judicieux". Avant de me réorienter, j’ai passé un an à étudier les ressources les soirs et week-ends, et c’est ainsi que j’ai commencé à vouloir en faire mon métier à plein temps Oui, et cela fait maintenant 7 ans que je travaille comme ingénieur ML après cette transition. Je suis actuellement responsable technique ML dans une FAANG. Avant cela, je travaillais dans l’infrastructure et le produit L’un des conseils qu’on m’a donnés il y a quelques années était de rejoindre une équipe proche des activités ML pour se familiariser avec ce à quoi ressemble le ML en production. On peut aussi commencer à s’entraîner à la pensée ML sur Kaggle.com Vous pouvez consulter d’autres billets de mon blog pour trouver des ressources afin d’apprendre l’IA/ML et les mathématiques nécessaires à ce métier Linear Algebra 101 for AI/ML – Part 1 (avec un quiz interactif, les bases des vecteurs/matrices et une brève introduction à PyTorch, framework ML open source largement utilisé dans l’industrie). deepGem Il recommande de regarder le cours fast.ai, "Practical Deep Learning for Coders Le contenu date de 2022, mais les principes qu’on y apprend restent aujourd’hui très valables et très utiles C’est particulièrement vrai pour le Self Attention, les transformers et les architectures récentes fondées sur ces concepts De nombreuses personnes ayant suivi le cursus fast.ai ont réorienté leur carrière non seulement vers l’ingénierie ML, mais aussi vers la recherche scientifique Ce n’est pas une formation facile, il faut donc y consacrer du temps libre Si vous vous intéressez au déploiement et au passage à l’échelle, vous pouvez même commencer directement par la leçon 2 de la partie 1. Jeremy est un excellent enseignant Comme je ne viens pas du monde académique, je trouve son style d’enseignement très sain

(news.ycombinator.com)

38 points par xguru 2024-07-02 | 2 commentaires | Partager sur WhatsApp

Ingénieur logiciel avec plus de 10 ans d’expérience dans la création d’applications intensives en données. Principalement backend (legacy, cloud)
(1) Est-ce une bonne idée de se réorienter ? (2) Certains l’ont-ils déjà fait ? (3) S’il n’y a pas de ML dans mon travail, comment puis-je m’y mettre ?
Existe-t-il des postes d’ingénierie ML davantage centrés sur la gestion, le déploiement et le passage à l’échelle des modèles que sur leur construction ?
- Autrement dit, peut-on éviter d’apprendre toutes les mathématiques sous-jacentes ?

arnabgho

Travaille comme tech lead MLE chez Snap et a posé les bases de l’infrastructure d’IA générative de Snap
- Recommande vivement la voie MLE, qui peut être une trajectoire de carrière très gratifiante
Le livre "Designing Machine Learning Systems: An Iterative Process for Production-Ready Applications" est une très bonne introduction à la conception de systèmes de machine learning pour la production
Recommande aussi vivement ce blog de l’autrice (Chip Huyen) comme introduction à la création de systèmes IA et ML de niveau production
Construire des applications LLM pour la production (avec lien vers un résumé et une traduction)
Réponses aux questions
- (1) Oui, surtout à un moment comme aujourd’hui, qui marque un tournant dans l’époque
- (2) Oui
- (3) Voir ci-dessus pour des ressources sur la manière de débuter et de progresser en ingénierie ML

breckenedge

S’y est mis il y a environ 7 mois dans le cadre d’un projet de 3 mois visant à créer un système de recommandation de contenu avec du ML
A commencé avec une bibliothèque classique de filtrage collaboratif, puis a fini sur PyTorch, avec l’aide précieuse de ChatGPT
Il aurait pu continuer dans cette voie, mais la direction voulait des résultats meilleurs et plus rapides, et trois mois étaient suffisants pour prendre le rythme quand on part de zéro
Une grande partie du travail en ML a consisté à nettoyer et préparer les jeux de données, ce qui n’était pas très amusant
Un dirigeant lui a recommandé d’essayer Amazon Personalize ; cela valait le coup, mais au final ça n’a pas abouti. Difficile de savoir si le problème venait des données ou du modèle de base
Le principal problème avec les services ML en boîte noire est qu’on ne peut pas analyser ce qui se passe
Amazon Personalize rend aussi difficile la modification de la couche de données, donc il est compliqué de savoir si l’on se rapproche d’une meilleure solution
Un spécialiste ML expérimenté pourrait peut-être obtenir de meilleurs résultats avec Personalize
Donc, si le ML vous attire, il vaut mieux faire un projet d’essai avant d’en faire une carrière, pour voir si cela vous plaît

nsyptras

Existe-t-il de l’ingénierie ML davantage centrée sur la gestion, le déploiement et l’extension des modèles que sur leur construction ?
Oui, il s’est réorienté vers ce domaine en 2018. Cela s’appelle le MLOps. Avant, il était développeur mobile
À l’époque, la transition était assez facile (même si la concurrence est peut-être plus forte aujourd’hui)
Ce qu’il a fait :
- A mené seul un projet ML intensif et a réalisé qu’il aimait travailler sur toute la stack ML
- A aussi écrit un [article de blog]((https://www.nicksypteras.com/blog/aisu.html) sur ce projet
- A ensuite postulé dans une équipe MLOps en s’appuyant sur ce projet pour démontrer ses compétences et son expérience
- On peut peut-être éviter les maths, mais apprendre les bases rendra tout beaucoup plus facile
- Sans les bases mathématiques du ML, il aurait eu l’impression d’avancer complètement à l’aveugle

ilaksh

Vous semblez penser au "MLOps". Le MLOps est lui aussi important
Il conseille de s’exercer à déployer des modèles en Python avec HuggingFace et RunPod
Il recommande aussi de chercher des tutoriels sur le pré-entraînement, le fine-tuning et l’évaluation des LLM, ainsi que de regarder Predibase
Selon lui, le plus important aujourd’hui, ce sont les diffusion transformers
- Si vous trouvez de la documentation expliquant comment lancer des jobs d’entraînement pour cela, cela pourrait aider les gens
Si vous voulez "tricher", regardez replicate.com. cog peut aussi être utile pour auto-héberger des modèles ML en dehors de replicate.com

nottorp

N’a pas exactement "basculé vers un poste d’ingénieur ML", mais a appris au cours des 2,5 derniers mois à utiliser des modèles publics, ainsi que des outils et API pour les entraîner et les exécuter
A très peu codé et a surtout beaucoup lu
Travailler avec une petite organisation (où l’on n’est pas enfermé dans un rôle et où l’on reçoit simplement des choses à faire) peut aider

trybackprop

A écrit et partagé un billet de blog sur le sujet pour des ingénieurs logiciel expérimentés qui envisagent réellement de passer au ML
- You Don't Need a Masters/PhD – How These 9 Engineers Broke Into ML
- L’article présente divers cas d’ingénieurs chez Meta, Google, Amazon et OpenAI qui ont effectué cette transition
- Vous pouvez voir quelles stratégies et tactiques ils ont utilisées
Réponses
- 1. Si vous aimez bricoler sur votre temps personnel, alors oui, cela peut être "judicieux". Avant de me réorienter, j’ai passé un an à étudier les ressources les soirs et week-ends, et c’est ainsi que j’ai commencé à vouloir en faire mon métier à plein temps
- 1. Oui, et cela fait maintenant 7 ans que je travaille comme ingénieur ML après cette transition. Je suis actuellement responsable technique ML dans une FAANG. Avant cela, je travaillais dans l’infrastructure et le produit
- 1. L’un des conseils qu’on m’a donnés il y a quelques années était de rejoindre une équipe proche des activités ML pour se familiariser avec ce à quoi ressemble le ML en production. On peut aussi commencer à s’entraîner à la pensée ML sur Kaggle.com
Vous pouvez consulter d’autres billets de mon blog pour trouver des ressources afin d’apprendre l’IA/ML et les mathématiques nécessaires à ce métier
Linear Algebra 101 for AI/ML – Part 1
(avec un quiz interactif, les bases des vecteurs/matrices et une brève introduction à PyTorch, framework ML open source largement utilisé dans l’industrie).

deepGem

Il recommande de regarder le cours fast.ai, "Practical Deep Learning for Coders
Le contenu date de 2022, mais les principes qu’on y apprend restent aujourd’hui très valables et très utiles
C’est particulièrement vrai pour le Self Attention, les transformers et les architectures récentes fondées sur ces concepts
De nombreuses personnes ayant suivi le cursus fast.ai ont réorienté leur carrière non seulement vers l’ingénierie ML, mais aussi vers la recherche scientifique
Ce n’est pas une formation facile, il faut donc y consacrer du temps libre
Si vous vous intéressez au déploiement et au passage à l’échelle, vous pouvez même commencer directement par la leçon 2 de la partie 1. Jeremy est un excellent enseignant
- Comme je ne viens pas du monde académique, je trouve son style d’enseignement très sain

2 commentaires

rawoon89 2024-07-03

Bonne lecture. Merci.

ahwjdekf 2024-07-02

En Corée, il suffit de connaître le strict minimum, comme appeler une API ; les entreprises ne veulent pas investir de grosses sommes, mais elles veulent quand même suivre les tendances du moment... Une ambiance ambiguë, en somme.