38 points par xguru 2024-07-02 | 2 commentaires | Partager sur WhatsApp
  • Ingénieur logiciel avec plus de 10 ans d’expérience dans la création d’applications intensives en données. Principalement backend (legacy, cloud)
  • (1) Est-ce une bonne idée de se réorienter ? (2) Certains l’ont-ils déjà fait ? (3) S’il n’y a pas de ML dans mon travail, comment puis-je m’y mettre ?
  • Existe-t-il des postes d’ingénierie ML davantage centrés sur la gestion, le déploiement et le passage à l’échelle des modèles que sur leur construction ?
    • Autrement dit, peut-on éviter d’apprendre toutes les mathématiques sous-jacentes ?

arnabgho

  • Travaille comme tech lead MLE chez Snap et a posé les bases de l’infrastructure d’IA générative de Snap
    • Recommande vivement la voie MLE, qui peut être une trajectoire de carrière très gratifiante
  • Le livre "Designing Machine Learning Systems: An Iterative Process for Production-Ready Applications" est une très bonne introduction à la conception de systèmes de machine learning pour la production
  • Recommande aussi vivement ce blog de l’autrice (Chip Huyen) comme introduction à la création de systèmes IA et ML de niveau production
    Construire des applications LLM pour la production (avec lien vers un résumé et une traduction)
  • Réponses aux questions
    • (1) Oui, surtout à un moment comme aujourd’hui, qui marque un tournant dans l’époque
    • (2) Oui
    • (3) Voir ci-dessus pour des ressources sur la manière de débuter et de progresser en ingénierie ML

breckenedge

  • S’y est mis il y a environ 7 mois dans le cadre d’un projet de 3 mois visant à créer un système de recommandation de contenu avec du ML
  • A commencé avec une bibliothèque classique de filtrage collaboratif, puis a fini sur PyTorch, avec l’aide précieuse de ChatGPT
  • Il aurait pu continuer dans cette voie, mais la direction voulait des résultats meilleurs et plus rapides, et trois mois étaient suffisants pour prendre le rythme quand on part de zéro
  • Une grande partie du travail en ML a consisté à nettoyer et préparer les jeux de données, ce qui n’était pas très amusant
  • Un dirigeant lui a recommandé d’essayer Amazon Personalize ; cela valait le coup, mais au final ça n’a pas abouti. Difficile de savoir si le problème venait des données ou du modèle de base
  • Le principal problème avec les services ML en boîte noire est qu’on ne peut pas analyser ce qui se passe
  • Amazon Personalize rend aussi difficile la modification de la couche de données, donc il est compliqué de savoir si l’on se rapproche d’une meilleure solution
  • Un spécialiste ML expérimenté pourrait peut-être obtenir de meilleurs résultats avec Personalize
  • Donc, si le ML vous attire, il vaut mieux faire un projet d’essai avant d’en faire une carrière, pour voir si cela vous plaît

nsyptras

  • > Existe-t-il de l’ingénierie ML davantage centrée sur la gestion, le déploiement et l’extension des modèles que sur leur construction ?
  • Oui, il s’est réorienté vers ce domaine en 2018. Cela s’appelle le MLOps. Avant, il était développeur mobile
  • À l’époque, la transition était assez facile (même si la concurrence est peut-être plus forte aujourd’hui)
  • Ce qu’il a fait :
    • A mené seul un projet ML intensif et a réalisé qu’il aimait travailler sur toute la stack ML
    • A aussi écrit un [article de blog]((https://www.nicksypteras.com/blog/aisu.html) sur ce projet
    • A ensuite postulé dans une équipe MLOps en s’appuyant sur ce projet pour démontrer ses compétences et son expérience
    • On peut peut-être éviter les maths, mais apprendre les bases rendra tout beaucoup plus facile
    • Sans les bases mathématiques du ML, il aurait eu l’impression d’avancer complètement à l’aveugle

ilaksh

  • Vous semblez penser au "MLOps". Le MLOps est lui aussi important
  • Il conseille de s’exercer à déployer des modèles en Python avec HuggingFace et RunPod
  • Il recommande aussi de chercher des tutoriels sur le pré-entraînement, le fine-tuning et l’évaluation des LLM, ainsi que de regarder Predibase
  • Selon lui, le plus important aujourd’hui, ce sont les diffusion transformers
    • Si vous trouvez de la documentation expliquant comment lancer des jobs d’entraînement pour cela, cela pourrait aider les gens
  • Si vous voulez "tricher", regardez replicate.com. cog peut aussi être utile pour auto-héberger des modèles ML en dehors de replicate.com

nottorp

  • N’a pas exactement "basculé vers un poste d’ingénieur ML", mais a appris au cours des 2,5 derniers mois à utiliser des modèles publics, ainsi que des outils et API pour les entraîner et les exécuter
  • A très peu codé et a surtout beaucoup lu
  • Travailler avec une petite organisation (où l’on n’est pas enfermé dans un rôle et où l’on reçoit simplement des choses à faire) peut aider

trybackprop

  • A écrit et partagé un billet de blog sur le sujet pour des ingénieurs logiciel expérimentés qui envisagent réellement de passer au ML
  • Réponses
      1. Si vous aimez bricoler sur votre temps personnel, alors oui, cela peut être "judicieux". Avant de me réorienter, j’ai passé un an à étudier les ressources les soirs et week-ends, et c’est ainsi que j’ai commencé à vouloir en faire mon métier à plein temps
      1. Oui, et cela fait maintenant 7 ans que je travaille comme ingénieur ML après cette transition. Je suis actuellement responsable technique ML dans une FAANG. Avant cela, je travaillais dans l’infrastructure et le produit
      1. L’un des conseils qu’on m’a donnés il y a quelques années était de rejoindre une équipe proche des activités ML pour se familiariser avec ce à quoi ressemble le ML en production. On peut aussi commencer à s’entraîner à la pensée ML sur Kaggle.com
  • Vous pouvez consulter d’autres billets de mon blog pour trouver des ressources afin d’apprendre l’IA/ML et les mathématiques nécessaires à ce métier
  • Linear Algebra 101 for AI/ML – Part 1
  • (avec un quiz interactif, les bases des vecteurs/matrices et une brève introduction à PyTorch, framework ML open source largement utilisé dans l’industrie).

deepGem

  • Il recommande de regarder le cours fast.ai, "Practical Deep Learning for Coders
  • Le contenu date de 2022, mais les principes qu’on y apprend restent aujourd’hui très valables et très utiles
  • C’est particulièrement vrai pour le Self Attention, les transformers et les architectures récentes fondées sur ces concepts
  • De nombreuses personnes ayant suivi le cursus fast.ai ont réorienté leur carrière non seulement vers l’ingénierie ML, mais aussi vers la recherche scientifique
  • Ce n’est pas une formation facile, il faut donc y consacrer du temps libre
  • Si vous vous intéressez au déploiement et au passage à l’échelle, vous pouvez même commencer directement par la leçon 2 de la partie 1. Jeremy est un excellent enseignant
    • Comme je ne viens pas du monde académique, je trouve son style d’enseignement très sain

2 commentaires

 
rawoon89 2024-07-03

Bonne lecture. Merci.

 
ahwjdekf 2024-07-02

En Corée, il suffit de connaître le strict minimum, comme appeler une API ; les entreprises ne veulent pas investir de grosses sommes, mais elles veulent quand même suivre les tendances du moment... Une ambiance ambiguë, en somme.