Ilya Sutskever : « Si vous apprenez tout cela, vous connaîtrez 90 % de ce qui est important »
(reddit.com)Liste de lectures recommandées par Ilya Sutskever sur le machine learning et l’IA
- The Annotated Transformer
- The First Law of Complexodynamics
- The Unreasonable Effectiveness of RNNs
- Understanding LSTM Networks
- Recurrent Neural Network Regularization
- Keeping Neural Networks Simple by Minimizing the Description Length of the Weights
- Pointer Networks
- ImageNet Classification with Deep CNNs
- Order Matters: Sequence to sequence for sets
- GPipe: Efficient Training of Giant Neural Networks using Pipeline Parallelism
- Deep Residual Learning for Image Recognition
- Multi-Scale Context Aggregation by Dilated Convolutions
- Neural Quantum Chemistry
- Attention Is All You Need
- Neural Machine Translation by Jointly Learning to Align and Translate
- Identity Mappings in Deep Residual Networks
- A Simple NN Module for Relational Reasoning
- Variational Lossy Autoencoder
- Relational RNNs
- Quantifying the Rise and Fall of Complexity in Closed Systems: The Coffee Automaton
- Neural Turing Machines
- Deep Speech 2: End-to-End Speech Recognition in English and Mandarin
- Scaling Laws for Neural LMs
- A Tutorial Introduction to the Minimum Description Length Principle
- Machine Super Intelligence Dissertation
- PAGE 434 onwards: Komogrov Complexity
- CS231n Convolutional Neural Networks for Visual Recognition
Recueil de liens : https://arc.net/folder/D0472A20-9C20-4D3F-B145-D2865C0A9FEE
3 commentaires
Il semble y avoir un problème de crawling du bot Neo.
On dirait que Reddit le bloque. Je l’ai ajouté manuellement ;)
Commentaire Hacker News
Résumé des commentaires Hacker News
Le titre minimise l’ampleur de cette tâche. Si vous cliquez pour voir de quoi il s’agit :
Il y a quelque temps, j’ai aussi copié la liste sur lien pour qu’il soit plus facile d’utiliser wget (par ex. récupérer tous les PDF arXiv)
wget.pdfunitepour tout fusionner en un seul PDF, puis l’avons fait imprimer en reliure spirale chez un imprimeur. Le résultat était excellent.Gardez à l’esprit qu’il n’y a aucune confirmation qu’il s’agisse de la vraie liste.
Combien de temps faut-il pour apprendre les prérequis nécessaires à ces lectures si l’on n’a pas déjà un cursus en informatique ?
Ce que les gens oublient, c’est que sans objectif clair et concret, peu importe le nombre d’articles fondamentaux ou intéressants que vous lisez, vous ne retiendrez rien.
Il existe quelques discussions plus anciennes, remontant à octobre 2022. Je me demande à quel point la liste est dépassée aujourd’hui.
Ce n’est qu’un dossier de favoris de quelqu’un. Où est la preuve que cela a été recommandé par Ilya ?
L’argument selon lequel cela représente 90 % de ce qui compte en ML semble un peu audacieux.
Il n’y a rien ici sur les LLM, alors que l’in-context learning, le retrieval augmentation, l’usage d’outils et la multimodalité sont en pleine effervescence.
Lire 30 études ne veut pas dire « appris et compris ». Surtout si l’on part de zéro.