Apprendre l’IA avec Excel
- Apprendre comment fonctionne l’IA à travers un véritable LLM implémenté dans Excel
- Implémentation du forward pass de GPT-2 uniquement avec des fonctions Excel, sans appel à une API externe
- L’objectif est de montrer que si l’on peut comprendre les tableurs, on peut comprendre l’IA
- Leçon 1 : comprendre GPT avec Excel
- Leçon 2 : Byte Pair Encoding et tokenization
- Bonus : examen détaillé de l’implémentation dans Excel (pour les personnes qui comprennent les Transformers)
- Fourni au format XLSB (Excel Binary), donc téléchargeable et exécutable (Mac/Windows pris en charge, mais Windows est recommandé)
- Limites de l’implémentation
- Modèle GPT-2 miniature complet (124M de paramètres), incluant les étapes BPE, multi-head attention et multilayer perceptron
- Inférence / forward pass uniquement (pas d’entraînement)
- Contexte limité à 10 tokens
- Limite de 10 caractères par mot
- Sortie uniquement en Zero Temperature
FAQ
- À propos de Google Sheets : ce projet a commencé sur Google Sheets, mais le modèle complet était trop volumineux, ce qui a conduit à passer à Excel. L’auteur explore encore des moyens de le faire fonctionner sur Google Sheets, mais il est probable qu’un fichier unique ne convienne pas aussi bien que dans Excel.
- Pourquoi on ne peut pas discuter comme avec ChatGPT : en plus de la longueur de contexte très courte, il manque l’instruction tuning et l’apprentissage par renforcement à partir de retours humains (RLHF) nécessaires pour en faire un chatbot conversationnel.
- Origine du nom : le nom "Spreadsheets-are-all-you-need" est un clin d’œil au titre du célèbre article "Attention Is All You Need", qui a présenté pour la première fois l’architecture d’apprentissage automatique Transformer.
Avis de GN⁺
- Ce projet contribue à rendre l’IA et le machine learning plus accessibles. En utilisant un outil familier comme Excel pour faire comprendre une technologie complexe, il offre même aux non-spécialistes l’occasion d’apprendre les principes de base de l’IA.
- L’implémentation dans Excel est utile pour comprendre visuellement le fonctionnement d’un véritable modèle d’IA, mais elle n’est pas destinée au développement réel d’IA. Apprendre l’IA de cette manière ne fait donc pas de quelqu’un un développeur IA professionnel.
- Ce type d’outil pédagogique peut accroître l’intérêt du grand public pour l’IA et contribuer à la démocratisation des technologies d’IA. Mais pour construire de véritables systèmes d’IA, des outils et frameworks plus spécialisés restent nécessaires.
- Parmi les projets comparables à visée pédagogique, on peut citer le Machine Learning Crash Course de Google ou le cours Machine Learning du professeur Andrew Ng sur Coursera. Ces formations combinent théorie et pratique pour offrir un apprentissage plus approfondi.
- Lorsqu’on adopte cette approche, il faut comprendre qu’elle repose sur une méthode différente de celle du développement réel de modèles d’IA. Ce projet est centré sur un objectif éducatif, tandis que dans les projets concrets de développement IA, il est courant d’utiliser des frameworks spécialisés comme TensorFlow et PyTorch.
2 commentaires
Commentaires Hacker News
Salutations et remerciements du créateur
Enseigner les réseaux de neurones avec des feuilles de calcul
Expliquer les réseaux de neurones avec des feuilles de calcul
Partage du lien vers la feuille de calcul
Question sur la nécessité du RLHF
Étonnement devant la mise en œuvre de GPT-2 dans une feuille de calcul
Possibilité d’implémenter GPT-3 ou GPT-4 dans une feuille de calcul
Un excellent projet pour aider à comprendre les LLM
Partage d’un exemple de résolution de PDE dans Excel
Une entreprise d’IA ayant des banques d’investissement comme clients