Technologies d’IA probabiliste
(arxiv.org)IA probabiliste
-
L’intelligence artificielle désigne la science et l’ingénierie des systèmes artificiels capables d’exécuter des tâches nécessitant l’intelligence humaine. Ces dernières années, des avancées intéressantes ont eu lieu dans les approches centrées sur les données et fondées sur l’apprentissage, et le machine learning comme le deep learning ont ouvert de nouvelles façons pour les systèmes informatiques de percevoir le monde. L’apprentissage par renforcement a permis des percées dans des jeux complexes comme le go ainsi que dans des tâches de robotique.
-
Un aspect essentiel de l’intelligence consiste non seulement à faire des prédictions, mais aussi à comprendre l’incertitude associée à ces prédictions et à en tenir compte au moment de prendre des décisions. Cet article porte sur l’« IA probabiliste ».
Approche probabiliste
- La première partie traite de l’approche probabiliste du machine learning. Elle discute de la différence entre l’incertitude « épistémique », due au manque de données, et l’incertitude « aléatoire », qui provient par exemple d’observations bruitées et des résultats. Elle aborde des approches concrètes de l’inférence probabiliste ainsi que des approches modernes d’inférence approchée efficace.
Prise en compte de l’incertitude dans les tâches de décision séquentielle
- La deuxième partie traite de la prise en compte de l’incertitude dans les tâches de décision séquentielle. Elle examine l’apprentissage actif et l’optimisation bayésienne, qui sont des approches de collecte de données proposant des expériences informatives afin de réduire l’incertitude épistémique. Elle s’intéresse à l’apprentissage par renforcement ainsi qu’aux approches modernes de deep RL utilisant l’approximation de fonctions par réseaux de neurones. Elle discute des approches modernes du RL fondé sur des modèles, qui exploitent les incertitudes épistémique et aléatoire pour guider l’exploration tout en prenant en compte la sécurité.
1 commentaires
Avis sur Hacker News
Le texte contient d’excellents schémas explicatifs et semble offrir une vue d’ensemble de grande qualité du machine learning sous l’angle des probabilités
J’ai découvert cette ressource il y a quelques jours et je cherchais une bonne excuse pour l’examiner sérieusement, sachant qu’Andreas Krause a mené des travaux approfondis et intéressants sur les Gaussian Processes et les bandits
La réalité existentielle est une distribution de potentiels, pas un tableau d’états
Question de savoir si un LLM, c’est-à-dire un réseau de neurones, peut indiquer la probabilité de la réponse qu’il vient tout juste de produire
Je pense qu’il faut une interface graphique pour démocratiser l’interprétabilité des modèles et permettre aussi aux gamers de l’explorer
Je pense que les Gaussian Processes avec un noyau approprié sont très puissants, même avec seulement quelques points de données et un petit ensemble de paramètres
Cela semble être l’une des meilleures références sur le sujet, avec un recoupement partiel. Mention de "An Introduction to Statistical Learning" de Gareth James et autres
Kevin Murphy est en train de renommer sa série Probabilistic Machine Learning
Gemini 2.0 Experimental 02-05 considère cela comme « seulement » 107K tokens
L’approximation de Laplace est une méthode « rapide et simple » pour convertir une distribution de probabilités complexe en une Gaussian simple (courbe en cloche)
J’ai suivi ce cours à l’ETH Zurich, et c’est l’un de mes préférés