- Article publié sur le blog par Jan Leike, responsable de l’équipe alignment d’OpenAI, traduit avec DeepL
- L’alignment consiste à « aligner un système d’IA sur un être humain »
- Il existe deux catégories d’alignement : selon « les préférences individuelles (tout le monde veut une IA alignée sur soi) » et selon « les préférences collectives (à quels usages l’IA peut-elle servir et quel devrait être son fonctionnement par défaut ?) »
- Cet article traite de la deuxième catégorie
Proposition : démocratie délibérative simulée
- L’idée centrale consiste à utiliser de grands modèles de langage pour les entraîner à imiter la « démocratie délibérative »
- La démocratie délibérative est un processus de prise de décision ou d’élaboration de politiques publiques dans lequel un petit groupe de citoyens sélectionnés aléatoirement (« mini-public ») délibère explicitement
- Méthode pour construire une démocratie délibérative simulée
- Collecte d’un jeu de données de questions de valeurs
- Enregistrements de délibérations humaines
- Apprentissage par imitation conditionné par le contexte
- Simulation : questions sur de nouvelles valeurs
1 commentaires
Je vous recommande de lire également le "complément d’explication sur le contexte de cet article" de Seungjun Choi. (Un lien figure aussi au début du document)
https://facebook.com/seungjoon.choi/posts/…