7 points par xguru 2023-03-13 | 1 commentaires | Partager sur WhatsApp
  • Article publié sur le blog par Jan Leike, responsable de l’équipe alignment d’OpenAI, traduit avec DeepL
  • L’alignment consiste à « aligner un système d’IA sur un être humain »
  • Il existe deux catégories d’alignement : selon « les préférences individuelles (tout le monde veut une IA alignée sur soi) » et selon « les préférences collectives (à quels usages l’IA peut-elle servir et quel devrait être son fonctionnement par défaut ?) »
  • Cet article traite de la deuxième catégorie

Proposition : démocratie délibérative simulée

  • L’idée centrale consiste à utiliser de grands modèles de langage pour les entraîner à imiter la « démocratie délibérative »
    • La démocratie délibérative est un processus de prise de décision ou d’élaboration de politiques publiques dans lequel un petit groupe de citoyens sélectionnés aléatoirement (« mini-public ») délibère explicitement
  • Méthode pour construire une démocratie délibérative simulée
    • Collecte d’un jeu de données de questions de valeurs
    • Enregistrements de délibérations humaines
    • Apprentissage par imitation conditionné par le contexte
    • Simulation : questions sur de nouvelles valeurs

1 commentaires

 
xguru 2023-03-13

Je vous recommande de lire également le "complément d’explication sur le contexte de cet article" de Seungjun Choi. (Un lien figure aussi au début du document)
https://facebook.com/seungjoon.choi/posts/…