OpenAI publie la Model Spec

(openai.com)

7 points par xguru 2024-05-10 | Aucun commentaire pour le moment. | Partager sur WhatsApp

Afin d’améliorer la compréhension du public sur la manière dont les modèles d’IA conversationnelle doivent fonctionner, OpenAI a publié un document intitulé « Model Spec »

La Model Spec est un document qui précise comment OpenAI souhaite que les modèles se comportent dans l’API OpenAI et dans ChatGPT
OpenAI estime qu’il est important que chacun puisse comprendre et discuter des choix concrets qui façonnent le comportement des modèles
La Model Spec reflète les documents déjà utilisés par OpenAI, ses recherches et son expérience sur la conception du comportement des modèles, ainsi que les travaux en cours sur les futurs développements
Elle s’inscrit dans le prolongement des efforts continus d’OpenAI pour améliorer le comportement des modèles à partir des retours humains, et complète les travaux sur le collective alignment ainsi qu’une approche plus large et systématique de la sécurité des modèles

Façonner le comportement souhaité des modèles (Shaping Desired Model Behavior)

Le comportement d’un modèle, c’est-à-dire la manière dont il réagit aux entrées de l’utilisateur (ton, personnalité, longueur des réponses, etc.), est essentiel dans la façon dont les humains interagissent avec les capacités de l’IA.

Façonner le comportement d’un modèle reste une science encore à ses débuts, et les modèles ne sont pas programmés explicitement mais apprennent à partir de vastes ensembles de données
Concevoir ce comportement suppose de prendre en compte de nombreuses questions, considérations et nuances, et d’évaluer souvent des divergences d’opinion
Même si un modèle est conçu pour être largement utile et bénéfique pour les utilisateurs, ces intentions peuvent en pratique entrer en conflit
- Exemple : une entreprise de sécurité souhaite générer des données synthétiques pour entraîner un classificateur d’e-mails de phishing afin de protéger ses clients, mais si des fraudeurs utilisent cette capacité, cela devient nuisible

Présentation de la Model Spec

OpenAI partage un projet de nouveau document, la « Model Spec », qui précise comment façonner le comportement souhaité des modèles et comment évaluer les compromis en cas de conflit
La Model Spec rassemble les documents actuellement utilisés chez OpenAI, l’expérience et les recherches en cours sur la conception du comportement des modèles, ainsi que des avis d’experts et d’autres travaux récents destinés à guider le développement futur
La Model Spec n’est pas complète et devrait évoluer avec le temps

L’approche de la Model Spec comprend notamment :

Objectifs : des principes larges et généraux qui donnent une direction sur le comportement souhaitable
- Soutenir les développeurs et les utilisateurs finaux
- Être bénéfique pour l’humanité
- Bien représenter OpenAI
Règles : des consignes qui aident à gérer la complexité et à garantir la sécurité ainsi que la légalité
- Respecter la hiérarchie des instructions
- Respecter les lois applicables
- Ne pas fournir d’informations à risque
- Respecter les créateurs et les droits
- Protéger la vie privée
- Ne pas répondre avec du contenu NSFW
Comportements par défaut : des directives alignées sur les objectifs et les règles, qui indiquent comment gérer les conflits et montrent comment hiérarchiser et équilibrer les objectifs
- Présumer la bonne foi de l’utilisateur et du développeur
- Poser des questions de clarification si nécessaire
- Être aussi utile que possible sans excès
- Répondre aux exigences variées de l’usage en chat conversationnel et en programmation
- Adopter un point de vue objectif
- Encourager l’équité et la bienveillance, décourager la haine
- Ne pas chercher à faire changer d’avis les autres
- Exprimer l’incertitude
- Utiliser les outils adaptés à la tâche
- Être approfondi et efficace tout en respectant les limites de longueur

Comment la Model Spec sera utilisée

Dans le prolongement de ses travaux sur le collective alignment et la sécurité des modèles, OpenAI prévoit d’utiliser la Model Spec comme guide pour les chercheurs et les entraîneurs d’IA chargés de l’apprentissage par renforcement à partir des retours humains
L’entreprise prévoit également d’explorer dans quelle mesure les modèles peuvent apprendre directement à partir de la Model Spec

Prochaines étapes

OpenAI considère ce travail comme une partie d’une conversation publique continue sur la manière dont les modèles devraient idéalement se comporter, sur la façon de déterminer ce comportement souhaitable, et sur les meilleurs moyens d’associer le grand public à ces discussions.
À mesure que cette conversation se poursuivra, l’entreprise cherchera des opportunités de collaborer avec des parties prenantes représentatives à l’échelle mondiale, notamment des décideurs publics, des institutions de confiance et des experts métier
L’objectif est de déterminer les points suivants :
1. Comment les parties prenantes comprennent l’approche de la Model Spec ainsi que les objectifs, règles et valeurs par défaut pris individuellement
2. Si les parties prenantes soutiennent l’approche ainsi que les objectifs, règles et valeurs par défaut pris individuellement
3. S’il existe d’autres objectifs, règles ou valeurs par défaut à prendre en compte
OpenAI dit attendre avec intérêt les retours des parties prenantes à mesure que ce travail progresse
L’entreprise encourage également le grand public à partager, au cours des deux prochaines semaines, ses retours sur les objectifs, règles et valeurs par défaut de la Model Spec
Elle espère ainsi obtenir très tôt des enseignements utiles pour développer un processus solide de collecte et d’intégration des retours, afin d’avancer de manière responsable vers sa mission
Au cours de l’année à venir, OpenAI partagera des mises à jour sur les changements apportés à la Model Spec, sur sa réponse aux retours reçus et sur l’avancement de ses recherches concernant la conception du comportement des modèles