1 points par GN⁺ 2024-12-20 | 1 commentaires | Partager sur WhatsApp

Changement de la politique de confidentialité d'arXiv

  • La politique de confidentialité d’arXiv a été modifiée. En continuant à utiliser arxiv.org, vous acceptez cette politique.

Évolution culturelle de la coopération

  • Contexte de la recherche : les grands modèles de langage (LLM) constituent généralement une base essentielle pour construire des agents IA compétents. Ces agents peuvent représenter les intérêts d’individus ou de groupes.
  • Objectif de la recherche : comprendre la dynamique des interactions lorsque plusieurs agents LLM sont déployés de manière répétée. Plus précisément, l’étude examine si les agents peuvent apprendre des normes sociales bénéfiques les uns pour les autres.
  • Méthode de recherche : les interactions indirectes entre agents LLM sont étudiées à travers un jeu du donateur répété. Dans ce jeu, les agents peuvent observer le comportement récent de leurs pairs.
  • Résultats de la recherche :
    • Les agents Claude 3.5 Sonnet obtiennent un score moyen supérieur à Gemini 1.5 Flash et GPT-4o.
    • Claude 3.5 Sonnet a pu obtenir un score plus élevé en utilisant un mécanisme de punition supplémentaire.
    • Des comportements variés montrant une forte dépendance aux conditions initiales ont été observés.
  • Portée de la recherche : cette étude pourrait proposer un nouveau benchmark pour évaluer l’impact du déploiement d’agents LLM sur l’infrastructure coopérative de la société.

Informations sur l’article

  • Nombre de pages : 15 pages, avec 6 figures
  • Sujet : systèmes multi-agents, intelligence artificielle
  • Référence : arXiv:2412.10270 [cs.MA]
  • Soumis par : Edward Hughes

Autres informations

  • Accès : l’article est disponible en différents formats, notamment PDF, HTML et source TeX
  • Bibliographie et outils de citation : divers outils sont disponibles, notamment NASA ADS, Google Scholar et Semantic Scholar
  • Articles et données associés : articles associés, données et démonstrations média disponibles

Cette étude ouvre la possibilité de mieux comprendre le comportement coopératif des agents LLM et, à travers cela, de contribuer au développement de la coopération sociale.

1 commentaires

 
GN⁺ 2024-12-20
Avis sur Hacker News
  • Meta a constaté un manque de données d’entraînement concernant la perception et les connaissances des modèles et, après les avoir réentraînés à l’aide de données synthétiques pour y remédier, leurs performances sur les benchmarks de Theory of Mind (TOM) se sont nettement améliorées

  • Quelqu’un a essayé de faire dialoguer un Mistral LLM et un modèle Llama avec ollama, et a trouvé intéressant de les voir discuter de sujets aléatoires. L’interaction à la fin de la conversation était particulièrement marquante

  • Sentiment mitigé vis-à-vis de l’article de recherche, avec l’idée que le cadre de l’expérience est inadapté puisque l’évolution culturelle des LLM pourrait être temporaire. Il est difficile d’accepter cette affirmation puisqu’on ne sait pas comment des humains se comporteraient dans la même situation

  • Explication du Donor Game : des individus appariés aléatoirement sont répartis entre donateur et bénéficiaire ; le donateur peut soit fournir un bénéfice, soit ne rien faire. La réputation du donateur joue un rôle important, et une stratégie de coopération devient stable lorsque le score de réputation dépasse un certain seuil

  • L’étude semble imposer un classement forcé à l’aide de paramètres arbitraires, et le comportement observé pourrait être le produit de réglages spécifiques. Cela dit, voir émerger de nouveaux comportements chez les LLM reste intéressant

  • La méthode de l’article peut sembler séduisante au premier abord, mais des doutes subsistent sur sa capacité à passer à l’échelle. Des variantes complexes de l’attention pourraient allonger le temps d’entraînement, et il manque des informations sur les performances sur des données réelles. Son utilité concrète reste donc incertaine

  • Une discussion porte sur la possibilité que les LLM transforment la sociologie, car de vastes expériences socio-économiques pourraient être menées facilement avec des agents LLM. Leur nature non déterministe et leur capacité à recevoir des consignes en anglais pourraient constituer des éléments supplémentaires intéressants

  • Il semble que ce soit surtout le niveau de détail des sorties du modèle qui soit testé, les sorties détaillées ayant tendance à converger vers des fonctions plus efficaces. Mais rien ne permet vraiment d’affirmer que cela reflète des propriétés internes du modèle

  • Certains s’attendaient à une étude montrant que la coopération conduit à des résultats plus précis chez les LLM, mais celle-ci se concentre uniquement sur l’aspect sociologique. Ils se demandent s’il existe des travaux sur la résolution de problèmes concrets via les interactions entre LLM

  • La tentative de modéliser le déploiement progressif des mises à jour de LLM semble relever d’une exagération inutile, car elle ne ressemble pas à un déploiement réel. Cela dit, l’article lui-même reste intéressant