- Version spécialisée en coréen du modèle GPT-3 créée par Kakao Brain
→ construite sur la base de 6 milliards de paramètres et de données en coréen totalisant 200 milliards de tokens
-
Capable d’exécuter tous types de tâches linguistiques, comme déterminer si une phrase est positive ou négative, résumer en une ligne un long texte, déduire une conclusion par inférence de phrases, ou répondre à des questions en comprenant leur contexte
-
Prévoit d’ouvrir en open source, après le coréen, des modèles en anglais, japonais, vietnamien et malais
-
Vise à garantir l’accessibilité en l’ouvrant en open source, et à contribuer au développement des technologies IT nationales ainsi qu’à la dynamisation de la recherche
3 commentaires
Site de démonstration : https://huggingface.co/spaces/akhaliq/kogpt
J’ai saisi telle quelle la phrase suivante, présente ici en exemple, et il a fallu environ 2 minutes, attente dans la file comprise, pour obtenir ce résultat. Le temps réellement utilisé pour le traitement semble avoir été d’environ 16,9 secondes.
input:
« Penser et agir comme un humain, grâce à une “intelligence” qui permettra enfin à l’humanité de résoudre ce qu’elle n’avait jusqu’à présent pas réussi à élucider »
output:
« Penser et agir comme un humain, grâce à une “intelligence” qui permettra enfin à l’humanité de répondre aux innombrables questions qu’elle n’avait jusqu’à présent pas réussi à résoudre. c Pixabay Le temps est venu pour notre humanité de s’attaquer à ce qui a été, au cours des dizaines de milliers d’années passées, le plus important à résoudre pour mener une vie véritablement humaine »
C'est génial
GPT-J-6B, Cedille et KoGPT ont tous 6 milliards (6B) de paramètres.
GPT-3 n'est désormais plus le seul sur le marché : https://fr.news.hada.io/topic?id=5349
GPT-Neo : un projet visant à créer en open source/gratuit un modèle à l'échelle de GPT-3 : https://fr.news.hada.io/topic?id=3599
Cedille - publication en open source d'un modèle francophone de taille 6B : https://fr.news.hada.io/topic?id=5372