-
OpenAI indique que GPT-4 peut sembler n’apporter que des différences subtiles par rapport à GPT-3.5 dans une conversation quotidienne. Mais plus la tâche est complexe, plus GPT-4 se montre stable, créatif et capable de gérer des consignes nuancées.
-
GPT-4 prend aussi en charge la sortie de texte à partir d’une entrée image. L’exemple fourni par OpenAI consistait à envoyer une image et à demander « quelle partie est drôle ». OpenAI a alors analysé et expliqué l’humour du mème. (Cette fonctionnalité n’est encore qu’un aperçu de recherche et n’est pas encore disponible au public.)
-
Avec ce modèle GPT-4, il devient possible de placer dans une zone distincte appelée
systemles formulations qui, à l’époque de GPT-3.5, servaient à attribuer un rôle précis à l’IA. Cela permet de définir plus directement le style et les tâches de l’IA. (OpenAI sait aussi que cet aspect peut être détourné pour ce qu’on appelle un « jailbreak », c’est-à-dire pour contourner les restrictions de contenu.) -
GPT-4 souffre toujours du problème des hallucinations. (Il peut croire à l’existence de choses qui n’existent pas et produire des erreurs de raisonnement.) Mais il a obtenu un score supérieur de 40 % dans les évaluations internes par rapport au modèle précédent.
-
GPT-4 présente toujours un risque de générer du contenu non autorisé, mais par rapport à GPT-3.5, le taux de génération de contenu en infraction a diminué de 82 %, et la fréquence à laquelle il répond en respectant la politique sur les demandes sensibles (conseils médicaux, automutilation) est supérieure de 29 %.
-
Actuellement, le modèle GPT-4 est proposé uniquement aux abonnés ChatGPT Plus, avec une limite de 100 messages toutes les 4 heures. OpenAI a indiqué qu’une politique de facturation supplémentaire liée à cette limite était prévue, et qu’à long terme il serait aussi mis à disposition des utilisateurs gratuits.
Ce résumé omet la manière dont GPT-4 a été entraîné, l’explication d’OpenAI Evals, ainsi que des exemples détaillés et des benchmarks directs. D’autres éléments importants peuvent également manquer, veuillez donc consulter le texte complet.
10 commentaires
Par rapport à la 3.5, il répond beaucoup moins à l’intuition au doigt mouillé (?) et, quand il ne sait pas, il a plutôt tendance à le dire franchement.
Je ne pense pas qu’il sera possible de continuer à faire ce travail et d’en vivre jusqu’à la retraite.
Skynet ne semble plus très loin...
La puissance de GPT-4
https://www.clien.net/service/board/park/17962934
Il y a pas mal d'images et de mèmes variés.
Dans les commentaires, quelqu'un compare les réponses de 3.5 et de 4 sur la façon d'apaiser sa petite amie quand elle est vexée, et l'écart est assez net. Haha
Revue du GPT-4 Technical Report par Sanghun Lee, publiée dans le groupe TensorFlow Korea
https://www.facebook.com/groups/TensorFlowKR/posts/1992265094447872
Dès sa sortie, j’ai posé ce genre de question à GPT-4 et à GPT-3.5.
Les réponses de GPT-3.5 et de GPT-4 étaient radicalement différentes. GPT-4 suit une procédure, répartit le rôle de chaque fichier et donne des instructions correctes qu’on peut réellement suivre dans l’éditeur Godot pour obtenir le résultat voulu, tandis que GPT-3.5 a simplement sorti du code cassé qui donne seulement l’impression de fonctionner.
On risque peut-être de voir déferler des jeux développés en solo... J’ai l’impression que c’est plus que jamais le bon moment pour créer des jeux.
Bien sûr, il y a aussi des inquiétudes sur des jeux produits à la chaîne, comme les romans industriels... mais au final, j’espère que les studios AAA feront eux aussi fortement évoluer leur environnement de travail pour produire, sans bugs, des jeux plus efficacement et avec une meilleure qualité.
J'ai presque envie de devenir luddite... bouh ouin bouh ouin
Est-ce qu'on pourra encore vivre avec un salaire à l'avenir..
Il faut prier pour devenir citoyen de Rome, haha.
La raison pour laquelle j’ai choisi Godot Engine, c’est que je pensais qu’il était au contraire plus adapté aux tests parce qu’il y a moins de ressources que pour Unity. Je voulais voir dans quelle mesure il pouvait répondre lorsqu’il n’y a pas autant de documentation, de manière générale. Mais j’ai été surpris de voir à quel point il s’en est bien sorti....