11 points par brainer 2024-05-14 | 5 commentaires | Partager sur WhatsApp

• Un modèle d’IA révolutionnaire capable de traiter et de générer simultanément du texte, de l’audio et des images
• Avec un temps de réponse en temps réel comparable à une conversation humaine, GPT-4o établit une nouvelle référence pour des interactions homme-machine naturelles
• Plus rapide et plus économique via l’API, tout en surpassant GPT-4 Turbo sur le texte et le code, en particulier dans les langues autres que l’anglais
• Grâce aux capacités multimodales de GPT-4o, il peut comprendre des entrées audio, y répondre, générer des sorties audio et participer à des conversations en temps réel
• Le modèle montre des capacités améliorées de raisonnement, une meilleure maîtrise multilingue, une compréhension audio et visuelle, ainsi qu’une perception visuelle
• OpenAI met en avant les mesures de sécurité mises en œuvre dans la conception et le post-entraînement de GPT-4o afin d’atténuer les risques potentiels
• La version initiale comprend des entrées texte et image ainsi qu’une sortie texte ; les fonctions audio et vidéo seront proposées ultérieurement à des partenaires de confiance via l’API

5 commentaires

 
bluejoyq 2024-05-14

On sent vraiment que la vitesse s'est énormément améliorée.

 
brainer 2024-05-14

Si l’on pose la question en coréen,

les performances du modèle lui-même x2 * 1,7 (amélioration des tokens en coréen) = 3,4 fois plus rapide

 
xguru 2024-05-14

Le « O » de 4O signifie Omni.

 
corelyai 2024-05-14

Dernière mise à jour de ChatGPT : le modèle GPT-4o et une accessibilité utilisateur améliorée

ChatGPT met l’accent sur l’accès gratuit de tous à des outils d’IA avancés. Le lancement de la version desktop et du nouveau modèle phare GPT-4o vise à améliorer le caractère naturel et la facilité d’utilisation. GPT-4o offrira des capacités plus rapides et améliorées dans les domaines du texte, de la vision et de l’audio, marquant une avancée importante dans la collaboration entre l’humain et la machine.

L’extension de ChatGPT avec GPT-4o

Nous proposons désormais GPT-4o à tous les utilisateurs, avec des capacités de raisonnement vocal, textuel et visuel. Les nouvelles fonctionnalités incluent la conversation vocale en temps réel, la mémoire, la recherche d’informations en temps réel et l’analyse avancée de données. GPT-4o sera disponible dans 50 langues, avec une qualité et une vitesse améliorées, ainsi qu’une limite d’utilisation plus élevée pour les utilisateurs payants.

Les nouvelles capacités en temps réel et réactives de ChatGPT

Les nouvelles fonctions de ChatGPT apportent une réactivité en temps réel et la capacité de percevoir les émotions des utilisateurs. Le modèle peut générer des voix de styles variés, comme une voix dramatique, robotique ou chantée. De plus, ChatGPT prend désormais en charge les tâches visuelles et peut interagir avec les utilisateurs dans un environnement de démonstration en direct.

Résoudre une équation linéaire : étape par étape

Barrett Zoph et ChatGPT résolvent l’équation 3X + 1 = 4 en isolant d’abord le terme en X, puis en trouvant X, avant d’aborder des applications concrètes des équations linéaires dans la vie quotidienne, comme les coûts, la planification de voyages et les calculs commerciaux. Cela permet d’acquérir une nouvelle confiance dans la compréhension des mathématiques et leur usage pour des problèmes réels.

Analyser des données météo avec ChatGPT

ChatGPT aide à analyser des données météo en expliquant les fonctions du code et en interprétant les sorties de graphique. La fonction « Fu » est essentielle pour lisser les données de température et réduire le bruit du graphique. Ce graphique montre les moyennes lissées, les températures minimales et maximales tout au long de 2018, avec une annotation notable concernant un important épisode de fortes pluies survenu fin septembre.

Interaction multilingue et technologies d’IA

Les technologies d’IA présentent, à travers une démonstration en direct, des capacités d’interaction multilingue et d’interprétation des émotions. Cette démonstration met en avant l’objectif de rendre cette technologie plus facilement accessible aux utilisateurs dans un futur proche. La présentation salue également l’équipe ayant contribué à ces avancées technologiques et reconnaît ses mérites.

Corely, l’essentiel des vidéos YouTube en 10 secondes ! - https://corely.ai/content/openai-spring-update-2022

 
xguru 2024-05-14

Introducing GPT-4o

La partie de démo de conversation en direct dans la vidéo de présentation est assez sidérante. À partir d’environ 9 min 45 s (le lien ci-dessus pointe vers ce moment).
Il est désormais possible d’interrompre facilement la réponse en cours, les réponses sont presque en temps réel, et l’intonation est aussi devenue plus riche.