OpenAI dévoile GPT-4.5

xguru · 2025-02-28T09:19:15+09:00

GPT-4.5 est le dernier modèle d’OpenAI, une version qui améliore la scalabilité lors du pré-entraînement (pre-training) et du post-entraînement (post-training) L’extension à grande échelle de l’apprentissage non supervisé (unsupervised learning) renforce la reconnaissance de motifs et l’intuition créative Il permet des conversations plus naturelles, comprend mieux l’intention de l’utilisateur et améliore l’intelligence émotionnelle (EQ) Il peut être utile dans diverses tâches comme l’écriture, la programmation et la résolution de problèmes Le taux d’hallucination devrait diminuer Proposé sous forme de research preview, il vise à explorer les points forts et les limites du modèle, ainsi qu’à recueillir divers cas d’usage Extension de l’apprentissage non supervisé Pour faire progresser l’IA, deux axes sont développés : l’apprentissage non supervisé et le raisonnement (reasoning) Renforcement du raisonnement : le modèle est entraîné à penser de manière structurée afin de résoudre des problèmes STEM complexes Des modèles comme OpenAI o1 et OpenAI o3-mini ont fait progresser cette approche Extension de l’apprentissage non supervisé : davantage de données permettent d’améliorer l’intuition du modèle et la précision de ses connaissances du monde GPT-4.5 a été entraîné sur le supercalculateur Microsoft Azure AI et dispose de connaissances plus larges ainsi que d’une compréhension plus profonde Cela réduit les hallucinations et fournit des résultats plus fiables sur une grande variété de sujets Extension du paradigme GPT GPT-4.5 possède des connaissances supérieures à celles des modèles précédents Il offre des analyses plus approfondies sur des questions historiques telles que l’origine du langage À une question comme « Quelle a été la première langue ? » : Il est probable qu’il n’ait pas existé de première langue unique On estime que le langage est apparu en Afrique il y a plus de 100 000 ans Les proto-langues ont probablement évolué à partir de gestes, de sons et de signaux Il est impossible de connaître avec précision l’origine du langage faute de traces écrites Ainsi, GPT-4.5 peut aussi fournir des réponses approfondies en linguistique et en histoire Des connaissances du monde plus profondes Dans les résultats de l’évaluation SimpleQA, GPT-4.5 a enregistré une précision supérieure à celle des autres modèles Comparaison de la précision (Accuracy) : GPT-4.5: 62.5% GPT-4o: 38.2% OpenAI o1: 47% OpenAI o3-mini: 15% Comparaison du taux d’hallucination (Hallucination Rate) (plus bas = mieux) : GPT-4.5: 37.1% GPT-4o: 61.8% OpenAI o1: 44% OpenAI o3-mini: 80.3% GPT-4.5 maintient une précision plus élevée sur les questions nécessitant une vérification factuelle et réduit le taux d’hallucination Entraînement pour la collaboration avec les humains GPT-4.5 a été entraîné pour mieux comprendre les demandes et les intentions humaines Il interprète plus finement l’intention de l’utilisateur et permet des conversations naturelles Son intelligence émotionnelle (EQ) est améliorée par rapport aux modèles précédents, ce qui lui permet de mieux saisir les nuances subtiles Il fait preuve d’une intuition créative et d’une sensibilité esthétique remarquables pour l’écriture et les travaux de design Évaluation comparative (Win-rate vs GPT-4o) Tâches créatives : 56.8% Questions professionnelles : 63.2% Questions du quotidien : 57.0% GPT-4.5 collabore plus naturellement avec les humains et identifie plus précisément l’intention de l’utilisateur au fil de la conversation Perspectives : des capacités de raisonnement encore plus puissantes GPT-4.5 n’est pas un modèle qui raisonne de manière logique avant de répondre Il adopte une approche différente de celle des modèles centrés sur le raisonnement comme OpenAI o1 et OpenAI o3-mini Pour les futurs modèles, la combinaison du pré-entraînement (pre-training) et du raisonnement (reasoning) devrait devenir l’élément clé Renforcement de la sécurité GPT-4.5 a été entraîné avec de nouvelles techniques de supervision, y compris le SFT (supervised fine-tuning) et le RLHF (reinforcement learning from human feedback) existants Des tests de sécurité sont réalisés avant le déploiement du modèle afin d’évaluer les risques potentiels Une system card présentant les résultats de l’évaluation est publiée pour encourager la recherche et les retours Comment utiliser GPT-4.5 dans ChatGPT À partir d’aujourd’hui, les utilisateurs ChatGPT Pro peuvent sélectionner GPT-4.5 sur le web, mobile et desktop La semaine prochaine, il sera proposé aux utilisateurs Plus et Team La semaine suivante, il sera proposé aux utilisateurs Enterprise et Edu Fonctionnalités principales : Recherche d’informations récentes disponible Prise en charge de l’upload de fichiers et d’images Travaux d’écriture et de code possibles avec Canvas En revanche, le mode vocal, la vidéo et le partage d’écran ne sont pas pris en charge Comment utiliser GPT-4.5 via l’API Mis à disposition des développeurs via les Chat Completions API, Assistants API et Batch API Fonctionnalités principales : Function Calling Structured Outputs Streaming System Messages Prise en charge des capacités de vision via l’entrée d’images Cas d’usage côté développeurs : Applications où l’intelligence émotionnelle et la créativité sont essentielles (ex. : assistant d’écriture, coaching d’apprentissage, brainstorming) Travaux de code complexes (ex. : workflows de développement multi-étapes, automatisation) Points à considérer concernant la disponibilité via l’API : GPT-4.5 est un modèle très gourmand en calcul et coûteux, il ne remplace donc pas GPT-4o OpenAI examine encore s’il sera maintenu à long terme dans l’API, et les retours des utilisateurs sont importants Conclusion GPT-4.5 est un modèle qui repousse les limites de l’apprentissage non supervisé, permettant d’explorer des capacités créatives et inédites Il ouvre la voie à de nouvelles possibilités pour l’IA, et OpenAI attend des cas d’usage innovants de la part des utilisateurs.

(openai.com)

4 points par xguru 2025-02-28 | 4 commentaires | Partager sur WhatsApp

GPT-4.5 est le dernier modèle d’OpenAI, une version qui améliore la scalabilité lors du pré-entraînement (pre-training) et du post-entraînement (post-training)
L’extension à grande échelle de l’apprentissage non supervisé (unsupervised learning) renforce la reconnaissance de motifs et l’intuition créative
Il permet des conversations plus naturelles, comprend mieux l’intention de l’utilisateur et améliore l’intelligence émotionnelle (EQ)
Il peut être utile dans diverses tâches comme l’écriture, la programmation et la résolution de problèmes
Le taux d’hallucination devrait diminuer
Proposé sous forme de research preview, il vise à explorer les points forts et les limites du modèle, ainsi qu’à recueillir divers cas d’usage

Extension de l’apprentissage non supervisé

Pour faire progresser l’IA, deux axes sont développés : l’apprentissage non supervisé et le raisonnement (reasoning)
- Renforcement du raisonnement : le modèle est entraîné à penser de manière structurée afin de résoudre des problèmes STEM complexes
  - Des modèles comme OpenAI o1 et OpenAI o3-mini ont fait progresser cette approche
- Extension de l’apprentissage non supervisé : davantage de données permettent d’améliorer l’intuition du modèle et la précision de ses connaissances du monde
GPT-4.5 a été entraîné sur le supercalculateur Microsoft Azure AI et dispose de connaissances plus larges ainsi que d’une compréhension plus profonde
- Cela réduit les hallucinations et fournit des résultats plus fiables sur une grande variété de sujets

Extension du paradigme GPT

GPT-4.5 possède des connaissances supérieures à celles des modèles précédents
- Il offre des analyses plus approfondies sur des questions historiques telles que l’origine du langage
- À une question comme « Quelle a été la première langue ? » :
  - Il est probable qu’il n’ait pas existé de première langue unique
  - On estime que le langage est apparu en Afrique il y a plus de 100 000 ans
  - Les proto-langues ont probablement évolué à partir de gestes, de sons et de signaux
  - Il est impossible de connaître avec précision l’origine du langage faute de traces écrites
Ainsi, GPT-4.5 peut aussi fournir des réponses approfondies en linguistique et en histoire

Des connaissances du monde plus profondes

Dans les résultats de l’évaluation SimpleQA, GPT-4.5 a enregistré une précision supérieure à celle des autres modèles
- Comparaison de la précision (Accuracy) :
  - GPT-4.5: 62.5%
  - GPT-4o: 38.2%
  - OpenAI o1: 47%
  - OpenAI o3-mini: 15%
- Comparaison du taux d’hallucination (Hallucination Rate) (plus bas = mieux) :
  - GPT-4.5: 37.1%
  - GPT-4o: 61.8%
  - OpenAI o1: 44%
  - OpenAI o3-mini: 80.3%
GPT-4.5 maintient une précision plus élevée sur les questions nécessitant une vérification factuelle et réduit le taux d’hallucination

Entraînement pour la collaboration avec les humains

GPT-4.5 a été entraîné pour mieux comprendre les demandes et les intentions humaines
- Il interprète plus finement l’intention de l’utilisateur et permet des conversations naturelles
- Son intelligence émotionnelle (EQ) est améliorée par rapport aux modèles précédents, ce qui lui permet de mieux saisir les nuances subtiles
- Il fait preuve d’une intuition créative et d’une sensibilité esthétique remarquables pour l’écriture et les travaux de design
Évaluation comparative (Win-rate vs GPT-4o)
- Tâches créatives : 56.8%
- Questions professionnelles : 63.2%
- Questions du quotidien : 57.0%
GPT-4.5 collabore plus naturellement avec les humains et identifie plus précisément l’intention de l’utilisateur au fil de la conversation

Perspectives : des capacités de raisonnement encore plus puissantes

GPT-4.5 n’est pas un modèle qui raisonne de manière logique avant de répondre
Il adopte une approche différente de celle des modèles centrés sur le raisonnement comme OpenAI o1 et OpenAI o3-mini
Pour les futurs modèles, la combinaison du pré-entraînement (pre-training) et du raisonnement (reasoning) devrait devenir l’élément clé

Renforcement de la sécurité

GPT-4.5 a été entraîné avec de nouvelles techniques de supervision, y compris le SFT (supervised fine-tuning) et le RLHF (reinforcement learning from human feedback) existants
Des tests de sécurité sont réalisés avant le déploiement du modèle afin d’évaluer les risques potentiels
Une system card présentant les résultats de l’évaluation est publiée pour encourager la recherche et les retours

Comment utiliser GPT-4.5 dans ChatGPT

À partir d’aujourd’hui, les utilisateurs ChatGPT Pro peuvent sélectionner GPT-4.5 sur le web, mobile et desktop
La semaine prochaine, il sera proposé aux utilisateurs Plus et Team
La semaine suivante, il sera proposé aux utilisateurs Enterprise et Edu
Fonctionnalités principales :
- Recherche d’informations récentes disponible
- Prise en charge de l’upload de fichiers et d’images
- Travaux d’écriture et de code possibles avec Canvas
- En revanche, le mode vocal, la vidéo et le partage d’écran ne sont pas pris en charge

Comment utiliser GPT-4.5 via l’API

Mis à disposition des développeurs via les Chat Completions API, Assistants API et Batch API
Fonctionnalités principales :
- Function Calling
- Structured Outputs
- Streaming
- System Messages
- Prise en charge des capacités de vision via l’entrée d’images
Cas d’usage côté développeurs :
- Applications où l’intelligence émotionnelle et la créativité sont essentielles (ex. : assistant d’écriture, coaching d’apprentissage, brainstorming)
- Travaux de code complexes (ex. : workflows de développement multi-étapes, automatisation)
Points à considérer concernant la disponibilité via l’API :
- GPT-4.5 est un modèle très gourmand en calcul et coûteux, il ne remplace donc pas GPT-4o
- OpenAI examine encore s’il sera maintenu à long terme dans l’API, et les retours des utilisateurs sont importants

Conclusion

GPT-4.5 est un modèle qui repousse les limites de l’apprentissage non supervisé, permettant d’explorer des capacités créatives et inédites
Il ouvre la voie à de nouvelles possibilités pour l’IA, et OpenAI attend des cas d’usage innovants de la part des utilisateurs.

4 commentaires

GN⁺ 2025-02-28

Commentaires Hacker News

Le prix de GPT 4.5 est très élevé
- Entrée : 75,00 $ par million de tokens
- Entrée mise en cache : 37,50 $ par million de tokens
- Sortie : 150,00 $ par million de tokens
- L’écart de prix est important par rapport à GPT 4o
- GPT-4.5 est un modèle très volumineux et gourmand en calcul, et son maintien à long terme dans l’API est encore en cours d’évaluation
- Les retours des utilisateurs sont importants
Premières impressions sur GPT-4.5
- Très lent, peu adapté aux interactions en temps réel
- Le style d’écriture s’est amélioré, plus décontracté et plus accessible
- Dans la comparaison de brouillons de livre entre GPT4o et GPT4.5, la différence saute aux yeux
Focus sur l’intelligence émotionnelle (EQ)
- Une tendance se dessine vers un « ami IA bienveillant »
- Anthropic et Grok évoluent aussi dans cette direction
- Espérons que ce comportement ne s’infiltre pas dans les réponses de l’API
Déception face au billet de blog et à la démo en live stream
- Le nouveau modèle n’est pas impressionnant
- OpenAI semble avoir du mal à garder de l’avance sur ses concurrents
- Le prix très élevé surprend
Des approches différentes chez OpenAI et Anthropic
- Anthropic pense qu’un paradigme unique (le raisonnement) peut convenir à tous les cas d’usage
- OpenAI pense qu’un ensemble de modèles aux capacités variées est nécessaire
- GPT 4.5, de par sa taille, peut stocker davantage de données factuelles
Performances de GPT-4.5 dans le benchmark LLM de Kagi
- Malgré son prix élevé et sa lenteur, ses performances sont excellentes
- Il reste néanmoins en retrait sur certaines tâches
Comment utiliser GPT-4.5 via l’API
- Il peut être exécuté avec l’outil uvx
- Il faut configurer une clé API
Comparaison des performances en code
- ChatGPT 4.5 est légèrement meilleur que ChatGPT 4o en programmation
- Anthropic Claude 3.7 affiche de meilleures performances
Compréhension de la tentative d’OpenAI
- GPT 4.5 a été une tentative importante pour explorer les lois de passage à l’échelle du préentraînement
- Un cadeau pour la science

xguru 2025-02-28

Le prix de GPT-4.5 (par 1M de tokens)

75 $ en entrée
37,50 $ pour les entrées mises en cache
150 $ en sortie
Si on compare les prix avec 4o, l’entrée est 30 fois plus chère et la sortie 15 fois plus chère.

Mais les performances ne s’améliorent pas non plus à ce point, donc il semble y avoir pas mal de mécontentement.

D’après les retours, quand on utilise GPT-4.5 dans Cursor, il fonctionne efficacement même dans des cas où d’autres modèles échouent.
Bien sûr, c’est tellement cher qu’il faut payer à l’usage. La réaction, c’est un peu : « Si je lui fais faire du code complexe, je vais finir ruiné. »
https://x.com/cursor_ai/status/1895210110714290302

bearmett 2025-02-28

En voyant le prix de Claude Code, j’ai eu à peu près la même réflexion. Quand on est salarié, si ça dépasse son taux horaire, ce n’est pas la faillite ? 😵‍💫

botplaysdice 2025-02-28

On dirait que c’est plutôt une bonne nouvelle. Selon le prix du modèle, notre valeur aussi... ;;;