4 points par xguru 2025-02-28 | 4 commentaires | Partager sur WhatsApp
  • GPT-4.5 est le dernier modèle d’OpenAI, une version qui améliore la scalabilité lors du pré-entraînement (pre-training) et du post-entraînement (post-training)
  • L’extension à grande échelle de l’apprentissage non supervisé (unsupervised learning) renforce la reconnaissance de motifs et l’intuition créative
  • Il permet des conversations plus naturelles, comprend mieux l’intention de l’utilisateur et améliore l’intelligence émotionnelle (EQ)
  • Il peut être utile dans diverses tâches comme l’écriture, la programmation et la résolution de problèmes
  • Le taux d’hallucination devrait diminuer
  • Proposé sous forme de research preview, il vise à explorer les points forts et les limites du modèle, ainsi qu’à recueillir divers cas d’usage

Extension de l’apprentissage non supervisé

  • Pour faire progresser l’IA, deux axes sont développés : l’apprentissage non supervisé et le raisonnement (reasoning)
    • Renforcement du raisonnement : le modèle est entraîné à penser de manière structurée afin de résoudre des problèmes STEM complexes
      • Des modèles comme OpenAI o1 et OpenAI o3-mini ont fait progresser cette approche
    • Extension de l’apprentissage non supervisé : davantage de données permettent d’améliorer l’intuition du modèle et la précision de ses connaissances du monde
  • GPT-4.5 a été entraîné sur le supercalculateur Microsoft Azure AI et dispose de connaissances plus larges ainsi que d’une compréhension plus profonde
    • Cela réduit les hallucinations et fournit des résultats plus fiables sur une grande variété de sujets

Extension du paradigme GPT

  • GPT-4.5 possède des connaissances supérieures à celles des modèles précédents
    • Il offre des analyses plus approfondies sur des questions historiques telles que l’origine du langage
    • À une question comme « Quelle a été la première langue ? » :
      • Il est probable qu’il n’ait pas existé de première langue unique
      • On estime que le langage est apparu en Afrique il y a plus de 100 000 ans
      • Les proto-langues ont probablement évolué à partir de gestes, de sons et de signaux
      • Il est impossible de connaître avec précision l’origine du langage faute de traces écrites
  • Ainsi, GPT-4.5 peut aussi fournir des réponses approfondies en linguistique et en histoire

Des connaissances du monde plus profondes

  • Dans les résultats de l’évaluation SimpleQA, GPT-4.5 a enregistré une précision supérieure à celle des autres modèles
    • Comparaison de la précision (Accuracy) :
      • GPT-4.5: 62.5%
      • GPT-4o: 38.2%
      • OpenAI o1: 47%
      • OpenAI o3-mini: 15%
    • Comparaison du taux d’hallucination (Hallucination Rate) (plus bas = mieux) :
      • GPT-4.5: 37.1%
      • GPT-4o: 61.8%
      • OpenAI o1: 44%
      • OpenAI o3-mini: 80.3%
  • GPT-4.5 maintient une précision plus élevée sur les questions nécessitant une vérification factuelle et réduit le taux d’hallucination

Entraînement pour la collaboration avec les humains

  • GPT-4.5 a été entraîné pour mieux comprendre les demandes et les intentions humaines
    • Il interprète plus finement l’intention de l’utilisateur et permet des conversations naturelles
    • Son intelligence émotionnelle (EQ) est améliorée par rapport aux modèles précédents, ce qui lui permet de mieux saisir les nuances subtiles
    • Il fait preuve d’une intuition créative et d’une sensibilité esthétique remarquables pour l’écriture et les travaux de design
  • Évaluation comparative (Win-rate vs GPT-4o)
    • Tâches créatives : 56.8%
    • Questions professionnelles : 63.2%
    • Questions du quotidien : 57.0%
  • GPT-4.5 collabore plus naturellement avec les humains et identifie plus précisément l’intention de l’utilisateur au fil de la conversation

Perspectives : des capacités de raisonnement encore plus puissantes

  • GPT-4.5 n’est pas un modèle qui raisonne de manière logique avant de répondre
  • Il adopte une approche différente de celle des modèles centrés sur le raisonnement comme OpenAI o1 et OpenAI o3-mini
  • Pour les futurs modèles, la combinaison du pré-entraînement (pre-training) et du raisonnement (reasoning) devrait devenir l’élément clé

Renforcement de la sécurité

  • GPT-4.5 a été entraîné avec de nouvelles techniques de supervision, y compris le SFT (supervised fine-tuning) et le RLHF (reinforcement learning from human feedback) existants
  • Des tests de sécurité sont réalisés avant le déploiement du modèle afin d’évaluer les risques potentiels
  • Une system card présentant les résultats de l’évaluation est publiée pour encourager la recherche et les retours

Comment utiliser GPT-4.5 dans ChatGPT

  • À partir d’aujourd’hui, les utilisateurs ChatGPT Pro peuvent sélectionner GPT-4.5 sur le web, mobile et desktop
  • La semaine prochaine, il sera proposé aux utilisateurs Plus et Team
  • La semaine suivante, il sera proposé aux utilisateurs Enterprise et Edu
  • Fonctionnalités principales :
    • Recherche d’informations récentes disponible
    • Prise en charge de l’upload de fichiers et d’images
    • Travaux d’écriture et de code possibles avec Canvas
    • En revanche, le mode vocal, la vidéo et le partage d’écran ne sont pas pris en charge

Comment utiliser GPT-4.5 via l’API

  • Mis à disposition des développeurs via les Chat Completions API, Assistants API et Batch API
  • Fonctionnalités principales :
    • Function Calling
    • Structured Outputs
    • Streaming
    • System Messages
    • Prise en charge des capacités de vision via l’entrée d’images
  • Cas d’usage côté développeurs :
    • Applications où l’intelligence émotionnelle et la créativité sont essentielles (ex. : assistant d’écriture, coaching d’apprentissage, brainstorming)
    • Travaux de code complexes (ex. : workflows de développement multi-étapes, automatisation)
  • Points à considérer concernant la disponibilité via l’API :
    • GPT-4.5 est un modèle très gourmand en calcul et coûteux, il ne remplace donc pas GPT-4o
    • OpenAI examine encore s’il sera maintenu à long terme dans l’API, et les retours des utilisateurs sont importants

Conclusion

  • GPT-4.5 est un modèle qui repousse les limites de l’apprentissage non supervisé, permettant d’explorer des capacités créatives et inédites
  • Il ouvre la voie à de nouvelles possibilités pour l’IA, et OpenAI attend des cas d’usage innovants de la part des utilisateurs.

4 commentaires

 
GN⁺ 2025-02-28

Commentaires Hacker News

  • Le prix de GPT 4.5 est très élevé

    • Entrée : 75,00 $ par million de tokens
    • Entrée mise en cache : 37,50 $ par million de tokens
    • Sortie : 150,00 $ par million de tokens
    • L’écart de prix est important par rapport à GPT 4o
    • GPT-4.5 est un modèle très volumineux et gourmand en calcul, et son maintien à long terme dans l’API est encore en cours d’évaluation
    • Les retours des utilisateurs sont importants
  • Premières impressions sur GPT-4.5

    • Très lent, peu adapté aux interactions en temps réel
    • Le style d’écriture s’est amélioré, plus décontracté et plus accessible
    • Dans la comparaison de brouillons de livre entre GPT4o et GPT4.5, la différence saute aux yeux
  • Focus sur l’intelligence émotionnelle (EQ)

    • Une tendance se dessine vers un « ami IA bienveillant »
    • Anthropic et Grok évoluent aussi dans cette direction
    • Espérons que ce comportement ne s’infiltre pas dans les réponses de l’API
  • Déception face au billet de blog et à la démo en live stream

    • Le nouveau modèle n’est pas impressionnant
    • OpenAI semble avoir du mal à garder de l’avance sur ses concurrents
    • Le prix très élevé surprend
  • Des approches différentes chez OpenAI et Anthropic

    • Anthropic pense qu’un paradigme unique (le raisonnement) peut convenir à tous les cas d’usage
    • OpenAI pense qu’un ensemble de modèles aux capacités variées est nécessaire
    • GPT 4.5, de par sa taille, peut stocker davantage de données factuelles
  • Performances de GPT-4.5 dans le benchmark LLM de Kagi

    • Malgré son prix élevé et sa lenteur, ses performances sont excellentes
    • Il reste néanmoins en retrait sur certaines tâches
  • Comment utiliser GPT-4.5 via l’API

    • Il peut être exécuté avec l’outil uvx
    • Il faut configurer une clé API
  • Comparaison des performances en code

    • ChatGPT 4.5 est légèrement meilleur que ChatGPT 4o en programmation
    • Anthropic Claude 3.7 affiche de meilleures performances
  • Compréhension de la tentative d’OpenAI

    • GPT 4.5 a été une tentative importante pour explorer les lois de passage à l’échelle du préentraînement
    • Un cadeau pour la science
 
xguru 2025-02-28

Le prix de GPT-4.5 (par 1M de tokens)

  • 75 $ en entrée
  • 37,50 $ pour les entrées mises en cache
  • 150 $ en sortie
    Si on compare les prix avec 4o, l’entrée est 30 fois plus chère et la sortie 15 fois plus chère.

Mais les performances ne s’améliorent pas non plus à ce point, donc il semble y avoir pas mal de mécontentement.

D’après les retours, quand on utilise GPT-4.5 dans Cursor, il fonctionne efficacement même dans des cas où d’autres modèles échouent.
Bien sûr, c’est tellement cher qu’il faut payer à l’usage. La réaction, c’est un peu : « Si je lui fais faire du code complexe, je vais finir ruiné. »
https://x.com/cursor_ai/status/1895210110714290302

 
bearmett 2025-02-28

En voyant le prix de Claude Code, j’ai eu à peu près la même réflexion. Quand on est salarié, si ça dépasse son taux horaire, ce n’est pas la faillite ? 😵‍💫

 
botplaysdice 2025-02-28

On dirait que c’est plutôt une bonne nouvelle. Selon le prix du modèle, notre valeur aussi... ;;;