- GPT-4o mini devrait rendre l’intelligence artificielle bien plus abordable et élargir considérablement le champ des applications construites avec l’IA
- Il a obtenu un score de 82 % au MMLU et dépasse actuellement GPT-4 dans les préférences de chat du classement LMSYS
- Son prix est de 0,15 $ par million de tokens en entrée et 0,60 $ par million de tokens en sortie, soit 10 fois moins cher que le précédent modèle de pointe et plus de 60 % moins cher que GPT-3.5 Turbo
Principales fonctionnalités de GPT-4o mini
- Il peut effectuer un large éventail de tâches avec un coût et une latence faibles
- Il convient aux applications qui enchaînent ou parallélisent plusieurs appels de modèle (par exemple plusieurs appels d’API)
- Il convient aux applications qui transmettent une grande quantité de contexte au modèle (par exemple une base de code complète ou un historique de conversation)
- Il convient aux applications qui échangent rapidement des réponses textuelles en temps réel avec les clients (par exemple les chatbots de support client)
- Il prend en charge le texte et la vision dans l’API, et prendra en charge à l’avenir les entrées/sorties texte, image, vidéo et audio
- Il dispose d’une fenêtre de contexte de 128K tokens, prend en charge jusqu’à 16K tokens de sortie par requête et possède des connaissances arrêtées à octobre 2023
- Grâce au tokenizer amélioré partagé avec GPT-4o, le traitement des textes autres que l’anglais devient plus rentable
Excellentes performances de GPT-4o mini
- GPT-4o mini dépasse GPT-3.5 Turbo et d’autres petits modèles, aussi bien en intelligence textuelle qu’en raisonnement multimodal
- Il prend en charge la même couverture linguistique que GPT-4o
- Ses performances en function calling sont excellentes, ce qui permet aux développeurs de créer des applications qui récupèrent des données depuis des systèmes externes ou exécutent des tâches
- Ses performances sur les contextes longs sont améliorées par rapport à GPT-3.5 Turbo
- Avec 82,0 % au MMLU, 87,0 % au MGSM, 87,2 % au HumanEval et 59,4 % au MMMU, il affiche de meilleures performances que les autres petits modèles
Mesures de sécurité
- Pendant le préentraînement, les informations que l’on ne souhaite pas que le modèle apprenne ou produise (par exemple les discours haineux, les contenus pour adultes, les sites collectant principalement des données personnelles, le spam, etc.) sont filtrées
- Lors du post-entraînement, des techniques comme l’apprentissage par renforcement à partir de retours humains (RLHF) sont utilisées pour aligner le comportement du modèle sur les politiques, afin d’améliorer la précision et la fiabilité des réponses
- GPT-4o mini intègre les mêmes dispositifs d’atténuation de sécurité que GPT-4o
- Plus de 70 experts externes ont testé GPT-4o afin d’identifier les risques potentiels ; ceux-ci ont été traités et seront détaillés dans la system card et la preparedness scorecard de GPT-4o
- GPT-4o mini est le premier modèle de l’API à appliquer la méthode instruction hierarchy afin d’améliorer sa résistance au jailbreak, à l’injection de prompt et à l’extraction du prompt système
Tarification et disponibilité
- GPT-4o mini est désormais disponible comme modèle texte et vision dans l’Assistants API, la Chat Completions API et la Batch API
- Les développeurs paient 0,15 $ par million de tokens en entrée et 0,60 $ par million de tokens en sortie
- Le fine-tuning de GPT-4o mini sera lancé dans les prochains jours
- Les utilisateurs Free, Plus et Team de ChatGPT peuvent accéder à GPT-4o mini à la place de GPT-3.5 dès aujourd’hui
- Les utilisateurs Enterprise y auront également accès à partir de la semaine prochaine
Plans à venir
- D’importantes réductions de coûts accompagnent les progrès remarquables de l’intelligence de l’IA
- Le coût par token de GPT-4o mini est 99 % inférieur à celui de
text-davinci-003, introduit en 2022
- OpenAI imagine un avenir où les modèles s’intègrent de façon fluide dans toutes les applications et tous les sites web
- GPT-4o mini ouvre la voie à des applications d’IA puissantes que les développeurs pourront concevoir et faire évoluer de manière plus efficace et moins coûteuse
- L’avenir de l’IA devient plus accessible, plus fiable et de plus en plus intégré à nos expériences numériques quotidiennes
1 commentaires
On aura sans doute aussi droit à un gpt-4o pro max ultra.