OpenAI dévoile GPT-4o mini, son petit modèle le plus rentable

xguru · 2024-07-19T11:52:11+09:00

GPT-4o mini devrait rendre l’intelligence artificielle bien plus abordable et élargir considérablement le champ des applications construites avec l’IA Il a obtenu un score de 82 % au MMLU et dépasse actuellement GPT-4 dans les préférences de chat du classement LMSYS Son prix est de 0,15 $ par million de tokens en entrée et 0,60 $ par million de tokens en sortie, soit 10 fois moins cher que le précédent modèle de pointe et plus de 60 % moins cher que GPT-3.5 Turbo Principales fonctionnalités de GPT-4o mini Il peut effectuer un large éventail de tâches avec un coût et une latence faibles Il convient aux applications qui enchaînent ou parallélisent plusieurs appels de modèle (par exemple plusieurs appels d’API) Il convient aux applications qui transmettent une grande quantité de contexte au modèle (par exemple une base de code complète ou un historique de conversation) Il convient aux applications qui échangent rapidement des réponses textuelles en temps réel avec les clients (par exemple les chatbots de support client) Il prend en charge le texte et la vision dans l’API, et prendra en charge à l’avenir les entrées/sorties texte, image, vidéo et audio Il dispose d’une fenêtre de contexte de 128K tokens, prend en charge jusqu’à 16K tokens de sortie par requête et possède des connaissances arrêtées à octobre 2023 Grâce au tokenizer amélioré partagé avec GPT-4o, le traitement des textes autres que l’anglais devient plus rentable Excellentes performances de GPT-4o mini GPT-4o mini dépasse GPT-3.5 Turbo et d’autres petits modèles, aussi bien en intelligence textuelle qu’en raisonnement multimodal Il prend en charge la même couverture linguistique que GPT-4o Ses performances en function calling sont excellentes, ce qui permet aux développeurs de créer des applications qui récupèrent des données depuis des systèmes externes ou exécutent des tâches Ses performances sur les contextes longs sont améliorées par rapport à GPT-3.5 Turbo Avec 82,0 % au MMLU, 87,0 % au MGSM, 87,2 % au HumanEval et 59,4 % au MMMU, il affiche de meilleures performances que les autres petits modèles Mesures de sécurité Pendant le préentraînement, les informations que l’on ne souhaite pas que le modèle apprenne ou produise (par exemple les discours haineux, les contenus pour adultes, les sites collectant principalement des données personnelles, le spam, etc.) sont filtrées Lors du post-entraînement, des techniques comme l’apprentissage par renforcement à partir de retours humains (RLHF) sont utilisées pour aligner le comportement du modèle sur les politiques, afin d’améliorer la précision et la fiabilité des réponses GPT-4o mini intègre les mêmes dispositifs d’atténuation de sécurité que GPT-4o Plus de 70 experts externes ont testé GPT-4o afin d’identifier les risques potentiels ; ceux-ci ont été traités et seront détaillés dans la system card et la preparedness scorecard de GPT-4o GPT-4o mini est le premier modèle de l’API à appliquer la méthode instruction hierarchy afin d’améliorer sa résistance au jailbreak, à l’injection de prompt et à l’extraction du prompt système Tarification et disponibilité GPT-4o mini est désormais disponible comme modèle texte et vision dans l’Assistants API, la Chat Completions API et la Batch API Les développeurs paient 0,15 $ par million de tokens en entrée et 0,60 $ par million de tokens en sortie Le fine-tuning de GPT-4o mini sera lancé dans les prochains jours Les utilisateurs Free, Plus et Team de ChatGPT peuvent accéder à GPT-4o mini à la place de GPT-3.5 dès aujourd’hui Les utilisateurs Enterprise y auront également accès à partir de la semaine prochaine Plans à venir D’importantes réductions de coûts accompagnent les progrès remarquables de l’intelligence de l’IA Le coût par token de GPT-4o mini est 99 % inférieur à celui de text-davinci-003, introduit en 2022 OpenAI imagine un avenir où les modèles s’intègrent de façon fluide dans toutes les applications et tous les sites web GPT-4o mini ouvre la voie à des applications d’IA puissantes que les développeurs pourront concevoir et faire évoluer de manière plus efficace et moins coûteuse L’avenir de l’IA devient plus accessible, plus fiable et de plus en plus intégré à nos expériences numériques quotidiennes

(openai.com)

12 points par xguru 2024-07-19 | 1 commentaires | Partager sur WhatsApp

GPT-4o mini devrait rendre l’intelligence artificielle bien plus abordable et élargir considérablement le champ des applications construites avec l’IA
Il a obtenu un score de 82 % au MMLU et dépasse actuellement GPT-4 dans les préférences de chat du classement LMSYS
Son prix est de 0,15 $ par million de tokens en entrée et 0,60 $ par million de tokens en sortie, soit 10 fois moins cher que le précédent modèle de pointe et plus de 60 % moins cher que GPT-3.5 Turbo

Principales fonctionnalités de GPT-4o mini

Il peut effectuer un large éventail de tâches avec un coût et une latence faibles
Il convient aux applications qui enchaînent ou parallélisent plusieurs appels de modèle (par exemple plusieurs appels d’API)
Il convient aux applications qui transmettent une grande quantité de contexte au modèle (par exemple une base de code complète ou un historique de conversation)
Il convient aux applications qui échangent rapidement des réponses textuelles en temps réel avec les clients (par exemple les chatbots de support client)
Il prend en charge le texte et la vision dans l’API, et prendra en charge à l’avenir les entrées/sorties texte, image, vidéo et audio
Il dispose d’une fenêtre de contexte de 128K tokens, prend en charge jusqu’à 16K tokens de sortie par requête et possède des connaissances arrêtées à octobre 2023
Grâce au tokenizer amélioré partagé avec GPT-4o, le traitement des textes autres que l’anglais devient plus rentable

Excellentes performances de GPT-4o mini

GPT-4o mini dépasse GPT-3.5 Turbo et d’autres petits modèles, aussi bien en intelligence textuelle qu’en raisonnement multimodal
Il prend en charge la même couverture linguistique que GPT-4o
Ses performances en function calling sont excellentes, ce qui permet aux développeurs de créer des applications qui récupèrent des données depuis des systèmes externes ou exécutent des tâches
Ses performances sur les contextes longs sont améliorées par rapport à GPT-3.5 Turbo
Avec 82,0 % au MMLU, 87,0 % au MGSM, 87,2 % au HumanEval et 59,4 % au MMMU, il affiche de meilleures performances que les autres petits modèles

Mesures de sécurité

Pendant le préentraînement, les informations que l’on ne souhaite pas que le modèle apprenne ou produise (par exemple les discours haineux, les contenus pour adultes, les sites collectant principalement des données personnelles, le spam, etc.) sont filtrées
Lors du post-entraînement, des techniques comme l’apprentissage par renforcement à partir de retours humains (RLHF) sont utilisées pour aligner le comportement du modèle sur les politiques, afin d’améliorer la précision et la fiabilité des réponses
GPT-4o mini intègre les mêmes dispositifs d’atténuation de sécurité que GPT-4o
Plus de 70 experts externes ont testé GPT-4o afin d’identifier les risques potentiels ; ceux-ci ont été traités et seront détaillés dans la system card et la preparedness scorecard de GPT-4o
GPT-4o mini est le premier modèle de l’API à appliquer la méthode instruction hierarchy afin d’améliorer sa résistance au jailbreak, à l’injection de prompt et à l’extraction du prompt système

Tarification et disponibilité

GPT-4o mini est désormais disponible comme modèle texte et vision dans l’Assistants API, la Chat Completions API et la Batch API
Les développeurs paient 0,15 $ par million de tokens en entrée et 0,60 $ par million de tokens en sortie
Le fine-tuning de GPT-4o mini sera lancé dans les prochains jours
Les utilisateurs Free, Plus et Team de ChatGPT peuvent accéder à GPT-4o mini à la place de GPT-3.5 dès aujourd’hui
Les utilisateurs Enterprise y auront également accès à partir de la semaine prochaine

Plans à venir

D’importantes réductions de coûts accompagnent les progrès remarquables de l’intelligence de l’IA
Le coût par token de GPT-4o mini est 99 % inférieur à celui de text-davinci-003, introduit en 2022
OpenAI imagine un avenir où les modèles s’intègrent de façon fluide dans toutes les applications et tous les sites web
GPT-4o mini ouvre la voie à des applications d’IA puissantes que les développeurs pourront concevoir et faire évoluer de manière plus efficace et moins coûteuse
L’avenir de l’IA devient plus accessible, plus fiable et de plus en plus intégré à nos expériences numériques quotidiennes

1 commentaires

wedding 2024-07-22

On aura sans doute aussi droit à un gpt-4o pro max ultra.