- Présentation du modèle GPT-4 Turbo prenant en charge une fenêtre de contexte de 128K, de l’API GPT-4 avec Vision, de l’API Assistants, de l’API DALL-E 3, du nouveau GPT-3.5 Turbo, etc.
- GPT-4 Turbo
- Prend en charge une fenêtre de contexte (Context Window) de 128K et a été entraîné sur des données allant jusqu’en avril 2023.
- Par rapport à GPT-4, les jetons d’entrée coûtent 3 fois moins cher et les jetons de sortie 2 fois moins cher.
- Suit mieux les instructions demandant de répondre dans un format spécifique, et dispose aussi d’un mode JSON garantissant une réponse en JSON.
- Prend en charge des sorties reproductibles à partir d’un
seed, et il est prévu d’ajouter une fonction renvoyant les log-probabilités des sorties.
- GPT-3.5 Turbo est également mis à jour.
- API Assistants
- Une IA spécialisée dotée de fonctions d’interpréteur de code, de recherche et d’appel de fonctions.
- Gère l’état sur la base de threads, ce qui permet de traiter des contenus d’une longueur illimitée.
- Interpréteur de code - permet d’écrire et d’exécuter du code Python dans un environnement sandbox.
- Recherche - recherche et répond à partir de connaissances externes au modèle, comme des documents fournis par l’utilisateur.
- Appel de fonctions - peut appeler de manière appropriée des fonctions définies par l’utilisateur et inclure les résultats dans la réponse.
- Autres nouvelles API
- Une fonction de reconnaissance d’image a été ajoutée à GPT-4 Turbo.
- DALL-E 3 est lancé via API, à 0,04 dollar par image générée.
- Une API TTS a été ajoutée.
- Personnalisation des modèles
- Un modèle GPT-4 de fine-tuning devrait être proposé en accès expérimental.
- Fourniture d’un service de modèles sur mesure pour créer des modèles personnalisés destinés aux grandes organisations.
- Notamment un entraînement sur des jeux de données propriétaires de plusieurs milliards de jetons.
- Baisse des prix
- GPT-4 Turbo 128K coûte 0,01 dollar par jeton d’entrée et 0,03 dollar par jeton de sortie.
- Par rapport à l’existant, les jetons d’entrée sont 3 fois moins chers et les jetons de sortie 2 fois moins chers.
- GPT-3.5 Turbo 16K est proposé à 0,001 dollar par jeton d’entrée et 0,002 dollar par jeton de sortie.
- Par rapport à l’existant, les jetons d’entrée sont 3 fois moins chers et les jetons de sortie 2 fois moins chers, et les jetons d’entrée sont aussi 33 % moins chers que sur le modèle 4K.
- Le modèle de fine-tuning de GPT-3.5 Turbo est proposé à 0,003 dollar par jeton d’entrée et 0,006 dollar par jeton de sortie.
- Par rapport à l’existant, les jetons d’entrée sont 4 fois moins chers et les jetons de sortie 2,7 fois moins chers.
8 commentaires
Depuis hier, GN⁺ utilise aussi GPT-4 Turbo.
Il est clairement plus rapide dans ses réponses et comprend mieux les consignes.
Il résume bien comme demandé et produit aussi des résultats plus propres.
À l’origine, j’utilisais un mélange de prompts en anglais, mais désormais il répond très bien même avec des prompts uniquement en coréen.
Je ne m’y connais pas très bien en IA, mais la vitesse à laquelle les prix baissent va sans doute encore s’accélérer, non ? Franchement, j’arrive mal à imaginer à quoi ressemblera le monde dans un ou deux ans.
Le prix ci-dessus par token correspond au prix pour 1 000 tokens. À noter.
Et 128K tokens... désormais, pour les usages que j’en ai, les problèmes de contexte vont généralement disparaître.
Ah, j’étais en train de préparer un résumé pour le poster, mais j’arrive trop tard, snif snif
J’avais déjà trouvé ça impressionnant quand Anthropic avait dévoilé son modèle 100K, mais avec GPT-4 qui passe maintenant à 128K tokens, OpenAI semble reprendre de l’avance.
Les prix ont aussi globalement été divisés par plusieurs fois, donc jusqu’où va vraiment la maîtrise technologique d’OpenAI...
Quoi qu’il en soit, c’est une excellente nouvelle.
GPT-4 était mine de rien assez cher (surtout en 16K), mais là, avec une taille de contexte largement augmentée, c’est vraiment devenu nettement moins cher. +_+
Et l’Assistants API m’intrigue aussi, il va falloir que je l’essaie.
S’il n’est plus nécessaire d’utiliser des embeddings pour la recherche, ça a l’air encore plus intéressant... ?
Résumé IA du fil HN.
Il y a une hallucination.
Les prix sont tous indiqués.