9 points par kuroneko 2023-11-07 | 8 commentaires | Partager sur WhatsApp
  • Présentation du modèle GPT-4 Turbo prenant en charge une fenêtre de contexte de 128K, de l’API GPT-4 avec Vision, de l’API Assistants, de l’API DALL-E 3, du nouveau GPT-3.5 Turbo, etc.
  • GPT-4 Turbo
    • Prend en charge une fenêtre de contexte (Context Window) de 128K et a été entraîné sur des données allant jusqu’en avril 2023.
    • Par rapport à GPT-4, les jetons d’entrée coûtent 3 fois moins cher et les jetons de sortie 2 fois moins cher.
    • Suit mieux les instructions demandant de répondre dans un format spécifique, et dispose aussi d’un mode JSON garantissant une réponse en JSON.
    • Prend en charge des sorties reproductibles à partir d’un seed, et il est prévu d’ajouter une fonction renvoyant les log-probabilités des sorties.
    • GPT-3.5 Turbo est également mis à jour.
  • API Assistants
    • Une IA spécialisée dotée de fonctions d’interpréteur de code, de recherche et d’appel de fonctions.
    • Gère l’état sur la base de threads, ce qui permet de traiter des contenus d’une longueur illimitée.
    • Interpréteur de code - permet d’écrire et d’exécuter du code Python dans un environnement sandbox.
    • Recherche - recherche et répond à partir de connaissances externes au modèle, comme des documents fournis par l’utilisateur.
    • Appel de fonctions - peut appeler de manière appropriée des fonctions définies par l’utilisateur et inclure les résultats dans la réponse.
  • Autres nouvelles API
    • Une fonction de reconnaissance d’image a été ajoutée à GPT-4 Turbo.
    • DALL-E 3 est lancé via API, à 0,04 dollar par image générée.
    • Une API TTS a été ajoutée.
  • Personnalisation des modèles
    • Un modèle GPT-4 de fine-tuning devrait être proposé en accès expérimental.
    • Fourniture d’un service de modèles sur mesure pour créer des modèles personnalisés destinés aux grandes organisations.
      • Notamment un entraînement sur des jeux de données propriétaires de plusieurs milliards de jetons.
  • Baisse des prix
    • GPT-4 Turbo 128K coûte 0,01 dollar par jeton d’entrée et 0,03 dollar par jeton de sortie.
      • Par rapport à l’existant, les jetons d’entrée sont 3 fois moins chers et les jetons de sortie 2 fois moins chers.
    • GPT-3.5 Turbo 16K est proposé à 0,001 dollar par jeton d’entrée et 0,002 dollar par jeton de sortie.
      • Par rapport à l’existant, les jetons d’entrée sont 3 fois moins chers et les jetons de sortie 2 fois moins chers, et les jetons d’entrée sont aussi 33 % moins chers que sur le modèle 4K.
    • Le modèle de fine-tuning de GPT-3.5 Turbo est proposé à 0,003 dollar par jeton d’entrée et 0,006 dollar par jeton de sortie.
      • Par rapport à l’existant, les jetons d’entrée sont 4 fois moins chers et les jetons de sortie 2,7 fois moins chers.

8 commentaires

 
xguru 2023-11-10

Depuis hier, GN⁺ utilise aussi GPT-4 Turbo.
Il est clairement plus rapide dans ses réponses et comprend mieux les consignes.
Il résume bien comme demandé et produit aussi des résultats plus propres.
À l’origine, j’utilisais un mélange de prompts en anglais, mais désormais il répond très bien même avec des prompts uniquement en coréen.

 
botplaysdice 2023-11-08

Je ne m’y connais pas très bien en IA, mais la vitesse à laquelle les prix baissent va sans doute encore s’accélérer, non ? Franchement, j’arrive mal à imaginer à quoi ressemblera le monde dans un ou deux ans.

 
tkwlsrl 2023-11-07

Le prix ci-dessus par token correspond au prix pour 1 000 tokens. À noter.

 
shw00 2023-11-07

Et 128K tokens... désormais, pour les usages que j’en ai, les problèmes de contexte vont généralement disparaître.

 
xguru 2023-11-07

Ah, j’étais en train de préparer un résumé pour le poster, mais j’arrive trop tard, snif snif

 
kuroneko 2023-11-07

J’avais déjà trouvé ça impressionnant quand Anthropic avait dévoilé son modèle 100K, mais avec GPT-4 qui passe maintenant à 128K tokens, OpenAI semble reprendre de l’avance.
Les prix ont aussi globalement été divisés par plusieurs fois, donc jusqu’où va vraiment la maîtrise technologique d’OpenAI...

Quoi qu’il en soit, c’est une excellente nouvelle.
GPT-4 était mine de rien assez cher (surtout en 16K), mais là, avec une taille de contexte largement augmentée, c’est vraiment devenu nettement moins cher. +_+

Et l’Assistants API m’intrigue aussi, il va falloir que je l’essaie.
S’il n’est plus nécessaire d’utiliser des embeddings pour la recherche, ça a l’air encore plus intéressant... ?

 
kuroneko 2023-11-07

Résumé IA du fil HN.

  • OpenAI a annoncé de nouveaux modèles et produits pour développeurs, dont GPT-4 Turbo avec une fenêtre de contexte de 128 000 tokens, l'Assistants API et des prix plus bas.
  • Ces annonces visent à renforcer le lock-in sur la plateforme API d'OpenAI alors que la concurrence s'intensifie.
  • Les agents GPT et les assistants fonctionnent comme des « boîtes noires dans une boîte noire » qui ne peuvent pas être portées ailleurs.
  • Le prix de DALL-E 3 est de 0,04 $ par image, soit 10 fois plus que chez les concurrents.
  • Le prix du fine-tuning de ChatGPT 3.5 a désormais été multiplié par 3, ce qui rend le fine-tuning encore plus attractif.
  • La fenêtre de contexte 128K de GPT-4 Turbo est séduisante, mais les modèles open source restent encore en retrait en précision et en capacités.
  • Les clients peuvent désormais payer 2 à 3 millions de dollars pour préentraîner des modèles GPT-N personnalisés sur des données propriétaires.
  • Des catégories de startups comme les vectorDB et le traitement de fichiers pourraient être affectées à mesure qu'OpenAI propose des fonctionnalités similaires.
  • OpenAI cherche à pousser les développeurs à dépendre de sa plateforme sans prendre en compte les risques à long terme.
  • À mesure que la concurrence diminue, les développeurs accepteront des risques comme le lock-in en fonction de leurs besoins actuels et de leurs gains à court terme.
 
brainer 2023-11-07

Il y a une hallucination.

Les prix sont tous indiqués.