- À mesure que les technologies d’IA progressent, elles deviennent capables de résoudre des problèmes plus complexes et plus importants, ce qui nécessite des ressources de calcul considérables
- ChatGPT Pro est une formule à 200 $ par mois qui permet d’utiliser de manière étendue les derniers modèles et outils d’OpenAI
- o1 : le modèle le plus intelligent
- o1-mini, GPT-4o et Advanced Voice sont également inclus
- o1 pro mode : utilise davantage de ressources de calcul pour réfléchir plus en profondeur et fournir des réponses plus élaborées à des problèmes complexes
- Des fonctionnalités de productivité plus puissantes seront ajoutées à l’avenir
- Conçu pour les chercheurs, les ingénieurs et les personnes qui effectuent un travail centré sur la recherche, afin d’améliorer leur productivité et de les aider à se situer à l’avant-garde des progrès de l’IA
- Le o1 pro mode de ChatGPT Pro est un modèle avancé qui fournit des réponses hautement fiables
- Il offre notamment des réponses précises et complètes en data science, en programmation et en analyse juridique
- Par rapport à o1 et o1-preview, il affiche de meilleures performances sur des benchmarks de machine learning difficiles en mathématiques, sciences et code
Comparaison principale des performances (sur la base de la précision pass@1)
- Compétition de mathématiques (AIME 2024)
- o1-preview: 50
- o1: 78
- o1 pro mode: 86
- Compétition de code (Codeforces)
- o1-preview: 62
- o1: 89
- o1 pro mode: 90
- Questions scientifiques de niveau doctorat (GPQA Diamond)
- o1-preview: 74
- o1: 76
- o1 pro mode: 79
Amélioration de la fiabilité : évaluation « 4/4 reliability »
- Introduction d’un critère d’évaluation plus strict : une question n’est considérée comme résolue que si la bonne réponse est obtenue 4 fois sur 4 tentatives
Comparaison principale des performances (sur la base de la fiabilité 4/4)
- Compétition de mathématiques (AIME 2024)
- o1-preview: 37
- o1: 67
- o1 pro mode: 80
- Compétition de code (Codeforces)
- o1-preview: 26
- o1: 64
- o1 pro mode: 75
- Questions scientifiques de niveau doctorat (GPQA Diamond)
- o1-preview: 58
- o1: 67
- o1 pro mode: 74
7 commentaires
Je l’ai utilisé en version Pro, et la brièveté de la fenêtre de contexte est rédhibitoire. Il peut certes écrire des contenus longs, mais au bout d’un certain temps, le contenu ou le format initial qu’il était en train de produire commence peu à peu à se dégrader.
OpenAI s’éloigne de plus en plus de l’idée d’« open ».
C’est sans doute la réalité.
Je pensais qu’ils allaient augmenter le prix de l’abonnement Plus parce que le coût devenait difficile à absorber, mais au lieu de ça, ils attaquent le marché en créant une gamme encore plus haut de gamme. Je m’en sers vraiment très bien au quotidien, mais je pense que je n’ai pas besoin d’aller jusqu’à la version Pro. Haha
J’utilise Plus depuis un moment. Depuis quelque temps, pour le même type de moteur et le même type de prompt, j’ai l’impression que l’exécution a changé. J’ai le sentiment que ça marche moins bien qu’avant.
Je me demande s’ils n’ont pas bridé les modèles disponibles dans l’offre Plus existante pour les découper et les vendre séparément.
En général, plus c’est cher, plus on a confiance dans la performance, mais avec les services d’IA, ce n’est pas le cas. On dirait que, comme une connexion Internet qu’on bride discrètement du jour au lendemain, l’IA a aussi de fortes chances d’évoluer dans ce sens.
J’utilise aussi Plus, mais c’est peut-être l’orientation générale des réponses ? Il porte le même nom,
o1, mais l’impression d’ensemble est complètement différente de la preview. Ça me fait même penser que quelqu’un bride la sortie des tokens.Je suis d’accord. Moi aussi, même en utilisant la même version au même moment, j’ai l’impression que les performances font le yo-yo sans aucune mention particulière. C’est un peu un autre sujet, mais pour certains services, il n’y a aucun moyen de vérifier qu’ils ne collectent pas d’informations, donc j’ai l’impression que cela relève finalement d’un acte de foi.
Avis Hacker News
OpenAI est en concurrence entre la vitesse de progression des alternatives open source et la nécessité de générer des revenus. Son succès dépendra du choix des grandes entreprises pour les solutions d’IA intégrées et sûres d’OpenAI. Cela rappelle la stratégie d’IBM dans l’informatique d’entreprise.
Le fait que la fenêtre de contexte de la version Pro soit courte est source de frustration. En tant qu’abonné Plus, j’espérais une fenêtre de contexte plus longue, mais il n’y a absolument aucune discussion à ce sujet. Je recommande vivement aux concurrents d’en faire un élément de différenciation.
Ma première impression après avoir acheté l’abonnement Pro est que le nouveau modèle o1-Pro est un excellent rédacteur. Il gère très bien les prompts longs et l’analyse de données complexe.
L’offre pour obtenir davantage de puissance de calcul peut s’expliquer par l’effet de leurre en matière de tarification. Introduire une option très chère rend les autres forfaits plus raisonnables en apparence.
Je paie 166 euros par mois pour Claude Teams. C’est grâce à la fonction Projects, qui permet d’importer beaucoup de fichiers et de poser des questions dans un contexte précis. Cette fonction est si puissante qu’on a l’impression d’avoir des chercheurs au bout des doigts.
J’obtiens de meilleures performances chez Anthropic pour un coût bien inférieur. Je suis sceptique face à l’affirmation selon laquelle le nouveau GPT serait 10 fois meilleur que Claude.
Je me demande si OpenAI pourra atteindre une IA « générale » avant que les investisseurs ne se lassent. Le succès de ChatGPT a peut-être laissé entendre qu’ils avaient une voie crédible pour y parvenir.
La principale difficulté d’un abonnement mensuel avec usage « illimité » pour ce type de produit, ce sont les 1 % de power users qui en font un usage extrême. Le prix de ChatGPT Pro vise les power users et les entreprises.
J’ai passé 4,5 heures à écrire une formule complexe dans Google Sheets. Si le nouveau mode ChatGPT Pro est plus rapide, cela représente un avantage majeur en gain de temps.
Il existe des cas où le modèle o1 est utilisé dans des usines à entretiens pour mener des entretiens. Pour ce type d’usage, les 200 $ par mois peuvent sembler bon marché.