1 points par flyingsquirrel 4 시간 전 | Aucun commentaire pour le moment. | Partager sur WhatsApp

Anthropic a lancé Claude Opus 4.8, une version améliorée de Claude Opus, son modèle haut de gamme. Basée sur la version 4.7 précédente, elle améliore les performances aux benchmarks et renforce les capacités de collaboration, tout en conservant le même prix.

Principales améliorations et caractéristiques

  • Amélioration des performances : le modèle affiche de meilleures performances que la version précédente et que des modèles concurrents comme GPT-5.5 dans le codage, les compétences agentiques, le raisonnement et les tâches de connaissance métier.
  • Renforcement de l’honnêteté (Honesty) : les problèmes où l’IA avance des affirmations sans fondement ou tire des conclusions hâtives ont été améliorés. Opus 4.8 signale lui-même les zones d’incertitude, et la probabilité de passer à côté de défauts dans le code a été réduite d’environ 4 fois par rapport au modèle précédent.
  • Capacités agentiques fiables : selon les premiers tests, son jugement s’est affiné dans l’exécution de tâches complexes à plusieurs étapes, et il montre de meilleures capacités de collaboration, notamment en détectant ses propres erreurs et en contestant un plan lorsqu’il n’est pas pertinent.
  • Efficacité des coûts : la vitesse du 'Fast Mode' a été multipliée par 2,5, et son coût est devenu 3 fois moins élevé que celui du modèle précédent.

Nouvelles fonctionnalités lancées en même temps

  • Dynamic Workflows : une fonctionnalité en research preview de Claude Code, qui permet d’exécuter des centaines de sous-agents en parallèle pour réaliser des tâches complexes comme la migration de grandes bases de code.
  • Effort Control : l’utilisateur peut choisir le niveau d’effort que Claude doit consacrer à une tâche. Avec un réglage élevé, il réfléchit plus en profondeur pour fournir des réponses de meilleure qualité ; avec un réglage faible, il répond plus rapidement.
  • Mise à jour de la Messages API : il est désormais possible d’inclure des entrées système dans le tableau de messages, ce qui permet de mettre à jour les instructions en cours de tâche sans casser le cache de prompt.

Feuille de route

Anthropic développe un modèle offrant des performances de niveau Opus à un coût plus faible et prépare, via Project Glasswing, une nouvelle classe de modèles dotés d’une intelligence supérieure à celle d’Opus (Claude Mythos). Le modèle est actuellement en phase de tests de sécurité auprès de certaines organisations et devrait être rendu public pour tous les clients dans les prochaines semaines.

Tarification et disponibilité

  • Mode standard : entrée $5 / 1M tokens, sortie $25 / 1M tokens (identique à Opus 4.7)
  • Fast Mode : entrée $10 / 1M tokens, sortie $50 / 1M tokens
  • Nom du modèle : claude-opus-4-8

Aucun commentaire pour le moment.

Aucun commentaire pour le moment.