Sortie de Claude 3.5 Sonnet : des performances supérieures à GPT-4o

(anthropic.com)

15 points par brainer 2024-06-21 | 1 commentaires | Partager sur WhatsApp

Anthropic a annoncé aujourd’hui la sortie de Claude 3.5 Sonnet. Il s’agit de la première version de la future famille de modèles Claude 3.5, avec des performances supérieures à celles de Claude 3 Opus et des modèles concurrents. Claude 3.5 Sonnet est proposé au même niveau de vitesse et de coût que Claude 3 Sonnet, le modèle intermédiaire.

Modalités de disponibilité

Claude 3.5 Sonnet est disponible gratuitement sur Claude.ai et dans l’application iOS de Claude, tandis que les abonnés aux offres Claude Pro et Team y ont accès avec des limites de requêtes plus élevées. Il est également accessible via l’API Anthropic, Amazon Bedrock et Vertex AI de Google Cloud. Son tarif est de 3 $ par million de tokens en entrée et 15 $ par million de tokens en sortie, avec une fenêtre de contexte de 200K tokens.

Améliorations des performances

Claude 3.5 Sonnet établit une nouvelle référence en raisonnement de niveau master (GPQA), en connaissances de niveau licence (MMLU) et en capacités de codage (HumanEval). Sa compréhension de l’humour et des consignes complexes a été nettement améliorée, et il peut rédiger des contenus de haute qualité avec un ton naturel et empathique.

Résultats des évaluations internes

Lors d’une évaluation interne en codage, Claude 3.5 Sonnet a résolu 64 % des problèmes, dépassant les 38 % de Claude 3 Opus. Cette évaluation mesurait la capacité à corriger des bugs ou à ajouter des fonctionnalités dans des bases de code open source à partir de descriptions en langage naturel. Claude 3.5 Sonnet gère facilement la traduction de code, ce qui le rend particulièrement efficace pour la mise à jour d’applications legacy et la migration de bases de code.

Capacités visuelles

Claude 3.5 Sonnet surpasse Claude 3 Opus sur les benchmarks visuels standard et affiche des performances remarquables sur les tâches nécessitant du raisonnement visuel. Sa capacité à retranscrire avec précision du texte à partir d’images incomplètes est particulièrement utile dans les secteurs du retail, de la logistique et des services financiers.

Introduction de la fonctionnalité Artifacts

Déployé aujourd’hui sur Claude.ai, Artifacts offre un espace de travail dynamique permettant aux utilisateurs de modifier en temps réel des contenus générés comme des snippets de code, des documents texte ou des designs de sites web, puis de les intégrer à leurs projets et workflows.

Sécurité et confidentialité

Claude 3.5 Sonnet a été soumis à des tests rigoureux au niveau ASL-2, et une évaluation de sécurité pré-déploiement a été menée en collaboration avec le UK AISI. Les données des utilisateurs ne sont pas utilisées pour l’entraînement sans autorisation explicite.

Feuille de route

Pour compléter la famille de modèles Claude 3.5, Anthropic prévoit de lancer Claude 3.5 Haiku et Claude 3.5 Opus plus tard cette année. De nouvelles fonctionnalités et modalités sont en cours de développement pour faciliter l’intégration dans les applications d’entreprise, et la fonction « Memory », capable de se souvenir des préférences des utilisateurs et de leur historique d’interactions, est également à l’étude.

Nous cherchons en permanence à améliorer Claude et à intégrer les retours des utilisateurs afin d’offrir une meilleure expérience. Les retours sur Claude 3.5 Sonnet peuvent être envoyés directement dans le produit afin d’alimenter la feuille de route de développement.

1 commentaires

wedding 2024-06-21

Je l’ai testé, et la vitesse est vraiment impressionnante.
C’est aussi appréciable qu’on puisse l’utiliser gratuitement un certain nombre de fois, comme avec gpt4o.