- Performances de réponse améliorées, réponses plus longues, accessible via une API publique
- Jusqu’à 100 000 tokens peuvent être saisis dans le prompt
- De meilleures performances en code, en mathématiques et en raisonnement
- Codex HumamEval (test de code Python) : 56 % → 71,2 %
- GSM8k (jeu de problèmes de mathématiques) : 85,2 % → 88 %
- Bar Exam : 73 % → 76,5 %
- Adoption de diverses techniques de sécurité pour se protéger contre le jailbreak (Constitutional AI, Moral Self-Correction, Red Teaming Language Model)
Aucun commentaire pour le moment.