- Un LLM hautes performances pour la génération de code, basé sur Llama 2 avec un échantillonnage accru de données issues d’un jeu de données spécialisé dans le code et un entraînement plus long
- Atteint 67,8 sur HumanEval, soit les meilleures performances parmi les modèles open source
- Comme avec la licence précédente, il peut être utilisé à la fois à des fins de recherche et commerciales
- 3 modèles
- CodeLlama-70B
- CodeLlama-70B-Python
- CodeLlama-70B-Instruct
- Désormais disponible en 4 tailles : 7B/13B/34B/70B
4 commentaires
S'il peut être exécuté en local sur un M2 Max ou supérieur, je pense que ce sera le meilleur jouet possible.
Une fois quantifié, cela devrait sans doute bien tourner. Avec un peu de patience, cela ne devrait-il pas arriver ?
Le lien ci-dessus sert à demander l’accès auprès de Meta, mais sur Hugging Face, tout est déjà publié. https://huggingface.co/codellama
Avis sur Hacker News