-
Meta lance Llama 3.2
- inclut des LLM de vision petits et moyens (11B et 90B) ainsi que des modèles légers texte seul (1B et 3B)
- disponible sur le matériel Qualcomm et MediaTek, avec une optimisation pour les processeurs Arm
- des modèles adaptés au résumé, au suivi d’instructions et aux tâches de réécriture
-
Caractéristiques des modèles Llama 3.2
- les modèles de vision 11B et 90B excellent dans les tâches de compréhension d’image
- possibilité d’ajustement fin pour des applications personnalisées avec torchtune
- déploiement local possible avec torchchat
- disponible via l’assistant intelligent Meta AI
-
Déploiement de Llama Stack
- simplifie le travail avec les modèles Llama dans des environnements à nœud unique, on-premise, cloud et on-device
- déployé en collaboration avec AWS, Databricks, Dell Technologies, Fireworks, Infosys et Together AI
-
Téléchargement des modèles Llama 3.2
- téléchargeable sur llama.com et Hugging Face
- développement immédiat possible sur des plateformes partenaires comme AMD, AWS, Databricks, Dell, Google Cloud, Groq, IBM, Intel, Microsoft Azure, NVIDIA, Oracle Cloud et Snowflake
-
Performances de Llama 3.2
- les modèles 11B et 90B sont adaptés à la compréhension au niveau document, à la génération de légendes d’images et aux tâches fondées sur l’information visuelle
- les modèles 1B et 3B offrent la génération de texte multilingue et des capacités d’appel d’outils
- en exécution locale, ils offrent des réponses immédiates et un niveau élevé de confidentialité
-
Évaluation des modèles
- performances évaluées sur plus de 150 jeux de données de benchmark
- des performances capables de rivaliser avec Claude 3 Haiku et GPT4o-mini
-
Modèles de vision
- introduction d’une nouvelle architecture de modèle pour prendre en charge les entrées d’image
- tout en conservant les capacités texte seul, ils combinent des prompts d’image et de texte pour permettre une compréhension et un raisonnement approfondis
-
Modèles légers
- développement des modèles 1B et 3B à l’aide de méthodes d’élagage et de distillation des connaissances
- exécution efficace possible en local
-
Déploiement de Llama Stack
- fournit une interface standardisée via l’API Llama Stack
- simplifie le travail avec les modèles Llama dans divers environnements
-
Sécurité au niveau système
- lancement de Llama Guard 3 11B Vision
- le modèle Llama Guard 3 1B réduit fortement les coûts de déploiement
-
Utilisation de Llama 3.2
- fournit aux développeurs les outils et ressources nécessaires
- permet de développer des applications innovantes avec Llama 3.2 et Llama Stack
Le récapitulatif de GN⁺
- Llama 3.2 propose divers modèles de vision et de texte, y compris des modèles légers pouvant s’exécuter sur des appareils edge et mobiles
- grâce à des collaborations avec Qualcomm, MediaTek, Arm et d’autres, il offre des performances optimisées sur différents matériels
- avec le déploiement de Llama Stack, il aide les développeurs à utiliser facilement les modèles Llama dans des environnements variés
- Llama 3.2 offre une forte confidentialité et des réponses immédiates, ce qui le rend adapté au développement d’applications locales
- il offre des performances capables de rivaliser avec Claude 3 Haiku et GPT4o-mini, et a démontré d’excellents résultats sur divers benchmarks
1 commentaires
Avis Hacker News
Impressionné par les performances du nouveau modèle 1B. La taille du téléchargement est de 1,3 Go
Dans l’exemple "The Llama jumped over the ______!", avec un encodage 1-hot, la bonne réponse est "wall" avec une probabilité de 100 %
J’admire l’ouverture de l’équipe Llama chez Meta. Ils publient non seulement l’accès aux modèles, mais aussi la manière dont ils les construisent
Question de débutant : j’ai besoin d’un modèle avec des capacités d’ingénieur logiciel 10x, sans avoir besoin de connaissances humaines. Je me demande si un tel modèle existe
J’ai essayé le modèle 3B dans Ollama. Il répond vite et semble avoir beaucoup de connaissances en optique, biologie et Rust
Billet de blog d’Ollama : lien
Le modèle
llama3.2:3b-instruct-q8_0est plus performant que3.1 8b-q4. Il est plus rapide sur un MacBook Pro M1 et donne de meilleurs résultatsllama3.2:3b-instruct-q8_0: 3.4GB, modifié il y a 2 heuresgemma2:9b-instruct-q4_1: 6.0GB, modifié il y a 3 joursphi3.5:3.8b-mini-instruct-q8_0: 4.1GB, modifié il y a 3 joursmxbai-embed-large:latest: 669MB, modifié il y a 3 moisQuelqu’un peut-il recommander un client Web UI pour Ollama ?
Quelqu’un sait-il s’il existe un leaderboard avec les benchmarks LLM les plus récents ?
Le modèle 3B était plutôt bon en multimodal (norvégien), mais donne parfois beaucoup de réponses dénuées de sens. Il est plus sensible que le 8B, mais reste plus utilisable que Gemma 2 2B