- Llama 3.2 Vision est un modèle de génération avec raisonnement sur image, disponible en tailles 11B/90B
- Optimisé pour la reconnaissance visuelle, le raisonnement sur image, la génération de légendes et les réponses à des questions générales sur les images
- Après l’avoir lancé avec
ollama run llama3.2-vision:90b, il est possible d’ajouter une image au prompt pour poser des questions
- Exemples d’usage : reconnaissance d’écriture manuscrite, OCR, interprétation de graphiques/tableaux, Q/R sur les images
Aucun commentaire pour le moment.