Ollama 0.4, prise en charge de Llama 3.2 Vision

xguru · 2024-11-08T10:17:01+09:00

Llama 3.2 Vision est un modèle de génération avec raisonnement sur image, disponible en tailles 11B/90B Optimisé pour la reconnaissance visuelle, le raisonnement sur image, la génération de légendes et les réponses à des questions générales sur les images Après l’avoir lancé avec ollama run llama3.2-vision:90b, il est possible d’ajouter une image au prompt pour poser des questions Exemples d’usage : reconnaissance d’écriture manuscrite, OCR, interprétation de graphiques/tableaux, Q/R sur les images

(ollama.com)

8 points par xguru 2024-11-08 | Aucun commentaire pour le moment. | Partager sur WhatsApp

Llama 3.2 Vision est un modèle de génération avec raisonnement sur image, disponible en tailles 11B/90B
- Optimisé pour la reconnaissance visuelle, le raisonnement sur image, la génération de légendes et les réponses à des questions générales sur les images
Après l’avoir lancé avec ollama run llama3.2-vision:90b, il est possible d’ajouter une image au prompt pour poser des questions
Exemples d’usage : reconnaissance d’écriture manuscrite, OCR, interprétation de graphiques/tableaux, Q/R sur les images

Ollama 0.4, prise en charge de Llama 3.2 Vision

À lire aussi

Aucun commentaire pour le moment.