8 points par xguru 2024-11-08 | Aucun commentaire pour le moment. | Partager sur WhatsApp
  • Llama 3.2 Vision est un modèle de génération avec raisonnement sur image, disponible en tailles 11B/90B
    • Optimisé pour la reconnaissance visuelle, le raisonnement sur image, la génération de légendes et les réponses à des questions générales sur les images
  • Après l’avoir lancé avec ollama run llama3.2-vision:90b, il est possible d’ajouter une image au prompt pour poser des questions
  • Exemples d’usage : reconnaissance d’écriture manuscrite, OCR, interprétation de graphiques/tableaux, Q/R sur les images

Aucun commentaire pour le moment.

Aucun commentaire pour le moment.