13 points par xguru 2024-11-19 | Aucun commentaire pour le moment. | Partager sur WhatsApp
  • Garak est un outil gratuit développé pour détecter les vulnérabilités des systèmes basés sur des LLM
  • Il sert principalement à examiner les dysfonctionnements et problèmes de sécurité des LLM, et peut être considéré comme une version de nmap pour les LLM
  • Il explore diverses vulnérabilités des LLM à l’aide de sondes (probes) statiques, dynamiques et adaptatives

Principales fonctionnalités de Garak

  • Identification des points de défaillance des LLM : exploration de nombreuses faiblesses, comme la génération d’informations erronées, les fuites de données, l’injection de prompt, la génération de contenu toxique ou les jailbreaks
  • Utilisation de diverses techniques de probing : analyse de différents modes d’échec des LLM grâce à des dizaines de plugins et à de nombreuses sondes
  • Journalisation : fournit des logs détaillés pour chaque cas d’échec, incluant le prompt, l’objectif et la réponse
  • Mises à jour continues : de nouvelles sondes sont ajoutées grâce aux contributions de la communauté, les sondes existantes sont améliorées et la portée des tests s’élargit en continu

Caractéristiques principales de Garak

  • Accent mis sur la sécurité des LLM
    • Vérifie en priorité les vulnérabilités propres aux LLM
      • Injection de prompt, jailbreak, contournement des garde-fous, attaques par rejeu de texte, etc.
    • Contrairement aux autres outils de sécurité ML, il se concentre uniquement sur la sécurité des LLM
  • Scan automatisé
    • Exécute automatiquement diverses sondes, tout en automatisant aussi la configuration des détecteurs et la gestion de la limitation de débit
    • Un scan standard complet est possible avec la configuration par défaut, mais une personnalisation est également possible
  • Prise en charge de nombreux LLM
    • Peut se connecter à plusieurs LLM, notamment OpenAI, Hugging Face, Cohere, Replicate
    • La communauté de contributeurs prévoit d’ajouter la prise en charge d’un plus grand nombre de LLM
  • Fonctionnalités de reporting structurées
    • Affichage à l’écran : suivi en temps réel de l’avancement du scan
    • Logs de rapport : enregistrement détaillé de chaque prompt et réponse
    • Hit log : enregistrement lors de la découverte d’une vulnérabilité
    • Logs de debug : résolution de problèmes et traces de fonctionnement de Garak

Aucun commentaire pour le moment.

Aucun commentaire pour le moment.