Representation Engineering Mistral-7B, voyage acide
-
Qu'est-ce qu'un vecteur de contrôle ?
- Le vecteur de contrôle est un vecteur (une liste de vecteurs par couche) appliqué aux activations du modèle pendant l'inférence, qui permet de contrôler son comportement sans prompt supplémentaire.
- En utilisant le même prompt et le même modèle, il produit des résultats différents selon que le vecteur de contrôle est appliqué ou non, et selon l'intensité de l'application.
-
Créer un vecteur de contrôle n'est pas compliqué
- On construit un jeu de données de paires de prompts contrastés avec la PCA, on exécute le modèle pour collecter les états cachés de chaque couche, puis on applique une PCA à composante unique pour obtenir le vecteur de contrôle de chaque couche.
- Cette procédure ne prend que quelques lignes de code et environ une minute.
-
Ce que l'on peut faire avec un vecteur de contrôle
- À l'aide d'un vecteur de contrôle, on peut mettre un modèle d'IA dans un état de « voyage acide » ou en mode « paresse », « assiduité », « créativité », entre autres.
- Chaque vecteur de contrôle peut être entraîné en quelques minutes, et vous pouvez l'essayer directement via les notebooks d'expérimentation sur GitHub.
-
Vecteurs de contrôle vs prompt engineering
- Les vecteurs de contrôle et le prompt engineering sont des approches différentes, mais elles se recoupent en partie.
- Les vecteurs de contrôle peuvent produire des résultats reproduisables par prompt engineering, mais il est plus facile de régler leur intensité.
Opinion de GN⁺
- L'importance des vecteurs de contrôle : Les vecteurs de contrôle sont un outil puissant pour ajuster finement le comportement des modèles d'IA, offrant de nouvelles possibilités au-delà des limites du prompt engineering.
- Efficacité et accessibilité : Les vecteurs de contrôle permettent aux utilisateurs d'ajuster le comportement du modèle sans avoir à élaborer des prompts complexes, ce qui peut considérablement améliorer l'ergonomie de l'IA.
- Utilisations créatives : Utiliser des vecteurs de contrôle pour faire entrer une IA dans un état de « voyage acide » ouvre de nouvelles voies expérimentales en IA.
1 commentaires
Commentaires Hacker News