- Évaluation et expérimentation de LLM, ainsi que prompt engineering, possibles dans un environnement no-code
- Interroger plusieurs LLM simultanément
- Comparer la qualité des réponses selon les prompts afin de choisir le prompt et le modèle les plus adaptés à chaque cas d’usage
- Définir des métriques d’évaluation et tracer automatiquement les résultats selon les prompts, les paramètres et la configuration du modèle
- Maintenir simultanément plusieurs conversations entre les paramètres de modèle de template et les modèles de chat
Aucun commentaire pour le moment.