- Un article qui présente le concept de la technique des « embeddings », qui convertit du contenu en tableaux de nombres à virgule flottante pouvant être utilisés dans diverses applications.
- L’auteur, Simon Willison, a donné une conférence sur les embeddings à PyBay 2023, et cet article en est une version améliorée.
- Les embeddings sont utilisés dans le domaine des grands modèles de langage qui sous-tendent des technologies comme ChatGPT, Bard et Claude.
- L’auteur explique comment utiliser le modèle
text-embedding-ada-002 d’OpenAI pour créer une fonctionnalité de « contenu associé » sur son blog.
- L’article explique également comment utiliser des embeddings pour le code avec un outil appelé Symbex, qui calcule des embeddings pour toutes les fonctions d’une base de code et permet de construire un moteur de recherche de code.
- L’auteur présente aussi un outil appelé LLM (Large Language Models), qui peut être utilisé pour exploiter les embeddings et construire des moteurs de recherche sémantique.
- L’article explique également comment utiliser des embeddings pour les images avec un modèle appelé CLIP, capable d’intégrer texte et images dans le même espace vectoriel.
- L’auteur explique comment effectuer de la classification à l’aide des embeddings, en calculant la position moyenne d’un groupe d’embeddings puis en comparant un nouveau contenu à cette position pour lui attribuer une catégorie.
- L’article se conclut par une discussion sur le Retrieval-Augmented Generation (RAG), une technique qui utilise les embeddings pour répondre à des questions à partir de documents personnels ou de documents internes d’entreprise.
- L’article comprend une session de questions-réponses dans laquelle l’auteur répond à des questions sur LangChain, les fonctions de distance autres que la similarité cosinus, le traitement de grands volumes de données et les futures améliorations des modèles d’embeddings.
1 commentaires
Avis Hacker News