43 points par sigridjineth 2025-01-30 | Aucun commentaire pour le moment. | Partager sur WhatsApp

Un article qui passe en revue l’ensemble du processus des embeddings et de la recherche d’information — des concepts et limites des embeddings à la création et au labellisation de jeux de données, l’évaluation de divers modèles off the shelf, l’hybride et le re-ranking, le fine-tuning et l’optimisation des modèles d’embedding, jusqu’à l’interprétabilité.

Sujets abordés

  • Discussion sur les embeddings et leur capacité de généralisation (Generalizability)
  • Construction et labellisation de jeux de données avec des humains + des LLM
  • Évaluation de 17 modèles de recherche
  • Décider, lors de l’utilisation de modèles d’embedding à long contexte, s’il faut ou non découper en chunks
  • Recherche hybride et re-ranking
  • Évaluation de services de recherche SaaS commerciaux
  • Fine-tuning des modèles d’embedding
  • Optimisation des modèles d’embedding et de la recherche vectorielle
  • Mise en œuvre d’une recherche neuronale interprétable (Interpretable)

Aucun commentaire pour le moment.

Aucun commentaire pour le moment.