14 points par xguru 2023-10-10 | 4 commentaires | Partager sur WhatsApp
  • Les bases de données vectorielles ne constituent pas une catégorie de bases de données distincte
  • D’ici peu, toutes les bases de données, y compris les bases de données graphe, relationnelles, documentaires et clé-valeur, ainsi que les caches, prendront en charge sous une forme ou une autre la « recherche vectorielle »
  • La frontière entre base de données vectorielle et non vectorielle va s’estomper, et les bases de données vectorielles spécialisées comme Pinecone, Weaviate et Milvus perdront leur élan et leur différenciation dans la concurrence
  • Les bases de données actuelles devraient tenter de capter les nouvelles charges de travail RAG (Retrieval Augmented Generation) en s’appuyant sur leurs charges de travail et leur base d’utilisateurs existantes

4 commentaires

 
yangeok 2023-10-26

PostgreSQL prend aussi en charge un module vectoriel ! J’espère que les autres moteurs le prendront vite en charge aussi haha

 
simmani5 2023-10-11

Bof
En tant que développeur avec 28 ans de carrière, bof ???
Les bibliothèques de développement de graphiques ne vont pas disparaître, elles vont plutôt continuer à évoluer... Il ne me semble pas nécessaire d’intégrer des graphiques dans la DB.
Même si la DB et ce genre de choses fusionnent, cela ne ferait qu’alourdir la DB,
et en tant que développeur, ça m’inquiète davantage. Déjà aujourd’hui, le plus gros problème est de résoudre le ralentissement causé par des volumes de DB toujours plus importants ; l’enjeu est justement de les séparer autant que possible pour personnaliser les performances et la vitesse.

 
sehandev 2023-10-11

La recherche vectorielle consiste à stocker sous forme de vecteurs les embeddings utilisés par les modèles de deep learning comme les LLM, puis à effectuer ou à accélérer en interne des opérations comme le calcul de leur similarité pour les retrouver ou les enregistrer. Je me demande donc ce que vous entendez par « chart ».

 
gnh1201 2023-10-11

Je pense que, voyant le mot « vecteur », vous l’avez utilisé en le considérant comme synonyme, puisque de nos jours les bibliothèques de graphiques rendent souvent en images vectorielles comme le SVG.

C’était intéressant, car cela ressemblait à un commentaire de quelqu’un qui connaît un peu les réalités du secteur.

Ce dont il est question ici, c’est que les content-based address (references), jusqu’ici surtout évoquées de manière théorique, sont devenues si faciles à mettre en œuvre grâce aux progrès rapides récents des technologies d’IA (y compris la vectorisation et autres sujets liés) qu’on estime qu’on pourra bientôt voir cette fonctionnalité apparaître aussi dans les DBMS traditionnels.