zvec - base de données vectorielle in-process ultra-légère et ultra-rapide
(github.com/alibaba)- Une base de données vectorielle pouvant être embarquée directement dans l’application, conçue pour effectuer de la recherche de similarité à grande échelle avec une configuration minimale
- Construite sur le moteur Proxima d’Alibaba, elle offre une scalabilité de niveau production et des performances de recherche à faible latence
- Prend en charge à la fois les vecteurs denses (dense) et clairsemés (sparse), avec possibilité d’exécuter des requêtes multi-vecteurs en un seul appel
- Les fonctions de recherche hybride permettent une recherche précise combinant similarité sémantique et filtrage structurel
- Sous forme de bibliothèque in-process qui s’exécute immédiatement sans serveur ni phase de configuration, et peut fonctionner partout : notebook, serveur, CLI ou environnement edge
- Compatible avec les plateformes Linux (x86/ARM) et macOS, avec une installation simple en environnement Python/Node.js
- Composée d’un moteur cœur en C++ et d’une architecture de bindings SWIG et Python, pour des calculs haute performance et une intégration avec plusieurs langages
- Grâce à des optimisations comme
unordered_mappour des recherches de clés en O(1) en moyenne, réduit le temps de chargement des index et améliore l’efficacité mémoire - Utilise des opérations de quantification Int4/Int8 pour préserver l’équilibre entre vitesse et précision lors du traitement de grands volumes de vecteurs
- Licence Apache-2.0
2 commentaires
Alibaba avait déjà sorti AliSQL, un fork de MySQL, en y intégrant aussi DuckDB pour la recherche vectorielle dans l’article lié ci-dessous, et on dirait qu’ils tentent vraiment beaucoup de nouvelles choses. QWEN aussi ; à l’ère de l’IA, Alibaba donne l’impression d’être l’entreprise chinoise la plus active dans l’open source.
On le voit vraiment partout.