- Article sur un nouveau moteur de recherche Wikipedia basé sur le navigateur, avec recherche hors ligne possible
- Fonction de recherche en temps réel sur un million de pages Wikipedia, avec retour des résultats toutes les 10 ms sur appareil mobile
- Petite taille de la base de données du moteur de recherche, un cas d’usage léger prenant en charge un million d’embeddings sans traitement particulier
- Moteur de recherche utilisant un sentence transformer pour les embeddings de documents, la quantification de produits pour compresser les embeddings, et
pq.js pour exécuter le calcul des distances dans le navigateur
- Utilisation de
transformers.js pour exécuter dans le navigateur un sentence transformer destiné aux requêtes du moteur de recherche
- Moteur de recherche triant les embeddings selon la taille compressée des pages, afin d’analyser d’abord les pages les plus denses en information et de les renvoyer dans le top 10
- Moteur de recherche utilisant Arrow au lieu de JSON pour de meilleures performances, Arrow permettant de stocker de façon compacte des tableaux de quantification de produits en entiers 8 bits
- Moteur de recherche utilisant des modèles ONNX exécutés en WebAssembly, sans accélération GPU pour l’instant
- Moteur de recherche qui génère les embeddings de l’ensemble de Wikipedia avec un sentence transformer, compresse les embeddings par quantification de produits, et écrit ONNX manuellement
- Moteur de recherche exportant numpy vers Arrow pour stocker embeddings et métadonnées, de manière bien plus compacte en mémoire comme sur disque
- Moteur de recherche prenant en charge la recherche à facettes, permettant une recherche en temps réel dans des sous-catégories de produits
- L’auteur invite aux retours et suggestions d’amélioration, notamment sur la prise en charge d’autres niveaux de quantification et d’autres dimensions d’embedding
1 commentaires
Avis Hacker News