"The web as a database"
- Un moteur de recherche basé sur les embeddings qui dépasse les limites de la recherche par mots-clés et ne renvoie que des résultats correspondant précisément à l’intention de l’utilisateur
- Fonctionne selon un processus en plusieurs étapes : recherche par vector embeddings sur l’ensemble du web selon le sens de la requête → vérification fondée sur des LLM → fourniture de résultats affinés
- Au lieu d’une simple liste, les résultats sont présentés sous forme de tableau ; il est possible d’ajouter les colonnes souhaitées et de collecter des informations supplémentaires de manière asynchrone
- Chaque cellule se charge individuellement de façon asynchrone, avec une conception pensée pour explorer le web comme une base de données
- Par exemple, il peut trouver avec précision des conditions spécifiques et complexes comme « startups d’outils de développement open source basées à San Francisco et fondées entre 2021 et 2025 »
- Pour chaque résultat, un LLM évalue s’il correspond réellement aux critères de recherche et le fournit avec les éléments de preuve (sources) démontrant qu’il répond à ces critères
- Le traitement peut prendre de quelques minutes à plusieurs heures
- Exemple de recherche : blogs de mathématiques créés par des professeurs de mathématiques situés hors des États-Unis
- Vidéo de démonstration : https://youtu.be/Unt8hJmCxd4
- Documentation API : https://docs.exa.ai/websets
Aucun commentaire pour le moment.