22 points par xguru 2025-05-20 | Aucun commentaire pour le moment. | Partager sur WhatsApp

"The web as a database"

  • Un moteur de recherche basé sur les embeddings qui dépasse les limites de la recherche par mots-clés et ne renvoie que des résultats correspondant précisément à l’intention de l’utilisateur
  • Fonctionne selon un processus en plusieurs étapes : recherche par vector embeddings sur l’ensemble du web selon le sens de la requête → vérification fondée sur des LLM → fourniture de résultats affinés
  • Au lieu d’une simple liste, les résultats sont présentés sous forme de tableau ; il est possible d’ajouter les colonnes souhaitées et de collecter des informations supplémentaires de manière asynchrone
    • Chaque cellule se charge individuellement de façon asynchrone, avec une conception pensée pour explorer le web comme une base de données
  • Par exemple, il peut trouver avec précision des conditions spécifiques et complexes comme « startups d’outils de développement open source basées à San Francisco et fondées entre 2021 et 2025 »
  • Pour chaque résultat, un LLM évalue s’il correspond réellement aux critères de recherche et le fournit avec les éléments de preuve (sources) démontrant qu’il répond à ces critères
    • Le traitement peut prendre de quelques minutes à plusieurs heures
  • Exemple de recherche : blogs de mathématiques créés par des professeurs de mathématiques situés hors des États-Unis
  • Vidéo de démonstration : https://youtu.be/Unt8hJmCxd4
  • Documentation API : https://docs.exa.ai/websets

Aucun commentaire pour le moment.

Aucun commentaire pour le moment.