7 points par sigridjineth 2025-04-08 | Aucun commentaire pour le moment. | Partager sur WhatsApp

La méthode pour calculer, dans un espace de haute dimension, la « probabilité que le produit scalaire soit supérieur ou égal à une certaine valeur » repose sur un principe simple. Il suffit de calculer l’aire de la surface de la sphère unité, puis l’aire du calotte correspondant à l’angle représenté par ce produit scalaire, avant de comparer cette valeur à l’aire totale de la surface.

Mais l’essentiel est que ce calcul simple permet de comprendre concrètement à quel point une valeur de produit scalaire est un événement « rare ou fréquent » dans un espace d’embeddings de haute dimension. En particulier, le fait qu’un produit scalaire supérieur ou égal à 0,9 soit extrêmement rare montre bien à quel point, dans la recherche basée sur les embeddings, un score de similarité élevé peut constituer un signal important.

Aucun commentaire pour le moment.

Aucun commentaire pour le moment.