4 points par brainer 2023-12-10 | 4 commentaires | Partager sur WhatsApp

Existe-t-il une bibliothèque Python ou une méthode qui fonctionne bien pour la recherche, même lorsqu’il y a beaucoup de fautes de frappe ?

4 commentaires

 
n0roo 2023-12-10

Si vous utilisez un SGBDR et que le full-text est la cible, on se concentre généralement surtout sur PostgreSQL. Si vous cherchez une voie plus simple, il y a MongoDB
Si vous choisissez une voie difficile et vertigineuse, il existe des méthodes comme la décomposition canonique du coréen pour comparer des hachages, ou le remplacement par des valeurs ASCII pour l’indexation ; mais la base, c’est d’abord la prise en charge de NFD ou de NFC.

 
brainer 2023-12-11

Merci pour cette réponse détaillée.

Il va falloir que je me renseigne sur le sujet.

 
joyfui 2023-12-10

Il y a bien un article qui me revient soudain en tête. Cela dit, c’est une bibliothèque JavaScript, et elle est plus efficace pour la recherche par consonnes initiales que pour les fautes de frappe..?
https://taegon.kim/archives/10671

 
brainer 2023-12-11

Je l’avais déjà vu sur GeekNews.

Merci pour votre réponse.