Charcuterie – explorateur Unicode basé sur la similarité visuelle
(charcuterie.elastiq.ch)- Outil permettant d’explorer visuellement le jeu de caractères Unicode et d’examiner les glyphes, écritures, symboles et formes de chaque caractère
- Utilise les embeddings SigLIP 2 pour analyser la similarité visuelle entre les caractères en comparant les glyphes dans un espace vectoriel
- Les utilisateurs peuvent saisir intuitivement les relations morphologiques entre les caractères et explorer la structure d’Unicode
- L’interface offre une expérience d’exploration centrée sur le visuel, conçue pour faciliter la compréhension de systèmes d’écriture complexes
- Le projet est en développement continu et reçoit des retours utilisateurs ainsi qu’un soutien par les dons
Aperçu de Charcuterie
- Un explorateur visuel Unicode permettant de parcourir le jeu de caractères et de consulter les glyphes, écritures, symboles et formes associés
- Pour analyser la similarité visuelle de chaque caractère, le projet intègre des glyphes rendus avec SigLIP 2 puis les compare dans un espace vectoriel
- Les utilisateurs peuvent explorer intuitivement les relations morphologiques entre les caractères et comprendre la structure de la norme Unicode
- Le projet est en développement continu et bénéficie des retours des utilisateurs et d’un soutien via les dons
1 commentaires
Commentaires sur Hacker News
Je comprends que supprimer automatiquement les espaces en début et fin soit une valeur par défaut généralement utile, mais dans ce cas c’est gênant, car on ne peut plus rechercher les espaces eux-mêmes
Donc ce serait bien d’ajouter une exception du genre
if (trim(str)=="") return strJe ne l’avais pas remarqué au début, mais en cliquant sur l’icône en forme de crayon, on peut dessiner directement une forme pour lancer la recherche au lieu de saisir du texte
Le concept et la réalisation sont vraiment super
En revanche, l’idée d’une interface « spotlight » est un peu déroutante. Quand on clique sur un caractère, la zone autour est mise en valeur, puis le paysage de caractères similaires autour de ce caractère est rechargé. On peut ainsi explorer ce paysage de similarité, mais j’ai l’impression de passer à côté d’une partie de la métaphore visuelle
C’est tellement cool que je l’ai ajouté immédiatement à mes favoris. Avant, j’utilisais EmojiDB pour rechercher des emoji par vecteur, et maintenant je pense utiliser celui-ci en complément
Mon site : unicode-atlas.vercel.app
Ça m’a fait rire de voir combien il existe de caractères « X »
En regardant le lien charcuterie.elastiq.ch/#1100B, on ne sait pas trop s’il s’agit de « Aegean Check Mark » ou de la « lettre Teh en ancien nord-arabique »
Vraiment excellent. Je préfère utiliser des caractères Unicode plutôt que des images quand c’est possible. Par exemple pour les flèches, j’ai toujours eu du mal à trouver exactement le bon caractère
Mais là, on peut dessiner directement ‼ pour affiner ce qu’on cherche. Parfait. L’UX est aussi très intuitive, donc je l’ai ajouté tout de suite à mes favoris
Je ne savais même pas que ce caractère existait : U+119A
Mon site : unicode-atlas.vercel.app
On dirait que l’outil prend en compte plus que la simple similarité visuelle. Sinon, il n’y aurait aucune raison pour que « @ » et « U+1F582 (BACK OF ENVELOPE) » soient aussi proches
Et cela fait des années, voire des décennies, que j’aimerais avoir une fonctionnalité comme ça dans Word. On peut décrire un symbole avec des mots, mais l’interface est tellement pénible qu’il est difficile de le retrouver directement. J’ai encore du mal à croire que la fenêtre « Insérer un symbole » n’ait toujours pas de fonction de recherche
Mon site : unicode-atlas.vercel.app
La recherche de kanji japonais ne fonctionne pas
https://unicodeplus.com/U+2F8F fonctionne, mais
https://unicodeplus.com/U+884C ne fonctionne pas
J’ai été impressionné par le fait qu’on puisse dessiner directement un caractère en haut à gauche pour trouver des caractères similaires. Cela montre qu’il y a plus qu’une simple table de correspondance derrière
Mon site : unicode-atlas.vercel.app
La norme Unicode ne définit pas la forme visuelle des code points (sauf pour certains exemples du côté des emoji)
Donc cet outil n’est qu’une visualisation de similarité entre glyphes pour une police donnée — non mentionnée et impossible à changer — ce qui est distinct d’une « exploration visuelle » des code points Unicode eux-mêmes.