2 points par GN⁺ 21 일 전 | 1 commentaires | Partager sur WhatsApp
  • Outil permettant d’explorer visuellement le jeu de caractères Unicode et d’examiner les glyphes, écritures, symboles et formes de chaque caractère
  • Utilise les embeddings SigLIP 2 pour analyser la similarité visuelle entre les caractères en comparant les glyphes dans un espace vectoriel
  • Les utilisateurs peuvent saisir intuitivement les relations morphologiques entre les caractères et explorer la structure d’Unicode
  • L’interface offre une expérience d’exploration centrée sur le visuel, conçue pour faciliter la compréhension de systèmes d’écriture complexes
  • Le projet est en développement continu et reçoit des retours utilisateurs ainsi qu’un soutien par les dons

Aperçu de Charcuterie

  • Un explorateur visuel Unicode permettant de parcourir le jeu de caractères et de consulter les glyphes, écritures, symboles et formes associés
  • Pour analyser la similarité visuelle de chaque caractère, le projet intègre des glyphes rendus avec SigLIP 2 puis les compare dans un espace vectoriel
  • Les utilisateurs peuvent explorer intuitivement les relations morphologiques entre les caractères et comprendre la structure de la norme Unicode
  • Le projet est en développement continu et bénéficie des retours des utilisateurs et d’un soutien via les dons

1 commentaires

 
GN⁺ 21 일 전
Commentaires sur Hacker News
  • Je comprends que supprimer automatiquement les espaces en début et fin soit une valeur par défaut généralement utile, mais dans ce cas c’est gênant, car on ne peut plus rechercher les espaces eux-mêmes
    Donc ce serait bien d’ajouter une exception du genre if (trim(str)=="") return str

    • Oui, bien vu
  • Je ne l’avais pas remarqué au début, mais en cliquant sur l’icône en forme de crayon, on peut dessiner directement une forme pour lancer la recherche au lieu de saisir du texte

  • Le concept et la réalisation sont vraiment super
    En revanche, l’idée d’une interface « spotlight » est un peu déroutante. Quand on clique sur un caractère, la zone autour est mise en valeur, puis le paysage de caractères similaires autour de ce caractère est rechargé. On peut ainsi explorer ce paysage de similarité, mais j’ai l’impression de passer à côté d’une partie de la métaphore visuelle

    • C’est juste une visualisation sympa
    • Le sens esthétique est bon, mais le design n’est pas terrible
  • C’est tellement cool que je l’ai ajouté immédiatement à mes favoris. Avant, j’utilisais EmojiDB pour rechercher des emoji par vecteur, et maintenant je pense utiliser celui-ci en complément

    • J’ai aussi créé un outil similaire, et personnellement je trouve le mien plus agréable à regarder et plus pratique pour rechercher des caractères. L’outil de l’OP est sympa pour s’amuser un moment, mais moins utile en pratique
      Mon site : unicode-atlas.vercel.app
  • Ça m’a fait rire de voir combien il existe de caractères « X »
    En regardant le lien charcuterie.elastiq.ch/#1100B, on ne sait pas trop s’il s’agit de « Aegean Check Mark » ou de la « lettre Teh en ancien nord-arabique »

    • Les idéogrammes CJK ont été unifiés, mais pas les “x” !
  • Vraiment excellent. Je préfère utiliser des caractères Unicode plutôt que des images quand c’est possible. Par exemple pour les flèches, j’ai toujours eu du mal à trouver exactement le bon caractère
    Mais là, on peut dessiner directement ‼ pour affiner ce qu’on cherche. Parfait. L’UX est aussi très intuitive, donc je l’ai ajouté tout de suite à mes favoris
    Je ne savais même pas que ce caractère existait : U+119A

    • J’ai aussi créé un outil similaire, et je trouve le mien plus joli et plus utile pour rechercher des caractères. L’outil de l’OP est amusant pour un court moment, mais moins pratique
      Mon site : unicode-atlas.vercel.app
  • On dirait que l’outil prend en compte plus que la simple similarité visuelle. Sinon, il n’y aurait aucune raison pour que « @ » et « U+1F582 (BACK OF ENVELOPE) » soient aussi proches
    Et cela fait des années, voire des décennies, que j’aimerais avoir une fonctionnalité comme ça dans Word. On peut décrire un symbole avec des mots, mais l’interface est tellement pénible qu’il est difficile de le retrouver directement. J’ai encore du mal à croire que la fenêtre « Insérer un symbole » n’ait toujours pas de fonction de recherche

    • J’ai aussi créé un outil similaire, et je trouve le mien plus joli et plus pratique pour explorer les caractères. L’outil de l’OP est sympa pour un usage bref, mais moins utile au quotidien
      Mon site : unicode-atlas.vercel.app
    • D’accord. Si Word avait une fonction comme celle-là, il serait bien plus facile de trouver le bon symbole
  • La recherche de kanji japonais ne fonctionne pas
    https://unicodeplus.com/U+2F8F fonctionne, mais
    https://unicodeplus.com/U+884C ne fonctionne pas

  • J’ai été impressionné par le fait qu’on puisse dessiner directement un caractère en haut à gauche pour trouver des caractères similaires. Cela montre qu’il y a plus qu’une simple table de correspondance derrière

    • J’ai aussi créé un outil similaire, et je trouve le mien plus joli et plus pratique pour la recherche de caractères. L’outil de l’OP est amusant pour un court moment, mais moins utile concrètement
      Mon site : unicode-atlas.vercel.app
  • La norme Unicode ne définit pas la forme visuelle des code points (sauf pour certains exemples du côté des emoji)
    Donc cet outil n’est qu’une visualisation de similarité entre glyphes pour une police donnée — non mentionnée et impossible à changer — ce qui est distinct d’une « exploration visuelle » des code points Unicode eux-mêmes.