Projet Myriad : une proposition de notation des nombres pour les aires linguistiques coréenne, chinoise et japonaise
(myriad-project.org)En coréen, en chinois et en japonais, les nombres se lisent par unités de dix-mille (만/萬), alors que les chiffres arabes utilisent des virgules tous les trois chiffres. Face à 1,234,567,890, pour le lire immédiatement comme « un milliard deux cent trente-quatre millions cinq cent soixante-sept mille huit cent quatre-vingt-dix », il faut à chaque fois recompter les positions dans sa tête.
Je propose donc d’utiliser le tiret bas (_) comme séparateur par unités de dix-mille.
Existant : 1,234,567,890
Proposition : 12_3456_7890
Le tiret bas appartient à la plage ASCII, il peut donc être saisi directement sur n’importe quel clavier, et il est déjà utilisé comme séparateur dans les littéraux numériques par plusieurs langages comme Python et Rust. En l’utilisant avec la virgule, on peut aussi représenter les deux systèmes de manière hiérarchique.
J’ai créé cinq versions linguistiques : anglais, coréen, japonais, chinois simplifié et chinois traditionnel. Le code comme le contenu sont publiés sur Codeberg.
8 commentaires
C’est encore un peu déroutant, mais une fois qu’on s’y habitue, ça me semble plus pratique que de séparer par milliers.
C'est une idée originale.
Je pense que cela poserait énormément de problèmes pour l’écriture en Markdown...
Heureusement, selon la spécification CommonMark, la syntaxe
_de Markdown ne fonctionne qu’aux frontières des mots !En Swift, c’est une notation utilisable immédiatement sans avoir besoin de faire quoi que ce soit de particulier.
Quand on parle à la fois coréen et anglais, on a souvent beaucoup de mal à exprimer les nombres coréens en anglais, ou inversement.
Cette méthode d’écriture que vous avez développée pourrait peut-être lever la confusion sur la lecture des nombres (pour les Coréens, les Chinois, etc.), mais malheureusement, à l’oral, il n’y a apparemment pas de solution.
Comme dans l’avis ci-dessous, lorsqu’on l’utilise comme standard international, c’est le regroupement par milliers, ce qui rend la situation assez embarrassante. Et je crois savoir qu’en Corée comme en Chine, on écrit aussi par milliers dans ces cas-là. Cela pourrait peut-être aider pour le TTS, mais d’après ce que j’ai pu constater, la plupart des TTS coréens lisaient correctement
10,000comme « dix mille », même quand c’était écrit ainsi.Il serait utile de savoir dans quels cas on écrit effectivement en unités de dix mille (
write) et dans quelles situations concrètes cela pourrait être utile (coding).Pour que ce projet prenne vraiment vie, il lui faudrait sans doute des fonctionnalités comme un convertisseur entre chiffres arabes et caractères chinois, mais je ne sais pas si cela aurait vraiment du sens.
Le monde entier utilise les milliers, donc… ça donne un peu l’impression de défendre l’usage des livres à la place des kg… En Europe aussi, on écrit
1.000au lieu de1,000, ce qui génère déjà beaucoup d’erreurs.