1 points par GN⁺ 2024-10-15 | 2 commentaires | Partager sur WhatsApp

Innovations technologiques pour faire du tibétain un citoyen de première classe dans le monde numérique

  • BDRC fait avancer des innovations technologiques pour faire du tibétain un citoyen de première classe dans le monde numérique. Le fait que LibreOffice prenne désormais en charge les paragraphes très longs, une caractéristique importante du tibétain, constitue une avancée majeure.
  • Depuis l’introduction du bouddhisme au VIIIe siècle, les Tibétains ont investi beaucoup d’énergie dans l’écriture, l’innovation et la technologie. L’écriture tibétaine a été inventée pour traduire les textes bouddhiques du sanskrit et du chinois vers le tibétain.
  • Au XIVe siècle, ils ont adopté la technique d’impression sur bois pour produire en masse des écritures traduites en tibétain ainsi que des textes bouddhiques rédigés directement par des auteurs de l’Himalaya.
  • Plus récemment, le développement de polices informatiques tibétaines a marqué un grand bond dans l’évolution du tibétain dans le monde numérique. Il est particulièrement notable que le tibétain ait été inclus dans la norme Unicode, qui standardise le codage des polices informatiques pour les systèmes d’écriture du monde entier.
  • Cependant, le tibétain possède encore une caractéristique importante qui n’est pas prise en charge par tous les outils ou toutes les applications. L’une d’elles est l’existence de paragraphes très longs. Contrairement aux langues européennes, les textes tibétains n’ont pas la même notion de paragraphe et doivent être traités comme un texte continu de grande longueur.
  • Les logiciels de traitement de texte classiques sont conçus en pensant aux textes anglais et prennent en charge des paragraphes relativement courts. Mais comme le tibétain a des paragraphes presque infinis et très peu d’espaces, ces logiciels voient leurs performances fortement se dégrader lorsqu’ils ouvrent des textes tibétains.
  • LibreOffice, l’un des traitements de texte open source gratuits les plus matures et les plus stables, est important pour les études tibétaines et pour la communauté tibétaine. Les logiciels commerciaux sont coûteux, et dans de nombreuses régions d’Asie, des versions piratées sont utilisées.
  • En 2015, Elie Roux, CTO de BDRC, a signalé ce problème à LibreOffice, mais intervenir dans le code représentait un projet d’envergure. Récemment toutefois, le développeur Jonathan Clark a résolu le problème. De longs textes comme le Yishindzö de Longchenpa peuvent désormais être ouverts rapidement et modifiés.
  • BDRC a apporté une petite contribution à cette innovation et se réjouit de l’excellent travail de Jonathan ainsi que du renforcement des outils open source de publication en tibétain.
  • La prise en charge des paragraphes très longs a été intégrée à LibreOffice 24.8.2, publié le 27 septembre 2024. Les retours sur l’édition de textes tibétains sont encouragés.

Résumé de GN⁺

  • Cet article porte sur des innovations technologiques destinées à mieux prendre en charge le tibétain dans le monde numérique. La mise à jour de LibreOffice représente un grand progrès en permettant de traiter les longs paragraphes des textes tibétains.
  • L’intégration numérique du tibétain joue un rôle important pour la préservation culturelle et la recherche, et les progrès des logiciels open source contribuent à résoudre les problèmes de coût.
  • Cet article montre pourquoi le support numérique des langues minoritaires comme le tibétain est important et comment il peut servir de modèle pour l’intégration numérique d’autres langues.
  • Parmi d’autres projets offrant des fonctions similaires figurent Google Docs et Microsoft Word.

2 commentaires

 
GN⁺ 2024-10-15
Avis Hacker News
  • Jim Woolsey était un des premiers hackers informatiques à avoir joué un rôle important dans la numérisation du tibétain. Son travail dévoué a impressionné de nombreuses personnes
  • Le fait que les paragraphes du document soient courts fait partie des idées fausses que les programmeurs se font sur le texte
  • Gérer de longs paragraphes peut être difficile pour un traitement de texte. Mais les auteurs et les éditeurs savent probablement comment s’en accommoder
  • Il existe une ancienne pile HyperCard qui enseigne la prononciation du tibétain
  • Le bengali et l’assamais utilisent l’écriture tibétaine. Une question est posée sur leur ressemblance avec le tibétain
  • Une opinion s’interroge sur la catégorie à laquelle appartient une langue en tant qu’outil facile à apprendre ou capable de transmettre des concepts complexes, et se demande où se situe le tibétain
  • Une opinion aimerait connaître les détails sur la manière de prendre en charge de longs paragraphes
  • L’innovation tibétaine est également mentionnée dans "The Nine Billion Names of God"
  • Eyal est bénévole pour le projet LibreOffice et remercie Jonathan Clark, qui a mis en œuvre des améliorations de performances pour le tibétain
    • La plupart des bugs trouvés dans LibreOffice sont généraux et ne se limitent pas à une écriture particulière
    • Il existe aussi des problèmes concernant des écritures moins utilisées, par exemple le tibétain ou le mongol
    • Comme il y a moins d’utilisateurs, moins de bugs peuvent être signalés
    • Il y a un intérêt à résoudre ces problèmes lorsque du temps de développement est disponible
  • Si vous découvrez un bug en utilisant LibreOffice, il est recommandé de le signaler dans BugZilla
  • Une demande invite à envisager un soutien financier à The Document Foundation
    • LibreOffice est un grand projet FOSS avec de nombreux utilisateurs
    • Il fonctionne grâce à des dons individuels, sans investissement de grandes entreprises
 
kayws426 2024-10-15

Heureusement qu’il y avait des espaces en coréen, sinon ça aurait été compliqué.