14 points par GN⁺ 2025-12-28 | 3 commentaires | Partager sur WhatsApp
  • Le texte est la technologie de communication la plus puissante de l’histoire humaine, avec une expressivité et une efficacité qui surpassent tous les autres médias
  • Plus adapté que les images, la vidéo ou la voix pour transmettre avec précision des concepts abstraits et des raisonnements complexes
  • Une technologie dont la durabilité et la stabilité sont prouvées, au point que l’on peut encore lire des écrits vieux de plusieurs millénaires
  • D’une efficacité écrasante en matière de stockage et de transmission, et point de départ récurrent des progrès des technologies de communication
  • Aucun autre média ne peut rivaliser avec lui en étendue et profondeur des usages sociaux : recherche, traduction, résumé, collaboration, etc.

Position de principe sur le texte

  • Chaque fois que l’on m’interroge sur la vidéo, la 3D, les jeux ou les systèmes multimédias dynamiques, je répète la même position
  • Je ne nie pas la valeur des images, de la photographie, du cinéma ou de la musique, mais je considère que la supériorité du texte est absolue
  • Le texte est défini ici comme la technologie de communication la plus puissante, la plus utile et la plus efficace

La technologie la plus ancienne et la plus stable

  • La parole et la langue des signes existent naturellement dans les sociétés humaines, mais le texte est une technologie acquise par apprentissage et transmission
  • Il possède une résistance au temps telle que des documents d’il y a environ 5 000 ans restent lisibles aujourd’hui
  • Gravé sur des supports physiques comme la pierre, il peut même survivre plus longtemps que l’humanité

Le moyen d’expression le plus flexible

  • Les images sont puissantes dans certaines situations, mais il est impossible de représenter visuellement une phrase abstraite arbitraire
  • Une phrase conceptuelle comme une définition des droits humains ne peut pas être remplacée par un dessin
  • Le texte permet de transmettre des idées en contrôlant le niveau de précision et d’ambiguïté
  • Ce n’est pas un hasard si la littérature, la philosophie, l’histoire, les mathématiques, la logique, la programmation et l’ingénierie reposent sur le texte

Le mode de communication le plus efficace

  • Le texte offre une efficacité d’un autre ordre en matière d’espace de stockage et de coût de transmission
  • Quelques milliers d’octets de texte peuvent être plus légers qu’une simple image d’icône
  • Du télégraphe optique au télégraphe électrique, du téléscripteur aux premiers réseaux informatiques, le texte est toujours apparu en premier
  • La voix, l’image et la vidéo n’ont émergé qu’une fois la bande passante devenue suffisamment bon marché
  • Sa densité est telle qu’on peut embarquer l’intégralité de Wikipédia sur un smartphone

La technologie la plus utile socialement

  • Fonctionne efficacement dans les communications 1:1, 1:N et M:N
  • Permet la recherche et l’indexation, y compris manuelles
  • Optimisé pour le traitement algorithmique : traduction, comparaison, diff, clustering, correction, résumé, filtrage, etc.
  • Peut être utilisé de manière asynchrone, avec une liberté totale sur le rythme
  • Prend en charge l’édition collaborative, la citation, l’annotation, les discussions en branche, les résumés, les revues et même les œuvres dérivées
  • Il n’existe aucune technologie capable de remplacer la complexité sociale et cognitive des bibliothèques et des publications sur Internet

Conclusion

  • La position sur le texte est donc claire : il faut toujours choisir d’abord le texte (always pick text first)
  • Pour reprendre les mots d’un ancien patron : il faut toujours parier sur le texte (always bet on text)
  • Si quelque chose peut être fait en texte, il faut le faire ainsi. Le texte déçoit rarement

3 commentaires

 
roxie 2025-12-29

Le texte est clairement stable, mais je ne suis pas sûr qu’il soit intuitif.

 
GN⁺ 2025-12-28
Commentaires sur Hacker News
  • Je ne comprends pas cette fausse dichotomie dans la discussion
    Je ne vois pas pourquoi je devrais choisir entre l’UTF-8 et un enregistrement d’interprétation au piano
    On a l’impression que quelqu’un, emballé par le sujet, ne sait en parler qu’en mode opposition simpliste du type « Ford vs. Chevy »
    Nous aimons tous le texte, donc j’aimerais qu’on arrête d’essayer de nous en convaincre

  • Je suis d’accord sur la souplesse infinie et la durabilité du texte, mais après avoir vu le travail de Bret Victor, j’en ai aussi perçu les limites
    Quand on apprend le piano, on a une boucle de retour immédiate, et ce type d’apprentissage est difficile à reproduire avec du texte
    L’idée centrale de Victor est d’appliquer cet apprentissage fondé sur le feedback à l’ingénierie et à l’éducation en général
    Le texte reste important, mais je pense qu’il y a aussi beaucoup de potentiel dans des approches qui mobilisent d’autres intuitions sensorielles

    • À court terme, mettre en œuvre un média plus riche que le texte demande une complexité d’ingénierie bien plus élevée
      Les démonstrations de Bret Victor sont impressionnantes, mais leur mise en œuvre réelle exige un effort énorme
      L’idée en elle-même est excellente, mais il faut comprendre que sa réalisation demande beaucoup d’investissement et d’engagement
    • Si l’on travaille dans les sciences, cet argument devient encore plus clair
      Il est difficile d’expliquer des données ou des résultats avec du texte, alors qu’un graphique transmet énormément d’informations d’un seul coup
      Le texte est utile parce qu’il est asynchrone, mais les humains préfèrent instinctivement parler ou s’exprimer visuellement
      Au final, une approche hybride paraît plus naturelle qu’un mode de communication unique
    • Par exemple, expliquer par texte comment démêler un tas de câbles est inefficace
      Un enfant regarde simplement et apprend, en le comprenant par intuition physique
      Les savoirs qu’on acquiert avec le corps, comme faire du vélo, se transmettent à peine par le texte
    • J’aurais plutôt envie de dire : « misez toujours sur les représentations symboliques »
      Le texte est symbolique, l’image est sensorielle
      Il est impossible de restituer parfaitement par texte une peinture de Norman Rockwell
      Des systèmes symboliques fondés sur le texte, comme la partition musicale ou les diagrammes de Feynman, restent néanmoins très puissants
    • Cette discussion montre en elle-même la supériorité du texte
      J’ai résumé le billet de l’OP en 30 secondes, alors que la vidéo de Bret Victor dure 54 minutes, et la plupart des gens ne la regarderont pas
      Le texte reste le meilleur média en matière d’efficacité et de transformabilité
      Je pense qu’il vaut mieux utiliser les autres médias comme moyens complémentaires
  • Je me définis comme un maximaliste du texte
    Le texte est le point de contact naturel entre les humains et les machines, et l’équilibre entre efficacité et transparence
    Tout peut être stocké sous forme de chaînes de caractères et représenté en base64, JSON, HTML, CSS, SQL, etc.
    En fin de compte, la silver bullet que poursuivait le secteur, c’était la chaîne de caractères
    Les formats binaires complexes perdent en lisibilité et, une fois compressés avec GZIP, leur avantage disparaît presque

    • Mais on ne peut pas avoir en même temps « efficacité, flexibilité et transparence »
      Les protocoles textuels deviennent instables à cause du problème de la loi de Postel
      Une différence de 30 % de bande passante n’est pas du tout négligeable, et c’est aussi pour cela que HTTP3 est passé au binaire
      Même si on compresse du base64, la lisibilité est déjà perdue
      Références associées : Robustness principle, problème des regex, ReDoS
    • À l’affirmation selon laquelle « le coût CPU de la désérialisation est négligeable », on peut répondre à l’inverse que « le coût d’utiliser des outils pour que les humains lisent les données » est lui aussi négligeable
      De toute façon, du JSON gzippé n’est pas lisible directement par un humain, donc passer par des outils n’est pas un vrai problème
    • Je travaille avec protobuf tous les jours, et la structure binaire de ce format existe pour garantir la compatibilité
      Pour les fichiers de configuration manipulés par des humains, le text proto ou le JSON sont plus adaptés
    • J’ai déplacé le stockage de mes documents de DOC ou PDF vers du texte Markdown
      grep, git, les conversions : tout est simple
      J’avais rédigé d’anciens articles avec Lotus Word Pro et je ne peux plus les lire aujourd’hui ; si cela avait été du texte, il n’y aurait pas eu eu de problème
    • La version texte de protobuf n’est ni du base64 ni du JSON
      Dans les systèmes à grande échelle, beaucoup de fichiers texte circulent, mais il n’y a presque aucune transparence
      À grande échelle, économiser quelques bits peut se traduire par des réductions de coûts importantes, donc les champs auto-étiquetés sont exclus
  • Le texte n’est au fond qu’une représentation d’octets
    Mais si l’on s’y accroche, c’est à cause du caractère fermé des formats binaires et du manque d’outils
    Même avec des millions de colonnes en base64 dans un CSV, sans les bons outils, ce n’est pas mieux que du binaire

    • Mais le texte n’est pas seulement des octets, c’est un système de symboles lisible par l’humain
    • Le texte impose des contraintes sur les séquences d’octets autorisées et possède une structure de compression issue de l’évolution des langues
      Grâce à la standardisation, on peut partager du sens, et des modèles comme les LLM peuvent l’apprendre
    • C’est une blague, mais il existe aussi une civilisation fondée sur la communication binaire — la civilisation Bynar
  • Comme le dit l’idée « essayez donc de représenter une phrase aléatoire de Wikipédia par un dessin », on ne peut pas tout remplacer par du texte
    À l’inverse, il est tout aussi impossible de décrire parfaitement un extrait de film avec du texte
    Le texte n’est pas le sur-ensemble de tous les médias, c’est simplement une autre forme de représentation

  • À l’affirmation selon laquelle « le texte est la technologie de communication la plus ancienne et la plus stable »
    En réalité, le langage lui-même est une technologie plus ancienne
    Les traditions orales ont transmis le savoir à travers les générations, et la langue humaine est la plus complexe d’entre elles
    Par exemple, les Gunditjmara autochtones d’Australie racontent une éruption volcanique vieille de 30 000 ans sous forme de récit (Budj Bim)
    Le texte est néanmoins unique en ce qu’il permet de transmettre l’information à travers les générations sans la déformer
    Au final, la conclusion serait plutôt : « misez sur le langage »

    • Si l’on inclut aussi la communication biologique, alors le code génétique de l’ARN serait peut-être le plus ancien « texte »
    • Le cas des Gunditjmara est fascinant, mais cela reste une hypothèse invérifiable
  • Si les LLM sont si impressionnants, c’est parce que l’humanité a consigné tout son savoir sous forme textuelle pendant des millénaires
    Les modèles d’image ont eux aussi progressé grâce à un espace d’embedding partagé entre texte et image

    • Mais quand un LLM trouve la réponse voulue après des dizaines d’échanges, c’est plus exploratoire qu’efficace
      C’est pratique, mais difficile à qualifier de modèle réellement « effectif »
  • En tant que linguiste, je crois que le texte (Unicode) est le format le plus durable pour documenter les langues menacées
    Des grammaires du grec ancien ou du sanskrit rédigées il y a des milliers d’années restent encore lisibles
    Notre équipe a publié en PDF, mais conservé en interne au format XML
    J’espère que cela sera encore lisible dans 2 000 ans

    • Mais personnellement, j’ai plutôt eu l’expérience inverse : des fichiers texte enregistrés il y a dix ans étaient plus difficiles à ouvrir
      Entre UTF-16, SJIS, EUC et d’autres encodages, la confusion est fréquente, alors que les PDF ou JPEG s’ouvrent encore parfaitement
      Si l’espace de stockage le permet, j’ai l’impression qu’un archivage au format image est plus sûr
      De plus, il existe encore des caractères qui ne sont pas représentables en Unicode
    • Comme pour la notation musicale, certaines formes de représentation ne se laissent pas classer simplement en texte ou binaire
      Une peinture rupestre transmet parfois mieux l’intention que le texte
  • Quand on lit la série Future Text Publishing,
    on voit que le « texte » est essentiellement un dessin en 2D
    Les ordinateurs ne comprennent pas le texte ; ils ne traitent que des nombres
    Ce sont les humains qui attribuent du sens à ces nombres et construisent ainsi des systèmes de signes et de langage
    L’ADN et l’ARN peuvent être vus comme des exemples de système d’écriture universel physiquement incarné

  • Cet article a déjà été soumis plusieurs fois sur HN
    En 2014, 2015 et 2021, il avait déjà reçu à chaque fois des centaines de commentaires
    version 2014, version 2015, version 2021

 
cronex 2025-12-30

Le texte est effectivement un très bon outil d’expression, et c’est aussi quelque chose de très important, mais...
On ne peut pas tout stocker sous forme de texte.
Le texte est au fond une représentation compressée. Il compresse et exprime, dans un format socialement convenu, ce que nous pouvons percevoir avec nos cinq sens (vue, ouïe, toucher, goût, odorat).
Mais s’il n’existe aucune information sur l’objet original auquel cela renvoie, alors, même si l’on stocke des données sous forme de texte, ce texte perd son sens plus tard si l’on ne connaît plus l’objet d’origine.
Nous savons ce qu’est une cassette, mais si l’on montre simplement le mot « cassette » à de très jeunes enfants nés récemment et qu’on leur demande ce que c’est, combien seraient réellement capables de répondre correctement ? Même si l’on décrit avec soin la forme, la fonction et le mode de fonctionnement d’une cassette, sera-t-on vraiment capable, dans quelques milliers d’années, de la recréer parfaitement à partir de ce seul texte ?
Dans ce genre de cas, quelques photos de cassette, des plans, ou quelques minutes de vidéo montrant comment on l’utilise peuvent être plus utiles.