Toujours parier sur le texte (2014)
(graydon2.dreamwidth.org)- Le texte est la technologie de communication la plus puissante de l’histoire humaine, avec une expressivité et une efficacité qui surpassent tous les autres médias
- Plus adapté que les images, la vidéo ou la voix pour transmettre avec précision des concepts abstraits et des raisonnements complexes
- Une technologie dont la durabilité et la stabilité sont prouvées, au point que l’on peut encore lire des écrits vieux de plusieurs millénaires
- D’une efficacité écrasante en matière de stockage et de transmission, et point de départ récurrent des progrès des technologies de communication
- Aucun autre média ne peut rivaliser avec lui en étendue et profondeur des usages sociaux : recherche, traduction, résumé, collaboration, etc.
Position de principe sur le texte
- Chaque fois que l’on m’interroge sur la vidéo, la 3D, les jeux ou les systèmes multimédias dynamiques, je répète la même position
- Je ne nie pas la valeur des images, de la photographie, du cinéma ou de la musique, mais je considère que la supériorité du texte est absolue
- Le texte est défini ici comme la technologie de communication la plus puissante, la plus utile et la plus efficace
La technologie la plus ancienne et la plus stable
- La parole et la langue des signes existent naturellement dans les sociétés humaines, mais le texte est une technologie acquise par apprentissage et transmission
- Il possède une résistance au temps telle que des documents d’il y a environ 5 000 ans restent lisibles aujourd’hui
- Gravé sur des supports physiques comme la pierre, il peut même survivre plus longtemps que l’humanité
Le moyen d’expression le plus flexible
- Les images sont puissantes dans certaines situations, mais il est impossible de représenter visuellement une phrase abstraite arbitraire
- Une phrase conceptuelle comme une définition des droits humains ne peut pas être remplacée par un dessin
- Le texte permet de transmettre des idées en contrôlant le niveau de précision et d’ambiguïté
- Ce n’est pas un hasard si la littérature, la philosophie, l’histoire, les mathématiques, la logique, la programmation et l’ingénierie reposent sur le texte
Le mode de communication le plus efficace
- Le texte offre une efficacité d’un autre ordre en matière d’espace de stockage et de coût de transmission
- Quelques milliers d’octets de texte peuvent être plus légers qu’une simple image d’icône
- Du télégraphe optique au télégraphe électrique, du téléscripteur aux premiers réseaux informatiques, le texte est toujours apparu en premier
- La voix, l’image et la vidéo n’ont émergé qu’une fois la bande passante devenue suffisamment bon marché
- Sa densité est telle qu’on peut embarquer l’intégralité de Wikipédia sur un smartphone
La technologie la plus utile socialement
- Fonctionne efficacement dans les communications 1:1, 1:N et M:N
- Permet la recherche et l’indexation, y compris manuelles
- Optimisé pour le traitement algorithmique : traduction, comparaison, diff, clustering, correction, résumé, filtrage, etc.
- Peut être utilisé de manière asynchrone, avec une liberté totale sur le rythme
- Prend en charge l’édition collaborative, la citation, l’annotation, les discussions en branche, les résumés, les revues et même les œuvres dérivées
- Il n’existe aucune technologie capable de remplacer la complexité sociale et cognitive des bibliothèques et des publications sur Internet
Conclusion
- La position sur le texte est donc claire : il faut toujours choisir d’abord le texte (always pick text first)
- Pour reprendre les mots d’un ancien patron : il faut toujours parier sur le texte (always bet on text)
- Si quelque chose peut être fait en texte, il faut le faire ainsi. Le texte déçoit rarement
3 commentaires
Le texte est clairement stable, mais je ne suis pas sûr qu’il soit intuitif.
Commentaires sur Hacker News
Je ne comprends pas cette fausse dichotomie dans la discussion
Je ne vois pas pourquoi je devrais choisir entre l’UTF-8 et un enregistrement d’interprétation au piano
On a l’impression que quelqu’un, emballé par le sujet, ne sait en parler qu’en mode opposition simpliste du type « Ford vs. Chevy »
Nous aimons tous le texte, donc j’aimerais qu’on arrête d’essayer de nous en convaincre
Je suis d’accord sur la souplesse infinie et la durabilité du texte, mais après avoir vu le travail de Bret Victor, j’en ai aussi perçu les limites
Quand on apprend le piano, on a une boucle de retour immédiate, et ce type d’apprentissage est difficile à reproduire avec du texte
L’idée centrale de Victor est d’appliquer cet apprentissage fondé sur le feedback à l’ingénierie et à l’éducation en général
Le texte reste important, mais je pense qu’il y a aussi beaucoup de potentiel dans des approches qui mobilisent d’autres intuitions sensorielles
Les démonstrations de Bret Victor sont impressionnantes, mais leur mise en œuvre réelle exige un effort énorme
L’idée en elle-même est excellente, mais il faut comprendre que sa réalisation demande beaucoup d’investissement et d’engagement
Il est difficile d’expliquer des données ou des résultats avec du texte, alors qu’un graphique transmet énormément d’informations d’un seul coup
Le texte est utile parce qu’il est asynchrone, mais les humains préfèrent instinctivement parler ou s’exprimer visuellement
Au final, une approche hybride paraît plus naturelle qu’un mode de communication unique
Un enfant regarde simplement et apprend, en le comprenant par intuition physique
Les savoirs qu’on acquiert avec le corps, comme faire du vélo, se transmettent à peine par le texte
Le texte est symbolique, l’image est sensorielle
Il est impossible de restituer parfaitement par texte une peinture de Norman Rockwell
Des systèmes symboliques fondés sur le texte, comme la partition musicale ou les diagrammes de Feynman, restent néanmoins très puissants
J’ai résumé le billet de l’OP en 30 secondes, alors que la vidéo de Bret Victor dure 54 minutes, et la plupart des gens ne la regarderont pas
Le texte reste le meilleur média en matière d’efficacité et de transformabilité
Je pense qu’il vaut mieux utiliser les autres médias comme moyens complémentaires
Je me définis comme un maximaliste du texte
Le texte est le point de contact naturel entre les humains et les machines, et l’équilibre entre efficacité et transparence
Tout peut être stocké sous forme de chaînes de caractères et représenté en base64, JSON, HTML, CSS, SQL, etc.
En fin de compte, la silver bullet que poursuivait le secteur, c’était la chaîne de caractères
Les formats binaires complexes perdent en lisibilité et, une fois compressés avec GZIP, leur avantage disparaît presque
Les protocoles textuels deviennent instables à cause du problème de la loi de Postel
Une différence de 30 % de bande passante n’est pas du tout négligeable, et c’est aussi pour cela que HTTP3 est passé au binaire
Même si on compresse du base64, la lisibilité est déjà perdue
Références associées : Robustness principle, problème des regex, ReDoS
De toute façon, du JSON gzippé n’est pas lisible directement par un humain, donc passer par des outils n’est pas un vrai problème
Pour les fichiers de configuration manipulés par des humains, le text proto ou le JSON sont plus adaptés
grep,git, les conversions : tout est simpleJ’avais rédigé d’anciens articles avec Lotus Word Pro et je ne peux plus les lire aujourd’hui ; si cela avait été du texte, il n’y aurait pas eu eu de problème
Dans les systèmes à grande échelle, beaucoup de fichiers texte circulent, mais il n’y a presque aucune transparence
À grande échelle, économiser quelques bits peut se traduire par des réductions de coûts importantes, donc les champs auto-étiquetés sont exclus
Le texte n’est au fond qu’une représentation d’octets
Mais si l’on s’y accroche, c’est à cause du caractère fermé des formats binaires et du manque d’outils
Même avec des millions de colonnes en base64 dans un CSV, sans les bons outils, ce n’est pas mieux que du binaire
Grâce à la standardisation, on peut partager du sens, et des modèles comme les LLM peuvent l’apprendre
Comme le dit l’idée « essayez donc de représenter une phrase aléatoire de Wikipédia par un dessin », on ne peut pas tout remplacer par du texte
À l’inverse, il est tout aussi impossible de décrire parfaitement un extrait de film avec du texte
Le texte n’est pas le sur-ensemble de tous les médias, c’est simplement une autre forme de représentation
Exemples : Flight management system, NOTAM
À l’affirmation selon laquelle « le texte est la technologie de communication la plus ancienne et la plus stable »
En réalité, le langage lui-même est une technologie plus ancienne
Les traditions orales ont transmis le savoir à travers les générations, et la langue humaine est la plus complexe d’entre elles
Par exemple, les Gunditjmara autochtones d’Australie racontent une éruption volcanique vieille de 30 000 ans sous forme de récit (Budj Bim)
Le texte est néanmoins unique en ce qu’il permet de transmettre l’information à travers les générations sans la déformer
Au final, la conclusion serait plutôt : « misez sur le langage »
Si les LLM sont si impressionnants, c’est parce que l’humanité a consigné tout son savoir sous forme textuelle pendant des millénaires
Les modèles d’image ont eux aussi progressé grâce à un espace d’embedding partagé entre texte et image
C’est pratique, mais difficile à qualifier de modèle réellement « effectif »
En tant que linguiste, je crois que le texte (Unicode) est le format le plus durable pour documenter les langues menacées
Des grammaires du grec ancien ou du sanskrit rédigées il y a des milliers d’années restent encore lisibles
Notre équipe a publié en PDF, mais conservé en interne au format XML
J’espère que cela sera encore lisible dans 2 000 ans
Entre UTF-16, SJIS, EUC et d’autres encodages, la confusion est fréquente, alors que les PDF ou JPEG s’ouvrent encore parfaitement
Si l’espace de stockage le permet, j’ai l’impression qu’un archivage au format image est plus sûr
De plus, il existe encore des caractères qui ne sont pas représentables en Unicode
Une peinture rupestre transmet parfois mieux l’intention que le texte
Quand on lit la série Future Text Publishing,
on voit que le « texte » est essentiellement un dessin en 2D
Les ordinateurs ne comprennent pas le texte ; ils ne traitent que des nombres
Ce sont les humains qui attribuent du sens à ces nombres et construisent ainsi des systèmes de signes et de langage
L’ADN et l’ARN peuvent être vus comme des exemples de système d’écriture universel physiquement incarné
Cet article a déjà été soumis plusieurs fois sur HN
En 2014, 2015 et 2021, il avait déjà reçu à chaque fois des centaines de commentaires
version 2014, version 2015, version 2021
Le texte est effectivement un très bon outil d’expression, et c’est aussi quelque chose de très important, mais...
On ne peut pas tout stocker sous forme de texte.
Le texte est au fond une représentation compressée. Il compresse et exprime, dans un format socialement convenu, ce que nous pouvons percevoir avec nos cinq sens (vue, ouïe, toucher, goût, odorat).
Mais s’il n’existe aucune information sur l’objet original auquel cela renvoie, alors, même si l’on stocke des données sous forme de texte, ce texte perd son sens plus tard si l’on ne connaît plus l’objet d’origine.
Nous savons ce qu’est une cassette, mais si l’on montre simplement le mot « cassette » à de très jeunes enfants nés récemment et qu’on leur demande ce que c’est, combien seraient réellement capables de répondre correctement ? Même si l’on décrit avec soin la forme, la fonction et le mode de fonctionnement d’une cassette, sera-t-on vraiment capable, dans quelques milliers d’années, de la recréer parfaitement à partir de ce seul texte ?
Dans ce genre de cas, quelques photos de cassette, des plans, ou quelques minutes de vidéo montrant comment on l’utilise peuvent être plus utiles.