- Dans le travail quotidien, il arrive fréquemment que des collègues prennent du texte en capture d’écran pour l’envoyer, une méthode inefficace qui rend la recherche dans le code et la compréhension du contexte extrêmement difficiles
- Le code reçu en capture d’écran ne permet absolument pas de connaître le contexte, comme la définition des variables, l’emplacement des modules ou la gestion des exceptions ; il faut alors tout retaper dans la recherche ou mobiliser un agent de codage
- Lorsqu’un journal d’erreurs de build est envoyé en capture d’écran, il est impossible de savoir ce qui a été buildé, la ligne de l’échec ou le message d’erreur exact, ce qui empêche toute résolution du problème
- En utilisant le copier-coller ou le partage de fichier/lien GitHub, on peut exploiter la recherche de l’IDE et vérifier immédiatement tout le contexte
- Sauf s’il s’agit d’un problème lié à l’affichage à l’écran, le texte doit être partagé sous une forme copiable, et non en capture d’écran, afin de garantir l’efficacité de la collaboration
Exemple de problème lié aux captures d’écran 1 : le code
- Lors d’une discussion avec un collègue sur un problème lié au code, on reçoit une capture d’écran du code
- Il est impossible de comprendre le contexte essentiel, comme la définition de la variable
slug, la façon dont baseUrl est généré, la raison du hardcoding du domaine, la manière dont les exceptions sont gérées ou l’emplacement du module concerné
- Il faut retaper manuellement le code visible dans la capture dans la recherche ou utiliser un agent de codage pour retrouver le module lié
- Avec le copier-coller, on peut voir davantage de contexte même pour la même ligne et coller directement le contenu dans la recherche de l’IDE
- Il est bien plus efficace de partager le fichier lui-même ou un lien GitHub
Exemple de problème lié aux captures d’écran 2 : les journaux d’erreurs de build
- On reçoit une capture d’écran du journal d’erreurs avec une demande du type : « Le build a échoué, peux-tu vérifier ? »
- Il est impossible de savoir ce qui a été buildé, à quelle ligne l’échec s’est produit, ni quel est exactement le message d’erreur
- Il arrive même qu’un rebuild complet sur son propre poste aboutisse sans erreur
- Il s’agit d’un problème qui pourrait être résolu simplement en copiant l’intégralité du journal d’erreurs ou en l’exportant dans un fichier avant de l’envoyer
La bonne manière de partager du texte
- N’envoyez pas du texte sous forme de capture d’écran ; partagez-le dans un format copiable
- Les captures d’écran ne doivent être utilisées que pour montrer un problème visuel d’affichage ou lorsqu’il existe des informations pertinentes qui se perdraient en texte brut
- Le partage de fichiers ou d’un lien GitHub est la meilleure façon de comprendre le contexte et de rechercher dans le code
4 commentaires
Il m’arrive aussi de publier du code sous forme de capture, parce que la lisibilité affichée dans l’éditeur au moment de la capture est bonne et que les raccourcis de capture intégrés à l’OS sont pratiques.
S’il existait un programme capable, d’un simple raccourci, de transformer le code présent dans l’image capturée en un lien de type Text Fragments partageable à l’extérieur, puis de le coller immédiatement, je pense que je l’utiliserais.
Pour que, lorsqu’on le publie sur Slack, il s’affiche en aperçu et qu’en ouvrant le lien on puisse copier le code
Je déteste les captures d’écran de texte
Pour faire un peu d’aguiche, je vous donne un site qui transforme du code en jolies captures d’écran façon image. haha
https://ray.so/
Quand j’envoie quelque chose par messagerie ou par mail, j’essaie moi aussi d’utiliser autant que possible du texte avant tout, mais en réalité, selon les cas, n’utiliser que du texte peut aussi être encore plus inconfortable.
À l’inverse, pour une capture d’écran, il suffit en gros d’appuyer sur un raccourci clavier, de sélectionner la zone à l’écran puis de coller le résultat, donc tout se fait dans l’interface graphique ; du point de vue de l’expéditeur, cela paraît sans doute plus pratique.
Mais comme cela a aussi été souligné dans le texte, du point de vue de celui qui la reçoit, une simple capture d’écran ne transmet pas toujours tout le contexte, et la recherche comme le copier-coller sont également peu pratiques, d’où la frustration. Sans même parler du fait que cela crée une surcharge bien plus importante que nécessaire pour le transfert et le stockage des données.
Bon, à titre personnel, si on commence à examiner ce genre de choses une par une, il y a aussi le fait de faire la documentation interne de l’entreprise dans des fichiers Word au lieu d’un wiki, ce qui m’agace déjà…
Commentaires sur Hacker News
Comme cela a été mentionné dans d’autres commentaires, l’OCR automatique sur les plateformes Apple est vraiment révolutionnaire
Je pense que ce genre de fonctionnalité devrait être intégré par défaut dans les visionneuses de documents de toutes les plateformes
Une autre chose que j’aimerais, c’est d’inclure des métadonnées dans les captures d’écran. Par exemple, si on capture une photo Instagram, l’URL correspondante serait incluse ; dans un navigateur, l’URL en cours et le chemin DOM ; dans une app de cartographie, les coordonnées ; dans un lecteur PDF, le hash SHA1 du document et l’offset
Il y aurait bien sûr des problèmes de confidentialité, mais j’imagine que cette idée a déjà été étudiée dans le monde académique
Aujourd’hui, la notion même de fichier est devenue abstraite, au point que la capture d’écran donne l’impression d’être la langue commune de l’ère du mobile computing
Au passage, je tiens aussi à mentionner Screenshot Conf
Les captures d’écran sont gérées au niveau de l’OS, donc il serait risqué qu’une app puisse savoir qu’elle a été capturée ou obtenir des informations de localisation
Des entreprises comme Evernote ou CloudApp ont essayé, mais ont fini par échouer. Une capture d’écran n’est utile que si elle reste simple
Le système que je construis encode beaucoup d’informations de contexte dans l’URL, et celles-ci ne figurent pas dans la capture
Du coup, je dois toujours demander l’URL en texte séparément
Après une capture d’écran, ils ajoutent dans l’interface des fonctions comme des insights IA, la recherche de produits, des conversations avec Gemini/LLM
Parce que tout le monde utilise les captures d’écran pour stocker ou retrouver de l’information
Mais elle a été retirée de la version finale, de peur que les gens ne s’en servent comme traitement de texte
J’utilise souvent des captures d’écran
Parce qu’en gardant une largeur de 80 caractères, la lisibilité est bonne, et que la police monospace ainsi que la coloration syntaxique sont préservées
Quand on veut éviter que du code ou une sortie de terminal ne soit cassé dans un e-mail ou un chat mobile, la capture d’écran reste la solution la plus fiable
Bien sûr, quand il faut le fichier complet, je le joins, mais j’envoie aussi une capture de la partie pertinente
Une capture d’écran oblige à zoomer et nuit aussi à l’accessibilité
En envoyant du texte, on facilite la recherche et la copie
La plupart des systèmes prennent déjà en charge les polices monospace, et le vrai problème vient plutôt de contraintes d’environnement comme le rendu de Gmail
GMail n’impose aucune limite de largeur et les tailles de police varient, ce qui rend la lecture difficile
Avec une URL longue ou un écran large, on peut au contraire subir une forte baisse de lisibilité
Parce qu’elles conservent les couleurs, le formatage et le contexte
Pour expliquer un problème, le dicton « une image vaut mille mots » s’applique bien
Je peux ainsi l’afficher dans mon éditeur avec la police, la largeur et les couleurs que je préfère, et il reste possible de chercher et de modifier
Une capture d’écran finit surtout par compliquer la vie des autres
Les fonctions de reconnaissance et de copie de texte sur Mac et iOS sont vraiment révolutionnaires
On peut copier directement le texte d’une capture d’écran ou d’une photo, puis le coller dans une note
À ce moment-là, j’ai vraiment eu l’impression de vivre dans le futur
Dans Safari, on peut même traduire le texte présent dans une image, ce qui est particulièrement utile pour traduire des pages web en japonais
C’est pratique, car tout se fait sans enregistrer de fichier
Avant, on collait des captures d’écran dans des documents Word pour les envoyer
Mais proposer maintenant de réextraire le texte avec un LLM est vraiment du gaspillage
Ce qu’il nous faut au final, c’est une innovation d’interface qui rende le partage de texte aussi simple que celui d’une capture d’écran
Quand je vois des aspirants programmeurs faire ça, c’est désespérant
En collant à l’intérieur d’un document d’autres fichiers Word comme de véritables objets
Dans mon billet « How to Ask for Help in Slack », la 7e règle est : « ne postez pas de captures d’écran de texte »
Même si l’OCR d’Apple est excellent, le problème de l’impossibilité de recherche reste entier
Lien vers l’original
Je préfère envoyer le document complet ou un lien vers le code, accompagné d’une capture d’écran de la partie pertinente
Le contexte visuel reste présent, ce qui aide à mieux s’en souvenir quand on y revient plus tard
Les nouveaux développeurs partagent souvent des captures d’écran de texte pendant leurs premières semaines
Mais c’est pénible à lire sur mobile, et Slack compresse les images au point qu’on ne peut même pas zoomer
Au final, la plupart apprennent à partager du texte
Dans MS Teams, la prise en charge des blocs de code est tellement mauvaise qu’on finit souvent par utiliser des captures d’écran
La fonctionnalité existe, mais elle est mal mise en avant
Les captures d’écran sont une méthode rapide et cohérente
Elles fonctionnent partout de la même manière, que ce soit dans une web app, une app native ou un site
C’est peut-être peu pratique pour le destinataire, mais du point de vue de l’expéditeur, c’est efficace
Sous Linux, j’ai relié l’action personnalisée de xfce4-screenshooter à un script OCR tesseract
Quand je capture une zone de sélection, le texte est automatiquement copié dans le presse-papiers
Quand la reconnaissance est difficile, j’utilise Gemma3-4B + llama.cpp
Je n’aime pas les captures d’écran de texte
De nos jours, la plupart des navigateurs disposent d’une fonctionnalité appelée Text Fragment, que j’utilise très utilement.
Vérifiez si cela fonctionne avec ce lien mis en surbrillance dans cet article.