5 points par GN⁺ 2025-11-12 | 4 commentaires | Partager sur WhatsApp
  • Dans le travail quotidien, il arrive fréquemment que des collègues prennent du texte en capture d’écran pour l’envoyer, une méthode inefficace qui rend la recherche dans le code et la compréhension du contexte extrêmement difficiles
  • Le code reçu en capture d’écran ne permet absolument pas de connaître le contexte, comme la définition des variables, l’emplacement des modules ou la gestion des exceptions ; il faut alors tout retaper dans la recherche ou mobiliser un agent de codage
  • Lorsqu’un journal d’erreurs de build est envoyé en capture d’écran, il est impossible de savoir ce qui a été buildé, la ligne de l’échec ou le message d’erreur exact, ce qui empêche toute résolution du problème
  • En utilisant le copier-coller ou le partage de fichier/lien GitHub, on peut exploiter la recherche de l’IDE et vérifier immédiatement tout le contexte
  • Sauf s’il s’agit d’un problème lié à l’affichage à l’écran, le texte doit être partagé sous une forme copiable, et non en capture d’écran, afin de garantir l’efficacité de la collaboration

Exemple de problème lié aux captures d’écran 1 : le code

  • Lors d’une discussion avec un collègue sur un problème lié au code, on reçoit une capture d’écran du code
    • Il est impossible de comprendre le contexte essentiel, comme la définition de la variable slug, la façon dont baseUrl est généré, la raison du hardcoding du domaine, la manière dont les exceptions sont gérées ou l’emplacement du module concerné
    • Il faut retaper manuellement le code visible dans la capture dans la recherche ou utiliser un agent de codage pour retrouver le module lié
  • Avec le copier-coller, on peut voir davantage de contexte même pour la même ligne et coller directement le contenu dans la recherche de l’IDE
  • Il est bien plus efficace de partager le fichier lui-même ou un lien GitHub

Exemple de problème lié aux captures d’écran 2 : les journaux d’erreurs de build

  • On reçoit une capture d’écran du journal d’erreurs avec une demande du type : « Le build a échoué, peux-tu vérifier ? »
    • Il est impossible de savoir ce qui a été buildé, à quelle ligne l’échec s’est produit, ni quel est exactement le message d’erreur
    • Il arrive même qu’un rebuild complet sur son propre poste aboutisse sans erreur
  • Il s’agit d’un problème qui pourrait être résolu simplement en copiant l’intégralité du journal d’erreurs ou en l’exportant dans un fichier avant de l’envoyer

La bonne manière de partager du texte

  • N’envoyez pas du texte sous forme de capture d’écran ; partagez-le dans un format copiable
  • Les captures d’écran ne doivent être utilisées que pour montrer un problème visuel d’affichage ou lorsqu’il existe des informations pertinentes qui se perdraient en texte brut
  • Le partage de fichiers ou d’un lien GitHub est la meilleure façon de comprendre le contexte et de rechercher dans le code

4 commentaires

 
tested 2025-11-12

Il m’arrive aussi de publier du code sous forme de capture, parce que la lisibilité affichée dans l’éditeur au moment de la capture est bonne et que les raccourcis de capture intégrés à l’OS sont pratiques.

S’il existait un programme capable, d’un simple raccourci, de transformer le code présent dans l’image capturée en un lien de type Text Fragments partageable à l’extérieur, puis de le coller immédiatement, je pense que je l’utiliserais.

Pour que, lorsqu’on le publie sur Slack, il s’affiche en aperçu et qu’en ouvrant le lien on puisse copier le code

 
kunggom 2025-11-12

Je déteste les captures d’écran de texte

Pour faire un peu d’aguiche, je vous donne un site qui transforme du code en jolies captures d’écran façon image. haha

https://ray.so/

Quand j’envoie quelque chose par messagerie ou par mail, j’essaie moi aussi d’utiliser autant que possible du texte avant tout, mais en réalité, selon les cas, n’utiliser que du texte peut aussi être encore plus inconfortable.
À l’inverse, pour une capture d’écran, il suffit en gros d’appuyer sur un raccourci clavier, de sélectionner la zone à l’écran puis de coller le résultat, donc tout se fait dans l’interface graphique ; du point de vue de l’expéditeur, cela paraît sans doute plus pratique.
Mais comme cela a aussi été souligné dans le texte, du point de vue de celui qui la reçoit, une simple capture d’écran ne transmet pas toujours tout le contexte, et la recherche comme le copier-coller sont également peu pratiques, d’où la frustration. Sans même parler du fait que cela crée une surcharge bien plus importante que nécessaire pour le transfert et le stockage des données.
Bon, à titre personnel, si on commence à examiner ce genre de choses une par une, il y a aussi le fait de faire la documentation interne de l’entreprise dans des fichiers Word au lieu d’un wiki, ce qui m’agace déjà…

 
GN⁺ 2025-11-12
Commentaires sur Hacker News
  • Comme cela a été mentionné dans d’autres commentaires, l’OCR automatique sur les plateformes Apple est vraiment révolutionnaire
    Je pense que ce genre de fonctionnalité devrait être intégré par défaut dans les visionneuses de documents de toutes les plateformes
    Une autre chose que j’aimerais, c’est d’inclure des métadonnées dans les captures d’écran. Par exemple, si on capture une photo Instagram, l’URL correspondante serait incluse ; dans un navigateur, l’URL en cours et le chemin DOM ; dans une app de cartographie, les coordonnées ; dans un lecteur PDF, le hash SHA1 du document et l’offset
    Il y aurait bien sûr des problèmes de confidentialité, mais j’imagine que cette idée a déjà été étudiée dans le monde académique
    Aujourd’hui, la notion même de fichier est devenue abstraite, au point que la capture d’écran donne l’impression d’être la langue commune de l’ère du mobile computing
    Au passage, je tiens aussi à mentionner Screenshot Conf

    • Je suis totalement d’accord pour l’OCR, mais l’insertion de métadonnées pourrait devenir un cauchemar pour la vie privée
      Les captures d’écran sont gérées au niveau de l’OS, donc il serait risqué qu’une app puisse savoir qu’elle a été capturée ou obtenir des informations de localisation
      Des entreprises comme Evernote ou CloudApp ont essayé, mais ont fini par échouer. Une capture d’écran n’est utile que si elle reste simple
    • Je suis l’auteur du billet, et j’aurais dû mentionner le problème de l’absence d’URL dans les captures d’écran de pages web
      Le système que je construis encode beaucoup d’informations de contexte dans l’URL, et celles-ci ne figurent pas dans la capture
      Du coup, je dois toujours demander l’URL en texte séparément
    • Google et Apple ont eux aussi compris cette tendance
      Après une capture d’écran, ils ajoutent dans l’interface des fonctions comme des insights IA, la recherche de produits, des conversations avec Gemini/LLM
      Parce que tout le monde utilise les captures d’écran pour stocker ou retrouver de l’information
    • L’idée d’inclure l’URL d’une photo Instagram dans une capture d’écran est en soi un cauchemar pour la vie privée
    • Fait amusant, les premières versions de développement de MacPaint avaient une fonction simple de copie par OCR
      Mais elle a été retirée de la version finale, de peur que les gens ne s’en servent comme traitement de texte
  • J’utilise souvent des captures d’écran
    Parce qu’en gardant une largeur de 80 caractères, la lisibilité est bonne, et que la police monospace ainsi que la coloration syntaxique sont préservées
    Quand on veut éviter que du code ou une sortie de terminal ne soit cassé dans un e-mail ou un chat mobile, la capture d’écran reste la solution la plus fiable
    Bien sûr, quand il faut le fichier complet, je le joins, mais j’envoie aussi une capture de la partie pertinente

    • Dans le chat, la possibilité de copier et de chercher est plus importante
      Une capture d’écran oblige à zoomer et nuit aussi à l’accessibilité
      En envoyant du texte, on facilite la recherche et la copie
    • Des choses comme la « largeur de 80 caractères » relèvent de la préférence personnelle
      La plupart des systèmes prennent déjà en charge les polices monospace, et le vrai problème vient plutôt de contraintes d’environnement comme le rendu de Gmail
      GMail n’impose aucune limite de largeur et les tailles de police varient, ce qui rend la lecture difficile
    • Comme ce type de préférence de format est personnel, il ne faut pas l’imposer par capture d’écran
      Avec une URL longue ou un écran large, on peut au contraire subir une forte baisse de lisibilité
    • Moi aussi, je préfère les captures d’écran
      Parce qu’elles conservent les couleurs, le formatage et le contexte
      Pour expliquer un problème, le dicton « une image vaut mille mots » s’applique bien
    • Je trouve qu’il est bien préférable que le code arrive sous forme de texte
      Je peux ainsi l’afficher dans mon éditeur avec la police, la largeur et les couleurs que je préfère, et il reste possible de chercher et de modifier
      Une capture d’écran finit surtout par compliquer la vie des autres
  • Les fonctions de reconnaissance et de copie de texte sur Mac et iOS sont vraiment révolutionnaires
    On peut copier directement le texte d’une capture d’écran ou d’une photo, puis le coller dans une note

    • Le Snipping Tool de Windows dispose aussi d’une fonction d’extraction de texte
    • Quelqu’un m’a envoyé via iMessage une photo d’un numéro de téléphone, j’ai simplement appuyé dessus et l’interface d’appel s’est ouverte directement
      À ce moment-là, j’ai vraiment eu l’impression de vivre dans le futur
    • La synchronisation du copier-coller entre MacBook et iPhone change complètement le flux de travail
    • Si cette fonction est si bonne, c’est parce qu’elle est intégrée de manière cohérente dans tout le système
      Dans Safari, on peut même traduire le texte présent dans une image, ce qui est particulièrement utile pour traduire des pages web en japonais
    • J’utilise Shottr : juste après une capture d’écran, j’appuie sur « O » pour lancer immédiatement l’OCR
      C’est pratique, car tout se fait sans enregistrer de fichier
  • Avant, on collait des captures d’écran dans des documents Word pour les envoyer
    Mais proposer maintenant de réextraire le texte avec un LLM est vraiment du gaspillage
    Ce qu’il nous faut au final, c’est une innovation d’interface qui rende le partage de texte aussi simple que celui d’une capture d’écran

    • Il y a pire encore. Certaines personnes prennent directement une photo de l’écran pour l’envoyer
      Quand je vois des aspirants programmeurs faire ça, c’est désespérant
    • Dans certaines entreprises, on utilisait les documents Word comme des dossiers
      En collant à l’intérieur d’un document d’autres fichiers Word comme de véritables objets
    • Il existe aussi un XKCD pertinent → xkcd 2116
  • Dans mon billet « How to Ask for Help in Slack », la 7e règle est : « ne postez pas de captures d’écran de texte »
    Même si l’OCR d’Apple est excellent, le problème de l’impossibilité de recherche reste entier
    Lien vers l’original

    • Pourtant, Spotlight et Photos permettent aussi de rechercher le texte présent dans les captures d’écran
  • Je préfère envoyer le document complet ou un lien vers le code, accompagné d’une capture d’écran de la partie pertinente
    Le contexte visuel reste présent, ce qui aide à mieux s’en souvenir quand on y revient plus tard

  • Les nouveaux développeurs partagent souvent des captures d’écran de texte pendant leurs premières semaines
    Mais c’est pénible à lire sur mobile, et Slack compresse les images au point qu’on ne peut même pas zoomer
    Au final, la plupart apprennent à partager du texte

  • Dans MS Teams, la prise en charge des blocs de code est tellement mauvaise qu’on finit souvent par utiliser des captures d’écran

    • J’apprends à mes collègues à créer des blocs de code Markdown dans Teams
      La fonctionnalité existe, mais elle est mal mise en avant
    • Quand on voit une capture d’écran dans Teams, c’est le plus souvent un bout de conversation capturé depuis un autre chat
  • Les captures d’écran sont une méthode rapide et cohérente
    Elles fonctionnent partout de la même manière, que ce soit dans une web app, une app native ou un site
    C’est peut-être peu pratique pour le destinataire, mais du point de vue de l’expéditeur, c’est efficace

  • Sous Linux, j’ai relié l’action personnalisée de xfce4-screenshooter à un script OCR tesseract
    Quand je capture une zone de sélection, le texte est automatiquement copié dans le presse-papiers
    Quand la reconnaissance est difficile, j’utilise Gemma3-4B + llama.cpp

 
ndrgrd 2025-11-12

Je n’aime pas les captures d’écran de texte

De nos jours, la plupart des navigateurs disposent d’une fonctionnalité appelée Text Fragment, que j’utilise très utilement.

Vérifiez si cela fonctionne avec ce lien mis en surbrillance dans cet article.