4 points par GN⁺ 2025-08-24 | 1 commentaires | Partager sur WhatsApp
  • LabPlot est un logiciel gratuit offrant diverses fonctions de visualisation de données et d’analyse
  • Il prend en charge de nombreux formats de données comme CSV, SQL, Excel (xlsx) et JSON, ce qui facilite l’importation des données
  • Avec LabPlot, il est possible d’effectuer l’analyse scientifique et la visualisation en une seule fois
  • Grâce à sa compatibilité multiplateforme, il peut être utilisé sur différents systèmes d’exploitation comme Windows, macOS et Linux
  • Comme il repose sur l’open source, chacun peut librement l’étendre et le personnaliser

Présentation de LabPlot

  • LabPlot est un outil de visualisation et d’analyse de données gratuit, open source et fonctionnant sur de multiples plateformes
  • Les utilisateurs peuvent traiter efficacement les tâches de tracé scientifique et d’analyse de données dans une seule application

Importation des données et compatibilité

  • La première étape avec LabPlot consiste à importer des données dans divers formats
  • Les formats pris en charge comprennent notamment CSV, Origin, SAS, Stata, SPSS, MATLAB, SQL, JSON, binaire, feuille de calcul OpenDocument (ods), Excel (xlsx), HDF5, MQTT, Binary Logging Format (BLF), FITS
  • La prise en charge de ces formats offre l’avantage d’accélérer l’intégration des données et le travail initial

Résumé

  • LabPlot est un outil multiplateforme de visualisation et d’analyse de données scientifiques qui aide les utilisateurs à importer rapidement divers formats de données et à les traiter efficacement
  • Sa nature open source permet également aux utilisateurs d’étendre les fonctionnalités et de le personnaliser directement

1 commentaires

 
GN⁺ 2025-08-24
Avis Hacker News
  • C’est étonnant de voir à quel point les outils de graphiques et de diagrammes sont désormais considérés comme des commodités totalement banales. Quand j’ai développé Deltagraph pour la première fois, fin 1988, on visait une sortie Postscript et Illustrator, avec une énorme variété de graphiques et d’options, au point qu’il a été utilisé comme une sorte de standard dans le monde entier, surtout pour l’impression. Vers le milieu des années 90, je ne faisais plus que le développement et le produit a été vendu à un éditeur ; ensuite, jusqu’à la pandémie, il a continué à fonctionner pendant 25 ans, changeant plusieurs fois de propriétaire, tout en restant basé sur le code source original écrit en C. Je n’ose même pas imaginer dans quel état ce code devait être à ce stade.

    • Malgré cela, j’ai toujours l’impression que le marché des graphiques/diagrammes n’est pas encore assez banalisé ou généralisé. La plupart des salariés utilisent encore des solutions commerciales vieillissantes (Tableau, JMP côté ingénierie matérielle, ainsi que SAS ou Excel).
  • J’ai utilisé SciDavis pendant longtemps, et j’avais aussi essayé QtiPlot auparavant ; j’ai également eu l’occasion d’utiliser Origin. SciDavis était assez rustique et plantait souvent, mais pour ce que je voulais faire, cela ne posait pas de gros problème. J’ai un peu souffert avec le réglage du style des graphiques, et la copie des styles n’était pas pratique. J’ai essayé LabPlot récemment, et lorsqu’un fichier csv contient des données datetime, il y avait un problème : même avec les options avancées et des réglages manuels, il ne reconnaissait pas correctement les formats de date et de série temporelle. Le site de documentation est une collection de vidéos YouTube ; je n’aime pas devoir chercher un manuel en regardant des vidéos. Les développeurs devraient aussi absolument produire une documentation traditionnelle. Il existe aussi AlphaPlot, un fork de SciDavis, qui a encore ses propres problèmes, notamment avec les dates au format yyyy-MM-dd hh:mm:ss.zzz, mais cela reste un outil utilisable. Pour le traitement par lots, ou quand je veux générer automatiquement plusieurs graphiques de manière reproductible, j’utilise gnuplot. La courbe d’apprentissage est raide, mais après avoir écrit quelques scripts, on peut se faire ses propres modèles, et c’est utile. C’est toujours bien de voir le mouvement open source proposer davantage d’options dans ce domaine.
    Lien vers le manuel LabPlot

  • Des outils comme ggplot demandent beaucoup de travail quand on veut affiner les détails, mais en contrepartie leur flexibilité est excellente. En revanche, si l’on veut par exemple tracer un spaghetti plot avec mesures répétées par sujet sur des données longitudinales accélérées, ou produire un graphique d’effets fixes, la plupart des solutions atteignent leurs limites. À titre indicatif, voici un exemple de graphique que j’ai réalisé.
    Exemple de graphique

    • Je suis biostatisticien, et j’adore vraiment voir des plans d’étude longitudinaux complexes. Un ancien professeur nous parlait, dans ce genre de situation, de la décomposition des effets transversaux et longitudinaux ainsi que du paradoxe de Lord, mais je n’ai toujours pas une compréhension parfaite du paradoxe de Lord.
  • Ça a vraiment l’air superbe, mais j’aimerais qu’il y ait une section expliquant « pourquoi c’est meilleur que matplotlib ou d’autres outils de graphiques populaires ». J’ai vu la liste des fonctionnalités, mais c’est pénible de devoir reconstituer mentalement un tableau comparatif. Il y a beaucoup d’aspects séduisants, mais j’aimerais vraiment voir des études de cas permettant de savoir si cela vaut la peine d’y investir du temps pour l’apprendre.

  • Il est clair qu’il y a beaucoup d’efforts derrière, mais si l’on est déjà intégré à du code de laboratoire en Julia, Matlab, R, Python, Excel, etc., je ne vois pas bien quelle serait la motivation pour utiliser cet outil. Je me demande s’il est populaire dans une communauté particulière.

    • Le but est probablement de remplacer, en mode FOSS, le rôle que jouent certains outils commerciaux populaires dans des communautés scientifiques, comme Origin. C’est utile quand un autre logiciel (par exemple un logiciel d’instrumentation) produit déjà les données, et qu’on veut les visualiser rapidement sous forme de graphiques, faire un ajustement de courbe simple, etc., via une interface graphique. Si l’on est déjà à l’aise avec le traitement des données dans les langages et bibliothèques mentionnés, il n’y a effectivement pas vraiment de raison d’avoir besoin de cet outil.

    • Je suis probablement exactement l’utilisateur cible de cet outil. Je passe de R à Python, Maxima, MATLAB/Octave, et je transfère généralement les données en CSV ; le fait que chaque outil ait une interface différente est pénible. Je n’aime pas non plus beaucoup Jupyter, donc si c’est plus confortable, je pourrais même l’essayer comme remplacement de Jupyter.

    • D’après mon expérience, il y a pas mal de gens pour qui programmer n’est ni productif ni confortable. J’utilise principalement Python, mais dans mon entreprise nous avons aussi beaucoup de licences JMP, et la plupart des ingénieurs sont tout à fait satisfaits d’Excel. En revanche, je ne montre pas aux autres le temps qu’il me faut pour faire mon travail. Et ces personnes restent souvent méfiantes envers l’open source ou les programmes sans notoriété. Un outil comme celui-ci pourrait être une option à tester discrètement de son côté, puis seulement dire à son supérieur « ça tient la route » une fois qu’on est convaincu.

    • Pour donner un exemple concret de terrain : je travaille comme ingénieur sur des projets de lanceurs, et à chaque essai ou vol, on accumule des trames de télémétrie sous forme de fichiers énormes, en CSV, TSV, etc. Il faut parcourir rapidement et visuellement des graphiques temporels de centaines de variables pour repérer immédiatement d’éventuelles anomalies, puis zoomer et se déplacer plusieurs fois afin de capturer ce qu’il faut pour l’intégrer dans la documentation. Il faut parfois zoomer jusqu’à un niveau de détail extrême (au bit, à l’échantillon) pour attraper des cas exceptionnels ; comme on ne sait pas à l’avance où ni quand un événement va survenir, la vitesse est essentielle. Il faut aussi afficher en même temps des graphiques de plusieurs variables ayant des unités différentes pour observer les corrélations, et lors d’analyses en équipe, une visualisation improvisée est souvent demandée sur le moment. Il faut également des analyses fréquentielles ou statistiques (périodogrammes, log/semi-log, PDF, etc.). On veut pouvoir ajouter très vite des marqueurs ou des annotations sur les graphiques, modifier les libellés ou le format en WYSIWYG, et appliquer puis visualiser une FFT ou un filtre en un seul clic dans le menu. Manipuler tout cela textuellement en Python/Jupyter est beaucoup trop inefficace en temps dans ce type de workflow. Avec LabPlot ou l’application que nous utilisions, tout cela pouvait se faire quasiment en temps réel. Excel s’en rapproche grâce à son interface de tableur, mais si l’on doit définir manuellement les cellules, les axes, les graphiques, l’extension des courbes, le format des libellés, etc. juste pour produire des graphiques de séries temporelles, on peut passer un mois entier rien qu’à analyser. Ces applications permettaient aussi un travail rapide grâce à des commentaires, métadonnées, etc., insérés dans les fichiers de données sous forme d’annotations formatées, et elles donnaient une réactivité immédiate sur de gros fichiers grâce à une mise en tampon au niveau disque et mémoire. Pour ce type de workflow spécialisé, LabPlot ou des outils similaires sont réellement indispensables.

    • Je n’ai pas encore essayé cet outil, mais si l’on peut visualiser les données en drag-and-drop, cela pourrait être un excellent complément aux outils existants.

  • C’est probablement le Github du projet.
    Github du projet

  • Je me demande si le site subit un HN hug of death.

  • Ce serait vraiment utile s’ils ajoutaient la prise en charge des buckets S3 et d’autres stockages d’objets cloud ; la prise en charge d’Iceberg serait aussi bienvenue vu sa popularité actuelle.

  • C’est dommage que la seule base de données actuellement prise en charge soit SQLite. J’aurais aimé pouvoir me connecter directement à une base de données ou à une API REST ; la procédure consistant à exporter puis réimporter des fichiers est trop fastidieuse.

  • Je me demande si son positionnement est celui d’une version desktop de Metabase ou Superset.