Liste des outils open source de traitement HWP/HWPX
(ko.wikipedia.org)Wikipédia n’est pas un panneau publicitaire destiné à présenter ou promouvoir quelque chose. Mais le fait qu’un grand nombre de bibliothèques aient émergé en peu de temps m’a semblé pouvoir être considéré comme un phénomène définissant une époque.
J’ai donc consigné ce phénomène dans un document et rassemblé les outils open source HWP/HWPX publiés jusqu’à présent pour les mettre en ligne sur MediaWiki.
Liste des outils open source de traitement HWP/HWPX
HWP (Hanword Processor) et son format successeur HWPX sont des formats de document largement utilisés dans les institutions publiques et le milieu éducatif en Corée du Sud. Comme Hancom Office Hanword s’est imposé comme standard de fait, il a longtemps été nécessaire, pour manipuler ces formats par programmation, de disposer de Hancom Office installé dans un environnement Windows.
Au début des années 2010, Kim Hodong a, à lui seul, développé ruby-hwp, libhwp, evince-hwp et d’autres outils, posant ainsi les premières bases de l’écosystème open source autour de HWP. Mais en 2013, à la suite de l’affaire libhwp, il a été écœuré par le développement open source et, avec la dégradation de sa santé, a interrompu tous ses projets avant de se retirer.[1][2] Par la suite, les activités open source dans ce domaine ne se sont poursuivies que de manière sporadique.
Autour de 2024, la situation a changé. Avec la diffusion de l’IA générative, la demande pour intégrer des documents HWP/HWPX dans des pipelines IA ou les traiter avec des outils d’automatisation a fortement augmenté. En conséquence, de nombreux outils open source fonctionnant sans Hancom Office sont apparus en peu de temps, sous des formes variées allant de bibliothèques implémentées en Python, Rust ou TypeScript à des CLI, des serveurs MCP et des éditeurs web.
Le tableau ci-dessous rassemble les principaux outils open source HWP/HWPX actuellement publiés.
(Vous pouvez consulter le tableau récapitulatif via le lien MediaWiki.)
À M. Kim Hodong
En 2013, un développeur a, à lui seul, posé presque toutes les bases permettant de traiter en open source des fichiers Hanword, avec ruby-hwp, libhwp, evince-hwp et d’autres projets. En raison de l’affaire Libhwp, il a été écœuré par le développement open source et, avec l’aggravation de son état de santé, a fermé ses projets avant de partir. Si les outils listés dans ce document ont pu exister, c’est parce que M. Hodong a vu cette possibilité avant les autres et a ouvert la voie. Ce document a été créé pour rendre hommage à ce travail pionnier.
10 commentaires
Pourquoi le document du wiki a-t-il disparu ?
https://ko.wikipedia.org/wiki/…
Il y a ce genre de discussion.
À voir, il semble que M. Kim Ho-dong ait déjà subi énormément de stress en 2019. En lisant le texte, on voit qu’il y avait vraiment trop de personnes pénibles et de voyous. (Il y en a probablement encore aujourd’hui ?)
https://hamonikr.org/Free_Board/63139
Je pense qu’il faut aussi entendre l’autre version.
C’est assez connu. En 2011, 2013, 2016 et 2019, des choses similaires arrivent à la même personne. Cette personne annonce à plusieurs reprises l’arrêt du projet, voire l’arrêt de l’open source, critique les personnes qui ont soumis des bug reports sur le projet, puis, quelque temps plus tard, recommence, et cela se répète plusieurs fois. On dirait aussi qu’elle fait assidûment des recherches sur elle-même, au point de lancer des recherches par mots-clés sur toutes sortes de forums et de wikis partout où il est question du sujet. (Il ou elle pourrait même tomber sur ce commentaire et venir ici.)
Parce que c’est un développeur, est-ce qu’il faut forcément le croire et faire preuve de compréhension ?
Merci pour votre commentaire. Je vois, il y a donc eu ce genre de choses. Ce que j’ai vu ne représente sans doute pas tout. Merci encore de m’avoir apporté des informations sous un autre angle.
Le code existant est toujours là, il est donc possible de vérifier directement de quelle implémentation il s’agit.
https://gitlab.com/sebuls/libhwp
rip
BckHWP. Automatisation VBA pour Excel
https://m.blog.naver.com/husky81/222045248589
Waouh, quand j’avais regardé en 2020, il n’y avait pas beaucoup de bibliothèques capables de gérer le HWP, mais récemment leur nombre a explosé.
Ce n’était pas tant que
libhwpétait la raison décisive, c’est surtout le groupe de déchets qui posait davantage problème. Il n’y a pas de sujet dans cette phrase ; si ça t’énerve en la lisant, c’est ton problème.