RHWP - Parseur open source HWP/HWPX et éditeur web en Rust
(github.com/edwardkim)Il s’agit d’un projet basé sur Rust permettant de lire et modifier des fichiers HWP/HWPX en open source.
- Prise en charge de l’analyse des formats binaire HWP 5.0 et HWPX (XML)
- Exécutable directement dans le navigateur via WebAssembly, avec distribution sous forme de packages npm (
@rhwp/editor,@rhwp/core) - Prise en charge du rendu des paragraphes, tableaux, formules, images et graphiques, ainsi que de la mise en page en colonnes multiples, des en-têtes/pieds de page et des notes de bas de page
- Dans l’éditeur web (
rhwp-studio), possibilité d’éditer le texte, modifier la mise en forme et créer/éditer des tableaux - Fournit plusieurs formats de sortie, dont l’export SVG (CLI) et le rendu Canvas (web)
- Qualité assurée grâce à plus de 783 tests et à l’automatisation CI/CD
Pendant le développement, Claude Code et une approche d’AI pair programming sont activement utilisés, et l’autre caractéristique notable est que l’ensemble du processus de développement est documenté de manière transparente dans le répertoire mydocs/ (724 fichiers). Le projet est actuellement au stade v0.5 (rétro-ingénierie terminée et base de lecture/écriture mise en place) et vise à long terme un pipeline de composition assisté par IA, la collaboration en temps réel et un niveau de finition comparable à celui de Hancom.
Licence MIT.
8 commentaires
Merci beaucoup à la personne qui a créé ce programme vraiment formidable. Il m’arrive de vouloir utiliser Hangul simplement, et c’est vraiment impressionnant. En particulier, la configuration des menus et de l’éditeur, très proche de celle de Hangul, est étonnante.
À titre personnel, j’ai essayé de le compiler dans un environnement Linux en utilisant Electron pour en faire une AppImage et une application de bureau, et cela fonctionne de manière très fluide. Le fait qu’il prenne aussi en charge Windows et Mac le rend vraiment très polyvalent.
(Par ailleurs, même si je consulte GeekNews tous les jours, je ne suis tombé sur ce billet qu’aujourd’hui alors qu’il a été publié « il y a 10 jours ». Je me demande si c’est parce que je maîtrise mal la façon d’utiliser le site, car ce genre de situation m’arrive parfois.)
À l’ère de l’IA, les HWP qui ne peuvent pas être exploités comme données devraient disparaître, ou bien Hancom devrait gérer activement en open source, de bout en bout, depuis un corpus d’extraction de mots dédié au HWP jusqu’aux embeddings, dans Hangul Word Processor.
Je l'admets.
https://github.com/edwardkim/rhwp/discussions/64
Je m’inquiétais lorsqu’un problème de droits d’auteur sur les polices avait éclaté alors que tout marchait très bien, mais heureusement, c’est maintenant réglé.
C’est vraiment excellent, on dirait que ça fonctionne même plus vite que Hancom.
C’est vraiment excellent. Pour mon outil de collaboration professionnelle que j’avais développé et que j’utilise déjà personnellement avec l’IA, je gérais jusque-là les fichiers hwp et hwpx en convertissant d’abord les documents en PDF via LibreOffice en arrière-plan en mode headless, puis en les affichant avec pdf.js ; eh bien, j’ai pu remplacer ça directement par ce projet. Ah, quel régal.
Étonné par la vitesse de cette web app basée sur Rust. Elle est plus de deux fois plus rapide que lorsqu’on lance Hancom Hangul installé sur l’ordinateur pour ouvrir un fichier. Et le défilement semble plus de quatre fois plus rapide.
On dirait le ton des résumés HN haha. Ce n’est pas une critique, hein. C’est amusant.