25 points par GN⁺ 2025-06-21 | 2 commentaires | Partager sur WhatsApp
  • Correcteur grammatical open source. Un produit pouvant être utilisé à la place de Grammarly, un service commercial bien connu
  • Utilisable gratuitement par tout le monde, avec un code et des algorithmes publiquement accessibles en toute transparence
  • Propose des fonctions de détection et de correction automatiques des problèmes de grammaire, de style et d’orthographe dans les textes en anglais
  • Adapté à des profils variés comme les développeurs, auteurs et étudiants, avec de larges possibilités de personnalisation
  • L’auto-hébergement du serveur et l’exécution en local sont possibles, ce qui offre des avantages en matière de vie privée et de protection des données

Présentation de Harper

  • Harper est un correcteur grammatical et stylistique open source offrant des fonctionnalités similaires à Grammarly
  • Entièrement gratuit, il permet à chacun de consulter librement le code source et de l’utiliser
  • Il fournit des fonctions de révision de textes en anglais, comme la vérification orthographique, la détection d’erreurs grammaticales et des recommandations d’amélioration du style
  • Les utilisateurs peuvent installer Harper sur un serveur local ou sur leur propre infrastructure afin de renforcer la confidentialité des données
  • Très extensible et personnalisable, il facilite la modification des algorithmes et l’ajout de fonctionnalités selon les besoins de chacun

Principales fonctionnalités et avantages

  • En tant que projet open source, il permet de gérer et d’améliorer les idées en interne sans dépendre d’un service tiers
  • Bien qu’optimisé pour l’anglais, il laisse aussi entrevoir une possible extension future vers le multilingue
  • Le support de la communauté est actif, avec de nombreux retours et des améliorations de fonctionnalités en continu
  • Il offre une grande flexibilité, via une approche serveur ou une installation directe

Public visé et exemples d’utilisation

  • Convient aux utilisateurs qui souhaitent améliorer la qualité de leur rédaction en anglais, comme les ingénieurs logiciel, les rédacteurs de documentation technique ou les étudiants
  • Avantageux pour les organisations qui veulent mettre en place leur propre processus de correction documentaire sans exposer les données personnelles à des services externes
  • Efficace dans les environnements nécessitant une personnalisation avancée, comme des règles sur mesure ou l’intégration dans des workflows

2 commentaires

 
GN⁺ 2025-06-21
Commentaires sur Hacker News
  • Pour la plupart des documents, Harper peut faire des suggestions en moins de 10 ms ; on accepte facilement des unités comme 10 l ou 10 kg, alors pourquoi 10 ms provoque-t-il une réticence ?

  • Le fait que les règles grammaticales soient codées en dur dans un programme open source, donc modifiables soi-même, est largement préférable à une approche fondée sur le prompt tuning ou codée implicitement dans les données d'entraînement d'un LLM. La configuration LSP pour Neovim a l'air particulièrement bonne : documentation d'intégration Neovim C'est exactement le genre d'outils qui représente l'avenir. Suggestion qu'Automattic devrait davantage mettre cela en avant sur sa page d'accueil.

    • Avis opposé : cette approche risque de passer à côté de l'évolution naturelle de la langue.
  • Personnellement, l'absence de LLM est perçue comme un gros avantage. Grammarly est devenu de plus en plus instable avec l'ajout de fonctions IA : il y a une heure il disait de retirer une virgule, puis juste après de la remettre, donnant une impression d'incohérence.

    • Les modèles génériques basés sur des LLM semblent en pratique souvent se tromper sur la ponctuation ; c'est un défaut très perceptible, et il est étonnant qu'un service comme Grammarly laisse ce problème en l'état.

    • Depuis un an environ, les prédictions de Grammarly et de gboard sont devenues vraiment mauvaises.

    • Question sur l'existence d'outils similaires développés avec des LLM. Les LLM ne sont pas toujours meilleurs, mais comparer les différences entre les deux approches semble intéressant.

    • Réaction en forme de plaisanterie : ces changements constants dans les suggestions de ponctuation ressemblent aux professeurs d'anglais.

  • LanguageTool, un concurrent de Grammarly, est lui aussi open source et peut être exécuté localement : GitHub, image Docker J'exécute surtout LanguageTool en local dans un conteneur Docker. Je n'ai pas utilisé Harper en profondeur, mais je connaissais son existence depuis longtemps ; c'est bien d'avoir plusieurs options. Souhait que le site de Harper indique plus clairement que l'un des outils concurrents peut aussi fonctionner en local.

  • Dans la phrase « Me and Jennifer went to have seen the ducks cousin. », aucune erreur n'est détectée. Critique selon laquelle il faudrait enrichir davantage les règles pour approcher le niveau de Grammarly.

    • Au début c'était impressionnant, mais après plusieurs tests, conclusion que les performances sont irrégulières car même des erreurs assez basiques ne sont pas repérées.

    • De la même manière, « My name John. What your name? What day today? » n'est pas non plus signalé comme fautif grammaticalement.

    • Interrogation sur ce que ces phrases de test sont censées démontrer.

  • Avis qu'un site web permettant une démo ou des tests avant téléchargement ou installation d'une extension serait vraiment utile. L'extension Firefox renvoie vers cette page, mais lorsqu'on colle un long texte, la mise en évidence ne fonctionne pas correctement.

  • Question sur l'absence d'usage de LLM dans les outils d'apprentissage des langues. Opinion selon laquelle on peut confier à 100 % les problèmes de langue à un LLM. Question demandant si quelqu'un a déjà vu ChatGPT faire des erreurs en anglais.

    • Avec le renforcement des fonctions IA de Grammarly, l'outil a commencé à proposer des phrases étranges, par exemple en séparant « wasn't » pour suggérer quelque chose comme « was trulyn't » : image associée

    • Les erreurs des LLM sont observées suffisamment souvent, avec parfois des suggestions vraiment absurdes. Bien sûr, cela marche très bien la plupart du temps, mais jamais au point d'être totalement « fiable », et ces modèles ont même tendance à suivre les erreurs de l'utilisateur.

    • Remarque selon laquelle ce type d'outils d'apprentissage linguistique sert souvent, au fond, à éviter d'« apprendre réellement » la langue.

  • Question sur la cible commerciale de Grammarly. Doute sur le fait qu'il vise surtout des professionnels utilisant l'anglais comme deuxième langue.

    • Hypothèse selon laquelle les personnes qui ignorent l'existence des LLM constituent aussi une cible majeure.
  • Présentation d'un excellent serveur LSP capable de faire aussi de la vérification grammaticale dans les commentaires de code : documentation LSP

  • Réticence à l'utiliser à cause de la crainte que, si le produit réussit, Matt finisse par le détériorer pour des raisons de profit, puisqu'il vient d'Automattic.

    • Réponse : comme c'est de l'open source (FOSS), même dans le pire des cas, la communauté pourra toujours forker la dernière bonne version et poursuivre le développement.

    • Position ferme affirmant que ce simple fait — que ce soit un produit Automattic — suffit à ne pas l'utiliser.

 
secwind 2025-06-23

Aaah, pas 10l mais 10L !