Project Gutenberg continue de s’améliorer

(gutenberg.org)

3 points par GN⁺ 2026-05-16 | 1 commentaires | Partager sur WhatsApp

Project Gutenberg propose plus de 75 000 eBooks gratuits, avec téléchargement en epub et Kindle ainsi que lecture en ligne
Le catalogue est centré sur les grandes œuvres de la littérature mondiale, avec un accent particulier sur les œuvres anciennes tombées dans le domaine public aux États-Unis
L’accès est 100 % gratuit, sans frais, sans inscription et sans application dédiée, via un navigateur web ou une liseuse
Il s’agit d’un projet de plus de 50 ans qui ouvre la voie aux eBooks gratuits depuis 1971, avec des centaines de bénévoles contribuant à la numérisation et à la relecture
La recherche par auteur, titre, sujet, langue, type et popularité est disponible, et il est aussi possible de participer à la relecture via Distributed Proofreaders et aux enregistrements de LibriVox

Trouver des eBooks gratuits

Frequently Downloaded : permet de consulter les 100 livres les plus téléchargés
Recherche par popularité : propose une liste de livres triés selon le nombre de téléchargements
Main Categories : présente les principales catégories que l’on retrouve dans les grandes librairies
Reading Lists : propose des listes de lecture sélectionnées par des bénévoles
Search Options : recherche possible par auteur, titre, sujet, langue, type, popularité, etc.
self.gutenberg.org : propose des eBooks autoédités de la World Library Foundation

Conditions d’utilisation et nature du projet

Les eBooks de Project Gutenberg sont 100 % gratuits, sans frais ni inscription
Aucun logiciel séparé n’est nécessaire : un simple navigateur web ou une liseuse suffit
Le site propose les grandes œuvres de la littérature mondiale, avec un accent particulier sur les œuvres anciennes tombées dans le domaine public aux États-Unis
Project Gutenberg est un projet de plus de 50 ans qui ouvre la voie aux eBooks gratuits depuis 1971
Des centaines de bénévoles ont contribué pendant des années à la numérisation et à la relecture des eBooks
Il est aussi possible de faire un don pour aider à numériser davantage de livres

Comment participer

Distributed Proofreaders recrute de nouveaux bénévoles et constitue la principale source de nouveaux eBooks pour Project Gutenberg
Corriger une seule page par jour peut déjà aider le projet
Via Fix and improve, il est possible de signaler des erreurs, bugs et fautes de frappe, et de proposer des modifications
Il est possible de participer à l’enregistrement de livres audio avec LibriVox

Livres audio

Les livres audio sont une autre manière d’apprécier la littérature, et toutes les ressources présentées ici sont des versions numérisées de textes de Project Gutenberg
Ces livres audio sont disponibles gratuitement et relèvent du domaine public aux États-Unis
Project Gutenberg’s 662 titles read by people : propose 662 titres lus par des personnes
Human-read audio books from LibriVox : propose des livres audio narrés produits par la communauté bénévole de LibriVox
The Project Gutenberg Open Audiobook Collection : comprend environ 5 000 titres générés par ordinateur, mis à disposition en 2023 par Project Gutenberg en collaboration avec Microsoft et le MIT
Project Gutenberg’s audio books from 2003 : livres audio générés par ordinateur datant de 2003, écoutables mais de qualité inférieure aux technologies actuelles

1 commentaires

GN⁺ 2026-05-16

Réactions sur Hacker News

Je suis l’un des programmeurs de Gutenberg. Nous avons beaucoup amélioré le site ces derniers mois, et d’autres changements sont prévus
Si vous n’y êtes pas allé récemment, ça vaut le coup d’y refaire un tour : https://www.gutenberg.org/
- Il serait intéressant d’envisager un historique de versions détaillé pour chaque livre, c’est-à-dire chaque texte électronique. L’envoi de corrections de coquilles se fait par e-mail (https://www.gutenberg.org/help/errata.html) ; quand je l’ai fait en 2011, les corrections avaient été intégrées en quelques jours, mais le processus m’avait paru assez opaque
  L’historique des versions pourrait aussi indiquer l’origine du texte électronique, souvent avec des informations sur des projets comme PGDP, afin de pouvoir le comparer aux scans des pages originales. J’ai des sentiments partagés à propos de Standard Ebooks et je préfère utiliser directement Project Gutenberg, mais Standard Ebooks a l’avantage d’avoir pour chaque livre un dépôt git sur GitHub, ce qui permet en principe de voir l’historique des modifications au fil du temps
- Quand je pensais à Project Gutenberg, j’avais en tête son brutalisme sans design d’origine, mais le site actuel a été mis à jour avec beaucoup de goût, et l’accessibilité semble toujours bonne même sans les styles
- Fait intéressant, le handshake TCP prend 4,5 secondes, et le handshake TLS 9,2 secondes de plus. La plupart des bots couperont avant, donc je me demande si ce n’est pas une sorte de captcha qui considère qu’une fois la connexion établie, on est un utilisateur légitime
  Jusqu’à ce que les bots s’adaptent, ça peut être une méthode relativement peu gênante, qui ne discrimine pas non plus les logiciels clients rares non basés sur Chrome/Chromium. Toutes les autres requêtes étaient très rapides
- Sur mobile, la liste des livres de la page d’accueil est rendue dans une div scrollable à la fois horizontalement et verticalement. Il y a sans doute matière à amélioration
- Vu le grand nombre de livres anciens, ce serait utile d’ajouter à la recherche une date de publication ou une plage de dates. Quand je fais des recherches, je cherche souvent des documents antérieurs à une année x, donc ce serait personnellement très pratique
J’ai découvert que si Project Gutenberg a beaucoup grandi avec l’essor et la démocratisation d’Internet depuis les années 1990, il a en réalité commencé en 1971
Michael S. Hart l’a lancé en numérisant la Déclaration d’indépendance des États-Unis. Étudiant à l’université de l’Illinois, Hart avait obtenu un accès au mainframe Xerox Sigma V du Materials Research Lab. Cette machine était l’un des 15 nœuds d’ARPANET, qui deviendra plus tard Internet, et Hart pensait qu’un jour le grand public aurait accès aux ordinateurs ; il a donc décidé de mettre gratuitement des œuvres littéraires à disposition sous forme électronique
https://en.wikipedia.org/wiki/Project_Gutenberg
- « Project Gutenberg a commencé en 1971 lorsque Michael Hart a reçu un compte opérateur contenant 100 millions de dollars de temps machine de la part des opérateurs du mainframe Xerox Sigma V du Materials Research Lab de l’université de l’Illinois »
  https://www.gutenberg.org/about/background/history_and_philo...
- Ce serait bien que les éditeurs de Wikipédia mettent cet article à jour
Offrir à mon père un Kindle et un point d’accès, puis lui apprendre à récupérer des livres sur Project Gutenberg, a été l’une des meilleures choses que j’aie faites pour lui
Mon père était un ancien marin vétéran de la guerre de Corée, titulaire du GED, mais il adorait les vieux textes au point d’avoir lu l’intégralité des Harvard Classics. Il restait assis dans son fauteuil préféré, avec une serviette roulée sur les genoux pour y caler son Kindle, et lisait encore et encore ; quand il est mort, il lisait l’édition de 1931 de « Legends of the Jews »
Dans les années 1990, j’ai eu quelques échanges d’e-mails avec Michael S. Hart et j’ai même apporté une petite contribution au projet, ce qui m’a donné beaucoup de fierté et de joie en tant qu’étudiant de premier cycle en littérature anglaise. Pour toutes ces raisons, Project Gutenberg a quelque chose de spécial pour moi, et ça me fait plaisir de voir qu’il continue à bien vivre
- Distributed Proofreaders, qui s’occupe de la transcription proprement dite, cherche toujours des bénévoles. Si cela vous tente, vous pouvez participer
  https://www.pgdp.net
Je suis surpris qu’aucun fabricant de liseuses n’ait intégré une « boutique » Project Gutenberg. Il suffirait de pouvoir parcourir Gutenberg, trouver un livre et le télécharger directement sur la liseuse, mais en pratique il y a des frictions, soit parce que l’appareil est activement hostile comme le Kindle, soit parce qu’il faut passer par Calibre
- Sur les liseuses avec navigateur, j’ai récupéré et lu des livres Project Gutenberg bien présentés via https://standardebooks.org/. Dans mon cas, c’était une Boox
  Techniquement, on peut aussi télécharger directement des epub depuis Project Gutenberg, mais la mise en forme laisse souvent à désirer. Une fois qu’on utilise une liseuse avec un OS à peu près exploitable — par exemple même un vieil appareil tournant sous Android de base — il devient difficile de revenir à un appareil comme le Kindle
- Si l’on ne retire pas la licence Project Gutenberg du texte du livre, autrement dit si l’on ne conserve pas uniquement le contenu du domaine public que personne ne conteste, il faut verser en redevance 20 % du bénéfice brut tiré de l’utilisation de l’œuvre Project Gutenberg-tm, calculé selon la méthode fiscale habituelle
  https://www.gutenberg.org/policy/license.html
  Aux débuts de l’iPhone, je vendais une application de lecture basée sur les textes de Project Gutenberg appelée « Eucalyptus », et j’envoyais 20 % du bénéfice brut à PG. PG a toujours été très favorable à cette application, et ça me semblait être la bonne chose à faire
- Comme la plupart exploitent leur propre boutique payante, ils ont une incitation perverse à ne pas proposer un espace riche en livres gratuits
- Autrefois, c’était un peu possible avec Project Librivox https://librivox.org/ et l’application de livres électroniques Gutebooks. Il y avait aussi une application audio, mais elle semble abandonnée aujourd’hui ; sur ma copie, elle ne se connecte plus au serveur
  Barnes & Noble utilise apparemment une société philippine de composition et de saisie pour moissonner le domaine public et l’ajouter à sa boutique, et Amazon semble avoir quelque chose de comparable dans le Kindle Store : https://www.amazon.com/Public-Domain-Books-Kindle-Store/s?k=...
  C’est assez regrettable que PG n’ait pas pris les devants pour y mettre ses livres et les monétiser
- J’ai entendu dire que les liseuses Kobo récentes ont un navigateur qui permet d’aller sur gutenberg.org et de télécharger directement les fichiers
  Mais globalement, je suis d’accord. Pouvoir accéder directement à une bibliothèque de 75 000 livres, c’est assez précieux
En Italie, https://www.gutenberg.org/ renvoie une 404, et https://gutenberg.org/ ouvre une page très officielle disant « police notice. This site is under judicial seizure » avec le numéro de dossier « criminal proceedings 52127/20 R.N.R.I. tribunal of Rome »
Je ne comprends pas ce qui se passe. Je pensais que PG publiait des livres du domaine public
- En cherchant, il semble qu’il s’agisse d’un jugement de 2020 et que PG ait décidé de ne pas faire appel
  Toute l’histoire, en italien, est ici : https://www.wired.it/internet/web/2020/06/30/progetto-gutenb...
- L’accès a aussi été bloqué pendant un temps en Allemagne à cause d’une décision de justice : https://cand.pglaf.org/germany/index.html
- J’ai demandé à Claude d’examiner le contexte ; il dit qu’en mai 2020, un tribunal de Rome a ordonné aux FAI italiens de saisir et bloquer une liste de domaines dans le cadre d’une affaire pénale visant des sites et des canaux Telegram distribuant des journaux et magazines piratés, et que Project Gutenberg figurait dans cette liste de 28 domaines aux côtés de vrais sites pirates
  La situation ne semble toujours pas résolue
Ça fait plaisir de voir autant de bienveillance pour ce que nous faisons. Je suis le directeur exécutif relativement nouveau
Si des éditeurs de Wikipédia passent par ici, l’article sur PG est assez daté. La dernière fois que j’ai regardé, il disait encore qu’on proposait des fichiers Plucker, et @Jseiko a fait du bon travail
Project Gutenberg est un trésor, mais il y a beaucoup de détails techniques qui compliquent la composition automatisée des livres. Standard Ebooks pousse la cohérence à un niveau presque difficile à croire
J’ai écrit un billet comparant plusieurs sources de livres du domaine public du point de vue de la composition typographique : https://dave.autonoma.ca/blog/2020/04/11/project-gutenberg-p...
Il faut aussi mentionner Project Gutenberg ZIM. On peut télécharger l’ensemble du corpus Gutenberg en anglais pour environ 60 Go
À titre de comparaison, l’intégralité du ZIM de Wikipédia en anglais avec images fait environ 120 Go : https://ebookfoundation.org/openzim.html
J’ai toujours eu un peu de mal avec Project Gutenberg à cause de son tropisme texte brut. Ça fait plus de dix ans que je n’ai pas vraiment exploré le site, donc il est très possible que mon impression soit dépassée
J’aime les livres avec une vraie mise en forme, et je préfère les PDF. J’apprécie l’idée de Project Gutenberg, mais j’ai toujours davantage aimé les scans de livres sur archive.org. Par exemple, « Through the Looking Glass » de Lewis Carroll a les superbes illustrations de John Tenniel et la mise en page inventive propre à Carroll
Je vois maintenant qu’il y a aussi des ePub sur Project Gutenberg ; si c’est bien fait, ça peut être très bien. Si c’est mal fait, ça peut devenir un chaos mêlant « HTML » reflowable et sauts de page, et quiconque a déjà imprimé une longue page web voit le genre de résultat que ça donne. Bien sûr, cela peut aussi venir de la liseuse ePub
- Nous prenons en charge EPUB3 pour la plupart des livres. En même temps, nous proposons aussi une version « Plain Text » pour chaque livre, car c’est dans un certain sens le format le plus robuste. Le PDF est également en préparation
- Comme d’autres l’ont dit ici, https://standardebooks.org/ est excellent. Si j’ai bien compris, ils utilisent les livres de Gutenberg comme base, mais les retravaillent bien mieux
- J’aime beaucoup pouvoir mettre en favori la version HTML de Project Gutenberg et reprendre ma lecture sur plusieurs appareils sans avoir à me connecter
  J’utilise beaucoup les fonctions intégrées du navigateur pour améliorer l’expérience de lecture : polices, arrière-plan, synthèse vocale, mise en page pour l’impression, partage d’extraits, etc. Avec les PDF, epub ou autres formats, cette expérience n’est pas aussi bonne. J’ai lu davantage de textes de manière significative sur PG que sur toute autre plateforme numérique, et j’apprécie que ce soit propre et gratuit
- Ça vaut le coup de jeter un œil à Standard eBooks. Ils reprennent les textes de Gutenberg et améliorent la qualité des ePub
- À l’inverse, moi je préfère l’epub pour les romans. Je lis surtout sur téléphone
Il semble que le livre le plus téléchargé hier[0] ait été Concrete Construction: Methods and Costs de Gillette et Hill[1], devant Moby Dick, Le Comte de Monte-Cristo, Frankenstein et Roméo et Juliette
Le total sur les 30 derniers jours serait de 23 644 téléchargements. Je me demande si c’est un comportement de bot ; 23 000 me paraît vraiment élevé
[0] https://www.gutenberg.org/browse/scores/top
[1] https://www.gutenberg.org/ebooks/24855
- C’est évidemment à cause de l’arrivée imminente du film passionnant sur le béton, « The History of Concrete » de John Wilson : les fans hardcore révisent avant la sortie
- Je pense aussi qu’il s’agit très probablement de trafic de bots. Il ne me semble pas plausible qu’il y ait soudainement un intérêt mondial massif pour « Concrete Construction Methods »
- Il a aussi une meilleure note sur Goodreads que Moby Dick. On dirait que mon prochain livre est tout trouvé

Project Gutenberg continue de s’améliorer

Trouver des eBooks gratuits

Conditions d’utilisation et nature du projet

Comment participer

Livres audio

À lire aussi

1 commentaires

Réactions sur Hacker News