Téléchargeur Wayback Machine
(github.com)-
Open source permettant de télécharger tout ou partie d’un site web à partir des archives de l’Internet Archive Wayback Machine
-
Télécharge les fichiers récents d’un site, l’ensemble des fichiers par date, ou les fichiers d’une plage de dates précise (
from ~ to) en conservant la structure des répertoires -
Génère automatiquement une page
index.htmlutilisable avec Apache/Nginx -
Télécharge la version originale, et non la version modifiée par Wayback Machine
-
Avec l’option
--list, permet d’enregistrer uniquement les URL au format JSON sans effectuer de téléchargement -
Open source en Ruby
4 commentaires
J’aimerais créer un service local de type Wayback Machine… mais je dois d’abord faire le tri dans le projet sur lequel je travaille en ce moment =m=… c’est dommage.
Wayback Machine a des images cassées / une UI médiocre (... ) / et Pocket, de son côté, ne sauvegarde pas la page mais l’article d’origine, avec en plus des sites où l’enregistrement ne fonctionne pas. J’aimerais faire un projet open source qui recadre la page puis l’enregistre sur la machine locale de l’utilisateur ou à distance, affiche joliment sous forme de liste, comme Pocket, les pages sauvegardées jusqu’à présent, puis ouvre la page archivée quand on clique dessus.
Il semble que, pour les images, cela fonctionne parfois correctement seulement si l’on coche l’option Save outlinks lors de l’enregistrement.
J’attends de voir… haha
Moi aussi, j’attendrai.
Et en plus… si vous pouviez aussi bien sauvegarder les sites faits avec React… ho ho ho
J’attendrai, hihihi