9 points par xguru 2021-07-13 | 4 commentaires | Partager sur WhatsApp
  • Open source permettant de télécharger tout ou partie d’un site web à partir des archives de l’Internet Archive Wayback Machine

  • Télécharge les fichiers récents d’un site, l’ensemble des fichiers par date, ou les fichiers d’une plage de dates précise (from ~ to) en conservant la structure des répertoires

  • Génère automatiquement une page index.html utilisable avec Apache/Nginx

  • Télécharge la version originale, et non la version modifiée par Wayback Machine

  • Avec l’option --list, permet d’enregistrer uniquement les URL au format JSON sans effectuer de téléchargement

  • Open source en Ruby

4 commentaires

 
ffdd270 2021-07-13

J’aimerais créer un service local de type Wayback Machine… mais je dois d’abord faire le tri dans le projet sur lequel je travaille en ce moment =m=… c’est dommage.

Wayback Machine a des images cassées / une UI médiocre (... ) / et Pocket, de son côté, ne sauvegarde pas la page mais l’article d’origine, avec en plus des sites où l’enregistrement ne fonctionne pas. J’aimerais faire un projet open source qui recadre la page puis l’enregistre sur la machine locale de l’utilisateur ou à distance, affiche joliment sous forme de liste, comme Pocket, les pages sauvegardées jusqu’à présent, puis ouvre la page archivée quand on clique dessus.

 
lineaa 2021-07-14

Il semble que, pour les images, cela fonctionne parfois correctement seulement si l’on coche l’option Save outlinks lors de l’enregistrement.

J’attends de voir… haha

 
xguru 2021-07-14

Moi aussi, j’attendrai.

Et en plus… si vous pouviez aussi bien sauvegarder les sites faits avec React… ho ho ho

 
galadbran 2021-07-13

J’attendrai, hihihi