WebRecorder - outil open source d’enregistrement de pages web
(webrecorder.io)- Capture du trafic réseau du navigateur, et non par crawling
→ permet de capturer, même en étant connecté, tous les fichiers multimédias ainsi que le JavaScript complexe et les contenus dynamiques
-
Enregistrement au format standard WARC, avec possibilité de relecture interactive plus tard
-
Automatisation de la capture de sites web connus avec AutoPilot
-
Version en ligne et exécutable de bureau en Electron / lecteur disponibles (Windows/Mac/Linux)
3 commentaires
Waouh, je ne savais même pas qu'il existait aussi un standard pour ça... Mais si c'est basé sur le réseau, il y a une prise en charge de SSL ?
Tiens, je ne savais même pas qu’il existait une norme standard pour ça ?
Je crois me souvenir qu’une fonction similaire avait été ajoutée autrefois aux outils de développement de Firefox, mais le problème, c’est que sur mon MacBook c’était tellement lent que c’en était franchement difficile à utiliser. Et la taille des fichiers était vraiment énorme. Je ne sais pas si celui-ci fera mieux.
Sur Instagram, si l’on applique AutoPilot, l’outil fait défiler automatiquement la page et capture à la chaîne le fil utilisateur.
Ce n’est pas parfaitement adapté aux pages à défilement infini, donc Facebook, qui a été modifié cette fois-ci, se capture assez mal.
Standard WARC https://iipc.github.io/warc-specifications/