9 points par xguru 2020-05-12 | 3 commentaires | Partager sur WhatsApp
  • Capture du trafic réseau du navigateur, et non par crawling

→ permet de capturer, même en étant connecté, tous les fichiers multimédias ainsi que le JavaScript complexe et les contenus dynamiques

  • Enregistrement au format standard WARC, avec possibilité de relecture interactive plus tard

  • Automatisation de la capture de sites web connus avec AutoPilot

  • Version en ligne et exécutable de bureau en Electron / lecteur disponibles (Windows/Mac/Linux)

3 commentaires

 
galadbran 2020-05-13

Waouh, je ne savais même pas qu'il existait aussi un standard pour ça... Mais si c'est basé sur le réseau, il y a une prise en charge de SSL ?

 
kunggom 2020-05-12

Tiens, je ne savais même pas qu’il existait une norme standard pour ça ?

Je crois me souvenir qu’une fonction similaire avait été ajoutée autrefois aux outils de développement de Firefox, mais le problème, c’est que sur mon MacBook c’était tellement lent que c’en était franchement difficile à utiliser. Et la taille des fichiers était vraiment énorme. Je ne sais pas si celui-ci fera mieux.

 
xguru 2020-05-12

Sur Instagram, si l’on applique AutoPilot, l’outil fait défiler automatiquement la page et capture à la chaîne le fil utilisateur.

Ce n’est pas parfaitement adapté aux pages à défilement infini, donc Facebook, qui a été modifié cette fois-ci, se capture assez mal.

Standard WARC https://iipc.github.io/warc-specifications/