info:httrack

httrack

Depuis un moment je n'utilise plus trop wget mais httrack pour archiver des sites en HTML statique.

script bash

Un petit script tout en un. Commencer par créer le répertoire et s'y rendre puis:

echo "Archiver un site"
echo "Entrer l'url du site"
read url
httrack -I0 --sockets=2 --keep-alive --cookies=0 -n -N4 -%P $url
echo "Finished!"

Old

 httrack http://LOCAL_URI -O . -N "%h%p/%n/index%[page].%t" -cWqQ%v --robots=0

puis

 find . -name "*.html" -type f -print0 |   xargs -0 perl -i -pe "s/\/index.html/\//g"

source: cet excellent article sur un archivage drupal, https://www.lullabot.com/articles/sending-a-drupal-site-into-retirement

  • info/httrack.txt
  • Dernière modification: 2021/11/18 06:53
  • de radeff