Je suis parvenu à sauver environ les 2/3 de mon ancienne partie 30 (Orques), c'est un travail de fourmi et de longue haleine.
La "feuille de route" pour faire une sauvegarde partielle :
1) Retrouver les liens vers les pages. Plusieurs solutions :
A) utiliser les caches des moteurs de recherches moins "actifs" que Google. Bing,
https://ixquick.com, … et faire un recherche de mots-clés
B) descendre l'arborescence de la web archive - dont on peut supposer qu'elle durera plus longtemps que le cache google
(Note : je n'ai pas essayé httrack sur la web archive, mais c'est un soft utile pour pomper directement du contenu web. Il viole au passage un certain nombre de conditions d'utilisation et ne marche pas sur le cache de google)
2) retrouver le lien dans le cache Google. Plusieurs choses à savoir néanmoins AVANT de se lancer en masse dans l'opération
- Google BLOQUE les tentatives répétées d'accès au cache (message : Nos systèmes ont détecté un trafic exceptionnel sur votre réseau informatique) après 31 essais (nombre déterminé empiriquement). Il faut donc se limiter à 31 essais afin de ne pas alerter la sécurité informatique de Google, ce qui ne ferait qu'accélérer la disparition d'Aidedd.
- Une fois les 31 essais tentés : il faut changer d'adresse IP. Pour connaitre son adresse, il y a tout un tas d'utilitaires, par ex :
http://www.mon-ip.com. Pour changer d'adresse IP, ça dépend de votre opérateur, chez certains, rebouter votre "truc-box" suffit, chez d'autres (free) non. Il est possible qu'attendre (24H ?) suffise, mais ce n'est pas notre intérêt de multiplier les messages d'alerte sécurité.
- l'accès au cache Google :
http://www.cachedpages.com est bien pratique, sinon ça peut se faire aussi en tapant directement l'adresse du cache. Pour avoir la page, j'ai du à chaque fois me mettre en mode "texte seul", j'imagine que c'est parce que les liens de la page en cache pointent tous sur du vide. Wget ne marche pas
3) Trucs et astuces pour accéder au contenu sur le cache Google
- En général, les pages 1 et dernière des fils de discussion ont disparu. Pour accéder aux pages intermédiaires, il faut demander
http://www.aidedd.org/mon-fofo/monsujet-txxx-12.html ou remplacer 12 par 24, 36, … pour les pages 3,4,…
- Le cache Google semble être est vidé d'autant plus rapidement (erreur 404) que la page a été beaucoup liée :/
- Les pages que j'ai sauvées datent environ de la mi septembre, avec quelques pages qui datent de début août. J'en déduis que la mise à jour se fait environ toutes les 6 semaines, et par paquet. On doit donc être pas loin de la disparition quasi-complète du site.
J'en conclus que le temps joue fortement contre nous, et qu'il faut a priori se concentrer sur les "must" du site - à définir.