Дмитрий Беломестнов
Что случилось с Интернет-архивом? 
4th-Sep-2017 06:34 pm
Что случилось с Интернет-архивом?

Он пишет, что есть 5 копий политического доноса "Пятая колонна - Запомнить эти "лица"":
http://web.archive.org/web/*/http://zavtra.ru:80/content/view/pyataya-kolonna-zapomnit-eti-litsa

Но при попытке открыть копии 2015 года перебрасывает сюда:
http://web.archive.org/web/20161031045626/http://zavtra.ru:80/content/view/pyataya-kolonna-zapomnit-eti-litsa/

А там уже искомого материала нет:
"The server returned a "404 Not Found".
Something is broken. Please e-mail us at [email] and let us know what you were doing when this error occurred. We will fix it as soon as possible. Sorry for any inconvenience caused".

И еще у меня есть закладка:
http://web.archive.org/web/20080617092727/http://www.memo98.cjes.ru/?sm2=on
Но открывается страница с надписью:
"Page cannot be displayed due to robots.txt".
Точно не помню, но раз я сделал эту закладку, значит, видимо, там была копия искомой страницы.

У кого-то есть комментарии?
Comments 
5th-Sep-2017 10:46 am
Это легко объяснить.
Вебархив устроен так, что владелец сайта может скрыть любой материал отредактировав robots.txt у себя.
5th-Sep-2017 04:01 pm
Странно.

Почему же тогда там можно было найти многие материалы, которые владельцам сайтов явно хотелось бы задним числом уничтожить?
И потом: разве Интернет-архив обновляет копии?
Ведь там хранится немало копий материалов, недоступных уже много лет, их-то обновить нельзя.

А при попытке открыть копию политического доноса robots.txt не упоминаются, просто перебрасывают на другой адрес.
6th-Sep-2017 08:57 pm
>Почему же тогда там можно было найти многие материалы,
>которые владельцам сайтов явно хотелось бы задним числом уничтожить?

потому что про это свойство archive.org не всем известно
6th-Sep-2017 09:18 pm
Спасибо.
Но все-таки если сайта больше нет, то robots.txt менять уже негде, правильно?

А что насчет копии политического доноса в "Завтра" - там просто перебрасывает на другой адрес и robots.txt не фигурируют?
This page was loaded May 1st 2024, 7:11 pm GMT.