shiitman - Восстановление блогов из кэша яндекса
[Recent Entries][Archive][Friends][User Info]
01:16 pm
[Link] |
Восстановление блогов из кэша яндекса
Исходная запись на shiitman.net
Удивительно, что никто не сделал это раньше:
http://shiitman.net/yandexcache
Утилита в автоматическом режиме вытаскивает из кэша удалённые журналы, делает удобное оглавление и даёт на выходе архив содержащий все проиндексированные яндексом посты.
Создавалось ради сообщества ru_horrorpunk, умучанного копирастами, но вполне может быть полезно и для других удалённых/засуспендженных блогов или сообществ.
Ссылки приветствуются.
Если будет пользоваться спросом - приделаю восстановление комментариев.
upd. Был небольшой баг при вводе полного имени журнала/сообщества (например: http://username.livejournal.com вместо username). Исправлено.
|
|
| |
вот комментарии было бы круто, посты можно и напрямую в кеше яндекса читать
Да!!!! Да!!!! Да!!!!!!!!!!!!!! ru_apokalipsis
а по какой методике они кэш трут?
Я ниже исправился, апокалипскульт не потёрт. По какому принципу трут - не знаю, но иногда блоги и сообщества оттуда пропадают. mertvie_russkie, например.
МР потерли, так как основателем там был мученически засупленный оккам сообщество вместе с ним злопнули
А утилитой jbackup засуспенженые сообщества точно нельзя восстановить? Там есть такая опция:
--journal=X Specify an alternate journal to use.
NOTE: You must be maintainer of the journal.
Сам пробовал только на живых сообществах.
круто-круто, а с удаленными пользователем постами работает?
Если они проиндексированы яндексом, то да.
тоесть и с неубитых журналов можно снимать? да, это хорошо.
Ну да, но если надо выловить какой-то определённый пост, это проще сделать вручную.
С восстановлением комментариев было бы круто!
Ну я не сильно вкуривал в тему, подозреваю, что можно сделать, для восстановления англоязычных сообществ, например. http://scrapy.org/Вот, кстати, тебе разработка в тему. Выдирание любой инфы из любых сайтов. Наша контора писала.
А как вообще этот кеш работает? Все про него говорят, а я себя прям неполноценным чувствую...
Замечательно. Вытянул давным-давно удаленный журнал, а из него и нужный мне пост, который тщетно пытался восстановить по памяти.
Как долго там инфа с удалённых блогов хранится интересно. витро
классная и полезная штука, не хватает сортировки постов по дате. я так понимаю, они идут в том же порядке, что вытаскиваются из кэша яндекса, но он не всегда соответствует хронологическому. |
|