shiitman - Восстановление блогов из кэша яндекса
February 27th, 2009
01:16 pm

[Link]

Previous Entry Add to Memories Tell A Friend Next Entry
Восстановление блогов из кэша яндекса

Исходная запись на shiitman.net


Удивительно, что никто не сделал это раньше:

http://shiitman.net/yandexcache


Утилита в автоматическом режиме вытаскивает из кэша удалённые журналы, делает удобное оглавление и даёт на выходе архив содержащий все проиндексированные яндексом посты.

Создавалось ради сообщества ru_horrorpunk, умучанного копирастами, но вполне может быть полезно и для других удалённых/засуспендженных блогов или сообществ.


Ссылки приветствуются.

Если будет пользоваться спросом - приделаю восстановление комментариев.


upd. Был небольшой баг при вводе полного имени журнала/сообщества (например: http://username.livejournal.com вместо username). Исправлено.

(27 комментариев | Оставить комментарий)

Comments
 
[User Picture]
From:[info]kvasimodo@lj
Date:February 27th, 2009 - 07:26 am
(Link)
вот комментарии было бы круто, посты можно и напрямую в кеше яндекса читать
[User Picture]
From:[info]pamupe_cc@lj
Date:February 27th, 2009 - 07:50 am
(Link)
Да!!!! Да!!!! Да!!!!!!!!!!!!!!
ru_apokalipsis
[User Picture]
From:[info]shiitman@lj
Date:February 27th, 2009 - 08:29 am
(Link)
From:[info]ext_164957@lj
Date:February 27th, 2009 - 12:20 pm
(Link)
а по какой методике они кэш трут?
[User Picture]
From:[info]shiitman@lj
Date:February 28th, 2009 - 05:16 am
(Link)
Я ниже исправился, апокалипскульт не потёрт.
По какому принципу трут - не знаю, но иногда блоги и сообщества оттуда пропадают.
mertvie_russkie, например.
[User Picture]
From:[info]center_gvardiya@lj
Date:March 16th, 2009 - 07:58 am
(Link)
МР потерли, так как основателем там был мученически засупленный оккам
сообщество вместе с ним злопнули
[User Picture]
From:[info]shiitman@lj
Date:February 27th, 2009 - 08:32 am
(Link)
[User Picture]
From:[info]kolen@lj
Date:February 28th, 2009 - 11:06 am
(Link)
А утилитой jbackup засуспенженые сообщества точно нельзя восстановить?

Там есть такая опция:
    --journal=X     Specify an alternate journal to use.                                                                                                                           
                    NOTE: You must be maintainer of the journal.                                                                                                                   


Сам пробовал только на живых сообществах.
[User Picture]
From:[info]shiitman@lj
Date:February 28th, 2009 - 11:16 am
(Link)
Не пробовал никогда.
[User Picture]
From:[info]net_kot@lj
Date:February 27th, 2009 - 08:49 am
(Link)
круто-круто, а с удаленными пользователем постами работает?
[User Picture]
From:[info]shiitman@lj
Date:February 27th, 2009 - 10:12 am
(Link)
Если они проиндексированы яндексом, то да.
[User Picture]
From:[info]net_kot@lj
Date:February 27th, 2009 - 10:18 am
(Link)
тоесть и с неубитых журналов можно снимать? да, это хорошо.
[User Picture]
From:[info]shiitman@lj
Date:February 27th, 2009 - 10:29 am
(Link)
Ну да, но если надо выловить какой-то определённый пост, это проще сделать вручную.
[User Picture]
From:[info]cyxymu@lj
Date:February 27th, 2009 - 09:50 am
(Link)
хорошая вещь
[User Picture]
From:[info]labas@lj
Date:February 27th, 2009 - 11:03 am
(Link)
С восстановлением комментариев было бы круто!
[User Picture]
From:[info]decil@lj
Date:February 27th, 2009 - 11:08 am
(Link)
А из кэшей гугля?
[User Picture]
From:[info]shiitman@lj
Date:February 28th, 2009 - 05:08 am
(Link)
А есть смысл думаешь?
[User Picture]
From:[info]decil@lj
Date:March 1st, 2009 - 04:37 pm
(Link)
Ну я не сильно вкуривал в тему, подозреваю, что можно сделать, для восстановления англоязычных сообществ, например.

http://scrapy.org/
Вот, кстати, тебе разработка в тему. Выдирание любой инфы из любых сайтов. Наша контора писала.
[User Picture]
From:[info]piligrim@lj
Date:February 27th, 2009 - 12:18 pm
(Link)
Спасибо!
[User Picture]
From:[info]asativum@lj
Date:February 27th, 2009 - 12:41 pm
(Link)
а опенсорс?
[User Picture]
From:[info]blacaman@lj
Date:February 27th, 2009 - 01:07 pm
(Link)
дорогие блоггеры
звучит!
From:[info]david_gor@lj
Date:February 27th, 2009 - 07:13 pm
(Link)
Спасибо.
[User Picture]
From:[info]adhal@lj
Date:February 27th, 2009 - 07:29 pm
(Link)
А как вообще этот кеш работает? Все про него говорят, а я себя прям неполноценным чувствую...
[User Picture]
From:[info]vital_x@lj
Date:February 28th, 2009 - 11:43 am
(Link)
Замечательно. Вытянул давным-давно удаленный журнал, а из него и нужный мне пост, который тщетно пытался восстановить по памяти.
From:[info]sisonc@lj
Date:March 1st, 2009 - 02:10 pm

Привет!!

(Link)
Интересует статистика запросов яндекса? На данном сайте много полезной информации, недавно нашел- советую. Может уже есть статистика и по вашему сайту-
http://shiitman.livejournal.com.
From:[info]blindspro@lj
Date:March 6th, 2009 - 05:50 pm
(Link)
Как долго там инфа с удалённых блогов хранится интересно.
витро
From:[info]katty_kat@lj
Date:March 24th, 2009 - 06:56 am
(Link)
классная и полезная штука, не хватает сортировки постов по дате.
я так понимаю, они идут в том же порядке, что вытаскиваются из кэша яндекса, но он не всегда соответствует хронологическому.
Powered by LJ.Rossia.org