Войти в систему

Home
    - Создать дневник
    - Написать в дневник
       - Подробный режим

LJ.Rossia.org
    - Новости сайта
    - Общие настройки
    - Sitemap
    - Оплата
    - ljr-fif

Редактировать...
    - Настройки
    - Список друзей
    - Дневник
    - Картинки
    - Пароль
    - Вид дневника

Сообщества

Настроить S2

Помощь
    - Забыли пароль?
    - FAQ
    - Тех. поддержка



Пишет rusec ([info]rusec)
@ 2007-06-28 23:48:00


Previous Entry  Add to memories!  Tell a Friend!  Next Entry
Добавил художественной литературы

Взято c Либрусека. Комментарии приветствуются.

Добавил пару десятков тысяч книжек.

Итого получилось около 20 тысяч авторов, 80 тысяч книг, 22G fb2 и 65G pdf/djvu.

Среди этого наверняка много дублей - где-то автора неправильно обозвали, где-то название чуть иначе написано.

Такие тонкости робот не ловит.

Кто чего заметит убедительно прошу сообщить. Сам я такой объем до пенсии не проработаю. А совместными усилиями - глядишь, и справимся.


P.S. Кто-то, смотрю, уже wget-ом тянет всё подряд. Я не против, тяните, только лучше бы чуть попозже. Структура еще не устаканилась, каталоги будут переименовываться, книги массово добавляться. Потом придется перевытягивать.

И зачем брать обе версии - fb2.zip и html? Они похожи. Если надо, могу к зипам ftp-доступ организовать. Или еще чего придумать интересного, типа списка файлов для wget-a по какому-нибудь критерию. По автору/жанру/типу/формату/еще как. Думайте. А то выкачивать почти сотню гиг без разбора как-то глупо, на мой взгляд. Извините. А если хотите зеркало организовывать - надо договариваться о репликации базы. Без этого неудобно получится, не во всех файлах метаинформация есть. Разгребать замучаетесь. И, опять же, чуть позже. Как из пре-беты выйду.