Добавил художественной литературы
Взято c Либрусека. Комментарии приветствуются.
Добавил пару десятков тысяч книжек.
Итого получилось около 20 тысяч авторов, 80 тысяч книг, 22G fb2 и 65G pdf/djvu.
Среди этого наверняка много дублей - где-то автора неправильно обозвали, где-то название чуть иначе написано.
Такие тонкости робот не ловит.
Кто чего заметит убедительно прошу сообщить. Сам я такой объем до пенсии не проработаю. А совместными усилиями - глядишь, и справимся.
P.S. Кто-то, смотрю, уже wget-ом тянет всё подряд. Я не против, тяните, только лучше бы чуть попозже. Структура еще не устаканилась, каталоги будут переименовываться, книги массово добавляться. Потом придется перевытягивать.
И зачем брать обе версии - fb2.zip и html? Они похожи. Если надо, могу к зипам ftp-доступ организовать. Или еще чего придумать интересного, типа списка файлов для wget-a по какому-нибудь критерию. По автору/жанру/типу/формату/еще как. Думайте. А то выкачивать почти сотню гиг без разбора как-то глупо, на мой взгляд. Извините. А если хотите зеркало организовывать - надо договариваться о репликации базы. Без этого неудобно получится, не во всех файлах метаинформация есть. Разгребать замучаетесь. И, опять же, чуть позже. Как из пре-беты выйду.