Войти в систему

Home
    - Создать дневник
    - Написать в дневник
       - Подробный режим

LJ.Rossia.org
    - Новости сайта
    - Общие настройки
    - Sitemap
    - Оплата
    - ljr-fif

Редактировать...
    - Настройки
    - Список друзей
    - Дневник
    - Картинки
    - Пароль
    - Вид дневника

Сообщества

Настроить S2

Помощь
    - Забыли пароль?
    - FAQ
    - Тех. поддержка



Пишет rusec ([info]rusec)
@ 2007-08-01 18:37:00


Previous Entry  Add to memories!  Tell a Friend!  Next Entry
Итоги за первый месяц

Взято c Либрусека. Комментарии приветствуются.

Результаты за июль:

Всего книг в библиотеке: 88162, из них fb2: 76546 (подробности - http://lib.rus.ec/stat/).

Думается, процентов 20 из этого - дубли, подлежащие поиску и искоренению. Но мы работаем над этим.


Посетители - 11 тысяч, из них 6500 уникальных, не считая роботов.

В начале месяца - 150-200 в день, в конце - 500-700.

Страны: почти половина США, на втором месте РФ, остальные ~70 по чуть-чуть (по данным geoip).

Браузеры: MS Internet Explorer 38.4%, Firefox 33.7%, Opera 15.9%


Два автора прислали авторские версии.


Благодаря Orphus исправлено 8 опечаток на сайте.


13 пользователей принимают участие в исправлении ошибок в базе. Ими уже сделано 482 исправления.


Планы на август:

Доразобрать несколько тысяч выкаченных, но пока не выложенных книжек.

Разобраться с зеркалом book-lib (book.lib.rus.ec), сделать по нему навигацию и поиск.

Сделать исправление опечаток в книгах.



(Читать комментарии) - (Добавить комментарий)


[info]rusec@lj
2007-08-04 00:34 (ссылка)
База есть, ты же мне вливал csv.
Загнать его в mysql - ровно одна команда.
Запишу себе для памяти, вдруг еще понадобится:
mysqlimport -u %user --password=%pass -L -v --default-character-set=cp1251 --ignore-lines=1 --fields-terminated-by=';' --fields-optionally-enclosed-by='"' --fields-escaped-by='~' %database booklib.cvs
По твоей базе поиск я сделал - http://lib.rus.ec/booklib (http://lib.rus.ec/booklib).
Там 90% возьни было не с базой, а с iso, которые мне на хостинге открыть нечем. Пришлось писать бродилку наколенную. Но вроде заработало.
Теперь вопрос - в обновлениях csv такой же или другой?
И не мог бы ты залить дополнения базы до фактического наличия? Ты как-то лучше в буклибе ориентируешься.
А там уже посмотрим, как обновляться.

(Ответить) (Уровень выше) (Ветвь дискуссии)


(Анонимно)
2007-08-04 03:12 (ссылка)
=============База есть, ты же мне вливал csv
это листинг базы, в котором все таблицы сведены в одну таблицу. за мелкими исключениями.
=============Пришлось писать бродилку наколенную. Но вроде заработало.
посмотрел - супер. Я даже не знал, что можно без разворачивания вовнутрях копаться. Такой навигации достаточно вполне.
=============Теперь вопрос - в обновлениях csv такой же или другой?
не такой. там отдельные csv по каждой таблице. Ну и используются индексы, например, в списке файлов вместо автора его идекс и т.д - вобчем, как положено в базе.

подумаю, как это можно сделать. в конце концов пока что можно просто новый листинг присылать да хоть раз в месяц. Ничего страшного.
==============И не мог бы ты залить дополнения базы до фактического наличия?
у меня проблемы - не могу фар настроить чтоб работал с проксей, плагин почему-то список файлов на сервере не показывает. Пока борюсь.

А вообще-то закачку автоматом сделать просто. Это даже я смог :)
Общий алгоритм такой
1. закачиваем описание обновления - выше ссылка где они лежат.
2. вытаскиваем оттуда catalog.xxx
3. берем оттуда имена файлов и проверям их наличие в имеющемся архиве. Если размеры различаются (в этом файле могут быть новые файлы, обновления существующих и обновления только описания базы для файла), то заносим этот файл в список закачки.
4. запускаем закачку для списка серверов, где лежат файлы. Ну у меня в скриптах еще есть предварительная закачка списка чего лежит на сервере и выбор из общего списка закачки только то, что там есть. Но да это можно и не делать. Экономии трафика практически не дает.
5. если это делать через 2 недели после появления файла обновления, то все файлы уже будут на серверах и будут закачаны за один раз.

Ну или могу договориться, чтобы Фил залил. Но это когда у него будет время.

(Ответить) (Уровень выше)


(Анонимно)
2007-08-04 03:57 (ссылка)
===========================База есть, ты же мне вливал csv
влил новый рядом со старым. (маленькие файлы я вливать умею - через диалапное подключение без прокси). Только надо иметь в виду, что там есть порядка 2500 книжек, которых реально пока еще нету на выложенном зеркале. Сейчас на отсуствующие выдает ошибку 500 Server Error

Ну и может имеет смысл и этот список выложить на зеркало?

(Ответить) (Уровень выше) (Ветвь дискуссии)


[info]rusec@lj
2007-08-04 18:02 (ссылка)
Значит, докачаю недостающие. Как я понял, от 115 и дальше?
Список выложил.

(Ответить) (Уровень выше) (Ветвь дискуссии)


(Анонимно)
2007-08-05 01:17 (ссылка)
да. всего пока 130.

(Ответить) (Уровень выше)


(Читать комментарии) -