Войти в систему

Home
    - Создать дневник
    - Написать в дневник
       - Подробный режим

LJ.Rossia.org
    - Новости сайта
    - Общие настройки
    - Sitemap
    - Оплата
    - ljr-fif

Редактировать...
    - Настройки
    - Список друзей
    - Дневник
    - Картинки
    - Пароль
    - Вид дневника

Сообщества

Настроить S2

Помощь
    - Забыли пароль?
    - FAQ
    - Тех. поддержка



Пишет r_l ([info]r_l)
@ 2009-10-21 21:31:00


Previous Entry  Add to memories!  Tell a Friend!  Next Entry
Спасибо добродетельному Д. Полонскому!

Ссылка на всякие важные в нашем деле pdf-ы из гугла, сохраненные, впрочем, на известной помойке и без исходных линков на gbooks.

Авторы коллекции полагают, видимо, что рапидшара протянет дольше гуголя.

Хихи, как говорится.


(Читать комментарии) - (Добавить комментарий)


[info]dp
2009-10-22 15:27 (ссылка)
Дело в том, что основатель всей этой затеи на Археологии.ру, достойнейший человек с ником Bewerr, не просто чохом перезаливает файлы на рапидшару. Как правило, все файлы проходят просмотр на предмет наличия дублированных страниц, для сокращения веса удаляются черные страницы обложек, а если на gbooks есть дубль файла, то выбирается лучший по степени читабельности вариант. В каких-то случаях Bewerr делал комбинированный файл, поскольку нередки случаи, когда две или три е-копии, выложенные на gbooks, содержат битые страницы, причем в разных местах файла. Вообще, Bewerr - известный подвижник в деле OCR дореволюционных книг по истории, cам оцифровал десятки редких книг, они тоже включены в этот каталог - в т.ч. такие, которых нет на gbooks. Кроме того, с лета сего года, когда Ленинка открыла часть своей электронной коллекции, в этот каталог на Археологии включаются и книги оттуда: большинство из того, что лежит на сайте Ленинки, зачем-то отсканировано в полноцвете, с высоким разрешением и весит сотни мегов, а тут файлы переведены в ч/б вид и ужаты до двух-пяти десятков мегов без потери читабельности.
Мы уже помним, как Ленинка закрывала доступ к своим ранее выложенным старым книжкам на orel, так что такое pdf-редактирование и перезаливка - по-моему, весьма полезное дело. Я сам сталкивался с тем, что некоторые книги 19-го века, ранее выложенные на gbooks, потом снимались оттуда, и если бы не каталог на Археологии - пиши пропало.
А архив.орг, который представляет собой, увы, некаталогизированную свалку с теми же кривыми возможностями поиска адским транслитом, что и на gbooks, никак не замена этому каталогу на Археологии - ни по полноте, ни по поисковым возможностям.

(Ответить) (Ветвь дискуссии)


[info]r_l
2009-10-22 16:09 (ссылка)
Ага, спасибо за разъяснение.
Я, скорее, к тому, что rapidshare - последнее место, на которое я бы положился.

(Ответить) (Уровень выше) (Ветвь дискуссии)


[info]dp
2009-10-22 16:36 (ссылка)
Да, так и есть, к сожалению. Просто не было другого пристанища, поэтому и это место.
С июня прошлого года (когда Bewerr начал составлять коллекцию) и до сентября сего года никаких проблем с rapidshare не было. Я завел на rapidshare платный счет, и все грузилось примерно в 2-5 раз быстрее, чем с серверов гугля (кстати, мне кажется, что ограничение по странам скачивания на гбукс и соотв. необходимость долбиться через прокси связана не с копирайтом, а просто с тем, что даже серверы гугля не справляются с книжной нагрузкой). Но вот с 20 октября, два дня назад, вступило в действие ограничение рапидшары (она объявила об этом за месяц до того, разослав извещения платникам): если у вас лежит коллекция размером > 25 гб, то файлы, никем не скачанные в течение последних трех месяцев, будут нахрен удалены (если < 25 гб, то не тронут). Боюсь, коллекции Bewerr'a это может сильно коснуться, особенно в отношении файлов с периодикой.

(Ответить) (Уровень выше) (Ветвь дискуссии)


[info]r_l
2009-10-23 00:17 (ссылка)
Ну, ты знаешь, что я на это скажу.
Я скажу, что никто не мешает завести независимый проект в известном тебе месте.

(Ответить) (Уровень выше) (Ветвь дискуссии)


[info]dp
2009-10-23 00:35 (ссылка)
Ну что ты, это же сотни книг, десятки гигабайт и офигенная нагрузка на сервер. Неужто известное место потянет такой трафик.

(Ответить) (Уровень выше) (Ветвь дискуссии)


[info]r_l
2009-10-23 00:39 (ссылка)
Душа моя, насчет места я выясню, а насчет трафика ты загнул. Прямо вот так тысячи офисных леммингов ломанутся качать "Киевскую старину", ага.
Терабайтный диск у нас сколько стоит? Мы с тобой можем в складчину купить. Или даже по одиночке.

(Ответить) (Уровень выше) (Ветвь дискуссии)


[info]dp
2009-10-23 00:56 (ссылка)
"Киевскую старину" - вряд ли, но из-за богатства выбора и популярности ресурса там многие найдут себе файл по интересам, от специалистов до самостийных любителей. Мне кажется, это будут десятки пользователей ежесуточно. Если, разумеется, мы говорим о зеркале коллекции Bewerra, дополненной литературоведческими книгами и, возможно, русской прозой.
А покупка диска нам по силам, конечно, дело того стоит. Вот со временем хуже, одному-двум человекам такое не поднять. Тут действительно нужна форма, позволяющая авторизованным юзерам самим выкладывать файлы по некоторому стандарту. Причем юзеры должны быть реально добродетельные, иначе быстро прискачет какая-нибудь роботизированная шпана и зальет все доступное пространство каким-нибудь ПСС Ким Ир Сена.

(Ответить) (Уровень выше) (Ветвь дискуссии)


[info]r_l
2009-10-23 00:59 (ссылка)
Все это ни фига не проблема.
Работы не больше, чем у смотрителей ru_lit.

(Ответить) (Уровень выше) (Ветвь дискуссии)


[info]dp
2009-10-23 01:07 (ссылка)
На старте - всяко больше. Надо придумать и напрограммировать форму, структуру каталога, прикрутить поиск. Это все не вдруг и в знач. степени не нашими с тобой руками.

(Ответить) (Уровень выше) (Ветвь дискуссии)


[info]r_l
2009-10-23 01:11 (ссылка)
Да нет, для начала можно просто создать добродетельному автору имеющегося архива более удобную форму хранения файлов.

(Ответить) (Уровень выше) (Ветвь дискуссии)


[info]dp
2009-10-23 01:20 (ссылка)
Да я только за. Просто сомневаюсь, что он пойдет перезаливать свою коллекцию к людям, с которыми дела до сих пор не имел. Счета на рапиде он держит свои, каталог на Археологии ведет сам, никто другой туда линк не всунет. Можно предложить, разумеется, но я знаком с ним лишь шапочно.

(Ответить) (Уровень выше) (Ветвь дискуссии)


[info]r_l
2009-10-23 01:22 (ссылка)
Не, ну я же тоже не стану настаивать, конечно. Спасибо за то, что есть и все такое.

(Ответить) (Уровень выше) (Ветвь дискуссии)


[info]dp
2009-10-23 01:26 (ссылка)
Угу. Думаю, скажет: хотите зеркало - исполать, переливайте сами.

(Ответить) (Уровень выше) (Ветвь дискуссии)


[info]r_l
2009-10-23 01:50 (ссылка)
Ну, тады конечно. Тады рапидшара. Оно ж удобнее, всяко!

(Ответить) (Уровень выше) (Ветвь дискуссии)


[info]dp
2009-10-23 02:03 (ссылка)
Человек же привык уже, вложился в эту рапидшару, загнал туда около 7 тыс. томов на 130 примерно гигабайт. У него свои отношения со смотрителями Археологии, где к проекту прикручен форум для обсуждения пополнения коллекции, и где другие энтузиасты ему подкидывают ссылки для постановки в каталог. Это типа устоявшаяся система, со своей тусовкой, со своими проблемами и неудобствами, но она работает уже больше года.
Чтобы побудить его перезалить, надо показать преимущества другой площадки и предложить на ней форму, которую он мог бы оценить и пощупать. Иначе для него это будет звучать как призыв комсомольца на целину, и мы получим вежливый отказ.

(Ответить) (Уровень выше) (Ветвь дискуссии)


[info]r_l
2009-10-23 02:08 (ссылка)
Нет, я опять же, не сторонник насильственной коллективизации.
Преимущества, по-моему, просты и очевидны. Доказывать их нужды нету. Имеющийся ресурс пока работает, как может - и прекрасно. Мир, дружба, жувачка и огромное спасибо (без шуток).
Т.е., я не думаю, что с моей стороны какие-то импульсы еще нужны.

(Ответить) (Уровень выше) (Ветвь дискуссии)


[info]dp
2009-10-23 02:28 (ссылка)
Так я-то согласен с преимуществами, о которых ты говоришь. Мне только кажется, что самого Bewerrа стоит приглашать на новое место только после того, как кто-то (не знаю кто) устроит там хранилище, удобный механизм заливки и обкатает это дело.
Что до меня, то я готов участвовать в обсуждении и обкатке, и пригласить Bewerrа, когда площадка будет готова. Если же он не пойдет и на готовое, тогда можно будет поддерживать эту площадку коллективными усилиями самим, а с ним дружить домами, по мере сил.
За импульсы спасибо, само собой. Если ты считаешь, что разговор с Bewerr'ом можно начинать уже сейчас, на пустом пока месте, то давай я напишу ему и сведу вас, просто при таком раскладе я не уверен в успехе предприятия.

(Ответить) (Уровень выше) (Ветвь дискуссии)


[info]r_l
2009-10-23 02:31 (ссылка)
Конечно, имеет смысл спросить, спасибо. Чтобы просто обозначить наши рутенийские намерения на будущее.

(Ответить) (Уровень выше) (Ветвь дискуссии)


[info]dp
2009-10-23 02:39 (ссылка)
Ага, хорошо, напишу ему. Собственно, я даже почты его не знаю, мы общались через доску на Археологии.

(Ответить) (Уровень выше)


[info]r_l
2009-10-22 16:17 (ссылка)
Навскидку: нет раннего ВЕ, нет МТ на 1825 (оба есть на гбуксах).
То есть, фрагментарненько все же.
Но полезно, спасибо еще раз.

(Ответить) (Уровень выше)


[info]r_l
2009-10-22 16:19 (ссылка)
А, про МТ соврал я - там нет полного текста. А ВЕ есть все же.

(Ответить) (Уровень выше) (Ветвь дискуссии)


[info]dp
2009-10-22 16:45 (ссылка)
Ну могли что-то проглядеть, конечно. Все мы люди. Или на гугль могли положить уже после того, как на рапиду перекачали. Но в целом, стараются выкладывать все номера, какие найдут. "Русский архив" еще вроде бы в проекте, например, а ЖМНП было решено не выкладывать целиком по номерам, а только надергать статьи по истории в отдельные файлы (в каталоге они по именам авторов).

(Ответить) (Уровень выше) (Ветвь дискуссии)


[info]r_l
2009-10-23 00:19 (ссылка)
Там дело не в том. Просто стали выкладывать ВЕ только уже реформенного времени.

(Ответить) (Уровень выше)


[info]bbb.livejournal.com
2009-10-22 16:55 (ссылка)
Дима, ты не прав насчет архива.орг. Транслит на архиве.орг - это всего лишь результат того, что там (почти) никто не делает описаний на русском. Я в виде эксперимента стал делать и все прекрасно получается. Соответственно, можно искать по-человечески. Далее, каталогизирования там в полном смысле нет, но зато можно добавлять в неограниченном количестве ключевые слова, дающие возможность поиска (правда, ключевые слова, кажется, только по-английски - впрочем, это я, если честно, не проверял). Кроме того, все заливаемое можно группировать по "коллекциям", то есть в реальности можно, наверно, соорудить целое дерево коллекций - де-факто каталог.

Кроме того, там автоматически делают djvu-копию, что тоже не вредно.

Кстати, там же, когда заливаешь, сам и придумываешь урл. То есть машина, в принципе, сама его изготавливает из названия книги, но это можно сделать и вручную - то есть, если подумать, названия урлов тоже вполне могут быть содержательными и, так сказать, каталогичными.

Почему бы не совместить хорошее с отличным? Скажем, можно постепенно перелить всю коллекцию рапидшары на архив.орг и забыть про целый ряд головных болей. Удалять же с рапидшары вовсе не обязательно.

(Ответить) (Уровень выше) (Ветвь дискуссии)


[info]dp
2009-10-22 17:43 (ссылка)
Ага, спасибо. Ну что же, тем лучше, я же вовсе не радикальный противник архива.орг. Попробую потыкаться и что-нибудь залить для пробы.
Проблема только в том, что для такого дела нужна некая системность, чтобы если уж перезаливать коллекцию - то нескольким человекам по единому стандарту (имена файлов, ключевые слова, etc), а один энтузиаст c такой заливкой год будет возиться.

(Ответить) (Уровень выше) (Ветвь дискуссии)


[info]cema
2009-10-23 09:40 (ссылка)
Нельзя ли это в какой-то степени автоматизировать? Или там какие-то действия требуют творческого решения (например, придумывать названия файлов и т.д.)?

(Ответить) (Уровень выше) (Ветвь дискуссии)


[info]r_l
2009-10-23 09:46 (ссылка)
Нет, там все рационально. Проблема в рапидшаре, я не знаю роботов, которые умеют копировать сайты со ссылками туда (это не означает, что их нету, конечно).

(Ответить) (Уровень выше) (Ветвь дискуссии)


[info]cema
2009-10-24 07:09 (ссылка)
Можно пример?

(Ответить) (Уровень выше) (Ветвь дискуссии)


[info]r_l
2009-10-30 03:19 (ссылка)
Простите, пропустил. Пример чего?

(Ответить) (Уровень выше) (Ветвь дискуссии)


[info]cema
2009-11-11 01:25 (ссылка)
Упс, я тоже пропустил. Я имел в виду пример того, как надо бы копировать.

Сейчас тут [info]dp@lj, я с ним обсужу, что входит в компетенцию. Если после этого будет о чём поговорить, лучше завести отдельный разговор (т.е. отдельный постинг).

(Ответить) (Уровень выше) (Ветвь дискуссии)


[info]r_l
2009-11-11 01:31 (ссылка)
Ага.
Привет добродетельному Д.П.!

(Ответить) (Уровень выше)


[info]tiphareth
2009-10-30 03:11 (ссылка)
Думаю, что если платный аккаунт, робота запустить
довольно просто, если бесплатный, то никак,
ибо рапида от таких роботов себя всеми силами
защищает. Для платного аккаунта робот будет типа
10 строчек скрипта (кстати, любой из канонических
роботов-загрузчиков типа телепорта тоже сгодится, если
он умеет посылать куки).

Платный аккаунт, правда, умеет в день давать
только 2.5 гига или типа того.

Такие дела
Миша

(Ответить) (Уровень выше) (Ветвь дискуссии)


[info]r_l
2009-10-30 03:18 (ссылка)
Ага, спасибо за справку.
Камень в рапид я не брошу, как и в составителя коллекции, но в принципе, коли уж скачал себе локально все эти штуки (правда, очень полезные), лучше поискать других вариантов размещения.
Ну и ссылочки точные на gbooks не помешали бы, да.

(Ответить) (Уровень выше)


(Читать комментарии) -