Войти в систему

Home
    - Создать дневник
    - Написать в дневник
       - Подробный режим

LJ.Rossia.org
    - Новости сайта
    - Общие настройки
    - Sitemap
    - Оплата
    - ljr-fif

Редактировать...
    - Настройки
    - Список друзей
    - Дневник
    - Картинки
    - Пароль
    - Вид дневника

Сообщества

Настроить S2

Помощь
    - Забыли пароль?
    - FAQ
    - Тех. поддержка



Пишет r_l ([info]r_l)
@ 2009-10-21 21:31:00


Previous Entry  Add to memories!  Tell a Friend!  Next Entry
Спасибо добродетельному Д. Полонскому!

Ссылка на всякие важные в нашем деле pdf-ы из гугла, сохраненные, впрочем, на известной помойке и без исходных линков на gbooks.

Авторы коллекции полагают, видимо, что рапидшара протянет дольше гуголя.

Хихи, как говорится.


(Добавить комментарий)


[info]bbb.livejournal.com
2009-10-22 00:20 (ссылка)
Главное - ведь практически все, выложенное гуглем, копируется в архив.орг, с улучшением и расширением доступа.

(Ответить) (Ветвь дискуссии)


[info]r_l
2009-10-22 00:23 (ссылка)
Ну да.
Проблема не в том, я вчера писал, что нераспознанные (полураспознанные) и некаталогизированные сканы в гбукс - это личная обида специалистам. Близок локоть, а не найдешь, куда кусать.
В аркайве, понятное дело, старых русских журналов тоже не распознают.
А по ссылке хотя бы какой каталог составили.

(Ответить) (Уровень выше) (Ветвь дискуссии)


[info]bbb.livejournal.com
2009-10-22 00:51 (ссылка)
А я не просекаю - в чем обида-то? И в чем трагедия нераспознанности? Что копи-пейст не сделаешь? Ну так и из книжки не сделаешь.

(Ответить) (Уровень выше) (Ветвь дискуссии)


[info]r_l
2009-10-22 00:55 (ссылка)
Да нет.
Я написал уже - там куча книг, которые не найти - просто потому, что они в старой орфографии, и поиск выдает результаты стохастически. В отличие от английских, например.
Погляди вчерашнюю запись.

(Ответить) (Уровень выше)


[info]r_l
2009-10-22 00:56 (ссылка)
Ну сам попробуй найти _все_ выпуски "Московского телеграфа", имеющиеся в gbooks.

(Ответить) (Уровень выше) (Ветвь дискуссии)


[info]bbb.livejournal.com
2009-10-22 01:25 (ссылка)
А, понял. Я просто пропустил тот постинг. Ну так почему же не устроить кооперативный проект этих специалистов по составлению каталога русских книг гуглебука? Каждый, кто нашел что-нибудь, заполняет строчку-клеточку в таком проекте - с правильным названием (лучше с двумя - старой орфографией и новой), автором, выпуском и т.д., плюс линком. На рутении бы и сделать. Только сперва согласовать стандарт - и вперед.

Более того, можно, если чуть больше усилий прилагать, вручную перекатывать эти файлы на архив.орг и там уже сопровождать их правильным описанием на родимом языке. Архив.орг это позволяет, проверено. И даже если там окажется несколько копий одного и того же, скачанное tbs без правильного описания и кем-то из наших с правильным, то беды никакой не будет.

О, я еще вариант придумал. В гуглебуксе можно добавлять reviews. Я вот добавил (потом стер) к найденному тобой выпуску. Пока не стер, попробовал поискать по слову, забитому в review. Увы, не получилось. Но можно все-таки поиграть и дальше - вдруг найдется способ утилизовать эту опцию народного редактирования?

(Ответить) (Уровень выше) (Ветвь дискуссии)


[info]r_l
2009-10-22 01:31 (ссылка)
Дорогой, спасибо - ты мыслишь именно в направлении, которое я предполагал спровоцировать своей записью; и мне очень грустно, что коллеги не предлагают всего этого (назревшего уже сто лет назад и локально сделанного многими).
Ну, что гуголь не стал сотрудничать (были разговоры) - это ладно. Им не до того. Но коллегам-то до того, елки. У всех студенты и вообще.
Сил уж нету. С тем же архивированием по требованию - сколько бился. Воз и ныне там.

(Ответить) (Уровень выше) (Ветвь дискуссии)


[info]annyway
2009-10-22 02:10 (ссылка)
Сделаю я Вам архивирование. Вот курсовик сейчас допишу и сделаю.

(Ответить) (Уровень выше) (Ветвь дискуссии)


[info]r_l
2009-10-22 02:13 (ссылка)
Ловлю на слове.

(Ответить) (Уровень выше) (Ветвь дискуссии)


[info]annyway
2009-10-22 02:24 (ссылка)
Ну здрассьте, приехали.

(Ответить) (Уровень выше) (Ветвь дискуссии)


[info]r_l
2009-10-22 02:29 (ссылка)
Хорошо: не ловлю и не на слове.

(Ответить) (Уровень выше) (Ветвь дискуссии)


[info]annyway
2009-10-22 02:37 (ссылка)
То-то. А то если меня каждый раз, когда я напоминаю о собственных обещаниях, на слове ловить, у меня никаких слов не останется. А они мне некоторые еще нужны, хотя бы чтоб архив ими писать.

(Ответить) (Уровень выше)


[info]gloomov.livejournal.com
2009-10-22 01:30 (ссылка)
Вот некоторым лишь бы хихи, лишь бы!
На самом деле многие из этих книг пользователям с русскими, украинскими или европейскими IP просто недоступны для скачивания (Гугль закрывается таким образом от исков). Так что товарисчи полезное дело делают.

(Ответить) (Ветвь дискуссии)


[info]r_l
2009-10-22 01:32 (ссылка)
Эти все книги в паблик домейне, вроде. Ну и прокси никто не отменял, между прочим.

(Ответить) (Уровень выше) (Ветвь дискуссии)


[info]gloomov.livejournal.com
2009-10-22 03:19 (ссылка)
Как бы да, но для пользователей не из США Гугль многие на всякий случай закрывает от скачивания.
Гугль-букс не любит прокси и многие блокирует после нескольких скачиваний или длительного поиска.
И на архив.орг далеко не все копируется, ббб не совсем прав. Все уже испробовано.

(Ответить) (Уровень выше)


[info]bbb.livejournal.com
2009-10-22 02:22 (ссылка)
Значительная, если не подавляющая часть - сразу же копируется на архив.орг - с расширением одни возможностев и потерянием других.

Уже устал писать об этом

(Ответить) (Уровень выше) (Ветвь дискуссии)


[info]r_l
2009-10-22 02:28 (ссылка)
Ага, ага. И индексируется, заметим сразу, тем же гуголем.
Но это не снимает вопроса, мной обозначенного (он интереснее, чем вопросы о копирайтах).

(Ответить) (Уровень выше) (Ветвь дискуссии)


[info]bbb.livejournal.com
2009-10-22 02:34 (ссылка)
Я, кстати, провожу икспиримент. Сделал запись в поле review и посмотрю, будет ли она сама проиндексирована, то есть можно ли будет по ней искать. Пока - не заиндексирована, но, возможно, это делается не слету.

(Ответить) (Уровень выше) (Ветвь дискуссии)


[info]r_l
2009-10-22 02:36 (ссылка)
А напиши потом, что вышло, да?

(Ответить) (Уровень выше) (Ветвь дискуссии)


[info]bbb.livejournal.com
2009-10-22 17:00 (ссылка)
Пока, увы, не получается. Я написал в ревью к твоему московско-телеграфному файлу слово "тартусский" (можешь проверить, оно там еще есть). Но вот уже второй день, а слово "тартусский" на гугльбуке вываливает почти семьсот книг (хехе), но ни одной в разделе full view, то есть мой review не заиндексировался. Подожду еще пару дней, но, похоже, икспиримент неудачен.

Нащот обидного слова не переживай, я его потом удалю.

(Ответить) (Уровень выше)


[info]dp
2009-10-22 15:27 (ссылка)
Дело в том, что основатель всей этой затеи на Археологии.ру, достойнейший человек с ником Bewerr, не просто чохом перезаливает файлы на рапидшару. Как правило, все файлы проходят просмотр на предмет наличия дублированных страниц, для сокращения веса удаляются черные страницы обложек, а если на gbooks есть дубль файла, то выбирается лучший по степени читабельности вариант. В каких-то случаях Bewerr делал комбинированный файл, поскольку нередки случаи, когда две или три е-копии, выложенные на gbooks, содержат битые страницы, причем в разных местах файла. Вообще, Bewerr - известный подвижник в деле OCR дореволюционных книг по истории, cам оцифровал десятки редких книг, они тоже включены в этот каталог - в т.ч. такие, которых нет на gbooks. Кроме того, с лета сего года, когда Ленинка открыла часть своей электронной коллекции, в этот каталог на Археологии включаются и книги оттуда: большинство из того, что лежит на сайте Ленинки, зачем-то отсканировано в полноцвете, с высоким разрешением и весит сотни мегов, а тут файлы переведены в ч/б вид и ужаты до двух-пяти десятков мегов без потери читабельности.
Мы уже помним, как Ленинка закрывала доступ к своим ранее выложенным старым книжкам на orel, так что такое pdf-редактирование и перезаливка - по-моему, весьма полезное дело. Я сам сталкивался с тем, что некоторые книги 19-го века, ранее выложенные на gbooks, потом снимались оттуда, и если бы не каталог на Археологии - пиши пропало.
А архив.орг, который представляет собой, увы, некаталогизированную свалку с теми же кривыми возможностями поиска адским транслитом, что и на gbooks, никак не замена этому каталогу на Археологии - ни по полноте, ни по поисковым возможностям.

(Ответить) (Ветвь дискуссии)


[info]r_l
2009-10-22 16:09 (ссылка)
Ага, спасибо за разъяснение.
Я, скорее, к тому, что rapidshare - последнее место, на которое я бы положился.

(Ответить) (Уровень выше) (Ветвь дискуссии)


[info]dp
2009-10-22 16:36 (ссылка)
Да, так и есть, к сожалению. Просто не было другого пристанища, поэтому и это место.
С июня прошлого года (когда Bewerr начал составлять коллекцию) и до сентября сего года никаких проблем с rapidshare не было. Я завел на rapidshare платный счет, и все грузилось примерно в 2-5 раз быстрее, чем с серверов гугля (кстати, мне кажется, что ограничение по странам скачивания на гбукс и соотв. необходимость долбиться через прокси связана не с копирайтом, а просто с тем, что даже серверы гугля не справляются с книжной нагрузкой). Но вот с 20 октября, два дня назад, вступило в действие ограничение рапидшары (она объявила об этом за месяц до того, разослав извещения платникам): если у вас лежит коллекция размером > 25 гб, то файлы, никем не скачанные в течение последних трех месяцев, будут нахрен удалены (если < 25 гб, то не тронут). Боюсь, коллекции Bewerr'a это может сильно коснуться, особенно в отношении файлов с периодикой.

(Ответить) (Уровень выше) (Ветвь дискуссии)


[info]r_l
2009-10-23 00:17 (ссылка)
Ну, ты знаешь, что я на это скажу.
Я скажу, что никто не мешает завести независимый проект в известном тебе месте.

(Ответить) (Уровень выше) (Ветвь дискуссии)


[info]dp
2009-10-23 00:35 (ссылка)
Ну что ты, это же сотни книг, десятки гигабайт и офигенная нагрузка на сервер. Неужто известное место потянет такой трафик.

(Ответить) (Уровень выше) (Ветвь дискуссии)


[info]r_l
2009-10-23 00:39 (ссылка)
Душа моя, насчет места я выясню, а насчет трафика ты загнул. Прямо вот так тысячи офисных леммингов ломанутся качать "Киевскую старину", ага.
Терабайтный диск у нас сколько стоит? Мы с тобой можем в складчину купить. Или даже по одиночке.

(Ответить) (Уровень выше) (Ветвь дискуссии)


[info]dp
2009-10-23 00:56 (ссылка)
"Киевскую старину" - вряд ли, но из-за богатства выбора и популярности ресурса там многие найдут себе файл по интересам, от специалистов до самостийных любителей. Мне кажется, это будут десятки пользователей ежесуточно. Если, разумеется, мы говорим о зеркале коллекции Bewerra, дополненной литературоведческими книгами и, возможно, русской прозой.
А покупка диска нам по силам, конечно, дело того стоит. Вот со временем хуже, одному-двум человекам такое не поднять. Тут действительно нужна форма, позволяющая авторизованным юзерам самим выкладывать файлы по некоторому стандарту. Причем юзеры должны быть реально добродетельные, иначе быстро прискачет какая-нибудь роботизированная шпана и зальет все доступное пространство каким-нибудь ПСС Ким Ир Сена.

(Ответить) (Уровень выше) (Ветвь дискуссии)


[info]r_l
2009-10-23 00:59 (ссылка)
Все это ни фига не проблема.
Работы не больше, чем у смотрителей ru_lit.

(Ответить) (Уровень выше) (Ветвь дискуссии)


[info]dp
2009-10-23 01:07 (ссылка)
На старте - всяко больше. Надо придумать и напрограммировать форму, структуру каталога, прикрутить поиск. Это все не вдруг и в знач. степени не нашими с тобой руками.

(Ответить) (Уровень выше) (Ветвь дискуссии)


[info]r_l
2009-10-23 01:11 (ссылка)
Да нет, для начала можно просто создать добродетельному автору имеющегося архива более удобную форму хранения файлов.

(Ответить) (Уровень выше) (Ветвь дискуссии)


[info]dp
2009-10-23 01:20 (ссылка)
Да я только за. Просто сомневаюсь, что он пойдет перезаливать свою коллекцию к людям, с которыми дела до сих пор не имел. Счета на рапиде он держит свои, каталог на Археологии ведет сам, никто другой туда линк не всунет. Можно предложить, разумеется, но я знаком с ним лишь шапочно.

(Ответить) (Уровень выше) (Ветвь дискуссии)


[info]r_l
2009-10-23 01:22 (ссылка)
Не, ну я же тоже не стану настаивать, конечно. Спасибо за то, что есть и все такое.

(Ответить) (Уровень выше) (Ветвь дискуссии)


[info]dp
2009-10-23 01:26 (ссылка)
Угу. Думаю, скажет: хотите зеркало - исполать, переливайте сами.

(Ответить) (Уровень выше) (Ветвь дискуссии)


[info]r_l
2009-10-23 01:50 (ссылка)
Ну, тады конечно. Тады рапидшара. Оно ж удобнее, всяко!

(Ответить) (Уровень выше) (Ветвь дискуссии)


[info]dp
2009-10-23 02:03 (ссылка)
Человек же привык уже, вложился в эту рапидшару, загнал туда около 7 тыс. томов на 130 примерно гигабайт. У него свои отношения со смотрителями Археологии, где к проекту прикручен форум для обсуждения пополнения коллекции, и где другие энтузиасты ему подкидывают ссылки для постановки в каталог. Это типа устоявшаяся система, со своей тусовкой, со своими проблемами и неудобствами, но она работает уже больше года.
Чтобы побудить его перезалить, надо показать преимущества другой площадки и предложить на ней форму, которую он мог бы оценить и пощупать. Иначе для него это будет звучать как призыв комсомольца на целину, и мы получим вежливый отказ.

(Ответить) (Уровень выше) (Ветвь дискуссии)


[info]r_l
2009-10-23 02:08 (ссылка)
Нет, я опять же, не сторонник насильственной коллективизации.
Преимущества, по-моему, просты и очевидны. Доказывать их нужды нету. Имеющийся ресурс пока работает, как может - и прекрасно. Мир, дружба, жувачка и огромное спасибо (без шуток).
Т.е., я не думаю, что с моей стороны какие-то импульсы еще нужны.

(Ответить) (Уровень выше) (Ветвь дискуссии)


[info]dp
2009-10-23 02:28 (ссылка)
Так я-то согласен с преимуществами, о которых ты говоришь. Мне только кажется, что самого Bewerrа стоит приглашать на новое место только после того, как кто-то (не знаю кто) устроит там хранилище, удобный механизм заливки и обкатает это дело.
Что до меня, то я готов участвовать в обсуждении и обкатке, и пригласить Bewerrа, когда площадка будет готова. Если же он не пойдет и на готовое, тогда можно будет поддерживать эту площадку коллективными усилиями самим, а с ним дружить домами, по мере сил.
За импульсы спасибо, само собой. Если ты считаешь, что разговор с Bewerr'ом можно начинать уже сейчас, на пустом пока месте, то давай я напишу ему и сведу вас, просто при таком раскладе я не уверен в успехе предприятия.

(Ответить) (Уровень выше) (Ветвь дискуссии)


[info]r_l
2009-10-23 02:31 (ссылка)
Конечно, имеет смысл спросить, спасибо. Чтобы просто обозначить наши рутенийские намерения на будущее.

(Ответить) (Уровень выше) (Ветвь дискуссии)


[info]dp
2009-10-23 02:39 (ссылка)
Ага, хорошо, напишу ему. Собственно, я даже почты его не знаю, мы общались через доску на Археологии.

(Ответить) (Уровень выше)


[info]r_l
2009-10-22 16:17 (ссылка)
Навскидку: нет раннего ВЕ, нет МТ на 1825 (оба есть на гбуксах).
То есть, фрагментарненько все же.
Но полезно, спасибо еще раз.

(Ответить) (Уровень выше)


[info]r_l
2009-10-22 16:19 (ссылка)
А, про МТ соврал я - там нет полного текста. А ВЕ есть все же.

(Ответить) (Уровень выше) (Ветвь дискуссии)


[info]dp
2009-10-22 16:45 (ссылка)
Ну могли что-то проглядеть, конечно. Все мы люди. Или на гугль могли положить уже после того, как на рапиду перекачали. Но в целом, стараются выкладывать все номера, какие найдут. "Русский архив" еще вроде бы в проекте, например, а ЖМНП было решено не выкладывать целиком по номерам, а только надергать статьи по истории в отдельные файлы (в каталоге они по именам авторов).

(Ответить) (Уровень выше) (Ветвь дискуссии)


[info]r_l
2009-10-23 00:19 (ссылка)
Там дело не в том. Просто стали выкладывать ВЕ только уже реформенного времени.

(Ответить) (Уровень выше)


[info]bbb.livejournal.com
2009-10-22 16:55 (ссылка)
Дима, ты не прав насчет архива.орг. Транслит на архиве.орг - это всего лишь результат того, что там (почти) никто не делает описаний на русском. Я в виде эксперимента стал делать и все прекрасно получается. Соответственно, можно искать по-человечески. Далее, каталогизирования там в полном смысле нет, но зато можно добавлять в неограниченном количестве ключевые слова, дающие возможность поиска (правда, ключевые слова, кажется, только по-английски - впрочем, это я, если честно, не проверял). Кроме того, все заливаемое можно группировать по "коллекциям", то есть в реальности можно, наверно, соорудить целое дерево коллекций - де-факто каталог.

Кроме того, там автоматически делают djvu-копию, что тоже не вредно.

Кстати, там же, когда заливаешь, сам и придумываешь урл. То есть машина, в принципе, сама его изготавливает из названия книги, но это можно сделать и вручную - то есть, если подумать, названия урлов тоже вполне могут быть содержательными и, так сказать, каталогичными.

Почему бы не совместить хорошее с отличным? Скажем, можно постепенно перелить всю коллекцию рапидшары на архив.орг и забыть про целый ряд головных болей. Удалять же с рапидшары вовсе не обязательно.

(Ответить) (Уровень выше) (Ветвь дискуссии)


[info]dp
2009-10-22 17:43 (ссылка)
Ага, спасибо. Ну что же, тем лучше, я же вовсе не радикальный противник архива.орг. Попробую потыкаться и что-нибудь залить для пробы.
Проблема только в том, что для такого дела нужна некая системность, чтобы если уж перезаливать коллекцию - то нескольким человекам по единому стандарту (имена файлов, ключевые слова, etc), а один энтузиаст c такой заливкой год будет возиться.

(Ответить) (Уровень выше) (Ветвь дискуссии)


[info]cema
2009-10-23 09:40 (ссылка)
Нельзя ли это в какой-то степени автоматизировать? Или там какие-то действия требуют творческого решения (например, придумывать названия файлов и т.д.)?

(Ответить) (Уровень выше) (Ветвь дискуссии)


[info]r_l
2009-10-23 09:46 (ссылка)
Нет, там все рационально. Проблема в рапидшаре, я не знаю роботов, которые умеют копировать сайты со ссылками туда (это не означает, что их нету, конечно).

(Ответить) (Уровень выше) (Ветвь дискуссии)


[info]cema
2009-10-24 07:09 (ссылка)
Можно пример?

(Ответить) (Уровень выше) (Ветвь дискуссии)


[info]r_l
2009-10-30 03:19 (ссылка)
Простите, пропустил. Пример чего?

(Ответить) (Уровень выше) (Ветвь дискуссии)


[info]cema
2009-11-11 01:25 (ссылка)
Упс, я тоже пропустил. Я имел в виду пример того, как надо бы копировать.

Сейчас тут [info]dp@lj, я с ним обсужу, что входит в компетенцию. Если после этого будет о чём поговорить, лучше завести отдельный разговор (т.е. отдельный постинг).

(Ответить) (Уровень выше) (Ветвь дискуссии)


[info]r_l
2009-11-11 01:31 (ссылка)
Ага.
Привет добродетельному Д.П.!

(Ответить) (Уровень выше)


[info]tiphareth
2009-10-30 03:11 (ссылка)
Думаю, что если платный аккаунт, робота запустить
довольно просто, если бесплатный, то никак,
ибо рапида от таких роботов себя всеми силами
защищает. Для платного аккаунта робот будет типа
10 строчек скрипта (кстати, любой из канонических
роботов-загрузчиков типа телепорта тоже сгодится, если
он умеет посылать куки).

Платный аккаунт, правда, умеет в день давать
только 2.5 гига или типа того.

Такие дела
Миша

(Ответить) (Уровень выше) (Ветвь дискуссии)


[info]r_l
2009-10-30 03:18 (ссылка)
Ага, спасибо за справку.
Камень в рапид я не брошу, как и в составителя коллекции, но в принципе, коли уж скачал себе локально все эти штуки (правда, очень полезные), лучше поискать других вариантов размещения.
Ну и ссылочки точные на gbooks не помешали бы, да.

(Ответить) (Уровень выше)