Войти в систему

Home
    - Создать дневник
    - Написать в дневник
       - Подробный режим

LJ.Rossia.org
    - Новости сайта
    - Общие настройки
    - Sitemap
    - Оплата
    - ljr-fif

Редактировать...
    - Настройки
    - Список друзей
    - Дневник
    - Картинки
    - Пароль
    - Вид дневника

Сообщества

Настроить S2

Помощь
    - Забыли пароль?
    - FAQ
    - Тех. поддержка



Пишет bbb ([info]bbb)
@ 2002-05-18 23:31:00


Previous Entry  Add to memories!  Tell a Friend!  Next Entry
Интересное начинание Библиотеки Конгресса
Оказывается, они ввели новую практику в отношении редких и рассыпающихся книг. Если их запрашивают по межбиблиотечному абонементу (мне-то казалось, что Библиотека Конгресса вообще не высылает книги по межбибу, но вот, получается, ошибался) - она теперь их не высылает, а сканирует, переводит в pdf и выставляет на специальной странице - http://lcweb.loc.gov/rr/loan/illscanhome.html

Оттуда эту книгу могут скачать все желающие, а по истечении полугода линк на нее с этой страницы удаляется - но не уничтожается вообще, а переносится в общую каталожную запись по данной книге. То есть узнать, какие именно книги доступны онлайн, будет не так-то просто. Правда, можно сделать общий поиск по каталогу - например, с поиском слова "pdf". Пока такой поиск выдал чуть больше трех тысяч записей, причем часть из них, понятно, представляют собой не отсканированные книги, а издания, где сочетание букв "pdf" просто входит в заголовок.

Нет сомнений, что рано или поздно они догадаются соорудить общий каталог дигитализированных изданий, но пока его нет.

Интересно, что этот подход полностью demand-driven - то есть сканируется только то, что просят по межбиблиотечному абонементу. Соответственно, пока, вроде, доминируют старинные издания по истории США. Хотя уже вот можно скачать книгу генерала Пронина "Последние дни царской ставки" (Белград, 1939) - http://hdl.loc.gov/loc.gdc/scd0001.20020312001po.1

Правда, книга, хоть размером всего в 88 страниц, получилась у них тридцатимегабайтовой...


(Добавить комментарий)


[info]ella_p@lj
2002-05-18 22:20 (ссылка)
Гнусный pdf. Мало того, что любая брошюрка весит неимоверные мегабайты, так там еще шрифты менять нельзя. В результате у меня не распечатывается половина файлов в этом формате. Читать же его с экрана тоже на редкость противно. Из каких соображений им пользуются - ума не приложу. Неужели только ради того, чтобы нельзя было скопировать текст через копи/паст?

(Ответить) (Ветвь дискуссии)


[info]ex_udod985@lj
2002-05-18 22:38 (ссылка)
pdf поддается обузданию вполне,
вполть до copy-past. Под windows для этого нужен полный Аcrobat, наверно.

(Ответить) (Уровень выше) (Ветвь дискуссии)


[info]ella_p@lj
2002-05-18 22:47 (ссылка)
Простите мою серость, а что такое полный Аcrobat? У меня стоит Аcrobat Reader, скачанный из интернета, с официального сайта. Но он только показывает странички. Мне очень мешает, что невозможно преобразовать это дело в нормальный текст (скажем когда он в три колонки), повыкидывать картинки, которые сажают принтер, поменять шрифты.

(Ответить) (Уровень выше) (Ветвь дискуссии)


[info]ex_udod985@lj
2002-05-18 23:25 (ссылка)
Acrobat-reader -- это свободный кусочек
(с нарочно ограниченными возможностями)
дорогой системы Adobe Acrobat http://www.adobe.com/products/acrobat/main.html
обработки текстов в postscript и pdf.
К ней приложены разнее конверторы и, в целом, можно делать все (и переформатировать). (Конечно, если текст снят
как битовая картинка с ним много не сделаешь,
но тогда его можно спасти в виде пригодном для программ распознающих текст на картинке).
Эта штука (полный Acrobat) встречается на дисках в переходах, конечно. Я - юниксоид и пользуюсь свободными
заменителями (они не все умеют, но текст извлекают).
Да, .pdf может быть защищен и тогда, не зная пароля, его не преобразовать с помошью
Acrobat'a.

(Ответить) (Уровень выше) (Ветвь дискуссии)


[info]ella_p@lj
2002-05-18 23:46 (ссылка)
Спасибо Вам большое за просвещение. Вот теперь буду знать. Интересно будет проверить, библиотечные тексты в основном под паролями? Узнаю - расскажу.

(Ответить) (Уровень выше)


[info]levg@lj
2002-05-19 09:38 (ссылка)
Пользуются потому, что это наилучший из существующих (безумно при этом далекий от идеала) формат позволяющий детально описывать и корректно передавать между аппаратными платформами и устройствами форматирование документа. Плюс бесплатная программа для чтения существующая для всех мало-мальски распространенных платформ. Плюс вес и авторитет Adobe и огормные средства вложенные этой фирмой в его продвижение на рынке. Плюс открытая документация. Плюс развитые средства для создания/обработки. Вобщем причин много.

Это теория однако. Практических замечаний два:
1)правильно изготовленный - весьма компактен.
2)Reader прекрасно умеет делать сору (a потом, понятно paste куда пожелаете). Нажмите жирную "T" в toolbar.

(Ответить) (Уровень выше) (Ветвь дискуссии)


[info]ella_p@lj
2002-05-19 09:57 (ссылка)
Огромное спасибо! Ага, теперь можно постранично копировать в Word.
Ламер я, конечно. Давно бы ртфм.

(Ответить) (Уровень выше)


[info]ex_udod985@lj
2002-05-18 22:46 (ссылка)
Замечательно делают старые
журналы на www.jstor.org -- с поиском по тексту
-- но пускают только по большому блату.

(Ответить) (Ветвь дискуссии)


[info]bbb@lj
2002-05-20 03:19 (ссылка)
Э, мест, где оцифровано, но нужен блат - предостаточно... Главное - где блат взять?

Правда, есть всякие обходные пути. Например, вот такое место - http://www.ciaonet.org - содержит множество книг по международной тематике, выложенных онлайн (кстати - не pdf, а простой html), и дает trial period сроком на месяц. А за месяц можно выкачать немало...

Бывают и дырки. Например, несколько месяцев назад случайно обнаружил такую дырку на сайте ун-та штата Вашингтон (http://www.lib.washington.edu/subject/RussiaEastEurope/dr/eljnl.html) - и скачал некоторое количество Canadian Slavonic Papers. Сейчас пошел посмотреть - ан дырка уже заделана.

(Ответить) (Уровень выше)


[info]levg@lj
2002-05-19 09:40 (ссылка)
Такой размер видимо потому, что не могут или не хотят делать OCR, а заворачивают страницы в PDF просто картинками.

(Ответить) (Ветвь дискуссии)


[info]bbb@lj
2002-05-20 03:07 (ссылка)
Конечно. Просто я не проверял, связано ли это с тем, что речь в данном случае идет о РУССКОМ тексте (может, они не умеют оцифровывать кириллицу), или это общая политика.

(Ответить) (Уровень выше) (Ветвь дискуссии)


[info]miram@lj
2002-05-26 07:30 (ссылка)
IMHO политика, конечно. И правильная. Распознавать, а потом вычитывать -- непременно внесешь искажения. А картинка честно передает все закорючки оригинала, для которых, может, и юникода не хватит.

(Ответить) (Уровень выше) (Ветвь дискуссии)


[info]bbb@lj
2002-05-26 11:57 (ссылка)
Да, скорее всего, так и есть. И для Библиотеки Конгресса это правильно - аутентичность превыше всего.

(Ответить) (Уровень выше)