Войти в систему

Home
    - Создать дневник
    - Написать в дневник
       - Подробный режим

LJ.Rossia.org
    - Новости сайта
    - Общие настройки
    - Sitemap
    - Оплата
    - ljr-fif

Редактировать...
    - Настройки
    - Список друзей
    - Дневник
    - Картинки
    - Пароль
    - Вид дневника

Сообщества

Настроить S2

Помощь
    - Забыли пароль?
    - FAQ
    - Тех. поддержка



Пишет bbb ([info]bbb)
@ 2002-05-18 23:31:00


Previous Entry  Add to memories!  Tell a Friend!  Next Entry
Интересное начинание Библиотеки Конгресса
Оказывается, они ввели новую практику в отношении редких и рассыпающихся книг. Если их запрашивают по межбиблиотечному абонементу (мне-то казалось, что Библиотека Конгресса вообще не высылает книги по межбибу, но вот, получается, ошибался) - она теперь их не высылает, а сканирует, переводит в pdf и выставляет на специальной странице - http://lcweb.loc.gov/rr/loan/illscanhome.html

Оттуда эту книгу могут скачать все желающие, а по истечении полугода линк на нее с этой страницы удаляется - но не уничтожается вообще, а переносится в общую каталожную запись по данной книге. То есть узнать, какие именно книги доступны онлайн, будет не так-то просто. Правда, можно сделать общий поиск по каталогу - например, с поиском слова "pdf". Пока такой поиск выдал чуть больше трех тысяч записей, причем часть из них, понятно, представляют собой не отсканированные книги, а издания, где сочетание букв "pdf" просто входит в заголовок.

Нет сомнений, что рано или поздно они догадаются соорудить общий каталог дигитализированных изданий, но пока его нет.

Интересно, что этот подход полностью demand-driven - то есть сканируется только то, что просят по межбиблиотечному абонементу. Соответственно, пока, вроде, доминируют старинные издания по истории США. Хотя уже вот можно скачать книгу генерала Пронина "Последние дни царской ставки" (Белград, 1939) - http://hdl.loc.gov/loc.gdc/scd0001.20020312001po.1

Правда, книга, хоть размером всего в 88 страниц, получилась у них тридцатимегабайтовой...


(Читать комментарии) - (Добавить комментарий)


[info]levg@lj
2002-05-19 09:40 (ссылка)
Такой размер видимо потому, что не могут или не хотят делать OCR, а заворачивают страницы в PDF просто картинками.

(Ответить) (Ветвь дискуссии)


[info]bbb@lj
2002-05-20 03:07 (ссылка)
Конечно. Просто я не проверял, связано ли это с тем, что речь в данном случае идет о РУССКОМ тексте (может, они не умеют оцифровывать кириллицу), или это общая политика.

(Ответить) (Уровень выше) (Ветвь дискуссии)


[info]miram@lj
2002-05-26 07:30 (ссылка)
IMHO политика, конечно. И правильная. Распознавать, а потом вычитывать -- непременно внесешь искажения. А картинка честно передает все закорючки оригинала, для которых, может, и юникода не хватит.

(Ответить) (Уровень выше) (Ветвь дискуссии)


[info]bbb@lj
2002-05-26 11:57 (ссылка)
Да, скорее всего, так и есть. И для Библиотеки Конгресса это правильно - аутентичность превыше всего.

(Ответить) (Уровень выше)


(Читать комментарии) -