|

|

Настроение: | Россия, возродись! |
Entry tags: | сеть и ИТ |
DjVu - полезный формат для эл.библиотек
Ликбез по DjVu Что такое DJVU и как с ним бороться :-)? Обзор djvu-шного софта Как распечатать большой графический файл. Советы по подготовке материалов в электронном и бумажном виде. Поиск по яндексу djvu
Формат дежавю позволяет хранить в растре (можно и с распознаванным вариантом вместе) картинки и тексты: документацию, формулы, схемы, необычные шрифты, рукописи, графику - и всё это с большим сжатием.
Никто никогда не утверждал, что djvu - это альтернатива всем существующим графическим форматам, отнюдь! Но в области создания и хранения черно-белой, полутоновой и отчасти цветной документации, пока ему нет равных. В первую очередь это касается отсканированных бумажных документов или как модно говорить, носителей. Системы OCR, то есть распознавания текста, конечно, замечательные вещи, но пока они еще не настолько интеллектуальны, чтобы суметь распознать много страниц без единой ошибки, различить, где рисунки, где текст, а где надписи на рисунках. Я сам достаточно много работаю с FineReader 6, как одной из самых лучших программ для этой цели и хорошо знаю его достоинства и недостатки. Поверьте мне - чем тратить уйму времени на правку распознанного текста, во многих случаях проще отсканировать эту же страницу с хорошим качеством, не ниже 300 dpi и сохранить ее как файл djvu. Результат будет один и тот же, если не иметь в виду редактирование текста и изображений, но затраты времени будут неизмеримо меньше, при сопоставимом объеме файлов. Под результатом имеется в виду получение информации о том, что напечатано на бумаге, ведь это главная цель при такой задаче. Если в сканируемом оригинале есть схемы, формулы и все такое прочее, то тут распознавание отдыхает, разумеется, были есть и будут энтузиасты, способные восстановить все, но затраты времени резко зашкаливают за разумный предел.
|
|