Войти в систему

Home
    - Создать дневник
    - Написать в дневник
       - Подробный режим

LJ.Rossia.org
    - Новости сайта
    - Общие настройки
    - Sitemap
    - Оплата
    - ljr-fif

Редактировать...
    - Настройки
    - Список друзей
    - Дневник
    - Картинки
    - Пароль
    - Вид дневника

Сообщества

Настроить S2

Помощь
    - Забыли пароль?
    - FAQ
    - Тех. поддержка



Пишет Марина ([info]mochalkina)
@ 2007-12-09 21:34:00


Previous Entry  Add to memories!  Tell a Friend!  Next Entry
сканированный текст в pdf
Друзья, простите чайника,

приветствуются практические соображения вот по какому вопросу. Если он дурацкий, скажите мне об этом сразу, я пост уберу.

Мне периодически приходится переводить всякие тексты, полученные по е-мейлу в виде сосканированных образов каждой страницы. Последний раз получила неслабых размеров текст в формате pdf и с удивлением обнаружила, что хотя речь явно идет о графических образах всех страниц, тем не менее отдельные фрагменты текста можно выделить курсором, закачать куда-нибудь через cut'n'paste, и они распознаются как текст.

Это такая фича адобовских программ? Если да, то начиная с какой версии (в старых такого не припомню)? Распознавание происходит на этапе сканирования или уже во время пользовательской работы с файлом?

Если у них там встроенная распознавалка, то есть ли шанс ее настроить? Скажем, сказать ей, что символ "l" в середине слова - это обязательно буква "эль", а не единица (а если отдельно, то наоборот). Потому что качество сейчас ниже плинтуса, текст проще перебить, а вот если бы удавалось распознавать чуть получше, это бы мне несколько облегчило жизнь.

Adobe Reader 8.1; чем сканировали - не знаю, но могу спросить.

UPD: вопрос прояснен, спасибо [info]chva@lj.


(Читать комментарии) - (Добавить комментарий)


[info]antonborisov@lj
2007-12-09 16:18 (ссылка)
У меня сейчас стоит Adobe Reader 7.1, то есть, обычный просмотрщик, обратите внимание, там есть такой пункт Select.

(Ответить)


(Читать комментарии) -