Последствия осере... Как вы наверное знаете, большинство книжек, которые размещены на электронных библиотеках, представляют собой отсканированные и склепанные файлы.
Насколько я понимаю, система переделывания бумажных книжек такова:
- Берут книгу и каждую ееную страничку сканируют
- Файлы множества страниц соединяют в один
- Полученный файл пропускают через специальную программу "Осере" OCR, которая графические картинки буковок распознает каким-то фотоаппаратным принципом и переводит в знакомые нам буквы формата "док".
- Полученный "док" проверяют грамматической исправлялкой и книжка готова!
( Read more... )