Войти в систему

Home
    - Создать дневник
    - Написать в дневник
       - Подробный режим

LJ.Rossia.org
    - Новости сайта
    - Общие настройки
    - Sitemap
    - Оплата
    - ljr-fif

Редактировать...
    - Настройки
    - Список друзей
    - Дневник
    - Картинки
    - Пароль
    - Вид дневника

Сообщества

Настроить S2

Помощь
    - Забыли пароль?
    - FAQ
    - Тех. поддержка



Пишет kommari ([info]kommari)
@ 2007-08-03 15:40:00


Previous Entry  Add to memories!  Tell a Friend!  Next Entry
технический вопрос

Народ! 
Есть ли на свете сканнер, заточенный под сканирование книг?
Очень много скачиваю из Тырнета, не все, правда, успеваю читать, но меня, как коммуниста, совесть гложет, что сам слишком мало отдаю в Сеть.

Есть какие-то книги, журналы, которые мог бы и хотел бы отсканировать, распознать и выложить, но у меня старый сканнер, который и сам по себе не очень дружит с XP, плюс еще очень неудобно на нем работать. В то же время смотришь - люди такие талмуды сканируют, что, если бы я на своем попробовал бы повторть их подвиг, это у меня год бы заняло. Это все-таки чересчур много, даже для меня.

Я понимаю, что нет такого сканнера, в который сунул книжку - а на выходе текст в электронной форме (как в фильме "Три дня Кондора"), но все-таки - может кто знает что-то, идущее в эту сторону.

Информация вообще и  жены тексты в частности должны быть общими.



(Добавить комментарий)


[info]homo_nudus@lj
2007-08-03 10:00 (ссылка)
Могу только такой информацией поделиться. (http://www.natahaus.ru/2007/07/24/nagljadnoe_sravnenie_skanerov_ccd_i_cis_pri_skanirovanii_knig.html)

(Ответить) (Ветвь дискуссии)


[info]kommari@lj
2007-08-03 10:13 (ссылка)
спасибо
начал читать - уж узнал массу нового для себя

(Ответить) (Уровень выше)


[info]yinshi@lj
2007-08-03 10:48 (ссылка)
А Вас интересует именно сканирование с последующим распознаванием и переводом документа в текстовый формат? Для этой цели идеально подходят библиотечные сканеры типа вот таких: http://www.elar.ru/device/bookscanners.html Но купить такой для дома, конечно, не реально. Сам я использую обычный планшетный Umax 2004-го года выпуска. Для пущей быстроты процесса могу посоветовать фотографировать книги цифровиком (подойдет, в принципе, любой, где есть черно-белый режим и матрица в 4-6 мегапикселей) с последующим распознаванием фотографий в обычном Файнридере. Распознает на ура, ничуть не хуже, чем изображения со сканера. Но здесь есть нюанс - снимать с рук таким образом утомительно чисто физически, а горизонтальный штатив по более-менее вменяемой цене я во всей Москве (!!!) так в свое время и не нашел. Но, может, в Финляндии с этим лучше...

Ну, а если Вы хотели бы выбрать обычный планшетный сканер - то Вам сюда: http://www.djvu-soft.narod.ru/scan/buy_scanner_2007.htm

Я-то предпочитаю делать книги в формате DjVu. Если Вам интересен такой метод - то вот сайт, где рассказано о ДежаВю всё: http://www.djvu-soft.narod.ru/. В частности - процесс создания книги от начала до конца описан тут: http://www.djvu-soft.narod.ru/b_cr.htm. Но я лично делаю по другому алгоритму, значительно более простому. Если Вам интересно - я могу его описать, когда приду сегодня домой (сейчас я просто не помню точных названий программ, которые использую :)).

(Ответить) (Ветвь дискуссии)


[info]kommari@lj
2007-08-03 10:54 (ссылка)
ага, ссылки изучу и обязательно буду уточнять

мне понравился Plustek Optikbook - наводка была в предыдущем комменте

djvu и pdf почему-то не люблю - больше нравится, когда в текст можно влезть и что-то изменить

но надо экспериментировать

камерой сканировать - не уверен, что это веселее и быстрее
хотя интересная мысль

(Ответить) (Уровень выше)


[info]_alekseev_@lj
2007-08-04 12:22 (ссылка)
>Но здесь есть нюанс - снимать с рук таким образом утомительно чисто физически, а горизонтальный
>штатив по более-менее вменяемой цене я во всей Москве (!!!) так в свое время и не нашел. Но, может, в
>Финляндии с этим лучше...

Попробуйте где-нить разжиться допотопным фотоувеличителем. Их еще не все повыкидывали - "плита" + вертикальная стойка + хреновина, которая по стойке ездит вверх-вниз решают проблему на 100%

(Ответить) (Уровень выше) (Ветвь дискуссии)


[info]yinshi@lj
2007-08-12 10:23 (ссылка)
О, спасибо! Интересная идея.

(Ответить) (Уровень выше)


[info]kommari@lj
2007-08-04 12:52 (ссылка)
Если Вам интересно - я могу его описать, когда приду сегодня домой
***
интересно - на самом деле
если будет возможность - напишите, пожалуйста

(Ответить) (Уровень выше) (Ветвь дискуссии)


[info]yinshi@lj
2007-08-12 10:24 (ссылка)
Коммари, извините, что так долго молчал - проклятая работа, по вечерам поесть - и то сил нет, что уж ЖЖ... Так вот, как я сканирую книги.

Нужны три программы: FineReader, BookRestorer и DjVuEditor. Последние две вместе с кряками можно взять на всё том же http://www.djvu-soft.narod.ru. ФайнРидера хватит и в демо-версии, которая бесплатно распространяется на официальном сайте.

FineReader:
Сканируете страницу(цы) в оттенках серого -- "Файл" -- "Сохранить результаты" -- "Сохранить изображения" -- "Тип файла" - TIFF, черно-белый, Group4, "Сохранить страницы" - Все, поставьте галочку напротив "Сохранить страницы в один файл"

BookRestorer:
Пиктограмма "Создать" --- Выбираете имя создаваемой книги и папку для хранения -- Пиктограмма "Импорт" -- Выбираете отсканированные файлы -- В левом крайнем поле они высвечиваются как страницы книги -- Обрабатываете их (как конкретно, расписывать не буду: здесь http://www.djvu-soft.narod.ru/scan/curved_text.htm всё очень хорошо изложено; другие действия - по аналогии, у программы интерфейс очень понятный) -- Пиктограмма "Публикация" -- Выбираете папку, куда сохранить файлы, ставите галочку напротив опции "Многостраничный"

DjVuEditor:
Открываете папку с программой, в ней открываете папку Bin, а там - файл DjVuPro.exe -- "Открыть" -- Выбираете получившийся после BookRestorer'а файл -- "Файл" -- "Кодировать в ДежаВю" -- "Один файл" -- Указываете место сохранения -- Разрещение оставляете 300, тип исходного документа - "Сканированный"

Всё, книга готова. Если ФайнРидер всё отсканировал нормально, и исправлять кривизну строк и пр. не надо, то и БукРесторер, соответственно, не нужен.

Несколько слов в защиту самого ДежаВю. Я его использую вот по каким соображениям: дело в том, что у книг, сделанных в нем, на порядок труднее изменить текст. Это, естественно, повышает достоверность скана - т.е. уменьшает вероятность фальсификации цитат и т.д. Между прочим на Западе (да и у нас уже) существуют строгие (хоть пока и негласные) правила цитирования интернет-источников. Так вот в научных работах ссылки на книгу, отсканированную в текстовом (doc, txt и пр.) формате, очень не поощряются. Для нашего ВАКа, например, это совершенно железный повод развернуть диссертацию. А с графическими форматами (PDF или тот же DjVu) проблем возникает значительно меньше. Тем более, что для удобства копирования текста или поиска внутри документа в нем легко можно прожечь текстовой слой.

(Ответить) (Уровень выше)


[info]obsrvr@lj
2007-08-03 10:53 (ссылка)
Ищите просто "книжные сканеры", например
http://www.document-scan.ru/catalog227.htm

(Ответить) (Ветвь дискуссии)


[info]kommari@lj
2007-08-03 10:57 (ссылка)
вот-вот - я уже нашел инфу как раз по Opticbook

только у меня город маленький, а по почте заказывать боязно - какие-то фирмы его предлагают несерьезные

в Питер надо бы скатать - но прошел по каталогам - этих моделей нет

в Москве есть - но далековато Москва :(

(Ответить) (Уровень выше)


[info]overnightexpres@lj
2007-08-03 12:58 (ссылка)
молва идет, что якобы цифровой фотоаппарат
очень пригоден для этого,..
надо наснимать страницы книги, и потом распознователь текста
отработает ещё лучше даже чем на сканере...
только главное постараться перпендикулярно странице щёлкать.

глядя на цифровые фото - допускаю что так и есть,
ведь на них текст куда как лучше видем чем на сканах.

(Ответить) (Ветвь дискуссии)


[info]kommari@lj
2007-08-03 13:11 (ссылка)
Вы уже второй, кто советует использовать цифровую камеру

поэкспериментирую в выходные

спасибо!

(Ответить) (Уровень выше)


[info]_iga@lj
2007-08-13 15:21 (ссылка)
Специальный книжный:
http://www.plustek.ru/product.php3?fname=x_OpticBook-3600_new
Около $300.

(Ответить)


[info]shiro_ta@lj
2007-12-10 07:58 (ссылка)
могу в копилку еще - инфа по книжному сканеру ATIZ BookDtive (данный сканер используется в частности в библиотеках для оцифровки ценных книжных фондов) - http://www.atiz.ru/bookdrive

(Ответить) (Ветвь дискуссии)


[info]kommari@lj
2007-12-10 14:50 (ссылка)
спасибо
правда, я уже купил plustek

еще бы научиться быстросканировать

с одной книжкой мучаюсь уже месяц

(Ответить) (Уровень выше)