Войти в систему

Home
    - Создать дневник
    - Написать в дневник
       - Подробный режим

LJ.Rossia.org
    - Новости сайта
    - Общие настройки
    - Sitemap
    - Оплата
    - ljr-fif

Редактировать...
    - Настройки
    - Список друзей
    - Дневник
    - Картинки
    - Пароль
    - Вид дневника

Сообщества

Настроить S2

Помощь
    - Забыли пароль?
    - FAQ
    - Тех. поддержка



Пишет kassian ([info]kassian)
@ 2006-11-21 01:11:00


Previous Entry  Add to memories!  Tell a Friend!  Next Entry
Entry tags:acro

Копирование литературы в растровый pdf. Краткая инструкция

Acrobat и филолог

Ч. 1: Копирование литературы в растровый pdf



По просьбам коллег составил такой документ-инструкцию: как при помощи цифровой мыльницы или сканера переснять бумажный оригинал и получить компактный растровый pdf.

Постарался изложить максимально простым языком. За грамматические ошибки не судите строго -- писалось в спешке.

Скачать 2pdf_v02.pdf.

Если что-то написано не очень непонятно или с неточностями -- укажите в каментах, я внесу изменения.


UPD-1. Я искренне надеюсь, что хотя бы часть книг, для обработке которых пригодилась моя инструкция, будет расшарена в [info]terra_linguarum@lj.

UPD-2. Поверьте, что формат djvu (несмотря на его кажущуюся привлекательность) -- не наш метод. Pdf -- промышленный стандарт. Под него сделано очень много высококачественных программ. Даже голый Acrobat (т.е. без дополнительных плагинов) дает возможность работать с файлом почти как с бумажной книгой (например, помещать маргиналии [с подписью автора]). Единственное преимущество djvu -- размер файлов, но в наше время дешевых носителей и быстрого интернета это не перевешивает всего остального.

UPD-3. У всех ли видны все картинки в этом pdf?


(Добавить комментарий)


[info]ginny_joyce@lj
2006-11-20 20:21 (ссылка)
спасибо огромное.

(Ответить) (Ветвь дискуссии)


[info]kassian@lj
2006-11-20 22:17 (ссылка)
Не за что.

(Ответить) (Уровень выше)


[info]aahsaap@lj
2006-11-20 20:22 (ссылка)
Спасибо, бум пробовать.

ЗЫ: у меня WinDjView 0.4.1. (windjview.sourceforge.net, просмотровик халявный).
"Практическая грамматика японского языка" на 350 страниц (с читабельными иероглифами!) весит 2,558,783 байта, меньше 10 Кб. на страницу :)

(Ответить) (Ветвь дискуссии)


[info]kassian@lj
2006-11-20 22:31 (ссылка)
Ща скачаю WinDjView, посмотрю.

Что объем -- преимущество, не спорю. Но объем важен при передаче через веб. Стационарно же важна юзабилити.


Upd.
Поставил WinDjView. Лучше, чем всё, что я видел до этого. Но все равно это просто смотрелка. Каментов делать нельзя, подчеркивать разноцветными фломастерами нельзя, с букмарками непонятно, как быть, вертеть страницы и так сохранять нельзя, вырезать/вставлять страницы нельзя. И т.п. и т.д.

Понимаешь, Acrobat позволяет работать с файлом как с бумажной книгой (напр., помещать маргиналии). А djvu -- просто посмотрел нужное место и на этом всё.

(Ответить) (Уровень выше) (Ветвь дискуссии)


[info]aahsaap@lj
2006-11-23 17:00 (ссылка)
А расскажи, можно ли из большого ПДФ-а выдрать энное количество страниц в другой пэдээф?
Т.е., у меня есть файл некого сборника, а нужно выдрать оттуда одну статью + титул.

(Ответить) (Уровень выше) (Ветвь дискуссии)


[info]kassian@lj
2006-11-23 17:16 (ссылка)
Document | Extract pages или Delete pages.

(Сейчас в процессе написания текста про фичи Акробата, полезные филологам.)

(Ответить) (Уровень выше) (Ветвь дискуссии)


[info]aahsaap@lj
2006-11-23 17:32 (ссылка)
О! Получилось. Спасибо!

(Ответить) (Уровень выше)


[info]grimzone@lj
2006-11-20 20:22 (ссылка)
Руководство для сканирования и создания DJVU-файлов научно-технических книг (pdf, v.1.03)

http://download.nextmail.ru/3/v/a1730a77946b0842f3a784e58f73f485/tech.rar

(Ответить) (Ветвь дискуссии)


[info]kassian@lj
2006-11-20 21:02 (ссылка)
Спасибо.
ScanKromsator, похоже, интересная программа, т.к. не требует ФШ (если у кого его не стоит).

(Ответить) (Уровень выше)


[info]ext_17438@lj
2006-11-21 03:34 (ссылка)
Хорошо написано, спасибо.

Ложка дёгтя: 1 и 3-я картинки битые, на что и Акробат ругается.

(Ответить) (Ветвь дискуссии)


[info]kassian@lj
2006-11-21 09:44 (ссылка)
Як так битые?! Как именно ругается? Я конечно это из Ворда делал (врать не буду), но вроде все кошерно (кроме "key HalftoneName", но это на всех страницах и влиять на экранный просмотр не должно).

(Ответить) (Уровень выше) (Ветвь дискуссии)


[info]ext_17438@lj
2006-11-21 10:00 (ссылка)
Сам удивился!

От верха процентов 30 рисуется, дальше залито чёрным — как при типичном повреждении JPEG'а.

"Insufficient data for an image"— акробатовский алерт.

PS: …скрин выслал тебе на форумскую почту.

(Ответить) (Уровень выше) (Ветвь дискуссии)


[info]kassian@lj
2006-11-21 10:33 (ссылка)
Очень странненько.
Посмотрим, будут ли у кого-нибудь еще такие глюки (вроде бы, больше всего это похоже на глюки).

(Ответить) (Уровень выше)


[info]lemon_sole@lj
2006-11-21 08:10 (ссылка)
...толково, ага...
...философский вопрос - как бы Capt. Beef. с обоюдной выгодой заполучить? Чтобы и вещь появилась, и деньги завелись? Неужели за две с половиной тысячи лет развития европейской философии ответ не найден?

(Ответить) (Ветвь дискуссии)


[info]kassian@lj
2006-11-21 09:55 (ссылка)
(Почему-то вдруг подумалось: знает ли Швыдкой такое имя -- "Capt.Beefh."?..)

(Я там краем уха про ftp услышал [подсмотрев пост, не мне предназначавшийся], но, как я понимаю, это не то, о чем я подумал...)

Тогда могу записать все 3 серии на CD и вручить.
Или могу залить на какой-нибудь обменник.

Как Вам удобнее?

(Ответить) (Уровень выше) (Ветвь дискуссии)


[info]lemon_sole@lj
2006-11-21 10:09 (ссылка)
...ftp - это для миллионеров из Майами (то есть не совсем для нас) - а так через FolderShare обмен завели (это мне кажется не очень удобным - но можете у Ш-мальского узнать
на предмет участия)...
...а по сабжу - могу поменять CD c Bat Chain Puller OT на DVD с фильмом...

(Ответить) (Уровень выше) (Ветвь дискуссии)


[info]kassian@lj
2006-11-21 10:31 (ссылка)
Сложно как жить. У меня даже членские взносы не уплочены, а вы уже на Майами перебираетесь.

> могу поменять CD c Bat Chain Puller OT на DVD с фильмом...

Bat Chain Puller -- замечательно.
Но у меня-то cd с тремя файлами mpeg. Или Вам это в формат dvd раскатать?

(Ответить) (Уровень выше) (Ветвь дискуссии)


[info]lemon_sole@lj
2006-11-21 11:53 (ссылка)
...да оставьте уж так...

(Ответить) (Уровень выше) (Ветвь дискуссии)


[info]kassian@lj
2006-11-21 12:10 (ссылка)
Как скажете. Но если Вы потом это все равно будете на dvd писать (для домашнего кинотеатра, ага), то лучше сразу я -- чтоб не тратить cd-болванку [исключительно из принципа].

(Ответить) (Уровень выше) (Ветвь дискуссии)


[info]lemon_sole@lj
2006-11-21 12:16 (ссылка)
...только на DVD-R...

(Ответить) (Уровень выше) (Ветвь дискуссии)


[info]kassian@lj
2006-11-21 14:25 (ссылка)
А упал или энтот фейс?

(Ответить) (Уровень выше) (Ветвь дискуссии)


[info]lemon_sole@lj
2006-11-21 14:45 (ссылка)
...что-то Вы по-будетлянски заговорили... Попробуйте раскатать, ага - если, конечно, уверены в качестве раскатывающих инструментов... про PAL спрашивали? Всё равно...

(Ответить) (Уровень выше) (Ветвь дискуссии)


[info]kassian@lj
2006-11-21 15:04 (ссылка)
Нет, в качестве не уверен, т.к. никогда этим вопросом не интересовался (не качеством, а перегоном mpeg > dvd).
У меня стоит какая-то автопилотная програмка для офисных девиц -- dvdSanta. Поставил, что предлагают -- Resolution High (720x480), Aspect ratio 4:3, звук не жать.

С другой стороны, уверяю Вас, сделать эту запись хуже, чем она есть, не под силу даже мне.


P.S. Попробую в VirtualDub убрать секунды, к-рые в нахлест при нарезке сделаны (если получится, не пробовал раньше).

(Ответить) (Уровень выше) (Ветвь дискуссии)


[info]lemon_sole@lj
2006-11-21 15:51 (ссылка)
...техническое творчество отвлекает молодежь от пивного ларька...

(Ответить) (Уровень выше) (Ветвь дискуссии)


[info]kassian@lj
2006-11-21 16:01 (ссылка)
Кстати, говоря о "залить", я думал, что мож кому еще это дело интересно будет (не у всех есть доступ к телу осла). Все-таки Cap.Beefh. -- это не прогрессия, как ни крути...

(Ответить) (Уровень выше) (Ветвь дискуссии)


[info]lemon_sole@lj
2006-11-21 16:16 (ссылка)
...да, штука-то всяко познавательная... если не боитесь быть закиданным тухлыми эстетскими помидорами - предложите тем же глазоухам, что ли...
...диск записал, ага...

(Ответить) (Уровень выше) (Ветвь дискуссии)


[info]kassian@lj
2006-11-22 07:36 (ссылка)
И ведь знаю, что опять обман,.. А продолжаю верить в людей.


Dvd тоже записал. Уф, смогу ли выбраться куда на этой недели -- вопрос. Вы ведь по вечерам на м.М-кая или это случайно вышло?

(Ответить) (Уровень выше) (Ветвь дискуссии)


[info]lemon_sole@lj
2006-11-22 08:27 (ссылка)
...нет, каждый день хожу - любуюсь изображениями успехов социалистического строительства... Сами же говорили - зеленая линия, зеленая линия...

(Ответить) (Уровень выше) (Ветвь дискуссии)


[info]kassian@lj
2006-11-22 08:38 (ссылка)
Эка...
Редка в наше время такая деликатность...
В общем, говорите тогда, где Вы на самом деле бываете, а то неудобно как-то.

(Ответить) (Уровень выше) (Ветвь дискуссии)


[info]lemon_sole@lj
2006-11-22 09:11 (ссылка)
...да ладно - там достаточно удобно... то есть кому другому, может, и неудобно - но мы ведь не такие, а наоборот... это некоторые впечатлительные тетушки думают невесть что - а мы не думаем ничего; впрочем, если бы и думали - все равно не додумались бы до такого... а которые думают - те, конечно, рано или поздно додумываются невесть до чего - на то они и впечатлительные тетушки...

(Ответить) (Уровень выше) (Ветвь дискуссии)

Секретность -- превыше всего
[info]kassian@lj
2006-11-22 09:19 (ссылка)
Ну, как Вам удобнее...
Тогда спишемся на этой неделе.

(Ответить) (Уровень выше) (Ветвь дискуссии)

Re: Секретность -- превыше всего
[info]lemon_sole@lj
2006-11-22 09:24 (ссылка)
...а то! Криптография тоже отвлекает молодежь от пивного ларька...

(Ответить) (Уровень выше)


[info]fbmk@lj
2006-11-21 13:15 (ссылка)
В чем принципиальные отличия от сканирования в Fine Reader + сохранении в pdf (без распознвания)? Если сканировать, используя собственный драйвер FR, а не драйвер сканера (там слишком много шума), получается вроде нормальное качество (я не из патриотичного желания использовать FR, а из элементарной лени хочу примерно представить себе, что именно выиграю, перейдя на более сложный способ).

(Ответить) (Ветвь дискуссии)


[info]kassian@lj
2006-11-21 13:29 (ссылка)
Думаю ничем. (Только тем, что лично мне не доводилось пользоваться FR для этих целей, поэтому и не написал ничего.)

Ты прав, если есть под рукой FR, то проще им. Но это в том случае, если после сканирования с файлами не надо ничего делать (например, они уже без белых полей -- FR разве умеет задавать рамку/фрейм для области сканирования?).

(Ответить) (Уровень выше) (Ветвь дискуссии)


[info]fbmk@lj
2006-11-21 13:33 (ссылка)
например, они уже без белых полей -- FR разве умеет задавать рамку/фрейм для области сканирования?).
Просто не сталкивался. Обратная проблема бывала не раз (книга еле-еле помещалась в сканер).

(Ответить) (Уровень выше) (Ветвь дискуссии)


[info]kassian@lj
2006-11-21 13:39 (ссылка)
> Просто не сталкивался.

Я как-то искал, не нашел (но это была не очень свежая версия). (Кстати, если этого нет, то было бы очень хорошо такую фичу сделать.)

> Обратная проблема бывала не раз (книга еле-еле помещалась в сканер).

Это у тебя сканер A4. А если A3...

(Ответить) (Уровень выше)


[info]mvs@lj
2006-11-21 18:14 (ссылка)
как-то даже непонятно, зачем и FR
если поворачивать можно в самом акробате, а задавать облать сканирования - в диалоге сканера
хотя не знаю, правда, может, у меня сканер слишком хороший, да вроде не замечалось за ним такого

(Ответить) (Уровень выше) (Ветвь дискуссии)


[info]kassian@lj
2006-11-21 18:25 (ссылка)
В общем, способов со сканером управиться вагон с тележкой. Тут уж кому что привычнее. Перевернуть можно и в Акробате, и это, действительно, проще, чем с батчем в ФШ возиться -- исправлю в след. версии.

(Ответить) (Уровень выше)


[info]fbmk@lj
2006-11-21 19:00 (ссылка)
Мой резон простой. Я сканирую из FR (не потому, удобнее всего, а потому, что мало программ знаю), если использовать при сканировании драйвер сканера, получается грязная и нечеткая картинка, а через драйвер FR картинка уже более-менее почищенная для распознавания. В редких случаях это неудобно (например, заштрихованные серым квадратики в табличках теории оптимальности становятся обычно белыми), но для нормального текста это хорошо.
У меня дешевенький Umax.

(Ответить) (Уровень выше)


[info]prog_squirrel@lj
2006-11-23 23:29 (ссылка)
Я сканирую сразу в pdf развороты книг. Потом разрезаю акробатом листы пополам так что получаю на выходе много "четных" и "нечетных" файлов (odd и even), названных Odd_001.pdf, Odd_002.pdf, ... Odd_N.pdf, Even_001.pdf, Even_002.pdf, ... Even_N.pdf. Потом переименовываю их собственноручным питоновским скриптом в файлы названные 001.pdf, 002.pdf, ..., 2N.pdf (могу поделиться кому надо) и сшиваю тем же акробатом в один файл. Планирую выкладывать здесь где-то по одной книге в две недели (два тома чукотского языка уже недавно выложил).

(Ответить) (Ветвь дискуссии)


[info]kassian@lj
2006-11-23 23:41 (ссылка)
Понятно, алгоритм ясен )

А Вы уверены, что иметь по отдельным страницам, а не по разворотам -- действительно удобнее?
Лично мне -- нет. Так же как неудобно читать книгу, у который запечатаны только четные или нечетные страницы.
Т.е. такая книга удобна, конечно, -- когда на боку лежишь-почитываешь. (Кстати таки видел на Западе подобные издания "для ленивых"!)


> Потом переименовываю их собственноручным питоновским скриптом

Это ж WindowsCommander'ом очень легко делается.

(Ответить) (Уровень выше) (Ветвь дискуссии)


[info]prog_squirrel@lj
2006-11-24 00:12 (ссылка)
Я тоже думал как удобнее - оставлять развороты или разрезать по страницам. Пришел к выводу, что страницы все же удобнее, по крайней мере для меня. Развороты не помещаются на небольшой монитор (а у меня как раз небольшой) в хорошем увеличении, поэтому всегда приходится увеличивать такой разворот и смотреть его то справа то слева.

Хмм, может и можно Windows Commanderom, но это надо разбираться как, да еще он может и не выполнять того чего я хочу. Мне в таких случаях легче за часик написать свою программку в которой мне не нужно разбираться :)

(Ответить) (Уровень выше)

Хотелось бы подробнее
(Анонимно)
2006-11-28 18:33 (ссылка)
Макро
Для книг большого формата м.б.и нет.

Автофокус
Лучше отключить, если камера это позволяет. Снимать можно будет со скоростью пулемета.

Освещение
Для получения более равномерного освещения можно накрыться белой простыней и ползти на кладб накрыть всю конструкцию белой тканью, чтобы получить рассеянный свет. Также желательно фотографа одеть во что-то белое или светло-серое.

(Ответить) (Ветвь дискуссии)

Re: Хотелось бы подробнее
[info]kassian@lj
2006-11-28 19:43 (ссылка)
> Лучше отключить, если камера это позволяет. Снимать можно будет со скоростью пулемета.

Это да. Но если в камере есть ручная наводка фокуса, то это уже не самая плохая камера. Гробить затвор на книги -- просто жалко )

(Ответить) (Уровень выше)