Войти в систему

Home
    - Создать дневник
    - Написать в дневник
       - Подробный режим

LJ.Rossia.org
    - Новости сайта
    - Общие настройки
    - Sitemap
    - Оплата
    - ljr-fif

Редактировать...
    - Настройки
    - Список друзей
    - Дневник
    - Картинки
    - Пароль
    - Вид дневника

Сообщества

Настроить S2

Помощь
    - Забыли пароль?
    - FAQ
    - Тех. поддержка



Пишет bbb ([info]bbb)
@ 2007-11-22 17:46:00


Previous Entry  Add to memories!  Tell a Friend!  Next Entry
Снова про pdf
Уже много раз задавал вопросы о том, как справляться с pdf-файлами, и всегда получал ценную помощь. Попробую еще раз. Не знает ли кто, существует ли какая-нибудь возможность форматировать интервал между строчками в pdf-файле? Вопрос связан с тем, что почти все диссертации, выложенные онлайн, напечатаны через два интервала (похоже, что это общий мировой стандарт), поэтому при распечатывании получаются просто огромными. Если бы можно было переформатировать их через один интервал - использовать их стало бы намного проще.

Конечно, можно прогнать файл через какой-нибудь файнридер, перегнать в ворд и переформатировать уже там, но хотелось бы избежать этих трудоемких и искажающих операций, а сделать все как-нибудь внутри самого акробата или другой программы, работающей с pdf-файлами.

Шансы, что это возможно, кажутся мне очень маленькими, но чем черт не шутит...


(Добавить комментарий)


[info]aptsvet@lj
2007-11-22 19:54 (ссылка)
Есть программа, кажется называется PdfToWord или в этом роде, которая совершает соответствующую трансформацию, а потом уже можно править. Но если в самом файле .pdf проставлены разные ограничения и коды, то может не получиться. Можно также выбрать орудие text и скопировать текст, но это трудоемко, и теряется весь формат.

(Ответить)


[info]ex_tritopor@lj
2007-11-22 19:56 (ссылка)
А не проще ли экспортировать в *.txt, вставить в любой текстовый процессор и распечатать? В txt Акробат Ридер экспортирует, насколько я помню.

(Ответить)


[info]vvagr@lj
2007-11-22 20:27 (ссылка)
Продвинутые последние версии акробатов и в ворд экспортируют. Даже если защита.

(Ответить)


[info]sorotokin@lj
2007-11-22 21:11 (ссылка)
А можно пример такого файла?

(Ответить) (Ветвь дискуссии)


[info]bbb@lj
2007-11-23 03:27 (ссылка)
Ну, скажем, http://etd.lsu.edu/docs/available/etd-11162005-210229/unrestricted/matthewschandlerthesis.pdf

(Ответить) (Уровень выше)


[info]riftsh@lj
2007-11-22 22:09 (ссылка)
Если pdf-файл содержит "renderable text": File -> Save as -> Word doc or XML
и потом форматировать (начиная с Acrobat 6)

Если pdf-файл сосканирован (почти все старые диссертации и многие новые): Document -> Paper capture и потом в Word.

(Ответить) (Ветвь дискуссии)


[info]9000@lj
2007-11-23 02:38 (ссылка)
...второе и есть OCR %)

(Ответить) (Уровень выше) (Ветвь дискуссии)


[info]riftsh@lj
2007-11-23 03:00 (ссылка)
я этого ни разу не отрицал

(Ответить) (Уровень выше)


[info]9000@lj
2007-11-23 02:43 (ссылка)
PDF-файл внутри себя ничего не знает ни про какие параграфы, а то и про строчки. Он нечто наподобие бумаги, на которой нарисованы буквы и прочие закорючки, притом без особенного различения букв, векторных картинок и растровых картинок, всё вперемешку. PDF-ы не слишком предназначены для редактирования -- максимум для вписывания чего-нибудь в предусмотренные пустые места. Они предназначены, наоборот, для максимально единообразного воспроизведения везде, без модификаций.

Поэтому переформатировать PDF обычно очень болезненно (и я их за это очень не люблю).

Мой вариант -- печатать по две уменьшенных страницы на лист A4 и тем вдвое сокращать носимые с собой пачки бумаги (при двусторонней печати -- и вчетверо).

(Ответить) (Ветвь дискуссии)


[info]bbb@lj
2007-11-23 03:14 (ссылка)
Я именно это и хочу сделать - распечатать по две страницы на лист на обеих сторонах. С большинством книг, выложенных в pdf, это вполне получается, если вручную убрать белые поля, что несложно. Но с диссертациями через два интервала такой способ печати приведет к драматическому уменьшению шрифта до нечитаемости. Если бы можно было переделать два интервала в один - все было бы удобнее. Но, как я понимаю, это невозможно без перевода pdf в doc, чего бы я хотел максимально избежать.

(Ответить) (Уровень выше) (Ветвь дискуссии)


[info]fima@lj
2007-11-23 04:17 (ссылка)
Имеется ввиду, печатать уменьшенные копии двух страниц на одном листе, например, вот так (http://qub.com/Eugene/lj/bbb-2.pdf). Можно на одном листе печатать и больше, но может получится слишком мелко и тяжело читать. Если идея нравится, пришлите ваши pdf и я их сконвертирую, как это сделать самому под виндами я не знаю, а на маке это практически встроено в систему.

(Ответить) (Уровень выше) (Ветвь дискуссии)


[info]bbb@lj
2007-11-23 04:58 (ссылка)
Конечно, именно об этом я и говорю. Я именно так и распечатываю большинство pdf-ов, это называется "multiple pages per sheet", даже акробат ридер это делает с легкостью. Но если таким образом распечатывать тексты, набранные через два интервала, то при таком распечатывании буквы уменьшатся до нечитаемых. А вот если убрать пустые строки интервалов - все было бы намного удобнее.

(Ответить) (Уровень выше)


[info]9000@lj
2007-11-23 05:01 (ссылка)
Это везде "встроено в систему" в том смысле, что в pdf можно печатать как на принтер, задав соотв. размещение нескольких страниц на листе.

(Ответить) (Уровень выше)


[info]9000@lj
2007-11-23 04:59 (ссылка)
Боюсь, если с простой текстовой частью pdf-ов как-то можно расправляться, то стоит оказаться там формуле или диаграмме, и привет. А в диссертациях этого, поди, полно.

(Но мне проще, я и обычный-то текст печатаю себе размером в 7 пунктов, а то и в 6.)

(Ответить) (Уровень выше) (Ветвь дискуссии)


[info]bbb@lj
2007-11-23 05:05 (ссылка)
В диссертациях, которые меня интересуют, формул обычно мало :)))

Проблема в том, как именно расправиться, не переделывая файл в вордовский (то есть не корежа пагинацию, примечания, разбивку на строки и т.д, и т.п). Похоже, проблема не решается :(

(Ответить) (Уровень выше)

во многих pdf читаалках можно вырезать текст
[info]freedom_of_sea@lj
2007-11-23 05:33 (ссылка)
и вставить куда хотите

(Ответить)