Войти в систему

Home
    - Создать дневник
    - Написать в дневник
       - Подробный режим

LJ.Rossia.org
    - Новости сайта
    - Общие настройки
    - Sitemap
    - Оплата
    - ljr-fif

Редактировать...
    - Настройки
    - Список друзей
    - Дневник
    - Картинки
    - Пароль
    - Вид дневника

Сообщества

Настроить S2

Помощь
    - Забыли пароль?
    - FAQ
    - Тех. поддержка



Пишет dibr ([info]dibr)
@ 2007-12-22 23:21:00


Previous Entry  Add to memories!  Tell a Friend!  Next Entry
pdf-doc
     По работе тут понадобилось "перегнать pdf в doc". С целью редактирования, то есть "погрузить как картинку" не катит.
     После нескольких попыток "сделать штатно" и "сделать хоть как-то" (в процессе с удивлением узнал, что acrobat умеет "save as microsoft word (.doc)", а самый-новый-ворд тоже типа умеет импорт из pdf), выяснил что. Что наилучший с точки зрения потребности в правке результат получается если pdf распечатать, отсканировать, и зарядить в finereader :-)))

     Ну, принтер-сканер я, конечно, пропустил - сделал экспорт в jpeg и скормил эту груду картинок файнридеру, но сама, блин, концепция межформатного преобразования...


(Добавить комментарий)


[info]azgar@lj
2007-12-22 18:02 (ссылка)
Интересно, меня буквально на днях спрашивали, не знаю ли я решения такой же проблемы.
Но через файнридер я не додумался :)

(Ответить)


[info]alex_rex@lj
2007-12-22 18:23 (ссылка)
А что, файнридер разучился открывать пдф напрямую? ;)

(Ответить) (Ветвь дискуссии)


[info]dibr@lj
2007-12-22 18:39 (ссылка)
Не знал :-) Значит, разработчики файнридера явно были в курсе проблем тех, кто получает документацию в pdf :-)

(Ответить) (Уровень выше)


[info]rain251@lj
2007-12-22 21:09 (ссылка)
файн давно хавает напрямую пдф.
есть куча вменяемых конвертеров пдф2док

(Ответить)


[info]ex_astur@lj
2007-12-22 21:58 (ссылка)
Вот на таких задачах и демонстрирует свою адскую сущность мир Microsoft/Adobe!

(Ответить) (Ветвь дискуссии)


[info]malykh@lj
2007-12-22 22:10 (ссылка)
Да адская сущность Adobe тут особо не влияет (влияет, но не особо).
Это адская сущность людей вообще.
PDF - это выходной формат по своей структуре. Основное назначение которого - стабильно "полиграфическое" оформление текстов. "Полиграфическое" - это т.е. пригодное для печати без необходимости проводить разбивку на страницы и т.д. Т.е. в первую очередь ориентация на то, как будет выглядеть документ, а не на его структуру. И всегда есть возможность загнать в тот же PDF фактически растровое изображение.
Потому универсальный PDF 2 DOC конвертор просто не может существовать.

Другое дело, что часто PDF применяют тогда, когда он особо и не нужен. Здесь уж просто отсутствие вменяемых альтернатив. DOC/RTF - не смешно. TXT - примитивно. HTML - можно, но громоздко и местами неудобно. PS - фактически тот же PDF. TeX/LaTeX - совсем уж для гиков. И т.д.

(Ответить) (Уровень выше) (Ветвь дискуссии)


[info]ex_astur@lj
2007-12-22 22:51 (ссылка)
Это ваше "не смешно" выглядит как-то не информативно. RTF и его клоны - это естественный формат для представления часто редактируемых обогащённых текстов, причём это следует не из оценки, а из определения. Его надо не заменять, а совершенствовать.

PDF и RTF (и их клоны) отличаются тем, что в одном случае представление хранимых данных линейно и переводится в двухмерный вид каждый раз заново без учёта несовместимости параметров страниц и конкретной программы, а в другом случае представление хранимых данных изначально двумерно и состоит из самостоятельных объектов, привязанных не к своему месту в тексте, а к точным координатам на листе/странице. Однозначное преобразование PDF в RTF попросту невозможно, точно так же, как невозможно однозначно преобразовать трёхмерное изображение к двумерному. Это было бы очевидно, если бы люди понимали суть и предназначение этих форматов, но Microsoft так всех запутал со своей универсализацией решений, что появляются разные заблуждения типа "PDF - это формат для технической документации" или "DOC - это формат для офисных документов".

(Ответить) (Уровень выше) (Ветвь дискуссии)


[info]malykh@lj
2007-12-23 03:59 (ссылка)
Про RTF я знаю очень многое, благо я занимался технической консультацией разработки софта как для чтения, так и для генерации RTF, потому мне именно смешно.
А вы, очевидно из вашего ответа, про техническую изнанку RTF мало знаете, потому предлагаете его совершенствовать. Это не выход. Изначально RTF настолько кривой, что понадобилось подставлять костыли, когда пошли его расширения в новых и новых версиях Word. Посмотрите ради интереса описания различных версий RTF и особенно его эволюцию - волосы дыбом встают.

Кстати, к вопросу, интересующимся темой рекомендую еще посмотреть HTML 5. Очевидно, что часть ниши DocBook и даже FictionBook нововведения в HTML 5 позволят отхватить.

(Ответить) (Уровень выше) (Ветвь дискуссии)


[info]ex_astur@lj
2007-12-23 18:38 (ссылка)
Знаете, вот что не имеет отношения к делу, так это то, кого Вы консультировали.

Про техническую изнанку речи не было ВООБЩЕ! Хотя если бы мне было не лень аргументированно обсудить ЕЩЁ И эту тему, то открытые спецификации убедили бы меня больше, чем весь ваш и мой опыт вместе взятый.

Разница между HTML и RTF исключительно в конкретике, которая может меняться от версии к версии (именно это я и имею в виду под соверщенствованием). По сути оба эти формата линейные и оба допускают неоднозначность при отображении, то есть зависят от конкретной программной реализации. Все остальные детали ТОЖЕ интересны и представляют отличую тему для обсуждения, но это будет ДРУГОЕ обсуждение. Проблема PDF->RTF лежит в другой плоскости. Если хотите, то можете подставить в мой предыдущий коммент HTML на место RTF и почти ничего не изменится. Можете хоть TeX подставить.

(Ответить) (Уровень выше) (Ветвь дискуссии)


[info]malykh@lj
2007-12-23 22:01 (ссылка)
Вот-вот. Техническую сторону RTF вы не знаете, а обсуждать пытаетесь.
Смешная демагогия. Как говорилось в фидошные времена: RTFM.

(Ответить) (Уровень выше) (Ветвь дискуссии)


[info]ex_astur@lj
2007-12-23 22:20 (ссылка)
Извините, что отнял у Вас время. Мне вообще не следовало обращать на Вас внимания, но в Димином блоге обычно тусуются вполне вменяемые люди, способные хотя бы прочесть и понять комментарий, прежде чем писать не относящуюся к делу ерунду и переходить на личности, и я по привычке начал что-то объяснять. Больше не повторится.

(Ответить) (Уровень выше) (Ветвь дискуссии)


[info]malykh@lj
2007-12-23 22:25 (ссылка)
Время, конечно, вы отняли.
Но это компенсируется вашим смешным поведением. Люблю посмеяться, спасибо.
И вот опять вам спасибо за "вменяемые люди, способные хотя бы прочесть и понять комментарий" в ваших уста. Вы просто юморист, не побоюсь просто этого слова "Петросян", пусть и демагог по натуре, но так еще забавнее.
А вообще да, вы правы, хорошо, что вы пойдете делать RTFM и такое больше не повторите. Смех смехом, но общий уровень компетенции вам, конечно, надо поднимать.

(Ответить) (Уровень выше)