Войти в систему

Home
    - Создать дневник
    - Написать в дневник
       - Подробный режим

LJ.Rossia.org
    - Новости сайта
    - Общие настройки
    - Sitemap
    - Оплата
    - ljr-fif

Редактировать...
    - Настройки
    - Список друзей
    - Дневник
    - Картинки
    - Пароль
    - Вид дневника

Сообщества

Настроить S2

Помощь
    - Забыли пароль?
    - FAQ
    - Тех. поддержка



Пишет temmokan ([info]temmokan)
@ 2010-10-25 22:52:00


Previous Entry  Add to memories!  Tell a Friend!  Next Entry
Музыка:Rolling Stones - Paint It Black

Шей да пори, или Будешь тут добрым
Шей да пори — не будет пустой поры. Вот уже который раз даю себе честное благородное слово начать писать сугубо положительно, конструктивно и доброжелательно. Но куда уж там!

Вот нужно мне .doc преобразовать в .html. Естественно, это все умеют. И MS Word, и OpenOffice Writer, и AbiWord, и много кто. Но если по поводу итогов работы первого и так всё понятно &mdsah; привычка программистов этой конторы любые гланды удалять сугубо автогеном и исключительно через задний проход — имманентная их черта; то с OO и прочими я даже слегка растерялся.

Ну почему после преобразования заголовка я вижу конструкции вида

<H1>Заголовок </H1><H1></H1><H1>произведения</H1>

? Недостаточно мозгов, чтобы выкосить подобные огрехи?

Почему все теги пишутся заглавными буквами? Господа, вы хоть немного читаете спецификации XHTML и планы развития языка разметки?

Почему вся типографика вида двойных угловых кавычек и длинных тире остаётся как есть, а не переводится в HTML entity? Что, господа программисты не в курсе, что есть &laquo; и тому подобное?

Почему вместо того, чтобы все стили определить в заголовке, и далее использовать классы, эти умники помимо огромной шапки стилей в заголовке фаршируют каждый тег чёртовой уймой встроенных стилей? Религия не позволяет делать всё НЕ через одно место?

Я, конечно, понимаю, что буквально десятком регулярных выражений вся эта жуткая свалка превращается в причёсанный и умытый HTML, но доколе, блин?

...Вот так и приучаешься к осознанию: хочешь, чтобы что-то работало как следует — делай всё сам. Жаль только, что жизнь коротка, а в сутках всего 24 часа.


(Добавить комментарий)


[info]vorchunn@lj
2010-10-25 14:07 (ссылка)
Во-во, мне регулярно по работе приходится с этим конвертированным ужасом бороться. Впрочем, те же cms-ы аналогично код громоздят ;/

(Ответить) (Ветвь дискуссии)


[info]temmokan@lj
2010-10-25 19:23 (ссылка)
CMS да, тоже как сделают... Такое ощущение, что производство нормального, читабельного HTML там считают лютым эстетством.

(Ответить) (Уровень выше)


[info]doldonius@lj
2010-10-25 15:15 (ссылка)
Очень похоже на банальную лень: вместо полноценной трансляции просто свое внутреннее представление текста обрамляют слегка похожим на правду HTML, и типа опа.

Я уже давно плюнул. Черновики пишу в plaintext, а когда текст в основном собран — тупеньким скриптом на bash добавляю базовую разметку. Дальше, если что, руками.

(Ответить) (Ветвь дискуссии)


[info]temmokan@lj
2010-10-25 19:25 (ссылка)
Ну, если говорить про себя самого, то я в итоге написал для LyX самодельные конвертеры в HTML/RTF и тоже чувствую себя спокойно. TeX особенно легко во что угодно конвертируется, вследствие структуры.

Однако и там тоже не всё в порядке с преобразованием - известные мне конвертеры в упомянутые два формата тоже плодят жуткий ужас. Действительно, трансляция безо всякой оптимизации полученного представления.

(Ответить) (Уровень выше)


[info]ext_298172@lj
2010-10-25 15:50 (ссылка)
а может, это следствие багов внутренней разметки в текстовом процессоре? Ибо, по логике, преобразование должно производиться as is, без самодеятельности, иначе на каждый чих не наздравствуешься. Т.е. "мусор" должен быть убираем всегда, вне зависимости от формата сохранения. И глядишь, "толстый" RTF окажется более стройным. Было бы интересно узнать, насколько мусорный и неоптимизированный получается текст в самом редакторе...

(Ответить) (Ветвь дискуссии)


[info]temmokan@lj
2010-10-25 19:29 (ссылка)
Строго говоря, форматы все неоднозначны. Если я ещё как-то могу представить, что DOC и HTML взаимозаменяемы (и то придётся тучу служебной информации в DOC куда-то прятать - в комментарии? а обратно как?) в смысле передачи информации, то не все прочие пары форматов таковы.

А потому, если глядеть с точки зрения пользователя, надо давать опцию оптимизировать под конечный формат с предупреждением, что форматы неравноценны и часть информации (стили и пр.) может быть потеряна.

Упомянутые "врезки" закрывающего-открывающего тега демонстрируют, что и во внутреннем представлении творится такой бардак, что лучше не интересоваться лишний раз.

(Ответить) (Уровень выше)


[info]starcat13@lj
2010-11-11 09:16 (ссылка)
работают с лозунгом "HTML должен читать браузер, а не человек"? :(

(Ответить) (Ветвь дискуссии)


[info]temmokan@lj
2010-11-12 11:07 (ссылка)
Угу, видимо. Иначе трудно понять, отчего всё именно так.

(Ответить) (Уровень выше) (Ветвь дискуссии)


[info]starcat13@lj
2010-11-16 00:48 (ссылка)
скорее всего хватает работы в других местах, а качество HTML'я волнует совсем немного людей (которым еще и весьма сложно угодить, к тому же)

(Ответить) (Уровень выше)