| |||
|
|
По моему вы путаете Unicode и UTF-8 ...а UTF увеличивает текст вдвое против ASCII. и это </i>Кроме того, UTF вынуждает кодировать двумя байтами такие тексты, где диакритики НЕТ ВОВСЕ, а это уже полный дурдом.</i> UTF-8 является НАДМНОЖЕСТВОМ ASCII, потому как в ASCII стандартизированы только символы 32-127, а в UTF-8 эти символы кодируются одним октетом. Так что французский текст, кодированный в UTF-8 будет МЕНЬШЕ того же текста в HTML, кроме того ОТСУТСТВУЕТ проблема кодировок. Попробуйте в том же HTML написать текст со смешанными кодовыми страницами: словарь например и подумайте, что Вы будете указывать в < META > UTF-ов же всего три: UTF-8, UTF-16 и UTF-32 и это просто способы кодирования UNICODE-символов. Главное же не это, а то, что никакого стандарта Юникод НЕТ, потому что он невозможен - нельзя забить в одну таблицы все стандарты ISO, по всем языкам, поскольку эти стандарты постоянно меняются. Соответственно, есть десяток разных стандартов UTF, и каждый год появляются новые. Есть стандарт UNICODE и при этом туда добавляются новые символы. Он так и называется Unicode Standard и постепенно включает в себя стандарты ISO/IEC. В первой юникодовой странице содержатся все более-менее часто употребляемые алфавиты. Дополнительные юникодные страницы вводятся только для всяких китайских и прочих, которые просто НЕВОЗМОЖНО впихнуть в 256-символьную кодовую страницу (в одном традиционном китайском 60000+ иероглифов). ЗЫ: А латех действительно хорош. Но не столько способом хранения инфы, сколько КАЧЕСТВОМ сверстанного документа. Добавить комментарий: |
||||