UTF-16 |
[Mar. 31st, 2007|10:29 am] |
ну если верить что iconv следует спецификации, то получается сногсшибательный эффект. обозначим оператор "echo -n $X | iconv -f koi8-r -t utf-16" как UTF16(X)
и заметим что если текст Х имеет длину N байт то текст UTF16(X) имеет длину ни разу не 2N байт, а 2N+2. Оказывается текст UTF16(X) всегда имеет вначале два фиксированных байта. Математики начинают судорожно вспоминать разницу между подпространством и многообразием. Чо-то там про замыкание относительно каких-то операций.... Какое интересное положение в тексте занимают эти байты! Какова роль этих байт? Надо спросить у Витуса, который говорил мне, что Юникод навсегда избавит нас от этих мерзких переключателей кодовых страниц.
Итого: UTF16(X) + UTF16(Y) != UTF16(X+Y) кто-то ещё хочет сказать что всё хорошо ? |
|
|