Лыцарь пичальнава образа - March 31st, 2007 [entries|archive|friends|userinfo]
silly_sad

[ userinfo | ljr userinfo ]
[ archive | journal archive ]

March 31st, 2007

UTF-16 [Mar. 31st, 2007|10:29 am]
ну если верить что iconv следует спецификации, то получается сногсшибательный эффект.
обозначим оператор "echo -n $X | iconv -f koi8-r -t utf-16" как UTF16(X)

и заметим что если текст Х имеет длину N байт то текст UTF16(X) имеет длину ни разу не 2N байт, а 2N+2. Оказывается текст UTF16(X) всегда имеет вначале два фиксированных байта. Математики начинают судорожно вспоминать разницу между подпространством и многообразием. Чо-то там про замыкание относительно каких-то операций....
Какое интересное положение в тексте занимают эти байты! Какова роль этих байт? Надо спросить у Витуса, который говорил мне, что Юникод навсегда избавит нас от этих мерзких переключателей кодовых страниц.

Итого:
UTF16(X) + UTF16(Y) != UTF16(X+Y)
кто-то ещё хочет сказать что всё хорошо ?
Link8 comments|Leave a comment

navigation
[ viewing | March 31st, 2007 ]
[ go | Previous Day|Next Day ]