| Comments: |
rODINA IM DALA @NIKOD - NOSI, NOSI @NIKOD! bLQDX... nE HO^U, HO^U DELITX NA BAJTY! ~TO TAKOE? |TO TERMINAL? |TO TERMINAL?! sUKI. mUDA^XE. pROGRAMISTY! nA BAJTY REVUT, BIT SREZA@T PIDORY, BLQDX, EBANYE
А так то спасибо, напомнил о. Посмотрел и охуел даже, уже 100К позиций в таблице засрали, охуеть не встать.
![[User Picture]](http://lj.rossia.org/userpic/197531/22349) | | From: | ketmar |
| Date: | August 25th, 2016 - 02:26 pm |
|---|
| | | (Link) |
|
ну, у меня системная локаль — koi8. я эту утсрань не использую, поддержка (вот в таком виде, ога) мне нужна только для того, чтобы открывать ебанутые файлы с утсранью.
![[User Picture]](http://lj.rossia.org/userpic/2144/2591) | | From: | prool |
| Date: | August 26th, 2016 - 11:07 am |
|---|
| | | (Link) |
|
А мой MUD поддерживает UTF-8, koi8-r, cp1251, а также транслитерацию и режим удвоения буквы я (так надо
![[User Picture]](http://lj.rossia.org/userpic/197531/22349) | | From: | ketmar |
| Date: | August 26th, 2016 - 11:13 am |
|---|
| | | (Link) |
|
круто, чо. к счастью, мне всё это не надо, я редактор для себя делаю. поэтому меня устраивает жестоко прибитая гвоздями таблица unicode<->koi8. а что в таблице не находится, то идёт нахер и превращается в точку или знак вопроса. иба ваистену.
![[User Picture]](http://lj.rossia.org/userpic/2144/2591) | | From: | prool |
| Date: | August 26th, 2016 - 11:15 am |
|---|
| | | (Link) |
|
Имплементируюя Юникод я использовал и стандартную библиотеку libiconv и свою функцию писал и понял: Юникод умеет много гитик
![[User Picture]](http://lj.rossia.org/userpic/197531/22349) | | From: | ketmar |
| Date: | August 26th, 2016 - 11:32 am |
|---|
| | | (Link) |
|
да. он только в sanity не умеет, потому что его авторы — безумные дегенераты.
![[User Picture]](http://lj.rossia.org/userpic/197531/22349) | | From: | ketmar |
| Date: | August 25th, 2016 - 02:30 pm |
|---|
| | | (Link) |
|
да пиздец вообще. к тому же unicode is defective by design: why unicode sux.
Просмотрел по диагонали, проникся БОЛЬЮ. Всё(ё!) так, юникод помойка. Там же еще, наверное, количество буковок не посчитаешь не сосканировав блядь нахуй всё. И правильно! Идите все нахуй, у нас не буквы, а ГРАФЕМЫ.
![[User Picture]](http://lj.rossia.org/userpic/197531/22349) | | From: | ketmar |
| Date: | August 25th, 2016 - 02:53 pm |
|---|
| | | (Link) |
|
хуй. у них буквы. иногда. а иногда графемы. потому что дегенеративные создатели юникода срать хотели на свои же заявления.
ибо если графемы, то какого хуя там есть английская «A» и кирилическая «А»? это ОДНА И ТАЖЕ ГРАФЕМА, БЛЯДЬ. то есть, заебок, разделение по языку. по языку? сосни хуйца: сербской «А» нет. почему? а нам оттуда, из Благословенной Земли, недосуг ваши тарабарские наречия различать: у нас есть Наш Язык, и прочая‐непонятная‐хуйня.
и вот так у них ВСЁ сделано.
![[User Picture]](http://lj.rossia.org/userpic/197531/22349) | | From: | ketmar |
| Date: | August 25th, 2016 - 02:58 pm |
|---|
| | | (Link) |
|
миня аж трисёт! проблел вон в «та же» даже забыл.
проБЛел тоже описка символичная. Вот хороше же жить, когда не знаешь/забыл как там все унутре организовано. Ничто не тревожит, спишь хорошо.
Ну если оставить одну только графему А для разных языков, энтропия достигнет уже эпических масштабов. Как потом сортировать по этих графемах? Но нахуя графемы сортировать, упоролись штоле? Целый КЛАСС ПРОБЛЕМ возникает на ровном месте переменной длины!
![[User Picture]](http://lj.rossia.org/userpic/197531/22349) | | From: | ketmar |
| Date: | August 25th, 2016 - 04:03 pm |
|---|
| | | (Link) |
|
>Но нахуя графемы сортировать, упоролись штоле? именно. но «пользователи юникода» зачем‐то занимаются именно этим.
а сортировать просто: по collation. несмотря на Весь Такой Крутой Юникод, создатели баз данных не купились, и до сих пор имеют collations.
| From: | (Anonymous) |
| Date: | August 25th, 2016 - 02:57 pm |
|---|
| | | (Link) |
|
Что такое "буковка"? Ы со знаком ударения - это одна буковка или две? А таб это одна или четыре? И зачем их вообще считать, если ты не собрался рендерить их на экране? А если собрался, тебе по-любому придется спрашивать у шревтового движка - кого ебет, сколько там "буковок", если у них физические размеры могут быть любыми?
![[User Picture]](http://lj.rossia.org/userpic/197531/22349) | | From: | ketmar |
| Date: | August 25th, 2016 - 02:59 pm |
|---|
| | | (Link) |
|
одна, естественно. впрочем, любителям уникодосрани позволительно не знать, что графема с диакритическим знаком всё ещё одна буква: у оных любителей мозг не больше ореха, не помещается туда такое сложное.
| From: | (Anonymous) |
| Date: | August 25th, 2016 - 03:08 pm |
|---|
| | | (Link) |
|
В каком смысле одна буква? В смысле рисования на экране - разумеется, в смысле представления - нахуй нужна отдельная сущность "ы с ударением", когда есть знак "ударение", который можно подставлять куда угодно?
![[User Picture]](http://lj.rossia.org/userpic/197531/22349) | | From: | ketmar |
| Date: | August 25th, 2016 - 04:02 pm |
|---|
| | | (Link) |
|
в самом прямом смысле буква. ты задал идиотский вопрос, а теперь озадачен тем, что получил идиотский ответ.
| From: | (Anonymous) |
| Date: | August 25th, 2016 - 02:50 pm |
|---|
| | | (Link) |
|
нахуй (http://utf8everywhere.org/)
![[User Picture]](http://lj.rossia.org/userpic/197531/22349) | | From: | ketmar |
| Date: | August 25th, 2016 - 02:51 pm |
|---|
| | | (Link) |
|
совершенно верно: эта срань идёт нахуй.
| From: | (Anonymous) |
| Date: | August 25th, 2016 - 02:53 pm |
|---|
| | | (Link) |
|
Нихуя не понял - у тебя редактор умеет читать утф, но добавляет к буквам пробел за каким-то хером (при том что кириллица это 3 байта) - чо это за шизуха вообще? Зачем?
![[User Picture]](http://lj.rossia.org/userpic/197531/22349) | | From: | ketmar |
| Date: | August 25th, 2016 - 02:54 pm |
|---|
| | | (Link) |
|
с какого хуя три байта? два, естественно. и там не пробел, там «точка‐в‐центре», что обозначает «срань неизвестная».
| From: | (Anonymous) |
| Date: | August 25th, 2016 - 02:57 pm |
|---|
| | | (Link) |
|
Кириллица в утф-8 это три байта.
| From: | (Anonymous) |
| Date: | August 25th, 2016 - 02:59 pm |
|---|
| | | (Link) |
|
А хотя хуй знает. Вроде реально два. Я лох.
| From: | (Anonymous) |
| Date: | August 25th, 2016 - 03:00 pm |
|---|
| | | (Link) |
|
это я с ем-дэшем перепутал
![[User Picture]](http://lj.rossia.org/userpic/197531/22349) | | From: | ketmar |
| Date: | August 25th, 2016 - 03:06 pm |
|---|
| | | (Link) |
|
бывает. натурально, оно всё ещё рисует побайтово, просто для невалидных символов ставит «точку‐в‐середине» (и да, не скипает их как один символ).
| From: | (Anonymous) |
| Date: | August 25th, 2016 - 03:13 pm |
|---|
| | | (Link) |
|
Я понял - он у тебя не умеет читать утф, это либа, которой ты рисуешь буковки в терминале, умеет читать утф (ей, очевидно, кроме поинтера на чар ничего не надо). Расово!
![[User Picture]](http://lj.rossia.org/userpic/197531/22349) | | From: | ketmar |
| Date: | August 25th, 2016 - 04:06 pm |
|---|
| | | (Link) |
|
вообще‐то «чтение утф» делается точно так же, как и чтение любых других байтов. и нет, как раз терминальный слой вообще ничего об утфак не знает и знать не желает, он исключительно однобайтовый. точки ставит как раз редактор, если включить в нём «utfuck mode».
Хуясе вы тут цирк устроили (мы вообще-то говорили за юникод год-полтора назад). UTF-8 сделан для хранения и передачи по сети, а для обработки надо переводить в UCS-4, там всё ровно. Но тебе же жалко по 4 байта на любой символ (к вопросу о том куда деваются гигабайты памяти)? Тогда энджой ёр ютфак. Koi-8 my ass.
![[User Picture]](http://lj.rossia.org/userpic/197531/22349) | | From: | ketmar |
| Date: | August 26th, 2016 - 02:54 am |
|---|
| | | (Link) |
|
мне не жалко. мне невозможно. вообрази на минуточку, что открываемый текст, например, нихуя не в утсрани, и ваще не юникод, но имеет символы выше 127. что будет при попытке его прочитать, а потом записать? ага, пиздец будет.
и нет, мне не жалко памяти, я бы с удовольствием всё делал в UCS-4. но никакой API не принимает на вход UCS-4, все хотят просто чары. причём я сейчас про системные API — дишечка как раз почти везде понимает dchar.
так вот. непонимание API обозначает, что у меня будет мешанина строк и бесконечные конвертации. не то, чтобы для движка редактора это было сильно критично (для него другое критично, см. выше), но я ебал эти пиздопляски в любом случае.
p.s. всё равно сделал уже убиение «лишних» символов в режиме «утфак». тормозит адово (ну как адово: юзеру незаметно, но я ЗНАЮ, что тормозит, лол), но пользователи юникода всё равно привыкли страдать, чо.
| From: | (Anonymous) |
| Date: | August 26th, 2016 - 06:50 am |
|---|
| | | (Link) |
|
Поглядите на этот экспонат - думает, что одинаковый размер "символов" сделает ему "ровно".
![[User Picture]](http://lj.rossia.org/userpic/197531/22349) | | From: | ketmar |
| Date: | August 26th, 2016 - 07:12 am |
|---|
| | | (Link) |
|
ну, сделает. до первого compose или rtl, конечно, но пусть тешатся.
| From: | (Anonymous) |
| Date: | August 26th, 2016 - 07:45 am |
|---|
| | | (Link) |
|
Думает, наверное, что у строки есть "длина". | |