Не верь, не бойся, не проси - [entries|archive|friends|userinfo]
phantom

[ website | My Website ]
[ userinfo | ljr userinfo ]
[ archive | journal archive ]

[May. 16th, 2021|09:17 pm]
Previous Entry Add to Memories Tell A Friend Next Entry
Буквенные коды стран по ISO 3166**

Теперь разберём двух- и трёх-буквенные коды стран - членов ООН. Но более спокойно, чем в прошлый раз (хорошего понемножку). В сравнении с прошлым постом я вернул Сао Томе Принципе, - ошибся, никто ведь не сокращает так. Британию же переименовал в "Великую" обратно. I made Britain great again, хехе. Это чтобы под алгоритм подогнать.

Коды из 2 букв применяются в инете для топ-доменов. Оба вида кодов (из 2 и 3 букв) применяются в справочниках, на почте и пр. Задался я вопросом, в чём логика их распределения? И, как обычно, начинаю с методичного вопроса "а как сам бы я распределил коды"?

Коды бы я раздавал следующим образом. Для однословных названий тупо отщепляем первые 2 или 3 буквы. Для остальных сначала скипаем служебные слова (=and). Для двусловных - берём первую букву от первого слова и первую (или первые две) от второго. Для трёхсловных 3-буквенный код образовуем от первых букв. Это по аналогии с типичным сокращением имён john smith = j.smith = j.sm. = j.s. или john jack smith = j.j.s. (Заметки на полях: можно считать, что >3 слов в названиях нет, мы их посокращали в прошлый раз).

Этой логике следуют коды 193 - 138 = 55 стран:
afghanistan albania argentina australia azerbaijan belgium bolivia brazil |burkina faso| canada colombia |costa rica| cuba cyprus czechia djibouti ecuador egypt eritrea ethiopia finland france gabon georgia ghana hungary india italy jordan kenya kiribati laos liechtenstein luxembourg namibia nicaragua norway panama peru qatar russia rwanda |sao tome and principe| |sierra leone| somalia syria thailand tonga |trinidad and tobago| uganda |great britain| usa uzbekistan venezuela yemen

Почему остальные не следуют этой логике? Несколько причин вижу. Двухбуквенным кодам тесновато, на 200 стран 700 кодов, и есть перехлёсты (и даже 3-буквенные: australia & austria). Тем более к 200 странам примешаны 50 внешних территорий. Также устаревшие, но зарезервированные коды (распавшиеся, объединившиеся, переименовавшиеся страны). И коды забуканные параллельными конвенциями. Наконец, в 1974 году, когда попытались создать ISO 3166, уже пришлось дело иметь с десятками подобных стандартов и приводить их к единому знаменателю. Думаю, основное влияние на этот процесс было у конвенции по дорожному движению от 1949 года (номерных знаков). Так что, учитывая неравномерность загруженности букв, им там тесновато.*

Чтобы оценить неравномерность загруженности, построим для наглядности распределение по первой букове стран:

first-letter-distribution

Трёхбуквенные коды считаются ближе к названию оригинальному, поэтому следующую гипотезу выдвигаем: 3-буквенный код будет как и раньше, "логичным" (из первых 3 букв названия, в основном), а 2-буквенный - выкидываем среднюю. Этому принципу ещё 138 - 121 = 17 стран следуют:
andorra armenia guyana jamaica kazakhstan korea mexico mozambique pakistan |papua new guinea| poland senegal suriname sweden tunisia turkey tuvalu

Уверен, извечный бардак в головах тоже роль сыграл, как это обычно бывает. Отсутствие чёткой концепции и изменение подхода сквозь годы. Бездумность. Это как программисты в слове из 7 букв выбрасывают парочку самым случайным образом, а потом вспоминают, как оно там было названо.

Так что оставшиеся делим ещё на 2 группы. Первая будет ещё остаткам здравого смысла следовать: для 3-буквенного кода выделяем первую букву плюс 2 согласные, а 2-буквенный код уж будет, как придётся (обычно средняя или 3 буква выбрасывается). Это отщепляет 121 - 84 = 37 стран:
(bh bhr bahrain) (bb brb barbados) (by blr belarus) (bz blz belize) (bn brn brunei) (cm cmr cameroon) (cl chl chile) (cn chn china) (sv slv salvador) (ee est estonia) (gm gmb gambia) (gr grc greece) (gt gtm guatemala) (hn hnd honduras) (ir irn iran) (iq irq iraq) (ie irl ireland) (il isr israel) (jp jpn japan) (kw kwt kuwait) (lb lbn lebanon) (lr lbr liberia) (ly lby libya) (mg mdg madagascar) (mt mlt malta) (mr mrt mauritania) (mn mng mongolia) (np npl nepal) (om omn oman) (ph phl philippines) (pt prt portugal) (rs srb serbia) (sc syc seychelles) (sd sdn sudan) (tj tjk tajikistan) (ua ukr ukraine) (zm zmb zambia)

Оставшиеся 84 не следуют никакой когерентной системе. Где случайным образом буквы выбраны, где локальное название страны использовалось, где исторические причины. Короче, бардак:
(dz dza algeria) (ao ago angola) (ag atg |antigua and barbuda|) (at aut austria) (bs bhs bahamas) (bd bgd bangladesh) (bj ben benin) (bt btn bhutan) (ba bih |bosnia and herzegovina|) (bw bwa botswana) (bg bgr bulgaria) (bi bdi burundi) (cv cpv |cabo verde|) (kh khm cambodia) (cf caf car) (td tcd chad) (km com comoros) (cg cog congo) (cd cod drc) (ci civ |côte d'ivoire|) (hr hrv croatia) (dk dnk denmark) (dm dma dominica) (do dom |dominican republic|) (gq gnq |equatorial guinea|) (sz swz eswatini) (fj fji fiji) (de deu germany) (gd grd grenada) (gn gin guinea) (gw gnb guinea-bissau) (ht hti haiti) (is isl iceland) (id idn indonesia) (kp prk korea) (kg kgz kyrgyzstan) (lv lva latvia) (ls lso lesotho) (lt ltu lithuania) (mw mwi malawi) (my mys malaysia) (mv mdv maldives) (ml mli mali) (mh mhl |marshall islands|) (mu mus mauritius) (fm fsm micronesia) (md mda moldova) (mc mco monaco) (me mne montenegro) (ma mar morocco) (mm mmr myanmar) (nr nru nauru) (nl nld netherlands) (nz nzl |new zealand|) (ne ner niger) (ng nga nigeria) (mk mkd macedonia) (pw plw palau) (py pry paraguay) (ro rou romania) (kn kna |saint kitts and nevis|) (lc lca |saint lucia|) (vc vct |saint vincent|) (ws wsm samoa) (sm smr |san marino|) (sa sau |saudi arabia|) (sg sgp singapore) (sk svk slovakia) (si svn slovenia) (sb slb |solomon islands|) (za zaf |south africa|) (ss ssd |south sudan|) (es esp spain) (lk lka |sri lanka|) (ch che switzerland) (tz tza tanzania) (tl tls timor) (tg tgo togo) (tm tkm turkmenistan) (ae are uae) (uy ury uruguay) (vu vut vanuatu) (vn vnm vietnam) (zw zwe zimbabwe)

Вот так и забрасываем в анки по пачкам, с разбросом в недельку. Первые пачки учить по описанной "мнемонике". Последнюю... как в анекдоте: В грузинской школе урок русского языка. Учитель: "Запомнытэ, дэти, тарелька и вилька пишется без мягкый знак, а кон, сол и фасол с мягкый знак... Запомнытэ это дэти, ибо понят этого нэвозможно!"

P.S. Ещё чуть сбалансировал, переместив 5 стран из последней в предпоследнюю группу (теперь 42+79), с помощью такого улучшения. Если в слове не хватает согласных (всего 2 их), то добавляем последнюю букву (гласную), чтобы образовать 3-буквенный код... Да, и для распределения в заучивании по времени 2 и 3 группу можно объединить, получается: 55 + 59 + 79 = 193.
LinkLeave a comment

Comments:
From:(Anonymous)
Date:May 16th, 2021 - 08:56 pm
(Link)
хуй будешь?
From:(Anonymous)
Date:May 16th, 2021 - 09:28 pm
(Link)
иди нахуй хуйлашка
From:(Anonymous)
Date:May 17th, 2021 - 01:49 am
(Link)
иди нахуй