Войти в систему

Home
    - Создать дневник
    - Написать в дневник
       - Подробный режим

LJ.Rossia.org
    - Новости сайта
    - Общие настройки
    - Sitemap
    - Оплата
    - ljr-fif

Редактировать...
    - Настройки
    - Список друзей
    - Дневник
    - Картинки
    - Пароль
    - Вид дневника

Сообщества

Настроить S2

Помощь
    - Забыли пароль?
    - FAQ
    - Тех. поддержка



Пишет dolboeb ([info]dolboeb)
@ 2003-11-07 18:48:00


Previous Entry  Add to memories!  Tell a Friend!  Next Entry
Настроение:busy

Помогите с КОИ7
Владимир Петрович Тарасов, будучи где-то там в далекой Америке, написал книгу воспоминаний про Трио Ганелина, в котором он играл на ударных.
Написал он ее на макинтоше одного американского универа.
Там, естественно, в качестве русского шрифта выступало проприетарное убожество Helvetica-самопал, где кодировка — не MacCyrillic, а самая что ни на есть уродская КОИ-7 с доморощенными вариациями.

Prowlo mnogo let s tex por, kogda m[, kak Trio Ganelina ili GT| (Ganelin - Tarasov - |ekasin), kak nas eq` naz[vali, perestali v[stupat' vmeste, ostaviv posle sebj 19-t' programm na 43-x, izdann[x na segodnj, plastinkax i SD.
Bol'winstvo iz nawix kompozicih b[lo sna\ala naigrano na repeticijx, a zatem — kogda m[ opredeljli garmoni\eskih, melodi\eskih i ritmi\eskih porjdok — zapisano na bumage. To\nee skazat' - vs` muz[kal'noe i =mocional'noe razvitie m[ der]ali v golove, a na buma]kax zapis[vali tol'ko sxemu s osnovn[mi punktami, na baze kotor[x v[straivalas' kompozicij. +to pozvoljlo nam, b[t' soverwenno svobodn[mi v nawix improvizacijx vnutri =toh sxem[ - v to ]e vremj strogo prider]ivajs' form[ kompozicii. Poz]e po =toh wpargalke, uva]itel'no naz[vaemuy nami %Partituroh%, m[ igrali na koncerte.
V osnovnom vs` v[straivalos' po prostehweh sxeme. Ka]d[h v Trio otve\al za svoy territoriy. Vj\eslav Ganelin za garmoniy i formu kompozicii, Vladimir |ekasin za melodi\eskoe razvitie, a j za ritmi\eskuy osnovu.

Теперь мне нужно все это щастье сконвертировать в Ворде.
Для чего, понятное дело, нужен конвертор из транслита в кириллицу.
Причем не абы какой, а настраиваемый. Чтобы учесть специфику данной конкретной разновидности кодировки (Ka]d[h otve\al = каждый отвечал).
Возможно, в формате вордового макроса. Даже, наверное, это было бы лучше всего.



(Добавить комментарий)


[info]timson@lj
2003-11-07 04:51 (ссылка)
http://www.artlebedev.ru/tools/decoder/
частично помогает.

(Ответить) (Ветвь дискуссии)


[info]dolboeb@lj
2003-11-07 04:53 (ссылка)
Из транслита в русский? Не припомню в нем такой фичи.

(Ответить) (Уровень выше) (Ветвь дискуссии)


[info]ex_mrparker@lj
2003-11-07 05:00 (ссылка)
здесь не нужен никакой макрос, подойдет просто набор решулярных выражений. если ты пришлешь соответствие всех символов - я могу написать тебе такие выражения.

(Ответить) (Уровень выше) (Ветвь дискуссии)


[info]dolboeb@lj
2003-11-07 05:04 (ссылка)
Спасибо огромное, а как я в ворде буду регекспы юзать?

Я могу тебе прислать файл, либо написать соответствия по алфавиту, просто намекни про формат.

(Ответить) (Уровень выше) (Ветвь дискуссии)


[info]ex_mrparker@lj
2003-11-07 05:10 (ссылка)
ворд поддерживает регекспы с первой версии. присылай текст, который надо перекодировать, на parker@paragraph.ru
как срочно надо?

(Ответить) (Уровень выше) (Ветвь дискуссии)

Посылаю
[info]dolboeb@lj
2003-11-07 05:20 (ссылка)
Хорошо б до середины завтрашнего дня.

(Ответить) (Уровень выше) (Ветвь дискуссии)

Re: Посылаю
[info]ex_mrparker@lj
2003-11-07 05:22 (ссылка)
постараюсь. сделал бы сейчас, но начинаются особенности национальной охоты и я планирую напиться. а с утра сделаю.

(Ответить) (Уровень выше)


[info]arbat@lj
2003-11-07 05:12 (ссылка)
Если там не много фонтов (вряд ли много) - сохраните в текстовой ASCII файл, прогоните через sed, потом - считайте обратно. Ну, или не sed, а perl-то наверняка есть.

(Ответить) (Уровень выше)


[info]dolboeb@lj
2003-11-07 05:05 (ссылка)
Проверил. Не годится.
Лебедевский почтовый декодер не догадывается, что при транслитерации буквы w и v могут означать разное.

(Ответить) (Уровень выше)


[info]el_mariachi@lj
2003-11-07 05:00 (ссылка)
машинистка возьмет по 100 рублей страница. нетехнологично, но работает. или писать скрипт... готовых, скорей всего, нет.

(Ответить) (Ветвь дискуссии)


[info]dolboeb@lj
2003-11-07 05:09 (ссылка)
Готовых были десятки, я прекрасно помню времена, когда оно было актуально. В одном Вечернем Интернете дюжина перекодировщиков рецензировалась, в том числе и настраиваемых произвольно по табличке.

Я когда Наши Сети публиковал в Интернете весной-осенью 1996 года (http://israel.ru/vesti/ ), то для выкладывания их в трех кодировках использовал батч-конвертор.

Смысл моего вопроса - в том, что тогдашние декодеры умерли.
А у очень многих людей остались макросы - вордовые и другие - для транслита. В движке Ленты.Ру даже есть транскодирование на лету.
http://www.lenta.ru:8085/
Но оно осмысленное, а тут нужно бессмысленное, КОИ7 которое.

(Ответить) (Уровень выше)


[info]yuricle@lj
2003-11-07 05:03 (ссылка)
Можно на XSL обычный translate сделать, учитывая, что одному символу в koi-7 соответствует один символ в win-1251.

Единственная проблема, которая может возникнуть -- размер текста, но наверняка решить ее несложно.

Могу попробовать, если не найдется более изящного решения.

(Ответить)


[info]gera@lj
2003-11-07 05:15 (ссылка)
Кажется, мой KOItus принимал custom schemes. Там, по моему, две строки надо было задать в отдельном файле с соответствием. У меня сейчас его нет под рукой (я на работе), но если у тебя сохранился, можешь проверить.

(Ответить) (Ветвь дискуссии)


[info]dolboeb@lj
2003-11-07 22:36 (ссылка)
Сохранился, конечно.
В неожиданном месте:
http://www.israel.ru/klm/russian/gera/gera.htm

(Ответить) (Уровень выше) (Ветвь дискуссии)


[info]gera@lj
2003-11-08 04:26 (ссылка)
Я попробовал сейчас, внес в custom file:

w[]\j
шыжчя

и сконвертировал. Получил:

Proшlo mnogo let s tex por, kogda mы, kak Trio Ganelina ili GT| (Ganelin - Tarasov - |ekasin), kak nas eq` nazыvali, perestali vыstupat' vmeste, ostaviv posle sebя 19-t' programm na 43-x, izdannыx na segodnя, plastinkax i SD.
Bol'шinstvo iz naшix kompozicih bыlo snaчala naigrano na repeticiяx, a zatem — kogda mы opredelяli garmoniчeskih, melodiчeskih i ritmiчeskih porяdok — zapisano na bumage. Toчnee skazat' - vs` muzыkal'noe i =mocional'noe razvitie mы derжali v golove, a na bumaжkax zapisыvali tol'ko sxemu s osnovnыmi punktami, na baze kotorыx vыstraivalas' kompoziciя. +to pozvolяlo nam, bыt' soverшenno svobodnыmi v naшix improvizaciяx vnutri =toh sxemы - v to жe vremя strogo priderжivaяs' formы kompozicii. Pozжe po =toh шpargalke, uvaжitel'no nazыvaemuy nami %Partituroh%, mы igrali na koncerte.
V osnovnom vs` vыstraivalos' po prostehшeh sxeme. Kaжdыh v Trio otveчal za svoy territoriy. Vячeslav Ganelin za garmoniy i formu kompozicii, Vladimir |ekasin za melodiчeskoe razvitie, a я za ritmiчeskuy osnovu.

Добавь остальные буквы и - вперёд.
Или уже не нужно?

(Ответить) (Уровень выше)


[info]morgulis@lj
2003-11-07 05:28 (ссылка)
Антон Борисыч, а почему бы Вам не воспользоваться простым Ctrl-H в Ворде и не заменить все латинские символы на соответствующие русские? Вот что у меня получилось:

Прoшлo мнoгo лeт с тex пoр, кoгдa мы, кaк Триo Гaнeлинa или ГТЧ (Гaнeлин - Тaрaсoв - Чeкaсин), кaк нaс eще нaзывaли, пeрeстaли выступaть вмeстe, oстaвив пoслe сeбя 19-ть прoгрaмм нa 43-x, издaнныx нa сeгoдня, плaстинкax и СД.
Бoльшинствo из нaшиx кoмпoзиций былo снaчaлa нaигрaнo нa рeпeтицияx, a зaтeм — кoгдa мы oпрeдeляли гaрмoничeский, мeлoдичeский и ритмичeский пoрядoк — зaписaнo нa бумaгe. Тoчнee скaзaть - все музыкaльнoe и эмoциoнaльнoe рaзвитиe мы дeржaли в гoлoвe, a нa бумaжкax зaписывaли тoлькo сxeму с oснoвными пунктaми, нa бaзe кoтoрыx выстрaивaлaсь кoмпoзиция. этo пoзвoлялo нaм, быть сoвeршeннo свoбoдными в нaшиx импрoвизaцияx внутри этoй сxeмы - в тo жe врeмя стрoгo придeрживaясь фoрмы кoмпoзиции. Пoзжe пo этoй шпaргaлкe, увaжитeльнo нaзывaeмую нaми “Пaртитурoй”, мы игрaли нa кoнцeртe.
В oснoвнoм все выстрaивaлoсь пo прoстeйшeй сxeмe. Кaждый в Триo oтвeчaл зa свoю тeрритoрию. Вячeслaв Гaнeлин зa гaрмoнию и фoрму кoмпoзиции, Влaдимир Чeкaсин зa мeлoдичeскoe рaзвитиe, a я зa ритмичeскую oснoву.

Как видите, ошибками остались только начала фраз со строчной буквы, но это должен выловить русский спелчекер, которого у меня нет. Все заняло минут 10.

(Ответить)


[info]labas@lj
2003-11-07 05:32 (ссылка)
Я может чего не понимаю, но обычный реплэйсмент в ворде сделает все даже без регэкспов. Соответствие же однозначное? Значит, за 65 где-то вызовов. Полчаса работы, правда тупой.

(Ответить) (Ветвь дискуссии)


[info]morgulis@lj
2003-11-07 05:39 (ссылка)
Как много иногда означают в науке 4 минуты приоритета!

(Ответить) (Уровень выше) (Ветвь дискуссии)


[info]labas@lj
2003-11-07 05:45 (ссылка)
Вот-вот.
Той же проблеме посвящена известная переписка Гея с Люссаком.

(Ответить) (Уровень выше)


[info]ex_ex_kbke@lj
2003-11-07 05:49 (ссылка)
в смысле?

(Ответить) (Уровень выше)


[info]moshkow@lj
2003-11-07 05:56 (ссылка)
Narod werno goworit - ili w worde 65 global replasementov,
libo 10 minut kowyryaniya s SED ili PERL ili AWK

tut tebe bolwanka dlya zatrawki, w nej ostaetsya tol'ko konkretnye posledowatel'nosti zamenit' na to, chto nuzhno.




sed -e '
s/s_ch/sch/g
s/'"'"'e/ye/g
s/'"'"'E/Ye/g
s/[\]$//g
s/---/ - /g
s/e0/j/g
s/I0/J/g
s/[\] / /g
s/[\]\"e/e/g
s/'\''/'/g
s/ sch/ sch/g
s/ SCH/ SCh/g
s/sch/shch/g
s/SCH/Shch/g
s/shch/shch/g
s/SHCH/shch/g
s/zh/zh/g
s/Zh/Zh/g
s/ZH/Zh/g
s/Ch/Ch/g
s/CH/Ch/g
s/KH/H/g
s/kh/h/g
s/ch/ch/g
s/Sh/Sh/g
s/SH/Sh/g
s/sh/sh/g
s/7h/shch/g
s/7H/Shch/g
s/P1/X/g
s/p1/'/g
s/e1/ye/g
s/E1/Ye/g
s/\([uei]\)ts/\1ts/g
s/\([UEI]\)TS/\1TS/g
s/ts/c/g
s/TS/C/g
s/yo/e/g
s/Ju/Yu/g
s/ju/yu/g
s/yu/yu/g
s/Yu/Yu/g
s/YU/Yu/g
s/ja/ya/g
s/Ja/Ya/g
s/jo/e/g
s/je/e/g
s/Je/E/g
s/ya/ya/g
s/Ya/Ya/g
s/YA/Ya/g
s/[\]-//g
s/a/a/g
s/b/b/g
s/c/c/g
s/d/d/g
s/e/e/g
s/f/f/g
s/g/g/g
s/h/h/g
s/i/i/g
s/j/j/g
s/k/k/g
s/l/l/g
s/m/m/g
s/n/n/g
s/o/o/g
s/p/p/g
s/r/r/g
s/s/s/g
s/t/t/g
s/u/u/g
s/w/v/g
s/v/v/g
s/y/y/g
s/z/z/g
s/A/A/g
s/B/B/g
s/C/C/g
s/D/D/g
s/E/E/g
s/F/F/g
s/G/G/g
s/H/H/g
s/I/I/g
s/J/J/g
s/K/K/g
s/L/L/g
s/M/M/g
s/N/N/g
s/O/O/g
s/P/P/g
s/R/R/g
s/S/S/g
s/T/T/g
s/U/U/g
s/V/V/g
s/W/V/g
s/Y/Y/g
s/Z/Z/g
s/No[.]/╟/g
'
}

(Ответить)


[info]moshkow@lj
2003-11-07 05:57 (ссылка)
Ili esli ty w techenii blizhajshih 20 minut uspeesh' mne etot tekst w formate plaint-text podognat', poka ya na dachu ne umotal - to ya mogu ego po bystromu dolbanut' swoimi konwertorami.

(Ответить)


[info]leonov@lj
2003-11-07 06:15 (ссылка)
http://bugtraq.ru/files/decode.html

В первом поле набор символов "откуда", во втором - "куда" (с соответствующими символами на одних позициях), в третьем сам текст.

Единственное, в полученном тексте вместо > и < будут & gt; и & lt;

(Ответить) (Ветвь дискуссии)


[info]dolboeb@lj
2003-11-07 06:19 (ссылка)
Спасибо огромное!
Если Паркер не справится с регекспом, попробую эту прогу.
А она case-sensitive?

(Ответить) (Уровень выше) (Ветвь дискуссии)


[info]leonov@lj
2003-11-07 06:27 (ссылка)
Да, конечно. А регексп там в одну строчку, только ворд таких, кажется не понимает (а те, которые понимают, тут без пользы, достаточно простых замен). Если вдруг под рукой есть перл, то весь скрипт:

$text = <<'ENDOFTEXT';
текст для перекодирования
ENDOFTEXT

$text =~ tr/abv...(и весь алфавит до конца)/абв...(аналогично)/;

print $text;

(Ответить) (Уровень выше)


[info]turkot@lj
2003-11-07 06:25 (ссылка)
Если не нашел - глянь сюды.
http://www.luftsoft.de/t2c/description_en.html

Я как-то пробовал, работало.
Таблицы, правда, придется корректировать самому

(Ответить)

Попробуй это...
[info]motkin@lj
2003-11-07 09:01 (ссылка)
http://www.redcom.ru/isp/netFiles/eMail/nf979446648/view
насколько я мог убедиться - штандертен-фюрер пережевывает даже проволоку

(Ответить) (Ветвь дискуссии)

Re: Попробуй это...
[info]chuzhoy@lj
2003-11-08 07:27 (ссылка)
г-н главный программер порт 8080 закрыл наконец-то :)
так что www.liceum.usu.ru/download (он мне сам это только что сказал ;)

(Ответить) (Уровень выше)

text Tarasova
[info]vicmoc@lj
2003-11-07 09:25 (ссылка)
Владимир Петрович сегодня, после премьеры своего спектакля в Центре Мейерхольда (Эсхил, "Персы", реж. Теодорос Терзопулос, музыка - Вл. Тарасов, стоит не пропустить - завтра еще идет) в ответ на наши восторги повторял, как заведенный, что НИКТО, никто на свете не мог раскодировать его текст, который нужно сдавать для публикации в НЛО - и только ты смог, и он потрясен...Спасибо! Я понимаю, как это было трудно, а Тарасов знает, что это было невозможно, так как до тебя над этим работала большая международная команда.

(Ответить) (Ветвь дискуссии)

Re: text Tarasova
[info]dolboeb@lj
2003-11-07 13:38 (ссылка)
Смог Максим Евгеньевич Мошков, на самом деле.
За 10 минут.
Программным способом.

(Ответить) (Уровень выше)


[info]chuzhoy@lj
2003-11-08 07:06 (ссылка)
опробуй Штирлица четвретого (Всеволод Лукьянин кажись написал, если память не изменяет)
переводит всё во всё.
там свои схемы можно создавать или можно изменить какую-либо имеющуюся "под руку". где взять не знаю. она freeware. могу на ящик кинуть, если надо. удобная вещь (так вообще). надо?

(Ответить)


[info]antanian@lj
2003-12-25 11:22 (ссылка)
Книжка издавалась на бумаге. В издательстве "Baltos Lankos". Достать можно. Делалась она на маках. КОИ-7 явно от издателей.

Писалась ручкой шариковой на бумаге и в Вильнюсе (ксеры рукописи видел еще в году так 1996-7)

Набор производил явно не он, хотя... Машинка в его хозяйстве вроде как была. Нет, не он. У него времени нет/не было на такие мелочи.

(Ответить)