Войти в систему

Home
    - Создать дневник
    - Написать в дневник
       - Подробный режим

LJ.Rossia.org
    - Новости сайта
    - Общие настройки
    - Sitemap
    - Оплата
    - ljr-fif

Редактировать...
    - Настройки
    - Список друзей
    - Дневник
    - Картинки
    - Пароль
    - Вид дневника

Сообщества

Настроить S2

Помощь
    - Забыли пароль?
    - FAQ
    - Тех. поддержка



Пишет Misha Verbitsky ([info]tiphareth)
@ 2004-02-05 05:48:00


Previous Entry  Add to memories!  Tell a Friend!  Next Entry
Настроение: tired
Музыка:Van der Graaf Generator - THE LEAST WE CAN DO IS WAVE TO EACH OTHER

Black metal nation: What do Norwegian dirtheads and Richard Perle have in common?
Когда мы полгода назад ходили
в поход с [info]drugnaroda@lj,
мною было изобретено следующеее
полезное блюдо.

1. Тарелку рожек или других макарон, но лучше рожек.
2. Банку лосося в собственном соку в эту тарелку. Засыпать
подравкой, сушеной морковкой-петрушкой или другими кореньями.
3. Налить туда полстакана или стакан крепкого чая.

Очень вкусно

Е-мэйл сюда не ходит, уже сутки, может
его починят, может не починят. Я не жду.

Смешная рецензия на книгу "Lords of Chaos"
Мойнихена с еще норвежцем
; написал Марк Эймс,
редактирующий Exile. Про Бурзума типа.

А как в regular expressions (Perl, locale мне неизвестна)
отделить русские буквы от нерусских? Я хочу написать regexp
для отделения слов, в которых некоторые русские буквы
заменяются на похожие по написанию латинские, спаммеры
очень любят так писать. В результате экпериментов, я
выяснил, что интервал [а-З] и [а-з], по мнению моего
Перла, включает в себя все английские буквы, а
интервал [ю-Ъ] (соответствующий русским буквам
по версии таблицы КОИ-8) пуст.

Привет



(Добавить комментарий)


[info]avva@lj
2004-02-04 17:35 (ссылка)
Зависит от кодировки, в которой представлен данный русский текст. В самом перле лучше писать на [а-з] или что-то в этом роде, а прямо ставить коды, напр. [\x80-\xff] итп. Тогда не будет никакой роли играть та локаль, в которой бежит сам перл, и это хорошо. Письмо перед обработкой проще всего перекодировать в одну какую-то кодировку, ту же koi8-r, какой-нибудь внешней утилитой, а потом в перле пользоваться регэкспами с шестнадцатеричными кодами внутри, согласно этой кодировке.

(Ответить) (Ветвь дискуссии)

Re:
[info]ex_tipharet@lj
2004-02-04 17:46 (ссылка)

Спасибо!
У меня переписка идет в koi-8, и обрабатывается
Spamassassin-ом. Задача - опознавать все слова, где
в одном слове встречаются латинские и русские буквы, типа
"Абoнeнтскoe oбслужuвaнue oргaнuзaцuй"

Правильно ли я понимаю, что [\xC0-\xff]
будет опознавать русские буквы?

Вообще хочется найти библиотеку Spamassassin-тестов для
кириллического спама.

Такие дела
Миша

(Ответить) (Уровень выше) (Ветвь дискуссии)


[info]avva@lj
2004-02-04 18:04 (ссылка)
Ага, думаю, [\xc0-\xff] это то, что надо.

Может, что-то в этом роде: ([\xc0-\xff][a-z])|([a-z][\xc0-\xff])
плюс добавить /i в флагах оператора, чтобы case insensitive и A-Z
тоже ловил. Это поймает любое чередование русской буквы с английской
внутри одного слова.

(Ответить) (Уровень выше)

Re: Spamassain libraries
[info]bbixob@lj
2004-02-07 08:56 (ссылка)


ЛОМИ pdmi.ras.ru ползуется Спамассасиом, и вроде у
них он неплохо ловит спамы; впрочем, русских спамов там мало.

Вроде админом там сейчас

анд at euclid.пдми.рас.ру (Андреи Каишев),

я с ним не знаком...

пс: спасибо за ответ на вопрос Зильбера; ответил со ссылками
я посылал, не знаю, дошел ли.



(Ответить) (Уровень выше) (Ветвь дискуссии)

Re: Spamassain libraries
[info]ex_tipharet@lj
2004-02-08 03:51 (ссылка)


Дошел! Я ответил. Спасибо!

Такие дела
Миша

(Ответить) (Уровень выше)

Re:
[info]ex_tipharet@lj
2004-02-04 17:57 (ссылка)

Да, вроде работает, спасибо

body MIXED1_OBFU_MV /[\xC0-\xff][A-GI-or-z][\xC0-\xff]/i
describe MIXED1_OBFU_MV Mixed Cyrillics and Latin (for obfuscation)
score MIXED1_OBFU_MV 1.5

body MIXED2_OBFU_MV /[\xC0-\xff][A-GI-or-z][\xC0-\xff]*[A-GI-or-z][\xC0-\xff]/i
describe MIXED2_OBFU_MV Mixed Cyrillics and Latin (for obfuscation)
score MIXED2_OBFU_MV 2.5

body MIXED3_OBFU_MV /[\xC0-\xff][A-GI-or-z][\xC0-\xff ]*[A-GI-or-z][\xC0-\xff]/i
describe MIXED3_OBFU_MV Mixed Cyrillics and Latin (for obfuscation)
score MIXED3_OBFU_MV 1.5

Использование H вместо Н и p вместо р встречается в легитимных
письмах (из-за Фидо и из-за старого Нортон-Коммандера)

Такие дела
Миша

(Ответить) (Уровень выше) (Ветвь дискуссии)


[info]avva@lj
2004-02-04 18:06 (ссылка)
Здорово. Про H и p я и забыл. Смешно, что они живут до сих пор.

(Ответить) (Уровень выше) (Ветвь дискуссии)

Re:
[info]syarzhuk@lj
2004-02-05 00:41 (ссылка)
Я предлагаю срочно написать Крылову о том, что два ЖЖ-гения - Авва и Тифарет - с помощью Перла решили главную задачу русских националистов, а именно - отделили русских от нерусских!

(Ответить) (Уровень выше)

Re:
[info]a48@lj
2004-02-05 09:30 (ссылка)
а можно попросить все собственные правила? :)

(Ответить) (Уровень выше) (Ветвь дискуссии)

Re:
[info]ex_tipharet@lj
2004-02-07 22:57 (ссылка)

Пожалуйста!
http://laylah.lenin.ru/spamassassin.cf.txt

Такие дела
Миша

(Ответить) (Уровень выше)


(Анонимно)
2004-02-04 18:29 (ссылка)
А заменой букв ещё можно писать матом в руссру!

(Ответить)


[info]quantum_angel@lj
2004-02-04 22:20 (ссылка)
странная история
ведь книга Мойнихена, кажется, уже несколько лет тому назад вышла?

а ты тоже любишь викернеса? я вот только недавно, что называетсяя, открыл для себя его эмбиентные работы. вовсе это не "недоделанный нью-эйдж", как некоторые критики из лавеевской церкви презрительно цедили. очень высокого уровня интеллигентная электронная музыка. один трек на Filosofem, который был в звуковой дорожке "Гуммо", вообще разносит. 24 минуты полтора примерно аккорда.

и еще есть две хорошие группы – Satiricon и Bethlehem. прочий блэк перестает быть интересным после третьего физиологического криза.

(Ответить) (Ветвь дискуссии)

Re:
[info]satory66@lj
2004-02-04 22:30 (ссылка)
... два альбома:
Bathory - Under The Sign Of The Black Mark (1987)
Dark Throne - A Blaze In The Northern Sky (1991)
..и больше ничегошеньки в BM интересного не выходило.

(Ответить) (Уровень выше)

Re:
[info]ex_tipharet@lj
2004-02-04 22:42 (ссылка)

Да, Кристиан В. зайка. Из всего блэка я тоже только
его могу слушать и Darkthrone (ранний).

По поводу амбиентных трэков - у него есть хорошие
и не очень, Filosofem весь, конечно, гениальный.

Такие дела
Миша

(Ответить) (Уровень выше) (Ветвь дискуссии)

Re:
[info]satory66@lj
2004-02-04 22:53 (ссылка)
Filosofem замечательный, Daudi Baldrs и Hlidskjalf немного посасывают.

(Ответить) (Уровень выше)


[info]chevengur@lj
2004-02-05 03:08 (ссылка)
Бурзум чудесный

(Ответить)


[info]ded_mitya@lj
2004-02-05 03:26 (ссылка)
Ха!
А рецензия действительно смешная. Такое ощущение, что писали герои South Park'a. Хотя поинт есть, конечно.

Эмбиентный Викернес - мнэээ. В Hlidskjalf первые два номера ободраны с Клауса Шульце (чье влияние на БМ-щиков очевидно - даже Мэйхем в сыром варианте одного из альбомов сделал его кавер!),остальное в общем-то балласт.

Hvis Lyset Tar Oss пожалуй, не хуже Философема будет. В принципе, Викернес и Дарктрон это наше все. Ранние блэкари лабали тот же трэш, только песенки писали не про Пиво-и-Баб, а про Чорта, и зубной пастой мазались, для вящего эффекту.

А тебе не попадались злые хохлы Drudkh и Hate Forest?

Будь.

(Ответить)


[info]haeldar@lj
2004-02-05 05:16 (ссылка)
Миша, а ты не в курсе, где эту книгу можно нарыть в Интернете, причем, желательно - по-русски. С бумажным вариантом я успел ознакомиться, но его у меня забрали по-быстрому. А на лотках в москве ее сейчас найти нереально. Там был особо замечательный пассаж про самую страшную сатанинскую блэк-группу в России: как вы думаете, кто? Коррозия Металла, ага))) Мои респекты авторам!
удачи.

(Ответить) (Ветвь дискуссии)

Re:
[info]ex_tipharet@lj
2004-02-08 03:52 (ссылка)

Не знаю! Я ее на Амазоне заказывал,
по-английски, конечно

Такие дела
Миша

(Ответить) (Уровень выше)


[info]azatiy@lj
2004-02-06 02:43 (ссылка)
Юронимус круче!

(Ответить)

Perl на службе Родины
[info]muchandr@lj
2004-02-06 03:57 (ссылка)
Помнится, пытался провести реформу англицкого. ИМХО, следует удалить из него артиклы, как не несущие смысловой нагрузки и доставляющие уйму проблем non-native speakers, особенно русским. В этих целях регулярно фильтровал motd на soda.berkeley.edu следующей коммандой:

alias russian "perl -pe 's/(\b)(an?|the)\s*\b/\1/gi'"

Зажопили только через месяц :)

(Ответить)