Войти в систему

Home
    - Создать дневник
    - Написать в дневник
       - Подробный режим

LJ.Rossia.org
    - Новости сайта
    - Общие настройки
    - Sitemap
    - Оплата
    - ljr-fif

Редактировать...
    - Настройки
    - Список друзей
    - Дневник
    - Картинки
    - Пароль
    - Вид дневника

Сообщества

Настроить S2

Помощь
    - Забыли пароль?
    - FAQ
    - Тех. поддержка



Пишет Misha Verbitsky ([info]tiphareth)
@ 2004-01-08 04:12:00


Previous Entry  Add to memories!  Tell a Friend!  Next Entry
Настроение: tired
Музыка:Jaki Liebezeit's Phantom Band - "NOWHERE"

интеллектуальный фильтр Spamassassin
Отстал с чтением лже-друзей, прекрасных,
на неделю аж. И комментарии. И е-мэйл.
Простите, ага. Я прочту.

Занимался среди прочего
настройкой фильтра от спама.
Установил интеллектуальный фильтр Spamassassin, а
поскольку тот не локализован к российским
условиям, весь безобразно пропущенный фильтром
спам подробно читал и сочинял для него тесты,
чтоб больше не ходили.

Spamassassin пользуется колоссальных
размерой библиотекой тестов (на регекспе,
по преимуществу), некоторые из них чрезвычайно
интеллектуальные. Например, там есть тест,
который со стопроцентной надежностью
ловит нигерийские спамные сообщения
от негров.

Спам-фильтры бывают, оказывается, трех видов.

1. Фильтр располагает базой данных IP, с которых
высылается спам. Самые умные из этих обмениваются
с базой данных образчиками спама, для улучшения
базы данных. Образчик: the Open Relay DataBase,
http://www.ordb.org/
Дело это не сильно прогрессивное.
Критика борьбы со спамом с помощью RBL здесь
http://theory.whirlycott.com/~phil/antispam/rbl-bad/rbl-bad.html
и здесь
http://www.spamtest.ru/varticles.html?id=0022
(очень хорошее; от А. Тутубалина, автора русификации
apache, к настоящему времени устаревшей до полной
ненужности, и хозяина какого-то коммерческого
сервиса по борьбе со спамом).

2. Фильтры имеют библиотеку интеллектуальных
тестов, которые определяют спам. Обыкновенно,
каждый из тестов присваивает письму спамные
очки, и когда этих очков будет больше какого-то
количества, письмо идентифицируется как спам.
Образчик: spamassassin, описание тестов вот
http://www.spamassassin.org/tests.html
(осторожно - файл длиной в мегабайт).

3. Фильтр имеет внутри себя искусственный
интеллект. Ему скармливают 20 тыщ спамных сообщений
и 20 тыщ неспамных, после этого он запоминает
статистические характеристики спама и неспама
и учится их различать. По мере получения
спамных сообщений фильтр учится дополнительно.

Преимущества этого подхода очевидны -
можно бороться со спамом хоть на китайском;
недостатки тоже очевидны, скорее даже удивительно,
что такая штука может работать. Но она работает,
и чрезвычайно эффективно при этом; вот статья,
где приводятся результаты тестов
http://freshmeat.net/articles/view/964/
а вот доклад на конференции, где рассказывается
в подробных деталях
http://www.paulgraham.com/spam.html

Чрезвычайно интеллектуальный фильтр Spamassassin
пользуется всеми тремя способами, позволяя
пользователю выбирать, какие ему больше нравятся,
и присваивать каждому интеллектуальные очки.

Если кто-то напишет ко мне письмо со словами
"Центр Американского Английского" "Офис в аренду"
"оказываем .качественные. услуги по" или
"Guaranteed to work or your money back!",
вы знаете, что с вами будет.

Сегодня я не получил ни одного спама.

Привет



(Читать комментарии) - (Добавить комментарий)


[info]r_l@lj
2004-01-08 07:08 (ссылка)
Ну для этого надо быть махровым матерым иудеем-интересантом. Или неиудеем, но интересантом. Я, как старый пропагатор бесплатной работы, неоднократно сталкивался с непониманием (думаю, тут еще узость эстонского рынка труда сказывается и высокая безработица - на работу поэтому часто попадают просто по протекции).
Самые любознательные махровые регистрируются как частные предприниматели и пишут себе свой софт или что еще. Университетские админы, насколько я знаю - довольно печальны на этом фоне.

(Ответить) (Уровень выше) (Ветвь дискуссии)


[info]onsamyi@lj
2004-01-08 07:22 (ссылка)
а прочему в эстонии? вот хороший пример - наш офисный Макс мне поставил программку для удаленного администрирования на комп, и совершенно без всякого присуттсвия у меня дома сделал меня частью корпоративной локалки. Думаю, если Вы вскричите: "нужен админ!"-тут же протянутся несколько десятков рук с системными зажигалками. Коммунизм - это когда с нормальными людьми есть возможность пообщаться, а не когда холодно и сибирь:)) Вообще, кстати, насчет того, что коммунизм "это когда есть материальные ценности"-странное заблуждение эпохи развитого социализма; "коммунизм"-это когда люди вместе. То есть, достаточно буквальной трактовки термина, и все становится на свои места. Кстати, вот мне кажется, что когда плохо и голодно, но все вместе - это гораздо лучше чем когда каждый сыт по отдельности.

В жж вот коммунизм, кстати, вполне типичный. да сеть - это вообще коммунизм, буквальный. Может быть, хрущев именно www имел в виду. Живем ведь при коммунизме...Правда, кормить бы еще пореже, совсем бы было хорошо.

(Ответить) (Уровень выше)


(Читать комментарии) -