Войти в систему

Home
    - Создать дневник
    - Написать в дневник
       - Подробный режим

LJ.Rossia.org
    - Новости сайта
    - Общие настройки
    - Sitemap
    - Оплата
    - ljr-fif

Редактировать...
    - Настройки
    - Список друзей
    - Дневник
    - Картинки
    - Пароль
    - Вид дневника

Сообщества

Настроить S2

Помощь
    - Забыли пароль?
    - FAQ
    - Тех. поддержка



Пишет cwot ([info]cwot)
@ 2003-10-19 22:15:00


Previous Entry  Add to memories!  Tell a Friend!  Next Entry
PopFile фильтрует spam
Количество спама, как все могли заметить, растёт с каждым днём.
Для тех, кому эта дрянь мешает, хочу поделиться опытом.
Минус один -- спам всё равно скачивается. Т.е. фильтрация происходит непосредственно на вашем компе, не на сервере.
Плюс -- эта штука очень хорошо справляется с поставленной задачей.


Программа работает по алгоритму Байеса, я, признаться, не вчитывался.
Понял только, что это связано с частотным анализом слов. Тут подробно написано:
http://spambayes.sourceforge.net/background.html

Также существует мнение, что все программы использующие Байесовский метод примерно одинаковы в работе, я взял ту, что все советуют.
Она называется PopFile
http://popfile.sourceforge.net/old_index.html

Ниже я буду рассматривать самый примитивный способ, без обучения программы другим папкам и правилам.

1. Скачиваем программку PopFile
2. Запускаем инсталяцию, она спрашивает про папки. Оставляем только inbox и spam (меньше папок -- быстрее учится)
3. Запускаем программку Start --> Programs --> PopFile --> Run PopFile in Background
4. Открываем "The Bat!" и в нём меняем настройки ящика:
mail server = 127.0.0.1
username = mail_server:старый_username

screenshot #1


5. В The Bat! запускаем "Mail filters/Сортировщик фильтров"
(Ctrl+Shift+S), где добавляем правило:
Если в заголовке есть [spam], то отправить в папку "Спам"

screenshot #2

6. Нажимаем на Осьминожка правой кнопкой, выбираем "PopFile UI"
7. Открываем закладку "Configuration" и в разделе "Message Text Insertion" отключаем "Subject line modification", остальные два не трогаем.

Теперь всё готово к работе, остаётся надрессировать зверька.

делается это очень просто:
1. Скачиваем почту
2. Нажимаем на Осьминожка правой кнопкой, выбираем "PopFile UI"
3. Перед нами History, в ней список писем. Напротив каждого выбираем "spam" это или "inbox", по завершении нажимаем "Reclassify"

вот, собственно и всё.
у меня после первых 20 писем он вполне бойко разделяет на спам и не
спам. Те письма, которые спамные летят в соответствующую папку и
более не отвлекают. Всё, что теперь требуется -- время от времени
его проверять и чистить.
Если вдруг в спаме оказалось нужное письмо (или наоборот) -- надо
зайти в на ту же страницу History и напротив данных писем сменить
значения, сказав "reclassify"

По общему мнению и личному опыту: после двух недель тренировки точность прицела равна 100%

Возможно, что не очень понятно и сумбурно написано, зато всегда рад ответить на вопросы.


(Добавить комментарий)

дескример: я не знаком с Попфиле, но
[info]qub@lj
2003-10-20 02:39 (ссылка)
есть два вопроса:

ты уверен что "отключаем "Subject line modification"? как же тогда она будет вставлять [spam] в сабжект? или это про какую другую modification.
Body and subject modification ezine.

"меньше папок -- быстрее учится" -- ты, наверно, имел ввиду что быстрее учить? учится-то он тем быстрее чем больше ему скормишь. и, вобщем, теоретически более правильно учить его на всем потоке -- но раз работает то главное не трогать :)

100% -- че-то уж слишком лихо. 99% правильно названного спама и одно на тысячу правильное письмо попавшее в спам -- такие результаты я видел, но не 100%.

(Ответить) (Ветвь дискуссии)

Re: дескример: я не знаком с Попфиле, но
[info]cwot@lj
2003-10-20 04:59 (ссылка)
[Subject line modification]
она умеет это в message header вставлять, чтоб сам subj не портить

[меньше папок -- быстрее учится]
я исходил из предположения (или где-то прочёл его), что быстрее обучить клать хорошее налево, а плохое -- направо, чем делить это на 5 кучек с разными степенями.

[100%]
у меня ещё нет тысячи писем, но за последнюю неделю (она же вторая) только одно спамное письмо попало в inbox. хотя, конечно, выборка немножко более восторжженная, чем могла бы :)

(Ответить) (Уровень выше)