Живой роман Пробежего - Как побороть спам в каментах [entries|archive|friends|userinfo]
probegi

[ website | Роман жизненных наблюдений поэта и литератора ]
[ userinfo | ljr userinfo ]
[ archive | journal archive ]

Как побороть спам в каментах [Oct. 9th, 2013|09:41 pm]
Previous Entry Add to Memories Tell A Friend Next Entry
Image
На самом деле, это задача для первокурсника. Каждый спамный камент содержит определенный набор символов, нужно только определить этот набор. Конечно, если анализировать весь миллион каментов, оставляемых в уйутненькой в час, то и восьмипроцессорный сервак взмолится. Но ведь этого и не требуется, достаточно смотреть на удаленные каменты, помеченные как спам.

После решения задачки достаточно раз в полчаса запускать скрипт, удаляющий все комментарии с этой последовательностью символов. И спам постепенно сойдет на нет. За интенсивностью спама тоже можно следить автоматически, ставя частоту запуска скрипта в зависимость от нее. При этом банить ботов тоже легко:два раза кинул аккаунт камент с сигнатурой? прощаемся. Не, ну если вы начнете везде писать "у меня глаза на лоб лезут", то конечно, вам писда, но кто ж будет в этом виноват?

А раз всего этого не делают, значит, заговор. Или же беспредельная глупость, тут уж не отличишь.
хехе
LinkLeave a comment

Comments:
[User Picture]
From:[info]access07@lj
Date:October 9th, 2013 - 12:56 pm
(Link)
У меня глаза на лоб лезут! Как всё просто.
From:[info]probegi@lj
Date:October 9th, 2013 - 01:00 pm
(Link)
Не ссать, еще долго будет можно смело.
хехе
From:[info]rednyrg721@lj
Date:October 9th, 2013 - 12:57 pm
(Link)
Технологии 21-го века:

"Коллеги напишут пост в сообщество notaspammer, сделают его верхним, будете туда ссылки кидать со спамом, коллеги будут подписаны на комменты и будут править" (c) tritankista

dewald.livejournal.com/192335.html?thread=8464463#t8464463

А вы говорите "скрипт", какие скрипты, ёпта!
From:[info]probegi@lj
Date:October 9th, 2013 - 12:58 pm
(Link)
В ногу со временем, ручной режим.

хехе
[User Picture]
From:[info]ohtori@lj
Date:October 9th, 2013 - 02:04 pm
(Link)
Более того: можно смотреть только на те удалённые комменты, помеченные как спам, которые удалены и помечены заведомо реальными пользователями. Людьми.

Людей в ЖЖ осталось не так уж много, что в данном случае лишь упрощает задачу.
From:[info]etno_exp@lj
Date:October 9th, 2013 - 03:54 pm
(Link)
Тык "людей" сломать можно. А потом иди доказывай, что ты не верблюд.
[User Picture]
From:[info]ohtori@lj
Date:October 9th, 2013 - 04:32 pm
(Link)
Взломанный будет генерить неправильные, шумовые сообщения о спаме. На работу общего алгоритма выявления спама это не влияет.
From:[info]etno_exp@lj
Date:October 9th, 2013 - 05:50 pm
(Link)
Ежели сломать полумёртвый аккаунт в который несколько месяцев никто не ходил (и который только через несколько месяцев проснётся), то генерить он будет всё то же самое что и только что созданный специально для спама. (Который без проблем можно замаскировать под полумёртвый.)

[User Picture]
From:[info]ohtori@lj
Date:October 9th, 2013 - 11:21 pm
(Link)
Ладно, не буду дальше объяснять, извините.
[User Picture]
From:[info]ffedd_ya@lj
Date:October 9th, 2013 - 03:06 pm
(Link)
Задачей ЖЖ является получение прибыли и повышение капитализации, а не ловля спама в комментах.
А задача борьбы со спамом имеет низший приоритет, если вообще поставлена: на прибыль и капитализацию это влияет слабо.


Поэтому в приоритетах задач программистам ЖЖ вверху всегда будет "разработка новой кнопочки", "разработка автоматической рекламы" и пр.
[User Picture]
From:[info]ohtori@lj
Date:October 9th, 2013 - 04:32 pm
(Link)
Да.
From:[info]etno_exp@lj
Date:October 9th, 2013 - 04:03 pm
(Link)
Тык в ЦК не дураки сидят. Чё там сейчас в тренде - про диету вроде. Меняем пару слов - остаётся тот же спам, но простым скриптом уже не ловится. Хотя ловить можно и по ссылке. Но ссылку можно "спрятать" через укорачиватили, и тогда, опять же, процесс ловли сильно усложняется.

Судя по всему, то что про диету - это такое чёрное СЕО, - задача оставить как можно больше ссылок в чистом виде, чтобы вылезти в топ в поисковиках. А там либо ишак, либо падишах (вдруг сия диета от которой глаза на лоб лезут и правда годная), но спамные камменты уже не нужны, ибо яндекс, говорят, блоги ооочень быстро индексирует.
[User Picture]
From:[info]ohtori@lj
Date:October 9th, 2013 - 04:36 pm
(Link)
Право опубликовать ссылку можно сделать привилегией. "Сперва заслужи"
From:[info]etno_exp@lj
Date:October 9th, 2013 - 05:46 pm
(Link)
А что делать с теми кто "специально зарегистрировался чтобы оставить этот коммент"? Ведь бывает же действительно по делу. И кстати со вражескими аккаунтами из твиттеров-фейсбуков-и-прочих-гуглплюсов та же проблема.
[User Picture]
From:[info]ohtori@lj
Date:October 9th, 2013 - 11:20 pm
(Link)
Пусть без ссылки публикуют свой коммент. Если написано по делу - поисковые машины помогут читателю найти нужную ссылку.
From:[info]probegi@lj
Date:October 9th, 2013 - 11:04 pm
(Link)
Конечно, борьба снаряда и брони не кончается, кто говорил, что будет легко.
Но говна станет меньше.

хехе
From:[info]ext_2193006@lj
Date:October 10th, 2013 - 12:12 am
(Link)
О божечки.
"Если не хватает хлеба, надо просто посадить больше хлебных деревьев, это же очевидно для любого нормального человека!"

Вы знаете, как я вас люблю, Пробежий, но не нужно вот этого вот, пожалуйста.
From:[info]000000_0@lj
Date:October 18th, 2013 - 09:35 am
(Link)
две зиги етой поняше
[User Picture]
From:[info]reeders@lj
Date:October 10th, 2013 - 05:13 am
(Link)
2007й год. реализовано в лиру
http://www.liveinternet.ru/users/reeder/post61346978

роботы больше половины жж имхо генерят. если их забанить то популярность упадёт :)