April 2032
|
|
|
|
1 |
2 |
3 |
4 |
5 |
6 |
7 |
8 |
9 |
10 |
11 |
12 |
13 |
14 |
15 |
16 |
17 |
18 |
19 |
20 |
21 |
22 |
23 |
24 |
25 |
26 |
27 |
28 |
29 |
30 |
|
2/27/09 02:58 pm
спамеры и капча
Моему ресурсу nissan-wiki.ru пришла, как видно, заслуженная популярность. Нет, увы, там не появилось 50 пользователей, каждый их которых пишет две-три новые статьи в неделю. Зато там появились SEO-спамеры, рассеивающие свой чёрный поисковый спам.
Раз в два-три дня кто-то приходит, регистрируется как пользователь, и на своей странице обсуждения пишет, что он, де, из Воронежа, закончил такой-то ВУЗ, любит разводить аквариумных рыбок, после чего пихает с десяток ссылок в виде Ссылка1 | Ссылка2 | Ссылка3 и т.п.
Установка SimpleCaptcha, где предлагалось посчитать, сколько будет 34+8 (или вроде того), не помогла. Показывается она как при регистрации пользователя, так и при добавлении на страничку внешних ссылок.
Сегодня поставил FancyCaptcha, для которой нагенерил весёлых картинок с двумя русскими словами. Посмотреть можно тут.
Забавно, что получились забавные сочетания слов, например, "форма вот", "чей бизнес", "сунуть поздно" или "худой сынок". Очень развлекает.
PS кому надо, могу отдать captcha.py, приспособленную к русским словам (понадобились некоторые тривиальные правки).
2/27/09, 02:30 pm
Я так понимаю, ничего кроме капчи и премодерации всего, чего только можно, на эту тему не придумано?
2/27/09, 02:35 pm
Ну почему. Можно ещё сделать классы пользователей, которым нельзя вставлять внешние ссылки. Например, такие пользователи, у которых не подтверждён email адрес. Или такие, которые завелись в последние 10 дней. Или такие, которые сделали менее 5 правок в вики (постов в форумах). Работать должно хорошо, а главное — аутоматично.
2/27/09, 02:54 pm
М...
Я вообще считаю не вполне правильной устоявшуюся практику, согласно которой у пользователя обязан быть действующий email адрес. В общем случае зачем он нужен? Только для валидации регистрации?
Если отсеивать тех, кто завелся в последние 5, 10, 30 дней, — начнут заранее регистрить с целью дальнейшего использования. Во всяком случае, если эта практика станет массовой.
И так далее.
Я думаю, что нужно смотреть глубже. Фактически, требования, при соблюдении которых не происходит генерации спама (или его очень мало), весьма просты. Необходимо убедиться, что любое сообщение оставлено человеком, и при этом набрано вручную (а не вставлено из буфера обмена). Тогда даже нанятый застобаксоввмесяц студент не будет иметь возможности серьезно засрать интернет.
Капча плоха в основном потому, что мы заставляем пользователя вводить бесполезную информацию, которая не имеет никакого отношения к основной деятельности, и при этом еще и плохо распознается (не только машиной, но зачастую и человеком). Премодерация плоха потому, что между отправкой сообщения и его публикацией проходит ощутимое время, а на популярных ресурсах очень высока нагрузка на модераторов (которые тоже могут ошибаться, кстати).
Что можно сделать? Заменить поля ввода специально изготовленным флэшом, который общается с сервером по защищенному протоколу, и воспринимает именно нажатия кнопок на клавиатуре? Это первое, что пришло мне в голову.
Я уверен, что над этой проблемой бились уже многие. Нет ли на примете интересных статей по теме?

2/27/09, 04:11 pm
Необходимо убедиться, что любое сообщение оставлено человеком, и при этом набрано вручную (а не вставлено из буфера обмена). Тогда даже нанятый застобаксоввмесяц студент …
У меня есть подозрение, что именно нанятые застобаксоввмесяц студенты меня и спамят.
Капча плоха в основном потому, что мы заставляем пользователя вводить бесполезную информацию
Есть полезные капчи, к примеру, http://en.wikipedia.org/wiki/ReCAPTCHA
Заменить поля ввода специально изготовленным флэшом
Стопятьдесят раз нет! Этим ты отрежешь от своего сайта всех тех, у кого нет флеша. Если при этом твой сайт называется youtube или там mult.ru, то это ещё туда-сюда, а в противном случае ты сильно ухудшаешь accessibility. Конечно, любая капча ухудшает аксессибилити, но на флеше — это уж совсем что-то издевательское.
Ты никак не откомментировал моё предложение (конечно, оно не моё…) про «карму» пользователя. В простейшем виде это выглядит так, что пользователи, оставившие меньше 10 сообщений в форуме (сделавшие меньше 10 правок в вики), не имеют права вставлять внешние сссылки. Такую систему я, в частности, видел, на webhostingtalk.com. Там много желающих прорекламировать свой хостинг или какие другие услуги — и им дают это сделать, но только после написания N сообщений.
Система «кармы» или «рейтинга» пользователя может быть и более сложной, конечно. При грамотно построенной системе роботу сложно туда пробиться. Минус, конечно, в том, что вначале тебя за человека не считают.
2/27/09, 04:46 pm
Против студентов бороться, видимо, бесполезно. Ну, разве что премодерацией. Или таки флэшом — я не верю, что студент способен *вручную* произвести достаточно каки, чтобы ему за это заплатили не совсем копейки.
Про рекапчу слышал, но не знал, что она приносит пользу ;-). Спасибо.
А у кого нет флэша (или он откручен по каким-то причинам, или его наличие не определяется, например, по причине открученных скриптов) — пусть распознают слова на картинке. В общем, сделать так, чтобы имеющие флэш выигрывали от его использования, а все остальные не слишком сильно страдали. Или можно, например, сделать скрипт, который следит, чтобы в полях ввода вдруг не появлялась мгновенно сотня символов. Это обходится, конечно, и означает некоторые трудности со вставкой «честных» ссылок, но все-таки.
Про карму просто не нашелся, что сказать ;-). С одной стороны, вроде, нормальная система. С другой — ты указал минус, который я считаю существенным. Но, в то же время, и в жизни новичка в компании тоже не сразу обычно начинают считать за своего, так что это, видимо, и правильно.
Будем считать, что карма рулит. К тому же, никто не мешает руками корректировать карму в исключительных случаях.
2/27/09, 09:38 pm
Я как-раз РеКапчу пользую - быстро и удобно.
2/27/09, 09:25 pm
Запрет на использование буфера обмена при написании сообщения и сам по себе, независимо от проблемы с реализацией, гораздо сильней напрягает, чем злобная капча.
2/28/09, 10:17 am
и как без буфера ссылки вставлять в гробу я видел такую вики
2/27/09, 02:41 pm
Интересно насколько эффективно твое решение получится в итоге.
2/27/09, 02:42 pm
Я ненавижу капчи. Без вариантов.
2/27/09, 02:55 pm
Они там только при регистрации (в принципе, можно выключить — нехай роботы регистрируются, мне ничуть не жалко) и при добавлении внешних ссылок. Внешние ссылки добавляются далеко не всегда.
2/27/09, 07:19 pm
В общем, справедливо. Захотел поставить ссылку наружу — будь добр поработать руками ;-).
Кстати, как насчет rel=nofollow? Не решает проблему?
2/27/09, 07:32 pm
У меня оно, если я правильно помню, глобально стоит.
2/27/09, 07:37 pm
Глобально нельзя, но, в общем, на каждой внешней ссылке стоит rel="nofollow". И нет бы спамерам это увидеть и отползти — фига.
2/27/09, 03:18 pm
34+8 показывается текстом или картинками?
2/27/09, 04:13 pm
Было текстом. На каком-то форуме у меня ASCII-картинками, типа
### # # ###
# # # # # # #
# # # # # # #####
### ##### ##### ###
# # # # # #####
# # # # # #
### # ###
2/27/09, 04:48 pm
А по поводу «заслуженной популярности», увы, должен тебя огорчить. Тебя всего лишь нашли при очередном прочесывании просторов тырнета. Мой опыт показывает, что спамят и блоги, которые читают 1—2 человека в день.
2/27/09, 05:26 pm
тьфу некого вроде сумка особый идиот
а нет прямой ссылки на капчу? поиграться. :)
2/27/09, 07:33 pm
А там все файлики в одном каталоге лежат, можно в HTML source посмотреть, в каком. Если там, конечно, листинг каталога разрешён, в чём я не уверен.
2/27/09, 07:35 pm
Вообще всё крайне просто.
1. берём список из 5000 наиболее употребительных в русском языке слов (где-то в инете взял). 2. из него берём слова от 3 до 6 символов (или от 4 до 6 — не помню). 3. из этого списка слов случайно выбираем два слова, рисуем из них картинку.
Ужасно забавные штуки получаются
|