Войти в систему

Home
    - Создать дневник
    - Написать в дневник
       - Подробный режим

LJ.Rossia.org
    - Новости сайта
    - Общие настройки
    - Sitemap
    - Оплата
    - ljr-fif

Редактировать...
    - Настройки
    - Список друзей
    - Дневник
    - Картинки
    - Пароль
    - Вид дневника

Сообщества

Настроить S2

Помощь
    - Забыли пароль?
    - FAQ
    - Тех. поддержка



Пишет dolboeb ([info]dolboeb)
@ 2007-01-29 19:35:00


Previous Entry  Add to memories!  Tell a Friend!  Next Entry
Интел по слову xyz
ImageЛесной экспериментирует с матюгами в Яндекс.ППБ, про которые Imageадминистрация сервиса нам рассказывала, что они вычищаются роботом. Лесной умнее робота, и сумел пропихнуть матюг в топ рейтинга, использовав латиницу. Надо заметить, что этот workaround никак не опровергает слов [info]anton@lja о принципе действия робота. Он всего лишь демонстрирует ограниченность списка известных роботу матюгов. То же самое демонстрировало попавшее вчера в топ безо всякой помощи Лесного слово ёпт — видимо, в словаре яндексова фильтра оно не фигурирует как матерное.

А мне в этой связи вспомнился дивный анекдот из первых дней интернет-рекламы в России. Компания Интел через одно симпатичное рекламное агентство купила рекламу на поисковике (кажется, на Рамблере, но могу ошибаться). При этом кто-то особенно умный из менеджеров Интела потребовал, чтобы реклама не показывалась на запросы по слову "х*й". Требование через рекламное агентство было передано администрации поисковика. Которая засела, конечно, писать фильтр по ключевому слову, но обратно передала клиенту вопрос: а по слову "п*зда" надо показывать Вашу рекламу? Нет, ответил клиент. Последовал следующий уточняющий вопрос, потом третий, пятый, девятый. На десятом вопросе до клиента дошло, что пингпонг будет длиться вечно, если не составить сразу весь список стоп-слов. И поручил эту задачу рекламистам. Которые справились. Итоговый список, переданный в Рамблер от имени Intel Corp., имел длину 183 слова. Там учитывались не только русские слова с известными корнями, но и возможность написания ряда букв в этих словах латиницей, или всех слов целиком в транслите. Излишне упоминать, что письмо из Интела в Рамблер, содержащее 183 вариации на заветную тему, в одночасье сделалось легендой РУНЕТа.


(Добавить комментарий)


[info]belyrabbit@lj
2007-01-29 13:39 (ссылка)
ну что тут сказать
письмо жжот, дайте два ;))

(Ответить)


[info]belenky@lj
2007-01-29 13:42 (ссылка)

А где этот знаменитый список?

Поскольку в России действует закон об оскорблении Президента, я бы предложил составить такой же список слов и выражений, считающихся оскорблениями Президента, и вывесить его во всех госучреждениях.

(Ответить) (Ветвь дискуссии)


[info]renny_@lj
2007-01-29 14:42 (ссылка)
+1! Хочу его видеть!!!

(Ответить) (Уровень выше) (Ветвь дискуссии)


[info]bunkind@lj
2007-01-29 15:03 (ссылка)
+1
Легенду в студию, пожалуйста.

(Ответить) (Уровень выше)


[info]ruffe@lj
2007-01-29 13:43 (ссылка)
Вывод - не делайте все сами, обращайтесь в агентство, ёпт!

(Ответить)


[info]vlarine@lj
2007-01-29 13:48 (ссылка)
А почему "х*й" и "п*зда" вместо "хуй" и "пизда"?
Чтобы йандекс проиндексировал? ;)

(Ответить) (Ветвь дискуссии)


[info]dolboeb@lj
2007-01-29 14:41 (ссылка)
йандекс индексирует независимо.
он только в топах отсекает. А в тексте запросто:
http://blogs.yandex.ru/search.xml?text=%F5%F3%E9+%7C+%EF%E8%E7%E4%E0

(Ответить) (Уровень выше)


[info]acidgarry@lj
2007-01-29 13:54 (ссылка)
найти бы оригинал пиьсма...

а вообще замечательная у тех рекламистов была работа - вспоминать часами весь известный мат и писать его заказчику, осваивая за это некислый бюджет! чтоб я так работал... %)

(Ответить)


[info]breqwas@lj
2007-01-29 14:43 (ссылка)
Помнится, прочитав словарик, по которому фильтрует мат Яндекс, я тоже узнал для себя много нового :)

(Ответить) (Ветвь дискуссии)


[info]miloslavsky@lj
2007-01-29 19:36 (ссылка)
А нет ли?

(Ответить) (Уровень выше) (Ветвь дискуссии)


[info]breqwas@lj
2007-01-29 19:37 (ссылка)
ДСП. :)

(Ответить) (Уровень выше) (Ветвь дискуссии)


[info]miloslavsky@lj
2007-01-29 19:39 (ссылка)
Древесно-стружечная плита? :)
Жаль, а так интересно...

(Ответить) (Уровень выше)

кириллическому сегменту скоро каюк. Выборы на Носу.
[info]ex_alexloto436@lj
2007-01-29 14:53 (ссылка)

(Ответить) (Ветвь дискуссии)

Re: кириллическому сегменту скоро каюк. Выборы на Носу.
[info]ludoedoed@lj
2007-01-29 21:28 (ссылка)
Хороший, годный робот.

(Ответить) (Уровень выше) (Ветвь дискуссии)

Re: кириллическому сегменту скоро каюк. Выборы на Носу.
[info]spacer@lj
2007-05-08 07:35 (ссылка)
В смысле робот? Что произошло?

(Ответить) (Уровень выше) (Ветвь дискуссии)

Re: кириллическому сегменту скоро каюк. Выборы на Носу.
[info]ludoedoed@lj
2007-05-08 17:34 (ссылка)
Хотите об этом поговорить?

(Ответить) (Уровень выше) (Ветвь дискуссии)

Re: кириллическому сегменту скоро каюк. Выборы на Носу.
[info]spacer@lj
2007-05-08 22:57 (ссылка)
Йа прост не понял ч0 стряслось? Бот? И вы аккаунт заблочили сразу?

(Ответить) (Уровень выше) (Ветвь дискуссии)

Re: кириллическому сегменту скоро каюк. Выборы на Носу.
[info]ludoedoed@lj
2007-05-09 01:39 (ссылка)
Просто не все роботы одинаково полезны.

(Ответить) (Уровень выше)


[info]alexmak@lj
2007-01-29 15:08 (ссылка)
мне когда-то пришлось создать список слов, против которого проверялся исходный код програм, уходящих заказчику. там были и русские слова, и английские, и транслит, и что угодно. веселый списочек был.

(Ответить)


[info]alex_derber@lj
2007-01-29 15:20 (ссылка)
Ну вот, сразу видно, что в Intel Corp. работают образованные люди :))) Такой мощный список подготовить, это ж сколько высших образований и красных дипломов нужно!

(Ответить)


[info]myryam76@lj
2007-01-29 15:32 (ссылка)
Если учитывать подстановку латиницы, с учетом перебора буковок и транслитов, то как-то даже маловато получается. Пойду, гляну Луку Мудищева и пр...

(Ответить) (Ветвь дискуссии)


[info]dimkin@lj
2007-01-29 15:46 (ссылка)
Вот что значит буржуазный ресурс.
Присутствовала ли в списке залупочешуйчатая пропиздоблядская мандихуёвина?

(Ответить) (Уровень выше) (Ветвь дискуссии)


[info]myryam76@lj
2007-01-29 15:52 (ссылка)
Ха-Ха-Ха

(Ответить) (Уровень выше)


[info]dolboeb@lj
2007-01-29 17:11 (ссылка)
залупочешуйчатая вряд ли
я думаю, интел еще приплатил бы, чтобы находиться по этому слову.

(Ответить) (Уровень выше) (Ветвь дискуссии)


[info]alex_celly@lj
2007-01-29 17:39 (ссылка)
А промандоблядское пиздопроёбище, охуевающее от своей злоебучести?

(Ответить) (Уровень выше) (Ветвь дискуссии)


[info]dolboeb@lj
2007-01-29 17:50 (ссылка)
Вряд ли Интел на такое закладывался. Это ж было задолго до Веб 2.0

(Ответить) (Уровень выше)


[info]akigo@lj
2007-01-29 16:57 (ссылка)
А "долбоеб" почему не фильтруется?

(Ответить) (Ветвь дискуссии)


[info]dolboeb@lj
2007-01-29 17:09 (ссылка)
Потому что не русскими буквами пишется.
Нет в русском языке такого слова dolboeb.

(Ответить) (Уровень выше) (Ветвь дискуссии)


[info]alfer22@lj
2007-01-30 01:59 (ссылка)
слова нет, а dolboeb есть

(Ответить) (Уровень выше)


[info]vadim_i_z@lj
2007-01-29 19:18 (ссылка)
Я вот так же написал когда-то для своих школьников прогу по фоносимволическому анализу. Естественно, что сперва они стали проверять свои имена и фамилии, а потом пошли по списку Интела. Я написал фильтрующую процедуру... и получил много впечатлений, составляя список слов и закрывая экран,когда кто-то входил в кабинет информатики.

(Ответить)


[info]anikitin@lj
2007-01-30 06:55 (ссылка)
кто интересно был этот прекрасный менеджер.
у меня есть парочка идей, но они как-то подрывают мою веру в людей всё-таки.

(Ответить) (Ветвь дискуссии)


[info]dolboeb@lj
2007-01-30 07:38 (ссылка)
Я как раз думал, что ты помнишь эту историю лучше меня.

(Ответить) (Уровень выше) (Ветвь дискуссии)


[info]anikitin@lj
2007-01-30 08:01 (ссылка)
да я ж не занимался никогда медийкой чистой.
это всё делалось через европу в те годы.

именно поэтому мне и удивительно - кто додумался до стоп листа совершенно непонятно.
разве что начальник мой тогдашний непосредственный - но он всегда производил впечатление здравого человека.
ну да бох с ними.

(Ответить) (Уровень выше)