Войти в систему

Home
    - Создать дневник
    - Написать в дневник
       - Подробный режим

LJ.Rossia.org
    - Новости сайта
    - Общие настройки
    - Sitemap
    - Оплата
    - ljr-fif

Редактировать...
    - Настройки
    - Список друзей
    - Дневник
    - Картинки
    - Пароль
    - Вид дневника

Сообщества

Настроить S2

Помощь
    - Забыли пароль?
    - FAQ
    - Тех. поддержка



Пишет dolboeb ([info]dolboeb)
@ 2007-11-06 11:51:00


Previous Entry  Add to memories!  Tell a Friend!  Next Entry
Про Топ Яндекса
Злые яндексы обидели спецпропагандона.
Он спамил-спамил, глаз не сомкнул, плодил виртуалов, весь топ Яндекса засрал идентичной записью про партийный корпоратив, а потом настал рабочий день, проснулись админы, и спам из топа вычистили. Как теперь отчитываться перед начальством за освоенный бюджет на покорение Интернета?!

Забавно, конечно, читать, когда спаммер жалуется той самой публике, которую он, ради копеечной выгоды, пытался отыметь, что отыметь в итоге не получилось.
Но Яндексу реально пора уже проснуться и нюхать кофе.

Идея засекретить алгоритм рейтингования, чтобы он был известен только накрутчикам, а потом до конца жизни скрывать факт накруток от публики — мягко говоря, неудачная придумка.

Ещё более неудачная идея — бороться с накрутками втихаря, аки тать в нощи, превращая пользователей рейтинга (которые изначально заинтересованы в фильтрации любого спама) из естественных союзников в противники.

Мне кажется, что сила любого рейтинга — в прозрачности алгоритма и в общих правилах для всех.
Пускай у всех будет и одинаковая возможность его накрутить, и одинаковое понимание, чем такие успехи караются.
Иначе рано или поздно (скорее, увы, рано) весь Топ30 админам придётся составлять вручную.
И выглядеть это зрелище будет, мягко говоря, печально.


(Читать комментарии) - (Добавить комментарий)


[info]drugoi@lj
2007-11-06 06:02 (ссылка)
>весь Топ30 админам придётся составлять вручную.

а разве они еще этого не делают?

(Ответить) (Ветвь дискуссии)


[info]dolboeb@lj
2007-11-06 06:04 (ссылка)
Нет, пока они его вручную только чистят.
Но эвристики, которые для этого используются, - лекарство хуже болезни.
Поэтому рано или поздно все действительно популярные записи окажутся забанены.
Тогда придётся вручную не только убирать оттуда спам, но и добавлять не-спам.

(Ответить) (Уровень выше) (Ветвь дискуссии)


[info]drugoi@lj
2007-11-06 06:13 (ссылка)
то, что чистят вручную я заметил. на вчерашний пост с фотографией Земляниченко уже 42 ссылки, а в пятерке, т.е. на морде страницы блогов, он так и не оказался ни разу. :-)

(Ответить) (Уровень выше) (Ветвь дискуссии)


[info]illyn@lj
2007-11-06 06:17 (ссылка)
Яндекс.Бар видит даже 83
Image

(Ответить) (Уровень выше)


[info]dolboeb@lj
2007-11-06 06:18 (ссылка)
Ты говоришь об исключении, и тут ты прав.
Исключение постов, по всем критериям долженствующих попасть в топ - это ручная работа.

А вот включение в топ постов, которые сами туда не попали бы - это ещё впереди.
Пока что до этого не дошло.
Но скоро дойдёт - когда первые 50 ссылок поделят ФЭП с ЛайвИнтернетом.

(Ответить) (Уровень выше) (Ветвь дискуссии)


[info]valez@lj
2007-11-06 07:59 (ссылка)
LiveInternet уже запрещен для показа в топе, тут даже можно не переживать :) попадают только те посты LI, на которые много ссылок внутри ЖЖ. Если бы правила были бы равными, то...

Я давно Антону предлагал вообще сделать некий метаязык для задания правил выбора постингов. Чтобы если сами не могут подобрать ничего лучше, чем есть + ручная работа, то дали бы возможность союзникам - блоггерам самостоятельно подкручивать различные рычажки, давая больший или меньший вес тем или иным параметрам (ссылки, посещаемость, авторитетность, количество вовлеченных блогхостингов и еще можно придумать много разных).

Такой вот абсолютно открытый механизм, конечно, имел бы результат.

(Ответить) (Уровень выше) (Ветвь дискуссии)


[info]dolboeb@lj
2007-11-06 08:11 (ссылка)
LiveInternet уже запрещен для показа в топе, тут даже можно не переживать :) попадают только те посты LI, на которые много ссылок внутри ЖЖ. Если бы правила были бы равными, то...

Если бы правила были равными, то ни Алекса Жданова, ни Соколова 2007 к первой тройке близко б не лежало.

Но действительно, для Яндекса больший вес имеет ссылка с другого хостинга, чем с того же самого.
Теоретически оно правильно, на практике - очередная рандомизация выдачи.

дали бы возможность союзникам - блоггерам самостоятельно подкручивать различные рычажки... Такой вот абсолютно открытый механизм

К сожалению, это взаимоисключающие вещи: союзники-блоггеры в борьбе со спаммерами и "абсолютно открытый механизм". Союзники-блоггеры подразумевают сепаратный сговор, детали которого трудно сделать открытыми.

(Ответить) (Уровень выше) (Ветвь дискуссии)


[info]valez@lj
2007-11-06 08:35 (ссылка)
Ситуация со Ждановыми очень простая
1) Яндекс говорит, что нет сил и времени сейчас подумать, как лучше выстроить рейтинг, поэтому давайте в десять раз занизим ссылки внутри LI
2) В итоге те, кто накручивает топ, начинают усиленно накручивать и в итоге вылезают в него.

Соответственно, Ждановы есть порождение Яндекса. Если бы алгоритм выдавал в топ ненакрученные посты написанные честными хорошими блогами, то накрутчикам бы просто не хватало там места и их деятельность не имела бы смысла.

А абсолютно открытый механизм - абсолютно такой же, как в концепции бесплатного ПО. Вот алгоритм, который мы сейчас используем. Вот способ вам попробовать изменить его и увидеть результаты. Вот сюда высылайте свои измененные алгоритмы, если сможете обосновать, почему они лучше справляются с поиском интересных постов.

А до тех пор ничего лучше, чем, например, добавлять в топ только записи друзей Антона Носика, придумать нельзя, потому как Яндекс один и у него много других дел, а накрутчиков сотни и это их хлеб.

(Ответить) (Уровень выше) (Ветвь дискуссии)


[info]dolboeb@lj
2007-11-06 08:50 (ссылка)
Если бы алгоритм выдавал в топ ненакрученные посты написанные честными хорошими блогами, то накрутчикам бы просто не хватало там места и их деятельность не имела бы смысла

Яндекс говорит, что "честных топов" слишком мало.

Я не могу относиться к этому утверждению серьёзно, потому что у Яндекса в его чёрном ящике стоит вручную выставленный параметр expiry, отбраковывающий как раз честно вылезшие в топ записи.

А до тех пор ничего лучше, чем, например, добавлять в топ только записи друзей Антона Носика, придумать нельзя

Только друзей Антона Носика в полтора раза больше, чем блогов-тысячнегов по всему РУНЕТу.
Их больше, чем партнёрских СМИ в новостном поиске Яндекса.
Так что если бы выборка для топов была так велика, в этом не было бы ни малейшей проблемы.

К сожалению, на практике работают совершенно другие алгоритмы.

(Ответить) (Уровень выше) (Ветвь дискуссии)


[info]valez@lj
2007-11-06 09:00 (ссылка)
Да я без доли иронии. Но тогда получилось бы не адекватное представление блогосферы, а "самая популярная передача на ТВ среди моей мамы".

На вкус и цвет товарищей нет, каждому возрасту, социально-культурному слою и так далее интересны совершенно разные вещи, и там и там есть умные интересные люди и не факт, что Антон Носик бы их смог добавить в друзья всех, даже если бы стремился к этому.

Это как в поиске нужно стремиться не только к точности, но и к полноте. Полнота уже никакая, а точность подкручивают вручную, в итоге, конечно, ерунда.

А предложенный мною комментом выше алгоритм это как раз примерно то, как решают подобную проблему поисковые системы: открытый контест различных весов различным параметрам. Хотя, конечно, даже Яндекс не открывает свой набор "весов", на которых он достигает высоких результатов, это очень обидно и тормозит прогресс, хотя локально, конечно, тормозит и прогресс спамеров.

(Ответить) (Уровень выше) (Ветвь дискуссии)


[info]dolboeb@lj
2007-11-06 09:25 (ссылка)
открытый контест различных весов различным параметрам

Совершенно согласен.

Хотя, конечно, даже Яндекс не открывает свой набор "весов"

Он его не просто "не открывает", он его ещё и маскирует, публикуя заведомую чушь в FAQ под видом объяснений алгоритма:
http://blogs.yandex.ru/faq.xml?id=966617#id27805717

это очень обидно и тормозит прогресс, хотя локально, конечно, тормозит и прогресс спамеров

В конечном счёте спаммеров это не тормозит, а, наоборот, закаляет. Между спаммерами таким образом проводится турнир, в результате которого весь топ Яндекса достаётся на разграбление десятке сильнейших. А Яндекс в итоге вынужден покрывать их художества, из ложно понятой заботы о чести мундира.

(Ответить) (Уровень выше) (Ветвь дискуссии)


[info]danwinter@lj
2007-11-06 13:45 (ссылка)
маскирует, публикуя заведомую чушь в FAQ
по ссылке кажется ничего такого нет

а каким образом "помощь зала" бы работала при открытых правилах?

(Ответить) (Уровень выше) (Ветвь дискуссии)


[info]dolboeb@lj
2007-11-06 14:37 (ссылка)
По ссылке есть волшебное объяснение:
«Популярные записи» — cписок записей, которые больше всего заинтересовали блоггеров в последние сутки. Определяется автоматически на основе количества ссылок на запись среди других блоггеров, количества комментариев, авторитетности блоггера, а также других параметров.

Всё, что выделено болдом - не имеет никакого отношения к реальности.

а каким образом "помощь зала" бы работала при открытых правилах?

Помощь зала работала бы при любых правилах, если бы её принимали.
Яндекс вообще не понимает такой темы, как диалог и сотрудничество с пользователями.
Пользователей в Яндексе могут любить, радовать, дарить им подарки, изучать их под микроскопом, но ни при каких условиях не допускается мысль, что с их стороны может проистечь какой-то осмысленный input в отношении работы сервиса.

Самое смешное, что это любопытное отношение к пацакам в первые же месяцы работы в Яндексе перенимает самый низовой саппорт таких сервисов, как Каталог и Новости. Он начинает на полном серьёзе рассказывать владельцам сайтов, что они, на самом деле, неправильно понимают тематику и жанр своих сайтов.

А самый забавный экспириенс - это подать в Яндекс bug report.
Сделать это невозможно в принципе.
Даже когда получаешь там жалование консультанта.

(Ответить) (Уровень выше)


[info]dolboeb@lj
2007-11-07 07:51 (ссылка)
LiveInternet уже запрещен для показа в топе, тут даже можно не переживать :)

Я замолвил словечко, и всё разбанили :)
Image
Теперь точно можно не переживать :)

(Ответить) (Уровень выше)


[info]nestol_next@lj
2007-11-07 13:20 (ссылка)
LiveInternet уже запрещен для показа в топе,

Господи, спасибо тебе, хоть ты и не существуешь.

(Ответить) (Уровень выше)


[info]ex_maxho_ma@lj
2007-11-06 06:15 (ссылка)
:popcorn:

(Ответить) (Уровень выше)


[info]illyn@lj
2007-11-06 06:11 (ссылка)
По выходным так, отсюда глядя — в Яндексе выходной. И админов внутри нет.

(Ответить) (Уровень выше)


(Читать комментарии) -