|
| |||
|
|
За кулисами Яндекс.рейтинга Незнакомый мне пользователь v_ad@lj сочинил новую пузомерку.Она берёт ваш username в ЖЖ, анализирует профайл, и находит всех тысячнегов в вашем списке Friend of. На выходе выдаёт код, позволяющий похвастаться результатами этого изыскания. Иногда это бессмысленная цифра. Потому что, как я уже не раз писал, "тысячнег" от нормального человека ровным счётом ничем не отличается. У него такие же две ноги, две руки, одна голова, и, как правило, нет хвоста. Но иногда о чём-то эта цифирь всё же свидетельствует. В тех случаях, про которые покойный Георг Вильгельм Фридрих Г. подмечал, что количество перешло в качество. Или не перешло. Чтоб в этом убедиться, полезно взглянуть вот на эту табличку:
Легко догадаться, что составлял я эту табличку наугад. Ориентировался на такие параметры, как популярность по числу френдов, "авторитетность" по Яндексу и офлайновая известность персонажа. Социологические выводы в основном таковы: 1. На долю тысячнегов среди френдов негативно влияет общая популярность: чем больше френдов, тем ниже среди них доля тысячнегов. Высокая доля тысячнегов среди френдов характерна для ЖЖ с камерной аудиторией, владельцы которых широко известны в узких кругах — причём одинаково часто причиной известности может служить личное знакомство ( gosha_o@lj), или профессиональная деятельность персонажа ( cema@lj).2. На число тысячнегов среди читателей влияют очень разные, никак между собой не связанные факторы, относящиеся и к биографии человека, и к возрасту ЖЖ, и к истории его раскрутки, и к месту работы. Любой рейтинг, построенный на учёте этих параметров в том или ином соотношении, будет больше характеризовать само это соотношение, заданное при выборе формулы оценки, чем какие-либо объективные свойства рейтингуемых блогов. Что, собственно говоря, мы и наблюдаем в рейтинге т.н. "авторитетности" Яндекса. Практически табличка наша и показывает (на примере doctor_livsy@lj и stillavinsergei@lj), как именно Яндекс изначально расставлял оценки блогам в ЖЖ. Она же раскрывает секрет изначальной популярности sholademi@lj. Потом формулку подкрутили, и Самсон просел, а Лукьяненко поднялся. Как выше уже сказано, это изменение описывало изменения не в "авторитетности" блоггера (whatever this means), а в алгоритме расчёта.PS. Я наверняка упустил какие-то журналы, у которых число читателей-тысячнегов выше и в абсолютном значении, и в процентном отношении. Благодарен буду за наводки, помогающие исправить и дополнить таблицу. PPS. При составлении таблички наткнулся на неслабую дырищу в яндексовом спайдеринге ЖЖ. У Гришковца, как выше указано, 11620 френдов только в ЖЖ. Яндексу из них известно только 7009 (цифра включает все знакомые Яндексу RSS-подписки извне ЖЖ, а не только Friends of). С учётом того факта, что журнал e_grishkovets@lj начал прирастать друзьями с июля с.г. (до этого там было 4 записи и считанные десятки френдов), очевидно, что все 11.620 добавивших — это живые люди, логинившиеся в ЖЖ и пополнявшие свою френдленту за последние 4 месяца. Тот факт, что о существовании 40% из них Яндекс не подозревает, невозможно объяснить цифрой про 17% аккаунтов ЖЖ, запретивших себя индексировать. Ведь данные о френдах журнала Яндекс берёт из профайлов тех, кто его зафрендил, и никто не может запретить Яндексу индексировать userinfo своих читателей. Так что единственное логичное объяснение тут — лаг в работе индексирующего ЖЖ спайдера. В принципе, такое запаздывание является совершенно нормальным явлением, ибо никто не вправе требовать от поисковой машины полной синхронизации и добавления вновь возникающих потоков в режиме реального времени (если только сам хостинг не делает всеобъемлющий content push). Однако же лаг в 40% — это некоторая внештатная величина. Которая, кстати, хорошо объясняет, почему Яндекс знает в ЖЖ 628.498 русских авторов, хотя в действительности их тут 1.236.384 по последнему счёту.Поясню, во избежание кривотолков, что это наблюдение — совершенно не критика в адрес Яндекса, а просто попытка сопоставления тех данных, которые он транслирует, с реальностью. Ответственность за расхождение этих данных с реальностью лежит скорее на самом ЖЖ, чем на индексирующем его поисковике. Единственная претензия к Яндексу — что он использует термины "авторитетность" и "популярность" вне всякой связи с их значением в русском языке, для обозначения параметра, который менее амбициозные сервисы именуют karma. Но это долгий семантический спор, далеко выходящий за рамки моих скромных изысканий. |
||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||