Войти в систему

Home
    - Создать дневник
    - Написать в дневник
       - Подробный режим

LJ.Rossia.org
    - Новости сайта
    - Общие настройки
    - Sitemap
    - Оплата
    - ljr-fif

Редактировать...
    - Настройки
    - Список друзей
    - Дневник
    - Картинки
    - Пароль
    - Вид дневника

Сообщества

Настроить S2

Помощь
    - Забыли пароль?
    - FAQ
    - Тех. поддержка



Пишет dolboeb ([info]dolboeb)
@ 2007-11-23 02:36:00


Previous Entry  Add to memories!  Tell a Friend!  Next Entry
За кулисами Яндекс.рейтинга
Незнакомый мне пользователь [info]v_ad@lj сочинил новую пузомерку.
Она берёт ваш username в ЖЖ, анализирует профайл, и находит всех тысячнегов в вашем списке Friend of.
На выходе выдаёт код, позволяющий похвастаться результатами этого изыскания.
Иногда это бессмысленная цифра. Потому что, как я уже не раз писал, "тысячнег" от нормального человека ровным счётом ничем не отличается. У него такие же две ноги, две руки, одна голова, и, как правило, нет хвоста.
Но иногда о чём-то эта цифирь всё же свидетельствует. В тех случаях, про которые покойный Георг Вильгельм Фридрих Г. подмечал, что количество перешло в качество. Или не перешло. Чтоб в этом убедиться, полезно взглянуть вот на эту табличку:
ЖурналФрендовТысячнеговПроцент
[info]galerist@lj45851342,92%
[info]mi3ch@lj84721231,45%
[info]pe3yc@lj17911236,87%
[info]labas@lj26241214,61%
[info]verner@lj15171217,98%
[info]dolboeb@lj102951161,13%
[info]another_kashin@lj30851163,76%
[info]nalymov@lj16051147,10%
[info]sholademi@lj27931103,94%
[info]drugoi@lj175481070,60%
[info]abstract2001@lj31291033,29%
[info]e_dikiy@lj15211036,77%
[info]tushka@lj20911024,88%
[info]maccolit@lj32011003,12%
[info]plushev@lj3472972,79%
[info]xura@lj1313977,39%
[info]mozgovaya@lj3556962,70%
[info]uisky@lj2102954,52%
[info]krylov@lj4283902,10%
[info]usachev@lj2091904,30%
[info]goblin_gaga@lj7295861,18%
[info]nl@lj6259861,37%
[info]r_l@lj2465853,45%
[info]dimkin@lj6832841,23%
[info]snorapp@lj4637841,81%
[info]ivand@lj1443845,82%
[info]dmitrivrubel@lj1347846,24%
[info]olleke_bolleke@lj7018311,84%
[info]avva@lj4352821,88%
[info]alex_lebedev@lj2812802,84%
[info]maxim_kononenko@lj1957804,06%
[info]chingizid@lj5503781,41%
[info]frumich@lj6568751,14%
[info]radulova@lj5886721,22%
[info]bogushevich@lj3522712,01%
[info]romochka@lj3956661,67%
[info]damian@lj1244645,14%
[info]aqua_snezhok@lj2909612,10%
[info]nevzlin@lj2488582,33%
[info]gospodi@lj1081534,90%
[info]amigo095@lj3954501,26%
[info]doctor_livsy@lj17825490,27%
[info]e_grishkovets@lj11620470,40%
[info]exler@lj7734470,60%
[info]katechkina@lj11451440,38%
[info]cema@lj498408,03%
[info]gosha_o@lj467377,92%
[info]stillavinsergei@lj8505320,38%
[info]graf_garcia@lj1762011,36%
[info]toster@lj17120,10%
[info]solomin@lj247124,86%
[info]antonborisov@lj201125,97%
[info]brad@lj165960,36%
[info]sgt@lj9166,59%

Легко догадаться, что составлял я эту табличку наугад. Ориентировался на такие параметры, как популярность по числу френдов, "авторитетность" по Яндексу и офлайновая известность персонажа. Социологические выводы в основном таковы:
1. На долю тысячнегов среди френдов негативно влияет общая популярность: чем больше френдов, тем ниже среди них доля тысячнегов. Высокая доля тысячнегов среди френдов характерна для ЖЖ с камерной аудиторией, владельцы которых широко известны в узких кругах — причём одинаково часто причиной известности может служить личное знакомство ([info]gosha_o@lj), или профессиональная деятельность персонажа ([info]cema@lj).
2. На число тысячнегов среди читателей влияют очень разные, никак между собой не связанные факторы, относящиеся и к биографии человека, и к возрасту ЖЖ, и к истории его раскрутки, и к месту работы. Любой рейтинг, построенный на учёте этих параметров в том или ином соотношении, будет больше характеризовать само это соотношение, заданное при выборе формулы оценки, чем какие-либо объективные свойства рейтингуемых блогов. Что, собственно говоря, мы и наблюдаем в рейтинге т.н. "авторитетности" Яндекса. Практически табличка наша и показывает (на примере [info]doctor_livsy@lj и [info]stillavinsergei@lj), как именно Яндекс изначально расставлял оценки блогам в ЖЖ. Она же раскрывает секрет изначальной популярности [info]sholademi@lj. Потом формулку подкрутили, и Самсон просел, а Лукьяненко поднялся. Как выше уже сказано, это изменение описывало изменения не в "авторитетности" блоггера (whatever this means), а в алгоритме расчёта.

PS. Я наверняка упустил какие-то журналы, у которых число читателей-тысячнегов выше и в абсолютном значении, и в процентном отношении. Благодарен буду за наводки, помогающие исправить и дополнить таблицу.

PPS. При составлении таблички наткнулся на неслабую дырищу в яндексовом спайдеринге ЖЖ. У Гришковца, как выше указано, 11620 френдов только в ЖЖ. Яндексу из них известно только 7009 (цифра включает все знакомые Яндексу RSS-подписки извне ЖЖ, а не только Friends of). С учётом того факта, что журнал [info]e_grishkovets@lj начал прирастать друзьями с июля с.г. (до этого там было 4 записи и считанные десятки френдов), очевидно, что все 11.620 добавивших — это живые люди, логинившиеся в ЖЖ и пополнявшие свою френдленту за последние 4 месяца. Тот факт, что о существовании 40% из них Яндекс не подозревает, невозможно объяснить цифрой про 17% аккаунтов ЖЖ, запретивших себя индексировать. Ведь данные о френдах журнала Яндекс берёт из профайлов тех, кто его зафрендил, и никто не может запретить Яндексу индексировать userinfo своих читателей. Так что единственное логичное объяснение тут — лаг в работе индексирующего ЖЖ спайдера. В принципе, такое запаздывание является совершенно нормальным явлением, ибо никто не вправе требовать от поисковой машины полной синхронизации и добавления вновь возникающих потоков в режиме реального времени (если только сам хостинг не делает всеобъемлющий content push). Однако же лаг в 40% — это некоторая внештатная величина. Которая, кстати, хорошо объясняет, почему Яндекс знает в ЖЖ 628.498 русских авторов, хотя в действительности их тут 1.236.384 по последнему счёту.

Поясню, во избежание кривотолков, что это наблюдение — совершенно не критика в адрес Яндекса, а просто попытка сопоставления тех данных, которые он транслирует, с реальностью. Ответственность за расхождение этих данных с реальностью лежит скорее на самом ЖЖ, чем на индексирующем его поисковике. Единственная претензия к Яндексу — что он использует термины "авторитетность" и "популярность" вне всякой связи с их значением в русском языке, для обозначения параметра, который менее амбициозные сервисы именуют karma. Но это долгий семантический спор, далеко выходящий за рамки моих скромных изысканий.


(Читать комментарии) - (Добавить комментарий)


[info]rizhaya_bestiya@lj
2007-11-23 08:55 (ссылка)
у меня всмего 5 и я от этого не парюсь:)

(Ответить)


(Читать комментарии) -