Войти в систему

Home
    - Создать дневник
    - Написать в дневник
       - Подробный режим

LJ.Rossia.org
    - Новости сайта
    - Общие настройки
    - Sitemap
    - Оплата
    - ljr-fif

Редактировать...
    - Настройки
    - Список друзей
    - Дневник
    - Картинки
    - Пароль
    - Вид дневника

Сообщества

Настроить S2

Помощь
    - Забыли пароль?
    - FAQ
    - Тех. поддержка



Пишет dolboeb ([info]dolboeb)
@ 2004-04-05 20:11:00


Previous Entry  Add to memories!  Tell a Friend!  Next Entry
Хорошие новости от Яндекса
  • Rambler.Ru — 16000
  • Газета.Ру — 14.000
  • Лента.Ру — 14.000
  • РБК — 13.000
  • РИА "Новости" — 12.000
    ...
  • Курсор — 800 (против 150 в январе и 400 к началу марта)

    Источник: http://yandex.ru/cy/
    Disclaimer: я не знаю, по какой формуле вычисляется CY, был бы крайне признателен читающим эти строки специалистам из Яндекса за объяснение алгоритма.


  • (Добавить комментарий)


    [info]ex_ex_ex_ma@lj
    2004-04-05 06:12 (ссылка)
    я хоть не из яндекса, но насколько помню по работе с ними, индекс цитирования означает то, сколько раз на вас ссылаются другие веб-сайты, проиндексированные яндексом. Считаются, разумеется не упоминания, а гиперссылки.

    (Ответить) (Ветвь дискуссии)


    [info]dolboeb@lj
    2004-04-05 06:30 (ссылка)
    Это как раз понятно.
    Условно говоря, CY=количество ссылающихся уникальных серверов (а не страниц).
    Проблема в формуле, которая позволяет независимому исследователю получить те же цифры запросом к Яндексу.
    По состоянию на пару лет назад такой формулы не существовало.
    Поэтому значение CY прописывается в УРЛе явным образом: &ci=12000. Можно поправить УРЛ, изменится и значение CY, показываемое по ссылке.

    (Ответить) (Уровень выше) (Ветвь дискуссии)


    [info]zorich@lj
    2004-04-05 07:34 (ссылка)
    По моим наблюдениям над ИЦ zorich.ru (http://www.zorich.ru) эмпирически получается что-то вроде "число серверов-реферреров" умножить примерно на 5.

    Но там, разумеется, все хитрее и вес ссылки колеблется в зависимости от степени родства категорий сервера-реферрера и реферрируемого сайта. Плюс в конечном итоге ИЦ округляется каким-то немыслимым образом до двадцатипятерок (!).

    (Ответить) (Уровень выше) (Ветвь дискуссии)


    [info]ex_tipharet@lj
    2004-04-06 00:36 (ссылка)


    В той категории, где я
    (http://www.yandex.ru:80/cy?sort=0&page=1&base=1&oldhost=&id=61):

    "Net-культура" (http://www.russ.ru/netcult)
    Результат поиска: страниц - 14285, тИЦ - 900

    "Imperium" - комплекс художественных проектов (http://imperium.lenin.ru)
    Результат поиска: страниц - 3586, тИЦ - 500

    MANIA.RU - интернет-проекты студии Новиков Дизайн
    (http://mania.ru)
    Результат поиска: страниц - 283, тИЦ - 450

    "Китеж" - традиция в мире постмодерна (http://kitezh.onego.ru)
    Результат поиска: страниц - 1007, тИЦ - 190

    О колоколах и колокольном искусстве (http://www.kolokola.ru)
    Результат поиска: страниц - 133, тИЦ - 150

    "MediaArtLab" - современная медиакультура (http://www.danet.ru)
    Результат поиска: страниц - 120, тИЦ - 140

    Объяснения этому нет никакого по-моему

    Такие дела
    Миша

    (Ответить) (Уровень выше) (Ветвь дискуссии)


    [info]zorich@lj
    2004-04-06 00:52 (ссылка)
    Объяснения этому нет никакого по-моему

    Так не страницы надо брать, а сервера. (Не говорю, что ясности добавится, но все-таки.)

    P.S. Да, я не прав насчет кратности 25. Кратность 5 все-таки.

    (Ответить) (Уровень выше)


    [info]avolzhanin@lj
    2004-04-05 06:34 (ссылка)
    Антон Борисыч, на Яндексе как раз 2 недели назад поменялась система ранжирования вообще и система подсчета ИЦ - в частности. По какой формуле он сейчас вычисляется - не знает никто, в том числе и люди Яндекса:-) См. по этому поводу форумы на Серчэнджинс - там до сих пор флеймы не утихают. Вкратце: двукратный прирост после перехода на новую систему - не редкость, равно как и двукратное падение индекса. Но вообще, толстение Курсора после массированной рекламной кампании в СЖ и рамблеровских еще, кажется, сетках - не чюдо;-) И плюс убийство Ясина вы там очень хорошо отработали.

    (Ответить) (Ветвь дискуссии)


    [info]dolboeb@lj
    2004-04-05 11:29 (ссылка)
    толстение Курсора после массированной рекламной кампании в СЖ и рамблеровских еще, кажется, сетках - не чюдо

    И в СЖ, и в рамблеровских крутилках УРЛ ссылки выглядит как случайная цифра, так что нет ни малейших шансов, чтобы он вдруг отразился на CY Курсора.

    В том-то и состоит фокус CY, что описываются не мои усилия, а чьи-то совершенно посторонние.
    Прямая, доступная яндеховому учету, ссылка на Курсор с той же Ленты существует года с 2000, и вряд ли от моего инвестирования в Курсор вес ее вырос.

    (Ответить) (Уровень выше) (Ветвь дискуссии)


    [info]avolzhanin@lj
    2004-04-05 19:07 (ссылка)
    Под "толстением" я все же подразумеваю рост посещаемости - и иного толстения не признаю. А все эти яндексОвые денежки считаю ни на что не влияющей глупостью. Ну право - на что они там влияют? На положение в каталоге? Кто-нибудь вообще в здравом уме пользуется этим самым каталогом Яндекса? На позицию в результатах поиска? Не влияет он ничерта на позицию в результатах. По мне - так и к лучшему, что не влияет;-)

    В этом смысле у Рамблера все умнее и правильнее устроено. Чем больше посещаемость - тем выше позиция в ТОП-100. Чем выше позиция в ТОП-100 - тем чаще индексится ресурс. И тем больше на него переходов собственно с рейтинга. Выход на первую страницу рейтинга СМИ дает прирост минимум в 300-400 гавриков ежедневно - ну, "умное избранное", да.

    Сайты из первой сотни индексятся Рамблером вообще ежедневно, по ощущениям. Плюс если в описалове ТОПа написано "Курсор - убийство Ясина" и сам сайт сидит в первой сотне - то по запросу "убийство Ясина" через Рамблер он будет с большой долей вероятности сидеть на первом экране.

    Больше посещаемость - выше рейтинг - больше релевантность - еще больше посещаемость - еще выше рейтинг и так далее, по спирали. А рост яндекскового ИЦ при этом - закономерный, приятный, но - абсолютно побочный продукт популярности;-)

    (Ответить) (Уровень выше) (Ветвь дискуссии)


    [info]lammer@lj
    2004-04-06 02:12 (ссылка)
    Ну по поводу Рамблера вы загнули. От посещаемости сайта в поисковике абсолютно ничего не меняется. И лучший пример Utro.Ru
    Попробуйте поискать Утро на Рамблере, а потом на Яндексе или Гугле. Разница поразительная

    (Ответить) (Уровень выше)


    [info]tty01@lj
    2004-04-14 21:17 (ссылка)
    > Кто-нибудь вообще в здравом уме пользуется этим самым каталогом Яндекса?
    Иногда пользуется. Но и в этом каталоге уже стало много битых ссылок и описаний, которые не соответствуют действительности.

    (Ответить) (Уровень выше)


    [info]dil@lj
    2004-04-05 06:35 (ссылка)
    http://yandex.ru/info/ci.html
    Точный алгоритм никто не скажет, но он учитывает и собственно количество ссылок, и тематическую схожесть ссылающегося и ссылаемого (?) сайта, и тИЦ ссылающегося сайта.

    (Ответить)


    [info]gray_ru@lj
    2004-04-05 09:47 (ссылка)
    Ща, как же, так и объяснят яндексоиды свои алгоритмы :).
    Не вдаваясь в особо мелкие детали, тИЦ (нынешняя версия CY, тематический ИЦ) считается как функция от:
    1. Количества ссылок на сайт.
    2. Тематической близости ссылающихся сайтов исходному сайту.
    Где-то там еще должен затесаться тИЦ ссылающихся ресурсов, кстати.
    Но вообще-то, последний апдейт тИЦа отражает больше изменения в работе Яндекса, нежели изменения в самих сайтах.

    (Ответить) (Ветвь дискуссии)


    [info]dolboeb@lj
    2004-04-05 11:22 (ссылка)
    последний апдейт тИЦа отражает больше изменения в работе Яндекса, нежели изменения в самих сайтах

    Это я понял.
    При предпоследнем апдейте (проведенном, очевидно, по старой методике) CY Курсора составил 850. Так что Курсор от смены алгоритма проиграл, в отличие от всех прочих вышеперечисленных. Газета.Ру по старой методике на 5-6% отставала от Ленты, и обе они примерно на 15-20% отставали от РБК.

    (Ответить) (Уровень выше)


    [info]bezukh@lj
    2004-04-05 11:33 (ссылка)
    А вот тематическая близость в свою очередь определяется, как установлено эмпирическим путем, через каталог Яндекса. Но точной формулы никто не знает. Даже неизвестно (я пытался узнать, но ответа не нашел), важно ли находиться сайту в одной подкатегории со ссылающимся сайтом, или достаточно быть в разных подкатегориях одной большой категории, чтобы ссылку Яндекс считал "тематической".

    (Ответить) (Уровень выше) (Ветвь дискуссии)


    [info]gray_ru@lj
    2004-04-05 12:05 (ссылка)
    При всем прочем - тИЦ в его публичном виде влияет лишь на порядок в каталоге Яндекса. Реальный же тематический показатель цитируемости должен рассчитываться для каждого документа в отдельности. Сейчас это нереально. Слишком дорого по ресурсам.
    Изящный выход, кстати, пробовал Google - LocalRank. Это когда тематическая цитируемость ресурса по данному запросу определяется по количеству ссылок, ведущих на сайт с первой тысячи сайтов по данному запросу. Так и это дороговато выходит. Это вам не гигабайты под почту раздавать. :).

    (Ответить) (Уровень выше) (Ветвь дискуссии)


    [info]bezukh@lj
    2004-04-05 12:14 (ссылка)
    При всем прочем - тИЦ в его публичном виде влияет лишь на порядок в каталоге
    Яндекса


    Да. Из чего мной был сделан вывод, что гнаться за тИЦем специально не надо.

    Реальный же тематический показатель цитируемости должен рассчитываться для каждого документа в отдельности.

    Не представляю себе такого даже теоретически. Ведь на конкретные страницы ссылаются ничтожно редко. Все ссылки стоят на главные страницы. Т.е. тогда 90% всех документов даже уважаемых сайтов будут иметь тИЦ равным 0.

    (Ответить) (Уровень выше) (Ветвь дискуссии)


    [info]gray_ru@lj
    2004-04-05 12:31 (ссылка)
    Не представляю себе такого даже теоретически. Т.е. тогда 90% всех документов даже уважаемых сайтов будут иметь тИЦ равным 0.
    Да что там представлять?! Это все, только без учета тематики, давно реализовано - в PageRank Google и ВИЦе Яндекса.
    Ведь на конкретные страницы ссылаются ничтожно редко. Все ссылки стоят на главные страницы.
    Нет, это абсолютно не так. Для проверки - идете на Ленту.ру (коль скоро разговор идет в ЖЖ Носика :)), и сравниваете число ссылок внутрь сервера и наружу. Спускаетесь на страницу конкретной новости и повторяете процедуру. Думаю, что не ошибусь, если скажу, что в среднем каждая первая новость, относящаяся не к России, а к миру, имеет хотя бы одну ссылку на западный сайт, причем не на главную страницу.

    (Ответить) (Уровень выше) (Ветвь дискуссии)


    [info]bezukh@lj
    2004-04-05 12:42 (ссылка)
    Да что там представлять?! Это все, только без учета тематики, давно реализовано - в PageRank Google и ВИЦе Яндекса.

    В том-то и дело, что без учета тематики. К тому же у Гугла действует правило, что PR передается от ссылающейся страницы на ссылаемые. Мне кажется, что передавать таким образом тематику было бы нелогично.

    Думаю, что не ошибусь, если скажу, что в среднем каждая первая новость, относящаяся не к России, а к миру, имеет хотя бы одну ссылку на западный сайт, причем не на главную страницу.

    Вот теперь убедили. :-) Тогда тИЦ будет высоким у отдельных страниц-первоисточников (любых, не только новостных), что вполне логично.

    (Ответить) (Уровень выше)


    [info]bezukh@lj
    2004-04-05 12:47 (ссылка)
    ...Но все равно тогда тИЦ будет равен 0 у подавляющего большинства документов.
    Если, конечно, страницы не будут им "делиться" в масштабах одного сайта.

    (Ответить) (Уровень выше)