Войти в систему

Home
    - Создать дневник
    - Написать в дневник
       - Подробный режим

LJ.Rossia.org
    - Новости сайта
    - Общие настройки
    - Sitemap
    - Оплата
    - ljr-fif

Редактировать...
    - Настройки
    - Список друзей
    - Дневник
    - Картинки
    - Пароль
    - Вид дневника

Сообщества

Настроить S2

Помощь
    - Забыли пароль?
    - FAQ
    - Тех. поддержка



Пишет kukutz ([info]kukutz)
@ 2006-04-21 16:32:00


Previous Entry  Add to memories!  Tell a Friend!  Next Entry
КИБ: моя презентация
2006_KIB_Blogosphere.ppt (433 Kb).

Называется "Блогосфера Рунета: занимательная статистика". В основном, данные поиска по блогам Яндекса, но часть цифр из других источников.

Самое интересное: миллион блогов в Рунете, 10% от мировой блогосферы, 10 тысяч читателей блога [info]doctor_livsy@lj.

Standalone-блоггеры выдвигают плохо сформулированные претензии, ответы на них под катом.

Начнем с того, что в качестве “блогосферы” рассматриваются только массивные блогохостинги, типа livejournal, блоги@mail.ru, blogger, и т.д. К слову, перечислены даже те, которые имеют по 500 и 800 русскоязычных пользователей.

Конечно, нет. Рассматриваются все. Мне важно было показать, как мало блогов на MSN и Blogger.com (именно у них 500 и 800 пользователей) и важно было показать, как блогхостинги ранжируются.
И при этом вскользь упоминаются недостойные внесения в список “самостоятельные” блоги, которых “всего-то около десяти тысяч”.

В список блогхостингов? Конечно, "недостойны", о чём вообще речь? Не надо сравнивать теплое и мягкое. Про десять тысяч тоже неверно, я говорил про десятки тысяч.
Немного странноватый подход, мне показалось. Учитывая что Technorati следит за контентом, т.к. большинство движков его пингует, а Яндекс?

В чём странноватость, я не понял. Насчёт пингов - таки да, Яндекс тоже "следит за контентом", как на weblogs.com, так и в других источниках. Кстати, weblogs.com пингуют больше, чем Technorati.
Но это всё неважно. Предположим, что Яндекс не "следит за контентом". Значит, русскоязычных постов на самом деле ещё больше, и мои выводы ещё более правомерны, ага?
Причем у ЖЖшного блога указывается количество френдов + RSS подписчиков, а у SellMe только RSS-подписчиков. А ведь это тоже не верно, т.к. такого понятия как “френды” у автономных блогов нет, да и френды - не показатель, многие используют френдов просто как закладки.

Что неверно-то? Да, нет "френдов". Значит, в формуле "читатели = френды + читатели через RSS" остаётся только второе слагаемое. А про закладки - это смешно, да. Можно данные какого-либо исследования на этот счёт?


(Добавить комментарий)


[info]yakovis@lj
2006-04-21 09:39 (ссылка)
На последнее. RSS-читалки тоже позволяют группировать каналы, так что если человек подписан на RSS и его дергает -- он вовсе не обязательно этот канал читает.

(Ответить) (Ветвь дискуссии)


[info]kukutz@lj
2006-04-21 09:54 (ссылка)
Ну да, это самоочевидно, что бывают "активные" читатели и "все".

За невозможностью посчитать активных - считаем всех.

(Ответить) (Уровень выше)


[info]bacek@lj
2006-04-21 09:54 (ссылка)
А вот ping надо-бы таки сделать...

(Ответить) (Ветвь дискуссии)


[info]kukutz@lj
2006-04-21 09:57 (ссылка)
Сделали же.

Надо документацию написать и выкатить.

(Ответить) (Уровень выше) (Ветвь дискуссии)


[info]bacek@lj
2006-04-21 21:56 (ссылка)
Давайте уже.

(Ответить) (Уровень выше)


[info]bobuk@lj
2006-04-21 10:16 (ссылка)
бацек, я уже :)
На коленке и питоне :)

(Ответить) (Уровень выше) (Ветвь дискуссии)


[info]bacek@lj
2006-04-21 21:55 (ссылка)
На коленке и на перле я сделал 1.5 года назад...

(Ответить) (Уровень выше)


[info]intwebit@lj
2006-04-21 11:21 (ссылка)
>> миллион блогов в Рунете
Это включая те "блоги", которые созданы чтобы поиметь траф с поисковиков?

(Ответить) (Ветвь дискуссии)


[info]kukutz@lj
2006-04-21 14:04 (ссылка)
А именно?

(Ответить) (Уровень выше) (Ветвь дискуссии)


[info]intwebit@lj
2006-04-21 14:17 (ссылка)
Блоги на бесплатных сервисах, набитые ключевыми словами.

Просто миллион - это как-то много.

(Ответить) (Уровень выше) (Ветвь дискуссии)


[info]kukutz@lj
2006-04-21 14:25 (ссылка)
Таких блогов - сотни три. Не влияет на число. И не включены, да =)

Миллион - включая заброшенные и подзамочные журналы.

Вот число активных - это то, что точно известно Поиску по блогам.

(Ответить) (Уровень выше) (Ветвь дискуссии)

три сотни?
[info]prosto_ya@lj
2006-04-23 19:28 (ссылка)
а Вы считаете за _блог_ отдельные темы каких-то форумов, которые Я-Лента находит при добавлении какого-то запроса с поиском по блогам?

в форумах просто оооочень много спама по запросам, порядка 90% (число почти с потолка) таких тем сразу кикаются администратором того самого форума, но они остаются в ленте (вы не удаляете мертвые потоки, помню)

ЖЖ и Мыло.Ру SEOшники тоже активно спамят, в первом случае, как я уже заметил, быстро суспендят, по Мылу я еще не отследил :-( но потоки, опять же - живы.

меня просто цифра в "три сотни" очень смущает...

ЗЫ. за презентацию - спасибо!

(Ответить) (Уровень выше) (Ветвь дискуссии)

Re: три сотни?
[info]kukutz@lj
2006-04-23 19:36 (ссылка)
Форумы за блоги я, конечно, не считаю вообще.

Активно - это вот как раз на сотни три.

(Ответить) (Уровень выше)

Re: три сотни?
[info]kukutz@lj
2006-04-23 19:36 (ссылка)
Вру, пять сотен. Ну да невелика разница.

(Ответить) (Уровень выше)


[info]apazhe_lj@lj
2006-04-23 02:10 (ссылка)
Таких не очень много. Даже я сказал бы - совсем мало.

(Ответить) (Уровень выше) (Ветвь дискуссии)


[info]uisky@lj
2006-04-23 17:59 (ссылка)
Я бы дополнил, что таких блогов, а вместе с ними - мёртвых, заброшенных, синдицированных и прочей такой мешающей статистическому анализу поебени, в принципе, до хуя, но отсеивается она довольно просто и серьёзноу такому пацановскому статистическому анализу мешать никак не может.

(Ответить) (Уровень выше)


[info]doppeltes@lj
2006-04-21 12:00 (ссылка)
Спасибо за то что выложили презентацию. Очень интересно было почитать.

(Ответить)


[info]liveuser@lj
2006-04-21 12:10 (ссылка)
"Количество читателей в LiveJournal посчитано анализом списка friends всех пользователей"

А это уже интересно. Расскажите, пожалуйста, как считали? ЖЖ ведь иногда отдает список friends только для платных пользователей, и обычным пауком его не взять... Т.е. логинились, массово скачивали ВСЕ и парсили? А список пользователей брали из Яндекс.Блогов - проиндексированные + запрещенные к индексированию?

У goblin_gaga, katechkina, nedorazumenie разница ЖЖ-шных и ваших показателей 40-150 человек, а у doctor_livsy 6000 - это не вызвало подозрений? приняли как данность, "так оно и есть"?

(Ответить) (Ветвь дискуссии)


[info]kukutz@lj
2006-04-21 14:07 (ссылка)
fdata.bml отдает список friends (не friend of) точный.

Скачав его для всех русскоязычных пользователей и их друзей, получим БД, по которой можно посчитать почти точные цифры.

Подозрений не вызвало, потому что есть и промежуточные точки.

Да и чего тут подозревать, методика подсчёта абсолютно прозрачная.

(Ответить) (Уровень выше) (Ветвь дискуссии)

!!!
[info]cmotpu@lj
2006-04-23 05:36 (ссылка)
А кто так ие "рускоязычные пользователи"? те, у кого Russia в юзеринфо прописана?

(Ответить) (Уровень выше) (Ветвь дискуссии)

Re: !!!
[info]kukutz@lj
2006-04-23 05:52 (ссылка)
Те, кто известны поиску по блогам Яндекса + те, у кого Russia в юзеринфо + все их друзья / вдрузьяху.

(Ответить) (Уровень выше) (Ветвь дискуссии)

!!!
[info]cmotpu@lj
2006-04-23 05:58 (ссылка)
аа, ну это уже да, близко. а насколько глубоко берутся друзья, то есть, скажем, у меня в дрзьях есть американец, например. Он посчитается как русский. Его друзья тоже проиндексируются или нет?

(Ответить) (Уровень выше) (Ветвь дискуссии)

Re: !!!
[info]kukutz@lj
2006-04-23 06:19 (ссылка)
1. К индексации всё это не имеет отношения.
2. Нет.

(Ответить) (Уровень выше) (Ветвь дискуссии)

!!!
[info]cmotpu@lj
2006-04-23 06:26 (ссылка)
хорошо, вопрос по-дургому: у меня друг американец, он посчитается как русский, его друзья тоже будут считаться русскими или на нем все остановится?

(Ответить) (Уровень выше) (Ветвь дискуссии)

Re: !!!
[info]kukutz@lj
2006-04-23 06:37 (ссылка)
2. Нет.

(Ответить) (Уровень выше)


[info]urbansheep@lj
2006-04-21 15:57 (ссылка)
О, спасибо за презентацию.

(Ответить)


[info]acerbial@lj
2006-04-21 16:55 (ссылка)
Блогов не существует.

(Ответить)


[info]raa@lj
2006-04-21 17:17 (ссылка)
в рунете 700000 постингов в неделю?... блогов не существует :) за презентацию спасибо, интересные цифры.

(Ответить)


[info]ex_1smash1100@lj
2006-04-21 18:03 (ссылка)
Спасибо посмотрю.
Данные иследования [info]toster@lj учитывались?

(Ответить) (Ветвь дискуссии)


[info]kukutz@lj
2006-04-22 02:35 (ссылка)
Ага. Спасибо ему большое.

(Ответить) (Уровень выше) (Ветвь дискуссии)


[info]ex_1smash1100@lj
2006-04-22 06:17 (ссылка)
Скажите, а тостер не публиковал свои исследования отдельно?

(Ответить) (Уровень выше) (Ветвь дискуссии)


[info]anton@lj
2006-04-22 08:22 (ссылка)
Ещё нет — часть данных ещё досчитывается. Скорее всего, начну публиковать на этой неделе.

(Ответить) (Уровень выше) (Ветвь дискуссии)


[info]ex_1smash1100@lj
2006-04-23 06:11 (ссылка)
Спасибо, жду с нетерпеньем.

(Ответить) (Уровень выше)


[info]mihun@lj
2006-04-21 19:34 (ссылка)
>Конечно, нет. Рассматриваются все. Мне важно было показать, как мало блогов на MSN и Blogger.com

Позвольте я вас пну с другого боку. :)

Очевидно, что данные Technorati не включают в себя:
а) блоги myspace. 60+ миллионов аккаунтов. Индексировать он их индексирует, но пипл жалуется что медленно и не всех. Ну, и разумеется, надо учитывать что их на самом деле 25-30 млн. активных, не более того.
б) китайские блоги. Опять же, Technorati индексирует, но далеко не всех.

Посему в мире не 35 миллионов, а нааамного больше.

Впрочем, это не так уж и важно, на самом деле. Хотел было задать вопрос на КИБе, но решил что неправильно поймут...

(Ответить) (Ветвь дискуссии)


[info]kukutz@lj
2006-04-22 02:35 (ссылка)
Да это тоже понятно.

Но надо же было с чем-то сравниваться =)

(Ответить) (Уровень выше)


[info]curiousweasel@lj
2006-04-22 10:51 (ссылка)
Мы круты и растём по экспоненте. Клёво.

Но какие из этого можно сделать выводы?

(Ответить)


[info]apazhe_lj@lj
2006-04-23 03:13 (ссылка)
Чувв-а-ак, а можно ppt переебать в exe, я знаю, он умеет.

У меня нет поверпойнта, а пазырить очень хочется.

(Ответить) (Ветвь дискуссии)

В html
[info]kukutz@lj
2006-04-23 04:55 (ссылка)
286Kb (http://wackowiki.com/files/KIB.zip).

Смотреть только IE, а то не работает.

(Ответить) (Уровень выше)


[info]artreal@lj
2006-04-24 06:49 (ссылка)
Viewer (http://www.microsoft.com/downloads/details.aspx?FamilyID=428d5727-43ab-4f24-90b7-a94784af71a4&DisplayLang=en)

(Ответить) (Уровень выше)


[info]warsh@lj
2006-04-23 10:45 (ссылка)
Простите, а как мне узнать, сколько у меня читателей?

(Ответить) (Ветвь дискуссии)


[info]kukutz@lj
2006-04-23 12:34 (ссылка)
Посмотреть в userinfo: 1333.

(Ответить) (Уровень выше) (Ветвь дискуссии)


[info]warsh@lj
2006-04-23 14:59 (ссылка)
Дык, это я и так вижу. Я имею в виду, общее количество.

(Ответить) (Уровень выше) (Ветвь дискуссии)


[info]kukutz@lj
2006-04-23 19:42 (ссылка)
В смысле, через RSS?

Посмотреть в Яндекс.Ленте, Ливинтернете, Блоглайнс и Канбане. Прибавить примерно столько же, сколько в Я.Ленте на пользователей декстопных аггрегаторов.

Я.Лента - 76
Блоглайнс - 5
Ливинтернет - меньше 2

Ну то есть 1333 + пара сотен.

(Ответить) (Уровень выше)


[info]ex_irishterr534@lj
2006-04-24 04:11 (ссылка)
blogger.com -- 800 русскоязычных ? не верю. Странно мало, не смотря на то, что я с ходу могу назвать около 10 блогов знакомых.

(Ответить) (Ветвь дискуссии)


[info]kukutz@lj
2006-04-24 04:14 (ссылка)
Что предлагаете? Как проверим?

(Ответить) (Уровень выше) (Ветвь дискуссии)


[info]ex_irishterr534@lj
2006-04-24 04:18 (ссылка)
к сожалению, пока предложить нечего, это просто обоснованные сомнения.
а как считалось?

(Ответить) (Уровень выше) (Ветвь дискуссии)


[info]ex_irishterr534@lj
2006-04-24 04:19 (ссылка)
к вопросу
http://directory.mblog.ru/?o=2&c=4

(Ответить) (Уровень выше) (Ветвь дискуссии)


[info]ex_irishterr534@lj
2006-04-24 04:20 (ссылка)
хотя там, конечно, даже меньше 800

(Ответить) (Уровень выше) (Ветвь дискуссии)


[info]ex_irishterr534@lj
2006-04-24 04:22 (ссылка)
а вот так?
http://www.google.com/search?hs=oYF&hl=ru&client=opera&rls=en&q=%D1%8F+site%3Ablogspot.com&btnG=%D0%9F%D0%BE%D0%B8%D1%81%D0%BA&lr=lang_ru

)))

(Ответить) (Уровень выше) (Ветвь дискуссии)


[info]kukutz@lj
2006-04-24 05:19 (ссылка)
Пробежался по первым 200 результатам.

Всего в них блогов нашлось 75. Из них 33 известны поиску по блогам Яндекса.

Пусть мы знаем треть (это меньше, чем 33) - 800 * 3 = 2400.

Невелика разница.

(Ответить) (Уровень выше) (Ветвь дискуссии)


[info]ex_irishterr534@lj
2006-04-24 05:27 (ссылка)
гм. ну ладно. хотя пол порядка все таки...
))

(Ответить) (Уровень выше) (Ветвь дискуссии)


[info]kukutz@lj
2006-04-24 05:56 (ссылка)
Вот поточнее.

81 известных, 197 всего.

Это во всей доступной выдаче (т.е. сто страниц).

Т.е. разница в 2.5 раза.

(Ответить) (Уровень выше) (Ветвь дискуссии)


[info]ex_irishterr534@lj
2006-04-24 06:03 (ссылка)
ну да... недраматические отличия.
)

(Ответить) (Уровень выше)

По данным поиска по блогам
[info]kukutz@lj
2006-04-24 04:24 (ссылка)
select * from feeds where lang = 'русский или типа того' and rssLink like '%blogspot.com%'

(Ответить) (Уровень выше)


[info]ex_moedusa903@lj
2006-05-04 06:47 (ссылка)
FYI: http://project.ioni.st/post/721#post-721

(Ответить)


[info]mixen@lj
2006-05-05 17:07 (ссылка)
А можно как-нибудь посмотреть статистику блогов по отдельному региону России? Или может подобное ожидается в дальнейшем?

(Ответить)


[info]setti@lj
2006-05-23 05:36 (ссылка)
Говорят, ваше исследование в корне не верно
http://bespredel.biz/archives/7

(Ответить) (Ветвь дискуссии)


[info]kukutz@lj
2006-05-23 06:09 (ссылка)
Говорят, что кур доят.

Ни одного аргумента, кроме слова "бред", по ссылке нет.

(Ответить) (Уровень выше)


[info]lalexru@lj
2006-05-25 05:42 (ссылка)
если есть сомнения в цифр то лучше их совсем не приводить. да и потом мне вот кажется неправильным вот это маниакальное стремление российских деятелей поделить всех на standalone, ЖЖистов и т.д., создать какой-то собственный путь (который в итоге приведет обратно, откуда начали).
Сравните blogs.yandex.ru с тем же technorati.com и вы поймете про что я...

(Ответить) (Ветвь дискуссии)


[info]kukutz@lj
2006-05-25 06:03 (ссылка)
Нет, я не понимаю про что Вы.

1. Сомнений в моих цифрах у меня нет.
2. Маниакального стремления кого-то делать у меня нет.
3. Сравнил Технорати и Поиск по блогам Яндекса и не понял, про что Вы.

(Ответить) (Уровень выше) (Ветвь дискуссии)


[info]lalexru@lj
2006-05-25 06:56 (ссылка)
ну еще можно с поискам по блогам от гугля сравнить.
Гугль даже умудрился свой Blogspot.com не прорекламировать.
разница видна невооруженным глазом.
Вообще впечатление такое, что если бы вдруг были только отдельные блоги (которые называют standalone) то Яндекс бы не сделал поиск по блогам.

(Ответить) (Уровень выше) (Ветвь дискуссии)


[info]kukutz@lj
2006-05-25 09:23 (ссылка)
Вы могли бы, всё же, пояснить, а?

Ну вот я сравниваю с поиском по блогам гугля, вижу около пятидесяти различий.

У меня нет идей, о каком различии говорите Вы.

(Ответить) (Уровень выше)


[info]3eta@lj
2006-05-29 17:35 (ссылка)
О, так вот почему вы мне в юзфул_факе так толково отвечали! Это ваша, оказывается, презентация, цифры из которой я с тихим визгом утащила к себе в диплом :))

Может подскажете тогда (уже второй день ищу, у кого бы спросить) - когда ждать от Яндекс.блогов опции "подписка на запрос"? Или, может, есть где, а я просмотрела? В идеале было бы хорошо не просто подписаться на обновления по запросу, но еще и с возможностью выбора рсс-потоков, которые стоит учитывать.

Если мысль недостаточно ясны, проиллюстрирую на примере: есть необходимость мониторить упоминания компании/бренда, но только в определенных комьюнити (например папарацци, адвертка и т.п.) При этом мониторинг раз в день - недостаточно оперативен, хорошо бы, чтобы некий автомат каждый час проверял обновления и сбрасывал нам почтой результаты.
Или "это, сынок, фантастика"?

И вообще, не раскрывает ли Яндекс планов по развитию сервисов, в частности, так или иначе связанных с блогами/социальными сетями? Чтобы хоть немного охватить в дипломе ближайшее будущее, и не устареть морально еще до защиты :)

Заранее спасибо.

(Ответить)

Заказать мебель в интернете
(Анонимно)
2009-06-17 14:45 (ссылка)
You have very good site!
Peccare licet nemini!

(Ответить)