Войти в систему

Home
    - Создать дневник
    - Написать в дневник
       - Подробный режим

LJ.Rossia.org
    - Новости сайта
    - Общие настройки
    - Sitemap
    - Оплата
    - ljr-fif

Редактировать...
    - Настройки
    - Список друзей
    - Дневник
    - Картинки
    - Пароль
    - Вид дневника

Сообщества

Настроить S2

Помощь
    - Забыли пароль?
    - FAQ
    - Тех. поддержка



Пишет Игорь Петров ([info]labas)
@ 2010-10-04 22:35:00


Previous Entry  Add to memories!  Tell a Friend!  Next Entry
немного статистики
К посту коллеги [info]pe3yc@lj
Вот статистика жж за 10 лет и нарисованная на ее основе диаграмма:





Вертикальные засечки отмечают:
- введение приглашений
- отмену приглашений
- покупку жж Six Apart
- появление СУПа
- покупку жж СУПом

Таким образом, сегодня в жж в день постится столько же записей, сколько постилось в день в августе 2003 года. Тогда в жж было 1,2 миллиона аккаунтов, сейчас в 23 раза больше. Кроме того тогда не было трансляций с других блогоплатформ, перепостов и спама, который, судя по ленте последних записей, составляет около половины текущего контента.
Данные обновлений за неделю и за месяц количественно тоже находятся на уровне конца 2003 г
Почти половина аккаунтов (12 миллионов!) не обновлялась вообще никогда.
Несмотря на то, что физически нагрузка уменьшается, благодаря "улучшениям" и "нововведениям" жж работает все медленнее.

Поэтому, когда "директор по развитию продуктов" СУПа сообщает нам, что "20,000 человек, что даже если брать только зарегистрированных пользователей, а не всех уников, составит примерно 0,6%" пользователей сервиса, он разговаривает не с нами, а с духами рекламодателей.
20000 человек это примерно десятая часть того контингента, который у него вообще остался, и 50% контингента, который пока еще активно пользуется жж. Такие дела.


(Добавить комментарий)


[info]bv@lj
2010-10-04 17:43 (ссылка)
Я так понимаю, что человек, открывший статью в сетевом "Коммерсанте" с парой комментов из ЖЖ уже вошел в это миллионный контент. Уж больно под статьей что-то долго грузится, трудится и мелькает, пока эти комменты не появятся.

(Ответить)


[info]kottonen@lj
2010-10-04 17:47 (ссылка)
Спасибо большое за информацию.

(Ответить)


[info]harding1989@lj
2010-10-04 17:48 (ссылка)
А можно как-нибудь получить экселевский файл со статистикой? Хочется поиграться немного, а с картинки перебивать данные - это как-то не очень.

(Ответить) (Ветвь дискуссии)


[info]labas@lj
2010-10-04 17:58 (ссылка)
абсолютные
25.09.2000 11.10.2001 14.10.2002 01.08.2003 04.08.2004 04.08.2005 21.06.2006 22.03.2007 07.03.2008 20.05.2009 11.02.2010 04.10.2010
Total accounts: 16673 366272 737975 1208073 4048249 7901310 10696264 12536860 15080494 20181217 25038043 27911916
active in some way: 576000 1856362 2623260 1853288 1833701 1741390 2289684 1922116 1856252
that have ever updated: 11463 279667 605617 1023854 3079500 5559143 7149783 8012268 9108982 x 14426819 15703505
updating in last 30 days: 7257 128120 269447 472164 1292527 1444586 1177648 1065160 967265 1183665 913357 899180
updating in last 7 days: 4869 89373 192217 333676 829858 875950 691580 622453 563698 600301 488383 473283
updating in past 24 hours: 1956 41968 67867 147775 315232 313981 239649 214154 190048 225542 174580 138044

относительные
25.09.2000 11.10.2001 14.10.2002 01.08.2003 04.08.2004 04.08.2005 21.06.2006 22.03.2007 07.03.2008 20.05.2009 11.02.2010 04.10.2010
Total accounts: 16673 366272 737975 1208073 4048249 7901310 10696264 12536860 15080494 20181217 25038043 27911916
active in some way: 47,7% 45,9% 33,2% 17,3% 14,6% 11,5% 11,3% 7,7% 6,7%
that have ever updated: 68,8% 76,4% 82,1% 84,8% 76,1% 70,4% 66,8% 63,9% 60,4% x 57,6% 56,3%
updating in last 30 days: 43,5% 35,0% 36,5% 39,1% 31,9% 18,3% 11,0% 8,5% 6,4% 5,9% 3,6% 3,2%
updating in last 7 days: 29,2% 24,4% 26,0% 27,6% 20,5% 11,1% 6,5% 5,0% 3,7% 3,0% 2,0% 1,7%
updating in past 24 hours: 11,7% 11,5% 9,2% 12,2% 7,8% 4,0% 2,2% 1,7% 1,3% 1,1% 0,7% 0,5%

(Ответить) (Уровень выше) (Ветвь дискуссии)


[info]harding1989@lj
2010-10-05 04:03 (ссылка)
Спасибо!

(Ответить) (Уровень выше)


[info]pe3yc@lj
2010-10-04 18:10 (ссылка)
Спам, по моим подсчётам, составляет сейчас до трёх четвертей текущего контента, - и использовать для его оценки ленту последних записей не очень корректно, потому что спам часто распространяется залповым способом, кампаниями. Между залпами фон действительно около половины, и даже ниже, но сами залпы в моменты максимальной активности доводят эту цифру до 90% и выше. В среднем получается от двух третей до трёх четвертей.

К сожалению, на стороне Сцуппа™ тему спама то ли вообще не анализируют, то ли анализируют, но не афишируют.

(Ответить) (Ветвь дискуссии)


[info]labas@lj
2010-10-04 18:16 (ссылка)
Ну да, лента дает в лучшем случае нижнюю оценку. Т.е. 138000 постеров ежедневно, из них (по нижней оценке) половина спамеры. Если вычесть из оставшегося трансляции и перепосты, станет совсем грустно.

(Ответить) (Уровень выше)


[info]repressii@lj
2010-10-04 21:54 (ссылка)
Да, точно. Сейчас там например 90% спама про футболки

(Ответить) (Уровень выше) (Ветвь дискуссии)


[info]pe3yc@lj
2010-10-05 04:09 (ссылка)
Мне вот посчастливилось ни разу его не увидеть.

(Ответить) (Уровень выше)


[info]pe3yc@lj
2010-10-04 18:14 (ссылка)
Кстати, эта диаграмма очень наглядно демонстрирует нам, что контентная деградация началась после отмены приглашений и усилилась после покупки ЖЖ сиксапартом, а Сцупп™ уже только догрызает полудохлого.

(Ответить) (Ветвь дискуссии)


[info]labas@lj
2010-10-04 18:23 (ссылка)
Да, я тоже обратил внимание. Не знаю, РАССКАЖУТ ЛИ НАМ КОГДА-НИБУДЬ ПРАВДУ, но готов предположить, что Сиксапарт уже тогда хотел болезного придушить, а Антон Борисович Н. и компания выступили в качестве скорой помощи.
Опять же понятен демонстративный отказ от борьбы с ботами: иначе скорость падения сохранялась бы, а так она явно замедлилась.

Другое дело, что английский сектор из жж уже практически исчез (и именно с этим связано падение), а отдельную статистику русскоязычного выделить невозможно. Она, наверное, не столь плачевна.

(Ответить) (Уровень выше) (Ветвь дискуссии)


[info]pe3yc@lj
2010-10-04 18:29 (ссылка)
Это нам невозможно, а на стороне Сцуппа™ все данные по кириллическим юзерам отдельно есть.

Демонстративного отказа от борьбы с ботами тут маловато будет, всё похоже на прямую стимуляцию ботоводства, а то и непосредственное ботоводство (или через аффилированных лиц). Поскольку боты накачивают статистику, в том числе и статистику, принимаемую во внимание рекламодателями, а также принимаю во внимание историю и бэкграунд Сцуппа™, я не вижу ни единой причины, по которой он мог бы отказаться от соблазнительного промышленного ботоводства.

(Ответить) (Уровень выше) (Ветвь дискуссии)


[info]dimrub@lj
2010-10-04 18:33 (ссылка)
Тов. Оккам предлагает просто подкручивать статистику на сервере, не заморачиваясь с ботами.

(Ответить) (Уровень выше) (Ветвь дискуссии)


[info]pe3yc@lj
2010-10-04 18:47 (ссылка)
Так есть же ещё TNS со своими панелями, это во-первых. А во-вторых, кроме ботов бывает ещё закупка траффика.

(Ответить) (Уровень выше) (Ветвь дискуссии)


[info]msk01@lj
2010-10-04 22:06 (ссылка)
TNS требует исполнения JS на клиенте. Это довольно муторно подделать ботами.

Те "22 миллиона уников", про которые в горячечном бреду пишет т.н. "разработчик" - это вполне реальная цифра, поскольку в нее входит каждый, случайно кликнувший на результат из поиска яндекса и попавший к кому в журнал - то есть практически весь рунет, который выходит за пределы социальных сетей. И здесь нет смысла закупать траффик, а достаточно платить яндексу, чтобы он получше индексировал уже имеющийся контент.

(Ответить) (Уровень выше) (Ветвь дискуссии)


[info]ext_239658@lj
2010-10-05 00:29 (ссылка)
Да ну ладно, муторно. JS всё равно по итогу шлёт на сервер что-то по протоколу http://

Так что ради можно и подделать, если начальство прикажет.

(Ответить) (Уровень выше) (Ветвь дискуссии)


[info]tonchikk@lj
2010-10-05 03:55 (ссылка)
TNS и любой сторонний счетчик фиг накрутишь: JS шлет но не в ЖЖ а в абсолютно левое место, ЖЖ неподвластное.

(Ответить) (Уровень выше)


[info]ext_45179@lj
2010-10-04 18:43 (ссылка)
буду удивлен, если кто-то нерусскоязычный все еще использует жж. Это при всем богатстве прочих платформ

(Ответить) (Уровень выше) (Ветвь дискуссии)


[info]labas@lj
2010-10-04 18:44 (ссылка)
Отдельные англоязычные записи в latest.bml еще встречаются. Но исчезающе мало.

(Ответить) (Уровень выше) (Ветвь дискуссии)


[info]ext_45179@lj
2010-10-04 18:54 (ссылка)
я подозреваю, что эти записи сделаны русскоязычными пользователями. Скажем, я тоже иногда вижу записи на английском.

(Ответить) (Уровень выше)


[info]southwest@lj
2010-10-04 23:50 (ссылка)
есть много довольно активных англоязычных сообществ

не надо также забывать что самое активное и знаменитое сообщество ЖЖ как раз англоязычное

http://community.livejournal.com/ohnotheydidnt/profile

(Ответить) (Уровень выше)


[info]beth4ever@lj
2010-10-05 02:24 (ссылка)
Я сообщества англоязычные читаю, регулярно обновляются.

(Ответить) (Уровень выше) (Ветвь дискуссии)


[info]labas@lj
2010-10-05 02:45 (ссылка)
Ну тут все относительно, конечно. Я просто могу сказать, что когда смотрел latest.bml два года назад, там было много порноспама, но половина контента было английским. Сейчас - порноспама нет, обычного спама в разы больше, а английских записей исчезающе мало.

(Ответить) (Уровень выше) (Ветвь дискуссии)


[info]timex4you@lj
2010-10-05 14:26 (ссылка)
В три часа ночи как раз-таки много английских записей и других иностранцев в latest.bml... Кириллические записи встречаются через каждые 5-10 иноземцев, да и то - половина на украинском...

(Ответить) (Уровень выше)


[info]piligrim@lj
2010-10-04 18:17 (ссылка)
При этом 2910 (http://blogs.yandex.ru/search.xml?text=%D0%BA%D0%B8%D1%80%D0%B8%D0%BB%D0%BB%D0%B8%D1%87%D0%B5%D1%81%D0%BA%D0%B8%D0%B5+%D1%81%D0%B5%D1%80%D0%B2%D0%B8%D1%81%D1%8B&holdres=mark&date=on&from_day=28&from_month=09&from_year=2010&to_day=4&to_month=10&to_year=2010&ft=blog%2Ccomments%2Cmicro) только одних постов с разъяснениями о том, как сделать так, чтоб не видеть их последних "улучшений".

(Ответить)


[info]kikasso@lj
2010-10-04 18:29 (ссылка)
то есть СУП покупал уже заведомо загибающийся продукт
однако, мне кажется, что все таки падение графика в кириллическом секторе будет гораздо менее резкое

(Ответить) (Ветвь дискуссии)


[info]descriptor@lj
2010-10-05 02:28 (ссылка)
суп не продукт покупал, а общественно-политическую площадку.

(Ответить) (Уровень выше)


[info]olegart@lj
2010-10-05 03:19 (ссылка)
то есть СУП покупал уже заведомо загибающийся продукт

Это и в 2007 было прекрасно понятно, с чисто экономической точки зрения ЖЖ себя никогда особо хорошо не чувствовал.

(Ответить) (Уровень выше)


[info]kblcbka@lj
2010-10-04 19:08 (ссылка)
Грустно-то как, ы. Остаётся утешать себя тем, что в узком кружку проще сойти за умную уютнее.

(Ответить)


[info]alexakarpov@lj
2010-10-04 19:54 (ссылка)
да.
А Миша Вербицкий еще когда предупреждал!
=)

(Ответить)


[info]bbb@lj
2010-10-04 20:29 (ссылка)
Но в чем реальная проблема-то? Сужу по себе - боты меня практически не мучают, спама я практически не получаю, всякие загадочные кириллические приблуды до меня не доезжают. Общаюсь себе с приятными людьми в свое удовольствие. Почему меня должно беспокоить, что где-то живут спаммерские боты, на статистике которых зарабатывает какой-то СУП?

(Ответить) (Ветвь дискуссии)


[info]dikem@lj
2010-10-04 21:13 (ссылка)
Проблема в том что жижа сервис пенсионеров и очень быстро превращается в кладбище рожденных в СССР. Со всеми коллизиями "Незабвенной" Ивлина Во.

(Ответить) (Уровень выше) (Ветвь дискуссии)


[info]msk01@lj
2010-10-04 22:08 (ссылка)
Ну сходите во вкантактик, ужаснитесь уровню школоты ;)

(Ответить) (Уровень выше)


[info]bbb@lj
2010-10-04 22:44 (ссылка)
Не читамши эту книгу, ничего не могу судить об описанных в ней коллизиях.

(Ответить) (Уровень выше)


[info]labas@lj
2010-10-05 02:20 (ссылка)
Ну как минимум в том, что после нынешних нововведений СУПа
1) жж уже около недели весьма тормозит (несмотря на смехотворный уровень нагрузки)
2) в журналы людей, заплативших за жж, без их ведома и против их согласия всовывается реклама, которую будет видеть каждый, заходящий в жж извне. Это очень существенное отступление от ранее декларируемых правил.

(Ответить) (Уровень выше)


[info]dimrub@lj
2010-10-05 16:26 (ссылка)
К сказанному выше добавлю, что если вы состоите в каком-нибудь сообществе, и в это сообщество не постят тонны спама, то это заслуга не СУПа, а модераторов, ежедневно продирающихся сквозь десятки запросов на вступление от спам-ботов.

(Ответить) (Уровень выше) (Ветвь дискуссии)


[info]bbb@lj
2010-10-05 16:43 (ссылка)
Я сам модератор одного из сообществ, и очень немаленького (м_щ - щербаковского), но никаких десятков запросов от ботов мне не поступает. Много если два-три в неделю.

(Ответить) (Уровень выше) (Ветвь дискуссии)


[info]dimrub@lj
2010-10-05 16:59 (ссылка)
Ну повезло значит. Ко мне в ру_классикал рвутся толпами.

(Ответить) (Уровень выше) (Ветвь дискуссии)


[info]bbb@lj
2010-10-05 17:32 (ссылка)
Всему виной то, что некоторые из нас слишком привлекательны, как сказала старушка, когда в нее ударила молния.

http://lib.ru/JEROM/r_weather.txt

(Ответить) (Уровень выше)


[info]bertram@lj
2010-10-04 20:49 (ссылка)
засечки вертикальные

(Ответить) (Ветвь дискуссии)


[info]cema@lj
2010-10-04 21:58 (ссылка)
+1

(Ответить) (Уровень выше)


[info]labas@lj
2010-10-05 02:12 (ссылка)
Да, конечно :)

(Ответить) (Уровень выше)


[info]gingema@lj
2010-10-04 22:15 (ссылка)
Молодец Фицпатрик, вовремя продал детище Сиксапарту

(Ответить)

ЖЖ купили самизнаете кто
[info]forgers@lj
2010-10-04 23:04 (ссылка)
чтоб вас всех и переписать. Там ищут по ключевым словам, которые спамботы не употребляют.

(Ответить)

к слову
[info]probegi@lj
2010-10-04 23:35 (ссылка)
Интересно, что TNS (не панель, а опрос M-Index) дает цифру посещающих ЖЖ 1 млн. 700 тыс., а посещающих каждый день - 409 тыс. Так как это опрос (респонденты вспоминают о посещении), то это означает, что для большинства из них посещение ЖЖ достаточно значимо, чтобы отложиться в памяти.

Это и есть живая аудитория, нужная (теоретически) рекламодателю, а вовсе не какие-то там 22 миллиона.

хехе

(Ответить) (Ветвь дискуссии)

Re: к слову
[info]maravan@lj
2010-10-05 01:58 (ссылка)
А есть какой-то научно обоснованый коэфициент, чтобы из этим 1.7/0.409 вывести число тех, кто посещал, но не помнит? :)

(Ответить) (Уровень выше) (Ветвь дискуссии)

Re: к слову
[info]probegi@lj
2010-10-05 06:42 (ссылка)
Ну, можно вывести (статистически обоснованный), но его нет, по принципу Неуловимого Джо.
хехе

(Ответить) (Уровень выше)


[info]napososhok@lj
2010-10-05 00:40 (ссылка)
Я поначалу подумал, что сегодня за день постится столько, сколько в 2003 за август. Так, так что же посоветуете делать, куда бечь? (Только не говорите: решайте сами!)

(Ответить) (Ветвь дискуссии)


[info]labas@lj
2010-10-05 05:09 (ссылка)
Ну я бы тут различал личную и общественную стратегии. Личная - иметь все бэкапы на случай, если жж вдруг загнется, и переходить на другой сервис.
Общественная - имеющееся русскоязыч. сообщество возникло в жж и за его пределы не портируемо. Если жж загнется - сообщество загнется вместе с ним.

(Ответить) (Уровень выше) (Ветвь дискуссии)


[info]napososhok@lj
2010-10-05 07:14 (ссылка)
Спасибо большое, очень ценю Ваше мнение! Жалко будет, если сбудутся пессимистические прогнозы. Лучшего сообщества, боюсь, у нас и нет.

(Ответить) (Уровень выше)


[info]drosselmayer@lj
2010-10-05 02:44 (ссылка)
Кривая на мой взгляд особенно ни о чем эдаком не говорит. Она выглядит типично для любого стартапа. Сначала интерес с ростом. Потом насыщение, потеря интереса и постепенное угасание. А вертикальные палочки, обозначающие телодвижение владельцев это не причина, а следствие. Когда интерес стал угасать или наметилась перспектива такого угасания (а предположить это было несложно), то владельцы начали предпринимать всякие меры по подхлестыванию интереса.
Это не отменяет проблему ботов и прочие поползновения на тему высасывания бабла из активного населения. Я скорее о том, что общая тенденция характерна для абсолютно любого начинания. Детали в пропорциях графика, а не в его форме.

(Ответить)


[info]ivanov_petrov@lj
2010-10-05 03:35 (ссылка)
после отмены приглашений плавное падение, которое не ускоряется идиотизмами администрации. Можно говорить об особенном, долготерпеливом духе ЖЖ

(Ответить)

Англоязычные тоже огрызаются
[info]cjelli@lj
2010-10-05 03:38 (ссылка)
http://boutell.livejournal.com/1132731.html

Бутелл - вполне солидная фигура.

(Ответить)


[info]jescid@lj
2010-10-05 04:31 (ссылка)
> физически нагрузка уменьшается
надо же судить не по количеству записей, а по трафику, который и составляет нагрузку на сервер

(Ответить) (Ветвь дискуссии)


[info]labas@lj
2010-10-05 05:05 (ссылка)
Во-первых, маловероятно, что при уменьшении количества записей, траффик возрастает, причем существенно.
Во-вторых, немалую часть траффика составляет спам, если это вопрос критичный, то что рубить несомненно есть.

(Ответить) (Уровень выше) (Ветвь дискуссии)


[info]kukutz@lj
2010-10-05 05:11 (ссылка)
Про "во-первых". Показать график посещаемости ЖЖ (из России) по TNS?

(Ответить) (Уровень выше) (Ветвь дискуссии)


[info]labas@lj
2010-10-05 05:17 (ссылка)
Да, было бы интересно.

(Ответить) (Уровень выше) (Ветвь дискуссии)


[info]kukutz@lj
2010-10-05 05:23 (ссылка)
Image

(Ответить) (Уровень выше) (Ветвь дискуссии)


[info]kukutz@lj
2010-10-05 05:26 (ссылка)
Это месячные аудитории. В суточных за тот же период рост ещё больше.

(Ответить) (Уровень выше) (Ветвь дискуссии)


[info]labas@lj
2010-10-05 05:31 (ссылка)
Извиняюсь за вопиющую неграмотность, а что показывает TNS? Количество посещений страниц жж уникальными юзерами?

(Ответить) (Уровень выше) (Ветвь дискуссии)


[info]kukutz@lj
2010-10-05 05:38 (ссылка)
Месячную аудиторию. Количество уникальных ЛЮДЕЙ (не кук) из России, которые посетили страницы ЖЖ хотя бы раз в месяц (день тоже показывает, отдельно).

(Ответить) (Уровень выше) (Ветвь дискуссии)


[info]labas@lj
2010-10-05 05:53 (ссылка)
Ну то есть [info]motto@lj прав во всем: сто тыщ пенсионеров и кладбище контента.

(Ответить) (Уровень выше) (Ветвь дискуссии)


[info]kukutz@lj
2010-10-05 06:05 (ссылка)
По-прежнему нет никаких данных о росте или загибании русскоязычной пишущей части ЖЖ, так что про песионеров можно говорить, только основываясь на "я так чую".

(Ответить) (Уровень выше) (Ветвь дискуссии)


[info]pe3yc@lj
2010-10-05 10:24 (ссылка)
У кого нет таких данных? У вас их нет или их вообще нет?

В общем, парадокс вырисовывается: контента всё меньше и меньше, а посетителей всё больше и больше.

Отчего так?

(Ответить) (Уровень выше) (Ветвь дискуссии)


[info]kukutz@lj
2010-10-05 11:17 (ссылка)
У меня их нет и в этом посте их нет. У вас есть?

Парадокс? Во-первых, контента всё больше, старый-то никуда не девается.
Во-вторых, нет доказательств, что объём нового русскоязычного неспамного контента уменьшается. Я бы посмотрел на данные ППБ, но вы им все равно не поверите.

(Ответить) (Уровень выше) (Ветвь дискуссии)


[info]pe3yc@lj
2010-10-05 11:58 (ссылка)
Почему же? Я всем данным верю, просто каждые данные нужно верифицировать. Если данные ППБ бьются с прочими или хотя бы им не противоречат - это косвенно подтверждает и их, и прочие.

(Ответить) (Уровень выше) (Ветвь дискуссии)

О нагрузке
[info]kamen_jahr@lj
2010-10-07 05:30 (ссылка)
"Почему же? Я всем данным верю, просто каждые данные нужно верифицировать"
И как Вы, Дмитрий, верифицировали высказывание Игоря Петрова?

"Несмотря на то, что физически нагрузка уменьшается, благодаря "улучшениям" и "нововведениям" жж работает все медленнее."
Автор поста не остановился подробно на данном пункте, но в Вашем жеже вы субъективное мнение например , высказывали, что мол рюрешки "тормозят" жж.

(Ответить) (Уровень выше) (Ветвь дискуссии)


[info]pe3yc@lj
2010-10-07 05:34 (ссылка)
А это не данные, а субъектвиное мнение. Оно не нуждается в верификации и может быть только принято к сведению.

А вот если появятся данные, что, мол, ХХ% пользователей жалуется на то, что всё стало тормозить, вот тогда это будут данные и их можно будет каким-то образом верифицировать - например, устроить опрос.

(Ответить) (Уровень выше) (Ветвь дискуссии)

Про опрос и имхи;-)
[info]kamen_jahr@lj
2010-10-07 05:56 (ссылка)
Когда я с lynx на нетскейп перешел, у меня тоже возникло ощущение, что все это жутко тормозит (тогда я еще изподмодема "серфал со ск. то ли 2800 БОД ;-))
Потом уже здесь в Германии, я серфал изпод "телефонного дозвона" ( звонишь на нумер, настраиваешь предварительно и серфаш) - я жутко удивился как все быстро "лётает" - тогда скорость была ок. 44000 Бит-в-секунду ( про боды, дление на 10 я тогда уж "позабыл")

Затем при той же скорости - снова все "тормозить" стало. Перешел на SDSL (урезанный на уплоад вариант). На SDSL был дцать леть. Ушел т.к. скорость быстрее нужна была- Теперь на VDSL.

П.С А опрос - вещь стоящая, тока сей опрос надо бы у тех прикрутить, кого много читают, чтобы хоть как то картина с медленностью яснее была...

(Ответить) (Уровень выше)


[info]msk01@lj
2010-10-05 06:42 (ссылка)
А людей они вычисляют не куками? А как?

(Ответить) (Уровень выше) (Ветвь дискуссии)


[info]kukutz@lj
2010-10-05 06:49 (ссылка)
Панелью. Не в смысле тулбара, а в смысле репрезентативной выборки людей.

(Ответить) (Уровень выше) (Ветвь дискуссии)


[info]pe3yc@lj
2010-10-05 10:31 (ссылка)
Кстати, Роман, хорошо что вы появились. Я до сих пор жду вашего ответа вот в этом треде.

Особенно меня интересуют ваши ответы на вопросы 3, 4 и 5. Не затруднит ли вас потратить несколько минут вашего драгоценного времени и ответить на них?

(Ответить) (Уровень выше) (Ветвь дискуссии)

Самим лень искать?
(Анонимно)
2010-10-05 16:52 (ссылка)
Никакого Кукуца там не нужно, вопросы-то детские. Выйдите уже из ЖЖ, на минуточку: сто раз уже это обсуждалось.

1. "Почему "в основном", а не "только"?
Потому что индексируются профили, к примеру:
http://api.yandex.ru/blogs/doc/indexation/concepts/what-is-foaf.xml

2. Очевидно глупый вопрос.
3. Главная функция сервиса ЯППБ — "узнать, что сейчас происходит в интернете".
4. А по Вашим? А разница-то какая? Потому что...
5. ...никакого отбора эккаунтов в базу не ведётся. Есть индексация RSS потоков. Из которого выкидывается явный мусор. По мере накопления данных о потоке — неявный втудаже идёт. И алгоритм этого "явный-неявный", разумеется, никогда не будет не то что опубликован — даже намекать на критерии невозможно. Причина, полагаю, на виду: любой критерий будет подхвачен и растиражирован.

(Ответить) (Уровень выше) (Ветвь дискуссии)


[info]pe3yc@lj
2010-10-05 17:06 (ссылка)
Феерическая хуйня. Впрочем, чего ждать от анонима?

(Ответить) (Уровень выше) (Ветвь дискуссии)


(Анонимно)
2010-10-05 17:26 (ссылка)
Собственно, от Вас другого ответа и не ждал.
Не разочаровали.

(Ответить) (Уровень выше) (Ветвь дискуссии)


[info]pe3yc@lj
2010-10-06 05:38 (ссылка)
Вот видите как хорошо получилось.

(Ответить) (Уровень выше)


[info]kukutz@lj
2010-10-06 02:36 (ссылка)
1. Прав аноним про FOAF, кроме того, часть индексации осуществляется через специальные ускоряющие механизмы, которые могут быть не в форматах RSS/Atom, а, например, PubSubHubBub.

2. Вопрос, на мой взгляд, бессмысленный. Что искажается, если ОДНИ И ТЕ ЖЕ данные представляются в разных форматах? А если представляются разные, то это попытка обмана поисковой системы, читай, спама. Мы с ними боремся с переменным успехом, но, скорее, довольно успешно.

3. Поиск работает. Работает не идеально (как, впрочем, любая программа), мы трудимся над тем, чтобы работал лучше. Конкретную техническую проблему я назвать не могу, т.к. просто её не знаю. Могу попросить Антона вам ответить.

4. Вы наверняка спрашиваете не про часть базы, а про часть индекса. База > индекса, выкидываем мы мусор именно из индекса, из базы выкидываем редко. Оценок таких у меня нет. Более того, судя по слову "аккаунт", вы спрашиваете про блоги на блогхостингах, а все автономные блоги не включаете. Или даже только про ЖЖ? В общем, уточните вопрос, я смогу тогда его задать внутри.

5. Аноним прав. Ситуация такая: любой новый аккаунт на отечественном блог-хостинге считается блогом. Любой новый аккаунт с записью на русском языке на зарубежном блог-хостинге считается блогом. Некоторые автономные RSS считаются блогами по умолчанию. Дальше происходит постоянный или разовый анализ на спам, на не-блоговость, на то, на сё.

(Ответить) (Уровень выше) (Ветвь дискуссии)


[info]pe3yc@lj
2010-10-06 06:33 (ссылка)
Ну наконец-то с вами начался хоть какой-то разумный диалог, не прошло и трёх лет. Хотя Антон моих вопросов по-прежнему избегает, надеюсь, что и он подключится на каком-то этапе.

1. ОК, принято.

2. Это совсем не бессмысленный вопрос. Он имеет отношение к дальнейшим исправлениям и обновлениям при редактировании поста. Если робот не ходит по вебу, как в нормальном поисковике, а данные берутся исключительно из RSS, то такой поиск попросту обречен на постепенную, но неизбежную потерю релевантности. В вашем же случае, в отличие от Большого поиска, роботы, как я понимаю, - по блогам не ходят и даже единожды не заходят.

Что же касается борьбы со спамом, то она абсолютно безуспешна, и мы, с вашего позволения, поговорим с вами об этом отдельно. Пока что я могу констатировать, что вы затрудняетесь даже оценить объём спама, о чём свидетельствует ваш ответ на вопрос 4.

3. Поиск работает неудовлетворительно. Выдача ужасна: часть записей отсутствует в выдаче (при том, что эти записи присутствуют в базе и в индексе), несмотря на корректно составленный запрос. Примеров масса. Кроме того, выдача крайне засорена спамом - по сравнению с выдачей Большого Яндекса, опять же. И ко всему ещё часты отказы в обслуживании ("попробуйте попозже"). Это не "поиск работает".

4. Уточняю: Какую часть индекса составляют сплоги, бот-эккаунты, заброшенные эккаунты? (По каждой позиции свой процент, пожалуйста). Речь идёт обо всех блогохостингах и автономных блогах тоже - иначе говоря обо всех "блогах", которые вы индексируете, то есть обо всех, подпадающих под определение в пункте 5.

5. Ответ принимается, но требует некоторых уточнений.

- любой НОВЫЙ эккаунт на отечественном блог-хостинге - это блог для ЯППБ.

(прошу сообщить список отечественных блог-хостингов, они как считаются, по гражданству владельцев или по месту регистрации? И почему только новый эккаунт относится к блогу, а как же со старыми эккаунтами? И как определяется в данном случае новый/старый?)

- любой НОВЫЙ эккаунт на зарубежном блог-хостинге, если там сделана первая запись на русском - это блог для ЯППБ.

(что считается записью на русском? А на украинском? Сколько кириллицы должно быть в этой записи? А если первая запись на китайском, а потом пятая на русском?)

- некоторые автономные RSS считаются блогами по умолчанию.

(какие именно автономные RSS считаются блогами по умолчанию и почему? На основе какого критерия составлялся этот список и изменяется ли он - пополняется и/или сокращается?)

- дальше происходит постоянный или разовый анализ на спам, на не-блоговость, на то, на сё.

(вот это особенно мило, про то и про сё. Можно ли об этом поподробнее: кто производит анализ на спам, на не-блоговость, по каким критериям это происходит и всё-таки разово или постоянно?)

И ещё дополнительный вопрос к этому же пункту: известно ли вам, что с помощью блоговых платформ (например, WP) можно успешно создавать сайты, которые никоим образом блогами не являются?

Спасибо за сотрудничество, жду ответов.

(Ответить) (Уровень выше)


[info]labas@lj
2010-10-12 08:05 (ссылка)
> Поиск работает. Работает не идеально (как, впрочем, любая программа), мы трудимся над тем, чтобы работал лучше.

Багрепорт. При таком запросе
http://blogs.yandex.ru/search.xml?text=%D0%B1%D0%B5%D1%80%D1%82%D1%83%D0%BC
находится не мой изначальный пост, а какое-то спамоговно, которое его перепечатало.

(Ответить) (Уровень выше)

Напротив, это очень выроятно.
[info]jescid@lj
2010-10-05 05:28 (ссылка)
Всё дело в раскрутке проекта, а не числе страниц на нём.
На жж много ссылок, у его записей как правило высокие позиции в Гугле (и, наверно, в Яндексе, раз тут появился его специалист — он скажет) — этого раньше не было, кстати…
Можете хоть на себя любимого (http://www.google.com/search?q=%D0%BC%D0%B5%D0%BC%D1%83%D0%B0%D1%80%D1%8B+%D1%81%D0%BE%D1%86%D0%B8%D0%B0%D0%BB-%D0%B4%D0%B5%D0%BC%D0%BE%D0%BA%D1%80%D0%B0%D1%82%D0%BE%D0%B2) полюбоваться :)

(Ответить) (Уровень выше)


[info]emsi@lj
2010-10-05 05:48 (ссылка)
> Во-первых, маловероятно, что при уменьшении количества записей, траффик возрастает, причем существенно

а вот тут, как мне кажется, бОльшая зависимость от общего роста количества пользователей интернета, чем от количества записей.

(Ответить) (Уровень выше) (Ветвь дискуссии)


[info]labas@lj
2010-10-05 05:54 (ссылка)
Да, [info]kukutz@lj меня убедил.

(Ответить) (Уровень выше) (Ветвь дискуссии)

Ещё на один момент, наверное, стоит обратить внимание
(Анонимно)
2010-10-05 17:03 (ссылка)
Комментарии.

Для многих написание комментария = публикации поста в собственном журнале. Можно сбрасывать со счёта такой контент? Полагаю, нет. И задача подсчета становится совсем неуловимой: как считать и что считать.

(Ответить) (Уровень выше)


[info]kukutz@lj
2010-10-05 05:02 (ссылка)
Мне очень нравится, как многие комментаторы не дают себе труда подумать хоть чуть-чуть и понять, что падение процента активных аккаунтов от всех не "угасание", не "загибающийся" и т.п. У любого неэкспоненциально растущего сервиса форма кривой будет похожей, а ЖЖ в целом не просто не экспоненциально растущий, он состоит из действительно умершей англоязычной части и довольно живой русскоязычной. Сейчас сюда придёт Резус и скажет, что я защищаю ЖЖ, потому что Яндекс вместе с СУПом зарабатывает на ботах, ну или какую-нибудь подобную чешую.

(Ответить) (Ветвь дискуссии)


[info]labas@lj
2010-10-05 05:16 (ссылка)
Ну меня изначально интересовал вопрос, является ли магическое число 20000 настолько некритичным, как это утверждал Директор По Развитию. Ответ вроде ясен.
Ну и факт, что со всем спамом и ебигданством в жж постится столько же контента, сколько в конце 2003-го, тоже удивил, да.

(Ответить) (Уровень выше) (Ветвь дискуссии)


[info]kukutz@lj
2010-10-05 05:20 (ссылка)
+спам + ибигданство -англоязчыность

Так выводов про русскоязычную часть толком не сделать.

(Ответить) (Уровень выше)


[info]gong@lj
2010-10-05 18:02 (ссылка)
:: Сейчас сюда придёт Резус и скажет, что я защищаю ЖЖ, потому что Яндекс вместе с СУПом зарабатывает на ботах, ну или какую-нибудь подобную чешую.

А что, разве нет?

(Ответить) (Уровень выше) (Ветвь дискуссии)


[info]kukutz@lj
2010-10-06 02:12 (ссылка)
Ну вышло, что нет. Придти пришёл, но этого пока не сказал.

(Ответить) (Уровень выше)


[info]gegmopo4@lj
2010-11-15 13:51 (ссылка)
Первым делом я взял данные и посмотрел графики в абсолютных цифрах. Всё не так печально, по сравнением с пиком 5 лет назад падение всего лишь раза в полтора. Причём в основном в первые два года -- это и дало возможность купить ЖЖ русским. Количество постоянных пользователей сейчас я бы оценил в миллион-полтора.

Дутые 23 млн. можно не учитывать, это мёртвые души, казуалы и боты.

(Ответить) (Уровень выше)


[info]brother2@lj
2010-10-05 05:20 (ссылка)
Во-во, смотрим на распределение по странам:
* United States - 5118650
* Russian Federation - 1826651
* United Kingdom - 483755
* Canada - 456243
* Ukraine - 306302
* Singapore - 227057
* Australia - 219310
* Philippines - 143307
* Germany - 106026
* India - 91877
* Japan - 91415
* Brazil - 89362
* Poland - 78401
* Korea (South) - 73379
* Belarus - 71878
Понятно, что из дальних заграниц тож многие пишут на русском, но явно не 227 тыщи сингапурских пользователей или почти 72 тысячи корейских. Собственно эта статистика и показывает отмирание нерусскоязычной части последствием миграции на фейсбук и прочие радости. Глянул пользователей по тому городку, где я сейчас - активно пишут два человека на русском, при том что всего журналов с три десятка большинство из которых местные, но не обновлялись несколько лет.
Впрочем и у них там с активными пользователями не ахти:
http://www.flipcorp.com/en/blog/read/blog/5-interesting-facts-about-social-media-in-middle-east.html

(Ответить)


[info]tmin@lj
2010-10-05 07:03 (ссылка)
contra: все неактивные увлеченно читают и тычут в рекламу.

(Ответить)


[info]aldanov@lj
2010-10-05 07:16 (ссылка)
Ну и стало больше в 23 раза. Сколь нибудь активных пользователей больше - было 576 тыс сейчас 1870 тыс.
Записей, от тех, кто пишет каждый день, постится столько же?
И в этом ничего удивительного.
В конце концов, активный народ со временем отлагается от обязательной формы журнала.
Тут ведь многое тонет со временем.

(Ответить)


[info]the_boris@lj
2010-10-06 12:51 (ссылка)
Очень кстати к этому разговору сегодняшний xkcd: http://xkcd.com/802/

(Ответить)


[info]kamen_jahr@lj
2010-10-07 05:30 (ссылка)

(Ответить)


[info]ktotam@lj
2010-10-11 18:05 (ссылка)
ну так это когда еще обсуждалось
http://pyrop.livejournal.com/743350.html
http://lj.rossia.org/users/tiphareth/997235.html

(Ответить)