Dima Verner's Journal
 
[Most Recent Entries] [Calendar View] [Friends View]

Tuesday, July 19th, 2005

    Time Event
    10:18a
    Структура
    Продолжение набросков к теории кластеризации ЖЖ, начало см. [1], [2], [3].

    Предположим, что задача определения силы связи между юзерами полностью решена: каждой паре юзеров a_i, a_j поставлена в соответствие сила связи между ними S_ij. Упорядочим все пары по величине S и найдем пару юзеров а_1, а_2 с самой сильной связью (какова ее величина? кто эти суперюзеры?). Далее, найдем следующую по величине силы связи пару. Будет ли это пара с кем-то из первых двух юзеров или полностью другая пара?

    Гипотеза. В русском ЖЖ есть доминирующий кластер. При понижении порога силы связи от максимального новые юзеры присоединяются к этому кластеру.

    Если эта гипотеза верна, то следующий вопрос - на каком уровне силы связи (в процентах от максимального) возникнет пара, не связанная на этом уровне с доминирующим кластером? Что будет при дальнейшем понижении порога силы связи - эта пара послужит новым "центром кристаллизации", вокруг которого формируется другой кластер, или этот другой кластер быстро сольется с доминирующим?

    На вчерашний контрольный вопрос правильно ответили [info]mithrilian@lj, [info]serafima_rez@lj и [info]mirritil@lj: в примере минимальный вес расстояния - 10, максимальный - 20.
    11:43a
    Кластеризация - основные определения
    Продолжение набросков к теории кластеризации ЖЖ, начало см. [1], [2], [3], [4].

    Насколько успешно наша теория будет описывать существенные особенности структуры ЖЖ, зависит, в частности, от того, насколько удачно мы определили силу связи между юзерами. Я ее определил как минимальное число отношений френдования, которые надо разорвать, чтобы нарушить связь между юзерами. Надо еще подумать над этим.
    3:22p
    Альтернативное определение силы связи
    Продолжение набросков к теории кластеризации ЖЖ, начало см. [1], [2], [3], [4], [5].

    Более естественно определять силу связи не через френдование, а через количество прочитанных сообщений. Сила связи меня с юзером А - это сколько сообщений юзера А я прочитал, будь то записи в его журнале, его записи в сообществах, или его комментарии. Это более информативный показатель, чем формальное френдование: я могу держать юзера во френдах, но не читать его, или, наоборот, не включать его во френды, но читать непосредственно его журнал или его в чужой френдленте. Сила связи в данном случае растет со временем и сохраняется даже с удаленными юзерами. В таком определении сила связи не является симметричной величиной: моя связь с А может быть сильнее, чем связь А со мной. Можно пойти дальше и определять силу связи по формуле типа S = x + K*y, где x - число прочитанных мной сообщений юзера А, y - число прокомментированных мной сообщений юзера А, К - коэффициент веса. То есть, комментирование входит в силу связи с большим весом, чем простое чтение. Все это, однако, гораздо сложнее поддается учету, чем обычное френдование.

    << Previous Day 2005/07/19
    [Calendar]
    Next Day >>

Anecdotes from Russia   About LJ.Rossia.org