Dima Verner's Journal
[Most Recent Entries]
[Calendar View]
[Friends View]
Tuesday, July 19th, 2005
Time |
Event |
10:18a |
Структура Продолжение набросков к теории кластеризации ЖЖ, начало см. [ 1], [ 2], [ 3]. Предположим, что задача определения силы связи между юзерами полностью решена: каждой паре юзеров a_i, a_j поставлена в соответствие сила связи между ними S_ij. Упорядочим все пары по величине S и найдем пару юзеров а_1, а_2 с самой сильной связью (какова ее величина? кто эти суперюзеры?). Далее, найдем следующую по величине силы связи пару. Будет ли это пара с кем-то из первых двух юзеров или полностью другая пара? Гипотеза. В русском ЖЖ есть доминирующий кластер. При понижении порога силы связи от максимального новые юзеры присоединяются к этому кластеру.Если эта гипотеза верна, то следующий вопрос - на каком уровне силы связи (в процентах от максимального) возникнет пара, не связанная на этом уровне с доминирующим кластером? Что будет при дальнейшем понижении порога силы связи - эта пара послужит новым "центром кристаллизации", вокруг которого формируется другой кластер, или этот другой кластер быстро сольется с доминирующим? На вчерашний контрольный вопрос правильно ответили mithrilian@lj, serafima_rez@lj и mirritil@lj: в примере минимальный вес расстояния - 10, максимальный - 20. | 11:43a |
Кластеризация - основные определения Продолжение набросков к теории кластеризации ЖЖ, начало см. [ 1], [ 2], [ 3], [ 4]. Насколько успешно наша теория будет описывать существенные особенности структуры ЖЖ, зависит, в частности, от того, насколько удачно мы определили силу связи между юзерами. Я ее определил как минимальное число отношений френдования, которые надо разорвать, чтобы нарушить связь между юзерами. Надо еще подумать над этим. | 3:22p |
Альтернативное определение силы связи Продолжение набросков к теории кластеризации ЖЖ, начало см. [ 1], [ 2], [ 3], [ 4], [ 5]. Более естественно определять силу связи не через френдование, а через количество прочитанных сообщений. Сила связи меня с юзером А - это сколько сообщений юзера А я прочитал, будь то записи в его журнале, его записи в сообществах, или его комментарии. Это более информативный показатель, чем формальное френдование: я могу держать юзера во френдах, но не читать его, или, наоборот, не включать его во френды, но читать непосредственно его журнал или его в чужой френдленте. Сила связи в данном случае растет со временем и сохраняется даже с удаленными юзерами. В таком определении сила связи не является симметричной величиной: моя связь с А может быть сильнее, чем связь А со мной. Можно пойти дальше и определять силу связи по формуле типа S = x + K*y, где x - число прочитанных мной сообщений юзера А, y - число прокомментированных мной сообщений юзера А, К - коэффициент веса. То есть, комментирование входит в силу связи с большим весом, чем простое чтение. Все это, однако, гораздо сложнее поддается учету, чем обычное френдование. |
|