¤ Некоторые иллюстрации к тому тезису, что из общего числа эккаунтов в LiveJournal фейковых уже более 90%.
Вот, например, имеются законсервированные пока фермы простых спамботов здесь и здесь. Это довольно примитивные боты: они ещё держат друг друга во френдах, имеют ники, составленные по одному и тому же принципу (с добавлением как бы года рождения) и на данный момент вообще не спамят в комментариях, поскольку ещё находятся на этапе ранней прокачки.
Это не единственные кластеры ботов такого типа, но обратите внимание, что кластеры обособлены друг от друга: не только нет всеобщего зафренживания внутри кластера, но есть и совершенно непересекающиеся кластеры, - из соображений безопасности. (Впрочем, таким ботам на данном этапе вообще ничего не угрожает даже теоретически).
Контент всех ботов этого типа состоит из грязной, необработанной нарезки контента других журналов, скрипты наполнения были запущены 2 апреля и набивают ежесуточно по два-три поста каждому боту. До этого момента боты стояли ненаполненными около двух с половиной месяцев, даты создания у них - во второй половине января.
Общее количество ботов только такого типа на данный момент составляет не менее 8000 (точную цифру знает только Сцупп™), они сблокированы в кластеры френдов, в каждом кластере примерно от 70 до 250 штук. Некоторые кластеры пересекаются полностью или частично, некоторые не пересекаются.
На сегодняшний день вред от таких ботов невелик: нагрузка на базу LiveJournal, да загаживание поисковой выдачи. Но после того, как период прокачки закончится, боты будут использоваться для других целей: например, для спама или флуда в комментах и сообществах. Ценность каждого бота невелика, но и вложения в него минимальные: процесс создания, наполнения и прокачки полностью автоматизирован. Такие боты после поступления в работу и не стараются выглядеть правдоподобно, у них другие задачи. Тем не менее, после засвечивания даже такие убогие механизмы в основном не банятся Сцуппом™, подавляющее большинство остаётся в живых, - поскольку банят только по письменным обращениям в абьюз, а не автоматически.
Это неинтересные боты, тупые. Гораздо интереснее исследовать ботов полуавтоматических, которые действуют и через скрипты, и через живых операторов. Эти модификации гораздо интереснее, их можно часто встретить в комментариях тысячников, причем не всегда можно сразу догадаться, что это бот. Но о них мы поговорим в другой раз..
¤ Господа специалисты по Яндексу, а объясните пожалуйста, чем такой синтаксис поиска отличается от такого, и почему такие разные получаются результаты?