Войти в систему

Home
    - Создать дневник
    - Написать в дневник
       - Подробный режим

LJ.Rossia.org
    - Новости сайта
    - Общие настройки
    - Sitemap
    - Оплата
    - ljr-fif

Редактировать...
    - Настройки
    - Список друзей
    - Дневник
    - Картинки
    - Пароль
    - Вид дневника

Сообщества

Настроить S2

Помощь
    - Забыли пароль?
    - FAQ
    - Тех. поддержка



Пишет topbot2 ([info]topbot2)
@ 2007-11-20 21:50:00


Previous Entry  Add to memories!  Tell a Friend!  Next Entry
Социальные сети, datamining, profiling и все-все-все
(хотел написать свои мысли на эту тему, а реально получилось предисловие к эссе [info]arkanoid@lj)

Прочитал у уважаемого [info]dolboeb@lj рассуждения о том, что пользователи "Рунета" пугаются анкетирования и сбора данных. Это было заметно и раньше - постоянно кто-то пишет на тему "опасности" проектов типа "Odnoklassniki" и "Vkontakte". Мол, это проекты ФСБ и все такое. По-моему, все это началось после короткой заметки "Гоблина" . Некоторые люди пошли дальше, объявив злом Google. Истерия на тему социальных сетей реально присутствует, и чем-то на мой взгляд напоминает аналогичную по поводу введения ИНН и биометрических данных.

Что хочется сказать на эту тему...


...Русский интернет всегда отставал от настоящего на несколько лет в плане развития его пользователей. 15 лет назад, когда я подключился к Internet, ньюсгрупы были забиты сообщениями от контор типа ACLU о том, что правительство следит за всеми, кредитные карты - зло и служат для отслеживания американцев и т.д. Появление через несколько лет Communications Decency Act привело к огромному outrage во всем интернете и породило Blue Ribbon Campaign против цензуры :) Сейчас все это как-то стихло, внимание больше привлечено к кейсами за пределами США типа Yahoo China.
Но в России все только начинается. У нас в стране вообще такая специфика народа - у него есть много страхов, играя на которых, можно добиваться хороших результатов. У нас отлично работает fear-mongering marketing.Соответственно, слухи о цензуре и слежке в интернете ложаться на благоприятную почву - средний пользователь "рунета" вместо знаний о том, как и что работает, верит во всякую хуйню (например, что по whois можно выяснить имя человека, который пользуется IP-адресом). Написанные где-то в комментариях слова "Deep Packet Inspection" выглядят страшно; если не знать, что это такое, легко поверить в то, что это технология для слежения за пользователями "Рунета". Дошло до того, что впроне адекватные люди люди начинают мне рассказывать о том, что ФСБ может прослуживать через выключенный телефон все разговоры в комнате в радиусе X метров.

Что мы имеем реально...

Datamining и profiling стали реальность. Данные собирать совсем не сложно, thanks G-d for Google; использовав в качестве вводных данных реальное имя, nick, email address, IM UIN, телефон,- можно накопать много интересного. Результаты поиска по каждому из этих запросов подвергаются cross-checking, иррелевантная информация фильтруется. Затем, узнав identity конкретного человека с клавиатурой в различных блогах и форумах, можно выдернуть сгенерированный им (привет, веб два-ноль) контент, который проверить на плотность ключевых слов. Все эти операции полностью автоматизируются; таким образом, достаточно вбить данные человека и узнать - за Путина он или против.
Все это работает, разумеется, при условии, что человек присутствует в этом самом веб два-ноле. Однако большинство людей довольно слабо представлены в сети и используют интернет в сугубо утилитарных целях.
Сообщения электронной почты и запросы к поисковым службам, в отличие от веб два-ноль, являются по определению закрытыми. Закрытыми для других пользователей, но не для администрации конкретной службы. Поисковые запросы можно сопоставить с IP-адресом, а также с конкретным id пользователя (через cookies); почта это вообще кладезь информации, поскольку пользователи пересылают довольно sensitive информацию в незашифрованном виде и хранят ее в почтовых ящиках. Имея доступ ко всем этим архивам, можно накопать очень много интересного. Человек можен не знать, что такое блоги, но почтой пользуются все.
Поэтому наибольшей угрозой мне представляются не социальные сети, а сервисы, аккумулирующие информацию - поисковые службы и бесплатные почтовые сервисы. В самом деле, при profiling представляет интерес, как правило, только первый круг знакомых. Данные же, которые указаны в базах "Vkontakte" или "Odnoklassniki", легко найти во множестве других мест (например, имя и дата рождения указываются при регистрации на многих форумах). Хорошей иллюстрацией на тему, что же действительно интересно спецслужбам, является знаменитая презентация про три кнопки Рунета

Почтовый сервер - это обширная база переписки наших граждан. Доступ к ящикам важен и для спецслужб: появляется реальная возможность следить за прохождением переписки продавцов наркотиков, террористов и иных злоумышленников.
БД запросов поисковика - дает ценную социологическую информацию о состоянии и интересах общества. Возможности информационных систем позволяют персонализировать поисковый сервис: привязать статистику запросов к IP-адресу пользователя, отследить вэб-маршруты запросов.


Что же можно предпринять?

На эту тему подробно написал [info]arkanoid@lj

http://arkanoid.livejournal.com/191642.html


Image источник-[info]l4rz@ljчитать полный текст со всеми комментариями