Войти в систему

Home
    - Создать дневник
    - Написать в дневник
       - Подробный режим

LJ.Rossia.org
    - Новости сайта
    - Общие настройки
    - Sitemap
    - Оплата
    - ljr-fif

Редактировать...
    - Настройки
    - Список друзей
    - Дневник
    - Картинки
    - Пароль
    - Вид дневника

Сообщества

Настроить S2

Помощь
    - Забыли пароль?
    - FAQ
    - Тех. поддержка



Пишет bbb ([info]bbb)
@ 2005-01-14 11:48:00


Previous Entry  Add to memories!  Tell a Friend!  Next Entry
снова об авторских правах
http://www.livejournal.com/users/corsika/591077.html?thread=2699749


(Читать комментарии) - (Добавить комментарий)


[info]induke@lj
2005-01-14 14:06 (ссылка)
То, что он принял во внимание желания некоторых авторов.

Но он ни в коем случае не обязан был это делать.

(Ответить) (Уровень выше) (Ветвь дискуссии)


[info]bbb@lj
2005-01-14 14:18 (ссылка)
По мне - строго наоборот. Принимая во внимание желание некоторых авторов, яндекс игнорирует желания миллионов своих пользователей-читателей, на которых и зарабатывает. То есть эта вежливость достигается не за счет самого яндекса, а за счет его пользователей-читателей. Не знаю, кто как, а мне вежливость за чужой счет не кажется великим достоинством. Очевидно, что это возможно только потому, что все эти неиднексируемые сайты остаются крайне маргинальны. Если бы дело обстояло иначе, то отказ от такой псевдо-вежливости стал бы важным инструментом конкуренции, и пользователи бы перекочевали к такому поисковику, который объявил бы об игнорировании пожеланий сайтовладельцев касательно неиндексирования их сайтов.

(Ответить) (Уровень выше) (Ветвь дискуссии)


[info]induke@lj
2005-01-14 14:31 (ссылка)
Это конечно уже Яндексу решать.

Хотя, возьмем пример Google. У них есть девиз "Do no evil". Они всегда согласны удалить ваш сайт из своего индекса. Но получается так, что те сайты которые удаляются сами становятся маргинальными, а их контент легко восполняется материалами подобных сайтов которие таки-да проиндексированы на Гугле.

В итоге, Гугл избегает нападки всяческих "прайваси"-активистов, и все равно предлагает своим пользователям довольно качественный продукт. И волки целы и овцы сыты, так сказать :)

Думаю, что здесь произойдет то же самое. Всякие крикуны найдут себе новую цель, а Яндекс будет спокойно предлагать поиск по большей части русскоязычного ЖЖ.

(Ответить) (Уровень выше)


[info]mama_ari@lj
2005-01-14 14:32 (ссылка)
оставляя вопрос, что яндекс зарабатывает на рекламодателях, а не на пользователях, напомню более важное:

на обычных сайтах ставится файл robots.txt
его указаниям подчиняются ВСЕ поисковики
это стандарт
ну вот - так же, как любой вебмастер имеет право определить сам в robots.txt, какие файлы его сервера индексировать, а какие нет - такие же права нам даёт эта пресловутая птичка отказа от индексации дневника. просто другая реализация того же стандарта.

ты удивишься, если узнаешь, какое большое число файлов и директорий не индексируется принципиально. это не абстрактная, это работающая вещь, в постоянном пользовании практиков.

(Ответить) (Уровень выше) (Ветвь дискуссии)


[info]induke@lj
2005-01-14 14:39 (ссылка)
Так разговор же весь о том, что подчиняются поисковики этому стандарту добровольно (да и то не всегда (http://www.webmasterworld.com/forum93/411.htm)).

У HTML и CSS тоже есть стандарты, это не значит, что IE или Netscape соблюдают из всегда и везде.

(Ответить) (Уровень выше) (Ветвь дискуссии)


[info]mama_ari@lj
2005-01-14 14:57 (ссылка)
я о том, что представление, что в мире есть капелька маргинальных неиндексируемых сайтов - неверное. немаргинальные поисковики уважают robots.txt и явно это описывают, и яндекс не исключение. (http://webmaster.yandex.ru/faq.xml?id=502499#robot)
абсолютно не маргинальные вебмастера прописывают этот файл ежедневно.

(Ответить) (Уровень выше) (Ветвь дискуссии)


[info]induke@lj
2005-01-14 15:07 (ссылка)
Насколько я понимаю, чаще всего robots.txt используют не для того, чтобы запретить поиск на сайте, а чтобы ограничить нагрузку на сервер. Это вполне реальные требования к поисковикам, и если они их не соблюдают, индексирование отрубается на корню - на файруолл ставится запрет на их IP.

Здесь же несколько другая постановка вопроса: я написал что-то, и дал возможность всему миру это посмотреть. Однако я не хочу, чтобы вы это индексировали из-за каких-то соображений. Можно скривиться и соблюдать это желание, а можно и нет, в зависимости от желаний пользователей данного поисковика.

В любом случае, утверждать, что кто-то имеет право контролировать распространение документа, который уже и так доступен абсолютно всем, безсмысленно.

(Ответить) (Уровень выше) (Ветвь дискуссии)


[info]mama_ari@lj
2005-01-14 15:22 (ссылка)
ip роботов меняются часто, все не запретишь
реальная ситуация с запретом индексирования директорий: вот лежит на сервере директория, на которую никаких ссылок с собственно сайта. но не защищённая паролями. ну выложила организация всякие не особо секретные файлы для сотрудников, доступные из любого места, например из офиса клиента в другом городе. исходя из "кому надо - знает прямой url документа и имеет доступ, остальные его не увидят". однако проходит время и прямые ссылки на документы появляются, например, в файлах статистики, например, у того же клиента. есть, знаете ли, такие дурацкие админы, у которых отчёты лог-анализатора формируются как открытые html-документы. и вот по этим ссылкам роботы начинают находить ту директорию. здесь и срабатывает robots.txt.
это некоторая аналогия происходящему.
кстати, подозреваю, что при выставлении пользователем блога галочки "не индексировать" соответствующая директория просто автоматически вносится в тот самый robots.txt сервера, в данном случае livejournal.com - а как ещё-то?

(Ответить) (Уровень выше) (Ветвь дискуссии)


[info]induke@lj
2005-01-14 15:42 (ссылка)
По поводу секретных файлов в открытых директориях - это уже диагноз, тут никакие роботы не спасут. Расчитывать на то, что поисковики не выдадут вашу секретную информацию это халатность, мягко говоря.

А каким образом Яндекс проиндексировал запретные болги не знаю. Думаю, что они перекупили у кого-то технологию (например у lj.crossroads.ru), а те не уважали роботов.

Да, вот еще вопрос - как с постингами быть. Допустим я не хочу, чтобы мои комментарии на журнале [info]bbb@lj были индексированы. Но реально такой возможности у меня нет. В этом случае поведение роботов не меняется, однако теперь они делают что-то с моими комментариями против моей воли.

Или наоборот - я оставил комментарий у [info]corsica@lj с надеждой, что его проиндексируют, а мне большую дулю показывают. Нехорошо ведь :)

(Ответить) (Уровень выше) (Ветвь дискуссии)


[info]mama_ari@lj
2005-01-14 17:46 (ссылка)
ну, я приводила пример из известной мне жизни, но не своей :)
у меня диагноза нет :)

(Ответить) (Уровень выше)


[info]tejblum@lj
2005-01-14 16:27 (ссылка)
кстати, подозреваю, что при выставлении пользователем блога галочки "не индексировать" соответствующая директория просто автоматически вносится в тот самый robots.txt сервера, в данном случае livejournal.com - а как ещё-то?

От этого утверждения и отвеча [info]induke@lj я, откровенно говоря, совсем обалдеваю. Обращаю внимание, что вы с ним обсуждаете не неизвестно какой robots.txt, а вполне конкретный. Если вам вдруг лень набрать этот url, вот он: http://www.livejournal.com/robots.txt . Нажмите на эту ссылку и посмотрите что там написано! Вы увидите, что там не запрещен ни один журнал.

На самом деле по стандартам-традициям хозяин сайта может запретить не только в robots.txt (который, действительно, изначально придуман для уменьшения нагрузки на сервер), а еще и в специальном HTML-тэге, пример которого можно пронаблюдать на той же странице http://www.livejournal.com/users/corsika/

<meta name="robots" content="noindex, nofollow, noarchive" />

Яндекс.Блоги же индексируют информацию из RSS-фида, в данном случае http://www.livejournal.com/users/corsika/data/rss . В этом файле никаких сдедов запрета индексации нет. Поэтому в первые дни работы Яндекс.Блогов запрещенные дурналы и индексировались. Теперь специально для livejournal был сделан специальный (довольно грязный) хак, чтобы узнавать, запрезен конкретный журнал или нет.

(Ответить) (Уровень выше) (Ветвь дискуссии)


[info]mama_ari@lj
2005-01-14 17:56 (ссылка)
спасибо большое!

(Ответить) (Уровень выше)


[info]russhatter@lj
2005-01-17 05:02 (ссылка)
Уточняю. Хак - не грязный, а просто кривой. Яндексу стыдиться нечего, проблемы на стороне LJ: кроме непоредственно самодеятельности с файлом robots.txt, они еще несколько мимо стандарта попадают... Так что факт учета "специфики" LJ Яндексом - акт доброй воли. Все остальные могут легко обойтись без такового, если выполнят необременительную модификацию при формировании RSS файлов.

(Ответить) (Уровень выше)


[info]bbb@lj
2005-01-14 16:06 (ссылка)
Конечно, зарабатывает яндекс именно на пользователях, потому что рекламодатели размещают у него рекламу только потому, что рассчитывают на пользователей.

Далее, ты говоришь - "стандарт". Это не стандарт, а имеющаяся на сегодняшний день ситуация. Подумай, как молодо все это наше интернетное дело, с какой фантастической скоростью развивается. На самом деле абсолютно ничего тут не устоялось, все поменялось сто раз за, страшно подумать, с какого-нибудь 96-го года или когда стало реально говорить об интернете как массовом пространстве. Мы даже не заметили, как очутились в новой жизни. Особенно это ощущается, конечно, в Америке, где через интернет делается вообще все - теперь первая реакция на любую информационную проблему в широком смысле (включая "найти и купить") состоит в автоматическом открывании гугля.

Соответственно, роль поисковиков в жизни людей менятся драматически. Теперь это уже не самодеятельная примочка для нашего дружного комьюнити интернетчиков, имплицитно противостоящего океану ламеров. И правила жизни - тоже будут меняться.

В мире дружного комьюнити (скажем, вот есть тут в ЖЖ большое комьюнити поэтов, которые даже ездят толпами из москв в ленинграды и киевы и обратно) вполне нормально, когда один член комьюнити обращается к другим - ребята, такое дело, вы вот эти мои стихи, конечно, читайте, но на публику не надо, ОК? В мире безличного общества такой номер не пройдет - тут аналогом будет не кружок поэтов, а библиотекари, каталогизаторы и т.д., которые делают свое дело для своих массовых читателей и пользователей, и жеманные просьбы авторов им по барабану.

Да, переход из тепличной жизни комьюнити в "бездушный мир рынка" бывает тяжел, но он неизбежен. В мире печатной продукции такой переход уже произошел и все его воспринимают как данность. В интернете, видимо, еще происходит.

Видимо, это напоминает момент возникновения массовых публичных библиотек (не была ли Библиотека Конгресса первой из них? или это была библиотека Британского музея?). Если до того книги собирали любители, и можно было с ними "договариваться" (я слыхал, у тебя остался экземпляр моего тиража - мне сегодня так стыдно за ту книгу, ты ее выкини, брат, или никому не давай), то с библиотекой - никак.

(Ответить) (Уровень выше) (Ветвь дискуссии)


[info]mama_ari@lj
2005-01-14 17:53 (ссылка)
понимаю этот коммент как просветительский и обращённый к широкой публике читателей этого треда, а не ко мне :)
я, хоть у меня галка и стоит - ну пока можно было оттянуть неизбежное, я пользовалась - на самом деле всё понимаю так же. я сюда влезла не про плохих гадов поругаться, попирающих мою прайваси. а только откомментировать ситуацию - внести уточнения. все эти вещи про robots.txt и про соответствующий стандарт w3 (http://www.w3.org/Search/9605-Indexing-Workshop/ReportOutcomes/Spidering.txt") ты вообще как бы не учитывал и описывал ситуацию как уже случившуюся с небольшими маргинальными исключениями - я лишь пояснила, что это не совсем так.

(Ответить) (Уровень выше)


[info]ex_cherjr@lj
2005-01-14 14:40 (ссылка)
борь, что-то ты не то говоришь.
видится, что все проще. есть блог-сервис, который указывает возможность для каждого пользователя по его (пользователя) сугубому желанию вывесить "признак", что он (пользователь) не хочет, чтобы с тем, что он (пользователь) делает в рамках этого сервиса другие сервисы делали какие-то свои сервисные действия - например, поисковики индексировали. Этот блог-сервис имеет возможность это "показать" сервису. Совершенно нормально, чтобы это желание пользователя другие сервисы уважали. Сознательный отказ в таком поведении означает, что этот сервис не уважает недвусмысленно высказанную волю пользователя блог-сервиса, что некрасиво.
Причем тут все остальное-то?
И довод про "инструмент конкуренции" - контр-продуктивный; пользователи блог-сервисов, которых этот вопрос беспокоит - и которые собственно в рамках этого своего беспокойства и высказали такое пожелание - просто либо уйдут в приват, либо вообще перестанут пользоваться этим блог-сервисом. И кто тут окажется в выигрыше? Никто.

(Ответить) (Уровень выше) (Ветвь дискуссии)


[info]bbb@lj
2005-01-14 16:08 (ссылка)
В этой конструкции присутствуют авторы текстов, серверы блогов и серверы поисковиков, и все выглядит гармонично. Это просто потому, что в ней потерян главный элемент - читатель-пользователь поисковика.

(Ответить) (Уровень выше) (Ветвь дискуссии)


[info]ex_cherjr@lj
2005-01-14 16:24 (ссылка)
ага. потому что авторы текстов не ему пишут. и все уважают этот подход. кроме тебя :)

(Ответить) (Уровень выше)


[info]mikev@lj
2005-01-14 14:53 (ссылка)
Сразу отмечу, что юридические аспекты обсуждаемого вопроса для меня так и остались неясными.

С другой стороны, автор, выкладывая материал в ЖЖ и не разрешая его индексировать, рассчитывает на вполне определенный объем аудитории. Если его ожидания не оправдаются вопреки его явно выраженной воле, вполне вероятно, что он перестанет выкладывать эту информацию вообще. Кто от этого выиграет?

С третьей стороны, позиция ЖЖ тоже выражена достаточно четко: стоящая опция запрета индексирования означает нежелательность индексирования. Действия Яндекса вопреки этой позиции могли бы привести к ответной реакции ЖЖ, который тоже должен защищать своих пользователей. Например, могли бы совсем отрубить Яндексу доступ или сделать что-то в этом роде. Кто от этого выиграет? Во всяком случае, не пользователи-читатели.

Часто, поступившись своими правами во имя интересов других, мы в результате выигрываем

(Ответить) (Уровень выше) (Ветвь дискуссии)


[info]bbb@lj
2005-01-14 16:10 (ссылка)
Кто эти "мы", которые выигрываем? Я - не выигрываю. Пользователи яндекса - не выигрывают.

Если кого-то волнует приватность, то есть множество способов ее обеспечить. Замочки, пассворды.

(Ответить) (Уровень выше) (Ветвь дискуссии)


[info]mikev@lj
2005-01-14 16:26 (ссылка)
Обязательно выиграем. И Вы, и я, и пользователи Яндекса.

Или наоборот - проиграем, если не проявим добрую волю. Потому что навесят замков и пассвордов, и информация станет совсем недоступна. То есть конечный результат может оказаться не тот, на который Вы первоначально рассчитываете.

Должны ли такие вещи регулироваться правом или нетикетом - не знаю.

(Ответить) (Уровень выше)


[info]tejblum@lj
2005-01-14 16:51 (ссылка)
Пользователи яндекса, по большому счету, и не проигрывают. Думаю, возможность поиска по журналам не желающих того авторов очень мало кому нужна. Сделали бы например опрос об этом -- мы бы хоть какое-то представление о проценте таких желающих получили. Кроме того, для поисковика довольно бессмысленно находить ссылки на журналы нежелающих того людей именно потому, что те всегда могут "повесить замок".

(Ответить) (Уровень выше)


[info]mikev@lj
2005-01-14 18:00 (ссылка)
Придумал, как сформулировать то же на языке права.

Выставляя соответствующую опцию, хозяева сервера ЖЖ, вывешивают знак, запрещающий въезд поисковиков на соответствующие дорожки и кластеры жесткого диска, являющегося частным владением.

Или, точнее, поисковикам запрещается воздействовать на сервер ЖЖ электрическим сигналом такой конфигурации, который (согласно TCP/IP, HTTP и другим общепризнанным протоколам)вызывает обращение сервера ЖЖ к этим секторам.

Казуистика!

(Ответить) (Уровень выше) (Ветвь дискуссии)


[info]bbb@lj
2005-01-14 18:36 (ссылка)
Проблема в том, что хозяева сервера не имеют средств и возможности определить, кто к ним залезает, робот-индексатор или кто-то другой, поэтому то, что вы назвали "запретом", на самом деле остается всего лишь просьбой. Если бы роботы вычислялись, то использовался бы мехинмзм их блокирования, не пропускающий даже тех, кто не уважает указанную просьбу.

Это примерно как объявление, позволяющее проходить в парк всем, кроме злых и нехороших. Ясно, что такое объявление не несет правовой нагрузки.

(Ответить) (Уровень выше) (Ветвь дискуссии)


[info]mikev@lj
2005-01-14 19:25 (ссылка)
>>что хозяева сервера не имеют средств и возможности определить, кто к ним залезает, робот-индексатор или кто-то другой

Как правило, хозяева поисковиков занимаются своей деятельностью открыто, а результат ее доступен для всех :) Я думаю, они не станут отпираться и под присягой.

>>кроме злых и нехороших. Ясно, что такое объявление не несет правовой нагрузки

В силу размытости грани между добром и злом. Разницу между search engine и natural person суд легко определит :)

Я не являюсь IT-специалистом, но полагаю, что и ТЕХНИЧЕСКИ отличтить живого юзера от поисковика - не проблема.
Например, можно наставить невидимых для человека ложных ссылок "белое-на-белом", по которым тупой робот начинает ходить, после чего его IP попадает в "черный список", если робот нарушает правила для роботов.
Конечно, на любую хитрость можно придумать контрхитрость, последует война подобная нынешней войне спаммеров с почтовыми серверами, а мы с Вами только проиграем.
В любой войне страдает мирное население :(

(Ответить) (Уровень выше) (Ветвь дискуссии)


[info]lxe@lj
2005-01-16 20:23 (ссылка)
можно наставить невидимых для человека ложных ссылок "белое-на-белом"

На Psionе я их увижу, например.

(Ответить) (Уровень выше) (Ветвь дискуссии)


[info]mikev@lj
2005-01-17 03:05 (ссылка)
Во-первых, я не настаиваю на этом варианте, можно придумать что-то еще, например прозрачный гиф величиной в один пиксель или просто надпись "сюда не кликать!".

Во-вторых, я сразу утверждал, что от подобной "войны" в первую очередь пострадают пользователи.

(Ответить) (Уровень выше)


[info]mama_ari@lj
2005-01-14 15:03 (ссылка)
ещё одно:
не знаю, есть ли платные поисковики. которые реально бизнес-моделью имеют зарабатывание на продаже результатов поиска пользователям. такие поисковики, если есть - конечно, будут действовать как ты говоришь.

в настоящий момент базовая бизнес-модель другая. что бы они ни декларировали, зарабатывают они на продаже рекламы (в последнее время всё больше - контекстной). то есть именно на владельцах сайтов. да, конечно, чем полнее и релевантнее поисковая выдача, тем больше посетителей - тем больше рекламный заработок; но это более косвенная заинтересованность, чем прямая во владельцах сайтов. и они предлагают всё новые платные механизмы для позиционирования себя сайтам, и всё более изощрённо их настраивают и дают настраивать сайтам-рекламодателям. вебмастера, а не посетители поиска, их постоянные корреспонденты в форуме и в мейле. и т.д.

(Ответить) (Уровень выше) (Ветвь дискуссии)


[info]induke@lj
2005-01-14 15:09 (ссылка)
Есть поисковики которые продают результаты поиска; Lexis-Nexis, например.

(Ответить) (Уровень выше) (Ветвь дискуссии)


[info]mama_ari@lj
2005-01-14 15:15 (ссылка)
да, это я стормозила :)

(Ответить) (Уровень выше)


[info]tejblum@lj
2005-01-14 18:55 (ссылка)
А что, разве Lexis-Nexis ищет по интернету?

(Ответить) (Уровень выше) (Ветвь дискуссии)


[info]induke@lj
2005-01-14 18:59 (ссылка)
Нет, но это суть не меняет.

Если нужен платный поиск по интернету, есть Google Answers, например.

(Ответить) (Уровень выше)


[info]toshick@lj
2005-01-14 15:17 (ссылка)
Значит, нам нужен другой Яндекс, который наплюет на мудаков типа Корсики !

(Replies frozen) (Уровень выше) (Ветвь дискуссии)


[info]toshick@lj
2005-01-14 15:21 (ссылка)
хотя, на кой же чорт индексировать блоги идиотов ?
это я не подумал, да.

(Replies frozen) (Уровень выше) (Ветвь дискуссии)


[info]mama_ari@lj
2005-01-14 15:23 (ссылка)
у меня тоже выставлена галка :)

(Replies frozen) (Уровень выше) (Ветвь дискуссии)


[info]toshick@lj
2005-01-14 15:28 (ссылка)
каждая рыба - селедка, но не каждая селедка - рыба ... ой, т.е. наоборот ... в общем, ты поняла ;-)

(Replies frozen) (Уровень выше)


[info]bbb@lj
2005-01-14 16:11 (ссылка)
Знаешь анекдот про хиппи - "Девушка, передайте пять копеек на билет. А я не девушка..."?

(Replies frozen) (Уровень выше) (Ветвь дискуссии)


[info]mama_ari@lj
2005-01-14 17:54 (ссылка)
я его придумала

(Replies frozen) (Уровень выше) (Ветвь дискуссии)


[info]bbb@lj
2005-01-14 18:42 (ссылка)
вот и врешь!

(Replies frozen) (Уровень выше) (Ветвь дискуссии)


[info]mama_ari@lj
2005-01-14 18:48 (ссылка)
ну, с высоты тех 20-22х лет, что прошли с момента, как я его первый раз услышала, это неважно.

(Replies frozen) (Уровень выше)


[info]corsika@lj
2005-01-17 08:01 (ссылка)
яндекс для мудаков типа тошика?

(Replies frozen) (Уровень выше) (Ветвь дискуссии)


[info]bbb@lj
2005-01-17 11:38 (ссылка)
теперь счет выравнялся - так что позвольте мне ЭТУ ветку заморозить :)

(Replies frozen) (Уровень выше)


(Читать комментарии) -