LJR: bugs - Индексация.
January 11th, 2008
11:25 am
[marta_ketro]

[Link]

Previous Entry Add to Memories Tell A Friend Next Entry
Индексация.
Поставила галочку в поле «Запретить поисковыми системам индексирование моего дневника», но всё равно нашла дневник здесь http://blogs.yandex.ru/search.xml?text=marta+ketro
в то время как в жж эта настройка срабатывает. Что можно сделать?
Если ничего, то нет ли функции перевода всего дневника «под глаз» одной кнопкой?

(24 comments | Leave a comment)

Comments
 
[User Picture]
From:[info]virh
Date:January 11th, 2008 - 11:14 am
(Link)
там еще написано "Некоторые роботы на такие указания плюют."
[User Picture]
From:[info]marta_ketro
Date:January 11th, 2008 - 11:24 am
(Link)
таки да, но почему эти же роботы не плюют на то же указание в жж?
[User Picture]
From:[info]tiphareth
Date:January 14th, 2008 - 11:10 am
(Link)
Я думаю, что он успел индексировать ваш дневник до того,
как вы поставили галочку
From:(Anonymous)
Date:January 14th, 2008 - 12:34 pm
(Link)
Я поставила её при создании, а в поисковике журнал появился дня через два. Кстати, после того, как я написала первый текст именно в lj.rossia.org
[User Picture]
From:[info]tiphareth
Date:January 14th, 2008 - 01:19 pm
(Link)
Любопытно.
[User Picture]
From:[info]nit
Date:February 3rd, 2008 - 10:57 pm
(Link)
Это обрабатывается функцией robot_meta_tags,
у нас не было "noindex, nofollow, noarchive" для googlebot,
не исключено, что ппб на этот тэг ориентируется

Я добавил, теперь один в один с большим lj
[User Picture]
From:[info]marta_ketro
Date:February 3rd, 2008 - 11:19 pm
(Link)
Я восстановила журнал, пока не отражается нигде, посмотрю, как оно дальше будет.
Спасибо.
From:[info]anton
Date:June 23rd, 2008 - 10:18 am
(Link)
А где в RSS это указывается (или robots.txt)? Яндекс.Поиск по блогам не индексирует html, и поэтому не может знать про тэги в нём.
[User Picture]
From:[info]nit
Date:June 23rd, 2008 - 11:36 am
(Link)
А где именно ППБ в rss-потоке
ожидает увидеть noindex?

Вот, нашел что-то для yahoo,
можно аналогично устроить
(или уже что-то есть общепринятое?):
http://publisher.yahoo.com/rss_guide/faq.php
From:[info]anton
Date:June 24th, 2008 - 08:31 pm
(Link)
Примерно так: <copyright>noindex</copyright>
Например: http://wackowiki.com/xml/recentchanges_wackowiki.xml


[User Picture]
From:[info]nit
Date:June 24th, 2008 - 10:18 pm
(Link)
Спасибо! Добавил.
[User Picture]
From:[info]tiphareth
Date:June 25th, 2008 - 09:34 pm
(Link)
Неожиданное употребление слова копирайт
[User Picture]
From:[info]tiphareth
Date:June 25th, 2008 - 09:39 pm
(Link)
Спасибо, Петя! Теперь, похоже, все
поисковики уважают наш ноиндекс. По крайней
мере я пробежался и не нашел.
[User Picture]
From:[info]ppkk
Date:July 16th, 2008 - 02:31 pm
(Link)
Поэтому потенциальную рекламу намного проще делать неиндексируемой, чем удалять пользователей, создавая лишний ажиотаж (если читателей нет, в lj_fif нет и не индексируется, то коммерческий характер будет практически исключён).
[User Picture]
From:[info]tiphareth
Date:July 22nd, 2008 - 01:57 pm
(Link)
А спаммерам похуй, индексируется неиндексируется
они на зарплате

если не бить им по зубам, они разведутся как насекомые
[User Picture]
From:[info]tiphareth
Date:June 25th, 2008 - 09:37 pm
(Link)
Спасибо!
[User Picture]
From:[info]nit
Date:June 23rd, 2008 - 11:36 am
(Link)
Можем и robots.txt в директории пользователя сделать,
но вариант с rss все-таки кажется элегантнее
[User Picture]
From:[info]beshenov
Date:July 16th, 2008 - 07:44 pm
(Link)
На robots.txt не в корне сайта никто не обращает внимания, я думаю.

LJ точно на страницы с текстами дописывает

<meta name="robots" content="noindex, nofollow, noarchive" />
<meta name="googlebot" content="noindex, nofollow, noarchive, nosnippet" />


В Atom — вот такое:

<feed xmlns="http://www.w3.org/2005/Atom" xmlns:lj="http://www.livejournal.com" xmlns:idx="urn:atom-extension:indexing" idx:index="no">

С RSS там ничего и не делается, вроде как.
[User Picture]
From:[info]beshenov
Date:July 16th, 2008 - 07:46 pm
(Link)
> На robots.txt не в корне сайта никто не обращает внимания

А, кроме ППБ, получается.
[User Picture]
From:[info]nit
Date:February 9th, 2008 - 05:23 pm
(Link)
К сожалению

Думаю, они могут совсем отфильтровывать по robots.txt,
который в lj есть, а у нас чтобы его включить,
нужно сначала перейти на субдомены для пользователей.

В принципе операция затратная, но можно по крайней мере
подумать на эту тему, раз у пользователей появляется
необходимость.
From:[info]anton
Date:June 23rd, 2008 - 10:34 am
(Link)
Для ЖЖ-клонов мы поддерживаем костыль в виде файлов robots.txt в папках пользователей (вроде http://lj.rossia.org/users/marta_ketro/robots.txt) - такая схема работала в ЖЖ до перехода на домены третьего уровня.
[User Picture]
From:[info]marta_ketro
Date:January 11th, 2008 - 11:26 am
(Link)
А всё перевести в "только для друзей" одной кнопкой можно? А где именно, не уточните?
[User Picture]
From:[info]marta_ketro
Date:January 11th, 2008 - 11:45 am
(Link)
спасибо.
прикрою пока лавочку, раз такое дело.
[User Picture]
From:[info]benzopilat
Date:January 22nd, 2008 - 10:56 pm
(Link)
просто проверка
Powered by LJ.Rossia.org