Войти в систему

Home
    - Создать дневник
    - Написать в дневник
       - Подробный режим

LJ.Rossia.org
    - Новости сайта
    - Общие настройки
    - Sitemap
    - Оплата
    - ljr-fif

Редактировать...
    - Настройки
    - Список друзей
    - Дневник
    - Картинки
    - Пароль
    - Вид дневника

Сообщества

Настроить S2

Помощь
    - Забыли пароль?
    - FAQ
    - Тех. поддержка



Пишет Игорь Петров ([info]labas)
@ 2010-08-27 09:13:00


Previous Entry  Add to memories!  Tell a Friend!  Next Entry
новости культуры
Отхуячить до кровавых соплей no_nine вообще нет проблем, был бы адрес, она никто - хуячить можно.


(Читать комментарии) - (Добавить комментарий)


[info]pe3yc@lj
2010-08-27 18:14 (ссылка)
Ну чо, всё правильно. Ручная работа: хочу выпиливаю, хочу запиливаю.

Самое смешное во всём этом: роботы ЯППБ не могут ходить по ЖЖ, потому что Сцупп™ им этого не разрешает.

Смешно.

(Ответить) (Уровень выше) (Ветвь дискуссии)


[info]kukutz@lj
2010-08-28 03:16 (ссылка)
> Самое смешное во всём этом: роботы ЯППБ не могут ходить по ЖЖ, потому что Сцупп™ им этого не разрешает.

Это полная ерунда.

(Ответить) (Уровень выше) (Ветвь дискуссии)


[info]pe3yc@lj
2010-08-28 04:18 (ссылка)
Хорошо. Поставим вопросы иначе.

1. Правда ли, что схема взаимодействия ЯППБ с ЖЖ отличается от схемы взаимодействия ЯППБ с другими блогосервисами? Если да, то в чём конкретно состоят эти отличия?
2. Правда ли, что роботы ЯППБ не могут посещать страницы ЖЖ так же, как они это делают с другими блогосервисами и стандалонами, потому что это перегружает систему ЖЖ и она падает?
3. Правда ли, что при изменении страниц ЖЖ в общем случае не происходит переиндексации и в базе ЯППБ остаётся старая версия?

Следующая серия вопросов последует после ответа на эти. Спасибо заранее.

(Ответить) (Уровень выше) (Ветвь дискуссии)


[info]kukutz@lj
2010-08-28 10:11 (ссылка)
1) Нет, принципиальных отличий нет. Так же, как и для любых других сервисов, мы индексируем поток RSS с записями. Конечно, поскольку ЖЖ один из крупных партнёров, мы стараемся разными способами эту схему улучшать (например, вместо того, чтобы индексировать отдельные RSS журналов, индексируем единый общий), но на работу это никак не влияет, и мы делаем так не только для ЖЖ, но и для многих других сервисов.

2) Нет, это неправда.

3) Это не вполне правда – новая версия поста попадает к нам в базу (сохранённая копия меняется), но не в индекс (найти её по новым словам нельзя). Последнее является технической проблемой и будет исправлено.

(Ответить) (Уровень выше) (Ветвь дискуссии)


[info]lananet@lj
2010-08-28 11:00 (ссылка)
Вот ответьте пожалуйста внятно - зачем делать сервис "Вебмастер", если информация там не обновляется оперативно? А?
Висит устаревшая, двухнедельной давности.

(Ответить) (Уровень выше) (Ветвь дискуссии)


[info]kukutz@lj
2010-08-28 11:08 (ссылка)
Какая именно информация?

(Ответить) (Уровень выше) (Ветвь дискуссии)


[info]lananet@lj
2010-08-28 11:35 (ссылка)
про сайты - количество внешних ссылок, проиндексированных страниц. И в каталог Яндекса даже за деньги не принимаете, хотя у меня сайт хороший - и тиц и пр и посетители и рекламы минимум, а другие сайты с нулевым тицем с минимумом посетителей - в каталоге по той же тематике, и так же в сапе сидят все поголовно.
Вообще, ваш каталог Яндекса - несправедливый, необъективный! И учитывает мнение лишь конкурентов.
Да, у меня сайт - конкурент! Но это не даёт право издеваться над ним - копировать мои статьи с сайта и ставить их на сайты народ.ру, не обновлять информацию в вебмастере и сажать в песочницу моих читателей с центра России. Почему я по Москве и МО выхожу на третью страницу по запросу? А в Орле чуть ли не на восьмую?
Это не красящие ваш ресурс хитрости, которые все видят и все понимают.

(Ответить) (Уровень выше) (Ветвь дискуссии)


[info]kukutz@lj
2010-08-28 11:37 (ссылка)
> про сайты - количество внешних ссылок, проиндексированных страниц

Можно конкретику?

(Ответить) (Уровень выше) (Ветвь дискуссии)


[info]lananet@lj
2010-08-28 11:57 (ссылка)
Да вам же жутко давать конкретику - вы и так мой сайт понизили по тицу, и информацию о количестве внешних ссылок, на момент апа - 25 августа заморозили - вебмастер стоит - там инфа не обновляется с 16 числа, а уже 28. И всё это только потому, что я, так сказать, "обнаружила" свой сайт, подав заявку на платное вхождение в каталог Яндекса.
Конкретика такая - вот, навскидку сайт с сапы http://pre-perinatal.ru/ тиц 20 посещаемость нулевая, стоит в яндекс каталоге в разделе семья.
Посмотрите, сколько там саповских ссылок внизу.
Ещё вот http://aperturastudio.com/portfolio/city/index.shtml тиц 10 тоже в том же каталоге.
А вот этот сайт вообще нонсенс http://www.senses.ru тиц 0 , однако уже в каталоге Яндекс в разделе Семья -"Психология отношений". Это все сайты с сапы.
Это несправедливо.
:(
А мне пришёл ответ: Ваш сайт по нашему мнению - не представляет интереса для читателей каталога.
А люди находят и ходят и читают. Даже уже в запросах просто название моего сайта появляется.
Я так думаю, ваш каталог - купленный и необъективный.




(Ответить) (Уровень выше)


[info]lananet@lj
2010-08-28 12:13 (ссылка)
Ещё - пишу статью уникальную в которой естественно оказываются ключевые слова - статья определённой тематики, сайт выходит в топ только по одной этой статье (что для меня было первое время удивительно, так как я не сеошник), но что ещё удивительней - конкуренты копируют полностью мою статью и ставят её не только что сделанный сайт на Народе. И Яндекс тут же выбрасывает мой сайт из топа, как-будто это я статью украла.
Это вообще кошмар. почему с этим не боретесь?

(Ответить) (Уровень выше)


[info]lananet@lj
2010-08-28 12:15 (ссылка)
Но ладно, со всем этим можно как-то сладить - но вебмастер мне СПЕЦИАЛЬНО не обновляет инфу, уже 12 дней!!!!!
Сделайте наконец вебмастер и чёрт с вашим каталогом.
Я теперь сама туда не хочу - позорище просто - стоять рядом с нулевыми сайтами сомнительной тематики в одном разделе!

(Ответить) (Уровень выше) (Ветвь дискуссии)


[info]kukutz@lj
2010-08-28 12:50 (ссылка)
Я и просил конкретику по вебмастеру, а не по каталогу. Поясните, пожалуйста, по какому сайту не обновляется информация и почему вы решили, что она не обновляется?

(Ответить) (Уровень выше) (Ветвь дискуссии)


[info]lananet@lj
2010-08-28 12:53 (ссылка)
Потому что там стоит - последнее посещение сайта роботом 16.08.10
А количество внешних ссылок за 18.08.10

И Платон всё время пишет - подождите немножко, всё обновится.
Уже два дня жду. Всё так же.

А по каталогам мне тоже интересно - почему так всё?
Сейчас скрин сделаю.

(Ответить) (Уровень выше)


[info]lananet@lj
2010-08-28 13:00 (ссылка)
скрин

http://clip2net.com/s/vvLx

(Ответить) (Уровень выше)


[info]lananet@lj
2010-08-28 13:03 (ссылка)
А это скрин про внешние ссылки:

http://clip2net.com/s/vvMA

(Ответить) (Уровень выше) (Ветвь дискуссии)


[info]kukutz@lj
2010-08-28 14:24 (ссылка)
Я передал вопрос специалистам, жду ответа. Так как сейчас выходные, возможно, придётся подождать до понедельника.

(Ответить) (Уровень выше) (Ветвь дискуссии)


[info]lananet@lj
2010-08-28 14:52 (ссылка)
Спасибо.

(Ответить) (Уровень выше) (Ветвь дискуссии)


[info]kukutz@lj
2010-09-01 07:16 (ссылка)
Компетентные специалисты сообщают, что да, к сожалению, проблема есть, мы ее чиним и скоро, надеемся, дата снова будет обновляться вовремя.

(Ответить) (Уровень выше) (Ветвь дискуссии)


[info]lananet@lj
2010-09-02 16:28 (ссылка)
Спасибо. Заработало.
----------------
А с каталогом можете разобраться? Что-то уж совсем плохи дела (((((

(Ответить) (Уровень выше)


[info]pe3yc@lj
2010-08-28 11:39 (ссылка)
1. То есть роботы Яндекса всё-таки не ходят по ЖЖ (как в Большом Яндексе), а вы работаете только и единственно с RSS-потоком, который отдаёт вам ЖЖ. Я правильно понял?

2. Ваш ответ несколько противоречит пункту 1, не находите?

3. Как долго уже имеет место это ситуация? Сколько недель, месяцев, лет?

(Ответить) (Уровень выше) (Ветвь дискуссии)


[info]kukutz@lj
2010-08-28 13:50 (ссылка)
1) Поиск по блогам индексирует данные в структурированном виде, в основном через RSS и Atom, мы никогда не обходили html по ссылкам, как веб-поиск Яндекса.

2) Нет, не нахожу. То, что мы индексируем RSS, не имеет никакого отношения к тому, что мы "перегружаем" чьи-то сервисы. И не является исключением для ЖЖ.

3) Я не готов сказать точно, около года. Нужно понимать, что в конце концов отредактированная версия всё же будет проиндексирована, вопрос лишь в сроке.

(Ответить) (Уровень выше) (Ветвь дискуссии)


[info]pe3yc@lj
2010-08-28 14:05 (ссылка)
1. Это относится не только к ЖЖ, а вообще ко всем блогосервисам, а также к стандалонам? То есть ЯППБ принципиально не обходит html, как Яндекс, а работает со всеми источниками только через RSS и Atom? Что значит "в основном"?

2. Причиной работы с потоками вместо обхода html (как это делает поисковая машина) разве не является нагрузка на блогосервис, которую он может и не выдержать? Если нет, то что же тогда является причиной отказа от использования нормальной технологии, проверенной временем и прекрасно себя зарекомендовавшей в большом поиске? Отдаёте ли вы себе отчёт в том, что работа с данными, которые блогосервис отдаёт по RSS/Atom и работа с непосредственными данными, полученными от поисковых роботов, приводят к разным результатам?

3. По моим сведениям - больше, чем около года, скорее ближе к двум. Но даже если и около года - не считаете ли вы, что для "технической неисправности" это неприлично большой срок? В современном интернете "около года" практически неотличимо от "так было всегда" или как минимум "очень давно". Причём речь не о какой-то второстепенной примочке, а об одном из важнейших критериев работы сервиса: об актуализации поиска.

4. Кстати, вы снова забыли подчистить анонс кэша (http://yandex.ru/yandsearch?date=&text=%D0%97%D0%BD%D0%B0%D1%87%D0%B8%D1%82+%D0%B3%D0%BE%D0%B2%D0%BE%D1%80%D1%8F%D1%82+%D0%B4%D1%80%D1%83%D0%B7%D1%8C%D1%8F+%D0%BF%D1%80%D0%B5%D0%B4%D0%BB%D0%B0%D0%B3%D0%B0%D1%8E%D1%82+%D0%B4%D0%B2%D1%83%D1%85+%D0%BE%D1%85%D1%80%D0%B0%D0%BD%D0%BD%D0%B8%D0%BA%D0%BE%D0%B2+%D0%BA%D0%BE%D1%80%D0%BE%D1%82%D0%BA%D0%BE%D0%B5+%D0%B2%D1%80%D0%B5%D0%BC%D1%8F+%D0%BE%D0%B1%D0%BB%D0%B8%D0%BB%D0%B0+%D0%A2%D0%BE%D0%BB%D1%81%D1%82%D1%83%D1%8E+%D0%B4%D0%B5%D1%80%D1%8C%D0%BC%D0%BE%D0%BC+%D1%81%D1%84%D0%BE%D1%82%D0%BE%D0%B3%D1%80%D0%B0%D1%84%D0%B8%D1%80%D0%BE%D0%B2%D0%B0%D0%BB%D0%B0+%D0%B2%D1%8B%D0%B2%D0%B5%D1%81%D0%B8%D0%BB%D0%B0+%D0%BB%D0%BE%D0%B6%D1%8C+%D0%B8%D0%BD%D0%B8%D1%86%D0%B8%D0%B8%D1%80%D0%BE%D0%B2%D0%B0%D0%BD%D0%BD%D1%83%D1%8E+%D1%82%D1%80%D0%B0%D0%B2%D0%BB%D1%8E+%D0%9E%D1%82%D1%85%D1%83%D1%8F%D1%87%D0%B8%D1%82%D1%8C+%D0%BA%D1%80%D0%BE%D0%B2%D0%B0%D0%B2%D1%8B%D1%85+%D1%81%D0%BE%D0%BF%D0%BB%D0%B5%D0%B9+no_nine+%D0%B0%D0%B4%D1%80%D0%B5%D1%81+%D0%BD%D0%B8%D0%BA%D1%82%D0%BE+%D1%85%D1%83%D1%8F%D1%87%D0%B8%D1%82%D1%8C+%D0%9A%D0%BE%D0%BB%D1%8B%D1%88%D0%B5%D0%B2%D1%81%D0%BA%D0%BE%D0%B3%D0%BE+%D0%BF%D0%BE%D1%83%D1%87%D0%B8%D0%BB%D0%B8+%D1%81%D1%82%D1%80%D0%B0%D1%85%D0%B0+%D0%BA%D0%B2%D0%B0%D1%80%D1%82%D0%B8%D1%80%D1%8B+%D1%81%D1%8A%D0%B5%D1%85%D0%B0%D0%BB+%D0%A3%D0%B3%D0%BE%D0%BB%D0%BE%D0%B2%D0%BD%D0%BE%D0%B9+%D0%BE%D1%82%D0%B2%D0%B5%D1%82%D1%81%D1%82%D0%B2%D0%B5%D0%BD%D0%BD%D0%BE%D1%81%D1%82%D0%B8+%D0%BE%D0%B1%D0%BB%D0%B8%D0%B2%D0%B0%D0%BD%D0%B8%D0%B5+%D0%B4%D0%B5%D1%80%D1%8C%D0%BC%D0%BE%D0%BC+%D0%B1%D0%B0%D0%BA%D0%BB%D0%B0%D0%BD%D0%BA%D0%B0+%D1%85%D1%83%D0%BB%D0%B8%D0%B3%D0%B0%D0%BD%D0%BA%D0%B0&site=becky-sharpe.livejournal.com&rstr=&zone=all&wordforms=all&lang=ru&within=0&from_day=&from_month=&from_year=&to_day=&to_month=&to_year=&mime=all&numdoc=10&lr=213), плохо выполнили команду Божены. Через большой поиск её пост всё равно находится (кэш, правда, уничтожен). Поправьте там, если у вас туда есть доступ, - а то некрасиво получается.

(Ответить) (Уровень выше) (Ветвь дискуссии)


[info]kukutz@lj
2010-08-28 14:18 (ссылка)
1. Да, это относится ко всем сервисам, а также к автономным блогам. Я удивлен, что такой эксперт в области недостатков поиска по блогам Яндекса, как Вы, не знает этой базовой основополагающей вещи про него.

2. Нет, причиной является не нагрузка, а то, что индексация в машиночитаемом формате позволяет получать большое количество метаданных, не полагаясь на либо наколенные парсеры для каждого дизайна каждого блога, либо на искуственный интеллект, занимающийся сегментацией страниц блогов. Эти метаданные позволяют вести все те поиски, которые доступны со страницы расширенного поиска, в частности. Они позволяют понимать, кто автор какого комментария и так далее.

(Ответить) (Уровень выше) (Ветвь дискуссии)


[info]pe3yc@lj
2010-08-28 14:42 (ссылка)
1. C чего бы это я эксперт? Нет уж, я обычный любитель, никаких экспертов. Однако вы не ответили на вопрос - что значит "в основном по RSS и Atom"? Почему "в основном", а не "только"?

2. Хорошо, допустим. Но тогда получается, что вы имеете дело не с самими блогами, а с теми их отражениями, которые блогосервис считает нужным отдать в трансляцию. Не полагаете ли вы, что такой подход искажает получаемую картину?

3. Вы так и не ответили - что это за загадочная "техническая причина", по которой вот уже больше года не происходит переиндексации поиска. Насколько я понимаю, главная функция сервиса ЯППБ, исходя из его названия - это именно поиск по блогам. Почему же он более года не работает, собственно? Кроме переиндексации отредактированных страниц имеются (годами причём имеются) также и лакуны в базе (часть постов и комментов вообще в неё не попадают). При этом прочие, не-поисковые функции вашего сервиса (например, рейтинги) вполне работают. Почему так? Вы считаете, что рейтинги нужнее поиска?

4. Есть и ещё вопросы. По вашей оценке, какую часть вашей базы составляют сплоги, бот-эккаунты, заброшенные эккаунты? (По каждой позиции свой процент, пожалуйста).

5. По каким критериям ведётся отбор эккаунтов в базу. Иначе говоря, что считается "блогом", а что нет. Надеюсь, это не секретные критерии и их можно опубликовать?

(Ответить) (Уровень выше)


[info]pe3yc@lj
2010-09-02 14:02 (ссылка)
Я правильно понимаю, что ответов на эти вопросы от вас я так и не дождусь?

(Ответить) (Уровень выше)


[info]los_oxuenos@lj
2010-08-28 12:03 (ссылка)
Вы не подскажете, каким образом работает счетчик Яндекса?
Он все время показывает сильно заниженные цифры посещений журнала.
Внутренняя статистика журнала, например, показывает 40 посетителей, а счетчик выдает 10-15 посещений, не больше.
Что это значит, не разъясните?

(Ответить) (Уровень выше) (Ветвь дискуссии)


[info]kukutz@lj
2010-08-28 12:48 (ссылка)
А он у вас установлен в теме s2, так, чтобы он был на странице каждой записи?

(Ответить) (Уровень выше) (Ветвь дискуссии)


[info]zakladom@lj
2010-08-28 12:49 (ссылка)
Нет, а где это сделать?

(Ответить) (Уровень выше) (Ветвь дискуссии)


[info]kukutz@lj
2010-08-28 12:52 (ссылка)
http://yandex.ru/yandsearch?text=как%20установить%20счетчик%20в%20жж%20s2&lr=213

(Ответить) (Уровень выше) (Ветвь дискуссии)


[info]zakladom@lj
2010-08-28 12:58 (ссылка)
Типа "сходите поизучать"?

Это охуенный ответ, спасибо, что прямым текстом не послали.

(Ответить) (Уровень выше) (Ветвь дискуссии)


[info]kukutz@lj
2010-08-28 13:46 (ссылка)
Там по второй ссылке, например, подробная инструкция.

Я сам, к сожалению, не вставлял счётчик, поэтому не могу рассказать о своём опыте.

(Ответить) (Уровень выше)


(Читать комментарии) -