Войти в систему

Home
    - Создать дневник
    - Написать в дневник
       - Подробный режим

LJ.Rossia.org
    - Новости сайта
    - Общие настройки
    - Sitemap
    - Оплата
    - ljr-fif

Редактировать...
    - Настройки
    - Список друзей
    - Дневник
    - Картинки
    - Пароль
    - Вид дневника

Сообщества

Настроить S2

Помощь
    - Забыли пароль?
    - FAQ
    - Тех. поддержка



Пишет Игорь Петров ([info]labas)
@ 2010-08-27 09:13:00


Previous Entry  Add to memories!  Tell a Friend!  Next Entry
новости культуры
Отхуячить до кровавых соплей no_nine вообще нет проблем, был бы адрес, она никто - хуячить можно.


(Читать комментарии) - (Добавить комментарий)


[info]kukutz@lj
2010-08-28 14:18 (ссылка)
1. Да, это относится ко всем сервисам, а также к автономным блогам. Я удивлен, что такой эксперт в области недостатков поиска по блогам Яндекса, как Вы, не знает этой базовой основополагающей вещи про него.

2. Нет, причиной является не нагрузка, а то, что индексация в машиночитаемом формате позволяет получать большое количество метаданных, не полагаясь на либо наколенные парсеры для каждого дизайна каждого блога, либо на искуственный интеллект, занимающийся сегментацией страниц блогов. Эти метаданные позволяют вести все те поиски, которые доступны со страницы расширенного поиска, в частности. Они позволяют понимать, кто автор какого комментария и так далее.

(Ответить) (Уровень выше) (Ветвь дискуссии)


[info]pe3yc@lj
2010-08-28 14:42 (ссылка)
1. C чего бы это я эксперт? Нет уж, я обычный любитель, никаких экспертов. Однако вы не ответили на вопрос - что значит "в основном по RSS и Atom"? Почему "в основном", а не "только"?

2. Хорошо, допустим. Но тогда получается, что вы имеете дело не с самими блогами, а с теми их отражениями, которые блогосервис считает нужным отдать в трансляцию. Не полагаете ли вы, что такой подход искажает получаемую картину?

3. Вы так и не ответили - что это за загадочная "техническая причина", по которой вот уже больше года не происходит переиндексации поиска. Насколько я понимаю, главная функция сервиса ЯППБ, исходя из его названия - это именно поиск по блогам. Почему же он более года не работает, собственно? Кроме переиндексации отредактированных страниц имеются (годами причём имеются) также и лакуны в базе (часть постов и комментов вообще в неё не попадают). При этом прочие, не-поисковые функции вашего сервиса (например, рейтинги) вполне работают. Почему так? Вы считаете, что рейтинги нужнее поиска?

4. Есть и ещё вопросы. По вашей оценке, какую часть вашей базы составляют сплоги, бот-эккаунты, заброшенные эккаунты? (По каждой позиции свой процент, пожалуйста).

5. По каким критериям ведётся отбор эккаунтов в базу. Иначе говоря, что считается "блогом", а что нет. Надеюсь, это не секретные критерии и их можно опубликовать?

(Ответить) (Уровень выше)


[info]pe3yc@lj
2010-09-02 14:02 (ссылка)
Я правильно понимаю, что ответов на эти вопросы от вас я так и не дождусь?

(Ответить) (Уровень выше)


(Читать комментарии) -