Войти в систему

Home
    - Создать дневник
    - Написать в дневник
       - Подробный режим

LJ.Rossia.org
    - Новости сайта
    - Общие настройки
    - Sitemap
    - Оплата
    - ljr-fif

Редактировать...
    - Настройки
    - Список друзей
    - Дневник
    - Картинки
    - Пароль
    - Вид дневника

Сообщества

Настроить S2

Помощь
    - Забыли пароль?
    - FAQ
    - Тех. поддержка



Пишет ivanov_petrov ([info]ivanov_petrov)
@ 2011-11-07 20:13:00


Previous Entry  Add to memories!  Tell a Friend!  Next Entry
Образцовый поиск
Разумеется, то, что я буду говорить - банально. Интересно, насколько это банально.

Сейчас существует очень обычный и рутинной вид интеллектуальной деятельности - поиск в сети некоторой информации. Мне кажется, можно выделить три вида обращения с этой интеллектуальной операцией - сейчас будет ясно, в каком отношении выделяются эти виды.

Самый просто случай - когда вы сами нечто ищете. Вы поискали, нашли, поняли и можете сказать - я искал и вот что происходит, вот какая ситуация, вот что было.

Ситуация другого вида - когда вы кого-то посылаете поискать, чтобы он узнал. Может быть, это ученик, или аспирант, или собеседник - не важно, дело не в сценариях, когда возникает такая ситуация, она во множестве вариантов возникает. Вы кого-то отправляете в сеть искать информацию. В некотором роде вы уверены в том, что он там найдет. Или вы знаете, сами искали и нашли, или еще по какой-то причине вы обладаете безусловной уверенностью, что именно он должен там отыскать по некоторому вопросу. При этом сами вы в сеть не смотрите в этот момент - вы не ищете, но уверены в том, что он найдет, если будет искать.

Третий вид (я им и закончу, чтобы соблюсти традицию и не мучить перечислением) - когда... Будем без сценариев, ситуаций может быть очень много, я скажу всего одну, чтобы было понятно. Допустим, делается научное исследование. И человек делает замечание, ссылку: данные получены поиском в сети такого-то числа. Ставит дату, ставит поисковые слова, описывает условия поиска, адрес поисковой машины, все дела. Он документирует поиск для научной ссылки.

Теперь я и скажу ту самую банальность, о которой речь. Все эти виды поиска подразумевают, что результат поиска - нечто данное, заранее данное и известное, что это такая вещь, как кирпич, как кусок реальности - она есть, на нее можно указать пальцем. Я поискал по теме и нашел. Я послал другого искать и знаю, что он должен узнать. Я желаю точно сформулировать, как я нашел вот именно эти результаты - и я оставляю в ссылке данные поиска.

Между тем поиск - непостоянен. Если посадить рядом за компьютеры двоих людей и сказать: введите поисковое слово... в гугль, то в общем случае результат у них будет разный. С промежутком в час - совсем разный, не говоря о том, что ежели между ними несколько тысяч километров - тоже иной. Через год очень мало смысла пытаться понять, что же было найдено год назад.

Результат поиска условно-достоверен. Не по отношению к реальности, об этом и речи нет - относительно тех баз данных, которые имеются у поисковика на момент запроса. У крупного поисковика размер баз такой, что база делится на большое количество сегментов - чтобы на сервер влезала операциональным образом. Учитывая число запросов в час, сопутствующие сервисы и регулирующие поиск роботы, бяки интерфейса и прочую фигню неисчислимую, в поиске всегда что-то не работает. Говоря грубо и для простоты - для каждого запроса какая-то база не работает на момент запроса. К тому же выдача поисковика связана с другими поисковыми средствами, работающими автономно от большого поиска - какая-нибудь выдача поиска по новостям или по блогам может влиять на выдачу основного результата, а там свои косяки и висяки. И работа поисковика в том, чтобы выдать результат не слишком скособоченный относительно генеральной совокупности в базе, то есть устроить системно и организованную деградацию результатов, а не случайную, хаотическую и "крутую" на определенных участках выдачи. Тем самым, войдя в один и тот же поиск с промежутком в секунду и вводя один и тот же запрос, пользователь получает отличающиеся результаты. Там масса факторов, влияющих на это дело, но важно сознавать, насколько непостоянным является то, к чему отсылают как к чему-то устойчивому. Это такой рукотворный вероятностный мир информации, и он, вообще говоря, требует иного отношения, чем привычные со времен аристотелевой логики познавательные средства. Как, скажем, собеседник, который отвечает на вопрос по вероятностной функции - то да, то нет, и таких собеседников - миллиарды, их ответы суммируются.


(Добавить комментарий)


[info]diing@lj
2011-11-07 13:29 (ссылка)
собственно ситуации - только две
1. найти материал подтверждающий некое "представление", возможно с поправками-нюансами
2. найти материал, аргументы для словжения "представления" (модели, теории)

по 1-му - удачность поиска зависит от формулировки сотрудники требуемого,
причем принципиально неважно "сотрудник" - это человек или программный автомат
(все задачи, которые возможно сформулировать другому человеку возможно переложить в программную систему)
здесь неважно весь ли материал имеющийся в природе получен - все одно будет использоваться часть..

по 2му - задача перепоручения невыполнима - ну разве только в качестве первоначальной выемки руды, из которой вы будете добывать радий

(Ответить) (Ветвь дискуссии)


[info]elvit@lj
2011-11-07 13:40 (ссылка)
> по 1-му - удачность поиска зависит от формулировки сотрудники требуемого,

А сейчас сюда еще вмешиваются и формулировки других людей! )) Сколько запросов было изменено при виде быстрой подсказки Гугля! ))

(Ответить) (Уровень выше)

Не так всё.
[info]eldhenn@lj
2011-11-07 13:39 (ссылка)
Поисковые системы не отдают ответ на вопрос. Они отдают набор вариантов ответа. С помощью различных механизмов вроде уточнения вопроса или интуитивного анализа частичной информации о варианте, число вариантов сокращается до некоторого небольшого количества. А это небольшое количество уже проходит верификацию - а то ли это, что мы хотели найти, достоверная ли это информация, насколько мы можем её использовать.
Неявно предполагается, что информация в сети дублируется множество раз разными способами, умышленно и нет, и это дублирование достаточно для того, чтобы нужная информация обязательно попалась в выборке по правильному вопросу.

(Ответить) (Ветвь дискуссии)

Re: Не так всё.
[info]elvit@lj
2011-11-07 13:41 (ссылка)
Попадется-то она попадется... Самая большая проблема - отранжировать нужное. Чтобы самое релевантное было вверху.

(Ответить) (Уровень выше) (Ветвь дискуссии)

Re: Не так всё.
[info]eldhenn@lj
2011-11-07 13:49 (ссылка)
Самая большая проблема - договориться с гуглом, что вы считаете релевантным одно и то же.

(Ответить) (Уровень выше) (Ветвь дискуссии)

Re: Не так всё.
[info]elvit@lj
2011-11-07 13:59 (ссылка)
Смотря с какой стороны смотреть. :) Разнообразие выдачи Гугла меня как раз радует - есть большие сложности с формулировками (однажды искала название сборника "Норильские рассказы" Снегова по запросу "Снегов рассказы зона" - нашла!), претензия к поисковику касается не отбора, а настроек: во-первых, эта самоуверенная зараза считает, что раз у меня ай-пи русский, значит, и информация мне нужна только из РуНета, во-вторых, результат по дате нельзя сортировать.

(Ответить) (Уровень выше) (Ветвь дискуссии)

Re: Не так всё.
[info]eldhenn@lj
2011-11-07 14:02 (ссылка)
Я думал я один неосилятор. Мне нередко хочется найти "что-то там в таком-то диапазоне дат".

(Ответить) (Уровень выше) (Ветвь дискуссии)

Re: Не так всё.
[info]ext_604978@lj
2011-11-07 16:29 (ссылка)
http://ivanov-petrov.livejournal.com/1755578.html?thread=88503994#t88503994
...
http://ivanov-petrov.livejournal.com/1755578.html?thread=88507066#t88507066
:)

(Ответить) (Уровень выше)

Re: Не так всё.
[info]rednyrg721@lj
2011-11-07 14:20 (ссылка)
1) Есть такая хитрость: чтобы отказаться от перенаправления на google.ru надо один раз зайти на www.google.com/ncr (No Country Redirect)
2) На google.com какое-никакое управление датами есть - слева More search tools и там выбрать Any time / Past hour / Past 24 hours / Past week / Past month / Past year / Custom range..., не знаю насчёт google.ru.

(Ответить) (Уровень выше) (Ветвь дискуссии)

Re: Не так всё.
[info]ext_604978@lj
2011-11-07 14:39 (ссылка)
1) гораздо проще "напрямую" вводить: у меня, например, отдельные ярлыки в избранном для google.ru и google.it - очень во многих случаях удобно (например, даже и отсутствием лишней контекстной рекламы при вводе запроса на языке, не совпадающем с "профильным языком" странички:)

2) Да, это есть и в .ru, и в других тоже - но, во-первых, это - "время обновления", а не "время создания". Во-вторых, больно грубые диапазоны, отсчитываемые от "сейчас" и исключающие конкретный запрос: "между такими-то датами"...
Правда, в случаях, например, поиска на новостных сайтах - иногда помогает введение самих дат в запрос, но много возни и "мусора" (из-за сложносоставности современных сайтов/"страниц": дата может относиться к совершенно другому разделу на них...).

(Ответить) (Уровень выше) (Ветвь дискуссии)

Re: Не так всё.
[info]rednyrg721@lj
2011-11-07 15:07 (ссылка)
1) Хмм, видимо, только с google.com автоматически перенаправляет на локализованную версию (которую определяет по IP-адресу).

2) Ну да, время там не всегда правильное, но custom range (from, to) вроде бы есть, самое интересное, что раньше я его как-то не замечал, может быть, недавно добавили.

А по новостным сайтам лучше, наверное, со страницы Google News искать, там поиск более подходящий (диапазон дат присутствует).

(Ответить) (Уровень выше)

Re: Не так всё.
[info]ext_604978@lj
2011-11-07 15:05 (ссылка)
2) Да - не сразу обратил внимание в Вашем ответе, а сейчас проверил для разных национальных и для google.com или google.com/ncr
Нигде не вижу "More search tools", но вижу и пользуюсь "Advanced Search" - так вот там нет ни "Past hour", ни "Custom range" (остальные варианты временного диапазона совпадают с Вашими).

Не первый раз у кого-то "разные Гуглы";), может - это зависит от регистрации аккаунта? (у меня его нет) Или ещё от каких неявных настроек?

(Ответить) (Уровень выше) (Ветвь дискуссии)

Re: Не так всё.
[info]rednyrg721@lj
2011-11-07 15:12 (ссылка)
Да, у меня гугл-аккаунт есть, наверное, в этом причина. Настройки тоже есть постоянные, которые сохраняются, не знаю, есть ли они у тех, у кого аккаунта нет :)

Interface Language
Search Language
SafeSearch Filtering
Google Instant
Number of Results
Results Window
Secure Connection
Blocked Sites

(Ответить) (Уровень выше) (Ветвь дискуссии)

Re: Не так всё.
[info]ext_604978@lj
2011-11-07 15:24 (ссылка)
Настройки - да, сохраняются и без аккаунта (в cookie-файле в кэше браузера, пока такой файл или все куки не удалишь) - причём совершенно отдельные настройки для разных локализованных версий (.ru или .it и т.п.) или для .com (что удобно, к тому же и в разных браузерах, очевидно, можно настроить по-разному). Я смотрю в гугль-хроме, поэтому "непорядка от браузера" вроде бы заподозрить нельзя:)...

А вот чтобы с аккаунтом - было больше возможностей/настроек поиска, про то вроде бы нигде (например, на справочных страничках того же Гугла) даже и не говорится... Что странно.

(Ответить) (Уровень выше) (Ветвь дискуссии)

Re: Не так всё.
[info]elvit@lj
2011-11-07 15:37 (ссылка)
Они ведь еще иногда для авторизованный юзеров включают экспериментальные настройки. Но не для всех и не всегда. Так что...

(Ответить) (Уровень выше)

Re: Не так всё.
[info]ext_604978@lj
2011-11-07 15:30 (ссылка)
Впрочем, вот и ещё "соврал":
кроме одной, все перечисленные Вами настройки есть,
но вот "Secure Connection" - нет! :)

(Впрочем, это-то как раз для аккаунта или без - нормально, а вот ограничение настроек поиска, к тому же "неафишируемое" - по-прежнему кажется странным, и может - всё-таки не в аккаунте дело?..)

(Ответить) (Уровень выше) (Ветвь дискуссии)

Re: Не так всё.
[info]rednyrg721@lj
2011-11-07 15:34 (ссылка)
Попробовал в режиме инкогнито (без аккаунта и кукис) — "More search tools"/"Показать настройки" присутствует и в google.com и в google.ru, так что дело не в аккаунте, действительно, может быть, Вы не там смотрите? Слева колонка с опциями, вот в ней в самом низу, для google.ru вот так:

Все результаты
Картинки
Карты
Видео
Новости
Ещё

город Екатеринбург
Изменить место

Параметры поиска
Весь Интернет
Только на русском
Перевод результатов

>>Показать настройки<<

(Ответить) (Уровень выше) (Ветвь дискуссии)

:)
[info]ext_604978@lj
2011-11-07 16:18 (ссылка)
И действительно! - "теперь есть", причём на странице выдачи результатов, а не на странице первоначального запроса (оно-то пустое, только окно ввода и меню наверху...). А я-то сразу переходил на "расширенный поиск" (из меню "кнопки-шестерёнки настроек" справа вверху) и потом для всех уточнений возвращался к той же "расширенной" странице (чтобы не сбросить её настроек) - а она, как выходит, не "расширенная", а "зауженная" по этому-то параметру:)).

И - действительно, наверное, интерфейс изменился не так давно, но я и продолжать мог "не замечать" по стереотипным привычкам, ага!:) Полезная штука - "разговоры об очевидном":)...

(Ответить) (Уровень выше) (Ветвь дискуссии)

Re: :)
[info]rednyrg721@lj
2011-11-07 16:29 (ссылка)
А, вот оно что, я забыл сказать, что надо на страницу выдачи результатов смотреть :) Да, они довольно много его меняли, нынешний вид вроде бы после запуска Google+ установился, но опции, по-моему, и раньше были уже.

(Ответить) (Уровень выше)

Re: Не так всё.
[info]eldhenn@lj
2011-11-08 01:10 (ссылка)
>Custom range

Не видел до сих пор...

(Ответить) (Уровень выше)

Re: Не так всё.
[info]den_king@lj
2011-11-12 14:54 (ссылка)
С одной стороны, правда, верный ответ быстрее найдёт тот, кто уже знает половину ответа.

С другой стороны, в поисковиках имеем дело прежде всего с рейтингом популярности.

То есть, к примеру,
если при слове "АВАТАР" десять лет назад всплывали сайты по индийской религии и философии,
на худой конец что-то эзотерическое или растаманское, то
уже пять лет назад лидировали сайты и обзоры посвященные мультсериалу про Повелителя Стихий,
ну а последние пару лет разумеется в первой полусотне ссылок будет планета Пандора и её синекожие аборигены.

Наконец, имеет значение и виртуальная геополитика.
Давно не секрет что самыйм надёжным из имеющихся поисковиков по бывшему Союзу идёт Яндекс. Хотя на него и хватает нареканий. но Гугл по России и Украине может давать выборку дажеко неточную.
Зато для прочего мира Гугл на первом месте. его ещё не скоро обскачут.

(Ответить) (Уровень выше) (Ветвь дискуссии)

Re: Не так всё.
[info]eldhenn@lj
2011-11-13 13:27 (ссылка)
Ну всё правильно. Если вы хотите узнать, что такое аватар, гугл совершенно верно даст ссылки на фильм. А если вы скажете, что блин, не то, не тот контекст - вы так и скажите гуглу, "аватар в таком-то контексте".

Полезность яндекса, IMHO, давно преувеличена. Я лично давно его не использую как поисковик общего плана, только яндекс-маркет, карты и метро.

(Ответить) (Уровень выше)


[info]rezoner@lj
2011-11-07 14:00 (ссылка)
По-моему, тут полезно разделить два типа поиска. Может, это еще банальнее, но упомянуть-то надо.

Первый - когда ищут ссылки на постоянно существующие источники. Скажем, на статьи; на конкретные статистические таблицы; на результаты конкретного опроса - можно продолжить.

Расхождение между результатами двух поисков теоретически должно быть нулевым. Или не больше того, которое бывает, когда двое спорщиков оперируют цитатами из литературы.

Второй вариант - когда результатом поиска является утверждение типа "90% всех статей подтверждают то-то", или "интерес к событию Х вырос в 10 раз за прошлый год". Тут результатом поиска, собственно, является некоторый параметр состояния информационной сферы. И тут Ваши замечания более чем приложимы.

(Ответить) (Ветвь дискуссии)


[info]nikolenko@lj
2011-11-07 14:15 (ссылка)
Про второй вариант рекомендую google trends (http://www.google.com/trends).

(Ответить) (Уровень выше)


[info]ivanov_petrov@lj
2011-11-07 14:21 (ссылка)
Я сомневаюсь и про первый вариант. Допустим, я интересуюсь - кто автор романа Набокова Лолита. Часть сайтов пишет, что Гоголь, а часть - что Бунин. Не считая небольшого остатка маргиналов, которые ругаются в паре Толстой-Достоевский, и унылого идиота, который где-то на заштатном форуме шепчет, что - таки Набоков. В зависимости от локальной кривизны выборки я могу получить в ответ то ли Гоголя, то ли Бунина.

Это, конечно, не про ссылку на постоянно действующий источник.

(Ответить) (Уровень выше) (Ветвь дискуссии)


[info]rezoner@lj
2011-11-07 14:28 (ссылка)
Мне представляется, что сетевой поиск без выхода на твердый источник приложим к определенному кругу проблем. И всерьез, в научных целях, искать ответ на то, кто написал "Лолиту", в сети - дело обычное, но методологически неверное.

(Ответить) (Уровень выше)


[info]jak40@lj
2011-11-07 14:15 (ссылка)
Ситуация "привязки к зыбкому", по-моему, более типична, чем поиск в сети.
Можно искать некоторый товар, вполне материальный, заданный набором интересующих потребителя свойств:
- либо я иду по магазинам и нахожу нечто подходящее,
- либо я посылаю кого-то, уверенный, что поставил выполнимую задачу,
- либо я... документирую, что такие-то и такие-то продукты были взяты там-то и там-то...

А еще можно купить дорогой прибор на 220 вольт (интереснее - на 127). В подарок, ведь 220 вольт моему виртуальному другу (про напряжение в сети мы не переписывались) точно кто-то в квартиру в следующем месяце и позже подавать будет...

Впрочем, возможно, я неправильно понял, о чем Вы.

(Ответить) (Ветвь дискуссии)


[info]ivanov_petrov@lj
2011-11-08 01:29 (ссылка)
Мне казалось, что такие ситуации регулярнее возникают с поиском. Хотя, конечно, не только с ним.

(Ответить) (Уровень выше)

Если не...
[info]michaellogin@lj
2011-11-07 15:29 (ссылка)
www.wolframalpha.com - интересный инструмент.

(Ответить) (Ветвь дискуссии)

Re: Если не...
[info]ivanov_petrov@lj
2011-11-07 15:37 (ссылка)
спасибо!

(Ответить) (Уровень выше)

принцип Гераклита-Иванова-Петрова :)
[info]falcao@lj
2011-11-07 15:36 (ссылка)
В один и тот же Гугль нельзя зайти дважды! :)

(Ответить) (Ветвь дискуссии)

Re: принцип Гераклита-Иванова-Петрова :)
[info]ivanov_petrov@lj
2011-11-08 01:30 (ссылка)
Гераклит просто не любил купаться.

(Ответить) (Уровень выше) (Ветвь дискуссии)

один и два
[info]falcao@lj
2011-11-08 10:20 (ссылка)
Если бы он совсем не любил, то сказал бы, что даже один раз в реку заходить не стОит! :)

(Ответить) (Уровень выше)


[info]gouriev@lj
2011-11-07 15:42 (ссылка)
Вчера, в 18-45, в Ежовой долине, выследил бизона
при помощи собаки Рыжика модель NZ212/70 и убил
его при помощи топора каменного модель HH130-22.
Вот он бизон-то!
А топор-то затупился. Да и собаку забрал другой
охотник. Я, правда, место хорошо запомнил, но
кто поручиться, что сегодня там снова будет бизон?

Поисковая система - это инструмент, а не корпус фактов.
Не зря ж "документатор" приводил тип системы и дату
проведения поиска. Знать, догадывался, что результаты
невоспроизводимы. Но ведь нам нужен бизон, а не
Ежовая долина, собака или каменный топор.
Вот он, бизон-то!

(Ответить) (Ветвь дискуссии)


[info]ivanov_petrov@lj
2011-11-08 01:31 (ссылка)
да, конечно. Но, как Вы знаете, инструмент отделим от факта только в тривиальном случае, далеко не всегда

(Ответить) (Уровень выше) (Ветвь дискуссии)


[info]gouriev@lj
2011-11-09 18:39 (ссылка)
поиск в сети разве не относится к тривиальным случаям?

интересно, в каком исследовании поиск в Интернет
информации о фактах неотделим от фактов?

(Ответить) (Уровень выше)


[info]aknost@lj
2011-11-07 16:23 (ссылка)
ага, вот она - вероятностная реальность :)
Ну, а если интересна фантастика: рекомендую "Море вероятностей" Ольги Онойко (asuri)

(Ответить) (Ветвь дискуссии)


[info]aknost@lj
2011-11-07 16:28 (ссылка)
ой, пардон, "Море имен" (http://www.jeltis.narod.ru/texts_my.htm) - про ассоциативный поиск реальности, в т.ч. с помощью поисковых серверов
("Море вероятностей" - это совсем другое).

(Ответить) (Уровень выше) (Ветвь дискуссии)


[info]ivanov_petrov@lj
2011-11-08 01:31 (ссылка)
спасибо, почитаю

(Ответить) (Уровень выше) (Ветвь дискуссии)


[info]petsen@lj
2011-11-08 07:30 (ссылка)
Оля таки знает, про что пишет:) (хотя ровно эту книгу я не читала)

Спасибо Вам за этот пост.

(Ответить) (Уровень выше)


[info]alex_and_r@lj
2011-11-07 16:49 (ссылка)
следует еще добавить, что не только фактор времени влияет на выдачу, но и человеческий фактор, а точнее социальный (от "социальные сети")
поиск сейас становитсявсе более и более персонализированным на основании данных сообщаемых человеком машине через механизмы соцсетей
собственно см. книгу и тему filter bubble - веб уже не одинаков для всех, у каждого он свой

(Ответить) (Ветвь дискуссии)


[info]ivanov_petrov@lj
2011-11-08 01:34 (ссылка)
да, понятно

(Ответить) (Уровень выше)

А у меня
[info]b_graf@lj
2011-11-07 17:29 (ссылка)
всегда примерно одни резльтаты выходят в разное время, если речь о чем-то фундаментальном (но постоянно забываемом :-)). Просто следует использовать заведомо достоверные источники, сами по себе результаты поисковиков мало что значат, какая разница, что там выдалось. Надо добиваться значимых результатов уточнением, а лучше - по ссылкам из правильных источников, т.е. вопрос встает не о данных, а об источниках. Ищем правильную "энциклопедию юных сурков" по искомому предмету - и все...

Если совсем никак результаты не сводятся (предмет малознакомый - воблеры в подарок другу-рыболову при том, что сам ни в зуб ногой в рыбалке), надо спросить у живых людей на профильном форуме, либо достаточно прочитать там обсуждение (там полезные участники быстро находятся путем наблюдения). Для рунета с форумами обычно никаких проблем не бывает, т.к. на каждую предметную область в лучшем случае пяток значимых форумов: например, по электронике и бытовой технике хорошо пользоваться форумом ixbt.com, а по стиральным машинам - на qol.ru (но давно не смотрел, может испортился), по компьютерам - еще и overclockers.ru. С заграницей обычно сложнее, но и тут часто активисты рунетовских форумов все уже отранжировала среди них за нас :-) (т.е. в темах есть ссылки на правильные зарубежные источники).

Проблема со случайными результатами ИМХО бывает острой обычно, когда речь идет о новостях или каких-то незавершенных, текущих событиях и явлениях, т.е. когда данные сами по себе противоречивы, т.к. их ни у кого в готовом виде нет, либо они придерживаются из корыстных интересов. Т.е. два вида данных выходит, которые ищут, где проблема с поисковиками есть только у вторых: наукообразные и криминального характера :-) (такое обозначение, т.к. поиск по ним схож с поимкой кого-то за руку, либо наоборот - вторжения в скрываемую область). Ну, с первыми-то: "коммунизм - норма науки" (Р.Мертон), а какие проблемы могут быть при коммунизме :-)

(Ответить)


[info]avrukinesku@lj
2011-11-07 17:56 (ссылка)
Делать скриншот страницы и заверять у нотариуса.

(Ответить) (Ветвь дискуссии)


[info]ivanov_petrov@lj
2011-11-08 01:35 (ссылка)
электронной, конечно же, подписью. С вероятностной функцией подтверждения: согласно некой формуле часть подписей нотариуса оказывается недействительной. Клиент должен выбрать контору нотариуса с устраивающей его кривизной распределения действительности подписи. А также врача, который с некой вероятностью будет лечить и работодателя, который, сверившись со своей собственной шкалой, может быть, оплатит выполненную работу.

(Ответить) (Уровень выше) (Ветвь дискуссии)


[info]avrukinesku@lj
2011-11-08 01:42 (ссылка)
Тогда для верности заверить уже заверенную подпись у нотариуса с другой кривизной распределения. Десять-двадцать нотариусов с самой разной кривизной - эта штука будет посильнее индекса цитируемости.

(Ответить) (Уровень выше) (Ветвь дискуссии)


[info]misha_makferson@lj
2011-11-08 03:47 (ссылка)
Если ориентироваться на инфраструктуру сертификатов подлинности должен быть Корневой Нотариус которому все верят. :-)

(Ответить) (Уровень выше) (Ветвь дискуссии)


[info]avrukinesku@lj
2011-11-08 03:50 (ссылка)
Проблема в том, что каждый нотариус убежден, что корневой - именно он.

(Ответить) (Уровень выше)


[info]oleg96345@lj
2011-11-07 18:43 (ссылка)
"Результат поиска" очень неоднозначное словосочетание. Это можно понять как:
- результат работы секретного алгоритма поисковика
- результат работы человека (имеющего некий уровень навыка) с использованием поисковиков
- поиск конкретного ответа на кокретный вопрос с возможностью оценить репутацию истоника
- или наоборот, случайный серфинг по какой-то теме с целью найти логово знающих людей
- ...

(Ответить) (Ветвь дискуссии)


[info]ivanov_petrov@lj
2011-11-08 01:36 (ссылка)
да, в общем, все сочетания слов неоднозначны

(Ответить) (Уровень выше)


[info]dm_kalashnikov@lj
2011-11-08 01:23 (ссылка)
Тут ещё такой момент как персонифицированный поиск. Т.е. тот же гугл выдаёт результаты которые будут интересны именно Вам, с Вашей историей поиска. У другого человека, они будут несколько иными, поскольку у него поисковая история иная.

Да, кластеры могут быть недоступны в любой момент времени, но данные доступны всегда, поскольку в GFS заранее определена избыточность данных на разных дата-центрах. Да и кэши никто не отменял.
Так что Ваш аргумент невалиден, на мой скромный взгляд.

(Ответить) (Ветвь дискуссии)


[info]ivanov_petrov@lj
2011-11-08 01:37 (ссылка)
Вы предполагаете, что всё везде работает согласно идеалу. А оно работает как работает, а не по идеалу. Но, впрочем, что тут говорить.

(Ответить) (Уровень выше)


[info]antoshkin@lj
2011-11-08 01:53 (ссылка)
Да, это - как река. Нельзя войти в один и тот же поиск дважды :)

(Ответить) (Ветвь дискуссии)


[info]ivanov_petrov@lj
2011-11-08 02:10 (ссылка)
эт точно

(Ответить) (Уровень выше)


[info]pashkin_elfe@lj
2011-11-08 02:34 (ссылка)
В качестве источника научных данных в интернете есть что-то временное, несерьезное. Если ты ссылаешься на книгу или статью, она, даже если устареет, но не исчезнет из журнала. А в интернете... лабораторию закрыли, не заплатили за хостинг и все результаты просто исчезли (может быть они остались только на личных компьютерах сотрудников, а никто не вечен).

К примеру, если бы Дарвин опубликовал свои наблюдения на сайте, то нет никакой гарантии, что оригинальный текст можно было бы сегодня прочитать. Скорее всего общая идея и полемика по каким-то вопросам сохранилась бы, но чтение этого заставляло бы строить ход мыслей ученого по сохранившимся кускам. Такое "кусочное" понимание теории эволюции явно отличается от понимания тех, кто читал "Происхождение видов..."

В книге Маркова, к примеру, очень много ссылок на web-источники. Понятно, что сама книга переживет время существования многих из них. Кому-то придется читать с "битыми ссылками". Аналогом такого цитирования может быть монография где в списке литературы 70% "Частное сообщение такого-то".

(Ответить) (Ветвь дискуссии)

Надо пользоваться
[info]b_graf@lj
2011-11-08 13:13 (ссылка)
в этом случае webarchive.org (даже в Вики бывают ссылки на него, когда исходный сайт недоступен). Правда, он не все сохраняет, почему-то пропусков много - кэши поисковиков бывают более полными, но они вроде хранят данные сравнительно недолго.

(Ответить) (Уровень выше) (Ветвь дискуссии)

Re: Надо пользоваться
[info]fregimus@lj
2011-11-12 03:54 (ссылка)
web.archive.org, ежели не вру, с точкой.

(Ответить) (Уровень выше)


[info]till_j@lj
2011-11-08 03:09 (ссылка)
Кроме всего прочего (как-то у Вас этот разговор уже был), я бы выделил необходимость маркировки любого источника индексом достоверности. В научном сообществе (как я понимаю) зона достоверности выделена списком изданий, относительно которых учёные согласились, что издания заслуживают доверия. Это конечно не гарантия, помню, читал рассказ, главный герой которого воевал с Наполеоном и Александром Македонским, будучи наборщиком в типографии, которая выпускала энциклопедию.

(Ответить) (Ветвь дискуссии)


[info]elvit@lj
2011-11-08 04:05 (ссылка)
Один из факторов ранжирования в поисковых системах - авторитетность сайта. Да, они далеко не всегда справляются с задачей, но стараются... как могут.

(Ответить) (Уровень выше)


[info]misha_makferson@lj
2011-11-08 03:41 (ссылка)
"Нельзя два раза войти в один и тот же Гугль"

(Ответить) (Ветвь дискуссии)


[info]ext_604978@lj
2011-11-08 03:44 (ссылка)
В него с этой фразой Вы тут вошли уже третьим ;) ...

(Ответить) (Уровень выше) (Ветвь дискуссии)


[info]misha_makferson@lj
2011-11-08 03:49 (ссылка)
"Я в армии служил и сисадмином работаю. Мне можно." :-)

(Ответить) (Уровень выше)


[info]misha_makferson@lj
2011-11-08 03:58 (ссылка)
Помнится давно в 90-е читал в компьютерном журнале интервью кого-то из отцов-основателей повсеместно протянутой паутины. Деталей я не помню, но человек с горечью говорил, что когда всё задумывалось в планах было универсальный идентификатор ресурса (URI) независимый от так сказать "физического" расположения документа, т. е. как бы уникальная в пределах Web метка документа. URL воспринималось как временное решение, дескать сейчас быстренько слабаем, а потом по уму допилим. Впрочем может я и путаю чего-то.

(Ответить) (Ветвь дискуссии)


[info]ivanov_petrov@lj
2011-11-08 04:35 (ссылка)
http://ivanov-petrov.livejournal.com/1318658.html

это, как я понимаю, восходит к мысли В. Буша

(Ответить) (Уровень выше)


[info]109@lj
2011-11-08 05:38 (ссылка)
отсыпьте мне тоже такой травы!

(Ответить)

Да, да, он живой,
[info]ext_698587@lj
2011-11-08 08:07 (ссылка)
Ну ИИ из Сети, понятно, да Вы ж писали. Умному ответит по-умному, дураку - по-дурацки, а если на серверах профилактика, так вообще пошлет.

(Ответить)


[info]sigizmundabol@lj
2011-11-08 08:52 (ссылка)
Думаю, всю дорогу человек стремился внести некий порядок в сетевой хаос. Сначала цвели каталоги, потом пришла очередь структурированного пользовательского контента - википедия, ответы и прочий веб 2.0, где одни пользователи не давали разойтись бурной фантазии других. Т.е. проблема эфемерности и нерелевантности поисковой выдачи осознавалась (может не то слово) еще давно. Поисковики так и не внесли пока порядка и гугловский +1 выглядит довольно жалкой попыткой в этом направлении. Статистические методы имеют свои ограничения. Можно некоторое время полагаться на внешние признаки и их совпадения, но не понимая сути (например, сути фразы - поискового запроса) сложно двигаться дальше. Strong AI давно уже нужен гигантам, но то ли они сами этого не знают, то ли им пока и так комфортно...

(Ответить) (Ветвь дискуссии)


[info]ivanov_petrov@lj
2011-11-08 08:58 (ссылка)
да, я почти ничего не знаю о напрашивающихся вещах - автономных поисковых ботах. Что-то такое давно видел, но очень примитивное, и уже почти не помню.

(Ответить) (Уровень выше) (Ветвь дискуссии)


[info]sigizmundabol@lj
2011-11-08 09:14 (ссылка)
Ну они и есть примитивные "шахтеры", а разбираться в добытых образцах будут "на верху". Я-то о том, что на этом верху нет никого, пустота... Вот если бы там был кто-то, кто в состоянии не только найти ключевые последовательности символов (слова) сайта и сравнить их со словами поискового запроса, но и понять смысл статьи на сайте и сравнить его со смыслом запроса, то поисковик мог бы упорядочить веб к запросу по релевантности.

(Ответить) (Уровень выше)


[info]stirlitz2008@lj
2012-01-10 08:23 (ссылка)
Пузырь фильтров.

Хочу отметить, что при простом использовании общий поисковых систем, два человека на разных компьютера, на которых они проработали некоторое время, никогда не получат одинаковых результатов поиска. Всё из-за проклятой кастомизации.
Если Вам это интересно, здесь (http://habrahabr.ru/blogs/social_networks/132191/) хорошая статья на эту тему.

(Ответить) (Ветвь дискуссии)


[info]ivanov_petrov@lj
2012-01-11 01:32 (ссылка)
спасибо, в самом деле хорошая

(Ответить) (Уровень выше)