Войти в систему

Home
    - Создать дневник
    - Написать в дневник
       - Подробный режим

LJ.Rossia.org
    - Новости сайта
    - Общие настройки
    - Sitemap
    - Оплата
    - ljr-fif

Редактировать...
    - Настройки
    - Список друзей
    - Дневник
    - Картинки
    - Пароль
    - Вид дневника

Сообщества

Настроить S2

Помощь
    - Забыли пароль?
    - FAQ
    - Тех. поддержка



Пишет mumuntu ([info]mumuntu)
@ 2008-08-07 17:24:00


Previous Entry  Add to memories!  Tell a Friend!  Next Entry
Я когда-то тоже думал, как и коллега из Google, что в программировании где-то есть задачи, не требующие применения мозга.
Сейчас я так не думаю, нет задач, не требующих применения мозга, есть разработчики, которые не применяют мозг.
С результатами их деятельности приходится сталкиваться ежедневно.
Вообще, у Яши в этот раз опять былинное обсуждение получилось. Господа спортивные программисты, вы плохо в школе учились, что ли? В норме в хорошей физматшколе к моменту выпуска звездная болезнь уже должна проходить.


(Читать комментарии) - (Добавить комментарий)


[info]alf_kadett@lj
2008-08-07 19:22 (ссылка)
Да, я заметил, что отсутствие звёздной болезни не мешает вам называть незнакомого человека дегенератом.

(Ответить) (Уровень выше) (Ветвь дискуссии)


[info]dfyz@lj
2008-08-07 19:39 (ссылка)
На всякий случай: я сужу исключительно по тому, что написано в комментариях. В ветке, на которую я ссылался, человек пишет настолько бредовые вещи, что мой эпитет вполне оправдан. Вполне допускаю, что на самом деле [info]jdevelop@lj умён и прекрасен, просто любит потроллить и пофлеймить.

(Ответить) (Уровень выше) (Ветвь дискуссии)


[info]jdevelop@lj
2008-08-08 07:12 (ссылка)
расскажите мне плз про "настолько бредовые вещи"

я конструктивной критики вероятного решения с использованием map/reduce для вытягивания сырых данных и последующей их обработки не увидел

более того, я это решение не от балды придумал, а это краткое описание, как у нас работает экспериментальная система обработки контента, причем не самого маленького (хотя по сравнению с мощностями яндекса и прочего гугля нам лучше даже не светиться)

(Ответить) (Уровень выше) (Ветвь дискуссии)


[info]jdevelop@lj
2008-08-08 07:13 (ссылка)
то есть как бы докрутить туда анализ похожести новостей на этапе reduce и не выдавать дублирующиеся данные совершенно не проблема, даже в архитектуре есть extension point )

(Ответить) (Уровень выше) (Ветвь дискуссии)


[info]jdevelop@lj
2008-08-08 07:18 (ссылка)
я кажется все понял

я рассуждаю с точки зрения человека, которому нужно все спроектировать, чтобы винтики цеплялись, гайки закручивались и все это в кучке не разваливалось, а выдавало результат, а разработкой винтиков и гаек займутся другие товарищи. вот там надо будет CS, аогоритмы и математика, в которой я точно не шарю

с точки зрения гуру топкодера разработка архитектуры - это наверное вообще лженаука какая-то.

с этой стороны я конечно полный лох и не увидел глубину глубин )

/me ушел посыпать голову пеплом

(Ответить) (Уровень выше) (Ветвь дискуссии)


[info]olexiy@lj
2008-08-08 12:51 (ссылка)
Да, правильно.

Только вы зря сравниваете "анализ похожести новостей" с винтиком. Потому что это как раз и является основной сложностью - все механизмы прикручивания винтиков уже есть, алгоритмы прекрасно мэпредьюсятся, параллелятся и вычисляются, но вот как узнать какие именно две новости похожи.

Точно так же Вы могли бы расписать простоту разработки интернет-поиска: парсим страницы, "анализируем их на похожесть запросу" и ранжируем по похожести (это, как Вы метко подметили в каком-то другом комменте - просто сортировка).

(Ответить) (Уровень выше) (Ветвь дискуссии)


[info]jdevelop@lj
2008-08-08 13:08 (ссылка)
но вот как узнать какие именно две новости похожи. у меня навскидку есть пара идей, но скорее всего они окажутся глупыми :)

(Ответить) (Уровень выше)


(Читать комментарии) -