serge_gorshkov


Сергей Горшков - о бизнесе в сфере ИТ

о семантической интеграции, программировании, управлении...


Previous Entry Share Next Entry
Яндекс: интеллект без ума
serge_gorshkov
Почему поисковики не хотят делать по-настоящему интеллектуальный поиск - то есть семантический, а не основанный на частотном анализе слов - я еще могу понять. Сложно, плюс подрывает рынок рекламы, и т.п.

Но почему нельзя сделать хотя бы в какой-то степени приличный семантический анализ вне поисковой выдачи - я не понимаю.

У Яндекса есть несколько фич с претензией на интеллект. Одна из них - анализ содержимого писем и их заголовков, чтобы предложить нам что-то полезное. Например, увидев в письме слово "договор", почта Яндекса спросит: "Часто отправляете договоры? - создайте шаблон". Это еще куда ни шло, хотя раздражает (после 10-го ответа "нет" можно было бы понять, что мне шаблоны действительно совсем не нужны).
Но вот когда они определяют в письме события - начинается полный ад. Достаточно написать, например: "у меня завтра утром встреча", или "приеду в Екатеринбург завтра" - Яндекс радостно рапортует, что в письме найдено событие "встреча" или "приезд", только почему-то назначенное на 9 утра. С чего "завтра" - это 9 утра, а не 12 или 18? Зачем вообще мне ставить напоминание об этом событии? Смысл фичи - нулевой, плюс она здорово раздражает своим квазиинтеллектом и неочевидностью поведения. Получаются, например, такие казусы (пример возник ненарочно, через два месяца после написания этого поста):

yandex

Другая фича - это агрегация новостей. С этой задачей Яндекс тоже справился хуже некуда. Имеем, например, сюжет новостей: "Обломки могли затонуть. Поиски "Боинга" не принесли результата". По факту этому сюжету соответствует только первая попавшая в него новость, а дальше валится все подряд, что хоть как-то касается боинга: и что сказал по этому поводу Обама, и отправленный на поиски китайский ледокол, и куча новостей из предыдущего сюжета о том, что нечто похожее на обломки обнаружили у берегов Австралии (последние новости прямо противоречат заголовку сюжета). Это еще не самый страшный пример, попадались куда более красочные. Например, когда в связи с высказыванием какого-нибудь политика в сюжет включаются вообще все новости, где имя этого политика упомянуто, в том числе никак не связанные с темой сюжета.


Почему так происходит? Понятно, почему - частотный анализ текста как метод имеет очевидные пределы качества результатов, и эти пределы уже достигнуты. Видимо, какая-то колоссальная умственная инерция мешает разработчикам подумать о том, что надо использовать совсем другие технологии для того, чтобы получить прорыв в качестве результатов. Тот же Яндекс слышал о семантике, но использует ее крайне примитивно - для анализа микроразметки в страницах, в очень узких предметных областях, и с совсем туманной прагматикой. Это все равно, что использовать телескоп только для того, чтобы смотреть, велика ли очередь за пивом в магазине напротив.

  • 1
Предполагаю, что они просто не видят смысла вкладываться в серьезную разработку, когда базовых возможностей хватает для зарабатывания денег.

Может быть, но ведь это недальновидно. Любой лидер рынка, почивающий на лаврах и уверенный в своей позиции, рано или поздно оказывается свергнут теми, кто уничтожит его преимущества на корню.
А уж в положении Яндекса, который постоянно занят конкуренцией с Гуглом, совсем странно пренебрегать возможностями получить серьезные преимущества.

Балом правит прибыль, пока направление не приносит прибыли оно не развивается. А прибыль оценивает кто? - экономисты, - а они особо в тех. моменты не вникают.

На данный момент никто не зарабатывает на глубоком Intelligence, есть компании, которые закладывают фундамент, google например скупает многие компании занимающиеся искусственным разумом, но нет тренда и фактической потребности.

Есть теория, что продукт создается когда он нужен потребителю, видимо сейчас до него еще нет интереса.

Про гугл и их скупку всего подряд - тема интересная, дающая почву для разных предположений, например, насчет планов по завоеванию мира :)
Эти предположения слишком правдоподобны, чтобы считать их просто шутками.

Насчет потребителя и потребности - это с одной стороны так, а с другой - появление новой технологии часто само по себе создает потребность, или по крайней мере предлагает такие способы удовлетворения старых потребностей, о которых никто не мечтал. Потребность получать качественные результаты поиска, действительно полезные советы и помощь от электронных устройств и программ - несомненно существует. На каком-то уровне эта потребность удовлетворяется, поэтому у потребителя нет стимула активно требовать от поставщиков качественного улучшения услуг.

В случае с Яндексом не понятно вот что: они, вроде, с одной стороны пытаются сделать что-то новое и полезное, но с другой - делают это с таким низким качеством, что смысла в новшестве не оказывается никакого.

Ладно, используя сравнение из жизни: Яндекс страшненькая подружка Google :)

  • 1
?

Log in

No account? Create an account