Google запатентовал технологию «продолжения поиска» для ИИ-ассистентов и чатботов. Что это значит для пользователей?

17:46
20 Августа 2024
Oksana_Nedvigina
212

В крупнейшем издании об интернет-маркетинге Search Engine Journal разобрали новый патент Google, посвящённый технологиям отображения и ранжирования поисковых результатов.

Ранжирование документов в результатах поиска для Google — занятие длиною в жизнь, но это свежий патент, полученный в июне 2024 года .

Патент под названием Contextual Estimation Of Link Information Gain описывает технологию предсказания того, какие сведения заинтересуют пользователя после того, как он уже получил определённую информацию.

Суть изобретения

Вводится параметр Information Gain score («балл прироста информации») для ранжирования «второй порции» веб-страниц, релевантных на основе предсказания следующего запроса. В том числе запроса, относящегося к связанной с предыдущим запросом теме, но уже немного другой.

Ключевая задача Information Gain score — подсчитать, сколько на данной странице есть информации, которая относится к теме, но не была представлена на уже показанных пользователю страницах. Цель — понять дополнительную ценность, которую новая веб-страница добавляет к уже показанным страницам.

Пользователи активно задают запросы на естественном языке, и поисковой системе всё более важно понимать их тематику и отвечать в рамках тематики и тесно связанных с ней подтематик. А не ориентироваться на ключевые слова и пытаться показать всё, что может к ним относиться.

Применение запатентованной технологии рассматривается в основном в контексте ИИ-ассистентов и чатботов. Поэтому, считают в Search Engine Journal, документ может пролить свет и на то, как работает и как будет работать недавно внедрённый Google в поиск продукт AI Overviews.

AI Overviews — генерируемые ИИ (Gemini) краткие сводки на основе ключевой информации из топовых результатов поиска с подборкой лучших ссылок. Запускались под лозунгом «Google will do the googling for you».

Гугл будет гуглить за тебя.

Запуск AI Overviews оказался скандальным. Во-первых, продукт на основе ИИ, как водится, работал несовершенно и выдавал ошибки. Во-вторых, он, как и многие запуски до него, пригрозил расшатать сложную экосистему, которую составляют поиск Google, остальной Google, те, кто делают контент, по которому ищет Google, пользователи, рекламодатели, ~~ЦРУ, Моссад и КГБ~~.

SEOшники опять не так всё поняли

Среди участников экосистемы наиболее активно заинтересовались новым продуктом специалисты по поисковой оптимизации. В профессиональных сообществах стало высказываться мнение: скоринг на основе доступной по ссылке информации означает, что Google сделает весомым фактором ранжирования страниц в результатах поиска то, как много информации на них есть. А значит, надо создавать на сайтах как можно более насыщенные данными страницы.

На самом деле, считает колумнист SEJ, это совсем другое измерение ранжирования, и относится оно скорее к персонализации. Google пытается определить, что заинтересует пользователя на следующем шаге работы с поиском. Или даже при новом поиске, уже в рамках другой поисковой сессии.

В целом идея показывать пользователю документы, релевантные не только его запросу, но и его персональным интересам, определённым в том числе на основе ранее просмотренных веб-страниц, для Google не нова. Но в патенте делается акцент на её реализации в чатботах и ИИ-ассистентах, в том числе голосовых. Ассистенты могут задавать пользователю дополнительные вопросы и уже сами задавать их в поисковую систему («гуглить за тебя») и самостоятельно выбирать информацию из полученных ответов.

Отдельно рассматривается проблема предоставления информации голосовыми ассистентами: длинные ответы хуже воспринимаются пользователем, он не может их наскоро просматривать, скроллить вперёд или отматывать назад. Поэтому здесь краткость, плотность, точность, релевантность ответа.

Information Gain score и AI Overviews

Как конкретно описанная в патенте технология будет внедрена в ИИ-сводки, можно пока предполагать. Но этот продукт явно требует улучшения и дальнейшего развития.

Да, это те самые Overviews, которые советовали пользователям прилеплять сыр к пицце клеем, есть камни и выдавали множество фактических ошибок, которые в ответах ИИ уже даже никого не удивляют (например, утверждали, что американский президент Эндрю Джонсон получал научные степени в 1947-2012 годах, хотя умер в 1875).

Через пару недель после запуска возглавляющая поиск Google Лиз Рейд заявила, что пользователи довольны продуктом, они стали задавать более сложные и длинные запросы и дольше оставаться на сайтах, на которые их отправляли сводки (возможно, пытались понять, как из текста на этой странице Google извлёк рекомендацию есть камни, прим.ред).

Рейд также напомнила, что AI Overviews работают не как чатботы и ассистенты на LLM, потому что зависят не от обучения на выборке данных, а от той же проиндексированной на сайтах информации и алгоритмов её ранжирования, что и старый-добрый поиск Google. Поэтому галлюцинации продукту не свойственны, ошибки возникают из-за недостатка информации, сбоев в понимании запроса или в интерпретации информации для ответа.

Отсюда, пояснила Рейд, возникали нелепые ответы на шуточные, сатирические и бессмысленные вопросы. Например, «сколько надо есть камней». Нормальные люди такие запросы не задают, а соответствующей им информации в интернете нет. Но ИИ постарался и всё же нашёл его в разделе юмора на каком-то сайте провайдера ПО для геологов. Большой и острый нож в спину Overviews воткнули форумы: в Google знали, что это обширный источник полезного юзер-генерированного контента по всем темам, но как-то не учли, что там тоже много шуток, сатиры, иронии и троллинга.

В результате, пишет Рейд, Overviews научили распознавать бессмысленные вопросы и не пытаться на них отвечать, а также сильно сократили использование «сатиры и юмора». Лимитировали вовлечение пользовательского контента в ответы на запросы, где ИИ мог дать неправильный совет. Научили ИИ распознавать запросы, в ответах на которые он уже проявил свою бесполезность. Ещё сильнее ограничили участие ИИ в ответах на вопросы о здоровье, а в ответах на вопросы по мотивам «сложных» новостей его уже и ограничивать сильнее было некуда.

Читайте так же:

ЦБ РФ расширяет список мошеннических операций

Если ИИ выдаёт неточные или неверные ответы уже на первичный запрос пользователя, в процессе продолжения диалога он может запутаться ещё сильнее, так что технология, относящаяся к проработке следующих шагов коммуникации, невостребованной не останется.

Бесплатный поиск, мониторинг и регистрация товарных знаков и других объектов интеллектуальной собственности.

Больше контента о сфере интеллектуальной собственности в нашем Telegram-канале

Материал опубликован при поддержке сайта habr.com

Читайте так же: