Нейросетям в «Яндекс Поиске» исполнилось 10 лет
«Яндекс» внедряет нейросетевые технологии с 2010-х годов — этому предшествовало много лет исследований в сфере машинного обучения. Со временем такие разработки сделали сервисы компании удобнее и быстрее: например, сегодня пользователи «Поиска» получают более подробные ответы на свои запросы, в которых могут комбинировать текст и изображение.
В поиске по загруженным изображениям «Яндекс» применил нейросети ровно 10 лет назад — 5 декабря 2014 года. С тех пор их стали использовать во многих областях: от ранжирования сайтов до перевода текстов и поиска объектов по фото. Нейросети эволюционировали, становились доступнее широкому кругу пользователей и компаний. К примеру, генеративные нейросети позволяют создавать изображения, тексты, видео и многое другое.
Однако распознавание и поиск изображений — не только похожих, но и близких по смыслу — не было первой функцией, в которую «Яндекс» добавил нейросеть. Еще в 2012 году компания использовала простую нейронную сеть для прогнозирования пробок на дорогах, а в 2013-м — для распознавания речи в технологии SpeechKit.
Затем, в 2015 году, в поиске по картинкам начали применять нейросети при обработке текстовых запросов. Если до этого релевантность изображения определяли по окружающему его тексту на сайте, новая модель позволила оценивать саму картинку, помещая в одно семантическое пространство с текстовым запросом.
В рамках поискового алгоритма «Палех» нейросети впервые использовали для ранжирования сайтов в 2016 году. Созданная «Яндексом» модель, подобная DSSM (Deep Semantic Similarity Model), помогала оценить смысловую связь между заголовками веб-страниц и запросами пользователей. Спустя еще год, в 2017-м, в обновлении «Королев» нейросеть начали применять к содержимому страниц, что улучшило качество ответа на уникальные запросы.
В 2020 году для ранжирования сайтов впервые использовали тяжелую нейронную сеть YATI (Yet Another Transformer with Improvements) — улучшенную версию «трансформера», адаптированную под «рантайм» «Поиска». Это обновление рекордно повысило качество ранжирования сайтов со времен внедрения «Матрикснета» в 2009 году.
В машинный перевод «Яндекс» ввел нейросети в 2017 году: благодаря этому «Переводчик» стал учитывать контекст и переводить фразы на его основе. Возможность перевода появилась и в «Поиске»: достаточно ввести запрос [translation перевод], чтобы получить мгновенный результат.
Полноценный переводной поиск «Яндекс» запустил в 2021 году: суть в том, что если подходящих результатов на русском языке не нашлось, система ищет их на англоязычных сайтах и предлагает переведенные варианты. В том же году появилась функция перевода видео в «Поиске» и «Браузере», что помогло расширить доступ к полезной информации, преодолевая языковые барьеры.
Главная цель «Поиска» — помощь пользователям в решении их задач. Для этого «Яндекс» выдает не только список сайтов, но и быстрый ответ на вопрос, причем дополненный ссылками на источники. Ранее для получения таких коротких ответов требовалась языковая модель YaLM, а с 2024 года, после внедрения нейросети нового поколения YandexGPT, поиск стал лучше справляться с анализом сложных вопросов и формированием точных ответов.
Помимо этого, в 2024-м «Яндекс» впервые добавил в поисковую систему мультимодальную VLM-нейросеть, объединяющую опыт работы с текстовыми и визуальными моделями. Теперь пользователи «Поиска» могут задавать вопросы, сочетающие текст и изображение, и получать подробные ответы.
ticket_comment_create