Google представляет новую модель встраивания текста на базе Gemini

08:19
08 Марта 2025
247

В пятницу Google добавила новую экспериментальную модель «встраивания» текста Gemini Embedding в свой API-интерфейс разработчика Gemini. Модели встраивания преобразуют текстовые входные данные, такие как слова и фразы, в числовые представления, известные как встраивания, которые фиксируют семантическое значение текста.

Встраивания используются в ряде приложений, таких как поиск и классификация документов, отчасти потому, что они могут снизить затраты и улучшить задержку. Такие компании, как Amazon, Cohere и OpenAI, предлагают модели встраивания через свои соответствующие API. Google уже предлагала модели встраивания, но Gemini Embedding — это ее первая модель, обученная на семействе моделей AI Gemini.

«Обученная на самой модели Gemini, эта модель встраивания унаследовала понимание языка и тонкого контекста Gemini, что делает ее применимой для широкого спектра применений», — говорится в сообщении в блоге Google.
«Мы обучили нашу модель быть исключительно общей, обеспечивая исключительную производительность в различных областях, включая финансы, науку, юриспруденцию, поиск и многое другое».

Google утверждает, что Gemini Embedding превосходит производительность своей предыдущей передовой модели встраивания text-embedding-004 и достигает конкурентоспособной производительности на популярных бенчмарках встраивания. По сравнению с text-embedding-004, Gemini Embedding также может принимать более крупные фрагменты текста и кода одновременно, и поддерживает в два раза больше языков (более 100).

Google отмечает, что Gemini Embedding находится в «экспериментальной фазе» с ограниченными возможностями и может быть изменен. «Мы работаем над выпуском стабильной общедоступной версии в ближайшие месяцы», — написала компания в своем блоге.

Источник

Материал опубликован при поддержке сайта habr.com

Читайте так же: