Следующие модели Llama от Meta* могут получить улучшенные голосовые функции

Марк Цукерберг намерен в этом году расширить голосовые возможности искусственного интеллекта Meta, продвигая амбициозные планы по монетизации стремительно развивающихся технологий.

Марк Цукерберг намерен в этом году расширить голосовые возможности искусственного интеллекта Meta, продвигая амбициозные планы по монетизации стремительно развивающихся технологий.

По словам осведомлённых источников, в ближайшие недели компания представит обновлённые голосовые функции в новой версии своей открытой языковой модели Llama 4, делая ставку на то, что ИИ-агенты будущего будут вести диалог в разговорном формате, а не ограничиваться текстовыми взаимодействиями.

Особое внимание Meta уделяет тому, чтобы общение пользователя с голосовой моделью стало максимально естественным, напоминая живой диалог, в котором допускаются реплики и перебивания, а не строгий формат вопрос-ответ, сообщил один из собеседников.

Голосовое направление стало ключевым элементом стратегии Цукерберга, который объявил о смелых планах превратить компанию стоимостью $1,7 трлн в лидера в сфере искусственного интеллекта, назвав 2025 год решающим для успеха многих ИИ-продуктов Meta на фоне гонки с такими конкурентами, как OpenAI, Microsoft и Google.

В рамках этих инициатив компания рассматривает возможность тестирования премиальных подписок на своего ИИ-ассистента Meta AI для выполнения агентских задач — таких как бронирование столиков в ресторанах и создание видеоконтента, сообщили два осведомлённых источника. Кроме того, обсуждается введение платной рекламы и спонсорских публикаций в результатах поиска ИИ-ассистента, добавил один из них.

Цукерберг также объявил о планах создать инженерного ИИ-агента с навыками программирования и решения задач на уровне инженера средней квалификации, подчеркнув, что у такого продукта «очень большой рынок».

В Meta отказались от комментариев.

В среду директор по продуктам компании Крис Кокс поделился подробностями о Llama 4, заявив, что это будет «универсальная модель», в которой речь станет «естественным элементом . . . без необходимости преобразовывать голос в текст, передавать текст в языковую модель, получать текстовый ответ и снова озвучивать его».

Выступая на конференции Morgan Stanley по технологиям, медиа и телекоммуникациям, он добавил: «Я считаю, что это революция в сфере пользовательских интерфейсов — возможность разговаривать с интернетом и задавать любые вопросы. Думаю, мы ещё не до конца осознали, насколько это мощно».

В компании также обсуждают, какими должны быть ограничения на выдачу контента в новой версии Llama и следует ли их ослабить, сообщили два источника.

Эти обсуждения проходят на фоне череды релизов конкурентов и предостережений от недавно назначенного «царя ИИ» Дэвида Сакса, венчурного инвестора Кремниевой долины, который стремится гарантировать, что американские модели ИИ не будут предвзятыми или «пропитанными идеологией».

В прошлом году OpenAI представила голосовой режим с уникальными персонализациями, а Grok 3 от xAI Илона Маска, доступный в соцсети X, запустил голосовые функции для ограниченного числа пользователей в конце февраля.

Модель Grok изначально создавалась с минимальным количеством ограничений, включая так называемый «режим без цензуры», при котором ответы намеренно могут быть «оскорбительными, неуместными и провокационными», по информации компании.

В прошлом году Meta представила менее «назидательную» версию своей языковой модели в третьем поколении Llama после критики в адрес Llama 2, которая отказывалась отвечать даже на безобидные запросы.

Интеграция голосового управления в ИИ-ассистента стала ключевой функцией умных очков Ray-Ban от Meta, которые в последнее время приобрели большую популярность у пользователей. Параллельно компания ускорила разработку лёгких гарнитур, которые в будущем могут заменить смартфоны в роли основного устройства для вычислений и связи.

Источник

*В тексте идет речь о компании Meta, которая признана на территории РФ экстремисткой организацией.


Чтобы не пропустить анонс новых материалов подпишитесь на «Голос Технократии» — мы регулярно рассказываем о новостях про AI, LLM и RAG, а также делимся полезными мастридами и актуальными событиями.

Материал опубликован при поддержке сайта habr.com
Комментарии

    Актуальные новости по теме "Array"