• Темы
  • большие языковые модели

Большие языковые модели: новейшие технологии в обработке языка

Эволюция и влияние больших языковых моделей на искусственный интеллект

Компания Sysdig рассказала, ради чего чаще всего крадут ключи API провайдеров БЯМ

Компания Sysdig рассказала, ради чего чаще всего крадут ключи API провайдеров БЯМ

Запросы к провайдерам больших языковых моделей сто́ят дорого, поэтому кража ключей API здесь — распространённое явление. Компания Sysdig приводит результаты нескольких…

В сети начался конкурс вопросов для сложнейшего в мире теста для ИИ: за каждый можно получить до $5000

В сети начался конкурс вопросов для сложнейшего в мире теста для ИИ: за каждый можно получить до $5000

Название конкурса заслуживает отдельного внимания. Он называется буквально Последний экзамен человечества: Humanity’s Last Exam. Ученые из CAIS и ScaleAI…

Nvidia выпустила NVLM 1.0 – собственную мультимодальную LLM, которая на некоторых тестах опережает GPT-4o

Nvidia выпустила NVLM 1.0 – собственную мультимодальную LLM, которая на некоторых тестах опережает GPT-4o

NVLM 1.0 – это семейство открытых мультимодальных LLM, состоящее из моделей NVLM-D , NVLM-X и NVLM-H на 34B и 72B. Модели особенно хорошо показывают себя на визуальных…

Специалисты «Яндекса» разработали решение, позволяющее бизнесу сократить расходы на внедрение нейросетей до восьми раз

Специалисты «Яндекса» разработали решение, позволяющее бизнесу сократить расходы на внедрение нейросетей до восьми раз

Команда Yandex Research совместно с исследователями IST Austria и Kaust разработала и опубликовала в свободном доступе новые методы сжатия больших языковых моделей. По…

«Яндекс» выложил в свободный доступ библиотеку, ускоряющую работу больших языковых моделей до 25%

«Яндекс» выложил в свободный доступ библиотеку, ускоряющую работу больших языковых моделей до 25%

Компания «Яндекс» выложила в свободный доступ свою библиотеку YaFSDP. По словам разработчиков, библиотека до 25% ускоряет обучение больших языковых моделей . Также создатели…

Qwen2 — самый мощный релиз открытых LLM со времен Llama 3

Qwen2 — самый мощный релиз открытых LLM со времен Llama 3

Alibaba только что выпустили свое новое семейство мультиязычных моделей, которых превосходят по производительности Llama 3 по многим параметрам.

Большой прорыв в понимании работы LLM — Anthropic опубликовала исследование

Большой прорыв в понимании работы LLM — Anthropic опубликовала исследование

Обычно модели AI воспринимаются как черный ящик, где ввод данных приводит к выводу ответа, но неясно, почему модель выбрала именно этот ответ.

Stardock представила бесплатное для клиентов настольное приложение DesktopGPT

Stardock представила бесплатное для клиентов настольное приложение DesktopGPT

Stardock представила настольное приложение с возможностями искусственного интеллекта DesktopGPT. Оно будет бесплатным для клиентов Object Desktop.

Microsoft создаёт новую LLM под названием MAI-1, которая может конкурировать с ChatGPT

Microsoft создаёт новую LLM под названием MAI-1, которая может конкурировать с ChatGPT

Microsoft работает над новой большой языковой моделью , которая сможет составить конкуренцию ChatGPT. LLM под названием MAI-1 разрабатывается с 500 млрд параметров. Для…

Исследователи из Offensive AI Lab рассказали, как хакеры могут читать переписку пользователей с чат-ботами

Исследователи из Offensive AI Lab рассказали, как хакеры могут читать переписку пользователей с чат-ботами

«Лаборатория Касперского» рассказала об исследовании израильской компании Offensive AI Lab. В своём исследовании специалисты Offensive AI Lab описывают метод восстановления…

Bloomberg: ИИ-функции в iOS 18 не потребуют подключения к интернету

Bloomberg: ИИ-функции в iOS 18 не потребуют подключения к интернету

Функции искусственного интеллекта в грядущей iOS 18 будут основаны на автономной большой языковой модели , разработанной Apple, сообщил Марк Гурман из Bloomberg. Устройствам…

Пентагон использовал чат-боты для управления боевыми действиями в StarCraft II

Пентагон использовал чат-боты для управления боевыми действиями в StarCraft II

Военные США изучили возможность применения чат-ботов в планировании боевых действий в контексте военного симулятора, основанного на компьютерной стратегии StarCraft II.…

ИИ предложил резко снизить интенсивность общения с инопланетянами

ИИ предложил резко снизить интенсивность общения с инопланетянами

Если допустить, что разумная жизнь во Вселенной не редкость и встреча людей с внеземными цивилизациями неизбежна, многие исследователи задаются вполне справедливыми вопросами:…

Тяга ИИ к гонке вооружений и ядерным ударам сделала его опасным помощником в военно-политических вопросах

Тяга ИИ к гонке вооружений и ядерным ударам сделала его опасным помощником в военно-политических вопросах

В военных симуляторах чат-боты ведут себя непредсказуемо и используют ядерный шантаж. Например, в одной из таких симуляций самая умная и мощная нейросеть решила нанести…

Reuters: за полгода Китай одобрил для публичного пользования более 40 ИИ-моделей

Reuters: за полгода Китай одобрил для публичного пользования более 40 ИИ-моделей

За последние шесть месяцев власти КНР одобрили более 40 моделей искусственного интеллекта для публичного пользования, пишет Reuters со ссылкой на китайские СМИ. Страна…

Google работает над ИИ-помощником на базе Gemini для смартфонов Pixel 9

Google работает над ИИ-помощником на базе Gemini для смартфонов Pixel 9

По данным The Information, Google начала разрабатывать ИИ-помощника под названием Pixie на базе Gemini. Скорее всего, его представят с выходом смартфонов серии Pixel…

Пародийный чат-бот из 1960-х годов превзошел GPT-3.5 в тесте Тьюринга

Пародийный чат-бот из 1960-х годов превзошел GPT-3.5 в тесте Тьюринга

Чат-бот «Элиза», написанный в 1966 году, в разговоре с людьми смог лучше убедить их в том, что является человеком, чем чат-бот GPT-3.5, который создали в 2022-м. Авторы…