• Темы
  • большие языковые модели

Большие языковые модели: новейшие технологии в обработке языка

Эволюция и влияние больших языковых моделей на искусственный интеллект

13 Февраля 2025
mefdayy

Проблемы языковых моделей при анализе длинных текстов: выводы исследования

В результате исследования, проведённого учёными из Мюнхенского университета Людвига-Максимилиана, Мюнхенского центра машинного обучения и Adobe Research, было установлено, что современные языковые модели искусственного интеллекта имеют ограничения при обработке и анализе больших объёмов текстовой информации.
Подробнее
22 Января 2025
mefdayy

Компания Lumina AI выпускает PrismRCL 2.6.0 с расширенными параметрами обучения LLM

Lumina AI, лидер в области решений для машинного обучения, оптимизированных для центральных процессоров, объявляет о выпуске PrismRCL 2.6.0, последней версии своего флагманского программного обеспечения, разработанного для повышения производительности и эффективности машинного обучения. В этом выпуске представлена долгожданная функция: параметр обучения LLM , которая ещё больше расширяет возможности RCL по созданию базовых моделей с беспрецедентной скоростью и экономичностью.
Подробнее
25 Декабря 2024

Исследование: LLM можно использовать для генерации вредоносного JavaScript-кода и сокрытия малвари

Исследование Palo Alto Networks показало, что большие языковые модели можно использоваться для массовой генерации новых вариантов вредоносного JavaScript-кода, и это позволяет малвари лучше избегать обнаружения.
Подробнее
10 Декабря 2024

Как далеко сможет зайти ИИ? Интервью с Александром Пановым

Трудно ли создать машинный сверхинтеллект? Поможет ли ИИ перейти к новому технологическому укладу? И как обучать искусственный разум на малом количестве примеров? Какие сложности возникают при взаимодействии с умными роботами, обсудили с директором центра когнитивного моделирования МФТИ, руководителем научной группы «Нейросимвольная интеграция» в Институте искусственного интеллекта AIRI Александром Пановым.
Подробнее
25 Сентября 2024

Meta выпустила Llama 3.2: это первая мультимодальная LLM в опенсорс

Компания Meta известна своими опенсорс LLM моделями: каждый раз их релизы производят фурор в ИИ-сообществе, обгоняя на бенчмарках передовые закрытые модели вроде GPT от OpenAI или Gemini от Google. Вот и в этот раз Meta навела шороху, без предупреждений и анонсов выпустив свою первую мультимодальную LLM Llama 3.2.
Подробнее
Компания Sysdig рассказала, ради чего чаще всего крадут ключи API провайдеров БЯМ

Компания Sysdig рассказала, ради чего чаще всего крадут ключи API провайдеров БЯМ

Запросы к провайдерам больших языковых моделей сто́ят дорого, поэтому кража ключей API здесь — распространённое явление. Компания Sysdig приводит результаты нескольк...

В сети начался конкурс вопросов для сложнейшего в мире теста для ИИ: за каждый можно получить до $5000

В сети начался конкурс вопросов для сложнейшего в мире теста для ИИ: за каждый можно получить до $5000

Название конкурса заслуживает отдельного внимания. Он называется буквально Последний экзамен человечества: Humanity’s Last Exam. Ученые из CAIS и S...

Nvidia выпустила NVLM 1.0 – собственную мультимодальную LLM, которая на некоторых тестах опережает GPT-4o

Nvidia выпустила NVLM 1.0 – собственную мультимодальную LLM, которая на некоторых тестах опережает GPT-4o

NVLM 1.0 – это семейство открытых мультимодальных LLM, состоящее из моделей NVLM-D , NVLM-X и NVLM-H на 34B и 72B. Модели особенно хорошо показывают себя на визуа...

«Яндекс» выложил в свободный доступ библиотеку, ускоряющую работу больших языковых моделей до 25%

«Яндекс» выложил в свободный доступ библиотеку, ускоряющую работу больших языковых моделей до 25%

Компания «Яндекс» выложила в свободный доступ свою библиотеку YaFSDP. По словам разработчиков, библиотека до 25% ускоряет обучение больших языковых моделей . Также с...

Qwen2 — самый мощный релиз открытых LLM со времен Llama 3

Qwen2 — самый мощный релиз открытых LLM со времен Llama 3

Alibaba только что выпустили свое новое семейство мультиязычных моделей, которых превосходят по производительности Llama 3 по многим параметрам.

Большой прорыв в понимании работы LLM — Anthropic опубликовала исследование

Большой прорыв в понимании работы LLM — Anthropic опубликовала исследование

Обычно модели AI воспринимаются как черный ящик, где ввод данных приводит к выводу ответа, но неясно, почему модель выбрала именно этот ответ.

Stardock представила бесплатное для клиентов настольное приложение DesktopGPT

Stardock представила бесплатное для клиентов настольное приложение DesktopGPT

Stardock представила настольное приложение с возможностями искусственного интеллекта DesktopGPT. Оно будет бесплатным для клиентов Object Desktop.

Microsoft создаёт новую LLM под названием MAI-1, которая может конкурировать с ChatGPT

Microsoft создаёт новую LLM под названием MAI-1, которая может конкурировать с ChatGPT

Microsoft работает над новой большой языковой моделью , которая сможет составить конкуренцию ChatGPT. LLM под названием MAI-1 разрабатывается с 500 млрд параметров. ...

Исследователи из Offensive AI Lab рассказали, как хакеры могут читать переписку пользователей с чат-ботами

Исследователи из Offensive AI Lab рассказали, как хакеры могут читать переписку пользователей с чат-ботами

«Лаборатория Касперского» рассказала об исследовании израильской компании Offensive AI Lab. В своём исследовании специалисты Offensive AI Lab описывают метод восстан...

Пентагон использовал чат-боты для управления боевыми действиями в StarCraft II

Пентагон использовал чат-боты для управления боевыми действиями в StarCraft II

Военные США изучили возможность применения чат-ботов в планировании боевых действий в контексте военного симулятора, основанного на компьютерной стратегии StarCraft ...

ИИ предложил резко снизить интенсивность общения с инопланетянами

ИИ предложил резко снизить интенсивность общения с инопланетянами

Если допустить, что разумная жизнь во Вселенной не редкость и встреча людей с внеземными цивилизациями неизбежна, многие исследователи задаются вполне справедливыми ...

Тяга ИИ к гонке вооружений и ядерным ударам сделала его опасным помощником в военно-политических вопросах

Тяга ИИ к гонке вооружений и ядерным ударам сделала его опасным помощником в военно-политических вопросах

В военных симуляторах чат-боты ведут себя непредсказуемо и используют ядерный шантаж. Например, в одной из таких симуляций самая умная и мощная нейросеть решила нане...

Reuters: за полгода Китай одобрил для публичного пользования более 40 ИИ-моделей

Reuters: за полгода Китай одобрил для публичного пользования более 40 ИИ-моделей

За последние шесть месяцев власти КНР одобрили более 40 моделей искусственного интеллекта для публичного пользования, пишет Reuters со ссылкой на китайские СМИ. Стра...

Google работает над ИИ-помощником на базе Gemini для смартфонов Pixel 9

Google работает над ИИ-помощником на базе Gemini для смартфонов Pixel 9

По данным The Information, Google начала разрабатывать ИИ-помощника под названием Pixie на базе Gemini. Скорее всего, его представят с выходом смартфонов серии Pixel...

Пародийный чат-бот из 1960-х годов превзошел GPT-3.5 в тесте Тьюринга

Пародийный чат-бот из 1960-х годов превзошел GPT-3.5 в тесте Тьюринга

Чат-бот «Элиза», написанный в 1966 году, в разговоре с людьми смог лучше убедить их в том, что является человеком, чем чат-бот GPT-3.5, который создали в 2022-м. Авт...