Языковые модели: новости и события искусственного интеллекта

Главные новости и события в мире языковых моделей

11 Апреля 2025
Мария Азарова

Ученые из «Яндекса», НИУ ВШЭ, MIT, KAUST и ISTA разработали прорывной метод сжатия больших языковых моделей

Теперь можно быстро тестировать нейросети и внедрять решения на основе их сжатых версий, экономя время и деньги. К примеру, «Яндекс» уже применяет метод HIGGS для ускоренного прототипирования.
Подробнее
26 Марта 2025
daniilshat

Илон Маск подтвердил, что Grok стал доступен в виде Telegram-бота

Илон Маск опубликовал в X пост, в котором подтвердил, что языковая модель Grok теперь доступна в виде Telegram-бота. Такое же сообщение появилось в официальном профиле Grok в X.
Подробнее
20 Марта 2025

Разработчик выпустил плагин для интеграции Cursor в Figma

UX-инженер Сонни Лазуарди выпустил плагин для интеграции Cursor в Figma. С его помощью можно использовать языковую модель для генерации макетов.
Подробнее
17 Марта 2025

Factorio пополняет список видеоигр, которые также тестируют производительность AI

Factorio, сложная компьютерная игра, ориентированная на строительство и управление ресурсами, стала последним инструментом исследователей для оценки возможностей AI. Игра проверяет способность языковых моделей планировать и строить сложные системы, управляя при этом множеством ресурсов и производственных цепочек.
Подробнее
01 Марта 2025

Deepseek: как превратить языковые модели в прибыльный бизнес, несмотря на снижение цен на рынке

В недавно опубликованных данных Deepseek говорится о том, что языковые модели могут приносить ощутимую выгоду, даже если их стоимость будет ниже, чем у OpenAI.
Подробнее
Языковые модели могут перегружать себя мыслями и застревать в бесконечных циклах мыслей

Языковые модели могут перегружать себя мыслями и застревать в бесконечных циклах мыслей

Новое исследование выявило неожиданную слабость языковых моделей: они могут зацикливаться на мышлении вместо действия, особенно в интерактивных средах. Эта тенденция...

Aomni привлекает $4 миллиона, доказывая, что AI может увеличить продажи, не заменяя людей

Aomni привлекает $4 миллиона, доказывая, что AI может увеличить продажи, не заменяя людей

Aomni, платформа на основе AI, которая помогает отделам продаж проводить глубокое исследование потенциальных клиентов, привлекла 4 миллиона долларов в качестве начал...

Проблемы языковых моделей при анализе длинных текстов: выводы исследования

Проблемы языковых моделей при анализе длинных текстов: выводы исследования

В результате исследования, проведённого учёными из Мюнхенского университета Людвига-Максимилиана, Мюнхенского центра машинного обучения и Adobe Research, было устано...

Исследование показывает, что энергопотребление ChatGPT меньше, чем многие думают

Исследование показывает, что энергопотребление ChatGPT меньше, чем многие думают

ChatGPT, возможно, не так жадна до ресурсов, как считалось ранее. Но, согласно новому исследованию, её аппетиты во многом зависят от того, как используется ChatGPT и...

Команда Hugging Face представила собственную открытую реализацию агента DeepResearch от OpenAI

Команда Hugging Face представила собственную открытую реализацию агента DeepResearch от OpenAI

Инженеры Hugging Face рассказали в блоге, что вдохновились функцией DeepResearch от OpenAI и решили за 24 часа разработать собственную реализацию. В итоге получился ...

Как небольшой набор данных и управление вычислениями могут улучшить работу языковых моделей

Как небольшой набор данных и управление вычислениями могут улучшить работу языковых моделей

Новый подход показывает, что тщательно подобранные обучающие данные и гибкое управление вычислениями во время тестирования могут помочь AI-моделям более эффективно р...

Тест ChangeMyView: как OpenAI оценивает убедительность своих AI-моделей

Тест ChangeMyView: как OpenAI оценивает убедительность своих AI-моделей

OpenAI использовала сабреддит r/ChangeMyView для создания теста, предназначенного для оценки убедительности своих AI-моделей. Компания рассказала об этом в системной...

Цензуру DeepSeek можно обойти с помощью ASCII-арта

Цензуру DeepSeek можно обойти с помощью ASCII-арта

Автора блога на Substack под никнеймом deepgains рассказал, что ему удалось разговорить языковую модель DeepSeek на тему событий на площади Тяньаньмэнь. Для этого он...

Mistral AI выпустила Small 3 — мощную языковую модель с 24 миллиардами параметров

Mistral AI выпустила Small 3 — мощную языковую модель с 24 миллиардами параметров

Mistral AI выпустила Small 3 — новую языковую модель с 24 миллиардами параметров, которая по производительности не уступает гораздо более крупным моделям от Meta и O...

Новая модель искусственного интеллекта Alibaba превосходит DeepSeek-V3

Новая модель искусственного интеллекта Alibaba превосходит DeepSeek-V3

Компания Alibaba разработала новую языковую модель под названием Qwen2.5-Max, которая, по словам компании, использует рекордное количество обучающих данных — более <...

Компания Lumina AI выпускает PrismRCL 2.6.0 с расширенными параметрами обучения LLM

Компания Lumina AI выпускает PrismRCL 2.6.0 с расширенными параметрами обучения LLM

Lumina AI, лидер в области решений для машинного обучения, оптимизированных для центральных процессоров, объявляет о выпуске PrismRCL 2.6.0, последн...

SwiftKV: как снизить затраты и ускорить логический вывод больших языковых моделей

SwiftKV: как снизить затраты и ускорить логический вывод больших языковых моделей

Исследовательская группа Snowflake AI представляет SwiftKV - решение, разработанное для повышения производительности LLM-выводов и снижения связанных с этим затрат. ...

ИИ-переводчик со 100 языков превзошел все существующие аналоги

ИИ-переводчик со 100 языков превзошел все существующие аналоги

IT-специалисты создали модель искусственного интеллекта, которая переводит текст с одного языка на другой в четырех разных режимах и делает это точнее предшественник...

RetroLLM: расширение возможностей больших языковых моделей для получения точных данных в процессе генерации

RetroLLM: расширение возможностей больших языковых моделей для получения точных данных в процессе генерации

Исследователи разработали более оптимизированный подход, который помогает системам искусственного интеллекта обрабатывать информацию. Новая система под назва...

Google запускает SALT: Новый способ ускоренного обучения больших моделей AI с помощью малых

Google запускает SALT: Новый способ ускоренного обучения больших моделей AI с помощью малых

Исследователи из Google разработали метод, позволяющий создавать языковые модели AI, которые одновременно быстрее и лучше, используя необычный подход: предоставляя м...

Исследование: LLM можно использовать для генерации вредоносного JavaScript-кода и сокрытия малвари

Исследование: LLM можно использовать для генерации вредоносного JavaScript-кода и сокрытия малвари

Исследование Palo Alto Networks показало, что большие языковые модели можно использоваться для массовой генерации новых вариантов вредоносного JavaScript-кода, и эт...

Как далеко сможет зайти ИИ? Интервью с Александром Пановым

Как далеко сможет зайти ИИ? Интервью с Александром Пановым

Трудно ли создать машинный сверхинтеллект? Поможет ли ИИ перейти к новому технологическому укладу? И как обучать искусственный разум на малом количестве примеров? К...

OpenAI официально представила модель GPT-o1 Pro за 200 долларов в месяц

OpenAI официально представила модель GPT-o1 Pro за 200 долларов в месяц

OpenAI провела первую трансляцию из 12 обещанных, во время которой представила GPT-o1 Pro — свою самую мощную модель. Отмечается, что она будет полезна исследователя...

Hugging Face выпустила SmolTalk — синтетический датасет для обучения языковых моделей

Hugging Face выпустила SmolTalk — синтетический датасет для обучения языковых моделей

Разработчики платформы Hugging Face представили SmolTalk — синтетический англоязычный датасет для обучения больших языковых моделей. Он включает в себя сущест...

Google Deepmind разработала архитектуру для симуляции поведения группы людей

Google Deepmind разработала архитектуру для симуляции поведения группы людей

Исследователи лаборатории Google Deepmind совместно со специалистами Стэнфорда, Северо-Западного университета Чикаго и Вашингтонского университета разработали архите...