Языковые модели — новости и события искусственного интеллекта

Главные новости и события в мире языковых моделей

Мария Азарова

Ученые из «Яндекса», НИУ ВШЭ, MIT, KAUST и ISTA разработали прорывной метод сжатия больших языковых моделей

Теперь можно быстро тестировать нейросети и внедрять решения на основе их сжатых версий, экономя время и деньги. К примеру, «Яндекс» уже применяет метод HIGGS для ускоренного прототипирования.

Подробнее

daniilshat

Илон Маск подтвердил, что Grok стал доступен в виде Telegram-бота

Илон Маск опубликовал в X пост, в котором подтвердил, что языковая модель Grok теперь доступна в виде Telegram-бота. Такое же сообщение появилось в официальном профиле Grok в X.

Подробнее

Разработчик выпустил плагин для интеграции Cursor в Figma

UX-инженер Сонни Лазуарди выпустил плагин для интеграции Cursor в Figma. С его помощью можно использовать языковую модель для генерации макетов.

Подробнее

Factorio пополняет список видеоигр, которые также тестируют производительность AI

Factorio, сложная компьютерная игра, ориентированная на строительство и управление ресурсами, стала последним инструментом исследователей для оценки возможностей AI. Игра проверяет способность языковых моделей планировать и строить сложные системы, управляя при этом множеством ресурсов и производственных цепочек.

Подробнее

Deepseek: как превратить языковые модели в прибыльный бизнес, несмотря на снижение цен на рынке

В недавно опубликованных данных Deepseek говорится о том, что языковые модели могут приносить ощутимую выгоду, даже если их стоимость будет ниже, чем у OpenAI.

Подробнее

Языковые модели могут перегружать себя мыслями и застревать в бесконечных циклах мыслей

15:34
23 Февраля 2025

Новое исследование выявило неожиданную слабость языковых моделей: они могут зацикливаться на мышлении вместо действия, особенно в интерактивных средах. Эта тенденция...

«Темпоральные головы» в языковых моделях: новые возможности для AI

14:26
23 Февраля 2025

Исследование ученых из Korea University, Upstage AI и AIGEN Sciences выявило специализированные компоненты в больших языковых моделях, которые обрабатывают информаци...

Aomni привлекает $4 миллиона, доказывая, что AI может увеличить продажи, не заменяя людей

17:49
18 Февраля 2025

Aomni, платформа на основе AI, которая помогает отделам продаж проводить глубокое исследование потенциальных клиентов, привлекла 4 миллиона долларов в качестве начал...

CAPA: новый инструмент для обнаружения сходства ошибок в LLM

23:24
15 Февраля 2025

Новое исследование того, как языковые модели оценивают друг друга, выявило тревожную закономерность: по мере того, как эти системы становятся более сложными, они все...

Проблемы языковых моделей при анализе длинных текстов: выводы исследования

13:59
13 Февраля 2025

В результате исследования, проведённого учёными из Мюнхенского университета Людвига-Максимилиана, Мюнхенского центра машинного обучения и Adobe Research, было устано...

Исследование показывает, что энергопотребление ChatGPT меньше, чем многие думают

17:15
12 Февраля 2025

ChatGPT, возможно, не так жадна до ресурсов, как считалось ранее. Но, согласно новому исследованию, её аппетиты во многом зависят от того, как используется ChatGPT и...

Команда Hugging Face представила собственную открытую реализацию агента DeepResearch от OpenAI

02:05
06 Февраля 2025

Инженеры Hugging Face рассказали в блоге, что вдохновились функцией DeepResearch от OpenAI и решили за 24 часа разработать собственную реализацию. В итоге получился ...

Как небольшой набор данных и управление вычислениями могут улучшить работу языковых моделей

21:47
04 Февраля 2025

Новый подход показывает, что тщательно подобранные обучающие данные и гибкое управление вычислениями во время тестирования могут помочь AI-моделям более эффективно р...

Тест ChangeMyView: как OpenAI оценивает убедительность своих AI-моделей

12:45
01 Февраля 2025

OpenAI использовала сабреддит r/ChangeMyView для создания теста, предназначенного для оценки убедительности своих AI-моделей. Компания рассказала об этом в системной...

Цензуру DeepSeek можно обойти с помощью ASCII-арта

00:45
01 Февраля 2025

Автора блога на Substack под никнеймом deepgains рассказал, что ему удалось разговорить языковую модель DeepSeek на тему событий на площади Тяньаньмэнь. Для этого он...

Mistral AI выпустила Small 3 — мощную языковую модель с 24 миллиардами параметров

17:31
31 Января 2025

Mistral AI выпустила Small 3 — новую языковую модель с 24 миллиардами параметров, которая по производительности не уступает гораздо более крупным моделям от Meta и O...

Новая модель искусственного интеллекта Alibaba превосходит DeepSeek-V3

21:00
29 Января 2025

Компания Alibaba разработала новую языковую модель под названием Qwen2.5-Max, которая, по словам компании, использует рекордное количество обучающих данных — более <...

Компания Lumina AI выпускает PrismRCL 2.6.0 с расширенными параметрами обучения LLM

16:32
22 Января 2025

Lumina AI, лидер в области решений для машинного обучения, оптимизированных для центральных процессоров, объявляет о выпуске PrismRCL 2.6.0, последн...

SwiftKV: как снизить затраты и ускорить логический вывод больших языковых моделей

14:18
22 Января 2025

Исследовательская группа Snowflake AI представляет SwiftKV - решение, разработанное для повышения производительности LLM-выводов и снижения связанных с этим затрат. ...

ИИ-переводчик со 100 языков превзошел все существующие аналоги

19:01
15 Января 2025

IT-специалисты создали модель искусственного интеллекта, которая переводит текст с одного языка на другой в четырех разных режимах и делает это точнее предшественник...

Meta* предлагает новые масштабируемые слои памяти

13:58
08 Января 2025

По мере того как предприятия продолжают внедрять большие языковые модели в различные приложения, одной из ключевых задач, с которыми они сталкиваются, является повы...

RetroLLM: расширение возможностей больших языковых моделей для получения точных данных в процессе генерации

19:10
07 Января 2025

Исследователи разработали более оптимизированный подход, который помогает системам искусственного интеллекта обрабатывать информацию. Новая система под назва...

google
salt
ai
обучение
языковые модели

Google запускает SALT: Новый способ ускоренного обучения больших моделей AI с помощью малых

15:59

05 Января 2025

Исследователи из Google разработали метод, позволяющий создавать языковые модели AI, которые одновременно быстрее и лучше, используя необычный подход: предоставляя м...

palo alto networks
llm
javascript
малварь
большие языковые модели
переписывание
код
обфускация
антивирусы
искусственный интеллект

Исследование: LLM можно использовать для генерации вредоносного JavaScript-кода и сокрытия малвари

10:37

25 Декабря 2024

Исследование Palo Alto Networks показало, что большие языковые модели можно использоваться для массовой генерации новых вариантов вредоносного JavaScript-кода, и эт...

большие данные
большие языковые модели
искусственный интеллект
машинное обучение

Как далеко сможет зайти ИИ? Интервью с Александром Пановым

11:39

10 Декабря 2024

Трудно ли создать машинный сверхинтеллект? Поможет ли ИИ перейти к новому технологическому укладу? И как обучать искусственный разум на малом количестве примеров? К...

openai
chatgpt
gpt
chatgpt pro
чат-боты
языковые модели
искусственный интеллект
машинное обучение
нейросети

OpenAI официально представила модель GPT-o1 Pro за 200 долларов в месяц

21:36

05 Декабря 2024

OpenAI провела первую трансляцию из 12 обещанных, во время которой представила GPT-o1 Pro — свою самую мощную модель. Отмечается, что она будет полезна исследователя...

openai
chatgpt
gpt
нейросети
чат-боты
языковые модели
машинное обучение
тизер

OpenAI тизерит модель GPT-o1 pro mode

20:20

05 Декабря 2024

На сайте ChatGPT появилась новая модель, которая доступна из чата с GPT-o1 и GPT-o1 mini. В приложении она называется o1 pro mode и более развёрнуто отвечает на вопр...

hugging face
smoltalk
нейросети
искусственный интеллект
машинное обучение
языковые модели
датасеты

Hugging Face выпустила SmolTalk — синтетический датасет для обучения языковых моделей

14:37

27 Ноября 2024

Разработчики платформы Hugging Face представили SmolTalk — синтетический англоязычный датасет для обучения больших языковых моделей. Он включает в себя сущест...

google
google deepmind
языковые модели
чат-боты
ии-агенты
искусственный интеллект
машинное обучение

Google Deepmind разработала архитектуру для симуляции поведения группы людей

00:27

22 Ноября 2024

Исследователи лаборатории Google Deepmind совместно со специалистами Стэнфорда, Северо-Западного университета Чикаго и Вашингтонского университета разработали архите...

Языковые модели: новости и события искусственного интеллекта

Главные новости и события в мире языковых моделей

Ученые из «Яндекса», НИУ ВШЭ, MIT, KAUST и ISTA разработали прорывной метод сжатия больших языковых моделей

Илон Маск подтвердил, что Grok стал доступен в виде Telegram-бота

Разработчик выпустил плагин для интеграции Cursor в Figma

Factorio пополняет список видеоигр, которые также тестируют производительность AI

Deepseek: как превратить языковые модели в прибыльный бизнес, несмотря на снижение цен на рынке

Языковые модели могут перегружать себя мыслями и застревать в бесконечных циклах мыслей

«Темпоральные головы» в языковых моделях: новые возможности для AI

Aomni привлекает $4 миллиона, доказывая, что AI может увеличить продажи, не заменяя людей

CAPA: новый инструмент для обнаружения сходства ошибок в LLM

Проблемы языковых моделей при анализе длинных текстов: выводы исследования

Исследование показывает, что энергопотребление ChatGPT меньше, чем многие думают

Команда Hugging Face представила собственную открытую реализацию агента DeepResearch от OpenAI

Как небольшой набор данных и управление вычислениями могут улучшить работу языковых моделей

Тест ChangeMyView: как OpenAI оценивает убедительность своих AI-моделей

Цензуру DeepSeek можно обойти с помощью ASCII-арта

Mistral AI выпустила Small 3 — мощную языковую модель с 24 миллиардами параметров

Новая модель искусственного интеллекта Alibaba превосходит DeepSeek-V3

Компания Lumina AI выпускает PrismRCL 2.6.0 с расширенными параметрами обучения LLM

SwiftKV: как снизить затраты и ускорить логический вывод больших языковых моделей

ИИ-переводчик со 100 языков превзошел все существующие аналоги

Meta* предлагает новые масштабируемые слои памяти

RetroLLM: расширение возможностей больших языковых моделей для получения точных данных в процессе генерации

Google запускает SALT: Новый способ ускоренного обучения больших моделей AI с помощью малых

Исследование: LLM можно использовать для генерации вредоносного JavaScript-кода и сокрытия малвари

Как далеко сможет зайти ИИ? Интервью с Александром Пановым

OpenAI официально представила модель GPT-o1 Pro за 200 долларов в месяц

OpenAI тизерит модель GPT-o1 pro mode

Hugging Face выпустила SmolTalk — синтетический датасет для обучения языковых моделей

Google Deepmind разработала архитектуру для симуляции поведения группы людей

Читайте также

Магнит завершил сделку по покупке Азбуки вкуса за 29,65 млрд рублей

В аэропортах Волгограда и Сочи отменили ограничения

В самарском аэропорту Курумоч возобновлено авиасообщение

Путин анонсировал перекрестные Годы образования России и КНР в 2026-2027 годах