Новости и события в мире LLM: последние достижения и исследования

Последние достижения и исследования в области LLM

daniilshat

Андрей Карпатый представил nanochat — проект полного цикла создания LLM всего за 100 долларов

ML-инженер и бывший разработчик OpenAI Андрей Карпатый представил nanochat — это открытый проект полного цикла создания LLM. Обучение модели обойдётся примерно в 100 долларов, если арендовать мощности у облачного провайдера.

Подробнее

Qwertcoser

DeepSeek-V3.1 теперь можно запускать локально

Unsloth сделали то, что еще год назад казалось невозможным — ужали модель весом 715 ГБ до 170 ГБ, почти без потерь в качестве.
Они использовали динамическую квантовку: важные слои остаются в 6–8 бит, а менее критичные ужимаются до меньшей разрядности. При этом для калибровки брали 2–3 миллиона токенов хороших данных

Подробнее

FuriosaAI, занимающийся разработкой чипов AI, отклонил предложение Meta* о покупке за $800 млн

FuriosaAI, южнокорейский стартап, производящий чипы для приложений искусственного интеллекта, отклонил предложение Meta* о приобретении за 800 миллионов долларов, решив вместо этого сосредоточиться на разработке и производстве своих чипов искусственного интеллекта, сообщают местные СМИ.

Подробнее

Microsoft Research разработала новый способ включения знаний в LLM

Microsoft Research разработала более эффективный способ включения внешних знаний в языковые модели. Новая система, называемая Knowledge Base-Augmented Language Models , использует подход plug-and-play, который не требует изменения существующих моделей.

Подробнее

Cohere представляет Command A: инструмент AI для быстрого реагирования в бизнесе и науке

Канадский стартап Cohere в области искусственного интеллекта, соучредителем которого является один из авторов оригинальной статьи о трансформаторах, положившей начало революции в области больших языковых моделей в 2017 году, представил Command A — свою новейшую генеративную модель искусственного интеллекта, разработанную для корпоративных приложений.

Подробнее

Meta* в центре судебного спора во Франции из-за нарушения авторских прав на ИИ

16:45
13 Марта 2025

Французские авторы и издатели подали в суд на Meta, обвинив компанию в нарушении авторских прав на ИИ. По их мнению, Meta использует ИИ в своих интересах, не выплачи...

Четыре поведенческие стратегии для улучшения рассуждающих языковых моделей

23:39
11 Марта 2025

Большие языковые модели уже сегодня могут решать сложные задачи. Но почему некоторые из них рассуждают эффективнее, а другие почти не прибавляют в результативности ...

Yelp адаптирует технологии ИИ для улучшения пользовательского опыта

16:03
10 Марта 2025

Во время недавнего всплеска интереса к технологиям ИИ приложение для отзывов Yelp столкнулось с препятствиями при использовании современных LLM для некоторых функций...

Великая перестройка ПО: ИИ не просто поглощает всё, он и есть всё

14:09
10 Марта 2025

Когда-то ПО поглотило мир. Теперь ИИ переваривает то, что осталось. Старая модель вычислений, в которой доминировали приложения, доступ к которым контролировали торг...

Turing, ключевой поставщик кодирования для OpenAI и других производителей LLM, привлек $111 млн при оценке в $2,2 млрд

07:59
07 Марта 2025

В то время как компании AI стремятся повысить точность LLM и приложений, созданных на их основе, стартап, который стал ключевым партнером в этих усилиях, объявляет о...

A-MEM: как новая структура памяти для агентов ИИ помогает решать сложные задачи

17:59
06 Марта 2025

Специалисты из Университета Рутгерса, Ant Group и Salesforce Research разработали новую структуру, которая позволяет агентам ИИ выполнять более сложные задачи, интег...

Ceramic.ai Анны Паттерсон стремится помочь предприятиям создавать модели AI быстрее и эффективнее

08:13
06 Марта 2025

У Анны Паттерсон была легендарная карьера в Кремниевой долине. Она основала три стартапа, включая поисковые стартапы Xift и Cuil, а также recall.archive.org, который...

Salesforce обновила платформу Agentforce: теперь их ИИ-агенты могут автономно управлять корпоративными системами

17:45
05 Марта 2025

Сегодня Salesforce объявила о запуске Agentforce 2dx — крупного обновления своей платформы цифрового труда, которое даёт автономным ИИ-агентам возможность проактивно...

Тест BIG-Bench Extra Hard: как он выявляет недостатки в больших языковых моделях

08:58
05 Марта 2025

В 2021 году был создан BIG-Bench — универсальный инструмент для тестирования больших языковых моделей. Однако с развитием технологий современные модели стали обеспеч...

Как сократить затраты на системы ИИ: новый метод исследователей Zoom Communications

14:33
04 Марта 2025

Команда исследователей из Zoom Communications разработала революционную технологию, которая может значительно сократить затраты и вычислительные ресурсы, необходимые...

Deepseek: как превратить языковые модели в прибыльный бизнес, несмотря на снижение цен на рынке

18:35
01 Марта 2025

В недавно опубликованных данных Deepseek говорится о том, что языковые модели могут приносить ощутимую выгоду, даже если их стоимость будет ниже, чем у OpenAI.

Akool объединяет модели GenAI с 2D-аватарами для создания реалистичных персонажей

17:54
27 Февраля 2025

Akool, стартап, занимающийся созданием контента для аватаров на основе искусственного интеллекта, объявил об усовершенствованиях Akool Streaming Avatars, которые св...

Когда ИИ-риэлтор убеждает лучше людей: новое исследование

17:12
26 Февраля 2025

Сегодня большие языковые модели умеют писать тексты, вести диалоги и решать интеллектуальные задачи. Но их способность убеждать до сих пор изучена недостаточно. Меж...

Способен ли ИИ помочь нам в дипломатии?

17:29
25 Февраля 2025

Исследования по применению больших языковых моделей в политике начинают набирать обороты. Несмотря на впечатляющие успехи в понимании естественного языка, до сих по...

YandexGPT заняла первое место в англо‑русском переводе среди нейросетей по результатам бенчмарка DiBiMT

14:27
24 Февраля 2025

«Яндекс Переводчик» с YandexGPT стал мировым лидером по качеству перевода с английского на русский по итогам международного независимого бенчмарка DiBiMT, сообщили в...

MLGym – новый шаг в автоматизации научных исследований

16:50
23 Февраля 2025

За последние время ускорение научных открытий с использованием ИИ стало одной из ключевых амбиций исследовательского сообщества. Исторически сложилось, что задачи ав...

«Темпоральные головы» в языковых моделях: новые возможности для AI

14:26
23 Февраля 2025

Исследование ученых из Korea University, Upstage AI и AIGEN Sciences выявило специализированные компоненты в больших языковых моделях, которые обрабатывают информаци...

Ставка ИИ на $305 миллионов: модели логического вывода увеличивают спрос на графические процессоры

08:26
21 Февраля 2025

Когда DeepSeek-R1 только вышел на рынок, в отрасли преобладал страх, что сложные вычисления можно будет производить с использованием менее сложной инфраструктуры.

Инновационный подход NYU Langone Health к медицинскому образованию с использованием искусственного интеллекта

08:11
21 Февраля 2025

Записи данных о пациентах могут быть запутанными, а иногда и неполными, а это значит, что у врачей не всегда есть под рукой вся необходимая информация. К этому следу...

Разобучаем языковые модели: как заставить ИИ забыть только нужные знания

19:20
20 Февраля 2025

Привет, Хабр! Сегодня я расскажу о новом подходе в области «разобучения» больших языковых моделей – методе ReLearn, который позволяет не просто «забывать» нежелате...

Интеграция AI с поисковыми системами: почему Deep Research — это прорыв

20:18
19 Февраля 2025

Корпоративным компаниям стоит обратить внимание на Deep Research от OpenAI. Это мощный продукт, основанный на новых возможностях, и настолько хорош, что может остави...

CAPA: новый инструмент для обнаружения сходства ошибок в LLM

23:24
15 Февраля 2025

Новое исследование того, как языковые модели оценивают друг друга, выявило тревожную закономерность: по мере того, как эти системы становятся более сложными, они все...

Проблемы языковых моделей при анализе длинных текстов: выводы исследования

13:59
13 Февраля 2025

В результате исследования, проведённого учёными из Мюнхенского университета Людвига-Максимилиана, Мюнхенского центра машинного обучения и Adobe Research, было устано...

C апреля 2025 года BILLmanager прекратит выпуск обновлений для CentOS Linux 7

08:52
13 Февраля 2025

Компания Red Hat 24 июня 2024 года объявила о прекращении поддержки операционной системы CentOS Linux 7.

Новости и события в мире LLM

Последние достижения и исследования в области LLM

Андрей Карпатый представил nanochat — проект полного цикла создания LLM всего за 100 долларов

DeepSeek-V3.1 теперь можно запускать локально

FuriosaAI, занимающийся разработкой чипов AI, отклонил предложение Meta* о покупке за $800 млн

Microsoft Research разработала новый способ включения знаний в LLM

Cohere представляет Command A: инструмент AI для быстрого реагирования в бизнесе и науке

Meta* в центре судебного спора во Франции из-за нарушения авторских прав на ИИ

Четыре поведенческие стратегии для улучшения рассуждающих языковых моделей

Yelp адаптирует технологии ИИ для улучшения пользовательского опыта

Великая перестройка ПО: ИИ не просто поглощает всё, он и есть всё

Turing, ключевой поставщик кодирования для OpenAI и других производителей LLM, привлек $111 млн при оценке в $2,2 млрд

A-MEM: как новая структура памяти для агентов ИИ помогает решать сложные задачи

Ceramic.ai Анны Паттерсон стремится помочь предприятиям создавать модели AI быстрее и эффективнее

Salesforce обновила платформу Agentforce: теперь их ИИ-агенты могут автономно управлять корпоративными системами

Тест BIG-Bench Extra Hard: как он выявляет недостатки в больших языковых моделях

Как сократить затраты на системы ИИ: новый метод исследователей Zoom Communications

Deepseek: как превратить языковые модели в прибыльный бизнес, несмотря на снижение цен на рынке

Akool объединяет модели GenAI с 2D-аватарами для создания реалистичных персонажей

Когда ИИ-риэлтор убеждает лучше людей: новое исследование

Способен ли ИИ помочь нам в дипломатии?

YandexGPT заняла первое место в англо‑русском переводе среди нейросетей по результатам бенчмарка DiBiMT

MLGym – новый шаг в автоматизации научных исследований

«Темпоральные головы» в языковых моделях: новые возможности для AI

Ставка ИИ на $305 миллионов: модели логического вывода увеличивают спрос на графические процессоры

Инновационный подход NYU Langone Health к медицинскому образованию с использованием искусственного интеллекта

Разобучаем языковые модели: как заставить ИИ забыть только нужные знания

Интеграция AI с поисковыми системами: почему Deep Research — это прорыв

CAPA: новый инструмент для обнаружения сходства ошибок в LLM

Проблемы языковых моделей при анализе длинных текстов: выводы исследования

C апреля 2025 года BILLmanager прекратит выпуск обновлений для CentOS Linux 7

Читайте также

ГД в четверг планирует рассмотреть в третьем чтении проект бюджета

В Новосибирске супружескую пару подозревают в организации незаконной миграции

На Камчатке задержали подозреваемого в попытке диверсии на автозаправке

Несколько школ закрылось из-за отзыва токсичного песка для игр