Вышел Evo 2: ИИ генерирующий ДНК

А если быть точным: ДНК/РНК и белковые структуры. И не только генерирующий, но и умеющий анализировать геном, предсказывать мутации, etc. Это полностью открытая модель, выпущенная совместно NVidia и Arc Institute.

Это полностью открытая модель, выпущенная совместно NVidia и Arc Institute.

Теперь ученые всего мира могут воспользоваться Evo 2 – новой мощной фундаментальной моделью, понимающей генетический код всех форм жизни (звучит очень громко, но это взято из официального анонса). Представленная сегодня ИИ-модель, которая заявляется как крупнейшая модель в открытом доступе для генетических данных, Evo 2 была разработана на платформе NVIDIA DGX Cloud в сотрудничестве с некоммерческим биомедицинским исследовательским институтом Arc Institute и Стэнфордским университетом. Evo 2 доступна для разработчиков по всему миру через платформу NVIDIA BioNeMo, включая NVIDIA NIM – микросервис для развертывания ИИ.

Обученная на массиве данных объемом почти 9 трлн нуклеотидов (строительных блоков ДНК и РНК), Evo 2 применяется в биомолекулярных исследованиях. Она способна:

  • предсказывать структуру и функцию белков на основе их генетической последовательности,

  • идентифицировать новые молекулы для медицины и промышленности,

  • анализировать влияние мутаций на функции генов.

Evo 2: Архитектура и параметры модели

Модель была обучена на 2 048 NVIDIA H100 GPUs на NVIDIA DGX Cloud.

Основные характеристики:

  • Данные для обучения: Все домены жизни + бактериофаги (9T нуклеотидов)

  • Параметры модели: 7B + 40B

  • Контекстное окно: до 1 048 576 токенов

  • Модальности: ДНК, РНК, белки

  • Безопасность: Исключены вирусы эукариот

  • Применение: Широкие кросс-видовые задачи, продвинутое биологическое моделирование

Прогнозирующие возможности Evo 2 превосходят специализированные модели в различных задачах:

  • Анализ влияния мутаций: модель достигает передовой точности (SotA) в предсказании функциональных эффектов мутаций у разных видов, включая человека, без дополнительного обучения (zero-shot).

  • Определение жизненно важных генов: объединяя молекулярную и системную биологию, выявляет ключевые гены в прокариотических и эукариотических геномах, что подтверждено экспериментальными данными.

  • Генеративные возможности: позволяет создавать сложные биологические системы, такие как геномы прокариот и эукариот, или механизм доступности хроматина. Это открывает новые возможности в биологическом моделировании с практическим применением.

Новая эра генеративной геномики

"Evo 2 – это важный шаг вперед в области генеративной геномики. Глубже понимая фундаментальные строительные блоки жизни, мы сможем разрабатывать решения для медицины и экологии, которые раньше казались невозможными."

– Патрик Хсу, соучредитель Arc Institute, ведущий исследователь и доцент биоинженерии Калифорнийского университета в Беркли.

"Создание новых биологических систем традиционно требовало сложных, длительных и непредсказуемых процессов. С Evo 2 мы делаем биологический дизайн сложных систем доступнее, ускоряя процесс разработки новых решений в разы."

– Брайан Хи, доцент химической инженерии в Стэнфорде и исследователь Arc Institute.

Применение в биомолекулярных науках

Evo 2 анализирует ДНК, РНК и белки. Модель обучена на множестве видов, включая растения, животных и бактерии, и применяется в медицине, агробиотехнологиях и материаловедении.

Она использует новую архитектуру, обрабатывая генетические последовательности длиной до 1 млн токенов. Это позволяет находить связи между удаленными участками генома и понимать механизмы работы клеток, экспрессии генов и заболеваний.

"Ген человека содержит тысячи нуклеотидов, и для его анализа ИИ-модель должна одновременно обрабатывать максимально длинные последовательности", – пояснил Хсу.

В медицине Evo 2 может помочь определять мутации, связанные с болезнями, и разрабатывать новые молекулы для их лечения. Например, в тестах с геном BRCA1, связанным с раком молочной железы, Evo 2 предсказала влияние ранее неизвестных мутаций с точностью 90%.

В сельском хозяйстве модель может помочь разрабатывать устойчивые к климату и более питательные сорта растений. В других сферах науки Evo 2 способна создавать биотопливо или белки, разлагающие пластик и нефть.

"Запуск Evo 2 – это как отправка мощного нового телескопа в глубины вселенной", – отметил Дэйв Берк, технический директор Arc, "Мы знаем, что перед нами безграничные возможности, но еще не представляем, какие открытия нас ждут."

Ссылки

  • Детальный обзор в блоге NVidia

  • Детальный отчет Arc Institute


P.S. Я веду телеграм-канал, где регулярно пишу про новые технологии, разработку, все ключевые вещи в мире ИИ/агентов, да и про технологический бизнес в целом. А ещё я часто даю там довольно глубокую аналитику по громким новостям. В общем, велком!

Материал опубликован при поддержке сайта habr.com
Комментарии

    Актуальные новости по теме "Array"