Вышел Evo 2: ИИ генерирующий ДНК
А если быть точным: ДНК/РНК и белковые структуры. И не только генерирующий, но и умеющий анализировать геном, предсказывать мутации, etc. Это полностью открытая модель, выпущенная совместно NVidia и Arc Institute.
Это полностью открытая модель, выпущенная совместно NVidia и Arc Institute.
Теперь ученые всего мира могут воспользоваться Evo 2 – новой мощной фундаментальной моделью, понимающей генетический код всех форм жизни (звучит очень громко, но это взято из официального анонса). Представленная сегодня ИИ-модель, которая заявляется как крупнейшая модель в открытом доступе для генетических данных, Evo 2 была разработана на платформе NVIDIA DGX Cloud в сотрудничестве с некоммерческим биомедицинским исследовательским институтом Arc Institute и Стэнфордским университетом. Evo 2 доступна для разработчиков по всему миру через платформу NVIDIA BioNeMo, включая NVIDIA NIM – микросервис для развертывания ИИ.
Обученная на массиве данных объемом почти 9 трлн нуклеотидов (строительных блоков ДНК и РНК), Evo 2 применяется в биомолекулярных исследованиях. Она способна:
предсказывать структуру и функцию белков на основе их генетической последовательности,
идентифицировать новые молекулы для медицины и промышленности,
анализировать влияние мутаций на функции генов.
Evo 2: Архитектура и параметры модели
Модель была обучена на 2 048 NVIDIA H100 GPUs на NVIDIA DGX Cloud.
Основные характеристики:
Данные для обучения: Все домены жизни + бактериофаги (9T нуклеотидов)
Параметры модели: 7B + 40B
Контекстное окно: до 1 048 576 токенов
Модальности: ДНК, РНК, белки
Безопасность: Исключены вирусы эукариот
Применение: Широкие кросс-видовые задачи, продвинутое биологическое моделирование
Прогнозирующие возможности Evo 2 превосходят специализированные модели в различных задачах:
Анализ влияния мутаций: модель достигает передовой точности (SotA) в предсказании функциональных эффектов мутаций у разных видов, включая человека, без дополнительного обучения (zero-shot).
Определение жизненно важных генов: объединяя молекулярную и системную биологию, выявляет ключевые гены в прокариотических и эукариотических геномах, что подтверждено экспериментальными данными.
Генеративные возможности: позволяет создавать сложные биологические системы, такие как геномы прокариот и эукариот, или механизм доступности хроматина. Это открывает новые возможности в биологическом моделировании с практическим применением.
Новая эра генеративной геномики
"Evo 2 – это важный шаг вперед в области генеративной геномики. Глубже понимая фундаментальные строительные блоки жизни, мы сможем разрабатывать решения для медицины и экологии, которые раньше казались невозможными."
– Патрик Хсу, соучредитель Arc Institute, ведущий исследователь и доцент биоинженерии Калифорнийского университета в Беркли.
"Создание новых биологических систем традиционно требовало сложных, длительных и непредсказуемых процессов. С Evo 2 мы делаем биологический дизайн сложных систем доступнее, ускоряя процесс разработки новых решений в разы."
– Брайан Хи, доцент химической инженерии в Стэнфорде и исследователь Arc Institute.
Применение в биомолекулярных науках
Evo 2 анализирует ДНК, РНК и белки. Модель обучена на множестве видов, включая растения, животных и бактерии, и применяется в медицине, агробиотехнологиях и материаловедении.
Она использует новую архитектуру, обрабатывая генетические последовательности длиной до 1 млн токенов. Это позволяет находить связи между удаленными участками генома и понимать механизмы работы клеток, экспрессии генов и заболеваний.
"Ген человека содержит тысячи нуклеотидов, и для его анализа ИИ-модель должна одновременно обрабатывать максимально длинные последовательности", – пояснил Хсу.
В медицине Evo 2 может помочь определять мутации, связанные с болезнями, и разрабатывать новые молекулы для их лечения. Например, в тестах с геном BRCA1, связанным с раком молочной железы, Evo 2 предсказала влияние ранее неизвестных мутаций с точностью 90%.
В сельском хозяйстве модель может помочь разрабатывать устойчивые к климату и более питательные сорта растений. В других сферах науки Evo 2 способна создавать биотопливо или белки, разлагающие пластик и нефть.
"Запуск Evo 2 – это как отправка мощного нового телескопа в глубины вселенной", – отметил Дэйв Берк, технический директор Arc, "Мы знаем, что перед нами безграничные возможности, но еще не представляем, какие открытия нас ждут."
Ссылки
Детальный обзор в блоге NVidia
Детальный отчет Arc Institute
P.S. Я веду телеграм-канал, где регулярно пишу про новые технологии, разработку, все ключевые вещи в мире ИИ/агентов, да и про технологический бизнес в целом. А ещё я часто даю там довольно глубокую аналитику по громким новостям. В общем, велком!
Написать комментарий