Новая модель AI Tencent Hunyuan3D 2.0 превращает 2D-изображения в детализированные 3D-объекты
Tencent выпустила версию 2.0 Hunyuan3D — генеративной системы искусственного интеллекта с открытым исходным кодом, которая создает текстурированные 3D-модели из обычных изображений. Система разделяет работу между двумя специализированными компонентами: один обрабатывает базовые 3D-фигуры, а другой добавляет реалистичные текстуры.
Под капотом система использует Hunyuan3D-DiT, модель диффузионного трансформатора, которая вычисляет основные формы объектов и представляет их в сжатом виде. Как только она понимает базовую структуру, она создает 3D-формы, которые точно соответствуют входному изображению.
Текстурирование происходит через Hunyuan3D-Paint, который учитывает такие детали, как углы и положения поверхности, чтобы создавать текстуры, которые выглядят естественно с любого угла обзора. Система даже удаляет световые эффекты из исходного изображения, гарантируя, что текстуры будут хорошо работать при любом освещении.
Последняя версия предлагает несколько улучшений по сравнению с предыдущей. Распознавание форм теперь более точно улавливает мелкие детали, такие как края и углы, что приводит к лучшему воспроизведению лиц, поверхностных узоров и текста. Исследователи говорят, что новые модели получаются чистыми, без дыр и ошибок, которые часто мешают 3D-генерации.
Тесты показывают, что Hunyuan3D 2.0 превосходит аналогичные инструменты по всем направлениям — в генерации форм, текстурировании и общем качестве модели. Один из ярких примеров показывает, как система точно воспроизводит читаемый текст на табличке, которую держит модель пингвина.
Чтобы сделать технологию более доступной, Tencent запустил Hunyuan3D-Studio — веб-инструментарий для создания 3D. Пользователи могут преобразовывать эскизы в 3D-модели, упрощать сложные проекты и даже анимировать персонажей — хотя для доступа требуется вход через WeChat, QQ или китайский номер телефона.
Выпуская систему с открытым исходным кодом , Tencent надеется создать основу для будущих моделей 3D AI и стимулировать дальнейшие исследования. Этот шаг происходит в то время, как другие технологические гиганты, такие как Nvidia , Stability AI и Meta*, продвигаются вперед со своими собственными достижениями в области генерации 3D на основе AI.
Meta* и ее продукты (Facebook, Instagram) запрещены на территории Российской Федерации
Источник
Написать комментарий