Al генератор Google Whisk «переделает» загруженные изображения

16:50
19 Декабря 2024
117

Компания Google представила новый инструмент искусственного интеллекта Whisk, который позволяет создавать изображения, используя другие изображения в качестве подсказок, вместо традиционных текстовых описаний.

Whisk — это экспериментальный проект Google, который предлагает "забавный" способ использовать Аl для генерации изображений, опираясь на визуальные подсказки.

Пользователи могут выбирать изображения, которые определяют предмет, сцену или стиль желаемого изображения, и даже добавлять несколько изображений для каждой категории. Если нет подходящих изображений, можно воспользоваться функцией случайного выбора, чтобы Google предложил изображения-подсказки (которые также могут быть созданы Аl). Конечно, присутствует возможность ввода текстового описания, чтобы уточнить детали, но это необязательно.

В блоге Google отмечается, что Whisk предназначен для "быстрого визуального изучения", а не для детального редактирования. Компания признает, что инструмент может ошибаться, поэтому пользователи могут изменять базовые подсказки.

Whisk использует обновленную версию модели генерации изображений Imagen 3, которую Google также анонсировала. Кроме того, компания представила Veo 2, новую версию модели для создания видео. Veo 2, по словам Google, лучше понимает "язык кинематографии" и уменьшает вероятность ошибок, таких как дополнительные пальцы, по сравнению с другими моделями (например, Sora от OpenAI). Veo 2 будет доступен для тестирования в Google VideoFX через список ожидания Google Labs, а в следующем году он будет интегрирован в короткие видео на YouTube и другие продукты.

Источник

Материал опубликован при поддержке сайта habr.com

Читайте так же: