Немецкий стартап представляет Finetuning API для персонализации AI-изображений Flux Pro
Немецкий стартап в области AI Black Forest Labs представил новый API, который позволяет пользователям настраивать свою модель AI-изображений FLUX Pro, чтобы соответствовать конкретным стилям брендов, используя всего пять образцов изображений.
Функция Finetuning API компании предназначена для решения ключевого ограничения современных генераторов AI-изображений: создание изображений, которые точно соответствуют конкретным визуальным стилям и идентичности бренда. По информации Black Forest Labs, модель сохраняет свою гибкость после тонкой настройки, одновременно интегрируя полученные из предоставленного пользователями контента данные в создание новых изображений. Система может генерировать изображения с разрешением до четырех мегапикселей.
Black Forest Labs разработала Finetuning API таким образом, чтобы он работал со всем ассортиментом продуктов компании. Настроенные модели интегрируются как с основными предложениями — FLUX.1 Pro и FLUX1.1 Pro Ultra, так и со специализированными инструментами, такими как FLUX.1 Fill для заполнения областей изображений и FLUX.1 Depth для структурного контроля.
Немецкая медиа-компания Burda Verlag использует Flux Finetuning API для создания настроенных версий модели изображений для своих различных брендов. Например, творческие команды компании теперь могут генерировать изображения для детского бренда Lissy PONY за считанные минуты, сохраняя при этом характерные визуальные элементы бренда.
API поддерживает распространенные форматы изображений, включая JPG, PNG и WebP файлы. Пользователи могут загружать от 1 до 20 обучающих изображений, каждое с максимальным разрешением в один мегапиксель. Black Forest Labs сообщает, что для оптимальных результатов требуется как минимум пять качественных изображений с четко определенными объектами.
Разработчики могут настраивать несколько параметров обучения, включая режим обучения (персонаж, продукт, стиль или общий), количество итераций обучения (минимум 100, по умолчанию 300) и скорость обучения. Для вывода разработчики могут выбирать между быстрой настройкой с ускоренной инференцией или более длительным временем обработки, которое дает более качественные результаты.
Black Forest Labs опубликовала конкретные рекомендации для различных сценариев использования. Например, при обучении моделей персонажей компания рекомендует использовать изображения, на которых показан только один объект одновременно. Для работы по переносу стиля тестирование более высоких мощностей тонкой настройки, как правило, дает лучшие результаты.
FLUX Pro Finetuning API остается в стадии бета-тестирования и в настоящее время требует ключ API для доступа. Black Forest Labs не раскрыла детали ценообразования и не объявила, когда сервис станет широко доступен.
Источник
Написать комментарий