DALL-E, а также DALL-E 2 – это модели искусственного интеллекта, разработанные компанией OpenAI и предназначенные для создания цифровых изображений на основе описаний на естественном языке. OpenAI добавил новую функцию «outpointing» в DALL-E, которая позволяет системе создавать новые визуальные эффекты, расширяющие границы любого изображения, сообщает издание The Verge.
DALL-E с помощью человеческих подсказок «представляет» то, что находится вне портрета Йоханнеса Вермера «Девушка с жемчужной серьгой». Интересно, что даже по ограниченной информации система может соответствовать стилю Вермера, имитируя тени и блики оригинала.
DALL·E: Introducing Outpainting
Extend creativity and tell a bigger story with DALL-E images of any size
blog: pic.twitter.com/9sOyDMPEb7
— AK (@_akhaliq) August 31, 2022
На покадровой съемке можно увидеть, как художник Август Камп расширял изображение на небольшие части за раз, часто перерабатывая сгенерированные изображения DALL-E, чтобы получить желаемый результат. Система не генерирует эти расширения сама по себе: как и в любом искусственном интеллекте, превращающем текст в изображение, эта модель требует, чтобы люди описывали визуальные эффекты.
Зарисовку как функцию можно использовать для расширения оригинального содержимого, но, конечно, многие DALL-E использовали эту возможность в карикатурных целях.
С более широкой точки зрения, зарисовка на самом деле не расширяет базовую функциональность систем искусственного интеллекта такого типа. Впрочем, оно показывает, как OpenAI, вероятно, будет позиционировать себя на растущем рынке этих систем, сделав удобство использования ключевым фактором для клиентов.
Многие модели искусственного интеллекта для преобразования текста в изображение могут выполнять ту же важную функцию, что и зарисовка, но, как и сам DALL-E до этого обновления, требует много ручных манипуляций. Сделать зарисовку максимально простым поможет DALL-E выделиться среди растущей конкуренции меньших систем, таких как Midjourney и Stable Diffusion.
Сама DALL-E доступна через программу бета-тестирования, к которой пока имеют доступ более миллиона пользователей. Каждый пользователь бета-версии получает 50 бесплатных поколений изображений в течение первого месяца, а затем 15 дополнительных использований ежемесячно. Позже можно сгенерировать 115 дополнительных изображений за $15.
