Как генерация изображений с помощью ИИ с помощью DALL·E 2 может использоваться в цифровом маркетинге?
Опубликовано: 2022-10-17«Вау, ты взял это? Подождите, это сделал профессиональный фотограф?..
Это была реакция Джейка, нашего доктора медицины, когда я показал ему изображение ниже: фотореалистичное изображение, сгенерированное DALL·E 2 от OpenAI, созданное за несколько секунд с использованием подсказки, которую я ввел для «макросъемки бабочки на подсолнухе». .
Эта фотография выглядит очень реалистично и передает четкость и цвет бабочки на переднем плане и мягкий фокус подсолнуха на заднем плане. На самом деле, настолько, что вам будет трудно найти много людей, которые могут найти какие-либо очевидные признаки хвоста, артефакты или ощущение неправильности, которые могут быть обычным явлением в изображениях, созданных ИИ.
В этот момент я понял, что мы подошли к моменту, когда передовые системы искусственного интеллекта могут понимать и создавать фотореалистичные изображения, которые во многих случаях неотличимы от реальной жизни. Это имеет интересные последствия для всех, кто работает в творческой и цифровой индустрии, или на любой должности, связанной с поиском изображений или манипулированием изображениями.
В этой статье я расскажу о некоторых практических применениях OpenAI DALL·E 2 в мире творчества и цифрового маркетинга и о том, как недавно обновленные инструменты редактирования DALL·E 2 можно использовать для поддержки творческой работы.
Что такое ДАЛЛ·Е 2?
DALL·E 2 от OpenAI — это генератор изображений на основе искусственного интеллекта, который принимает простое текстовое приглашение и генерирует изображения на основе понимания этого приглашения ИИ. В течение нескольких секунд вы получите четыре сгенерированных варианта изображения, которые затем можно загрузить, поделиться ими или сохранить в качестве избранного в своей учетной записи OpenAI.
DALL·E 2 теперь доступен каждому. Вы получаете 15 бесплатных кредитов в месяц, по 1 кредиту на поколение, а каждые 115 кредитов стоят 15 долларов. Вы можете создавать изображения с нуля или загружать свои собственные фотографии для обработки при условии, что они соответствуют Политике содержания DALL·E 2 и, согласно условиям использования, вы «можете использовать Generations для любых законных целей, в том числе для коммерческого использования».
Это делает атрибуцию интересной темой и тем, сколько кредитов следует отдавать человеку, предоставляющему подсказки, источнику изображения при редактировании изображения или DALL·E 2. Все изображения, которые я использовал в этом сообщении в блоге, например, я либо сгенерировано с помощью DALL·E 2 или сгенерировано модифицированным изображением из стандартной библиотеки, но я бы чувствовал себя несколько мошенником, если бы приписал эти поколения или модификации себе.
Изображения могут быть созданы на основе:
- Тематика: вы можете генерировать изображения чего угодно; пейзажи, животные, объекты, абстрактные понятия, если они соответствуют политике в отношении контента, которая, например, запрещает создание изображений известных людей, чтобы избежать распространения дипфейков.
- Среда: от карандашных набросков и картин маслом до пиксельной графики и цифровых иллюстраций, DALL·E 2 может генерировать изображения, представляющие любой вид среды.
- Настройки окружающей среды: добавьте к подсказкам факторы окружающей среды, такие как «закат» или «туман», чтобы придать вашим изображениям немного атмосферы.
- Местоположение: если вам нужно разместить изображения в определенном месте, укажите город или страну, и вы должны получить ориентиры, стили зданий и т. д., связанные с этим местом.
- Художественный стиль: DALL·E 2 может генерировать изображения в стиле разных художников. Просто добавьте «в стиле [художника]» к своим подсказкам.
- Настройки камеры: особенно полезно для фотографических стилей, вы можете добавить настройки камеры к своим запросам, чтобы придать фотографиям различные снимки и качество. Примеры включают «Макросъемка 35 мм», «длинная выдержка» или «объектив «рыбий глаз».
Просто используйте естественный язык, чтобы объединить любое из вышеперечисленных, чтобы помочь описать то, что вы хотите, например, «Гомер Симпсон в парижском кафе в стиле Пикассо», и в течение нескольких секунд вы получите несколько поколений.
При изучении возможностей DALL·E 2 легко заблудиться в кроличьей норе, но существует также много практических применений этого инструмента, особенно в дизайне и маркетинге, которые рассматриваются далее в этой статье.
Как работает DALL·E 2?
Я не буду притворяться, что полностью понимаю или даже попытаюсь объяснить, как именно работает генерация изображений DALL·E 2 AI — есть много статей, посвященных этому. Но я могу сказать, что это гораздо больше, чем умный алгоритм, использующий сложный набор логики. Это машинное обучение. Искусственный интеллект, который со временем обучался на миллиардах исходных изображений и естественного языка, а также на взаимосвязях между ними.
В его основе лежит модель распространения, которая начинается со случайного шума и итеративно уточняется в течение нескольких циклов, пока не появится нечто, напоминающее понимание ИИ запрошенной подсказки.
Сам инструмент DALL·E 2 прост в использовании. После входа в систему вас приветствует простое поле ввода, где вы можете начать создавать изображения на основе текстового приглашения или загрузить свое собственное изображение для редактирования.
Ряд инструментов редактирования изображений становится доступным как для сгенерированных, так и для загруженных изображений, которые мы рассмотрим позже в этой статье.
Использование DALL·E 2 для поиска изображений
Одним из наиболее очевидных применений генерации изображений на основе ИИ является поиск фотографий или других стилей изображений для использования в сообщениях в блогах, презентациях, веб-сайтах, рекламе и различных других средах. Библиотеки стоковых фотографий, такие как ShutterStock, iStockPhotos или Unsplash, часто являются популярным выбором, когда дело доходит до поиска изображений, но мы, вероятно, увидим, что люди все чаще обращаются к таким, как DALL·E 2 для более быстрой и дешевой альтернативы, а также для создания изображений, которые действительно уникальны и не существуют больше нигде в Интернете.
DALL·E 2 может быть особенно полезен при поиске изображений с очень конкретной тематикой, таких как «Золотистый ретривер сидит на пляже и смотрит на закат» или «Фотография лисы, прыгающей через колокольчики в лесу на фоне солнца». светит сквозь деревья». Поиск похожих изображений из различных библиотек стоковых фотографий, вероятно, займет больше времени, и во многих случаях тема вряд ли существует.
Что меня действительно поразило в фотографическом стиле генерации изображений, так это то, что DALL·E 2 может точно воспроизводить все виды условий окружающей среды. От бликов солнечного света и точного отбрасывания теней до резкости объектов вблизи и постепенного размытия более удаленных элементов. Вы также можете включить подсказки для различных настроек камеры, таких как «Макро 35 мм», «Рыбий глаз» или «Блики».
При создании изображений фотографического качества я наблюдал более реалистичные генерации из более распространенных предметов. Например, фотографий собак на пляжах намного больше, чем лисиц, прыгающих в колокольчики, так что ИИ может найти больше контента, на который можно ссылаться.
Одно ключевое ограничение, на которое стоит обратить внимание, заключается в том, что все сгенерированные изображения ограничены размером 1024 x 1024 пикселей, поэтому в ближайшее время мы не будем создавать фотографии для рекламных щитов…
Увеличение размеров изображения
Я вижу одно из наиболее распространенных применений DALL·E 2 в мире творчества и маркетинга — улучшение и редактирование существующих изображений, а не полное создание новых изображений. Как веб-разработчик, я часто сталкиваюсь с проблемами, когда можно найти отличное приличное изображение, но соотношение и размеры приводят к плохому кадрированию при загрузке изображения из-за того, что контейнер изображения имеет другое соотношение с изображением.
Вот пример. Прекрасное стоковое изображение собаки, высовывающейся из окна автомобиля, которое было предназначено для использования на изображении известного героя, но стандартное соотношение сторон исходной фотографии не очень хорошо сочеталось со сверхшироким соотношением сторон 21:9 избранного героя. баннер.
Загрузив изображение в DALL·E 2 и используя инструмент «Создание кадра», мы можем расширить изображение, позволив ИИ заполнить пробелы. При использовании кадра генерации вы всегда захотите сохранить часть исходного изображения внутри кадра, чтобы дать ИИ больше информации для работы.
Текст подсказки также важен здесь, и обычно вы хотите описать то, что вы хотите, в кадре генерации, а не во всем изображении. Для этой подсказки я просто использовал «холмы и небо», а DALL·E 2 сделал все остальное.
Для каждого поколения DALL·E 2 предложит вам четыре варианта на выбор. Изображение выше, на мой взгляд, было наиболее правдоподобным; с хорошим расширением дороги, несколькими сгенерированными деревьями, некоторыми интересными облаками без драматического наложения и ручьем (о котором я не просил, но хорошим дополнением), бегущим за деревьями.
Редактирование артефактов
Внесение изменений в проблемные части изображений также может быть выполнено быстро и эффективно с помощью DALL·E 2. В приведенном ниже примере был недавний запрос на замену отвлекающего отражения в защитных очках руководителя строительства.
Используя инструмент «Ластик», чтобы отредактировать отражающую часть изображения, показанного в левом верхнем углу, вместе с подсказкой «Женщина в защитных очках смотрит на iPad», DALL·E 2 сгенерировал остальное, вплоть до края и блика. очков, растушевки и точного подбора цвета.
Добавление содержимого к существующему изображению
Точно так же добавление элементов к изображению может быть таким же простым, как их удаление. Вот пример фотографии человека, смотрящего на долину. Было бы неплохо, если бы их лучший друг был рядом с ними? Нет проблем, просто сотрите с изображения пространство размером с собаку с помощью инструмента «Ластик» и дайте соответствующую подсказку; «Золотистый ретривер, сидящий рядом с женщиной, смотрящей вдаль» был использован в приведенном ниже примере.
Создание визуально похожих изображений
Возможно, вы нашли действительно хорошее изображение с точки зрения композиции и тематики, но по какой-то причине оно просто не работает. Не внося вообще никаких правок и изменений в текст подсказки, вы можете использовать функцию «Создать вариации» для создания стилистически и композиционно похожих изображений.
В приведенном ниже примере освещение, затенение, ракурсы камеры очень похожи, и воссоздан тот же тип собаки, а также женщина в куртке, смотрящая на холмы, через которые проходит дорога, но элементы имеют все элементы. измененный; холмы и дорога новые, а женщина и собака другие.
Создание мудбордов
На ранних этапах творческого проекта доски настроения часто используются для определения визуального стиля, тона и творческого направления путем поиска сочетания существующих скриншотов, текста и изображений. Поскольку вы можете запросить DALL·E 2 для любого визуального стиля, от карандашных рисунков и рисунков до пиксельной графики и 3D-рендеринга, генеративный ИИ может стать хорошей отправной точкой для установки визуального тона или направления.
Поддержка продвижения бренда
При развертывании нового бренда обычно макетируют, как новый дизайн будет выглядеть на разных стационарных предметах, или визуализируют дизайн веб-сайта на месте на разных устройствах. DALL·E 2 может помочь в создании уникального фона, связанного с бизнесом клиента.
Например, создание изображения визитных карточек в поле с полевыми цветами для эко-ориентированного бренда или создание макета ноутбука на фоне современного дома для бизнеса в секторе жилищного строительства.
Получение вдохновения
Я думаю, что мы все еще далеки от создания готовых к печати или полностью разработанных визуальных эффектов для творческих развертываний, но одна из областей, где DALL·E 2 может быть полезна для поддержки процесса проектирования, — это предоставление быстрого вдохновения для запуска творческих соков. .
Например, я сгенерировал нижеследующее, пытаясь создать логотип для нового эля в стиле стимпанк, используя подсказку «дизайн логотипа для эля в стиле стимпанк». Хотя DALL·E 2 отлично понимает текстовые подсказки, генерация текста — это одна из областей, где DALL·E 2 испытывает затруднения. Во всех произведенных вариантах текст либо допустим, либо бессмысленен. Несмотря на это, я думаю, что у этих поколений все еще есть потенциал для вдохновения, будь то цвета, композиция или элементы, используемые в созданных изображениях.
Изготовление черновых макетов
Еще одна область, в которой DALL·E 2 может помочь, — это поиск черновых макетов и композиций, которые можно использовать в качестве идеи или отправной точки для рекламы и дизайна веб-сайтов. Приведенные ниже примеры дизайна веб-сайта и рекламы брошюры были основаны на подсказках «Дизайн [веб-сайта] [брошюры] для компании, работающей в сфере устойчивой энергетики».
Благодаря машинному обучению и пониманию миллиардов исходных изображений DALL·E 2 естественным образом будет включать стандартные соглашения, когда дело доходит до макетов. В примере с дизайном веб-сайта основная навигация показана вверху для всех вариантов, логотип бренда обычно находится в верхнем левом углу, и почти всегда под заголовком был большой главный блок и большой заголовок, за которым следовали абзацы текста. Точно так же зеленый цвет был общей цветовой темой с этими вариациями, поскольку он, естественно, тесно связан со словом «устойчивое развитие».
Текст заметно неразборчив, а многие изображения в макетах неясны, но с композиционной точки зрения, я думаю, что здесь достаточно потенциала для DALL·E 2, чтобы взять на себя вспомогательную роль при поиске вдохновения для макетов.
Вывод
DALL·E 2 от OpenAI и прогресс, который мы сейчас наблюдаем с моделями генерации изображений на основе ИИ, такими как Imagen от Google (еще не для общественного потребления), несомненно, впечатляют, и я вижу их роль в цифровом маркетинге и творческом пространстве гораздо больше. поддерживающая, а не прямая угроза творческим и маркетинговым ролям. Как мы видели в некоторых приведенных выше примерах, существуют некоторые очевидные ограничения, особенно в отношении размера вывода и генерации текста. Даже с большинством изображений, основанных на фотографиях, используемых в статье, большинство людей, вероятно, смогут сказать, что большинство из них не настоящие фотографии, но со временем это будет становиться все труднее обнаружить.
Мы все еще находимся на ранних этапах создания изображений на основе ИИ, но я вижу много полезных приложений для творческого и маркетингового сектора, от создания вдохновения и идей до поиска источников изображений и расширенного редактирования изображений. Вскоре API для этих инструментов станут доступны и будут встроены в популярные инструменты дизайна, такие как PhotoShop или Figma. Это увлекательная область, и я буду следить за ее развитием в ближайшие месяцы и годы.