DALL·E 2를 통한 AI 이미지 생성은 디지털 마케팅에 어떻게 활용될 수 있을까요?
게시 됨: 2022-10-17"야, 너 그거 가져왔어? 잠깐만, 전문 포토그래퍼가 찍어준 건데...?"
이것이 우리 MD인 Jake에게 아래 이미지를 보여주었을 때의 반응이었습니다. OpenAI의 DALL·E 2로 생성된 사실적인 이미지로, "해바라기 위의 나비의 매크로 사진"에 대해 입력한 프롬프트를 사용하여 몇 초 만에 생성되었습니다. .
전경의 나비의 선명도와 색상, 배경의 해바라기의 부드러운 초점을 포착하여 너무 사실적으로 보이는 사진입니다. 사실, AI 생성 이미지에서 흔히 볼 수 있는 명백한 꼬리 표시, 인공물 또는 잘못된 감각을 찾을 수 있는 많은 사람들을 찾기가 너무 어렵습니다.
첨단 AI 시스템이 실제와 거의 구별할 수 없는 사실적인 이미지를 이해하고 생성할 수 있는 시점에 이르렀음을 실감하는 순간이었습니다. 이는 크리에이티브 및 디지털 산업, 또는 이미지 소싱 또는 이미지 조작과 관련된 모든 역할에 종사하는 모든 사람에게 흥미로운 의미를 갖습니다.
이 기사에서는 크리에이티브 및 디지털 마케팅 세계에서 OpenAI의 DALL·E 2를 사용하는 몇 가지 실용적인 응용 프로그램과 DALL·E 2의 최근 업그레이드된 편집 도구를 사용하여 크리에이티브 작업을 지원하는 방법을 탐구합니다.
DALL·E 2란?
OpenAI의 DALL·E 2는 간단한 텍스트 기반 프롬프트를 가져와서 해당 프롬프트에 대한 AI의 이해를 기반으로 이미지를 생성하는 AI 기반 이미지 생성기입니다. 몇 초 안에 4개의 이미지 변형이 생성되어 OpenAI 계정 내에서 다운로드, 공유 또는 즐겨찾기로 저장할 수 있습니다.
DALL·E 2는 이제 누구나 사용할 수 있습니다. 매월 15개의 무료 크레딧이 제공되며, 세대당 1개의 크레딧이 필요하며 115개 크레딧마다 $15입니다. DALL·E 2 콘텐츠 정책을 준수하고 사용 약관에 따라 "상업적 사용을 포함한 모든 법적 목적으로 Generations를 사용할 수" 있는 경우 처음부터 이미지를 생성하거나 자신의 사진을 업로드하여 조작할 수 있습니다.
이것은 저작자 표시를 흥미로운 주제로 만들고 프롬프트를 제공하는 사람에게 얼마나 많은 크레딧을 제공해야 하는지, 이미지 또는 DALL·E 2를 편집할 때 이미지 소스를 제공해야 합니다. 예를 들어 이 블로그 게시물에서 사용한 모든 이미지는 DALL·E 2로 생성하거나 수정된 스톡 라이브러리 이미지를 생성했지만 이러한 세대 또는 수정을 나 자신의 탓으로 돌리면 다소 사기를 느낄 것입니다.
다음을 기반으로 이미지를 생성할 수 있습니다.
- 주제: 원하는 모든 이미지를 생성할 수 있습니다. 풍경, 동물, 사물, 추상적 개념은 예를 들어 딥페이크의 확산을 방지하기 위해 유명인의 이미지 생성을 금지하는 콘텐츠 정책을 준수하는 한 허용됩니다.
- 매체: 연필 스케치 및 유화에서 픽셀 아트 및 디지털 일러스트레이션에 이르기까지 DALL·E 2는 모든 종류의 매체를 나타내는 이미지를 생성할 수 있습니다.
- 환경 설정: 이미지에 약간의 분위기를 주기 위해 "일몰" 또는 "안개"와 같은 즉각적인 환경 요소를 추가합니다.
- 위치: 특정 위치에 이미지를 배치해야 하는 경우 프롬프트에 도시 또는 국가를 지정하면 해당 장소와 관련된 랜드마크, 건물 스타일 등을 얻을 수 있습니다.
- 예술적 스타일: DALL·E 2는 다양한 아티스트의 스타일로 이미지를 생성할 수 있습니다. 프롬프트에 "in the style of [artist]"를 추가하기만 하면 됩니다.
- 카메라 설정: 사진 스타일에 특히 유용합니다. 요청에 카메라 설정을 추가하여 사진에 다양한 샷과 품질을 제공할 수 있습니다. 예로는 "매크로 35mm 샷", "장노출" 또는 "어안 렌즈"가 있습니다.
"피카소 스타일의 파리 카페에 있는 호머 심슨"과 같이 원하는 것을 설명하는 데 도움이 되도록 위의 모든 것을 결합하기 위해 자연어를 사용하면 몇 초 안에 여러 세대를 얻을 수 있습니다.
DALL·E 2 기능을 탐색할 때 가능성의 토끼굴에서 길을 잃기 쉽지만 특히 이 기사의 뒷부분에서 살펴볼 디자인 및 마케팅에서 도구의 실용적인 응용 프로그램이 많이 있습니다.
DALL·E 2는 어떻게 작동합니까?
DALL·E 2 AI 이미지 생성이 어떻게 작동하는지 완전히 이해한 척하거나 심지어 설명하려고 시도하지도 않습니다. 이 작업을 수행하는 많은 기사가 있습니다. 그러나 내가 말할 수 있는 것은 이것이 복잡한 논리 집합을 사용하는 스마트 알고리즘 그 이상이라는 것입니다. 머신러닝입니다. 시간이 지남에 따라 수십억 개의 소스 이미지와 자연어, 그리고 둘 사이의 관계에서 훈련된 인공 지능입니다.
그 중심에는 무작위 노이즈로 시작하고 요청된 프롬프트에 대한 AI의 이해와 유사한 것이 나타날 때까지 여러 주기에 걸쳐 반복적으로 정제되는 확산 모델이 있습니다.
DALL·E 2 도구 자체는 사용하기 쉽습니다. 로그인하면 텍스트 프롬프트를 기반으로 이미지 생성을 시작하거나 편집할 이미지를 업로드할 수 있는 간단한 입력 필드가 나타납니다.
생성된 이미지와 업로드된 이미지 모두에 다양한 이미지 편집 도구를 사용할 수 있게 되었으며 이에 대해서는 이 기사의 뒷부분에서 살펴보겠습니다.
이미지 소싱에 DALL·E 2 사용
AI 기반 이미지 생성의 가장 명백한 용도 중 하나는 블로그 게시물, 프레젠테이션, 웹사이트, 광고 및 기타 다양한 매체에 사용할 사진 또는 기타 이미지 스타일을 소싱하는 것입니다. ShutterStock, iStockPhotos 또는 Unsplash와 같은 스톡 사진 라이브러리는 이미지 소싱과 관련하여 인기 있는 선택인 경우가 많습니다. 온라인 어디에서도 볼 수 없는 고유한 이미지를 제공합니다.
DALL·E 2는 "해변을 바라보며 앉아 있는 골든 리트리버" 또는 "태양과 함께 삼림 지대에서 블루벨 사이로 점프하는 여우의 사진"과 같이 매우 구체적인 주제가 있는 이미지를 소싱할 때 특히 유용할 수 있습니다. 나무 사이로 빛나다". 다양한 스톡 사진 라이브러리에서 유사한 이미지를 소싱하는 것은 시간이 더 오래 걸리고 많은 경우 주제가 존재하지 않을 것입니다.
이미지 생성의 사진 스타일에서 정말 놀라운 점은 DALL·E 2가 모든 종류의 환경 설정을 정확하게 복제할 수 있다는 것입니다. 햇빛의 눈부심과 정확한 그림자 투사부터 가까운 물체의 선명도와 더 먼 요소의 점진적 흐림에 이르기까지. 'Macro 35mm', 'Fisheye' 또는 'Lens Flare'와 같은 다양한 카메라 기반 설정에 대한 프롬프트를 포함할 수도 있습니다.
사진 품질의 이미지를 생성할 때 보다 일반적인 주제에서 보다 사실적인 세대를 관찰했습니다. 예를 들어, 블루벨을 타고 뛰어오르는 여우보다 해변에 있는 개 사진이 더 많기 때문에 AI가 참조할 콘텐츠가 더 많습니다.
지적할 가치가 있는 한 가지 주요 제한 사항은 생성된 모든 이미지가 1024 x 1024 픽셀로 제한되어 있기 때문에 조만간 빌보드용 사진을 생성하지 않을 것이라는 점입니다...
이미지 크기 확장
내가 크리에이티브 및 마케팅 세계에서 DALL·E 2를 사용하는 일반적인 용도 중 하나는 새로운 이미지를 완전히 생성하는 것이 아니라 기존 이미지를 개선하고 편집하는 것입니다. 웹 개발자로서 나는 일반적으로 훌륭한 이미지를 찾았지만 이미지 컨테이너가 이미지에 대한 비율이 다르기 때문에 이미지를 업로드할 때 비율과 치수로 인해 잘리지 않는 문제에 직면합니다.
여기 예가 있습니다. 추천 영웅 유닛에 사용하도록 지정된 차창에 기대어 있는 강아지의 사랑스러운 스톡 이미지, 그러나 원본 사진의 표준 가로 비율은 추천 영웅의 초광각 21:9 비율과 잘 맞지 않았습니다. 배너.
DALL·E 2에 이미지를 업로드하고 'Generation Frame' 도구를 사용하여 AI가 공백을 채우도록 하여 이미지를 확장할 수 있습니다. 생성 프레임을 사용할 때 AI가 작업할 더 많은 정보를 제공하기 위해 항상 프레임 내에서 원본 이미지의 일부를 유지하기를 원할 것입니다.
프롬프트 텍스트도 여기에서 중요하며 일반적으로 전체 이미지보다는 생성 프레임에서 원하는 것을 설명하고 싶을 것입니다. 이 프롬프트에서는 "언덕과 하늘"을 사용하고 나머지는 DALL·E 2가 처리하도록 했습니다.
모든 세대에 대해 DALL·E 2는 선택할 수 있는 4가지 변형을 제공합니다. 내가 느낀 위의 이미지가 가장 믿음직스러웠다. 길의 좋은 확장, 생성된 소수의 나무, 극적인 오버레이가 없는 흥미로운 구름 및 나무 뒤에서 흐르는 개울(내가 요청하지 않았지만 좋은 추가 기능)이 있습니다.
아티팩트 편집
DALL·E 2를 사용하여 이미지의 문제가 있는 부분을 빠르고 효율적으로 편집할 수도 있습니다. 아래 예는 최근에 건설 관리자의 보안경에 반사된 산만함을 교체해야 하는 요청이었습니다.
지우개 도구를 사용하여 왼쪽 상단에 표시된 이미지의 반사 부분을 편집하고 "보안경을 쓴 여성이 iPad를 바라보고 있습니다"라는 프롬프트를 제공하여 DALL·E 2가 나머지를 생성했습니다. 안경, 음영 및 정확한 색상 일치.
기존 이미지에 콘텐츠 추가
마찬가지로 이미지에 요소를 추가하는 것은 제거하는 것만큼 쉽습니다. 다음은 계곡 건너편을 바라보는 사람의 사진의 예입니다. 가장 친한 친구가 옆에 있으면 좋지 않을까요? 문제 없습니다. 지우개 도구를 사용하여 이미지에서 개 크기의 공간을 지우고 적절한 프롬프트를 표시하면 됩니다. 아래 예에서는 "멀리 내다보는 여성 옆에 앉아 있는 골든 리트리버"가 사용되었습니다.
시각적으로 유사한 이미지 생성
구성과 주제 면에서 정말 좋은 이미지를 찾았지만 어떤 이유로든 제대로 작동하지 않을 수 있습니다. 프롬프트 텍스트를 전혀 편집하거나 변경하지 않고 '변형 생성' 기능을 사용하여 스타일 및 구성적으로 유사한 이미지를 만들 수 있습니다.
아래 예에서 조명, 음영, 카메라 앵글이 모두 매우 유사하고 동일한 유형의 개가 재생성되며 재킷을 입은 여성이 길을 따라 언덕을 내다보고 있지만 요소가 모든 것을 갖추고 있습니다. 변경됨; 언덕과 길은 새롭고 여자와 개는 모두 다릅니다.
무드보드 만들기
크리에이티브 프로젝트의 초기 단계에서 무드 보드는 기존 스크린샷, 텍스트 및 이미지를 혼합하여 시각적 스타일, 톤 및 크리에이티브 방향을 설정하는 데 자주 사용됩니다. DALL·E 2는 연필 드로잉과 페인트, 픽셀 아트 및 3D 렌더링에 이르기까지 모든 종류의 시각적 스타일에 대해 프롬프트를 표시할 수 있으므로 제너레이티브 AI는 시각적 톤이나 방향을 설정하는 좋은 출발점을 제공할 수 있습니다.
브랜드 출시 지원
새 브랜드를 출시할 때 새 디자인이 다양한 고정 품목에서 어떻게 보이는지 조롱하거나 다양한 장치에서 현장에서 웹사이트 디자인을 시각화하는 것이 일반적입니다. DALL·E 2는 클라이언트의 비즈니스와 관련된 고유한 배경 생성을 지원할 수 있습니다.
예를 들어, 친환경 브랜드의 야생화 밭에서 명함 이미지를 생성하거나 주택 건축 부문의 비즈니스를 위해 배경에 현대적인 집이 있는 노트북을 조롱하는 것입니다.
영감 얻기
크리에이티브 롤아웃을 위한 인쇄 준비 또는 완전히 디자인된 비주얼을 생성하려면 아직 멀었다고 생각하지만 DALL·E 2가 디자인 프로세스를 지원하는 데 유용할 수 있는 한 영역은 창의적인 주스가 흐르도록 하는 빠른 영감을 제공하는 것입니다. .
예를 들어 "steampunk Ale의 로고 디자인"이라는 프롬프트를 사용하여 새로운 steampunk 테마 에일의 로고를 생성하기 위해 아래를 생성했습니다. DALL·E 2가 텍스트 프롬프트를 이해하는 데 탁월하지만 텍스트 생성은 DALL·E 2가 어려움을 겪는 영역 중 하나입니다. 생성된 모든 변형에서 텍스트는 적합하거나 의미가 없습니다. 그럼에도 불구하고 생산된 이미지에 사용된 색상, 구성 또는 요소에 관계없이 이러한 유형의 세대에서 영감을 얻을 수 있는 잠재력이 여전히 있다고 생각합니다.
대략적인 레이아웃 생성
DALL·E 2가 지원할 수 있는 또 다른 영역은 광고 및 웹사이트 디자인과 같은 아이디어 또는 출발점으로 사용할 수 있는 대략적인 레이아웃 및 구성을 소싱하는 것입니다. 웹사이트 디자인 및 브로셔 광고에 대한 아래의 예는 "지속 가능한 에너지 회사를 위한 [웹사이트] [브로셔] 디자인"이라는 프롬프트를 기반으로 했습니다.
머신 러닝과 수십억 개의 소스 이미지에 대한 이해를 통해 DALL·E 2는 레이아웃과 관련하여 표준 규칙을 자연스럽게 통합할 것입니다. 웹사이트 디자인의 예에서 기본 탐색은 모든 변형에 대해 상단에 표시되고 브랜드 로고는 일반적으로 왼쪽 상단에 표시되며 거의 항상 큰 영웅 단위와 헤더 아래에 큰 헤드라인이 있고 그 아래에는 텍스트 단락이 있습니다. 마찬가지로 녹색은 자연적으로 '지속 가능성'이라는 단어와 강한 연관성을 가지고 있기 때문에 이러한 변형과 함께 일반적인 색상 테마였습니다.
텍스트는 특히 읽을 수 없고 레이아웃 내의 많은 이미지가 모호하지만 구성적 관점에서 볼 때 레이아웃에 대한 영감을 찾을 때 DALL·E 2가 지원 역할을 할 가능성은 충분하다고 생각합니다.
결론
OpenAI의 DALL·E 2와 현재 Google의 Imagen(아직 대중이 사용하지 않음)과 같은 AI 기반 이미지 생성 모델을 통해 볼 수 있는 발전은 의심할 여지 없이 인상적이며 디지털 마케팅 및 크리에이티브 공간에서의 역할이 훨씬 더 중요하다고 생각합니다. 창의적이고 마케팅적인 역할에 대한 직접적인 위협이 아니라 지지적인 역할을 합니다. 위의 몇 가지 예에서 보았듯이 특히 출력 크기 및 텍스트 생성과 관련하여 몇 가지 분명한 제한이 있습니다. 기사에 사용된 사진 기반 이미지의 대부분을 사용하더라도 대부분의 사람들은 대부분이 실제 사진이 아님을 알 수 있지만 시간이 지남에 따라 이를 식별하기가 점점 더 어려워질 것입니다.
우리는 아직 AI 이미지 기반 생성의 초기 단계에 있지만 영감과 아이디어 생성에서 이미지 소싱 및 고급 이미지 편집에 이르기까지 크리에이티브 및 마케팅 부문에 유용한 응용 프로그램이 많이 있습니다. 이러한 도구용 API가 PhotoShop 또는 Figma와 같은 인기 있는 디자인 도구와 함께 사용 가능해지고 포함되기까지는 그리 오래 걸리지 않을 것입니다. 그것은 매혹적인 분야이며 앞으로 몇 달, 몇 년에 걸쳐 진행 상황을 추적할 것입니다.