Wie kann die KI-Bilderzeugung mit DALL·E 2 im digitalen Marketing eingesetzt werden?

Veröffentlicht: 2022-10-17

„Wow, hast du das genommen? Moment mal – das hat ein professioneller Fotograf gemacht…?“

Das war die Reaktion von Jake, unserem MD, als ich ihm das folgende Bild zeigte: ein fotorealistisches Bild, das von OpenAIs DALL·E 2 generiert wurde und innerhalb von Sekunden erstellt wurde, unter Verwendung einer Eingabeaufforderung, die ich für „ein Makrofoto eines Schmetterlings auf einer Sonnenblume“ eingegeben hatte. .

Es ist ein Foto, das so echt aussieht und die Schärfe und Farbe eines Schmetterlings im Vordergrund und den Weichzeichner der Sonnenblume im Hintergrund eingefangen hat. In der Tat, so sehr, dass es Ihnen schwer fallen würde, viele Leute zu finden, die offensichtliche Erkennungszeichen, Artefakte oder ein Gefühl der Falschheit finden können, was in KI-generierten Bildern üblich sein kann.

In diesem Moment wurde mir klar, dass wir den Punkt erreicht haben, an dem fortschrittliche KI-Systeme fotorealistische Bilder verstehen und erstellen können, die in vielen Fällen nicht vom wirklichen Leben zu unterscheiden sind. Dies hat interessante Implikationen für jeden, der in der Kreativ- und Digitalbranche arbeitet, oder in der Tat für jede Rolle, die Bildbeschaffung oder Bildmanipulation beinhaltet.

In diesem Artikel untersuche ich einige praktische Anwendungen der Verwendung von DALL·E 2 von OpenAI in der kreativen und digitalen Marketingwelt und wie die kürzlich aktualisierten Bearbeitungswerkzeuge von DALL·E 2 zur Unterstützung kreativer Arbeit verwendet werden können.

Fotorealistisches KI-generiertes Bild eines Schmetterlings auf einer Sonnenblume
Fotorealistisches KI-generiertes Bild eines Schmetterlings auf einer Sonnenblume

Was ist DALL·E 2?

DALL·E 2 von OpenAI ist ein KI-basierter Bildgenerator, der eine einfache textbasierte Eingabeaufforderung nimmt und Bilder basierend auf dem Verständnis der KI von dieser Eingabeaufforderung generiert. Innerhalb von Sekunden erhalten Sie vier generierte Bildvariationen, die Sie dann herunterladen, teilen oder als Favorit in Ihrem OpenAI-Konto speichern können.

DALL·E 2 ist jetzt für alle verfügbar. Sie erhalten 15 kostenlose Credits pro Monat, wobei 1 Credit pro Generation erforderlich ist und alle 115 Credits 15 US-Dollar kosten. Sie können Bilder von Grund auf neu erstellen oder Ihre eigenen Fotos hochladen, um sie zu manipulieren, vorausgesetzt, dass sie der DALL·E 2-Inhaltsrichtlinie entsprechen, und Sie gemäß den Nutzungsbedingungen „Generationen für jeden legalen Zweck, einschließlich der kommerziellen Nutzung, verwenden dürfen“.

Das macht Attribution zu einem interessanten Thema und wie viel Anerkennung sollte der Person zuteil werden, die die Eingabeaufforderungen, die Bildquelle bei der Bearbeitung eines Bildes oder DALL·E 2 bereitstellt mit DALL·E 2 generiert oder ein modifiziertes Bestandsbibliotheksbild generiert, aber ich würde mich etwas betrogen fühlen, wenn ich diese Generierungen oder Modifikationen mir selbst zuschreiben würde.

Bilder können generiert werden basierend auf:

  1. Thema: Sie können Bilder von allem erstellen, was Sie wollen; Landschaften, Tiere, Objekte, abstrakte Konzepte, solange sie der Inhaltsrichtlinie folgen, die beispielsweise das Generieren von Bildern berühmter Personen verbietet, um die Verbreitung von Deepfakes zu verhindern.
  2. Medium: Von Bleistiftskizzen und Ölgemälden bis hin zu Pixelkunst und digitalen Illustrationen kann DALL·E 2 Bilder erzeugen, die jedes Medium repräsentieren.
  3. Umgebungseinstellungen: Fügen Sie zu den Eingabeaufforderungen Umgebungsfaktoren wie „Sonnenuntergang“ oder „Nebel“ hinzu, um Ihren Bildern ein wenig Atmosphäre zu verleihen.
  4. Ort: Wenn Sie Ihre Bilder an einem bestimmten Ort platzieren müssen, geben Sie der Eingabeaufforderung eine Stadt oder ein Land und Sie sollten Wahrzeichen, Baustile usw. erhalten, die mit diesem Ort verknüpft sind.
  5. Künstlerischer Stil: DALL·E 2 kann Bilder im Stil verschiedener Künstler erzeugen. Fügen Sie einfach „im Stil von [Künstler]“ zu Ihren Eingabeaufforderungen hinzu.
  6. Kameraeinstellungen: Besonders nützlich für fotografische Stile, können Sie Ihren Anfragen Kameraeinstellungen hinzufügen, um Fotos eine Vielzahl unterschiedlicher Aufnahmen und Qualitäten zu verleihen. Beispiele hierfür sind „Makro-35-mm-Aufnahme“, „Langzeitbelichtung“ oder „Fisheye-Objektiv“.

Verwenden Sie einfach natürliche Sprache, um eines der oben genannten Elemente zu kombinieren, um zu beschreiben, was Sie möchten, z. B. „Homer Simpson in einem Pariser Café im Stil von Picasso“, und innerhalb von Sekunden erhalten Sie mehrere Generationen.

Beispiele verschiedener künstlerischer Stilrichtungen
Beispiele verschiedener künstlerischer Stilrichtungen aus der Aufforderung „Homer Simpson in einem Pariser Café im Stil von [Kandinsky][Van Gogh]“
Es ist leicht, sich in einem Kaninchenbau voller Möglichkeiten zu verlieren, wenn man die Möglichkeiten von DALL·E 2 erforscht, aber es gibt auch viele praktische Anwendungen des Tools, insbesondere in Design und Marketing, die später in diesem Artikel untersucht werden.

Wie funktioniert DALL·E 2?

Ich werde nicht so tun, als ob ich vollständig verstehe oder sogar versuchen werde, genau zu erklären, wie die DALL·E 2 AI-Bilderzeugung funktioniert – es gibt viele Artikel, die dies tun. Aber was ich sagen kann, ist, dass es viel mehr ist als ein intelligenter Algorithmus, der eine komplexe Logik verwendet. Es ist maschinelles Lernen. Eine künstliche Intelligenz, die im Laufe der Zeit aus Milliarden von Quellbildern und natürlicher Sprache und der Beziehung zwischen beiden trainiert wurde.

Das Herzstück ist ein Diffusionsmodell, das mit zufälligem Rauschen beginnt und über mehrere Zyklen iterativ verfeinert wird, bis etwas entsteht, das dem Verständnis der KI für die angeforderte Eingabeaufforderung ähnelt.

Das DALL·E 2-Tool selbst ist einfach zu bedienen. Sobald Sie angemeldet sind, werden Sie mit einem einfachen Eingabefeld begrüßt, in dem Sie mit der Generierung von Bildern basierend auf einer Texteingabe beginnen oder Ihr eigenes Bild zur Bearbeitung hochladen können.
DALLE2-Eingabeaufforderungsdialogfeld

Sowohl für generierte als auch für hochgeladene Bilder stehen eine Reihe von Bildbearbeitungstools zur Verfügung, die wir später in diesem Artikel untersuchen werden.

Verwendung von DALL·E 2 für die Bildbeschaffung

Eine der offensichtlichsten Anwendungen der KI-basierten Bildgenerierung ist die Beschaffung von Fotos oder anderen Bildstilen zur Verwendung für Blogbeiträge, Präsentationen, Websites, Anzeigen und verschiedene andere Medien. Archivfotobibliotheken wie ShutterStock, iStockPhotos oder Unsplash sind oft eine beliebte Wahl, wenn es um die Bildbeschaffung geht, aber wir werden wahrscheinlich sehen, dass sich die Leute zunehmend an DALL·E 2 wenden, um eine schnellere und kostengünstigere Alternative sowie die Erstellung zu erhalten von Bildern, die wirklich einzigartig sind und nirgendwo sonst online existieren.

DALL·E 2 kann besonders nützlich sein, wenn Sie Bilder mit einem sehr spezifischen Thema beschaffen, wie z. B. „ein Golden Retriever sitzt an einem Strand und blickt auf einen Sonnenuntergang“ oder ein „Foto eines Fuchses, der mit der Sonne durch Glockenblumen in einem Wald springt“. scheint durch Bäume“. Die Beschaffung ähnlicher Bilder aus verschiedenen Stock-Fotobibliotheken würde wahrscheinlich länger dauern, und in vielen Fällen ist es unwahrscheinlich, dass das Motiv existiert.

Fotografische Naturbilder, die mit DALLE 2 erstellt wurden
Mit DALLE 2 erstellte fotografische Bilder

Was ich an dem fotografischen Stil der Bilderzeugung wirklich erstaunlich finde, ist, dass DALL·E 2 alle Arten von Umgebungseinstellungen genau nachbilden kann. Vom grellen Sonnenlicht und präzisem Schattenwurf bis hin zur Schärfe naher Objekte und allmählicher Unschärfe entfernterer Elemente. Sie können auch Eingabeaufforderungen für verschiedene kamerabasierte Einstellungen wie „Makro 35 mm“, „Fisheye“ oder „Lens Flare“ hinzufügen.

Bei der Erstellung von Bildern in fotografischer Qualität habe ich realistischere Generationen von Motiven beobachtet, die häufiger vorkommen. Es gibt zum Beispiel viel mehr Fotos von Hunden an Stränden als Füchse, die in Glockenblumen springen, also mehr Inhalt für eine KI, aus dem sie Referenzen ziehen kann.

Eine wichtige Einschränkung, die es wert ist, darauf hinzuweisen, ist, dass alle generierten Bilder auf 1024 x 1024 Pixel begrenzt sind, sodass wir in absehbarer Zeit keine Fotos für Werbetafeln erstellen werden …

Erweitern der Bildabmessungen

Eine der häufigeren Anwendungen, die ich für DALL·E 2 in der Kreativ- und Marketingwelt sehe, ist die Verbesserung und Bearbeitung vorhandener Bilder und nicht die vollständige Generierung neuer Bilder. Als Webentwickler stoße ich häufig auf Herausforderungen, bei denen ein großartiges, anständiges Bild gefunden wird, aber das Verhältnis und die Abmessungen beim Hochladen des Bildes zu schlechten Zuschnitten führen, da der Bildcontainer ein anderes Verhältnis zum Bild hat.

Hier ist ein Beispiel. Ein hübsches Archivbild eines Hundes, der sich aus einem Autofenster lehnt, das für die Verwendung auf einer vorgestellten Heldeneinheit vorgesehen war, aber das Standard-Querformat des Quellfotos passte nicht gut zu einem superbreiten 21: 9-Verhältnis eines vorgestellten Helden Banner.

Indem wir das Bild auf DALL·E 2 hochladen und das „Generation Frame“-Tool verwenden, können wir das Bild erweitern, indem wir die KI die Lücken füllen lassen. Wenn Sie den Generierungsrahmen verwenden, möchten Sie immer einen Teil des Originalbilds innerhalb des Rahmens beibehalten, um der KI mehr Informationen zu geben, mit denen sie arbeiten kann.

Der Eingabeaufforderungstext ist auch hier wichtig, und normalerweise möchten Sie eher im Generierungsrahmen beschreiben, was Sie möchten, als im gesamten Bild. Für diese Eingabeaufforderung habe ich einfach „Hügel und Himmel“ verwendet und DALL·E 2 den Rest erledigen lassen.

Verwenden des von Dalle2 generierten Frame-Tools
Verwenden des DALL·E Frame-Tools der 2. Generation zum Erweitern eines Bildes

DALL·E 2 stellt Ihnen für jede Generation vier Varianten zur Auswahl. Das Bild oben erschien mir am glaubwürdigsten; mit einer guten Verlängerung der Straße, einer Handvoll generierter Bäume, einigen interessanten Wolken ohne dramatische Überlagerung und einem Bach (nach dem ich nicht gefragt habe, aber eine gute Ergänzung), der hinter den Bäumen fließt.

Herausarbeiten von Artefakten

Mit DALL·E 2 können auch problematische Teile von Bildern schnell und effizient bearbeitet werden. Das folgende Beispiel war eine kürzliche Anfrage, die wir hatten, um eine störende Reflexion in der Schutzbrille eines Bauleiters zu ersetzen.

Unter Verwendung des Radiergummi-Werkzeugs, um den Reflexionsteil des Bildes oben links herauszuarbeiten, zusammen mit der Bereitstellung der Eingabeaufforderung „Frau mit Schutzbrille, die auf das iPad schaut“, generierte DALL·E 2 den Rest, bis hin zum Rand und zur Hervorhebung der Gläser, Schattierung und exakte Farbabstimmung.

DallE2 bearbeitet Artefakte heraus
Herausarbeiten visueller Artefakte mit DALL·E 2

Hinzufügen von Inhalt zu einem vorhandenen Bild

Ebenso kann das Hinzufügen von Elementen zu einem Bild genauso einfach sein wie das Entfernen. Hier ist ein Beispielfoto einer Person, die über ein Tal blickt. Wäre es nicht schön, wenn ihr bester Freund neben ihnen wäre? Kein Problem, löschen Sie einfach mit dem Radiergummi-Werkzeug einen hundegroßen Platz aus dem Bild und geben Sie eine entsprechende Aufforderung ein; „Ein Golden Retriever sitzt neben der Frau und schaut in die Ferne“ wurde im Beispiel unten verwendet

Dalle 2 Inhalt zu einem bestehenden Bild hinzufügen
DALL·E 2 Inhalt zu einem bestehenden Bild hinzufügen

Erzeugen visuell ähnlicher Bilder

Vielleicht haben Sie ein wirklich gutes Bild in Bezug auf Komposition und Thema gefunden, aber aus irgendeinem Grund funktioniert es einfach nicht ganz. Ohne irgendwelche Bearbeitungen oder Änderungen am Aufforderungstext vorzunehmen, können Sie die Funktion „Variationen generieren“ verwenden, um stilistisch und kompositorisch ähnliche Bilder zu erstellen.

Im Beispiel unten sind die Beleuchtung, die Schattierung und die Kamerawinkel alle sehr ähnlich und die gleiche Art von Hund wird neu generiert, zusammen mit einer Frau, die eine Jacke trägt und auf die Hügel blickt, durch die sich eine Straße schlängelt, aber die Elemente haben alle geändert; Die Hügel und die Straße sind neu und die Frau und der Hund sind beide unterschiedlich.

KI erzeugt ein ähnliches Bild
DALL·E 2 Bilder mit dem Werkzeug „Variationen generieren“.

Erstellen von Moodboards

In frühen Phasen eines Kreativprojekts werden Moodboards häufig verwendet, um visuellen Stil, Ton und kreative Richtung festzulegen, indem eine Mischung aus vorhandenen Screenshots, Text und Bildern verwendet wird. Da Sie DALL·E 2 für jeden visuellen Stil von Bleistiftzeichnungen und Malerei bis hin zu Pixelkunst und 3D-Renderings auffordern können, kann die generative KI einen guten Ausgangspunkt bieten, um einen visuellen Ton oder eine Richtung festzulegen.

dalle2 Generation futuristischer Synthwave
DALL·E 2 Generation mit dem Prompt „Eine futuristische Synthwave-Stadt mit fliegenden Autos“
Dalle2 Generierung einer Bleistiftskizze eines 100-Meter-Rennens
DALL·E 2-Generation mit der Aufforderung „Eine Bleistiftskizze eines 100-Meter-Rennens“

Unterstützung des Marken-Rollouts

Bei der Einführung einer neuen Marke ist es üblich, zu simulieren, wie die neuen Designs auf verschiedenen stationären Artikeln aussehen, oder Website-Designs vor Ort auf verschiedenen Geräten zu visualisieren. DALL·E 2 kann möglicherweise dabei helfen, einen einzigartigen Hintergrund zu schaffen, der zum Geschäft des Kunden passt.

Zum Beispiel das Erstellen eines Bildes von Visitenkarten in einem Wildblumenfeld für eine umweltorientierte Marke oder das Mocken eines Laptops mit einem modernen Haus im Hintergrund für ein Unternehmen im Wohnungsbausektor.

KI-generierte Markeneinführung
DALL·E 2 Generationen mit den Eingabeaufforderungen „Ein Foto von einem Stapel Visitenkarten auf einer Wildblumenwiese“ und „Eine Nahaufnahme eines Macbook Pro mit einem großen modernen Haus im Hintergrund, fotografisch“

Inspiration bekommen

Ich denke, wir sind noch weit davon entfernt, druckfertige oder vollständig gestaltete Visuals für kreative Rollouts zu erstellen, aber ein Bereich, in dem DALL·E 2 zur Unterstützung des Designprozesses nützlich sein könnte, ist die schnelle Inspiration, um die kreativen Säfte zum Fließen zu bringen .

Zum Beispiel habe ich das Folgende generiert, um ein Logo für ein neues Steampunk-Ale zu generieren, indem ich die Eingabeaufforderung „ein Logo-Design für ein Steampunk-Ale“ verwendete. Während DALL·E 2 hervorragend darin ist, Texteingabeaufforderungen zu verstehen, ist die Textgenerierung ein Bereich, in dem DALL·E 2 Probleme hat. In allen produzierten Variationen ist Text entweder zulässig oder unsinnig. Trotzdem denke ich, dass es immer noch Potenzial gibt, sich von dieser Art von Generationen inspirieren zu lassen, sei es in Bezug auf Farben, Komposition oder Elemente, die in den produzierten Bildern verwendet werden.

KI-bildgeneriertes Logodesign für neues Ale
Generierung des DALL·E 2-Logos. mit der Aufforderung „Ein Logo-Design für ein Steampunk-Ale“

Erstellung von Groblayouts

Ein weiterer Bereich, in dem DALL·E 2 möglicherweise unterstützen kann, ist die Beschaffung grober Layouts und Kompositionen, die als Idee oder Ausgangspunkt für Anzeigen und Website-Designs verwendet werden können. Die folgenden Beispiele für ein Website-Design und eine Broschürenanzeige basierten auf der Aufforderung „Ein [Website] [Broschüre]-Design für ein Unternehmen für nachhaltige Energie“

Mit maschinellem Lernen und dem Verständnis von Milliarden von Quellbildern wird DALL·E 2 natürlich Standardkonventionen in Bezug auf Layouts berücksichtigen. Beim Website-Design-Beispiel wird die Hauptnavigation bei allen Varianten oben angezeigt, das Markenlogo war normalerweise oben links und es gab fast immer eine große Heldeneinheit und eine große Überschrift unter der Kopfzeile, gefolgt von Textabsätzen darunter. Auch Grün war ein gemeinsames Farbthema bei diesen Variationen, da es natürlich eine starke Assoziation mit dem Wort „Nachhaltigkeit“ hat.

Der Text ist bemerkenswert unleserlich und viele der Bilder in den Layouts sind undeutlich, aber aus kompositorischer Sicht gibt es meiner Meinung nach genug Potenzial für DALL·E 2, um bei der Suche nach Inspiration für Layouts eine unterstützende Rolle zu übernehmen.

KI-generierte Website-Layouts
DALL·E 2-Design mit der Aufforderung „Ein Website-Design für ein nachhaltiges Energieunternehmen im Dunkelmodus“
KI-generierte Broschürenanzeigen
DALL·E 2-Anzeige mit dem Prompt „Eine ganzseitige A4-Broschürenanzeige für ein nachhaltiges Energieunternehmen“

Fazit

OpenAIs DALL·E 2 und die Fortschritte, die wir jetzt mit KI-basierten Bilderzeugungsmodellen wie Googles Imagen (noch nicht für die Öffentlichkeit zugänglich) sehen, sind zweifellos beeindruckend, und ich sehe ihre Rolle im digitalen Marketing- und Kreativbereich viel eher als a eher unterstützend als eine direkte Bedrohung für kreative und marketingbasierte Rollen. Wie wir bei einigen der obigen Beispiele gesehen haben, gibt es einige offensichtliche Einschränkungen, insbesondere in Bezug auf die Ausgabegröße und die Textgenerierung. Selbst bei den meisten fotografiebasierten Bildern, die in diesem Artikel verwendet werden, würden die meisten Menschen wahrscheinlich erkennen können, dass die meisten keine echten Fotos sind, aber dies wird mit der Zeit immer schwieriger zu erkennen sein.

Wir befinden uns noch in den Anfängen der KI-basierten Bildgenerierung, aber ich sehe viele nützliche Anwendungen für den Kreativ- und Marketingsektor, von der Generierung von Inspiration und Ideen bis hin zur Bildbeschaffung und fortschrittlichen Bildbearbeitung. Es wird nicht lange dauern, bis APIs für diese Tools verfügbar und in beliebte Design-Tools wie PhotoShop oder Figma eingebettet sind. Es ist ein faszinierendes Gebiet, und ich werde seine Fortschritte in den kommenden Monaten und Jahren verfolgen.