Comment la génération d'images IA avec DALL·E 2 peut-elle être utilisée dans le marketing numérique ?
Publié: 2022-10-17« Wow, tu as pris ça ? Attendez une minute – cela a été fait par un photographe professionnel… ? »
Telle a été la réaction de Jake, notre MD, lorsque je lui ai montré l'image ci-dessous : une image photoréaliste générée par DALL·E 2 d'OpenAI, créée en quelques secondes, à l'aide d'une invite que j'ai entrée pour "une macro photo d'un papillon sur un tournesol" .
C'est une photo qui a l'air si réelle et qui a capturé la netteté et la couleur d'un papillon au premier plan et la mise au point douce du tournesol en arrière-plan. En fait, à tel point que vous auriez du mal à trouver de nombreuses personnes capables de trouver des signes évidents, des artefacts ou un sentiment d'erreur, ce qui peut être courant dans les images générées par l'IA.
C'est à ce moment-là que j'ai réalisé que nous étions entrés dans le point où les systèmes d'IA avancés peuvent comprendre et créer des images photoréalistes qui sont, dans de nombreux cas, impossibles à distinguer de la vie réelle. Cela a des implications intéressantes pour toute personne travaillant dans les industries créatives et numériques, ou même pour tout rôle impliquant la recherche d'images ou la manipulation d'images.
Dans cet article, j'explore quelques applications pratiques de l'utilisation de DALL·E 2 d'OpenAI dans le monde du marketing créatif et numérique et comment les outils d'édition récemment mis à jour de DALL·E 2 peuvent être utilisés pour soutenir le travail créatif.
Qu'est-ce que DALL·E 2 ?
DALL·E 2 d'OpenAI est un générateur d'images basé sur l'IA qui prend une simple invite textuelle et génère des images basées sur la compréhension de cette invite par l'IA. En quelques secondes, vous obtiendrez quatre variantes d'images générées qui pourront ensuite être téléchargées, partagées ou enregistrées en tant que favoris dans votre compte OpenAI.
DALL·E 2 est désormais accessible à tous. Vous obtenez 15 crédits gratuits par mois, avec 1 crédit requis par génération et tous les 115 crédits coûtant 15 $. Vous pouvez générer des images à partir de zéro ou télécharger vos propres photos à manipuler à condition qu'elles respectent la politique de contenu DALL·E 2 et, selon les conditions d'utilisation, vous "pouvez utiliser Generations à toute fin légale, y compris à des fins commerciales".
Cela fait de l'attribution un sujet intéressant et du crédit à accorder à la personne qui fournit les invites, à la source de l'image lors de l'édition d'une image ou à DALL·E 2. Toutes les images que j'ai utilisées dans cet article de blog, par exemple, je généré avec DALL·E 2 ou généré une image de bibliothèque de stock modifiée mais je me sentirais un peu comme une fraude si je m'attribuais ces générations ou modifications.
Les images peuvent être générées en fonction de :
- Objet : vous pouvez générer des images de tout ce que vous voulez ; des paysages, des animaux, des objets, des concepts abstraits tant qu'ils respectent la politique de contenu qui interdit par exemple de générer des images de personnages célèbres pour éviter la prolifération des deepfakes.
- Support : des croquis au crayon et des peintures à l'huile au pixel art et aux illustrations numériques, DALL·E 2 peut générer des images représentant tout type de support.
- Paramètres environnementaux : ajoutez à l'invite des facteurs environnementaux tels que « coucher de soleil » ou « brouillard » pour donner un peu d'ambiance à vos images.
- Emplacement : si vous devez placer vos images dans un emplacement particulier, indiquez une ville ou un pays à l'invite et vous devriez obtenir des points de repère, des styles de construction, etc. associés à cet endroit.
- Style artistique : DALL·E 2 peut générer des images dans le style de différents artistes. Ajoutez simplement "dans le style de [artiste]" à vos invites.
- Paramètres de l'appareil photo : particulièrement utile pour les styles photographiques, vous pouvez ajouter des configurations d'appareil photo à vos demandes pour donner aux photos une variété de prises de vue et de qualités différentes. Les exemples incluent "prise de vue macro 35 mm", "exposition longue" ou "objectif fisheye".
Utilisez simplement le langage naturel pour combiner l'un des éléments ci-dessus pour aider à décrire ce que vous voulez, comme "Homer Simpson dans un café parisien dans le style de Picasso" et en quelques secondes, vous obtiendrez plusieurs générations.
Il est facile de se perdre dans un terrier de lapin de possibilités lors de l'exploration des capacités de DALL·E 2, mais il existe également de nombreuses applications pratiques de l'outil, en particulier dans la conception et le marketing, qui sont explorées plus loin dans cet article.
Comment fonctionne DALL·E 2 ?
Je ne prétendrai pas comprendre totalement ni même essayer d'expliquer exactement comment fonctionne la génération d'images DALL·E 2 AI - il existe de nombreux articles qui le font. Mais ce que je peux dire, c'est que c'est bien plus qu'un algorithme intelligent utilisant un ensemble complexe de logique. C'est de l'apprentissage automatique. Une intelligence artificielle qui a été formée, au fil du temps, à partir de milliards d'images sources et de langage naturel et de la relation entre les deux.
En son cœur se trouve un modèle de diffusion qui commence par un bruit aléatoire et qui est affiné de manière itérative sur plusieurs cycles jusqu'à ce que quelque chose ressemblant à la compréhension de l'IA de l'invite demandée émerge.
L'outil DALL·E 2 lui-même est simple à utiliser. Une fois connecté, vous êtes accueilli avec un champ de saisie simple où vous pouvez commencer à générer des images basées sur une invite de texte ou vous pouvez télécharger votre propre image à modifier.
Un certain nombre d'outils d'édition d'images deviennent disponibles pour les images générées et téléchargées que nous explorerons plus loin dans cet article.
Utilisation de DALL·E 2 pour la source d'images
L'une des utilisations les plus évidentes de la génération d'images basée sur l'IA consiste à rechercher des photos ou d'autres styles d'image à utiliser pour les articles de blog, les présentations, les sites Web, les publicités et divers autres supports. Les bibliothèques de photos telles que ShutterStock, iStockPhotos ou Unsplash sont souvent des choix populaires en matière d'approvisionnement en images, mais nous verrons probablement les gens se tourner de plus en plus vers DALL·E 2 pour une alternative plus rapide et moins coûteuse, ainsi que la création d'images vraiment uniques et qui n'existent nulle part ailleurs en ligne.
DALL·E 2 peut être particulièrement utile lors de la recherche d'images ayant un sujet très spécifique, tel qu'un "Golden Retriever assis sur une plage regardant vers un coucher de soleil" ou une "Photo d'un renard sautant à travers des campanules dans une forêt avec le soleil brille à travers les arbres ». L'obtention d'images similaires à partir de diverses bibliothèques de photos prendrait probablement plus de temps et, dans de nombreux cas, il est peu probable que le sujet existe.
Ce que je trouve vraiment étonnant avec le style photographique de génération d'images, c'est que DALL·E 2 peut reproduire avec précision toutes sortes de paramètres environnementaux. De l'éblouissement de la lumière du soleil et de la projection précise des ombres à la netteté des objets rapprochés et au flou progressif des éléments plus éloignés. Vous pouvez également inclure des invites pour diverses configurations basées sur l'appareil photo telles que "Macro 35 mm", "Fisheye" ou "Lens Flare".
Lors de la génération d'images de qualité photographique, j'ai observé des générations plus réalistes à partir de sujets plus courants. Il y a beaucoup plus de photographies de chiens sur les plages par exemple qu'il n'y a de renards sautant dans des jacinthes des bois, donc plus de contenu pour qu'une IA tire des références.
Une limitation clé qui mérite d'être soulignée est que toutes les images générées sont limitées à 1024 x 1024 pixels, nous ne générerons donc pas de photos pour les panneaux d'affichage de sitôt…
Extension des dimensions de l'image
L'une des utilisations les plus courantes que je vois pour DALL·E 2 dans le monde de la création et du marketing est l'amélioration et l'édition d'images existantes, plutôt que la génération complète de nouvelles images. En tant que développeur Web, je rencontre souvent des défis où une grande image décente est trouvée, mais le rapport et les dimensions causent de mauvaises récoltes lorsque l'image est téléchargée car le conteneur d'image est un rapport différent de l'image.
Voici un exemple. Une belle image de stock d'un chien se penchant par la fenêtre d'une voiture qui était destinée à être utilisée sur une unité de héros en vedette, mais le rapport paysage standard de la photographie source ne jouait pas bien avec un rapport 21: 9 super large d'un héros en vedette bannière.
En téléchargeant l'image sur DALL·E 2 et en utilisant l'outil "Generation Frame", nous pouvons étendre l'image en laissant l'IA combler les lacunes. Lorsque vous utilisez le cadre de génération, vous souhaiterez toujours conserver une partie de l'image d'origine dans le cadre pour donner à l'IA plus d'informations à partir desquelles travailler.
Le texte de l'invite est également important ici et vous voudrez généralement décrire ce que vous voulez dans le cadre de génération plutôt que l'image entière. Pour cette invite, j'ai simplement utilisé "collines et ciel" et laissé DALL·E 2 faire le reste.
Pour chaque génération, DALL·E 2 vous propose quatre variantes parmi lesquelles choisir. L'image ci-dessus m'a semblé la plus crédible; avec une bonne extension de la route, une poignée d'arbres générés, quelques nuages intéressants sans superposition dramatique et un ruisseau (que je n'ai pas demandé mais un bon ajout) courant derrière les arbres.
Éliminer les artefacts
L'édition de parties problématiques d'images peut également être effectuée rapidement et efficacement à l'aide de DALL·E 2. L'exemple ci-dessous était une demande récente que nous avons eue pour remplacer un reflet distrayant dans les lunettes de sécurité d'un chef de chantier.
En utilisant l'outil Gomme pour éditer la partie réfléchissante de l'image affichée en haut à gauche, tout en fournissant l'invite "Femme avec des lunettes de sécurité regardant l'iPad", DALL·E 2 a généré le reste, jusqu'au bord et surligné des verres, ombrage et correspondance précise des couleurs.
Ajouter du contenu à une image existante
De même, ajouter des éléments à une image peut être aussi simple que de les supprimer. Voici un exemple de photo d'une personne regardant à travers une vallée. Ne serait-ce pas bien si leur meilleur ami était à côté d'eux ? Pas de problème, effacez simplement un espace de la taille d'un chien de l'image à l'aide de l'outil Gomme et donnez une invite appropriée. "Un golden retriever assis à côté de la femme regardant au loin" a été utilisé dans l'exemple ci-dessous
Génération d'images visuellement similaires
Peut-être avez-vous trouvé une très bonne image en termes de composition et de sujet, mais pour une raison quelconque, cela ne fonctionne tout simplement pas. Sans apporter aucune modification ni modification au texte de l'invite, vous pouvez utiliser la fonction "Générer des variantes" pour créer des images similaires sur le plan stylistique et compositionnel.
Dans l'exemple ci-dessous, l'éclairage, l'ombrage, les angles de caméra sont tous très similaires et le même type de chien est régénéré, ainsi qu'une femme portant une veste regardant dans les collines avec une route qui les traverse mais les éléments ont tous modifié; les collines et la route sont nouvelles et la femme et le chien sont tous deux différents.
Créer des planches d'ambiance
Au cours des premières étapes d'un projet créatif, les Mood Boards sont souvent utilisés pour définir le style visuel, le ton et la direction créative en se procurant un mélange de captures d'écran, de texte et d'images existants. Comme vous pouvez demander à DALL·E 2 tout type de style visuel, des dessins au crayon et de la peinture au pixel art et aux rendus 3D, l'IA générative peut fournir un bon point de départ pour définir un ton ou une direction visuelle.
Accompagner le déploiement de la marque
Lors du déploiement d'une nouvelle marque, il est courant de modéliser l'apparence des nouvelles conceptions sur différents articles fixes ou de visualiser les conceptions de sites Web in situ sur différents appareils. DALL·E 2 peut éventuellement prendre en charge la création d'une toile de fond unique en rapport avec l'activité du client.
Par exemple, générer une image de cartes de visite dans un champ de fleurs sauvages pour une marque éco-orientée, ou simuler un ordinateur portable avec une maison moderne en arrière-plan pour une entreprise du secteur de la construction de maisons.
S'inspirer
Je pense que nous sommes encore loin de générer des visuels prêts à imprimer ou entièrement conçus pour des déploiements créatifs, mais un domaine où DALL·E 2 pourrait être utile pour soutenir le processus de conception est de fournir une inspiration rapide pour faire couler le jus créatif .
Par exemple, j'ai généré ce qui suit dans le but de générer un logo pour une nouvelle bière à thème steampunk en utilisant l'invite "un logo pour une bière steampunk". Alors que DALL·E 2 est excellent pour comprendre les invites de texte, la génération de texte est un domaine où DALL·E 2 se débat. Dans toutes les variantes produites, le texte est soit éligible, soit absurde. Malgré cela, je pense qu'il y a encore un potentiel d'inspiration à tirer de ces types de générations que ce soit les couleurs, la composition ou les éléments utilisés dans les images produites.
Réalisation de maquettes brutes
Un autre domaine dans lequel DALL·E 2 pourrait être en mesure de prendre en charge est la recherche de mises en page et de compositions approximatives pouvant être utilisées comme idée ou point de départ pour des publicités et des conceptions de sites Web. Les exemples ci-dessous pour une conception de site Web et une publicité de brochure étaient basés sur les invites "Une conception de [site Web] [brochure] pour une entreprise d'énergie durable"
Grâce à l'apprentissage automatique et à la compréhension de milliards d'images sources, DALL·E 2 intégrera naturellement les conventions standard en matière de mise en page. Avec l'exemple de conception de site Web, la navigation principale est affichée en haut pour toutes les variantes, le logo de la marque était généralement en haut à gauche et il y avait presque toujours une grande unité de héros et un grand titre en dessous de l'en-tête suivi de paragraphes de texte ci-dessous. De même, le vert était un thème de couleur commun avec ces variations car il a naturellement une forte association avec le mot « durabilité ».
Le texte est notamment illisible et de nombreuses images dans les mises en page sont obscures, mais d'un point de vue compositionnel, je pense qu'il y a suffisamment de potentiel ici pour que DALL·E 2 joue un rôle de soutien lors de la recherche d'inspiration pour les mises en page.
Conclusion
DALL·E 2 d'OpenAI et les progrès que nous constatons actuellement avec les modèles de génération d'images basés sur l'IA tels que Imagen de Google (pas encore destinés à la consommation publique) sont sans aucun doute impressionnants, et je considère que leur rôle dans le marketing numérique et l'espace créatif est beaucoup plus un un soutien plutôt qu'une menace directe pour les rôles basés sur la création et le marketing. Comme nous l'avons vu avec certains des exemples ci-dessus, il existe des limitations évidentes, notamment en ce qui concerne la taille de sortie et la génération de texte. Même avec la plupart des images basées sur la photographie utilisées dans l'article, la plupart des gens seraient probablement en mesure de dire que la plupart ne sont pas de vraies photos, mais cela deviendra de plus en plus difficile à repérer avec le temps.
Nous en sommes encore aux premiers stades de la génération d'images basées sur l'IA, mais je vois de nombreuses applications utiles pour le secteur de la création et du marketing, de la génération d'inspiration et d'idées à la recherche d'images et à l'édition d'images avancée. Il ne faudra pas longtemps avant que les API de ces outils soient disponibles et intégrées aux outils de conception populaires tels que PhotoShop ou Figma. C'est un domaine fascinant, et je suivrai son évolution au cours des mois et des années à venir.