Como a geração de imagens de IA com DALL·E 2 pode ser usada no marketing digital?

Publicados: 2022-10-17

“Uau, você pegou isso? Espere um minuto – isso foi feito por um fotógrafo profissional…?”

Essa foi a reação de Jake, nosso MD, quando mostrei a ele a imagem abaixo: uma imagem fotorrealista gerada pelo DALL·E 2 da OpenAI, criada em segundos, usando um prompt que digitei para “uma foto macro de uma borboleta em um girassol” .

É uma foto que parece tão real e capturou a nitidez e a cor de uma borboleta em primeiro plano e o foco suave do girassol no fundo. Na verdade, tanto que seria difícil encontrar muitas pessoas que possam encontrar sinais óbvios, artefatos ou uma sensação de erro, o que pode ser comum em imagens geradas por IA.

Este foi o momento em que percebi que entramos no ponto em que sistemas avançados de IA podem entender e criar imagens fotorrealistas que são, em muitos casos, indistinguíveis da vida real. Isso tem implicações interessantes para quem trabalha nas indústrias criativas e digitais, ou mesmo para qualquer função que envolva fornecimento ou manipulação de imagens.

Neste artigo, exploro algumas aplicações práticas do uso do DALL·E 2 da OpenAI no mundo criativo e de marketing digital e como as ferramentas de edição recentemente atualizadas do DALL·E 2 podem ser usadas para apoiar o trabalho criativo.

Imagem fotorrealista gerada por IA de uma borboleta em um girassol
Imagem fotorrealista gerada por IA de uma borboleta em um girassol

O que é DALL·E 2?

O DALL·E 2 da OpenAI é um gerador de imagens baseado em IA que usa um prompt simples baseado em texto e gera imagens com base na compreensão do prompt pela IA. Em segundos, você terá quatro variações de imagem geradas que podem ser baixadas, compartilhadas ou salvas como favoritas em sua conta OpenAI.

DALL·E 2 agora está disponível para todos. Você recebe 15 créditos gratuitos por mês, com 1 crédito necessário por geração e a cada 115 créditos custando US$ 15. Você pode gerar imagens do zero ou fazer upload de suas próprias fotos para manipulação desde que sigam a Política de Conteúdo DALL·E 2 e, de acordo com os termos de uso, você “pode usar Generations para qualquer finalidade legal, inclusive para uso comercial”.

Isso torna a atribuição um assunto interessante e quanto crédito deve ser dado à pessoa que fornece as instruções, a fonte da imagem ao editar uma imagem ou DALL·E 2. Todas as imagens que usei neste post do blog, por exemplo, eu gerado com DALL·E 2 ou gerado uma imagem de biblioteca de estoque modificada, mas eu me sentiria um tanto quanto uma fraude se atribuísse essas gerações ou modificações a mim mesmo.

As imagens podem ser geradas com base em:

  1. Assunto: você pode gerar imagens do que quiser; paisagens, animais, objetos, conceitos abstratos desde que sigam a política de conteúdo que, por exemplo, proíbe a geração de imagens de pessoas famosas para evitar a proliferação de deepfakes.
  2. Meio: desde esboços a lápis e pinturas a óleo até pixel art e ilustrações digitais, DALL·E 2 pode gerar imagens representando qualquer tipo de meio.
  3. Configurações ambientais: adicione ao prompt fatores ambientais como “pôr do sol” ou “neblina” para dar um pouco de atmosfera às suas imagens.
  4. Localização: se você precisar colocar suas imagens em um local específico, dê ao prompt uma cidade ou país e você deve obter pontos de referência, estilos de construção etc. associados a esse local.
  5. Estilo artístico: DALL·E 2 pode gerar imagens no estilo de diferentes artistas. Basta adicionar “no estilo de [artista]” aos seus prompts.
  6. Configurações da câmera: particularmente útil para estilos fotográficos, você pode adicionar configurações de câmera às suas solicitações para fornecer às fotos uma variedade de fotos e qualidades diferentes. Os exemplos incluem “foto macro de 35 mm”, “exposição longa” ou “lente olho de peixe”.

Basta usar a linguagem natural para combinar qualquer um dos itens acima para ajudar a descrever o que você deseja, como “Homer Simpson em um café parisiense no estilo de Picasso” e em segundos você terá várias gerações.

Exemplos de diferentes estilos artísticos
Exemplos de diferentes estilos artísticos do prompt “Homer Simpson em um café parisiense no estilo de [Kandinsky][Van Gogh]”
É fácil se perder em uma toca de coelho de possibilidades ao explorar os recursos do DALL·E 2, mas também há muitas aplicações práticas da ferramenta, especialmente em design e marketing, que serão exploradas mais adiante neste artigo.

Como funciona o DALL·E 2?

Não vou fingir que entendo totalmente ou tentarei explicar exatamente como funciona a geração de imagens DALL·E 2 AI – há muitos artigos que fazem isso. Mas o que posso dizer é que é muito mais do que um algoritmo inteligente usando um conjunto complexo de lógica. É aprendizado de máquina. Uma inteligência artificial que foi treinada, ao longo do tempo, a partir de bilhões de imagens de origem e linguagem natural e a relação entre ambos.

Em seu coração está um modelo de difusão que começa com ruído aleatório e que é refinado iterativamente ao longo de vários ciclos até que algo semelhante à compreensão da IA ​​sobre o prompt solicitado surja.

A própria ferramenta DALL·E 2 é simples de usar. Uma vez logado, você é saudado com um campo de entrada simples onde você pode começar a gerar imagens com base em um prompt de texto ou você pode enviar sua própria imagem para editar.
Caixa de diálogo Prompt DALLE2

Várias ferramentas de edição de imagem ficam disponíveis para imagens geradas e carregadas, que exploraremos mais adiante neste artigo.

Usando DALL·E 2 para fonte de imagem

Um dos usos mais óbvios da geração de imagens baseada em IA é obter fotos ou outros estilos de imagem para usar em postagens de blog, apresentações, sites, anúncios e vários outros meios. Bibliotecas de fotos como ShutterStock, iStockPhotos ou Unsplash costumam ser escolhas populares quando se trata de fonte de imagens, mas provavelmente veremos pessoas cada vez mais recorrendo a DALL·E 2 para uma alternativa mais rápida e de baixo custo, bem como a criação de imagens que são verdadeiramente únicas e não existem em nenhum outro lugar online.

O DALL·E 2 pode ser especialmente útil ao obter imagens que tenham um assunto muito específico, como um “Golden Retriever sentado em uma praia olhando para o pôr do sol” ou uma “Foto de uma raposa pulando entre campainhas em uma floresta com o sol brilhando através das árvores”. O fornecimento de imagens semelhantes de várias bibliotecas de fotos provavelmente levaria mais tempo e, em muitos casos, é improvável que o assunto exista.

Imagens de natureza fotográfica geradas com DALLE 2
Imagens fotográficas geradas com DALLE 2

O que eu acho realmente surpreendente com o estilo fotográfico de geração de imagem é que o DALL·E 2 pode replicar com precisão todos os tipos de configurações ambientais. Desde o brilho da luz do sol e a projeção precisa de sombras até a nitidez de objetos próximos e o desfoque gradual de elementos mais distantes. Você também pode incluir prompts para várias configurações baseadas em câmera, como 'Macro 35mm', 'Fisheye' ou 'Lens Flare'.

Ao gerar imagens com qualidade fotográfica, observei gerações mais realistas de assuntos mais comuns. Há muito mais fotografias de cães nas praias, por exemplo, do que raposas pulando em campainhas, então mais conteúdo para uma IA extrair referências.

Uma limitação importante que vale a pena apontar é que todas as imagens geradas são limitadas a 1024 x 1024 pixels, então não estaremos gerando fotos para outdoors tão cedo…

Estendendo as dimensões da imagem

Um dos usos mais comuns que vejo para DALL·E 2 no mundo criativo e de marketing é o aprimoramento e edição de imagens existentes, em vez de geração completa de novas imagens. Como desenvolvedor da Web, geralmente me deparo com desafios em que uma ótima imagem decente é encontrada, mas a proporção e as dimensões causam cortes ruins quando a imagem é carregada devido ao contêiner da imagem ter uma proporção diferente da imagem.

Aqui está um exemplo. Uma linda imagem de um cachorro inclinado para fora de uma janela de carro que foi destinada para uso em uma unidade de herói em destaque, mas a proporção de paisagem padrão da fotografia de origem não funcionou bem com uma proporção super ampla de 21: 9 de um herói em destaque bandeira.

Ao fazer o upload da imagem para o DALL·E 2 e usar a ferramenta 'Generation Frame', podemos estender a imagem deixando a IA preencher as lacunas. Ao usar o quadro de geração, você sempre desejará manter parte da imagem original dentro do quadro para fornecer à IA mais informações para trabalhar.

O texto do prompt também é importante aqui e, geralmente, você desejará descrever o que deseja no quadro de geração em vez da imagem inteira. Para este prompt, usei apenas “hills and sky” e deixei o DALL·E 2 fazer o resto.

Usando a ferramenta Quadro Gerado Dalle2
Usando a ferramenta DALL·E 2 Generation Frame para ampliar uma imagem

Para cada geração, o DALL·E 2 oferece quatro variações para você escolher. A imagem acima achei a mais verossímil; com uma boa extensão da estrada, um punhado de árvores geradas, algumas nuvens interessantes sem serem sobrepostas dramáticas e um riacho (que eu não pedi mas um bom complemento) correndo atrás das árvores.

Editando artefatos

Fazer edições em partes problemáticas de imagens também pode ser feito de forma rápida e eficiente usando o DALL·E 2. O exemplo abaixo foi um pedido recente que tivemos para substituir um reflexo perturbador nos óculos de segurança de um gerente de construção.

Usando a ferramenta Eraser para editar a parte do reflexo da imagem mostrada no canto superior esquerdo, juntamente com o prompt “Mulher com óculos de segurança olhando para o iPad”, DALL·E 2 gerou o resto, até a borda e destaque dos óculos, sombreamento e correspondência de cores precisa.

DallE2 editando artefatos
Editando artefatos visuais com DALL·E 2

Adicionando conteúdo a uma imagem existente

Da mesma forma, adicionar elementos a uma imagem pode ser tão fácil quanto removê-los. Aqui está um exemplo de uma foto de uma pessoa olhando para um vale. Não seria bom se o melhor amigo deles estivesse ao lado deles? Não tem problema, apenas apague um espaço do tamanho de um cachorro da imagem usando a ferramenta Borracha e dê um prompt apropriado; “Um golden retriever sentado ao lado da mulher olhando para longe” foi usado no exemplo abaixo

Dalle 2 Adicionando conteúdo a uma imagem existente
DALL·E 2 Adicionando conteúdo a uma imagem existente

Gerando imagens visualmente semelhantes

Talvez você tenha encontrado uma imagem realmente boa em termos de composição e assunto, mas por alguma razão ela simplesmente não funciona. Sem fazer nenhuma edição ou alteração no texto do prompt, você pode usar o recurso 'Gerar variações' para criar imagens semelhantes em termos de estilo e composição.

No exemplo abaixo, a iluminação, o sombreamento, os ângulos da câmera são todos muito semelhantes e o mesmo tipo de cachorro é gerado novamente, junto com uma mulher vestindo uma jaqueta olhando para as colinas com uma estrada passando por elas, mas os elementos têm todos mudado; as colinas e a estrada são novas e a mulher e o cachorro são ambos diferentes.

AI gerando imagem semelhante
Imagens DALL·E 2 usando a ferramenta “Gerar variações”

Criando Mood Boards

Durante os estágios iniciais de um projeto criativo, os Mood Boards costumam ser usados ​​para definir o estilo visual, o tom e a direção criativa, fornecendo uma mistura de capturas de tela, texto e imagens existentes. Como você pode solicitar ao DALL·E 2 qualquer tipo de estilo visual, desde desenhos a lápis e pintura até pixel art e renderizações em 3D, a IA generativa pode fornecer um bom ponto de partida para definir um tom ou direção visual.

dalle2 geração futurista synthwave
DALL·E 2 geração usando o prompt “Uma cidade futurista de ondas sintéticas com carros voadores”
Dalle2 geração de um esboço a lápis de corrida de 100m
DALL·E 2 geração usando o prompt “A lápis sketch of 100m race”

Apoiar o lançamento da marca

Ao lançar uma nova marca, é comum simular como os novos designs ficarão em diferentes itens estacionários ou visualizar designs de sites in situ em diferentes dispositivos. O DALL·E 2 talvez seja capaz de suportar a geração de um cenário único que se relacione com o negócio do cliente.

Por exemplo, gerar uma imagem de cartões de visita em um campo de flores silvestres para uma marca ecologicamente correta ou simular um laptop com uma casa moderna ao fundo para uma empresa do setor de construção de casas.

Lançamento de marca gerado por IA
DALL·E 2 gerações usando os prompts “Uma foto de uma pilha de cartões de visita em um prado de flores silvestres” e “Um close de um Macbook Pro com uma grande casa moderna ao fundo, fotográfica”

Obtendo inspiração

Acho que ainda estamos muito longe de gerar visuais prontos para impressão ou totalmente projetados para lançamentos criativos, mas uma área em que o DALL·E 2 pode ser útil para apoiar o processo de design é fornecer inspiração rápida para fazer fluir a criatividade .

Por exemplo, eu gerei o abaixo em uma tentativa de gerar um logotipo para uma nova cerveja com tema steampunk usando o prompt “um design de logotipo para uma cerveja steampunk”. Embora o DALL·E 2 seja ótimo para entender prompts de texto, a geração de texto é uma área em que o DALL·E 2 tem dificuldades. Em todas as variações produzidas, o texto é elegível ou sem sentido. Apesar disso, acho que ainda há potencial para se inspirar nesses tipos de gerações, sejam cores, composição ou elementos usados ​​nas imagens produzidas.

Design de logotipo gerado por imagem AI para a nova Ale
Geração do logotipo DALL·E 2. com o prompt “Um design de logotipo para uma cerveja steampunk”

Produzindo layouts grosseiros

Outra área em que o DALL·E 2 pode apoiar é com o fornecimento de layouts e composições brutos que podem ser usados ​​como uma ideia ou ponto de partida para anúncios e designs de sites. Os exemplos abaixo para um design de site e anúncio de brochura foram baseados em prompts “Um design de [site] [brochura] para uma empresa de energia sustentável”

Com o aprendizado de máquina e a compreensão de bilhões de imagens de origem, o DALL·E 2 naturalmente incorporará convenções padrão quando se trata de layouts. Com o exemplo de design do site, a navegação principal é mostrada na parte superior para todas as variações, o logotipo da marca geralmente estava no canto superior esquerdo e quase sempre havia uma grande unidade de herói e um grande título abaixo do cabeçalho seguido por parágrafos de texto abaixo. Da mesma forma, o verde foi um tema de cor comum com essas variações, pois naturalmente tem uma forte associação com a palavra 'sustentabilidade'.

O texto é notavelmente ilegível e muitas das imagens dentro dos layouts são obscuras, mas do ponto de vista composicional, acho que há bastante potencial aqui para DALL·E 2 ter um papel de apoio ao buscar inspiração para layouts.

Layouts de sites gerados por IA
DALL·E 2 design usando o prompt “Um design de site para uma empresa de energia sustentável no modo escuro”
Anúncios de brochura gerados por IA
Anúncio DALL·E 2 usando o prompt “Anúncio de folheto de página inteira A4 para uma empresa de energia sustentável”

Conclusão

O DALL·E 2 da OpenAI e o avanço que vemos agora com modelos de geração de imagem baseados em IA, como o Imagen do Google (ainda não para consumo público) são sem dúvida impressionantes, e vejo seu papel no marketing digital e no espaço criativo sendo muito mais de apoio, em vez de uma ameaça direta às funções criativas e baseadas em marketing. Como vimos com alguns dos exemplos acima, existem algumas limitações óbvias, especialmente em relação ao tamanho da saída e à geração de texto. Mesmo com a maioria das imagens baseadas em fotografia usadas no artigo, a maioria das pessoas provavelmente seria capaz de dizer que a maioria não são fotos reais, mas isso se tornará cada vez mais difícil de detectar com o tempo.

Ainda estamos nos estágios iniciais da geração baseada em imagens de IA, mas vejo muitos aplicativos úteis para o setor criativo e de marketing, desde a geração de inspiração e ideias até o fornecimento de imagens e a edição avançada de imagens. Não demorará muito para que as APIs dessas ferramentas estejam disponíveis e incorporadas a ferramentas de design populares, como PhotoShop ou Figma. É um campo fascinante, e estarei acompanhando seu progresso nos próximos meses e anos.