¿Cómo se puede utilizar la generación de imágenes de IA con DALL·E 2 en marketing digital?

Publicado: 2022-10-17

“Vaya, ¿tomaste eso? Un momento, ¿eso fue hecho por un fotógrafo profesional...?

Esa fue la reacción de Jake, nuestro MD, cuando le mostré la imagen a continuación: una imagen fotorrealista generada por DALL·E 2 de OpenAI, creada en segundos, usando un mensaje que ingresé para "una foto macro de una mariposa en un girasol". .

Es una foto que parece tan real y ha capturado la nitidez y el color de una mariposa en primer plano y el enfoque suave del girasol en el fondo. De hecho, tanto es así, que sería difícil encontrar muchas personas que puedan encontrar signos obvios de cola, artefactos o una sensación de error, que pueden ser comunes en las imágenes generadas por IA.

Este fue el momento en que me di cuenta de que habíamos entrado en el punto en el que los sistemas avanzados de IA pueden comprender y crear imágenes fotorrealistas que, en muchos casos, son indistinguibles de la vida real. Esto tiene implicaciones interesantes para cualquier persona que trabaje en las industrias creativas y digitales, o cualquier rol que involucre el abastecimiento de imágenes o la manipulación de imágenes.

En este artículo, exploro algunas aplicaciones prácticas del uso de DALL·E 2 de OpenAI dentro del mundo creativo y del marketing digital y cómo las herramientas de edición recientemente actualizadas de DALL·E 2 se pueden usar para respaldar el trabajo creativo.

Imagen fotorrealista generada por IA de una mariposa sobre un girasol
Imagen fotorrealista generada por IA de una mariposa sobre un girasol

¿Qué es DALL·E 2?

DALL·E 2 de OpenAI es un generador de imágenes basado en IA que toma un mensaje simple basado en texto y genera imágenes basadas en la comprensión de ese mensaje por parte de la IA. En cuestión de segundos, obtendrá cuatro variaciones de imagen generadas que luego se pueden descargar, compartir o guardar como favoritas dentro de su cuenta de OpenAI.

DALL·E 2 ya está disponible para todos. Obtiene 15 créditos gratis por mes, con 1 crédito requerido por generación y cada 115 créditos cuestan $ 15. Puede generar imágenes desde cero o cargar sus propias fotos para manipularlas, siempre que sigan la Política de contenido de DALL·E 2 y, de acuerdo con los términos de uso, "puede usar Generations para cualquier fin legal, incluido el uso comercial".

Esto hace que la atribución sea un tema interesante y cuánto crédito se debe dar a la persona que proporciona las indicaciones, la fuente de la imagen al editar una imagen o DALL·E 2. Todas las imágenes que he usado en esta publicación de blog, por ejemplo, yo generado con DALL·E 2 o generado una imagen de biblioteca de stock modificada, pero me sentiría un poco fraudulento si me atribuyera estas generaciones o modificaciones.

Las imágenes se pueden generar en base a:

  1. Tema: puedes generar imágenes de lo que quieras; paisajes, animales, objetos, conceptos abstractos siempre y cuando sigan la política de contenidos que por ejemplo prohíbe generar imágenes de personajes famosos para evitar la proliferación de deepfakes.
  2. Medio: desde bocetos a lápiz y pinturas al óleo hasta pixel art e ilustraciones digitales, DALL·E 2 puede generar imágenes que representan cualquier tipo de medio.
  3. Configuraciones ambientales: agregue a las indicaciones factores ambientales como "puesta de sol" o "niebla" para darle a sus imágenes un poco de atmósfera.
  4. Ubicación: si necesita colocar sus imágenes en una ubicación en particular, indique una ciudad o un país y debería obtener puntos de referencia, estilos de construcción, etc. asociados con ese lugar.
  5. Estilo artístico: DALL·E 2 puede generar imágenes al estilo de diferentes artistas. Simplemente agregue "al estilo de [artista]" a sus indicaciones.
  6. Configuración de la cámara: particularmente útil para estilos fotográficos, puede agregar configuraciones de cámara a sus solicitudes para dar a las fotos una variedad de tomas y calidades diferentes. Los ejemplos incluyen "disparo macro de 35 mm", "exposición prolongada" o "objetivo ojo de pez".

Simplemente use el lenguaje natural para combinar cualquiera de los anteriores para ayudar a describir lo que quiere, como "Homer Simpson en un café parisino al estilo de Picasso" y en segundos obtendrá varias generaciones.

Ejemplos de diferentes estilos artísticos.
Ejemplos de diferentes estilos artísticos del mensaje “Homer Simpson en un café parisino al estilo de [Kandinsky][Van Gogh]”
Es fácil perderse en una madriguera de posibilidades al explorar las capacidades de DALL·E 2, pero también hay muchas aplicaciones prácticas de la herramienta, especialmente en diseño y marketing, que se exploran más adelante en este artículo.

¿Cómo funciona DALL·E 2?

No voy a pretender que lo entiendo totalmente o incluso trataré de explicar exactamente cómo funciona la generación de imágenes de DALL·E 2 AI; hay muchos artículos que hacen esto. Pero lo que puedo decir es que es mucho más que un algoritmo inteligente que utiliza un conjunto complejo de lógica. Es aprendizaje automático. Una inteligencia artificial que ha sido entrenada, a lo largo del tiempo, a partir de miles de millones de imágenes fuente y lenguaje natural y la relación entre ambos.

En su corazón hay un modelo de difusión que comienza con ruido aleatorio y que se refina iterativamente durante múltiples ciclos hasta que surge algo parecido a la comprensión de la IA del aviso solicitado.

La herramienta DALL·E 2 en sí misma es fácil de usar. Una vez que haya iniciado sesión, será recibido con un campo de entrada simple donde puede comenzar a generar imágenes basadas en un mensaje de texto o puede cargar su propia imagen para editar.
Cuadro de diálogo de solicitud de DALLE2

Una serie de herramientas de edición de imágenes están disponibles para las imágenes generadas y cargadas que exploraremos más adelante en este artículo.

Uso de DALL·E 2 para el abastecimiento de imágenes

Uno de los usos más obvios de la generación de imágenes basada en IA es obtener fotos u otros estilos de imagen para usar en publicaciones de blogs, presentaciones, sitios web, anuncios y otros medios. Las bibliotecas de fotos de archivo, como ShutterStock, iStockPhotos o Unsplash, suelen ser opciones populares cuando se trata de obtener imágenes, pero es probable que veamos que la gente recurre cada vez más a DALL·E 2 para obtener una alternativa más rápida y de menor costo, así como la creación de imágenes que son verdaderamente únicas y no existen en ningún otro lugar en línea.

DALL·E 2 puede ser especialmente útil cuando se obtienen imágenes que tienen un tema muy específico, como un "Golden Retriever sentado en una playa mirando hacia una puesta de sol" o una "Foto de un zorro saltando entre campanillas en un bosque con el sol". brillando a través de los árboles”. Obtener imágenes similares de varias bibliotecas de fotos de archivo probablemente llevaría más tiempo y, en muchos casos, es poco probable que exista el tema.

Imágenes fotográficas de naturaleza generadas con DALLE 2
Imágenes fotográficas generadas con DALLE 2

Lo que encuentro realmente sorprendente con el estilo fotográfico de generación de imágenes es que DALL·E 2 puede replicar con precisión todo tipo de entornos ambientales. Desde el resplandor de la luz del sol y la proyección precisa de las sombras hasta la nitidez de los objetos cercanos y el desenfoque gradual de los elementos más distantes. También puede incluir indicaciones para varias configuraciones basadas en cámaras, como 'Macro 35 mm', 'Ojo de pez' o 'Lens Flare'.

Al generar imágenes de calidad fotográfica, he observado generaciones más realistas a partir de temas que son más comunes. Hay muchas más fotografías de perros en las playas, por ejemplo, que zorros saltando en campanillas azules, por lo que hay más contenido para que una IA extraiga referencias.

Una limitación clave que vale la pena señalar es que todas las imágenes generadas están limitadas a 1024 x 1024 píxeles, por lo que no generaremos fotos para vallas publicitarias en el corto plazo...

Ampliación de las dimensiones de la imagen

Uno de los usos más comunes que veo para DALL·E 2 en el mundo creativo y de marketing es la mejora y edición de imágenes existentes, en lugar de la generación completa de nuevas imágenes. Como desarrollador web, por lo general me encuentro con desafíos en los que se encuentra una imagen decente, pero la relación y las dimensiones provocan recortes deficientes cuando se carga la imagen debido a que el contenedor de la imagen tiene una relación diferente a la imagen.

Aquí hay un ejemplo. Una hermosa imagen de archivo de un perro asomado a la ventanilla de un automóvil que estaba destinado a ser utilizado en una unidad de héroe destacada, pero la proporción de paisaje estándar de la fotografía de origen no funcionó bien con una proporción súper amplia de 21:9 de un héroe destacado bandera.

Al cargar la imagen en DALL·E 2 y usar la herramienta 'Generación de fotogramas', podemos ampliar la imagen dejando que la IA rellene los espacios. Cuando utilice el marco de generación, siempre querrá mantener parte de la imagen original dentro del marco para darle a la IA más información con la que trabajar.

El texto del mensaje también es importante aquí y, por lo general, querrá describir lo que desea en el cuadro de generación en lugar de la imagen completa. Para este aviso, simplemente usé "colinas y cielo" y dejé que DALL·E 2 hiciera el resto.

Uso de la herramienta Cuadro generado de Dalle2
Uso de la herramienta Marco de 2ª generación de DALL·E para ampliar una imagen

Para cada generación, DALL·E 2 te dará cuatro variaciones para que elijas. La imagen de arriba que sentí fue la más creíble; con una buena extensión del camino, un puñado de árboles generados, algunas nubes interesantes sin ser superpuestas dramáticas y un arroyo (que no pedí pero una buena adición) corriendo detrás de los árboles.

Edición de artefactos

La edición de partes problemáticas de las imágenes también se puede hacer de manera rápida y eficiente con DALL·E 2. El siguiente ejemplo fue una solicitud reciente que tuvimos para reemplazar un reflejo que distrae en las gafas de seguridad de un gerente de construcción.

Usando la herramienta Borrador para editar la parte reflejada de la imagen que se muestra en la parte superior izquierda, junto con el mensaje "Mujer con gafas de seguridad mirando el iPad", DALL·E 2 generó el resto, hasta el borde y resaltado de las gafas, sombreado y coincidencia de color precisa.

DallE2 editando artefactos
Edición de artefactos visuales con DALL·E 2

Agregar contenido a una imagen existente

Del mismo modo, agregar elementos a una imagen puede ser tan fácil como eliminarlos. Aquí hay un ejemplo de una foto de una persona mirando a través de un valle. ¿No sería agradable si su mejor amigo estuviera a su lado? No hay problema, simplemente borre un espacio del tamaño de un perro de la imagen con la herramienta Borrador y dé un aviso apropiado; "Un golden retriever sentado junto a la mujer que mira a lo lejos" se usó en el siguiente ejemplo

Dalle 2 Adición de contenido a una imagen existente
DALL·E 2 Agregar contenido a una imagen existente

Generación de imágenes visualmente similares

Tal vez hayas encontrado una imagen realmente buena en términos de composición y tema, pero por alguna razón simplemente no funciona. Sin realizar ninguna edición o cambios en el texto del mensaje, puede utilizar la función 'Generar variaciones' para crear imágenes similares en cuanto a estilo y composición.

En el siguiente ejemplo, la iluminación, el sombreado, los ángulos de la cámara son todos muy similares y se regenera el mismo tipo de perro, junto con una mujer con una chaqueta que mira hacia las colinas con un camino que las atraviesa, pero los elementos tienen todos cambió; las colinas y el camino son nuevos y la mujer y el perro son diferentes.

AI generando una imagen similar
Imágenes DALL·E 2 utilizando la herramienta “Generar variaciones”

Creación de tableros de humor

Durante las primeras etapas de un proyecto creativo, los Mood Boards a menudo se usan para establecer el estilo visual, el tono y la dirección creativa al obtener una combinación de capturas de pantalla, texto e imágenes existentes. Como puede solicitar DALL·E 2 para cualquier tipo de estilo visual, desde dibujos a lápiz y pintura hasta pixel art y representaciones 3D, la IA generativa puede proporcionar un buen punto de partida para establecer un tono o dirección visual.

dalle2 generación futurista synthwave
Generación DALL·E 2 usando el mensaje "Una ciudad futurista de ondas sintéticas con autos voladores"
Generación Dalle2 de un boceto a lápiz de la carrera de 100 m.
DALL·E 2 generación usando el mensaje "Un boceto a lápiz de la carrera de 100 m"

Apoyo al lanzamiento de la marca

Cuando se implementa una nueva marca, es común simular cómo se verán los nuevos diseños en diferentes elementos estacionarios, o visualizar diseños de sitios web in situ en diferentes dispositivos. DALL·E 2 tal vez pueda ayudar a generar un telón de fondo único que se vincule con el negocio del cliente.

Por ejemplo, generar una imagen de tarjetas de presentación en un campo de flores silvestres para una marca ecológica, o simular una computadora portátil con una casa moderna de fondo para una empresa en el sector de la construcción de viviendas.

Despliegue de marca generado por IA
DALL·E 2 generaciones usando las indicaciones “Una foto de una pila de tarjetas de presentación en un prado de flores silvestres” y “Un primer plano de una Macbook Pro con una gran casa moderna al fondo, fotografía”

Obtener inspiración

Creo que todavía estamos muy lejos de generar imágenes listas para imprimir o completamente diseñadas para implementaciones creativas, pero un área en la que DALL·E 2 podría ser útil para respaldar el proceso de diseño es proporcionar una inspiración rápida para que fluya la creatividad. .

Por ejemplo, generé lo siguiente en un intento de generar un logotipo para una nueva cerveza con temática steampunk usando el mensaje "un diseño de logotipo para una cerveza steampunk". Si bien DALL·E 2 es excelente para comprender las indicaciones de texto, la generación de texto es un área en la que DALL·E 2 tiene dificultades. En todas las variaciones producidas, el texto es elegible o no tiene sentido. A pesar de eso, creo que todavía hay potencial para inspirarse en este tipo de generaciones, ya sean colores, composición o elementos utilizados en las imágenes producidas.

Diseño de logotipo generado por imagen de IA para la nueva Ale
Generación del logotipo DALL·E 2. con el mensaje "Un diseño de logotipo para una Steampunk Ale"

Producir diseños aproximados

Otra área en la que DALL·E 2 podría ser compatible es en la obtención de diseños y composiciones aproximadas que se pueden usar como idea o punto de partida para anuncios y diseños de sitios web. Los ejemplos a continuación para un diseño de sitio web y un anuncio de folleto se basaron en las indicaciones "Un [sitio web] [folleto] diseño para una empresa de energía sostenible"

Con el aprendizaje automático y la comprensión de miles de millones de imágenes de origen, DALL·E 2 incorporará naturalmente convenciones estándar en lo que respecta a los diseños. Con el ejemplo de diseño del sitio web, la navegación principal se muestra en la parte superior para todas las variaciones, el logotipo de la marca generalmente estaba en la parte superior izquierda y casi siempre había una unidad de héroe grande y un título grande debajo del encabezado seguido de párrafos de texto a continuación. Del mismo modo, el verde era un tema de color común con estas variaciones, ya que, naturalmente, tiene una fuerte asociación con la palabra "sostenibilidad".

El texto es notablemente ilegible y muchas de las imágenes dentro de los diseños son oscuras, pero desde el punto de vista de la composición, creo que hay suficiente potencial aquí para que DALL·E 2 desempeñe un papel de apoyo cuando se busca inspiración para los diseños.

Diseños de sitios web generados por IA
Diseño de DALL·E 2 con el mensaje "Un diseño de sitio web para una empresa de energía sostenible en modo oscuro"
Anuncios de folletos generados por IA
Anuncio de DALL·E 2 con el mensaje "Un anuncio de folleto de página completa A4 para una empresa de energía sostenible"

Conclusión

DALL·E 2 de OpenAI y el avance que ahora vemos con los modelos de generación de imágenes basados ​​en IA como Imagen de Google (aún no para el consumo público) son sin duda impresionantes, y veo que su papel en el espacio creativo y de marketing digital es mucho más de apoyo en lugar de una amenaza directa para los roles creativos y basados ​​en el marketing. Como hemos visto con algunos de los ejemplos anteriores, existen algunas limitaciones obvias, especialmente en cuanto al tamaño de salida y la generación de texto. Incluso con la mayoría de las imágenes basadas en fotografías utilizadas en el artículo, la mayoría de las personas probablemente podría darse cuenta de que la mayoría no son fotos reales, pero esto será cada vez más difícil de detectar con el tiempo.

Todavía estamos en las primeras etapas de la generación de imágenes basada en IA, pero veo muchas aplicaciones útiles para el sector creativo y de marketing, desde la generación de inspiración e ideas, hasta el abastecimiento de imágenes y la edición avanzada de imágenes. No pasará mucho tiempo antes de que las API para estas herramientas estén disponibles y se integren con herramientas de diseño populares como PhotoShop o Figma. Es un campo fascinante y seguiré su progreso en los próximos meses y años.