Dall-E 3 vs Midjourney: una comparación de imágenes de IA en paralelo

Publicado: 2023-10-26

Dall-E 3 de OpenAI ha estado en escena durante aproximadamente un mes y los entusiastas creativos de todo el mundo se están sumergiendo en varios casos de uso. El potencial parece ilimitado, desde la creación de imágenes de IA hasta la producción de cortometrajes.

Ahora quizás te estés preguntando: ¿Realmente vale la pena tanta expectación por Dall-E 3? ¿Es mejor que Midjourney?

Si ha estado utilizando Midjourney para sus necesidades de imágenes de IA, es posible que se pregunte si es necesario realizar un cambio.

En esta publicación de blog, profundizaremos en una comparación en profundidad, donde comparamos Dall-E 3 con Midjourney usando 16 indicaciones distintas para comprender las fortalezas y deficiencias de cada plataforma.

¿Qué son DALL-E 3 y Midjourney?

Dall-e 3 - Dall-e 3 vs mitad del viaje
Dall-e 3

DALL-E 3 es el generador de arte de IA más nuevo de OpenAI.

Está integrado en ChatGPT, lo que lo hace fácil de usar, y está disponible a través de ChatGPT Plus por $20 al mes. Aunque aún está en versión beta, causa sensación en varios campos para obtener imágenes precisas.

Consulte la guía detallada sobre Cómo utilizar Dall-E 3.

A mitad del viaje - dall-e vs a mitad del viaje
A mitad del viaje

Por otro lado, tenemos Midjourney, un robot dentro de Discord.

Es conocido por sus ricos estilos y emociones en imágenes. Por $10 al mes, puedes comenzar con su plan básico, pero prepárate para modificar tus indicaciones de vez en cuando.

Entonces, DALL-E 3 ofrece arte detallado a través de una plataforma dedicada, mientras que Midjourney, dentro de Discord, se apoya en la creatividad y la emoción. Ambos tienen sus propias ventajas. Todo se reduce a lo que estás buscando.

Dall-E 3 vs Midjourney: una matriz de comparación

Dall-E 3 A mitad del viaje
Facilidad de uso Muy fácil Medio
Costo $20 por mes Desde $10 por mes
Calidad de la imagen Más matices y detalles Bien
Estilo de imagen Soporta todos los estilos artísticos. Soporta todos los estilos artísticos.
Tamaño de la imagen Cuadrado, alto y ancho Admite tamaños personalizados
Creatividad Entiende la intención del usuario Ajustar los niveles de creatividad
Velocidad de generación de imágenes un poco mas lento Unos pocos segundos
Derechos de autor de imágenes de IA Los usuarios son propietarios de las imágenes que crearon. Los usuarios son propietarios de las imágenes que crearon.
Realismo Menos realista pero más detallado. Más realista
Personalización Opciones de personalización limitadas Más opciones de personalización

Dall-E 3 vs Midjourney: el enfrentamiento definitivo

Mirar una tabla de comparación puede darle una breve idea, pero solo comprenderá las fortalezas y debilidades de cada generador de arte de IA haciendo una comparación lado a lado.

En esta sección, seleccionamos algunas de las mejores imágenes y tipos de arte. Usaremos el mismo mensaje en Dall-E 3 y Midjourney para cada tipo para comparar los resultados.

Nota: Todas las imágenes de la izquierda se crearon en DALL-E 3 y las de la derecha se crearon en Midjourney.

Paisajes

Mensaje: Campos de trigo dorados bajo un cielo tormentoso, con un espantapájaros solitario que lleva un pañuelo rojo brillante

La imagen de Dall-E 3 tiene un estilo ilustrativo y detallado con un tono cálido y dorado, que muestra una figura parecida a un espantapájaros. Por el contrario, la imagen de Midjourney tiene una sensación más fotográfica, centrándose en una figura envuelta en una capa en una tormenta que se avecina, pintada en tonos sepia. Se perdió por completo al espantapájaros.

Conceptos abstractos

Mensaje: Representación visual del sonido de la risa usando vibrantes explosiones de color y patrones arremolinados.

La imagen de Dall-E 3 tiene muchos colores mezclados, que parecen girar, con muchos azules, lo que la hace sentir de ensueño. La imagen de Midjourney muestra a una dama riendo con patrones coloridos a su alrededor, lo que hace que la risa parezca viva y real. Ambos son geniales al mostrar la alegría de la risa.

Si bien Midjourney hizo un gran trabajo, la imagen no parece arte abstracto. Dall-E 3 entendió la intención del mensaje y generó una imagen abstracta.

Escenarios históricos

Mensaje: Un gladiador preparándose para la batalla en un Coliseo romano, ajustándose el casco y agarrando su escudo.

A la izquierda, el Dall-E 3 muestra a un gladiador con un casco adornado y detallado de pie ante el Coliseo. El ambiente es más sereno y la luz del sol ilumina su equipo.

A la derecha, la imagen de Midjourney presenta a un gladiador más rudo en un momento íntimo. Este guerrero parece perdido en sus pensamientos, tal vez reflexionando sobre la batalla que se avecina. Su armadura está más desgastada por la batalla y la escena se siente más oscura e intensa. Agarra con fuerza su ornamentado escudo, mostrando su determinación.

Ambas imágenes parecen reales. El Dall-E 3 incluyó casi todo lo que pedimos en el mensaje, pero Midjourney se perdió el casco y el coliseo. Dall-E 3 también se perdió la parte de ' ajustar el casco '.

escenas futuristas

Mensaje: Músicos callejeros cibernéticos tocando instrumentos luminosos en un callejón iluminado con luces de neón de una metrópoli

La imagen de la izquierda de Dall-E 3 muestra un callejón largo y tranquilo con músicos extraterrestres y brillantes letreros de neón. También se aseguró de tener detalles perfectos del fondo. La imagen de la derecha de Midjourney parece más ocupada, con una mezcla de humanos y robots y un callejón más amplio y vibrante lleno de reflejos de luces de neón. Si bien ambas imágenes muestran músicos futuristas en callejones iluminados con luces de neón, la de Dall-E se siente más como en otro planeta y la de Midjourney tiene una mezcla de vibraciones actuales y futuras.

Retratos

Mensaje: Una mujer mayor con cabello plateado recogido en un moño, usando gafas antiguas y bordando un patrón colorido.

Estas dos imágenes capturan maravillosamente a una anciana trabajando en su bordado. La imagen de Dall-E 3 de la izquierda muestra a una mujer con llamativas gafas vintage y cabello plateado recogido en un moño. Ella está trabajando en un patrón vibrante. El ambiente es refinado, con una iluminación suave que resalta sus rasgos. La imagen de la derecha de Midjourney parece más sincera, donde la dama lleva gafas más informales con montura negra y viste una blusa colorida.

Ambas imágenes enfatizan el arte del bordado, pero el Dall-E 3 se inclina hacia la elegancia mientras que el Midjourney se siente acogedor y auténtico.

Arte de pixel

Mensaje: Un mago lanzando un hechizo, con partículas mágicas y un libro de hechizos flotante, sobre un fondo de bosque encantado pixelado.

A la izquierda, Dall-E 3 ofrece una imagen pixelada de un fondo de bosque con el mago vestido de azul profundo y con un sombrero alto, replicando la vibra de un videojuego de la vieja escuela. Puedes ver las partículas mágicas girando a su alrededor y el libro de hechizos flotante, que está abierto de par en par, mostrando sus páginas brillantes.

Ahora, a la derecha, Midjourney pinta un cuadro más realista. El mago es retratado como un hombre joven, de aspecto intenso, profundamente absorto en el acto de lanzar un hechizo. Las partículas mágicas son vívidamente visibles y rodean el brillante libro de hechizos en forma de orbe que sostiene. Si bien el fondo del bosque es evidente, no está pixelado como lo pedía el mensaje.

Si bien ambas imágenes representan brillantemente a un mago lanzando un hechizo, solo Dall-E 3 logró el detalle "pixelado".

arte surrealista

Mensaje: Una mariposa de gran tamaño leyendo un libro ante un círculo de pequeños y atentos elefantes en una isla flotante.

Ambas imágenes se crean utilizando el mismo mensaje pero pintan escenas muy diferentes. La imagen de Dall-E 3 es vibrante y divertida y muestra una mariposa con cabeza de elefante leyendo un libro a pequeños elefantes en una tierra flotante.

Por otro lado, la imagen de Midjourney tiene una sensación de jungla encantada con una isla de elefantes gigante y muchos elefantes pequeños realizando diferentes actividades. Pero la versión de Midjourney omite el elemento central de la "mariposa de gran tamaño".

Diseño plano

Mensaje: Una postal minimalista que muestra la esencia de Tokio a través de siluetas icónicas como la Torre de Tokio, un rollo de sushi y una rama de flor de cerezo.

Ambas imágenes capturan la esencia de Tokio utilizando la Torre de Tokio, el sushi y las flores de cerezo. La versión de Dall-E 3 es vibrante y muestra un paisaje urbano detallado y un rollo de sushi sobre un fondo brillante, y las flores de cerezo son exuberantes.

Por el contrario, Midjourney tiene un enfoque tranquilo y minimalista con una paleta de colores pastel, estructuras simplificadas y menos flores de cerezo.

Si bien ambas creaciones abarcan los elementos solicitados, Dall-E 3 agrega características adicionales como un río y un puente. En cuanto a la calidad, la imagen de Dall-E es más rica en detalles, mientras que la de Midjourney prioriza la simplicidad y el espacio abierto.

renderizados 3D

Aviso: Un detallado colgante de dragón de jade renderizado en 3D con ojos de rubí, suspendido de una delicada cadena de plata sobre un fondo de terciopelo.

El colgante de Dall-E (a la izquierda) coincide mucho con el aspecto de 'jade' con su color verde y sus ojos rojo rubí, pero la cadena de plata parece más gruesa de lo esperado. El fondo parece terciopelo.

El colgante de Midjourney (a la derecha) no se parece tanto al jade y tiene una sensación más metálica, pero sus ojos de rubí son prominentes. La cadena aquí es más detallada y el fondo es completamente oscuro. En comparación con el mensaje, la imagen de Dall-E se alinea mejor con los detalles de "jade" y "fondo de terciopelo", mientras que Midjourney destaca el aspecto de "cadena de plata".

Ilustración digital

Aviso: una ilustración digital de un gato travieso que intenta sacar un pescado de una pecera mientras un loro cerca grita una advertencia.

Ambas imágenes muestran a un gato tratando de sacar un pescado de un recipiente con un loro cerca. La imagen de Dall-E 3 a la izquierda muestra un gato de rayas grises tocando tranquilamente el agua y el loro simplemente está mirando.

En la imagen de Midjourney de la derecha, el gato parece sorprendido y no hay ningún loro. La imagen de Dall-E tiene más detalles y textura, lo que la hace lucir más pulida. La imagen de Midjourney se siente apresurada y tiene un ambiente más oscuro al que le faltan elementos.

Pintura al óleo

Mensaje: Un marinero solemne perdido en sus pensamientos, sosteniendo una vieja brújula, con el mar tumultuoso y las nubes de tormenta de fondo.

La imagen de la izquierda, tomada por Dall-E 3, muestra a un marinero mayor mirando pensativo con un mar tormentoso detrás de él. El de la derecha, de Midjourney, muestra a un marinero más joven contemplando un mar más tranquilo. Ambas imágenes coinciden con el mensaje, pero la de Dall-E parece más cercana debido al fondo más tormentoso. La calidad de imagen es buena en ambos, pero dan sensaciones diferentes: uno tiene ganas de recordar aventuras pasadas y el otro tiene ganas de prepararse para una nueva.

Diorama

Mensaje: Una escena de carnaval en miniatura, con una noria en funcionamiento, pequeños visitantes disfrutando de algodón de azúcar y un payaso haciendo malabares con orbes brillantes en estilo diorama.

Ambas imágenes muestran escenas de carnaval en miniatura con norias. La imagen de la izquierda de Dall-E 3 muestra a los visitantes con algodón de azúcar y un payaso haciendo malabarismos con orbes brillantes, lo que encaja bien con el mensaje. La imagen de la derecha de Midjourney tiene un aire nocturno y diseños más complejos, pero no muestra a los visitantes con algodón de azúcar ni al payaso que hace malabares. Si bien ambas imágenes tienen buena calidad, la imagen de Dall-E se alinea más con los detalles específicos del mensaje, mientras que la de Midjourney ofrece una toma única, pero los pequeños visitantes no son tan claros.

Arquitectura

Aviso: Una biblioteca caprichosa en una casa en el árbol con escaleras de caracol, linternas colgantes y balcones llenos de libros.

La imagen de la izquierda de Dall-E 3 es más fantástica, con muchos detalles, linternas y una casa en el árbol más grande. La imagen correcta de Midjourney se acerca más a la vida real, con menos habitaciones y linternas. Ambas imágenes capturan la idea de una "biblioteca en la casa del árbol" con escaleras de caracol y balcones para libros. Ambos siguen bien las indicaciones.

Sin embargo, la imagen de Dall-E tiene una sensación más soñadora con su brillo verdoso, mientras que la de Midjourney parece ambientada en la noche y se siente más acogedora.

Ambas imágenes son de alta calidad, pero la elección entre ellas es si te gusta una apariencia más mágica o realista.

Diseño de interiores

Aviso: un dormitorio bohemio con una hamaca, tapices en las paredes, un espejo de mosaico y plantas colgando del techo.

Ambas imágenes capturan la sensación de un dormitorio bohemio. La imagen de Dall-E (a la izquierda) es colorida con patrones y tiene un asiento tipo hamaca, tapices transparentes y muchas plantas colgantes, pero carece de un espejo de mosaico.

La imagen de Midjourney (a la derecha) es más luminosa y espaciosa, con plantas y un tapiz de encaje, pero su cama no tiene estilo de hamaca y no hay ningún espejo de mosaico visible.

Si bien ambas imágenes tienen elementos bohemios y plantas colgantes, ninguna coincide completamente con el mensaje, especialmente en lo que respecta al espejo de mosaico y la descripción exacta de la hamaca.

Indicaciones de alto contexto

Mensaje: Un taller de herrería durante el Renacimiento, con herramientas detalladas, forja resplandeciente, piezas de armadura intrincadas y un artesano trabajando.

El de la izquierda de Dall-E tiene un herrero, herramientas cuidadosamente organizadas y una armadura resaltada. El correcto de Midjourney tiene varias personas, herramientas dispersas y una atmósfera animada. Si bien ambas representan el taller, la imagen de Dall-E se centra en un solo artesano y sus herramientas, y la de Midjourney se siente más como un día ajetreado con varios trabajadores.

Indicaciones de bajo contexto

Mensaje: Un baile a la luz de la luna

Ambas imágenes muestran un "baile a la luz de la luna". La imagen de la izquierda de Dall-E tiene un tono azul vibrante con siluetas de bailarines contra una gran luna, mientras que la de Midjourney, a la derecha, ofrece una mirada más cercana y detallada a los bailarines con un brillo lunar más sutil. Dall-E se centra en el entorno y los contrastes, y Midjourney destaca las emociones de los bailarines. Ambos capturan el tema de la danza a la luz de la luna, pero en diferentes estilos.

Lo espectacular: Midjourney vs Dall-E 3

Después de evaluar 16 imágenes generadas por IA de Dall-E 3 y Midjourney, es evidente que Dall-E 3 sobresale en la captura de detalles intrincados. Esta plataforma también supera a Midjourney en la interpretación de la intención de las indicaciones para generar imágenes relevantes. Por otro lado, Midjourney tiene la ventaja de crear imágenes que parecen reales. Aunque Dall-E 3 aspira a la perfección, a veces puede producir imágenes menos naturales.

Para las empresas que buscan detalles en sus imágenes de IA, Dall-E 3 podría ser la opción más adecuada. Podrás acceder a él a través de ChatGPT Plus y también en Photosonic, el mejor generador de imágenes con IA, muy pronto. OpenAI planea lanzar pronto la API Dall-E 3, convirtiéndola en una función integrada en Photosonic.

Preguntas frecuentes

1. ¿Midjourney es mejor que DALL-E 3?

En realidad, no se trata de que uno sea absolutamente "mejor" que el otro. Tienen diferentes estilos y capacidades. DALL-E 3 está integrado con ChatGPT Plus y es parte del paquete que obtienes con GPT-4. Midjourney, por otro lado, podría ofrecer variaciones en sus representaciones. Se trata más de tus preferencias personales y del estilo que estás buscando.

2. ¿DALL-E 3 es gratuito?

No, DALL-E 3 no es gratis. Viene incluido con ChatGPT Plus, que cuesta $20 al mes. Esta suscripción también le otorga acceso a GPT-4.

3. ¿Qué es más barato, DALL-E 3 o Midjourney?

Si nos fijamos estrictamente en los números, Midjourney comienza con un precio más económico de 10 dólares al mes. DALL-E 3 viene con ChatGPT Plus, cuyo precio es de $20 al mes. Entonces, si el presupuesto es un factor clave, Midjourney podría ser su opción más rentable.