Dall-E 3 vs Midjourney : une comparaison d'images IA côte à côte
Publié: 2023-10-26Le Dall-E 3 d'OpenAI est sur le marché depuis environ un mois et les passionnés de création du monde entier se plongent dans divers cas d'utilisation. Le potentiel semble illimité, de la création d’images IA à la production de courts métrages.
Maintenant, vous vous posez peut-être des questions : le Dall-E 3 vaut-il vraiment le coup ? Est-ce mieux que Midjourney ?
Si vous utilisez Midjourney pour vos besoins en images d'IA, vous vous demandez peut-être si un changement est nécessaire.
Dans cet article de blog, nous plongerons dans une comparaison approfondie, dans laquelle nous comparerons Dall-E 3 à Midjourney en utilisant 16 invites distinctes pour comprendre les forces et les lacunes de chaque plateforme.
Que sont DALL-E 3 et Midjourney ?
DALL-E 3 est le dernier générateur d'art IA d'OpenAI.
Il est intégré à ChatGPT, ce qui le rend convivial, et est disponible via ChatGPT Plus pour 20 $ par mois. Bien qu'encore en version bêta, il fait des vagues dans divers domaines pour des images précises.
Consultez le guide détaillé sur Comment utiliser Dall-E 3.
D’un autre côté, nous avons Midjourney, un bot de Discord.
Il est connu pour la richesse de ses styles et de ses émotions en images. Pour 10 $ par mois, vous pouvez commencer avec leur forfait de base, mais soyez prêt à modifier parfois vos invites.
Ainsi, DALL-E 3 propose un art détaillé via une plateforme dédiée, tandis que Midjourney, au sein de Discord, se penche sur la créativité et l'émotion. Les deux ont leurs propres avantages. Tout dépend de ce que vous recherchez.
Dall-E 3 vs Midjourney : une matrice de comparaison
Dall-E 3 | À mi-parcours | |
---|---|---|
Facilité d'utilisation | Très facile | Moyen |
Coût | 20 $ par mois | À partir de 10 $ par mois |
Qualité d'image | Plus de nuances et de détails | Bien |
Style d'image | Prend en charge tous les styles artistiques | Prend en charge tous les styles artistiques |
Taille de l'image | Carré, haut et large | Prend en charge les tailles personnalisées |
La créativité | Comprend l'intention de l'utilisateur | Ajuster les niveaux de créativité |
Vitesse de génération d'images | Un peu plus lent | Quelques secondes |
Droits d'auteur sur les images IA | Les utilisateurs sont propriétaires des images qu'ils ont créées | Les utilisateurs sont propriétaires des images qu'ils ont créées |
Le réalisme | Moins réaliste mais plus détaillé | Plus réaliste |
Personnalisation | Options de personnalisation limitées | Plus d'options de personnalisation |
Dall-E 3 contre Midjourney : la confrontation ultime
L’examen d’un tableau comparatif peut vous donner une brève idée, mais vous ne comprendrez les forces et les faiblesses de chaque générateur d’art IA qu’en effectuant une comparaison côte à côte.
Dans cette section, nous avons sélectionné certaines des meilleures images et types d’art. Nous utiliserons la même invite dans Dall-E 3 et Midjourney pour chaque type afin de comparer les résultats.
Remarque : toutes les images de gauche sont créées dans DALL-E 3 et celles de droite sont créées par Midjourney.
Paysages
Invite : des champs de blé dorés sous un ciel d'orage, avec un épouvantail solitaire portant une écharpe rouge vif
L'image Dall-E 3 présente un style détaillé et illustratif avec une teinte chaude et dorée, mettant en valeur une silhouette ressemblant à un épouvantail. En revanche, l'image de Midjourney a une sensation plus photographique, se concentrant sur une silhouette masquée dans une tempête imminente, peinte dans des tons sépia. Il a complètement raté l'épouvantail.
Concepts abstraits
Invite : Représentation visuelle du son du rire à l'aide d'éclats de couleurs vibrants et de motifs tourbillonnants
L'image Dall-E 3 a de nombreuses couleurs mélangées, comme si elles tournaient, avec beaucoup de bleus, ce qui la rend rêveuse. La photo de Midjourney montre une dame qui rit avec des motifs colorés autour d'elle, ce qui rend le rire vivant et réel. Les deux sont cool en montrant la joie du rire.
Bien que Midjourney ait fait un excellent travail, l’image ne ressemble pas à de l’art abstrait. Dall-E 3 a compris l'intention de l'invite et a généré un visuel abstrait.
Paramètres historiques
Invite : un gladiateur se préparant au combat dans un Colisée romain, ajustant son casque et agrippant son bouclier
Sur la gauche, le Dall-E 3 montre un gladiateur avec un casque détaillé et orné se tenant devant le Colisée. L'ambiance est plus sereine et la lumière du soleil illumine son équipement.
À droite, l'image de Midjourney présente un gladiateur plus robuste dans un moment intime. Ce guerrier semble perdu dans ses pensées, réfléchissant peut-être à la bataille à venir. Son armure est plus usée au combat et la scène semble plus sombre et plus intense. Il serre fermement son bouclier orné, montrant sa détermination.
Les deux images semblent réelles. Le Dall-E 3 a inclus presque tout ce que nous avons demandé dans l'invite, mais Midjourney a raté le casque et le Colisée. Dall-E 3 a également raté la partie « ajustement du casque ».
Scènes futuristes
Invite : Des musiciens de rue cybernétiques jouant des instruments lumineux dans une ruelle éclairée au néon d'une métropole
L'image de gauche de Dall-E 3 montre une longue allée calme avec des musiciens ressemblant à des extraterrestres et des enseignes lumineuses au néon. Il s’est également assuré d’avoir des détails parfaits sur l’arrière-plan. L'image de droite de Midjourney semble plus animée, avec un mélange d'humains et de robots et une allée plus large et vibrante remplie de reflets de néons. Alors que les deux images montrent des musiciens futuristes dans des ruelles éclairées au néon, celle de Dall-E ressemble davantage à une autre planète et celle de Midjourney présente un mélange d'ambiances d'aujourd'hui et de demain.
Portraits
Invite : Une femme âgée aux cheveux argentés attachés en chignon, portant des lunettes vintage et brodant un motif coloré
Ces deux images capturent magnifiquement une femme âgée travaillant sur sa broderie. L'image Dall-E 3 à gauche montre une femme avec des lunettes vintage frappantes et des cheveux argentés attachés en chignon. Elle travaille sur un motif vibrant. L'ambiance est raffinée, avec un éclairage tamisé mettant en valeur ses traits. L'image de droite de Midjourney semble plus franche, où la dame porte des lunettes plus décontractées à monture noire et est vêtue d'un chemisier coloré.
Les deux images mettent l'accent sur l'art de la broderie, mais le Dall-E 3 penche vers l'élégance tandis que celui de Midjourney est confortable et authentique.
Pixel art
Invite : Un mage jetant un sort, avec des particules magiques et un livre de sorts flottant, sur fond de forêt enchantée pixélisée.
Sur la gauche, Dall-E 3 propose une image pixellisée d'un fond de forêt avec le mage vêtu d'un bleu profond avec un grand chapeau, reproduisant une ambiance de jeu vidéo à l'ancienne. Vous pouvez voir les particules magiques tourbillonnant autour de lui et le livre de sorts flottant, grand ouvert, présentant ses pages lumineuses.
Maintenant, à droite, Midjourney dresse un tableau plus réaliste. Le mage est dépeint comme un jeune homme à l'air intense, profondément absorbé par l'acte de lancer des sorts. Les particules magiques sont clairement visibles, entourant le livre de sorts lumineux en forme d'orbe qu'il tient. Bien que l'arrière-plan de la forêt soit évident, il n'est pas pixelisé comme l'invite l'avait demandé.
Alors que les deux images représentent brillamment un mage jetant un sort, seul Dall-E 3 a réussi le détail « pixelisé ».
Art surréaliste
Invite : Un papillon surdimensionné lisant un livre devant un cercle de petits éléphants attentifs sur une île flottante.
Les deux images sont créées à l’aide de la même invite mais représentent des scènes très différentes. L'image de Dall-E 3 est vibrante et amusante, mettant en vedette un papillon avec une tête d'éléphant lisant un livre à de minuscules éléphants sur une terre flottante.
D'un autre côté, l'image de Midjourney évoque une jungle enchantée avec une île aux éléphants géants et de nombreux petits éléphants pratiquant différentes activités. Mais la version de Midjourney manque l’élément central du « papillon surdimensionné ».
Conception plate
Invite : une carte postale minimaliste mettant en valeur l'essence de Tokyo à travers des silhouettes emblématiques comme la tour de Tokyo, un rouleau de sushi et une branche de fleurs de cerisier
Les deux images capturent l'essence de Tokyo à l'aide de la tour de Tokyo, des sushis et des fleurs de cerisier. La version de Dall-E 3 est vibrante, montrant un paysage urbain détaillé et des rouleaux de sushi sur un fond lumineux, et les fleurs de cerisier sont luxuriantes.
En revanche, Midjourney a une approche calme et minimaliste avec une palette pastel, des structures simplifiées et moins de fleurs de cerisier.
Alors que les deux créations englobent les éléments demandés, Dall-E 3 ajoute des fonctionnalités supplémentaires comme une rivière et un pont. Du point de vue de la qualité, l'image de Dall-E est plus riche en détails, tandis que celle de Midjourney privilégie la simplicité et l'espace ouvert.
Rendus 3D
Invite : un pendentif dragon en jade détaillé en 3D avec des yeux rubis, suspendu à une délicate chaîne en argent sur un fond de velours
Le pendentif de Dall-E (à gauche) correspond étroitement au look « jade » avec sa couleur verte et ses yeux rouge rubis, mais la chaîne en argent semble plus épaisse que prévu. La toile de fond ressemble à du velours.
Le pendentif de Midjourney (à droite) ne ressemble pas autant au jade et a une sensation plus métallique, mais ses yeux rubis sont proéminents. La chaîne ici est plus détaillée et l’arrière-plan est tout simplement sombre. Par rapport à l'invite, l'image de Dall-E s'aligne mieux avec les détails du « jade » et du « fond de velours », tandis que Midjourney met en valeur l'aspect « chaîne en argent ».
Illustration numérique
Invite : illustration numérique d'un chat espiègle essayant de sortir un poisson d'un bol tandis qu'un perroquet à proximité crie un avertissement.
Les deux images montrent un chat essayant de récupérer un poisson dans un bol avec un perroquet à proximité. L'image de gauche de Dall-E 3 montre un chat à rayures grises touchant calmement l'eau, et le perroquet ne fait que regarder.
Sur la photo de Midjourney à droite, le chat a l'air surpris et il n'y a pas de perroquet. La photo de Dall-E a plus de détails et de texture, ce qui lui donne un aspect plus soigné. L'image de Midjourney semble précipitée et présente un décor plus sombre avec des éléments manquants.
Peinture à l'huile
Invite : Un marin solennel perdu dans ses pensées, tenant une vieille boussole, avec la mer tumultueuse et les nuages orageux en toile de fond.
L'image de gauche, réalisée par Dall-E 3, montre un marin plus âgé qui semble pensif avec une mer agitée derrière lui. Celui de droite, réalisé par Midjourney, représente un jeune marin regardant une mer plus calme. Les deux images correspondent à l'invite, mais celle de Dall-E semble plus proche en raison du contexte plus orageux. La qualité d'image est bonne dans les deux cas, mais ils donnent des sentiments différents : l'un a envie de revenir sur des aventures passées, et l'autre a envie de se préparer pour une nouvelle.
Diorama
Invite : Une scène de carnaval miniature, avec une grande roue qui fonctionne, de minuscules visiteurs dégustant de la barbe à papa et un clown jonglant avec des orbes lumineux dans le style diorama.
Les deux images montrent des scènes de carnaval miniatures avec de grandes roues. L'image de gauche de Dall-E 3 montre des visiteurs avec de la barbe à papa et un clown jonglant avec des orbes lumineux, ce qui correspond bien à l'invite. L'image de droite de Midjourney a une ambiance nocturne et des designs plus complexes, mais ne montre pas les visiteurs avec de la barbe à papa ou le clown jongleur. Bien que les deux images soient de bonne qualité, l'image de Dall-E se rapproche davantage des spécificités de l'invite, tandis que celle de Midjourney offre une prise unique, mais les petits visiteurs ne sont pas aussi clairs.
Architecture
Invite : une bibliothèque fantaisiste dans une cabane dans les arbres avec des escaliers en colimaçon, des lanternes suspendues et des balcons remplis de livres
L'image de gauche de Dall-E 3 ressemble plus à de la fantaisie, avec de nombreux détails, des lanternes et une plus grande cabane dans les arbres. L'image de droite de Midjourney semble plus proche de la vie réelle, avec moins de pièces et de lanternes. Les deux images capturent l'idée d'une « bibliothèque dans les arbres » avec des escaliers en colimaçon et des balcons de livres. Ils suivent tous les deux bien l’invite.
Cependant, la photo de Dall-E a une sensation plus rêveuse avec sa lueur verdâtre, tandis que celle de Midjourney semble se dérouler en soirée et est plus confortable.
Les deux images sont de haute qualité, mais le choix entre elles est de savoir si vous préférez un look plus magique ou plus réaliste.
Design d'intérieur
Invite : Une chambre bohème avec un lit hamac, des tapisseries aux murs, un miroir en mosaïque et des plantes suspendues au plafond.
Les deux images capturent une ambiance bohème dans une chambre. L'image de Dall-E (à gauche) est colorée avec des motifs et comporte un siège en forme de hamac, des tapisseries transparentes et de nombreuses plantes suspendues, mais il lui manque un miroir en mosaïque.
L'image de Midjourney (à droite) est plus claire et plus spacieuse, avec des plantes et une tapisserie de dentelle, mais son lit n'est pas de style hamac et il n'y a pas de miroir en mosaïque visible.
Bien que les deux images comportent des éléments bohèmes et des plantes suspendues, aucune ne correspond entièrement à l'invite, en particulier en ce qui concerne le miroir en mosaïque et la description exacte du lit hamac.
Invites contextuelles élevées
Invite : Un atelier de forgeron à la Renaissance, avec des outils détaillés, une forge rougeoyante, des pièces d'armure complexes et un artisan au travail
Celui de gauche de Dall-E a un forgeron, des outils bien organisés et une armure mise en évidence. Celui de droite de Midjourney compte plusieurs personnes, des outils dispersés et une atmosphère animée. Alors que les deux représentent l'atelier, l'image de Dall-E se concentre sur un seul artisan et ses outils, tandis que celle de Midjourney ressemble davantage à une journée bien remplie avec plusieurs travailleurs.
Invites contextuelles faibles
Invite : Une danse au clair de lune
Les deux images présentent une « danse au clair de lune ». L'image de gauche de Dall-E a un ton bleu vif avec des danseurs se découpant sur une grande lune, tandis que celle de Midjourney, à droite, offre un aperçu plus rapproché et plus détaillé des danseurs avec une lueur de lune plus subtile. Dall-E se concentre sur l'environnement et les contrastes, et Midjourney met en avant les émotions des danseurs. Les deux capturent le thème de la danse au clair de lune mais dans des styles différents.
Le clou du spectacle : Midjourney contre Dall-E 3
Après avoir évalué 16 images générées par l'IA de Dall-E 3 et Midjourney, il est évident que Dall-E 3 excelle dans la capture de détails complexes. Cette plate-forme surpasse également Midjourney dans l'interprétation de l'intention des invites pour générer des images pertinentes. D'un autre côté, Midjourney a un avantage dans la création de visuels qui semblent réels. Si le Dall-E 3 vise la perfection, il peut parfois produire des images moins naturelles.
Pour les entreprises à la recherche de détails dans leurs visuels IA, Dall-E 3 pourrait être le choix le plus approprié. Vous pourrez y accéder via ChatGPT Plus et également dans Photosonic, le meilleur générateur d'images IA, très prochainement. OpenAI prévoit de publier prochainement l'API Dall-E 3, ce qui en fera une fonctionnalité intégrée dans Photosonic.
FAQ
1. Midjourney est-il meilleur que DALL-E 3 ?
Il ne s’agit pas vraiment que l’un soit carrément « meilleur » que l’autre. Ils ont des styles et des capacités différents. DALL-E 3 est intégré à ChatGPT Plus et fait partie du package que vous obtenez avec GPT-4. Midjourney, en revanche, pourrait proposer des variations dans ses rendus. Il s'agit davantage de vos préférences personnelles et du style que vous recherchez.
2. DALL-E 3 est-il gratuit ?
Non, DALL-E 3 n'est pas gratuit. Il est fourni avec ChatGPT Plus, qui coûte 20 $/mois. Cet abonnement vous donne également accès à GPT-4.
3. Qu'est-ce qui est le moins cher, DALL-E 3 ou Midjourney ?
En regardant strictement les chiffres, Midjourney commence à un prix moins cher de 10 $/mois. DALL-E 3 est livré avec ChatGPT Plus, au prix de 20 $/mois. Ainsi, si le budget est un facteur clé, Midjourney pourrait être votre option la plus rentable.