Dall-E 3 vs. Midjourney: Ein direkter KI-Bildvergleich
Veröffentlicht: 2023-10-26Dall-E 3 von OpenAI ist seit etwa einem Monat auf dem Markt und kreative Enthusiasten auf der ganzen Welt beschäftigen sich mit verschiedenen Anwendungsfällen. Das Potenzial scheint grenzenlos, von der Erstellung von KI-Bildern bis zur Produktion von Kurzfilmen.
Jetzt stellen Sie sich vielleicht die Frage: Ist Dall-E 3 den Hype wirklich wert? Ist es besser als Midjourney?
Wenn Sie Midjourney für Ihre KI-Bildanforderungen verwendet haben, fragen Sie sich vielleicht, ob ein Wechsel angebracht ist.
In diesem Blog-Beitrag gehen wir auf einen ausführlichen Vergleich ein, bei dem wir Dall-E 3 und Midjourney anhand von 16 verschiedenen Eingabeaufforderungen vergleichen, um die Stärken und Schwächen jeder Plattform zu verstehen.
Was sind DALL-E 3 und Midjourney?
DALL-E 3 ist der neueste KI-Kunstgenerator von OpenAI.
Es ist in ChatGPT integriert, was es benutzerfreundlich macht, und ist über ChatGPT Plus für 20 $ pro Monat erhältlich. Während es sich noch in der Betaphase befindet, sorgt es in verschiedenen Bereichen für präzise Bilder.
Sehen Sie sich die ausführliche Anleitung zur Verwendung von Dall-E 3 an.
Auf der anderen Seite haben wir Midjourney, einen Bot innerhalb von Discord.
Es ist bekannt für seinen reichen Stil und seine emotionalen Bilder. Für 10 US-Dollar im Monat können Sie mit dem Basisplan beginnen, seien Sie aber bereit, Ihre Eingabeaufforderungen manchmal zu optimieren.
So bietet DALL-E 3 detaillierte Kunst über eine spezielle Plattform, während Midjourney innerhalb von Discord auf Kreativität und Emotionen setzt. Beide haben ihre eigenen Vorteile. Es kommt alles darauf an, wonach Sie suchen.
Dall-E 3 vs. Midjourney: Eine Vergleichsmatrix
Dall-E 3 | Mitten auf der Reise | |
---|---|---|
Benutzerfreundlichkeit | Sehr leicht | Mittel |
Kosten | 20 $ pro Monat | Beginnt bei 10 $ pro Monat |
Bildqualität | Mehr Nuancen und Details | Gut |
Bildstil | Unterstützt alle Kunststile | Unterstützt alle Kunststile |
Bildgröße | Quadratisch, hoch und breit | Unterstützt benutzerdefinierte Größen |
Kreativität | Versteht die Absicht des Benutzers | Passen Sie das Kreativitätsniveau an |
Geschwindigkeit der Bilderzeugung | Etwas langsamer | Ein paar Sekunden |
Urheberrecht an AI-Bildern | Benutzer sind Eigentümer der von ihnen erstellten Bilder | Benutzer sind Eigentümer der von ihnen erstellten Bilder |
Realismus | Weniger lebensecht, aber detaillierter | Realistischer |
Anpassung | Begrenzte Anpassungsmöglichkeiten | Weitere Anpassungsoptionen |
Dall-E 3 gegen Midjourney: Der ultimative Showdown
Ein Blick auf eine Vergleichstabelle kann Ihnen einen kurzen Eindruck vermitteln, aber Sie werden die Stärken und Schwächen der einzelnen KI-Kunstgeneratoren nur verstehen, wenn Sie einen Vergleich nebeneinander durchführen.
In diesem Abschnitt haben wir einige der besten Bilder und Kunsttypen handverlesen. Wir verwenden in Dall-E 3 und Midjourney für jeden Typ dieselbe Eingabeaufforderung, um die Ergebnisse zu vergleichen.
Hinweis: Alle Bilder links wurden in DALL-E 3 erstellt und rechts wurden von Midjourney erstellt.
Landschaften
Aufforderung: Goldene Weizenfelder unter stürmischem Himmel, mit einer einsamen Vogelscheuche, die einen leuchtend roten Schal trägt
Das Dall-E 3-Bild hat einen detaillierten, illustrativen Stil mit einem warmen, goldenen Farbton und zeigt eine vogelscheuchenartige Figur. Im Gegensatz dazu wirkt das Bild von „Midjourney“ eher fotografisch und konzentriert sich auf eine verhüllte Figur in einem drohenden Sturm, gemalt in Sepiatönen. Es hat die Vogelscheuche völlig verfehlt.
Abstrakte Konzepte
Eingabeaufforderung: Visuelle Darstellung des Lachens durch lebendige Farbtupfer und wirbelnde Muster
Das Dall-E 3-Bild hat viele gemischte Farben, die aussehen, als würden sie sich drehen, mit vielen Blautönen, die es verträumt wirken lassen. Das Midjourney-Bild zeigt eine lachende Dame mit bunten Mustern um sich herum, wodurch sich das Lachen lebendig und echt anfühlt. Beide zeigen cool die Freude am Lachen.
Obwohl Midjourney großartige Arbeit geleistet hat, sieht das Bild nicht wie abstrakte Kunst aus. Dall-E 3 verstand die Absicht der Aufforderung und erstellte ein abstraktes Bild.
Historische Schauplätze
Aufforderung: Ein Gladiator, der sich auf den Kampf in einem römischen Kolosseum vorbereitet, seinen Helm zurechtrückt und seinen Schild festhält
Auf der linken Seite zeigt das Dall-E 3 einen Gladiator mit einem detaillierten und verzierten Helm, der vor dem Kolosseum steht. Die Atmosphäre ist ruhiger und das Sonnenlicht beleuchtet seine Ausrüstung.
Rechts zeigt das Midjourney-Bild einen raueren Gladiator in einem intimen Moment. Dieser Krieger scheint in Gedanken versunken zu sein und denkt vielleicht über den bevorstehenden Kampf nach. Seine Rüstung wirkt stärker vom Kampf getragen und die Szene wirkt düsterer und intensiver. Er hält seinen verzierten Schild fest umklammert und zeigt damit seine Entschlossenheit.
Beide Bilder sehen echt aus. Der Dall-E 3 hat fast alles enthalten, was wir in der Eingabeaufforderung verlangt haben, aber Midjourney hat den Helm und das Kolosseum vermisst. Beim Dall-E 3 fehlte auch der Teil „ Einstellen des Helms “.
Futuristische Szenen
Aufforderung: Kybernetische Straßenmusiker spielen leuchtende Instrumente in einer neonbeleuchteten Gasse einer Metropole
Das linke Bild von Dall-E 3 zeigt eine ruhige, lange Gasse mit außerirdischen Musikern und leuchtenden Neonreklamen. Es sorgte auch für perfekte Details des Hintergrunds. Das rechte Bild von Midjourney wirkt geschäftiger, mit einer Mischung aus Menschen und Robotern und einer breiteren, lebendigen Gasse voller Reflexionen von Neonlichtern. Während beide Bilder futuristische Musiker in neonbeleuchteten Gassen zeigen, fühlt man sich bei Dall-E's eher wie auf einem anderen Planeten und Midjourney's hat eine Mischung aus heutiger und zukünftiger Atmosphäre.
Porträts
Aufforderung: Eine ältere Frau mit silbernen Haaren, die zu einem Knoten zusammengebunden sind, eine Vintage-Brille trägt und ein buntes Muster stickt
Diese beiden Bilder zeigen wunderschön eine ältere Frau, die an ihrer Stickerei arbeitet. Das Dall-E 3-Bild links zeigt eine Frau mit auffälliger Vintage-Brille und silbernem Haar, das zu einem Knoten zusammengebunden ist. Sie arbeitet an einem lebendigen Muster. Das Ambiente ist raffiniert und die sanfte Beleuchtung betont ihre Gesichtszüge. Offener wirkt das rechte Bild von Midjourney, auf dem die Dame eine eher lässige, schwarz umrandete Brille trägt und in eine farbenfrohe Bluse gekleidet ist.
Beide Bilder betonen die Kunst des Stickens, aber das Dall-E 3 tendiert zur Eleganz, während das Midjourney-Bild gemütlich und authentisch wirkt.
Pixel Kunst
Eingabeaufforderung: Ein Magier, der einen Zauber mit magischen Partikeln und einem schwebenden Zauberbuch vor einem pixeligen Zauberwaldhintergrund wirkt
Auf der linken Seite bietet Dall-E 3 ein verpixeltes Bild eines Waldes im Hintergrund mit dem in tiefem Blau gehüllten Magier mit hohem Hut, der an ein Videospiel der alten Schule erinnert. Sie können die magischen Partikel sehen, die um ihn herum wirbeln, und das schwebende Zauberbuch, das weit geöffnet ist und seine leuchtenden Seiten zur Schau stellt.
Auf der rechten Seite zeichnet Midjourney nun ein realistischeres Bild. Der Magier wird als junger, intensiv aussehender Mann dargestellt, der tief in den Akt des Zauberns vertieft ist. Die magischen Partikel sind deutlich sichtbar und umgeben das leuchtende, kugelartige Zauberbuch, das er hält. Der Waldhintergrund ist zwar erkennbar, aber nicht verpixelt, wie in der Eingabeaufforderung gefordert.
Während beide Bilder einen Magier, der einen Zauber wirkt, brillant zeigen, hat nur Dall-E 3 das „pixelige“ Detail auf den Punkt gebracht.
Surrealistische Kunst
Aufforderung: Ein übergroßer Schmetterling, der einem Kreis aufmerksamer, kleiner Elefanten auf einer schwimmenden Insel ein Buch vorliest
Beide Bilder werden mit derselben Eingabeaufforderung erstellt, zeigen jedoch sehr unterschiedliche Szenen. Das Bild von Dall-E 3 ist lebendig und unterhaltsam und zeigt einen Schmetterling mit Elefantenkopf, der kleinen Elefanten auf einem schwimmenden Land ein Buch vorliest.
Andererseits vermittelt das Bild von Midjourney eine verzauberte Dschungelatmosphäre mit einer riesigen Elefanteninsel und vielen kleinen Elefanten, die verschiedenen Aktivitäten nachgehen. Allerdings fehlt in Midjourneys Version das zentrale Element des „übergroßen Schmetterlings“.
Flaches Design
Prompt: Eine minimalistische Postkarte, die die Essenz Tokios durch ikonische Silhouetten wie den Tokyo Tower, eine Sushi-Rolle und einen Kirschblütenzweig zeigt
Beide Bilder fangen die Essenz Tokios mit dem Tokyo Tower, Sushi und Kirschblüten ein. Die Version von Dall-E 3 ist lebendig und zeigt ein detailliertes Stadtbild und eine Sushi-Rolle vor einem hellen Hintergrund, und die Kirschblüten sind üppig.
Im Gegensatz dazu verfolgt Midjourney einen ruhigen und minimalistischen Ansatz mit einer Pastellpalette, vereinfachten Strukturen und weniger Kirschblüten.
Während beide Kreationen die gewünschten Elemente umfassen, fügt Dall-E 3 zusätzliche Elemente wie einen Fluss und eine Brücke hinzu. Was die Qualität betrifft, ist das Bild von Dall-E detailreicher, während bei Midjourney Schlichtheit und Freiraum im Vordergrund stehen.
3D- Renderings
Eingabeaufforderung: Ein detaillierter 3D-gerenderter Jade-Drachenanhänger mit Rubinaugen, der an einer zarten Silberkette vor einem Samthintergrund hängt
Der Anhänger von Dall-E (links) passt mit seiner grünen Farbe sehr gut zum „Jade“-Look und hat rubinrote Augen, aber die Silberkette wirkt dicker als erwartet. Der Hintergrund sieht aus wie Samt.
Der Anhänger von Midjourney (rechts) sieht nicht so sehr nach Jade aus und fühlt sich metallischer an, aber seine rubinroten Augen sind auffällig. Die Kette ist hier detaillierter und der Hintergrund ist schlicht dunkel. Verglichen mit der Aufforderung passt das Bild von Dall-E besser zu den Details „Jade“ und „Samthintergrund“, während Midjourney den Aspekt der „Silberkette“ auf den Punkt bringt.
Digitale Illustration
Aufforderung: Eine digitale Illustration einer schelmischen Katze, die versucht, einen Fisch aus einer Schüssel zu schmuggeln, während ein Papagei in der Nähe eine Warnung ruft
Beide Bilder zeigen eine Katze, die versucht, einen Fisch aus einer Schüssel zu holen, während ein Papagei in der Nähe ist. Das Bild von Dall-E 3 links zeigt eine grau gestreifte Katze, die ruhig das Wasser berührt, und der Papagei schaut nur zu.
Auf dem Midjourney-Bild rechts sieht die Katze überrascht aus, und es gibt keinen Papagei. Das Bild von Dall-E ist detaillierter und strukturierter, wodurch es eleganter aussieht. Das Bild von Midjourney wirkt gehetzt und hat eine düstere Umgebung mit fehlenden Elementen.
Ölgemälde
Aufforderung: Ein feierlicher, gedankenverlorener Seemann mit einem alten Kompass in der Hand, im Hintergrund das turbulente Meer und Gewitterwolken
Das linke Bild, aufgenommen von Dall-E 3, zeigt einen älteren Seemann, der nachdenklich dreinschaut, mit stürmischer See im Rücken. Das rechte Bild von Midjourney zeigt einen jüngeren Seemann, der auf eine ruhigere See blickt. Beide Bilder stimmen mit der Aufforderung überein, aber das von Dall-E scheint aufgrund der stürmischeren Kulisse näher zu sein. Die Bildqualität ist bei beiden gut, aber sie vermitteln unterschiedliche Gefühle: Der eine hat das Gefühl, auf vergangene Abenteuer zurückzublicken, der andere hat das Gefühl, sich auf ein neues vorzubereiten.
Diorama
Aufforderung: Eine Miniatur-Karnevalsszene mit einem funktionierenden Riesenrad, kleinen Besuchern, die Zuckerwatte genießen, und einem Clown, der im Diorama-Stil mit leuchtenden Kugeln jongliert
Beide Bilder zeigen Miniatur-Karnevalsszenen mit Riesenrädern. Das linke Bild von Dall-E 3 zeigt Besucher mit Zuckerwatte und einen Clown, der mit leuchtenden Kugeln jongliert, was gut zur Aufforderung passt. Das rechte Bild von Midjourney hat ein nächtliches Gefühl und komplexere Designs, zeigt aber keine Besucher mit Zuckerwatte oder den Jonglierclown. Während beide Bilder eine gute Qualität haben, passt sich das Bild von Dall-E eher den Besonderheiten der Aufforderung an, während das von Midjourney eine einzigartige Aufnahme bietet, aber die kleinen Besucher sind nicht so deutlich zu erkennen.
Die Architektur
Prompt: Eine skurrile Baumhausbibliothek mit Wendeltreppen, hängenden Laternen und Balkonen voller Bücher
Das linke Bild von Dall-E 3 ist eher fantasievoll, mit vielen Details, Laternen und einem größeren Baumhaus. Das rechte Bild von Midjourney kommt dem wirklichen Leben näher, mit weniger Räumen und Laternen. Beide Bilder fangen die Idee einer „Baumhausbibliothek“ mit Wendeltreppen und Bücherbalkonen ein. Beide befolgen die Aufforderung gut.
Das Bild von Dall-E wirkt jedoch mit seinem grünlichen Schimmer eher verträumt, während das Bild von Midjourney am Abend spielt und gemütlicher wirkt.
Beide Bilder sind von hoher Qualität, aber Sie haben die Wahl, ob Sie einen magischeren oder realistischeren Look bevorzugen.
Innenarchitektur
Anregung: Ein Bohemian-Schlafzimmer mit einem Hängemattenbett, Wandteppichen, einem Mosaikspiegel und von der Decke hängenden Pflanzen
Beide Bilder fangen ein böhmisches Schlafzimmergefühl ein. Das Bild von Dall-E (links) ist farbenfroh mit Mustern und hat einen hängemattenähnlichen Sitz, transparente Wandteppiche und viele hängende Pflanzen, aber keinen Mosaikspiegel.
Das Bild von Midjourney (rechts) ist heller und geräumiger, mit Pflanzen und einem Spitzenteppich, aber das Bett ist nicht im Hängemattenstil gestaltet und es gibt keinen sichtbaren Mosaikspiegel.
Obwohl beide Bilder Boho-Elemente und hängende Pflanzen aufweisen, entspricht keines von beiden vollständig der Aufforderung, insbesondere was den Mosaikspiegel und die genaue Beschreibung des Hängemattenbetts betrifft.
Eingabeaufforderungen mit hohem Kontextanteil
Eingabeaufforderung: Eine Schmiedewerkstatt während der Renaissance mit detaillierten Werkzeugen, glühender Schmiede, komplizierten Rüstungsteilen und einem Handwerker bei der Arbeit
Das linke Bild von Dall-E zeigt einen Schmied, ordentlich angeordnete Werkzeuge und eine hervorgehobene Rüstung. Das richtige von Midjourney hat mehrere Leute, verstreute Werkzeuge und eine lebhafte Atmosphäre. Während beide die Werkstatt zeigen, konzentriert sich das Dall-E-Bild auf einen einzelnen Handwerker und seine Werkzeuge, und das Midjourney-Bild wirkt eher wie ein arbeitsreicher Tag mit mehreren Arbeitern.
Eingabeaufforderungen mit geringem Kontext
Aufforderung: Ein Tanz im Mondschein
Beide Bilder zeigen einen „Mondscheintanz“. Das linke Bild von Dall-E hat einen leuchtenden Blauton mit Silhouetten von Tänzern vor einem großen Mond, während das Bild von Midjourney auf der rechten Seite einen genaueren, detaillierteren Blick auf die Tänzer mit einem subtileren Mondschein bietet. Dall-E konzentriert sich auf die Umgebung und Kontraste und Midjourney hebt die Emotionen der Tänzer hervor. Beide greifen das Thema Mondscheintanz auf, jedoch in unterschiedlichen Stilen.
Der Clou: Midjourney gegen Dall-E 3
Nach der Auswertung von 16 KI-generierten Bildern von Dall-E 3 und Midjourney ist klar, dass Dall-E 3 sich durch die Erfassung komplexer Details auszeichnet. Diese Plattform übertrifft Midjourney auch bei der Interpretation der Absicht von Eingabeaufforderungen, relevante Bilder zu generieren. Auf der anderen Seite hat Midjourney die Nase vorn, wenn es darum geht, Bilder zu erstellen, die echt aussehen. Während Dall-E 3 nach Perfektion strebt, kann es manchmal zu weniger natürlichen Bildern kommen.
Für Unternehmen, die bei ihren KI-Visualisierungen Wert auf Details legen, ist Dall-E 3 möglicherweise die passendere Wahl. Sie können darauf über ChatGPT Plus und bald auch in Photosonic, dem besten KI-Bildgenerator, zugreifen. OpenAI plant, die Dall-E 3-API bald zu veröffentlichen und sie zu einer integrierten Funktion in Photosonic zu machen.
FAQs
1. Ist Midjourney besser als DALL-E 3?
Es geht nicht wirklich darum, dass einer einfach „besser“ ist als der andere. Sie haben unterschiedliche Stile und Fähigkeiten. DALL-E 3 ist in ChatGPT Plus integriert und Teil des Pakets, das Sie mit GPT-4 erhalten. Midjourney hingegen könnte Variationen in seinen Darstellungen bieten. Es kommt mehr auf Ihre persönlichen Vorlieben und den Stil an, den Sie suchen.
2. Ist DALL-E 3 kostenlos?
Nein, DALL-E 3 ist nicht kostenlos. Es ist im Paket mit ChatGPT Plus enthalten, das 20 $/Monat kostet. Mit diesem Abonnement erhalten Sie auch Zugriff auf GPT-4.
3. Was ist günstiger, DALL-E 3 oder Midjourney?
Wenn man die Zahlen genau betrachtet, startet Midjourney zu einem günstigeren Preis von 10 $/Monat. DALL-E 3 wird mit ChatGPT Plus geliefert, das 20 $/Monat kostet. Wenn also das Budget ein entscheidender Faktor ist, könnte Midjourney Ihre kostengünstigere Option sein.