Dall-E 3 と Midjourney: AI 画像を並べて比較

公開: 2023-10-26

OpenAI の Dall-E 3 が登場してから約 1 か月が経過し、世界中のクリエイティブ愛好家がさまざまなユースケースに飛び込んでいます。 AI 画像の作成から短編映画の制作まで、その可能性は無限に思えます。

AI を使用してどれくらい速くフィルムを生成できるかを確認する 10 分間の実験。
#ChatGPT にストーリーを依頼し、#DALLE3 で画像を生成するように依頼しました
#runwayml を通じて画像を実行し、音楽を追加しました。

これは GPT4 が考え出したストーリーです。
過去の残響:
イントロ: ジャズバーで… pic.twitter.com/6hlPknBYY7
— オリバー・マッキャン (@OliverZMcCann) 2023 年 10 月 14 日

さて、あなたは次のような疑問を抱いているかもしれません: Dall-E 3 は本当に誇大広告に値するのでしょうか? ミッドジャーニーより良いですか？

AI 画像のニーズに Midjourney を使用している場合は、切り替えが適切かどうか疑問に思うかもしれません。

このブログ投稿では、各プラットフォームの長所と短所を理解するために、16 の異なるプロンプトを使用して Dall-E 3 と Midjourney を比較し、詳細に比較します。

DALL-E 3とMidjourneyとは何ですか?

DALL-E 3 は、OpenAI の最新の AI アートジェネレーターです。

ChatGPT に組み込まれているため使いやすく、ChatGPT Plus を通じて月額 20 ドルで利用できます。まだベータ版ではありますが、正確な画像としてさまざまな分野で話題を呼んでいます。

Dall-E 3 の使用方法に関する詳細ガイドをご覧ください。

反対に、Discord 内のボットである Midjourney があります。

豊かなスタイルと感情を表現した画像で知られています。月額 10 ドルで基本プランから始めることができますが、場合によってはプロンプトを調整する準備をしてください。

つまり、DALL-E 3 は専用プラットフォームを通じて詳細なアートを提供するのに対し、Discord 内の Midjourney は創造性と感情に重点を置いています。どちらにも独自の利点があります。すべてはあなたが何を探しているかによって決まります。

Dall-E 3 対 Midjourney: 比較表

	ダル-E 3	旅の途中
使いやすさ	非常に簡単	中くらい
料金	月額 20 ドル	月額 10 ドルから始まります
画質	より詳細なニュアンスと詳細	良い
画像スタイル	あらゆるアートスタイルをサポート	あらゆるアートスタイルをサポート
画像サイズ	四角くて高くて広い	カスタムサイズをサポート
創造性	ユーザーの意図を理解する	創造性レベルを調整する
画像生成速度	もう少し遅い	数秒
AI画像の著作権	ユーザーは自分が作成した画像を所有します	ユーザーは自分が作成した画像を所有します
リアリズム	本物らしさは少ないが、より詳細な表現が可能	より現実的な
カスタマイズ	限られたカスタマイズオプション	さらなるカスタマイズオプション

Dall-E 3 vs Midjourney: 究極の対決

比較表を見ると概要がわかりますが、各 AI アートジェネレーターの長所と短所は、並べて比較して初めて理解できます。

このセクションでは、最高の画像とアートタイプをいくつか厳選しました。 Dall-E 3 と Midjourney で同じプロンプトをタイプごとに使用して、結果を比較します。

注:左側の画像はすべて DALL-E 3 で作成され、右側は Midjourney で作成されています。

風景

プロンプト:嵐の空の下、黄金色の小麦畑と、真っ赤なスカーフをかぶった一匹のかかし

Dall-E 3 の画像は、温かみのある金色の色合いを持つ詳細でイラスト的なスタイルで、かかしのような姿を示しています。対照的に、『ミッドジャーニー』のイメージはより写真的な雰囲気があり、迫り来る嵐の中でセピア色で描かれたマントを着た人物に焦点を当てています。かかしを完全に見逃してしまいました。

抽象的な概念

プロンプト:鮮やかな色のバーストと渦巻くパターンを使用した笑い声の視覚的表現

Dall-E 3 の絵は、たくさんの色が混ざり合って回転しているように見え、青が多く、幻想的な感じがします。『Midjourney』の写真には、カラフルな模様が周囲にありながら笑っている女性が描かれており、その笑い声が生き生きとしてリアルに感じられます。どちらも笑いの楽しさを表現していてカッコいいです。

『ミッドジャーニー』は素晴らしい仕事をしているが、そのイメージは抽象芸術のようには見えない。 Dall-E 3 はプロンプトの意図を理解し、抽象的なビジュアルを生成しました。

歴史的設定

プロンプト:ローマのコロッセオで戦いの準備をし、ヘルメットを調整し、盾を握る剣闘士

左側の Dall-E 3 には、精緻で華麗なヘルメットをかぶった剣闘士がコロッセオの前に立っています。雰囲気はより穏やかになり、太陽の光が彼のギアを照らします。

右側のミッドジャーニーの画像では、より屈強な剣闘士が親密な瞬間を表現しています。この戦士は物思いにふけっているようで、おそらく今後の戦いについて考えているようです。彼の鎧は戦いで使い古されており、シーンはより暗く、より強烈に感じられます。彼は装飾された盾をしっかりと握り締め、彼の決意を示しています。

どちらの画像も本物のように見えます。 Dall-E 3 には、プロンプトで求めたほぼすべてのものが含まれていますが、Midjourney ではヘルメットとコロシアムを見逃していました。 Dall-E 3 は「ヘルメットの調整」の部分も見逃していました。

未来的なシーン

プロンプト:大都市のネオン輝く路地で発光楽器を演奏するサイバネティックなストリートミュージシャン

Dall-E 3 による左の画像は、エイリアンのようなミュージシャンと明るいネオンサインが並ぶ静かな長い路地を示しています。背景のディテールも完璧に再現しました。 Midjourney による右の画像は、人間とロボットが混在し、ネオンの反射で満たされた広くて活気のある路地があり、にぎやかであるように感じられます。どちらの写真もネオンが輝く路地で未来的なミュージシャンを描いていますが、Dall-E の写真は別の惑星にいるような雰囲気があり、Midjourney の写真は現在と未来の雰囲気が混ざり合っています。

ポートレート

プロンプト:銀髪をお団子に結び、ヴィンテージの眼鏡をかけ、カラフルな模様を刺繍した年配の女性

これらの 2 つの画像は、刺繍に取り組む年配の女性を美しく捉えています。左側の Dall-E 3 の画像には、印象的なビンテージメガネと銀の髪をお団子に結んだ女性が写っています。彼女は鮮やかなパターンに取り組んでいます。雰囲気は洗練されており、柔らかな照明が彼女の特徴を強調しています。ミッドジャーニーによる右の画像は、より率直で、女性はよりカジュアルな黒縁の眼鏡をかけ、カラフルなブラウスを着ています。

どちらの画像も刺繍の芸術性を強調していますが、Dall-E 3 はエレガントさを重視しているのに対し、Midjourney の画像は居心地が良く本物の雰囲気を感じさせます。

ドット絵

プロンプト:ピクセル化された魔法の森を背景に、魔法の粒子と浮遊する魔法の本を使って呪文を唱える魔術師

左側の Dall-E 3 は、森の背景のピクセル化された画像と、高い帽子をかぶった深い青色のマントを着た魔術師を提供し、昔ながらのビデオゲームの雰囲気を再現しています。彼の周りで魔法の粒子が渦巻いているのと、大きく開いて光るページを見せている浮遊する魔法の本が見えます。

さて、右側では、ミッドジャーニーがより現実的な絵を描いています。魔術師は、呪文を唱える行為に深く夢中になっている、若くて精悍な男として描かれています。魔法の粒子が鮮やかに見え、彼が持っている光る球体のような魔法の本を囲んでいます。森の背景は明らかですが、プロンプトが要求したようにピクセル化されていません。

どちらの画像も呪文を唱える魔術師を見事に描いていますが、「ピクセル化された」ディテールを完璧に表現しているのは Dall-E 3 だけです。

シュルレアリスムアート

メッセージ:浮島で気配りのある小さな象の輪に向かって本を読んでいる特大の蝶

どちらのイメージも同じプロンプトを使用して作成されていますが、まったく異なるシーンが描かれています。 Dall-E 3 のイメージは活気に満ちていて楽しいもので、象の頭を持つ蝶が浮いた土地で小さな象に本を読んでいる様子を示しています。

一方、ミッドジャーニーのイメージには、巨大な象の島とさまざまな活動をしているたくさんの小さな象があり、魅惑的なジャングルの雰囲気があります。しかし、ミッドジャーニーのバージョンには、「特大の蝶」という中心要素が欠けています。

フラットなデザイン

プロンプト:東京タワー、巻き寿司、桜の枝などの象徴的なシルエットを通して東京の本質を表現したミニマルなポストカード

どちらの画像も、東京タワー、寿司、桜を使って東京のエッセンスを捉えています。 Dall-E 3 のバージョンは活気に満ちており、明るい背景に詳細な街並みと巻き寿司が表示され、桜が青々と茂っています。

対照的に、ミッドジャーニーは、パステルカラーのパレット、簡素化された構造、そして桜の数が少ない、落ち着いたミニマリストのアプローチを採用しています。

どちらの作品にも要求された要素が含まれていますが、Dall-E 3 には川や橋などの追加機能が追加されています。品質の点では、Dall-E のイメージは細部まで豊かですが、Midjourney のイメージはシンプルさとオープンスペースを優先しています。

3Dレンダリング

プロンプト:詳細な 3D レンダリングされたルビーの目をした翡翠龍のペンダント。ベルベットの背景に繊細なシルバーのチェーンで吊るされています。

Dall-E のペンダント (左側) は緑色で「翡翠」の外観によく似ており、ルビーレッドの目をしていますが、銀のチェーンは予想よりも太いように見えます。背景はベルベットのように見えます。

ミッドジャーニーのペンダント (右側) は翡翠にはあまり似ておらず、より金属的な雰囲気がありますが、ルビーの目が際立っています。ここのチェーンはより詳細で、背景は単純に暗いです。プロンプトと比較すると、Dall-E のイメージは「翡翠」と「ベルベットの背景」の詳細とよりよく一致しており、ミッドジャーニーは「銀の鎖」の側面を釘付けにしています。

デジタルイラスト

プロンプト:近くのオウムが警告を叫びながら、いたずら好きな猫がボウルからこっそり魚を取り出そうとしているデジタルイラスト

どちらの写真にも、近くにオウムがいるボウルから魚を取ろうとしている猫が写っています。 Dall-E 3 の左側の画像には、灰色の縞模様の猫が静かに水に触れており、オウムはただそれを眺めています。

右のミッドジャーニーの写真では、猫が驚いたように見えますが、オウムはいません。 Dall-E の写真はより詳細で質感があり、より洗練されたように見えます。『Midjourney』のイメージは急いでいるように感じられ、要素が欠けている暗い設定になっています。

油絵

メッセージ:騒々しい海と嵐の雲を背景に、古いコンパスを手に物思いにふける厳粛な船員

Dall-E 3 によって作成された左の画像には、嵐の海を背に思慮深い表情をしている年配の船員がいます。右の写真はミッドジャーニー作で、穏やかな海を眺める若い船員を描いています。どちらの写真もプロンプトと一致していますが、背景が嵐のため、Dall-E の方が近くに見えます。どちらも画質は良いのですが、過去の冒険を振り返るような感じと、新たな冒険に向けて準備をするような感じと、それぞれ異なる感情を与えてくれます。

ジオラマ

プロンプト:稼働中の観覧車、綿菓子を楽しむ小さな訪問者、ジオラマスタイルで光る球体をジャグリングするピエロのミニチュアカーニバルシーン

どちらの画像も、観覧車のあるミニチュアのカーニバルのシーンを示しています。 Dall-E 3 による左の画像には綿菓子を持った訪問者と光る球体をジャグリングするピエロが描かれており、プロンプトによく合っています。 Midjourney による右の画像は、夜の雰囲気とより複雑なデザインを持っていますが、綿菓子を持った訪問者やジャグリングするピエロは表示されていません。どちらの画像も品質は良好ですが、Dall-E の画像はプロンプトの詳細に近いのに対し、Midjourney の画像は独特の見方を提供していますが、小さな訪問者はそれほど鮮明ではありません。

建築

プロンプト:らせん階段、吊り下げられたランタン、本でいっぱいのバルコニーのある風変わりなツリーハウス図書館

Dall-E 3 による左の画像は、多くの詳細、ランタン、大きなツリーハウスがあり、よりファンタジーのようです。 Midjourney による右の画像は、部屋とランタンが少なく、現実の生活に近いように感じられます。どちらの写真も、らせん階段と本のバルコニーを備えた「ツリーハウス図書館」のアイデアを捉えています。どちらもプロンプトによく従います。

ただし、Dall-E の写真は緑がかった輝きでより夢のような雰囲気を持っていますが、Midjourney の写真は夕方に設定されているように見え、より居心地の良い雰囲気を感じます。

どちらの画像も高品質ですが、どちらを選択するかは、より魔法のような外観を好むか、より現実的な外観を好むかによって決まります。

インテリア・デザイン

プロンプト:ハンモックベッド、壁のタペストリー、モザイク鏡、天井から吊るされた植物のあるボヘミアンな寝室

どちらの画像もボヘミアンなベッドルームの雰囲気を捉えています。 Dall-E の画像 (左側) は模様がカラフルで、ハンモックのような椅子、透明なタペストリー、たくさんの植物が吊り下げられていますが、モザイク鏡がありません。

ミッドジャーニーの画像 (右側) は、植物やレースのタペストリーがあり、より明るく広々としていますが、ベッドはハンモックスタイルではなく、目に見えるモザイク鏡もありません。

どちらの画像にも自由奔放に生きる要素や吊り下げられた植物が含まれていますが、特にモザイクミラーと正確なハンモックベッドの説明に関しては、どちらもプロンプトと完全には一致しません。

ハイコンテキストプロンプト

プロンプト:ルネサンス期の鍛冶屋の作業場。詳細な道具、輝く鍛冶場、複雑な鎧の部品、そして仕事をする職人がいる。

Dall-E の左側には、鍛冶屋が 1 人、きちんと整理された道具があり、強調表示された鎧があります。 Midjourney の右側には、複数の人がいて、ツールが点在し、活気のある雰囲気が漂っています。どちらも工房を描いていますが、Dall-E のイメージは 1 人の職人とその道具に焦点を当てており、Midjourney のイメージは複数の労働者がいる忙しい一日のように感じられます。

ローコンテキストプロンプト

プロンプト：月明かりのダンス

どちらの画像も「月明かりのダンス」を示しています。 Dall-E による左の画像は、大きな月を背景にダンサーのシルエットが描かれた鮮やかなブルーの色調で、一方、Midjourney による右の画像では、控えめな月の輝きでダンサーをより詳細に観察できます。 Dall-E は環境とコントラストに焦点を当て、Midjourney はダンサーの感情を強調します。どちらも月明かりに照らされたダンスのテーマを捉えていますが、スタイルは異なります。

注目の試合: ミッドジャーニー vs Dall-E 3

Dall-E 3 と Midjourney から AI が生成した 16 枚の画像を評価した結果、Dall-E 3 が複雑な詳細を捉えるのに優れていることは明らかです。このプラットフォームは、プロンプトの意図を解釈して関連する画像を生成する点でも Midjourney を上回っています。一方、Midjourney は、本物に見えるビジュアルを作成する点で優れています。 Dall-E 3 は完璧を目指していますが、場合によっては不自然な画像が生成されることがあります。

AI ビジュアルの詳細を求める企業にとっては、Dall-E 3 がより適切な選択肢となる可能性があります。 ChatGPT Plus 経由でアクセスできるほか、最高の AI 画像ジェネレーターである Photosonic からも間もなくアクセスできるようになります。 OpenAI は、Dall-E 3 API を間もなくリリースし、Photosonic の統合機能にする予定です。

よくある質問

1. Midjourney は DALL-E 3 より優れていますか?

どちらかが他方よりも完全に「優れている」ということではありません。それらにはさまざまなスタイルと機能があります。 DALL-E 3 は ChatGPT Plus と統合されており、GPT-4 で入手できるパッケージの一部です。一方、Midjourney では、レンダリングにバリエーションが提供される可能性があります。それはあなたの個人的な好みとあなたが探しているスタイルによります。

2. DALL-E 3 は無料ですか?

いいえ、DALL-E 3 は無料ではありません。 ChatGPT Plus がバンドルされており、料金は月額 20 ドルです。このサブスクリプションにより、GPT-4 へのアクセスも許可されます。

3. DALL-E 3とMidjourneyではどちらが安いですか?

数字を厳密に見ると、Midjourney は月額 10 ドルから始まります。 DALL-E 3 には ChatGPT Plus が付属しており、価格は月額 20 ドルです。したがって、予算が重要な要素である場合は、Midjourney がより費用対効果の高い選択肢になる可能性があります。