Dall-E 3 vs Midjourney: Perbandingan Gambar AI Berdampingan
Diterbitkan: 2023-10-26Dall-E 3 OpenAI telah hadir selama sekitar satu bulan, dan para penggemar kreatif di mana pun mempelajari berbagai kasus penggunaan. Potensinya sepertinya tidak terbatas, mulai dari pembuatan gambar AI hingga produksi film pendek.
Sekarang Anda mungkin bertanya-tanya: Apakah Dall-E 3 benar-benar layak untuk dihebohkan? Apakah ini lebih baik dari Midjourney?
Jika Anda telah menggunakan Midjourney untuk kebutuhan gambar AI Anda, Anda mungkin bertanya-tanya apakah ada peralihan yang perlu dilakukan.
Dalam postingan blog ini, kami akan mendalami perbandingan mendalam, di mana kami menempatkan Dall-E 3 melawan Midjourney menggunakan 16 petunjuk berbeda untuk memahami kekuatan dan kekurangan masing-masing platform.
Apa itu DALL-E 3 dan Midjourney?
DALL-E 3 adalah generator seni AI terbaru OpenAI.
Itu ada di dalam ChatGPT, membuatnya mudah digunakan, dan tersedia melalui ChatGPT Plus seharga $20 per bulan. Saat masih dalam versi beta, ia membuat gelombang di berbagai bidang untuk menghasilkan gambar yang presisi.
Lihat panduan terperinci tentang Cara menggunakan Dall-E 3.
Di sisi lain, kami memiliki Midjourney, bot di dalam Discord.
Ia dikenal karena gaya dan emosinya yang kaya dalam gambar. Dengan $10 per bulan, Anda dapat memulai dengan paket dasarnya, tetapi terkadang bersiaplah untuk mengubah permintaan Anda.
Jadi, DALL-E 3 menawarkan seni mendetail melalui platform khusus, sementara Midjourney, dalam Discord, bersandar pada kreativitas dan emosi. Keduanya mempunyai kelebihan masing-masing. Semuanya tergantung pada apa yang Anda cari.
Dall-E 3 vs Midjourney: Matriks perbandingan
Dall-E 3 | Tengah perjalanan | |
---|---|---|
Kemudahan penggunaan | Sangat mudah | Sedang |
Biaya | $20 per bulan | Mulai dari $10 per bulan |
Kualitas gambar | Lebih bernuansa dan detail | Bagus |
Gaya gambar | Mendukung semua gaya seni | Mendukung semua gaya seni |
Ukuran gambar | Persegi, tinggi, dan lebar | Mendukung ukuran khusus |
Kreativitas | Memahami maksud pengguna | Sesuaikan tingkat kreativitas |
Kecepatan pembuatan gambar | Sedikit lebih lambat | Beberapa detik |
Hak cipta gambar AI | Pengguna memiliki gambar yang mereka buat | Pengguna memiliki gambar yang mereka buat |
Realisme | Kurang hidup tapi lebih detail | Lebih realistis |
Kustomisasi | Opsi penyesuaian terbatas | Opsi penyesuaian lainnya |
Dall-E 3 vs Midjourney: Pertarungan Terakhir
Melihat tabel perbandingan dapat memberi Anda gambaran singkat, namun Anda hanya akan memahami kekuatan dan kelemahan setiap generator seni AI dengan melakukan perbandingan berdampingan.
Di bagian ini, kami memilih sendiri beberapa gambar dan jenis seni terbaik. Kami akan menggunakan prompt yang sama di Dall-E 3 dan Midjourney untuk setiap jenis untuk membandingkan hasilnya.
Catatan: Semua gambar di sebelah kiri dibuat di DALL-E 3, dan di sebelah kanan dibuat oleh Midjourney.
lanskap
Petunjuk: Ladang gandum emas di bawah langit badai, dengan orang-orangan sawah yang mengenakan syal merah cerah
Gambar Dall-E 3 memiliki gaya ilustratif yang detail dengan rona emas yang hangat, menampilkan sosok seperti orang-orangan sawah. Sebaliknya, gambar Midjourney lebih bernuansa fotografis, berfokus pada sosok berjubah di tengah badai yang akan datang, dilukis dengan warna sepia. Itu benar-benar merindukan orang-orangan sawah.
Konsep abstrak
Prompt: Representasi visual dari suara tawa menggunakan semburan warna cerah dan pola berputar-putar
Gambar Dall-E 3 memiliki banyak warna campuran, tampak seperti berputar, dengan banyak warna biru, membuatnya terasa seperti mimpi. Gambar Midjourney menampilkan seorang wanita yang tertawa dengan pola warna-warni di sekelilingnya, membuat tawa tersebut terasa hidup dan nyata. Keduanya asik menampilkan keceriaan tertawa.
Meskipun Midjourney berhasil dengan baik, gambarnya tidak terlihat seperti seni abstrak. Dall-E 3 memahami maksud dari prompt dan menghasilkan visual abstrak.
Pengaturan sejarah
Petunjuk: Seorang gladiator bersiap untuk bertempur di Colosseum Romawi, menyesuaikan helmnya dan mencengkeram perisainya
Di sebelah kiri, Dall-E 3 menunjukkan seorang gladiator dengan helm detail dan penuh hiasan berdiri di depan Colosseum. Suasananya lebih tenang, dan sinar matahari menyinari perlengkapannya.
Di sebelah kanan, gambar Midjourney menghadirkan gladiator yang lebih tangguh di momen intim. Prajurit ini nampaknya sedang tenggelam dalam pikirannya, mungkin sedang memikirkan pertempuran yang akan datang. Armornya lebih usang dalam pertempuran, dan pemandangannya terasa lebih gelap dan intens. Dia dengan erat menggenggam perisai hiasannya, menunjukkan tekadnya.
Kedua gambar tampak nyata. Dall-E 3 telah menyertakan hampir semua yang kami minta di prompt, tetapi Midjourney melewatkan helm dan colosseum. Dall-E 3 juga melewatkan bagian ' penyesuaian helm '.
Adegan futuristik
Prompt: Musisi jalanan cybernetic memainkan alat musik bercahaya di gang kota metropolitan yang diterangi lampu neon
Gambar kiri oleh Dall-E 3 menunjukkan gang yang tenang dan panjang dengan musisi mirip alien dan lampu neon terang. Itu memastikan untuk memiliki detail latar belakang yang sempurna juga. Gambar kanan dari Midjourney terasa lebih sibuk, dengan perpaduan manusia dan robot serta gang yang lebih luas dan semarak yang dipenuhi pantulan lampu neon. Meskipun kedua gambar menampilkan musisi futuristik di gang-gang yang diterangi lampu neon, gambar Dall-E lebih terasa seperti di planet lain, dan gambar Midjourney memiliki perpaduan antara suasana masa kini dan masa depan.
Potret
Petunjuk: Seorang wanita tua dengan rambut perak diikat di sanggul, mengenakan kacamata antik dan menyulam pola warna-warni
Kedua gambar ini dengan indahnya menangkap seorang wanita tua yang sedang mengerjakan sulamannya. Gambar Dall-E 3 di sebelah kiri menunjukkan seorang wanita dengan kacamata vintage yang mencolok dan rambut perak diikat di sanggul. Dia sedang mengerjakan pola yang dinamis. Suasananya halus, dengan pencahayaan lembut menonjolkan fitur-fiturnya. Gambar kanan dari Midjourney tampak lebih candid, di mana wanita tersebut mengenakan kacamata berbingkai hitam yang lebih kasual dan mengenakan blus warna-warni.
Kedua gambar tersebut menekankan seni bordir, namun Dall-E 3 condong ke arah keanggunan sedangkan gambar Midjourney terasa nyaman dan otentik.
Seni piksel
Prompt: Seorang penyihir merapal mantra, dengan partikel sihir dan buku mantra mengambang, dengan latar belakang hutan ajaib berpiksel
Di sebelah kiri, Dall-E 3 menawarkan gambar piksel latar belakang hutan dengan penyihir berjubah biru tua dan topi tinggi, meniru suasana video game jadul. Anda dapat melihat partikel ajaib berputar-putar di sekelilingnya dan buku mantra mengambang, yang terbuka lebar, menampilkan halaman-halamannya yang bersinar.
Sekarang, di sebelah kanan, Midjourney memberikan gambaran yang lebih realistis. Penyihir tersebut digambarkan sebagai seorang pria muda, berpenampilan intens, sangat asyik dengan tindakan merapal mantra. Partikel sihir terlihat jelas, mengelilingi buku mantra berbentuk bola bercahaya yang dipegangnya. Meskipun latar belakang hutan terlihat jelas, namun pikselnya tidak seperti yang diminta.
Meskipun kedua gambar dengan cemerlang menggambarkan seorang penyihir yang sedang merapal mantra, hanya Dall-E 3 yang berhasil menampilkan detail 'piksel'.
Seni surealis
Petunjuk: Seekor kupu-kupu berukuran besar sedang membacakan buku di hadapan sekelompok gajah kecil yang penuh perhatian di pulau terapung
Kedua gambar dibuat menggunakan prompt yang sama tetapi melukiskan pemandangan yang sangat berbeda. Gambar Dall-E 3 bersemangat dan menyenangkan, menampilkan kupu-kupu berkepala gajah sedang membaca buku hingga gajah kecil di tanah terapung.
Di sisi lain, gambar Midjourney memiliki nuansa hutan yang mempesona dengan pulau gajah raksasa dan banyak gajah kecil yang melakukan aktivitas berbeda. Namun, versi Midjourney kehilangan elemen sentral dari "kupu-kupu berukuran besar".
Desain datar
Prompt: Kartu pos minimalis yang menampilkan esensi Tokyo melalui siluet ikonik seperti Tokyo Tower, sushi roll, dan cabang bunga sakura
Kedua gambar tersebut menangkap esensi Tokyo menggunakan Menara Tokyo, sushi, dan bunga sakura. Versi Dall-E 3 cerah, menampilkan detail pemandangan kota dan sushi gulung dengan latar belakang cerah, dan bunga sakura yang subur.
Sebaliknya, Midjourney memiliki pendekatan yang tenang dan minimalis dengan palet pastel, struktur yang disederhanakan, dan bunga sakura yang lebih sedikit.
Meskipun kedua kreasi mencakup elemen yang diminta, Dall-E 3 menambahkan fitur tambahan seperti sungai dan jembatan. Dari segi kualitas, gambar Dall-E lebih kaya detail, sedangkan gambar Midjourney mengutamakan kesederhanaan dan ruang terbuka.
Render 3D
Prompt: Liontin naga giok dengan tampilan 3D mendetail dengan mata rubi, digantung pada rantai perak halus dengan latar belakang beludru
Liontin Dall-E (di sebelah kiri) sangat mirip dengan tampilan 'giok' dengan warna hijau dan memiliki mata merah delima, tetapi rantai peraknya tampak lebih tebal dari yang diperkirakan. Latar belakangnya tampak seperti beludru.
Liontin Midjourney (di sebelah kanan) tidak terlihat seperti batu giok dan memiliki kesan lebih metalik, namun mata rubinya menonjol. Rantai di sini lebih detail, dan latar belakangnya gelap gulita. Dibandingkan dengan prompt, gambar Dall-E lebih selaras dengan detail 'latar belakang giok' dan 'latar belakang beludru', sementara Midjourney menerapkan aspek 'rantai perak'.
Ilustrasi digital
Prompt: Ilustrasi digital seekor kucing nakal yang mencoba menyelinapkan ikan keluar dari mangkuk sementara burung beo di dekatnya meneriakkan peringatan
Kedua gambar tersebut menunjukkan seekor kucing mencoba mengambil ikan dari mangkuk dengan seekor burung beo di dekatnya. Gambar Dall-E 3 di sebelah kiri menunjukkan seekor kucing bergaris abu-abu dengan tenang menyentuh air, dan burung beo hanya menonton.
Pada gambar Midjourney di sebelah kanan, kucing terlihat terkejut, dan tidak ada burung beo. Gambar Dall-E memiliki lebih banyak detail dan tekstur sehingga terlihat lebih halus. Gambar Midjourney terasa terburu-buru dan memiliki latar yang lebih gelap dengan elemen yang hilang.
Lukisan cat minyak
Petunjuk: Seorang pelaut yang serius tenggelam dalam pikirannya, memegang kompas tua, dengan latar belakang laut yang bergejolak dan awan badai
Gambar kiri, dibuat oleh Dall-E 3, menampilkan seorang pelaut tua yang tampak berpikir dengan lautan badai di belakangnya. Yang kanan, di Midjourney, menampilkan seorang pelaut muda yang memandang ke laut yang lebih tenang. Kedua gambar tersebut cocok dengan petunjuknya, tetapi gambar Dall-E tampak lebih dekat karena latar belakangnya yang lebih berbadai. Kualitas gambar keduanya bagus, tetapi memberikan perasaan yang berbeda: yang satu terasa seperti mengingat kembali petualangan masa lalu, dan yang lain seperti bersiap untuk petualangan baru.
Diorama
Petunjuk: Adegan karnaval mini, dengan bianglala yang berfungsi, pengunjung kecil yang menikmati permen kapas, dan badut yang menyulap bola-bola bercahaya dalam gaya diorama
Kedua gambar tersebut menunjukkan pemandangan miniatur karnaval dengan bianglala. Gambar kiri oleh Dall-E 3 menampilkan pengunjung dengan permen kapas dan badut yang sedang menyulap bola-bola bercahaya, sesuai dengan petunjuknya. Gambar kanan oleh Midjourney memiliki nuansa malam hari dan desain yang lebih kompleks tetapi tidak menampilkan pengunjung dengan permen kapas atau badut juggling. Meskipun kedua gambar memiliki kualitas yang baik, gambar Dall-E selaras dengan spesifikasi prompt, sedangkan gambar Midjourney menawarkan pengambilan yang unik, tetapi pengunjung kecilnya tidak begitu jelas.
Arsitektur
Prompt: Perpustakaan rumah pohon unik dengan tangga spiral, lentera gantung, dan balkon berisi buku
Gambar kiri oleh Dall-E 3 lebih seperti fantasi, dengan banyak detail, lentera, dan rumah pohon yang lebih besar. Gambar kanan Midjourney terasa lebih dekat dengan kehidupan nyata, dengan ruangan dan lentera yang lebih sedikit. Kedua gambar tersebut menangkap gagasan 'perpustakaan rumah pohon' dengan tangga spiral dan balkon buku. Mereka berdua mengikuti perintahnya dengan baik.
Namun, gambar Dall-E memiliki nuansa yang lebih melamun dengan cahaya kehijauannya, sedangkan gambar Midjourney tampak berlatar malam hari dan terasa lebih nyaman.
Kedua gambar tersebut berkualitas tinggi, tetapi pilihan di antara keduanya adalah apakah Anda menyukai tampilan yang lebih ajaib atau realistis.
Desain interior
Petunjuk: Kamar tidur bohemian dengan tempat tidur gantung, permadani di dinding, cermin mosaik, dan tanaman yang tergantung di langit-langit
Kedua gambar tersebut menangkap nuansa kamar tidur bohemian. Gambar Dall-E (di sebelah kiri) berwarna-warni dengan pola dan memiliki tempat duduk seperti tempat tidur gantung, permadani bening, dan banyak tanaman gantung, tetapi tidak memiliki cermin mosaik.
Gambar Midjourney (di sebelah kanan) lebih terang dan luas, dengan tanaman dan permadani renda, tetapi tempat tidurnya tidak bergaya tempat tidur gantung, dan tidak ada cermin mosaik yang terlihat.
Meskipun kedua gambar memiliki elemen boho dan tanaman gantung, tidak ada yang sepenuhnya cocok dengan gambarannya, terutama mengenai cermin mosaik dan deskripsi tempat tidur gantung yang tepat.
Konteks tinggi meminta
Petunjuk: Bengkel pandai besi pada masa Renaisans, dengan peralatan terperinci, bengkel bercahaya, potongan baju besi yang rumit, dan pengrajin yang sedang bekerja
Yang kiri oleh Dall-E memiliki satu pandai besi, peralatan yang tertata rapi, dan baju besi yang disorot. Yang kanan di Midjourney memiliki banyak orang, peralatan tersebar, dan suasana yang hidup. Meskipun keduanya menggambarkan bengkel, gambar Dall-E berfokus pada seorang pengrajin dan peralatannya, dan gambar Midjourney lebih terasa seperti hari yang sibuk dengan banyak pekerja.
Konteks rendah meminta
Prompt: Tarian cahaya bulan
Kedua gambar tersebut menampilkan "tarian cahaya bulan". Gambar kiri oleh Dall-E memiliki warna biru cerah dengan siluet penari menghadap bulan besar, sedangkan gambar Midjourney, di sebelah kanan, menawarkan tampilan lebih dekat dan detail pada para penari dengan cahaya bulan yang lebih halus. Dall-E berfokus pada lingkungan dan kontras, dan Midjourney menyoroti emosi para penari. Keduanya mengusung tema tarian cahaya bulan namun dengan gaya berbeda.
Penghenti pertunjukan: Midjourney vs Dall-E 3
Setelah mengevaluasi 16 gambar yang dihasilkan AI dari Dall-E 3 dan Midjourney, terbukti bahwa Dall-E 3 unggul dalam menangkap detail yang rumit. Platform ini juga melampaui Midjourney dalam menafsirkan maksud dari petunjuk untuk menghasilkan gambar yang relevan. Di sisi lain, Midjourney memiliki keunggulan dalam menciptakan visual yang terlihat nyata. Meskipun Dall-E 3 bertujuan untuk kesempurnaan, terkadang menghasilkan gambar yang kurang alami.
Untuk bisnis yang mencari detail dalam visual AI mereka, Dall-E 3 mungkin merupakan pilihan yang lebih cocok. Anda dapat segera mengaksesnya melalui ChatGPT Plus dan juga di Photosonic, generator gambar AI terbaik. OpenAI berencana segera merilis Dall-E 3 API, menjadikannya fitur terintegrasi di Photosonic.
FAQ
1. Apakah Midjourney lebih baik daripada DALL-E 3?
Ini sebenarnya bukan tentang yang satu menjadi "lebih baik" dari yang lain. Mereka mempunyai gaya dan kemampuan yang berbeda. DALL-E 3 terintegrasi dengan ChatGPT Plus dan merupakan bagian dari paket yang Anda dapatkan dengan GPT-4. Sebaliknya, Midjourney mungkin menawarkan variasi dalam terjemahannya. Ini lebih tentang preferensi pribadi Anda dan gaya yang Anda cari.
2. Apakah DALL-E 3 gratis?
Tidak, DALL-E 3 tidak gratis. Ini dibundel dengan ChatGPT Plus, dengan biaya $20/bulan. Langganan ini juga memberi Anda akses ke GPT-4.
3. Mana yang lebih murah, DALL-E 3 atau Midjourney?
Melihat angkanya secara ketat, Midjourney dimulai dengan harga lebih murah yaitu $10/bulan. DALL-E 3 hadir dengan ChatGPT Plus, dengan harga $20/bulan. Jadi, jika anggaran adalah faktor kuncinya, Midjourney mungkin merupakan pilihan yang lebih hemat biaya.