Dall-E 3 ve Midjourney: Yan Yana Yapay Zeka Görüntü Karşılaştırması
Yayınlanan: 2023-10-26OpenAI'nin Dall-E 3'ü yaklaşık bir aydır sahnede ve her yerdeki yaratıcı meraklılar çeşitli kullanım senaryolarını araştırıyor. Yapay zeka görüntüleri oluşturmaktan kısa filmler üretmeye kadar potansiyel sınırsız görünüyor.
Şimdi şu soruları soruyor olabilirsiniz: Dall-E 3 gerçekten bu heyecana değer mi? Midjourney'den daha mı iyi?
AI görüntü ihtiyaçlarınız için Midjourney'i kullanıyorsanız bir geçişin uygun olup olmadığını merak edebilirsiniz.
Bu blog yazısında, her platformun güçlü yönlerini ve eksikliklerini anlamak için 16 farklı ipucu kullanarak Dall-E 3'ü Midjourney'e karşı koyacağımız derinlemesine bir karşılaştırmaya gireceğiz.
DALL-E 3 ve Midjourney nedir?
DALL-E 3, OpenAI'nin en yeni yapay zeka sanat oluşturucusudur.
ChatGPT'de yerleşik olarak bulunur, bu da onu kullanıcı dostu hale getirir ve ChatGPT Plus aracılığıyla ayda 20 ABD Doları karşılığında edinilebilir. Hala beta aşamasındayken, hassas görüntüler için çeşitli alanlarda dalgalar yaratıyor.
Dall-E 3'ün nasıl kullanılacağına ilişkin ayrıntılı kılavuza göz atın.
Diğer tarafta Discord'un içinde bir bot olan Midjourney var.
Görsellerdeki zengin stilleri ve duygularıyla tanınır. Aylık 10 ABD Doları karşılığında temel planlarıyla başlayabilirsiniz, ancak bazen istemlerinizi değiştirmeye hazır olun.
Yani DALL-E 3, özel bir platform aracılığıyla ayrıntılı sanat eserleri sunarken Discord'daki Midjourney, yaratıcılığa ve duyguya odaklanıyor. Her ikisinin de kendine göre avantajları var. Her şey aradığınız şeye bağlı.
Dall-E 3 ve Midjourney: Bir karşılaştırma matrisi
Dall-E 3 | Yolculuk ortası | |
---|---|---|
Kullanım kolaylığı | Çok kolay | Orta |
Maliyet | Aylık 20$ | Aylık 10 dolardan başlıyor |
Görüntü kalitesi | Daha fazla nüans ve detay | İyi |
Resim stili | Tüm sanat stillerini destekler | Tüm sanat stillerini destekler |
Görüntü boyutu | Kare, uzun ve geniş | Özel boyutları destekler |
Yaratıcılık | Kullanıcının amacını anlar | Yaratıcılık düzeylerini ayarlayın |
Görüntü oluşturma hızı | Biraz daha yavaş | Birkaç saniye |
AI görsellerinin telif hakkı | Kullanıcılar oluşturdukları görsellerin sahibidir | Kullanıcılar oluşturdukları görsellerin sahibidir |
Gerçekçilik | Daha az gerçeğe yakın ama daha fazla ayrıntı | Daha gerçekçi |
Özelleştirme | Sınırlı özelleştirme seçenekleri | Daha fazla özelleştirme seçeneği |
Dall-E 3 Midjourney'e Karşı: Nihai Hesaplaşma
Bir karşılaştırma tablosuna bakmak size kısa bir fikir verebilir, ancak her bir AI sanat üretecinin güçlü ve zayıf yönlerini yalnızca yan yana karşılaştırma yaparak anlayabilirsiniz.
Bu bölümde en iyi görsellerden ve sanat türlerinden bazılarını özenle seçtik. Sonuçları karşılaştırmak için her tür için Dall-E 3 ve Midjourney'de aynı istemi kullanacağız.
Not: Soldaki tüm görüntüler DALL-E 3'te, sağdaki ise Midjourney tarafından oluşturulmuştur.
Manzaralar
Komut istemi: Fırtınalı bir gökyüzünün altında altın renkli buğday tarlaları, parlak kırmızı bir eşarp takan yalnız bir korkuluk
Dall-E 3 görüntüsü, korkuluk benzeri bir figürün sergilendiği, sıcak, altın rengi bir renk tonuna sahip, ayrıntılı, açıklayıcı bir stile sahiptir. Buna karşılık, Midjourney'in görüntüsü daha fotografik bir his veriyor; yaklaşmakta olan bir fırtınanın içindeki, sepya tonlarında boyanmış pelerinli bir figüre odaklanıyor. Korkuluğu tamamen ıskaladı.
Soyut kavramlar
Komut İstemi: Canlı renk patlamaları ve dönen desenler kullanılarak kahkaha sesinin görsel temsili
Dall-E 3 resminde çok sayıda karışık renk var, dönüyormuş gibi görünüyorlar, bol miktarda mavi var ve bu da rüya gibi hissettiriyor. Yolculuk Ortası resminde, etrafında renkli desenlerle gülen, kahkahayı canlı ve gerçek hissettiren bir kadın var. Her ikisi de kahkahanın neşesini gösterme konusunda havalı.
Midjourney harika bir iş çıkarsa da görüntü soyut sanata benzemiyor. Dall-E 3, istemin amacını anladı ve soyut bir görsel oluşturdu.
Geçmiş ayarlar
Komut: Roma Kolezyumunda savaşa hazırlanan, miğferini ayarlayan ve kalkanını tutan bir gladyatör
Solda, Dall-E 3, Kolezyum'un önünde duran, ayrıntılı ve süslü miğferli bir gladyatörü gösteriyor. Ortam daha sakin ve güneş ışığı eşyalarını aydınlatıyor.
Sağdaki Yolculuğun Ortası görüntüsü, samimi bir anda daha sağlam bir gladyatörü gösteriyor. Bu savaşçı düşüncelere dalmış gibi görünüyor, belki de önümüzdeki savaşı düşünüyor. Zırhı savaşta daha yıpranmış ve sahne daha karanlık ve daha yoğun hissettiriyor. Kararlılığını sergileyerek süslü kalkanını sıkıca tutuyor.
Her iki görüntü de gerçek görünüyor. Dall-E 3, istemde sorduğumuz hemen hemen her şeyi içeriyordu, ancak Midjourney kaskı ve kolezyumu kaçırdı. Dall-E 3'te ' kaskın ayarlanması ' kısmı da atlanmış.
Fütüristik sahneler
Komut: Bir metropolün neon ışıklı bir sokağında ışıklı enstrümanlar çalan sibernetik sokak müzisyenleri
Dall-E 3'ün soldaki görüntüsü, uzaylı gibi müzisyenlerin ve parlak neon tabelaların olduğu sakin, uzun bir sokağı gösteriyor. Arka planın da mükemmel ayrıntılarına sahip olmasını sağladı. Midjourney'in doğru görüntüsü, insanlar ve robotların bir karışımı ve neon ışıklardan gelen yansımalarla dolu daha geniş, canlı bir sokak ile daha yoğun bir his veriyor. Her iki resim de neon ışıklı sokaklarda fütüristik müzisyenleri gösterirken, Dall-E daha çok başka bir gezegendeymiş gibi hissettiriyor ve Midjourney'de bugünün ve geleceğin heyecanlarının bir karışımı var.
Portreler
Komut: Gümüş rengi saçları topuz yapmış, vintage gözlük takan ve renkli bir desen işleyen yaşlı bir kadın
Bu iki görüntü, nakışı üzerinde çalışan yaşlı bir kadını çok güzel bir şekilde yansıtıyor. Soldaki Dall-E 3 görselinde çarpıcı vintage gözlüklü ve gümüş rengi saçları topuz yapmış bir kadın görülüyor. Canlı bir desen üzerinde çalışıyor. Onun özelliklerini vurgulayan yumuşak aydınlatmayla ambiyans zariftir. Midjourney'in doğru görüntüsü daha samimi görünüyor; burada bayan daha gündelik, siyah çerçeveli gözlükler takıyor ve renkli bir bluz giyiyor.
Her iki görüntü de nakış sanatını vurguluyor, ancak Dall-E 3 zarafete yönelirken, Midjourney rahat ve otantik bir his veriyor.
Piksel sanatı
Komut: Pikselli büyülü orman arka planına karşı sihirli parçacıklar ve yüzen bir büyü kitabıyla büyü yapan bir büyücü
Solda, Dall-E 3, eski tarz bir video oyunu havasını taklit eden, uzun bir şapka ve koyu mavi bir pelerin içindeki büyücünün yer aldığı bir orman arka planının pikselli bir görüntüsünü sunuyor. Etrafında dönen sihirli parçacıkları ve ardına kadar açık olan, parlayan sayfalarını sergileyen, havada süzülen büyü kitabını görebilirsiniz.
Artık sağda Midjourney daha gerçekçi bir tablo çiziyor. Büyücü, büyü yapma eylemine derinden dalmış, genç, yoğun görünüşlü bir adam olarak tasvir edilmiştir. Elinde tuttuğu parlayan küre benzeri büyü kitabını çevreleyen sihirli parçacıklar canlı bir şekilde görülebiliyor. Orman arka planı belirgin olsa da istemin istediği gibi pikselli değil.
Her iki görüntü de büyü yapan bir büyücüyü parlak bir şekilde tasvir ederken, 'pikselli' ayrıntıyı yalnızca Dall-E 3 çiviledi.
Sürrealist sanat
Komut: Yüzen bir adada dikkatli, minik fillerden oluşan bir çembere kitap okuyan büyük boy bir kelebek
Her iki görüntü de aynı istem kullanılarak oluşturulmuştur ancak çok farklı sahneleri resmetmektedir. Dall-E 3'ün canlı ve eğlenceli görüntüsü, yüzen bir arazide minik fillere kitap okuyan fil kafalı bir kelebeği gösteriyor.
Öte yandan Midjourney'in görüntüsü, dev bir fil adası ve birçok küçük filin farklı aktiviteler yaptığı büyülü bir orman hissine sahip. Ancak Midjourney'in versiyonu "büyük boy kelebek" şeklindeki merkezi unsuru gözden kaçırıyor.
Düz tasarım
Öneri: Tokyo Kulesi, suşi rulosu ve kiraz çiçeği dalı gibi ikonik silüetlerle Tokyo'nun özünü sergileyen minimalist bir kartpostal
Her iki görüntü de Tokyo Kulesi, suşi ve kiraz çiçekleri kullanılarak Tokyo'nun özünü yansıtıyor. Dall-E 3'ün versiyonu canlı, parlak bir arka planda ayrıntılı bir şehir manzarası ve suşi gösterisini gösteriyor ve kiraz çiçekleri gür.
Bunun aksine Midjourney, pastel renk paleti, basitleştirilmiş yapılar ve daha az kiraz çiçeği ile sakin ve minimalist bir yaklaşıma sahip.
Her iki tasarım da istenen unsurları barındırırken Dall-E 3, nehir ve köprü gibi ekstra özellikler ekliyor. Kalite açısından Dall-E'nin görüntüsü ayrıntılar açısından daha zengindir; Midjourney ise sadeliğe ve açık alana öncelik verir.
3D görüntüler
Komut istemi: Kadife bir fon önünde narin bir gümüş zincir üzerinde asılı duran, yakut gözlü, ayrıntılı bir 3D işlenmiş yeşim ejderha kolye ucu
Dall-E'nin kolyesi (solda), yeşil rengiyle 'yeşim' görünümüne çok benziyor ve yakut kırmızısı gözleri var, ancak gümüş zincir beklenenden daha kalın görünüyor. Zemin kadife gibi görünüyor.
Midjourney'nin kolyesi (sağda) yeşim taşına pek benzemiyor ve daha metalik bir his veriyor ancak yakut rengi gözleri öne çıkıyor. Buradaki zincir daha detaylıdır ve arka plan tamamen karanlıktır. İstemle karşılaştırıldığında Dall-E'nin görüntüsü 'yeşim' ve 'kadife zemin' detaylarıyla daha iyi uyum sağlarken Midjourney 'gümüş zincir' özelliğini vurguluyor.
Dijital illüstrasyon
Komut: Yakındaki bir papağan uyarı bağırırken, yaramaz bir kedinin kaseden gizlice balık çıkarmaya çalışmasının dijital illüstrasyonu
Her iki fotoğrafta da, yanında bir papağan bulunan bir kaseden balık almaya çalışan bir kedi görülüyor. Dall-E 3'ün soldaki görselinde suya sakin bir şekilde dokunan gri çizgili bir kedi var ve papağan sadece izliyor.
Sağdaki Yolculuk Ortası resminde kedi şaşırmış görünüyor ve papağan yok. Dall-E'nin resminde daha fazla ayrıntı ve doku var, bu da onun daha parlak görünmesini sağlıyor. Midjourney'in görüntüsü aceleye getirilmiş gibi görünüyor ve eksik unsurlarla daha karanlık bir ortama sahip.
Yağlı boya
Komut: Arka planda çalkantılı deniz ve fırtına bulutları bulunan, elinde eski bir pusula tutan, düşüncelere dalmış ciddi bir denizci
Dall-E 3 tarafından yapılan soldaki resimde, arkasında fırtınalı bir deniz varken düşünceli görünen yaşlı bir denizci görülüyor. Sağdaki Midjourney'de daha sakin bir denize bakan genç bir denizci yer alıyor. Her iki resim de istemle eşleşiyor ancak daha fırtınalı arka plan nedeniyle Dall-E daha yakın görünüyor. Her ikisinde de görüntü kalitesi iyi, ancak farklı duygular veriyorlar: Biri geçmiş maceralara bakıyormuş gibi, diğeri ise yeni bir maceraya hazırlanıyormuş gibi.
Diyorama
Komut İstemi: Çalışan bir dönme dolabın, pamuk şekerin tadını çıkaran minik ziyaretçilerin ve diyorama tarzında parlayan kürelerle hokkabazlık yapan bir palyaçonun yer aldığı minyatür bir karnaval sahnesi
Her iki görüntü de dönme dolapların yer aldığı minyatür karnaval sahnelerini gösteriyor. Dall-E 3'ün soldaki görselinde, pamuk şekerli ziyaretçiler ve parlayan kürelerle hokkabazlık yapan bir palyaço var ve bu isteğe çok iyi uyuyor. Midjourney'in doğru görseli gece hissi veriyor ve daha karmaşık tasarımlara sahip ancak ziyaretçilere elinde pamuk şekeri veya hokkabazlık yapan palyaçoyu göstermiyor. Her iki görüntü de iyi kaliteye sahip olsa da, Dall-E'nin görüntüsü istemin özelliklerine daha yakın hizalanırken Midjourney'in görüntüsü benzersiz bir çekim sunuyor ancak küçük ziyaretçiler o kadar net değil.
Mimari
İstem: Döner merdivenleri, asılı fenerleri ve kitaplarla dolu balkonları olan ilginç bir ağaç evi kütüphanesi
Dall-E 3'ün soldaki görüntüsü, birçok ayrıntı, fenerler ve daha büyük bir ağaç eviyle daha fantastik bir görünüme sahip. Midjourney'in doğru görüntüsü, daha az oda ve fenerle gerçek hayata daha yakın hissettiriyor. Her iki resim de spiral merdivenli ve kitap balkonlu bir 'ağaç ev kütüphanesi' fikrini yansıtıyor. Her ikisi de istemi iyi takip ediyor.
Bununla birlikte, Dall-E'nin resmi yeşilimsi parıltısıyla daha rüya gibi bir his verirken, Midjourney'inki akşam geçiyor gibi görünüyor ve daha samimi hissettiriyor.
Her iki görüntü de yüksek kalitelidir ancak aralarındaki seçim, daha büyülü veya gerçekçi bir görünümden hoşlanıp hoşlanmadığınıza bağlıdır.
İç dizayn
İstem: Hamak yatağı, duvar halıları, mozaik ayna ve tavandan sarkan bitkilerle bohem bir yatak odası
Her iki görüntü de bohem bir yatak odası hissini yansıtıyor. Dall-E'nin görüntüsü (solda) desenlerle rengarenktir ve hamak benzeri bir oturağa, şeffaf duvar halılarına ve birçok asılı bitkiye sahiptir, ancak mozaik aynadan yoksundur.
Midjourney'in görüntüsü (sağda) bitkiler ve dantel duvar halılarıyla daha hafif ve daha geniştir, ancak yatağı hamak tarzında değildir ve görünür bir mozaik ayna yoktur.
Her iki görüntü de boho unsurlara ve asılı bitkilere sahip olsa da, özellikle mozaik ayna ve hamak yatağının tam tanımı konusunda ikisi de istemle tam olarak eşleşmiyor.
Yüksek bağlam istemleri
Komut istemi: Ayrıntılı aletler, parlak demirhane, karmaşık zırh parçaları ve iş başında bir zanaatkarın bulunduğu, Rönesans döneminde bir demirci atölyesi
Dall-E'nin solunda bir demirci, özenle düzenlenmiş aletler ve vurgulanmış bir zırh var. Midjourney'in doğru olanı birden fazla kişiye, dağınık araçlara ve canlı bir atmosfere sahiptir. Her ikisi de atölyeyi tasvir ederken, Dall-E görüntüsü tek bir zanaatkar ve onun aletlerine odaklanırken, Yolculuk Ortası görüntüsü daha çok birden fazla işçinin olduğu yoğun bir günü andırıyor.
Düşük bağlam istemleri
Komut istemi: Mehtaplı bir dans
Her iki görüntü de "mehtaplı bir dans" sergiliyor. Dall-E'nin soldaki görüntüsü, büyük bir aya karşı silüet halindeki dansçıların yer aldığı canlı bir mavi tona sahipken, sağdaki Midjourney'ninki ise daha hafif bir ay parıltısıyla dansçılara daha yakından, daha ayrıntılı bir bakış sunuyor. Dall-E çevreye ve zıtlıklara odaklanırken Midjourney dansçıların duygularını öne çıkarıyor. Her ikisi de mehtaplı dans temasını yakalıyor ancak farklı tarzlarda.
Gösteriyi durduran: Midjourney vs Dall-E 3
Dall-E 3 ve Midjourney'den yapay zeka tarafından oluşturulan 16 görüntüyü değerlendirdikten sonra, Dall-E 3'ün karmaşık ayrıntıları yakalamada üstün olduğu açıkça görülüyor. Bu platform aynı zamanda ilgili görüntüleri oluşturmaya yönelik istemlerin amacını yorumlama konusunda da Midjourney'i geride bırakıyor. Öte yandan Midjourney'in gerçek gibi görünen görseller oluşturma konusunda bir avantajı var. Dall-E 3 mükemmelliği hedeflerken bazen daha az doğal görüntüler üretebiliyor.
Yapay zeka görsellerinde ayrıntı arayan işletmeler için Dall-E 3 daha uygun bir seçim olabilir. ChatGPT Plus aracılığıyla ve ayrıca en iyi AI görüntü oluşturucu olan Photosonic üzerinden çok yakında erişebileceksiniz. OpenAI, Dall-E 3 API'sini yakında piyasaya sürmeyi planlıyor ve bu da onu Photosonic'te entegre bir özellik haline getiriyor.
SSS
1. Midjourney DALL-E 3'ten daha mı iyi?
Bu aslında birinin diğerinden tamamen "daha iyi" olmasıyla ilgili değil. Farklı tarzları ve yetenekleri var. DALL-E 3, ChatGPT Plus ile entegredir ve GPT-4 ile aldığınız paketin bir parçasıdır. Öte yandan Midjourney, görselleştirmelerinde farklılıklar sunabilir. Bu daha çok kişisel tercihiniz ve aradığınız stil ile ilgilidir.
2. DALL-E 3 ücretsiz mi?
Hayır, DALL-E 3 ücretsiz değil. Aylık 20 ABD doları tutarındaki ChatGPT Plus ile birlikte gelir. Bu abonelik aynı zamanda GPT-4'e erişmenizi de sağlar.
3. Hangisi daha ucuz, DALL-E 3 mü yoksa Midjourney mi?
Rakamlara kesin olarak bakıldığında Midjourney ayda 10$ gibi daha ucuz bir fiyatla başlıyor. DALL-E 3, ayda 20 ABD Doları tutarındaki ChatGPT Plus ile birlikte gelir. Dolayısıyla, bütçe önemli bir faktörse Midjourney daha uygun maliyetli seçeneğiniz olabilir.