Dall-E 3 vs Midjourney: o comparație de imagine AI alăturată
Publicat: 2023-10-26Dall-E 3 de la OpenAI a fost pe scena de aproximativ o lună, iar pasionații de creație de pretutindeni se scufundă în diverse cazuri de utilizare. Potențialul pare nelimitat, de la crearea de imagini AI până la producerea de scurtmetraje.
Acum s-ar putea să-ți pui întrebări: Dall-E 3 merită cu adevărat hype-ul? Este mai bine decât Midjourney?
Dacă ați folosit Midjourney pentru nevoile dvs. de imagine AI, s-ar putea să vă întrebați dacă un comutator este în ordine.
În această postare pe blog, ne vom scufunda într-o comparație aprofundată, în care punem Dall-E 3 împotriva Midjourney folosind 16 indicații distincte pentru a înțelege punctele forte și deficiențele fiecărei platforme.
Ce sunt DALL-E 3 și Midjourney?
DALL-E 3 este cel mai nou generator de artă AI OpenAI.
Este încorporat în ChatGPT, făcându-l ușor de utilizat și este disponibil prin ChatGPT Plus pentru 20 USD pe lună. În timp ce este încă în versiune beta, face valuri în diverse domenii pentru imagini precise.
Consultați ghidul detaliat despre Cum să utilizați Dall-E 3.
Pe de altă parte, avem Midjourney, un bot din Discord.
Este cunoscut pentru stilurile sale bogate și emoțiile în imagini. Pentru 10 USD pe lună, puteți începe cu planul lor de bază, dar fiți gata să vă modificați solicitările uneori.
Deci, DALL-E 3 oferă artă detaliată printr-o platformă dedicată, în timp ce Midjourney, în cadrul Discord, se înclină spre creativitate și emoție. Ambele au propriile lor avantaje. Totul se reduce la ceea ce cauți.
Dall-E 3 vs Midjourney: o matrice de comparație
Dall-E 3 | Mijlocul călătoriei | |
---|---|---|
Ușurință în utilizare | Foarte usor | Mediu |
Cost | 20 USD pe lună | Începe de la 10 USD pe lună |
Calitatea imaginii | Mai multe nuanțe și detalii | Bun |
Stilul imaginii | Sprijină toate stilurile de artă | Sprijină toate stilurile de artă |
Marimea imaginii | Pătrat, înalt și lat | Suporta dimensiuni personalizate |
Creativitate | Înțelege intenția utilizatorului | Ajustați nivelurile de creativitate |
Viteza de generare a imaginii | Un pic mai lent | Câteva secunde |
Drepturi de autor pentru imaginile AI | Utilizatorii dețin imaginile pe care le-au creat | Utilizatorii dețin imaginile pe care le-au creat |
Realism | Mai puțin real, dar mai multe detalii | Mai realistic |
Personalizare | Opțiuni limitate de personalizare | Mai multe opțiuni de personalizare |
Dall-E 3 vs Midjourney: The Ultimate Showdown
Privind un tabel de comparație vă poate oferi o idee scurtă, dar veți înțelege punctele forte și punctele slabe ale fiecărui generator de artă AI doar făcând o comparație alăturată.
În această secțiune, am ales câteva dintre cele mai bune imagini și tipuri de artă. Vom folosi același prompt în Dall-E 3 și Midjourney pentru fiecare tip pentru a compara rezultatele.
Notă: Toate imaginile din stânga sunt create în DALL-E 3, iar din dreapta sunt create de Midjourney.
Peisaje
Solicitare: câmpuri de grâu aurii sub un cer furtunos, cu o sperietoare singuratică purtând o eșarfă roșu aprins
Imaginea Dall-E 3 are un stil detaliat, ilustrativ, cu o nuanță caldă, aurie, prezentând o figură asemănătoare unei sperietoare. În schimb, imaginea lui Midjourney are o senzație mai fotografică, concentrându-se pe o figură învelită într-o furtună care se profilează, pictată în tonuri sepia. A ratat complet sperietoarea.
Concepte abstracte
Prompt: Reprezentare vizuală a sunetului râsului folosind rafale vibrante de culoare și modele învolburate
Poza Dall-E 3 are multe culori amestecate, arătând ca și cum s-ar învârti, cu o mulțime de albastru, făcându-l să se simtă visător. Poza Midjourney are o doamnă care râde cu modele colorate în jurul ei, făcând râsul să se simtă viu și real. Ambele sunt cool în arătarea bucuriei râsului.
În timp ce Midjourney a făcut o treabă grozavă, imaginea nu arată ca artă abstractă. Dall-E 3 a înțeles intenția promptului și a generat o imagine abstractă.
Setări istorice
Prompt: Un gladiator se pregătește de luptă într-un Colosseum roman, își ajustează casca și își apucă scutul
În stânga, Dall-E 3 arată un gladiator cu o cască detaliată și ornamentată în picioare în fața Colosseumului. Ambianța este mai senină, iar lumina soarelui îi luminează echipamentul.
În dreapta, imaginea Midjourney prezintă un gladiator mai aspru într-un moment intim. Acest războinic pare pierdut în gânduri, reflectând poate la bătălia care urmează. Armura lui este mai uzată de luptă, iar scena pare mai întunecată și mai intensă. Își strânge strâns scutul ornamentat, arătându-și hotărârea.
Ambele imagini par reale. Dall-E 3 a inclus aproape tot ce am cerut în prompt, dar Midjourney a ratat casca și Colosseum. Dall-E 3 a ratat și partea „ reglarea căștii ”.
Scene futuriste
Solicitare: muzicieni cibernetici de stradă cântă la instrumente luminoase pe o alee iluminată cu neon a unei metropole
Imaginea din stânga a lui Dall-E 3 arată o alee lungă și liniștită, cu muzicieni ca extratereștri și semne cu neon strălucitoare. A avut grijă să aibă și detalii perfecte ale fundalului. Imaginea potrivită de la Midjourney pare mai aglomerată, cu un amestec de oameni și roboți și o alee mai largă și vibrantă, plină de reflexii ale luminilor de neon. În timp ce ambele imagini arată muzicieni futurişti pe alei iluminate cu neon, Dall-E's se simte mai mult ca pe o altă planetă, iar Midjourney's are un amestec de vibrații de azi și viitoare.
Portrete
Solicitare: O femeie în vârstă cu părul argintiu legat într-un coc, poartă ochelari de epocă și brodează un model colorat
Aceste două imagini surprind frumos o femeie în vârstă care lucrează la broderia ei. Imaginea Dall-E 3 din stânga arată o femeie cu ochelari vintage izbitori și păr argintiu legat într-un coc. Ea lucrează la un model vibrant. Ambianța este rafinată, cu iluminare slabă care îi evidențiază trăsăturile. Imaginea potrivită de la Midjourney pare mai sinceră, în care doamna poartă ochelari mai casual, cu rame negre și este îmbrăcată într-o bluză colorată.
Ambele imagini subliniază arta broderiei, dar Dall-E 3 înclină spre eleganță, în timp ce Midjourney se simte confortabil și autentic.
Artă cu pixeli
Solicitare: un mag care aruncă o vrajă, cu particule magice și o carte de vrăji plutitoare, pe un fundal de pădure fermecată pixelat
În stânga, Dall-E 3 oferă o imagine pixelată a unui fundal de pădure cu magul îmbrăcat în albastru profund cu o pălărie înaltă, replicând o atmosferă de joc video de școală veche. Puteți vedea particulele magice învârtindu-se în jurul lui și cartea de vrăji plutitoare, care este larg deschisă, prezentându-și paginile strălucitoare.
Acum, în dreapta, Midjourney pictează o imagine mai realistă. Magul este portretizat ca un bărbat tânăr, cu aspect intens, profund absorbit de actul de vrăji. Particulele magice sunt vizibile în mod viu, înconjurând cartea de vrăji ca o sfera strălucitoare pe care o deține. Deși fundalul pădurii este evident, nu este pixelat așa cum a cerut solicitarea.
În timp ce ambele imagini înfățișează în mod strălucit un mag aruncând o vrajă, doar Dall-E 3 a reușit detaliul „pixelat”.
Artă suprarealistă
Solicitare: Un fluture supradimensionat care citește o carte unui cerc de elefanți atenți, mici pe o insulă plutitoare
Ambele imagini sunt create folosind același prompt, dar pictează scene foarte diferite. Imaginea lui Dall-E 3 este vibrantă și distractivă, prezentând un fluture cu cap de elefant citind o carte unor elefanți mici pe un tărâm plutitor.
Pe de altă parte, imaginea lui Midjourney are un sentiment de junglă fermecată, cu o insulă uriașă de elefanți și mulți elefanți mici care fac diferite activități. Dar, versiunea lui Midjourney ratează elementul central al „fluturelui supradimensionat”.
Design plat
Prompt: o carte poștală minimalistă care prezintă esența Tokyo prin siluete emblematice precum Turnul Tokyo, o rolă de sushi și o ramură cu flori de cireș
Ambele imagini surprind esența Tokyo folosind turnul Tokyo, sushi și flori de cireș. Versiunea lui Dall-E 3 este vibrantă, arătând un peisaj urban detaliat și sushi pe un fundal luminos, iar florile de cireș sunt luxuriante.
În contrast, Midjourney are o abordare calmă și minimalistă, cu o paletă pastelată, structuri simplificate și mai puține flori de cireș.
În timp ce ambele creații cuprind elementele solicitate, Dall-E 3 adaugă caracteristici suplimentare precum un râu și un pod. Din punct de vedere al calității, imaginea lui Dall-E este mai bogată în detalii, în timp ce cea a lui Midjourney acordă prioritate simplității și spațiului deschis.
randari 3D
Prompt: un pandantiv detaliat cu dragon de jad, redat 3D, cu ochi rubin, suspendat pe un lanț de argint delicat pe un fundal de catifea
Pandantivul lui Dall-E (din stânga) se potrivește îndeaproape cu aspectul „jad” cu culoarea sa verde și are ochi roșu rubiniu, dar lanțul argintiu pare mai gros decât se aștepta. Fundalul arată ca catifea.
Pandantivul lui Midjourney (în dreapta) nu seamănă la fel de mult cu jadul și are o senzație mai metalică, dar ochii lui rubin sunt proeminenți. Lanțul de aici este mai detaliat, iar fundalul este simplu întunecat. În comparație cu promptul, imaginea lui Dall-E se aliniază mai bine cu detaliile „jad” și „fondul de catifea”, în timp ce Midjourney prinde aspectul „lanț de argint”.
Ilustrație digitală
Prompt: O ilustrație digitală a unei pisici răutăcioase care încearcă să scoată pe furiș un pește dintr-un castron în timp ce un papagal din apropiere strigă un avertisment
Ambele imagini arată o pisică care încearcă să ia un pește dintr-un castron cu un papagal în apropiere. Imaginea lui Dall-E 3 din stânga are o pisică cu dungi gri atingând apa calm, iar papagalul doar privește.
În imaginea Midjourney din dreapta, pisica pare surprinsă și nu există nici un papagal. Poza lui Dall-E are mai multe detalii și textură, făcând-o să pară mai lustruită. Imaginea lui Midjourney se simte grăbită și are un decor mai întunecat, cu elemente lipsă.
Pictura in ulei
Prompt: Un marinar solemn pierdut în gânduri, ținând o busolă veche, cu marea tumultoasă și norii de furtună în fundal
Imaginea din stânga, realizată de Dall-E 3, are un marinar mai în vârstă care arată gânditor, cu o mare furtunoasă în spate. Cel din dreapta, de Midjourney, prezintă un marinar mai tânăr care se uită la o mare mai calmă. Ambele imagini se potrivesc cu promptul, dar Dall-E pare mai apropiată din cauza fundalului mai furtunoasă. Calitatea imaginii este bună în ambele, dar dau sentimente diferite: unul simte că se uită înapoi la aventurile trecute, iar celălalt are chef să se pregătească pentru una nouă.
Dioramă
Solicitare: o scenă de carnaval în miniatură, cu o roată Ferris funcțională, mici vizitatori care se bucură de vată de zahăr și un clovn care jonglează cu globuri strălucitoare în stil dioramă
Ambele imagini prezintă scene de carnaval în miniatură cu roți Ferris. Imaginea din stânga a lui Dall-E 3 are vizitatori cu vată de zahăr și un clovn care jonglează cu globuri strălucitoare, potrivite bine cu promptul. Imaginea potrivită de la Midjourney are o senzație de noapte și modele mai complexe, dar nu arată vizitatorilor cu vată de zahăr sau clovnul jongler. În timp ce ambele imagini au o calitate bună, imaginea lui Dall-E se aliniază mai aproape de specificul promptului, în timp ce cea a lui Midjourney oferă o imagine unică, dar vizitatorii mici nu sunt atât de clari.
Arhitectură
Solicitare: O bibliotecă capricioasă de casă în copac cu scări în spirală, felinare suspendate și balcoane pline cu cărți
Imaginea din stânga a lui Dall-E 3 este mai fantezie, cu multe detalii, felinare și o casă mai mare în copac. Imaginea potrivită de la Midjourney se simte mai aproape de viața reală, cu mai puține camere și felinare. Ambele imagini surprind ideea unei „biblioteci în copac” cu scări în spirală și balcoane cu cărți. Amândoi urmează bine promptul.
Cu toate acestea, poza lui Dall-E are o senzație mai visătoare, cu strălucirea verzuie, în timp ce cea a lui Midjourney pare seara și se simte mai confortabilă.
Ambele imagini sunt de înaltă calitate, dar alegerea dintre ele este dacă vă place un aspect mai magic sau mai realist.
Design interior
Solicitare: un dormitor boem cu un pat cu hamac, tapiserii pe pereți, o oglindă cu mozaic și plante atârnate de tavan
Ambele imagini surprind o senzație de dormitor boem. Imaginea lui Dall-E (din stânga) este colorată cu modele și are un scaun asemănător unui hamac, tapiserii clare și multe plante suspendate, dar îi lipsește o oglindă cu mozaic.
Imaginea lui Midjourney (din dreapta) este mai ușoară și mai spațioasă, cu plante și o tapiserie din dantelă, dar patul său nu este în stil hamac și nu există o oglindă mozaică vizibilă.
În timp ce ambele imagini au elemente boho și plante suspendate, niciuna nu se potrivește pe deplin cu solicitarea, mai ales în ceea ce privește oglinda mozaică și descrierea exactă a patului hamacului.
Solicitări de context înalt
Solicitare: Atelierul unui fierar în timpul Renașterii, cu unelte detaliate, forja strălucitoare, piese de armură complicate și un meșter la lucru
Cel din stânga de la Dall-E are un fierar, unelte bine organizate și armură evidențiată. Cel potrivit de la Midjourney are mai mulți oameni, unelte împrăștiate și o atmosferă plină de viață. În timp ce ambele descriu atelierul, imaginea Dall-E se concentrează pe un singur meșter și uneltele sale, iar cea de la Midjourney se simte mai mult ca o zi plină cu mai mulți muncitori.
Solicitări de context scăzut
Îndemn: Un dans luminat de lună
Ambele imagini prezintă un „dans la lumina lunii”. Imaginea din stânga a lui Dall-E are un ton de albastru vibrant, cu dansatori silueți pe o lună mare, în timp ce cea de la Midjourney, din dreapta, oferă o privire mai atentă și mai detaliată asupra dansatorilor cu o strălucire mai subtilă a lunii. Dall-E se concentrează pe mediu și contraste, iar Midjourney evidențiază emoțiile dansatorilor. Ambele surprind tema dansului luminat de lună, dar în stiluri diferite.
Spectacolul: Midjourney vs Dall-E 3
După evaluarea a 16 imagini generate de AI de la Dall-E 3 și Midjourney, este evident că Dall-E 3 excelează în capturarea detaliilor complicate. Această platformă depășește și Midjourney în interpretarea intenției solicitărilor de a genera imagini relevante. Pe de altă parte, Midjourney are un avantaj în crearea de elemente vizuale care par reale. În timp ce Dall-E 3 vizează perfecțiunea, uneori poate produce imagini mai puțin naturale.
Pentru companiile care caută detalii în imaginile lor AI, Dall-E 3 ar putea fi alegerea mai potrivită. Îl puteți accesa prin ChatGPT Plus și, de asemenea, în Photosonic, cel mai bun generator de imagini AI, foarte curând. OpenAI intenționează să lanseze API-ul Dall-E 3 în curând, făcându-l o funcție integrată în Photosonic.
Întrebări frecvente
1. Este Midjourney mai bun decât DALL-E 3?
Nu este vorba despre ca unul să fie de-a dreptul „mai bun” decât celălalt. Au stiluri și capacități diferite. DALL-E 3 este integrat cu ChatGPT Plus și face parte din pachetul pe care îl obțineți cu GPT-4. Midjourney, pe de altă parte, ar putea oferi variații în redările sale. Este mai mult despre preferințele tale personale și stilul pe care îl cauți.
2. DALL-E 3 este gratuit?
Nu, DALL-E 3 nu este gratuit. Este la pachet cu ChatGPT Plus, care costă 20 USD/lună. Acest abonament vă oferă și acces la GPT-4.
3. Care este mai ieftin, DALL-E 3 sau Midjourney?
Privind strict cifrele, Midjourney începe la un preț mai ieftin de 10 USD/lună. DALL-E 3 vine cu ChatGPT Plus, care are un preț de 20 USD/lună. Deci, dacă bugetul este un factor cheie, Midjourney ar putea fi opțiunea dvs. mai rentabilă.