Dall-E 3 vs Midjourney: un confronto affiancato delle immagini AI
Pubblicato: 2023-10-26Dall-E 3 di OpenAI è sulla scena da circa un mese e gli appassionati creativi di tutto il mondo si stanno immergendo in vari casi d'uso. Il potenziale sembra illimitato, dalla creazione di immagini AI alla produzione di cortometraggi.
Ora potresti farti delle domande: Dall-E 3 vale davvero la pubblicità? È meglio di Midjourney?
Se hai utilizzato Midjourney per le tue esigenze di immagine AI, potresti chiederti se è necessario un interruttore.
In questo post del blog, ci immergeremo in un confronto approfondito, in cui metteremo Dall-E 3 contro Midjourney utilizzando 16 istruzioni distinte per comprendere i punti di forza e i difetti di ciascuna piattaforma.
Cosa sono DALL-E 3 e Midjourney?
DALL-E 3 è il nuovissimo generatore di arte AI di OpenAI.
È integrato in ChatGPT, rendendolo facile da usare ed è disponibile tramite ChatGPT Plus per $ 20 al mese. Mentre è ancora in versione beta, fa scalpore in vari campi per immagini precise.
Consulta la guida dettagliata su Come utilizzare Dall-E 3.
D'altro canto, abbiamo Midjourney, un bot all'interno di Discord.
È noto per i suoi stili ricchi ed emozioni nelle immagini. Per $ 10 al mese, puoi iniziare con il loro piano di base, ma sii pronto a modificare le tue istruzioni a volte.
Quindi, DALL-E 3 offre arte dettagliata attraverso una piattaforma dedicata, mentre Midjourney, all'interno di Discord, si appoggia alla creatività e all'emozione. Entrambi hanno i loro vantaggi. Tutto dipende da ciò che stai cercando.
Dall-E 3 vs Midjourney: una matrice di confronto
Dall-E 3 | A metà viaggio | |
---|---|---|
Facilità d'uso | Molto facile | medio |
Costo | $ 20 al mese | A partire da $ 10 al mese |
Qualità dell'immagine | Più sfumature e dettagli | Bene |
Stile dell'immagine | Supporta tutti gli stili artistici | Supporta tutti gli stili artistici |
Dimensione dell'immagine | Quadrato, alto e largo | Supporta dimensioni personalizzate |
Creatività | Comprende l'intento dell'utente | Regola i livelli di creatività |
Velocità di generazione delle immagini | Un po' più lento | Pochi secondi |
Diritto d'autore sulle immagini AI | Gli utenti possiedono le immagini che hanno creato | Gli utenti possiedono le immagini che hanno creato |
Realismo | Meno realistico ma più dettagliato | Più realistico |
Personalizzazione | Opzioni di personalizzazione limitate | Ulteriori opzioni di personalizzazione |
Dall-E 3 contro Midjourney: lo scontro finale
Guardare una tabella comparativa può darti una breve idea, ma capirai i punti di forza e di debolezza di ciascun generatore di arte AI solo facendo un confronto fianco a fianco.
In questa sezione abbiamo selezionato alcune delle migliori immagini e tipi di grafica. Utilizzeremo lo stesso prompt in Dall-E 3 e Midjourney per ciascun tipo per confrontare i risultati.
Nota: tutte le immagini a sinistra vengono create in DALL-E 3 e a destra vengono create da Midjourney.
Paesaggi
Suggerimento: campi di grano dorati sotto un cielo tempestoso, con uno spaventapasseri solitario che indossa una sciarpa rosso brillante
L'immagine Dall-E 3 ha uno stile dettagliato e illustrativo con una tonalità calda e dorata, che mostra una figura simile a uno spaventapasseri. Al contrario, l'immagine di Midjourney ha un aspetto più fotografico, concentrandosi su una figura ammantata in una tempesta incombente, dipinta in tonalità seppia. Ha mancato completamente lo spaventapasseri.
Concetti astratti
Suggerimento: rappresentazione visiva del suono della risata utilizzando vibranti esplosioni di colori e motivi vorticosi
L'immagine Dall-E 3 ha molti colori misti, sembra che stiano girando, con molto blu, che la fanno sembrare sognante. L'immagine di Midjourney mostra una signora che ride con motivi colorati intorno a lei, rendendo la risata viva e reale. Entrambi sono bravi nel mostrare la gioia della risata.
Sebbene Midjourney abbia fatto un ottimo lavoro, l'immagine non sembra arte astratta. Dall-E 3 ha compreso l'intento del prompt e ha generato un visual astratto.
Ambientazioni storiche
Suggerimento: un gladiatore che si prepara alla battaglia in un Colosseo romano, mentre si aggiusta l'elmo e impugna lo scudo
A sinistra, il Dall-E 3 mostra un gladiatore con un elmo dettagliato e ornato in piedi davanti al Colosseo. L'atmosfera è più serena e la luce del sole illumina la sua attrezzatura.
A destra, l'immagine di Mezzo Viaggio presenta un gladiatore più robusto in un momento intimo. Questo guerriero sembra perso nei suoi pensieri, forse riflettendo sulla battaglia che lo attende. La sua armatura è più usurata dalla battaglia e la scena sembra più oscura e intensa. Afferra saldamente il suo scudo ornato, mostrando la sua determinazione.
Entrambe le immagini sembrano reali. Il Dall-E 3 ha incluso quasi tutto ciò che abbiamo chiesto nel prompt, ma a Midjourney mancano l'elmo e il colosseo. Dall-E 3 mancava anche la parte della " regolazione del casco ".
Scene futuristiche
Suggerimento: musicisti di strada cibernetici che suonano strumenti luminosi in un vicolo illuminato al neon di una metropoli
L'immagine a sinistra di Dall-E 3 mostra un lungo vicolo tranquillo con musicisti simili ad alieni e insegne al neon luminose. Si è assicurato che anche i dettagli dello sfondo fossero perfetti. L'immagine giusta di Midjourney sembra più affollata, con un mix di umani e robot e un vicolo più ampio e vibrante pieno di riflessi di luci al neon. Mentre entrambe le immagini mostrano musicisti futuristici in vicoli illuminati al neon, quella di Dall-E sembra più come su un altro pianeta e quella di Midjourney ha un mix di vibrazioni attuali e future.
Ritratti
Suggerimento: una donna anziana con i capelli argentati legati in uno chignon, che indossa occhiali vintage e ricama un motivo colorato
Queste due immagini catturano magnificamente una donna anziana che lavora al suo ricamo. L'immagine Dall-E 3 a sinistra mostra una donna con straordinari occhiali vintage e capelli argentati legati in uno chignon. Sta lavorando su un modello vibrante. L'ambiente è raffinato, con luci soffuse che mettono in risalto i suoi lineamenti. L'immagine giusta di Midjourney sembra più schietta, in cui la signora indossa occhiali più casual con la montatura nera ed è vestita con una camicetta colorata.
Entrambe le immagini enfatizzano l'arte del ricamo, ma Dall-E 3 tende all'eleganza mentre quella Midjourney sembra accogliente e autentica.
Arte pixelata
Suggerimento: un mago che lancia un incantesimo, con particelle magiche e un libro degli incantesimi fluttuante, sullo sfondo di una foresta incantata pixelata
A sinistra, Dall-E 3 offre un'immagine pixelata di una foresta sullo sfondo con il mago vestito di blu intenso con un cappello alto, che replica l'atmosfera dei videogiochi vecchia scuola. Puoi vedere le particelle magiche che vorticano intorno a lui e il libro degli incantesimi fluttuante, che è spalancato, mostrando le sue pagine luminose.
Ora, a destra, Midjourney dipinge un quadro più realistico. Il mago è ritratto come un uomo giovane, dall'aspetto intenso, profondamente assorto nell'atto di lanciare incantesimi. Le particelle magiche sono vividamente visibili e circondano il libro degli incantesimi luminoso simile a una sfera che tiene in mano. Sebbene lo sfondo della foresta sia evidente, non è pixelato come richiesto dal prompt.
Sebbene entrambe le immagini rappresentino brillantemente un mago che lancia un incantesimo, solo Dall-E 3 ha centrato il dettaglio "pixellato".
Arte surrealista
Suggerimento: una farfalla di grandi dimensioni che legge un libro a un cerchio di piccoli elefanti attenti su un'isola galleggiante
Entrambe le immagini vengono create utilizzando lo stesso prompt ma dipingono scene molto diverse. L'immagine di Dall-E 3 è vibrante e divertente e mostra una farfalla con la testa di elefante che legge un libro a piccoli elefanti su una terra galleggiante.
D'altra parte, l'immagine di Midjourney ha l'atmosfera di una giungla incantata con un'isola di elefanti giganti e tanti piccoli elefanti che svolgono diverse attività. Ma la versione di Midjourney manca dell'elemento centrale della "farfalla oversize".
Design piatto
Suggerimento: una cartolina minimalista che mostra l'essenza di Tokyo attraverso silhouette iconiche come la Torre di Tokyo, un rotolo di sushi e un ramo di fiori di ciliegio
Entrambe le immagini catturano l'essenza di Tokyo utilizzando la Torre di Tokyo, il sushi e i fiori di ciliegio. La versione di Dall-E 3 è vivace e mostra un paesaggio urbano dettagliato e un rotolo di sushi su uno sfondo luminoso, mentre i fiori di ciliegio sono rigogliosi.
Al contrario, Midjourney ha un approccio calmo e minimalista con una tavolozza pastello, strutture semplificate e meno fiori di ciliegio.
Sebbene entrambe le creazioni racchiudano gli elementi richiesti, Dall-E 3 aggiunge funzionalità extra come un fiume e un ponte. Dal punto di vista della qualità, l'immagine di Dall-E è più ricca di dettagli, mentre quella di Midjourney privilegia la semplicità e lo spazio aperto.
Rendering 3D
Suggerimento: un dettagliato ciondolo a forma di drago di giada reso in 3D con occhi di rubino, sospeso su una delicata catena d'argento su uno sfondo di velluto
Il ciondolo di Dall-E (a sinistra) si avvicina molto all'aspetto "giada" con il suo colore verde e ha gli occhi rosso rubino, ma la catena d'argento sembra più spessa del previsto. Lo sfondo sembra velluto.
Il ciondolo di Midjourney (a destra) non assomiglia tanto alla giada e ha un aspetto più metallico, ma i suoi occhi di rubino sono prominenti. La catena qui è più dettagliata e lo sfondo è semplicemente scuro. Rispetto al suggerimento, l'immagine di Dall-E si allinea meglio con i dettagli della "giada" e dello "fondale di velluto", mentre Midjourney inchioda l'aspetto della "catena d'argento".
Illustrazione digitale
Suggerimento: un'illustrazione digitale di un gatto dispettoso che cerca di far uscire di nascosto un pesce da una ciotola mentre un pappagallo nelle vicinanze grida un avvertimento
Entrambe le immagini mostrano un gatto che cerca di prendere un pesce da una ciotola con un pappagallo nelle vicinanze. L'immagine di Dall-E 3 a sinistra mostra un gatto a strisce grigie che tocca con calma l'acqua, e il pappagallo sta semplicemente guardando.
Nella foto di metà viaggio a destra, il gatto sembra sorpreso e non c'è nessun pappagallo. L'immagine di Dall-E ha più dettagli e texture, il che la rende più raffinata. L'immagine di Midjourney sembra affrettata e ha un'ambientazione più oscura con elementi mancanti.
Pittura ad olio
Suggerimento: un solenne marinaio perso nei suoi pensieri, con in mano una vecchia bussola, con il mare tumultuoso e le nuvole tempestose sullo sfondo
L'immagine a sinistra, realizzata da Dall-E 3, mostra un marinaio anziano con l'aria pensierosa con il mare in tempesta alle spalle. Quello di destra, di Midjourney, mostra un marinaio più giovane che guarda un mare più calmo. Entrambe le immagini corrispondono al suggerimento, ma quella di Dall-E sembra più vicina a causa dello sfondo più tempestoso. La qualità dell'immagine è buona in entrambi, ma danno sensazioni diverse: uno ha la sensazione di guardare indietro alle avventure passate, e l'altro di prepararsi per una nuova.
Diorama
Suggerimento: una scena di carnevale in miniatura, con una ruota panoramica funzionante, piccoli visitatori che si divertono con zucchero filato e un clown che si destreggia tra sfere luminose in stile diorama
Entrambe le immagini mostrano scene di carnevale in miniatura con ruote panoramiche. L'immagine a sinistra di Dall-E 3 mostra visitatori con zucchero filato e un clown che si destreggia tra sfere luminose, adattandosi bene al suggerimento. L'immagine giusta di Midjourney ha un'atmosfera notturna e disegni più complessi, ma non mostra i visitatori con lo zucchero filato o il clown giocoliere. Sebbene entrambe le immagini abbiano una buona qualità, l'immagine di Dall-E si allinea più alle specifiche del prompt, mentre quella di Midjourney offre una visione unica, ma i piccoli visitatori non sono così chiari.
Architettura
Suggerimento: una bizzarra biblioteca su una casa sull'albero con scale a chiocciola, lanterne sospese e balconi pieni di libri
L'immagine a sinistra di Dall-E 3 è più fantasy, con molti dettagli, lanterne e una casa sull'albero più grande. L'immagine giusta di Midjourney sembra più vicina alla vita reale, con meno stanze e lanterne. Entrambe le immagini catturano l'idea di una "biblioteca sull'albero" con scale a chiocciola e balconi con libri. Entrambi seguono bene il suggerimento.
Tuttavia, la foto di Dall-E ha un aspetto più sognante con il suo bagliore verdastro, mentre quella di Midjourney sembra ambientata di sera e sembra più accogliente.
Entrambe le immagini sono di alta qualità, ma la scelta tra loro è se ti piace un aspetto più magico o realistico.
Interior design
Suggerimento: una camera da letto bohémien con un letto ad amaca, arazzi alle pareti, uno specchio a mosaico e piante appese al soffitto
Entrambe le immagini catturano l'atmosfera bohémien di una camera da letto. L'immagine di Dall-E (a sinistra) è colorata con motivi e ha un sedile simile a un'amaca, arazzi trasparenti e molte piante pendenti, ma manca uno specchio a mosaico.
L'immagine di Midjourney (a destra) è più leggera e spaziosa, con piante e un arazzo di pizzo, ma il suo letto non è in stile amaca e non c'è uno specchio a mosaico visibile.
Sebbene entrambe le immagini abbiano elementi boho e piante pendenti, nessuna delle due corrisponde pienamente al suggerimento, soprattutto per quanto riguarda lo specchio a mosaico e la descrizione esatta del letto dell'amaca.
Richieste di contesto elevato
Suggerimento: la bottega di un fabbro durante il Rinascimento, con strumenti dettagliati, fucina luminosa, intricate armature e un artigiano al lavoro
Quello a sinistra di Dall-E ha un fabbro, strumenti ben organizzati e un'armatura evidenziata. Quello giusto di Midjourney ha più persone, strumenti sparsi e un'atmosfera vivace. Mentre entrambi raffigurano il laboratorio, l'immagine Dall-E si concentra su un singolo artigiano e i suoi strumenti, mentre quella di Midjourney sembra più una giornata impegnativa con più lavoratori.
Richieste di contesto basso
Suggerimento: una danza al chiaro di luna
Entrambe le immagini mostrano una "danza al chiaro di luna". L'immagine a sinistra di Dall-E ha una vibrante tonalità blu con ballerini stagliati contro una grande luna, mentre quella di Midjourney, a destra, offre uno sguardo più ravvicinato e dettagliato dei ballerini con un bagliore lunare più sottile. Dall-E si concentra sull'ambiente e sui contrasti, mentre Midjourney mette in risalto le emozioni dei ballerini. Entrambi catturano il tema della danza al chiaro di luna ma in stili diversi.
Il pezzo forte: Midjourney vs Dall-E 3
Dopo aver valutato 16 immagini generate dall'intelligenza artificiale da Dall-E 3 e Midjourney, è evidente che Dall-E 3 eccelle nel catturare dettagli complessi. Questa piattaforma supera Midjourney anche nell'interpretare l'intento dei suggerimenti di generare immagini rilevanti. D'altra parte, Midjourney ha un vantaggio nel creare immagini che sembrano reali. Sebbene Dall-E 3 punti alla perfezione, a volte può produrre immagini meno naturali.
Per le aziende che cercano dettagli nelle immagini dell'intelligenza artificiale, Dall-E 3 potrebbe essere la scelta più adatta. Potrai accedervi tramite ChatGPT Plus e molto presto anche in Photosonic, il miglior generatore di immagini AI. OpenAI prevede di rilasciare presto l'API Dall-E 3, rendendola una funzionalità integrata in Photosonic.
Domande frequenti
1. Midjourney è migliore di DALL-E 3?
Non si tratta davvero di uno che sia completamente "migliore" dell'altro. Hanno stili e capacità diversi. DALL-E 3 è integrato con ChatGPT Plus e fa parte del pacchetto che ottieni con GPT-4. Midjourney, d'altra parte, potrebbe offrire variazioni nei suoi rendering. Riguarda più le tue preferenze personali e lo stile che stai cercando.
2. DALL-E 3 è gratuito?
No, DALL-E 3 non è gratuito. È in bundle con ChatGPT Plus, che costa $ 20 al mese. Questo abbonamento ti garantisce anche l'accesso a GPT-4.
3. Cos'è più economico, DALL-E 3 o Midjourney?
Osservando attentamente i numeri, Midjourney parte da un prezzo più economico di $ 10 al mese. DALL-E 3 viene fornito con ChatGPT Plus, al prezzo di $ 20 al mese. Quindi, se il budget è un fattore chiave, Midjourney potrebbe essere l’opzione più conveniente.