Dall-E 3 против Midjourney: параллельное сравнение изображений ИИ
Опубликовано: 2023-10-26Dall-E 3 от OpenAI присутствует уже около месяца, и творческие энтузиасты со всего мира изучают различные варианты использования. Потенциал кажется безграничным: от создания изображений с помощью ИИ до производства короткометражных фильмов.
Теперь вы, возможно, задаетесь вопросом: действительно ли Dall-E 3 стоит такой шумихи? Это лучше, чем Мидджорни?
Если вы использовали Midjourney для создания изображений ИИ, вы можете задаться вопросом, нужен ли переход.
В этом сообщении блога мы углубимся в подробное сравнение, в котором мы сравним Dall-E 3 с Midjourney, используя 16 различных подсказок, чтобы понять сильные и слабые стороны каждой платформы.
Что такое DALL-E 3 и Midjourney?
DALL-E 3 — новейший генератор искусственного интеллекта от OpenAI.
Он встроен в ChatGPT, что делает его удобным для пользователя, и доступен через ChatGPT Plus за 20 долларов в месяц. Пока он все еще находится в бета-версии, он активно работает в различных областях для получения точных изображений.
Ознакомьтесь с подробным руководством по использованию Dall-E 3.
С другой стороны, у нас есть Midjourney, бот внутри Discord.
Он известен своим богатым стилем и эмоциями в изображениях. За 10 долларов в месяц вы можете начать с их базового плана, но будьте готовы иногда корректировать свои подсказки.
Итак, DALL-E 3 предлагает детальную графику через специальную платформу, а Midjourney в Discord опирается на творчество и эмоции. Оба имеют свои преимущества. Все сводится к тому, что вы ищете.
Dall-E 3 против Midjourney: матрица сравнения
Далл-Э 3 | Середина пути | |
---|---|---|
Простота использования | Очень просто | Середина |
Расходы | 20 долларов в месяц | От 10 долларов в месяц |
Качество изображения | Больше нюансов и деталей | Хороший |
Стиль изображения | Поддерживает все художественные стили | Поддерживает все художественные стили |
Размер изображения | Квадратный, высокий и широкий | Поддерживает нестандартные размеры |
Креативность | Понимает намерения пользователя | Регулируйте уровень креативности |
Скорость создания изображения | Немного медленнее | Несколько секунд |
Авторские права на изображения AI | Пользователи владеют созданными ими изображениями | Пользователи владеют созданными ими изображениями |
Реализм | Менее реалистично, но более подробно | Более реалистично |
Кастомизация | Ограниченные возможности настройки | Больше возможностей настройки |
Dall-E 3 против Midjourney: The Ultimate Showdown
Просмотр сравнительной таблицы может дать вам краткое представление, но вы поймете сильные и слабые стороны каждого генератора искусств ИИ, только проведя параллельное сравнение.
В этом разделе мы выбрали некоторые из лучших изображений и видов искусства. Мы будем использовать одну и ту же подсказку в Dall-E 3 и Midjourney для каждого типа, чтобы сравнить результаты.
Примечание. Все изображения слева созданы в DALL-E 3, а справа — в Midjourney.
Пейзажи
Подсказка: золотые пшеничные поля под грозовым небом, с одиноким чучелом в ярко-красном шарфе.
Изображение Dall-E 3 имеет детальный, иллюстративный стиль с теплым золотистым оттенком, демонстрирующий фигуру, похожую на пугало. Напротив, изображение Мидджорни имеет более фотографический вид: оно сосредоточено на закутанной фигуре в надвигающемся шторме, окрашенной в тонах сепии. Оно совершенно не попало в пугало.
Абстрактные понятия
Подсказка: визуальное представление звука смеха с помощью ярких вспышек цвета и закрученных узоров.
На изображении Dall-E 3 много смешанных цветов, которые выглядят так, как будто они вращаются, с большим количеством синего цвета, что создает ощущение мечтательности. На снимке «Мидджорни» изображена смеющаяся женщина, окруженная яркими узорами, благодаря чему смех кажется живым и настоящим. Оба классно показывают радость смеха.
Хотя Midjourney проделали отличную работу, изображение не похоже на абстрактное искусство. Dall-E 3 понял смысл подсказки и создал абстрактное изображение.
Исторические настройки
Подсказка: гладиатор готовится к бою в римском Колизее, поправляет шлем и сжимает щит.
Слева на Dall-E 3 изображен гладиатор в детализированном и богато украшенном шлеме, стоящий перед Колизеем. Атмосфера стала более безмятежной, и солнечный свет освещает его снаряжение.
Справа на изображении Midjourney изображен более суровый гладиатор в интимный момент. Этот воин кажется погруженным в свои мысли, возможно, размышляя о предстоящей битве. Его доспехи стали более изношенными в боях, а сцена кажется более мрачной и напряженной. Он крепко сжимает свой богато украшенный щит, демонстрируя свою решимость.
Оба изображения выглядят реальными. В Dall-E 3 включено почти все, что мы просили в подсказке, но в Midjourney не хватает шлема и Колизея. Dall-E 3 также пропустил часть « регулировки шлема ».
Футуристические сцены
Подсказка: Кибернетические уличные музыканты играют на светящихся инструментах в освещенном неоном переулке мегаполиса.
На левом изображении, сделанном Dall-E 3, показан тихий длинный переулок с музыкантами, похожими на инопланетян, и яркими неоновыми вывесками. Он также позаботился о том, чтобы были идеальные детали фона. Правое изображение от Midjourney кажется более оживленным: здесь смешаны люди и роботы, а также более широкий и яркий переулок, наполненный отражениями неоновых огней. В то время как на обеих фотографиях изображены футуристические музыканты в освещенных неоном переулках, Dall-E больше напоминает другую планету, а Midjourney представляет собой смесь атмосферы настоящего и будущего.
Портреты
Подсказка: пожилая женщина с серебристыми волосами, завязанными в пучок, в старинных очках и вышивающая красочный узор.
На этих двух изображениях прекрасно запечатлена пожилая женщина, работающая над вышивкой. На изображении Dall-E 3 слева изображена женщина в ярких винтажных очках и с серебристыми волосами, заплетенными в пучок. Она работает над ярким узором. Атмосфера изысканная, мягкое освещение подчеркивает ее черты. Правое изображение от Midjourney кажется более откровенным, где дама носит более повседневные очки в черной оправе и одета в яркую блузку.
Оба изображения подчеркивают искусство вышивки, но Dall-E 3 склоняется к элегантности, а Midjourney выглядит уютно и аутентично.
Пиксельное искусство
Подсказка: маг произносит заклинание с магическими частицами и плавающей книгой заклинаний на пикселированном фоне зачарованного леса.
Слева Dall-E 3 предлагает пиксельное изображение лесного фона с магом в темно-синем плаще и высокой шляпе, имитирующим атмосферу старой школы видеоигры. Вы можете видеть магические частицы, кружащиеся вокруг него, и плавающую книгу заклинаний, которая широко открыта, демонстрируя свои светящиеся страницы.
Теперь справа Midjourney рисует более реалистичную картину. Маг изображается как молодой, энергичный мужчина, глубоко поглощенный процессом заклинания. Магические частицы отчетливо видны вокруг светящейся книги заклинаний, похожей на сферу, которую он держит. Хотя лесной фон очевиден, он не пикселизирован, как было указано в подсказке.
Хотя оба изображения блестяще изображают мага, творящего заклинание, только Dall-E 3 удалось передать «пиксельные» детали.
Сюрреалистическое искусство
Подсказка: огромная бабочка читает книгу кругу внимательных крошечных слонят на плавучем острове.
Оба изображения созданы с использованием одной и той же подсказки, но рисуют совершенно разные сцены. Изображение Dall-E 3 яркое и веселое: бабочка с головой слона читает книгу крошечным слонам на плавучей земле.
С другой стороны, изображение Midjourney создает атмосферу волшебных джунглей с гигантским слоновьим островом и множеством маленьких слонов, занимающихся разными делами. Но в версии Midjourney отсутствует центральный элемент «огромной бабочки».
Плоский дизайн
Подсказка: минималистичная открытка, демонстрирующая суть Токио через такие знаковые силуэты, как Токийская башня, суши-ролл и ветка цветущей сакуры.
Оба изображения передают суть Токио с помощью Токийской башни, суши и цветущей вишни. Версия Dall-E 3 яркая: детализированный городской пейзаж, суши-роллы на ярком фоне, а также пышное цветение вишни.
Напротив, Midjourney имеет спокойный и минималистичный подход с пастельной палитрой, упрощенными структурами и меньшим количеством цветов вишни.
Хотя оба проекта включают в себя запрошенные элементы, Dall-E 3 добавляет дополнительные функции, такие как река и мост. С точки зрения качества изображение Dall-E богаче деталями, тогда как Midjourney отдает предпочтение простоте и открытому пространству.
3D- рендеринг
Подсказка: детальный 3D-кулон в виде нефритового дракона с рубиновыми глазами, подвешенный на тонкой серебряной цепочке на бархатном фоне.
Подвеска Dall-E (слева) очень похожа на «нефрит» благодаря своему зеленому цвету и рубиново-красным глазам, но серебряная цепочка кажется толще, чем ожидалось. Фон выглядит как бархат.
Кулон Мидджорни (справа) не так похож на нефрит и имеет более металлический оттенок, но у него заметны рубиновые глаза. Цепочка здесь более детальная, а фон просто темный. По сравнению с подсказкой, изображение Dall-E лучше сочетается с деталями «нефрита» и «бархатного фона», в то время как Midjourney подчеркивает аспект «серебряной цепочки».
Цифровая иллюстрация
Подсказка: цифровая иллюстрация озорного кота, пытающегося выкрасть рыбу из миски, в то время как попугай поблизости выкрикивает предупреждение.
На обеих фотографиях изображен кот, пытающийся достать рыбу из миски, а рядом находится попугай. На изображении Dall-E 3 слева серо-полосатый кот спокойно касается воды, а попугай просто наблюдает.
На снимке Мидджорни справа кот выглядит удивленным, а попугая нет. Изображение Dall-E имеет больше деталей и текстур, благодаря чему оно выглядит более изысканным. Изображение Midjourney выглядит поспешным и имеет более темную обстановку с отсутствующими элементами.
Картина маслом
Подсказка: торжественный моряк, погруженный в свои мысли, держит старый компас на фоне бурного моря и грозовых облаков.
На левом снимке, сделанном Dall-E 3, изображен задумчивый пожилой моряк, а позади него штормит море. На правом фото Midjourney изображен молодой моряк, смотрящий на более спокойное море. Обе фотографии соответствуют сюжету, но фотография Далл-И кажется ближе из-за более бурного фона. Качество изображения хорошее у обоих, но ощущения они вызывают разные: у одного хочется оглянуться на прошлые приключения, а у другого - готовиться к новым.
Диорама
Подсказка: миниатюрная сцена карнавала с работающим колесом обозрения, крошечными посетителями, наслаждающимися сладкой ватой, и клоуном, жонглирующим светящимися шарами в стиле диорамы.
На обоих изображениях изображены миниатюрные карнавальные сцены с колесами обозрения. На левом изображении, сделанном Dall-E 3, изображены посетители с сахарной ватой и клоун, жонглирующий светящимися шарами, что хорошо соответствует сюжету. Правое изображение от Midjourney создает атмосферу ночного времени и имеет более сложный дизайн, но не показывает посетителей с сахарной ватой или жонглирующего клоуна. Хотя оба изображения имеют хорошее качество, изображение Dall-E ближе к специфике подсказки, тогда как изображение Midjourney предлагает уникальный подход, но крошечные посетители не так ясны.
Архитектура
Подсказка: причудливая библиотека в домике на дереве с винтовыми лестницами, подвесными фонарями и балконами, заполненными книгами.
Левое изображение, сделанное Dall-E 3, больше похоже на фэнтези, со множеством деталей, фонарями и большим домиком на дереве. Правое изображение от Midjourney кажется более близким к реальной жизни, с меньшим количеством комнат и фонарей. Обе фотографии передают идею «библиотеки на дереве» с винтовой лестницей и книжными балконами. Они оба хорошо следуют подсказкам.
Тем не менее, фотография Dall-E выглядит более мечтательной благодаря своему зеленоватому свечению, в то время как фотография Midjourney кажется вечерней и кажется более уютной.
Оба изображения высокого качества, но выбор между ними зависит от того, хотите ли вы более волшебный или реалистичный вид.
Дизайн интерьера
Подсказка: богемная спальня с кроватью-гамаком, гобеленами на стенах, мозаичным зеркалом и растениями, свисающими с потолка.
Оба изображения передают атмосферу богемной спальни. Изображение Далл-И (слева) красочно и украшено узорами, имеет сиденье, похожее на гамак, прозрачные гобелены и множество свисающих растений, но в нем отсутствует мозаичное зеркало.
Изображение Midjourney (справа) светлее и просторнее, с растениями и кружевным гобеленом, но кровать не похожа на гамак, и нет видимого мозаичного зеркала.
Хотя оба изображения содержат элементы бохо и висячие растения, ни одно из них полностью не соответствует подсказке, особенно в отношении мозаичного зеркала и точного описания гамака.
Высококонтекстные подсказки
Подсказка: кузница эпохи Возрождения с детализированными инструментами, светящейся кузницей, замысловатыми деталями доспехов и мастером за работой.
В левом от Далл-И есть один кузнец, аккуратно разложенные инструменты и выделенная броня. В правом от Midjourney есть несколько человек, разбросанные инструменты и оживленная атмосфера. Хотя оба изображения изображают мастерскую, изображение Dall-E фокусируется на одном мастере и его инструментах, а изображение Midjourney больше похоже на напряженный день с несколькими рабочими.
Низкоконтекстные подсказки
Подсказка: танец при лунном свете.
Оба изображения демонстрируют «танец при лунном свете». Левое изображение от Dall-E имеет яркий синий оттенок с силуэтами танцоров на фоне большой луны, а изображение от Midjourney справа предлагает более детальный взгляд на танцоров с более тонким лунным сиянием. Dall-E фокусируется на окружающей среде и контрастах, а Midjourney подчеркивает эмоции танцоров. Оба отражают танцевальную тему при лунном свете, но в разных стилях.
Яркое зрелище: Midjourney против Dall-E 3
После оценки 16 изображений, созданных искусственным интеллектом с помощью Dall-E 3 и Midjourney, стало очевидно, что Dall-E 3 превосходно передает сложные детали. Эта платформа также превосходит Midjourney в интерпретации намерений подсказок для создания релевантных изображений. С другой стороны, Midjourney имеет преимущество в создании реалистичных визуальных эффектов. Хотя Dall-E 3 стремится к совершенству, иногда он может создавать менее естественные изображения.
Для компаний, которым важна детализация визуальных эффектов искусственного интеллекта, Dall-E 3 может оказаться более подходящим выбором. Вы можете получить к нему доступ через ChatGPT Plus, а также в Photosonic, лучшем генераторе изображений AI, очень скоро. OpenAI планирует в ближайшее время выпустить API Dall-E 3, что сделает его интегрированной функцией в Photosonic.
Часто задаваемые вопросы
1. Midjourney лучше, чем DALL-E 3?
На самом деле дело не в том, что один из них явно «лучше», чем другой. У них разные стили и возможности. DALL-E 3 интегрирован с ChatGPT Plus и является частью пакета, который вы получаете с GPT-4. С другой стороны, Midjourney может предлагать различные варианты визуализации. Это больше зависит от ваших личных предпочтений и стиля, который вы ищете.
2. Является ли DALL-E 3 бесплатным?
Нет, DALL-E 3 не бесплатен. Он поставляется в комплекте с ChatGPT Plus, который стоит 20 долларов в месяц. Эта подписка также предоставляет вам доступ к GPT-4.
3. Что дешевле, DALL-E 3 или Midjourney?
Если смотреть строго на цифры, Midjourney начинается с более низкой цены — 10 долларов в месяц. DALL-E 3 поставляется с ChatGPT Plus, стоимость которого составляет 20 долларов США в месяц. Итак, если бюджет является ключевым фактором, Midjourney может быть вашим более экономичным вариантом.