DALL·E 2 ile AI görüntü üretimi dijital pazarlamada nasıl kullanılabilir?
Yayınlanan: 2022-10-17"Vay, sen mi aldın? Bir dakika – bu profesyonel bir fotoğrafçı tarafından yapıldı…?”
Doktorumuz Jake'e aşağıdaki resmi gösterdiğimde tepkisi buydu: OpenAI'nin DALL·E 2'si tarafından saniyeler içinde oluşturulan, “ayçiçeği üzerindeki bir kelebeğin makro fotoğrafı” için girdiğim bir komut kullanılarak oluşturulan fotogerçekçi bir görüntü .
Ön planda bir kelebeğin keskinliğini ve rengini ve arka planda ayçiçeğinin yumuşak odağını yakalayan çok gerçekçi görünen bir fotoğraf. Aslında, o kadar ki, AI tarafından oluşturulan görüntülerde yaygın olabilecek herhangi bir belirgin kuyruk işareti, artefakt veya yanlışlık hissi bulabilen birçok insan bulmakta zorlanacaksınız.
Bu, gelişmiş AI sistemlerinin çoğu durumda gerçek hayattan ayırt edilemeyen fotogerçekçi görüntüleri anlayabildiği ve oluşturabildiği noktaya girdiğimizi fark ettiğim andı. Bunun yaratıcı ve dijital endüstrilerde çalışan herkes için veya gerçekten de görüntü kaynağı veya görüntü manipülasyonu içeren herhangi bir rol için ilginç etkileri vardır.
Bu makalede, yaratıcı ve dijital pazarlama dünyasında OpenAI'nin DALL·E 2'sini kullanmanın bazı pratik uygulamalarını ve DALL·E 2'nin yakın zamanda güncellenen düzenleme araçlarının yaratıcı çalışmaları desteklemek için nasıl kullanılabileceğini araştırıyorum.
DALL·E 2 nedir?
OpenAI'nin DALL·E 2'si, basit bir metin tabanlı komut istemi alan ve yapay zekanın bu istemi anlamasına dayalı olarak görüntüler oluşturan yapay zeka tabanlı bir görüntü oluşturucudur. Saniyeler içinde, OpenAI hesabınızda indirilebilecek, paylaşılabilecek veya favori olarak kaydedilebilecek dört resim varyasyonu oluşturacaksınız.
DALL·E 2 artık herkesin kullanımına açık. Her nesil için 1 kredi gerekli ve her 115 kredinin maliyeti 15 $ olmak üzere ayda 15 ücretsiz kredi alırsınız. DALL·E 2 İçerik Politikasına uygun olmaları koşuluyla sıfırdan görüntüler oluşturabilir veya kendi fotoğraflarınızı manipüle etmek için yükleyebilirsiniz ve kullanım koşullarına göre "Generations'ı ticari kullanım da dahil olmak üzere herhangi bir yasal amaç için kullanabilirsiniz".
Bu, ilişkilendirmeyi ilginç bir konu haline getirir ve komutları sağlayan kişiye, bir resmi düzenlerken resim kaynağına veya DALL·E 2'ye ne kadar itibar edilmesi gerektiğini gösterir. Bu blog gönderisinde kullandığım tüm resimler, örneğin, ben ya DALL·E 2 ile oluşturulmuş veya değiştirilmiş bir stok kitaplık görüntüsü oluşturmuştur, ancak bu nesilleri veya değişiklikleri kendime atfedersem bir şekilde sahtekarlık hissederim.
Görüntüler şunlara dayalı olarak oluşturulabilir:
- Konu: İstediğiniz her şeyin görüntülerini oluşturabilirsiniz; manzaralar, hayvanlar, nesneler, soyut kavramlar, örneğin derin sahtekarlıkların çoğalmasını önlemek için ünlü kişilerin görüntülerini oluşturmayı yasaklayan içerik politikasını takip ettikleri sürece.
- Orta: Kurşun kalem eskizlerinden yağlı boya tablolara, piksel sanatına ve dijital çizimlere kadar, DALL·E 2 her türlü ortamı temsil eden görüntüler üretebilir.
- Çevresel ayarlar: Resimlerinize biraz atmosfer katmak için "gün batımı" veya "sis" gibi hızlı çevresel faktörleri ekleyin.
- Konum: Resimlerinizi belirli bir yere yerleştirmeniz gerekiyorsa, komut istemine bir şehir veya ülke verin ve o yerle ilişkili yer işaretleri, yapı stilleri vb. almalısınız.
- Sanatsal stil: DALL·E 2, farklı sanatçıların tarzında görüntüler oluşturabilir. İstemlerinize "[sanatçı] tarzında" eklemeniz yeterlidir.
- Kamera ayarları: özellikle fotoğraf stilleri için kullanışlıdır, fotoğraflara çeşitli farklı çekimler ve kaliteler vermek için isteklerinize kamera kurulumları ekleyebilirsiniz. Örnekler arasında “Makro 35 mm çekim”, “uzun pozlama” veya “balık gözü lens” sayılabilir.
“Picasso tarzında Parisli bir kafede Homer Simpson” gibi ne istediğinizi tanımlamanıza yardımcı olması için yukarıdakilerden herhangi birini birleştirmek için doğal dili kullanın ve saniyeler içinde birkaç nesil elde edeceksiniz.
DALL·E 2'nin yeteneklerini keşfederken olasılıklar arasında kaybolmak kolaydır, ancak aracın özellikle tasarım ve pazarlamada bu makalenin ilerleyen kısımlarında incelenecek olan birçok pratik uygulaması da vardır.
DALL·E 2 nasıl çalışır?
DALL·E 2 AI görüntü oluşturmanın nasıl çalıştığını tam olarak anlıyormuş gibi yapmayacağım hatta tam olarak açıklamaya çalışacağım – bunu yapan çok sayıda makale var. Ama söyleyebileceğim şey, karmaşık bir mantık kümesi kullanan akıllı bir algoritmadan çok daha fazlası. Makine öğrenimi. Zamanla milyarlarca kaynak görüntüden ve doğal dilden ve her ikisi arasındaki ilişkiden eğitilmiş bir yapay zeka.
Kalbinde, rastgele gürültü ile başlayan ve yapay zekanın istenen komut istemine ilişkin anlayışına benzer bir şey ortaya çıkana kadar birden fazla döngü boyunca yinelemeli olarak rafine edilen bir difüzyon modeli vardır.
DALL·E 2 aracının kullanımı kolaydır. Giriş yaptıktan sonra, bir metin istemine dayalı olarak resim oluşturmaya başlayabileceğiniz veya düzenlemek için kendi resminizi yükleyebileceğiniz basit bir giriş alanı ile karşılaşacaksınız.
Bu makalenin ilerleyen bölümlerinde inceleyeceğimiz, hem oluşturulan hem de yüklenen resimler için bir dizi resim düzenleme aracı kullanılabilir hale gelir.
Görüntü kaynağı için DALL·E 2'yi kullanma
Yapay zeka tabanlı görüntü oluşturmanın en belirgin kullanımlarından biri, blog gönderileri, sunumlar, web siteleri, reklamlar ve diğer çeşitli ortamlar için kullanılacak fotoğrafları veya diğer görüntü stillerini sağlamaktır. ShutterStock, iStockPhotos veya Unsplash gibi stok fotoğraf kitaplıkları, görüntü kaynağı söz konusu olduğunda genellikle popüler seçeneklerdir, ancak insanların daha hızlı ve daha düşük maliyetli bir alternatif ve aynı zamanda oluşturma için DALL·E 2'nin beğenilerine giderek daha fazla yöneldiğini göreceğiz. gerçekten benzersiz olan ve çevrimiçi başka hiçbir yerde bulunmayan görüntüler.
DALL·E 2, özellikle "Golden Retriever bir gün batımına bakan bir kumsalda oturdu" veya "Güneşli bir ormanda çanların arasından atlayan bir tilkinin fotoğrafı" gibi çok özel bir konusu olan görüntülerin kaynağında kullanışlı olabilir ağaçların arasından parlıyor”. Çeşitli stok fotoğraf kitaplıklarından benzer görseller elde etmek muhtemelen daha uzun sürer ve çoğu durumda konunun var olması pek olası değildir.
Fotoğrafik görüntü oluşturma stilinde gerçekten şaşırtıcı bulduğum şey, DALL·E 2'nin her türlü çevresel ayarı doğru bir şekilde kopyalayabilmesidir. Güneş ışığının parıltısından ve gölgelerin doğru şekilde dökülmesinden yakındaki nesnelerin keskinliğine ve daha uzaktaki öğelerin kademeli olarak bulanıklaşmasına kadar. Ayrıca 'Makro 35mm', 'Balık gözü' veya 'Mercek Parlaması' gibi çeşitli kamera tabanlı kurulumlar için istemler de ekleyebilirsiniz.
Fotoğraf kalitesinde görüntüler oluştururken, daha yaygın olan konulardan daha gerçekçi nesiller gözlemledim. Örneğin, kumsallarda köpeklerin, çanların içinde zıplayan tilkilerden çok daha fazla fotoğrafı vardır, bu nedenle bir yapay zekanın referans alabileceği daha fazla içerik vardır.
Belirtmeye değer önemli bir sınırlama, oluşturulan tüm görüntülerin 1024 x 1024 piksel ile sınırlı olmasıdır, bu nedenle yakın zamanda reklam panoları için fotoğraf üretmeyeceğiz…
Görüntü boyutlarını genişletme
DALL·E 2'nin kreatif ve pazarlama dünyasında gördüğüm en yaygın kullanımlarından biri, eksiksiz yeni görüntüler oluşturmak yerine mevcut görüntülerin geliştirilmesi ve düzenlenmesidir. Bir web geliştiricisi olarak, genellikle iyi bir görüntünün bulunduğu ancak görüntü kapsayıcısının görüntüden farklı bir oranda olması nedeniyle görüntü yüklendiğinde oran ve boyutların yetersiz kırpmalara neden olduğu zorluklarla karşılaşıyorum.
İşte bir örnek. Öne çıkan bir kahraman biriminde kullanılmak üzere ayrılmış bir arabanın penceresinden dışarı doğru eğilmiş bir köpeğin hoş bir stok görüntüsü, ancak kaynak fotoğrafın standart manzara oranı, öne çıkan bir kahramanın süper geniş 21:9 oranıyla pek iyi oynamadı afiş.
Görüntüyü DALL·E 2'ye yükleyerek ve 'Generation Frame' aracını kullanarak, AI'nın boşlukları doldurmasına izin vererek görüntüyü genişletebiliriz. Nesil Çerçeveyi kullanırken, AI'ya çalışması için daha fazla bilgi vermek için her zaman orijinal görüntünün bir kısmını çerçeve içinde tutmak isteyeceksiniz.
Bilgi istemi metni burada da önemlidir ve genellikle tam görüntü yerine oluşturma çerçevesinde ne istediğinizi açıklamak istersiniz. Bu komut için sadece “tepeler ve gökyüzü” kullandım ve gerisini DALL·E 2'ye bıraktım.
DALL·E 2, her nesil için size aralarından seçim yapabileceğiniz dört varyasyon sunacaktır. Yukarıdaki görüntü en inandırıcıydı; yolun iyi bir uzantısı, bir avuç dolusu ağaç, dramatik olmayan bazı ilginç bulutlar ve ağaçların arkasından akan bir dere (ki ben istemedim ama iyi bir ekleme) ile.
Eserleri düzenleme
Görüntülerin sorunlu kısımlarında düzenlemeler yapmak da DALL·E 2 kullanılarak hızlı ve verimli bir şekilde yapılabilir. Aşağıdaki örnek, yakın zamanda bir inşaat müdürünün güvenlik gözlüklerindeki dikkat dağıtıcı yansımayı değiştirmek zorunda kaldığımız bir talepti.
DALL·E 2, "Güvenlik gözlüklü kadın iPad'e bakıyor" istemini sağlamanın yanı sıra sol üstte gösterilen görüntünün yansıma kısmını düzenlemek için Silgi aracını kullanarak gerisini çerçeveye kadar oluşturdu ve vurgulamayı yaptı. gözlük, gölgeleme ve doğru renk uyumu.
Mevcut bir resme içerik ekleme
Aynı şekilde, bir görüntüye öğeler eklemek, onları kaldırmak kadar kolay olabilir. İşte bir vadiye bakan bir kişinin fotoğrafına bir örnek. En yakın arkadaşları yanlarında olsa güzel olmaz mıydı? Sorun değil, Silgi aracını kullanarak görüntüden köpek boyutundaki bir alanı silin ve uygun bir komut verin; Aşağıdaki örnekte “uzaklığa bakan kadının yanında oturan bir golden retriever” kullanılmıştır.
Görsel olarak benzer görüntüler oluşturma
Belki kompozisyon ve konu açısından gerçekten iyi bir görüntü bulmuşsunuzdur, ancak her ne sebeple olursa olsun tam olarak işe yaramıyor. Bilgi istemi metninde herhangi bir düzenleme veya değişiklik yapmadan, stil ve kompozisyon açısından benzer görüntüler oluşturmak için 'Varyasyonlar oluştur' özelliğini kullanabilirsiniz.
Aşağıdaki örnekte, aydınlatma, gölgeleme, kamera açılarının hepsi birbirine çok benzer ve aynı köpek türü yeniden yaratılmış, ceket giymiş bir kadın tepelere bakıyor ve içinden bir yol geçiyor ama öğelerin hepsi var. değişti; tepeler ve yol yeni, kadın ve köpek farklı.
Mood Panoları Oluşturma
Yaratıcı bir projenin ilk aşamalarında, Mood Board'lar genellikle mevcut ekran görüntüleri, metin ve görüntülerin bir karışımını sağlayarak görsel stili, tonu ve yaratıcı yönü ayarlamak için kullanılır. DALL·E 2'yi karakalem çizimlerinden boyamaya, piksel sanatına ve 3D işlemelere kadar her türlü görsel stil için uyarabileceğiniz gibi, üretken yapay zeka, görsel bir ton veya yön belirlemek için iyi bir başlangıç noktası sağlayabilir.
Marka sunumunu desteklemek
Yeni bir markayı piyasaya sürerken, yeni tasarımların farklı sabit öğeler arasında nasıl görüneceğini taklit etmek veya web sitesi tasarımlarını farklı cihazlarda yerinde görselleştirmek yaygındır. DALL·E 2, müşterinin işiyle bağlantılı benzersiz bir arka plan oluşturmayı destekleyebilir.
Örneğin, eko odaklı bir marka için kır çiçeği tarlasında kartvizit görüntüsü oluşturmak veya ev inşaat sektöründeki bir işletme için arka planda modern bir ev olan bir dizüstü bilgisayarı taklit etmek.
İlham almak
Yaratıcı sunumlar için baskıya hazır veya tamamen tasarlanmış görseller oluşturmaktan hâlâ çok uzağız, ancak DALL·E 2'nin tasarım sürecini desteklemek için yararlı olabileceği bir alan, yaratıcılığın akışını sağlamak için hızlı bir ilham sağlamaktır. .
Örneğin, "bir steampunk Ale için logo tasarımı" istemini kullanarak yeni bir steampunk temalı bira için bir logo oluşturma girişiminde aşağıdakileri oluşturdum. DALL·E 2 metin istemlerini anlamada harika olsa da metin oluşturma, DALL·E 2'nin zorlandığı alanlardan biridir. Üretilen tüm çeşitlemelerde metin ya uygun ya da anlamsızdır. Buna rağmen, üretilen görüntülerde renkler, kompozisyon veya kullanılan unsurlar olsun, bu tür nesillerden ilham alma potansiyeli olduğunu düşünüyorum.
Kaba düzenler üretmek
DALL·E 2'nin destekleyebileceği başka bir alan da, reklamlar ve web sitesi tasarımları için bir fikir veya başlangıç noktası olarak kullanılabilecek kaba yerleşimler ve kompozisyonlar tedarik etmektir. Aşağıdaki web sitesi tasarımı ve broşür reklamı örnekleri, “Sürdürülebilir bir enerji şirketi için bir [web sitesi] [broşür] tasarımı” istemlerine dayanmaktadır.
Makine öğrenimi ve milyarlarca kaynak görüntünün anlaşılmasıyla DALL·E 2, düzen söz konusu olduğunda doğal olarak standart kuralları bir araya getirecektir. Web sitesi tasarımı örneğinde, tüm varyasyonlar için ana gezinme üstte gösterilir, marka logosu genellikle sol üsttedir ve hemen hemen her zaman büyük bir kahraman birimi ve başlığın altında büyük bir başlık ve ardından aşağıdaki metin paragrafları bulunur. Aynı şekilde yeşil de bu varyasyonlarla ortak bir renk temasıydı çünkü doğal olarak 'sürdürülebilirlik' kelimesiyle güçlü bir ilişkisi vardı.
Metin özellikle okunaksız ve mizanpajlardaki görüntülerin çoğu belirsiz, ancak kompozisyon açısından bakıldığında, bence burada DALL·E 2'nin mizanpajlar için ilham ararken destekleyici bir rol üstlenmesi için yeterli potansiyel var.
Çözüm
OpenAI'nin DALL·E 2'si ve şu anda Google'ın Imagen'i (henüz kamu tüketimi için değil) gibi AI tabanlı görüntü oluşturma modellerinde gördüğümüz ilerleme kuşkusuz etkileyici ve dijital pazarlama ve yaratıcı alandaki rollerinin çok daha fazlası olduğunu görüyorum. yaratıcı ve pazarlama temelli rollere yönelik doğrudan bir tehditten ziyade destekleyicidir. Yukarıdaki bazı örneklerde gördüğümüz gibi, özellikle çıktı boyutu ve metin oluşturma konusunda bazı bariz sınırlamalar vardır. Makalede kullanılan fotoğraf temelli görüntülerin çoğunda bile, çoğu insan muhtemelen çoğunun gerçek fotoğraf olmadığını söyleyebilir, ancak zamanla bunu tespit etmek giderek daha zor hale gelecektir.
Hala AI görüntü tabanlı neslin ilk aşamalarındayız, ancak yaratıcı ve pazarlama sektörü için ilham ve fikir üretmekten görüntü kaynağına ve gelişmiş görüntü düzenlemeye kadar birçok faydalı uygulama görüyorum. Bu araçlar için API'lerin kullanıma sunulması ve PhotoShop veya Figma gibi popüler tasarım araçlarıyla entegre edilmesi çok uzun sürmeyecektir. Bu büyüleyici bir alan ve önümüzdeki aylarda ve yıllarda ilerlemesini takip edeceğim.