Bagaimana generasi gambar AI dengan DALL·E 2 dapat digunakan dalam pemasaran digital?
Diterbitkan: 2022-10-17“Wow, apakah kamu mengambilnya? Tunggu sebentar – itu dilakukan oleh fotografer profesional…?”
Itulah reaksi dari Jake, MD kami, ketika saya menunjukkan kepadanya gambar di bawah ini: gambar fotorealistik yang dihasilkan oleh DALL·E 2 OpenAI, dibuat dalam hitungan detik, menggunakan prompt yang saya masukkan untuk “foto makro kupu-kupu di atas bunga matahari” .
Ini adalah foto yang terlihat begitu nyata dan telah menangkap ketajaman dan warna kupu-kupu di latar depan dan fokus lembut bunga matahari di latar belakang. Bahkan, begitu banyak, sehingga Anda akan sulit sekali menemukan banyak orang yang dapat menemukan tanda ekor yang jelas, artefak, atau rasa salah, yang dapat umum dalam citra yang dihasilkan AI.
Saat itulah saya menyadari bahwa kami telah memasuki titik di mana sistem AI canggih dapat memahami dan membuat gambar fotorealistik yang, dalam banyak kasus, tidak dapat dibedakan dari kehidupan nyata. Ini memiliki implikasi yang menarik bagi siapa saja yang bekerja di industri kreatif dan digital, atau memang peran apa pun yang melibatkan sumber gambar atau manipulasi gambar.
Dalam artikel ini, saya mengeksplorasi beberapa aplikasi praktis menggunakan DALL·E 2 OpenAI dalam dunia kreatif dan pemasaran digital dan bagaimana alat pengeditan DALL·E 2 yang baru-baru ini ditingkatkan dapat digunakan untuk mendukung pekerjaan kreatif.
Apa itu DALL·E 2?
DALL·E 2 dari OpenAI adalah generator gambar berbasis AI yang mengambil prompt berbasis teks sederhana dan menghasilkan gambar berdasarkan pemahaman AI tentang prompt itu. Dalam hitungan detik, Anda akan mendapatkan empat variasi gambar yang dihasilkan yang kemudian dapat diunduh, dibagikan, atau disimpan sebagai favorit dalam akun OpenAI Anda.
DALL·E 2 sekarang tersedia untuk semua orang. Anda mendapatkan 15 kredit gratis per bulan, dengan 1 kredit diperlukan per generasi dan setiap 115 kredit seharga $15. Anda dapat membuat gambar dari awal atau mengunggah foto Anda sendiri untuk dimanipulasi asalkan mereka mengikuti Kebijakan Konten DALL·E 2 dan, menurut ketentuan penggunaan, Anda “dapat menggunakan Generations untuk tujuan hukum apa pun, termasuk untuk penggunaan komersial.”
Hal ini membuat atribusi menjadi subjek yang menarik dan berapa banyak kredit yang harus diberikan kepada orang yang memberikan petunjuknya, sumber gambar saat mengedit gambar atau DALL·E 2. Semua gambar yang saya gunakan dalam posting blog ini, misalnya, saya juga dihasilkan dengan DALL·E 2 atau menghasilkan gambar perpustakaan stok yang dimodifikasi tetapi saya akan merasa agak curang jika saya menghubungkan generasi atau modifikasi ini dengan diri saya sendiri.
Gambar dapat dihasilkan berdasarkan:
- Materi pelajaran: Anda dapat menghasilkan gambar apa pun yang Anda inginkan; lanskap, hewan, objek, konsep abstrak asalkan mengikuti kebijakan konten yang misalnya melarang pembuatan gambar orang terkenal untuk menghindari menjamurnya deepfake.
- Medium: dari sketsa pensil dan lukisan cat minyak hingga seni piksel dan ilustrasi digital, DALL·E 2 dapat menghasilkan gambar yang mewakili segala jenis media.
- Pengaturan lingkungan: tambahkan faktor lingkungan yang cepat seperti "matahari terbenam" atau "kabut" untuk memberi sedikit suasana pada gambar Anda.
- Lokasi: jika Anda perlu menempatkan gambar Anda di lokasi tertentu, berikan prompt kota atau negara dan Anda harus mendapatkan landmark, gaya bangunan, dll yang terkait dengan tempat itu.
- Gaya artistik: DALL·E 2 dapat menghasilkan gambar dengan gaya seniman yang berbeda. Cukup tambahkan "dalam gaya [artis]" ke permintaan Anda.
- Pengaturan kamera: sangat berguna untuk gaya fotografi, Anda dapat menambahkan pengaturan kamera ke permintaan Anda untuk memberikan foto berbagai bidikan dan kualitas yang berbeda. Contohnya termasuk "Pemotretan makro 35mm", "pencahayaan lama" atau "lensa mata ikan".
Cukup gunakan bahasa alami untuk menggabungkan salah satu di atas untuk membantu menggambarkan apa yang Anda inginkan seperti "Homer Simpson di kafe Paris bergaya Picasso" dan dalam hitungan detik Anda akan mendapatkan beberapa generasi.
Sangat mudah tersesat di lubang kelinci kemungkinan saat menjelajahi kemampuan DALL·E 2, tetapi ada juga banyak aplikasi praktis dari alat ini terutama dalam desain dan pemasaran yang akan dieksplorasi nanti dalam artikel ini.
Bagaimana cara kerja DALL·E 2?
Saya tidak akan berpura-pura bahwa saya benar-benar mengerti atau bahkan akan mencoba dan menjelaskan dengan tepat bagaimana pembuatan gambar DALL·E 2 AI bekerja – ada banyak artikel yang melakukan hal ini. Tapi apa yang bisa saya katakan adalah bahwa ini lebih dari sekadar algoritma cerdas yang menggunakan serangkaian logika yang kompleks. Ini pembelajaran mesin. Kecerdasan buatan yang telah dilatih, dari waktu ke waktu, dari miliaran gambar sumber dan bahasa alami serta hubungan antara keduanya.
Pada intinya adalah model difusi yang dimulai dengan derau acak dan yang disempurnakan secara berulang selama beberapa siklus hingga sesuatu yang menyerupai pemahaman AI tentang prompt yang diminta muncul.
Alat DALL·E 2 itu sendiri mudah digunakan. Setelah masuk, Anda akan disambut dengan bidang input sederhana di mana Anda dapat mulai menghasilkan gambar berdasarkan prompt teks atau Anda dapat mengunggah gambar Anda sendiri untuk diedit.
Sejumlah alat pengeditan gambar tersedia untuk gambar yang dihasilkan dan diunggah yang akan kita jelajahi nanti di artikel ini.
Menggunakan DALL·E 2 untuk sumber gambar
Salah satu penggunaan paling jelas dari pembuatan gambar berbasis AI adalah sumber foto atau gaya gambar lain untuk digunakan untuk posting blog, presentasi, situs web, iklan, dan berbagai media lainnya. Pustaka foto stok seperti ShutterStock, iStockPhotos atau Unsplash sering kali menjadi pilihan populer dalam hal sumber gambar, tetapi kita mungkin akan melihat orang semakin beralih ke DALL·E 2 untuk alternatif yang lebih cepat dan berbiaya lebih rendah, serta pembuatan citra yang benar-benar unik dan tidak ada di tempat lain secara online.
DALL·E 2 dapat sangat berguna saat mencari gambar yang memiliki subjek yang sangat spesifik seperti “Golden Retriever duduk di pantai memandang ke arah matahari terbenam” atau “Foto rubah melompat melalui lonceng biru di hutan dengan matahari bersinar melalui pepohonan”. Sumber gambar serupa dari berbagai perpustakaan foto stok kemungkinan akan memakan waktu lebih lama, dan dalam banyak kasus materi pelajaran tidak mungkin ada.
Apa yang menurut saya sangat mencengangkan dengan gaya fotografi generasi gambar adalah bahwa DALL·E 2 dapat secara akurat mereplikasi semua jenis pengaturan lingkungan. Dari silau sinar matahari dan bayangan akurat hingga ketajaman objek dekat dan pengaburan bertahap elemen yang lebih jauh. Anda juga dapat menyertakan petunjuk untuk berbagai pengaturan berbasis kamera seperti 'Macro 35mm', 'Fisheye' atau 'Lens Flare'.
Saat menghasilkan gambar berkualitas fotografi, saya telah mengamati generasi yang lebih realistis dari subjek yang lebih umum. Ada lebih banyak foto anjing di pantai misalnya daripada ada rubah yang melompat di lonceng biru, jadi lebih banyak konten untuk AI untuk menarik referensi.
Salah satu batasan utama yang perlu diperhatikan adalah bahwa semua gambar yang dihasilkan dibatasi hingga 1024 x 1024 piksel, jadi kami tidak akan membuat foto untuk papan iklan dalam waktu dekat…
Memperluas dimensi gambar
Salah satu kegunaan yang lebih umum yang saya lihat untuk DALL·E 2 di dunia kreatif dan pemasaran adalah peningkatan dan pengeditan gambar yang ada, daripada pembuatan gambar baru yang lengkap. Sebagai pengembang web, saya biasanya menemukan tantangan di mana gambar yang bagus dan layak ditemukan tetapi rasio dan dimensi menyebabkan hasil panen yang buruk saat gambar diunggah karena wadah gambar memiliki rasio yang berbeda dengan gambar.
Berikut adalah contoh. Gambar stok yang indah dari seekor anjing yang mencondongkan tubuh ke luar jendela mobil yang diperuntukkan untuk digunakan pada unit pahlawan unggulan, tetapi rasio lanskap standar dari foto sumber tidak cocok dengan rasio 21:9 super lebar dari pahlawan unggulan spanduk.
Dengan mengunggah gambar ke DALL·E 2 dan menggunakan alat 'Generation Frame', kita dapat memperluas gambar dengan membiarkan AI mengisi celah. Saat menggunakan Frame Generasi, Anda akan selalu ingin mempertahankan bagian dari gambar asli di dalam bingkai untuk memberi AI lebih banyak informasi untuk bekerja.
Teks prompt juga penting di sini dan biasanya Anda ingin menjelaskan apa yang Anda inginkan dalam bingkai generasi daripada keseluruhan gambar. Untuk prompt ini, saya hanya menggunakan "bukit dan langit" dan biarkan DALL·E 2 melakukan sisanya.
Untuk setiap generasi, DALL·E 2 akan memberi Anda empat variasi untuk Anda pilih. Gambar di atas menurut saya adalah yang paling bisa dipercaya; dengan perpanjangan jalan yang baik, beberapa pohon yang dihasilkan, beberapa awan yang menarik tanpa overlay yang dramatis dan sungai (yang tidak saya minta tetapi tambahan yang bagus) mengalir di belakang pepohonan.
Mengedit artefak
Mengedit bagian gambar yang bermasalah juga dapat dilakukan dengan cepat dan efisien menggunakan DALL·E 2. Contoh di bawah ini adalah permintaan baru-baru ini yang kami harus mengganti pantulan yang mengganggu di kacamata pengaman manajer konstruksi.
Menggunakan alat Eraser untuk mengedit bagian refleksi dari gambar yang ditampilkan di kiri atas, bersama dengan memberikan prompt "Wanita dengan kacamata pengaman melihat iPad", DALL·E 2 menghasilkan sisanya, sampai ke tepi dan sorot kacamata, shading dan pencocokan warna yang akurat.
Menambahkan konten ke gambar yang ada
Demikian juga menambahkan elemen ke gambar bisa semudah menghapusnya. Berikut adalah contoh foto seseorang yang melihat ke seberang lembah. Bukankah lebih baik jika sahabat mereka ada di samping mereka? Tidak masalah, cukup hapus spasi seukuran anjing dari gambar menggunakan alat Eraser dan berikan perintah yang sesuai; “Seekor anjing golden retriever duduk di sebelah wanita yang memandang ke kejauhan” digunakan dalam contoh di bawah ini
Menghasilkan gambar yang mirip secara visual
Mungkin Anda telah menemukan gambar yang sangat bagus dalam hal komposisi dan materi pelajaran, tetapi untuk alasan apa pun itu tidak cukup berhasil. Tanpa mengedit sama sekali atau mengubah teks prompt, Anda dapat menggunakan fitur 'Hasilkan variasi' untuk membuat gambar yang serupa secara gaya dan komposisi.
Pada contoh di bawah ini, pencahayaan, bayangan, sudut kamera semuanya sangat mirip dan jenis anjing yang sama dibangkitkan kembali, bersama dengan seorang wanita mengenakan jaket yang memandang ke perbukitan dengan jalan berkelok-kelok melaluinya tetapi elemen-elemennya memiliki semua berubah; bukit dan jalan baru dan wanita dan anjing keduanya berbeda.
Membuat Papan Suasana Hati
Selama tahap awal proyek kreatif, Mood Boards sering digunakan untuk mengatur gaya visual, nada, dan arah kreatif dengan menggabungkan tangkapan layar, teks, dan citra yang ada. Karena Anda dapat meminta DALL·E 2 untuk segala jenis gaya visual mulai dari gambar pensil dan cat hingga seni piksel dan render 3D, AI generatif dapat memberikan titik awal yang baik untuk menetapkan nada atau arah visual.
Mendukung peluncuran merek
Saat meluncurkan merek baru, merupakan hal yang umum untuk mengejek bagaimana desain baru akan terlihat di berbagai item stasioner yang berbeda, atau memvisualisasikan desain situs web secara in situ pada perangkat yang berbeda. DALL·E 2 mungkin dapat mendukung pembuatan latar belakang unik yang terkait dengan bisnis klien.
Misalnya, membuat gambar kartu nama di bidang bunga liar untuk merek yang berorientasi lingkungan, atau mengolok-olok laptop dengan latar belakang rumah modern untuk bisnis di sektor pembangunan rumah.
Mendapatkan inspirasi
Saya pikir kita masih jauh dari menghasilkan visual siap cetak atau sepenuhnya dirancang untuk peluncuran kreatif, tetapi satu area di mana DALL·E 2 dapat berguna untuk mendukung proses desain adalah memberikan beberapa inspirasi cepat untuk membuat jus kreatif mengalir .
Sebagai contoh, saya membuat di bawah ini dalam upaya untuk menghasilkan logo untuk bir bertema steampunk baru menggunakan prompt "desain logo untuk bir steampunk". Meskipun DALL·E 2 hebat dalam memahami perintah teks, pembuatan teks adalah salah satu area di mana DALL·E 2 kesulitan. Dalam semua variasi yang dihasilkan, teks memenuhi syarat atau tidak masuk akal. Meski begitu, menurut saya masih ada potensi inspirasi yang bisa diambil dari generasi seperti ini baik itu warna, komposisi atau elemen yang digunakan dalam gambar yang dihasilkan.
Memproduksi tata letak kasar
Area lain di mana DALL·E 2 mungkin dapat mendukung adalah dengan mencari tata letak dan komposisi kasar yang dapat digunakan sebagai ide atau titik awal untuk hal-hal seperti iklan dan desain situs web. Contoh di bawah ini untuk desain situs web dan iklan brosur didasarkan pada permintaan “Desain [situs web] [brosur] untuk perusahaan energi berkelanjutan”
Dengan pembelajaran mesin dan pemahaman miliaran gambar sumber, DALL·E 2 secara alami akan menggabungkan konvensi standar dalam hal tata letak. Dengan contoh desain situs web, navigasi utama ditampilkan di bagian atas untuk semua variasi, logo merek biasanya di kiri atas dan hampir selalu ada unit pahlawan besar dan judul besar di bawah header diikuti oleh paragraf teks di bawah. Demikian juga hijau adalah tema warna umum dengan variasi ini karena secara alami memiliki asosiasi yang kuat dengan kata 'keberlanjutan'.
Teksnya sangat tidak terbaca dan banyak citra dalam tata letak tidak jelas, tetapi dari sudut pandang komposisi, saya pikir ada cukup potensi di sini bagi DALL·E 2 untuk mengambil peran pendukung ketika mencari inspirasi untuk tata letak.
Kesimpulan
DALL·E 2 dari OpenAI dan kemajuan yang sekarang kita lihat dengan model pembuatan gambar berbasis AI seperti Google Imagen (belum untuk konsumsi publik) tidak diragukan lagi sangat mengesankan, dan saya melihat peran mereka dalam pemasaran digital dan ruang kreatif jauh lebih penting. yang mendukung daripada ancaman langsung terhadap peran kreatif dan berbasis pemasaran. Seperti yang telah kita lihat dengan beberapa contoh di atas, ada beberapa batasan yang jelas terutama seputar ukuran keluaran dan pembuatan teks. Bahkan dengan sebagian besar gambar berbasis fotografi yang digunakan dalam artikel, kebanyakan orang mungkin dapat mengetahui bahwa sebagian besar bukan foto asli, tetapi ini akan menjadi semakin sulit dikenali seiring waktu.
Kami masih dalam tahap awal generasi berbasis gambar AI, tetapi saya melihat banyak aplikasi berguna untuk sektor kreatif dan pemasaran mulai dari menghasilkan inspirasi dan ide, hingga sumber gambar dan pengeditan gambar tingkat lanjut. Tidak akan lama sebelum API untuk alat ini tersedia dan disematkan dengan alat desain populer seperti PhotoShop atau Figma. Ini adalah bidang yang menarik, dan saya akan mengikuti perkembangannya selama beberapa bulan dan tahun mendatang.