Geleceğin Ayak Sesleri: DALL-E 2 Nedir?

Geleceğin Ayak Sesleri: DALL-E 2 Nedir?

Güncelleme Tarihi: 6 Aralık 2022

Çoğu bilim kurgu filminde kendine yer bulmayı başaran yapay zeka, bizi bilinç kavramına dair derin sorgulara itti. Bir bilgisayar programı insan gibi düşünebilir mi? Teknoloji alanında yaşanan son gelişmeler bu sorunun cevabına sandığımızdan da yakın olduğumuzu düşündürüyor. Yüksek yaratıcılık kabiliyetine sahip bir görsel oluşturma yapay zekası olan DALL-E 2, insan hayal dünyasının dahi sınırlarını zorlayan görseller üretebiliyor. Peki DALL-E 2 nedir? Gelin yapay zekanın görenleri hayrete düşüren dünyasına dalış yapalım…

Not: Bu yazıda kullanılan tüm görseller DALL-E 2 tarafından üretilmiştir.

DALL-E 2 Nedir?

DALL-E 2 Nedir?

OpenAI tarafından geliştirilen DALL-E 2, bir görsel işleme yapay zekasıdır. Bu programın benzerlerinden ayrılan ve bu denli popüler olmasını sağlayan sebeplerden biri Generative Adversarial Network adlı makine öğrenmesi yöntemini kullanmasıdır. 

Görsel işleme algoritmaları, kullanıcıdan aldığı girdilere göre belirlenmiş kütüphanedeki görsellerden yararlanarak yeni üretimler gerçekleştirir. Bunu bir fotoğrafı tuvalin yanına koyarak resmini çizmeye benzetebilirsiniz. 

Oluşturulan yapay zekalar, çeşitli makine öğrenme tekniklerini kullanarak belirlenen kaynak kütüphanesindeki etiketler ile işaretlenmiş görselleri tarar. Örneğin kullanıcı kırmızı bir şapka giyen kedi görseli oluşturmak istediğinde yapay zeka öncelikle kırmızı şapka ve kedi etiketlerine sahip görselleri inceler. Daha sonrasında şapka giymiş kedi görsellerini de inceleyerek birbirinden ayrı duran iki görseli üçüncü aramasından elde ettiği şablona göre düzenlemeye başlar ve kırmızı bir şapka giymiş kedi görseli üretmeye çalışır. Görsel işleme yapay zekalarının arkasındaki temel mantık bu olsa da kullanılan makine öğrenme yöntemine göre sonuçlar farklı olabilir. 

Generative Adversarial Network (GAN) Nedir?

Türkçeye Çekişmeli Üretici Ağ olarak çevrilebilecek GAN, temelde üretici ve ayırt edici olarak ayrılan iki yapay sinir ağının çekişmesi üzerine dayalı bir makine öğrenmesi yöntemidir. Bu yönteme göre üretici ağ, öncelikle belirlenen kaynak kütüphaneden istenen etikete sahip görselleri araştırır. İstenen görselin teknik detaylarını ve şemasını çıkaran üretici ağ, oluşturduğu matrisler çerçevesinde görsel üretmeye başlar. Bu noktada ise ayırt edici sinir ağı devreye girer. 

Ayırt edici sinir ağı, üretici ağdan gelen görselleri orijinal kütüphanedeki görsellerle karşılaştırarak bir elemeye tabi tutar. Karşılaştırma sonrasında üretici ağa geri bildirim veren ayırt edici ağ, ikinci nesil görsellerin yeni bildirimlere göre üretilmesini bekler. Bu süreç, ayırt edici ağ tarafından onaylanan, mükemmel denecek seviyede benzerlik taşıyan görseller üretilene kadar tekrar edilir. İki yapay sinir ağı arasındaki çekişme, sonuç olarak başarılı görsellerin üretilmesini sağlar.

Apple makine öğrenmesi uzmanları tarafından üretilen GAN’ın gelişmiş bir versiyonu, OpenAI’ın yapay zekasında kullanılıyor. Üretim ve kontrol mekanizmalarını çok daha optimize bir hale getirerek işlem süresini düşürmeyi başaran OpenAI ekibi, GAN sayesinde son kullanıcıya sunulabilecek düzeyde görseller üretebiliyor.

DALL-E 2 Nasıl Çalışır?

Görsel İşleme Algoritmaları Nasıl Çalışır?

DALL-E 2 arka tarafta çalışan karmaşık bir makine öğrenmesi kodunun yanında bir metin okuyucu sistemine de sahiptir. Kullanıcılar yaratmak istedikleri görselle ilgili detayları, anahtar kelimeleri ve püf noktalarını yapay zekaya bildirir. Metni mükemmel derecede okuma kabiliyetine sahip olan yapay zeka, elinden geldiğinin en iyisini yaparak birden fazla seçenek içeren bir görsel kataloğunu kullanıcıya sunar. 

OpenAI’ın oluşturduğu metin okuma sistemi sektördeki en gelişmiş algoritmalardan biri. Paragraf uzunluğundaki çok karmaşık girdileri bile analiz edip istenen sonuçlara ulaşabilen yapay zeka, kullanıcıyı memnun etmek için elinden geleni yapar. 

Programı kullanmak için OpenAI tarafından belirlenmiş yönergeler bulunuyor. Bu yönergelere göre yapay zekaya girdi gönderdiğiniz takdirde aklınızda canlanan görselleri üretmeniz mümkün olacak. 

DALL-E 2 Halka Açık Mı?

DALL-E 2 Halka Açık Mı?

Yapay zeka programı şu an beta test aşamasında. Yalnızca seçilmiş 100 bin kişi yapay zekaya erişebiliyor. Programın tam sürümü yayınlandığında ücretli bir şekilde kullanıcılara sunulması bekleniyor.  

OpenAI, yapay zeka tarafından oluşturulan görselleri ticari kullanımlar için yasaklıyor. Fakat beta sürümüne özel bir şekilde kullanıcılar, oluşturdukları görsellerin tüm haklarına sahip olabiliyor.

DALL-E 2 tam sürümü çıktığında kullanıcılar sınırlı sayıda yeni görsel oluşturmak ve görsel alternatiflerini düzenlemek için krediye sahip olacak. OpenAI uygulamasını kullanmak belli bir kredi sayısına kadar ücretsiz olacak. Fakat daha fazla krediye ihtiyaç duyan kullanıcılar ekstra ödeme yapmak zorunda kalacak. Ayrıca yeni yapay zeka ile oluşturulabilecek görsel sayısı da sınırlandırılmış durumda.

DALL-E 2 Fiyat Tablosu

FiyatKredi Görsel Sayısı
İlk AyBedava50200
İlk Aydan Sonraki Her AyBedava1560
Ekstra Kredi Paketleri15 Dolar115460

DALL-E 2’nin benzer yapay zekalara kıyasla en öne çıkan özelliklerinden biri, farklı tarzlarda görseller üretebilme imkanı sağlıyor olması. Program ile örneğin Picasso’nun öncülüğünü yaptığı kübizm akımına uygun tablolar üretebilirsiniz. Aynı şekilde Leonardo da Vinci’nin sanat anlayışına uygun fakat uçan arabalarla ilgili görseller üretmeniz de mümkün. Bu yanıyla kullanıcısına büyük çeşitlilik sağlayan OpenAI’ın oluşturduğu yapay zeka, en gelişmiş görsel işleme algoritmaları arasında yerini sağlamlaştırıyor. 

Ayrıca algoritmaya örnek bir görsel vererek alternatiflerini üretmesini, verdiğiniz görseldeki ışıklandırmayı değiştirmesini veya istenmeyen objeleri kaldırmasını isteyebilirsiniz. Yani görsel işleme programları ile yapabilecekleriniz yalnızca hayal gücünüzle sınırlı!

DALL-E 2 ile hayal gücünüzün sınırlarını zorlayan görseller üretmeniz mümkün. Ancak yapay zekanın da belirlenmiş bazı sınırları var. Daha önceden internetten veya kullanıcı girdilerinden beslenen yapay zekalar, kötü niyetli kişilerin sistemi suistimal etmesi sonrasında büyük sorunlara sebep olmuştu. Microsoft’un oluşturduğu sohbet botu Tay, Twitter’da kullanıcılarla etkileşime girerken kısa sürede cinsiyetçi ve ırkçı söylemlerde bulunmaya başlamıştı. Yaşanan olaylardan dersler çıkaran OpenAI ekibi, yapay zeka ile oluşturulabilecek görselleri belirli bir filtreden geçirerek sınırlandırdı.

DALL-E 2 Davetiyesi Nasıl Alınır?

DALL-E 2 davetiyesi almak için buraya tıklayarak başvuru yapmanız gerekiyor. Uygulama şu an beta aşamasında olduğu için OpenAI, kreatif içerik üreticileri ve yazılım geliştiricileri yapay zekayı test etmeleri amacıyla beyaz listeye aldı. 100 binden fazla kullanıcı OpenAI’ın geliştirdiği görsel işleme algoritmasını kullanabiliyor. Ekibin yakın zamanda bu sayıyı bir milyon kullanıcıya kadar çıkartması bekleniyor. Bu sebeple bekleme listesinde erkenden yerinizi almanız sizin için faydalı olacaktır.

Uygulamanın bekleme listesinde OpenAI sizden sosyal medya adresleri, Linkedin profili ve mail gibi ekstra bilgiler talep ediyor. Formda yer alan “Sizi en iyi ne tanımlıyor?” sorusunu profesyonel sanatçı, yazılım geliştirici, akademik araştırmacı, gazeteci veya online içerik üreticisi ya da diğer seçeneğini seçerek yanıtlayabilirsiniz.

DALL-E 2 Alternatifleri

DALL-E 2 Alternatifleri

Şu an OpenAI’ın geliştirdikleri yapay zekayı tüm kullanıcılara sunmaması sebebiyle çoğu kişi alternatif görsel işleme yapay zekalarına yöneldi. Bunlar arasında ücretsiz ve ücretli olan hizmetler bulunuyor. İşte DALL-E 2 alternatifi bazı uygulamalar…

MidJourney

DALL-E 2 ile benzer temeller üzerine kurulu olan MidJourney, yazılım uzmanı David Holz önderliğinde Leap Motion firması tarafından oluşturuldu. Yakın zamanda açık beta sürecine geçen uygulama kullanıcıların istediği görselleri üretmesini sağlıyor. MidJourney kullanmak için bir Discord hesabına sahip olmanız gerekiyor. Discord üzerinde açılan MidJourney adlı kanala girdikten sonra “/imagine + istediğiniz görsel hakkında bilgi” komutlarını #newbie alt kanalına girerseniz istediğiniz görselleri üretmeye başlayabilirsiniz. Şu an MidJourney ile 25 ücretsiz görsel üretme hakkınız var. Fakat ilerideki kullanımlarda aylık 20 dolarlık bir ücreti bulunuyor.

DALL-E Mini

Craiyon tarafından oluşturulan DALL-E Mini, kullanıcıların sınırsız bir şekilde görsel üretmesini sağlıyor. Fakat bu uygulama MidJourney ve DALL-E 2’ye kıyasla çok daha düşük çözünürlük ve başarısız görsellere sahip. Görsel işleme yapay zekasına dair merak ettiklerinizi ve garip girdilerinizi öncelikle DALL-E Mini üzerinde denedikten sonra daha profesyonel uygulamalara geçiş yapabilirsiniz. Buraya tıklayarak uygulamaya ulaşabilirsiniz.