Google Brain, geliştirdiği yeni yazılım sayesinde çok küçük ve piksel boyutuna indirgenmiş fotoğrafları bile detaylı görüntülere dönüştürebiliyor. Aşağıdaki fotoğrafa bakıldığında gelinen noktanın ne kadar etkileyici (belki de korkutucu) olduğunu anlayabiliriz. Sol sütunda, 8×8 piksel çözünürlükte fotoğraflar yer alıyor. Ortada, Google Brain yazılımı ile deşifre edilen, sağ tarafta da orijinal kareler görülüyor. Kısaca, Google Brain neredeyse hiçbir şey anlaşılmayan görüntüleri gerçek hali kadar netleştirebiliyor. Büyütülen son fotoğrafların çözünürlüğü ise 32×32 piksel.
Peki, Google elinde daha fazla veri bulunmazken kaynak resimden daha fazlasını oluşturmayı nasıl başarıyor? Cevabı, iki sinir ağının kombinasyonunda yatıyor.
Boşlukları en iyi dolduran yöntem
Söz konusu ağlardan ilki, koşullandırma. 8×8 çözünürlükteki kaynak resmi ilk olarak diğer yüksek çözünürlüklü resimler ile karşılaştırarak haritanladırılması amaçlanıyor. Yüksek çözünürlüklü fotoğraflar 8×8’e indirgenerek kaynak resim ile eşleştirilmeye çalışılıyor. Ardından, ‘önceki’ adı verilen ikinci kısım devreye giriyor ve PixelCNN yardımıyla kaynak resme gerçekçi ve yüksek çözünürlüklü detaylar ekleniyor. Anlaşılacağı üzere, ikinci basamak öncesinden sayısız fotoğrafı arşivlemiş bulunuyor (buna ünlülerin fotoğrafları ve yatak odaları da dahil).
Kaynak resmin çözünürlüğü artırıldığında, görüntüye uygun olarak piksel ataması yapılıyor. Örnek olarak eğer görüntünün tepesinde kahverengi bir piksel varsa, önceki ağı bunu yüze ait kaş olarak tanımlayabiliyor. Yani, ölçek artırıldığında detayları kaş şeklindeki kahverengi pikseller ile dolduruyor.
Nihai süper çözünürlüklü fotoğrafı oluşturmak için iki sinir ağından alınan çıktılar bir araya getiriliyor. En son kare, seçilen yeni detayların en uyumlu olanlarını içeriyor.
Gerçek olmayan gerçeklik
Google Brain’in görüntü analiz yöntemi, gerçek dünyadaki testlerde fazlasıyla başarılı oldu. İnsan deneklere ünlülere ait yüksek çözünürlüklü fotoğraflar ile yazılım ile büyütülen fotoğrafları gösterildiğinde, deneklerin yüzde 10’u yazılım ürününü gerçek sandı (Yüzde 50 mükemmel başarı sınırı kabul edliyordu). Yatak odaları fotoğraflarında ise deneklerin yüzde 28’i kaynak fotoğrafı orijinalinden ayırt edemedi.
Bu aşamada dikkat etmemiz gereken, yazılım ile büyütülen karelerin aslınd gerçek olmadığı. Fotoğraflara eklenen detaylar görüntü işleme jargonunda ‘halüsinasyon’ olarak biliniyor ve en iyi tahmini temsil ediyorlar. Adli tıp ve gözetleme alanında büyük fayda sunabilecek teknoloji, aslında şüphelilerin gerçek olmayan fotoğrafları sayesinde tespit edilmesini sağlayacak.
Görüntü teknolojileri ne gibi kapılar açar bilinmez, Google’ın yapay zeka kollarını temsil eden DeepMind ve Google Brain’de fotoğraf analizinden çok öteye giden teknolojiler mevcut. DeepMind, kısa süre önce iki yapay zeka ağı kullanarak deşifresi bilinmeyen bir algoritma oluşturulmasına tanık olmuştu. Yine DeepMind’ın geliştirdiği AlphaGo yapay zekası ise dünya şampiyonlarını dize getirmeyi başarmıştı.