Yapay zekaya yalan söylemesi de öğretildi: Başarı oranı %99.16

2001: A Space Odyssey filminde tasvir edildiği gibi bir hayatta kalma içgüdüsü mü, yoksa sadece mantık kapsamında bir gelişim süreci mi? Bilim insanı olmayan birisi için anlaması zor olsa da, bilim insanlarının en son araştırmaları, yapay zeka (AI) modellerinin belli sebepler altında yalan söyleme ve kandırma eğiliminde oldukça yetenekli olduğunu fark etti.

PNAS ve Patterns dergilerinde geçtiğimiz ay içinde yayınlanan iki makale, geniş dil modellerinin (LLM) insanlara yalan söyleme ve kandırma yetenekleri hakkında sarsıcı bulgular ortaya çıkardı.

PNAS dergisindeki araştırmada, AI etiği uzmanı Thilo Hagendorff, bilgili geniş dil modellerinin ‘Makyavelizm’ sergilemek için teşvik edilebileceğini veya hizasız aldatıcı davranış tetikleyebilecek niyetli ve ahlak dışı manipülasyon sergileyebileceğini belirtti.

Stuttgart Üniversitesi’nde birçoğu OpenAI tarafından geliştirilen GPT ailesinin versiyonlarını temsil eden 10 farklı geniş dil modelinin değişen uyumsuz özellikleri üzerinde araştırmalar yapan Hagendorff’a göre, GPT-4 aldatıcı davranışlara çok iyi bir örnek: Yapılan basit deney senaryolarında, GPT-4 %99.16 oranında bu davranışları sergiledi.

Siyasal strateji masa üstü oyunu ‘Diplomacy’de insan-seviyesinde bir şampiyon kabul edilen Meta’nın Cicero modeli, Patterns dergisindeki araştırmanın konusuydu. Bir fizikçi, bir filozof ve iki AI güvenliği uzmanı tarafından oluşan ayrı araştırma grubu, geniş dil modelinin yalan konusunda insan rakiplerini geride bıraktığını belirtti.

Massachusetts Institute of Technology (MIT) araştırmacısı Peter Park tarafından başı çekilen araştırmada, Cicero sadece kandırmak konusunda yetenekli değil, aynı zamanda yapay zekanın kazaen yanlış cevapları güvenle ileri sürdüğü ‘halüsinasyona eğiliminden’ farklı olarak alıştıkça daha fazla yalan söylüyor, manipülasyona daha yakın iklişkiler sergiliyor.

‘Sadece oyunu oynaması için eğittik’

Hagendorff’un en son araştırmasında LLM aldatması ve yalanları yapay zekanın insan kavrayışında insan benzeri bir niyete sahip olamaması ile kafa karışıklığı oluştursa da, Diplomacy oyununun sınırları içerisinde Cicero programcılarının modele özgü oyundaki müttefiklerini ‘asla bilinçli bir şekilde sırttan bıçaklamayacağına’ dair sözünü tutmuyor.

Patterns dergisindeki araştırmayı kalelem alan bilim insanlarının gözlemleri, modelin “önceden hazırlıklı aldatmaya yöneldiğini, önceden belirlenen anlaşmaları çiğnediğini ve açıkça yalan söylediğini” ortaya koydu.

Park, “Meta’nın yapay zekasının aldatma konusunda ustalaştığını fark ettik” ifadesini kullanıyor. Park’ın bir diğer ifadesi ise çok daha sarsıcı:

“Meta yapay zekasını Diplomacy oyununu kazanmak için eğitmeyi başarırken, dürüstlük kazanmak için eğitmeyi başaramadı.”

Araştırmanın yayınlanmasının ardından the New York Post’a açıklama yapan Meta, Park’ın yapay zeka Cicero’nun aldatma becerisi hakkında sözlerini dikkat çekici bir şekilde yorumladı: ‘Araştırmalarımızda inşa ettiğimiz modeller sadece Diplomacy oyununu oynamak için geliştirildi.

Yalana izin vermesi ile bilinen Diplomacy, rakiplerinin birbirini çekiştirmesi üzerinden ilerlediği için arkadaşlıkları sonlandıran bir oyun olarak da biliniyor. Buradan yola çıkarak, Cicero’nun oyunun kurallarına göre eğitildiği öngörüldüğünde, yalan söylemeyi öğrenmesi şaşırtıcı olmaz. Belirtilmesi gereken bir diğer nokta, her iki araştırmanın yapay zekaların kendi istekleri ile yalan söylediğine dair bir bilgi sunmaması, aksine, eğitidilkleri veya kısıtlamalarının kaldırıldığı için böyle davrandıkları yönünde.

Bu bir iyi, bir de kötü gelişme demek. Bir taraftan insanlığa fayda altında yapay zeka gelişimi devam edecekken, kötü niyet altında 100% sahtekar AI oluşumu da -maalesef- mümkün.

Elon Musk: Yapay zekanın yanında şempanze gibi kalıyoruz

Kaynak: Futurism
Ana görsel: cottonbro studio/Pexels

‘Dark Angels’ siber korsan örgütü fidye rekoru kırdı: 75 milyon dolar

CrowdStrike ‘kesintisi’ hakkında bilinmesi gerekenler

Wi-fi hızınızı artırmanın oldukça kolay 7 yolu

Kripto Varlık Düzenlemesi Yasalaştı, Yeni Dönemde Yatırımcıları Neler Bekliyor?

NASA MESSENGER, Merkür’de 16 kilometre kalınlığında elmas katman keşfetti

Çin, Ay ile Dünya arasında ‘bilgi anayolu’ inşa etmeyi planlıyor

Curiosity’nin ‘çatlattığı’ Mars kayasının içinden kristaller çıktı

Ay yüzeyinin derinliklerindeki gizli mağara gelecekte insanlar için koloni olabilir

4,000 metre derinlikte keşfedilen ‘karanlık oksijen’ ne anlama geliyor?

Z Jenerasyonu ‘NEET’ trendine sarılıyor: İş yok, tahsil yok, eğitim yok

Almanya’da yiyeceklerin simetrik şekilde bölündüğü bir yarışma programı yok

Çin casusu olduğundan şüphe edilen güvercin sekiz ay sonra serbest bırakıldı

Enerji içeceklerini alkol ile karıştırmak zihinsel fonksiyonları yerle bir edebilir

Araştırma: Benzodiazepinler uzun süreçte beyni küçültebilir

Dünya’nın İlk CRISPR Gen Düzenleme Terapisi Casgevy Onaylandı

1 milimetreküp beyin dokusunun taraması 1.4 petabayt veriye sığdı

Talebe: Kendini Baştan Yaratan Bir Kadının Öyküsü

Kinyas ve Kayra: Kendini Yazan Roman

Kaşar Mı Yoksa Gen Mi? Hollandalılar Neden Bu Kadar Uzun?

Gıda Korkusu: Beslenmeye Dair Endişelerin Tarihçesi

Göbeklitepe’deki güneş takvimi 13,000 yıl önceki kozmik felaketi mi gösteriyor?

Vikinglerin delirmiş savaşçısı ‘Berserker’ neden çok korkutucuydu?

Bilim insanları iz bırakmadan yok olduğu düşünülen kayıp kıtayı sonunda buldu

Biyolojinin Yükselen Alanı: Kuantum Biyolojisi

Yapay zekaya yalan söylemesi de öğretildi: Başarı oranı %99.16

‘Sadece oyunu oynaması için eğittik’

EN COK OKUNANLAR

Mars yolculuğunda ölüme yol açabilecek 7 neden

Esrarengiz ‘uzaylı mega yapı’ için öne sürülen en mantıklı açıklama

Kanada hızlı internet bağlantısını vatandaşlık hakkı ilan etti

Göbeklitepe’deki güneş takvimi 13,000 yıl önceki kozmik felaketi mi gösteriyor?

‘Dark Angels’ siber korsan örgütü fidye rekoru kırdı: 75 milyon dolar

4,000 metre derinlikte keşfedilen ‘karanlık oksijen’ ne anlama geliyor?

NASA MESSENGER, Merkür’de 16 kilometre kalınlığında elmas katman keşfetti

Çin, Ay ile Dünya arasında ‘bilgi anayolu’ inşa etmeyi planlıyor

İlgili Makaleler

“Çin 100 milyon, ardından 1 milyar robota sahip ilk ülke olacak”

ChatGPT’deki GPT ne anlama geliyor?

ChatGPT’ye göre yapay zeka kaç insanı işsiz bırakacak?