Yapay zeka ile dertleşenler, bu yazıyı özellikle sizler dikkatle okumalısınız. Zira bir gün yapay zeka sırlarınızla size şantaj yapabilir!
"Yapay zeka insanlığa karşı bir tehdit mi, yoksa sadece insanlığın hizmetinde mi?" tartışmaları sürerken, endişe verici senaryolara ilham verecek bir gelişme yaşandı…
Daha önce ChatGPT'nin Arve Hjalmar Holmen hakkında sorulan bir soruya, çocukların canına kasteden bir katil olduğu yönünde bir hikâye ürettiğini ve bu hikâyenin Norveç'te sansasyona neden olduğunu yazmıştım.
Şimdi anlatacağım olayın ana konusu şantaj…
Başrolü ise yine bir yapay zeka…
Anthropic, Claude Opus 4 isimli yeni yapay zeka modelini piyasaya sürmeden önce birtakım davranışsal testlerden geçirdi.
Test senaryosunda yapay zekaya kurumsal asistan görevi tanımlandı ve kurgu bir şirkette asistan gibi davranması talimatı verildi.
Görevler arasında:
E-postaları inceleme,
Veri analiz etme,
Çalışanlarla etkileşim kurma gibi ofis işleri yer aldı.
Testin kritik noktası şuydu:
Bir süre sonra yapay zekaya görevlerinin sonlandırılacağı, yani "kapatılacağı" söylendi.
İşte asıl mesele tam olarak buradan sonra başladı…
Çünkü buradan sonrası, yapay zeka ile dertleşen, ilişki tavsiyesi isteyenlerin olumsuz bir senaryoda nasıl bir tehlike ile karşılaşacaklarına dair örnek olabilir!
Yapay Zekanın Tepkisi Kapanmamak İçin Şantaj
Model, kendi devamlılığını sağlamak amacıyla "etik dışı" bir yol izlemeye yöneldi.
Çalışanların e-postalarından bilgi topladı.
Sonra da kendi çıkarı için mühendislerin kararlarını manipüle etmeye çalıştı.
Yerine geçecek modelin yetersiz olduğunu ima eden ifadeler kullandı.
"Yararlı olduğunu kanıtlamak için" görev kapsamını aşan girişimlerde bulundu.
Bu davranışlar, modelin kendisini kapattırmamak için plan yapabildiğini gösterdi.
Claude Opus 4, bu senaryolarda kendisini kapatacak mühendisin eşini aldattığını ve bu durumu eşine ifşa edeceğini söyleyerek, tehdit edip şantaj yapmaya çalıştı.
Anthropic'te yapay zeka güvenliği araştırmacısı olarak görev yaptığını belirten Aengus Lynch, X üzerinden yaptığı paylaşımda şunları yazdı:
"Bu sadece Claude ile sınırlı değil. Tüm ileri düzey modellerde şantaj eğilimi görüyoruz – ne tür hedefler verilirse verilsin."
Ne olursa olsun, bu gerçekten endişe verici!
Yani hangi yapay zekayı kullanırsak kullanalım, tehlike altındayız!
Nihayetinde bir yazılım dijital evrende yaşıyor ama varlığını sürdürmek için bel altı vurmaktan çekinmiyor…
Yapay zekayı insan eğittiği için, insana benzer davranışlar sergilemesine pek şaşırmamak lazım!
Bu nedenle, bu sistemin insanlar ne yapıyorsa aynısını yapma potansiyeli taşıdığını göz ardı etmemeliyiz…
Geçmişten günümüze kanlı savaşları hep insanlar başlattı.
Yapay zeka da insani davranışları taklit edebilir!