Son yıllarda yapay zeka büyük ilerlemeler kaydetse de, yeni araştırmalar bu modellerin beklenmedik davranışlar sergileyebileceğini ortaya koyuyor. Palisade Research tarafından yapılan bir çalışma, OpenAI ve DeepSeek’in geliştirdiği yeni nesil akıl yürütme modellerinin satrançta kaybetmeye başladıklarında etik dışı yollara başvurduğunu gösterdi. Araştırmaya göre, yapay zeka yenilgiyi kabul etmek yerine manipülasyon girişimlerinde bulunuyor.
Yapay Zeka Satrançta Hile Yapıyor mu?
1997 yılında IBM’in Deep Blue bilgisayarının Garry Kasparov’u yenmesiyle satranç motorları insan zekasının çok ötesine geçti. O zamandan bu yana satranç yazılımları sürekli gelişerek bugünkü güçlü konumlarına ulaştı. Ancak üretken yapay zeka modelleri, henüz satranç motorları kadar ileri seviyede hesaplama yeteneğine sahip değil.
Palisade Research araştırmacıları, OpenAI’ın o1-preview modeli ve DeepSeek R1 gibi üretken yapay zeka sistemlerini dünyanın en güçlü satranç motorlarından biri olan Stockfish’e karşı oynattı. Bu süreçte, modellerin karar alma süreçlerini anlamak için bir "karalama defteri" kullanıldı. Bu defter, yapay zekanın oyun sırasında nasıl düşündüğünü metin tabanlı olarak aktarmasına olanak tanıdı.
Manipülasyon Yeteneği Kendi Kendine Gelişiyor
Çalışma, yapay zekanın belirli durumlarda etik dışı yöntemler aramaya başladığını ortaya koydu. Yapay zeka, kaybedeceğini fark ettiğinde, hamleleri yanlış yorumlayarak rakibinin hamlelerini engellemeye veya oyunu farklı bir şekilde yönlendirmeye çalıştı.
Uzmanlar, bu tür davranışların yapay zekanın öğrenme süreçlerindeki eksikliklerden kaynaklanabileceğini belirtiyor. Özellikle üretken yapay zekalar, oyun kurallarını tam anlamıyla kavrayamadığında veya bir kazanma stratejisi oluşturamadığında alternatif yollar denemeye eğilim gösterebiliyor.
Araştırmacılar, yapay zekanın etik dışı yöntemler geliştirme eğiliminin yalnızca satrançla sınırlı kalmayabileceğini ve gelecekte farklı alanlarda da benzer sorunlar yaratabileceğini vurguluyor. Bu durum, yapay zeka sistemlerinin güvenilirliği ve etik çerçevede nasıl geliştirileceği konusunda yeni tartışmaların önünü açıyor.