DeepMindın Yapay Zekâ Araştırmacıları, Oyuncuların Zaafları Üzerine Çalışıyor
Gerçek hayattaki problemlerin çözümüne yönelik olarak geliştirmek istenen algoritmalar söz konusu olduğunda, bilgisayar oyunları gerçek hayata uyarlanıp algoritmaların geliştirilmesinde bilim insanlarına elverişli bir zemin sağlayabilir. Bunun sayesinde, yapay genel zekâ (AGI) için zemin hazırlanmış olabilir. AGI, yalnızca veri girişi gibi sıradan ve tekrarlanan görevleri değil, kendi çevresi hakkında da akıl yürütebilen bir karar verici yapay zekâ sistemine işaret ediyor.
Gerçek hayattaki problemlerin çözümüne yönelik olarak geliştirmek istenen algoritmalar söz konusu olduğunda, bilgisayar oyunları gerçek hayata uyarlanıp algoritmaların geliştirilmesinde bilim insanlarına elverişli bir zemin sağlayabilir. Bunun sayesinde, yapay genel zekâ (AGI) için zemin hazırlanmış olabilir. AGI, yalnızca veri girişi gibi sıradan ve tekrarlanan görevleri değil, kendi çevresi hakkında da akıl yürütebilen bir karar verici yapay zekâ sistemine işaret ediyor.
Google'ın ana şirketi Alphabet bünyesindeki yapay zekâ şirketi DeepMind'daki araştırmacılar tarafından yayınlanan yeni bir makaleye göre bazı oyunlardaki oyuncuların hamlelerine yönelik en iyi karşılıkları öğrenen bir sistem oluşturuldu. Satranç ve Go'nun da içinde yer aldığı oyunlarda, bu yapının 'en kötü durumdaki rakiplerde' tutarlı bir şekilde yüksek performans gösterdiği belirtiliyor. 'En kötü durumdaki rakipler', iyi olmayan ancak oyunu kuralına göre oynayıp bitiren oyuncular için kullanılan bir terim.
Oyunculara karşı gösterilen performansın seviyesi, projede 'zafiyet' olarak adlandırılıyor. Bu zafiyeti hesaplamak, oyuncunun yapabileceği hareketlerin toplamı çok büyük olduğundan ötürü hayli yoğun bir işlem gerektiriyor. Örneğin Texas Hold'em isimli oyunun bir versiyonu olan Heads-Up Limit Texas Hold’em oyununda 10 üzeri 14 karar noktası varken Go'da bu sayı 10 üzeri 170'e çıkıyor. Bu işlemlerden kaçınmanın bir yolu, güçlendirilmiş öğrenme adı verilen bir yöntemi kullanmak. Bu yöntemle verilebilecek en iyi karşılık hesaplanabiliyor.
DeepMind araştırmacılarının önerdiği yapı, Yaklaşık En İyi Karşılık Bilgi Durum Monte Carlo Ağaç Araştırması (ABR IS-MCTS) adını almış. Bu yapı, bilgi/durum temelinde en iyi karşılığa yakınsıyor. Yapı içerisindeki aktörler, bir oyunu oynamak için bir algoritmayı takip ederlerken öğreniciyse bir hareket tarzı geliştirmek için çeşitli oyunların sonuçlarından yola çıkıyor. ABR IS-MCTS sezgisel olarak doğru ve istismar edebilir bir karşı strateji yaratabilmeyi öğrenmeyi deniyor. Zaafları arayan sistem, rakibin stratejisine sınırsız bir erişim sağlıyor ve birinin yıllar boyunca rakibinin zaaflarını kullanması için eğitilmesi durumunda ne olacağını simüle ediyor.
Araştırmacıların verilerine göre, 200 oyunculu (4 işlemcili ve 8 GB RAM'li bir bilgisayarda eğitildiler) ve bir öğrenicili (10 işlemcili ve 20 GB RAM'li bir bilgisayarda eğitildi) deneylerde, ABR IS-MCTS her oyunda %50'nin üzerinde bir kazanma oranı yakaladı. Buna ek olarak Hex veya Go dışındaki oyunlarda (Connect Four ve Breakthrough gibi) bu oran %70'in üzerine çıkarken 1 milyon bölüm için eğitildikten sonra tavlada %80 başarı sağladı.
İLGİLİ HABER Googledan Cinsiyetlere Göre Çeviri Yapacak Yapay Zekâ
Bununla birlikte ABR IS-MCTS'nin bazı örneklerde hayli yavaş olduğu kaydediliyor. Örneğin iki oyunculu pokerin basitleştirilmiş bir versiyonu olan Kuhn Poker'de belirli bir tür stratejinin zafiyetini hesaplamak ortalama 150 saniye sürdü. Gelecekteki araştırmalarda, daha karmaşık oyunlar için stratejiler geliştirmesi hedefleniyor.
Kaynak webtekno.com
Ülkemizin Tarihi Yapılarını Bir Bilim Kurgu Evrenine Gönderseydik Nasıl Görünürlerdi? Yapay Zekâ Yanıtladı...
Yüzlerce yılı geride bırakarak günümüze kadar ulaşan ve muhtemelen hepimizden çok daha uzun süre ayakta duracak olan tarihi yapılarımızın uzak gelecekte nasıl görüneceğini hiç merak ettiniz mi?
Twitterın Eski CEOsu Jack Dorsey, Twitterın Son Durumu Hakkında Fikirlerini Paylaştı
Geçtiğimiz gün Twitter, Elon Musk’ın onaylı kullanıcılara 6.000, onaylanmamış kullanıcılara 600 tweet görüntüleme sınırı getirmesiyle çalkalanmıştı. Sitede belirtilen sayıda gönderi gören insanlara ‘Limiti aştınız’ minvalinde bir uyarı verilmesiyle birlikte insanlar çileden çıkmıştı.
iPhone 15in Lansmanında Sahneye Çıkan Türk, Deniz Teoman Kimdir?
Apple, yılın en çok beklenen akıllı telefonu iPhone 15 serisini tanıttı. Her sene olduğu gibi kamerası, performansı gibi konularla çok konuşulan iPhone 15'in tanıtımında geçen senelerde de gördüğümüz bir Türk isim de yer aldı.
Bugüne Kadarki En Yaşlı Galaksi Keşfedildi: Neredeyse Büyük Patlamayla Yaşıt!
Sonsuz evrenin yalnızca gözlemleyebildiğimiz kısmı bile bize her gün yeni sürprizler sunuyor. ‘Yalnızca gözlemleyebildiğimiz’ dediğimiz, çapı yaklaşık 93 milyar ışık yılı olan bu alanda bilim insanları, bu kez içinde bulunduğumuz Samanyolu Galaksisi’ne en uzak galaksiyi keşfetmeyi başardı. Galaksi hakkında edinilen ilk bilgilerse oldukça ilgi çekiciydi.
Android 13ün İlk Önizleme Sürümü Yayınlandı: İşte İlk Ekran Görüntüleri ve Yepyeni Özellikler
Geçtiğimiz aylarda en çok kullanıcısı bulunan işletim sistemi olan Android'in yeni sürümü hakkında birkaç detaylar gelmişti. Kısaca bu gelecek olan sürümden bahsedecek olursak; LG'nin Güney Kore kolu, Android 12 ve Android 13 güncellemesi alacak cihazlar için resmi bir açıklama yapmıştı.