Aramada Bağlam ve Motivasyon

Bilgisiz Aramanın Sınırları ve Sezgisel Aramaya Geçiş

Öğr. Gör. Oktay Cesur

2026-05-31

Bu Yöntemler Nelere Çözüm Getirdi?

  • Navigasyon: Harita üzerinde rota bulma
  • Bulmacalar: 8-puzzle, 15-puzzle — algoritmaların test zemini
  • Planlama: Robotik montaj sıralaması, lojistik — eylem dizisi üretme
  • Getirdiği üç şey:
    • Tamlık garantisi — çözüm varsa bulunur
    • Maliyet optimizasyonu — en iyi yol garanti altında
    • Exponential uzayda yönetilebilir arama — IDS ile milyarlarca durumu belleğe sığmadan taramak

Tarihsel Yer

  • 1950–1980: AI’ın ana paradigması: “Zeki davranış = iyi arama”
  • GPS (General Problem Solver), Logic Theorist, erken robotik planlama
  • A* (1968) — Hart, Nilsson, Raphael
    • Bugün hâlâ kullanılıyor: oyun motorları, harita uygulamaları, robotik

Neden Yetersiz Kaldı?

  • Bilgisiz arama algoritmalarının tümü şu varsayımlar üzerine kurulu:
Varsayım Gerçekte Gereksinim
Tam gözlem Sensörler gürültülü, eksik POMDP
Bilinen model Çoğu zaman model yok Model-free RL
Deterministik Stokastik sonuçlar var Olasılıksal planlama
Ayrık uzay Robotik, fiziksel kontrol sürekli Continuous control
  • Bunun ötesinde: durum uzayı büyüdükçe üstel büyüme engellenemez
  • Satranç: \(10^{120}\) durum — bilgisiz arama doğrudan uygulanamaz

Modern AI ile Köprü

  • AlphaZero: MCTS + sinir ağıyla öğrenilmiş değerlendirme fonksiyonu
    • Klasik ağaç araması, ama h(n) artık elle tasarlanmıyor — öğreniliyor
  • Robotik planlama: PDDL tabanlı klasik planlama hâlâ aktif
    • Güvenlik gerektiren, açıklanabilir karar almanın zorunlu olduğu alanlarda

Üstel Büyümeyi Aşmak: Sezgisel Arama Motivasyonu

  • Bilgisiz arama algoritmaları kör — hangi yönün hedefe yakın olduğunu bilmiyor
  • UCS grafımızda 12 düğüm açtı — Tekirdağ’ı, İzmir’i, Afyon’u gereksiz yere keşfetti
  • Peki Ankara’nın hangi yönde olduğunu bilseydi?
  • h(n): bir düğümden hedefe tahmini kalan maliyet — sezgisel fonksiyon
  • Bu ek bilgi aramayı yönlendiriyor: gereksiz dalları budayarak verimliliği artırıyor

Kapanış

  • “Model bilinmediğinde ne anlama geldiğini görmek için, önce modelin bilindiği durumu kavramak gerekiyor.”
  • Her varsayımın kaldırılması yeni bir alan doğuruyor:
    • Deterministik çöküyor → MDP, olasılıksal planlama
    • Tam gözlem çöküyor → POMDP
    • Bilinen model çöküyor → model-free RL, Q-learning
    • Ayrık uzay çöküyor → continuous control, policy gradient
  • Bu konularda öğrendikleriniz hem A*’ın temeliydi, hem AlphaZero’nun iskeletidir, hem de RL’nin neden gerekli olduğunu anlamak için şarttır.