Aramada Bağlam ve Motivasyon
Bilgisiz Aramanın Sınırları ve Sezgisel Aramaya Geçiş
Öğr. Gör. Oktay Cesur
2026-05-31
Bu Yöntemler Nelere Çözüm Getirdi?
Navigasyon:
Harita üzerinde rota bulma
Bulmacalar:
8-puzzle, 15-puzzle — algoritmaların test zemini
Planlama:
Robotik montaj sıralaması, lojistik — eylem dizisi üretme
Getirdiği üç şey:
Tamlık garantisi — çözüm varsa bulunur
Maliyet optimizasyonu — en iyi yol garanti altında
Exponential uzayda yönetilebilir arama — IDS ile milyarlarca durumu belleğe sığmadan taramak
Tarihsel Yer
1950–1980:
AI’ın ana paradigması: “Zeki davranış = iyi arama”
GPS (General Problem Solver), Logic Theorist, erken robotik planlama
A* (1968)
— Hart, Nilsson, Raphael
Bugün hâlâ kullanılıyor: oyun motorları, harita uygulamaları, robotik
Neden Yetersiz Kaldı?
Bilgisiz arama algoritmalarının tümü şu varsayımlar üzerine kurulu:
Varsayım
Gerçekte
Gereksinim
Tam gözlem
Sensörler gürültülü, eksik
POMDP
Bilinen model
Çoğu zaman model yok
Model-free RL
Deterministik
Stokastik sonuçlar var
Olasılıksal planlama
Ayrık uzay
Robotik, fiziksel kontrol sürekli
Continuous control
Bunun ötesinde: durum uzayı büyüdükçe üstel büyüme engellenemez
Satranç:
\(10^{120}\)
durum — bilgisiz arama doğrudan uygulanamaz
Modern AI ile Köprü
AlphaZero:
MCTS + sinir ağıyla öğrenilmiş değerlendirme fonksiyonu
Klasik ağaç araması, ama h(n) artık elle tasarlanmıyor —
öğreniliyor
Robotik planlama:
PDDL tabanlı klasik planlama hâlâ aktif
Güvenlik gerektiren, açıklanabilir karar almanın zorunlu olduğu alanlarda
Üstel Büyümeyi Aşmak: Sezgisel Arama Motivasyonu
Bilgisiz arama algoritmaları
kör
— hangi yönün hedefe yakın olduğunu bilmiyor
UCS grafımızda 12 düğüm açtı — Tekirdağ’ı, İzmir’i, Afyon’u gereksiz yere keşfetti
Peki Ankara’nın
hangi yönde
olduğunu bilseydi?
h(n): bir düğümden hedefe tahmini kalan maliyet —
sezgisel fonksiyon
Bu ek bilgi aramayı yönlendiriyor: gereksiz dalları budayarak verimliliği artırıyor
Kapanış
“Model bilinmediğinde ne anlama geldiğini görmek için, önce modelin bilindiği durumu kavramak gerekiyor.”
Her varsayımın kaldırılması yeni bir alan doğuruyor:
Deterministik çöküyor → MDP, olasılıksal planlama
Tam gözlem çöküyor → POMDP
Bilinen model çöküyor → model-free RL, Q-learning
Ayrık uzay çöküyor → continuous control, policy gradient
Bu konularda öğrendikleriniz hem A*’ın temeliydi, hem AlphaZero’nun iskeletidir, hem de RL’nin neden gerekli olduğunu anlamak için şarttır.