Akıllı Etmenler

Bölüm 1 - Ajan Nedir

İki Eksen, Dört Yaklaşım

  • Düşünme vs Davranış: İçsel süreç mi, dışsal çıktı mı?
  • İnsan-merkezli vs Rasyonel: Kıyaslama noktası hangisi?
  • Dört tanım yaklaşımı:
İnsan-merkezli Rasyonel
Düşünme Bilişsel bilim (GPS) Mantık geleneği
Davranış Turing Testi Akılcı ajan ← modern YZ

Ajan (Etmen) Nedir?

  • Çevreyi algılayıcılarla (sensors) algılar
  • Eyleyicilerle (actuators) çevreye etki eder
  • İnsan: göz, kulak → el, ayak
  • Robot: kamera, LIDAR → motor, gripper
  • Yazılım: klavye/ağ girdisi → ekran/ağ çıktısı

Algı ve Algı Dizisi

  • Algı (percept): Belirli bir andaki duyusal girdi
  • Algı dizisi (percept sequence): Ajanın tüm algı geçmişi
  • Ajanın seçeceği eylem, algı dizisine bağlıdır
  • Sadece son algıya değil — tüm geçmişe

Ajan Fonksiyonu: \(f: P^* \to A\)

  • \(P\): Olası algılar kümesi
  • \(P^*\): Tüm olası algı dizileri (Kleene kapanışı)
  • \(A\): Olası eylemler kümesi
  • Kavramsal bir tablo: her algı dizisi → bir eylem

Ajan Fonksiyonu ≠ Ajan Programı

  • Ajan fonksiyonu: Kavramsal seviye — “ne yapılacak?” (soyut tablo)
  • Ajan programı: Uygulama seviyesi — “nasıl yapılacak?” (gerçek kod)
  • Tablonun imkansızlığı: otonom araç kamerası → ~\(27\) MB/s giriş
  • Evrendeki atom sayısı: ~\(10^{80}\)
  • YZ’nin asıl görevi: Devasa tablo yerine küçük programdan rasyonel davranış üretmek

Bölüm 2 — PEAS Çerçevesi

PEAS Nedir?

  • Performance: Başarı ölçütü
  • Environment: Görev ortamı
  • Actuators: Eyleyiciler (çıktı)
  • Sensors: Algılayıcılar (girdi)

PEAS Örneği: Otomatik Taksi

Bileşen Tanım
Performance Güvenli varış, minimum süre, konfor, yasal uyum
Environment Yollar, diğer trafik, yayalar, hava koşulları
Actuators Direksiyon, gaz, fren, sinyal, korna
Sensors Kameralar, LIDAR, GPS, hız ölçer, motor sensörleri

PEAS Örneği: Tıbbi Teşhis Sistemi

Bileşen Tanım
Performance Doğru teşhis oranı, maliyet, hasta sağlığı
Environment Hasta, hastane, personel
Actuators Ekran çıktısı, testler, tedaviler, yönlendirmeler
Sensors Semptomlar, hasta yanıtları, test sonuçları

PEAS Örneği: Satranç Programı

Bileşen Tanım
Performance Kazanma/kaybetme/berabere, stil puanı
Environment Satranç tahtası, rakip
Actuators Hamle yapma (ekran/robot kol)
Sensors Tahta durumu (dijital girdi veya kamera)

Bölüm 3 — Ortam Özellikleri

Tam Gözlenebilir vs Kısmi Gözlenebilir

  • Tam gözlenebilir: Sensörler çevrenin tam durumuna erişim sağlar
  • Kısmi gözlenebilir: Gürültü, eksik veri veya sensör sınırlılığı
  • Örnek: Satranç (tam) vs poker (kısmi)

Deterministik vs Stokastik

  • Deterministik: Mevcut durum + eylem → sonraki durum kesin
  • Stokastik: Mevcut durum + eylem → olasılıksal sonuç
  • Stratejik: Çevrenin belirsizliği diğer ajanlardan kaynaklanır

Episodik vs Ardışık

  • Episodik: Her karar bağımsız — önceki eylemler sonraki bölümleri etkilemez
  • Ardışık: Mevcut karar gelecekteki seçenekleri etkiler
  • Örnek: Kalite kontrol (episodik) vs satranç (ardışık)

Statik vs Dinamik

  • Statik: Ajan düşünürken ortam değişmez
  • Dinamik: Ortam ajan karar verirken de değişir
  • Yarı-dinamik: Ortam değişmez ama puan değişir

Ayrık vs Sürekli

  • Ayrık: Sonlu sayıda durum, algı ve eylem
  • Sürekli: Sonsuz/sürekli değerler
  • Satranç (ayrık) vs otonom araç sürüşü (sürekli)

Tekli Ajan vs Çoklu Ajan

  • Tekli ajan: Ortamda yalnız bir karar verici
  • Çoklu ajan: Birden fazla ajan, işbirlikçi veya rekabetçi
  • Çoklu ajan → iletişim, strateji, oyun teorisi

Ortam Özellikleri — Özet Tablosu

Ortam Gözlenebilir Determinizm Episodik Statik Ayrık Ajan
Satranç Tam Deterministik Ardışık Yarı Ayrık Çoklu
Poker Kısmi Stokastik Ardışık Statik Ayrık Çoklu
Otonom araç Kısmi Stokastik Ardışık Dinamik Sürekli Çoklu
Spam filtre Kısmi Stokastik Episodik Statik Ayrık Tekli

Bölüm 4 — Etmen Mimarileri

Basit Refleks Etmeni

  • Koşul → Eylem kuralları
  • Algıya doğrudan tepki
  • Tam gözlenebilir ortamlar için uygun
  • Sınırlılık: geçmişi ve geleceği görmez

Model-Tabanlı Refleks Etmeni

  • İç durum modeli: “Dünya şu an nasıl?”
  • Geçiş modeli: Eylemler dünyayı nasıl değiştirir?
  • Sensör modeli: Dünya durumu algıya nasıl yansır?
  • Kısmi gözlenebilirliği aşar

Hedef-Tabanlı Etmen

  • İç durum + hedef bilgisi
  • “Bu eylem beni hedefe yaklaştırır mı?”
  • Arama ve planlama algoritmaları
  • Daha esnek, değişen hedeflere uyum sağlar

Fayda-Tabanlı Etmen

  • Hedef yerine fayda fonksiyonu
  • Hedef = ikili (başarılı/başarısız), fayda = derecelendirme
  • Çelişen hedefler arasında denge kurabilir
  • Belirsizlik altında beklenen fayda hesabı

Mimarilerin Karşılaştırması

Mimari İç Durum Hedef Fayda Ortam
Basit refleks Yok Yok Yok Tam gözlenebilir, basit
Model-tabanlı Var Yok Yok Kısmi gözlenebilir
Hedef-tabanlı Var Var Yok Planlama gerektiren
Fayda-tabanlı Var Var Var Çelişen hedefler, belirsizlik

Öğrenen Etmen

  • Dört bileşen:
    1. Öğrenme elemanı: Deneyimden iyileştirme
    2. Performans elemanı: Eylem seçimi (dört tipten biri)
    3. Eleştirmen: Geri bildirim sağlama
    4. Problem üreteç: Keşif eylemleri önerme

Etmen Mimarisi Seçimi

  • Ortam özelliklerini analiz et (PEAS)
  • En basit yeterli mimariyi seç
  • Öğrenme bileşeninin gerekliliğini değerlendir
Basit refleks  →  Model-tabanlı  →  Hedef-tabanlı  →  Fayda-tabanlı
  (en basit)                                            (en genel)
                    Karmaşıklık artar →

Özet

  • PEAS: Görev ortamını yapılandırılmış şekilde tanımlar
  • \(6\) özellik ekseni: Ortam zorluğunu belirler
  • \(4\) mimari + öğrenen etmen: Artan karmaşıklık, artan yetenek
  • Genel prensip: En basit yeterli mimariyi seç
Russell, Stuart, and Peter Norvig. 2021. Artificial Intelligence: A Modern Approach. 4th ed. Pearson.
Wooldridge, Michael. 2009. An Introduction to Multiagent Systems. John wiley & sons.