Oktay Cesur – Akıllı Etmenler

Bölüm 1 - Ajan Nedir

İki Eksen, Dört Yaklaşım

Düşünme vs Davranış: İçsel süreç mi, dışsal çıktı mı?
İnsan-merkezli vs Rasyonel: Kıyaslama noktası hangisi?
Dört tanım yaklaşımı:

	İnsan-merkezli	Rasyonel
Düşünme	Bilişsel bilim (GPS)	Mantık geleneği
Davranış	Turing Testi	Akılcı ajan ← modern YZ

Etmen kavramına detaylıca değinmeden önce yapay zekanın tanımına yönelik yaklaşımları gözden geçirelim.

İnsanca düşünme yaklaşımı, bilişsel bilim perspektifinden programın insan zihnine benzer şekilde çalışıp çalışmadığını inceler.
İnsanca davranma, Turing Testi ile sembolize edilen davranışsal bir kriterdir — içsel işleyiş değil dışsal çıktı önemlidir.
Rasyonel düşünme, Aristoteles’ten gelen mantık geleneğine dayanır ancak formalizasyon ve hesaplama sınırlılıkları vardır.
Modern yapay zekanın benimsediği yaklaşım ise rasyonel davranmadır: akılcı ajan kavramı. Neden bu yaklaşım? Çünkü rasyonellik matematiksel olarak kesin tanımlanabilir ve bilimsel ilerlemeye uygun bir zemin sağlar.

Ancak mantıksal çıkarım, rasyonelitenin tek mekanizması değildir — sıcak sobaya değen eli mantıksal süreçlere girmeden refleksle geri çekmek daha başarılı bir eylem olabilir. Bu bizi doğrudan bir soruya getirir: rasyonel davranma dediğimizde bir ajan var. Peki ajan tam olarak nedir?

Ajan (Etmen) Nedir?

Çevreyi algılayıcılarla (sensors) algılar
Eyleyicilerle (actuators) çevreye etki eder
İnsan: göz, kulak → el, ayak
Robot: kamera, LIDAR → motor, gripper
Yazılım: klavye/ağ girdisi → ekran/ağ çıktısı

Ajan ya da etmen, çevresini algılayıcılar aracılığıyla algılayan ve bu çevreye eyleyiciler aracılığıyla etki eden herhangi bir varlıktır. Bazı kaynaklar ajan tanımını yazılım/otonom sistem için kullanırken (Wooldridge 2009), bazılarında bu şartları sağlayan her sistem ajan olarak adlandırılır (Russell and Norvig 2021). Bu noktada hangi tanımın tercih edildiği bizim için önemli bir fark yaratmamaktadır. Uygulama aşamasında her iki yaklaşım da yazılımsal süreçlere odaklandığından biyolojik etmenlerin dahil edilip edilmemesi konuyu doğrudan etkilemez; ancak kavramı somutlaştırmak için verilen örneklerde yararlı olabilir.

İnsan bir ajandır: gözleri ve kulakları algılayıcı, elleri ve ayakları eyleyicidir. Bir robot da ajandır: kameraları ve sensörleri algılayıcı, motorları ve kavrayıcıları eyleyicidir. Yazılım da ajan olabilir: klavye girdileri veya ağ istekleri algılayıcı, ekrana veya ağa verdiği çıktılar eyleyicidir.

Burada önemli bir nokta vardır: ajan kavramı, dünyadaki her şeyi ajan olan ve olmayan diye ikiye ayırmak için değil, karmaşık karar süreçlerini analiz etmek amacıyla kullanılan bir soyutlama aracıdır. Pille çalışan basit bir hesap makinesi de teknik olarak bir ajan sayılabilir — girdi alır, çıktı üretir — ancak bu tanım onu analiz etmemize ek bir fayda sağlamaz.

Yapay zeka ise genellikle önemli hesaplama kaynakları gerektiren ve karmaşık karar süreçlerinin söz konusu olduğu problemlere odaklanır. Biz çoğunlukla konunun bu tarafına odaklanacağız.

Algı ve Algı Dizisi

Algı (percept): Belirli bir andaki duyusal girdi
Algı dizisi (percept sequence): Ajanın tüm algı geçmişi
Ajanın seçeceği eylem, algı dizisine bağlıdır
Sadece son algıya değil — tüm geçmişe

Algı (percept), bir ajanın belirli bir anda çevresinden aldığı duyusal girdidir. Algı dizisi (percept sequence) ise ajanın var olduğu andan itibaren algıladığı her şeyin eksiksiz geçmişidir. Bu ayrım kritiktir: bir ajanın herhangi bir anda seçeceği eylem her zaman yalnızca o anki algısına bağlı değildir; bazı durumlarda o ana kadar edindiği tüm algı dizisine bağlı olabilir.

Hava sıcaklığı \(27\) derecenin üzerine çıktığında klimayı açan bir ajan için algı geçmişi önemli değildir. Buna karşılık otonom sürüş gibi görevlerde geçmiş algılar kritik olabilir.

Hatta ilk bakışta yalnızca mevcut durumun yeterli olduğu düşünülen durumlarda bile algı geçmişi önemli olabilir. Örneğin satranç oyununu düşünelim. Tahtanın mevcut durumuna bakmak çoğu zaman yeterli görünür; ancak rakibin oyun tarzı ve önceki hamleleri kararınızı etkileyebilir. Örneğin karşınızda Mikhail Tal gibi bir oyuncu varsa ve size bir taş fedası yaptıysa, görünen durumdan daha tehlikeli bir konumda olabilirsiniz.

Ajan Fonksiyonu: \(f: P^* \to A\)

\(P\): Olası algılar kümesi
\(P^*\): Tüm olası algı dizileri (Kleene kapanışı)
\(A\): Olası eylemler kümesi
Kavramsal bir tablo: her algı dizisi → bir eylem

Bir ajanın davranışı matematiksel olarak bir ajan fonksiyonu ile tanımlanabilir. Bu fonksiyon, herhangi bir algı dizisini bir eyleme eşler.

\(P\) ile olası algıların kümesini, \(P^*\) ile tüm olası algı dizilerini, \(A\) ile de olası eylemlerin kümesini gösterdiğimizde ajan fonksiyonu

\(f : P^* \to A\)

şeklinde ifade edilir.

Bunu kavramsal olarak bir tablo gibi düşünebiliriz: tablonun her satırı bir algı dizisini temsil eder ve her satırın karşısında o algı dizisine karşılık gelen eylem bulunur.

Ancak burada önemli bir sorun vardır. Gerçek dünyada olası algı dizilerinin sayısı son derece büyüktür. Bu nedenle tüm algı dizileri için ayrı ayrı eylem belirleyen böyle bir tabloyu açık biçimde saklamak -bir nevi tüm olası durumları tek tek listelemek- pratik değildir. Yapay zekâ sistemlerinin amacı da tam olarak bu sorunu çözmektir: astronomik büyüklükteki bu tabloyu saklamak yerine, aynı davranışı üretebilecek küçük ve genel bir ajan programı tasarlamak.

Ajan Fonksiyonu ≠ Ajan Programı

Ajan fonksiyonu: Kavramsal seviye — “ne yapılacak?” (soyut tablo)
Ajan programı: Uygulama seviyesi — “nasıl yapılacak?” (gerçek kod)
Tablonun imkansızlığı: otonom araç kamerası → ~\(27\) MB/s giriş
Evrendeki atom sayısı: ~\(10^{80}\)
YZ’nin asıl görevi: Devasa tablo yerine küçük programdan rasyonel davranış üretmek

Ajan fonksiyonu ile ajan programı arasındaki ayrım kritiktir. Ajan fonksiyonu soyut bir matematiksel tanımlama, tüm algı dizilerini eylemlere eşleyen kavramsal bir tablodur. Ajan programı ise bu fonksiyonu fiziksel bir mimari üzerinde gerçekleştiren algoritmadır. Başka bir deyişle fonksiyon “ne yapılması gerektiğini”, program ise “bunun nasıl yapılacağını” ifade eder.

Bu ayrımın önemi, ajan fonksiyonunun açık bir tablo olarak saklanmasının pratikte imkânsız olmasından kaynaklanır. Bir otonom araç düşünelim: kameradan gelen görsel veri yaklaşık \(27\) MB/s hızındadır. (Russell and Norvig 2021) Bu tür bir sistem için tüm olası algı dizilerini tablo halinde saklamak astronomik büyüklükte bir veri gerektirir. Karşılaştırma için, gözlemlenebilir evrendeki atom sayısı yaklaşık \(10^{80}\) civarındadır. Yapay zekâ araştırmasının temel amacı da tam olarak budur: bu devasa tabloyu saklamak yerine, aynı davranışı üretebilen küçük ve genel bir ajan programı tasarlamak.

Bölüm 2 — PEAS Çerçevesi

PEAS Nedir?

Performance: Başarı ölçütü
Environment: Görev ortamı
Actuators: Eyleyiciler (çıktı)
Sensors: Algılayıcılar (girdi)

PEAS Örneği: Otomatik Taksi

Bileşen	Tanım
Performance	Güvenli varış, minimum süre, konfor, yasal uyum
Environment	Yollar, diğer trafik, yayalar, hava koşulları
Actuators	Direksiyon, gaz, fren, sinyal, korna
Sensors	Kameralar, LIDAR, GPS, hız ölçer, motor sensörleri

Otomatik taksi örneği, PEAS çerçevesinin nasıl uygulandığını göstermek için klasik bir örnektir. Performans ölçütü çok boyutludur: yolcuyu güvenli bir şekilde doğru hedefe ulaştırma, trafik kurallarına uyma, sürüş konforunu sağlama ve yakıt tüketimini minimize etme gibi birden fazla kriter birlikte değerlendirilir. Dikkat edilmesi gereken önemli bir nokta, bu kriterlerin bazen çelişebilmesidir — örneğin minimum süre ile konfor arasında bir denge kurulması gerekir. Ortam son derece karmaşıktır: diğer araçlar, yayalar, bisikletliler, trafik işaretleri, yol koşulları ve hava durumu gibi birçok değişken içerir. Eyleyiciler araç kontrol mekanizmalarıdır ve algılayıcılar modern otonom araçlarda kullanılan zengin sensör paketini kapsar.

PEAS Örneği: Tıbbi Teşhis Sistemi

Bileşen	Tanım
Performance	Doğru teşhis oranı, maliyet, hasta sağlığı
Environment	Hasta, hastane, personel
Actuators	Ekran çıktısı, testler, tedaviler, yönlendirmeler
Sensors	Semptomlar, hasta yanıtları, test sonuçları

Tıbbi teşhis sistemi, otomatik taksiden çok farklı bir görev ortamına sahiptir. Performans ölçütü burada da çok boyutludur ancak hasta sağlığı en kritik kriterdir — yanlış teşhisin maliyeti çok yüksektir. Ortam, hasta ile etkileşimi ve hastane sistemlerini kapsar. Eyleyiciler fiziksel değil bilgiseldir: teşhis önerileri, ek test talepleri ve tedavi planları. Algılayıcılar ise hastanın bildirdiği semptomlar, muayene bulguları ve laboratuvar test sonuçlarıdır.

Bu noktada önemli bir başka konu da performans ölçütlerinin bazen birbiriyle çelişebilmesidir. Hastalar için en iyi sistem genellikle doğru teşhis oranı en yüksek olan sistemdir. Ancak sağlık sistemi veya sigorta kurumları açısından değerlendirildiğinde maliyet de önemli bir faktör haline gelir. Bu durumda farklı paydaşlar için “en iyi” çözüm farklı olabilir.

Örneğin aşağıdaki iki yöntemi düşünelim.

Yöntem	Doğru teşhis oranı	Maliyet
A	\(%90\)	\(500\)
B	\(%70\)	\(100\)

Hasta perspektifinden bakıldığında doğal olarak A yöntemi tercih edilir. Ancak sistem düzeyinde sabit bir bütçe olduğunu varsayalım. Örneğin toplam bütçe \(500\,000\) birim olsun.

A yöntemi kullanılırsa: \(1000\) kişi test edilir → \(900\) doğru teşhis
B yöntemi kullanılırsa: \(5000\) kişi test edilir → \(3500\) doğru teşhis

Bu durumda tek tek bireyler için daha kötü görünen bir yöntem, sistem düzeyinde daha fazla kişinin doğru teşhis almasını sağlayabilir. Bu noktada etik konusu karşımıza çıkmaktadır. Bu durumun tartışılma yeri burası konumuz kapsamında burası değil; ancak yapay zeka çalışmalarında oldukça revaçta ve örnekte gördüğünüz gibi insanı can sıkıcı çıkmazlara sokabilen bir konudur.

PEAS Örneği: Satranç Programı

Bileşen	Tanım
Performance	Kazanma/kaybetme/berabere, stil puanı
Environment	Satranç tahtası, rakip
Actuators	Hamle yapma (ekran/robot kol)
Sensors	Tahta durumu (dijital girdi veya kamera)

Bölüm 3 — Ortam Özellikleri

Tam Gözlenebilir vs Kısmi Gözlenebilir

Tam gözlenebilir: Sensörler çevrenin tam durumuna erişim sağlar
Kısmi gözlenebilir: Gürültü, eksik veri veya sensör sınırlılığı
Örnek: Satranç (tam) vs poker (kısmi)

Bir görev ortamı, ajanın sensörleri her an çevrenin tam durumuna erişim sağlıyorsa tam gözlenebilirdir. Satranç buna iyi bir örnektir: her iki oyuncu da tahtadaki tüm taşların konumunu görebilir. Kısmi gözlenebilirlik ise sensörlerin çevrenin durumunun yalnızca bir kısmını algıladığı durumlarda ortaya çıkar. Bu, sensörlerin yetersizliğinden, gürültüden veya çevrenin doğasından kaynaklanabilir. Poker, kısmi gözlenebilirliğin klasik örneğidir: her oyuncu kendi kartlarını görebilir ancak rakiplerin kartlarını göremez. Otonom araç da kısmi gözlenebilir bir ortamda çalışır — sensörlerin menzili sınırlıdır ve kör noktalar vardır. Kısmi gözlenebilirlik, ajan tasarımını önemli ölçüde zorlaştırır çünkü ajan, gözlemleyemediği durumları tahmin etmek için bir iç model tutmak zorundadır.

Deterministik vs Stokastik

Deterministik: Mevcut durum + eylem → sonraki durum kesin
Stokastik: Mevcut durum + eylem → olasılıksal sonuç
Stratejik: Çevrenin belirsizliği diğer ajanlardan kaynaklanır

Deterministik bir ortamda, çevrenin bir sonraki durumu tamamen mevcut durum ve ajanın yaptığı eylem tarafından belirlenir. Yani aynı durumda aynı eylem yapılırsa sonuç her zaman aynıdır. Satranç buna iyi bir örnektir: bir hamle yapıldığında ortaya çıkacak yeni tahta durumu kesindir.

Stokastik ortamlarda ise durum farklıdır. Aynı durumda aynı eylem farklı sonuçlara yol açabilir. Zar atma içeren oyunlar, hava durumu veya gerçek dünya trafik ortamları buna örnek verilebilir.

Stratejik ortam ise biraz farklı bir durumdur. Çevre kendi başına deterministik olabilir, ancak ortamda başka ajanlar da varsa onların davranışları belirsizlik yaratır. Örneğin satranç kuralları deterministiktir, fakat rakibin hangi hamleyi yapacağını kesin olarak bilemeyiz.

Deterministik ortamlar genellikle daha kolay modellenir çünkü yapılan bir eylemden sonra ortaya çıkacak durumu tahmin etmek mümkündür. Stokastik ortamlarda ise bu mümkün değildir; bu nedenle olasılık teorisi ve karar teorisi gibi araçlara ihtiyaç duyulur.

Bir noktaya daha dikkat etmek gerekir. Ortam tam gözlenebilir ve deterministik olsa bile ajan algı bilgisini tam olarak işleyemiyorsa, ortam ajan açısından yine de stokastik görünebilir. Yani belirsizlik bazen çevreden değil, ajanın sınırlılıklarından kaynaklanır.

Episodik vs Ardışık

Episodik: Her karar bağımsız — önceki eylemler sonraki bölümleri etkilemez
Ardışık: Mevcut karar gelecekteki seçenekleri etkiler
Örnek: Kalite kontrol (episodik) vs satranç (ardışık)

Statik vs Dinamik

Statik: Ajan düşünürken ortam değişmez
Dinamik: Ortam ajan karar verirken de değişir
Yarı-dinamik: Ortam değişmez ama puan değişir

Ayrık vs Sürekli

Ayrık: Sonlu sayıda durum, algı ve eylem
Sürekli: Sonsuz/sürekli değerler
Satranç (ayrık) vs otonom araç sürüşü (sürekli)

Tekli Ajan vs Çoklu Ajan

Tekli ajan: Ortamda yalnız bir karar verici
Çoklu ajan: Birden fazla ajan, işbirlikçi veya rekabetçi
Çoklu ajan → iletişim, strateji, oyun teorisi

Ortam Özellikleri — Özet Tablosu

Ortam	Gözlenebilir	Determinizm	Episodik	Statik	Ayrık	Ajan
Satranç	Tam	Deterministik	Ardışık	Yarı	Ayrık	Çoklu
Poker	Kısmi	Stokastik	Ardışık	Statik	Ayrık	Çoklu
Otonom araç	Kısmi	Stokastik	Ardışık	Dinamik	Sürekli	Çoklu
Spam filtre	Kısmi	Stokastik	Episodik	Statik	Ayrık	Tekli

Bölüm 4 — Etmen Mimarileri

Basit Refleks Etmeni

Koşul → Eylem kuralları
Algıya doğrudan tepki
Tam gözlenebilir ortamlar için uygun
Sınırlılık: geçmişi ve geleceği görmez

Model-Tabanlı Refleks Etmeni

İç durum modeli: “Dünya şu an nasıl?”
Geçiş modeli: Eylemler dünyayı nasıl değiştirir?
Sensör modeli: Dünya durumu algıya nasıl yansır?
Kısmi gözlenebilirliği aşar

Model-tabanlı refleks etmeni, basit refleks etmeninin sınırlılıklarını bir iç durum modeli ekleyerek aşar. Bu ajan, çevrenin gözlenemeyen kısımlarını takip etmek için bir iç temsil tutar. Bu iç temsili güncellemek için iki tür bilgiye ihtiyaç duyar. İlk olarak, bir geçiş modeli: eylemlerin dünyayı nasıl değiştirdiğine dair bilgi. Örneğin, bir araç sola dönerse yeni konumunun ne olacağı. İkinci olarak, bir sensör modeli: dünyanın mevcut durumunun ajanın algılarına nasıl yansıdığına dair bilgi. Örneğin, öndeki araç fren yaptığında kamerada kırmızı ışıklar görülür. Her adımda ajan, önceki iç durumu, son eylemi ve yeni algıyı kullanarak iç durumunu günceller ve ardından koşul-eylem kurallarını bu güncellenmiş iç duruma uygular. Bu mimari, kısmi gözlenebilir ortamlarda çalışabilir ancak hâlâ uzun vadeli hedefleri dikkate almaz.

Hedef-Tabanlı Etmen

İç durum + hedef bilgisi
“Bu eylem beni hedefe yaklaştırır mı?”
Arama ve planlama algoritmaları
Daha esnek, değişen hedeflere uyum sağlar

Hedef-tabanlı etmen, model-tabanlı refleks etmenin üzerine bir hedef bileşeni ekler. Bu ajan yalnızca dünyanın mevcut durumunu bilmekle kalmaz, aynı zamanda ulaşmak istediği bir hedef durumu da bilir. Karar verirken, her olası eylemin hedefe yaklaştırıp yaklaştırmadığını değerlendirir. Bu değerlendirme, basit bir karşılaştırma olabilir veya uzun bir arama ve planlama süreci gerektirebilir. Hedef-tabanlı etmenin önemli avantajı esnekliktir. Basit refleks etmeninde, hedef değiştiğinde tüm koşul-eylem kurallarının yeniden yazılması gerekir. Hedef-tabanlı etmende ise sadece hedefin güncellenmesi yeterlidir ve ajan davranışını otomatik olarak uyarlar. Örneğin, bir navigasyon ajanının hedef adresi değiştirildiğinde rota otomatik olarak yeniden hesaplanır. Arama ve planlama algoritmaları — ki ileriki haftalarda detaylı işleyeceğiz — bu tür ajanların temelini oluşturur.

Fayda-Tabanlı Etmen

Hedef yerine fayda fonksiyonu:
Hedef = ikili (başarılı/başarısız), fayda = derecelendirme
Çelişen hedefler arasında denge kurabilir
Belirsizlik altında beklenen fayda hesabı

Fayda-tabanlı etmen, hedef-tabanlı etmenin bir genellemesidir. Hedefler ikili bir değerlendirme sağlar: ya hedefe ulaşıldı ya da ulaşılmadı. Ancak gerçek dünyada çoğu zaman birden fazla hedef vardır ve bu hedefler çelişebilir. Fayda fonksiyonu, her durum için sayısal bir değerlendirme sağlayarak bu sorunu çözer. Örneğin, otomatik taksi için hem hızlı varış hem konforlu sürüş hedeflerini tek bir fayda fonksiyonunda birleştirmek mümkündür. Stokastik ortamlarda ise beklenen fayda hesabı yapılır: her olası sonucun faydasının olasılıkla çarpımının toplamı. Fayda-tabanlı yaklaşım, ekonomi ve karar teorisinin temellerinden biridir. Rasyonel ajan tanımıyla doğrudan örtüşür: rasyonel ajan, beklenen faydasını maksimize eden eylemi seçen ajandır. Bu mimari en genel ve en güçlü olanıdır ancak fayda fonksiyonunun doğru tasarlanması zorlu bir problemdir.

Mimarilerin Karşılaştırması

Mimari	İç Durum	Hedef	Fayda	Ortam
Basit refleks	Yok	Yok	Yok	Tam gözlenebilir, basit
Model-tabanlı	Var	Yok	Yok	Kısmi gözlenebilir
Hedef-tabanlı	Var	Var	Yok	Planlama gerektiren
Fayda-tabanlı	Var	Var	Var	Çelişen hedefler, belirsizlik

Bu tablo dört temel etmen mimarisini karşılaştırır. Her bir mimari, bir öncekinin üzerine yeni bir bileşen ekler ve böylece daha karmaşık ortamlarla başa çıkabilir hale gelir. Basit refleks etmeni yalnızca algı-eylem eşleştirmesi yapar ve tam gözlenebilir, basit ortamlar için yeterlidir. Model-tabanlı etmen bir iç durum ekleyerek kısmi gözlenebilirliği aşar. Hedef-tabanlı etmen bir hedef bileşeni ekleyerek proaktif davranış ve planlama yeteneği kazanır. Fayda-tabanlı etmen ise bir fayda fonksiyonu ekleyerek çelişen hedefler ve belirsizlik altında optimal karar verebilir. Genel kural olarak, ortamın karmaşıklığı arttıkça daha sofistike bir mimari gerekir ancak daha basit bir mimari yeterliyse tercih edilmelidir — gereksiz karmaşıklık performansı düşürür.

Öğrenen Etmen

Dört bileşen:
1. Öğrenme elemanı: Deneyimden iyileştirme
2. Performans elemanı: Eylem seçimi (dört tipten biri)
3. Eleştirmen: Geri bildirim sağlama
4. Problem üreteç: Keşif eylemleri önerme

Öğrenen etmen, tüm ajan mimarilerine uygulanabilecek genel bir çerçevedir. Bu çerçevenin amacı, ajanın başlangıç tasarımındaki eksiklikleri deneyim yoluyla gidermesidir. Performans elemanı, daha önce tartıştığımız dört mimariden herhangi biri olabilir. Öğrenme elemanı, performans elemanının bileşenlerini — koşul-eylem kurallarını, modeli, hedefleri veya fayda fonksiyonunu — deneyimden öğrenerek iyileştirir. Eleştirmen, performans elemanının ne kadar iyi çalıştığına dair geri bildirim sağlar ve bu geri bildirimi sabit bir performans standardına göre verir. Problem üreteç ise ajana bilgilendirici ve keşifsel eylemler önerir. Kısa vadede bu eylemler optimal olmayabilir ancak uzun vadede ajanın daha iyi kararlar almasına yardımcı olan deneyimler sağlarlar. Örneğin, bir restoran ajanı her zaman bildiği en iyi restorana gitmek yerine bazen yeni restoranları denemeli — bu exploration vs exploitation dengesidir.

Etmen Mimarisi Seçimi

Ortam özelliklerini analiz et (PEAS)
En basit yeterli mimariyi seç
Öğrenme bileşeninin gerekliliğini değerlendir

Basit refleks  →  Model-tabanlı  →  Hedef-tabanlı  →  Fayda-tabanlı
  (en basit)                                            (en genel)
                    Karmaşıklık artar →

Doğru etmen mimarisinin seçimi, görev ortamının özelliklerinin doğru analiz edilmesine bağlıdır. PEAS analizi bu seçimin temelini oluşturur. Temel prensip, görev için yeterli olan en basit mimariyi seçmektir. Eğer ortam tam gözlenebilir ve basitse, basit refleks etmeni yeterli olabilir. Kısmi gözlenebilirlik varsa model-tabanlı bir yaklaşım gerekir. Ajan proaktif olarak hedeflere ulaşmak zorundaysa hedef-tabanlı mimari uygun olur. Çelişen hedefler veya belirsizlik altında optimal karar gerekiyorsa fayda-tabanlı mimari tercih edilir. Pratik uygulamalarda genellikle bu mimarilerin hibrit versiyonları kullanılır. Öğrenme bileşeni ise çevrenin dinamik olduğu, başlangıç bilgisinin yetersiz olduğu veya optimal davranışın önceden bilinmediği durumlarda eklenir.

Özet

PEAS: Görev ortamını yapılandırılmış şekilde tanımlar
\(6\) özellik ekseni: Ortam zorluğunu belirler
\(4\) mimari + öğrenen etmen: Artan karmaşıklık, artan yetenek
Genel prensip: En basit yeterli mimariyi seç

Bu noktada ulaşabileceğimiz temel çıkarımları şunlardır. Birincisi, herhangi bir yapay zeka sistemi tasarlamadan önce görev ortamının PEAS çerçevesiyle tam olarak belirtilmesi gerekir. İkincisi, ortamın altı temel özelliği — gözlenebilirlik, determinizm, episodik yapı, dinamiklik, süreklilik ve ajan sayısı — hangi tekniklerin uygun olacağını belirler. Üçüncüsü, dört temel ajan mimarisi artan karmaşıklık ve yetenek sunar: basit refleks, model-tabanlı refleks, hedef-tabanlı ve fayda-tabanlı. Öğrenen etmen çerçevesi ise tüm bu mimarilere uygulanabilir. Tasarım prensibi olarak en basit yeterli mimari tercih edilmelidir. Gelecek hafta, hedef-tabanlı ajanların kullandığı arama algoritmalarını incelemeye başlayacağız ve problem çözmenin sistematik yollarını tartışacağız.

Russell, Stuart, and Peter Norvig. 2021. Artificial Intelligence: A Modern Approach. 4th ed. Pearson.

Wooldridge, Michael. 2009. An Introduction to Multiagent Systems. John wiley & sons.