Denetimli Öğrenme

BİM444 — Hafta 8

Öğr. Gör. Oktay Cesur

2026-03-23

Denetimli Öğrenme

Geçen Haftadan: Üç Paradigma

  • Denetimli: giriş + etiket → karar fonksiyonu öğren
  • Denetimsiz: yalnızca giriş → yapıyı keşfet
  • Takviyeli: durum + ödül → politika öğren

Bu hafta: Denetimli öğrenmeyi derinleştiriyoruz

Etiketli Veri Nedir?

Her örnek iki parçadan oluşur: giriş + doğru cevap

Giriş Etiket
E-posta metni Spam / Değil
Hasta X-ışını görüntüsü Pnömoni / Normal
Ev: metrekare, konum, yaş Fiyat (TL)
Müşteri işlem geçmişi Terk edecek / Etmeyecek
  • Etiket = öğretmenin verdiği doğru cevap
  • Model bu örneklerden kalıpları çıkarıyor

İki Temel Problem Türü

Sınıflandırma (Classification) - Çıktı: kategori — “hangi sınıf?” - Örnek: e-posta → spam / değil · görüntü → kedi / köpek / kuş

Regresyon (Regression) - Çıktı: sayısal değer — “ne kadar?” - Örnek: eve bakarak fiyat tahmini · sensör verisinden sıcaklık tahmini

Karar Fonksiyonu: Kara Kutu Sezgisi

\[ h(x) \to \hat{y} \]

  • Giriş \(x\): özellikler (e-posta kelimeleri, piksel değerleri, metrekare…)
  • Çıktı \(\hat{y}\): tahmin edilen etiket
  • Model = bu eşlemeyi yapan fonksiyon

Öğrenme: eğitim verisi üzerinde \(h(x) \approx f(x)\) olacak şekilde ayarla

Doğrusal Regresyon

Soru: Sürekli bir değeri nasıl tahmin ederiz?

\[ \hat{y} = w_0 + w_1 x_1 + w_2 x_2 + \cdots + w_n x_n \]

  • \(w\) ağırlıkları öğrenilecek parametreler
  • Hedef: Ortalama Kare Hata (MSE) minimize et

\[ \text{MSE} = \frac{1}{n} \sum_{i=1}^n (y_i - \hat{y}_i)^2 \]

  • Optimizasyon: gradyan inişi ya da analitik çözüm

Lojistik Regresyon

Soru: Doğrusal regresyonu sınıflandırmaya nasıl uyarlarız?

\[ P(y=1 \mid x) = \sigma(w^T x) = \frac{1}{1 + e^{-w^T x}} \]

  • Sigmoid fonksiyonu: doğrusal çıktıyı 0-1 arasına sıkıştırır
  • Çıktı: sınıfa ait olma olasılığı
  • Karar: \(P > 0.5\) ise pozitif sınıf

Karar Ağacı

Soru: Veriyi en iyi ayıran soruyu nasıl seçeriz?

  • Her düğüm: bir özellik üzerine soru
  • Her dal: sorunun cevabı
  • Her yaprak: karar (sınıf etiketi)
  • Bölme ölçütü: entropi / bilgi kazancı

\[ H = -\sum_i p_i \log_2 p_i \]

Karar Ağacı: Spam Örneği

            Kelime "indirim" var mı?
           /                       \
         Evet                      Hayır
          |                          |
   Gönderen bilinmiyor mu?      → Spam değil
     /           \
   Evet          Hayır
    |               |
 → Spam        → Spam değil
  • Ağaç insan tarafından okunabilir — yorumlanabilir model
  • Derinleştikçe güçlenir ama overfitting riski artar
  • Random Forest: çok sayıda ağacın oyu → daha güçlü, daha dayanıklı

k-En Yakın Komşu (kNN)

Soru: Yeni örnek hangi bilinen örneklere benziyor?

  • Tüm eğitim verisini sakla
  • Yeni örnek gelince: en yakın k komşuyu bul
  • Sınıflandırma: komşuların çoğunluk etiketi
  • Regresyon: komşuların ortalama değeri
  • “Yakınlık”: Öklid mesafesi, kosinüs benzerliği…

\[ d(a, b) = \sqrt{\sum_i (a_i - b_i)^2} \]

Naive Bayes

Bayes teoremini sınıflandırmaya uygula

\[ P(C \mid x) = \frac{P(x \mid C) \cdot P(C)}{P(x)} \]

  • \(P(C)\): öncül olasılık — bu sınıf ne kadar yaygın?
  • \(P(x \mid C)\): bu özellikler bu sınıfta ne kadar görülüyor?
  • “Naive”: özellikler birbirinden bağımsız varsayılır

Örnek: “kazandınız” kelimesi spam’de %80, normal e-postada %2 geçiyor

Destek Vektör Makinesi (SVM)

Soru: İki sınıfı ayıran en iyi çizgi hangisi?

  • Sadece doğru ayırmak değil: marjı maksimize et
  • Marj: karar sınırı ile en yakın örnekler arası mesafe
  • Destek vektörleri: marjı belirleyen sınır örnekleri
  • Çekirdek hilesi: doğrusal ayrılamayan veriler için boyutu artır

Modelleri Karşılaştırma

Model Güçlü yan Zayıf yan
Karar ağacı Yorumlanabilir, hızlı Overfitting riski
kNN Basit, eğitim yok Tahmin yavaş, hafıza
Doğrusal regresyon Hızlı, yorumlanabilir Doğrusal olmayan ilişki yok
Lojistik regresyon Olasılık çıktısı Doğrusal sınır
Naive Bayes Hızlı, az veriyle çalışır Bağımsızlık varsayımı
SVM Yüksek boyut, marj Büyük veride yavaş

“En iyi algoritma” yok — probleme, veriye, bağlama göre seçilir

Modeli Değerlendirme

Confusion Matrix — Karmaşıklık Matrisi

Tahmin: Pozitif Tahmin: Negatif
Gerçek: Pozitif TP (doğru pozitif) FN (yanlış negatif)
Gerçek: Negatif FP (yanlış pozitif) TN (doğru negatif)
  • Doğruluk: \((TP + TN)\) / toplam
  • Kesinlik: \(TP / (TP + FP)\) — “pozitif dediklerimin kaçı gerçekten pozitif?”
  • Duyarlılık: \(TP / (TP + FN)\) — “gerçek pozitiflerin kaçını yakaladım?”

Eğitim / Test Ayrımı ve Cross-Validation

Temel kural: test seti model tarafından hiç görülmemiş olmalı

Cross-validation (Çapraz Doğrulama): - Veriyi k parçaya böl - Her seferinde bir parçayı test, kalanları eğitim olarak kullan - k tur sonunda ortalama performans → güvenilir tahmin

Ajan Bağlantısı

  • Denetimli öğrenme ile eğitilmiş model → ajanın karar fonksiyonu
  • Ajan algı girdisini \(h(x)\)’e veriyor → eylem tavsiyesi alıyor
  • Kural elle yazılmadı — örneklerden öğrenildi

Özet

  • Denetimli öğrenme: etiketli veri → karar fonksiyonu
  • İki tür: Sınıflandırma (kategori) · Regresyon (sayısal değer)
  • Karar fonksiyonu: karar ağacı · kNN · Naive Bayes — hepsi aynı amaca hizmet
  • Değerlendirme: doğruluk yetmez → confusion matrix + kesinlik/duyarlılık
  • Test güvenilirliği: eğitim/test ayrımı · cross-validation
  • Ajan için: öğrenilmiş karar fonksiyonu = akıllı algı-eylem haritası