Makine Öğrenmesine Giriş

BİM444 — Hafta 6

Öğr. Gör. Oktay Cesur

2026-03-09

Makine Öğrenmesine Giriş

Buraya Nasıl Geldik?

  • Önceki haftalar: ajan, çevreyi önceden bilinen bir modelle temsil ediyordu
  • Durum uzayı, geçişler, maliyetler — hepsi verilmişti
  • Peki ya çevre çok karmaşık ve model elle tanımlanamıyorsa?

2000’li Yıllarda Bir Problem: Çeviri

Türkçe → İngilizce çeviri yazılımı yapın. Nasıl başlarsınız?

  • Kural Tabanlı (RBMT): dil bilgisi kurallarını elle yaz
  • Örnek Tabanlı (EBMT): çevrilmiş cümle çiftlerinden eşleştir
  • İstatistiksel (SMT): büyük veri + olasılık — kural öğren, yazma

İnsanlar Nasıl Öğrenir?

Dil nasıl öğrenilir? - Bebek: dinler → kalıpları içselleştirir → üretir → düzeltilir

Başka her şey nasıl öğrenilir? - Deneme-yanılma: eylem → sonuç → ödül ya da ceza → strateji güncelle - Gözlem: etiket olmadan yapıyı fark et

Makine Öğrenmesi Nedir?

Bilgisayarların açıkça programlanmadan veriden öğrenmesini sağlayan YZ dalı

  • Geleneksel: veri + kural → çıktı
  • MÖ: veri + çıktı → kural

Alan haritası: - Yapay Zeka ⊃ Makine Öğrenmesi ⊃ Derin Öğrenme - Veri Bilimi: örtüşen ama farklı odak

Üç Öğrenme Paradigması

Paradigma Veri Hedef Sezgi
Denetimli Giriş + etiket Etiketi tahmin et Öğretmenli öğrenme
Denetimsiz Yalnızca giriş Yapıyı keşfet Kendi başına keşif
Takviyeli Durum + ödül Ödülü maksimize et Deneme-yanılma

Öğrenme Formülasyonu

Bilinmeyen bir \(f(x)\) var. Veriyle \(h(x) \approx f(x)\) bulmak istiyoruz.

\[ 1 \to 4 \quad 2 \to 11 \quad 3 \to 14 \quad 4 \to 21 \]

  • Gözlem: \(h(x) = 5x\) yakın bir tahmin
  • \(h\): hipotez · \(f\): gerçek fonksiyon · fark: hata
  • Öğrenme = hipotez uzayında hatayı minimize eden \(h\)’yi ara

Overfitting — Ezberleme mi, Genelleme mi?

  • Model eğitim verisinde çok iyi → yeni veriye genelleyemiyor
  • Aşırı uyum (overfitting): kalıbı değil, veriyi ezberledi
  • Yetersiz uyum (underfitting): model çok basit, hiçbir şeyi yakalayamıyor
  • Hedef: görülmemiş veride iyi performans

Değerlendirme: Görülmemiş Veriyle Test

  • Doğruluk (Accuracy): doğru tahmin / toplam tahmin
  • Modeli eğittiğiniz veri üzerinde test → yanıltıcı
  • Çözüm: eğitim / test ayrımı
Küme Rol
Eğitim (train) Model bu veriyle öğrenir
Test (test) Yalnızca değerlendirmede kullanılır — model hiç görmedi

ML Projesi Nasıl Yürür? — CRISP-DM

  • İş anlama: problem ne? başarı kriteri ne?
  • Veri anlama: elimizde ne var?
  • Veri hazırlama: temizleme, dönüştürme — zamanın %60-80’i burada
  • Modelleme: algoritma seç, eğit
  • Değerlendirme: metrikler, overfitting kontrolü
  • Dağıtım: modeli canlıya al

Özet

  • MÖ: kural yazmak yerine veriden kural öğrenmek
  • Üç paradigma: Denetimli · Denetimsiz · Takviyeli
  • Formülasyon: \(h(x) \approx f(x)\) — hipotez uzayında arama
  • Temel gerilim: overfitting ↔︎ genelleme
  • Değerlendirme: görülmemiş test verisi üzerinde
  • Süreç: CRISP-DM — algoritma seçmekten önce problem ve veri anlama