Denetimsiz Öğrenme

BİM444 — Hafta 9

Öğr. Gör. Oktay Cesur

2026-03-30

Denetimsiz Öğrenme

Geçen Haftadan: Etiket Vardı

  • Denetimli öğrenme: her örneğin bir doğru cevabı vardı
  • Etiketler insan emeğiyle üretiliyordu — pahalı, zaman alıcı
  • Peki ya etiket yoksa?

Bu hafta: Etiketsiz veriden ne öğrenebiliriz?

Etiketsiz Veri: Örnekler

Veri Etiket yok Öğrenilebilecek yapı
Müşteri alışveriş geçmişi Segment bilgisi yok Benzer müşteri grupları
Haber makaleleri Konu etiketi yok Konu kümeleri
Gen ekspresyon verisi Hastalık tanısı yok Benzer hasta profilleri
Kullanıcı tıklama verisi Tercih etiketi yok Davranış kalıpları
  • Veri içinde gizli yapı var
  • Denetimsiz öğrenme bu yapıyı açığa çıkarıyor

Kümeleme — Benzer Olanları Grupla

Fikir: Birbirine yakın örnekleri aynı gruba at

  • “Yakınlık” = bir mesafe ölçüsü (Öklid, korelasyon…)
  • Grupların ne anlama geldiğini biz yorumluyoruz
  • Sınıflandırma değil: çıktı etiket değil, grup ataması

Soru: “Benzer” ne demek — bu seçim kritik

k-Means: Adım Adım

  1. k merkez nokta rastgele yerleştir
  2. Her örneği en yakın merkeze ata
  3. Her kümenin yeni merkezini hesapla (ortalama)
  4. Değişim duruncaya kadar 2-3’ü tekrarla

k önceden seçilmeli — kaç küme istiyorsunuz?

Hiyerarşik Kümeleme

  • Tek tek başla → en benzer ikileri birleştir → tekrarla
  • Sonuç: dendrogram — ağaç yapısı
  • Kaç küme istediğinize sonradan karar verebilirsiniz — k önceden belirlenmez

Boyut İndirgeme — Neden?

Problem: çok sayıda özellik var - Görselleştirme imkânsız: 100 boyutlu veriyi çizemezsiniz - Hesaplama pahalı: her boyut karmaşıklığı artırıyor - Gürültü: bazı özellikler bilgi taşımıyor, bazıları birbiriyle tekrar ediyor

Çözüm: Bilgiyi koruyarak boyut sayısını azalt

PCA — Temel Bileşen Analizi

  • Verideki en fazla varyasyonu açıklayan yönleri bul
  • Bu yönler boyunca veriyi yeniden ifade et
  • İlk birkaç bileşen çoğu bilgiyi taşır → geri kalanı at

Sezgi: 3D nesnenin 2D gölgesi — bilgiyi koruyarak boyutu azaltır

t-SNE — Görselleştirme İçin

  • Yüksek boyutlu veriyi 2D / 3D’ye indir
  • Birbirine yakın örnekler yakın kalsın
  • Sonuç: küme yapıları gözle görülür hale gelir
  • PCA’dan farkı: global yapıdan çok yerel komşulukları korur

Ajan Bağlantısı

  • Denetimsiz öğrenme → ajanın çevreyi anlamlandırması
  • Kümeleme: benzer durumları grupla → benzer eylemleri uygula
  • Boyut indirgeme: karmaşık algı → özlü temsil → daha hızlı karar
  • Etiket olmadan ortamdan yapı çıkarma

Özet

  • Denetimsiz öğrenme: etiket yok → veri içindeki yapıyı keşfet
  • Kümeleme: benzer örnekleri grupla
    • k-Means: k merkez, iteratif güncelleme
    • Hiyerarşik: dendrogram, k önceden belirlenmez
  • Boyut indirgeme: bilgiyi koruyarak boyutu azalt
    • PCA: en fazla varyasyonu açıklayan yönler
    • t-SNE: yerel komşulukları koruyarak görselleştirme
  • Ajan için: etiketsiz deneyimden çevre yapısını anlamlandır