Derin Öğrenmeye Giriş

BİM444 — Hafta 11

Öğr. Gör. Oktay Cesur

2026-04-13

Derin Öğrenmeye Giriş

Makine Öğrenmesinde Ne Eksikti?

  • Denetimli öğrenme: karar fonksiyonu öğreniyorduk
  • Sorun: özellikleri biz seçiyorduk
  • Görüntüde “kenar”, “renk”, “doku” — bunları elle tanımlamak gerekiyordu
  • Karmaşık veride elle özellik çıkarmak: zor, pahalı, yetersiz

Derin öğrenme: özellikleri de veriden öğren

Biyolojik İlham: Nöron

  • Beyin ~86 milyar nörondan oluşuyor
  • Her nöron: giriş sinyalleri alır → toplar → eşiği aşarsa ateşler
  • Yapay nöron: aynı mantığın matematiksel modeli

\[ z = w_1 x_1 + w_2 x_2 + \cdots + w_n x_n + b \] \[ \text{çıkış} = f(z) \]

  • \(w\): ağırlıklar · \(b\): önyargı · \(f\): aktivasyon fonksiyonu

Aktivasyon Fonksiyonu: Doğrusallığı Kır

Neden gerekli? - Aktivasyonsuz: katmanlar ne kadar çok olursa olsun sonuç doğrusal - Aktivasyon: modele doğrusal olmayan ilişkileri öğretir

Yaygın fonksiyonlar:

Fonksiyon Sezgi Kullanım
ReLU Negatifi sıfırla, pozitifte değiştirme Derin ağlarda standart
Sigmoid Çıktıyı 0-1 arasına sıkıştır İkili sınıflandırma çıkışı
Softmax K sınıf için olasılık dağılımı üret Çok sınıflı çıkış

Derin Ağ: Katmanlar

Giriş → [Gizli Katman 1] → [Gizli Katman 2] → ... → Çıkış
  • Giriş katmanı: ham veri — pikseller, kelimeler, sayılar
  • Gizli katmanlar: giderek soyutlaşan özellikler
  • Çıkış katmanı: tahmin — sınıf, değer, olasılık

“Derin” = birden fazla gizli katman

Öğrenme: Geri Yayılım

  1. İleri geçiş: girdi ağdan geçer, tahmin üretilir
  2. Kayıp hesaplanır: tahmin ile gerçek arasındaki fark
  3. Geri yayılım: hata gradyanı katman katman geri taşınır
  4. Ağırlıklar güncellenir: her ağırlık hataya katkısı kadar ayarlanır

Gradyan inişi: kayıp fonksiyonunun en derin noktasına in

Mimariler: Farklı Problem, Farklı Yapı

CNN — Evrişimli Sinir Ağı - Görüntü işleme için tasarlanmış - Yerel örüntüleri tara — kenar, şekil, doku - Kullanım: görüntü sınıflandırma, nesne tespiti

RNN / LSTM — Tekrarlayan Sinir Ağı - Sıralı veri için tasarlanmış — zaman serisi, metin - Geçmişi “hatırlayan” gizli durum - Kullanım: dil modelleme, makine çevirisi

Transformer - Dikkat (attention) mekanizması — her adımda tüm diziye bak - LLM’lerin temeli: GPT, BERT - Kullanım: metin, görüntü, ses

Neden Şimdi?

Derin öğrenme fikirleri 1980’lerdeydi — neden 2010’larda patladı?

  • Veri: internet, sosyal medya, sensörler → milyarlarca etiketli örnek
  • Hesaplama: GPU’lar paralel matris işlemini hızlandırdı
  • Algoritmik gelişmeler: ReLU, dropout, batch normalization

Sınırlılıklar

  • Veri açlığı: milyonlarca etiketli örnek gerekebilir
  • Yorumlanamaz: “kara kutu” — neden bu kararı verdi?
  • Hesaplama maliyeti: eğitim: saatler, günler, haftalar
  • Kırılganlık: küçük gürültü → tamamen yanlış tahmin (adversarial örnekler)

Ajan Bağlantısı

  • Derin ağ → ajanın algı işleme katmanı
  • Kamera görüntüsü → CNN → durum temsili → karar
  • RL + Derin öğrenme = DRL (Derin Pekiştirmeli Öğrenme)
  • AlphaGo, AlphaStar, OpenAI Five — hepsi bu kombinasyon

Özet

  • Derin öğrenme: ham veriden hiyerarşik özellikler öğren
  • Yapay nöron: ağırlıklı toplam + aktivasyon
  • Aktivasyon fonksiyonu: doğrusallığı kır — ReLU, Sigmoid, Softmax
  • Geri yayılım + gradyan inişi: ağırlıkları öğren
  • Mimariler: CNN (görüntü) · RNN/LSTM (sıralı) · Transformer (dikkat)
  • Neden şimdi: veri + GPU + algoritmik gelişmeler
  • Ajan için: karmaşık algıyı işleyen katman