14 Üstel ve Logaritmik Fonksiyon
Büyüme, çürüme ve onların tersi — sigmoid’in temeli
Bölüm 1’de üs (Üslü İfadeler dersi) ve logaritmanın (Logaritma dersi) cebirini gördük. Şimdi bunları fonksiyon olarak ele alıp grafiklerine bakıyoruz. Bu iki şekil modern ML’in motorudur: sigmoid ve softmax doğrudan üstel fonksiyona, kayıp fonksiyonu ise logaritmaya dayanır.
14.1 Üstel fonksiyon: \(f(x) = b^x\)
Değişkenin üste çıktığı fonksiyondur (taban sabit, üs değişken):
\[f(x) = b^x \quad (b > 0,\; b \neq 1)\]
Davranışı tabanın değerine bağlıdır:
- \(b > 1\) → büyüme: giderek daha hızlı artar (örn. \(2^x\)).
- \(0 < b < 1\) → çürüme: sıfıra doğru azalır (örn. \((1/2)^x\)).
- Her zaman pozitiftir (görüntü kümesi \(> 0\)) ve \(b^0 = 1\) olduğu için daima \((0, 1)\)’den geçer.
14.2 Doğrusal vs üstel: sabit fark mı, sabit oran mı?
Doğrusal fonksiyon her adımda sabit bir miktar ekler; üstel fonksiyon her adımda sabit bir oranla çarpar. Fark görünüşte küçük, sonuç dramatiktir:
| \(x\) | Doğrusal \(y = 2x\) (+2) | Üstel \(y = 2^x\) (×2) |
|---|---|---|
| 0 | 0 | 1 |
| 1 | 2 | 2 |
| 2 | 4 | 4 |
| 3 | 6 | 8 |
| 4 | 8 | 16 |
| 5 | 10 | 32 |
Başta yakınlar, ama üstel kısa sürede doğrusalı ezer. “Üstel büyüme” deyiminin gücü buradan gelir.
14.3 Logaritmik fonksiyon: \(f(x) = \log_b x\)
Logaritma, üstelin tersidir (Logaritma dersindeki ayna ilişkisi). Bu yüzden üstelin zıttı gibi davranır:
- Artar ama giderek yavaşlar (üstelin tam tersi).
- Tanım kümesi \(x > 0\) (pozitif sayıların logaritması vardır).
- \(\log_b 1 = 0\) olduğu için daima \((1, 0)\)’dan geçer.
14.4 Doğal taban \(e\)
ML ve kalkülüste en sık kullanılan taban \(e \approx 2{,}718\)’dir. \(e^x\) üstel fonksiyonu, \(\ln x = \log_e x\) ise onun tersidir. Pratikte “üstel” denince çoğu zaman \(e^x\), “log” denince \(\ln\) kastedilir.
Üstel fonksiyon çarpımsaldır (sabit oran) ve yaygın fonksiyonlar içinde en hızlı büyüyendir. Logaritma onun tersidir: en yavaş yükselen fonksiyon. Bu ikisi, büyümenin ve onu geri çözmenin iki ucudur.
- \(b^x\) ile \(x^b\) karıştırılmaz: üstel fonksiyonda değişken üstte (\(2^x\)), kuvvet fonksiyonunda değişken tabanda (\(x^2\)) — büyüme hızları tamamen farklıdır.
- Üstel fonksiyon asla negatif ya da sıfır olmaz; çıktısı hep pozitiftir.
14.5 Örnek
Örnek 1. \(f(x) = 2^x\): \(f(3) = 8\), \(f(0) = 1\), \(f(-1) = \tfrac{1}{2}\).
Örnek 2. \(g(x) = \left(\tfrac{1}{3}\right)^x\): taban \(0 < b < 1\) olduğu için çürüme; \(g(2) = \tfrac{1}{9}\).
Örnek 3. \(\log_2 8 = 3\) (Logaritma dersinden): üssün tersi.
Üstel ve logaritma, sinir ağlarının her yerindedir:
- Sigmoid: \(\sigma(x) = \dfrac{1}{1 + e^{-x}}\) — herhangi bir reel sayıyı \((0, 1)\) aralığına, yani bir olasılığa sıkıştırır. Kalbinde \(e^{-x}\) vardır.
- Softmax: sınıf skorlarını üstel alıp olasılığa çevirir (çok sınıflı sınıflandırmanın çıkışı).
- Log-loss: Logaritma dersinde gördüğün logaritma, kaybın temelidir.
- Öğrenme oranı çürümesi: eğitimde adım boyu çoğu zaman üstel çürümeyle küçültülür.
Bu dersteki büyüme/çürüme eğrileri, o fonksiyonların ham hâlidir.
14.6 Alıştırmalar
- \(f(x) = 3^x\) için \(f(2) = ?\)
- \(f(x) = 2^x\) büyüme mi çürüme mi gösterir?
- \(f(x) = \left(\tfrac{1}{2}\right)^x\) büyüme mi çürüme mi gösterir?
- Her üstel fonksiyon \(b^x\) hangi noktadan geçer?
- \(\log_3 9 = ?\)
- \(f(x) = 5^x\) için \(f(0) = ?\)
- \(3^2 = 9\)
- Büyüme (taban \(b = 2 > 1\), artar)
- Çürüme (taban \(0 < \tfrac{1}{2} < 1\), azalır)
- \((0, 1)\), çünkü \(b^0 = 1\)
- \(2\), çünkü \(3^2 = 9\)
- \(1\), çünkü \(5^0 = 1\)
Sonraki ders: Fonksiyon Bileşkesi.