14  Üstel ve Logaritmik Fonksiyon

Büyüme, çürüme ve onların tersi — sigmoid’in temeli

Bölüm 1’de üs (Üslü İfadeler dersi) ve logaritmanın (Logaritma dersi) cebirini gördük. Şimdi bunları fonksiyon olarak ele alıp grafiklerine bakıyoruz. Bu iki şekil modern ML’in motorudur: sigmoid ve softmax doğrudan üstel fonksiyona, kayıp fonksiyonu ise logaritmaya dayanır.

14.1 Üstel fonksiyon: \(f(x) = b^x\)

Değişkenin üste çıktığı fonksiyondur (taban sabit, üs değişken):

\[f(x) = b^x \quad (b > 0,\; b \neq 1)\]

Şekil 14.1: Üstel fonksiyon: \(b>1\) büyüme (\(2^x\)), \(0<b<1\) çürüme (\((1/2)^x\)). İkisi de \((0,1)\)’den geçer ve daima pozitiftir.

Davranışı tabanın değerine bağlıdır:

  • \(b > 1\)büyüme: giderek daha hızlı artar (örn. \(2^x\)).
  • \(0 < b < 1\)çürüme: sıfıra doğru azalır (örn. \((1/2)^x\)).
  • Her zaman pozitiftir (görüntü kümesi \(> 0\)) ve \(b^0 = 1\) olduğu için daima \((0, 1)\)’den geçer.

14.2 Doğrusal vs üstel: sabit fark mı, sabit oran mı?

Doğrusal fonksiyon her adımda sabit bir miktar ekler; üstel fonksiyon her adımda sabit bir oranla çarpar. Fark görünüşte küçük, sonuç dramatiktir:

\(x\) Doğrusal \(y = 2x\) (+2) Üstel \(y = 2^x\) (×2)
0 0 1
1 2 2
2 4 4
3 6 8
4 8 16
5 10 32

Başta yakınlar, ama üstel kısa sürede doğrusalı ezer. “Üstel büyüme” deyiminin gücü buradan gelir.

14.3 Logaritmik fonksiyon: \(f(x) = \log_b x\)

Logaritma, üstelin tersidir (Logaritma dersindeki ayna ilişkisi). Bu yüzden üstelin zıttı gibi davranır:

  • Artar ama giderek yavaşlar (üstelin tam tersi).
  • Tanım kümesi \(x > 0\) (pozitif sayıların logaritması vardır).
  • \(\log_b 1 = 0\) olduğu için daima \((1, 0)\)’dan geçer.

14.4 Doğal taban \(e\)

ML ve kalkülüste en sık kullanılan taban \(e \approx 2{,}718\)’dir. \(e^x\) üstel fonksiyonu, \(\ln x = \log_e x\) ise onun tersidir. Pratikte “üstel” denince çoğu zaman \(e^x\), “log” denince \(\ln\) kastedilir.

Önemliİki uç

Üstel fonksiyon çarpımsaldır (sabit oran) ve yaygın fonksiyonlar içinde en hızlı büyüyendir. Logaritma onun tersidir: en yavaş yükselen fonksiyon. Bu ikisi, büyümenin ve onu geri çözmenin iki ucudur.

Uyarıİki tuzak
  • \(b^x\) ile \(x^b\) karıştırılmaz: üstel fonksiyonda değişken üstte (\(2^x\)), kuvvet fonksiyonunda değişken tabanda (\(x^2\)) — büyüme hızları tamamen farklıdır.
  • Üstel fonksiyon asla negatif ya da sıfır olmaz; çıktısı hep pozitiftir.

14.5 Örnek

Örnek 1. \(f(x) = 2^x\): \(f(3) = 8\), \(f(0) = 1\), \(f(-1) = \tfrac{1}{2}\).

Örnek 2. \(g(x) = \left(\tfrac{1}{3}\right)^x\): taban \(0 < b < 1\) olduğu için çürüme; \(g(2) = \tfrac{1}{9}\).

Örnek 3. \(\log_2 8 = 3\) (Logaritma dersinden): üssün tersi.

İpucuML köprüsü

Üstel ve logaritma, sinir ağlarının her yerindedir:

  • Sigmoid: \(\sigma(x) = \dfrac{1}{1 + e^{-x}}\) — herhangi bir reel sayıyı \((0, 1)\) aralığına, yani bir olasılığa sıkıştırır. Kalbinde \(e^{-x}\) vardır.
  • Softmax: sınıf skorlarını üstel alıp olasılığa çevirir (çok sınıflı sınıflandırmanın çıkışı).
  • Log-loss: Logaritma dersinde gördüğün logaritma, kaybın temelidir.
  • Öğrenme oranı çürümesi: eğitimde adım boyu çoğu zaman üstel çürümeyle küçültülür.

Bu dersteki büyüme/çürüme eğrileri, o fonksiyonların ham hâlidir.

14.6 Alıştırmalar

  1. \(f(x) = 3^x\) için \(f(2) = ?\)
  2. \(f(x) = 2^x\) büyüme mi çürüme mi gösterir?
  3. \(f(x) = \left(\tfrac{1}{2}\right)^x\) büyüme mi çürüme mi gösterir?
  4. Her üstel fonksiyon \(b^x\) hangi noktadan geçer?
  5. \(\log_3 9 = ?\)
  6. \(f(x) = 5^x\) için \(f(0) = ?\)
  1. \(3^2 = 9\)
  2. Büyüme (taban \(b = 2 > 1\), artar)
  3. Çürüme (taban \(0 < \tfrac{1}{2} < 1\), azalır)
  4. \((0, 1)\), çünkü \(b^0 = 1\)
  5. \(2\), çünkü \(3^2 = 9\)
  6. \(1\), çünkü \(5^0 = 1\)

Sonraki ders: Fonksiyon Bileşkesi.