13 Parabol
İkinci derece fonksiyonun U biçimi — ML’deki kayıp çukuru
İkinci derece bir fonksiyonun grafiği bir paraboldür — U biçimli bir eğri. Bölüm 1’de ikinci derece denklemleri çözmüştük; şimdi o denklemin grafiğine bakıyoruz. Bu şekil ML’de doğrudan karşına çıkar: kayıp fonksiyonu (loss) çoğu zaman tam böyle bir çukurdur ve eğitim, o çukurun dibini aramaktır.
13.1 Parabol: \(y = ax^2 + bx + c\)
\[f(x) = ax^2 + bx + c \quad (a \neq 0)\]
13.2 \(a\) kolların yönünü ve genişliğini belirler
- \(a > 0\) → kollar yukarı açılır, parabolün bir minimumu vardır (çukur).
- \(a < 0\) → kollar aşağı açılır, bir maksimumu vardır (tepe).
- \(|a|\) büyüdükçe parabol darlaşır; küçüldükçe yayvanlaşır.
13.3 Tepe noktası
Tepe noktası, parabolün döndüğü yerdir — minimum ya da maksimum. \(x\) koordinatı:
\[x_{\text{tepe}} = -\frac{b}{2a}\]
Bu \(x\)’i fonksiyona koyunca tepe noktasının \(y\) değeri çıkar. \(a > 0\) ise tepe en alçak nokta (minimum), \(a < 0\) ise en yüksek nokta (maksimum).
13.4 Kökler ve diskriminant
Parabolün \(x\) eksenini kestiği yerler köklerdir (\(y = 0\)). Bunlar Bölüm 1’deki ikinci derece denklemin çözümleridir; kaç tane olduğunu diskriminant \(\Delta = b^2 - 4ac\) söyler:
- \(\Delta > 0\) → iki kök (parabol ekseni iki noktada keser),
- \(\Delta = 0\) → bir kök (tepe tam eksenin üstünde),
- \(\Delta < 0\) → reel kök yok (parabol ekseni hiç kesmez).
\(a\) parabolün yönünü ve genişliğini, tepe noktası ise dönüm yerini (min/max) verir. Optimizasyonda asıl peşinde olduğumuz şey bu tepe noktasıdır — fonksiyonun en küçük (veya en büyük) değeri orada.
13.5 Örnek
\(f(x) = x^2 - 4x + 3\) paraboli:
- \(a = 1 > 0\) → kollar yukarı, minimum var.
- Tepe: \(x = -\dfrac{-4}{2(1)} = 2\), sonra \(f(2) = 4 - 8 + 3 = -1\) → tepe \((2, -1)\).
- Kökler: \(x^2 - 4x + 3 = (x-1)(x-3) = 0 \Rightarrow x = 1,\; x = 3\).
- \(y\)-kesişimi: \(c = 3\).
- Tepe formülü \(-\dfrac{b}{2a}\)’dır; baştaki eksi işaretini unutma.
- Her parabol \(x\) eksenini kesmez (\(\Delta < 0\) ise kök yoktur) — ama yine de bir tepe noktası vardır. “Kök yok” demek “tepe yok” demek değildir.
Bir modeli eğitirken, hatayı ölçen bir kayıp fonksiyonu (loss) tanımlarız — en yaygını ortalama kare hata (MSE). Tek bir ağırlığın fonksiyonu olarak çizildiğinde MSE tam bir paraboldür: yukarı açılan bir çukur. Eğitim, bu çukurun dibine (tepe noktası = minimum kayıp) inmektir; gradyan inişi adım adım o dibe yuvarlanır.
\(a > 0\) olan çukur biçimi “konveks” demektir — tek bir minimum vardır, bu yüzden optimize etmesi kolaydır. Parabolün geometrisi, modelin nasıl öğrendiğinin doğrudan resmidir.
13.6 Alıştırmalar
- \(y = x^2 - 6x + 5\) paraboli yukarı mı aşağı mı açılır?
- \(y = -2x^2 + 4x\) paraboli tepe noktasının \(x\) koordinatı nedir?
- \(y = x^2 - 4\) paraboli kökleri nelerdir?
- \(y = 3x^2 + 2x - 1\) paraboli \(y\)-kesişimi nedir?
- \(y = x^2 - 6x + 5\) paraboli tepe noktası (\(x\) ve \(y\))?
- \(y = -x^2 + 1\) paraboli maksimum mu minimum mu vardır?
- Yukarı (\(a = 1 > 0\)).
- \(x = -\dfrac{4}{2(-2)} = -\dfrac{4}{-4} = 1\).
- \(x^2 - 4 = 0 \Rightarrow x^2 = 4 \Rightarrow x = 2\) veya \(x = -2\).
- \(c = -1\).
- \(x = -\dfrac{-6}{2(1)} = 3\), sonra \(f(3) = 9 - 18 + 5 = -4\) → tepe \((3, -4)\).
- Maksimum (\(a = -1 < 0\), kollar aşağı).
Sonraki ders: Üstel ve Logaritmik Fonksiyon.