23 Vektör İşlemleri
Toplama ve skaler çarpım — eğitim güncellemesinin ta kendisi
Vektörlerle iki temel işlem yaparız: toplama ve skaler çarpım. Tüm lineer cebir bunların üstüne kurulur — ve bir modeli eğitirken yapılan ağırlık güncellemesi tam olarak bu iki işlemden ibarettir.
23.1 Vektör toplama
İki vektörü toplamak için karşılıklı bileşenleri toplarsın:
\[\vec{u} + \vec{v} = (u_1 + v_1,\; u_2 + v_2,\; \dots)\]
Geometrik anlamı uç-uca eklemedir: \(\vec{v}\)’yi \(\vec{u}\)’nun ucuna koyarsın; toplam, \(\vec{u}\)’nun başından \(\vec{v}\)’nin ucuna giden oktur.
23.2 Skaler çarpım
Bir vektörü bir sayıyla (skalerle) çarpmak, her bileşeni o sayıyla çarpmaktır:
\[c\,\vec{v} = (c v_1,\; c v_2,\; \dots)\]
Geometrik anlamı, okun uzunluğunu ölçeklemektir: \(c = 2\) iki katı uzun, \(c = \tfrac{1}{2}\) yarısı; \(c < 0\) ise oku ters yöne çevirir. Örneğin \(2(3,2) = (6,4)\), \(\;-1(3,2) = (-3,-2)\).
23.3 Vektör çıkarma
Çıkarma da bileşen bileşendir; aslında \(-1\) ile skaler çarpıp toplamaktır:
\[\vec{u} - \vec{v} = \vec{u} + (-1)\vec{v} = (u_1 - v_1,\; u_2 - v_2,\; \dots)\]
Örnek: \((5, 4) - (2, 1) = (3, 3)\).
Hem toplama hem skaler çarpım bileşen bazında çalışır. Geometride: toplama = okları uç-uca ekleme, skaler çarpım = oku uzatma/kısaltma (ve negatifse ters çevirme).
- Yalnızca aynı boyutlu vektörler toplanır/çıkarılır.
- Skaler çarpım her bileşene uygulanır, sadece birine değil. Negatif skaler oku kısaltmaz, yönünü ters çevirir (\(c = -1\) tam ters yön).
23.4 Örnek
Örnek 1 (toplama). \((2, 3) + (4, 1) = (6, 4)\).
Örnek 2 (skaler). \(3(1, 2) = (3, 6)\).
Örnek 3 (çıkarma). \((5, 7) - (2, 3) = (3, 4)\).
Bir modeli eğitmenin kalbindeki gradyan inişi güncellemesi tam olarak bu iki işlemdir:
\[\vec{w} \leftarrow \vec{w} - \eta \,\nabla L\]
Burada \(\nabla L\) gradyan vektörü, \(\eta\) (öğrenme oranı) bir skalerdir. Yani: gradyanı bir skalerle çarp (skaler çarpım), sonucu ağırlık vektöründen çıkar (vektör çıkarma). Her eğitim adımı, ağırlık vektörünü gradyanın ters yönünde küçük bir adım kaydırmaktan ibarettir — bu derste öğrendiğin iki işlem.
Embeddingleri birleştirmek veya ortalamak da yine vektör toplama ve skaler çarpımdır.
23.5 Alıştırmalar
- \((2, 3) + (4, 1) = ?\)
- \(3(1, 2) = ?\)
- \((5, 7) - (2, 3) = ?\)
- \(-2(1, -3) = ?\)
- \((1, 2, 3) + (4, 5, 6) = ?\)
- \(\dfrac{1}{2}(6, 4) = ?\)
- \((2+4,\; 3+1) = (6, 4)\)
- \((3 \cdot 1,\; 3 \cdot 2) = (3, 6)\)
- \((5-2,\; 7-3) = (3, 4)\)
- \((-2 \cdot 1,\; -2 \cdot (-3)) = (-2, 6)\)
- \((1+4,\; 2+5,\; 3+6) = (5, 7, 9)\)
- \(\left(\tfrac{1}{2} \cdot 6,\; \tfrac{1}{2} \cdot 4\right) = (3, 2)\)
Sonraki ders: İç Çarpım.