18 Toplam Sembolü (Σ)
Çok terimi tek sembolde toplamak — ML’in en sık işlemi
Toplam sembolü \(\Sigma\) (büyük sigma), “şu terimleri topla” demenin kısa yoludur. ML’de en çok karşına çıkan semboldür: ortalama, kayıp fonksiyonu ve iç çarpım — hepsi birer toplamdır. Sembol ilk bakışta korkutucu görünür; aslında bir döngünün matematik yazımıdır.
18.1 Σ ne demek?
\[\sum_{i=1}^{n} a_i = a_1 + a_2 + a_3 + \dots + a_n\]
Sembolün dört parçası vardır:
- Toplam değişkeni (indis): \(i\) — alt sınırdan üst sınıra doğru tek tek değer alır.
- Alt sınır: \(i = 1\) — saymanın başladığı yer.
- Üst sınır: \(n\) — saymanın bittiği yer.
- Toplanan terim: \(a_i\) — her adımda hesaplanıp toplama eklenen ifade.
18.2 Nasıl açılır?
İndise sırayla değer ver, sonuçları topla:
\[\sum_{i=1}^{4} i = 1 + 2 + 3 + 4 = 10\] \[\sum_{i=1}^{3} i^2 = 1^2 + 2^2 + 3^2 = 1 + 4 + 9 = 14\] \[\sum_{i=1}^{3} 5 = 5 + 5 + 5 = 15 \quad (\text{sabit terim: } n \text{ kopya})\]
18.3 Σ kuralları
Bu üç kural ML’de toplamları sadeleştirmenin temelidir:
\[\sum_{i=1}^{n} c \cdot a_i = c \sum_{i=1}^{n} a_i \qquad \sum_{i=1}^{n} (a_i + b_i) = \sum_{i=1}^{n} a_i + \sum_{i=1}^{n} b_i \qquad \sum_{i=1}^{n} c = n c\]
Yani sabit çarpan dışarı alınır, toplam üzerinden açılır, sabitin toplamı \(n\) kopyadır.
18.4 Ortalama bir Σ’dır
Bir veri kümesinin ortalaması, aslında ölçeklenmiş bir toplamdır:
\[\bar{x} = \frac{1}{n} \sum_{i=1}^{n} x_i\]
\(\sum_{i=1}^{n} a_i\) sadece şu demektir: “\(i\)’yi \(1\)’den \(n\)’e kadar yürüt, her adımda \(a_i\)’yi hesapla, hepsini topla.” Bu, kodda bir for döngüsünün matematikteki yazımıdır — başka bir şey değil.
- Sınırlar dahildir: \(i = 1\)’den \(n\)’e demek, iki uç da dahil \(n\) terim demektir.
- Sabit terimin toplamı \(n\) kopyadır: \(\sum_{i=1}^{n} c = nc\), \(c\) değil. İndis adı önemsizdir; \(i\), \(j\), \(k\) aynı kapıya çıkar.
18.5 Örnek
Örnek 1. \(\displaystyle\sum_{i=1}^{3} 2i\) — kuralla: \(2\sum_{i=1}^{3} i = 2(1+2+3) = 2 \cdot 6 = 12\).
Örnek 2. \(\displaystyle\sum_{k=1}^{4} (k + 1) = (1{+}1) + (2{+}1) + (3{+}1) + (4{+}1) = 2 + 3 + 4 + 5 = 14\).
Σ, makine öğrenmesinin en sık işlemidir:
- Ortalama: \(\bar{x} = \dfrac{1}{n}\sum x_i\).
- MSE kaybı: \(\text{MSE} = \dfrac{1}{n}\sum_{i=1}^{n}(y_i - \hat{y}_i)^2\) — hataların karelerinin ortalaması (Parabol dersinden tanıdık parabol burada toplanıyor).
- İç çarpım / ağırlıklı toplam: \(y = \sum_{i=1}^{n} w_i x_i + b\) — tek bir nöronun hesabı. Bu, Doğrusal Fonksiyon ve Eğim dersindeki \(wx + b\)’nin çok özelliğe genelleşmiş hâlidir: her özellik \(x_i\) kendi ağırlığı \(w_i\) ile çarpılıp toplanır.
Kodda bu satırların hepsi bir for döngüsü veya bir np.sum çağrısıdır.
18.6 Alıştırmalar
- \(\displaystyle\sum_{i=1}^{5} i = ?\)
- \(\displaystyle\sum_{i=1}^{3} i^2 = ?\)
- \(\displaystyle\sum_{i=1}^{4} 3 = ?\)
- \(\displaystyle\sum_{i=1}^{3} 2i = ?\)
- \(\displaystyle\sum_{k=1}^{4} (k + 1) = ?\)
- \(x = (2, 4, 6)\) için ortalama \(\bar{x} = \dfrac{1}{3}\displaystyle\sum_{i=1}^{3} x_i = ?\)
- \(1 + 2 + 3 + 4 + 5 = 15\)
- \(1 + 4 + 9 = 14\)
- \(3 \cdot 4 = 12\) (dört kopya)
- \(2(1) + 2(2) + 2(3) = 2 + 4 + 6 = 12\)
- \(2 + 3 + 4 + 5 = 14\)
- \(\dfrac{2 + 4 + 6}{3} = \dfrac{12}{3} = 4\)
Sonraki ders: Pi Çarpım Notasyonu.