18  Toplam Sembolü (Σ)

Çok terimi tek sembolde toplamak — ML’in en sık işlemi

Toplam sembolü \(\Sigma\) (büyük sigma), “şu terimleri topla” demenin kısa yoludur. ML’de en çok karşına çıkan semboldür: ortalama, kayıp fonksiyonu ve iç çarpım — hepsi birer toplamdır. Sembol ilk bakışta korkutucu görünür; aslında bir döngünün matematik yazımıdır.

18.1 Σ ne demek?

\[\sum_{i=1}^{n} a_i = a_1 + a_2 + a_3 + \dots + a_n\]

Sembolün dört parçası vardır:

Şekil 18.1: Toplam sembolünün anatomisi: alt sınır (başlangıç), üst sınır (bitiş), toplanan terim ve toplam sembolünün kendisi. İndis \(i\) alttan üste sırayla değer alır.
  • Toplam değişkeni (indis): \(i\) — alt sınırdan üst sınıra doğru tek tek değer alır.
  • Alt sınır: \(i = 1\) — saymanın başladığı yer.
  • Üst sınır: \(n\) — saymanın bittiği yer.
  • Toplanan terim: \(a_i\) — her adımda hesaplanıp toplama eklenen ifade.

18.2 Nasıl açılır?

İndise sırayla değer ver, sonuçları topla:

\[\sum_{i=1}^{4} i = 1 + 2 + 3 + 4 = 10\] \[\sum_{i=1}^{3} i^2 = 1^2 + 2^2 + 3^2 = 1 + 4 + 9 = 14\] \[\sum_{i=1}^{3} 5 = 5 + 5 + 5 = 15 \quad (\text{sabit terim: } n \text{ kopya})\]

18.3 Σ kuralları

Bu üç kural ML’de toplamları sadeleştirmenin temelidir:

\[\sum_{i=1}^{n} c \cdot a_i = c \sum_{i=1}^{n} a_i \qquad \sum_{i=1}^{n} (a_i + b_i) = \sum_{i=1}^{n} a_i + \sum_{i=1}^{n} b_i \qquad \sum_{i=1}^{n} c = n c\]

Yani sabit çarpan dışarı alınır, toplam üzerinden açılır, sabitin toplamı \(n\) kopyadır.

18.4 Ortalama bir Σ’dır

Bir veri kümesinin ortalaması, aslında ölçeklenmiş bir toplamdır:

\[\bar{x} = \frac{1}{n} \sum_{i=1}^{n} x_i\]

ÖnemliKorkutucu değil

\(\sum_{i=1}^{n} a_i\) sadece şu demektir: “\(i\)’yi \(1\)’den \(n\)’e kadar yürüt, her adımda \(a_i\)’yi hesapla, hepsini topla.” Bu, kodda bir for döngüsünün matematikteki yazımıdır — başka bir şey değil.

Uyarıİki tuzak
  • Sınırlar dahildir: \(i = 1\)’den \(n\)’e demek, iki uç da dahil \(n\) terim demektir.
  • Sabit terimin toplamı \(n\) kopyadır: \(\sum_{i=1}^{n} c = nc\), \(c\) değil. İndis adı önemsizdir; \(i\), \(j\), \(k\) aynı kapıya çıkar.

18.5 Örnek

Örnek 1. \(\displaystyle\sum_{i=1}^{3} 2i\) — kuralla: \(2\sum_{i=1}^{3} i = 2(1+2+3) = 2 \cdot 6 = 12\).

Örnek 2. \(\displaystyle\sum_{k=1}^{4} (k + 1) = (1{+}1) + (2{+}1) + (3{+}1) + (4{+}1) = 2 + 3 + 4 + 5 = 14\).

İpucuML köprüsü

Σ, makine öğrenmesinin en sık işlemidir:

  • Ortalama: \(\bar{x} = \dfrac{1}{n}\sum x_i\).
  • MSE kaybı: \(\text{MSE} = \dfrac{1}{n}\sum_{i=1}^{n}(y_i - \hat{y}_i)^2\) — hataların karelerinin ortalaması (Parabol dersinden tanıdık parabol burada toplanıyor).
  • İç çarpım / ağırlıklı toplam: \(y = \sum_{i=1}^{n} w_i x_i + b\) — tek bir nöronun hesabı. Bu, Doğrusal Fonksiyon ve Eğim dersindeki \(wx + b\)’nin çok özelliğe genelleşmiş hâlidir: her özellik \(x_i\) kendi ağırlığı \(w_i\) ile çarpılıp toplanır.

Kodda bu satırların hepsi bir for döngüsü veya bir np.sum çağrısıdır.

18.6 Alıştırmalar

  1. \(\displaystyle\sum_{i=1}^{5} i = ?\)
  2. \(\displaystyle\sum_{i=1}^{3} i^2 = ?\)
  3. \(\displaystyle\sum_{i=1}^{4} 3 = ?\)
  4. \(\displaystyle\sum_{i=1}^{3} 2i = ?\)
  5. \(\displaystyle\sum_{k=1}^{4} (k + 1) = ?\)
  6. \(x = (2, 4, 6)\) için ortalama \(\bar{x} = \dfrac{1}{3}\displaystyle\sum_{i=1}^{3} x_i = ?\)
  1. \(1 + 2 + 3 + 4 + 5 = 15\)
  2. \(1 + 4 + 9 = 14\)
  3. \(3 \cdot 4 = 12\) (dört kopya)
  4. \(2(1) + 2(2) + 2(3) = 2 + 4 + 6 = 12\)
  5. \(2 + 3 + 4 + 5 = 14\)
  6. \(\dfrac{2 + 4 + 6}{3} = \dfrac{12}{3} = 4\)

Sonraki ders: Pi Çarpım Notasyonu.