25  Vektör Uzunluğu ve Kosinüs Benzerliği

Büyüklük ve yön — embedding ve RAG’ın motoru

Son derse geldik. Bir vektörün iki temel ölçüsü vardır: uzunluğu (ne kadar büyük) ve başka bir vektörle yön benzerliği (ne kadar aynı tarafa bakıyorlar). İkincisi — kosinüs benzerliği — embedding ve RAG sistemlerinin motorudur; yani bu ders, foundation’dan senin günlük işine giden yolu kapatır.

25.1 Vektör uzunluğu (norm)

Bir vektörün uzunluğu, okun boyudur ve Pisagor teoreminden gelir:

\[|\vec{v}| = \sqrt{v_1^2 + v_2^2 + \dots + v_n^2} = \sqrt{\vec{v} \cdot \vec{v}}\]

Sağdaki sadeleştirme İç Çarpım dersinden: bir vektörün kendisiyle iç çarpımı, uzunluğunun karesidir.

Şekil 25.1: Vektör uzunluğu Pisagor’dan gelir: (3,4) vektörünün bileşenleri 3 ve 4 dik kenarlar, uzunluğu hipotenüs = 5.

Örnek: \(|(3, 4)| = \sqrt{3^2 + 4^2} = \sqrt{9 + 16} = \sqrt{25} = 5\).

25.2 Birim vektör

Uzunluğu \(1\) olan vektöre birim vektör denir. Herhangi bir vektörü uzunluğuna bölerek birim vektöre çevirirsin (normalize):

\[\hat{v} = \frac{\vec{v}}{|\vec{v}|}\]

Bu, yönü korur ama uzunluğu \(1\)’e sabitler. Örneğin \((3, 4)\)’ün birim vektörü \(\left(\tfrac{3}{5}, \tfrac{4}{5}\right) = (0{,}6,\; 0{,}8)\).

25.3 Kosinüs benzerliği

İki vektörün yönlerinin ne kadar benzer olduğunu, büyüklüklerinden bağımsız ölçer. İç Çarpım dersindeki \(\vec{u} \cdot \vec{v} = |\vec{u}||\vec{v}|\cos\theta\) formülünü \(\cos\theta\) için çözersin:

\[\cos\theta = \frac{\vec{u} \cdot \vec{v}}{|\vec{u}|\,|\vec{v}|}\]

Değeri \(-1\) ile \(1\) arasındadır:

  • \(1\) → aynı yön (en benzer),
  • \(0\) → dik (ilişkisiz),
  • \(-1\) → zıt yön (en farklı).

Örnek: \((3, 4)\) ve \((4, 3)\) için iç çarpım \(= 24\), uzunluklar \(5\) ve \(5\), kosinüs benzerliği \(= \tfrac{24}{25} = 0{,}96\) — neredeyse aynı yön.

ÖnemliBüyüklük mü, yön mü

Uzunluk vektörün ne kadar büyük olduğunu söyler; kosinüs benzerliği iki vektörün ne kadar aynı yöne baktığını — büyüklükten bağımsız olarak. Kosinüs benzerliği daima \([-1, 1]\) aralığındadır.

Uyarıİki tuzak
  • Uzunluk için karekök şart: \(\vec{v} \cdot \vec{v}\) uzunluğun karesidir, uzunluğun kendisi değil.
  • Kosinüs benzerliği yönü ölçer, mesafeyi değil. Birbirinden çok uzak iki nokta bile aynı yöne bakıyorsa kosinüs benzerlikleri \(1\) olabilir.

25.4 Örnek

Örnek 1 (uzunluk). \(|(6, 8)| = \sqrt{36 + 64} = \sqrt{100} = 10\).

Örnek 2 (kosinüs). \((2, 0)\) ile \((4, 0)\): iç çarpım \(8\), uzunluklar \(2\) ve \(4\); \(\cos\theta = \tfrac{8}{2 \cdot 4} = 1\) — uzunlukları farklı olsa da tam aynı yön.

İpucuML köprüsü

Kosinüs benzerliği, embedding ve RAG sistemlerinin çekirdeğidir:

  • Bir RAG sistemi, sorguyu ve belgeleri birer embedding vektörüne çevirir, sonra sorguya en yakın belgeleri kosinüs benzerliğine göre sıralayıp getirir. Bir vektör veritabanının (örneğin senin Qdrant bilgi tabanın) yaptığı tam olarak budur — yüksek boyutlu vektörler arasında yön benzerliği araması.
  • Neden mesafe değil de kosinüs? Çünkü anlam yönde kodlanır: aynı konudaki iki belge, uzunlukları ne olursa olsun aynı yöne bakar.
  • Embeddingler çoğu zaman birim vektöre normalize edilir; o zaman kosinüs benzerliği doğrudan iç çarpıma eşit olur (payda \(1\)).

Böylece tüm yol kapanıyor: sayı → fonksiyon → vektör → iç çarpım → benzerlik → getirme. Foundation’ın son tuğlası, senin sistemlerinin temel işlemiyle birleşti.

25.5 Alıştırmalar

  1. \(|(3, 4)| = ?\)
  2. \(|(6, 8)| = ?\)
  3. \(|(1, 2, 2)| = ?\)
  4. \((3, 4)\) vektörünün birim vektörü nedir?
  5. \((1, 0)\) ile \((0, 1)\) arasındaki kosinüs benzerliği nedir? (ne anlama gelir?)
  6. \((2, 0)\) ile \((4, 0)\) arasındaki kosinüs benzerliği nedir?
  1. \(\sqrt{3^2 + 4^2} = \sqrt{25} = 5\)
  2. \(\sqrt{6^2 + 8^2} = \sqrt{100} = 10\)
  3. \(\sqrt{1 + 4 + 4} = \sqrt{9} = 3\)
  4. \(\dfrac{(3, 4)}{5} = \left(\tfrac{3}{5}, \tfrac{4}{5}\right) = (0{,}6,\; 0{,}8)\)
  5. İç çarpım \(= 0\), uzunluklar \(1\) ve \(1\), \(\cos\theta = 0\) → dik, ilişkisiz.
  6. İç çarpım \(= 8\), uzunluklar \(2\) ve \(4\), \(\cos\theta = \tfrac{8}{8} = 1\) → aynı yön (uzunluk farkı önemsiz).

Phase 0 — Temel Matematik tamamlandı. Buradan sonra: lineer cebir, kalkülüs ve olasılık sütunları — hepsi bu temelin üstüne kurulur.