📥 PDF İndir (tek dosya, 490 sayfa)

Matris Yöntemleri — MIT 18.065 Strang’den

ML Builder için Türkçe Notlar

Yazar

Phase 2

Yayınlanma Tarihi

2026-06-07

1 Bu kitap nedir?

Bu, Gilbert Strang — MIT 18.065: Matrix Methods in Data Analysis, Signal Processing, and Machine Learning ders serisinin Türkçe ders notlarıdır. Hedef, videoları izlerken paralel okunabilecek; sonradan tek başına da yeterli olabilecek bir referans seti üretmek.

18.065’in tek bir iddiası var ve her ders onu biraz daha somutlaştırır: modern makine öğrenmesi, lineer cebirin üstünde durur. Strang’in 18.06’da kurduğu klasik lineer cebiri (kolon uzayı, özdeğerler, SVD) alıp, doğrudan veriden öğrenmeye — düşük-rank yaklaşıma, gradyan inişine, sinir ağlarına — bağlar. Strang’in sözüyle: “Linear algebra is the secret to everything.”

Her bölüm bir Builder Notu katmanı taşır: kavramın hem geriye (18.06 klasik lineer cebir, calculus, olasılık) hem de ileriye (PCA, LoRA, backprop, CNN, spektral kümeleme) köprüsü. Bu seriyi “soyut matris teorisi” olarak değil, veri-odaklı düşünme disipliniyle okuyoruz: her teorem bir ML aracına iner.

NotKaynak
  • Seri: MIT 18.065 — Video Lectures (OCW) — Gilbert Strang, Bahar 2018
  • Yazar: Gilbert Strang — MIT matematik profesörü, Linear Algebra and Learning from Data (2019) kitabının yazarı
  • Önkoşul: Klasik lineer cebir (18.06 / Phase 1 Lineer Cebir) — bu seri onun ML-uygulamalı devamıdır
  • Çeviri ve genişletme: Phase 2 (TR + ML Builder köprüleri)

2 Nasıl Okumalı

Sıralı oku. Seri kümülatiftir — her ders bir öncekinin kurduğu faktorizasyon dilini kullanır. İlk blok (Ders 1–7) lineer cebirin omurgasını ML gözüyle yeniden çerçeveler: kolon uzayı, beş faktorizasyon, özdeğerler, pozitif tanımlılık, SVD. Orta blok (Ders 8–19) sayısal lineer cebir ve matris analizidir. Son blok (Ders 20–36) optimizasyon, derin öğrenme ve sinyal işlemeye iner.

Strang’in önerdiği akış: önce videoyu izle, sonra ilgili dersi oku, en sonunda kendi elinle hesapla — küçük matrislerle faktorizasyonları, numpy ile doğrulamaları. Bu set videoyu destekler, ikame etmez.

İpucuPratik bir tavsiye

Her bölüm sonundaki egzersizleri atlama. Strang’in felsefesi tek cümle: küçük bir matrisle eline al. Bir 3×3 matrisin rankını, A = CR’sini, SVD’sini elle bul; sonra numpy ile kontrol et. Aynı faktorizasyonu ileride PCA, LoRA, en küçük kareler kılığında yıllarca farklı yerlerde göreceksin; bir kez elle yapmak onu kara kutu olmaktan çıkarır.

3 34 Ders

Seri kolon uzayından başlayıp SVD, optimizasyon ve sinir ağlarına doğru tırmanır. (OCW kaydında Ders 28–29 laboratuvar oturumları kaydedilmemiştir; numaralandırma OCW ile birebir korunur.)

# Ders Ana Fikir
1 Kolon Uzayı — A = CR Ax = kolonların kombinasyonu; rank; kolon rank = satır rank
2 Beş Faktorizasyon LU, QR, QΛQᵀ, SVD, CR — her biri bir soruya cevap
3 Ortonormal Kolonlar — QᵀQ = I Ortogonallik, dönme/yansıma, uzunluk koruyan matrisler
4 Özdeğerler ve Özvektörler Ax = λx; QΛQ⁻¹ ile köşegenleştirme
5 Pozitif Tanımlı Matrisler Enerji xᵀAx > 0; tüm λ > 0; optimizasyonun temeli
6 Tekil Değer Ayrışımı (SVD) A = UΣVᵀ — her matris için var olan ayrışım
7 Eckart-Young / PCA En iyi düşük-rank yaklaşım = en büyük σ’lar
8 Vektör ve Matris Normları ‖·‖₁, ‖·‖₂, ‖·‖∞, Frobenius, nükleer norm
9 En Küçük Kareler — Dört Yol AᵀA x̂ = Aᵀb; projeksiyon, QR, SVD, pseudoinverse
10 Ax = b Çözmenin Zorlukları Kondisyon sayısı, kötü koşulluluk, Krylov
11 Min ‖x‖ ve Gram-Schmidt Ortonormalleştirme; Arnoldi, Lanczos
12 Özdeğer / Tekil Değer Hesaplamak QR algoritması, kaydırma, sayısal yöntemler
13 Rastlantısal Matris Çarpımı Sütun-satır örnekleme; randomized lineer cebir
14 Düşük-Rank Değişim (SMW) Sherman-Morrison-Woodbury; güncellemeler
15 A(t)’nin Türevi — dA/dt Matris değişiminin türevi; özdeğer hassasiyeti
16 Ters ve Tekil Değer Türevleri Pertürbasyon; interlacing, Weyl eşitsizlikleri
17 Hızla Azalan Tekil Değerler Düşük-rank yaklaşılabilirlik (konuk: A. Townsend)
18 Parametre Sayımı ve Eyer Noktaları Serbestlik dereceleri; Rayleigh oranı
19 Maxmin Karakterizasyonu Courant-Fischer; eyer noktası prensibi
20 Ortalama, Varyans, Kovaryans Kovaryans matrisi; PCA’nın olasılık temeli
21 Newton Yöntemi ve Konvekslik İkinci-derece optimizasyon; konveks fonksiyonlar
22 Gradyan İnişi x ← x − η∇f; line search; en temel optimizatör
23 Momentum ve Nesterov Hızlandırılmış gradyan; ağır-top yöntemi
24 Doğrusal Programlama ve Oyunlar Dualite, simpleks, iç-nokta yöntemleri
25 Stokastik Gradyan İnişi (SGD) Mini-batch; derin öğrenmenin iş atı (konuk: S. Sra)
26 Sinir Ağı Yapısı ve ReLU Parçalı-doğrusal fonksiyonlar; evrensellik
27 Geri Yayılım (Backprop) Zincir kuralı = reverse-mode AD; matris-zinciri görüşü
30 Sirkülant Matrisler / Matris Tamamlama Konvolüsyon, rank-1 tamamlama
31 Fourier Matrisi / Normal Matrisler FFT; AAᵀ = AᵀA olan matrisler
32 CNN / Evrişim Kuralı / Kronecker Ağırlık paylaşımı; Kronecker çarpımı/toplamı
33 Öğrenme Fonksiyonu F(x,v) / Uzaklık Matrisleri NN’in öğrendiği fonksiyon; Gram, Cholesky
34 Procrustes / Q = UVᵀ En yakın ortogonal matris; uzaklık matrisleri
35 Graf Kümeleme / Laplacian k-means, spektral kümeleme, Fiedler vektörü
36 Edelman/Julia — İleri + Geri AD Dual sayılar; backprop = (I−L)⁻¹ üçgen çözüm (SON DERS)

Not: Phase 2 pilotu Ders 1 (Kolon Uzayı) ile başlar. Dersler 2–36 aynı şablonla eklenecektir.

4 Notasyon

  • Matris ve vektör: \(A\) matris, \(x\) vektör (kolon vektörü, NumPy/Julia/MATLAB konvansiyonu)
  • Kolon kombinasyonu: \(Ax = x_1 a_1 + x_2 a_2 + \cdots + x_n a_n\)\(a_k\), \(A\)’nın \(k\). kolonu
  • Kolon uzayı: \(C(A)\) — tüm \(Ax\)’lerin kümesi; satır uzayı: \(C(A^{T})\)
  • Rank: \(r\) — bağımsız kolon sayısı = bağımsız satır sayısı = \(C(A)\)’nın boyutu
  • Dış çarpım: \(a\,b^{T}\) — bir kolon çarpı bir satır = rank-1 matris (yapı taşı)
  • Beş faktorizasyon: \(A = CR\) (rank), \(A = LU\) (eliminasyon), \(A = QR\) (ortonormallik), \(A = Q\Lambda Q^{T}\) (özdeğer), \(A = U\Sigma V^{T}\) (tekil değer)
  • Özdeğer / tekil değer: \(Ax = \lambda x\); \(\sigma_i\) = \(A\)’nın tekil değerleri
  • Norm: \(\|x\|\) vektör normu, \(\|A\|\) matris normu

Tüm matematik MathJax 3 ile render ediliyor.

5 Builder Eksen — Lineer Cebir → Makine Öğrenmesi

İpucuHer ders bu bağlantı katmanını taşır
18.065 kavramı ML / veri bilimi karşılığı
\(A = CR\) / düşük-rank LoRA fine-tuning, model sıkıştırma, CUR
SVD + Eckart-Young PCA, gürültü giderme, latent uzay, öneri sistemleri
Rank-1 = dış çarpım attention \(QK^{T}\), ağırlık güncellemeleri, yapı taşı
\(A^{T}A\) / kovaryans PCA, en küçük kareler, Gram matrisi, kernel trick
Pozitif tanımlılık konveks optimizasyon, kayıp yüzeyinin şekli
Gradyan inişi / SGD sinir ağı eğitimi (tüm derin öğrenme)
Backprop = reverse-mode AD torch.autograd, loss.backward()
Fourier / sirkülant konvolüsyon, FFT, CNN ağırlık paylaşımı
Graf Laplacian spektral kümeleme, graf sinir ağları (GNN)
ÖnemliBir tek şey

Lineer cebir, bir matrise bir bütün olarak bakmayı öğretir: kolonlarının gerdiği uzay, o uzayın boyutu (rank), ve matrisin onu açığa çıkaran faktorizasyonu. Modern ML’in tamamı — sıkıştırmadan optimizasyona, konvolüsyondan attention’a — bu birkaç faktorizasyonun (CR, QR, QΛQᵀ, SVD) üstünde durur. 18.065 bu köprüyü ders ders kurar.

6 Yazım Kuralları

  • Türkçe terminoloji + parantez içinde İngilizce orijinal ilk geçtiğinde: “kolon uzayı (column space)”, “tekil değer ayrışımı (SVD)”, “düşük-rank (low-rank)”.
  • Strang’den alıntılar İngilizce orijinal hâliyle, blockquote içinde, zaman damgasıyla verilir.
  • Builder Notu callout’ları her ana bölüm sonunda; ML köprüsünü (geriye + ileriye) buraya yazıyoruz.
  • Figürler tam, sayısal doğru bir numpy motoru kullanan executable hücrelerdir; kaynak kod code-fold ile katlanabilir (matematik + figür ön planda, kod erişilebilir).
  • Kontrol Soruları collapse’lu — cevap kapalı başlar, okur kendi düşündükten sonra açar.
  • Egzersizler cevapsız — en az bir elle-hesaplama + numpy doğrulaması.
UyarıBu kitap Strang’in yerine geçmez

Tek başına bu set yetmez — Strang’in tahtada matrisleri elle çevirerek anlattığı sezginin yerine geçemez. Önce videoyu izle, sonra ilgili dersi oku, son olarak küçük matrislerle kendin hesapla. Set videoyu destekler, ikame etmez.