Matris Yöntemleri — MIT 18.065 Strang’den
ML Builder için Türkçe Notlar
1 Bu kitap nedir?
Bu, Gilbert Strang — MIT 18.065: Matrix Methods in Data Analysis, Signal Processing, and Machine Learning ders serisinin Türkçe ders notlarıdır. Hedef, videoları izlerken paralel okunabilecek; sonradan tek başına da yeterli olabilecek bir referans seti üretmek.
18.065’in tek bir iddiası var ve her ders onu biraz daha somutlaştırır: modern makine öğrenmesi, lineer cebirin üstünde durur. Strang’in 18.06’da kurduğu klasik lineer cebiri (kolon uzayı, özdeğerler, SVD) alıp, doğrudan veriden öğrenmeye — düşük-rank yaklaşıma, gradyan inişine, sinir ağlarına — bağlar. Strang’in sözüyle: “Linear algebra is the secret to everything.”
Her bölüm bir Builder Notu katmanı taşır: kavramın hem geriye (18.06 klasik lineer cebir, calculus, olasılık) hem de ileriye (PCA, LoRA, backprop, CNN, spektral kümeleme) köprüsü. Bu seriyi “soyut matris teorisi” olarak değil, veri-odaklı düşünme disipliniyle okuyoruz: her teorem bir ML aracına iner.
- Seri: MIT 18.065 — Video Lectures (OCW) — Gilbert Strang, Bahar 2018
- Yazar: Gilbert Strang — MIT matematik profesörü, Linear Algebra and Learning from Data (2019) kitabının yazarı
- Önkoşul: Klasik lineer cebir (18.06 / Phase 1 Lineer Cebir) — bu seri onun ML-uygulamalı devamıdır
- Çeviri ve genişletme: Phase 2 (TR + ML Builder köprüleri)
2 Nasıl Okumalı
Sıralı oku. Seri kümülatiftir — her ders bir öncekinin kurduğu faktorizasyon dilini kullanır. İlk blok (Ders 1–7) lineer cebirin omurgasını ML gözüyle yeniden çerçeveler: kolon uzayı, beş faktorizasyon, özdeğerler, pozitif tanımlılık, SVD. Orta blok (Ders 8–19) sayısal lineer cebir ve matris analizidir. Son blok (Ders 20–36) optimizasyon, derin öğrenme ve sinyal işlemeye iner.
Strang’in önerdiği akış: önce videoyu izle, sonra ilgili dersi oku, en sonunda kendi elinle hesapla — küçük matrislerle faktorizasyonları, numpy ile doğrulamaları. Bu set videoyu destekler, ikame etmez.
Her bölüm sonundaki egzersizleri atlama. Strang’in felsefesi tek cümle: küçük bir matrisle eline al. Bir 3×3 matrisin rankını, A = CR’sini, SVD’sini elle bul; sonra numpy ile kontrol et. Aynı faktorizasyonu ileride PCA, LoRA, en küçük kareler kılığında yıllarca farklı yerlerde göreceksin; bir kez elle yapmak onu kara kutu olmaktan çıkarır.
3 34 Ders
Seri kolon uzayından başlayıp SVD, optimizasyon ve sinir ağlarına doğru tırmanır. (OCW kaydında Ders 28–29 laboratuvar oturumları kaydedilmemiştir; numaralandırma OCW ile birebir korunur.)
| # | Ders | Ana Fikir |
|---|---|---|
| 1 | Kolon Uzayı — A = CR | Ax = kolonların kombinasyonu; rank; kolon rank = satır rank |
| 2 | Beş Faktorizasyon | LU, QR, QΛQᵀ, SVD, CR — her biri bir soruya cevap |
| 3 | Ortonormal Kolonlar — QᵀQ = I | Ortogonallik, dönme/yansıma, uzunluk koruyan matrisler |
| 4 | Özdeğerler ve Özvektörler | Ax = λx; QΛQ⁻¹ ile köşegenleştirme |
| 5 | Pozitif Tanımlı Matrisler | Enerji xᵀAx > 0; tüm λ > 0; optimizasyonun temeli |
| 6 | Tekil Değer Ayrışımı (SVD) | A = UΣVᵀ — her matris için var olan ayrışım |
| 7 | Eckart-Young / PCA | En iyi düşük-rank yaklaşım = en büyük σ’lar |
| 8 | Vektör ve Matris Normları | ‖·‖₁, ‖·‖₂, ‖·‖∞, Frobenius, nükleer norm |
| 9 | En Küçük Kareler — Dört Yol | AᵀA x̂ = Aᵀb; projeksiyon, QR, SVD, pseudoinverse |
| 10 | Ax = b Çözmenin Zorlukları | Kondisyon sayısı, kötü koşulluluk, Krylov |
| 11 | Min ‖x‖ ve Gram-Schmidt | Ortonormalleştirme; Arnoldi, Lanczos |
| 12 | Özdeğer / Tekil Değer Hesaplamak | QR algoritması, kaydırma, sayısal yöntemler |
| 13 | Rastlantısal Matris Çarpımı | Sütun-satır örnekleme; randomized lineer cebir |
| 14 | Düşük-Rank Değişim (SMW) | Sherman-Morrison-Woodbury; güncellemeler |
| 15 | A(t)’nin Türevi — dA/dt | Matris değişiminin türevi; özdeğer hassasiyeti |
| 16 | Ters ve Tekil Değer Türevleri | Pertürbasyon; interlacing, Weyl eşitsizlikleri |
| 17 | Hızla Azalan Tekil Değerler | Düşük-rank yaklaşılabilirlik (konuk: A. Townsend) |
| 18 | Parametre Sayımı ve Eyer Noktaları | Serbestlik dereceleri; Rayleigh oranı |
| 19 | Maxmin Karakterizasyonu | Courant-Fischer; eyer noktası prensibi |
| 20 | Ortalama, Varyans, Kovaryans | Kovaryans matrisi; PCA’nın olasılık temeli |
| 21 | Newton Yöntemi ve Konvekslik | İkinci-derece optimizasyon; konveks fonksiyonlar |
| 22 | Gradyan İnişi | x ← x − η∇f; line search; en temel optimizatör |
| 23 | Momentum ve Nesterov | Hızlandırılmış gradyan; ağır-top yöntemi |
| 24 | Doğrusal Programlama ve Oyunlar | Dualite, simpleks, iç-nokta yöntemleri |
| 25 | Stokastik Gradyan İnişi (SGD) | Mini-batch; derin öğrenmenin iş atı (konuk: S. Sra) |
| 26 | Sinir Ağı Yapısı ve ReLU | Parçalı-doğrusal fonksiyonlar; evrensellik |
| 27 | Geri Yayılım (Backprop) | Zincir kuralı = reverse-mode AD; matris-zinciri görüşü |
| 30 | Sirkülant Matrisler / Matris Tamamlama | Konvolüsyon, rank-1 tamamlama |
| 31 | Fourier Matrisi / Normal Matrisler | FFT; AAᵀ = AᵀA olan matrisler |
| 32 | CNN / Evrişim Kuralı / Kronecker | Ağırlık paylaşımı; Kronecker çarpımı/toplamı |
| 33 | Öğrenme Fonksiyonu F(x,v) / Uzaklık Matrisleri | NN’in öğrendiği fonksiyon; Gram, Cholesky |
| 34 | Procrustes / Q = UVᵀ | En yakın ortogonal matris; uzaklık matrisleri |
| 35 | Graf Kümeleme / Laplacian | k-means, spektral kümeleme, Fiedler vektörü |
| 36 | Edelman/Julia — İleri + Geri AD | Dual sayılar; backprop = (I−L)⁻¹ üçgen çözüm (SON DERS) |
Not: Phase 2 pilotu Ders 1 (Kolon Uzayı) ile başlar. Dersler 2–36 aynı şablonla eklenecektir.
4 Notasyon
- Matris ve vektör: \(A\) matris, \(x\) vektör (kolon vektörü, NumPy/Julia/MATLAB konvansiyonu)
- Kolon kombinasyonu: \(Ax = x_1 a_1 + x_2 a_2 + \cdots + x_n a_n\) — \(a_k\), \(A\)’nın \(k\). kolonu
- Kolon uzayı: \(C(A)\) — tüm \(Ax\)’lerin kümesi; satır uzayı: \(C(A^{T})\)
- Rank: \(r\) — bağımsız kolon sayısı = bağımsız satır sayısı = \(C(A)\)’nın boyutu
- Dış çarpım: \(a\,b^{T}\) — bir kolon çarpı bir satır = rank-1 matris (yapı taşı)
- Beş faktorizasyon: \(A = CR\) (rank), \(A = LU\) (eliminasyon), \(A = QR\) (ortonormallik), \(A = Q\Lambda Q^{T}\) (özdeğer), \(A = U\Sigma V^{T}\) (tekil değer)
- Özdeğer / tekil değer: \(Ax = \lambda x\); \(\sigma_i\) = \(A\)’nın tekil değerleri
- Norm: \(\|x\|\) vektör normu, \(\|A\|\) matris normu
Tüm matematik MathJax 3 ile render ediliyor.
5 Builder Eksen — Lineer Cebir → Makine Öğrenmesi
| 18.065 kavramı | ML / veri bilimi karşılığı |
|---|---|
| \(A = CR\) / düşük-rank | LoRA fine-tuning, model sıkıştırma, CUR |
| SVD + Eckart-Young | PCA, gürültü giderme, latent uzay, öneri sistemleri |
| Rank-1 = dış çarpım | attention \(QK^{T}\), ağırlık güncellemeleri, yapı taşı |
| \(A^{T}A\) / kovaryans | PCA, en küçük kareler, Gram matrisi, kernel trick |
| Pozitif tanımlılık | konveks optimizasyon, kayıp yüzeyinin şekli |
| Gradyan inişi / SGD | sinir ağı eğitimi (tüm derin öğrenme) |
| Backprop = reverse-mode AD | torch.autograd, loss.backward() |
| Fourier / sirkülant | konvolüsyon, FFT, CNN ağırlık paylaşımı |
| Graf Laplacian | spektral kümeleme, graf sinir ağları (GNN) |
Lineer cebir, bir matrise bir bütün olarak bakmayı öğretir: kolonlarının gerdiği uzay, o uzayın boyutu (rank), ve matrisin onu açığa çıkaran faktorizasyonu. Modern ML’in tamamı — sıkıştırmadan optimizasyona, konvolüsyondan attention’a — bu birkaç faktorizasyonun (CR, QR, QΛQᵀ, SVD) üstünde durur. 18.065 bu köprüyü ders ders kurar.
6 Yazım Kuralları
- Türkçe terminoloji + parantez içinde İngilizce orijinal ilk geçtiğinde: “kolon uzayı (column space)”, “tekil değer ayrışımı (SVD)”, “düşük-rank (low-rank)”.
- Strang’den alıntılar İngilizce orijinal hâliyle, blockquote içinde, zaman damgasıyla verilir.
- Builder Notu callout’ları her ana bölüm sonunda; ML köprüsünü (geriye + ileriye) buraya yazıyoruz.
- Figürler tam, sayısal doğru bir
numpymotoru kullanan executable hücrelerdir; kaynak kodcode-foldile katlanabilir (matematik + figür ön planda, kod erişilebilir). - Kontrol Soruları collapse’lu — cevap kapalı başlar, okur kendi düşündükten sonra açar.
- Egzersizler cevapsız — en az bir elle-hesaplama +
numpydoğrulaması.
Tek başına bu set yetmez — Strang’in tahtada matrisleri elle çevirerek anlattığı sezginin yerine geçemez. Önce videoyu izle, sonra ilgili dersi oku, son olarak küçük matrislerle kendin hesapla. Set videoyu destekler, ikame etmez.