Matris Yöntemleri — MIT 18.065 Strang’den

ML Builder için Türkçe Notlar

Yazar

Phase 2

Yayınlanma Tarihi

2026-06-07

1 Bu kitap nedir?

Bu, Gilbert Strang — MIT 18.065: Matrix Methods in Data Analysis, Signal Processing, and Machine Learning ders serisinin Türkçe ders notlarıdır. Hedef, videoları izlerken paralel okunabilecek; sonradan tek başına da yeterli olabilecek bir referans seti üretmek.

18.065’in tek bir iddiası var ve her ders onu biraz daha somutlaştırır: modern makine öğrenmesi, lineer cebirin üstünde durur. Strang’in 18.06’da kurduğu klasik lineer cebiri (kolon uzayı, özdeğerler, SVD) alıp, doğrudan veriden öğrenmeye — düşük-rank yaklaşıma, gradyan inişine, sinir ağlarına — bağlar. Strang’in sözüyle: “Linear algebra is the secret to everything.”

Her bölüm bir Builder Notu katmanı taşır: kavramın hem geriye (18.06 klasik lineer cebir, calculus, olasılık) hem de ileriye (PCA, LoRA, backprop, CNN, spektral kümeleme) köprüsü. Bu seriyi “soyut matris teorisi” olarak değil, veri-odaklı düşünme disipliniyle okuyoruz: her teorem bir ML aracına iner.

Kaynak

Seri: MIT 18.065 — Video Lectures (OCW) — Gilbert Strang, Bahar 2018
Yazar: Gilbert Strang — MIT matematik profesörü, Linear Algebra and Learning from Data (2019) kitabının yazarı
Önkoşul: Klasik lineer cebir (18.06 / Phase 1 Lineer Cebir) — bu seri onun ML-uygulamalı devamıdır
Çeviri ve genişletme: Phase 2 (TR + ML Builder köprüleri)

2 Nasıl Okumalı

Sıralı oku. Seri kümülatiftir — her ders bir öncekinin kurduğu faktorizasyon dilini kullanır. İlk blok (Ders 1–7) lineer cebirin omurgasını ML gözüyle yeniden çerçeveler: kolon uzayı, beş faktorizasyon, özdeğerler, pozitif tanımlılık, SVD. Orta blok (Ders 8–19) sayısal lineer cebir ve matris analizidir. Son blok (Ders 20–36) optimizasyon, derin öğrenme ve sinyal işlemeye iner.

Strang’in önerdiği akış: önce videoyu izle, sonra ilgili dersi oku, en sonunda kendi elinle hesapla — küçük matrislerle faktorizasyonları, numpy ile doğrulamaları. Bu set videoyu destekler, ikame etmez.

Pratik bir tavsiye

Her bölüm sonundaki egzersizleri atlama. Strang’in felsefesi tek cümle: küçük bir matrisle eline al. Bir 3×3 matrisin rankını, A = CR’sini, SVD’sini elle bul; sonra numpy ile kontrol et. Aynı faktorizasyonu ileride PCA, LoRA, en küçük kareler kılığında yıllarca farklı yerlerde göreceksin; bir kez elle yapmak onu kara kutu olmaktan çıkarır.

3 34 Ders

Seri kolon uzayından başlayıp SVD, optimizasyon ve sinir ağlarına doğru tırmanır. (OCW kaydında Ders 28–29 laboratuvar oturumları kaydedilmemiştir; numaralandırma OCW ile birebir korunur.)

#	Ders	Ana Fikir
1	Kolon Uzayı — A = CR	Ax = kolonların kombinasyonu; rank; kolon rank = satır rank
2	Beş Faktorizasyon	LU, QR, QΛQᵀ, SVD, CR — her biri bir soruya cevap
3	Ortonormal Kolonlar — QᵀQ = I	Ortogonallik, dönme/yansıma, uzunluk koruyan matrisler
4	Özdeğerler ve Özvektörler	Ax = λx; QΛQ⁻¹ ile köşegenleştirme
5	Pozitif Tanımlı Matrisler	Enerji xᵀAx > 0; tüm λ > 0; optimizasyonun temeli
6	Tekil Değer Ayrışımı (SVD)	A = UΣVᵀ — her matris için var olan ayrışım
7	Eckart-Young / PCA	En iyi düşük-rank yaklaşım = en büyük σ’lar
8	Vektör ve Matris Normları	‖·‖₁, ‖·‖₂, ‖·‖∞, Frobenius, nükleer norm
9	En Küçük Kareler — Dört Yol	AᵀA x̂ = Aᵀb; projeksiyon, QR, SVD, pseudoinverse
10	Ax = b Çözmenin Zorlukları	Kondisyon sayısı, kötü koşulluluk, Krylov
11	Min ‖x‖ ve Gram-Schmidt	Ortonormalleştirme; Arnoldi, Lanczos
12	Özdeğer / Tekil Değer Hesaplamak	QR algoritması, kaydırma, sayısal yöntemler
13	Rastlantısal Matris Çarpımı	Sütun-satır örnekleme; randomized lineer cebir
14	Düşük-Rank Değişim (SMW)	Sherman-Morrison-Woodbury; güncellemeler
15	A(t)’nin Türevi — dA/dt	Matris değişiminin türevi; özdeğer hassasiyeti
16	Ters ve Tekil Değer Türevleri	Pertürbasyon; interlacing, Weyl eşitsizlikleri
17	Hızla Azalan Tekil Değerler	Düşük-rank yaklaşılabilirlik (konuk: A. Townsend)
18	Parametre Sayımı ve Eyer Noktaları	Serbestlik dereceleri; Rayleigh oranı
19	Maxmin Karakterizasyonu	Courant-Fischer; eyer noktası prensibi
20	Ortalama, Varyans, Kovaryans	Kovaryans matrisi; PCA’nın olasılık temeli
21	Newton Yöntemi ve Konvekslik	İkinci-derece optimizasyon; konveks fonksiyonlar
22	Gradyan İnişi	x ← x − η∇f; line search; en temel optimizatör
23	Momentum ve Nesterov	Hızlandırılmış gradyan; ağır-top yöntemi
24	Doğrusal Programlama ve Oyunlar	Dualite, simpleks, iç-nokta yöntemleri
25	Stokastik Gradyan İnişi (SGD)	Mini-batch; derin öğrenmenin iş atı (konuk: S. Sra)
26	Sinir Ağı Yapısı ve ReLU	Parçalı-doğrusal fonksiyonlar; evrensellik
27	Geri Yayılım (Backprop)	Zincir kuralı = reverse-mode AD; matris-zinciri görüşü
30	Sirkülant Matrisler / Matris Tamamlama	Konvolüsyon, rank-1 tamamlama
31	Fourier Matrisi / Normal Matrisler	FFT; AAᵀ = AᵀA olan matrisler
32	CNN / Evrişim Kuralı / Kronecker	Ağırlık paylaşımı; Kronecker çarpımı/toplamı
33	Öğrenme Fonksiyonu F(x,v) / Uzaklık Matrisleri	NN’in öğrendiği fonksiyon; Gram, Cholesky
34	Procrustes / Q = UVᵀ	En yakın ortogonal matris; uzaklık matrisleri
35	Graf Kümeleme / Laplacian	k-means, spektral kümeleme, Fiedler vektörü
36	Edelman/Julia — İleri + Geri AD	Dual sayılar; backprop = (I−L)⁻¹ üçgen çözüm (SON DERS)

Not: Phase 2 pilotu Ders 1 (Kolon Uzayı) ile başlar. Dersler 2–36 aynı şablonla eklenecektir.

4 Notasyon

Matris ve vektör: $A$ matris, $x$ vektör (kolon vektörü, NumPy/Julia/MATLAB konvansiyonu)
Kolon kombinasyonu: $Ax = x_1 a_1 + x_2 a_2 + \cdots + x_n a_n$ — $a_k$, $A$’nın $k$. kolonu
Kolon uzayı: $C(A)$ — tüm $Ax$’lerin kümesi; satır uzayı: $C(A^{T})$
Rank: $r$ — bağımsız kolon sayısı = bağımsız satır sayısı = $C(A)$’nın boyutu
Dış çarpım: $a\,b^{T}$ — bir kolon çarpı bir satır = rank-1 matris (yapı taşı)
Beş faktorizasyon: $A = CR$ (rank), $A = LU$ (eliminasyon), $A = QR$ (ortonormallik), $A = Q\Lambda Q^{T}$ (özdeğer), $A = U\Sigma V^{T}$ (tekil değer)
Özdeğer / tekil değer: $Ax = \lambda x$; $\sigma_i$ = $A$’nın tekil değerleri
Norm: $\|x\|$ vektör normu, $\|A\|$ matris normu

Tüm matematik MathJax 3 ile render ediliyor.

5 Builder Eksen — Lineer Cebir → Makine Öğrenmesi

Her ders bu bağlantı katmanını taşır

18.065 kavramı	ML / veri bilimi karşılığı
$A = CR$ / düşük-rank	LoRA fine-tuning, model sıkıştırma, CUR
SVD + Eckart-Young	PCA, gürültü giderme, latent uzay, öneri sistemleri
Rank-1 = dış çarpım	attention $QK^{T}$, ağırlık güncellemeleri, yapı taşı
$A^{T}A$ / kovaryans	PCA, en küçük kareler, Gram matrisi, kernel trick
Pozitif tanımlılık	konveks optimizasyon, kayıp yüzeyinin şekli
Gradyan inişi / SGD	sinir ağı eğitimi (tüm derin öğrenme)
Backprop = reverse-mode AD	`torch.autograd`, `loss.backward()`
Fourier / sirkülant	konvolüsyon, FFT, CNN ağırlık paylaşımı
Graf Laplacian	spektral kümeleme, graf sinir ağları (GNN)

Bir tek şey

Lineer cebir, bir matrise bir bütün olarak bakmayı öğretir: kolonlarının gerdiği uzay, o uzayın boyutu (rank), ve matrisin onu açığa çıkaran faktorizasyonu. Modern ML’in tamamı — sıkıştırmadan optimizasyona, konvolüsyondan attention’a — bu birkaç faktorizasyonun (CR, QR, QΛQᵀ, SVD) üstünde durur. 18.065 bu köprüyü ders ders kurar.

6 Yazım Kuralları

Türkçe terminoloji + parantez içinde İngilizce orijinal ilk geçtiğinde: “kolon uzayı (column space)”, “tekil değer ayrışımı (SVD)”, “düşük-rank (low-rank)”.
Strang’den alıntılar İngilizce orijinal hâliyle, blockquote içinde, zaman damgasıyla verilir.
Builder Notu callout’ları her ana bölüm sonunda; ML köprüsünü (geriye + ileriye) buraya yazıyoruz.
Figürler tam, sayısal doğru bir numpy motoru kullanan executable hücrelerdir; kaynak kod code-fold ile katlanabilir (matematik + figür ön planda, kod erişilebilir).
Kontrol Soruları collapse’lu — cevap kapalı başlar, okur kendi düşündükten sonra açar.
Egzersizler cevapsız — en az bir elle-hesaplama + numpy doğrulaması.

Bu kitap Strang’in yerine geçmez

Tek başına bu set yetmez — Strang’in tahtada matrisleri elle çevirerek anlattığı sezginin yerine geçemez. Önce videoyu izle, sonra ilgili dersi oku, son olarak küçük matrislerle kendin hesapla. Set videoyu destekler, ikame etmez.

--- title: "Önsöz" --- # Bu kitap nedir? Bu, **Gilbert Strang — MIT 18.065: Matrix Methods in Data Analysis, Signal Processing, and Machine Learning** ders serisinin Türkçe ders notlarıdır. Hedef, videoları izlerken paralel okunabilecek; sonradan tek başına da yeterli olabilecek bir referans seti üretmek. 18.065'in tek bir iddiası var ve her ders onu biraz daha somutlaştırır: **modern makine öğrenmesi, lineer cebirin üstünde durur.** Strang'in 18.06'da kurduğu klasik lineer cebiri (kolon uzayı, özdeğerler, SVD) alıp, doğrudan veriden öğrenmeye — düşük-rank yaklaşıma, gradyan inişine, sinir ağlarına — bağlar. Strang'in sözüyle: *"Linear algebra is the secret to everything."* Her bölüm bir **Builder Notu** katmanı taşır: kavramın hem **geriye** (18.06 klasik lineer cebir, calculus, olasılık) hem de **ileriye** (PCA, LoRA, backprop, CNN, spektral kümeleme) köprüsü. Bu seriyi "soyut matris teorisi" olarak değil, **veri-odaklı düşünme** disipliniyle okuyoruz: her teorem bir ML aracına iner. ::: {.callout-note title="Kaynak"} - **Seri:** [MIT 18.065 — Video Lectures (OCW)](https://ocw.mit.edu/courses/18-065-matrix-methods-in-data-analysis-signal-processing-and-machine-learning-spring-2018/video_galleries/video-lectures/) — Gilbert Strang, Bahar 2018 - **Yazar:** Gilbert Strang — MIT matematik profesörü, *Linear Algebra and Learning from Data* (2019) kitabının yazarı - **Önkoşul:** Klasik lineer cebir (18.06 / Phase 1 *Lineer Cebir*) — bu seri onun ML-uygulamalı devamıdır - **Çeviri ve genişletme:** Phase 2 (TR + ML Builder köprüleri) ::: # Nasıl Okumalı Sıralı oku. Seri kümülatiftir — her ders bir öncekinin kurduğu faktorizasyon dilini kullanır. İlk blok (Ders 1–7) lineer cebirin omurgasını ML gözüyle yeniden çerçeveler: kolon uzayı, beş faktorizasyon, özdeğerler, pozitif tanımlılık, SVD. Orta blok (Ders 8–19) sayısal lineer cebir ve matris analizidir. Son blok (Ders 20–36) optimizasyon, derin öğrenme ve sinyal işlemeye iner. Strang'in önerdiği akış: önce videoyu izle, sonra ilgili dersi oku, en sonunda **kendi elinle hesapla** — küçük matrislerle faktorizasyonları, `numpy` ile doğrulamaları. Bu set videoyu **destekler**, ikame etmez. ::: {.callout-tip title="Pratik bir tavsiye"} Her bölüm sonundaki **egzersizleri** atlama. Strang'in felsefesi tek cümle: küçük bir matrisle eline al. Bir 3×3 matrisin rankını, A = CR'sini, SVD'sini elle bul; sonra `numpy` ile kontrol et. Aynı faktorizasyonu ileride PCA, LoRA, en küçük kareler kılığında yıllarca farklı yerlerde göreceksin; bir kez elle yapmak onu kara kutu olmaktan çıkarır. ::: # 34 Ders Seri kolon uzayından başlayıp SVD, optimizasyon ve sinir ağlarına doğru tırmanır. (OCW kaydında Ders 28–29 laboratuvar oturumları kaydedilmemiştir; numaralandırma OCW ile birebir korunur.) | # | Ders | Ana Fikir | |---|------|-----------| | 1 | [Kolon Uzayı — A = CR](01-kolon-uzayi.qmd) | Ax = kolonların kombinasyonu; rank; kolon rank = satır rank | | 2 | Beş Faktorizasyon | LU, QR, QΛQᵀ, SVD, CR — her biri bir soruya cevap | | 3 | Ortonormal Kolonlar — QᵀQ = I | Ortogonallik, dönme/yansıma, uzunluk koruyan matrisler | | 4 | Özdeğerler ve Özvektörler | Ax = λx; QΛQ⁻¹ ile köşegenleştirme | | 5 | Pozitif Tanımlı Matrisler | Enerji xᵀAx > 0; tüm λ > 0; optimizasyonun temeli | | 6 | Tekil Değer Ayrışımı (SVD) | A = UΣVᵀ — her matris için var olan ayrışım | | 7 | Eckart-Young / PCA | En iyi düşük-rank yaklaşım = en büyük σ'lar | | 8 | Vektör ve Matris Normları | ‖·‖₁, ‖·‖₂, ‖·‖∞, Frobenius, nükleer norm | | 9 | En Küçük Kareler — Dört Yol | AᵀA x̂ = Aᵀb; projeksiyon, QR, SVD, pseudoinverse | | 10 | Ax = b Çözmenin Zorlukları | Kondisyon sayısı, kötü koşulluluk, Krylov | | 11 | Min ‖x‖ ve Gram-Schmidt | Ortonormalleştirme; Arnoldi, Lanczos | | 12 | Özdeğer / Tekil Değer Hesaplamak | QR algoritması, kaydırma, sayısal yöntemler | | 13 | Rastlantısal Matris Çarpımı | Sütun-satır örnekleme; randomized lineer cebir | | 14 | Düşük-Rank Değişim (SMW) | Sherman-Morrison-Woodbury; güncellemeler | | 15 | A(t)'nin Türevi — dA/dt | Matris değişiminin türevi; özdeğer hassasiyeti | | 16 | Ters ve Tekil Değer Türevleri | Pertürbasyon; interlacing, Weyl eşitsizlikleri | | 17 | Hızla Azalan Tekil Değerler | Düşük-rank yaklaşılabilirlik (konuk: A. Townsend) | | 18 | Parametre Sayımı ve Eyer Noktaları | Serbestlik dereceleri; Rayleigh oranı | | 19 | Maxmin Karakterizasyonu | Courant-Fischer; eyer noktası prensibi | | 20 | Ortalama, Varyans, Kovaryans | Kovaryans matrisi; PCA'nın olasılık temeli | | 21 | Newton Yöntemi ve Konvekslik | İkinci-derece optimizasyon; konveks fonksiyonlar | | 22 | Gradyan İnişi | x ← x − η∇f; line search; en temel optimizatör | | 23 | Momentum ve Nesterov | Hızlandırılmış gradyan; ağır-top yöntemi | | 24 | Doğrusal Programlama ve Oyunlar | Dualite, simpleks, iç-nokta yöntemleri | | 25 | Stokastik Gradyan İnişi (SGD) | Mini-batch; derin öğrenmenin iş atı (konuk: S. Sra) | | 26 | Sinir Ağı Yapısı ve ReLU | Parçalı-doğrusal fonksiyonlar; evrensellik | | 27 | Geri Yayılım (Backprop) | Zincir kuralı = reverse-mode AD; matris-zinciri görüşü | | 30 | Sirkülant Matrisler / Matris Tamamlama | Konvolüsyon, rank-1 tamamlama | | 31 | Fourier Matrisi / Normal Matrisler | FFT; AAᵀ = AᵀA olan matrisler | | 32 | CNN / Evrişim Kuralı / Kronecker | Ağırlık paylaşımı; Kronecker çarpımı/toplamı | | 33 | Öğrenme Fonksiyonu F(x,v) / Uzaklık Matrisleri | NN'in öğrendiği fonksiyon; Gram, Cholesky | | 34 | Procrustes / Q = UVᵀ | En yakın ortogonal matris; uzaklık matrisleri | | 35 | Graf Kümeleme / Laplacian | k-means, spektral kümeleme, Fiedler vektörü | | 36 | Edelman/Julia — İleri + Geri AD | Dual sayılar; backprop = (I−L)⁻¹ üçgen çözüm (SON DERS) | > Not: Phase 2 pilotu Ders 1 (Kolon Uzayı) ile başlar. Dersler 2–36 aynı şablonla eklenecektir. # Notasyon - **Matris ve vektör:** $A$ matris, $x$ vektör (kolon vektörü, NumPy/Julia/MATLAB konvansiyonu) - **Kolon kombinasyonu:** $Ax = x_1 a_1 + x_2 a_2 + \cdots + x_n a_n$ — $a_k$, $A$'nın $k$. kolonu - **Kolon uzayı:** $C(A)$ — tüm $Ax$'lerin kümesi; **satır uzayı:** $C(A^{T})$ - **Rank:** $r$ — bağımsız kolon sayısı = bağımsız satır sayısı = $C(A)$'nın boyutu - **Dış çarpım:** $a\,b^{T}$ — bir kolon çarpı bir satır = rank-1 matris (yapı taşı) - **Beş faktorizasyon:** $A = CR$ (rank), $A = LU$ (eliminasyon), $A = QR$ (ortonormallik), $A = Q\Lambda Q^{T}$ (özdeğer), $A = U\Sigma V^{T}$ (tekil değer) - **Özdeğer / tekil değer:** $Ax = \lambda x$; $\sigma_i$ = $A$'nın tekil değerleri - **Norm:** $\|x\|$ vektör normu, $\|A\|$ matris normu Tüm matematik [MathJax 3](https://www.mathjax.org/) ile render ediliyor. # Builder Eksen — Lineer Cebir → Makine Öğrenmesi ::: {.callout-tip title="Her ders bu bağlantı katmanını taşır"} | 18.065 kavramı | ML / veri bilimi karşılığı | |---|---| | $A = CR$ / düşük-rank | LoRA fine-tuning, model sıkıştırma, CUR | | SVD + Eckart-Young | PCA, gürültü giderme, latent uzay, öneri sistemleri | | Rank-1 = dış çarpım | attention $QK^{T}$, ağırlık güncellemeleri, yapı taşı | | $A^{T}A$ / kovaryans | PCA, en küçük kareler, Gram matrisi, kernel trick | | Pozitif tanımlılık | konveks optimizasyon, kayıp yüzeyinin şekli | | Gradyan inişi / SGD | sinir ağı eğitimi (tüm derin öğrenme) | | Backprop = reverse-mode AD | `torch.autograd`, `loss.backward()` | | Fourier / sirkülant | konvolüsyon, FFT, CNN ağırlık paylaşımı | | Graf Laplacian | spektral kümeleme, graf sinir ağları (GNN) | ::: ::: {.callout-important title="Bir tek şey"} Lineer cebir, bir matrise **bir bütün** olarak bakmayı öğretir: kolonlarının gerdiği uzay, o uzayın boyutu (rank), ve matrisin onu açığa çıkaran faktorizasyonu. Modern ML'in tamamı — sıkıştırmadan optimizasyona, konvolüsyondan attention'a — bu birkaç faktorizasyonun (CR, QR, QΛQᵀ, SVD) üstünde durur. 18.065 bu köprüyü ders ders kurar. ::: # Yazım Kuralları - **Türkçe terminoloji + parantez içinde İngilizce orijinal** ilk geçtiğinde: "kolon uzayı (column space)", "tekil değer ayrışımı (SVD)", "düşük-rank (low-rank)". - **Strang'den alıntılar** İngilizce orijinal hâliyle, blockquote içinde, zaman damgasıyla verilir. - **Builder Notu** callout'ları her ana bölüm sonunda; ML köprüsünü (geriye + ileriye) buraya yazıyoruz. - **Figürler** tam, sayısal doğru bir `numpy` motoru kullanan executable hücrelerdir; kaynak kod `code-fold` ile katlanabilir (matematik + figür ön planda, kod erişilebilir). - **Kontrol Soruları** collapse'lu — cevap kapalı başlar, okur kendi düşündükten sonra açar. - **Egzersizler** cevapsız — en az bir elle-hesaplama + `numpy` doğrulaması. ::: {.callout-warning title="Bu kitap Strang'in yerine geçmez"} Tek başına bu set yetmez — Strang'in tahtada matrisleri elle çevirerek anlattığı sezginin yerine geçemez. Önce videoyu izle, sonra ilgili dersi oku, son olarak küçük matrislerle **kendin hesapla**. Set videoyu **destekler**, ikame etmez. :::