BÖLÜM 3

advertisement
BÖLÜM 3
3. ÇOK DEĞİŞKENLİ REGRESYON İÇİN VEKTÖR VE MATRİS CEBRİ
Bölüm 2 de, doğrusal regresyon tek değişkenli basit model olarak ele alınarak açıklanmıştı. Bölüm
4 de ise çok değişkenli (k değişkenli) model için giriş yapılacaktır. Çok değişkenli modelde
değişken sayısına paralel olarak tahminlenmesi gereken parametre sayısı da artmaktadır. Bunun
sonucu olarak işlemler için bazı hesaplama zorlukları ortaya çıkmaktadır. İşte bu hesaplama
zorluklarını giderebilmek amacı ile kitabın bu bölümünden itibaren matris ve vektör işlemleri
kullanılacaktır. Doğal olarak regresyon analizinde kullanılacak olan bu matris ve vektör
işlemlerinin tanıtılması faydalı olacaktır. Kitabın bu bölümünün amacı temel doğrusal cebir
konularını sadece regresyon kapsamında ele almaktır. Ayrca Bölüm 5 de verilecek olan regresyon
geometrisi kısmına temel oluşturmak üzere bu kısımda vektör geometrisi incelenecektir. Bu
nedenle temel teoremlerin bazıları ispatsız olarak verilecektir. Bu kitapta matrisler büyük koyu harf
ile vektörler ise küçük koyu harf ile gösterilecektir.
3.1 VEKTÖRLER
Bir boyutlu öklit (Euclidean) uzayındaki gerçel sayılar kümesi
uzayı
m
ise her biri bir
m
=
× ×
çarpımı ile tanımlanır.
ile gösterilir. m-boyutlu öklit
kümesini tanımlayan m adet kümenin kartezyen (Catesian),
×
m
uzayındaki bir eleman
⎛ x1 ⎞
⎜ ⎟
x=⎜ ⎟
⎜x ⎟
⎝ m⎠
bir vektör olarak adlandırılır. Bu vektördeki xi değerleri vektörün elemanları m ise vektörün boyutu
olarak adlandırılır. Diğer bir ifade ile m elemanlı bir vektör düzenlenmiş m adet gerçel sayıdan
oluşmuştur. Derecesi m=1 olan vektörler skaler olarak adlandırılırlar. Bunlar genellikle bir boyutlu
değişkenlerdir.
Tanım 3.1 Uzunluk alan hacim yoğunluk kütle gibi cebirsel değerlere skaler büyüklük denir.
Tanım 3.2 Hareket hız kuvvet gibi hem yönü hem büyüklüğü olan değerlerlere vektörel büyüklük
denir.
Vektör analizi hem cebirsel hem de geometrik olarak uygulanabilir. Her iki bakış açısı da
önemlidir. Eğer xi elemanı belirli bir ülkedeki belirli bir yılda i-inci ailenin geliri ifade ediyorsa x
vektörünü
m
uzayındaki bir nokta olarak düşünmek oldukça mantıklıdır. Bununla birlikte kuvvet
ve ivme gibi değerler ele alındığında her ikisinin de hem büyüklük hem de yön değerlerine sahip
olduğu görülebilir. Bu değerleri orijinden yayılan oklarla ifade etmek en uygun yoldur. İlk bakış
açısı cebirsel ikincisi ise geometriktir.
1
3.1.1 Vektör İşlemleri
Vektörlere uygulanan iki temel işlem, vektörel toplama ve skaler çarpımdır. Aynı boyuta sahip x ve
y gibi iki vektörün toplamı x+y olup aynı boyutlu bir vektörü,
⎛ x1 + y1 ⎞
⎜
⎟
x+y =⎜
⎟
⎜x + y ⎟
m⎠
⎝ m
(3.1)
tanımlar. Bir x vektörünün bir λ skaleri ile çarpımı,
⎛ λ x1 ⎞
⎟
λ x = ⎜⎜
⎟
⎜λx ⎟
⎝ m⎠
(3.2)
olup xλ çarpımı da aynı sonucu verir. Bu cebirsel tanımların geometrik gösterimi Şekil 3.1 ve Şekil
3.4 de verilmiştir. İki vektörün toplamı x+y, vektörler ile orijinin tanımladığı paralel kenarın
köşegeni olarak elde edilir. İki elemanlı bir vektör,
⎡3⎤
x=⎢ ⎥
⎣1⎦
şeklinde tanımlanabilir. Bu vektör Şekil (3.1)’de olduğu gibi yönlü bir doğru parçası ile
gösterilebilir. Doğru parçası, orjinde başlayıp, (3,1) noktasında biter. Ok ise vektörün yönünü
belirtir. Bir başka x2 vektörü ise,
⎡1 ⎤
y=⎢ ⎥
⎣ 2⎦
şeklinde verilebilir. Bu iki vektör geometrik olarak aşağıda belirtildiği şekilde toplanabilir: İki
vektörden herhangi biri orjin dikkate alınarak çizilir (şekilde ilk çizilen x vektörüdür). Daha sonra
diğer vektör ilk vektörün bitim koordinatından itibaren (bu bitim noktası ikinci vektör için orjin
olarak kabul edilebilir) çizilir. Şekilde varılan nokta p’dir. İlk vektörün başlangıç noktası ile bu p
noktasını birleştiren doğru parçası x+y vektörünü verir. Elde edilen bu vektörün koordinatları
(4,3)’dür. x+y vektörü x ve y vektörlerinin geometrik olarak toplanması ile elde edilir. Eğer bu iki
vektör cebirsel olarak toplanırsa,
⎡3⎤ ⎡1 ⎤ ⎡4⎤
x+y=⎢ ⎥+⎢ ⎥=⎢ ⎥
⎣1⎦ ⎣2⎦ ⎣3⎦
sonucu elde edilir. Görüldüğü gibi hem geometrik hem de cebirsel olarak tamamen aynı sonuçlar
elde edilmiştir. Şekilden görüldüğü gibi ilk olarak y vektörü çizilseydi de aynı noktaya (p’ye)
varılacak ve sonuç değişmeyecekti. Vektörel çıkarma ise Şekil 3.2 ve 3.3 de gösterilmiştir.
2
Şekil 3.1 Vektörel toplama işlemi
Şekil 3.2 Vektörel çıkarma
Şekil 3.3 den (x+y) vektörel toplamının, x ve y vektörlerinden oluşturulmuş paralel kenarın bir
köşegeni, (x-y) farkının ise paralel kenarın diğer bir köşegeni olduğu görülmektedir.
Şekil 3.3 Vektörel toplama ve çıkarmanın karşılaştırılması: Toplama x okunu takip eden y okunun
ucunu x’in başlangıcı ile birleştiren köşegendir. Çıkarma ise y noktasından x noktasına
oluşturulan köşegen ile tanımlanır.
3
Vektörün skaler ile çarpımında vektördeki her bir eleman λ skaleri ile çarpılır ve büyüklükler
değişir. Eğer λ>0 ise yön aynı kalır, λ<0 ise vektör zıt yöndedir. Eğer her hangi bir λ skaleri için
y=λx ise ya da y=0 veya x=0 ise x ve y vektörleri arasında doğrusal bağlantı (collinear) vardır.
Şimdi bir vektörün bir skalerle çarpımı ele alınsın. Bu duruma bir örnek olarak x vektörü 2 ile
çarpılmış ve
⎡3⎤ ⎡6⎤
2x = 2⎢ ⎥ = ⎢ ⎥
⎣1⎦ ⎣2⎦
sonucu elde edilmiştir. Elde edilen bu vektörün yönü x vektörü ile tamamen aynıdır. Aradaki fark
ise elde edilen vektörün uzunluğunun x vektörünün iki katı olmasıdır. Bu skaler negatif bir sayıda
olabilir.
⎡3⎤ ⎡− 3⎤
− 1x = −1⎢ ⎥ = ⎢ ⎥
⎣1⎦ ⎣ − 1⎦
Elde edilen bu iki vektör orjinal x vektörü ile birlikte Şekil 3.4 de gösterilmiştir. Şekilden
görüldüğü gibi bu üç vektörün hepside orjinden geçen bir tek doğru parçası üzerindedir ve bu
doğru parçası da x vektörü ile tanımlanmıştır.
Vektörlerin toplanması ve bir skalerle çarpılması işlemlerinin birlikte ele alınması sonucunda x1 ve
x2 vektörlerinin doğrusal kombinasyonu olan herhangi bir iki elemanlı vektör elde edilebilir. Elde
edilen bu y vektörü,
y = λ1x1 + λ2 x 2
(3.3)
şeklinde ifade edilebilir. Bu eşitlikteki λ1 ve λ2 skalerleri temsil etmektedir. Eğer y vektörü,
⎡ 4⎤
y=⎢ ⎥
⎣0⎦
şeklinde tanımlanmış ise bu vektör x1 ve x2 vektörlerinin doğrusal bir kombinasyonu olarak,
y=
12 ⎡ 2 ⎤ 4 ⎡1⎤
−
5 ⎢⎣1 ⎥⎦ 5 ⎢⎣3⎥⎦
ifade edilebilir. Bu eşitlikte λ1=12/5 ve λ2=-4/5’dir. Bu değerler aşağıdaki şekilde, denklem çiftinin
eşanlı olarak çözülmesi ile elde edilebilir.
⎡ 2⎤
⎡1⎤ ⎡2λ + λ 2 ⎤ ⎡4⎤
=
λ1 ⎢ ⎥ + λ 2 ⎢ ⎥ = ⎢ 1
λ + 3λ ⎥ ⎢0⎥
1
3
⎣ ⎦
⎣ ⎦
⎣
1
2
⎦
⎣ ⎦
4
Şekil 3.4 Bir vektörün skalerle çarpımı
Bir başka örnek için y vektörü,
⎡6⎤
y=⎢ ⎥
⎣ 3⎦
olarak verilmiş olsun. Bu durumda x1 ve x2 vektörlerinin doğrusal bir kombinasyonu olarak,
⎡2⎤
⎡1⎤
y = 3⎢ ⎥ + 0⎢ ⎥
⎣1 ⎦
⎣ 3⎦
şeklinde ifade edilebilir. Bu eşitlikte λ1=3 ve λ2=0’dır. Bu örnekler daha da arttırılabilir. Bu
verilenler dikkate alınarak bir vektör uzayının tanımı yapılabilir. Vektör uzayı aşağıda verilen
özelliklere sahip vektörlerin biraraya gelmesi ile oluşur.
1) Eğer v1 ve v2 aynı vektör uzayındaki iki vektör ise, v1+v2’ de aynı vektör uzayındadır.
2) Eğer v bu vektör uzayında ve λ bir skaler sabitse, λv ’de aynı vektör uzayındadır.
Bu özelliklerden görüldüğü gibi toplama ve bir skalerle çarpma işlemleri sonucunda elde edilen
vektör yine aynı vektör uzayındadır. Vektörlerin basit cebirsel işlemleri ve bu işlemlerin geometrik
yorumları Tablo 3.1’de verilmiştir.
Tablo 3.1 Vektörlerin cebirsel ve geometrik karşılaştırılması
Cebirsel işlem
Geometrik Yorumu
Pozitif bir skalerle çarpım
2(3,1)=(6,2)
Uzunluk değişir. (Şekil 3.4)
Negatif bir skalerle çarpım
-1(3,1)=(-3,-1)
Yön değişir. (Şekil3.4)
Toplam
(3,1)+(1,2)=(4,3)
Çıkarma
(3,1)-(1,2)=(2,-1)
x ve y okları birbirini takip
edecek
şekilde
eklenir.
Oluşturulan paralel kenarın
köşegeni
toplam
vektörü
belirtir.(Şekil 3.1)
x +(-y) toplamına eşittir.
Oluşturulan paralel kenarın
diğer köşegeni fark vektörünü
belirtir. (Şekil 3.2 ve 3.3)
5
m adet sıradan oluşan vektör sütun vektörüdür. Örneğin, x4×1 vektörü bir sütun vektörüdür.
⎡ −3 ⎤
⎢ 4⎥
x 4 x1 = ⎢ ⎥
⎢ 7⎥
⎢ ⎥
⎣ 6⎦
n adet sütundan oluşan vektör ise sıra vektörüdür. x1×3 vektörü örnek olarak verilebilir.
x1x 3 = [ −2 2 5]
Bir sütun vektörünün sıra vektörü olarak ifadesi o vektörün transpozu (evriği) olarak adlandırılır ve
xT ile gösterilir. Yukarıdaki tanımdan anlaşılacağı gibi bir sütun vektörünün transpozu,
⎡ −3
⎢ 4
x 4 x1 = ⎢
⎢ 7
⎢
⎣ 6
⎤
⎥
⎥
⎥
⎥
⎦
x1T×4 = [ −3 4 7 6]
şeklinde bir sıra vektörü, bir sıra vektörünün transpozu da,
y1x 3 = [ −2 2 5]
y
T
3×1
⎡ −2
= ⎢⎢ 2
⎢⎣ 5
⎤
⎥
⎥
⎥⎦
şeklinde bir sütun vektörü oluşturur.
Aynı boyutlu m×1 iki gerçel vektör x ve y nin önemli bir skaler fonksiyonu nokta (dot) çarpımdır,
x1T×m y m×1 = (x11
x12
⎛ y11 ⎞
⎜
⎟
⎜ y 21 ⎟
… x1m )⎜
⎟ = x11 y11 + x12 y 21 +
⎜
⎟
⎜y ⎟
⎝ m1 ⎠
m
+ x1m y m1 = ∑ x1i y i1 = c
i =1
x1T×m y m×1 = y1T×m x m×1 = ⟨ x, y ⟩ = ∑ i =1 xi y i .
m
(3.4)
Bu çarpım iç (inner) çarpım olarak da adlandırılır. Elde edilen sonuç değeri c bir skalerdir.
Pisagor teoremi ile bir vektörün uzunluğu veya normu, bir vektörün kendisiyle nokta çarpımının
x
2
2
= xxT = x11
+ … + x n21
(3.5)
kare kökü olup vektörün uzunluğu x sembolü ile gösterilir Bu işlem kullanılarak vektörün
uzunluğu (normu),
x = ⟨ x, x⟩1 2 = xT x
(3.6)
olarak elde edilir. Vektörün normu geometrik bir özelliğini temsil eder. Vektörlerin nokta çarpımı iki
boyutlu uzayda vektörün karesel uzunluğu olarak düşünülebilir, Şekil 3.5 de bu durum Pisagor
teoremiyle açıklanmıştır. Örneğin x =(3,1) vektörünün karesel uzunluğu
6
2
2
xxT = x11
+ x 21
= 3 2 + 12 = 10
şeklinde olup uzunluğu 10 dur.
Şekil 3.5 Vektörlerin karesel uzunlukları ve Pisagor teoremiyle ilişkisi a)İki boyutlu, b)Üç boyutlu
Her hangi bir x vektörü x = 1 ise birim uzunlukta (normalize) vektör olarak adlandırılır. Sıfırdan
farklı her hangi bir x* vektörü,
x=
1 *
x
x*
(3.7)
uygulanarak normalize edilir. Vektör normu ile ilgili önemli bir eşitsizlik,
xT y
12
≤ x y
(3.8)
Cauchy-Schwarz eşitsizliğidir. Bu eşitsizlik iki vektörün toplamının karesel uzunluğu için de,
2
x + y = ⟨ x + y, x + y⟩ = ⟨ x, x⟩ + 2⟨ x, y⟩ + ⟨ y, y⟩
≤ x +2 x y + y =( x + y
2
2
)
2
(3.9)
elde edilebilir.
İki vetör x ve y için,
⟨ x, y⟩ = xT y = 0
(3.10)
ise ortogonaldirler. Eşitlik (3.10) da iki vektörün nokta çarpımlarının sıfır olması durumunda bu iki
vektörün birbirine ortogonal olduğu belirtilmişti. Ortogonallik vektör uzunlukları dikkate alınarak da
ifade edilebilir. Şekil 3.6’dan görüldüğü gibi, eğer (x+y) ‘nin uzunluğu (x-y) ‘nin uzunluğuna eşit ise x
ile y vektörleri birbirine ortogonaldir:
x+y
2
= x−y
2
(x + y )T (x + y ) = (x − y )T (x − y )
7
x T x + 2x T y + y T y = x T x − 2x T y + y T y
4x T y = 0
Sonuç olarak ortogonallik özelliğinin sağlanabilmesi için eşitlik (3.10) un sağlanması gerektiği
görülmektedir.
Şekil 3.6 Bu şekiller herhangi bir boyut için de geçerlidir. a) x1 ve x2 ortogonal b) x1 ve x2 ortogonal
değil.
Eğer x ve y vektörleri birbirine ortogonal ise eşitsizlik (3.9) eşitlik durumunu tanımlayarak Pisagor
denklemini verir:
2
x + y = ⟨ x + y , x + y⟩ = ⟨ x, x⟩ + 2⟨ x, y⟩ + ⟨ y, y⟩ = ⟨ x, x⟩ + ⟨ y, y⟩
2
= x + y
2
(3.11)
Ortogonallik özelliğine ek olarak eğer x = y = 1 ise bu iki vektör ortanormaldir. Bir m-boyutlu
öklit uzayının bazını oluşturan birim vektörler,
⎛1⎞
⎜ ⎟
0
e1 = ⎜ ⎟
⎜ ⎟
⎜ ⎟
⎝0⎠
⎛0⎞
⎛0⎞
⎜ ⎟
⎜ ⎟
1⎟
0
⎜
… em = ⎜ ⎟
e2 =
⎜ ⎟
⎜ ⎟
⎜ ⎟
⎜ ⎟
⎝0⎠
⎝1⎠
ile tanımlanıp ortanormaldirler.
Doğrusal bağımsız vektörler farklı yönlerde oldukları için bu vektörler arasındaki açıda sıfırdan
farklıdır. Bu açı vektör elemanlarına göre ifade edilebilir. Sıfırdan farklı iki vektör x ve y
arasındaki açıyı belirlemek için Şekil 3.7 deki OAB üçgeni dikkate alınsın. Şekilden görüldüğü gibi
–y ve x-y vektörleri bulunabilir. x-y vektörünün uzunluğu AB arasındaki uzaklığa eşittir. Kosinüs
kuralı,
c 2 = a 2 + b 2 − 2ab cos θ
8
kullanılarak,
2
2
2
x − y = x + y − 2 x y cos θ
(3.12)
ve bu ifade basitleştirilerek,
xT y = x y cos θ
x ve y vektörleri arasındaki açı,
xT y
⟨ x, y ⟩
cos θ =
=
x y
x y
(3.13)
formülü ile hesaplanır. Eşitlik (3.13) ün iki özel durumu mevcuttur. Bunlardan birincisi x ve y
vektörlerinin doğrusal bağımlı olmasıdır. Bu durumda, x= λy yazılabilir. Vektörlerin doğrusal bağımlı
olması durumunda (3.13) eşitliğinin sağ tarafı için bir, bunun sonucunda θ=00 olarak bulunur. İkinci
bir durumda x ve y vektörlerinin birbirine dik olmasıdır. Bu durumda θ=900 olup Cos θ=0 olarak elde
edilir. Cos θ=0 olması için xTy=0 olması gerekir. Bu durum gerçekleştiğinde, diğer bir deyişle iki
vektör arasındaki açı 900 olduğunda bu iki vektörün ortogonal olduğu söylenebilir. Bazı özel durumlar
için eşitlik (3.13) ün değerleri aşağıda verilmiştir:
xT y
⟨ x, y⟩
cos θ =
=
=1⇒ θ = 0
x y
x y
cos θ =
xT y
⟨ x, y⟩
=
= −1 ⇒ θ = π
x y
x y
cos θ =
xT y
⟨ x, y⟩
=
= 0⇒θ =π 2
x y
x y
Şekil 3.7 x ve y vektörleri arasındaki açı
9
3.1.2 Vektör Uzayı
Bir boyutlu uzay
ile belirtilsin. Sabit bir x1 vektörünün mümkün olabilecek tüm λ1 skalerleriyle
çarpılması sonucu orijinle x1 doğrultusunda bir düz doğru oluştuğu Şekil 3.8’den görülmektedir. Her
bir λ1x1 vektörü ok veya nokta ile ifade edilebilir. Yukarıdaki açıklama
L: λ1x1
− ∞ < λ1 < ∞
(3.14)
ifadesiyle özetlenebilir.
Şekil 3.8 x1 vektörü ile oluşturulan L doğrusu
Şekil 3.9 da boyut sayısı bir arttırılmıştır ve iki farklı renkte ok başı kullanılmıştır. Düzlem içinde
bulunan ok başları beyaz olup, düzlem dışındaki siyahtır. Üç boyutlu uzayda iki adet sabitlenmiş
vektörün oluşturduğu noktalar seti Şekil 3.9 da gösterilmektedir:
P: λ1x1+λ2x2
− ∞ < λ1 , λ 2 < ∞
(3.15a)
Şekil 3.9 x1 ve x2 vektörleri ile oluşturulabilen P düzlemi. P= λ1x1+λ2x2 olup λ1 ve λ2 değerlerine
bağlı olarak düzlem sınırsız bir şekilde genişletilir.
P ifadesi x1 ve x2’nin tüm mümkün doğrusal kombinasyonlarının seti olarak adlandırılır ve x1, x2
vektörleri ile orijin arasında kalan düzlemi belirtir. Geometrik olarak, x1 ve x2’nin uygun doğrusal
kombinasyonları dikkate alınarak P düzleminde herhangi bir nokta oluşturabileceği görülmektedir.
Uygun doğrusal kombinasyon ile açıklanmak istenen λ1 ve λ2 ‘nin eşitlik (3.15a) ya uygun olarak
seçilmiş olmasıdır. Bu koşula uyulması durumunda elde edilen nokta, P düzleminin altında ya da
üstünde olmayacaktır. Aşağıda λ1 ve λ2 skalerlerinin nasıl belirlenebileceği açıklanmıştır.
10
2
İki boyutlu uzay
ile belirtilsin. Bu vektör uzayı tüm iki elemanlı gerçel vektörlerden oluşur. Bu
uzaydaki herhangi bir vektörün x1 ve x2 vektörlerinin doğrusal kombinasyonu olarak ifade
edilebileceği açıktır. Bununla birlikte x1 ve x2 vektörleri keyfi olarak seçilmişti. Bu nedenle
aşağıdaki iki boyutlu birim vektör çifti ele alınsın,
⎡1 ⎤
e1 = ⎢ ⎥
⎣0 ⎦
2
⎡0⎤
e2 = ⎢ ⎥
⎣1 ⎦
deki herhangi bir c vektörü de bu vektörlerin doğrusal bir kombinasyonu olarak ifade edilebilir.
Bu durum için λ değerlerinin belirlenmesi basittir. Daha önce verilen iki örnek için,
⎡ 4⎤
⎡1 ⎤
⎡0 ⎤
⎢ 0 ⎥ = 4 ⎢ 0 ⎥ + 0 ⎢1 ⎥
⎣ ⎦
⎣ ⎦
⎣ ⎦
,
λ1 = 4 ve λ 2 = 0
⎡6 ⎤
⎡1⎤
⎡0⎤
⎢3⎥ = 6⎢0⎥ + 3⎢1⎥
⎣ ⎦
⎣ ⎦
⎣ ⎦
,
λ1 = 6 ve λ 2 = 3
şeklinde λ1 ve λ2 değerleri bulunabilir. Görüldüğü gibi elde edilen bu değerler x vektörlerinin
elemanlarıdır.
Bu örneklerdeki vektör çiftlerinin herbiri (x1,x2 ve e1, e2) iki boyutlu uzay
2
için uygun bir baz
teşkil edebilir. Bu sonuca göre bir bazın benzersiz (eşsiz) olmadığı söylenebilir. Herhangi iki
vektörün
2
’de uygun bir baz olabilmesi için onların farklı yönlerde olması gereklidir. Eğer x1 ve
x2 aynı yönde ise Şekil 3.4’de gösterildiği gibi bir vektör bir skalerle çarpılarak diğer vektöre
dönüştürülebilir ve daha sonra bu vektörün çarpımları x1 ve x2 vektörlerinin doğrusal bir
kombinasyonu olarak ifade edilebilir. Farklı yönlerdeki bu baz vektörler, doğrusal bağımsız
vektörler olarak ifade edilebilecektir. x1 ve x2 vektörleri eğer sadece,
λ1x1+λ2x2=0
(3.15b)
eşitliğini λ1=λ2=0 için sağlıyorsa doğrusal bağımsızdırlar. Eğer λi için sıfırdan farklı bir tek değer
bile bulunabiliyorsa bu vektörler doğrusal bağımlıdır. x1 ve x2 vektörleri,
⎡ 2⎤
x1 = ⎢ ⎥
⎣1 ⎦
⎡6 ⎤
x2 = ⎢ ⎥
⎣ 3⎦
şeklinde tanımlanırsa, bu iki vektörün aynı yönde farklı uzunlukta olduğu görülebilir. Bu durumda
3x1-x2 doğrusal kombinasyonu sıfır değerini verecektir. Bununla birlikte aşağıda verilen x1 ve x2
vektörleri,
⎡ 2⎤
x1 = ⎢ ⎥
⎣1 ⎦
⎡1⎤
x2 = ⎢ ⎥
⎣3⎦
için λ1x1+λ2x2=0 eşitliğini sağlayan sıfırdan farklı λ1 ve λ2 değerleri bulmak imkansızdır. Bu
vektörler için birinci elemanı sıfıra indirgeyecek λ1 ve λ2 çifti bulunabilir, örneğin, λ1=1 ve λ2=-2
gibi. Fakat bu λ çifti ikinci elemanları asla sıfıra indirgeyemeyecektir. Bu tanıma göre
2
için bir
11
baz vektör çifti, birbirinden bağımsız herhangi iki elemanlı vektör olarak tanımlanabilir. İki boyutlu
vektör geometrisinden görüleceği üzere, verilen bir baza göre belirtilen bir vektörün eşsiz olarak
temsil edilebilmesi için
y = λ1x1 + λ2 x 2
eşitliğini bir ve yalnız bir adet λ1, λ2 çiftinin sağlaması gerekmektedir.
2
de x1 ve x2’nin baz vektörler olarak verilmesi durumunda bu uzaydaki herhangi bir y
vektörünün bu baz vektörlerin eşsiz bir doğrusal kombinasyonu olarak ifade edilebileceği
belirtilmişti. Buna göre x1, x2ve y vektörleri doğrusal bağımlıdır. Çünkü,
λ1x1 + λ2 x 2 − y = 0
denkleminde sıfırdan farklı bir λ (y’nin katsayısı –1 olduğu için) değeri mevcuttur. Bu durumda
2
’de genişletilmiş x1, x2 ve y vektör setine göre ifade edilebilecek herhangi bir v vektörünün
mevcut olup olmadığı sorulabilir. Bu soruya verilecek yanıt şüphesiz evettir, fakat katsayılar eşsiz
olmayacaktır. Örneğin; x1, x2 ve y vektörleri,
⎡ 2⎤
x1 = ⎢ ⎥
⎣1 ⎦
⎡1⎤
x2 = ⎢ ⎥
⎣ 3⎦
⎡1⎤
y=⎢ ⎥
⎣1⎦
şeklinde verilmiş ise x1, x2ve y’nin doğrusal bir kombinasyonu olarak,
⎡6⎤
v=⎢ ⎥
⎣8 ⎦
vektörü elde edilebilir. Bu kombinasyon,
v = 2x1 + 2x 2 + 0y
şeklindedir. Fakat v için (6,8) değerini verebilecek pek çok λ değerleri mevcuttur. Genel doğrusal
kombinasyon,
v = λ1x1 + λ2 x 2 + λ3 y
yeniden düzenlenerek,
v − λ3 y = λ1x1 + λ2 x 2
şeklinde de yazılabilir. Daha sonra da λ3 için herhangi bir keyfi değer atanarak sol taraf belirli iki
elemanlı bir vektör haline getirilir ve bu vektör x1 ve x2’nin doğrusal bir kombinasyonu şeklinde
ifade edilebilir. x1, x2ve y’nin oluşturduğu bu tür vektör setleri, zincir (span) ya da türeten seti
olarak adlandırılır. Baz ve zincir setleri arasında bir fark mevcuttur. Bu fark da baz setlerin
doğrusal bağımsız vektörlerden oluşmasından kaynaklanmaktadır. Verilen örnekteki zincir seti bir
vektör eksiltilerek baz sete dönüştürülebilir.
Tam bir üç boyutlu uzay oluşturmak için diğerlerinden bağımsız olarak belirtilebilecek üçüncü bir
vektöre ihtiyaç vardır. Bu nedenle P düzleminin dışına çıkılır. Bunun sonucu olarak bu üç boyutlu
uzaydaki noktalar setinin bütünü
12
− ∞ < λ1 , λ 2 , λ3 < ∞
T: λ1x1+λ2x2+λ3x3
(3.16)
ifadesiyle oluşturulabilir. Bu ifade üç boyutlu uzayda x1, x2 ve x3 oluşumu (veya zinciri) olarak
belirtilir. Başka bir deyişle x1, x2 ve x3 bu üç boyutlu uzayın temelini oluşturmaktadır. Elemanları
gerçel sayı olan üç elemanlı bir vektör üç boyutlu uzayda bir nokta tanımlar. Üç boyutlu uzay
3
ile
tanımlanır ve bu uzaydaki herhangi bir v vektörü üç doğrusal bağımsız vektörün uygun bir setinin
eşsiz doğrusal kombinasyonu olarak ifade edilebilir. Bu üç vektör
3
için bir baz oluşturur. Bu bazı
oluşturan vektörler,
⎡1 ⎤
e1 = ⎢⎢ 0 ⎥⎥
⎢⎣ 0 ⎥⎦
⎡0 ⎤
e 2 = ⎢⎢1 ⎥⎥
⎢⎣0 ⎥⎦
⎡0⎤
e3 = ⎢⎢0 ⎥⎥
⎢⎣1 ⎥⎦
şeklinde seçildiklerinde bir vT = [3 −2 5] vektörü,
v = 3e1 − 2e 2 + 5e3
eşitliği ile verilebilir. Bu vektörlerden herhangi iki tanesi (örneğin e1, e2) ele alındığında bunların
tüm doğrusal kombinasyonları
3
uzayında bir alt vektör uzayı oluşturur. Bunun nedeni herbir
zincir vektöründe üçüncü bileşenin sıfır olmasıdır. Örneğin;
⎡1 ⎤
x1 = ⎢⎢ 2 ⎥⎥
⎢⎣ 3 ⎥⎦
⎡5⎤
x 2 = ⎢⎢1⎥⎥
⎢⎣1⎥⎦
şeklinde üç elemanlı iki vektör ele alındığında bu vektörler Şekil 3.10’da görüldüğü gibi bir düzlem
yüzeyi oluştururlar. Şekilde bu düzlem x1Ox2 ile belirtilmiştir.
Şekil 3.10
Üç boyutlu uzay için de x1
2
değerinin vektörün karesel uzunluğu olduğu doğrulanabilir. Örneğin
Şekil 3.5b’de Pisagor teoremi ilk olarak ABC üçgenine uygulanarak AC’nin karesel uzaklığı
13
2
2
x11
+ x 21
elde edilir. Daha sonra teorem ACD üçgenine uygulanarak, AD vektörünün karesel
uzunluğu
2
2
2
( x11
+ x 21
) + x31
= x1
2
(3.17)
olarak elde edilir ve teorem üç boyutlu uzay için de doğrulanmış olur. x1=(2 4 3) şeklinde verilmiş
vektörün karesel uzunluğu için, x1
2
= x1 x1T = 2 2 + 4 2 + 3 2 = 29 ve uzunluğu için ise x1 = 29
sonucu elde edilir.
Eşitlik (3.16), n boyutlu uzay için genelleştirilebilir.
M: λ1x1+λ2x2+…+λmxm
− ∞ < λi < ∞
(3.18a)
Eşitlik (3.18a), m adet sabit vektörün tüm mümkün doğrusal kombinasyonlarının setidir ve m boyutlu
bir alt uzay olarak adlandırılır. Eğer m=1 ise alt uzay düz bir doğru m=2 ise alt uzay bir düzlemdir.
m>2 olması durumunda ise alt uzay bir hiper düzlem olarak adlandırılır. Sadece m=n olması
durumunda n adet birbirinden bağımsız vektör mevcuttur (x1, x2,…, xn) ve bu vektörlerin tümü n
boyutlu uzayı oluşturur. Bu n boyutlu uzaydaki herhangi bir vektör veya bir y noktası için λ1, λ2,…, λm
katsayılarının sadece ve sadece bir tek seti mevcuttur ve bu set,
y=λ1x1+λ2x2+…+λnxn
(3.18b)
eşitliği ile bulunabilir. Bu katsayılar, (x1, x2,…, xn) vektörlerine göre y’nin koordinatları olarak
adlandırılırlar. Konu daha da genelleştirilirse, tüm n adet gerçel eleman içeren vektörler
oluştururlar.
n
n
uzayını
’deki her bir vektör, n doğrusal bağımsız vektörün bazı uygun setlerinin bir eşsiz
doğrusal kombinasyonu olarak ifade edilebilir. Bu doğrusal kombinasyon eşsiz olmak zorundadır.
Bunu görebilmek için bir v vektörünü baz v1, v2,…,vn vektörlerinin iki farklı doğrusal kombinasyonu
olarak,
v = λ1 v1 + λ2 v 2 +
+ λn v n
v = μ1 v1 + μ2 v 2 +
+ μn v n
şeklinde ifade edilebildiği varsayılsın. Bu iki denklem birbirinden çıkarılarak,
0 = (λ1 − μ1 )v 1 + (λ 2 − μ 2 )v 2 +
+ (λ n − μ n )v n
eşitliği elde edilir. Baz veriler doğrusal bağımsız oldukları için,
λ1 − μ1 = λ 2 − μ 2 =
= λn − μ n
ifadesi elde edilebilir ve görüldüğü gibi bu ifade eşsizdir. Eğer k adet n elemanlı doğrusal bağımsız
vektörün bir seti alınmış ise bu set
n
’in bir alt uzayını oluşturur. Bu alt uzayın boyutu bu alt
uzaydaki doğrusal bağımsız vektör sayısına eşittir. n elemanlı vektörler için v1, v2, … ,vk eğer,
vi v j = 0
tüm i ≠ j için
sonucu sağlanıyorsa bu vektör seti ayrık ortogonal settir.
3.1.3 Vektör Geometrisinde Ortogonal İzdüşüm
14
İki boyutlu uzayda x1=(1 -1) ve x2=(2 1) vektörleri dikkate alınsın. Bu vektörler bütün uzayı
tanımlayacaklardır. y = (4 1) şeklinde verilen bir vektörün x1 ve x2’ye göre koordinatlarını
bulabilmek için eşitlik (3.15a) kullanılarak,
λ1x1T + λ2 xT2 = y
⎡1⎤
⎡ 2⎤
⎡4⎤
⎣
⎣ ⎦
⎣
λ1 ⎢ ⎥ + λ2 ⎢ ⎥ = ⎢ ⎥
−1
−1
1
⎦
⎦
λ1 + 2λ2 = 4
−λ1 + λ2 = −1
yazılabilir ve bu denklem sisteminin çözümüyle λ1=2, λ2=1 elde edilir. y vektörünün x1 ve x2’nin
doğrusal bir kombinasyonu olarak ifade edileceği görülmektedir. Bu durum Şekil 3.11’de geometrik
olarak görülmektedir. L1 doğrusunun (alt uzayının) x1 tarafından L2 alt uzayının ise x2 tarafından
oluşturulduğu görülmektedir. Daha sonra λ1=2 ve λ2=1 alınarak bir paralel kenar ile şekil
tamamlanmıştır.
Şekil 3.11 İzdüşüm ile y’nin koordinatlarının x1 ve x2’ye göre geometrik olarak ifade edilmesi.
Başka bir deyişle, y’nin koordinatlarını bulmak için ilk olarak L2’ye paralel olacak şekilde L1 üzerine
y’nin izdüşümü alınarak λ1 elde edilir. Daha sonra benzer bir işlem λ2 için yapılır, L1’e paralel olacak
şekilde L2 üzerine y‘nin izdüşümü alınır. En basit izdüşüm yapısı ortogonal izdüşümdür. Bu durum x1
ile x2’nin birbirine ortogonal olmaları durumunda ortaya çıkar, (bkz Şekil 3.12).
Şekil 3.12 x1 üzerine y’nin ortogonal izdüşüm
15
Şekil 3.13 İki boyutlu ortogonal izdüşüm
Eşitlik (3.10) ile tanımlanan vektörler için ortogonallik şartı oldukça basit olduğu için ortogonal
izdüşümü hesaplamak da oldukça basittir. x1 vektörünün tanımladığı L1 doğrusu üzerine y’nin
ortogonal izdüşümü y1 ile belirtilmiş ve Şekil 3.13’de gösterilmiştir. y1 izdüşüm vektörü L1 üzerinde
bulunacağı için eşitlik (3.2) de verilen bir vektörün x1 bir skalerle λ çarpımı şeklinde
y1=λx1
(3.19)
ifade edilebilir. Burada sorun λ katsayısının belirlenebilmesidir. Şekil 3.13’den görülebileceği gibi y1
ile y birleştirilerek y-y1 vektörü tanımlanabilir. Bu işlemde elde edilen vektör ile x1 arasındaki
ortogonal yapı korunmalıdır. (y-y1) ve x1 ortogonal olduğundan eşitlikler (3.10) ve (3.19) kullanılarak,
(y-λx1)T x1=0
y T x1 − λ ( x1T x1 ) = 0
λ=
y T x1
x1T x1
(3.20)
elde edilir. Eşitlik (3.20), eşitlik (3.19)’da yerine konarak
T
⎛ yT x ⎞
(3.21)
y1 = ⎜ T 1 ⎟ x1
⎝ x1 x1 ⎠
sonucu bulunabilir. Eşitlik (3.21) in sağındaki ilk bileşenin payı ve paydası bir skaleri tanımladığı için
transpozları kendilerine eşittir. Bu eşitlikteki y1 ifadesi x1 üzerine y nin ortogonal izdüşümünü
belirtmektedir. Bu izdüşüm vektörünün karesel uzunluğu,
y1
2
= y 1T y 1
= λ2 x1T x1
2
⎡ yT x ⎤
= ⎢ T 1 ⎥ x1T x1
⎣ x1 x1 ⎦
y1
2
(y x )
=
T
2
1
x1T x1
olup, normu veya uzunluğu ise
y T x1
y1 =
x1
(3.22)
(3.23)
şeklindedir. Şekil 3.13 incelendiğinde, ortogonal izdüşüm y1 in L1 üzerindeki y ye en yakın alt nokta
olduğu görülebilir. Ortogonal olmayan ve y 1* ile gösterilebilecek diğer herhangi bir izdüşümün y
16
noktasına olan uzaklığı daha fazla olacaktır. y − y 1* uzaklığı y − y 1 uzaklığından daha büyüktür.
Çünkü y − y 1* dik üçgenin üçgeninin hipotenüsüdür. Üç boyutlu durum Şekil 3.14’de gösterilmiştir.
Şekil 3.14 Üç boyutlu uzayda ortogonal izdüşüm
Teorem 3.1 λ1x1+λ2x2+…+λmxm alt uzayı üzerine y vektörünün ortogonal izdüşümü bu alt
uzaydaki y vektörüne en yakın noktayı belirtir.
3.2 MATRİSLER
Matris sayı veya elemanların sıralar ve sütunlar şeklinde düzenlendiği dikdörtgen bir dizindir.
Matrisi oluşturan bu sıra ve sütunların sayısı matrisin boyutunu belirler. Örneğin, m adet sıra ve n
adet sütundan oluşan bir A matrisi aşağıda gösterilmiştir.
A mxn
⎡ a 11
⎢a
= ⎢ 21
⎢
⎢
⎣a m1
a12
a 22
am2
… a1n ⎤
a 2 n ⎥⎥
⎥
⎥
a mn ⎦
Matrisin içindeki aij değerleri matrisin elemanlarıdır. Bu kitapta Amxn ifadesi, m sıra ve n sütundan
oluşan bir matrisi ifade edecektir ve sıra sayısı ilk sütun sayısı ise ikinci indisle tanımlanacaktır.
Örneğin aij, i-nci sıra j-inci sütundaki elemandır. Tüm elemanları gerçel sayılardan oluşan matrisler
gerçel matrislerdir ve A ∈
m×n
ile tanımlanır.
Matrisler üzerine açıklanacak ilk konu matris işlemleridir. Temel matris işlemleri ise toplama ve
çarpma işlemleridir.
3.2.1 Matris İşlemleri
İki matrisin toplanabilmesi için boyutlarının eşit olması gereklidir. Boyutları eşit olan iki matrisin,
Am×n, Bm×n toplamı karşılıklı elemanlarının toplamına,
(
)
A + B = a ij + bij = c ij = C
(3.24)
eşittir.
Örnek 3.1 Aşağıdaki A ve B matrislerinin toplamını elde ediniz.
17
⎡ − 1 3⎤
A 2x2 = ⎢
⎥
⎣ 4 2⎦
⎡ − 6 4⎤
B 2x2 = ⎢
⎥
⎣ 7 5⎦
⎡(− 1 − 6) = −7
Çözüm: A 2 x 2 + B 2 x 2 = ⎢
⎣ (4 + 7 ) = 11
(3 + 4) = 7 ⎤
=C .
(2 + 5) = 7⎥⎦ 2 x 2
Bir matrisin λ skaleri ile çarpımı,
⎡ λa 11
⎢ λa
λA = Aλ = ⎢ 21
⎢
⎢
⎣λa m1
λa12
λa 22
λa m 2
… λa1n ⎤
λa 2 n ⎥⎥
⎥
⎥
λa mn ⎦
(3.25)
olarak tanımlanır. Eğer A boyutu m×n ve B boyutu n×p olan matrisler ise bu matrislerin çarpımı,
⎛ n
AB = ⎜⎜ ∑ a ij b jk = a i1b1k + a i 2 b2 k +
⎝ j =1
⎞
+ a in bnk = cik ⎟⎟ = C
⎠
(3.26a)
eşitliği ile tanımlanır. Her bir cik elemanı için bu çarpım işlemi eşitlik (3.4) ile tanımlanan
vektörlerin nokta çarpımına denktir. A matrisinin i-inci satır elemanı B matrisinin karşılık gelen kıncı sütun elemanı ile çarpılır ve elde edilen değerler toplanarak C matrisinin cik elemanı elde edilir.
Çarpım işlemlerinin ön koşulu soldaki matrisin sütun sayısının sağdaki matrisin satır sayısına eşit
olmasıdır. Çarpım sonucunda elde edilen C matrisinin boyutu m×p olur. Eşitlik (3.26a) dan bu
matrisin ik-ıncı elemanının,
n
cik = ∑ a ij b jk
(3.26b)
j =1
eşitliği ile elde edilebileceği görülebilir. Matris çarpımlarında matrislerin konumu (sıralaması)
önemlidir. Boyutları dikkate alındığında AB çarpımı geçerli olup BA çarpımı geçerli değildir. B
matrisi için p=m alınarak,
⎛ n
⎞
BA = ⎜ ∑ bri a ij = c rj ⎟ = C
⎝ i =1
⎠
çarpımı elde edilebilir.
Örnek 3.2 Aşağıdaki A ve B matrislerinin çarpımını elde ediniz.
A 3x 2
⎡− 1 3 ⎤
= ⎢⎢ 4 − 2⎥⎥
⎢⎣ 5
0 ⎥⎦
⎡ − 3 2⎤
B 2x2 = ⎢
⎥
⎣− 4 1⎦
Çözüm: A 3 x 2 B 2 x 2 = C 3 x 2
⎡ (−1)(−3) + (3)(−4) (−1)(2) + (3)(1) ⎤ ⎡ − 9 1 ⎤
⎡− 1 3 ⎤
−
3
2
⎡
⎤
⎢
⎥ ⎢
⎢ 4 − 2⎥
⎥
⎢
⎥ ⎢− 4 1 ⎥ = ⎢(4)(−3) + (−2)(−4) (4)(2) + (−2)(1)⎥ = ⎢ − 4 6 ⎥ .
⎦ ⎢ (5)(−3) + (0)(−4)
⎢⎣ 5
(5)(2) + (0)(1) ⎥⎦ ⎢⎣− 15 10⎥⎦
0 ⎥⎦ ⎣
⎣
18
Yukarıda belirtildiği gibi matrislerin çarpımı matrisleri oluşturan vektörlerin çarpımları ile elde
edilir. Vektörel çarpımlar istatistikte olukça önemlidir. Örneğin verilen an×1 ve bn×1 boyutlu
a nx1
⎡ a1 ⎤
⎢a ⎥
= ⎢ 2⎥
⎢ ⎥
⎢ ⎥
⎣a n ⎦
b nx1
⎡ b1 ⎤
⎢b ⎥
= ⎢ 2⎥
⎢ ⎥
⎢ ⎥
⎣bn ⎦
vektörler iki şekilde çarpılabilir: Birincisi eşitlik (3.4) ile tanımlanan nokta çarpımdır ve sonucunda
bir skaler elde edilir. İkincisi ise aşağıda tanımlanan ve dış çarpım olarak adlandırılan çarpım,
a n×1b1T×n
⎡ a1 ⎤
⎢a ⎥
= ⎢ 2 ⎥ [b1
⎢ ⎥
⎢ ⎥
⎣a n ⎦
⎡ a1b1
⎢a b
bn ] = ⎢ 2 1
⎢
⎢
⎣a n b1
b2
a1b2
a 2 b2
a n b2
a1bn ⎤
a 2 bn ⎥⎥
= C nxn
⎥
⎥
a n bn ⎦
(3.27)
olup işlem sonucunda bir matris elde edilir.
Teorem 3.2 Çarpmanın toplama üzerine dağılma özelliği, matrislerin boyutları çarpmaya uygun
olmak üzere,
A(B + C) = AB + AC
şeklinde matrisler için uygulanabilir.
Bir Am×n matrisinin transpozu (evriği) A Tn×m şeklinde ifade edilir ve A matrisinin sıraları ile
sütunları yer değiştirilerek elde edilir. Başka bir deyişle A matrisinin i-inci sırası AT matrisinin iinci sütununu oluşturur. A 3x 2 matrisinin kendisi ve transpozu aşağıda verilmiştir.
A 3x 2
⎡ 3 4 ⎤
= ⎢⎢− 2 5 ⎥⎥
⎢⎣ 7 1 ⎥⎦
⎡3 − 2
A T2×3 = ⎢
5
⎣4
7⎤
1 ⎥⎦
Teorem 3.3 AT matrisinin (vektörünün) transpozu A matrisine (vektörüne) eşittir.
(A )
T T
=A
Teorem 3.4 Matris toplamlarının transpozu,
( A + B + C) T = A T + B T + CT
şeklindedir.
Teorem 3.5 Matris çarpımlarının transpozu,
(ABC)T
= CT B T A T
şeklindedir.
19
Teorem 3.6 A ve B matrisleri ancak ve ancak boyutları birbirine eşit ve karşılık gelen tüm
elemanları birbirine eşit aij= bij i=1,…m j=1,…n ise eşit A=B matrislerdir.
Sıra ve sütun sayıları eşit olan (m = n) matrisler kare matris olarak adlandırılır.
⎡4 2
= ⎢⎢9 − 1
⎢⎣3 2
A 3x 3
5⎤
4⎥⎥
6⎥⎦
Köşegen elemanları haricindeki elemanları sıfıra eşit olan kare matris, köşegen matris olarak
bilinir. Bir matrisin köşegen matris olabilmesi için köşegen elemanlarından bir tanesinin sıfırdan
farklı olması yeterlidir. Köşegen matrisler genellikle D harfi ile tanımlanırlar.
⎡1
⎢0
=⎢
⎢0
⎢
⎣0
D 4x4
0
0
3
0
0 −7
0
0
0⎤
0⎥⎥
0⎥
⎥
5⎦
Teorem 3.7 Eğer D1 ve D2 köşegen matrisler ise bu matrislerin çarpımları da bir köşegen matristir.
D1D2=D2D1=D
D matrisinin i-inci elemanı, D1 ve D2’nin i-inci elemanlarının çarpımından elde edilir.
Tüm elemanları bire (1) eşit olan köşegen matris birim matristir ve I harfi ile belirtilir.
I 3x 3
⎡1 0 0⎤
= ⎢⎢0 1 0⎥⎥
⎢⎣0 0 1⎥⎦
(3.28)
Teorem 3.8 Herhangi bir A matrisinin soldan ya da sağdan birim matris ile çarpılması A matrisini
değiştirmez.
IA = AI = A
Bu özelliği birim matrisin matris işlemlerinde etkisiz eleman olarak kullanılmasını sağlar.
Matrislerin sağdan ya da soldan çarpılmalarının önemini de dikkate alan, aşağıdaki işlem bu
duruma bir örnek olarak verilebilir.
A − BA = IA − BA
= (I − B ) A
Birim matris baz vektörler üzerine dış çarpın uygulanarak,
n
n
i =1
i =1
I n = ∑ ei eTi = ∑ Eii
elde edililebilir. Bir baz vektörün bir diğeri ile dış çarpımı Eij=eiej sonucunda elde edilen matrisin
ij-inci elemanı 1 diğer elemanları sıfırdır. Örneğin,
20
⎛1⎞
⎛0⎞
⎜ ⎟
⎜ ⎟
e1 = ⎜ 0 ⎟ ve e 2 = ⎜ 1 ⎟
⎜0⎟
⎜0⎟
⎝ ⎠
⎝ ⎠
⎛0 1 0⎞
⎜
⎟
E12 = e1eT2 = ⎜ 0 0 0 ⎟ .
⎜0 0 0⎟
⎝
⎠
Birim matrisin bir skaleri ile çarpımı sonucu elde edilen ve tüm köşegen elemenları eşit fakat
birden (1) farklı köşegen matris ise skaler matristir.
D 3 x 3 = λI 3×3
⎡λ 0 0 ⎤
= ⎢⎢ 0 λ 0 ⎥⎥
⎢⎣ 0 0 λ ⎥⎦
Tüm elemanları sıfır olan matris boş (null) ya da sıfır matrisi olarak adlandırılır ve 0 ile
gösterilirler. Alt üçgen matris,
⎡ a11
⎢a
A = ⎢ 21
⎢
⎢
⎣ an1
0
a22
an 2
0⎤
0 ⎥⎥
⎥
⎥
ann ⎦
ve üst üçgen matris,
⎡ a11
⎢0
A=⎢
⎢
⎢
⎣0
a12
a22
0
a1n ⎤
a2 n ⎥⎥
⎥
⎥
ann ⎦
şeklinde tanımlanır.
Köşegen elemanlarının üstündeki (üst üçgen) aij elemanları ile köşegen elemanlarının altındaki (alt
üçgen) aji elemanlarının tümünün bire bir eşit olduğu matris simetrik matristir. Simetrik matrisin
transpozuda kendisine eşittir,
A=AT
(3.29)
Başka bir deyişle A matrisinin aij elemanı, AT matrisinin aji elemanına eşittir. Simetrik bir matris
aşağıda gösterilmiştir.
A 3x 3
⎡ 4 2 3⎤
= ⎢⎢2 − 1 2⎥⎥
⎢⎣3 2 6⎥⎦
Teorem 3.9 Her hangi bir gerçel kare matris A için, A matrisi simetrik olmasa da A+AT simetrik
matristir.
Teorem 3.10 Her hangi iki gerçel kare matris A ve B için, A ve B matrisleri simetrik olsa da AB
matrisi simetrik olmayabilir.
Teorem 3.11 Her hangi iki gerçel kare matris A ve B için, eğer B matrisi simetrik ise ATBA matrisi
simetrik olup bu ifadenin tersi geçerli olmayabilir.
21
Eğer bir matrisin elemanları AT=-A özelliğini sağlıyor ve köşegen elemanları sıfır ise çarpık
simetrik matris olarak adlandırılır. Diğer bir ifade ile aii=0 ve aij=-aji olmalıdır.
⎛ 0 1 −6 ⎞
⎜
⎟
A = ⎜ −1 0 −5 ⎟
⎜6 5 0⎟
⎝
⎠
Matrisi çarpık simetrik bir matrisdir.
Teorem 3.12 Her hangi bir gerçel kare matris A için A-AT matrisi çarpık simetrik matrisi tanımlar.
Teorem 3.13 Her hangi bir gerçel kare matris A, simetrik ve çarpık simetrik bir matrisin toplamı
A=
A + AT A − AT
+
2
2
olarak elde edilebilir.
Bir kare matrisin köşegen elemanlarının toplamı matrisin izi (trace) olarak adlandırılır, tr(A)
şeklinde gösterilir ve
m
tr (A ) = a11 + a 22 + … + a mm = ∑ a ii
(3.30)
i =1
eşitliğinden hesaplanır. Eşitlik (3.30) dan görülebileceği gibi matrisin izi bir skalerdir. Matris kare
matris değilse izi tanımsızdır.
Teorem 3.14 I matrisi n×n boyutlu birim matris ise tr (I ) = n ’dir.
Teorem 3.15 A matrisi kare matris ise transpozunun izi kendi izine eşittir.
( )
tr A T = tr (A ) .
Teorem 3.16 Her hangi bir gerçel matris A için,
(
)
tr A T A ≥ 0
(
)
olup, ancak ve ancak A=0 ise tr A T A = 0 sağlanır.
Teorem 3.17 Her hangi bir gerçel matris A için,
(
) (
)
tr A T A = tr AA T = ∑ ∑ a ij2 .
i
j
Teorem 3.18 A ve B aynı boyutlu kare matrisler ise toplamlarının izi, izlerinin toplamına eşittir.
tr (A + B ) = tr (A ) + tr (B ) .
Teorem 3.19 Eğer ABC, BCA, CAB matris çarpımları kare matrisleri tanımlıyor ise,
tr (ABC) = tr (BCA ) = tr (CAB ) .
İspat: Sadece A ve B matrisleri için tr(AB)=tr(BA) olduğu ispatlanacaktır. AB matrisinin boyutu
m×m’dir. Bu matrisin i-inci köşegen elemanı,
22
n
cii = ∑ a ij b ji
j =1
şeklinde olduğu için,
m
n
tr ( AB) = ∑∑ aij b ji
i =1 j =1
eşitliği ile elde edilir. BA matrisi ise n×n boyutludur. Bu matrisin j-inci köşegen elemanı,
m
d ii = ∑ b ji aij
i =1
şeklinde elde edildiği için,
n
m
tr (BA) = ∑∑ b ji aij = tr ( AB)
j =1 i =1
sonucu elde edilir. Bu sonuç, tr ( ABC) = tr (BCA ) = tr (CAB) şeklinde genişletilebilir.
Sıraları ortanormal vektör setinden oluşan boyutu r×c olan bir P matrisi için PPT=Ir eşitliği
sağlanır. Bununla birlikte PTP çarpımı c boyutlu bir birim matrisi Ic vermesi şart değildir. Eğer P
matrisinin sütunları ortanormal vektör setini tanımlıyor ise PTP=Ic sağlanır fakat PPT çarpımı birim
matrise eşit olmayabilir. Ortanormal sıralara sahip kare matrisler doğrusal cebirde özel bir sınıfı
tanımlar bu matrislerin aynı zamanda sütunları da ortanormaldir ve
P T P = PT P = I
(3.31)
eşitliğini sağlarlar. Koşulu sağlayan P matrisi ortogonal matris olarak adlandırılır. Eğer i) P kare
matris ii) PTP=I ve iii) PPT=I koşullarından her hangi ikisinin sağlanması üçüncün de sağlandığını
ve P matrisinin bir ortogonal matris olduğunu belirtir. Ortogonal matrisler ile ilgili eşitlik (3.31) e
denk bir diğer özdeşlik ters matrisler kısmında verilecektir.
Teorem 3.20 Eğer P ortogonal bir matris ise tr(PTAP)=tr(A) dır.
Bir matrisin kuvvetinin alınabilmesi için kare matris olması gereklidir. Boyutu m×n olan bir A
matrisi için AA çarpımı ancak ve ancak m=n durumu için geçerlidir. Diğer bir deyişle A2 matrisi
sadece A kare matris ise mevcuttur. Bu durumda tüm pozitif k tam sayıları için Ak matrisi
tanımlıdır. Skaler aritmetikte x0=1 olup matris cebrinde eğer A kare matris ise A0=I ile
tanımlanmıştır. Gerçel sayılar cebrinde a2=-1 eşitliğini sağlayan bir gerçel skaler yoktur. Bununla
birlikte,
⎛ 0 1⎞
⎟⎟
A = ⎜⎜
⎝ − 1 0⎠
gerçel matrisi A2=-I eşitliğini sağlar. Bu matris ortogonal bir matris olup soldan her hangi bir (x,y)T
noktası ile çarpılması sonucunda, orijinde merkezlenmiş bir daire boyunca, bu noktayı 900 açı ile
saat yönünde döndürerek (y,-x)T noktasını elde eder:
23
⎛ 0 1 ⎞⎛ x ⎞ ⎛ y ⎞
⎜⎜
⎟⎟⎜⎜ ⎟⎟ = ⎜⎜ ⎟⎟
⎝ − 1 0 ⎠⎝ y ⎠ ⎝ − x ⎠
Skaler cebrinden farklı olarak her hangi bir B≠0 matrisi için B2=0 sonucu sağlanabilir. Örneğin,
2
5 ⎞
⎛1
⎜
⎟
4 10 ⎟
B=⎜ 2
⎜ − 1 − 2 − 5⎟
⎝
⎠
matrisi B2=0 eşitliğini sağlar. Bk-1≠0 ve Bk=0 koşullarını sağlayan matrisler, k indeksli, nilpotent
matrisler olarak adlandırılır. Yukarıda tanımlanan B matrisi indeksi 2 olana bir nilpotent matristir.
Skaler cebrinden farklı olarak AB=0 eşitliğinin sağlanması için ne A matrisinin ne de B matrisinin
sıfıra eşit boş matris olması gerekli değildir. Örneğin,
⎛ 1 1⎞
⎟⎟
A = ⎜⎜
⎝ 1 1⎠
1⎞
⎛1
⎟⎟
B = ⎜⎜
⎝ − 1 − 1⎠
matrisleri için AB=0 eşitliği sağlanmaktadır.
Teorem 3.21 A her hangi bir gerçel matris olmak üzere, ancak ve ancak A=0 ise ATA=0 eşitliği
sağlanır.
Teorem 3.22 A ve B her hangi iki gerçel matris olmak üzere, ancak ve ancak ATAB=0 ise AB=0
eşitliği sağlanır.
Teorem 3.23 A, B ve C her hangi üç gerçel matris olmak üzere, ancak ve ancak ATAB= ATAC ise
AB=AC eşitliği sağlanır.
Kare matrislerin bir diğer önemli özel durumu ise idempotent matristir. A matrisi bir kare matris
olsun. Eğer;
A = A2
(3.32)
eşitliği sağlanıyorsa A matrisi idempotent matristir. Başka bir deyişle matrisin kendisi ile çarpımı
orijinal matrisi veriyorsa bu matris idempotent matristir. Simetrik olsun olmasın herhangi bir kare
matris (3.32) eşitliğini sağlıyorsa idempotent matristir. Fakat bu kitapta sadece simetrik idempotent
matrislerle ilgilenilecektir. Bu matrisler istatistik teorisinde önemli bir yer tutmaktadır. Örneğin bir
x değişkeni y i = xi − x dönüşüm ile ortalamadan sapmaları ifade eden bir değişkene döştürülebilir.
Bu dönüşüm bir idempotent matris kullanılarak aşağıda açıklandığı şekilde gerçekleştirilebilir:
Tüm elemanları bir değerinden oluşan n×1 boyutlu,
⎛1⎞
⎜ ⎟
1=⎜ ⎟
⎜1⎟
⎝ ⎠
(3.33)
vektörü tanımlansın. Bu vektörün kendi ile iç çarpımı,
24
⎛ 1⎞
⎜ ⎟
1) ⎜ ⎟ = n
⎜ 1⎟
⎝ ⎠
1T 1 = (1
(3.34)
vektörün boyutunu tanımlayan bir skaleri verir. Vektörün dış çarpımı ise,
⎛ 1⎞
⎜ ⎟
11 = ⎜ ⎟ (1
⎜ 1⎟
⎝ ⎠
⎛1
⎜
1) = ⎜
⎜1
⎝
T
1⎞
⎟
⎟ = Jn
1⎟⎠
(3.35)
tüm elemanları 1 değerinden oluşan ve Jn ile gösterilen n×n boyutlu bir matrisdir. Eşitlik (3.33) de
tanımlanan vektör kullanılarak elde edilen,
⎛1⎞
M = I n − ⎜ ⎟11T
⎝n⎠
(3.36)
matrisi,
1
1
1
1
1
⎛
⎞⎛
⎞
M 2 = ⎜ I n − 11T ⎟⎜ I n − 11T ⎟ = I n − 11T − 11T + 2 11T 11T
n
n
n
n
n
⎝
⎠⎝
⎠
= In −
( )
2 T
1
2
1
11 + 2 1 1T 1 1T = I n − 11T + 2 11T = M
n
n
n
n
eşitliğinden görüldüğü gibi simetrik ve idempotent bir matristir. x değişkeninin ortalaması matris
gösteriminde,
x=
1 T
1 x
n
(3.37)
eşitliği ile tanımlanır. Eşitlik (3.36) de verilen M matrisi kullanılarak, y=Mx vektör denklemi ile
( )
1
1
⎛
⎞
y = Mx = ⎜ I n − 11T ⎟x = x − 1 1T x
n
n
⎝
⎠
= x − x1
(3.38)
ortalamadan sapmalara dönüştürülmüş değişken elde edilir. Görüldüğü gibi simetrik ve idempotent M
matrisi her hangi bir değişken için ortalamadan sapmalara göre tanımlanan değişkeni elde eden bir
dönüşümü vermektedir. Yukarıda elde edilen yeni değişken y için y = 0 olacaktır. Yeni bir dönüşüm
z=My ile tanımlansın. Eşitlik (3.38) den z = y − y1 = y olduğu ya da z=My=M2x= Mx görülebilir.
Diğer bir deyişle idempotent bir matris ile gerçekleştirilen bir operasyonun tekrarlanmasının her hangi
bir etkisi yoktur. İstatistikteki kullanılan bir diğer önemli özellik olan ortalamadan sapmaların kareler
toplamını ifade eden
∑( x − x )
2
değeri xTMx eşitliği ile elde edilebilir:
1
1
⎛
⎞
xT Mx = xT ⎜ I n − 11T ⎟ x = xT x − xT 1 (1T x )
n
n
⎝
⎠
= xT x − xT 1 x = xT x − nx 2
(3.39a)
25
Diğer bir deyişle aşağıdaki ifadeler birbirine denktir:
∑( x − x ) = ∑ x
2
2
i
− nx 2 =xT x − nx 2 = xT Mx
(3.39b)
Eşitlik (3.39) ile verilen xTMx değeri Kısım 3.6 da açıklanacak olan bir karesel formu
tanımlamaktadır. İdempotent matrislerle ilgili bazı önemli teoremler aşağıda verilmiştir.
Teorem 3.24 Eğer A idempotent ve tekil olmayan bir matris ise A=I’dır.
Teorem 3.25 Eğer A, elemanları aij ve i-inci köşegen elemanı sıfır olan bir idempotent matris ise A
matrisinin i-inci sıra ve j-inci sütun elemanlarının hepsi sıfırdır.
Teorem 3.26 Eğer A ve B her ikisi de idempotent olan matrisler ise, AB çarpımının da idempotent
olması için AB=BA olması gereklidir.
Teorem 3.27 Eğer A idempotent ve A+B=I ise B matrisi de idempotendir ve AB=BA=0’dır.
Teorem 3.28 Eğer A idempotent P ortogonal matris ise PTAP matrisi idempotentdir.
Teorem 3.29 Eğer A, rankı r olan idempotent bir matris ise PT AP = Er olacak şekilde bir P
ortogonal matrisi mevcuttur. Burada Er, r adet köşegen elemanı bir ve kalan elemanları sıfır olan
bir köşegen matristir.
Doğrusal cebirdeki bir diğer matris yapısı permütasyon matrisidir. Eğer bir A kare matrisinin her
bir sırası ve her bir sütunu sadece bir tek 1 elemanını içeriyor ve geri kalan elemanları sıfır ise
permütasyon matrisi olarak adlandırılır. Derecesi n olan kare matrisler için n! kadar permütasyon
matrisi vardır. Örneğin n=3 ise altı adet permütasyon matrisi P,
⎛1 0 0⎞ ⎛1 0 0⎞ ⎛0 1 0⎞ ⎛0 1 0⎞ ⎛0 0 1⎞ ⎛0 0 1⎞
⎜
⎟ ⎜
⎟⎜
⎟⎜
⎟⎜
⎟⎜
⎟
⎜ 0 1 0⎟ ⎜ 0 0 1⎟ ⎜1 0 0⎟ ⎜0 0 1⎟ ⎜1 0 0⎟ ⎜0 1 0⎟
⎜0 0 1⎟ ⎜0 1 0⎟ ⎜0 0 1⎟ ⎜1 0 0⎟ ⎜0 1 0⎟ ⎜1 0 0⎟
⎝
⎠ ⎝
⎠⎝
⎠⎝
⎠⎝
⎠⎝
⎠
ile tanımlanmıştır. Permütasyon matrisinin her bir sırası p Ti bir adet 1 ve (n-1) adet sıfır değeri
içerdiğinden p Ti p i = 1 ve bir diğer sıra p Tj , 1 değerini farklı bir elemanında içerdiği için p Ti p j = 0
olup bu sonuçlar P matrisinin ortogonal bir matris olduğunu gösterir.
Eğer bir A kare matrisi
ATA=AAT
(3.40)
özelliğine sahip ise normal matris olarak adlandırılır. Bir gerçel matrisin normu,
A = ⟨ A, A ⟩ 1 2 =
∑i ∑ j aij2
(
= tr A T A
)
(3.41)
şeklinde hesaplanır.
3.2.2 Matrisin Bölümlenmesi
Bazı durumlarda bir matrisin alt matrislere ayrılması faydalı olabilir. Bu işleme matrisin
bölümlenmesi işlemi adı verilir. Bir matris çeşitli şekillerde bölümlenebilir. Örneğin, m×n boyutlu
bir A matrisi,
26
⎛A
A = ⎜⎜ 11
⎝ A 21
A 12 ⎞
⎟
A 22 ⎟⎠
(3.42)
şeklinde alt matrislere ayrılabilir. Burada A11 matrisi m1×n1, A12 matrisi m1×n2, A21 matrisi m2×n1 ve
A22 matrisi m2×n2, boyutludur. Ayrıca m1+m2=m ve n1+n2=n olduğu görülebilir. Bölümlenmiş bir
matrisin transpozu,
⎛A
A = ⎜ 11
⎝ A 21
T
T
T
A12 ⎞ ⎛ A11
=
⎟ ⎜ T
A 22 ⎠ ⎝ A12
AT21 ⎞
⎟
AT22 ⎠
(3.43)
şeklindedir. Bölümlenmiş matrisler için toplama kuralı matrisler için tanınlanan genel kuralla
aynıdır. Diğer bir deyişle karşılıklı bölümlerin boyutları aynı olmalıdır.
Teorem 3.30 Eğer A11 ve A22 kare alt matrisler ise, matrislerin boyutları aynı olmak zoruda değil,
⎛A
tr ( A ) = tr ⎜ 11
⎝ A 21
A12 ⎞
⎟ = tr ( A11 ) + tr ( A 22 )
A 22 ⎠
Teorem 3.31 Eğer A matrisi simetrik ise A11 ve A22 matrisleri de simetriktir.
Teorem 3.32 Eğer A matrisi köşegen ise A11 ve A22 matrisleri de köşegendir.
Teorem 3.33 Eğer A matrisi üst üçgen matris ise A11 ve A22 matrisleri de üst üçgendir.
AB şeklinde iki matrisin çarpımı, bu matrisler alt matrislere ayrılmış olsalar bile sembolik olarak
gösterilebilirler. Bunun için matrislerin boyutlarının çarpım için uygun olması yeterlidir. Eğer B
matrisi n×p boyutlu ve,
⎛B
B = ⎜⎜ 11
⎝ B 21
B12 ⎞
⎟
B 22 ⎟⎠
şeklinde parçalanmış ise Bjk alt matrisleri nj×pk boyutludur. Bu durumda AB çarpımı mevcuttur.
Çünkü Aij’nin boyutları mi×nj ve Bjk’nin ise nj×pk’dır ve alt matrislerin karşılıklı elemanları,
⎛A
AB = ⎜⎜ 11
⎝ A 21
A 12 ⎞⎛ B11
⎟⎜
A 22 ⎟⎠⎜⎝ B 21
B12 ⎞ ⎛ A 11B11 + A 12 B12
⎟=⎜
B 22 ⎟⎠ ⎜⎝ A 21B11 + A 22 B12
A 11B12 + A 12 B 22 ⎞
⎟
A 21B12 + A 22 B 22 ⎟⎠
(3.44)
şeklinde çarpılıp, toplanarak çarpım matrisi elde edilir.
3.2.3 Bir Matrisin Rankı ve Ters Matrisi
Herhangi bir m×n boyutlu A matrisi ele alınsın. A matrisinin sütunları
tanımlar. Aynı şekilde A’nın sıraları da
n
m
uzayındaki n vektörü
uzayında m vektörü belirler. A matrisindeki
maksimum doğrusal bağımsız sıra sayısı r ile belirtilsin, r ≤ m . Eğer r, m’den küçük ise doğrusal
bağımsız sıra vektörlerinin alt seti sayısı birden daha fazla olabilir. Örneğin, dört sıralı (m=4) bir
matris ele alındığında, 1,2,4 sıraları bir doğrusal bağımsız set tanımlayabildiği gibi 1,3,4 sıraları da
bir diğer doğrusal bağımsız seti tanımlayabilir. Fakat dört sıranın tümü doğrusal bağımlıdır. Bu
durumda r=3’dür. Bu A matrisi için herhangi r doğrusal bağımsız sıranın bir setinin oluşturduğu ve
27
~
kalan m-r sıranın ihmal edildiği r×n boyutlu bir A
matrisi tanımlanabilir. A matrisindeki
~
maksimum doğrusal bağımsız sütun sayısı c ile belirtilsin. Bu c değeri aynı zamanda A
~
matrisindeki maksimum doğrusal bağımsız sütun sayısını da belirtir. A matrisindeki her bir sütun r
elemana sahiptir. Buna göre,
c≤r
eşitsizliği verilebilir.
(3.45a)
n
uzayındaki herhangi bir vektör, r adet doğrusal bağımsız vektörün
doğrusal bir kombinasyonu şeklinde verilebilir. Yukarıda sıralar için verilen işlem benzer şekilde
sütunlar içinde gerçekleştirilebilir. A matrisindeki c adet doğrusal bağımsız sütunun bir alt seti
~
~
alınır ve kalan n–c adet sütun ihmal edilerek m×c boyutlu bir A matrisi oluşturulabilir. A
matrisindeki maksimum doğrusal bağımsız sıra sayısı r ile belirtildiği için bu değer aynı zamanda
~
~
~
A matrisindeki maksimum doğrusal bağımsız sıra sayısını belirtmektedir. Fakat A ’daki her bir
sıra c elemana sahip olduğu için,
r≤c
(3.45b)
şeklindedir. Eşitlik (3.45a) ve (3.45b) birlikte ele alınarak,
r=c
(3.45c)
elde edilebilir. Sonuç olarak m×n boyutlu bir A matrisinin maksimum doğrusal bağımsız sıra sayısı,
maksimum doğrusal bağımsız sütun sayısına eşittir. Bu sayı matrisin rankı olarak tanımlanır ve
ρ(A) sembolü ile gösterilir. Açık olarak görüleceği gibi bir matrisin rankı satır veya sütun
sayılarından en küçük olanını aşamaz. Başka bir deyişle,
ρ(A) ≤min(m,n)
(3.46)
eşitsizliği verilebilir. ρ(A)=m durumunda matris tam sıra ranklı ρ(A)=n durumunda ise tam sütun
ranklıdır.
Örnek 3.3 Aşağıda verilen A matrisinin rankını belirleyiniz.
⎡1 2 3 4 ⎤
A = ⎢⎢1 0 1 1 ⎥⎥
⎢⎣2 2 4 5⎥⎦
Çözüm: A matrisi incelendiğinde 1,2 sıraları ve 1,3 sıralarının doğrusal bağımsız olduğu, bununla
birlikte Sıra1+Sıra2–Sıra3 = 0 olduğu içinde üç sıranın doğrusal bağımlı olduğu görülebilir. Sonuç
olarak r=2’dir. A matrisinin üçüncü sırası ihmal edilerek,
~ ⎡1 2 3 4⎤
A=⎢
⎥
⎣1 0 1 1 ⎦
~
~
şeklinde bir A matrisi elde edilebilir. A ’nın tüm sütun çiftleri doğrusal bağımsızdır. Buna göre c
~
en azından 2 olmalıdır. Fakat bu değer aynı zamanda 2 değerini aşamaz. A matrisindeki herhangi
bir sütun, bu matrisin sütun çiftlerinin doğrusal bir kombinasyonu olarak,
28
Sütun 3 = Sütun 1 + Sütun 2
Sütun 4 = Sütun 1 + 1.5 Sütun 2
Sütun 1 = 3 Sütun 3 – 2 Sütun 4
Sütun 2 = Sütun 3 – Sütun 1
ifade edilebilir. Buna göre r=c=2=ρ(A) bulunur. Alternatif olarak A matrisinin sütunları ele alınırsa
~
doğrusal bağımsız üç sütunun oluşturduğu bir set bulunamaz ve yukarıda gösterildiği gibi A
matrisi içinde aynı sonuç geçerlidir.
Ranklarla ilgili teoremler ve bazı açıklamalar aşağıda verilmiştir.
Teorem 3.34 A matrisinin transpozunun rankı A matrisinin rankına eşittir.
( )
ρ A T = ρ (A )
Teorem 3.35 Eğer A, rankı r olan bir idempotent matris ise tr(A)=r ‘dir.
Özel bir durum olarak A, n×n boyutlu rankı n olan bir kare matris ise A matrisi tekil değildir ve
eğer n×n boyutlu
AB = BA = I n
(3.47a)
bir B matrisi mevcut ise A matrisinin ters matrisi olarak adlandırılır ve A-1 ile belirtilir. Bu ters
matris eşsizdir. Bu kısımda ters matrislerin hesaplanması ve bazı özellikleri verilmiştir. A
matrisinin n×n boyutlu bir kare matris olduğu kabul edilsin. Bu matrisin tersinin mevcut olması için
gerekli şart aşağıda dört değişik tanımla verilmiştir. Bu tanımların hepsi aynı anlamı taşımaktadır.
1) A matrisi tekil olmayan bir matris olmalıdır.
2) A matrisinin rankı n olmalıdır.
3) A matrisinin n sırası doğrusal bağımsız olmalıdır.
4) A matrisinin n sütunu doğrusal bağımsız olmalıdır.
Ters matrisin elde edilmesi çalışmalarına 2×2 durumu ile başlanacaktır. A matrisi ve ters matrisi
A-1 aşağıda verilmiştir.
⎡a
A = ⎢ 11
⎣ a21
a12 ⎤
a22 ⎥⎦
α12 ⎤
⎡α
A −1 = ⎢ 11
⎥
⎣α 21 α 22 ⎦
Ters matris tanımından,
AA −1 = I
(3.47b)
genel denklemi elde edilir. İlk olarak eşitlik (3.47b) nin her iki tarafının birinci sütunları ele alınsın,
⎡ a11
⎢a
⎣ 21
a12 ⎤ ⎡α 11 ⎤ ⎡1⎤
=
a 22 ⎥⎦ ⎢⎣α 21 ⎥⎦ ⎢⎣0⎥⎦
ters matrisin elemanları bilinmemektedir. Denklemler bu elemanlar için çözülürse,
29
α 11 =
a 22
a11 a 22 − a 21 a12
α 21 =
− a 21
a11 a 22 − a 21 a12
eşitlikleri elde edilir. Eşitlik (3. 47b) nin ikinci sütunları için,
α 12 =
− a12
a11 a 22 − a 21 a12
α 22 =
a11
a11 a 22 − a 21 a12
sonuçları elde edilir. Bu sonuçlar kullanılarak ters matris,
A −1 =
⎡ a22
1
a11a22 − a21a12 ⎢⎣ −a21
− a12 ⎤
a11 ⎥⎦
(3.48)
şeklinde bulunur. A-1 matrisindeki her bir eleman A’daki elemanların bir fonksiyonudur. Ters
matristeki her bir eleman a11 a 22 − a12 a 21 ortak bölenine sahiptir. Bu değer A matrisindeki tüm
elemanların bir fonksiyonu olup A matrisinin determinantı olarak tanımlanır. Ters matrisler konusu
determinant kavramı açıklandıktan sonra detaylandırılacaktır.
Teorem 3.36 Eğer A, B, C matrisleri tekil olmayan matrisler ise bu matrislerin çarpımlarının tersi,
(ABC)−1 = C −1B −1 A −1
şeklinde elde edilir.
Teorem 3.37 Ters matrisin tersi orijinal matrisi verir.
(A )
−1 −1
=A
Teorem 3.38 Bir matrisin transpozunun tersi, tersinin transpozuna eşittir.
(A )
T −1
( )
= A −1
T
Teorem 3.39 Bir üst (veya alt) üçgen matrisin terside bir üst (veya alt) üçgen matristir.
Teorem 3.40 Eğer A matrisi,
⎡A
A = ⎢ 11
⎣ 0
0 ⎤
A 22 ⎥⎦
şeklinde parçalanmış ve tekil değilse (A, A11, A22 matrisleri kare matrislerdir) A matrisinin tersi,
⎡ A −1
A −1 = ⎢ 11
⎣ 0
0 ⎤
−1 ⎥
A 22
⎦
şeklinde elde edilir.
Teorem 3.41 A matrisi,
30
⎡A
A = ⎢ 11
⎣ A 21
A 12 ⎤
A 22 ⎥⎦
şeklinde parçalanmış, A11 ve A22 tekil olmayan kare matrisler ise A matrisinin tersi,
⎡
B11
A −1 = ⎢
−1
⎣− A 22 A 21B 11
A −221
(
⎤
− B11 A 12 A −221
−1
−1 ⎥
+ A 22 A 21B11 A 12 A 22 ⎦
)
−1
−1
burada B11 = A 11 − A 12 A 22
A 21
’dir ya da
−1
−1
⎡ A −1 + A 11
A 12 B 22 A 21 A 11
A −1 = ⎢ 11
−1
− B 22 A 21 A 11
⎣
−1
− A 11
A 12 B 22 ⎤
⎥
B 22
⎦
(
−1
A 12
şekline elde edilir, burada B 22 = A 22 − A 21 A 11
)
−1
’dir.
İspat: İlk olarak
⎡B
A −1 = B = ⎢ 11
⎣B 21
B 12 ⎤
B 22 ⎥⎦
alınsın ve AB = I olduğundan,
⎛ A 11
⎜⎜
⎝ A 21
A 12 ⎞ ⎛ B 11
⎟⎜
A 22 ⎟⎠ ⎜⎝ B 21
B 12 ⎞
⎟=I
B 22 ⎟⎠
daha sonrada,
A 11B11 + A 12 B 21 = I
A 11B12 + A 12 B 22 = 0
A 21B11 + A 22 B 21 = 0
A 21B12 + A 22 B 22 = I
denklemleri elde edilebilir. Üçüncü denklemden,
B 21 = − A −221 A 21B11
bulunur ve birinci denklemde yerine konup B11 için çözülürse,
(
B11 = A 11 − A 12 A −221 A 21
)
−1
elde edilir. Benzer işlemler ikinci ve dördüncü denklemlere uygulanarak,
−1
B12 = − A 11
A 12 B 22
(
−1
B 22 = A 22 − A 21 A 11
A 12
)
−1
elde edilir. Matrisdeki kalan sütunları elde etmek amacıyla, BA=I çarpımı kullanılarak,
B11 A 11 + B 12 A 21 = I
B11 A 12 + B 12 A 22 = 0
31
B 21 A 11 + B 22 A 21 = 0
B 21 A 12 + B 22 A 22 = I
denklem seti elde edilir. Bu setteki ikinci denklemden,
B12 = −B11 A 12 A −221
elde edilir ve bu değer ilk setin dördüncü denkleminde yerine konarak B22 için çözülerek,
B 22 = A −221 + A −221 A 21B 11 A 12 A −221
elde edilir. Elde edilen son iki eşitlik ilk A-1 matrisinin ikinci sütununu verir. Son setin üçüncü
denklemi ve ilk setin birinci denkleminden,
−1
B 21 = −B 22 A 21 A 11
−1
−1
−1
B11 = A 11
+ A 11
A 12 B 22 A 21 A 11
elde edilir. İspat tamamlanır.
Bir matrisin tersinin alınması üzerine tanımlanmış önemli teoremlerden biri de Sherman-Morrison-
Woodbury teoremidir. Bu teoremin sonuçları Bölüm 7 de sunulan PRESS istatistiği ve Bölüm 11
de tanımlanan etkili bir veri noktasının tanı istatistikleri için temel oluşturur. Açıklanan teorem iinci veri noktasının veri seti dışında bırakıldığı durumlar için bazı önemli regresyon istatistiklerinin
kolay bir şekilde hesaplanmasını sağlamaktadır. Boyutu p×p olan ve tekil olmayan bir A matrisi ve
p boyutlu bir sütun vektörü a ele alınsın. Regresyon uygulaması için A=XTX ve aT = xTi alınır.
Burada xTi = (1 xi1 … xik ) vektörü X matrisinin i-inci sırasıdır. Bu durumda (A-aaT) matrisi
XTX matrisinin i-inci sırasının çıkarıldığı matrisi temsil eder. Bu matrisin tersi ise aşağıdaki teorem
ile elde edilir.
Teorem 3.42 ( A − aaT ) = A −1 +
−1
A −1aaT A −1
1 − aT A −1a
A matrisinin rankı n’den küçük ise tekil matristir ve ters matrisi mevcut değildir. Tekil matris konusu
matrisin boş uzayı kavramı ile ilişkilidir. Boyutları m×n olan ve rankı ρ(A)=r olan bir A matrisi ele
alındığında en az bir tane r adet doğrusal bağımsız sıranın oluşturduğu set ve en az bir tane de r adet
doğrusal bağımsız sütunun oluşturduğu set mevcuttur. Bunun sonucu olarak A matrisinin satır ve
sütunları, ilk r sırası ve ilk r sütunu doğrusal bağımsız olacak şekilde düzenlenebilir ve daha sonra ilk
r sıra ve sütun dikkate alınarak parçalanabilir.
⎡A
A = ⎢ 11
⎣ A 21
A 12 ⎤
A 22 ⎥⎦
Elde edilen A11 matrisi r×r boyutlu tekil olmayan bir kare matristir. Homojen denklem seti, Kısım
3.3.3 da detaylı olarak açıklanacaktır,
Ax=0
(3.49)
32
şeklinde verilebilir. x vektörü n adet bilinmeyen eleman içeren sütun vektörüdür. Eşitlik (3.49)’un
sağ tarafı 0 vektörü olduğu için denklem seti homojendir. Eğer Ax=b ve b≠0 ise denklem sistemi
homojen değildir.
Eğer x1, eşitlik (3.49)’un bir çözümü ise c herhangi bir skaler olmak üzere cx1’de bu eşitliğin bir
çözümüdür. Eşitlik (3.49)’un çözümler seti A matrisinin boş uzayı olarak bilinen bir vektör uzayını
oluştururlar. İlk olarak boş uzayın boyutu araştırılacaktır. Bu boyut alt uzayı tanımlayan birbirinden
bağımsız vektör sayısıdır. A matrisinin son m–r sırası çıkarılıp ve x vektörü de A matrisinin
sütunlarına uygun olarak parçalanırsa,
[ A11
⎡x ⎤
A12 ] ⎢ 1 ⎥ = 0
⎣x2 ⎦
(3.50)
eşitliği elde edilir. Bu ifade de x1, r adet x2 ise kalan n–r adet elemanı içerir. Sonuç olarak n adet
(n≥r) bilinmeyen içeren r adet doğrusal bağımsız denklemli bir set elde edilir. Eşitlik (3.50),
A11x1 + A12 x 2 = 0
−1
şeklinde yeniden yazılabilir. A11 tekil olmadığı için tersi mevcuttur ve bu ifade soldan A11
ile
çarpılarak,
−1
x1 = − A11
A12 x 2
(3.51)
elde edilir. x2 alt vektöründeki n-r eleman herhangi bir şekilde belirlenebilir. Fakat x2 belirlendikten
sonra x1 alt vektörü eşitlik (3.51) kullanılarak atanabilir. Eşitlik (3.51) kullanılarak eşitlik (3.50)
deki çözüm vektörü,
⎡ x ⎤ ⎡ − A −1 A ⎤
x = ⎢ 1 ⎥ = ⎢ 11 12 ⎥ x 2
⎣ x 2 ⎦ ⎣ I n-r ⎦
(3.52)
şeklinde düzenlenebilir. Elde edilen (3.52) eşitliği n sıra ve n–r sütuna sahiptir. Bu n–r sütun
doğrusal bağımsızdır. Bunun nedeni de sütunları doğrusal bağımsız olan In-r alt matrisinin mevcut
olmasıdır. Bir birim matrisin sütunları (sıraları) doğrusal bağımsızdır. Sonuç olarak eşitlik (3.52),
n–r adet n elemanlı doğrusal bağımsız vektörü eşitlik (3.50)’nin tüm çözümleri için n–r adet
doğrusal kombinasyon şeklinde ifade eder. Eşitlik (3.50), çıkarılan sıralar [A11 A12]’nin sıralarının
doğrusal bir kombinasyonu olduğu için, eşitlik (3.49) içinde bir çözüm verir. Buna uygun olarak
çıkarılan sıralar,
cT [ A11
A12 ]
formunda gösterilebilir. Burada cT herhangi uygun bir r elemanlı sıra vektörüdür. Bu ifade sağdan x
ile çarpılabilir.
cT [ A11
A12 ] x = 0
Bunun nedeni ise, x’in eşitlik (3.50) ü sağlamasıdır. Buna göre her bir x çözümü çıkarılan sıralara
göre ele alınır ve eşitlik (3.52), eşitlik (3.49) için bu çözüm vektörünü belirler. A matrisinin boş
33
uzayı n–r boyutludur. Buradan çıkarılacak önemli bir sonuç: r ranklı ve boyutları m×n olan bir A
matrisi için; Sütun sayısı = rank + boş uzay boyutu
n = r + (n – r )
(3.53)
eşitliği yazılabilir.
Eşitlik (3.53)’in özel bir durumu mxn boyutlu bir A matrisinin rankının n–1 olmasıdır. Bu durumda
A matrisinin boş uzayının boyutu 1’dir ve
Ax=0
denkleminin tüm çözümleri orjinden geçen bir tek doğru üzerindedir. Eğer çözüm vektörü,
xT = [ x 1
x2
xn ]
ise
cxT = [ cx1
cx 2
cx n ]
vektörü de (c herhangi bir sabit) bir çözüm vektörüdür. Eşitlik (3.53)’in sonucu çeşitli matrislerin
rankları üzerine verilen bazı önemli teoremlerin basit ispatlarını oluşturur.
Örnek 3.4 3×4 boyutlu A matrisi ve 4×1 boyutlu x vektörü aşağıda verildiği gibi bir homojen denklem
seti oluşturmaktadır, Ax=0. A matrisinin boş uzayını bulunuz.
⎡ x1 ⎤
⎡1 2 3 4 ⎤ ⎢ ⎥ ⎡0 ⎤
⎢1 2 1 1 ⎥ ⎢ x 2 ⎥ = ⎢0 ⎥
⎢
⎥ ⎢x ⎥ ⎢ ⎥
⎢⎣2 4 4 5⎥⎦ ⎢ 3 ⎥ ⎢⎣0⎥⎦
⎣ x4 ⎦
Çözüm: Matrisin sıraları ikişerli olarak doğrusal bağımsızdır. Fakat üç sıra birlikte ele alındığında,
Sıra 1 + Sıra 2 – Sıra 3 = 0
doğrusal bağımsız olmadıkları görülebilir. Bu nedenle A matrisinin rankı ikidir. A matrisinin
üçüncü sırası çıkarılarak,
⎡ x1 ⎤
⎢ ⎥
⎡1 2 3 4⎤ ⎢ x 2 ⎥ ⎡0⎤
⎢1 2 1 1 ⎥ ⎢ x ⎥ = ⎢0⎥
⎣ ⎦
⎣
⎦ 3
⎢ ⎥
x
⎣ 4⎦
homojen denklem seti elde edilir. Sütun 1 ve 3 doğrusal bağımsız olduğundan yukarıdaki denklem
seti,
⎡1 3⎤ ⎡ x1 ⎤
⎡ 2 4⎤ ⎡ x 2 ⎤
⎢1 1⎥ ⎢ x ⎥ = − ⎢2 1 ⎥ ⎢ x ⎥
⎣
⎦ ⎣ 3⎦
⎣
⎦ ⎣ 4⎦
şeklinde elde edilir ve bu denklemler x1 ve x3 için çözülerek,
x1 = −2 x 2 + 1 / 2 x 4
x3 =
- 3/2x 4
sonuçları bulunur. Denklem sistemi için çözüm vektörü,
34
⎡
⎢
x=⎢
⎢
⎢
⎣
−2
1
0
0
− 1/ 2⎤
0 ⎥⎥ ⎡ x 2 ⎤
− 3 / 2⎥ ⎢⎣ x 4 ⎥⎦
⎥
1 ⎦
olarak elde edilir. Çözüm olarak verilen matris iki doğrusal bağımsız sütuna sahiptir ve herhangi
bir çözüm dört elemanlı iki doğrusal bağımsız vektörün bir doğrusal kombinasyonu şeklinde ifade
edilmiştir. Bu çözüm vektörleri
4
’de iki boyutlu bir boş uzay oluştururlar. Çözüm için
T
tanımlanan [x2 x4] vektörü herhangi bir değer alabileceği için sonsuz sayıda çözüm vektörü
mevcuttur. Elde edilen herhangi bir çözüm, başlangıç denklem seti için de bir çözüm oluşturur. Bu
durum çözümdeki her bir sütun vektörünün çıkarılan sırayı sağladığının,
⎡ − 2⎤
⎡12 ⎤
⎢1 ⎥
⎢ 0 ⎥
⎥
⎥=0
⎢
[2 4 4 5]⎢ ⎥ = 0 ve [2 4 4 5] ⎢⎢
0
− 3 2⎥
⎥
⎢ ⎥
⎢
⎣0⎦
⎣ 1 ⎦
gösterilmesi ile ispatlanabilir. Herhangi bir x çözüm vektörü, bu iki sütun vektörünün doğrusal bir
kombinasyonu olduğu için x, sistem üçüncü denklemi de sağlar. İlk iki denklemi de sağladığı
belirlenmiş olduğundan bu çözüm, tanımlanan denklem sistemi için de bir çözüm oluşturur. A
matrisinin boş uzayının boyutu 2’dir. Bu sonuç A matrisinin sütun sayısı rankından çıkarılarak elde
edilir. Boş uzaydaki her bir vektör (çözüm vektörü), A matrisindeki her bir sıraya ortogonaldir. A
matrisinden çıkarılacak sıranın seçiminde aldatıcı bir keyfilik olduğu düşünülebilir. Fakat aslında
durum böyle değildir. Örneğin sistem,
⎡3 4⎤ ⎡ x 3 ⎤
⎡1 2⎤ ⎡ x1 ⎤
⎢1 1 ⎥ ⎢ x ⎥ = − ⎢1 2⎥ ⎢ x ⎥
⎣
⎦ ⎣ 4⎦
⎣
⎦ ⎣ 2⎦
şeklinde parçalanırsa,
x 3 = −3x1 − 6 x 2
x 4 = 2 x1 + 4 x 2
denklemleri elde edilir ve çözüm vektörü,
0
⎡ 1
⎢ 0
1
x=⎢
⎢− 3 − 6
⎢
4
⎣ 2
⎤
⎥ x
⎥ ⎡ 1⎤
⎥ ⎢⎣ x 2 ⎥⎦
⎥
⎦
şeklindedir. Elde edilen son çözüm sistemi tanımlayan A matrisinin boş uzayının başka bir tanımını
verir. Boş uzayın boyutu 2’dir ve son çözümdeki matrisin sütunları doğrusal bağımsızdır. Bununla
birlikte elde edilen bu boş uzay daha önce eşitlik elde edilen ile aynıdır. Çünkü son çözümdeki her
bir sütun vektörü ilk çözümün sütun vektörlerinin doğrusal bir kombinasyonu olarak ifade
edilebilir.
35
⎡ 1
⎢ 0
⎢
⎢− 3
⎢
⎣ 2
⎤
⎡− 2
⎥
⎢
⎥=λ ⎢ 1
1
⎥
⎢ 0
⎥
⎢
⎦
⎣ 0
⎡ 0
⎢ 1
⎢
⎢− 6
⎢
⎣ 4
⎡- 2
⎤
⎢
⎥
⎥=λ ⎢ 1
1
⎢ 0
⎥
⎢
⎥
⎣ 0
⎦
⎤
⎥
⎥+λ
2
⎥
⎥
⎦
⎡12 ⎤
⎢ 0 ⎥
⎥ ⇒ λ = 0,λ = 2
⎢
1
2
⎢ − 3 2⎥
⎥
⎢
⎣ 1 ⎦
ve
⎤
⎥
⎥+λ
2
⎥
⎥
⎦
⎡12 ⎤
⎢ 0 ⎥
⎥ ⇒ λ = 1, λ = 4
⎢
1
2
⎢− 3 2⎥
⎥
⎢
⎣ 1 ⎦
Sonuç olarak boş uzaylar aynıdır. Başlangıç adımında A matrisinden birinci veya ikinci denklem
çıkarılsaydı da boş uzayın belirlenmesinde herhangi bir fark olmayacaktı.
Teorem 3.43 Eğer A, m×n boyutlu r ranklı herhangi bir matris ve P m×m boyutlu, Q ise n×n
boyutlu tekil olmayan kare matrisler ise,
ρ ( PA ) = ρ ( AQ ) = ρ ( PAQ ) = ρ ( A )
eşitlikleri sağlanır. Başka bir deyişle, A matrisi tekil olmayan bir matrisle soldan veya sağdan
çarpılırsa A matrisinin rankı değişmez.
İspat: ρ ( PA ) = ρ ( A ) eşitliğini ispat etmek için A matrisinin boş uzayındaki herhangi bir vektör
olarak m ele alınsın; Am=0 ve PAm=0 olacak ve sonuç olarak m vektörü aynı zamanda PA’nın
boş uzayında da yer alacaktır. Buna karşın PA’nın boş uzayındaki herhangi bir vektör s ile
belirtilerek, PAs=0 yazılabilir. P tekil olmayan bir matris olduğu için bu eşitlik soldan P-1 ile
çarpılarak, As=0 elde edilir. Görüleceği gibi s aynı zamanda A’nın boş uzayındadır. Sonuç olarak
PA ve A aynı boş uzaya sahiptirler. Bu nedenle rankları aynıdır. Açıklanan ispatlardan
yararlanarak, ρ ( AQ ) = ρ ( A ) için ispat,
ρ ( AQ ) = ρ ( QT AT ) = ρ ( AT )
= ρ (A)
şeklinde yapılabilir. Tüm bu sonuçlar ile,
ρ (PAQ ) = ρ (A )
eşitliği yazılabilir.
Ranklarla ilgili diğer bir teorem ise dikdörtgen bir matris ile diğer uygun bir dikdörtgen matrisin
çarpımları için genel durumu ifade eder.
Teorem 3.44 A matrisi m×n, B matrisi n×s boyutlu ise AB çarpımının rankı, bu matrislerden rankı
daha küçük olanın rankına eşit veya daha küçüktür.
ρ ( AB ) ≤ min ⎡⎣ ρ ( A ) , ρ ( B ) ⎤⎦
36
İspat: x vektörü A matrisinin boş uzayındaki herhangi bir vektör olsun, Bx=0 ve ABx=0 yazılabilir.
Bu durumda x vektörü AB’nin boş uzayında da bulunmaktadır. Fakat A matrisi kare matris
olmadığı için ters matrisi bulunamaz, bu nedenle, ABy=0 işleminden By=0 işlemine geçilemez.
Sonuç olarak, B’nin boş uzayının boyutu ≤AB’nin boş uzayının boyutu eşitsizliği elde edilebilir.
AB ve B’nin sütun sayısı aynı olduğu için eşitlik (3.53)’den, ρ ( AB ) ≤ ρ ( B ) ve transpoz işlemi
kullanılarak,
ρ ( AB ) = ρ ( BT AT ) ≤ ρ ( AT ) = ρ ( A )
sonucu elde edilerek teorem ispatlanmış olur. Ranklarla ilgili önemli bazı teoremler aşağıda
ispatsız olarak verilecektir.
Teorem 3.45 Boyutları n×n olan iki kare matris A ve B’nin rankları r ve s ise AB’nin rankı ,
ρ ( AB ) ≥ r + s − n
eşitsizliğini sağlar.
Teorem 3.46 A ve B matrislerinin toplamının rankı,
ρ ( A + B) ≤ ρ ( A) + ρ (B)
eşitsizliğini sağlar.
Teorem 3.47 Boyutları n×p olan bir A matrisi için:
(
) (
) ( )
ρ A T A = ρ AA T = ρ A T = ρ (A ) .
Teorem 3.48 A boyutu m×n olan bir matrisi a boyutu m×1 ve b boyutu n×1 olan vektörler ise
ancak ve ancak A=abT eşitliğini sağlayan sıfırdan farklı a ve b vektörleri var ise ρ(A)=1 olur.
Teorem 3.49 A matrisinin bir alt matrisi A1 ise ρ(A1)≤ρ(A).
3.2.4 Matrisin Determinantı
Determinantın yaygın tanımı n×n sayıda elemanların
a11
a12 … a1n
a21
…
a22 … a2 n
… … …
an1
an 2 … ann
biçimindeki sıralanışıdır. Bu
n
uzayındaki n adet vektörün oluşturduğu kümedir. Görüldüğü gibi
determinant, vektör kavramı ile iç içedir. Örneğin
⎛x ⎞
v1 = ⎜ 1 ⎟
⎝ y1 ⎠
2
uzayında,
⎛x ⎞
v2 = ⎜ 2 ⎟
⎝ y2 ⎠
vektörlerinin oluşturduğu ve Şekil 3.15 de gösterilen paralel kenar ele alısın.
37
Şekil 3.15
Paralel kenarın alanının OBB´ ve B´BCC´ alanlarının toplamından OAA´ ve A´ACC´ alanlarının
toplamının çıkarılması ile elde edilebileceği açıktır:
S=
1
1
1
1
x2 y2 + ( y1 + 2 y2 ) x1 − x1 y1 − ( 2 y1 + y2 ) x2
2
2
2
2
= x1 y2 − y1 x2
Hesaplanan x1y2-y1x2 sonucu matematikte,
x1
x2
y1
y2
şeklinde gösterilebilir. Sonuç olarak,
Δ=
x1
y1
x2
= x1 y2 − y1 x2
y2
(3.54)
eşitliği geçerlidir. Buradan determinantın bir değer olduğu bu değerin hesabının nasıl yapıldığı ve
2
uzayında Δ nın v1 ve v2 vektörlerinin tanımladığı paralel kenarın alanını gösterdiği sonucu elde
edilir. Eğer n=3 ise,
⎛ x1 ⎞
⎜ ⎟
v1 = ⎜ y1 ⎟
⎜z ⎟
⎝ 1⎠
⎛ x2 ⎞
⎜ ⎟
v 2 = ⎜ y2 ⎟
⎜z ⎟
⎝ 2⎠
⎛ x3 ⎞
⎜ ⎟
v 3 = ⎜ y3 ⎟
⎜z ⎟
⎝ 3⎠
vektörlerinin kümesi,
x1
x2
x3
Δ = y1
y2
y3 = x1 ( y2 z3 − z2 y3 ) + y1 ( z2 x3 − x2 z3 ) + z1 ( x2 y3 − y2 x3 )
z1
z2
z3
38
ile hesaplanır ve bu sonuç paralel yüzün hacmini verir. Benzer şekilde n=n boyutu için de Δ değeri
bulunabilir. Görülüyorki Δ fonksiyonu bir geometrik şeklin alan hacim gibi değerlerini ifade
etmektedir.
Aşağıda 2×2 ve 3×3 boyutlu determinantlar elemanları indislenerek tanımlanmıştır:
a11
a12
a 21
a 22
a11
a12
a13
Δ 3 = a 21
a 31
a 22
a 23 = a11 a 22 a 33 − a12 a 21 a 33 + a12 a 23 a 31 − a13 a 22 a 31 + a13 a 21 a 32 − a11 a 23 a 32
a 32
a 33
Δ2 =
= a11 a 22 − a12 a 21
Eşitliklerin sağ taraflarından determinantın her satır ve sütundan yalnızca bir eleman almak koşulu
ile oluşturulan çarpımların toplamı olduğu görülür. Her terimde yer alan elemanların sayısı
determinantın satır veya sütun sayısına eşittir. Toplanan terimlerin sayısı ise satır veya sütun
permütasyon sayısı n! kadardır. Terimlerin yarısı (-) diğer yarısı da (+) işaretlidir. Terimlerdeki
işaretlerin, terimleri oluşturan çarpımların sütun indislerinin inversiyon sayılarının tek veya çift
olmasından ileri geldiği açıktır. Δ3 determinantı incelendiğinde sütun indisleri, 123 213 231 321
312 132 olup her bir permütasyonun inversiyon sayısı bulunduğunda Δ3 determinantının
açılımındaki terimlerin işaretleri elde edilir.
Her hangi bir A matrisinin determinantı genellikle det (A ) ya da A ile gösterilir.
Determinant için daha genel ve kolay bir yöntem 3×3 boyutlu bir matris örneği üzerinde aşağıda
açıklanmıştır:
⎡ a11
A = ⎢⎢ a21
⎢⎣ a31
a12
a22
a32
a13 ⎤
a23 ⎥⎥
a33 ⎥⎦
şeklinde verilmiş olsun. Eğer a11 elemanına ait satır ve sütun çıkarılırsa,
⎡a 22
⎢a
⎣ 32
a 23 ⎤
a 33 ⎥⎦
alt matrisi elde edilir. A matrisinden i-inci sıra ve j-inci sütun silindikten sonra elde edilen 2×2
boyutlu alt matrisin determinantı
M ij =
a 22
a 32
a 23
a 33
(3.55)
ile belirtilsin. Mij, bir minör olarak isimlendirilir.
cij = (− 1)
i+ j
⋅ M ij
(3.56)
ifadesi ise kofaktör başka bir deyişle işaretli minördür. Eğer i+j toplamı çift ise, Mij’nin işareti
39
değişmez, i+j toplamı tek ise işaret değiştirir. Kofaktörler yardımı ile A matrisinin determinantı bir
tek sıra veya sütuna göre,
A = a11c11 + a12 c12 + a13c13
(3.57)
şeklinde elde edilebilir. Bu tanımdan da anlaşılacağı gibi A herhangi bir sıra veya sütunun
elemanlarına göre elde edilebilir. n×n boyutlu genel durum için determinant,
A = ai1ci1 + ai 2 ci 2 +
+ ain cin
i = 1,......, n
(3.58a)
veya
A = a1 j c1 j + a2 j c2 j +
+ anj cnj
j = 1,......, n
(3.58b)
eşitliklerinden bulunabilir. Bu ifadedeki kofaktörler n–1 boyutlu alt matrislerdir.
Her bir aij elemanına karşılık gelen cij değerleri bulunarak elde edilen matris A ile bölünerek ters
matris A-1 elde edilebilir:
⎡ c11 c12
1 ⎢
A =
⋅ c21 c22
A ⎢
⎢⎣ c31 c32
−1
c13 ⎤
−1
c23 ⎥⎥ = A CT
c33 ⎥⎦
(3.59)
Teorem 3.50 A matrisi simetrik ise A matrisinin determinantı,
A = AT
transpozunun determinantına eşittir.
Teorem 3.51 A matrisinin herhangi iki sırasının veya sütununun değiştirilmesi ile bir B matrisi
elde edilirse, B matrisinin determinantı A matrisinin determinantının ters işaretlisine eşittir.
B =− A
Teorem 3.52 Aynı elemandan oluşan iki veya daha fazla sıraya (veya sütuna) sahip matrisin
determinantı sıfırdır.
⎡a b⎤
İspat: Sadece 2×2 boyutlu matris için verilecektir. A = ⎢
⎥ ise determinant:
⎣a b⎦
A = ab − ab = 0
Teorem 3.53 A matrisinin herhangi bir sırasının (veya sütununun) herhangi bir değerle çarpılıp bir
başka sırası (veya sütunu) ile toplanması ile elde edilen B matrisinin determinantı A matrisinin
determinantına eşittir.
Teorem 3.54 Eğer A matrisinin sıraları (veya sütunları) doğrusal bağımlı ise A = 0 , doğrusal
bağımsız ise A ≠ 0 ’dır. Buna uygun olarak tekil olmayan matrisler sıfırdan farklı, tekil matrisler
ise sıfır determinanta sahiptir.
Teorem 3.55 Bir üçgen matrisin determinantı köşegen elemanlarının çarpımına eşittir.
40
A = a11 ⋅ a22 ⋅ a33 ⋅ ..... ⋅ ann
Teorem 3.56 Bir köşegen matrisin determinantı köşegen elemanlarının çarpımına eşittir.
A = a11 ⋅ a22 ⋅ ..... ⋅ ann
Teorem 3.57 Birim matrisin determinantı I = 1 bire eşittir.
Teorem 3.58 Bir A matrisinin herhangi bir sıra (veya sütunu) bir λ sabiti ile çarpılarak B matrisi
elde edilirse, elde edilen matrisin determinantı orijinal matrisin determinantının λ katıdır.
B =λ A
Teorem 3.59 Eğer A matrisinin tüm elemanları λ ile çarpılarak B matrisi elde edilirse B
matrisinin determinantı,
B = λn A
şeklinde elde edilir.
Teorem 3.60 İki kare matrisin çarpımının determinantı bu matrislerin determinantlarının çarpımına
eşittir.
AB = A ⋅ B
Teorem 3.61 Eğer P bir ortogonal matris ise determinantı P = 1 veya P = −1 şeklindedir.
Teorem 3.62 Eğer P bir ortogonal matris ve A kare bir matris ise,
P T AP = A
eşitliği sağlanır.
İspat: P matrisi ortogonal bir matris ise Teorem 3.61 ile P = ±1 . Ortogonal matrisler simetrik
olduğundan Teorem 3.50 ile P = P T olduğundan P P T = 1 koşulları sağlanır. Bu durumda
P T AP = P T A P = A elde edilir.
Teorem 3.63 A matrisi,
⎛A
A = ⎜⎜ 11
⎝ A 21
A 12 ⎞
⎟
A 22 ⎟⎠
şeklinde alt matrislere ayrılmış ve A11 ile A22 kare matrislerdir. Eğer A12=0 veya A21=0 ise,
A = A 11 A 22
olarak elde edilir.
İspat: A22 matrisinin birim matris olması durumunda,
41
A=
A 11
0
0
= A 11
I
bulunabilir. Bu sonuç kullanılarak
0 ⎤ ⎡ A 11
⎡A
A = ⎢ 11
⎥=⎢
⎣ 0 A 12 ⎦ ⎣ 0
A = A 11 A 22
0 ⎤
0⎤ ⎡ I
⎢
⎥
I ⎦ ⎣0 A 22 ⎥⎦
elde edilerek teoremin ispatı yapılabilir.
Daha sonra bu teorem ile
A=
A 11
A 12
0
I
= A 11
ifadesi tanımlanarak teorem üçgen (alt veya üst) matrisin determinantı için genişletilerek,
A 12 ⎤ ⎡ I
0 ⎤ ⎡ A 11
⎡A
=⎢
A = ⎢ 11
⎥
⎥⎢
⎣ 0 A 22 ⎦ ⎣0 A 22 ⎦ ⎣ 0
A = A 11 A 22
A 12 ⎤
I ⎥⎦
sonucu bulunur.
Parçalanmış matrislerin determinantı için genel tanım aşağıdaki şekilde verilebilir. A11 ve A22 kare
ve tekil olmayan matrisler olmak üzere,
⎡I − A12 A −221 ⎤
B1 = ⎢
⎥
I
⎣0
⎦
ve
I
⎡
B 2 = ⎢ −1
⎣- A 22 A 21
0⎤
I ⎥⎦
şeklinde B1 ve B2 matrisleri tanımlanarak,
−1
⎡ A − A 12 A 22
A 21
B1 AB 2 = ⎢ 11
0
⎣
0 ⎤
⎥
A 22 ⎦
çarpımı elde edilir. B1 = B 2 = 1 olduğu için,
−1
A = A 22 ⋅ A 11 − A 12 A 22
A 21
(3.60a)
veya benzer bir şekilde alternatif olarak,
−1
A = A 11 ⋅ A 22 − A 21 A 11
A 12
(3.60b)
şeklinde elde edilebilir.
Teorem 3.64 A-1 matrisinin determinantı A matrisinin determinantının devriğidir.
A −1 =
1
A
3.3 DENKLEM SİSTEMLERİNİN ÇÖZÜMÜ
42
Eşanlı doğrusal denklemler kümesi ile istatistiksel doğrusal modeller konusunda oldukça sık
karşılaşılır. Bu kısımda doğrusal denklemlerin çözümlü ve çözümlü ise eşsiz bir çözümün varlığı
ve çözümlerin özellikleri ile ilgili kriterler araştırılacaktır.
Homojen olmayan bir doğrusal denklem sistemi,
x1 a11 + x 2 a12 +
+ x m a1m = b1
x1 a 21 + x 2 a 22 +
+ x m a 2 m = b2
x1 a n1 + x 2 a n 2 +
+ x m a nm = bn
(3.61a)
şeklinde tanımlanıp, bu sistem matris notasyonunda,
(3.61b)
Ax=b
ifadesi ile verilebilir. Bu eşitlikte A, n×m boyutlu matris x, m×1 boyutlu vektör b ise n×1 boyutlu
bir vektördür. Verilen aij ve bj seti için Ax=b eşitliğini sağlayan bir xi seti mevcut mudur? Bu soru
için dikkate alınabilecek üç durum sözkonusudur.
1) Eşitliğin çözümü yoktur. Bu durumda sistemin eşitliğini sağlayan bir x vektörü yoktur ve sistem
tutarsızdır.
2) Sistemin eşitliğini sağlayan bir tek x seti vardır. Bu durumda sistemin bir tek çözümü vardır.
3) Sistemin eşitliğini sağlayan birden fazla x vektörü vardır. Eğer eşitliği sağlayan birden fazla x
vektörü varsa sonsuz sayıda çözüm bulunabilir.
Sistemin çözümü ile ilgili çalışmalara geçilmeden önce ilk aşamada bir matrisin rankını
değiştirmeyen basit satır (sütun) işlemleri açıklanacaktır. Matrisin satırları (sütunları) üzerinde
basit elemanter işlemler olarak adlandırılan üç operasyon tipi vardır:
1) İki satırın (sütunun) yer değiştirmesi.
2) Bir satırın (sütunun) her hangi bir skaler λ≠0 ile çarpılması.
3) j-inci satırın (sütunun) λ katının i-inci satıra (sütuna) eklenmesi.
Yukarıdaki işlemler bir Im birim matris üzerine uygulansın. i-inci satırı (sütunu), j-inci satırı
(sütunu) ile değişen matris Eij, (Fij) şeklinde, i-inci satırı (sütunu) λ≠0 skaleri ile çarpılan matris
Ei(λ), Fi(λ) ile ve j-inci satırı (sütunu) λ ile çarpılıp i-inci satıra (sütuna) eklenen matris Ei(λ/j),
Fi(λ/j) ile gösterilecektir. Burada E (ya da F) boyutu m×m olan birim matristen elemanter işlemler
ile elde edilen matristir ve elemanter matris olarak adlandırılır. Örneğin m=3 alınarak,
⎛0 0 1⎞
⎜
⎟
E13 = ⎜ 0 1 0 ⎟
⎜1 0 0⎟
⎝
⎠
⎛1 0 0⎞
⎜
⎟
E 2 (7 ) = ⎜ 0 7 0 ⎟
⎜0 0 1⎟
⎝
⎠
⎛1 0 0⎞
⎜
⎟
E 3 (5 / 2) = ⎜ 0 1 0 ⎟
⎜0 5 1⎟
⎝
⎠
43
⎛0 0 1⎞
⎜
⎟
F13 = ⎜ 0 1 0 ⎟
⎜1 0 0⎟
⎝
⎠
⎛1 0 0⎞
⎜
⎟
F2 (7 ) = ⎜ 0 7 0 ⎟
⎜0 0 1⎟
⎝
⎠
⎛1 0 0⎞
⎜
⎟
F3 (5 / 2 ) = ⎜ 0 1 5 ⎟
⎜0 0 1⎟
⎝
⎠
Matrislerden görüldüğü gibi, Fij=Eij, Fi(λ)=Ei(λ), olmakla birlikte Fi (λ / j ) = E j (λ / i ) = E iT (λ / j ) .
Boyutu m×n olan bir A matrisi bir dizi elemanter işlem ile boyutu olan m×n bir B matrisine
dönüştürülebilir. Diğer bir deyişle,
EkEk-1…E1A=B
koşulunu sağlayan sonlu sayıda m×m boyutlu elemanter matris vardır. Bu eşitlik kısaca B=EA
şeklinde gösterilebilir.
Boyutu m×n olan bir A matrisi bir dizi elemanter satır (sütun) işleminin uygulanması ile eşelon
(echelon) matrise indirgenebilir. Bir eşelon matrisin yapısı aşağıda tanımlanmıştır:
1) Eğer bir satır sıfırdan farklı bir elemana sahip ise sıfırdan farklı ilk elemanın değeri 1 olup
pivot elemandır.
2) Eğer bir sütun pivot elemana sahip ise pivot elemanın altındaki tüm elemanlar sıfırdır.
3) Eğer bir satır pivot elemana sahip ise bu satırın üstündeki her bir satırın pivot elemanı en az
bir sütun solda yer alır.
Aşağıdaki H matrisi bir eşelon matristir:
⎛0
⎜
⎜0
H=⎜
0
⎜
⎜0
⎝
1 h13
h14
h15
0
0
1
h25
0
0
0
1
0
0
0
0
h16 ⎞
⎟
h26 ⎟
h36 ⎟
⎟
0 ⎟⎠
Matrisin üç adet pivot elemanı vardır. Eşelon matrislerin rankını belirlemek oldukça kolaydır. Tüm
elemanları sıfırdan farklı satırların sayısı matrisin rankını belirler yukarıdaki matris için ρ(H)=3.
Boyutu m×n olan her A matrisi bir dizi elemanter işlem ile eşelon matrise dönüştürülebilir. Diğer
bir deyişle,
EkEk-1…E1A=H
koşulunu sağlayan sonlu sayıda m×m boyutlu elemanter matris vardır.
Bir eşelon matrisi elde etmek için kullanılabilecek üç adımlı algoritma şağıda verilmiştir:
Adım 1. Alt sırasında en az bir tane sıfırdan farklı elemanı olan ilk sütunu ji belirle. Eğer böyle bir
sütun yok ise işlemi durdur.
Adım 2. Eğer a iji = 0 ise i-inci sırayı ji sütunundaki elemanı sıfırdan farklı her hangi bir sıra ile
değiştir.
Adım 3. ji sütunundaki sıfırdan farklı elemanları elemanter işlemler ile sıfıra indirge.
44
Elde edilen matris henüz eşelon formunda değildir çünkü her sıradaki pivot elemanlar 1 değerinde
değildir. Her bir sıra pivot elemanın değerine bölünerek eşelon matris elde edilir.
Örnek 3.5 Aşağıdaki 3×5 boyutlu matrisi elemanter işlemler ile eşelon yapıya indirgeyin.
⎛ 0 0 1 2 3⎞
⎜
⎟
A = ⎜ 2 4 − 2 0 4⎟
⎜ 2 4 −1 2 7⎟
⎝
⎠
Çözüm: Algoritma izlendiğinde,
Adım 1 j1=1, Adım 2 a11=0 olduğundan satır 1 ve 2 yer değiştirir.
⎛ 2 4 − 2 0 4⎞
⎜
⎟
A 2 = E12 A = ⎜ 0 0 1 2 3 ⎟
⎜2 4 −1 2 7⎟
⎝
⎠
Adım 3 satır 1 satır 3 den çıkarılır.
⎛ 2 4 − 2 0 4⎞
⎜
⎟
A 3 = E 3 (− 1 / 1)A 2 = ⎜ 0 0 1 2 3 ⎟
⎜ 0 0 1 2 3⎟
⎝
⎠
Adım 1 e dönülür. Adım 1 j2=3, Adım 2 a23≠0 olduğundan satır değiştirme gerekli değildir. Adım 3
satır 2 satır 3 den çıkarılır.
⎛ 2 4 − 2 0 4⎞
⎜
⎟
A 4 = E 3 (− 1 / 2)A 3 = ⎜ 0 0 1 2 3 ⎟
⎜0 0 0 0 0⎟
⎝
⎠
Adım 1 e dönülür ve işlem durdurulur. Son aşamada pivot elemanı 1 değerine eşitlemek için satır
bir ½ ile çarpılır.
⎛1 2 − 1 0 2⎞
⎜
⎟
A 5 = E1 (0.5)A 4 = ⎜ 0 0 1 2 3 ⎟
⎜0 0 0 0 0⎟
⎝
⎠
A matrisi üzerine yapılan elemanter işlemler:
H = A 5 = E1 (0.5)E 3 (− 1 / 2)E 3 (− 1 / 1)E12 A
ile özetlenebilir. A matrisinin rankının ρ(A)=2 olduğu da görülmektedir.
Örnek 3.6 Örnek 3.5 da elde edilen eşelon matrisin bir dizi elemanter sütun işlemi ile
⎛1 0 0 0 0⎞
⎜
⎟
H 4 = ⎜ 0 1 0 0 0⎟
⎜ 0 0 0 0 0⎟
⎝
⎠
matrisine dönüştürülebileceğini gösteriniz.
Çözüm: İlk olarak sütun 2 ile sütun 3 yer değiştirsin.
45
⎛1 − 1 2 0 2⎞
⎜
⎟
H 2 = HF23 = ⎜ 0 1 0 2 3 ⎟
⎜0 0 0 0 0⎟
⎝
⎠
Sütun 1 i kullanarak sütun 2,3 ve 5 in ilk satır elemanlarını sıfır değerine dönüştür.
⎛1 0 0 0 0⎞
⎜
⎟
H 3 = H 2 F2 (1 / 1)F3 (− 2 / 1)F5 (− 2 / 1) = ⎜ 0 1 0 2 3 ⎟
⎜ 0 0 0 0 0⎟
⎝
⎠
Son olarak Sütun 2 yi kullanarak sütun 4 ve 5 in ikinci satır elemanlarını sıfır değerine dönüştür.
⎛1 0 0 0 0⎞
⎜
⎟
H 4 = H 3 F4 (1 / 1)F4 (− 2 / 2)F5 (− 3 / 2 ) = ⎜ 0 1 0 0 0 ⎟
⎜ 0 0 0 0 0⎟
⎝
⎠
elde edilir.
Teorem 3.65 Boyutu m×n ve rankı r olan her A matrisi, E boyutu m×m ve F boyutu n×n olan
elemanter (tekil olmayan) matrisler ve H boyutu m×n olan eşelon matris olmak üzere,
⎛I
EAF = HF = ⎜⎜ r
⎝0
0⎞
⎟
0 ⎟⎠
şeklinde gösterilebilir.
Eğer A matrisi tekil olmayan bir matris ise A matrisi bir dizi elemanter işlem (ileri doğru eleme) ile
E1A=H eşelon matrise ve daha sonra yine elemanter işlemler (geriye doğru eleme) ile eşelon matris
E2H=Im birim matrise dönüştürülebilir. Matrisler arasındaki ilişki yapısının E2E1A =Im ve
A-1=E2E1 olduğu görülmektedir. Bu yaklaşım ileride açıklanacak olan Gauss eleme yöntemini
tanımlamaktadır.
Teorem 3.66 Boyutu n×n ve rankı n olan (tekil olmayan) her A matrisi, E boyutu n×n ve F boyutu
n×n olan elemanter (tekil olmayan) matrisler olmak üzere,
EAF = I n
şeklinde gösterilebilir.
Sonuç 3.66.1 Her tekil olmayan matris elemanter matrislerin çarpımı olarak yazılabilir. EAF=In
olduğundan ve elemanter matrislerin tersi yine elemanter bir matrisi tanımladığından,
A = E −1F −1
= (E k E k −1 … E1 )
−1
(F1F2 … Fl )−1 = E1−1 … E k−1Fl−1 … F1−1
eşitliği elde edilir.
Bazı durumlarda bir A matrisini eşelon yapıya indirgemenin yanı sıra bu indirgemeyi
gerçekleştiren E matrisinin de bulunması istenebilir. EA=H eşitliği kullanılarak, A ve H matrisleri
genişletilerek,
46
E(A : I ) = (H : E )
yazılabilir. Bu eşitlik m×n boyutlu A matrisini eşelon yapı indirgemek yerine boyutu m×(n+m) olan
(A:Im) matrisini eşelon yapıya indirger. Bu yaklaşım eğer A matrisi tekil olmayan bir matris ise A
matrisinin tersinin elde edilmesinde kullanılabir.
Teorem 3.67 Boyutu n×n ve rankı n olan (tekil olmayan) her A matrisi için eğer (A:In) matrisi
eşelon forma indirgenir ise eşelon yapının ilk matrisi birim matrisi ikinci matrisi ise ters matrisi
(In:A-1) verir.
İspat: Teorem 3.66 dan EAF=In olduğu bilinmektedir. Bu ifade önce sağdan F-1 ile ve sonra soldan
F ile çarpılarak FEA=In elde edilir. FE=G matrisi elemanter matrislerin çarpımı olduğundan yine
bir elemanter matristir. Sonuç olarak GA=In eşitliği ile A matrisi birim matrise In indirgenebilir. Bu
sonuç kullanılarak,
G(A:In)=(GA:G)=(In:A-1)
ispat tamamlanır.
Diğer bir deyişle eğer (A:In) matrisi eşelon yapıya dönüştürülüse elde edilen matrisin ilk bloğu
birim matrisi ikinci bloğu ise A matrisinin tersini verecektir.
Örnek 3.7 Aşağıdaki matrisin tersini eşelon yöntemi ile bulunuz.
⎛ 0 1 1⎞
⎜
⎟
A = ⎜ 1 1 1⎟
⎜ 3 4 3⎟
⎝
⎠
Çözüm: A matrisine birim matris eklenerek,
⎛ 0 1 1 1 0 0⎞
⎜
⎟
A1 = ⎜ 1 1 1 0 1 0 ⎟
⎜3 4 3 0 0 1⎟
⎝
⎠
Satır 1 ile 2 yer değiştirerek,
⎛1 1 1 0 1 0⎞
⎜
⎟
A 2 = ⎜ 0 1 1 1 0 0⎟
⎜3 4 3 0 0 1⎟
⎝
⎠
Satır 1 in üç katını satır 3 den çıkartarak,
⎛1 1 1 0 1 0⎞
⎜
⎟
A3 = ⎜ 0 1 1 1 0 0⎟
⎜0 1 0 0 − 3 1⎟
⎝
⎠
Satır2 yi satır 3 den çıkararak ve satır 3 ü -1 ile çarparak,
47
⎛1 1 1 0 1 0 ⎞
⎜
⎟
A4 = ⎜0 1 1 1 0 0 ⎟
⎜ 0 0 1 1 3 − 1⎟
⎝
⎠
Matris eşelon yapıya dönüşmüştür. İndirgemeye devam etmek için satır 3 satır 1 ve 2 den
çıkarılarak,
⎛1 1 0 −1 − 2 1 ⎞
⎜
⎟
A5 = ⎜0 1 0 0 − 3 1 ⎟
⎜0 0 1 1
3 − 1⎟⎠
⎝
son olarak satır 2 satır 1 den çıkarılarak,
⎛1 0 0 −1 1
0⎞
⎜
⎟
A6 = ⎜0 1 0 0 − 3 1 ⎟
⎜0 0 1 1
3 − 1⎟⎠
⎝
Araştırılan ters matris,
A
−1
0⎞
⎛−1 1
⎜
⎟
=⎜ 0 −3 1 ⎟.
⎜1
3 − 1⎟⎠
⎝
3.3.1 Gauss eleme yöntemi
A tekil olmayan bir matris olsun ve Ax=b eşanlı doğrusal denklen sistemi ele alınsın. Denklem
sisteminde katsayılar matrisi A’dır. Amaç x çözüm vektörünü bulmaktır. Teorem 3.66 dan
görüldüğü gibi GA=I denklemini sağlayan G elemanter matrisi vardır. Elemanter matris iki
elemanter matrisin çarpımı G=E1E2 olarak düşünülebilir. İlk aşamada E1A=H eşelon matris ve
ikinci aşamada E2H=I birim matris elde edilir.
Çözüm için genişletilmiş (augmented) matris (A:b), A matrisine b vektörünün bir sütun olarak
eklenip sütun boyutunun bir arttırılması ile elde edilen,
⎡ a11
⎢a
(A : b ) = ⎢ 21
⎢
⎢
⎣ a n1
a12
a1m
a 22
a2m
an2
a nm
b1 ⎤
b2 ⎥⎥
⎥
⎥
bn ⎦
(3.62)
matris genişletilmiş matristir, ele alınsın. İlk adımda ileri doğru eleme yöntemi ile
E1(A:b)=(H:E1b) eşelon yapısı elde edilir. İkinci adımda geriye doğru eleme yöntemi ile
E2(H:E1b)=(I:E2E1b) birim matris yapısı elde edilir. Sağ tarafta elde edilen x=E2E1b çözüm
vektörüdür. Bu sonuç için, E2E1A= E2H=I olduğundan A-1=E2E1 ve x=A-1b için çözümün
A-1b=E2E1b eşitliğini sağladığı görülebilir.
Örnek 3.8 Aşağıdaki denklem sisteminin çözümünü bulunuz.
2 x1 + x 2 − 3 x3 = 1
48
5 x1 + 2 x 2 − 6 x3 = 5
3x1 − x 2 − 4 x3 = 7
Çözüm: Denklem sistemi Ax=b yapısında,
⎛ 2 1 − 3 ⎞⎛ x1 ⎞ ⎛ 1 ⎞
⎜
⎟⎜ ⎟ ⎜ ⎟
⎜ 5 2 − 6 ⎟⎜ x 2 ⎟ = ⎜ 5 ⎟
⎜ 3 − 1 − 4 ⎟⎜ ⎟ ⎜ 7 ⎟
⎝
⎠⎝ 3 ⎠ ⎝ ⎠
tanımlanır. Genişletilmiş matrise,
⎛2 1 − 3 1⎞
⎜
⎟
⎜ 5 2 − 6 5⎟
⎜3 −1 − 4 7⎟
⎝
⎠
ileri doğru eleme yöntemi ile satır işlemleri uygulanarak eşelon yapısındaki A matrisi,
⎛ 1 0.5 − 1.5 0.5 ⎞
⎜
⎟
− 3 − 5⎟
⎜0 1
⎜0 0
1
1 ⎟⎠
⎝
ve son olarak geriye doğru eleme yöntemi ile,
⎛1 0 0 3 ⎞
⎜
⎟
⎜ 0 1 0 − 2⎟
⎜0 0 1 1 ⎟
⎝
⎠
matrisi elde edilir. Çözüm vektörü x=(x1 x2 x3)=(3 -2 1) olarak elde edilmiştir.
3.3.2 Kramer Kuralı
Boyutu n×n olan bir A matrisinin i-inci satır ve j-inci sütunu silinerek elde edilen (n-1)×(n-1)
boyutlu matris Aij olsun. Eşitlik (3.56) den aij elemanının kofaktörü tanımlanmıştır. Boyutu n×n
olan elemanları kofaktörlerden oluşan matris C olsun. Eğer A matrisi tekil değilse eşitlik (3.59)
sağlanır. Bu eşitlikden,
A I n = CT A
bulunur. Görüldüğü gibi CTA matrisinin tüm köşegen elemanları A değerine eşittir ve
n
A = ∑ aij cij
j =1
eşitliği yazılabilir. Bu ifade A determinantının j-inci sütuna göre açılımı olarak adlandırılır. Şimdi
Ax=b denklem sistemi dikkate alınsın. Eşitlik (3.59) dan,
n
xj =
∑ bi cij
i =1
A
j=1,…,n
(3.63a)
49
sonucu bulunur. Şimdi j-inci sütuna göre açılan A ( j ) determinantı dikkate alınsın. A(j) matrisinin
ij-inci kofaktörü A(j) matrisinin j-inci sütunun ve i-inci satırının silinmesi ile elde edilir. Bu nedenle
A
ij-inci
matrisinin
elemanının
kofaktörüne,
cij
eşittir.
Sonuç
olarak
A ( j ) = ∑ i =1 bi cij sağlandığından eşitlik (3.63a),
A( j )
xj =
(3.63b)
A
olarak bulunur.
Örnek 3.9 Örnek 3. da verilen denklem sistemini Cramer yöntemi ile çözünüz.
1
Çözüm: A
(1)
1
2 1 −3
= 5 2 −6 = 21
7 −1 −4
2
A
−3
( 3)
1
A
1
= 5 2 5 =7
3 −1 7
( 2)
2
= 5 5 −6 = −14
3 7 −4
1
−3
A = 5 2 −6 = 7
3 −1 −4
Determinant değerleri eşitlik (3.63b) de yerine konarak, çözüm vektörü x=(x1 x2 x3)=(3 -2 1) olarak
elde edilmiştir.
3.3.3 Homojen Denklem Sistemleri
Eğer eşitlik (3.61) ile tanımlanan denklem sistemi,
x1a11 + x2 a12 +
+ xm a1m = 0
x1a21 + x2 a22 +
+ xm a2 m = 0
x1an1 + x2 an 2 +
+ xm anm = 0
(3.64a)
şeklinde tanımlanmış ise homojen denklem sistemi olarak adlandırılır. Bu sistem matris
notasyonunda,
Ax=0
(3.64b)
ifadesi ile verilebilir. x=0 bu sistem için daima bir sonuç verdiğinden sistem her zaman
çözümlüdür. Bu çözüm sıfır çözümü (trivial) olarak adlandırılır. Doğal olarak homojen denklem
sistemlerinde x≠0 şeklinde bir çözümün varlığı araştırılır. Eğer ρ(A)=n ise ATA tekil olmadığı için
eşitlik (3.64b) kullanılarak ATAx=0 elde edildiğinden sadece x=0 çözümü vardır. Sonuç olarak
sıfırdan farklı bir çözümün olabilmesi için ρ(A)<n olmalıdır. Diğer bir deyişle eğer ρ(A)<n ise A
matrisinin n adet sütunu, a1, a2,…,an doğrusal bağımlı olacağından, x1a1+x2a2+…+xnan=0
denklemini sağlayan sağlayan sıfırdan farklı x1, x2,…,xn değerleri bulunabilir. Sonuç olarak Ax=0
sistemi için sıfırdan farklı çözüm vardır. Eğer ρ(A)<n için x≠0 şeklinde bir çözüm var ise bu
50
durumda λ her hangi bir skaler olmak üzere, λx vektörüde sistemin bir çözümünü tanımladığından
sistem için sonsuz çözüm mevcuttur.
Teorem 3.68 Ax=0 homojen denklem sisteminde A bir kare matris olmak üzere sıfırdan farklı
çözüm ancak ve ancak A matrisi tekil ise vardır.
İspat: Eğer ρ(A)=n ise Ax=0 sistemini sağlayan doğrusal bağımsız x vektörleri yoktur.
Teorem 3.69 Ax=0 homojen denklem sisteminde denklem sayısı bilinmeyen sayısından daha az ise
sıfırdan farklı çözüm daima vardır.
İspat: Boyutu m×n olan bir A matrisi için Ax=0 homojen denklem sistemi tanımlansın. Eğer m<n
ise ρ(A)<m<n eşitsizliği geçerli olduğundan Teorem 3.68 e göre ispat tamamlanır. Diğer bir deyişle
n-ρ(A) adet doğrusal bağımsız x vektörü Ax=0 denklemini sağlar.
Örnek 3.10 Aşağıdaki homojen doğrusal denklem sistemini çözünüz.
x1 − x2 + 5 x3 − x4 = 0
x1 + x2 − 2 x3 + 3x4 = 0
3x1 − x2 + 8 x3 + x4 = 0
x1 + 3 x2 − 9 x3 + 7 x4 = 0
Çözüm: Katsayılar matrisi A eşelon yapıya yapıya dönüştürülerek,
−1 ⎞
5
⎛ 1 −1 5 −1⎞ ⎛ 1 −1
⎜
⎟ ⎜
⎟
⎜ 1 1 −2 3 ⎟ → ⎜ 0 1 −7 / 2 2 ⎟
⎜ 3 −1 8 1 ⎟ ⎜ 0 0
0
0⎟
⎜
⎟ ⎜
⎟
0
0⎠
⎝ 1 3 −9 7 ⎠ ⎝ 0 0
ρ(A)=2 bulunur. x3=2λ ve x4=μ atanarak, x2 = 7λ − 2 μ ve x1 = x2 − 10λ + μ = −3λ − μ elde edilir
ve çözüm kümesi, ( x1 , x2 , x3 , x4 ) = λ ( −3,7, 2,0 ) + μ ( −1, −2,0,1) .
Homojen olmayan denklem sistemlerinin Ax=b çözümü ile ilgili bazı önemli teoremler aşağıda
verilmiştir.
Teorem 3.70 Ax=b denklem sisteminin tutarlı olabilmesi (bu sistemi sağlayan en az bir adet x
vektörünün mevcut olması) için gerek ve yeter koşul, katsayı matrisinin A rankı ile genişletilmiş
matrisin (A:b) rankının eşit olması gereklidir.
ρ(A)=ρ(A:b)
İspat: Genişletilmiş matrisin (A:b) rankı A matrisinin rankına eşit ya da bir fazladır. A matrisinin
sütunları, a1,…,an kullanılarak,
x1a1 + x2 a 2 +
+ xn a n = b
sistemin tanımlansın. Sistem ancak ve ancak b vektörü A matrisinin sütunlarının doğrusal bir
kombinasyonu olarak yazılabiliyor ise bir çözüme sahiptir. Bu durum ise ancak ve ancak b vektörü
51
A matrisinin sütun uzayında ise mümkündür. Diğer bir deyişle ancak ve ancak ρ(A)= ρ(A:b)
durumu geçerli ise çözüm vardır.
Teorem 3.71 Eğer A boyutu m×n olan bir matris ve ρ(A)=ρ(A:b)=p ve p<n ise bilinmeyen n-p
adet xi değeri keyfi olarak atanır ve kalan p adet xi eşsiz olarak belirlenir.
Bu tip çözümler çoklu çözüm olarak adlandırılır.
Teorem 3.72 Eğer A boyutu m×n olan bir matris ve ρ(A)=ρ(A:b)=n ise Ax=b denklemini sağlayan
bir eşsiz x vektörü mevcuttur.
İspat: Ax=b denkleminin her iki tarafı AT ile çarpılsın ATAx=ATb. ρ(A)=n olduğundan ATA matrisi
tekil olmayan bir matristir. Bu nedenle x=(ATA)-1ATb eşsiz bir çözüme sahiptir.
Tanımlanan bir Ax=b denklem sistemi için yukarıda verilen teoremler aşağıdaki gibi özetlenebilir.
A boyutu m×n olan bir matris ise:
ρ(A)=ρ(A:b)=n ise eşsiz çözüm
ρ(A)=ρ(A:b)<n ise çoklu çözüm
ρ(A)=ρ(A:b)+1 ise çözümsüz.
3.4 DOĞRUSAL DÖNÜŞÜMLER
Doğrusal dönüşümler doğrusal cebir ve doğrusal modeller kapsamında önemli bir konu başlığıdır.
n
A boyutu m×n olan bir matris ve x boyutu n×1 olan
uzayındaki bir vektör olsun. Boyutu m×1
olan bir y vektörü,
y=Ax
(3.65)
denklemi ile tanımlansın. Elde edilen y vektörü
m
uzayındadır. Bu işlem, A dönüşümü ile x vektörü
y vektörüne dönüştürülmüştür, şeklinde ifade edilebilir. Eşitlik (3.65)
n
uzayındaki x vektörünü
m
uzayındaki y vektörüne taşımak ya da x noktasını y noktasına taşımak olarak değerlendirilebilir.
n
uzayındaki her hangi iki vektör x1 ve x2 olsun eğer,
y1=Ax1
y2=Ax2
olarak tanımlanırsa x1 vektörü y1 vektörüne ve x2 vektörü de y2 vektörüne A dönüşümü ile
dönüştürülmüştür. Eğer c1 ve c2 her hangi iki gerçel sayı olmak üzere x3 vektörü,
x3= c1x1+c2x2
denklemi ile belirlenmiş ise A dönüşümü kullanılarak x3 vektörü y3 vektörüne;
y3=Ax3=A(c1x1+c2x2)= Ac1x1+Ac2x2
=c1y1+c2y2
dönüştürülür. Denklemden görüldüğü gibi c1x1+c2x2 vektörü c1y1+c2y2 vektörüne dönüştürülmüştür.
Eşitlik (3.65) ile tanımlanan
n
uzayındaki vektörlerin dönüşümü doğrusal homojen dönüşüm olarak
adlandırılır ve genellikle basit olarak doğrusal dönüşüm şeklinde ifade edilir. Bu dönüşümün özel bir
52
durumu 0=A0 eşitliği olup bir sıfır vektörünü bir diğer sıfır vektörüne dönüştürmektedir. Bu nedenle
dönüşüm homojen olarak adlandırılır.
n
uzayındaki her hangi iki vektör x1 ve x2 ile her hangi iki
skaler c1 ve c2 için,
A(c1x1+c2x2)= c1(Ax1)+ c2(Ax2)
elde edildiğinden doğrusaldır. Diğer bir deyişle iki vektörün doğrusal bir kombinasyonunun A
dönüşümü, dönüştürülmüş iki vektörün aynı doğrusal kombinasyonu ile elde edilmektedir.
Bir x vektörünün,
y=Ax
dönüşümü ve y vektörünün,
z=By
dönüşümü ele alınsın. Dönüşümler yerine konarak,
z=By=B(Ax)=(BA)x
elde edilir. Burada BA matrisi x vektörünü doğrudan z vektörüne taşıyan dönüşümdür. Bu yaklaşım
her hangi sonlu sayıdaki dönüşüm için genişletilebilir.
Yanıtı araştırılan bir diğer soru ise dönüşüm sonucu elde edilen vektörler kümesinin bir vektör uzayı
yapısında olup olmadığıdır.
Teorem 3.73 Bir A dönüşümü ile
n
vektör uzayındaki her bir vektörün dönüşümünden elde edilen
vektör kümesi,
S = {y / y = Ax, x ∈
n
}
bir vektör uzayını tanımlar.
Dönüşümler üzerine bir diğer önemli soru da bir vektörü kendi katlarına dönüştürecek dönüşüm ile
ilgilidir. Bu problem doğrusal cebirde özdeğer problemi olarak adlandırılır.
3.5 MATRİSİN ÖZDEĞERLERİ (KARAKTERİSTİK KÖKLERİ)
Boyutu n×n olan bir A matrisi ile tanımlanan dönüşüm ele alınsın.
n
uzayındaki sıfırdan farklı
bir x için λ bir gerçel sayı olmak üzere,
Ax=λx
(3.66)
dönüşümü var ise λx vektörü x vektörünün katı olduğundan bu dönüşüm x vektörünü kendi
katlarına dönüştürmektedir. Bu eşitlikteki gerçel sayı λ özdeğer x vektörü ise özvektör olarak
adlandırılır. Eşitlik (3.66)’da bilinmeyen x vektörünün yanısıra bir de bilinmeyen skaler mevcuttur.
Her bir λ ’ya bir x vektörü karşılık gelir. Bu λ değerleri, özdeğerler ya da karakteristik kök olarak,
x vektörleri ise öz vektörler ya da karakteristik vektörler olarak bilinirler. Eşitlik (3.66) homojen
yapıda,
(A − λ I ) x = 0
(3.67)
53
eşitliği ile verilebilir. Eşitlik (3.67) verilen herhangi bir n için eşitlik (3.66)’ya eşittir. Doğrusal
denklemlerin çözümü ile ilgili temel bilgilerden, eğer (A-λI) matrisi tekil olmayan bir matris ise
eşitlik (3.67) için sadece x=0 sonucu elde edilir. Bu çözüm her hangi bir λ değeri için geçerli
olacaktır. Çözüm olarak x=0 vektörünün bulunması doğrusal homojen bir dönüşümü diğer bir
deyişle orijini tanımlayan 0 vektörünün kendi içine dönüştürüldüğünü belirtir. Sonuç olarak x=0 bir
özvektörü tanımlamaz. Bununla birlikte λ=0 değerime sahip bir özdeğer olabilir. Problem eşitlik
(3.66) ü sağlayan x≠0 olacak şekilde bir vektörün bulunmasıdır.
Eşitlik (3.67) için bir çözümün var olabilmesi ancak ve ancak A-λI matrisinin tekil bir matris diğer
bir deyişle determinantının sıfıra eşit olması
A−λI =0
(3.68a)
durumunda gerçekleşir. Bu determinant değeri λ skalerine göre bir n-inci dereceden polinom
denklemini,
pA ( λ ) = A − λ I = 0
(3.68b)
tanımlar. Polinom A matrisinin karakteristik denklemi olarak bilinir ve denklemin kökleri matrisin
özdeğerlerini verir. Özdeğerler karakteristik denklemin kökleri olduğundan karakteristik kök olarak
da adlandırılırlar. Derecesi n olan bir polinom n adet kök değerine sahiptir. Kök değerlerinin her
birinin faklı olması gerekli olmayıp katlı kök bulunabilir. Kökler gerçel ya da karmaşık olabilir.
Karakteristik polinom,
pA ( λ ) = p0 + p1λ + … + pn −1λ n −1 + λ n = ( λ − λ1 )( λ − λ2 )… ( λ − λn )
(3.69)
olup eğer A matrisi gerçel bir matris ise pi değerleri de gerçeldir. Bu nedenle gerçel bir matrisin
karmaşık özdeğerleri ancak eşlenik çiftlerde ortaya çıkabilir.
Özdeğerlerin hesaplanmasına yardımcı olmak üzere n=3 alınarak,
p ( λ ) = p0 + p1λ + p2 λ 2 + p3λ 3 = ( λ − λ1 )( λ − λ2 )( λ − λ3 )
polinomu ele alınsın, bu polinom için, verilen λ1, λ2, λ3 sayılarının tanımladığı elemanter simetrik
fonksiyonlar,
s1 = λ1 + λ2 + λ3
s2 = λ1λ2 + λ1λ3 + λ2λ3
s3 = λ1λ2 λ3
σ 2 = λ12 + λ22 + λ32
σ 2 = λ13 + λ23 + λ33
ve kuvvet toplamları,
σ 1 = λ1 + λ2 + λ3
tanımlansın. Polinom açık olarak,
p ( λ ) = ( λ − λ1 ) ⎡⎣λ 2 − ( λ2 + λ3 ) λ + λ2λ3 ⎤⎦
p ( λ ) = λ 3 − ( λ1 + λ2 + λ3 ) λ 2 + ( λ1λ2 + λ1λ3 + λ2λ3 ) λ − λ1λ2λ3
54
p ( λ ) = λ 3 − s1λ 2 + s2 λ − s3
yazıldığında, p0=-s3, p1=s2, p2=-s1, eşitlikleri geçerli olup,
s1 = σ 1
σ 1 = s1
s2 =
1 2
(σ 1 − σ 2 )
2
σ 2 = s12 − 2s2
s3 =
1 3
(σ1 − 3σ 1σ 2 + 2σ 3 )
6
σ 3 = s13 − 3s1s2 + 3s3
özdeşlikleri elde edilir. Eşitliklerden görülebileceği gibi si ve σi değerleri arasında bire bir ilişki
vardır. Yukarıda açıklanan yaklaşım benzer yapıda daha yüsek dereceli polinomlara uygulanabilir.
Boyutu n×n olan bir A matrisinin k×k boyutlu alt matrisi n-k sıra ve n-k sütunun silinmesi ile elde
edilir. Eğer silinen sıra ve sütun indisleri aynı ise elde edilen alt matris A matrisinin ana alt matrisi
olarak adlandırılır. Örneğin 3×3 boyutlu bir alt matris A matrisinin birinci, üçüncü ve dördüncü
sıraları ile birinci, üçüncü ve dördüncü sütunlarından elde edilmiş ise A matrisinin ana alt
matrisidir. Eğer seçilen alt matris A matrisinin kuzey batı köşesinde ise ön (leading) ana alt
matrisidir. Yukarıda tanımlanan 3×3 boyutlu ana alt matris ön ana alt matris değildir. 3×3 boyutlu
ana alt matris ilk üç sıra ve sütundan oluşturulur ise ön ana alt matrisi tanımlar. Bir (ön) ana alt
⎛n⎞
⎝k ⎠
matrisin determinantı (ön) ana minör olarak adlandırılır. A matrisinin k×k boyutlu ⎜ ⎟ adet farklı
ana minörü vardır. Bunların toplamı M k ( A ) ile belirtilsin. Özel durum olarak M 1 ( A ) = tr ( A ) ve
M n ( A ) = A . Matrisin karakteristik polinomunun katsayıları ile M k ( A ) fonksiyonlarının ilişkisi,
pn −1 = − M 1 ( A ) , pn − 2 = ( −1) M 2 ( A ) ,… , p1 = ( −1)
2
n −1
M n −1 ( A ) , p0 = ( −1) M n ( A )
n
olup eğer A matrisinin özdeğerleri λ1,…, λn ise,
sk ( λ1 ,… , λn ) = M k ( A ) k=1,…,n
ilişkisi tanımlanabilir.
Matrisler ile ilgili önemli özelliklerden ikisi denklik (equivalent) ve benzerliktir (similar). A ve B
matrisleri aynı boyutta ve aynı ranka sahipler ise denk matrisler olarak adlandırılırlar. Bu
özelliklere ek olarak kare matris iseler benzer matrisler olarak adlandırılırlar.
Kısım 3.1 de simetrik matrisler tanımlanmıştı. Doğrusal cebirde önemli bir yer tutan simetrik
matrislerin genelde diğer matrislerde bulunmayan bazı özellikleri aşağıda açıklanmıştır:
1- Simetrik matrislerin özdeğerlerinin tümü gerçeldir.
2- Simetrik matrislerin farklı özdeğerlerinin tanımladığı özvektörler ortogonaldir.
3- Simetrik matrislerin özvektörleri bir
n
uzayı tanımlar.
4- Simetrik matrislerin rankı sıfırdan farklı özdeğerlerin sayısına eşittir.
55
5- Simetrik matrisler ortogonal bir dönüşüm ile köşegenleştirilebilir.
Teorem 3.74 Eğer A matrisi simetrik ise özdeğerleri gerçeldir.
İspat: Matrisin bir karmaşık özdeğere λ+iμ sahip olduğu kabul edilsin. Burada i,
- 1 değerini
belirtsin. Bu özdeğere karşılık gelen bir özvektör x+iy şeklinde verilsin. Buna göre,
A(x + iy ) = (λ + iμ )(x + iy )
yazılabilir. Daha sonra bu denklem gerçel ve izafi bileşenlere, Ax=λx-μy ve Ay=μx-λy, ayrılabilir.
Birinci denklem yT ve ikinci denklem xT ile soldan çarpılarak,
yTAx=λyTx-μyTy
xTAy=μxTx+λxTy
elde edilir. A simetrik bir matris ise, yTAx= xTAy eşitliği sağlanır, (bir skaler kendi transpozuna
eşittir). Bu iki denklem birbirinden çıkarılarak,
(
0 = μ xT x + y T y
)
sonucu elde edilir. Özvektörlerin sıfır olmayan, xTx>0 ve/veya yTy>0 bir çözüme sahip olması
gerektiğinden, μ=0 elde edilir. Bunun sonucu olarak da karmaşık bir özdeğer olamayacağı
görülmektedir. Özvektörler de y=0 olup, gerçeldir.
Örnek 3.11 Aşağıdaki 2×2 ve 3×3 boyutlu matrislerin özdeğerlerini bulunuz.
⎛ 3 5⎞
A=⎜
⎟
⎝ −2 −4 ⎠
Çözüm: λ I 2 − A =
λI2 − B =
⎛ 3 4⎞
B=⎜
⎟
⎝ −5 −5 ⎠
λ −3
−5
2
λ+4
λ −3
−4
5
λ +5
⎛3 5⎞
C=⎜
⎟
⎝5 7⎠
⎛7 0 0⎞
⎜
⎟
D = ⎜ 0 3 5⎟
⎜ 0 5 4⎟
⎝
⎠
= ( λ − 3)( λ + 4 ) + 10 = ( λ − 1)( λ + 2 ) olup özdeğerler 1 ve -2 dir.
= ( λ − 3)( λ + 5 ) + 20 = ( λ + 1) + 4 olup denklemin
2
( λ + 1)
2
= −4 için
2
− 29
çözümü λ1,2 = −1 ± 2i bulunduğundan özdeğerler karmaşıktır.
λI2 − C =
λ −3
−5
−5
λ −7
= ( λ − 3)( λ − 7 ) − 25 = ( λ − 5 ) − 29 olup denklemin
2
( λ − 5)
için
çözümü λ1,2 = 5 ± 29 çözümü elde edilir.
λI 3 − D = (λ − 7 )
λ −3
−5
−5
λ−4
[
]
(
= (λ − 7 )(λ − 7 2) − 101 4 olup özdeğerler 7 ve 1 2 7 ± 101
2
)
dir.
Örneklerden görüldüğü gibi simetrik olmayan bir matris (A ve B gibi) için özdeğerler gerçel
olmayabilir. Bunula birlikte simetrik matrislerin (C gibi) özdeğerleri daima gerçeldir.
56
Doğrusal
cebirde
önemli
konulardan
biri
de
matrislerin
çarpanlara
ayrılması
ve
köşegenleştirilmesidir. Bu konu ile ilgili bazı teoremler aşağıda verilmiştir.
Teorem 3.75 Eğer A matrisinin boyutu m×n ve rankı r ise, her ikisinin de rankı r olan ve boyutları
sırası ile m×r ve r×n olan B ve C matrisleri için,
A=BCT
eşitliği sağlanır.
Teorem 3.76 Eğer A matrisinin boyutu m×n ve rankı r ise, tekil olmayan E ve F matrisleri için,
⎛I
EAF = D = ⎜⎜ r
⎝0
0⎞
⎟
0 ⎟⎠
eşitliği sağlanır.
Teorem 3.77 Eğer A gerçel matrisinin boyutu m×n rankı n ve Q boyutu m×n yarı ortogonal,
QTQ=In, matris ve U boyutu n×n gerçel pozitif köşegen elemanlı üst üçgen matris olmak üzere,
A=QU
eşitliği sağlanır.
Teorem 3.78 Eğer A matrisinin boyutu n×n kare simetrik bir matris ve P ortogonal matris ise,
PTAP=Λ
eşitliği sağlanır burada Λ bir köşegen matris olup köşegen elemanları A matrisinin özdeğerlerinden
P ortogonal matrisi ise bu özdeğerlere ait özvektörlerden oluşur.
Teorem 3.79 A matrisinin özdeğerlerinin çarpımı bu matrisin determinantına eşittir,
A =
n
i =1
λi
İspat: Teorem 3.78 ile PTAP=Λ ve Teorem 3.62 ile P T AP = A olduğundan, A = Λ ve
A = λ1λ 2 … λ n =
n
i =1
λi
ispat tamamlanır. Farklı bir ispat matrisin karakteristik denkleminde,
λ I n − A = ( λ − λ1 )( λ − λ2 )… ( λ − λn )
λ=0 alınarak, − A = ( −1)
n
n
i =1
λi ve A =
n
i =1
λi bulunabilir.
Sonuç 3.79.1 Eğer P ortogonal bir matris ise A ile PTAP matrislerinin özdeğerleri özdeştir.
Örnek 3.12 A matrisinin,
⎛ 1 3 0⎞
⎜
⎟
A = ⎜ 0 1 0⎟
⎜ 2 1 5⎟
⎝
⎠
57
karakteristik denklemini, özdeğerlerini, determinantını ve rankını bulunuz.
Çözüm: pA ( λ ) = λ I 3 − A =
( λ − 1)( λ − 5) = 0 ile
λ −1
−3
0
−2
λ −1
−1
0
0 = ( λ − 1)( λ − 5 )
λ −5
olup
karakteristik
tanımlanmıştır. Özdeğerler ise 5 ve 1 olup 1 katlı kökdür.
denklem
pA ( λ )
denkleminde λ=0 alınarak,
pA ( λ ) = − A = ( −1) A = ( −1) ( −5 ) = −5
3
2
ve sonuç olarak, A = 5 bulunur. Determinant değeri sıfırdan farklı olduğu için A matrisinin rankı
ρ(A)=3.
Bir köşegen matrisin determinantı köşegen elemanlarının çarpımına eşit olduğundan köşegen
matrislerin kaşegen elemanları aynı zamanda özdeğerlerine eşittir. Benzer bir durum üçgen
matrisler için de geçerlidir.
Teorem 3.80 Bir A matrisi ancak ve ancak tüm özdeğerleri sıfırdan farklı ise tekil değildir.
Eşdeğer olarak A matrisi ancak ve ancak özdeğerlerinden en az biri sıfır ise tekildir.
İspat: Eğer boyutu n×n olan A matrisinin bir özdeğeri λ=0 ise,
λI n − A = − A = (− 1)n A = 0
ve sonuç olarak A = 0 .
Teorem 3.81 Simetrik bir A matrisinin rankı, bu matrisin sıfırdan farklı özdeğerlerinin sayısına r
eşittir.
İspat: Teorem 3.78 ile PTAP=Λ. P matrisi tekil olmadığından, ρ(A)= ρ(Λ) olduğu görülebilir.
Ayrıca Λ köşegen matristir. Bu nedenle rankı sıfırdan farklı köşegen elemanlarının sayısına eşit
olduğundan ρ(A)= ρ(Λ)=r.
Teorem 3.82 A matrisinin bir λ özdeğeri için özvektörü x olsun. Her hangi s ve t skalerleri için, sI-
tA matrisinin özdeğeri olan s-tλ nın özvektörü, A matrisinin λ özdeğeri için özvektörü olan x dir.
İspat: ( sI − tA ) x = sx − t λ x = ( s − t λ ) x .
Teorem 3.83 Ak matrisinin özdeğerleri, A matrisinin özdeğerlerinin k-ıncı kuvvetine eşittir. Fakat
her iki matrisinde özvektörleri aynıdır.
İspat: A k x = A k −1 ( Ax ) = λ A k −1x = … = λ k x
Teorem 3.84 Bir idempotent matrisin her bir özdeğeri sıfır ya da birdir.
İspat:Teorem 3.83 kullanılarak A2x= λ2x ve A idempotent bir matris ise,
A2x =Ax= λx
58
λ(λ-1)x=0
ve herhangi bir x özvektörü sıfır vektörü olmadığından, λ=0 ya da λ=1 bulunur.
Teorem 3.85 A-1 matrisinin özdeğerleri A matrisinin özdeğerlerinin evriğine eşittir. Fakat her iki
matrisin özvektörleri aynıdır.
İspat: Ax=λx bu eşitlik soldan A-1 ile çarpılarak x=λ A-1x veya A-1x =(1/ λ)x elde edilir.
Teorem 3.86 Bir özvektör iki faklı özdeğere ait olamaz.
İspat: A matrisinin iki faklı özdeğeri λ1≠λ2 olsun. Bu durumda x≠0 için Ax=λ1x ve Ax=λ2x olup
λ1x=λ2x sağlanmalıdır fakat olduğundan λ1≠λ2 bu eşitlik sadece x=0 için sağlanır.
Teorem 3.87 A matrisinin farklı özdeğerlerine karşılık gelen özvektörler doğrusal bağımsızdır.
Eğer A matrisi simetrik ise özvektörler ortogonaldir.
İspat: A matrisinin özvektörlerinin kümesi x1,…,xn ve λj özdeğerine karşılık gelen özvektör xj
olsun. Birbirine eşit her hangi iki λj olmadığı ve bu özvektör kümesinin doğrusal bağımlı olduğu
varsayılsın. Özvektörler r≤n olmak üzere doğrusal bağımsız olanlar x1,…,xr olarak düzenlensin. Bu
durumda, j=r+1,…,n olmak üzere,
r
x j = ∑ α ij x i
i =1
r
λ j x j = λ j ∑ α ij x i
(3.70a)
i =1
yazılabileceği için,
r
r
i =1
i =1
λ j x j = Ax j = ∑ α ij Ax i = ∑ α ij λi x i
(3.70b)
eşitlikleri elde edilir. Eşitlikler (3.70a) ve (3.70b) kullanılarak,
∑ α ij (λi − λ j )x i
r
=0
(3.70c)
i =1
bulunur. x1,…,xr vektörleri doğrusal bağımsız olduğundan, eşitlik (3.70c),
α ij (λi − λ j ) = 0
i=1,…,r
j=r+1,…,n
sonucunu verir. Varsayım gereği λi≠λj olduğundan tüm i=1,…,r ve j=r+1,…,n için αij=0 ve
xr+1=…=xn=0 olmalıdır. Bu ise mümkün değildir çünkü xr+1,…,xn özvektörler olduğundan sıfırdan
farklı olmalıdır. Sonuç olarak r=n olup farklı özdeğerlere ait özvektörler doğrusal bağımsızdır.
A matrisinin birbirinden farklı iki özdeğeri λi veλj olsun. Bu durumda, Axi=λxi ve Axj=λxj
koşulunu sağlayan iki özvektör xi ve xj mevcuttur. Sonuç olarak, A matrisi simetrik olduğundan,
λi x Tj x i = x Tj Ax i = x Ti A T x j = x Ti Ax j = λi x Ti x j
bulunur. λi≠λj olduğundan, x Ti x j = 0 elde edilir.
59
Teorem 3.88 T-1AT=Λ eşitliğini sağlayan bir T matrisi ancak ve ancak her biri A matrisinin
özvektörü olan birbirinden bağımsız n adet vektör kümesi mevcut ise elde edilebilir.
Örneğin aşağıda verilen ve temel Jordan bloğu olarak adlandırlan k×k boyutlu üst üçgen matris,
⎛0
⎜
⎜0
Jk = ⎜
⎜
⎜0
⎜0
⎝
1 0
0 1
0 0
0 0
0⎞
⎟
0⎟
⎟
⎟
1⎟
0 ⎟⎠
sadece bir tane özvektöre x=(1,0,…,0) sahip olup k adet bağımsız özvektörü olmadığından
köşegenleştirilemez. Bununla birlikte,
⎛ 0 0T ⎞
⎛ I k −1 0 ⎞
T
J Tk J k = ⎜
⎟ ya da J k J k = ⎜ T
⎟
0⎠
⎝0
⎝ 0 I k −1 ⎠
elde edilebilir.
Teorem 3.89 Eğer B=T-1AT eşitliğini sağlayan bir tekil olmayan T matrisi var ise A ve B
matrisleri benzer matrislerdir. Benzer matrisler aynı özdeğer kümesine sahiptir. Fakat özvektörler
kümesi aynı değildir.
İspat: λ I n − B = λ I n − T−1 AT = T−1 ( λ I n − A ) T olduğundan,
λ I n − B = λ I n − T −1AT = T−1 λ I n − A T = λ I n − A
aynı özdeğer kümesi sonucu bulunur. Bununla birlikte Ax=λx ise B(T-1x)= λ(T-1x) olup özvektör
kümesi aynı değildir.
Teorem 3.90 Boyutu n×n olan simetrik bir A matrisinin her hangi bir λ özdeğeri k defa
tekrarlanıyor ise bu özdeğere karşılık gelen k adet ortogonal vektör mevcuttur.
İspat: Teorem 3.78 ile AP=PΛ eşitliğini sağlayan ortogonal bir P matrisi vardır. k≥2 olacak şekilde
katlı bir özdeğer λ1 olsun. Köşegen matris,
⎛λ I
Λ=⎜ 1 k
⎝ 0
0 ⎞
⎟
Λ2 ⎠
olarak bölümlensin. Burada köşegen alt matris Λ2, A matrisinin λ1 den farklı n-k adet özdeğerini
içerir. P matrisi de yukarıdaki bölümlenmeye uygun olarak P=(P1:P2) bölümlensin. Sonuç
olarak, P1T P1 = I k , P2T P2 = I n − k ve P1T P2 = 0 olduğundan,
AP1=λ1P1 ve AP2=P1Λ2
elde edilebilir. P1 matrisi k adet sütuna sahiptir. P1T P1 = I k olduğundan P1 matrisinin k adet sütunu
doğrusal bağımsız ve ortanormaldir ve AP1=λ1P1 eşitliği sağlandığından bu sütunların her biri λ1
özdeğerinin bir özvektörüdür.
60
Teorem 3.91 n boyutlu simetrik A matrisinin sahip olduğu n adet özdeğerin λ1, … ,λn hepsinin
birbirinden farklı olması gerekli değildir
Örnek 3.13 Aşağıda verilen A matrisinin özvektörlerini bulunuz.
⎡4 2⎤
A=⎢
⎥
⎣2 1⎦
⎡4 − λ
Çözüm: Karakteristik denklem A − λ I 2 = ⎢
⎣ 2
2 ⎤
= (4 − λ ) (1-λ )-4 = λ 2 − 5λ = 0
1 − λ ⎥⎦
ve karakteristik kökler, λ1=5 ve λ2=0olarak elde edilir. λ1 için
2 ⎤ ⎡ x1 ⎤ ⎡ −1 2 ⎤ ⎡ x1 ⎤
⎡4 − 5
=
=0
⎢ 2
1 − 5⎥⎦ ⎢⎣ x2 ⎥⎦ ⎢⎣ 2 −4 ⎥⎦ ⎢⎣ x2 ⎥⎦
⎣
ve
x1 = 2x2
elde edilir. Sonuç olarak λ1=5 için özvektör,
⎡ x1 ⎤ ⎡ 2x2 ⎤
⎢x ⎥ = ⎢ x ⎥
⎣ 2⎦ ⎣ 2 ⎦
şeklinde olup görüldüğü gibi özvektörün bir elemanı herhangi bir değeri serbestçe alabilir ve eğer x
değeri herhangi bir λ için bu eşitliğini sağlıyorsa, c bir sabit olmak üzere cx değeri de bu eşitliği
sağlar. Elde edilen herhangi bir özdeğere karşılık gelen özvektörler eşsiz olaraktanımlanabilmeleri
için normalize edilir. λ1=5 için bulunan özvektör normalize edilerek,
⎡2
x1 = ⎢
⎢⎣ 1
5⎤
⎥
5 ⎥⎦
şeklinde elde edilir. λ2=0 için özvektör,
2 ⎤ ⎡ x1 ⎤ ⎡ 4 2 ⎤ ⎡ x1 ⎤
⎡4 − 0
=
=0
⎢ 2
1 − 0 ⎥⎦ ⎢⎣ x2 ⎥⎦ ⎢⎣ 2 1 ⎥⎦ ⎢⎣ x2 ⎥⎦
⎣
ve
x2 = −2x1
elde edilir. Sonuç olarak λ2=0 için özvektör,
⎡ x1 ⎤ ⎡ x1 ⎤
⎢ x ⎥ = ⎢ −2 x ⎥
1⎦
⎣ 2⎦ ⎣
bulunur ve normalize edilerek:
⎡1 5 ⎤
x2 = ⎢
⎥
⎢⎣ −2 5 ⎥⎦
61
Farklı özdeğerlere karşılık gelen özvektörler ortogonaldir. Özvektörler bir X matrisi şeklinde,
⎡2
x2 ] = ⎢
⎣⎢ 1
X = [ x1
5
5
5 ⎤
⎥
−2 5 ⎦⎥
1
yazılabilir. XTX matrisi ise,
⎡1 0 ⎤
XT X = XXT = ⎢
⎥
⎣0 1 ⎦
şeklinde elde edilir. Görüldüğü gibi özvektörlerin oluşturduğu matris ortogonal bir matristir. Daha
sonra XTAX matrisi,
⎡2
⎢
⎢⎣1
5 ⎤ ⎡ 4 2⎤ ⎡ 2
⎥⎢
⎥⎢
− 2 5 ⎥⎦ ⎣2 1 ⎦ ⎢⎣1
5
1
5
5
5
5 ⎤ ⎡5 0⎤
⎥=⎢
⎥
− 2 5 ⎥⎦ ⎣0 0⎦
1
şeklinde elde edilir. Görüldüğü gibi elde edilen matrisin köşegen elemanları özdeğerleri
vermektedir ve matrisin rankı sıfırdan farklı özdeğer sayısına eşittir.
Teorem 3.92 Boyutu n×n olan simetrik bir A matrisinin özdeğerlerine ait özvektörler
n
uzayını
oluştururlar.
Teorem 3.93 Bir A matrisinin köşegen elemanlarının toplamı (izi) özdeğerlerinin toplamına eşittir,
n
tr ( A ) = ∑ λi .
i =1
İspat: Kare bir A matrisinin izi,
tr ( A) = a11 + a22 +
+ ann
şeklindedir. m×n boyutlu A ve n×m boyutlu B matrisleri için Teorem 3.18 ile, tr ( AB) = tr (BA)
eşitliği verilebilir. Teorem 3.78 PT AP = Λ kullanılarak,
tr ( Λ ) = tr ( PT AP ) = tr ( APT P )
P matrisi ortogonal olduğundan
tr(Λ)=tr(A)
elde edilir. Sonuç olarak,
λ1 + λ2 +
+ λn = a11 + a22 +
+ ann
ispat sağlanır.
Teorem 3.94 Özdeğerleri λ1, λ2,…, λn olan her hangi bir n×n boyutlu A matrisi için,
tr ( A k ) = ∑ λik
n
k=1,2,…
i =1
Teorem 3.95 Bir simetrik ortogonal matris sadece 1 ve -1 özdeğerlerine sahiptir.
Teorem 3.96 Eğer A matrisi tekil ise tekil olmayan bir A+εI matrisini tanımlayan bir ε skaleri
daima vardır.
62
İspat: A matrisinin özdeğerleri λ1, λ2,…, λn olsun. A+εI matrisinin özdeğerleri λi+ε olacaktır. Bu
nedenle her hangi λi≠ε için A+εI tekil olmayan bir matrisdir. Özellikle eğer λi≠0 olmak üzere en
küçük özdeğer λi ise A+εI matrisi (0, λi ) aralığındaki her hangi bir ε için tekil olmayan matristir.
Teorem 3.97 Her ikisinin de boyutu n×1 iki vektör x ve y olsun. xyT matrisinin n-1 adet özdeğeri
sıfıra bir tanesi ise yTx değerine eşittir.
3.6 KARESEL FORMLAR VE POZİTİF TANIMLI MATRİSLER
Bir satır xT vektörünün bir A matrisi ve sütun x vektörü ile çarpımı xTAx karesel form olarak
adlandırılır. Karesel formlar istatistikte ve özellikle varyans analizi teorisinde oldukça sık
kullanılırlar. A matrisinin uygun bir seçimi sonucunda varyans analizindeki kareler toplamları
xTAx yapısında gösterilebilirler. Örneğin,
x Ax = (x1
T
x2
⎛ 1 2 3 ⎞⎛ x1 ⎞
⎜
⎟⎜ ⎟
x3 )⎜ 4 7 6 ⎟⎜ x 2 ⎟
⎜ 2 − 2 5 ⎟⎜ x ⎟
⎝
⎠⎝ 3 ⎠
= x12 + 4 x 2 x1 + 2 x3 x1 + 2 x1 x 2 + 7 x 22 − 2 x3 x 2 + 3 x1 x 3 + 6 x 2 x 3 + 5 x32
(3.71a)
= x12 + x1 x 2 (4 + 2 ) + x1 x 3 (2 + 3) + 7 x 22 + x 2 x 3 (− 2 + 6) + 5 x32
(3.71b)
= x12 + +7 x 22 + 5 x 32 + 6 x1 x 2 + 5 x1 x3 + 4 x 2 x3
(3.71c)
bir karesel formdur ve sonuç bir skaleri tanımladığı için xTAx bir skaler fonksiyondur. xTAx tüm
mümkün xi çiftlerinin A matrisinin bir elemanı ile çarpımlarının toplamıdır. Örneğin eşitlik (3.71a)
deki 4x2x1 terimi x2x1 çiftinin A matrisinin ikinci sırası ile birinci sütunundaki eleman ile çarpılarak
elde edilmiştir. Eşitlik (3.71b) de ise x2x1 teriminin katsayısının A matrisinin iki elemanının, birinci
sütun ikinci satırdaki eleman ile ikinci sütun birinci satırdaki eleman, toplamı olduğu görülebilir.
Eğer x boyutu n×1 olan ve elemanları xi, i=1,…,n ile tanımlanan bir vektör, A ise boyutu n×n olan
ve elemanları aij, j=1,…,n ile gösterilen bir kare matris ise eşitlik (3.71a) genel olarak,
x T Ax = ∑ ∑ xi x j a ij
i
j
= ∑ x i2 a ii + ∑ ∑ xi x j a ij
i
i≠ j
ve eşitlik (3.71b) ile (3.71c) genel olarak,
(
x T Ax = ∑ xi2 a ii + ∑ ∑ x i x j a ij + a ji
i
j >i
)
(3.72)
şeklinde ifade edilebilir. Eşitlik (3.71c) tekrar ele alınsın,
x T Ax = x12 + +7 x 22 + 5 x32 + 6 x1 x 2 + 5 x1 x3 + 4 x 2 x3
= x12 + +7 x 22 + 5 x 32 + x1 x 2 (1 + 5) + x1 x3 (1 + 4) + x 2 x3 (0 + 4 )
63
⎛1 1 1⎞
⎜
⎟
= x ⎜ 5 7 0 ⎟x
⎜ 4 4 5⎟
⎝
⎠
T
= x T Bx
elde edilir. Görüldüğü gibi B matrisi A matrisinden farklı olmakla birlikte iki karesel form eşittir.
Sonuç olarak xTAx şeklindeki bir karesel formu ifade eden eşsiz bir A matrisi yoktur.
Kullanılabilecek pek çok matris vardır. Bu matrislerin köşegen elemanları eşit olup köşegen
dışındaki simetrik aij=aji elemanların toplamları eşittir. Örneğin eşitlik (3.71a),
2342 − 789 ⎞
⎛ 1
⎜
⎟
7
1.37 ⎟x
x Ax = x ⎜ − 2336
⎜ 794
2.63
5 ⎟⎠
⎝
T
T
(3.73a)
olarak ifade edilebilir. Eğer eşitlik (3.71b),
x T Ax = x12 + x1 x 2 (3 + 3) + x1 x3 (2.5 + 2.5) + 7 x 22 + x 2 x 3 (2 + 2) + 5 x32
⎛ 1 3 2 .5 ⎞
⎜
⎟
x Ax = x ⎜ 3 7 2 ⎟x
⎜ 2 .5 2 5 ⎟
⎝
⎠
T
T
(3.73b)
olarak yazılır ise A matrisi simetriktir bu nedenle eşsizdir. Diğer bir deyişle belirli bir karesel form
bir simetrik A matrisi için eşsizdir. Simetrik olmayan bir A matrisi için ½(A+AT) simetrik
olduğundan karesel form xT[½(A+AT)]x olarak tanımlanabilir. Örneğin eşitlik (3.73a) deki A
matrisine ½(A+AT) uygulanarak eşitlik (3.71b) daki simetrik matris elde edilebilir. Simetri nedeni
ile aij=aji olduğundan eşitlik (3.72),
x T Ax = ∑ x i2 a ii + 2∑ ∑ x i x j aij
i
(3.74)
j >i
olarak tanımlanabilir. Karesel formu eşsiz olarak belirlediği için A matrisinin simetrik olaması
önemlidir. Bu nedenle özellikle Bölüm 4 de incelenerek karesel formlar için A matrisinin daima
simetrik olmasına dikkat edilecektir.
A matrisi n×n boyutlu simetrik bir matris ve x vektörü n elemanlı bir sütun vektörü ise karesel
formun genel yapısı,
xT Ax = a11 x12 + 2a12 x1 x2 + 2a13 x1 x3 +
+ 2a1n x1 xn
+ a 22 x 22 + 2a 23 x 2 x3 +
+
a 33 x32
+ 2a 2 n x 2 x n
+
+ 2a 3n x 3 x n
(3.75)
+ a nn x n2
ifadesi ile verilebilir.
64
Tüm x≠0 sütun vektörleri için eğer xTAx>0 ise karesel form ve A matrisi pozitif tanımlıdır. Eğer
tüm x≠0 sütun vektörleri için xTAx≥0 ise karesel form ve matris pozitif yarı tanımlıdır. Yukarıdaki
eşitsizliklerin yönü değiştirilerek negatif tanımlı ve negatif yarı tanımlı karesel form ve matrisler
tanımlanabilir. Eğer bir form bazı x vektörleri için pozitif, diğerleri için negatif ise tanımsızdır.
Teorem 3.98 Her hangi bir gerçel A matrisi ve tüm gerçel x vektörleri için xTAx=0 eşitliği ancak
ve ancak A matrisi çarpık simetrik ise sağlanır.
Teorem 3.99 Eğer A ve B matrisleri simetrik ise tüm gerçel x vektörleri için xTAx= xTBx eşitliği
ancak ve ancak A=B ise sağlanır.
Teorem 3.100 Gerçel simetrik matris A’nın pozitif tanımlı olabilmesi için gerek ve yeter koşul A
matrisinin tüm özdeğerlerinin pozitif tanımlı olması gerekir. Pozitif yarı tanımlı bir matrisin
özdeğerleri negatif değildir.
Teorem 3.101 Gerçel simetrik bir A matrisinin pozitif tanımlı olabilmesi için gerek ve yeter koşul
A matrisinin her bir alt matrisinin determinantının pozitif olması gerekir.
a11 ⟩ 0
A1 ⟩ 0
a11
a12
a 21
a 22
A 2 ⟩0
⟩0
An
a11
a12
a1n
a 21
a 22
a2n
a n1
an2
a nn
⟩0
= A ⟩0
Teorem 3.102 Pozitif tanımlı bir matrisin determinantı pozitiftir.
Teorem 3.103 Eğer A boyutu n×n rankı r≤n ve pozitif yarı tanımlı matris ise L köşegen
elemanlarının r adedi pozitif ve n-r adedi sıfır olan bir alt üçgen matris olmak üzere,
A=LTL
şeklinde ayrıştırılabilir, (Cholesky ayrışımı).
İspat: Teorem 3.77 de verilen A=QU eşitliği n×n boyutlu bir A matrisi için n×n boyutlu ortogonal
bir P matrisi ve n×n boyutlu pozitif köşegen elemanlı bir L alt üçgen matrisin var olduğunu belirtir.
Bu durumda A=LP olup AAT=LPPTLT=LLT ispat tamamlanır.
Teorem 3.104 A matrisi simetrik ve pozitif tanımlı bir matris ise,
A=TTT
eşitliğini sağlayan tekil olmayan bir T matrisi mevcuttur.
İspat: A matrisinin özvektörlerinden oluşan P matrisi kullanılarak Teorem 3.78 ile PTAP=Λ ve
A=PΛPT elde edilebilir. A matrisi pozitif tanımlı ise tüm özdeğerleri pozitiftir. Bu nedenle bir
köşegen matris olan Λ matrisi
Λ=Λ1/2Λ1/2
(3.76a)
şeklinde yazılabilir. Burada Λ1/2 matrisi
65
Λ1 2
⎡ λ1
⎢
⎢ 0
=⎢
⎢
⎢ 0
⎣
0
λ2
0
0 ⎤
⎥
0 ⎥
⎥
⎥
λn ⎥⎦
(3.76b)
şeklindedir. Buna uygun olarak,
A=PΛ1/2Λ1/2PT=( PΛ1/2)( PΛ1/2)T
elde edilir. Sonuç olarak,
T= PΛ1/2
olduğu görülebilir. T matrisi tekil olmayan matrislerin çarpımı olduğundan tekil olmayan bir
matristir.
Teorem 3.105 A matrisi boyutu n×n ve pozitif yarı tanımlı bir matris ise B2=A eşitliğini sağlayan
bir B matrisi vardır. Bu matris A matrisinin karekökü olarak adlandırılır ve A1/2 ile gösterilir.
İspat: Teorem 3.78 ile PTAP=Λ ve eşitlik (3.76b) ile Λ1/2 tanımlanmıştır. Sonuç olarak B=PΛ1/2PT
bulunur. B matrisi B2=A eşitliğini sağlayan simetrik pozitif (yarı) tanımlı matristir.
Teorem 3.106 B2=A eşitliğini sağlayan pek çok B matrisi vardır. Fakat B=A1/2 eşitliğini sağlayan
sadece bir tek pozitif yarı tanımlı B matrisi vardır.
Teorem 3.107 A matrisi n×n boyutlu ve pozitif tanımlı ve P, n×m boyutlu rankı m olan bir matris
ise PTAP pozitif tanımlıdır.
Teorem 3.108 A matrisi n×m boyutlu rankı m olan bir matris ise ATA pozitif, AAT pozitif yarı
tanımlıdır.
Teorem 3.109 A matrisi n×m boyutlu rankı k (k ⟨ m, k ⟨ n) olan bir matris ise ATA ve AAT
çarpımlarının her ikisi de pozitif yarı tanımlıdır.
Teorem 3.110 A ve B pozitif tanımlı matrislerse A-B ve B-1-A-1 matrisleri de pozitif tanımlıdır.
Teorem 3.111 A1 ve A2 matrisleri simetrik, A2 pozitif tanımlı matris ve eğer A1-A2 matrisi pozitif
yarı tanımlı (veya pozitif tanımlı) ise A1 ≥ A 2 ’dir.
Teorem 3.112 Tam ranklı olmayan tüm idempotent matrisler pozitif yarı tanımlıdır.
Teorem 3.113 Simetrik boyutu n×n olan bir A matrisinin özdeğerleri λ1≥λ2≥…≥λn ise,
λn ≤
x T Ax
≤ λ1
xT x
eşitsizliği sağlanır.
İspat: Teorem 3.78 den PTAP=Λ olup, y=PTx doğrusal dönüşümü tanımlansın.
n
n
i =1
i =1
x T Ax = x T PΛΛT x = y T Λy = ∑ λi y i2 ≤ λ1 ∑ y i2 = λ1 y T y = λ1 x T PP T x = λ1 x T x
66
Diğer eşitsizlik benzer şekilde elde edilir. xTAx/xTx oranı Rayleigh böleni (quotient) olarak
adlandırılır.
3.7 BİR DİKDÖRTGEN MATRİSİN TEKİL DEĞER AYRIŞIMI
Kısım 3.5’de verilen özdeğer analizi bir kare matrise uygulanmaktaydı. Bu kısımda özdeğer
analizi, tekil değer ayrışımı adı verilen benzer bir ayrışımı geliştirmek için kullanılacaktır. Tekil
değer ayrışımı daha sonra anabileşen analizini vermekte kullanılır.
X boyutları n×p olan (n>p) olan bir matris ise XTX p×p boyutlu bir simetrik kare matristir. Bu
matrisin özdeğerleri λ ve özvektörlerin tanımladığı Z matrisi kullanılarak,
XTX =ZΛZT
(3.77)
ifadesi verilebilir. Burada Λ köşegen matris olup elemanları XTX matrisinin özdeğerleridir. Benzer
olarak XXT matrisi de simetrik bir kare matristir, fakat boyutu n×n’dir. XXT matrisinin rankı en çok
p olabileceği için sıfırdan farklı özdeğerlerinin sayısıda en çok p olabilecektir. Elde edilen bu
sıfırdan farklı özdeğerler XTX matrisinin özdeğerleri ile aynıdır. XXT matrisi n–p adet sıfıra eşit
özdeğere sahiptir. Bu n–p adet özdeğer ve onların özvektörleri aşağıda verildiği şekildedir. XXT
matrisi özvektörlerinin matrisi V ile belirtilmektedir. Bu matris XTX ile XXT matrisinin müşterek p
adet özdeğerine karşılık gelen özvektörlerden oluşmaktadır. Her bir özvektör vi n×1 boyutludur.
XXT matrisi için,
XXT =VΛVT
(3.78)
eşitliği verilebilir. Eşitlik (3.77) ve (3.78) birlikte ele alınarak dikdörtgen matris X,
X=VΛ1/2ZT
şeklinde yazılabilir. Burada Λ1/2 matrisi, eşitlik (3.76b) de tanımlanan, XTX matrisinin p adet
özdeğerinin pozitif kareköklerinin oluşturduğu köşegen matristir. Buna göre Λ1/2 Λ1/2= Λ’dır.
Eşitlik (3.78) dikdörtgen X matrisinin tekil değer ayrışımıdır. Λ1/2 matrisinin elemanları tekil
değerlerdir ve V ile Z’deki sütun vektörleri ise sol ve sağ tekil vektörlerdir. D1/2 bir köşegen matris
olduğundan,
p
X = ∑ λ1i 2 v i z Ti
i =1
şeklindedir.
Teorem 3.114 Boyutu m×n ve ρ(A)=r>0 olan bir matris A olsun.
A=SΛ1/2 TT
Eşitliğini sağlayan, boyutu m×r ve STS=Ir olan bir S matrisi, boyutu n×r ve TTT=Ir olan bir T
matrisi ve boyutu r×r olup köşegen elemanları pozitif olan bir Λ köşegen matrisi vardır.
Tekil değer ayrışımında S ve T matrislerinin elde edilebileceği pek çok yaklaşım vardır. Fakat S ve
T matrislerini eşsiz olarak elde etmenin doğru yöntemi, AATS=SΛ eşitliğinden S ve Λ matrislerini
67
belirleyip daha sonra T=ATSΛ-1/2 eşitliğinden T matrisini elde etmektir. Aletrnatif olarak,
AATT=TΛ eşitliğinden T ve Λ matrislerini belirleyip daha sonra S=ATΛ-1/2 eşitliğinden S matrisini
elde etmektir.
3.8 MATRİSLERDE TÜREV İŞLEMİ
Eğer f(b) fonksiyonu k adet farklı bi katsayısını içeriyorsa bu fonksiyonun her bir bi’ye göre kısmi
türevi alınabilir. Bu kısmi türevlerin bir sütun vektörü formundaki genel tanımı,
⎡ ∂ [ f (b)] ⎤
⎢
⎥
∂b1 ⎥
⎢
∂ [ f (b) ]
⎥
=⎢
⎢
⎥
∂b
⎢ ∂ [ f (b)] ⎥
⎢ ∂b ⎥
k
⎣
⎦
(3.79a)
şeklindedir. Bu kısmi türevler bir sıra vektörü şeklinde düzenlenebilir. Bu işlemde vektör ve
matrislerdeki toplama ve çarpma işlemleri için boyutların uyumlu olması sağlanmalıdır. f(b)’nin bir
doğrusal fonksiyon olduğu kabul edilerek,
f (b) = a T b
= a1b1 + a 2 b2 +
+ a k bk
yazılabilir. Bu eşitlikteki ai değerleri birer sabittir. Bu ifadeye eşitlik (3.79a)’nin uygulanması ile,
⎡ a1 ⎤
⎢ ⎥
∂ a T b ∂ b T a ⎢a 2 ⎥
=a
=
=
⎢ ⎥
∂b
∂b
⎢ ⎥
⎣a k ⎦
( )
( )
(3.79b)
sonucu elde edilebilir. Eğer f(b) fonksiyonu bi değerleri açısından karesel ise,
f (b) = b T A b
şeklinde ifade edilebilir. A ile belirtilen matrisin simetrik olduğu kabul edilerek,
⎡ a11
⎢a
A = ⎢ 12
⎢
⎢
⎣a1k
a12
a 22
a2k
a1k ⎤
a 2 k ⎥⎥
⎥
⎥
a kk ⎦
yazılabilir. Bunun sonucu olarak,
b T A b = a11b12 + 2a12 b1b2 + 2a13 b1b3 +
+ a 22 b22 + 2a 23b2 b3 +
+ 2a1k b1bk
+ 2a 2 k b2 bk
68
+ a kk bk2
olarak elde edilir. Bu ifadenin kısmi türevleri,
∂ (b T A b)
= 2 (a11b1 + a12 b2 +
∂b1
+ a1k bk ) = 2a1b1
...................................................................................
∂ (b T A b)
= 2 (a1k b1 + a 2 k b2 +
∂bk
+ a kk bk ) = 2a k b
şeklinde bulunur. Eşitliğin en sağındaki ai değerleri A matrisinin sıralarını ifade etmektedir. Bu
kısmi türevler bir sütun vektörü olarak,
⎡ a 1b ⎤
⎡ a1 ⎤
⎢a b ⎥
⎢a ⎥
∂ (b A b)
2 ⎥
2
=2⎢
= 2 ⎢ ⎥ b = 2Ab
⎢
⎥
⎢ ⎥
∂b
⎢
⎥
⎢ ⎥
⎣a k b ⎦
⎣a k ⎦
T
(3.80)
elde edilebilir. Eşitlik (3.79b) ve (3.80) doğrusal ve karesel formların standart diferansiyel
sonuçlarını verir.
3.9 MAKSİMUM – MİNİMUM DEĞERLER ve JAKOBYEN
Maksimum ve minimum değerler için bazı önemli sonuçları matris notasyonunda vermek yararlı
olacaktır. Bir skaler y değişkeni, n bağımsız değişkenin fonksiyonu olarak,
y = f ( x1 , x2 , ,xn ) = f ( x )
tanımlanabilir. Bu fonksiyonun toplam diferansiyeli,
dy = f1dx1 + f 2 dx2 +
+ f n dxn
(3.81)
olarak verilir. Burada
fi =
∂y
∂xi
i = 1,..., n
şeklindedir. dxi, xi’deki herhangi bir değişikliği belirtir. Küçük bir dxi için birinci dereceden
diferansiyel y değişkeninde oluşan değişimin yaklaşık bir değerini verir. Kısmi türev vektörü f ve
diferansiyel vektörü dx,
⎡ f1 ⎤
⎢ ⎥
∂y ⎢ f 2 ⎥
=
f=
∂x ⎢ ⎥
⎢ ⎥
⎣ fn ⎦
⎡ dx1 ⎤
⎢ dx ⎥
dx = ⎢ 2 ⎥
⎢ ⎥
⎢ ⎥
⎣ dxn ⎦
ile belirtilerek y’nin birinci dereceden diferansiyeli
dy = f T dx
69
ifadesi ile verilebilir. Eğer y değişkeni,
x∗ = ⎡⎣ x1∗
xn∗ ⎤⎦
x2∗
noktasında durağan bir değere sahipse x*’ın yakınındaki tüm noktalar için dy=0 olacaktır. Bu
noktalarda dx≠0 olacağı için eşitlik (3.81) dikkate alındığında bir durağan değer için gerekli şartın,
f=0 olduğu görülmektedir. Başka bir deyişle durağan noktada tüm kısmi türevler sıfırdır.
Bir durağan nokta bir maksimum nokta olabilir. Bu durumda x* çevresindeki tüm noktalarda
fonksiyonun değeri azalır. İkinci bir durum ise durağan noktanın bir minimum noktası olmasıdır ki
bu durumda x* çevresindeki tüm noktalarda fonksiyonun değeri artar. Sonlanarak bir eğer noktası
olabilir. Bu durumda x*’dan uzaklaşılan bazı yönlerde fonksiyon azalır diğer yönlerde ise artar.
Ortaya çıkabilecek bu muhtemel durumlar arasındaki farkı ayırt edebilmek için ikinci dereceden
diferansiyel d2y kullanılır. İkinci dereceden diferansiyel ile toplam diferansiyelin birinci dereceden
diferansiyeli bulunabilir. Bu ifade de x* noktasından uzaklaşmanın dy değerinde oluşturduğu
değişim için yaklaşım elde edilmesini sağlar. Bir maksimum değer için dy sıfırdan bir negatif
değere doğru azalacaktır, bu nedenle d2y negatif bir değer alabilecektir. Buna uygun olarak bir
minimum değer için d2y pozitif değer alabilir. Eğer
noktası için d2y bazı dx değerleri için pozitif
diğerleri için negatif değer alır. Eşitlik (3.81) toplam diferansiyeli,
d2 y =
∂
[ f1dx1 + f 2 dx 2 +
∂x1
+
+
+ f n dx n ]dx1
∂
[ f1dx1 + f 2 dx 2 +
∂x 2
+
+ f n dx n ]dx 2
∂
[ f1dx1 + f 2 dx 2 +
∂x n
+ f n dx n ]dx n
= f 11dx12 + 2 f 12 dx1dx 2 + 2 f 13 dx1dx3 +
+ 2 f 1n dx1dx n
+ f 22 dx 22 + 2 f 23 dx 2 dx 3 +
+ 2 f 2 n dx 2 dx n
(3.82)
+ f nn dx n2
şeklinde elde edilir. Burada,
fij = f ji =
∂2 y
∂xi ∂x j
ifadesi ile verilir. dxi2 ise dxi diferansiyelinin karesidir. Eşitlik (3.82)’den görülebileceği gibi ikinci
dereceden diferansiyel dx’in karesel bir formu olarak yazılabilir. Karesel form matrisi ikinci
dereceden kısmi türevlerin simetrik Hessien matrisidir.
70
⎡ f11
⎢f
∂ y
F = 2 = ⎢ 21
⎢
∂x
⎢
⎣ f n1
2
f12
f 22
fn2
f1n ⎤
f 2 n ⎥⎥
⎥
⎥
f nn ⎦
sonuç olarak,
d 2 y = dxT Fdx
(3.83)
eşitliği yazılabilir. Bu ifadeye uygun olarak F pozitif tanımlı ise d2y pozitif, negatif tanımlı ise
negatiftir. Bir x* noktasında maksimum veya minimum mevcut olması için şartlar aşağıda
özetlenmiştir.
Birinci derece şartı
İkinci derece şartı
Maksimum
f=
∂y
=0
∂x
F=
∂2 y
∂x 2
negatif tanımlı
Minimum
f=
∂y
=0
∂x
F=
∂2 y
∂x 2
pozitif tanımlı
Kısıtlı Maksimum veya Minimum; y=f(x1, … ,xn) fonksiyonun durağan değerleri araştırılırken
x’lerin bağımsız değişkenler olduğu varsayılmıştı. Bu nedenle n adet keyfi diferansiyel dx1, dx2 ,....,
dxn belirlenebilmekteydi. Bununla birlikte bazı problemlerde x’ler bir veya daha kısıta sahip
olabilirler ve bu durumda y’nin bir maksimum veya minimumu bu kısıtlar dikkate alınarak
bulunmak zorundadır. Fonksiyonun bir tek maksimum veya minimuma sahip olduğu varsayımı ile
problem aşağıdaki şekilde ifade edilebilir:
Verilen m adet (m<n) kısıt altında y’yi maksimum (minimum) yapan x* vektörünü bulun.
y j ( x) = 0
j = 1,
,m
Kısıt sütun vektörü,
⎡ y1 (x ) ⎤
⎢ y (x )⎥
2
⎥
y ( x) = ⎢
⎢
⎥
⎢
⎥
⎣ y m (x )⎦
ve Lagrange çarpanları sütun vektörü,
⎡ λ1 ⎤
⎢λ ⎥
λ=⎢ 2⎥
⎢ ⎥
⎢ ⎥
⎣λ m ⎦
Bu veriler kullanılarak yeni bir amaç fonksiyonu,
ψ = f (x ) − λ T y (x )
(3.84)
71
tanımlanır. ψ değeri λ ve x’lerden oluşan m×n adet değişkenin oluşturduğu bir skalerdir. ψ’nin
durağan bir değeri için birinci derece koşulu tüm m×n adet birinci dereceden kısmi türevin,
⎡ ∂ψ
⎢ ∂x
⎢ ∂ψ
⎢
⎣ ∂λ
(
⎤
T
⎥ ⎡ ∂f − ∂ λ (x)
⎥ = ⎢ ∂x
∂x
⎥ ⎢⎣
y (x )
⎦
)⎤
⎥=0
⎥
⎦
(3.85)
sıfır olmasıdır.
λ T y (x ) = λ1 y1 (x 1 , x 2 ,
, x n ) + λ 2 y 2 (x 1 , x 2 ,
,xn )+
+ λ m y m (x 1 , x 2 ,
,xn )
olup kısmi türevleri,
(
)
∂y
∂y 2
∂ λ T y ( x)
= λ1 1 + λ 2
+
∂x 1
∂x 1
∂x 1
+ λm
∂y m
∂y
= λ′
∂x 1
∂x 1
.............................................................................................
(
)
∂y
∂y 2
∂ λ T y ( x)
= λ1 1 + λ 2
+
∂x n
∂x n
∂x n
+ λm
∂y m
∂y
= λ′
∂x n
∂x n
şeklindedir. Bu ifadede,
⎡ ∂y1 ⎤
⎢ ∂x ⎥
⎢ i ⎥
∂y
∂y ⎢ 2 ⎥
= ⎢ ∂x ⎥
∂x i ⎢ i ⎥
⎢ ∂y ⎥
⎢ m⎥
⎢⎣ ∂x i ⎥⎦
i = 1,2,
,n
(
)
olarak verilmiştir. ∂f ∂x , n×1 boyutlu bir vektör olduğu için, (∂ ∂x ) λ T y (x) değerinin de n sıralı
olacak şekilde düzenlenmesi gereklidir. Kısmi türevler n×m boyutlu G matrisi ile,
⎡ ∂y1
⎢ ∂x
⎢ 1
⎢ ∂y1
G = ⎢ ∂x 2
⎢
⎢
⎢ ∂y1
⎢⎣ ∂x n
∂y 2
∂x1
∂y 2
∂x 2
∂y 2
∂x n
∂y m ⎤
∂x1 ⎥
⎥
∂y m ⎥
⎡ ∂y
∂x 2 ⎥ = ⎢
⎥ ⎣ ∂x1
⎥
∂y m ⎥
∂x n ⎥⎦
∂y
∂x 2
∂y ⎤
⎥
∂x n ⎦
belirtilebilir. Bu durumda
∂ψ ∂f
=
− Gλ
∂x ∂x
yazılabilir ve durağan bir nokta için birinci derece koşul,
∂f
− Gλ = 0
∂x
y(x) = 0
(3.86)
72
şeklindedir. Eşitlik (3.86)’deki ikinci denklem durağan noktanın kısıtları sağlamasını garanti eder.
Maksimum ve minimumu ayırt edebilmek için eşitlik (3.83)’deki karesel formun pozitif mi yoksa
negatif mi tanımlı olduğunun araştırılması gereklidir. Fakat bu çalışma sadece kısıtları ihlal
etmeyen dx vektörleri için yapılır. j-inci kısıtın,
y j (x1 , x 2 ,
, xn ) = 0
toplam diferansiyeli,
0 = dy j =
∂y j
∂x1
dx1 +
∂y j
∂x 2
dx 2 +
+
∂y j
∂x n
dx n
olarak verilebilir. Her bir kısıt için benzer bir şart mevcuttur. Bu eşitliği sağlayan dx vektörleri
kısıtları ihlal etmez ve bu vektörler,
GTdx=0
(3.87)
eşitliği ile elde edilebilir. Pek çok durumda F matrisi sabitlerden oluşur, bu matrisin tanımsızlığı
herhangi x değerlerinin bağımsızlığı ile oluşturulabilir.
3.10 ORTOGONAL DÖNÜŞÜMLER VE İZDÜŞÜMLER
Her ikisi de n boyutlu olan x vektörünün y vektörüne doğrusal dönüşümü (transformasyonu),
y=Ax
(3.88a)
şeklinde yazılabilir. Burada A, n×n boyutlu dönüşüm katsayılar matrisidir. Eğer A matrisi tekil
değilse dönüşüm birebirdir. Bu durumda y vektörünün x üzerine ters dönüşümü,
x=A-1y
(3.88b)
şeklindedir. Eğer AAT=I ise bu doğrusal dönüşüm ortogonal dönüşümdür. Buna uygun olarak A
matrisinin sıraları ortogonaldir ve uzunlukları bir birimdir. Ortogonal dönüşümler vektörler
arasındaki uzaklık ve açıları değiştirmez. Başka bir deyişle vektörler arasındaki uzaysal ilişkiler
ortogonal dönüşüm ile değişmez.
Teorem 3.115 Eğer P matrisi ortogonal ise x vektörünün Px olarak tanımlanan doğrusal dönüşümü
x vektörünün uzunluğunu değiştirmez.
İspat: Eğer P ortogonal ise PTP=I olduğundan,
Px = x T P T Px = x T x = x
elde edilerek ispat tamamlanır.
Bu ifadenin tersi geçerli değildir. Başka bir deyişle sıfırdan farklı bir x vektörünün uzunluğunu
(
)
değiştirmeyen her dönüşüm matrisi ortogonal değildir. Örneğin, Q = 1 x T x xxT
şeklinde
tanımlanan bir idempotent matris için Qx=x doğrusal dönüşümünde xTQTQx=xTx olup Qx = x
eşitliği sağlanır fakat Q matrisi ortogonal değildir.
73
Teorem 3.116 Eğer x vektöründen y vektörüne dönüşüm y=Ax şeklinde tanımlanmış ise ve A tekil
olmayan bir matris ise dönüşümün Jacobianı J = A −1 olarak tanımlanır.
Jacobian, elemanları dyi dx j = aij ile tanımlanan A matrisinin tersinin determinantıdır. Eğer A
matrisi ortogonal ise J = A −1 = AT = ±1 olup J = 1 sonucu elde edilir.
Örnek 3.14 y 1T = (3 10 20 ) ve y T2 = (6 14 21) vektörleri ile katsayı matrisi,
⎡1 1 1⎤
A = ⎢⎢− 1 0 1 ⎥⎥
⎢⎣− 1 2 − 1⎥⎦
olarak verilmiş olsun doğrusal dönüşümleri elde ediniz.
⎡1 1 1⎤
Çözüm: x1= Ay1= ⎢⎢− 1 0 1 ⎥⎥
⎢⎣− 1 2 − 1⎥⎦
⎛ 3 ⎞ ⎛ 33 ⎞
⎜ ⎟ ⎜ ⎟
⎜ 10 ⎟ = ⎜ 17 ⎟
⎜ 20 ⎟ ⎜ − 3 ⎟
⎝ ⎠ ⎝ ⎠
ve
⎡1 1 1⎤
⎢
⎥
x2= Ay2= − 1 0 1
⎢
⎥
⎢⎣− 1 2 − 1⎥⎦
⎛ 6 ⎞ ⎛ 41⎞
⎜ ⎟ ⎜ ⎟
⎜14 ⎟ = ⎜ 15 ⎟
⎜ 21⎟ ⎜ 1 ⎟
⎝ ⎠ ⎝ ⎠
olarak y1’in x1’e ve y2’nin x2’ye doğrusal dönüşümü elde edilir. Bunlar ortogonal dönüşümler
değildir. Çünkü
⎡3 0 0⎤
AA = ⎢⎢0 2 0⎥⎥ ≠ I
⎢⎣0 0 6⎥⎦
T
çarpımı birim matrisi vermemektedir. A matrisinin sıraları ayrık ortogonaldir, köşegen dışı
elemanlar sıfırdır, fakat uzunlukları bir birim değildir. Bu dönüşüm her bir sıra kendi uzunluğuna
bölünerek ortogonal hale dönüştürülebilir. Bu işlem ile sıraların uzunluğu bir birim olacak şekilde
ölçeklenmiş olur. Elde edilen A* matrisi ve ortogonal dönüşüm,
⎡1 3
⎢
x1* = A * y 1 = ⎢− 1 2
⎢− 1 6
⎣
1
3
0
2
6
⎛ 33 3 ⎞
3 ⎤
⎟
⎜
⎥
1 2 ⎥ y 1 = ⎜ 17 2 ⎟
⎟
⎜⎜
−3 6⎟
−1 6⎥
⎠
⎦
⎝
1
ve
x *2
⎛ 41 3 ⎞
⎜
⎟
= A y 2 = ⎜15 2 ⎟
⎜⎜
⎟
1 6 ⎟
⎝
⎠
*
olarak bulunur. İki vektör (u ve v) arasındaki uzaklığın karesi, (u-v)T(u-v) şeklindedir. Bu ifadeden
74
faydalanarak orijinal y vektörleri arasındaki ile ortogonal transformasyon sonucu elde edilen x
vektörleri arasındaki uzaklığın değişmediği ispatlanabilir:
(y 1 − y 2 )T (y 1 − y 2 ) = (x1∗ − x ∗2 ) (x1∗ − x ∗2 ) = 26
′
Bir alt uzay içine bir vektörün izdüşümü dönüşümlerin özel bir durumudur. İzdüşüm EKK’da
anahtar bir adımdır, bkz.Bölüm 4.
75
Download