Vektör Uzayları, İç Çarpım Uzayları ve Dik İzdüşüm Matrislerin

advertisement
1. Ders
Vektör Uzayları, Đç Çarpım Uzayları ve Dik Đzdüşüm
Matrislerin Genelleştirilmiş Đnversleri
Vektör Uzayları
Vektör uzayları ile ilgili bazı temel kavram ve özellikler hatırlatalım. Reel
sayılar cismi ( R, +,.) ‘yi kısaca R ile göstereceğiz
Tanım V boş olmayan bir küme ve ⊕ ile • işlemleri,
⊕ : V ×V → V
,
• : R ×V → V
biçiminde olmak üzere;
i) (V , ⊕ ) bir Abel grubu,
ii) ∀v , u ∈ V ve a , b ∈ R için
a) ( a .b ) • v = a • ( b • v )
b) ( a + b) • v = ( a • v ) ⊕ (b • v )
c) a • (v ⊕ u) = (a • v ) ⊕ ( a • u)
d ) 1• v = v
özellikleri sağlandığında (V , R , ⊕ , • ) dörtlüsüne (⊕ vektör toplama ve
• skaler ile
çarpma işlemleri altında V kümesine) R cismi üzerinde bir vektör uzayı denir. V
‘nin elemanlarına da vektör denir.
Örnek Rn reel sayıların sıralı n-lilerinin kümesi,
⊕: Rn × Rn → Rn
( a1 , a2 ,..., an ) ⊕ ( b1 , b2 ,..., bn ) = (( a1 + b1 , a2 + b2 ,..., an + bn )
vektörleri toplama ve
• : R × R n → Rn
c • ( a1 , a2 ,..., an ) = ( ca1 , ca2 ,..., can )
skalar ile çarpma işlemleri altında R cismi üzerinde bir vektör uzayıdır.
( Rn , R , ⊕ , • ) vektör uzayını R1×n ile gösterelim. Bu uzayın elemanlarına n-bileşenli
satır vektörleri denir.
Rn×1 kümesi,
 a1 

 


n×1  a2 
R =
: a1, a2 ,..., an ∈ R 
 ⋮ 

 an 



olmak üzere,
⊕ : Rn×1 × Rn×1 → Rn ×1
 a1   b1   a1 + b1 
    

 a2  ⊕  b2  =  a2 + b2 
 ⋮   ⋮   ⋮ 
    

 an   bn   an + bn 
ve
• : R × Rn×1 → Rn×1
 a1   ca1 
  

a2   ca2 

c •
=
 ⋮   ⋮ 
  

 an   can 
olsun. Rn×1 kümesi bu iki işlem ile birlikte R üzerinde bir vektör uzayıdır. Bu
uzayın elemanlarına n-bileşenli sütun vektörleri denir. Rn×1 in elemanlarını, altına
bir cizgi atılmış küçük veya büyük harflerle göstereceğiz.
 a1 
 X1k 
 


a2 
X 2k 


a=
, Xk =
 ⋮ 
 ⋮ 
 


 an 
 X nk 
R1×n nin elemanlarını
a ' = ( a1 , a 2 ,..., a n )
X 'k = ( X k 1 , X k 2 ,..., X kn )
biçiminde göstereceğiz.
R1×n ile Rn×1 uzayları farklı iki vektör uzayıdır. R n , R1×n veya Rn×1
sözkonusu olduğunda hangisinden bahsedildiği açık olarak anlaşılıyorsa üçü de
R n ile gösterilecektir. Özel olarak R n standart vektör uzayı dendiğinde, Rn×1
sözkonusu olacağını belirtelim.
Rn×m kümesi n × m boyutlu reel elemanlı matrislerin kümesi olmak üzere
matris toplamı ve matrislerin skalar ile çarpımı işlemleri altında Rn×m , R
üzerinde bir vektör uzayıdır.
Bundan sonra, u , v ∈ V ve a , b ∈R için ( a • u ) ⊕ ( b • v ) yerine kısaca au + bv
yazılacaktır.
Đç Çarpım Uzayları
Önce Normlu Vektör Uzayı kavramını hatırlatalım. Norm, bir vektör uzayındaki
vektörlere pozitif bir reel sayı karşılık getiren bir fonksiyondur. Bir vektörün
normu, geometrik olarak, vektörün uzunluğu olarak yorumlanmaktadır.
Tanım V bir vektör uzayı olmak üzere ,
. :V→R
v→ v
fonksiyonu:
i ) ∀v ∈V için v ≥ 0
v =0⇔v=0
ii )
iii ) ∀a ∈ R ve ∀v ∈V için
av = a . v
iv ) ∀u , v ∈V için
u+v ≤ u + v
özelliklerini sağladığında, . fonksiyonuna norm , v sayısına v vektörünün
normu, (V , . ) ikilisine de normlu vektör uzayı denir.
Örnek R de,
x→ x = x =
RS x , x ≥ 0
T− x , x < 0
ve Rn standart vektör uzayında,
aε Rn için :
1)
m
a = max a1 , a2 ,..., an
n
r
p
2)
a = ( ∑ ai )1/ p
3)
a = ( ∑ ai2 )1/ 2
, p ≥ 1 ( l p normu)
i =1
n
i =1
,
( Euclide normu)
olarak tanımlı . fonksiyonları birer normdur.
Örnek Rn×m vektör uzayında A = ( aij ) ∈ Rn × m için,
n
a)
A 1 = max( ∑ aij )
j
i =1
n
b)
A ∞ = max( ∑ aij )
i
j =1
c)
A 2 = ( A′ A nýn en büyük özdeðeri)1/ 2
d)
A E = ( ∑ ∑ aij2 )1/ 2
n
n
i =1 j = 1
n
A = ∑ ∑ aij
i =1 j =1
n
e)
{
}
f ) A = max aij : i = 1, 2 ,..., n , j = 1, 2 ,..., m
olarak tanımlı fonksiyonlar birer normdur.
Tanım V bir vektör uzayı olmak üzere,
< .,. > : V × V → R
(u, v) →< u , v >
fonksiyonu :
i ) < u , v >=< v , u >
ii ) a , b ∈ R için,
< au + bv , z >= a < u , z > + b < v , z >
iii ) v ≠ 0 için < v, v > > 0 , v = 0 için < v, v >= 0
özelliklerini sağladığında, < u, v > sayısına u ile v ‘nin iç çarpımı ve (V , <.,. > )
ikilisine de iç çarpım uzayı denir.
Örnek Rn standart vektör uzayında a , b ∈ R n için ,
n
< a , b >= ∑ aibi
i =1
olarak tanımlı <.,. > fonksiyonu bir iç çarpımdır. Bu iç çarpıma Euclide iç
çarpımı denir. Bu iç çarpım ile birlikte Rn standart vektör uzayına Euclide uzayı
denir. Bu iç çarpıma vektörlerin skalar çarpımı da denir ve
n
< a ' b >= ∑ aibi
i =1
gösterimi kullanılmaktadır.
Rn×m de A , B ∈ Rn × m için
n
m
< A , B >= ∑ ∑ aijbij
i = 1 j =1
olarak tanımlı <.,. > fonksiyonu bir iç çarpımdır.
Teorem (V , <.,. > ) bir iç çarpım uzayı olmak üzere,
( < u , v > )2 ≤< u , u >< v , v >
dır. (Cauchy-Schwarz Eşitsizliği)
Teorem (V , <.,. > ) bir iç çarpım uzayı olmak üzere <.,. > iç çarpım yardımıyla
tanımlı,
. < , > :V → R
1
u → u < ,> = ( < u, u > ) 2
fonksiyonu V de bir normdur.
Bir iç çarpım uzayında ayrıca bir norm verilmemişse norm olarak bu iç çarpıma
dayalı . < , > normu sözkonusu olacaktır ve gösterim olarak sadece . yazılacaktır.
Tanım M boş olmayan bir küme olmak üzere,
d: M × M → R
fonksiyonu,
i) d ( x, y) ≥ 0
ii ) d ( x , y ) = 0 ⇔ x = y
iii ) d ( x , y ) = d ( y , x )
iv ) d ( x , z ) ≤ d ( x , y ) + d ( y , z )
özelliklerini sağladığında, d fonksiyonuna M kümesinde metrik, ( Μ , d ) ikilisine
metrik uzay ve d ( x , y ) sayısına x ile y elemanları arasındaki uzaklık denir.
Örnek R reel sayılar kümesinde,
d ( x, y) = x − y
olarak tanımlı d fonksiyonu bir metriktir.
Örnek (V , . ) bir normlu vektör uzayı olmak üzere,
d (u, v ) = u − v
olarak tanımlı d fonksiyonu V de bir metriktir.
Örnek R3×1 Euclide uzayında a , b ∈ R3×1vektörleri için,
3
d ( a , b) = b − a = ( ∑ (bi − ai )2 )1 2
i =1
olmak üzere, d ( a , b) sayısı, a ile b vektörleri arasındaki uzaklık yerine a ile b
vektörlerine karşılık gelen A ile B noktaları arasındaki uzaklık olarak
yorumlanmaktadır.
(V , < .,. > ) bir iç çarpım uzayı olmak üzere,
< u, v >
cos( u , v ) =
u v
sayısına u ile v vektörleri arasındaki "açının kosinüsü" denir ve trigonometrideki
kosinüs gibi yorumlanır. Normları sıfırdan farklı iki u ile v vektörleri için
< u , v >= 0 ise bu vektörlere dik (ortogonal) vektörler denir ve u⊥ v biçiminde
gösterilir. V ‘nin V1,V2 altkümelerinde ∀x ∈ V1 ve ∀y ∈ V2 vektörleri için x ⊥y ise V1
kümesine V2 ye diktir denir ve V1 ⊥ V2 biçiminde gösterilir.
Örnek Rn Euclide uzayında a , bε Rn için,
< a , b >= ∑ aibi = a ′ b
n
i =1
olmak üzere , bu uzayda iç çarpıma dayalı norm,
1
1
1
a = ( < a , a > ) 2 = ( ∑ ai2 ) 2 = ( a ′ a ) 2
n
i =1
ve a , b vektörleri arasındaki açının kosinüsü,
n
cos( a , b) =
∑ aibi
i =1
n
1
( ∑ ai2 ∑ bi2 ) 2
i =1 i =1
n
dır.
Tanım M boş olmayan bir küme olmak üzere,
d: M × M → R
fonksiyonu,
i) d ( x, y) ≥ 0
ii ) d ( x , y ) = 0 ⇔ x = y
iii ) d ( x , y ) = d ( y , x )
iv ) d ( x , z ) ≤ d ( x , y ) + d ( y , z )
özelliklerini sağladığında, d fonksiyonuna M kümesinde metrik, ( Μ , d ) ikilisine
metrik uzay ve d ( x , y ) sayısına x ile y elemanları arasındaki uzaklık denir.
Örnek R reel sayılar kümesinde,
d ( x, y) = x − y
olarak tanımlı d fonksiyonu bir metriktir.
Örnek (V , . ) bir normlu vektör uzayı olmak üzere,
d (u, v ) = u − v
olarak tanımlı d fonksiyonu V de bir metriktir.
Tanım V bir vektör uzayı ve U ⊂ V olmak üzere, her x , y ∈ R için ax + by ∈ U
oluyorsa U ye V nin alt vektör uzayı denir.
V bir vektör uzayı ve v1 , v2 ,..., vm ∈V olmak üzere bu vektörlerin lineer bileşimi
olarak yazılabilen vektörlerin kümesi,
m


span {v1 , v2 ,..., vm } = [v1 v2 ...vm ] = v ∈ V : v = ∑ ai vi , ai ∈ R, i = 1, 2,..., m 
i =1


bir alt vektör uzayıdır. Bu alt vektör uzayına v1 , v2 ,... vm vektörlerinin gerdiği uzay
denir.
k
Tanım V bir vektör uzayı ve v1 , v2 ,..., vk ∈V olmak üzere ∑ aivi = 0 olacak şekilde
i =1
tümü sıfır olmayan a1 , a2 ,..., ak ∈ R sayıları varsa v1 , v2 ,..., vk vektörlerine lineer
bağımlı vektörler, aksi halde, yani
k
∑ ai vi = 0
i =1
⇒
ai = 0 , i = 1, 2 ,..., k
oluyorsa v1 , v2 ,..., vk vektörlerine lineer bağımsız vektörler denir.
Tanım V bir vektör uzayı, U kümesi (U ⊂ V ) lineer bağımsız vektörlerin bir
kümesi olmak üzere V nin herbir elemanı U deki vektörlerin lineer bileşimi
olarak yazılabiliyorsa U ye V nin bir bazı denir. V bir iç çarpım uzayı ve S deki
vektörler birbirine dik olduğunda U ye ortogonal baz denir. Bir ortogonal
bazdaki vektörler birim normlu ise bu baza ortonormal baz denir.
V nin bütün bazları aynı sayıda elemana sahiptir. Bazın eleman sayısına V
nin boyutu denir ve dim(V ) veya boy (V ) biçiminde gösterilir.
V bir vektör uzayı ve {v1, v2 ,..., vk } bir baz olmak üzere bir v ∈V elemanı bir
tek biçimde,
n
v = ∑ ai vi
i =1
olarak yazılır. ai ∈ R , i = 1, 2 ,..., n sayılarına v vektörünün bu baza göre bileşenleri
denir. V iç çarpım uzayı ve {v1, v2 ,..., vk } ortogonal bir baz ise,
< v , vi >
vi
i =1 < vi , vi >
n
v= ∑
dır.
M ve N , V vektör uzayının iki alt uzayı olsun.
M ⊕ N = x: x = y + z , y ∈ M , z ∈ N
l
q
olarak tanımlanan M ⊕ N kümesi de V ‘nin bir alt uzayıdır. M ⊕ N ye M ile N
nin toplamı diyeceğiz. M ile N ‘nin boyutlarına bağlı olarak,
boy ( M ⊕ N ) = boy ( M ) + boy ( N ) − boy ( M ∩ N )
dır.
V vektör uzayının M , N alt uzayları için M ∩ N = ∅ ve M ⊕ N = V ise M
ile N ye tümleyen alt uzaylar denir. Ayrıca V bir iç çarpım uzayı ve M ile N dik
alt uzaylar, yani M ⊥ N ise M ile N ye dik tümleyen alt uzaylar denir ve M = N ⊥ ,
N = M ⊥ biçiminde gösterilir. Bu durumda V = M ⊕ M ⊥ yazılır.
V vektör uzayının tümleyen iki alt uzayı M ve N olmak üzere her v ∈V
vektörü bir tek biçimde,
v = u + e , u ∈ M ,e ∈ N
olarak yazılır. u vektörüne v vektörünün N alt uzayı boyunca M üzerine
izdüşümü, e vektörüne ise v vektörünün M alt uzayı boyunca N üzerine
izdüşümü denir.
V bir iç çarpım uzayı olduğunda, bir M alt uzayı ile ilgili olarak,
V = M ⊕ M⊥
ve v ∈V için,
v = vˆ + eˆ , vˆ ∈ M , eˆ ∈ M ⊥
olmak üzere, v̂ ya v vektörünün M üzerine dik izdüşümü, ê ya da v
vektörünün M ⊥ üzerine dik izdüşümü denir.
v = vˆ + eˆ
2
2
2
vˆ = v .cos(v, x)
1
< v, x >
x=
x
x
< x, x >
< v, x >
eˆ = v −
x
< x, x >
vˆ = vˆ .
Örnek (V , < , > ) iç çarpım uzayında M ⊂ V alt uzayının bir ortogonal bazı
v1 , v2 ,..., vk ise bir v ∈V vektörünün M üzerine dik izdüşümü olan vektör,
k
vˆ = ∑
i =1
< v, vi >
vi
< vi , vi >
dır.
(V , < , > ) bir iç çarpım uzayı ve x1 , x2 ,..., xn vektörleri V nin bir bazı
olduğunda bu baz yardımıyla V nin bir ortogonal bazı, Gram-Schmidt yöntemi
ile aşağıdaki gibi elde edilmektedir.
1. v1 =
1
x1
x1
2. k = 1, 2 ,..., n − 1 için,


k

vk +1 =
x − < xk +1 , v j > v j 

  k +1 ∑
k

j=1

 
x
−
<
x
,
v
>
v
 k +1 ∑
k +1 j
j
j=1


1
Böyle elde edilen v1 , v2 ,..., vn vektörleri V nin bir ortonormal bazıdır.
Tanım V , W vektör uzayları olmak üzere,
A : V →W
v → A( v )
fonksiyonu her u , v ∈V ve a , b ∈ R için ,
A ( av + bu ) = aA( v ) + bA ( u )
özelliğine sahipse, A fonksiyonuna V den W ye bir lineer dönüşüm,
l w : w ∈W , ∃v ∈V için w = A( v )q
R ( A) =
kümesine A lineer dönüşümünün değer kümesi ve
N ( A) =
l v : v ∈V , A( v ) = 0 q
kümesine A lineer dönüşümünün çekirdeği denir.
Bir A : V → W lineer dönüşümünün değer kümesi R ( A ) ⊂ W , W da bir alt
vektör uzayı ve çekirdeği N ( A ) ⊂ V , V de bir alt vektör uzayıdır. R ( A ) uzayının
boyutuna A dönüşümünün rankı denir ve r ( A ) ile gösterilir.
boy (V ) = boy ( N ( A )) + boy ( R ( A ))
V
A
W
R(A)
0
N(A)
vektör uzayının bir bazı v1 , v2 ,..., vm olsun. Bir A : V → W lineer
dönüşümünün bilinmesi demek v1 , v2 ,..., v m baz vektörlerinin dönüşümleri olan
A ( v1 ), A ( v2 ),..., A ( vm ) ∈W vektörlerinin bilinmesi demektedir. Bu durumda bir
v ∈V için,
V
m
r
m
v = ∑ ci vi
i =1
olmak üzere,
m
A ( v ) = ∑ ci A ( vi )
i =1
dır.
V vektör uzayının bir bazı v 2 ,..., v m ve W vektör uzayının bir bazı
w1 , w2 ,..., wn olmak üzere A , V den W ya bir lineer dönüşüm olsun. j = 1, 2 ,..., m
A ( v j ) ∈W dönüşümü W ‘deki baz vektörlerinin lineer
için v j baz vektörünün
bileşimi olarak,
A ( v j ) = a1 j w1 + a2 j w2 + ... + anj wn
biçiminde yazılsın. A lineer dönüşümünün bilinmesi demek A ( v j ) ( j = 1, 2 ,..., m)
vektörlerinin bilinmesi, yani a1 j , a2 j ,..., anj ( j = 1, 2 ,..., m) katsayılarının bilinmesi
demektir. Bu katsayılar ile oluşturulan,
An×m
 a11
a
=  21
 ⋮

 an1
a12 ⋯ a1m 
a22 … a2 m 
⋮
⋮ 

an 2 ⋯ anm 
matrisine A lineer dönüşümüne karşılık gelen matris denir.
Tersine, bir An × m matrisi ve V nin bir v1 , v2 ,..., v m bazı ile W nun bir
w1 , w2 ,..., wn bazı ile başlayıp j = 1, 2 ,..., m için,
m
m
r
r
A ( v j ) = a1 j w1 + a2 j w2 + ... + anj wn
olarak tanımlanırsa, A bir lineer dönüşümdür.
V ‘nin {v1 , v 2 ,..., v m } , W ‘nun {w1 , w2 ,..., wn } bazları için A lineer dönüşüme
karşılık gelen matris An × m = ( aij )n × m olsun. Bir v ∈V vektörü için,
m
v = ∑ ci vi
i =1
olmak üzere,
m
A( v ) = ∑ c j A( v j )
j =1
m
n
= ∑ c j ∑ aij wi
j =1 i =1
n
m
= ∑ ( ∑ aijc j ) wi
i =1 j =1
n
m
= ∑ ( ∑ aijc j ) wi
i =1 j =1
m
r
dır. v nin lineer dönüşümü olan A ( v ) vektörünün W da w1 , w2 ,..., wn bazına
göre bileşenleri A n × m matrisi ile v sütun vektörünün çarpımındaki bileşenlerdir.
Bir A lineer dönüşümüne karşılık gelen A n × m matrisi, karışıklığa yol açmadığı
takdirde yine A ile gösterilir.
Rm×1 ‘den Rn ×1 'e tanımlı bir A lineer dönüşümüne standart bazlara göre
karşılık gelen matris n × m boyutlu A matrisi ise, bir v ∈ Rm ×1 vektörünün
görüntüsü A matrisi ile v vektörünün çarpımı olan,
A ( v ) = Av
vektörüdür.
A lineer dönüşümünün değer kümesi, bu lineer dönüşüme karşılık gelen A
matrisinin sütun vektörlerinin gerdiği alt uzaydır. Bir A matrisinin sütun
vektörlerinin gerdiği R( A) uzayını A biçiminde de göstereceğiz.
V bir vektör uzayı, M ile N tümleyen iki alt uzay,
V = M⊕N
ve v ∈V için,
v = u + e , u ∈ M ,e ∈ N
olmak üzere N boyunca M üzerine izdüşüm dönüşümü olan,
A:V → V
v → Av = u
dönüşümü bir lineer dönüşümdür. Bu dönüşüm için,
R ( A) = M
N ( A) = N
dır. Ayrıca,
AA ( v ) = A ( A ( v )) = A ( u ) = u
olduğundan,
AA = A2 = A
dır.
M boyunca N üzerine izdüşüm dönüşümü de bir lineer dönüşümdür ve I
birim dönüşümü göstermek üzere, bu dönüşüm I − A dır.
u = Av vektörüne V nin N alt uzayı boyunca M üzerine izdüşümü denir. A
izdüşüm dönüşümü bir lineer dönüşüm olmak üzere PM , N biçiminde gösterilir.
PM , N aynı zamanda N boyunca M üzerine izdüşüm dönüşümüne karşılık gelen
matrisi de göstersin.
2
PM
= PM , N
,N
olmak üzere PM , N idempotent bir matristir.
A: n × n ∈ L (V ,V ) idempotent bir matris olmak üzere,
V = R ( A) ⊕ N ( A)
ve
A = PR ( A ), N ( A )
dır. Gerçekten, v ∈V için, A idempotent olduğunda,
v = Av + ( I − A ) v
dır.
,
Av ∈ R ( A ) , ( I - A ) v ∈ N ( A )
V = V1 ⊕ V2 ⊕ ⋯ ⊕ Vk olmak üzere i = 1, 2 , L , k için Pi :V → Vi dönüşümü V ‘nin
Vi üzerine izdüşümü olsun . O zaman
a ) Pi2 = Pi
, i = 1, 2,⋯ , k
b) Pi Pj = 0 , i ≠ j , i, j = 1, 2,⋯ , k
c) P1 + P2 + ⋯ + Pk = I
dır . Bu özellikler , v ∈V vektörününün vi ∈ Vi , i = 1, 2,⋯ , k ve
v = v1 + v 2 + ⋯ + v k
olacak şekilde bir tek biçimde yazılmasının bir sonucudur.
(V , < , > ) bir iç çarpım uzayı, M , V nin bir alt uzayı,
V = M ⊕ M⊥
ve v ∈V için,
v = vˆ + eˆ , vˆ ∈ M , eˆ ∈ M ⊥
olmak üzere M üzerine dik izdüşüm dönüşümü olan
PM : V → M
v → PM (v) = vˆ
dönüşümü bir lineer dönüşümdür,
R ( PM ) = M
2
PM
= PM
ve ayrıca
'
PM = PM
dır. Gerçekten , x1 = xˆ1 + eˆ1 , x2 = xˆ2 + eˆ2 , x1 , x2 ∈ V , xˆ1 , xˆ2 ∈ M , eˆ1 , eˆ2 ∈ M ⊥
olmak
üzere,
x1 , PM x2 = xˆ1 + eˆ1 , xˆ2
= xˆ1 , xˆ2 + eˆ1 , xˆ2
= xˆ1 , xˆ2
= xˆ1 , xˆ2 + eˆ2
= PM x1 , x2
olduğundan
'
PM
= PM
dır.
PM dik izdüşüm dönüşümü bir lineer dönüşüm olmak üzere PM ye karşılık
gelen matris
2
'
PM
= PM = PM
den dolayı idempotent ve simetrik bir matristir.
MATRĐSLERĐN GENELLEŞTĐRĐLMĐŞ ĐNVERSLERĐ
1955 yılında Penrose ∀A: n × m matrisi için (reel veya kompleks elemanlı)
aşağıdaki denklemleri sağlayan bir tek G matrisinin var olduğunu ispatlamıştır.
1) AGA = A
2) GAG = G
3) ( AG )* = AG
4) ( GA)* = GA
Burada * işareti matrisin konjuge (eşlenik) transpozunu göstermektedir. Reel
elemanlı matrisleri için Penrose denklemlerini bir kez daha yazalım.
1) AGA = A
3) ( AG ) ′ = AG
2) GAG = G
4) ( GA) ′ = GA
Bu dört koşulu sağlayan G matrisi Moore tarafından da incelenmiş olup
bu matrise Moore-Penrose genelleştirilmiş inversi denir ve A + ile gösterilir.
Moore tanımlaması aşağıdaki gibidir.
A ∈ R n × m için,
AA + = PR ( A )
A + A = PR ( A + )
olacak şekilde A + matrisine A nın genelleştirilmiş inversi denir.
A + için Moore tanımlaması ile Penrose tanımlamasının denk oldukları
gösterilebilir.(Campbell ve Meyer (1979))
lq
Penrose koşullarından sadece birinci koşulu sağlayan matrislere 1 -
lq
koşullu inversler veya c-inversler denir. Bir A matrisinin 1 -koşullu inversi A−
veya Ac , Ag biçiminde gösterilir. Penrose koşullarından örneğin sadece 1) ve 2)
koşulunu sağlayan matrislere 1, 2 -koşullu inversler denir. Moore-Penrose
genelleştirilmiş inversi başka bir ifade ile 1, 2 , 3, 4 -koşullu invers 'dir
l q
l
q
l1q-Koşullu Đnversler:
A: n × m ve rank ( A ) = r olmak üzere, singüler olmayan P: n × n , Q: m × m, D: r × r
matrisleri vardır, öyleki
 D 0
PAQ = 

 0 0
biçiminde yazılabilir. E , F , H uygun boyutlu isteksel matrisler olmak üzere,
 D −1
AQ 
 F
E
 PA = A
H
olduğundan,
 D −1
A =Q
 F
E
P
H
−
lq
matrisi A ‘nın bir 1 -koşullu inversidir. E , F , H matrisleri isteksel
olduklarından, A matrisinin birden çok 1 -koşullu inversi olabilir. Her A
matrisinin en az bir tane 1 -koşullu inversi vardır. Q ile P matrislerinin singüler
olmadığı ve D matrisinin rankının r olduğu gözönüne alınırsa E ile F
matrisinin sıfır matrisleri olarak alınması durumunda H matrisinin seçimine
bağlı olarak A − nin rankı r ≤ rank( A − ) ≤ min n, m olacak şekilde değişik ranklı A −
1 -koşullu inversleri vardır.
lq
lq
l q
lq
Teorem Ax = g denklem sistemini göz önüne alalım.
a) Denklem sisteminin tutarlı olması için gerek ve yeter şart
AA − g = g
lq
olmasıdır. (Burada A − , A nın bir 1 -koşullu inversidir.)
b) Denklem sistemi tutarlı olsun. x 0 = G g nin bir çözüm olması için gerek
ve yeter şart G matrisinin A nın bir 1 -koşullu inversi olmasıdır.
lq
c) Denklem sistemi tutarlı olsun. z isteksel bir vektör olmak üzere,
x = A − g + ( I − A − A) z
denklem sisteminin bir çözümüdür.
Ax = g lineer denklem sistemlerinin çözümünü halleden A − inversi matris
denklemlerinin çözümünde de kullanışlıdır. X bilinmeyen bir matris olmak
üzere,
AXB = C
matris denkleminin tutarlı olması için gerek ve yeter şart,
AA − CB − B = C
olmasıdır ve bu durumda çözümler,
X = A − CB − + ( Z − A − AZBB − )
dır. Burada Z uygun boyutlu isteksel bir matristir.
l1q-Koşullu Đnverslerin Bazı Özellikleri
1) A regüler ise A − = A −1 dır. A: n × k tam satır ranklı ( rank( A ) = n ) ise,
A − = A ′ ( AA ′ ) −1 olup A − matrisi A nın sağ inversidir, yani AA − = I n dır. A: n × k
tam sütun ranklı ( rank( A ) = k ) ise, A − = ( A ′ A ) −1 A ′ olup A − matrisi A nın sol
inversidir, yani A − A = I k dır.
A idempotent ise A − = A dır.
2) ( A′ ) − = ( A − ) ′ dır. Eğer A simetrik, yani A ′ = A ise A − ve ( A − ) ′ matrisleri A nın
lq
lq
1
2
birer 1 -koşullu inversidir ve G = ( A − + ( A − ) ′ ) matrisi A nın simetrik bir 1 koşullu inversidir.
3) AA − , A − A, I − AA − , I − A − A matrisleri idempotentir ve
R ( AA − ) = R ( A), R ( A − A) = R ( A′ ), N ( A − A) = N ( A)
dır.
−
 A−
A 0
4) 
=


 0 B
0
0
 dır. C nin satır vektörleri A nın satır uzayında ise,
B− 
−
 A−
A C
=

0 0


0
0

0
dır.
5) A = A( A′A)− A′A = AA ′ ( AA ′ ) − A dır. Buna göre ( A ′ A ) − A ′ ile A ′ ( AA ′ ) −
matrisleri A nın birer 1 -koşullu inversidir.
lq
lq
6) ( A′ A)1− ve ( A′ A) 2− matrisleri A′ A ‘nın iki 1 -koşullu inversi olmak üzere
A( A′ A)1− A′ = A( A′ A) 2− A′ dır.
7) AA − ve A − A matrisleri idempotent olduklarından birer izdüşüm matrisleridir.
A: n × m , AA − ∈ R n × n , A − A ∈ R m× m olmak üzere,
PR ( AA − ), N ( AA − ) = AA −
PR ( A − A), N ( A − A) = A − A
dır. Ayrıca R n = R ( A) ⊕ S , R m = N ( A) ⊕ T olmak üzere N ( A − A) = S ve R ( A − A) = T
olacak şekilde A ‘nın bir A − 1 -koşullu inversi vardır, öyle ki,
PR ( A),S = AA − ve A − A = PT , N ( A)
dır.
lq
8) A matrisi için A ( A ′ A ) − A ′ matrisi simetrik ve idempotentdir. A ( A ′ A ) − A ′ A = A
olmak üzere A ( A ′ A ) − A ′ matrisine karşılık gelen lineer dönüşüm R ( A) = A
üzerine bir dik izdüşümdür, yani A ( A ′ A ) − A ′ = P A dır..
n
s
9) y ∈ R n , X : n × p olmak üzere, X = X b:b ∈ R p uzayında y vektörüne Euclide
metriğine göre en yakın, yani ( y − X b ) ′ ( y − X b) iç çarpımını en küçük yapan
vektör, yˆ = P[ X ] y = X ( X ′X )− X ′ y = X b0 dır. Burada b 0 = ( X ′X ) − X ′ y vektörü, tutarlı
olan ve normal denklemler ismini taşıyan,
X ′X b = X ′ y
denklem sisteminin bir çözümüdür. rank( X ) = rank( X ′X ) < p olduğunda normal
denklemlerin birden çok çözümü olmasına rağmen yˆ = X ( X ′X )− X ′ y bir tektir.
10) y ∈ R n , X : n × p olmak üzere X ′X b = X ′ y normal denklemlerin bir çözümü b̂
olmak üzere λ ′ b̂ lineer bileşiminin (sayısının) bir tek olması ( b̂ çözümüne bağlı
olmaması) için gerek ve yeter şart
λ ' = λ ' ( X ′X ) − X ′X
olmasıdır.
11) λ: p × 1 vektörünün X : n × p matrisinin satır vektörlerinin gerdiği uzayda
olması (yani λ ' = c ' X , ∃c ∈ R n ) için gerek ve yeter şart λ ' = λ ' ( X ′X ) − X ′X
olmasıdır.
{1, 2,3, 4} -Koşullu (Moore-Penrose Tipi )Đnverslerin Bazı Özellikleri
Moore-Penrose tipi genelleştirilmiş inversleri ile ilgili bazı özellikler
aşağıda özetlenmiştir.
1) Eğer A karesel ve singüler olmayan bir matris ise
A + = A −1
dır.
2) A: n × m ve rank(A) = m , yani A nın sütun vektörleri lineer bağımsız ( A tam
sütun ranklı) ise,
A + = ( A ′ A ) −1 A ′
dır. A + matrisi A nın sol inversidir.
3) A: n × m ve rank(A) = n , yani A tam satır ranklı ise,
A + = A ′ ( A ′ A ) −1
dır. A + matrisi A nın sağ inversidir.
4) A:1 × 1 tipinde bir matris, yani A = a , a ∈ R ise,
[ 0] , a = 0

A = lim( A′A + δ I ) A′ =   1 
δ →0
 a  , a ≠ 0
 
+
2
−1
dır. a ∈ R reel sayısı için,
a
+
R|0
= S1
|T a
,a = 0
,a ≠ 0
olarak tanımlansın.
5) A köşegen matris yani,
 d1
0
A=
⋮

0
0
d2
⋮
0
0
⋯ 0 
⋮

⋯ dn 
⋯
ise,
 d1+

0
+
A =
⋮

 0
0 ⋯ 0

d 2+ ⋯ 0 
⋮
⋮ 

0 ⋯ d n+ 
dır.
6) A: n × 1 tipinde bir vektör, yani A = a ∈ R n ×1 ise,
a + = (a' a)+ a'
dır.
7) A simetrik ve idempotent, yani A′ = A ve A2 = A ise A + = A dır.
8) ( A + ) + = A
9)
( A′ ) + = ( A + ) ′
dır. Eğer
A ′ = A ise ( A + ) ′ = A + dır.
A
simetrik ise
A+
de
simetriktir, yani
10) A + = ( A ′ A ) + A ′ = A ′ ( AA ′ ) +
R| A′ = A′ AA + = A + AA′
|
11) S R ( A ) = R ( AA ′ ) = R ( AA + )
|| R ( A + ) = R ( A′ ) = R ( A + A) = R ( A′ A)
T
12) a , b ∈ R n için ( ab ' ) + = ( a a ' ) + ( b ' b ) + ba ' dır.
13) Herhangi bir A: n × m, rank( A) = r matrisi için,
A = BC
( B: n × r , C: r × m, rank( B ) = rank( C ) = r ) biçiminde yapılan ayrışım altında,
A + = C + B + = C ′ ( CC ′ ) −1 ( B ′ B ) −1 B ′ = C ′ ( B ′ A C ′ ) −1 B ′
dır.
14) A: n × m ve P: n × n , Q: m × m ortogonal matrisler olmak üzere,
( PAQ ) + = Q′A + P ′
dır.
15) A: n × n , A′ = A ve A nın spektral ayrışımı,
A = PDP ′
olmak üzere,
A + = PD+ P ′
dır.
0 
 A11+
+
ise A = 
A22 
0
A
16) A =  11
0
17) ( A ⊗ B ) + = A + ⊗ B +
Elemanları 1 olan
J n× m
1
1
=
⋮

1
n×m
0 
 dır.
A22+ 
tipinde matris,
1 ⋯ 1
1 ⋯ 1
⋮
⋮

1 ⋯ 1
1
1
=   ⊗ [1 1 ⋯ 1]1×m
⋮ 

1 n×1
olmak üzere,
+
J n+×m
1
1
1
+
=   ⊗ [1 1 ⋯ 1]1×m = 1 1 L
⋮ 
n

1 n×1
LM1OP
1 1
1
=
Jm× n
1 1× n ⊗ M P
m M MP
n. m
MN1PQ
m ×1
dır.
18) P X = XX + , yani XX + matrisi X in sütun vektörlerinin gerdiği, X ⊂ R n
alt uzayı üzerine dik izdüşüm matrisidir (operatörüdür). Ayrıca,
P[ X ]⊥ = I − XX + , ( R( I − XX + ) = R( X )⊥ = N ( XX + ) = N ( X + ))
P X ′ = X + X


P[ X ′]⊥ = I − X + X , ( R( I − X + X ) = R( X ′) ⊥ = N ( X + X ) = N ( X ))
dır.
19) ( AB) + = ( PR ( A′) B)+ ( APR ( B ) )+ = ( A+ AB)+ ( ABB + ) +
20) A: n × m , B: m × k , rank ( A ) = rank ( B ) = m ise,
( AB ) + = B + A +
dır.
21) y ∈ R n , X : n × p olmak üzere,
min y − X β = y − X β * ⇔ β * = X + y + ( I − X + X ) z , z ∈ R p
β
dır.
R|
S|
T
22) min β * : min y − X β = y − X β*
β
U| = X + y
V|
W
23) A x = b denkleminin tutarlı olması için gerek ve yeter şart,
AA + b = b
olmasıdır. Tutarlı olması durumunda çözümler,
x 0 = A+b + ( I − A+ A ) z , z ∈ R p isteksel vektör
biçimindedir.
24) Moore-Penrose genelleştirilmiş inversini hesaplamak için bir algoritma.
A: n × m , rank( A) = r olmak üzere A + yı bulmak için aşağıdaki adımlar
izlenebilir:
a) B = A′ A yı hesaplayınız.
b) C1 = I alınız.
1
k
c) Ck +1 = . I . tr ( Ck B ) − Ck B , k = 1, 2 ,..., r − 1
d) A + =
r
Cr A′
tr ( Cr B )
NOT: Cr +1B = 0 ve tr ( Cr B ) ≠ 0 olması c) adımında durdurma kuralı olarak
kullanılırsa bu algoritmada A nın rankının önceden bilinmesi gerekmez.
(Graybill, 1983)
{1,3} -Koşullu ve {1, 4} -Koşullu Đnverslerin Bazı Özellikleri
Penrose denklemlerini bir kez daha yazalım.
1) AGA = A
3) ( AG ) ′ = AG
2) GAG = G
4) ( GA) ′ = GA
ve ( AA(1,3) )′ = AA(1,3) özelliklerini sağlayan
matrisine A ‘nın {1,3} -koşullu inversi denir.
AA(1,3) A = A
A(1,3)
A(1,4) AA(1,4) = A(1,4) ve ( A(1,4) A)′ = A(1,4) A özelliklerini sağlayan A(1,4)
matrisine A ‘nın {1, 4} -koşullu inversi denir.
AA (1,3) matrisi için,
* AA (1, 3) AA (1, 3) = AA (1, 3)
( A(1, 3)
ün Penrose koşullarından 1) i sağladığından)
* ( AA (1, 3) )′ = AA (1, 3)
( A(1, 3)
ün Penrose koşullarından 3) ü sağladığından)
dır, yani AA (1,3) matrisi idempotent ve simetriktir. O zaman AA (1,3) bir dik
izdüşüm matrisidir.
AA (1,3) = PR ( A )
dır.
X ∈ R n × p , y ∈ R n olmak üzere
min y − X β = y − XX (1,3) y
β
dır. βˆ = X (1,3) y vektörü minimizasyon probleminin bir çözümü olmakla birlikte,
çözümler arasında minimum normlu olmayabilir. β* = X + y çözümler arasında
minimum normludur.
A ∈ R n × m , b ∈ R ( A) için Ax = b denklemi tutarlı olmak üzere, ∀A(1,4) için,
x * = A (1, 4 ) b
çözümü minimum normlu çözümdür.
PARÇALANMIŞ MATRĐSLERĐN GENELLEŞTĐRĐLMĐŞ
ĐNVERSLERĐ
Bu kısımda parçalanmış matrislerin genelleştirilmiş inversleri ile ilgili
bazı formüller verilecektir.
1. A: n × k , rank( A ) = r matrisi sütun olarak,
A = [U ⋮V ] , U : n × s , V : n × (k − s )
biçiminde iki matrise parçalanmış olsun.
U − − U −VC − ( I − UU − ) 
−
A =
 , C =( I − UU )V
−
−
C ( I − UU )


−
−
−
(1,2)
U UU − U VC ( I − UU − ) 
−
A(1,2) = 
 , C =( I − UU )V
(1,2)
−
C ( I − UU )


−
U (1,2,3) − U (1,2,3)VC (1,2,3) 
(1,2,3)
=
A
)V
 , C =( I − UU
(1,2,3)
C


U + − U +V (C + + K ) 
+
A+ = 
 , C =( I − UU )V
+
C +K


(1,2,3)
K = ( I − C+C) I + ( I − C+C)V '(U + )'U +V ( I − C+C)
−1
V '(U + )'U +V ( I −VC+ )
dır.
Satır olarak ikiye parçalanmış matrisler için benzer sonuçlar transpoz
alarak elde edilebilir. Bir matrisin satır ve sütun olarak ikiye yani dört blok
matrise parçalanması durumunda genel halde invers formülleri yoktur. Blok
matrislerin özel halleri için elde edilen formüllerden bazıları aşağıdaki gibidir.
A
A
2. A =  1 2  olmak üzere A1 regüler ve rank( A ) = rank( A1 ) ise,
 A3 A4 
A4 = A3 A1−1 A2
dır. P = A3 A1−1 , Q = A1−1 A2 için,
 A1
A
 3
A2   I 
=
A [I
A4   P  1
 A1
A
 3
A2 
I 
−1
=   ( ( I + P′P ) A1 ( I + QQ′) ) [ I

A4 
Q ′ 
Q]
olmak üzere,
+
P′ ]
dır.
A
A= 1
0
A2 
ve R ( A2 ) ⊂ R ( A1 ) , S ( A2 ) ⊂ S ( A3 ) ise,
A3 
 A1
0

dır.
+
A2 
 A1+
=

A3 
0
− A1+ A2 A3+ 

A3+ 
A = [U ⋮V ] , U : n × s , V : n × (k − s ) için,
U ′U U ′V 
A′A = 
ve Q = U ' ( I − VV − )U

V ′U V ′V 
olmak üzere,

−Q −U ′V (V ′V )−
−
−
−
−
(V ′V ) + (V ′V ) V ′UQ U ′V (V ′V ) 

Q−
( A′A)− = 
−
−
 −(V ′V ) V ′UQ
( A ' A ) ( 1, 2 ) =
LM Q (1,2 )
MN − (V 'V ) − V 'UQ (1,2 )
OP
(V 'V ) ( 1, 2 ) + (V 'V ) − V ' UQ (1, 2 )U 'V (V 'V ) − PQ
− Q ( 1, 2 )U 'V (V 'V ) −
dır. Eğer rank(U ' U ) + rank(V 'V ) = rank( A ' A ) ise,
′ (V ′V )−

−Q(1,2,3)UV
(1,2,3)
−
(1,2,3)
−
′
′ (V ′V ) 
(V ′V )
+ (V ′V ) VUQ
UV

Q(1,2,3)
(1,2,3)
′
( AA)
=
−
(1,2,3)
−(V ′V ) V ′UQ

Q+
( A′A)+ = 
−
+
 −(V ′V ) V ′UQ
dır.

−Q +U ′V (V ′V ) −
+
−
+
−
(V ′V ) + (V ′V ) V ′UQ U ′V (V ′V ) 
 A′A L′
matrisi için, K = A ' A + L ' L ve R = LK − L ' olmak üzere,

0
4. M = 
 L
 K − − K − L′R − LK −
M− =
R − LK −

K − L′R − 

R− R − R− 
dır.
Eğer S ( L ) ⊂ S ( A ' A ) ise,
( A′A)− − ( A′A)− L′(L( A′A)− L′)− L( A′A)− ( A′A)− L′(L( A′A)− L′)− 
M− = 

(L( A′A)− L′)− L( A′A)−
−(L( A′A)− L′)− 

dır.
Eğer S ( L ) ⊂ S ( A ' A ) ve rank( L: q × k ) = q ise,
( A′A)− − ( A′A)− L′(L( A′A)− L′)−1 L( A′A)− ( A′A)− L′(L( A′A)− L′)−1 
M =

(L( A′A)− L′)−1 L( A′A)−
−(L( A′A)− L′)−1 

−
dır.
Eğer L: q × k matrisinin satır uzayı A ' A: k × k matrisinin satır uzayının
tümleyeni, yani
R k = S ( A' A) ⊕ S ( L)
ise,
 K −1 A′AK −1
M+ = 
−1
 LK
K −1 L′

0 
dır. Ayrıca, rank( L ) = q ise M matrisi regülerdir ve S ( L ) = S ( A ' A ) ⊥ ise,
( A′A) +
M −1 =  +
 ( L )′
dır.
L+ 

0
EK
MATRĐSLER ĐLE ĐLGĐLĐ BAZI HATIRLATMALAR
1) A: n × p tipinde reel sayıların bir matrisi olmak üzere, R p den Rn ye bir lineer
dönüşüm belirler.
A: R p → Rn
b → Ab
A matrisinin belirlediği lineer dönüşümün görüntü kümesi R ( A) , A
{
}
A matrisinin satır vektörlerinin gerdiği S ( A) = {c′ A: c ∈ Rn } uzayı R p ‘nin bir alt
matrisinin sütun vektörlerinin Rn de gerdiği R ( A) = A = Ab:b ∈ R p alt uzayıdır.
uzayıdır.
R ( A ) = R ( AA ′ ) , S(A) = S(A ′A)
dır.
A matrisinin rankı, lineer bağımsız sütun (satır) vektörü sayısı olmak
üzere,
rank (A)=boyut(R(A))=boyut(S(A))
l q
dır. A: n × p ise rank( A) ≤ min n, p dır.
2) a) Bir C matrisi için AC = B ⇔ R ( B ) ⊂ R ( A ) dır.
b) R ( AC ) ⊂ R ( A) dır. Eğer C singüler değilse R ( AC ) = R ( A) dır.
3) C singüler değilse rank ( AC ) = rank ( A) . Genelde,
rank ( AB) ≤ min {rank ( A), rank ( B )}
dır.
b) ( AB )−1 = B −1 A−1
c) ( A−1)′ = ( A′ ) −1
4) a) ( AB )′ = B′A′
d) det ( AB ) = det ( A ) det ( B )
e) det( kAn × n ) = k n det( An × n )
5) A: n × n , A ′ A = I ise A matrisine ortogonal matris denir. A ‘nın sütun
vektörleri Rn de bir ortogonal baz oluşturmaktadır.
a) (det( A))2 = 1 olmak üzere det( A) = +1 veya −1 dır.
b) A−1 = A′
c) AA′ = I dır. A ‘nın satır vektörleri de Rn de bir ortonormal baz
oluşturmaktadır.
d) Ortogonal matrise karşılık gelen lineer dönüşüme de ortogonal
dönüşüm denir.
Ax − A y
2
= ( Ax − A y )′ ( Ax − A y )
= ( x − y )′ A′ A( x − y ) = ( x − y )′ ( x − y ) = x − y
2
olmak üzere ortogonal dönüşümler Euclide metriğinde uzaklıkları ve
A x , A y = x ′ A′ A y = x ′ y = x , y
olmak üzere Euclide
bırakmaktadır).
iç
çarpımında
açıları
korumaktadır
(değişmez
6) Matrislerin Eşelon Forma Getirilmesi
A: n × p tipinde bir matris olmak üzere, A matrisi üzerindeki aşağıdaki
işlemleri (elemanter satır işlemleri) göz önüne alalım.
i1) Matrisin bir satırı (veya sütununu) bir c sabiti ile çarpmak.
k .satırı c sabiti ile çarpmak demek A matrisinin soldan singüler olmayan,
c, i= j=k
Ek ( c ) = ( eij )n × n , eij = 1 , i = j ≠ k
0,
i≠k
R|
S|
T
U|
V|
W
matrisi ile çarpmaktır. k . sütunu c sabiti ile çarpmak, A matrisini sağdan m × m
boyutlu Ek ( c) matrisi ile çarpmak demektir.
i2 ) r. satırın (sütunun) yerine " r. satır(sütun) + s. satırın (sütunun) c
katının " yazılması.
r. satır için bu işlemi yapmak demek A matrisini soldan singüler olmayan
aşağıdaki gibi bir matrisle çarpmak demektir.
Ers ( c ) = ( eij )n × n ,
R| 1
eij = S c
|T 0
,
i= j
,
i = r, j = s
, diðer durumlarda
Sütunlar için bu işlemi yapmak için A matrisi sağdan böyle bir matris ile
çarpılmaktadır.
i3 ) Đki satırın (sütunun) yerinin değiştirilmesi.
r. satır ile s. satırın yerini değiştirmek demek A matrisini soldan
Es ( −1) Esr ( −1) Ers (1) Esr ( −1)
matrisi ile çarpmak demektir. Sütunların yerini
değiştirmek için benzer çarpım sağdan yapılmaktadır.
Bir matris satır işlemleri yapılarak eşelon forma getirilebilir. Bir matrisin
eşelon formda olması demek, bir satırın elemanlarının ya tümü sıfır yada 1 olan
elemanın solundakiler sıfır (sağındakiler olmayabilir) ve bir sütunda 1 varsa
diğer elemanların 0 olması demektir.
7) A: n × k matrisi (satır işlemlere karşılık gelen matrislerin çarpımı olan) bir
B: n × n singüler olmayan matrisi ile çarpılarak eşelon forma getirilebilir.
8) A: n × k , rank ( A ) = r , matrisi için singüler olmayan B: n × n (satır işlemlerine
karşılık gelen) ve C: k × k (sütun işlemlerine karşılık gelen) matrisleri vardır
öyleki,
I
BAC =  r
0
0
0 
I
A = B −1  r
0
0  −1
C
0 
dır. Ayrıca,
= B1C1
olmak üzere, A: n × k matrisi rankları r olan B1: n × r ve C1: r × n gibi iki matrisin
çarpımı olarak yazılabilir.
8) A: n × n matrisi için singüler olmayan B: n × n matrisi vardır öyleki, BA üst
üçgenseldir (köşegenin altındaki elemanlar sıfırdır).
9) A: n × n ve A simetrik bir matris ise BA B′ köşegen matris olacak şekilde
singüler olmayan B: n × n matrisi vardır.
10) Gram-Schmidt Yöntemi
A : n × p ( rank ( A) = p )
olmak üzere,
matrisinin sütun vektörleri
A
A(:,1) , A(:,2) ,..., A(:, p ) olsun.
* U (:,1) = A(:,1)
*
U (:,i +1) = A(:,i+1) − U n×i bi +1
(
U n×i = U (:,1) ,U (:,2) ,...,U (:,i )  , bi +1 = U n' ×iU n×i
)
−1
U n' ×i A(:,i +1) , i = 1, 2,..., p − 1
olmak üzere,
U (:,1) , U (:,2) ,..., U (:, p ) ‘ler ortogonal (dik), yani U '(:,i ) U (:, j ) = 0 ,
i, j = 1, 2,..., p
i≠ j
dır. Ayrıca,
{
}
{
}
span A(:,1) , A(:,2) ,..., A(:,k ) = span U (:,1) , U (:,2) ,..., U (:,k ) , k = 1, 2,..., p
{
}
{
R ( A) = span A(:,1) , A(:,2) ,..., A(:, p ) = span U (:,1) , U (:,2) ,..., U (:, p )
dır. U (:,1) , U (:,2) ,..., U (:, p ) vektörleri R( A) için bir ortogonal bazdır.
11) A : n × p (rank ( A) = p) matrisi için
U = U n× p = U (:,1) , U (:,2) ,..., U (:, p ) 
S = ( Sij ) p× p
olmak üzere,
A = US
dır.

 Sii = 1

,  Sij = 0 , i > j

j
 Sij = bi , i ≤ j
i, j = 1, 2,..., p
}
, i = j = 1, 2,..., p
 U
U 'U = D 2 , Dij =  (:,i )
, i≠ j
0
A = UD −1DS
Q = UD −1
R = DS
A = QR
A = QR , A matrisinin QR ayrışımı
A ' A = (QR) ' QR = R ' R
, A ' A ‘nın Cholesky ayrışımı, R üst üçgensel
12) Özdeğerler, Özvektörler ve Spektral Ayrışım
A: n × n tipinde reel sayıların bir matrisi olmak üzere, λ ‘ya göre bir
polinom denklemi olan, det A − λI = 0 denklemine A ‘nın karakteristik denklemi
b
g
ve köklerine A ‘nın özdeğerleri denir.
v ≠ 0 için Av = λ v oluyorsa v vektörüne λ özdeğerine karşılık gelen
özvektör denir. Bir özdeğere birden çok özvektör karşılık gelebilir.
A: n × n matrisi simetrik olduğunda:
a) Özdeğerleri reel sayılardır. Rank ( A ) = r ise 0 sayısı n - r katlı özdeğerdir.
λ 1 ≠ λ 2 özdeğerlerine karşılık gelen
Av = λ1 v , Aw = λ 2 w özvektörleri için
v⊥ w dır.
b) A matrisinin rankı sıfırdan farklı özdeğerlerin sayısına (katlı özdeğerler katı
kadar sayılmak şartıyla ) eşittir.
c) Bir λ i özdeğeri k katlı ise,
Av = λi v
denklemini sağlayan k tane ortogonal v özvektörü vardır, sıfır vektörü ile
birlikte bu k tane özvektör bir Vi alt vektör uzayı (özdeğer uzayı) germektedir. A
nin farklı özvektörleri λ1 , λ2 ,..., λ r olmak üzere bunlara karşılık gelen V1 ,V2 ,...,Vr
özdeğer uzayları birbirine dik ve
Rn = V1 ⊕ V2 ⊕... ⊕Vr
dır.
d) A nın özdeğerleri λ1 , λ 2 ,..., λ n ve
λ1 0 ...... 0 
0 λ ....... 0 
2

D=
.



0 0 ....... λn 
b
g
olsun. P: n × n ortogonal matrisi P′P = I A nın normlanmış özvektörlerinin
matrisi (eşit özdeğerler için karşılık gelen özdeğer uzayının ortonormal baz
vektörleri) olmak üzere,
AP = DP
A = PDP′
dır.
n
A = PDP′ = ∑ λ i v i v i'
i =1
gösterimine A matrisinin spektral ayrışımı (spectral decomposition) denir.
n
A 2 = ∑ λ2i v i v i'
i =1
olmak üzere, biçimsel olarak, c ∈ R için,
n
A c = ∑ λci v i v i'
i =1
veya
n
f ( A ) = ∑ f ( λ i ) v i v i'
i =1
gibi gösterimler operatör hesabında kullanılmaktadır.
13) Bir Matrisin Tekil Değer Ayrışımı (Singular Value Decomposition)
A : n × p tipinde bir matris, rank ( A ) = r
V : p × p ortogonal matrisleri vardır, öyleki
olmak
üzere
U : n×n ,
 D 0
A =U 
 V'
0 0 
biçiminde yazılır. Burada, U matrisi AA′ nın ve V matrisi A′ A nın normlanmış
özvektörlerinin matrisleridir. D matrisi, AA′ matrisinin ( A′ A matrisinin)
sıfırdan farklı di ( di > 0 ,i = 1, 2 ,..., r ) özdeğerlerinin,
 d1 0 ...... 0 


0 d 2 ....... 0 
D=

.



0 0 ....... d r 
köşegen matrisidir. U matrisinin ilk r sütunundan oluşan matris U1 : n × r
(U1'U1 = I r ) , P matrisinin ilk r satırından oluşan matris V : r × p (V V
1
'
1 1
= I r ) olmak
üzere,
A = U1DV1'
dır. Tersine, bu gösterimden yukarıdakine geçmek için D matrisi sıfır matrisleri
ile genişletilecek ve Q1 ile P1 matrisleri ortogonal matrisler olacak şekilde
genişletileceklerdir. A matrisinin böyle bir gösterimine tekil değer ayrışımı ve D
matrisinin elemanlarına A ‘nın tekil değerleri denir.
Örnek:
A matrisinin bir g-inversinin hesaplanması (Matlab):
>>A =
[1
1
1
1
1
1
1
1
1];
>> [U D V]=svd(A);
>> r=rank(A);
%F,G,H isteksel (keyfi) matrisler
>> F=ones(r,size(A,1)-r);
% F=rand(r,size(A,1)-r) olabilir
>> G=rand(size(A,2)-r,r);
% G=zeros(size(A,2)-r,r) olabilir
>> H=rand(size(A,2)-r,size(A,1)-r);
% H=ones(size(A,2)-r,size(A,1)-r) olabilir
>> ginvA=V*[inv(D(1:r,1:r)) F ; G H]*U'
ginvA =
>> pinv(A)
-0.2943 -0.3043 -0.1574
0.1111
0.1111
0.1111
1.9667 -0.1458 -0.5140
0.1111
0.1111
0.1111
0.6609 -0.2165
0.1111
0.1111
0.1111
0.0047
>> A*ginvA*A
>> A*pinv(A)*A
1.0000
1.0000
1.0000
1.0000
1.0000
1.0000
1.0000
1.0000
1.0000
1.0000
1.0000
1.0000
1.0000
1.0000
1.0000
1.0000
1.0000
1.0000
A=
[1
1
1
1
1
1
1
1
1]
>> [U D V]=svd(A);
>> r=rank(A);
>> F=zeros(r,size(A,1)-r);
>> G=zeros(size(A,2)-r,r);
>> H=zeros(size(A,2)-r,size(A,1)-r);
>> ginvA=V*[inv(D(1:r,1:r)) F ; G H]*U'
ginvA =
0.1111
0.1111
0.1111
0.1111
0.1111
0.1111
0.1111
0.1111
0.1111
>>1/9*ones(3,3)
ans =
0.1111
0.1111
0.1111
0.1111
0.1111
0.1111
0.1111
0.1111
0.1111
Örnek: Gram-Schmidt Yöntemi
Clc;clear all;close all
A = [1
1
1
1
2
4
1
3
9
1
4
16]
U(:,1)=A(:,1);
n=size(A,1);
p=size(A,2);
S=zeros(p,p);
for ii=1:p
S(ii,ii)=1;
end
for i=1:(p-1)
beta=regress(A(:,(i+1)),U);
S(1:i,(i+1))=beta;
U(:,(i+1))=A(:,i+1)-U*beta;
end
U
S
D2=U'*U;
D=sqrt(D2);
Q=U*inv(D)
R=D*S
Q*R
A=
1
1
1
1 2
1 3
1 4
U=
1.0000
1.0000
1.0000
1.0000
S=
1.0000
0
0
Q=
0.5000
0.5000
0.5000
0.5000
R=
2.0000
0
0
QR =
1.0000
1.0000
1.0000
1.0000
4
9
16
-1.5000
-0.5000
0.5000
1.5000
1.0000
-1.0000
-1.0000
1.0000
2.5000 7.5000
1.0000
5.0000
0
1.0000
-0.6708
-0.2236
0.2236
0.6708
0.5000
-0.5000
-0.5000
0.5000
5.0000 15.0000
2.2361 11.1803
0.0000 2.0000
1.0000
2.0000
3.0000
4.0000
1.0000
4.0000
9.0000
16.0000
Download