1. Ders Vektör Uzayları, Đç Çarpım Uzayları ve Dik Đzdüşüm Matrislerin Genelleştirilmiş Đnversleri Vektör Uzayları Vektör uzayları ile ilgili bazı temel kavram ve özellikler hatırlatalım. Reel sayılar cismi ( R, +,.) ‘yi kısaca R ile göstereceğiz Tanım V boş olmayan bir küme ve ⊕ ile • işlemleri, ⊕ : V ×V → V , • : R ×V → V biçiminde olmak üzere; i) (V , ⊕ ) bir Abel grubu, ii) ∀v , u ∈ V ve a , b ∈ R için a) ( a .b ) • v = a • ( b • v ) b) ( a + b) • v = ( a • v ) ⊕ (b • v ) c) a • (v ⊕ u) = (a • v ) ⊕ ( a • u) d ) 1• v = v özellikleri sağlandığında (V , R , ⊕ , • ) dörtlüsüne (⊕ vektör toplama ve • skaler ile çarpma işlemleri altında V kümesine) R cismi üzerinde bir vektör uzayı denir. V ‘nin elemanlarına da vektör denir. Örnek Rn reel sayıların sıralı n-lilerinin kümesi, ⊕: Rn × Rn → Rn ( a1 , a2 ,..., an ) ⊕ ( b1 , b2 ,..., bn ) = (( a1 + b1 , a2 + b2 ,..., an + bn ) vektörleri toplama ve • : R × R n → Rn c • ( a1 , a2 ,..., an ) = ( ca1 , ca2 ,..., can ) skalar ile çarpma işlemleri altında R cismi üzerinde bir vektör uzayıdır. ( Rn , R , ⊕ , • ) vektör uzayını R1×n ile gösterelim. Bu uzayın elemanlarına n-bileşenli satır vektörleri denir. Rn×1 kümesi, a1 n×1 a2 R = : a1, a2 ,..., an ∈ R ⋮ an olmak üzere, ⊕ : Rn×1 × Rn×1 → Rn ×1 a1 b1 a1 + b1 a2 ⊕ b2 = a2 + b2 ⋮ ⋮ ⋮ an bn an + bn ve • : R × Rn×1 → Rn×1 a1 ca1 a2 ca2 c • = ⋮ ⋮ an can olsun. Rn×1 kümesi bu iki işlem ile birlikte R üzerinde bir vektör uzayıdır. Bu uzayın elemanlarına n-bileşenli sütun vektörleri denir. Rn×1 in elemanlarını, altına bir cizgi atılmış küçük veya büyük harflerle göstereceğiz. a1 X1k a2 X 2k a= , Xk = ⋮ ⋮ an X nk R1×n nin elemanlarını a ' = ( a1 , a 2 ,..., a n ) X 'k = ( X k 1 , X k 2 ,..., X kn ) biçiminde göstereceğiz. R1×n ile Rn×1 uzayları farklı iki vektör uzayıdır. R n , R1×n veya Rn×1 sözkonusu olduğunda hangisinden bahsedildiği açık olarak anlaşılıyorsa üçü de R n ile gösterilecektir. Özel olarak R n standart vektör uzayı dendiğinde, Rn×1 sözkonusu olacağını belirtelim. Rn×m kümesi n × m boyutlu reel elemanlı matrislerin kümesi olmak üzere matris toplamı ve matrislerin skalar ile çarpımı işlemleri altında Rn×m , R üzerinde bir vektör uzayıdır. Bundan sonra, u , v ∈ V ve a , b ∈R için ( a • u ) ⊕ ( b • v ) yerine kısaca au + bv yazılacaktır. Đç Çarpım Uzayları Önce Normlu Vektör Uzayı kavramını hatırlatalım. Norm, bir vektör uzayındaki vektörlere pozitif bir reel sayı karşılık getiren bir fonksiyondur. Bir vektörün normu, geometrik olarak, vektörün uzunluğu olarak yorumlanmaktadır. Tanım V bir vektör uzayı olmak üzere , . :V→R v→ v fonksiyonu: i ) ∀v ∈V için v ≥ 0 v =0⇔v=0 ii ) iii ) ∀a ∈ R ve ∀v ∈V için av = a . v iv ) ∀u , v ∈V için u+v ≤ u + v özelliklerini sağladığında, . fonksiyonuna norm , v sayısına v vektörünün normu, (V , . ) ikilisine de normlu vektör uzayı denir. Örnek R de, x→ x = x = RS x , x ≥ 0 T− x , x < 0 ve Rn standart vektör uzayında, aε Rn için : 1) m a = max a1 , a2 ,..., an n r p 2) a = ( ∑ ai )1/ p 3) a = ( ∑ ai2 )1/ 2 , p ≥ 1 ( l p normu) i =1 n i =1 , ( Euclide normu) olarak tanımlı . fonksiyonları birer normdur. Örnek Rn×m vektör uzayında A = ( aij ) ∈ Rn × m için, n a) A 1 = max( ∑ aij ) j i =1 n b) A ∞ = max( ∑ aij ) i j =1 c) A 2 = ( A′ A nýn en büyük özdeðeri)1/ 2 d) A E = ( ∑ ∑ aij2 )1/ 2 n n i =1 j = 1 n A = ∑ ∑ aij i =1 j =1 n e) { } f ) A = max aij : i = 1, 2 ,..., n , j = 1, 2 ,..., m olarak tanımlı fonksiyonlar birer normdur. Tanım V bir vektör uzayı olmak üzere, < .,. > : V × V → R (u, v) →< u , v > fonksiyonu : i ) < u , v >=< v , u > ii ) a , b ∈ R için, < au + bv , z >= a < u , z > + b < v , z > iii ) v ≠ 0 için < v, v > > 0 , v = 0 için < v, v >= 0 özelliklerini sağladığında, < u, v > sayısına u ile v ‘nin iç çarpımı ve (V , <.,. > ) ikilisine de iç çarpım uzayı denir. Örnek Rn standart vektör uzayında a , b ∈ R n için , n < a , b >= ∑ aibi i =1 olarak tanımlı <.,. > fonksiyonu bir iç çarpımdır. Bu iç çarpıma Euclide iç çarpımı denir. Bu iç çarpım ile birlikte Rn standart vektör uzayına Euclide uzayı denir. Bu iç çarpıma vektörlerin skalar çarpımı da denir ve n < a ' b >= ∑ aibi i =1 gösterimi kullanılmaktadır. Rn×m de A , B ∈ Rn × m için n m < A , B >= ∑ ∑ aijbij i = 1 j =1 olarak tanımlı <.,. > fonksiyonu bir iç çarpımdır. Teorem (V , <.,. > ) bir iç çarpım uzayı olmak üzere, ( < u , v > )2 ≤< u , u >< v , v > dır. (Cauchy-Schwarz Eşitsizliği) Teorem (V , <.,. > ) bir iç çarpım uzayı olmak üzere <.,. > iç çarpım yardımıyla tanımlı, . < , > :V → R 1 u → u < ,> = ( < u, u > ) 2 fonksiyonu V de bir normdur. Bir iç çarpım uzayında ayrıca bir norm verilmemişse norm olarak bu iç çarpıma dayalı . < , > normu sözkonusu olacaktır ve gösterim olarak sadece . yazılacaktır. Tanım M boş olmayan bir küme olmak üzere, d: M × M → R fonksiyonu, i) d ( x, y) ≥ 0 ii ) d ( x , y ) = 0 ⇔ x = y iii ) d ( x , y ) = d ( y , x ) iv ) d ( x , z ) ≤ d ( x , y ) + d ( y , z ) özelliklerini sağladığında, d fonksiyonuna M kümesinde metrik, ( Μ , d ) ikilisine metrik uzay ve d ( x , y ) sayısına x ile y elemanları arasındaki uzaklık denir. Örnek R reel sayılar kümesinde, d ( x, y) = x − y olarak tanımlı d fonksiyonu bir metriktir. Örnek (V , . ) bir normlu vektör uzayı olmak üzere, d (u, v ) = u − v olarak tanımlı d fonksiyonu V de bir metriktir. Örnek R3×1 Euclide uzayında a , b ∈ R3×1vektörleri için, 3 d ( a , b) = b − a = ( ∑ (bi − ai )2 )1 2 i =1 olmak üzere, d ( a , b) sayısı, a ile b vektörleri arasındaki uzaklık yerine a ile b vektörlerine karşılık gelen A ile B noktaları arasındaki uzaklık olarak yorumlanmaktadır. (V , < .,. > ) bir iç çarpım uzayı olmak üzere, < u, v > cos( u , v ) = u v sayısına u ile v vektörleri arasındaki "açının kosinüsü" denir ve trigonometrideki kosinüs gibi yorumlanır. Normları sıfırdan farklı iki u ile v vektörleri için < u , v >= 0 ise bu vektörlere dik (ortogonal) vektörler denir ve u⊥ v biçiminde gösterilir. V ‘nin V1,V2 altkümelerinde ∀x ∈ V1 ve ∀y ∈ V2 vektörleri için x ⊥y ise V1 kümesine V2 ye diktir denir ve V1 ⊥ V2 biçiminde gösterilir. Örnek Rn Euclide uzayında a , bε Rn için, < a , b >= ∑ aibi = a ′ b n i =1 olmak üzere , bu uzayda iç çarpıma dayalı norm, 1 1 1 a = ( < a , a > ) 2 = ( ∑ ai2 ) 2 = ( a ′ a ) 2 n i =1 ve a , b vektörleri arasındaki açının kosinüsü, n cos( a , b) = ∑ aibi i =1 n 1 ( ∑ ai2 ∑ bi2 ) 2 i =1 i =1 n dır. Tanım M boş olmayan bir küme olmak üzere, d: M × M → R fonksiyonu, i) d ( x, y) ≥ 0 ii ) d ( x , y ) = 0 ⇔ x = y iii ) d ( x , y ) = d ( y , x ) iv ) d ( x , z ) ≤ d ( x , y ) + d ( y , z ) özelliklerini sağladığında, d fonksiyonuna M kümesinde metrik, ( Μ , d ) ikilisine metrik uzay ve d ( x , y ) sayısına x ile y elemanları arasındaki uzaklık denir. Örnek R reel sayılar kümesinde, d ( x, y) = x − y olarak tanımlı d fonksiyonu bir metriktir. Örnek (V , . ) bir normlu vektör uzayı olmak üzere, d (u, v ) = u − v olarak tanımlı d fonksiyonu V de bir metriktir. Tanım V bir vektör uzayı ve U ⊂ V olmak üzere, her x , y ∈ R için ax + by ∈ U oluyorsa U ye V nin alt vektör uzayı denir. V bir vektör uzayı ve v1 , v2 ,..., vm ∈V olmak üzere bu vektörlerin lineer bileşimi olarak yazılabilen vektörlerin kümesi, m span {v1 , v2 ,..., vm } = [v1 v2 ...vm ] = v ∈ V : v = ∑ ai vi , ai ∈ R, i = 1, 2,..., m i =1 bir alt vektör uzayıdır. Bu alt vektör uzayına v1 , v2 ,... vm vektörlerinin gerdiği uzay denir. k Tanım V bir vektör uzayı ve v1 , v2 ,..., vk ∈V olmak üzere ∑ aivi = 0 olacak şekilde i =1 tümü sıfır olmayan a1 , a2 ,..., ak ∈ R sayıları varsa v1 , v2 ,..., vk vektörlerine lineer bağımlı vektörler, aksi halde, yani k ∑ ai vi = 0 i =1 ⇒ ai = 0 , i = 1, 2 ,..., k oluyorsa v1 , v2 ,..., vk vektörlerine lineer bağımsız vektörler denir. Tanım V bir vektör uzayı, U kümesi (U ⊂ V ) lineer bağımsız vektörlerin bir kümesi olmak üzere V nin herbir elemanı U deki vektörlerin lineer bileşimi olarak yazılabiliyorsa U ye V nin bir bazı denir. V bir iç çarpım uzayı ve S deki vektörler birbirine dik olduğunda U ye ortogonal baz denir. Bir ortogonal bazdaki vektörler birim normlu ise bu baza ortonormal baz denir. V nin bütün bazları aynı sayıda elemana sahiptir. Bazın eleman sayısına V nin boyutu denir ve dim(V ) veya boy (V ) biçiminde gösterilir. V bir vektör uzayı ve {v1, v2 ,..., vk } bir baz olmak üzere bir v ∈V elemanı bir tek biçimde, n v = ∑ ai vi i =1 olarak yazılır. ai ∈ R , i = 1, 2 ,..., n sayılarına v vektörünün bu baza göre bileşenleri denir. V iç çarpım uzayı ve {v1, v2 ,..., vk } ortogonal bir baz ise, < v , vi > vi i =1 < vi , vi > n v= ∑ dır. M ve N , V vektör uzayının iki alt uzayı olsun. M ⊕ N = x: x = y + z , y ∈ M , z ∈ N l q olarak tanımlanan M ⊕ N kümesi de V ‘nin bir alt uzayıdır. M ⊕ N ye M ile N nin toplamı diyeceğiz. M ile N ‘nin boyutlarına bağlı olarak, boy ( M ⊕ N ) = boy ( M ) + boy ( N ) − boy ( M ∩ N ) dır. V vektör uzayının M , N alt uzayları için M ∩ N = ∅ ve M ⊕ N = V ise M ile N ye tümleyen alt uzaylar denir. Ayrıca V bir iç çarpım uzayı ve M ile N dik alt uzaylar, yani M ⊥ N ise M ile N ye dik tümleyen alt uzaylar denir ve M = N ⊥ , N = M ⊥ biçiminde gösterilir. Bu durumda V = M ⊕ M ⊥ yazılır. V vektör uzayının tümleyen iki alt uzayı M ve N olmak üzere her v ∈V vektörü bir tek biçimde, v = u + e , u ∈ M ,e ∈ N olarak yazılır. u vektörüne v vektörünün N alt uzayı boyunca M üzerine izdüşümü, e vektörüne ise v vektörünün M alt uzayı boyunca N üzerine izdüşümü denir. V bir iç çarpım uzayı olduğunda, bir M alt uzayı ile ilgili olarak, V = M ⊕ M⊥ ve v ∈V için, v = vˆ + eˆ , vˆ ∈ M , eˆ ∈ M ⊥ olmak üzere, v̂ ya v vektörünün M üzerine dik izdüşümü, ê ya da v vektörünün M ⊥ üzerine dik izdüşümü denir. v = vˆ + eˆ 2 2 2 vˆ = v .cos(v, x) 1 < v, x > x= x x < x, x > < v, x > eˆ = v − x < x, x > vˆ = vˆ . Örnek (V , < , > ) iç çarpım uzayında M ⊂ V alt uzayının bir ortogonal bazı v1 , v2 ,..., vk ise bir v ∈V vektörünün M üzerine dik izdüşümü olan vektör, k vˆ = ∑ i =1 < v, vi > vi < vi , vi > dır. (V , < , > ) bir iç çarpım uzayı ve x1 , x2 ,..., xn vektörleri V nin bir bazı olduğunda bu baz yardımıyla V nin bir ortogonal bazı, Gram-Schmidt yöntemi ile aşağıdaki gibi elde edilmektedir. 1. v1 = 1 x1 x1 2. k = 1, 2 ,..., n − 1 için, k vk +1 = x − < xk +1 , v j > v j k +1 ∑ k j=1 x − < x , v > v k +1 ∑ k +1 j j j=1 1 Böyle elde edilen v1 , v2 ,..., vn vektörleri V nin bir ortonormal bazıdır. Tanım V , W vektör uzayları olmak üzere, A : V →W v → A( v ) fonksiyonu her u , v ∈V ve a , b ∈ R için , A ( av + bu ) = aA( v ) + bA ( u ) özelliğine sahipse, A fonksiyonuna V den W ye bir lineer dönüşüm, l w : w ∈W , ∃v ∈V için w = A( v )q R ( A) = kümesine A lineer dönüşümünün değer kümesi ve N ( A) = l v : v ∈V , A( v ) = 0 q kümesine A lineer dönüşümünün çekirdeği denir. Bir A : V → W lineer dönüşümünün değer kümesi R ( A ) ⊂ W , W da bir alt vektör uzayı ve çekirdeği N ( A ) ⊂ V , V de bir alt vektör uzayıdır. R ( A ) uzayının boyutuna A dönüşümünün rankı denir ve r ( A ) ile gösterilir. boy (V ) = boy ( N ( A )) + boy ( R ( A )) V A W R(A) 0 N(A) vektör uzayının bir bazı v1 , v2 ,..., vm olsun. Bir A : V → W lineer dönüşümünün bilinmesi demek v1 , v2 ,..., v m baz vektörlerinin dönüşümleri olan A ( v1 ), A ( v2 ),..., A ( vm ) ∈W vektörlerinin bilinmesi demektedir. Bu durumda bir v ∈V için, V m r m v = ∑ ci vi i =1 olmak üzere, m A ( v ) = ∑ ci A ( vi ) i =1 dır. V vektör uzayının bir bazı v 2 ,..., v m ve W vektör uzayının bir bazı w1 , w2 ,..., wn olmak üzere A , V den W ya bir lineer dönüşüm olsun. j = 1, 2 ,..., m A ( v j ) ∈W dönüşümü W ‘deki baz vektörlerinin lineer için v j baz vektörünün bileşimi olarak, A ( v j ) = a1 j w1 + a2 j w2 + ... + anj wn biçiminde yazılsın. A lineer dönüşümünün bilinmesi demek A ( v j ) ( j = 1, 2 ,..., m) vektörlerinin bilinmesi, yani a1 j , a2 j ,..., anj ( j = 1, 2 ,..., m) katsayılarının bilinmesi demektir. Bu katsayılar ile oluşturulan, An×m a11 a = 21 ⋮ an1 a12 ⋯ a1m a22 … a2 m ⋮ ⋮ an 2 ⋯ anm matrisine A lineer dönüşümüne karşılık gelen matris denir. Tersine, bir An × m matrisi ve V nin bir v1 , v2 ,..., v m bazı ile W nun bir w1 , w2 ,..., wn bazı ile başlayıp j = 1, 2 ,..., m için, m m r r A ( v j ) = a1 j w1 + a2 j w2 + ... + anj wn olarak tanımlanırsa, A bir lineer dönüşümdür. V ‘nin {v1 , v 2 ,..., v m } , W ‘nun {w1 , w2 ,..., wn } bazları için A lineer dönüşüme karşılık gelen matris An × m = ( aij )n × m olsun. Bir v ∈V vektörü için, m v = ∑ ci vi i =1 olmak üzere, m A( v ) = ∑ c j A( v j ) j =1 m n = ∑ c j ∑ aij wi j =1 i =1 n m = ∑ ( ∑ aijc j ) wi i =1 j =1 n m = ∑ ( ∑ aijc j ) wi i =1 j =1 m r dır. v nin lineer dönüşümü olan A ( v ) vektörünün W da w1 , w2 ,..., wn bazına göre bileşenleri A n × m matrisi ile v sütun vektörünün çarpımındaki bileşenlerdir. Bir A lineer dönüşümüne karşılık gelen A n × m matrisi, karışıklığa yol açmadığı takdirde yine A ile gösterilir. Rm×1 ‘den Rn ×1 'e tanımlı bir A lineer dönüşümüne standart bazlara göre karşılık gelen matris n × m boyutlu A matrisi ise, bir v ∈ Rm ×1 vektörünün görüntüsü A matrisi ile v vektörünün çarpımı olan, A ( v ) = Av vektörüdür. A lineer dönüşümünün değer kümesi, bu lineer dönüşüme karşılık gelen A matrisinin sütun vektörlerinin gerdiği alt uzaydır. Bir A matrisinin sütun vektörlerinin gerdiği R( A) uzayını A biçiminde de göstereceğiz. V bir vektör uzayı, M ile N tümleyen iki alt uzay, V = M⊕N ve v ∈V için, v = u + e , u ∈ M ,e ∈ N olmak üzere N boyunca M üzerine izdüşüm dönüşümü olan, A:V → V v → Av = u dönüşümü bir lineer dönüşümdür. Bu dönüşüm için, R ( A) = M N ( A) = N dır. Ayrıca, AA ( v ) = A ( A ( v )) = A ( u ) = u olduğundan, AA = A2 = A dır. M boyunca N üzerine izdüşüm dönüşümü de bir lineer dönüşümdür ve I birim dönüşümü göstermek üzere, bu dönüşüm I − A dır. u = Av vektörüne V nin N alt uzayı boyunca M üzerine izdüşümü denir. A izdüşüm dönüşümü bir lineer dönüşüm olmak üzere PM , N biçiminde gösterilir. PM , N aynı zamanda N boyunca M üzerine izdüşüm dönüşümüne karşılık gelen matrisi de göstersin. 2 PM = PM , N ,N olmak üzere PM , N idempotent bir matristir. A: n × n ∈ L (V ,V ) idempotent bir matris olmak üzere, V = R ( A) ⊕ N ( A) ve A = PR ( A ), N ( A ) dır. Gerçekten, v ∈V için, A idempotent olduğunda, v = Av + ( I − A ) v dır. , Av ∈ R ( A ) , ( I - A ) v ∈ N ( A ) V = V1 ⊕ V2 ⊕ ⋯ ⊕ Vk olmak üzere i = 1, 2 , L , k için Pi :V → Vi dönüşümü V ‘nin Vi üzerine izdüşümü olsun . O zaman a ) Pi2 = Pi , i = 1, 2,⋯ , k b) Pi Pj = 0 , i ≠ j , i, j = 1, 2,⋯ , k c) P1 + P2 + ⋯ + Pk = I dır . Bu özellikler , v ∈V vektörününün vi ∈ Vi , i = 1, 2,⋯ , k ve v = v1 + v 2 + ⋯ + v k olacak şekilde bir tek biçimde yazılmasının bir sonucudur. (V , < , > ) bir iç çarpım uzayı, M , V nin bir alt uzayı, V = M ⊕ M⊥ ve v ∈V için, v = vˆ + eˆ , vˆ ∈ M , eˆ ∈ M ⊥ olmak üzere M üzerine dik izdüşüm dönüşümü olan PM : V → M v → PM (v) = vˆ dönüşümü bir lineer dönüşümdür, R ( PM ) = M 2 PM = PM ve ayrıca ' PM = PM dır. Gerçekten , x1 = xˆ1 + eˆ1 , x2 = xˆ2 + eˆ2 , x1 , x2 ∈ V , xˆ1 , xˆ2 ∈ M , eˆ1 , eˆ2 ∈ M ⊥ olmak üzere, x1 , PM x2 = xˆ1 + eˆ1 , xˆ2 = xˆ1 , xˆ2 + eˆ1 , xˆ2 = xˆ1 , xˆ2 = xˆ1 , xˆ2 + eˆ2 = PM x1 , x2 olduğundan ' PM = PM dır. PM dik izdüşüm dönüşümü bir lineer dönüşüm olmak üzere PM ye karşılık gelen matris 2 ' PM = PM = PM den dolayı idempotent ve simetrik bir matristir. MATRĐSLERĐN GENELLEŞTĐRĐLMĐŞ ĐNVERSLERĐ 1955 yılında Penrose ∀A: n × m matrisi için (reel veya kompleks elemanlı) aşağıdaki denklemleri sağlayan bir tek G matrisinin var olduğunu ispatlamıştır. 1) AGA = A 2) GAG = G 3) ( AG )* = AG 4) ( GA)* = GA Burada * işareti matrisin konjuge (eşlenik) transpozunu göstermektedir. Reel elemanlı matrisleri için Penrose denklemlerini bir kez daha yazalım. 1) AGA = A 3) ( AG ) ′ = AG 2) GAG = G 4) ( GA) ′ = GA Bu dört koşulu sağlayan G matrisi Moore tarafından da incelenmiş olup bu matrise Moore-Penrose genelleştirilmiş inversi denir ve A + ile gösterilir. Moore tanımlaması aşağıdaki gibidir. A ∈ R n × m için, AA + = PR ( A ) A + A = PR ( A + ) olacak şekilde A + matrisine A nın genelleştirilmiş inversi denir. A + için Moore tanımlaması ile Penrose tanımlamasının denk oldukları gösterilebilir.(Campbell ve Meyer (1979)) lq Penrose koşullarından sadece birinci koşulu sağlayan matrislere 1 - lq koşullu inversler veya c-inversler denir. Bir A matrisinin 1 -koşullu inversi A− veya Ac , Ag biçiminde gösterilir. Penrose koşullarından örneğin sadece 1) ve 2) koşulunu sağlayan matrislere 1, 2 -koşullu inversler denir. Moore-Penrose genelleştirilmiş inversi başka bir ifade ile 1, 2 , 3, 4 -koşullu invers 'dir l q l q l1q-Koşullu Đnversler: A: n × m ve rank ( A ) = r olmak üzere, singüler olmayan P: n × n , Q: m × m, D: r × r matrisleri vardır, öyleki D 0 PAQ = 0 0 biçiminde yazılabilir. E , F , H uygun boyutlu isteksel matrisler olmak üzere, D −1 AQ F E PA = A H olduğundan, D −1 A =Q F E P H − lq matrisi A ‘nın bir 1 -koşullu inversidir. E , F , H matrisleri isteksel olduklarından, A matrisinin birden çok 1 -koşullu inversi olabilir. Her A matrisinin en az bir tane 1 -koşullu inversi vardır. Q ile P matrislerinin singüler olmadığı ve D matrisinin rankının r olduğu gözönüne alınırsa E ile F matrisinin sıfır matrisleri olarak alınması durumunda H matrisinin seçimine bağlı olarak A − nin rankı r ≤ rank( A − ) ≤ min n, m olacak şekilde değişik ranklı A − 1 -koşullu inversleri vardır. lq lq l q lq Teorem Ax = g denklem sistemini göz önüne alalım. a) Denklem sisteminin tutarlı olması için gerek ve yeter şart AA − g = g lq olmasıdır. (Burada A − , A nın bir 1 -koşullu inversidir.) b) Denklem sistemi tutarlı olsun. x 0 = G g nin bir çözüm olması için gerek ve yeter şart G matrisinin A nın bir 1 -koşullu inversi olmasıdır. lq c) Denklem sistemi tutarlı olsun. z isteksel bir vektör olmak üzere, x = A − g + ( I − A − A) z denklem sisteminin bir çözümüdür. Ax = g lineer denklem sistemlerinin çözümünü halleden A − inversi matris denklemlerinin çözümünde de kullanışlıdır. X bilinmeyen bir matris olmak üzere, AXB = C matris denkleminin tutarlı olması için gerek ve yeter şart, AA − CB − B = C olmasıdır ve bu durumda çözümler, X = A − CB − + ( Z − A − AZBB − ) dır. Burada Z uygun boyutlu isteksel bir matristir. l1q-Koşullu Đnverslerin Bazı Özellikleri 1) A regüler ise A − = A −1 dır. A: n × k tam satır ranklı ( rank( A ) = n ) ise, A − = A ′ ( AA ′ ) −1 olup A − matrisi A nın sağ inversidir, yani AA − = I n dır. A: n × k tam sütun ranklı ( rank( A ) = k ) ise, A − = ( A ′ A ) −1 A ′ olup A − matrisi A nın sol inversidir, yani A − A = I k dır. A idempotent ise A − = A dır. 2) ( A′ ) − = ( A − ) ′ dır. Eğer A simetrik, yani A ′ = A ise A − ve ( A − ) ′ matrisleri A nın lq lq 1 2 birer 1 -koşullu inversidir ve G = ( A − + ( A − ) ′ ) matrisi A nın simetrik bir 1 koşullu inversidir. 3) AA − , A − A, I − AA − , I − A − A matrisleri idempotentir ve R ( AA − ) = R ( A), R ( A − A) = R ( A′ ), N ( A − A) = N ( A) dır. − A− A 0 4) = 0 B 0 0 dır. C nin satır vektörleri A nın satır uzayında ise, B− − A− A C = 0 0 0 0 0 dır. 5) A = A( A′A)− A′A = AA ′ ( AA ′ ) − A dır. Buna göre ( A ′ A ) − A ′ ile A ′ ( AA ′ ) − matrisleri A nın birer 1 -koşullu inversidir. lq lq 6) ( A′ A)1− ve ( A′ A) 2− matrisleri A′ A ‘nın iki 1 -koşullu inversi olmak üzere A( A′ A)1− A′ = A( A′ A) 2− A′ dır. 7) AA − ve A − A matrisleri idempotent olduklarından birer izdüşüm matrisleridir. A: n × m , AA − ∈ R n × n , A − A ∈ R m× m olmak üzere, PR ( AA − ), N ( AA − ) = AA − PR ( A − A), N ( A − A) = A − A dır. Ayrıca R n = R ( A) ⊕ S , R m = N ( A) ⊕ T olmak üzere N ( A − A) = S ve R ( A − A) = T olacak şekilde A ‘nın bir A − 1 -koşullu inversi vardır, öyle ki, PR ( A),S = AA − ve A − A = PT , N ( A) dır. lq 8) A matrisi için A ( A ′ A ) − A ′ matrisi simetrik ve idempotentdir. A ( A ′ A ) − A ′ A = A olmak üzere A ( A ′ A ) − A ′ matrisine karşılık gelen lineer dönüşüm R ( A) = A üzerine bir dik izdüşümdür, yani A ( A ′ A ) − A ′ = P A dır.. n s 9) y ∈ R n , X : n × p olmak üzere, X = X b:b ∈ R p uzayında y vektörüne Euclide metriğine göre en yakın, yani ( y − X b ) ′ ( y − X b) iç çarpımını en küçük yapan vektör, yˆ = P[ X ] y = X ( X ′X )− X ′ y = X b0 dır. Burada b 0 = ( X ′X ) − X ′ y vektörü, tutarlı olan ve normal denklemler ismini taşıyan, X ′X b = X ′ y denklem sisteminin bir çözümüdür. rank( X ) = rank( X ′X ) < p olduğunda normal denklemlerin birden çok çözümü olmasına rağmen yˆ = X ( X ′X )− X ′ y bir tektir. 10) y ∈ R n , X : n × p olmak üzere X ′X b = X ′ y normal denklemlerin bir çözümü b̂ olmak üzere λ ′ b̂ lineer bileşiminin (sayısının) bir tek olması ( b̂ çözümüne bağlı olmaması) için gerek ve yeter şart λ ' = λ ' ( X ′X ) − X ′X olmasıdır. 11) λ: p × 1 vektörünün X : n × p matrisinin satır vektörlerinin gerdiği uzayda olması (yani λ ' = c ' X , ∃c ∈ R n ) için gerek ve yeter şart λ ' = λ ' ( X ′X ) − X ′X olmasıdır. {1, 2,3, 4} -Koşullu (Moore-Penrose Tipi )Đnverslerin Bazı Özellikleri Moore-Penrose tipi genelleştirilmiş inversleri ile ilgili bazı özellikler aşağıda özetlenmiştir. 1) Eğer A karesel ve singüler olmayan bir matris ise A + = A −1 dır. 2) A: n × m ve rank(A) = m , yani A nın sütun vektörleri lineer bağımsız ( A tam sütun ranklı) ise, A + = ( A ′ A ) −1 A ′ dır. A + matrisi A nın sol inversidir. 3) A: n × m ve rank(A) = n , yani A tam satır ranklı ise, A + = A ′ ( A ′ A ) −1 dır. A + matrisi A nın sağ inversidir. 4) A:1 × 1 tipinde bir matris, yani A = a , a ∈ R ise, [ 0] , a = 0 A = lim( A′A + δ I ) A′ = 1 δ →0 a , a ≠ 0 + 2 −1 dır. a ∈ R reel sayısı için, a + R|0 = S1 |T a ,a = 0 ,a ≠ 0 olarak tanımlansın. 5) A köşegen matris yani, d1 0 A= ⋮ 0 0 d2 ⋮ 0 0 ⋯ 0 ⋮ ⋯ dn ⋯ ise, d1+ 0 + A = ⋮ 0 0 ⋯ 0 d 2+ ⋯ 0 ⋮ ⋮ 0 ⋯ d n+ dır. 6) A: n × 1 tipinde bir vektör, yani A = a ∈ R n ×1 ise, a + = (a' a)+ a' dır. 7) A simetrik ve idempotent, yani A′ = A ve A2 = A ise A + = A dır. 8) ( A + ) + = A 9) ( A′ ) + = ( A + ) ′ dır. Eğer A ′ = A ise ( A + ) ′ = A + dır. A simetrik ise A+ de simetriktir, yani 10) A + = ( A ′ A ) + A ′ = A ′ ( AA ′ ) + R| A′ = A′ AA + = A + AA′ | 11) S R ( A ) = R ( AA ′ ) = R ( AA + ) || R ( A + ) = R ( A′ ) = R ( A + A) = R ( A′ A) T 12) a , b ∈ R n için ( ab ' ) + = ( a a ' ) + ( b ' b ) + ba ' dır. 13) Herhangi bir A: n × m, rank( A) = r matrisi için, A = BC ( B: n × r , C: r × m, rank( B ) = rank( C ) = r ) biçiminde yapılan ayrışım altında, A + = C + B + = C ′ ( CC ′ ) −1 ( B ′ B ) −1 B ′ = C ′ ( B ′ A C ′ ) −1 B ′ dır. 14) A: n × m ve P: n × n , Q: m × m ortogonal matrisler olmak üzere, ( PAQ ) + = Q′A + P ′ dır. 15) A: n × n , A′ = A ve A nın spektral ayrışımı, A = PDP ′ olmak üzere, A + = PD+ P ′ dır. 0 A11+ + ise A = A22 0 A 16) A = 11 0 17) ( A ⊗ B ) + = A + ⊗ B + Elemanları 1 olan J n× m 1 1 = ⋮ 1 n×m 0 dır. A22+ tipinde matris, 1 ⋯ 1 1 ⋯ 1 ⋮ ⋮ 1 ⋯ 1 1 1 = ⊗ [1 1 ⋯ 1]1×m ⋮ 1 n×1 olmak üzere, + J n+×m 1 1 1 + = ⊗ [1 1 ⋯ 1]1×m = 1 1 L ⋮ n 1 n×1 LM1OP 1 1 1 = Jm× n 1 1× n ⊗ M P m M MP n. m MN1PQ m ×1 dır. 18) P X = XX + , yani XX + matrisi X in sütun vektörlerinin gerdiği, X ⊂ R n alt uzayı üzerine dik izdüşüm matrisidir (operatörüdür). Ayrıca, P[ X ]⊥ = I − XX + , ( R( I − XX + ) = R( X )⊥ = N ( XX + ) = N ( X + )) P X ′ = X + X P[ X ′]⊥ = I − X + X , ( R( I − X + X ) = R( X ′) ⊥ = N ( X + X ) = N ( X )) dır. 19) ( AB) + = ( PR ( A′) B)+ ( APR ( B ) )+ = ( A+ AB)+ ( ABB + ) + 20) A: n × m , B: m × k , rank ( A ) = rank ( B ) = m ise, ( AB ) + = B + A + dır. 21) y ∈ R n , X : n × p olmak üzere, min y − X β = y − X β * ⇔ β * = X + y + ( I − X + X ) z , z ∈ R p β dır. R| S| T 22) min β * : min y − X β = y − X β* β U| = X + y V| W 23) A x = b denkleminin tutarlı olması için gerek ve yeter şart, AA + b = b olmasıdır. Tutarlı olması durumunda çözümler, x 0 = A+b + ( I − A+ A ) z , z ∈ R p isteksel vektör biçimindedir. 24) Moore-Penrose genelleştirilmiş inversini hesaplamak için bir algoritma. A: n × m , rank( A) = r olmak üzere A + yı bulmak için aşağıdaki adımlar izlenebilir: a) B = A′ A yı hesaplayınız. b) C1 = I alınız. 1 k c) Ck +1 = . I . tr ( Ck B ) − Ck B , k = 1, 2 ,..., r − 1 d) A + = r Cr A′ tr ( Cr B ) NOT: Cr +1B = 0 ve tr ( Cr B ) ≠ 0 olması c) adımında durdurma kuralı olarak kullanılırsa bu algoritmada A nın rankının önceden bilinmesi gerekmez. (Graybill, 1983) {1,3} -Koşullu ve {1, 4} -Koşullu Đnverslerin Bazı Özellikleri Penrose denklemlerini bir kez daha yazalım. 1) AGA = A 3) ( AG ) ′ = AG 2) GAG = G 4) ( GA) ′ = GA ve ( AA(1,3) )′ = AA(1,3) özelliklerini sağlayan matrisine A ‘nın {1,3} -koşullu inversi denir. AA(1,3) A = A A(1,3) A(1,4) AA(1,4) = A(1,4) ve ( A(1,4) A)′ = A(1,4) A özelliklerini sağlayan A(1,4) matrisine A ‘nın {1, 4} -koşullu inversi denir. AA (1,3) matrisi için, * AA (1, 3) AA (1, 3) = AA (1, 3) ( A(1, 3) ün Penrose koşullarından 1) i sağladığından) * ( AA (1, 3) )′ = AA (1, 3) ( A(1, 3) ün Penrose koşullarından 3) ü sağladığından) dır, yani AA (1,3) matrisi idempotent ve simetriktir. O zaman AA (1,3) bir dik izdüşüm matrisidir. AA (1,3) = PR ( A ) dır. X ∈ R n × p , y ∈ R n olmak üzere min y − X β = y − XX (1,3) y β dır. βˆ = X (1,3) y vektörü minimizasyon probleminin bir çözümü olmakla birlikte, çözümler arasında minimum normlu olmayabilir. β* = X + y çözümler arasında minimum normludur. A ∈ R n × m , b ∈ R ( A) için Ax = b denklemi tutarlı olmak üzere, ∀A(1,4) için, x * = A (1, 4 ) b çözümü minimum normlu çözümdür. PARÇALANMIŞ MATRĐSLERĐN GENELLEŞTĐRĐLMĐŞ ĐNVERSLERĐ Bu kısımda parçalanmış matrislerin genelleştirilmiş inversleri ile ilgili bazı formüller verilecektir. 1. A: n × k , rank( A ) = r matrisi sütun olarak, A = [U ⋮V ] , U : n × s , V : n × (k − s ) biçiminde iki matrise parçalanmış olsun. U − − U −VC − ( I − UU − ) − A = , C =( I − UU )V − − C ( I − UU ) − − − (1,2) U UU − U VC ( I − UU − ) − A(1,2) = , C =( I − UU )V (1,2) − C ( I − UU ) − U (1,2,3) − U (1,2,3)VC (1,2,3) (1,2,3) = A )V , C =( I − UU (1,2,3) C U + − U +V (C + + K ) + A+ = , C =( I − UU )V + C +K (1,2,3) K = ( I − C+C) I + ( I − C+C)V '(U + )'U +V ( I − C+C) −1 V '(U + )'U +V ( I −VC+ ) dır. Satır olarak ikiye parçalanmış matrisler için benzer sonuçlar transpoz alarak elde edilebilir. Bir matrisin satır ve sütun olarak ikiye yani dört blok matrise parçalanması durumunda genel halde invers formülleri yoktur. Blok matrislerin özel halleri için elde edilen formüllerden bazıları aşağıdaki gibidir. A A 2. A = 1 2 olmak üzere A1 regüler ve rank( A ) = rank( A1 ) ise, A3 A4 A4 = A3 A1−1 A2 dır. P = A3 A1−1 , Q = A1−1 A2 için, A1 A 3 A2 I = A [I A4 P 1 A1 A 3 A2 I −1 = ( ( I + P′P ) A1 ( I + QQ′) ) [ I A4 Q ′ Q] olmak üzere, + P′ ] dır. A A= 1 0 A2 ve R ( A2 ) ⊂ R ( A1 ) , S ( A2 ) ⊂ S ( A3 ) ise, A3 A1 0 dır. + A2 A1+ = A3 0 − A1+ A2 A3+ A3+ A = [U ⋮V ] , U : n × s , V : n × (k − s ) için, U ′U U ′V A′A = ve Q = U ' ( I − VV − )U V ′U V ′V olmak üzere, −Q −U ′V (V ′V )− − − − − (V ′V ) + (V ′V ) V ′UQ U ′V (V ′V ) Q− ( A′A)− = − − −(V ′V ) V ′UQ ( A ' A ) ( 1, 2 ) = LM Q (1,2 ) MN − (V 'V ) − V 'UQ (1,2 ) OP (V 'V ) ( 1, 2 ) + (V 'V ) − V ' UQ (1, 2 )U 'V (V 'V ) − PQ − Q ( 1, 2 )U 'V (V 'V ) − dır. Eğer rank(U ' U ) + rank(V 'V ) = rank( A ' A ) ise, ′ (V ′V )− −Q(1,2,3)UV (1,2,3) − (1,2,3) − ′ ′ (V ′V ) (V ′V ) + (V ′V ) VUQ UV Q(1,2,3) (1,2,3) ′ ( AA) = − (1,2,3) −(V ′V ) V ′UQ Q+ ( A′A)+ = − + −(V ′V ) V ′UQ dır. −Q +U ′V (V ′V ) − + − + − (V ′V ) + (V ′V ) V ′UQ U ′V (V ′V ) A′A L′ matrisi için, K = A ' A + L ' L ve R = LK − L ' olmak üzere, 0 4. M = L K − − K − L′R − LK − M− = R − LK − K − L′R − R− R − R− dır. Eğer S ( L ) ⊂ S ( A ' A ) ise, ( A′A)− − ( A′A)− L′(L( A′A)− L′)− L( A′A)− ( A′A)− L′(L( A′A)− L′)− M− = (L( A′A)− L′)− L( A′A)− −(L( A′A)− L′)− dır. Eğer S ( L ) ⊂ S ( A ' A ) ve rank( L: q × k ) = q ise, ( A′A)− − ( A′A)− L′(L( A′A)− L′)−1 L( A′A)− ( A′A)− L′(L( A′A)− L′)−1 M = (L( A′A)− L′)−1 L( A′A)− −(L( A′A)− L′)−1 − dır. Eğer L: q × k matrisinin satır uzayı A ' A: k × k matrisinin satır uzayının tümleyeni, yani R k = S ( A' A) ⊕ S ( L) ise, K −1 A′AK −1 M+ = −1 LK K −1 L′ 0 dır. Ayrıca, rank( L ) = q ise M matrisi regülerdir ve S ( L ) = S ( A ' A ) ⊥ ise, ( A′A) + M −1 = + ( L )′ dır. L+ 0 EK MATRĐSLER ĐLE ĐLGĐLĐ BAZI HATIRLATMALAR 1) A: n × p tipinde reel sayıların bir matrisi olmak üzere, R p den Rn ye bir lineer dönüşüm belirler. A: R p → Rn b → Ab A matrisinin belirlediği lineer dönüşümün görüntü kümesi R ( A) , A { } A matrisinin satır vektörlerinin gerdiği S ( A) = {c′ A: c ∈ Rn } uzayı R p ‘nin bir alt matrisinin sütun vektörlerinin Rn de gerdiği R ( A) = A = Ab:b ∈ R p alt uzayıdır. uzayıdır. R ( A ) = R ( AA ′ ) , S(A) = S(A ′A) dır. A matrisinin rankı, lineer bağımsız sütun (satır) vektörü sayısı olmak üzere, rank (A)=boyut(R(A))=boyut(S(A)) l q dır. A: n × p ise rank( A) ≤ min n, p dır. 2) a) Bir C matrisi için AC = B ⇔ R ( B ) ⊂ R ( A ) dır. b) R ( AC ) ⊂ R ( A) dır. Eğer C singüler değilse R ( AC ) = R ( A) dır. 3) C singüler değilse rank ( AC ) = rank ( A) . Genelde, rank ( AB) ≤ min {rank ( A), rank ( B )} dır. b) ( AB )−1 = B −1 A−1 c) ( A−1)′ = ( A′ ) −1 4) a) ( AB )′ = B′A′ d) det ( AB ) = det ( A ) det ( B ) e) det( kAn × n ) = k n det( An × n ) 5) A: n × n , A ′ A = I ise A matrisine ortogonal matris denir. A ‘nın sütun vektörleri Rn de bir ortogonal baz oluşturmaktadır. a) (det( A))2 = 1 olmak üzere det( A) = +1 veya −1 dır. b) A−1 = A′ c) AA′ = I dır. A ‘nın satır vektörleri de Rn de bir ortonormal baz oluşturmaktadır. d) Ortogonal matrise karşılık gelen lineer dönüşüme de ortogonal dönüşüm denir. Ax − A y 2 = ( Ax − A y )′ ( Ax − A y ) = ( x − y )′ A′ A( x − y ) = ( x − y )′ ( x − y ) = x − y 2 olmak üzere ortogonal dönüşümler Euclide metriğinde uzaklıkları ve A x , A y = x ′ A′ A y = x ′ y = x , y olmak üzere Euclide bırakmaktadır). iç çarpımında açıları korumaktadır (değişmez 6) Matrislerin Eşelon Forma Getirilmesi A: n × p tipinde bir matris olmak üzere, A matrisi üzerindeki aşağıdaki işlemleri (elemanter satır işlemleri) göz önüne alalım. i1) Matrisin bir satırı (veya sütununu) bir c sabiti ile çarpmak. k .satırı c sabiti ile çarpmak demek A matrisinin soldan singüler olmayan, c, i= j=k Ek ( c ) = ( eij )n × n , eij = 1 , i = j ≠ k 0, i≠k R| S| T U| V| W matrisi ile çarpmaktır. k . sütunu c sabiti ile çarpmak, A matrisini sağdan m × m boyutlu Ek ( c) matrisi ile çarpmak demektir. i2 ) r. satırın (sütunun) yerine " r. satır(sütun) + s. satırın (sütunun) c katının " yazılması. r. satır için bu işlemi yapmak demek A matrisini soldan singüler olmayan aşağıdaki gibi bir matrisle çarpmak demektir. Ers ( c ) = ( eij )n × n , R| 1 eij = S c |T 0 , i= j , i = r, j = s , diðer durumlarda Sütunlar için bu işlemi yapmak için A matrisi sağdan böyle bir matris ile çarpılmaktadır. i3 ) Đki satırın (sütunun) yerinin değiştirilmesi. r. satır ile s. satırın yerini değiştirmek demek A matrisini soldan Es ( −1) Esr ( −1) Ers (1) Esr ( −1) matrisi ile çarpmak demektir. Sütunların yerini değiştirmek için benzer çarpım sağdan yapılmaktadır. Bir matris satır işlemleri yapılarak eşelon forma getirilebilir. Bir matrisin eşelon formda olması demek, bir satırın elemanlarının ya tümü sıfır yada 1 olan elemanın solundakiler sıfır (sağındakiler olmayabilir) ve bir sütunda 1 varsa diğer elemanların 0 olması demektir. 7) A: n × k matrisi (satır işlemlere karşılık gelen matrislerin çarpımı olan) bir B: n × n singüler olmayan matrisi ile çarpılarak eşelon forma getirilebilir. 8) A: n × k , rank ( A ) = r , matrisi için singüler olmayan B: n × n (satır işlemlerine karşılık gelen) ve C: k × k (sütun işlemlerine karşılık gelen) matrisleri vardır öyleki, I BAC = r 0 0 0 I A = B −1 r 0 0 −1 C 0 dır. Ayrıca, = B1C1 olmak üzere, A: n × k matrisi rankları r olan B1: n × r ve C1: r × n gibi iki matrisin çarpımı olarak yazılabilir. 8) A: n × n matrisi için singüler olmayan B: n × n matrisi vardır öyleki, BA üst üçgenseldir (köşegenin altındaki elemanlar sıfırdır). 9) A: n × n ve A simetrik bir matris ise BA B′ köşegen matris olacak şekilde singüler olmayan B: n × n matrisi vardır. 10) Gram-Schmidt Yöntemi A : n × p ( rank ( A) = p ) olmak üzere, matrisinin sütun vektörleri A A(:,1) , A(:,2) ,..., A(:, p ) olsun. * U (:,1) = A(:,1) * U (:,i +1) = A(:,i+1) − U n×i bi +1 ( U n×i = U (:,1) ,U (:,2) ,...,U (:,i ) , bi +1 = U n' ×iU n×i ) −1 U n' ×i A(:,i +1) , i = 1, 2,..., p − 1 olmak üzere, U (:,1) , U (:,2) ,..., U (:, p ) ‘ler ortogonal (dik), yani U '(:,i ) U (:, j ) = 0 , i, j = 1, 2,..., p i≠ j dır. Ayrıca, { } { } span A(:,1) , A(:,2) ,..., A(:,k ) = span U (:,1) , U (:,2) ,..., U (:,k ) , k = 1, 2,..., p { } { R ( A) = span A(:,1) , A(:,2) ,..., A(:, p ) = span U (:,1) , U (:,2) ,..., U (:, p ) dır. U (:,1) , U (:,2) ,..., U (:, p ) vektörleri R( A) için bir ortogonal bazdır. 11) A : n × p (rank ( A) = p) matrisi için U = U n× p = U (:,1) , U (:,2) ,..., U (:, p ) S = ( Sij ) p× p olmak üzere, A = US dır. Sii = 1 , Sij = 0 , i > j j Sij = bi , i ≤ j i, j = 1, 2,..., p } , i = j = 1, 2,..., p U U 'U = D 2 , Dij = (:,i ) , i≠ j 0 A = UD −1DS Q = UD −1 R = DS A = QR A = QR , A matrisinin QR ayrışımı A ' A = (QR) ' QR = R ' R , A ' A ‘nın Cholesky ayrışımı, R üst üçgensel 12) Özdeğerler, Özvektörler ve Spektral Ayrışım A: n × n tipinde reel sayıların bir matrisi olmak üzere, λ ‘ya göre bir polinom denklemi olan, det A − λI = 0 denklemine A ‘nın karakteristik denklemi b g ve köklerine A ‘nın özdeğerleri denir. v ≠ 0 için Av = λ v oluyorsa v vektörüne λ özdeğerine karşılık gelen özvektör denir. Bir özdeğere birden çok özvektör karşılık gelebilir. A: n × n matrisi simetrik olduğunda: a) Özdeğerleri reel sayılardır. Rank ( A ) = r ise 0 sayısı n - r katlı özdeğerdir. λ 1 ≠ λ 2 özdeğerlerine karşılık gelen Av = λ1 v , Aw = λ 2 w özvektörleri için v⊥ w dır. b) A matrisinin rankı sıfırdan farklı özdeğerlerin sayısına (katlı özdeğerler katı kadar sayılmak şartıyla ) eşittir. c) Bir λ i özdeğeri k katlı ise, Av = λi v denklemini sağlayan k tane ortogonal v özvektörü vardır, sıfır vektörü ile birlikte bu k tane özvektör bir Vi alt vektör uzayı (özdeğer uzayı) germektedir. A nin farklı özvektörleri λ1 , λ2 ,..., λ r olmak üzere bunlara karşılık gelen V1 ,V2 ,...,Vr özdeğer uzayları birbirine dik ve Rn = V1 ⊕ V2 ⊕... ⊕Vr dır. d) A nın özdeğerleri λ1 , λ 2 ,..., λ n ve λ1 0 ...... 0 0 λ ....... 0 2 D= . 0 0 ....... λn b g olsun. P: n × n ortogonal matrisi P′P = I A nın normlanmış özvektörlerinin matrisi (eşit özdeğerler için karşılık gelen özdeğer uzayının ortonormal baz vektörleri) olmak üzere, AP = DP A = PDP′ dır. n A = PDP′ = ∑ λ i v i v i' i =1 gösterimine A matrisinin spektral ayrışımı (spectral decomposition) denir. n A 2 = ∑ λ2i v i v i' i =1 olmak üzere, biçimsel olarak, c ∈ R için, n A c = ∑ λci v i v i' i =1 veya n f ( A ) = ∑ f ( λ i ) v i v i' i =1 gibi gösterimler operatör hesabında kullanılmaktadır. 13) Bir Matrisin Tekil Değer Ayrışımı (Singular Value Decomposition) A : n × p tipinde bir matris, rank ( A ) = r V : p × p ortogonal matrisleri vardır, öyleki olmak üzere U : n×n , D 0 A =U V' 0 0 biçiminde yazılır. Burada, U matrisi AA′ nın ve V matrisi A′ A nın normlanmış özvektörlerinin matrisleridir. D matrisi, AA′ matrisinin ( A′ A matrisinin) sıfırdan farklı di ( di > 0 ,i = 1, 2 ,..., r ) özdeğerlerinin, d1 0 ...... 0 0 d 2 ....... 0 D= . 0 0 ....... d r köşegen matrisidir. U matrisinin ilk r sütunundan oluşan matris U1 : n × r (U1'U1 = I r ) , P matrisinin ilk r satırından oluşan matris V : r × p (V V 1 ' 1 1 = I r ) olmak üzere, A = U1DV1' dır. Tersine, bu gösterimden yukarıdakine geçmek için D matrisi sıfır matrisleri ile genişletilecek ve Q1 ile P1 matrisleri ortogonal matrisler olacak şekilde genişletileceklerdir. A matrisinin böyle bir gösterimine tekil değer ayrışımı ve D matrisinin elemanlarına A ‘nın tekil değerleri denir. Örnek: A matrisinin bir g-inversinin hesaplanması (Matlab): >>A = [1 1 1 1 1 1 1 1 1]; >> [U D V]=svd(A); >> r=rank(A); %F,G,H isteksel (keyfi) matrisler >> F=ones(r,size(A,1)-r); % F=rand(r,size(A,1)-r) olabilir >> G=rand(size(A,2)-r,r); % G=zeros(size(A,2)-r,r) olabilir >> H=rand(size(A,2)-r,size(A,1)-r); % H=ones(size(A,2)-r,size(A,1)-r) olabilir >> ginvA=V*[inv(D(1:r,1:r)) F ; G H]*U' ginvA = >> pinv(A) -0.2943 -0.3043 -0.1574 0.1111 0.1111 0.1111 1.9667 -0.1458 -0.5140 0.1111 0.1111 0.1111 0.6609 -0.2165 0.1111 0.1111 0.1111 0.0047 >> A*ginvA*A >> A*pinv(A)*A 1.0000 1.0000 1.0000 1.0000 1.0000 1.0000 1.0000 1.0000 1.0000 1.0000 1.0000 1.0000 1.0000 1.0000 1.0000 1.0000 1.0000 1.0000 A= [1 1 1 1 1 1 1 1 1] >> [U D V]=svd(A); >> r=rank(A); >> F=zeros(r,size(A,1)-r); >> G=zeros(size(A,2)-r,r); >> H=zeros(size(A,2)-r,size(A,1)-r); >> ginvA=V*[inv(D(1:r,1:r)) F ; G H]*U' ginvA = 0.1111 0.1111 0.1111 0.1111 0.1111 0.1111 0.1111 0.1111 0.1111 >>1/9*ones(3,3) ans = 0.1111 0.1111 0.1111 0.1111 0.1111 0.1111 0.1111 0.1111 0.1111 Örnek: Gram-Schmidt Yöntemi Clc;clear all;close all A = [1 1 1 1 2 4 1 3 9 1 4 16] U(:,1)=A(:,1); n=size(A,1); p=size(A,2); S=zeros(p,p); for ii=1:p S(ii,ii)=1; end for i=1:(p-1) beta=regress(A(:,(i+1)),U); S(1:i,(i+1))=beta; U(:,(i+1))=A(:,i+1)-U*beta; end U S D2=U'*U; D=sqrt(D2); Q=U*inv(D) R=D*S Q*R A= 1 1 1 1 2 1 3 1 4 U= 1.0000 1.0000 1.0000 1.0000 S= 1.0000 0 0 Q= 0.5000 0.5000 0.5000 0.5000 R= 2.0000 0 0 QR = 1.0000 1.0000 1.0000 1.0000 4 9 16 -1.5000 -0.5000 0.5000 1.5000 1.0000 -1.0000 -1.0000 1.0000 2.5000 7.5000 1.0000 5.0000 0 1.0000 -0.6708 -0.2236 0.2236 0.6708 0.5000 -0.5000 -0.5000 0.5000 5.0000 15.0000 2.2361 11.1803 0.0000 2.0000 1.0000 2.0000 3.0000 4.0000 1.0000 4.0000 9.0000 16.0000