2. Ders NORMAL DAĞILIM ve NORMAL DAĞILIMLI RASGELE VEKTÖRLERĐN KARESEL FORMLARININ DAĞILIMLARI Bir X rasgele değişkenin olasılık yoğunluk fonksiyonu, 1 x −µ − ( )2 1 2 σ e , −∞ < x < ∞ 2 πσ f ( x) = biçiminde olduğunda, X rasgele değişkenine normal dağılıma sahiptir denir ve X ∼ N ( µ , σ2 ) biçiminde gösterilir. µ ∈ R ve σ ∈ ( 0, ∞ ) sayıları, dağlılımın parametreleri olmak üzere 1 x −µ ∞ − ( )2 1 σ 2 E( X ) = x e dx = µ 2 πσ -∞ z E( X ) = 2 ∞ zx -∞ 1 x −µ 2 − ( )2 1 2 σ e dx = σ2 + µ2 2 πσ ve Var ( X ) = σ2 dır. Normal dağılıma sahip bir X r.d. nin moment çıkaran fonksiyonu, µ t+ M X ( t ) = E ( etx ) = e σ2 t 2 2 dır. µ = 0 , σ = 1 olan N ( 0 ,1) dağılımına standart normal dağılım denir. Z ∼ N ( 0 , 1) için x2 1 −2 φ( z ) = e dx , z ∈ R π 2 −∞ z z fonksiyonu standart normal dağılımın dağılım fonksiyonu olmak üzere bu fonksiyonun değerleri standart normal dağılım tablolarında mevcuttur. X1 , X 2 ,..., X n , N ( µ , σ2 ) normal dağılımından bir örneklem olmak üzere, dağılımın paremetrelerinin en çok olabilirlik tahmin edicileri, n µˆ = ∑X i =1 n i =X ve n σɶ 2 = ∑(X i =1 i − X )2 n dır. Bu tahmin ediciler bağımsız istatistiklerdir. Aynı zamanda momentler yöntemi ile elde edilen tahmin edicilerdir. Ayrıca, µ̂ en küçük kareler tahmin edicisidir. Yansız ve tutarlı bir tahmin edici olan µ̂ tahmin edicisi N ( µ , σ2 n ) dağılımlıdır. E (σɶ 2 ) = n −1 2 σ n olmak üzere σɶ 2 tahmin edicisi yansız değildir. Yansız olacak şekilde düzeltilmiş olan tahmin edici, n n σˆ 2 = σɶ 2 = n −1 ∑(X i =1 i − X )2 n −1 olsun. σˆ nin dağılımı ile ilgili olarak 2 n (n − 1)σˆ 2 σ 2 = ∑(X i =1 i σ − X )2 2 ∼ χ (2n −1) olduğunu hatırlatalım. Tanım Σ : n× n tipinde pozitif tanımlı simetrik matris, µ:n × 1 tipinde bir vektör olmak üzere bir Y rasgele vektörün olasılık yoğunluk fonksiyonu f ( y ) = f ( y1 , y2 ,..., yn ) = (2π ) 1 n ( y − µ )′Σ −1 ( y − µ ) 2 e − det(Σ ) , − ∞ < yi < ∞, i = 1, 2,..., n biçiminde ise Y rasgele vektörüne normal dağılıma (çok değişkenli normal dağılıma) sahiptir denir. Y rasgele vektörü normal dağılıma sahip olduğunda moment çıkaran fonksiyonu M Y ( t ) = E ( et ′ Y ) = ∞ ∫ ∞ ⋯ −∞ ( y−µ )′Σ−1 ( y−µ ) t ′ y− 2 1 ∫ (2π )n det(Σ) −∞ e dy1...dyn t ′Σt t ′ µ+ 2 =e dır. Y vektörünün i . bileşeninin moment çıkaran fonksiyonu MYi ( ti ) = MY ( 0 ,..., 0 , ti dır. Burada σii , Σ fonksiyondan n’nın 1 ti µi + σiiti2 2 , 0 ,..., 0 ) = e i . köşegen elemanıdır. Bu moment çıkaran Yi ∼ N (µi , σii ) , i = 1,..., n olduğu söylenebilir. Y nin herbir bileşeni bir boyutlu normal dağılıma sahiptir. Yi ile Yj nin ortak marjinal dağılımını bulalım. M Yi ,Y j ( t i , t j ) = M Y ( 0,..., 0, t i , 0,..., t j , 0,..., 0) =e ti µi +t j µ j + σiiti2 +2σij tit j +σ jj t 2j 2 σ σij t i t ,t ii i j σ σ jj t j µ ij t ,t i + i j µ j 2 =e olmak üzere (Yi , Yj ) nin ortak dağılımı iki değişkenli normal dağılımdır. Ayrıca, E (Yi ) = µi Var (Yi ) = σii E ( Yj ) = µ j Var (Y j ) = σ jj Cov(Yi , Y j ) = σij dır. vektörünün yoğunluk fonksiyonunda bulunan µ vektörü Y nin bileşenlerinin ortalamalarının vektörü, Σ matrisi ise Y nin bileşenlerinin varyans-kovaryans matrisidir. Y σ 11 σ 12 ⋯ σ 1n σ i = 1, 2,..., n σ 22 ⋯ σ 2 n 21 Σ = Cov(Y ) = , σ ij = Cov(Yi , Y j ) , ⋮ j = 1, 2,..., n ⋮ ⋮ σ n1 σ n 2 ⋯ σ nn Bir E (Y ) = µ Y rasgele vektörü n-değişkenli normal dağılıma sahip ve , Cov (Y ) = Σ , rank( Σ ) = n ise bu kısaca, Y ∼ N (µ , Σ ) biçiminde gösterilir. Burada Σ varyans-kovaryans matrisi simetrik ve pozitif tanımlı bir matristir. Bu durumdaki çok değişkenli normal dağılımlara singüler olmayan çok değişkenli normal dağılım denir. Y ∼ N ( µ , Σ ) olmak üzere Y nin lineer dönüşümü olan, U = AY + b rasgele vektörü de normal dağılıma sahiptir. Gerçekten, Mu ( t ) = E ( et ′ u ) = E ( et ′ ( AY + b ) ) = et ′b E ( et ′ AY ) t ′b =e t ′b MY ( A′ t ) = e 1 t ′ Aµ + t ′ A Σ ( t ′ A )′ 2 e olmak üzere u rasgele vektörü, U ∼ N ( A µ + b , A ΣA′ ) dağılımına sahiptir. µ = 0 , Σ = I olması durumunda N ( 0, I ) dağılımına çok değişkenli standart normal dapılım denir. Y ∼ N ( µ , Σ ) olmak üzere, Σ:n × n varyanskovaryans matrisinin Σ −1 invers matrisi kendi özdeğer ve özvektörlerinin oluşturduğu matrisler cinsinden, d1 0 −1 Σ = P ⋮ 0 0 d2 ⋮ 0 0 ⋯ 0 P′ 0 ⋯ dn ⋯ olarak yazılsın ve Σ −1/ 2 olsun. = P d1 0 ⋯ 0 d2 ⋯ ⋮ ⋮ 0 0 ⋯ 0 0 P′ 0 d n Z = Σ −1/ 2 ( Y − µ ) dönüşümü sonucu Z rasgele vektörü standart normal dağılıma sahiptir, yani Z ∼ N ( 0, I ) dır. Marjinal ve Koşullu Dağılımlar Y n×1 ∼ N ( µ , Σ ) , rank( Σ ) = n σ11 σ12 ⋯ σ1n Y1 µ1 σ Y µ σ 22 ⋯ σ 2n 21 2 2 , σ ii = Var (Yi ) , σ ij = σ ji = Cov (Yi , Y j ) Y = , µ= , Σ= ⋮ ⋮ ⋮ ⋮ ⋮ σ Yn µ n n1 σ n 2 ⋯ σ nn MY 1 t ′ µ + t ′Σ t 2 (t ) = e olmak üzere Y1, Y2 ,..., Yk ( k < n ) rasgele değişkenlrinin ortak marjinal veya Y1 Y 2 =Y 1 ⋮ Yk vektörünün marjinal dağılımını bulmak için Y1 'in moment çıkaran fonksiyonunu bulalım. k ∑ M Y 1 (t1 , t2 ,..., tk ) = M Y (t1 , t2 ,..., tk , 0,..., 0) = e i =1 σ11 σ12 ⋯ σ1 k t1 σ σ 22 ⋯ σ 2 k t2 1 ti µi + [t1 ,t2 ,...,tk ] 21 ⋮ ⋮ ⋮ ⋮ 2 σ k 1 σ k 2 ⋯ σ kk tk olduğundan µ1 σ11 σ12 ⋯ σ1k µ σ σ 22 ⋯ σ 2k ) Y 1 ∼ N ( 2 , 21 ⋮ ⋮ ⋮ ⋮ µ σ k k1 σ k 2 ⋯ σ kk dır. Y1, Y2 ,..., Yn ‘lerin ortak marjinal dağılımı normaldir. Y ∼ N ( µ , Σ ) olmak üzere aşağıdaki, µ1 µ 2 ⋮ µ1 µk µ n×1 = ... = .... k ×1 µk +1 µ 2 (n − k ) ×1 µ k +2 ... µ n n×1 Y1 Y 2 ⋮ Y 1 Yk Y n×1 = ... = .... k × 1 Yk +1 Y 2 (n − k ) × 1 Y k +2 ... Y n n×1 gösterimler altında, Y1 ∼ N ( µ , Σ11) 1 Y 2 ∼ N ( µ , Σ 22 ) 2 ve fY ( y ) = 1 1 fY ( y ) = 2 2 1 ( 2 π ) k det ( Σ11 ) 1 −1 − ( y − µ )′ Σ11 (( y − µ ) 1 1 1 1 2 e 1 ( 2 π )n − k det ( Σ22 ) 1 −1 − ( y − µ )′ Σ 22 ( y −µ ) 2 2 2 2 2 e dır. Y 2 = y verildiğinde Y1 in koşullu dağılımının yoğunluk fonksiyonu, 2 f (y ,y ) 1 2 = f ( y) f (y / y ) = 1 2 fY ( y ) fY ( y ) 2 2 2 2 olmak üzere, 1 f (y / y ) = 1 2 ( 2 π )n det ( Σ ) 1 ( 2 π )n det ( Σ 22 ) 1 − ( y − µ )′ Σ −1 ( y − µ ) e 2 1 −1 − ( y − µ )′ Σ 22 ( y −µ ) 2 2 2 2 2 e ve −1 −1 Σ11.2 −Σ11.2 Σ12 Σ −221 Σ11 Σ12 Σ = = −1 −1 1 Σ −22.1 Σ 21 Σ 22 −Σ 22 Σ 21Σ11.2 −1 −1 −1 Σ −Σ11 Σ12 Σ 22.1 = −1 11.2 −1 1 Σ −22.1 −Σ 22.1Σ 21Σ11 −1 Σ11.2 = Σ11 − Σ12 Σ −221Σ 21 −1 Σ 22.1 = Σ 22 − Σ 21Σ11 Σ12 ve ayrıca, −1 det( Σ ) = det( Σ11) det( Σ 22 − Σ21Σ11 Σ12 ) −1 = det( Σ22 ) det( Σ11 − Σ12 Σ 22 Σ 21) olduğundan, f (y / y ) = 1 2 1 ( 2 π ) k det ( Σ11.2 ) 1 − Q 2 e elde edilir. Burada, ′ −1 −1 −1 Q = ( y − µ ) − Σ12 Σ22 ( y − µ ) Σ11 ( y − µ ) − Σ12 Σ22 (y −µ ) .2 1 1 2 2 1 1 2 2 dır. Y2 = y 2 verildiğinde Y1 in koşullu dağılımına karşılık gelen rasgele vektör Y1/ Y 2 = y ile gösterilirse bu rasgele vektör, 2 beklenen değeri ve −1 E ( Y1/ Y = y ) = µ + Σ12 Σ 22 (y −µ ) 1 2 2 2 2 Cov ( Y1/ Y = y ) = Σ11.2 2 2 varyans-kovaryans matrisi ile normal dağılıma sahiptir, yani −1 Y1/ Y = y ∼ N ( µ + Σ12 Σ22 ( y − µ ), Σ11.2 ) 1 2 2 2 2 dır. −1 E ( Y1/ Y = y ) = µ + Σ12 Σ 22 (y −µ ) 1 2 2 2 2 denklemine regresyon denklemi denir. Y1 vektörü bir bileşenli, yani Y1 rasgele değişkeni olduğunda, −1 E ( Y1/ Y = y ) = µ1 + Σ12 Σ 22 (y −µ ) 2 2 2 2 denklemine Y 2 vektörü üzerinde Y1 rasgele değişkeninin regresyon denklemi denir. Y1 − − Y , Y = = 1 olmak üzere, Y2 Y 2 Y3 Y1 µ1 * Y = Y2 ∼ N ( µ2 , [Σ ]) µ3 Y3 −1 E ( Y1/ Y = y ) = µ1 + Σ12 Σ 22 (y −µ ) 2 2 2 2 −1 σ 23 y2 − µ 2 σ = µ1 + [σ 12 , σ 13 ] 22 σ 32 σ 33 y3 − µ3 denklemi Y1 in Y2 ile Y3 üzerine regresyon denklemidir. Σ11.2 nin elemanları Y1 in koşullu dağılımındaki Yi ile Yj , (i , j = 1, 2 ,..., k ) lerin kovaryanslarıdır. Bu kovaryanslar, σi , j /( k +1, k + 2 ,...,n ) , i , j =1,2 ,..., k biçiminde gösterilir. ρi , j /( k +1, k + 2 ,...,n ) = σij /( k +1, k + 2 ,...,n ) σii /( k +1, k + 2 ,...,n ) , i , j = 1, 2 ,..., k değerine , Y 2 = y2 verildiğinde Yi ile Yj arasındaki kısmi korelasyon katsayısı denir. Y1 Y1 Y Y 2 Y= vektörü, Y = 2 ve buna bağlı olarak Σ matrisi, ⋮ ⋮ Y m Yn Σ11 Σ12 ⋯ Σ1m Σ Σ 22 ⋯ Σ 2 m Σ = 21 ⋮ ⋮ ⋮ Σ m1 Σ m 2 ⋯ Σ mm biçiminde parçalansın. Cov (Y i , Y j ) = Σij , i , j = 1, 2,..., m olmak üzere, Y i ve Y j vektörleri için Cov(Y i , Y j ) = Σij = 0 matrisi ise Y i ve Y j vektörlerine ilişkili değildir denir. Çok sık rasgele vektörlerin bağımsızlığı ile ilgileniriz. Rasgele vektörler bağımsız ise ilişkili değillerdir. Đlişkili olmayan rasgele vektörlerin bağımsız olduklarını her zaman söyleyemeyiz. Ancak rasgele vektörlerin ortak dağılımı normal olduğunda bağımsız olmaları için gerek ve yeter şart ilişkili olmamalarıdır. Y ∼ N ( µ , Σ ) ve Y ile Σ aşağıdaki gibi parçalansın. Y1 Y 2 Y = ⋮ Y m , Σ11 Σ12 ⋯ Σ1m Σ Σ 22 ⋯ Σ 2 m 21 Σ= ⋮ ⋮ ⋮ Σ m1 Σ m 2 ⋯ Σ mm Y1, Y2 ,..., Ym vektörleri bağımsız ⇔ Σ ij = 0 i , j = 1, 2 , 3,..., n , i ≠ j dır. Y ∼ N ( µ , Σ ) , Σ = σI ise Y1, Y2 ,..., Yn rasgele değişkenleri bağımsızdır. µ1 1 µ 2 * Y ∼ N ( 2 , µ3 0 µ4 0 2 5 0 0 0 0 2 4 0 0 Y3 Y ) ise 1 vektörü ile vektörü ilişkili değildir. 4 Y2 Y4 3 Bu iki vektör üstelik bağımsızdır. 1 1 2 0 0 2 2 5 0 0 ) olmak üzere, * Y ∼ N ( , Σ = 0 0 0 2 0 −1 0 0 0 1 ve Y4 rasgele değişkeni bağımsızdır. LMY1 OP vektörü, Y3 rasgele değişkeni NY2 Q 1 1 0 1 * Y ∼ N ( 0 , Σ = 0 2 −1 ) ise Y1 ile Y2 bağımsızdır. 2 1 −1 3 1 1 2 0 ,Σ = * Y ∼ N( 0 0 −1 0 0 0 0 5 0 0 ) ise Y1, Y2 , Y3 , Y4 bağımsızdır. 0 2 0 0 0 1 Ki-Kare Dağılımı Bir X rasgele değikenin olasılık yoğunluk fonksiyonu, R| 1 xα −1e− x / β f ( x ) = S Γ ( α ) αβ |T0 , x>0 , d . y. biçiminde olduğunda, X e Gamma dağılımına sahiptir denir ve X ∼ Γ(α , β) biçiminde gösterilir. α ∈ ( 0, ∞ ), β ∈ ( 0, ∞ ) parametrelerine bağlı olarak, E ( X ) = αβ Var ( X ) = αβ2 M X ( t ) = (1 − β t ) − α dır. β = 2 olan Γ( α , β = 2) dağılımına r = 2α serbestlik dereceli (tam sayı olmak kaydıyla ) ki-kare dağılımı denir ve χ( r ) biçiminde gösterilir. X ∼ χ( r ) dağılımlı ise, R| 1 2r −1 − x / 2 x e , x>0 | f ( x ) = S Γ ( r ) 2r / 2 || 2 , d . y. T0 E( X ) = r Var ( X ) = 2 r M X ( t ) = (1 − 2 t ) − r 2 dır. Bağımsız X1, X 2 ,..., X n rasgele değişkenleri sırasıyla r1, r2 ,..., rn serbestlik dereceli ki-kare dağılımına sahip ise Y = X1 + X 2 +... + X n rasgele değişkeni serbestlik derecesi r = r1 + r2 +... + rn olan ki-kare dağılımına sahiptir. Gerçekten, MY ( t ) = M X1 ( t ). M X 2 ( t )... M X n ( t ) = (1 − 2 t ) − r1/ 2 (1 − 2 t ) − r2 / 2 ...(1 − 2 t ) − rn / 2 = (1 − 2 t ) − r1 + r2 + ...+ rn 2 olduğundan Y ∼ χ( r1 + r2 +...+ rn ) dır. X ∼ χ2( n ) , X1 ∼ χ(2m ) , n > m , X1 ile X 2 bağımsız ve X = X1 + X 2 2 ise X 2 ∼ χ( n − m) dır. Gerçekten, X 2 rasgele değişkenin moment çıkaran fonksiyonu M X 2 ( t ) olmak üzere, M X ( t ) = M X1 ( t ) M X 2 ( t ) (1− 2t )−n /2 = (1− 2t )−m /2 M X 2 (t ) n−m M X 2 ( t ) = (1 − 2 t ) 2 X 2 ∼ χ(2n − m) dır. − yani, Z ∼ N ( 0, 1) olmak üzere X = Z 2 ‘nin dağılımı χ12 dır. rasgele değişkenleri bağımsız ve her biri N ( µ , σ2 ) dağılımlı, ya da X1, X 2 ,..., X n N ( µ , σ2 ) dağılımından örneklem olmak üzere, X1, X 2 ,..., X n n ∑ ( Xi − µ ) i =1 σ n ∑ ( Xi − X ) 2 2 i =1 ∼ χ(2n ) σ 2 2 ∼ χ(2n −1) dır. X1, X 2 ,..., X n rasgele değişkenleri bağımsız ve herbiri N ( 0, 1) dağılımlı olduğunda n 2 2 ∑ X i ∼ χ( n ) i =1 dır. X1, X 2 ,..., X n rasgele değişkenleri bağımsız ve sırasıyla N ( µi ,1) , i = 1, 2,..., n dağılımlı olduğunda, n 2 2 ∑ ( X i − µ i ) ∼ χ( n ) i =1 n dır. Merkezileştirme yapılmaksızın ∑ Xi2 rasgele değişkeninin dağılımı nedir? i =1 Şimdi bu problemi göz önüne alalım. X1 X X = 2 ∼ N (µ , I ) ⋮ Xn , µ1 µ µ = 2 ⋮ µ n olmak üzere ∑ Xi2 = X ′ X rasgele değişkenin dağılımını bulmak istiyoruz. n i =1 A matrisi ilk satırı 1 µ′ a ( a = µ′ µ ) vektörü olan bir ortogonal matris olsun. Y = AX dönüşümü sonucu Y ∼ N ( Aµ , I ) dağılımlıdır. a 0 Aµ = ⋮ 0 olmak üzere, n 2 2 ∑ Yi ∼ χ( n −1) i =2 dır. V = Y12 U = ∑ Yi2 = Y ′ Y − V = X ′ X − V n i=2 olmak üzere V ile U bağımsızdır. Amacımızın X ′ X = U + V nin dağılımını bulmak olduğunu hatırlatalım. Đlk olarak V nin dağılımını, daha sonra V ile U nun ortak dağılımını ve buradan U + V nin dağılımını bulmaya çalışalım. Y1 ∼ N ( a ,1) olmak üzere V = Y12 rasgele değişkenin olasılık yoğunluk fonksiyonu R| 1 - 1 ( v − a ) 1 1 - 1 ( − v − 2 + e 2 fV ( v ) = S 2 π e 2 v 2π |T0 R| - 2a | e v-1/ 2e- v/ 2 (e- av + e av ) , v > 0 fV ( v ) = S ||02 2 π , d.y. T 2 a )2 1 -2 v , v>0 , d.y. - a2 j ∞ e v -1/2 e-v/2 (av) , v >0 ∑ fV (v) = 2π j=0 (2j)! , d.y. 0 dır. V ile U nun ortak o.y.f. fV ,U ( u , v ) = RS fV (v). fU (u) T0 , v > 0, u > 0 , d. y. olmak üzere, Z = U +V U W= U +V l q dönüşümünün ( z , w ): z > 0, < w < 1 bölgesi üzerinde ters dönüşümü U = ZW V = Z (1 − W ) ve Jakobiyeni, LM N OP Q w z ∂ ( u, v) = det = −z 1− w −z ∂( z , w) dır. Buna göre Z ile W ‘nun ortak olasılık yoğunluk fonksiyonu, f z , w ( z , w) = RS fV ( z (1 − w)). fU ( zw ). − z T0 , z > 0,0 < w < 1 , d.y. ve Z ‘nin marjinal olasılık yoğunluk fonksiyonu, R|1z f ( z (1 − w)). f ( zw ) zdw , z > 0 U f z ( z ) = S0 V |T0 , d.y. dır. 1 e−1/ 2 z 0 2π ( z (1 − w )) −1/ 2 e − z ( 1− w ) ∞ 2 ∑ n −1 ( az (1 − w ))δ ( zw ) 2 ( 2 j )! j =0 −1 − e zw 2 n −1 n −1 2 Γ( )2 zdw 2 n e− a / 2 2 − 1 − z / 2 z e = 2π n −1 n −1 2 Γ( )2 ∞ a jz j 1 z (1 − w ) ∑ j = 0 ( 2 j )! 0 j − 1/ 2 n −1 w 2 dw 2 n −1 1 Γ (δ + )Γ ( ) a jz j 2 2 = ∑ n −1 n ( 2 j )! Γ( j + ) n − 1 2 j =0 2 πΓ ( )2 2 2 1 n+2 j Γ( j + ) ∞ e − a / 2a j −1 2 z 2 e− z / 2 = ∑ n j = 0 ( 2 j )! π 2n / 2 Γ ( j + ) 2 1 n+2 j Γ( j + ) ∞ e− a / 2a j −1 2 z 2 e− z / 2 = ∑ n+2j j = 0 ( 2 j )! π 2n / 2 Γ ( ) 2 n −1 −a/ 2 2 e z e− z / 2 ve ∞ 1 2 j −1 2 j − 3 3 1 1 Γ( j + ) ( )( )... Γ( ) 2 = 2 2 22 2 = 1 ( 2 j )! π 2 j j !1. 3. 5...( 2 j − 1) π 22 j j! olması sebebiyle n+2 j R| ∞ e− a / 2 ( a / 2 ) j −1 1 2 z e− z / 2 ∑ n+2 j | j ! fZ ( z ) = S j = 0 n+2j Γ( )2 2 || 2 , T 0 elde edilir. λ= , z>0 d . y. ′ a µ µ = 2 2 n olmak üzere Z = U + V = X ′ X = ∑ Xi2 rasgele değişkenin olasılık yoğunluk i =1 fonksiyonu, n+2 j R| ∞ e− λλ j −1 1 2 z e− z / 2 ∑ 2 n + j | fZ ( z ) = S j = 0 j! n+2j Γ( )2 2 || 2 T0 , z>0 , d . y. olarak yazılır. Bu olasılık yoğunluk fonksiyonu λ = µ′ µ parametreli Poisson 2 dağılımındaki olasılıklar ile ağırlıklandırılmış n + 2 j , ( j = 0,1, 2 ,...) serbestlik dereceli ki-kare dağılımlarının olasılık yoğunluk fonksiyonlarının ağırlıklı toplamıdır. Böyle bir olasılık yoğunluk fonksiyonuna sahip dağılıma, n serbestlik dereceli λ parametreli (merkezsel olmama parametreli) merkezsel olmayan ki-kare dağılımı denir ve χ2( n ,λ ) biçiminde gösterilir. Özetlersek, X ∼ N ( µ , In ) ⇒ X ′ X = ∑ Xi2 ∼ χ2 n i =1 ( n ,λ = µ′ µ 2 ) dır. χ2( n ,λ ) dağılımına sahip bir X rasgele değişkeni için, MX 2 tλ − n/ 2 1− 2 t ( t ) = (1 − 2 t ) e , t< 1 2 E ( x ) = n + 2λ Var ( x ) = 2 ( n + 4 λ ) dır. χ2( n ,λ ) merkezsel olmayan ki-kare dağılımı λ =0 için alışılmış ki-kare dağılımının kendisidir. Bu dağılıma merkezsel ki-kare dağılımı da denir. Merkezsel ki-kare dağılımı yardımıyla oluşturulan t ve F dağılımlarına benzer şekilde, merkezsel olmayan ki-kare dağılımı yardımıyla, merkezsel olmayan t ve F dağılımları tanımlanmıştır. t-Dağılımı U ∼ N ( 0,1) , V ∼ χ2( r ) ve U ile V bağımsız iki rasgele değişken olmak üzere, X= U v r rasgele değişkenin olasılık yoğunluk fonksiyonu, r +1 ) x 2 − r +1 2 f ( x) = (1 + ) 2 , − ∞ < x < ∞ r 2 π r Γ( ) 2 dır. Bu o.y.f. na sahip r.d. lere r serbestlik dereceli t -dağılımına sahiptir denir ve X ∼ t( r ) biçiminde gösterilir. Γ( X ∼ t( r ) olmak üzere, E ( X ) = 0 , ( r > 1) ve Var ( X ) = r r−2 , (r > 2) dır. Tr ∼ t( r ) olmak üzere, dağılımda r →∞ Tr → Z (Z ~N(0,1)) dır. Teorem X1, X 2 ,..., X n , N ( µ , σ2 ) dağılımından bir örneklem olmak üzere, X −µ ∑ ( Xi − X )2 ( n − 1) n ∼ t( r ) dır. Tanım Z ∼ N ( 0,1) , U ∼ χ2( r ) ve Z ile U bağımsız olsun. δ , sabit bir sayı olmak üzere, X = Z +δ u/ r rasgele değişkenine r serbestlik dereceli, δ merkezsel olmama parametreli t − dağılımına sahiptir denir ve X ∼ t ( r , δ ) biçiminde gösterilir. − f ( x) = δ2 ∞ rr/ 2 e 2 r + j + 1 δ j 2 x2 j/ 2 Γ ( )( )( ) , ∑ Γ ( r / 2) ( r + x 2 )( r +1)/ 2 j = 0 2 j ! r + x2 −∞< x <∞ dır. Teorem Y ∼ N ( µ , σ2 ) , U ∼ χ2( r ) ve Y ile U bağımsız olmak üzere, Y u/ r ∼ t (r ,δ = µ ) σ dır. F -Dağılımı U ∼ χ2( r ) , V ∼ χ2r ve U ile V bağımsız iki rasgele değişken olmak üzere, 1 2 U / r1 X = V / r2 rasgele değişkenin olasılık yoğunluk fonksiyonu, r1 r +r r r1 + r2 Γ ( 1 2 )( 1 ) 2 r1 − 1 r 2 r2 f ( x) = x 2 (1 + 1 x ) 2 , 0 < x < ∞ r2 Γ ( r1 / 2 ) Γ ( r2 / 2 ) dır. Bu olasılık yoğunluk fonksiyonuna sahip rasgele değişkenlere F − dağılımına sahiptir denir ve X ∼ F ( r1, r2 ) biçiminde gösterilir. X ∼ F ( r1, r2 ) ise 1 / X ∼ F ( r2 , r1) dır. T ∼ t ( r ) ise T2 ∼ F (1, r ) dır. F ( r1, r2 ) dağılımında, Fα ( r1, r2 ) noktası sol tarafındaki alan α olacak şekilde bir nokta olmak üzere, Fα ( r1, r2 ) = dır. 1 F1− α ( r2 , r1) U1 ∼ χ2( r ,λ ) , U 2 ∼ χ(2r ) , U1 ile U 2 bağımsız olsun. 1 2 X= U1 / r1 U 2 / r2 rasgele değişkeninin olasılık yoğunluk fonksiyonu R| −l j 2 j + r1 + r2 r1 r +22 j r +r +2 j e l G( )( ) ∞ | r1 − 2 r2 ( r + 2 j − 2 )/ 2 2 x (1 + x ) f ( x) = S ∑ r2 2 j + r1 r j =0 2 j !G ( )G ( ) || 2 2 |T0 1 1 2 , x>0 1 , x≤0 dır. Bu olasılık yoğunluk fonksiyonuna sahip bir dağılıma λ merkezsel olmama parametreli, r1 ve r2 sebestlik dereceli F − dağılımı denir ve X ∼ F ( r1, r2 , λ ) biçiminde gösterilir. r (r + 2λ ) E( X ) = 2 1 , ( r2 > 2 ) r1 ( r2 − 2 ) r ( r + 2 λ )2 + ( r1 + 4 λ )( −2 ) Var ( X ) = 2 ( 2 )2 1 , ( r2 > 4 ) r1 ( r2 − 2 )2 ( r2 − 4 ) dır. X ∼ F ( r1 , r2 , λ ) olmak üzere, r + 2λ k= 1 r1 ( r1 + 2 λ )2 r= r1 + 4 λ için X / k rasgele değişkenin dağılımı yaklaşık olarak F ( r1, r2 ) dır. Karesel Formların Dağılımları Bu kısımda normal dağılıma sahip rasgele vektörlerin formlarının olasılık dağılımları ele alınacaktır. karesel Y n×1 ∼ N ( 0, I ) olması durumunda Y ′ Y ∼ χ 2( n ) ve Y n ×1 ∼ N ( 0, σ2 I ) olması 1 ′ durumunda da Y Y ∼ χ2 olduğunu biliyoruz. (n) σ2 Şimdi Y n ×1 ∼ N ( 0, Σ ) ( rank( Σ = n) ) olmak üzere, Q = Y ′ Σ −1 Y karesel formunun dağılımını bulmaya çalışalım. Q nun moment çıkaran fonksiyonu ′ −1Y M Q (t ) = E (etQ ) = E (etY Σ =∫ ∞ −∞ ⋯∫ ∞ 1−2t ′ −1 − yΣ y 2 e dy1dy2 ⋯ dyn 1/2 1 −∞ ( = (1− 2t )−n/2 ) 2π ) n (det Σ) , t < 1/ 2 olduğundan, Q ∼ χ2( n ) dır. Y ∼ N ( 0, In ) ve A reel simetrik bir matris olmak üzere Q = Y ′ AY karesel formunu gözönüne alalım. Bu karesel formun moment çıkaran fonksiyonu, M Q( t ) = E ( etY ′ AY ) =∫ ∞ −∞ ⋯∫ ∞ 1 −∞ ( 2π ) −1/2 = [ det( I − 2tA) ] 1 − y ′ ( I −2tA) y e 2 dy1dy2 ⋯ dyn n , t <h dır. Burada h sayısı, I − 2tA matrisi pozitif tanımlı olacak şekilde bir sayıdır. A reel simetrik bir matris olmak üzere, P ortogonal matrisi vardır, öyleki λ1 0 ⋯ 0 0 λ 0 0 2 ′ P AP = ⋮ ⋮ ⋮ 0 0 ⋯ λn ve det( I − 2 tA ) = det( P ′ ( I − 2 tA ) P ) = (1 − 2 tλ 1 )(1 − 2 tλ 2 )...(1 − 2 tλ n ) dır. rank( A ) = r olsun. 0 < r ≤ n olmak üzere A matrisinin özdeğerlerinden r tanesi sıfırdan farklıdır, bunlar λ1, λ2 ,..., λr olsun. O zaman, MQ ( t ) = (1 − 2tλ1)(1 − 2tλ 2 )...(1 − 2 tλ r ) −1/ 2 dır. Q = Y ′ AY karesel formunun dağılımı ki-kare olması için moment çıkaran fonksiyonunun (1 − 2t )− k / 2 biçiminde olması gerektiğini hatırlatalım. Đlk önce Q = Y ′ AY ∼ χ2( k ) olduğunu varsayalım. Bu durumda, [(1− 2tλ1 )(1− 2tλ2 )...(1− 2tλr ) ]−1/2 = (1− 2t )−k /2 olacaktır. Polinomların özdeş olması için r = k ve λ1 = λ2 =... = λ r = 1 olması gerekir. Diğer özdeğerlerin de sıfır olduğu göz önüne alınırsa A matrisi idempotent bir matris olmalıdır. Diğer taraftan Y ∼ N ( 0, I ) ve reel simetrik A matrisi için rank( A) = r , 2 A = A , yani A idempotent ise, MQ ( t ) = (1 − 2 t ) − r / 2 ve Q = Y ′ AY ∼ χ2( r ) olacaktır. Böylece aşağıdaki Teoremi ispatlamış olduk. Teorem Y ∼ N ( 0, In ) ve An × n reel simetrik rankı r olan bir matris olmak üzere, Y ′ AY ∼ χ2( r ) ⇔ A2 = A dır. Aşağıdakiler (teoremler) de benzer şekilde ispatlanabilir: * Y ∼ N ( 0, Σ n × n ) ve rank( Σ ) = n, Bn × n reel simetrik bir matris olmak üzere, Y ′ BY ∼ χ2( r ) ⇔ ( BΣ )2 = B Σ ve rank( B ) = r dır. * Y ∼ N ( µ , In ) için Y ′ Y ∼ χ2 1 ( n ,λ = µ ′ µ ) 2 * Y ∼ N ( µ , Σ n × n ) için Y ′ Σ −1Y ∼ χ2 1 ( n ,λ = µ ′Σ −1 µ ) 2 * Y ∼ N ( µ , In ) için A reel simetrik bir matris olmak üzere, Y ′ AY ∼ χ2 1 ( r ,λ = µ ′ A µ ) 2 ⇔ A2 = A ve rank( A) = r dır. * Y ∼ N ( µ , Σ n × n ) ve regüler C matrisi için C′ΣC = I , Z = C′Y ∼ N ( C′ µ , I ) olsun. O zaman, Y ′ AY = Z ′ C −1 AC ′ −1 Z ∼ χ 2 1 ( r , λ = µ ′ CC −1 AC ′ −1C ′ µ ) 2 olması için gerek ve yeter şart C −1 AC′−1 matrisinin idempotent ve rank( C −1 AC′ −1) = Rank ( A) = r olmasıdır. Yukarıda verilenler, aşağıdaki teoremin özel halleridir. TEOREM Y ∼ N ( µ , Σ ) , rank( Σ ) = n ve üzere, Y ′ AY ∼ χ 2 1 ( r ,λ = µ ′ Aµ ) 2 dır. A reel simetrik bir matris olmak ⇔ A Σ idempotent ve rank( A ) = r Karesel Formların Beklenen Değeri ve Varyansı Teorem X n × 1 boyutlu bir rasgele vektör olmak üzere, E ( X ′ A X ) = tr ACov ( X ) + E ( X ) ′ AE ( X ) dır. Đspat E ( X ′ A X ) = E ( ∑ aij Xi X j ) ij = ∑ aij E ( Xi X j ) = ∑ aij Cov ( Xi X j ) + E ( Xi ) E ( X j ) ij ij = ∑ aijCov ( Xi X j ) + ∑ aij E ( Xi ) E ( X j ) ij ij = tr ( ACov( X )) + E ( X )′ AE ( X ) Sonuç Cov ( X ) = σ2 I ve E ( X ) = 0 ise E ( X ′ A X ) = σ2tr ( A) dır. Teorem X n ×1 ∼ N ( µ , Σ ) olmak üzere LM N OP Q a) E ( X ′ A X )( X ′ B X ) = tr ( A Σ ) tr ( B Σ ) + 2tr ( AB Σ ) + µ′ Aµtr ( B Σ ) + µ ′ Btr ( A Σ ) + µµ′ A ΣB µ + ( µ′ Aµ )′ ( µ′ B µ ) b) Cov ( X ′ A X , X ′ B X ) = 2tr ( A ΣBΣ ) + 4µ ′ A ΣB µ c) Var ( X ′ AX ) = 2tr ( AΣ)2 + 4µ′ AΣAµ dır. Normal Dağılımlı Rasgele Vektörlerin Lineer ve Karesel Formların Bağımsızlığı Teorem Y ∼ N ( µ , Σ n × n ) , rank( Σ ) = n olmak üzere, AY ile Y ′ BY bağumsız ⇔ A ΣB = 0 dır. Teorem Y ∼ N ( µ , Σ n × n ) , rank( Σ ) = n olmak üzere, Y ′ BY ile Y ′CY baðýmsýz⇔ B ΣC = 0 dır. Cohran Teoremi Y ∼ N ( µ , σ2 In ) A1, A2 ,..., Ak matrisleri simetrik, sırasıyla n1, n2 ,..., nk ranklı ve A1 + A2 +... + Ak = In , yani Y ′ Y = Y ′ A1Y + Y ′ A2 Y +... +Y ′ Ak Y k olsun. Eğer ∑ ni = n ise, i =1 Y ′ A1 Y , Y ′ A2 Y ,..., Y ′ Ak Y karesel formları bağımsız ve i = 1, 2,..., n için, 1 σ 2 Y ′ Ai Y ∼ χ2 ( ni ,λi = 1 2σ 2 µ ′ Ai µ ) dır. Tersine, 1 σ 2 Y ′ Ai Y karesel formları bağımsız ve ⇓ ri = ni , i = 1, 2,..., k ve 1 σ 2 Y ′ Ai Y ∼ χ(2r ,λ ) , i = 1, 2 ,..., k i i k ∑ ni = n i=1 dır. Cochran Teoremi karesel formların parçalanmasında çok kul-lanışlı bir teoremdir. Bu teoremdeki Ai A j = 0 , i ≠ j , i , j = 1, 2 ,..., n ya da Ai 2 = Ai , denktir. Yani bu üç şart birbirine denktir. n ∑ ni = n i =1 olması şartı, i = 1, 2 ,..., n olması şartlarına Normal Dağılım ve Karesel Formlar Đle Đlgili Bazı Örnekler Örnek Y n ×1 ∼ N ( 0, σ2 I ) olsun. Y vektörünün Y1, Y2 ,..., Yn bileşenlerine N ( 0, σ2 ) dağılımından alınmış n birimlik bir örneklem olarak bakabiliriz. 1 1 Jn = ⋮ 1 1 ⋯ 1 1 ⋯ 1 , rank ( J n ) = n ⋮ ⋮ 1 ⋯ 1 n×n ve 1/ n 1/ n ⋯ 1 / n 1/ n 1/ n ⋯ 1 / n 1 A = Jn = ⋮ ⋮ ⋮ n 1/ n 1/ n ⋯ 1 / n olmak üzere, 2 1 nY Q = Y ′ ( 2 A )Y = 2 σ σ karesel formunu göz önüne alalım. rank( A) = 1 ve nY σ 2 2 ∼ χ 2( 1) dır. Ayrıca A matrisi simetrik ve idempotent olduğundan bir dik izdüşüm matrisidir. Gerçekte, 1 1 1 + 1n = , 1n = [1,1,...,1] ⋮ n 1 n×1 A = 1n1+ n olmak üzere, A matrisi Rn ‘deki vektörleri 1n vektörünün gerdiği 1n altuzayı üzerine dik izdüşüm matrisidir. 1/ n 1/ n ⋯ 1/ n Y1 Y 1/ n 1/ n ⋯ 1/ n Y ˆ 2 = Y = Y 1n Y = AY = ⋮ ⋮ ⋮ ⋮ ⋮ 1/ n 1/ n ⋯ 1/ n Yn Y 2 2 Yˆ = Yˆ ′Yˆ = Y ′AY = nY ve Yˆ ile Y − Yˆ vektörleri birbirine dik olduğundan, Y 2 2 = Yˆ + Y − Yˆ n 2 2 n 2 2 ∑ Yi = nY + ∑ (Yi − Y ) i =1 i =1 dır. Y 2 = ∑ Yi2 = Y ′ Y de bir karesel formdur. Bu karesel formun matrisi, I n i =1 birim matrisidir. Bu karesel form ile ilgili, Y′ ( 1 σ 2 I ) Y ∼ χ 2( n ) olduğunu biliyoruz. n 2 ∑ (Yi − Y ) de Y nin bir karesel formudur. i =1 n 1 Y ′ ( I − J n )Y = ∑ (Yi − Y )2 n i=1 1 n Bu karesel formun matrisi I n − J n olmak üzere, bu matris simetrik, idempotent ve 1n 1 In − Jn n ⊥ altuzayı üzerine dik izdüşüm matrisidir. matrisi ile Y ‘nin varyans kovaryans matrisi olan σ2 I matrisinin çarpımı olan ( I n − 1 J n )σ 2 I ( I n − 1 J n )σ 2 I ≠ ( I n − 1 J n )σ 2 I n n n 1 n matrisini idempotent yapmak için I n − J n yerine 1 1 ( I − J n ) yazılmasıyla, n n σ2 1 ( I n − 1 J n )σ 2 I 1 ( I n − 1 J n )σ 2 I = 1 ( I n − 1 J n )σ 2 I 2 2 2 σ σ σ n n n ve 1 Y ′ ( I n − J n )Y ∼ χ(2r ) n σ 1 2 1 n olur. Buradaki r serbestlik derecesi, I n − J n matrisinin rankı olmak üzere aynı zamanda bu matrisinin sütun vektörlerinin gerdiği 1n boyutudur. ⊥ alt uzayının 1 I n − J n matrisi idempotent olduğundan, n 1 1 1 1 rank ( I n − J n ) = tr ( I n − J n ) = tr ( I n ) − tr ( J n ) = n − n = n −1 n n n n ve buna göre, n Y′ dır. 1 σ 2 ( In − 2 ∑ ( Yi − Y ) 1 J n )Y = i =1 n σ2 ∼ χ (2n − 1) Ayrıca, 1 1 J n (In − Jn ) = 0 n n olduğundan, n 2 1 1 ′ ′ Y J n Y = nY ile Y ( I n − J n )Y = ∑ (Yi − Y )2 n n i=1 karesel formları bağımsızdır. Özetlersek: Y1, Y2 ,..., Yn ‘ler N ( 0, σ2 ) dağılımından alınmış n birimlik bir örneklem, yani Y1 Y Y n×1 = 2 ∼ N (0, σ 2 I ) ⋮ Y n olsun. n 2 n 2 2 ∑ Yi = nY + ∑ (Yi − Y ) i =1 1 σ 2 i =1 n ∑ Yi2 = Y ′ ( σ 2 I )Y ∼ χ(2n) 1 i=1 σ bağımsız n 2 (Yi − Y ) ∑ 1 1 ′ 2 i = 1 Y 2 ( I n − J n )Y = ∼ χ( n−1) 2 n σ σ nY 2 2 ∼ χ(1) 2 dır. Örnek Y n ×1 ∼ N ( µ , σ2 I ) ve µ = µ1n olsun. Y vektörünün Y1, Y2 ,..., Yn bileşenlerine, N ( µ , σ2 ) dağılımından alınmış n birimlik örneklem olarak bakabiliriz. Y1, Y2 ,..., Yn ‘ler N ( µ , σ2 ) dağılımından n birimlik örneklem olsun. n n 2 2 2 ∑ Yi = nY + ∑ (Yi − Y ) i =1 i =1 n ∑ Yi2 i=1 σ nY σ 2 2 = 2 =Y′( 1 σ 2 I )Y ∼ χ 2 ( n,λ= nµ 2 2σ 2 ) 1 Y ′ ( J n )Y ∼ χ 2 nµ 2 n σ (1,λ= ) 1 2 2σ 2 n ∑ (Yi −Y )2 i=1 σ 2 = 1 Y ′ ( I n − J n )Y ∼ χ(2n−1,λ=0) n σ 1 2 dır. Ayrıca, n 2 ∑ ( Yi −µ ) i =1 σ 2 n (Y − µ ) 2 σ 2 ∼ χ 2( n ) ∼ χ (21) dır. Y1, Y2 ,..., Yn ‘ler N (0, σ 2 = 25) dağılımından alınmış n birimlik bir örneklem nY σ 2 2 ∼ χ(1) 2 Y1, Y2 ,..., Yn ‘ler N (µ = 5, σ 2 = 25) dağılımından alınmış n birimlik bir örneklem nY σ 2 2 ∼ χ2 (1,λ= nµ 2 2σ 2 ) >> veri=randn(10,100)*5; >> hist(10*(mean(veri)).^2/25) >> veri=randn(10,100)*5+5; >> hist(10*(mean(veri)).^2/25) 60 25 20 40 15 10 20 5 0 0 0 2 4 6 8 0 5 10 15 20 25 30 35 n 1 2 ∑ Yi2 n ∑ Yi2 ∼ χ(2n=10) i=1 2 σ >> hist(sum((veri).^2)/25); σ i=1 >> hist(sum((veri).^2)/25); 20 20 15 15 10 10 5 5 0 0 5 10 15 i=1 σ 2 0 20 n ∑ (Yi − Y )2 10 ∑ (Yi −Y )2 ∼ χ(2n−1) i=1 σ 20 15 15 10 10 5 5 0 0 20 30 40 n 20 0 ∼ χ(2n=10,λ=5) 5 10 15 20 0 0 2 ∼ χ(2n−1,λ=0) 5 10 15 20 Örnek Y ∼ N ( 0, σ2 I ) olsun. X n × p , rank( X ) = p olmak üzere, Q= Y′Y , Q1 = σ2 Y ′ X ( X ′X )−1 X ′Y σ2 , Q2 = Y ′ ( I − X ( X ′X ) −1 X ′ )Y σ2 karesel formların dağılımlarını bulalım. Q = Y′ ( X ( X ′X ) −1 1 σ 2 I)Y ∼ χ 2(n ) X ′ idempotent, rank( X ( X ′X ) −1 X ′ ) = tr ( X ′X ( X ′X ) −1 ) = tr ( I p ) = p olduğundan Q1 = Y ′ LM 1 X ( X ′X ) −1 X ′ OP Y ∼ χ 2 N σ2 Q ( p) ve I − X ( X ′X ) −1 X ′ idempotent, rank( I − X ( X ′X )−1 X ′ ) = n − p olduğundan Q2 = Y ′ dır. Ayrıca, LM 1 ( I − X ( X ′X ) −1 X ′ ) OP Y ∼ χ 2 N σ2 Q (n− p) X ( X ′X )−1 X ′ ( I − X ( X ′X ) −1 X ′ ) = 0 olduğundan Q1 ile Q2 karesel formları bağımsızdır ve Q1 n − p ∼ F( p ,n − p ) Q2 p dır. X ( X ′X )−1 X ′ matrisi X = X 1, X 2 ,..., X p matrisinin sütun vektörleinin gerdiği [ X ] = span { X 1, X 2 ,..., X p } uzayı üzerine dik izdüşüm dönüşümüne karşılık gelen matristir. Y vektörünün Yˆ = X ( X ′X ) −1 X ′Y ile gösterilirse, Y 2 2 = Yˆ + Y − Yˆ X üzerine dik izdüşümü 2 Y ′ Y = Y X ( X ′X ) −1 X ′Y + Y ′ I − X ( X ′X ) −1 X ′ Y dır. Örnek: Đki Değişkenli Normal Dağılım Đki değişkenli normal dağılıma sahip X , Y rasgele değişkenlerinin ortak olasılık yoğunluk fonksiyonu, E ( X ) = µ X , E ( Y ) = µY , Cov ( X , X ) = σ XY , σ XX ∑ = σ XY σ XY σ YY olmak üzere, f ( x, y ) = 1 2π ( det ∑ ) 12 1 x − µ X exp − ( x − µ X , y − µY ) ∑ −1 , y − µY 2 dır. X ile Y ‘nin marjinal dağılımları X ∼ N ( µ X , σ XX ) Y ∼ N ( µY , σ YY ) ve koşullu dağılımları, σ 2 Y/ X = x ∼ N µY + XY ( x − µ X ) , σYY (1− ρ XY ) σ XX E (Y/ X = x ) = µY + σ XY ( x − µX ) σ XX Var (Y/ X =x ) = σYY (1− ρ 2XY ) σ X /Y = y ∼ N µ X + XY ( y − µY ) , σ XX (1− ρ 2XY ) σYY σ E ( X /Y = y ) = µ X + XY ( y − µY ) σYY 2 Var ( X /Y = y ) = σ XX (1− ρ XY ) dır. −∞ < x < ∞ −∞ < y < ∞ Z1 , Z 2 iki değişkenli standart normal dağılıma sahip olduğunda, f ( z1 , z2 ) = 1 1 exp − ( z12 + z22 ) , − ∞ < z1 < ∞, − ∞ < z2 < ∞ 2π 2 dır. Bu olasılık yoğunluk fonksiyonunun grafiği, 0.2 0.15 0.1 0.05 0 5 5 0 0 -5 -5 dır. Đki değişkenli standart normal dağılımdan 100 birimlik bir örnek için serpilme diyagramı, 3 2 1 0 -1 -2 -3 -3 dır. -2 -1 0 1 2 3 >> clear all; close all mu=[5 ;10]; sigmamatrisi=[2 0.5;0.5 2]; sigmaters=inv(sigmamatrisi); c=1/(2*3.14*sqrt(det(sigmamatrisi))); for ii=1:101; for jj=1:101; xx=mu(1,1)-5+10*(ii/101); yy=mu(2,1)-5+10*(jj/101); z(ii,jj)=c*exp(-0.5*[xx-mu(1,1);yy-mu(2,1)]'*sigmaters*[xx-mu(1,1);yy-mu(2,1)]); z(ii,jj)=c*exp(-0.5*[xx-mu(1,1);yy-mu(2,1)]'*sigmaters*[xx-mu(1,1);yy-mu(2,1)]); end end xxx=(mu(1,1)-5):.1:(mu(1,1)+5); yyy=(mu(2,1)-5):.1:(mu(2,1)+5); meshgrid(xxx,yyy); mesh(xxx,yyy,z); sigmamatrisi=[2 1.6;1.6 2] sigmamatrisi=[2 0.5;0.5 2] 0.1 0.14 0.08 0.12 0.06 0.1 0.08 0.04 10 0.06 0.02 10 0.04 5 0 15 0.02 10 5 0 0 15 5 10 5 0 >> clc ; clear all ; close all n=1000; sigmamatrisi=[2 0.5;0.5 2]; veri=sqrt(sigmamatrisi)*randn(2,n); sinifsayisi=10; [fx,sx]=hist(veri(1,:),sinifsayisi); [fy,sy]=hist(veri(2,:),sinifsayisi); for i=1:sinifsayisi for j=1:sinifsayisi x1=sx(i)-(sx(2)-sx(1))/2 ; x2=sx(i)+(sx(2)-sx(1))/2 ; y1=sy(j)-(sy(2)-sy(1))/2 ; y2=sy(j)+(sy(2)-sy(1))/2 ; frekans=0; for ii=1:n if veri(1,ii)<x2 if veri(1,ii)>=x1 if veri(2,ii)<y2 if veri(2,ii)>=y1 frekans=frekans+1; end,end,end,end end frpolig(i,j)=frekans; x=[x1 x2]; y=[y1 y2]; meshgrid(x,y); z=frekans*ones(2,2); mesh(y,x,z); hold on end end figure meshgrid(sx,sy); mesh(sy,sx,frpolig); figure plot(veri(1,:),veri(2,:),'.') sigmaters=inv(sigmamatrisi); c=1/(2*3.14*sqrt(det(sigmamatrisi))); figure for ii=1:101; for jj=1:101; xx=-5+10*(ii/101); yy=-5+10*(jj/101); z(ii,jj)=c*exp(-0.5*[xx;yy]'*sigmaters*[xx;yy]); end end xxx=-5:.1:5; yyy=-5:.1:5; meshgrid(xxx,yyy); mesh(xxx,yyy,z); 100 50 0 -6 -5 -4 -2 0 0 2 4 6 5 100 80 60 40 20 0 5 0 -2 -5 -6 -4 0 2 4 5 4 3 2 1 0 -1 -2 -3 -4 -5 -6 -4 -2 0 2 4 6 0.09 0.08 0.07 0.06 0.05 0.04 0.03 0.02 0.01 0 5 0 5 -5 -5 0 >> hist3(veri); µY Y X ∼ N µ , X σ YY ∑ = σ XY σ XY dağılımında, σ XX σ 2 Y/ X = x ∼ N µY + XY ( x − µ X ) , σYY (1− ρ XY ) σ XX E (Y/ X = x ) = µY + σ XY ( x − µX ) σ XX Var (Y/ X =x ) = σYY (1− ρ 2XY ) olmak üzere, Y rasgele değişkeninin X rasgele değişkeni üzerine regresyon denklemi , σ E (Y/ X = x ) = µY + XY ( x − µ X ) σ XX dır. X , Y ‘nin ortak dağılımından alınan n birimlik örneklem, Y1 Y2 X , X , ... , 1 2 Yn X n olsun. Bu gözlemler için Yi = µY + ( σ XY ( X i − µ X ) + εi , i = 1, 2,..., n , εi ∼ N 0, σε2 = σ XX (1− ρ 2XY ) σ XX ) εi ' ler bağımsız yazılabilir. Buna Y rasgele değişkeninin X rasgele değişkeni üzerine regresyon modeli denir. Bu modeli, Yi = β0 + β1 X i + εi , i = 1, 2,..., n biçiminde yazalım. Regresyon katsayıları, β0 = µY − β1 = σ XY µX σ XX σ XY σ XX olmak üzere, bu katsayıları ve hata terimi ε ‘nun varyansı olan σε2 parametresini gözlemlerden tahmin etmek isteyelim. Tahmin edici olarak, µ X , σ XX = σX2 , µY , σYY = σY2 , σYY = Cov( X , Y ) , ρ 2XY parametrelerin örneklem karşılıklarını kullanır ve β0 = µY − β1 = σ XY µX σ XX σ XY σ XX σε2 = σ XX (1− ρ 2XY ) ifadelerinde yerlerine yazarız. Böylece, n ∑ ( X i − X )(Yi − Y ) βˆ1 = i=1 n = ∑ ( X i − X )2 SXY SXX i=1 SXY βˆ0 = Y − X = Y − βˆ1 X SXX SXY 2 σˆ ε2 = SYY (1− ρˆ 2 ) = SYY (1− rXY ) = SYY 1− ( )2 SXX .SYY >> n=15; >>sigmamatrisi=[2 4 ; 4 16]; >>veri=sqrt(sigmamatrisi)*randn(2,n)+[10; 2.5]*ones(1,n); >>Y=veri(1,:)'; >>X=veri(2,:)'; >>R=corrcoef(Y,X); >>S=cov(Y,X); >>SYY=S(1,1); >>SXX=S(2,2); >>SXY=S(1,2); >>beta1=SXY/SXX beta1 = 0.5679 >>beta0=mean(Y)-beta1*mean(X) beta0 = 8.6036 >> beta=regress(Y,[ones(n,1) X]) beta = 8.6036 0.5679 >> sigmaepsilon=SYY*(1-R(1,2)^2) sigmaepsilon = 0.1923 >> (Y-[ones(n,1) X]*beta)'*(Y-[ones(n,1) X]*beta)/(n-2) ans = 0.2071 >> (Y-[ones(n,1) X]*beta)'*(Y-[ones(n,1) X]*beta)/(n-1) ans = 0.1923 % En Küçük Kareler % SSE/(n-2) = AKT/(n-2) >> plot(X,Y,'.') >> hold on >> x=-8:.1:15; >> plot(x,beta0+beta1*x) 18 16 14 12 10 8 6 4 2 -10 -5 0 5 10 15