ÇOK DEaG˙ISKENL˙I ˙ISTAT˙IST˙IKSEL SONUÇ

advertisement
ÇOK DEĞİŞKENLİ İSTATİSTİKSEL
SONUÇ ÇIKARIMI DERSİ
FİNAL SORULARININ ÇÖZÜMLERİ
1. Σ, p×p boyutlu pozitif tanımlı bir matris, λ1 , λ2 , . . . , λp bu matrisinin özdeğer0
leri, ei = (ei1 , ei2 , . . . , eip ) , i = 1, 2, . . . , p bu özdeğerlere karşılık gelen normalleştrilmiş
özvektörler, E = (e1 , e2 , . . . , ep ) ve


λ1 0 · · · 0
 0 λ2 · · · 0 


Λ =  ..
.. . .
.. 
 .
. . 
.
0 0 · · · λp
1
olmak üzere karakök Σ 2 matrisi
p
X
p
1
0
0
Σ =
λi ei ei = EΛ 2 E
1
2
i=1
şeklinde tanımlanmak üzere
³ 1 ´0
1
a) Σ = Σ 2 , yani Σ 2 simetriktir.
1
2
1
1
b) Σ = Σ 2 Σ 2
olduğunu ispat ediniz.
1a.
³ 1 ´0
´0
³
1
0
2
2
Σ
= EΛ E
³ 0 ´0 ³ 1 ´0 0
Λ2 E
= E
1
0
1
= EΛ 2 E = Σ 2
1
, burada 1. satır Σ 2 in tanımı gereği yazılmıştır. Satırdan 2. satıra Soru 1 de
bahsedilen e özelliğinden, 2. satırdan 3. satıra Soru 1 de bahsedilen f özelliğinden
³ 1 ´0
1
1
2
geçilmiştir. Ayrıca Λ köşegen matris olduğundan Λ 2 = Λ 2 olduğu aşikardır.
1
1b.
1
2
Σ Σ
´³
´
³
1
1
0
0
2
2
EΛ E
= EΛ E
³
´
1
1
0
0
= EΛ 2 E E Λ 2 E
1
2
1
1
0
2
2E
= EΛ
´ 0
³ IΛ
1
1
= E Λ2 Λ2 E
0
= EΛE
= Σ
1
, burada 1. satır Σ 2 nin tanımı gereği yazılmıştır. 2. satırdan 3. satıra ortogonal ma0
0
trisin tanımından (E ortogonal ise E E = EE = I), 4. satırdan 5. satıra Λ köşegen
matris olduğundan geçilebilmiştir.
Karakök matrisini kullanarak µ ve Σ parametreli çok değişkenli normal dağılımdan sayı üretmek için bir dönüşüm yazınız.
1
Σ 2 , p×p boyutlu Σ pozitif tanımlı matrisin karakök matrisi olmak üzere, Z ∼ Np (0, I)
olmak üzere
1
Y = Σ2 Z + µ
dönüşümü için Y ∼ Np (µ, Σ) dir.
¶
µ
¶
µ
4 1
X1
, Varyans kovaryans matrisi Σ =
ve ortalaması µ =
2. X =
X2
1 9
µ ¶
5
olan iki değişkenli normal dağılıma sahip bir rasgele vektör olmak üzere
0
(1)
Y1 = 2X1 + X2
Y2 = 3X1 − X2
şeklinde tanımlanan Y1 ve Y2 rasgele değişkenlerinden oluşan Y =
µ
Y1
Y2
¶
rasgele
vektörünün dağılımını elde ediniz.
Bu soruyu cevaplayabilmek için aşağıdaki iki teorem kullanılacaktır:
Teorem 1. X, p değişkenli normal dağılıma sahip bir rasgele vektör, A, k × p
boyutlu sabitlerin matrisi olmak üzere Y = AX lineer dönüşümü k değişkenli normal
dağılıma sahip bir rasgele vektördür.
Teorem 2. X, µ ortalamalı, Cov(X) = Σ kovaryans matrisli bir rasgele vektör
olmak üzere b ∈ Rp vektörü ve A, k × p boyutlu matrisi için
³ 0 ´
0
E bX = bµ
E (AX) = Aµ
2
³ 0 ´
0
V ar b X = b Σb
0
Cov (AX) = AΣA
dir.
(1) dönüşümü matris formunda
¶µ
¶
µ
X1
2 1
Y =
3 −1
X2
Y = AX
şeklinde yazılabilir. Teorem 1 den Y iki değişkenli normal dağılıma sahiptir. Teorem
2 den Y nin beklenen değer ve kovaryans matrisi
E (Y) = E (AX)
= AE (X)
= Aµ
µ
¶µ ¶
2 1
5
=
3 −1
0
¶
µ
10
=
15
Cov (Y) =
=
=
Cov (AX)
0
ACov (X) A
0
AΣA
µ
¶µ
¶µ
¶
2 1
4 1
2 3
=
3 −1
1 9
1 −1
µ
¶
29 16
=
16 39
biçiminde elde edilir.
Size göre yukarıda tanımlanan Σ =
µ
4 1
1 9
¶
, varyans kovaryans matrisi olabilir
mi? Neden?
Varyans-Kovaryans matrisi, pozitif veya pozitif yarı tanımlı(pozitif yarı tanımlılığın tanımı matrisin simetrik olmasını barındırmaktadır.) olmalıdır. Σ matrisi
simetriktir. Alt determinantlar sırasıyla 4 > 0 ve 35 > 0 olduğundan Σ matrisi
pozitif tanımlıdır. Bu nedenle Σ Varyans-Kovaryans matrisidir.
0
0
3) Z = (Z1 , Z2 , Z3 ) rasgele vektörü µ = (0, 1, 2) ortalamalı


1 0 −1
Σ = 0 2 0 
−1 0 4
3
varyans-kovaryans matrisli çok değişkenli normal dağılıma sahip olmak üzere
(a) Z3 ve Z2 rasgele değişkenleri bağımsız mıdır? Neden?
Cov (Z2 , Z3 ) = 0
0
olduğundan Z2 ve Z3 rasgele değişkenleri ilişkisizdir. Z = (Z1 , Z2 , Z3 ) , çok değişkenli
normal dağılıma sahip olduğundan Z2 ile Z3 ün ilişkisiz olması aynı zamanda bağımsız
olması anlamına gelmektedir.
(b) Z1 + Z3 rasgele değişkeninin dağılımını elde ediniz.
Z1 + Z3 dönüşümü matris formunda


Z
1
¡
¢
1 0 1  Z2 
Y =
Z3
Y
0
= bZ
şeklinde yazılabilir. Teorem 1 den Y, tek değişkenli normal dağılıma sahiptir. Teorem
2 den Y nin beklenen değer ve varyansı
³ 0 ´
0
E bZ = bµ
 
¡
¢ 0
1 0 1  1 
=
2
= 2
dir.

 
1
0
−1
1
³ 0 ´
¡
¢
1 0 1  0 2 0  0 
V ar b Z =
−1 0 4
1
 
¡
¢ 1
0 0 3  0 =3
=
1
(c) Z rasgele vektörü çok değişkenli normal dağılıma sahip olmasaydı Z1 + Z3 rasgele
değişkeninin dağılımı için neler söylenebilirdi?
Z1 + Z3 rasgele değişkeninin dağılımı hakkında birşey söylenemez ancak Z1 + Z3
nin beklenen değeri 2, varyansıµ3 dir.¶
µ
¶
ρσ 1 σ 2
σ 21
µ1
ortalamalı Σ =
kovaryans
4) X rasgele vektörü µ =
µ2
ρσ 1 σ 2
σ 22
matrisli iki değişkenli normal dağılıma sahip ise µ ve Σ nın en çok olabilirlik tahmin
edicilerini elde ediniz.
4
Bu sorunun cevabı için ders notlarına bakılabilir.
İki değişkenli normal dağılımın parametreleri için parametre uzayını yazınız.
İki değişkenli normal dağılımın parametreleri için parametre uzayı
Γ = {ρ, σ 1 , σ 2 , µ1 , µ2 : −1 ≤ ρ ≤ 1, σ 1 ≥ 0, σ 2 ≥ 0, µ1 ∈ R, µ2 ∈ R}
şeklindedir.
Sizce bu tahmin edicilerin aldığı değerler, parametre uzayının dışına çıkabilir mi?
Neden? Çıkarsa ne olur?
µ
b1 = X 1 ve µ
b2 = X 2
olduğundan ve µ
b1 ve µ
b2 tahmin edicilerinin aldığı değerler reel sayı olacağından bu
tahmin edicilerin parametre uzayının dışına çıkması söz konusu değildir.
v
v
u n
u n
u1 X¡
u1 X¡
¢2
¢2
t
σ
b1 = S1 =
b2 = S2 = t
X1j − X 1 ve σ
X2j − X 2
n i=1
n i=1
olduğundan ve S1 ve S2 tahmin edicilerinin aldığı değerler pozitif reel sayı olacağından
bu tahmin edicilerin parametre uzayının dışına çıkması söz konusu değildir.
b
ρ1 = R =
S12
S1 S2
dir, burada
¢¡
¢
1 X¡
=
X1j − X 1 X2j − X 2
n i=1
n
S12
ρ1 < 1 dir ve parametre uzayının dışına
biçimindedir. S12 < S1 S2 olacağından −1 < b
çıkması söz konusu değildir.
µ
¶ µ
¶
µ
¶
X1
X2
Xn
5)
,
,...,
bağımsız ve aynı
Y1 µ
µY2 ¶
µYn 2
¶¶
µ1
σ1
ρσ 1 σ 2
Normal2 µ =
,Σ =
dağılıma sahip bir örneklem olµ2
ρσ 1 σ 2
σ 22
mak üzere Fisher’in Z dönüşümünü ve asimptotik dağılımını yazarak ρ için asimptotik
(1 − α) güven seviyeli güven aralığı oluşturunuz.
Fisher’in Z dönüşümü kullanılarak ρ için %95 lik güven aralığı aşağıdaki gibi elde
edilir: n > 3 ve H0 : ρ = ρ0 hipotezinin doğruluğu altında
µ
¶
1+R
1
Z = log
2
1−R
5
´
´
³
³
1
0
,
dır. Buradan
rasgele değişeninin asimptotik dağılımı Normal 12 log 1+ρ
1−ρ
n−3
0
p
L = zα/2 1/ (n − 3)
U = z1−α/2
p
1/ (n − 3)
olmak
³ ´

 üzere
Z − 12 log 1+ρ
1−ρ
P zα/2 < p
< z1−α/2 
1/ (n − 3)
µ
µ
¶
¶
1
1+ρ
= P L < Z − log
<U
2
1−ρ
µ
µ
¶
¶
1+ρ
= P 2 × (Z − L) > log
> 2 × (Z − U )
1−ρ
µ
¶
1+ρ
= P exp [2 × (Z − L)] >
> exp [2 × (Z − U)]
1−ρ
½
¾
exp [2 × (Z − L)] − 1
exp [2 × (Z − U)] − 1
= P
>ρ>
=1−α
exp [2 × (Z − L)] + 1
exp [2 × (Z − U )] + 1
p
eşitliği elde
edilir.
z
=
−z
eşitli
ği
göz
önüne
alınırsa
L
=
z
1/ (n − 3) =
1−α/2
α/2
α/2
p
−z1−α/2 1/ (n − 3) = −U olur ve buradan
½
¾
exp [2 × (Z − U)] − 1
exp [2 × (Z + U )] − 1
P
<ρ<
=1−α
exp [2 × (Z − U )] + 1
exp [2 × (Z + U)] + 1
elde edilir.
Bir örneklem için bu aralık (−2, 2) olarak elde edilirse ne yaparsınız?
Korelasyon katsayısı −1 ≤ ρ ≤ 1 arasında olduğundan ρ nun %95 ihtimalle (−2, 2)
aralığında olması hiç birbilge vermez. Çünkü ρ nun %100 (−1, 1) aralığında olduğunu
biliyoruz. Bu durumda ρ için başka güven aralıkları elde edilebilir.
6
Download