˙ISTAT˙IST˙IK I KAVRAMLARININ G¨OZDEN GEC¸˙IR˙ILMES˙I

advertisement
YTÜ-İktisat İstatistik II
'
İstatistik I Gözden Geçirme
1
$
İSTATİSTİK I KAVRAMLARININ
GÖZDEN GEÇİRİLMESİ
Hüseyin Taştan
Yıldız Teknik Üniversitesi,
İktisat Bölümü,
email: [email protected]
&
YTÜ-İktisat İstatistik II
'
%
İstatistik I Gözden Geçirme
2
$
İSTATİSTİK BİLİMİNİN UĞRAŞI ALANLARI
• Veriden anlam çıkarılması, özetlenmesi
• Belirsizlik: neyin olduğu değil, neyin olası olduğu
• Örnekleme (sampling): anakütlenin (population) tümüne ait bilgi
toplamak çoğu zaman imkansızdır. Bunun yerine anakütleye ilişkin
analiz bu anakütleyi en iyi temsil eden bir örnekleme dayandırılabilir.
• İktisadi ilişkilerin analizi: Ekonometrinin alanı
• Kestirim (Prediction)
• Belirsizlik altında karar alma
&
%
YTÜ-İktisat İstatistik II
'
İstatistik I Gözden Geçirme
3
$
İSTATİSTİK
İSTATİSTİK I
İSTATİSTİK II
Olasılık Teorisi
Örnekleme ve Örneklem Dağılımları
Rassal Değişkenler
Nokta ve Aralık Tahmini
Kesikli ve Sürekli R.D.
Hipotez Testi
Olasılık Fonksiyonu
Regresyon ve Korelasyon
Beklenen Değer, Moment
Parametrik Olmayan Testler
Normal Dağılım
Varyans Analizi
Merkezi Limit Teoremi
&
YTÜ-İktisat İstatistik II
'
%
İstatistik I Gözden Geçirme
4
$
RASSAL DEĞİŞKENLER ve OLASILIK DAĞILIMLARI
• Rassal (Stokastik) Değişken (r.d.) : Alacağı değer belli bir rassal
denemenin sonucuna bağlı olan, bu değere ilişkin kesinlik bulunmayan
değişken. Büyük harflerle göstereceğiz.
• x: rassal değişken X’in aldığı belli bir değer.
• Kesikli r.d. : Alacağı değerler sayılabilir (sonlu ya da sonsuz) olan
rassal değişkenler. Örneğin, iki zar atımında üste gelen sayıların
toplamı, belli bir üretim bandında bir çalışanın yaptığı hata sayısı,
bir bankaya 15 dk içinde gelen müşteri sayısı, vb.
• Sürekli r.d.: Belli bir aralıkta her hangi bir değeri alabilen rassal
değişken. Bir çok iktisadi değişken bu gruba girer, örneğin, bir
şehirdeki ortalama harcanabilir gelir, belli bir dönemdeki enflasyon
oranı, İMKB100 endeksinin kapanış değeri, bir yılda yapılan toplam
ihracat tutarı, vb.
&
%
YTÜ-İktisat İstatistik II
'
İstatistik I Gözden Geçirme
5
$
OLASILIK DAĞILIMLARI - KESİKLİ
• f (x) ile göstereceğiz,
• f (x) ≥ 0,
• f (x) = P (X = x),
P
•
x f (x) = 1, Bu toplam x’in alabileceği tüm değerler üzerinedir,
P
• Birikimli dağılım fonksiyonu: P (X ≤ x0 ) = F (x0 ) = x≤x0 f (x)
&
YTÜ-İktisat İstatistik II
'
%
İstatistik I Gözden Geçirme
6
$
KESİKLİ OLASILIK DAĞILIMLARI
• Örnek: 3 para atılıyor ve tura (T) gelme sayısı X ile gösteriliyor.
• Bu deneyde ortaya çıkabilecek sonuçlar şunlardır: (TTT), (TTY),
(TYT), (YTT), (TYY), (YTY), (YYT), ve (YYY). Bu 8 sonuç
karşılıklı olarak bağdaşmazdır ve herbirinin gelme olasılığı aynıdır.
Olasılık: 1/8.
• X’in alabileceği değerler: 0, 1, 2, and 3.
• X rassal değişkeninin dağılımını bulalım.
&
%
YTÜ-İktisat İstatistik II
'
İstatistik I Gözden Geçirme
Sonuçlar
x
f (x)
YYY
0
1/8
YYT
1
YTY
1
TYY
1
YTT
2
TYT
2
TTY
2
TTT
3
7
$
3/8
3/8
1/8
&
%
YTÜ-İktisat İstatistik II
'
İstatistik I Gözden Geçirme
8
$
X’in olasılık dağılımı:
•
P
x
x
0
1
2
3
f (x) = P (X = x)
1
8
3
8
3
8
1
8
f (x) = 1
• P (X ≤ 1) =?
• P (1 ≤ X ≤ 3) =?
&
%
YTÜ-İktisat İstatistik II
'
İstatistik I Gözden Geçirme
9
$
X’in birikimli olasılık dağılımı


0,





1


 8,
1
F (x) = P (X ≤ x) =
2,



7


8,



 1,
x < 0;
0 ≤ x < 1;
1 ≤ x < 2;
2 ≤ x < 3;
x ≥ 3.
&
%
YTÜ-İktisat İstatistik II
'
İstatistik I Gözden Geçirme
10
$
OLASILIK FONKSIYONU
0.4
0.35
0.3
f(x)
0.25
0.2
0.15
0.1
0.05
0
−1
−0.5
0
0.5
1
1.5
x
2
2.5
3
3.5
4
2.5
3
3.5
4
BIRIKIMLI OLASILIK FONKSIYONU
1
0.8
F(x)
0.6
0.4
0.2
0
−1
&
−0.5
0
0.5
1
1.5
x
2
%
YTÜ-İktisat İstatistik II
'
İstatistik I Gözden Geçirme
11
$
Kesikli r.d.’lerin BEKLENEN DEĞERLERİ
• Kesikli r. d. X’in beklenen değeri
E(X) =
X
xf (x)
x
• g(x), X’in bir fonksiyonu olsun, g(x)’in beklenen değeri
X
E(g(X)) =
g(x)f (x)
x
&
YTÜ-İktisat İstatistik II
'
%
İstatistik I Gözden Geçirme
12
$
ÖRNEK
• Önceki örnekte X’in beklenen değerini bulun.
1
3
3
1
3
E(X) = 0 + 1 + 2 + 3 =
8
8
8
8
2
• (i) g(x) = x2 ’nin beklenen değerini bulun.
1
3
3
1
E(X 2 ) = 0 + 1 + 4 + 9 = 3
8
8
8
8
&
%
YTÜ-İktisat İstatistik II
'
İstatistik I Gözden Geçirme
13
$
Kesikli r.d.’lerin VARYANSları
• Tanım:
V ar(X)
h
=
2
i
E (X − E(X))
E (X 2 − 2XE(X) + (E(X))2 )
E X 2 − 2E (XE(X)) + E (E(X))2 )
2
E X 2 − 2E(X)2 + (E(X))
E X 2 − E(X)2
=
=
=
=
• µx = E(X) dersek varyans
V ar(X) = E X 2 − µ2x
olarak yazılabilir.
&
%
YTÜ-İktisat İstatistik II
'
İstatistik I Gözden Geçirme
14
$
Kesikli r.d.’lerin MOMENTLERİ
• Tanım: Kesikli r.d. X’in knci momenti
X
µk = E(X k ) =
xk f (x) k = 0, 1, 2, ...
x
1. moment
µ1
=
E(X)
=⇒ populasyon ortalaması
2. moment
µ2
=
E(X 2 )
= V ar(X) + µ21
3. moment
µ3
=
E(X 3 )
4. moment
µ4
=
E(X 4 )
&
%
YTÜ-İktisat İstatistik II
'
İstatistik I Gözden Geçirme
15
$
Kesikli r.d.’lerin MERKEZİ MOMENTLERİ
• Tanım: Kesikli r.d. X’in knci merkezi momenti
X
mk = E((X − µ1 )k ) =
(x − µ1 )k f (x) k = 0, 1, 2, ...
x
1. merkezi moment
m1
=
0
2. merkezi moment
m2
=
3. merkezi moment
m3
=
E((X − µ1 )2 )
4. merkezi moment
m4
=
= V ar(X)
E((X − µ1 )3 )
E((X − µ1 )4 )
&
%
YTÜ-İktisat İstatistik II
'
İstatistik I Gözden Geçirme
16
$
Kesikli r.d.’lerin STANDART MOMENTLERİ
• Tanım: Kesikli r.d. X’in knci standart momenti
mk
γk = k k = 0, 1, 2, ...
σ
Burada σ populasyon standart sapmasıdır:
r h
i
p
2
σ = V ar(X) = E (X − µ1 )
1. standart moment
γ1
=
0
2. standart moment
γ2
=
1
neden?
3. standart moment
γ3
=
çarpıklık (skewness)
4. standart moment
γ4
=
m3
σ3
m4
σ4
&
basıklık (kurtosis)
%
YTÜ-İktisat İstatistik II
'
İstatistik I Gözden Geçirme
17
$
Bazı Kesikli Dağılımlar
• Bernoulli
• Binom
• Hipergeometrik
• Poisson
&
%
YTÜ-İktisat İstatistik II
'
İstatistik I Gözden Geçirme
18
$
Bernoulli(p) Dağılımı:
Beklenen Değer:

 p,
f (x) =
 1 − p,
E(X) =
if X = 1
if X = 0
X
xf (x) = p · 1 + (1 − p) · 0 = p
X
x2 f (x) = p · 1 + (1 − p) · 0 = p
x
İkinci Moment:
E(X 2 ) =
x
Varyans (ikinci merkezi moment):
V ar(X) = E(X 2 ) − (E(X))2 = p − p2 = p(1 − p)
&
%
YTÜ-İktisat İstatistik II
'
İstatistik I Gözden Geçirme
19
$
BİNOM DAĞILIMI
X, n bağımsız Bernoulli denemesinde 1 değerini alma (başarı) sayısı
P
olsun. Yani eğer Y Bernoulli(p) ise X = (Y ), Binom(n, p) dağılımına
uyar. X toplam başarı sayısı.


n
n!
 px (1 − p)n−x =
px (1 − p)n−x , x = 0, 1, 2, . . . , n
f (x) = 
x!(n
−
x)!
x
E(X) = np
V ar(X) = np(1 − p)
&
%
YTÜ-İktisat İstatistik II
'
İstatistik I Gözden Geçirme
20
$
HİPERGEOMETRİK DAĞILIM
Eğer Bernoulli denemeleri birbirinden bağımsız değilse, toplam başarı
sayısı Binom dağılımına uymaz. İçinde B tane başarı bulunan N nesneli
rassal bir örneklemde, toplam başarı sayısı X’in olasılık dağılımı

f (x) =

B
x




N
n
N −B
n−x




Burada x max(0, n − (N − B)) ve min(n, B) arasında tamsayı değerler
alabilir
E(X) = np,
&
V ar(X) =
N −n
np(1 − p),
N −1
p=
B
N
%
YTÜ-İktisat İstatistik II
'
İstatistik I Gözden Geçirme
21
$
POISSON DAĞILIMI
Bir olayın belli bir zaman diliminde gerçekleşme sayısı
Notasyon: X ∼ P oisson(λ), pmf:
λx e−λ
f (x, λ) =
,
x!
x = 0, 1, 2, . . .
E(X) = λ
V ar(X) = λ
1
skewness = √
λ
excess kurtosis =
1
λ
&
%
YTÜ-İktisat İstatistik II
'
İstatistik I Gözden Geçirme
22
$
Kesikli r.d. için ORTAK DAĞILIMLAR
ORTAK OLASILIK FONKSİYONU: Birden fazla r.d.’in ortak
davranışını betimlemek istiyoruz. Önce iki değişkenli durumu inceleyelim.
X ve Y iki r.d. olsun. Bunların ortak olasılık fonksiyonu
f (x, y) = P (X = x ∩ Y = y)
Daha genel olarak X1 , X2 , . . . , Xk k tane kesikli r.d. ise bunların ortak
olasılık fonksiyonu şöyle olur:
f (x1 , x2 , . . . , xk ) = P (X1 = x1 ∩ X2 = x2 , ∩, . . . , ∩Xk = xk )
&
%
YTÜ-İktisat İstatistik II
'
İstatistik I Gözden Geçirme
23
$
X: Bir bankada 1 nolu gişede sırada bekleyen müşteri sayısı, Y : Bir
bankada 2 nolu gişede sırada bekleyen müşteri sayısı. Bu iki r.d. için
ortak olasılık fonksiyonu aşağıdaki tabloda verilmiştir.
y\x
0
1
2
3
Toplam
0
0.05
0.21
0
0
0.26
1
0.20
0.26
0.08
0
0.54
2
0
0.06
0.07
0.02
0.15
3
0
0
0.03
0.02
0.05
Toplam
0.25
0.53
0.18
0.04
1.00
&
%
YTÜ-İktisat İstatistik II
'
İstatistik I Gözden Geçirme
24
$
MARJİNAL OLASILIK FONKSİYONU
Ortak olasılık fonksiyonu biliniyorsa, bundan hareketle marjinal ya da
tekil olasılık fonksiyonları elde edilebilir.
X’in marjinal olasılık fonksiyonu:
f (x) =
X
f (x, y)
X
f (x, y)
y
Y ’nin marjinal olasılık fonksiyonu:
f (y) =
x
&
%
YTÜ-İktisat İstatistik II
'
İstatistik I Gözden Geçirme
25
$
KOŞULLU OLASILIK FONKSİYONU
Ortak olasılık fonksiyonu biliniyorsa, bundan hareketle koşullu olasılık
fonksiyonları elde edilebilir.
Y = y verilmişken X’in koşullu olasılık fonksiyonu:
f (x|y) =
f (x, y)
f (y)
X = x verilmişken Y ’nin koşullu olasılık fonksiyonu:
f (y|x) =
f (x, y)
f (x)
&
%
YTÜ-İktisat İstatistik II
'
İstatistik I Gözden Geçirme
26
$
BAĞIMSIZLIK
X ve Y r.d.’lerinin istatistik bakımından bağımsız olduğunu
söyleyebilmemiz için aşağıdaki koşulun sağlanması gerekir:
f (x, y) = f (x)f (y)
Başka bir deyişle
f (x|y) = f (x),
&
vef (y|x) = f (y)
%
YTÜ-İktisat İstatistik II
'
İstatistik I Gözden Geçirme
27
$
KOVARYANS
g(X, Y ), X ve Y r.d.’lerinin herhangi bir fonksiyonunu ifade etsin. Bu
fonksiyonun beklenen değeri:
XX
E [g(X, Y )] =
g(x, y)f (x, y)
x
y
g(X, Y ) = (X − µx )(Y − µy ) olsun. Bu fonksiyonun beklenen değerine
KOVARYANS denir:
XX
Cov (X, Y ) =
(x − µx )(y − µy )f (x, y)
x
y
&
%
YTÜ-İktisat İstatistik II
'
İstatistik I Gözden Geçirme
28
$
SÜREKLİ RASSAL DEĞİŞKENLER ve OLASILIK DAĞILIMLARI
X sürekli bir r.d. ise verilmiş bir aralıkta herhangi bir değeri alabilir. Bir
sürekli rassal değişkenin belli bir değere eşit olma olasılığından (kesikli
r.d. gibi) bahsedemeyiz. Ancak verilmiş bir aralık içine düşme
olasılıklarını bulabiliriz.
f (x): olasılık yoğunluk fonksiyonu. Özellikleri:
• f (x) ≥ 0
R∞
• −∞ f (x)dx = 1
• P r(a < X < b) =
&
Rb
a
f (x)dx
%
YTÜ-İktisat İstatistik II
'
İstatistik I Gözden Geçirme
29
$
f(x)
P(a <X <b) =
0
a
Rb
a
b
f(x)dx
x
&
YTÜ-İktisat İstatistik II
'
%
İstatistik I Gözden Geçirme
30
$
BİRİKİMLİ OLASILIK FONKSİYONU
X sürekli r.d. için birikimli olasılık fonksiyonu, ya da dağılım fonksiyonu,
X’in belli bir x değerini aşmama olasılığı olarak tanımlanır ve F (x) ile
gösterilir.
Z
x
F (x) = P (X ≤ x) =
f (t)dt
−∞
oyf ile dağılım fonksiyonu arasındaki ilişki:
f (x) =
&
dF (x)
dx
%
YTÜ-İktisat İstatistik II
'
İstatistik I Gözden Geçirme
31
$
BİRİKİMLİ OLASILIK FONKSİYONU
F (x)’in özellikleri:
F (−∞) = 0,
F (+∞) = 1
Buna göre F (x), x’in azalmayan bir fonksiyonudur. x1 ≤ x2 olmak üzere
F (x1 ) ≤ F (x2 ).
Z b
f (x)dx
P (a < X < b) = F (b) − F (a) =
a
P (−∞ < X < +∞) = P (−∞ < X < a)+P (a < X < b)+P (b < X < +∞)
Z +∞
Z b
Z a
Z ∞
f (x)dx
f (x)dx +
f (x)dx +
f (x)dx =
b
a
−∞
−∞
F (+∞) − F (−∞) = [F (a) − F (−∞)] + P (a < X < b) + [F (+∞) − F (b)]
1 = F (a) − 0 + P (a < X < b) + 1 − F (b)
P (a < X < b) = F (b) − F (a)
&
YTÜ-İktisat İstatistik II
'
%
İstatistik I Gözden Geçirme
32
$
f(x)
F (+∞
) −F (b ) = 1 −F (b )
F (a) −F (−∞
) = F (a)
Rb
a
0
&
a
f(x)dx = F (b ) −F (a)
b
x
%
YTÜ-İktisat İstatistik II
'
İstatistik I Gözden Geçirme
33
$
SÜREKLİ r.d.’lerin BEKLENEN DEĞERLERİ
Z ∞
xf (x)dx
E(X) ≡ µx =
−∞
g(x), X’in bir fonksiyonu ise,
Z
E(g(X)) =
∞
g(x)f (x)dx
−∞
V ar(X) =
Z
∞
−∞
(x − µx )2 f (x)dx
&
%
YTÜ-İktisat İstatistik II
'
İstatistik I Gözden Geçirme
34
$
İntegral özellikleri kullanılarak V ar(X) aşağıdaki gibi yazılabilir:
Z ∞
2
V ar(X) = E (X − E(X)) ≡
(x − µx )2 f (x)dx
=
Z
∞
2
x f (x)dx +
−∞
=
Z
=
−∞
∞
−∞
∞
−∞
µ2x
Z
2
x f (x)dx −
2
E(X ) −
µ2x
Z
∞
−∞
f (x)dx − 2µx
2
xf (x)dx
Z
∞
xf (x)dx
−∞
R∞
R∞
Burada −∞ f (x)dx = 1 ve −∞ xf (x)dx = E(X) ≡ µx özelliklerini
kullandık. Bunu kesikli r.d.ler için de göstermiştik.
&
%
YTÜ-İktisat İstatistik II
'
İstatistik I Gözden Geçirme
35
$
Sürekli r.d.’lerin MOMENTLERİ
• Tanım: Sürekli r.d. X’in knci momenti
Z
k
µk = E(X ) =
xk f (x)dx
k = 0, 1, 2, ...
x∈X
1. moment
µ1
=
E(X)
=⇒ populasyon ortalaması
2. moment
µ2
=
E(X 2 )
= V ar(X) + µ21
3. moment
µ3
=
E(X 3 )
4. moment
µ4
=
E(X 4 )
&
%
YTÜ-İktisat İstatistik II
'
İstatistik I Gözden Geçirme
36
$
Sürekli r.d.’lerin MERKEZİ MOMENTLERİ
• Tanım: Sürekli r.d. X’in knci merkezi momenti
Z
k
mk = E((X − µ1 ) ) =
(x − µ1 )k f (x)dx
k = 0, 1, 2, ...
x∈X
1. merkezi moment
m1
=
0
2. merkezi moment
m2
=
3. merkezi moment
m3
=
E((X − µ1 )2 )
4. merkezi moment
m4
=
&
= V ar(X)
E((X − µ1 )3 )
E((X − µ1 )4 )
%
YTÜ-İktisat İstatistik II
'
İstatistik I Gözden Geçirme
37
$
BEKLENTİ İŞLEMCİSİNİN ÖZELLİKLERİ
• Doğrusallık: X rassal değişkeninin doğrusal bir fonksiyonu
Y = a + bX olsun. Y ’nin beklenen değeri:
E[Y ] = E[a + bX] = a + bE(X)
• X1 , X2 , . . . , Xn rassal değişkenlerinin aşağıdaki gibi bir fonksiyonu
tanımlanıyor:
Y = b 1 X 1 + b n X 2 + . . . + bn X n
Y ’nin beklenen değeri:
E[Y ] = b1 E[X1 ] + b2 E[X2 ] + . . . + bn E[Xn ]
ya da kısaca
E(Y ) = E
n
X
bi X i
i=1
&
YTÜ-İktisat İstatistik II
'
!
=
n
X
bi E(Xi )
i=1
İstatistik I Gözden Geçirme
%
38
$
BEKLENTİ İŞLEMCİSİNİN ÖZELLİKLERİ
• X’in doğrusal olmayan bir fonksiyonu için genellikle
E[h(X)] 6= h(E(X))
• Örneğin, E(X 2 ) 6= (E(X))2 , E(ln(X)) 6= ln(E(X))
• X ve Y gibi iki r.d. için
E
&
X
Y
6=
E(X)
E(Y )
%
YTÜ-İktisat İstatistik II
'
İstatistik I Gözden Geçirme
39
VARYANSIN ÖZELLİKLERİ
$
• Herhangi bir c sabit sayısı için
V ar(c) = 0
• Y = bX’in varyansı, b sabit
V ar(Y ) = V ar(bX) = b2 V ar(X)
• Y = a + bX’in varyansı
V ar(Y ) = V ar(a + bX) = b2 V ar(X)
• X ve Y iki bağımsız r.d. ise
V ar(X + Y ) = V ar(X) + V ar(Y )
V ar(X − Y ) = V ar(X) + V ar(Y )
Bu kural n r.d. için genelleştirilebilir.
&
YTÜ-İktisat İstatistik II
'
İstatistik I Gözden Geçirme
%
40
$
Sürekli Standart Uniform (Tekdüze) Dağılım: Notation: X ∼ U (0, 1), oyf:

 1, if 0 < x < 1,
f (x) =
(1)
 0, otherwise.
E(X) =
V ar(X) =
&
1
2
1
12
%
YTÜ-İktisat İstatistik II
'
İstatistik I Gözden Geçirme
41
$
(Genel) Uniform (Tekdüze) Dağılım: Notation: X ∼ U (a, b), oyf:

 1
if a < x < b,
b−a
f (x; a, b) =
 0,
otherwise.
b−a
2
b−a
M edian =
2
(b − a)2
V ar(X) =
12
Skewness = 0
E(X) =
Excess kurtosis = −
6
5
&
YTÜ-İktisat İstatistik II
'
%
İstatistik I Gözden Geçirme
42
$
X ∼ U (a, b) için beklenen değer ve varyans:
Z b
x
dx
E(X) =
a b−a
2
b − a2
1
=
b−a
2
(b − a)(b + a)
=
2(b − a)
a+b
=
2
&
%
YTÜ-İktisat İstatistik II
'
İstatistik I Gözden Geçirme
43
$
X ∼ U (a, b) için g(x) = x2 fonksiyonunun beklenen değerini bulalım.
Z b
1
x2
E[g(x)] =
b−a
a
=
=
=
b3 − a3
3(b − a)
(b − a)(b2 + ab + a2 )
3(b − a)
a2 + ab + b2
= E[X 2 ].
3
&
%
YTÜ-İktisat İstatistik II
'
İstatistik I Gözden Geçirme
44
$
X ∼ U (a, b) için varyans:
V ar(X) =
=
=
&
E[(X − E(X))2 ] = E(X 2 ) − [E(X)]2
(a2 + ab + b2 ) (a + b)2
−
3
4
2
(b − a)
12
%
YTÜ-İktisat İstatistik II
'
İstatistik I Gözden Geçirme
45
$
U ∼ (a, b) için dağılım fonksiyonu:
F (x)
= P (X ≤ x)
Z x
1
dt
=
a b−a
x
t =
b − a
a
=
x−a
,
b−a
a ≤ x ≤ b aralığı için
yazılabilir. Öyleyse X ∼ U (a, b)’nin



 0,
x−a
F (x) =
b−a ,



1,
bof’nu şöyle olur:
x < a için;
a ≤ x ≤ b için;
x > b için.
&
%
YTÜ-İktisat İstatistik II
'
İstatistik I Gözden Geçirme
f(x)
&
$
F (x)
1
b −a
0
46
1
a
b
x
0
a
b
x
%
YTÜ-İktisat İstatistik II
'
İstatistik I Gözden Geçirme
47
$
ÖRNEK: Aşağıda verilen fonksiyonu düşünelim.

 e−x , 0 < x < ∞ ise;
f (x) =
 0,
değilse.
1. Bunun bir oyf olduğunu gösterin.
2. Bu fonksiyunun grafiğini çizin ve X > 1 olasılığı ile ilgili alanı
işaretleyin.
3. P (X > 1) olasılığını hesaplayın.
4. Birikimli olasılık fonksiyonunu bulun.
&
%
YTÜ-İktisat İstatistik II
'
İstatistik I Gözden Geçirme
48
$
CEVAP:
1. Olasılık yoğunluk fonksiyonları özelliklerini sağlayıp sağlamadığına
bakalım:
(a) (i) İlk olarak, f (x) ≥ 0 koşulunun 0 < x < ∞ aralığındaki her x
değeri için sağlandığı açıktır.
(b) (ii) Ayrıca, x’in değerler aralığında oyf’nin integralinin 1 olması
gerekir.
Z ∞
e−x dx = 1
0
∞
−e−x 0 = 1
−e−∞ − (−e0 )
=
1
0+1 =
1
−e−∞ = limx→∞ −e−x = 0 olarak düşünülmelidir. Bu koşul da
sağlandığına göre fonksiyon bir oyf’dir.
&
%
YTÜ-İktisat İstatistik II
'
İstatistik I Gözden Geçirme
49
$
1. P (X > 1) olasılığı grafikte gösterilmiştir.
2.
P (X > 1)
Z
∞
e−x dx
1
∞
−e−x =
=
1
−1
=
e
≈
0.36787
3.
F (x)
=
=
Z
x
e−t dt
0
x
−e−t = −e
&
YTÜ-İktisat İstatistik II
'
0
−x
+ e0
= 1 − e−x
İstatistik I Gözden Geçirme
%
50
$
Buradan birikimli olasılık fonksiyonu

 0,
x < 0;
F (x) =
 1 − e−x , 0 < x < ∞.
olarak bulunur.
&
%
YTÜ-İktisat İstatistik II
'
İstatistik I Gözden Geçirme
oyf : f( x) =e−x
f ( 1x )
0.9
0.9
0.8
0.8
0.7
0.7
0.6
P ( X > 1) =
R∞
1
0.5
0.6
e−x dx
0.5
0.4
0.4
0.3
0.3
0.2
0.2
0.1
0.1
0
0
1
2
$
bof : f( x) =1 −e−x
1x )
F (
51
3
4
0
5
0
1
2
3
x
4
5
x
&
%
YTÜ-İktisat İstatistik II
'
İstatistik I Gözden Geçirme
52
$
ORTAK OLASILIK YOĞUNLUK FONKSİYONU
X ve Y , sırasıyla, −∞ < X < +∞ ve −∞ < Y < +∞ aralıklarında
tanımlı iki sürekli r.d. olsun. Bu iki r.d. için ortak olasılık yoğunluk
fonksiyonu, f (x, y) ile gösterilir ve aşağıdaki gibi tanımlanır.
f (x, y) ≥ 0,
Z
∞
−∞
Z
∞
f (x, y)dxdy = 1,
−∞
P r(a < X < b, c < Y < d) =
Z
c
&
d
Z
b
f (x, y)dxdy.
a
%
YTÜ-İktisat İstatistik II
'
2
f (x, y) = xye−(x
fonksiyonu
İstatistik I Gözden Geçirme
+y 2 )
53
$
, x > 0, y > 0, için ortak olasılık yoğunluk
f(x,y)
0.2
0.18
0.16
0.14
0.12
0.1
0.08
0.06
0.04
0.02
0
3
2.5
3
2
2.5
1.5
y
2
1.5
1
1
0.5
0.5
0
x
0
&
%
YTÜ-İktisat İstatistik II
'
İstatistik I Gözden Geçirme
54
$
Örnek: Aşağıda verilen iki değişkenli fonksiyonun bir ortak olasılık
yoğunluk fonksiyonu olmasını sağlayacak k sabit sayısını bulun. Elde
ettiğiniz ooyf’nu kullanarak
P 0 < X < 12 , 1 < Y < 2 olasılığını bulun.

 k(x + y), 0 < x < 1, 0 < y < 2 ise;
f (x, y) =
 0,
değilse.
&
%
YTÜ-İktisat İstatistik II
'
İstatistik I Gözden Geçirme
55
$
Öncelikle f (x, y) > 0 koşulunun sağlanabilmesi için k > 0 olmalı. İkinci
koşuldan hareketle
Z 2Z 1
k(x + y)dxdy = 1
0
0
= k
Z
2
0
= 3k = 1
k=
1
3
2
1
y 2 1
+ y dy = k
y+
2
2
2 0
bulunur. Öyleyse ooyf
f (x, y) =


1
3 (x
 0,
+ y), 0 < x < 1, 0 < y < 2 ise;
değilse.
&
YTÜ-İktisat İstatistik II
'
%
İstatistik I Gözden Geçirme
56
$
İstenen olasılık ooyf’nun altındaki hacim olarak bulunur:
Z 2 Z 12
1
1
P 0<X< , 1<Y <2
=
(x + y) dxdy
2
1
0 3
2
Z 1 2 1 1
1 1
y 2 =
+ y dy =
y+
3 1
8 2
3 8
4 1
7
=
24
&
%
YTÜ-İktisat İstatistik II
'
İstatistik I Gözden Geçirme
57
$
MARJİNAL YOĞUNLUK FONKSİYONU
X’in myf:
f (x) =
∞
Z
f (x, y)dy
−∞
İntegralin sınırları y’nin tanım aralığıdır.
Y ’nin myf:
f (y) =
∞
Z
f (x, y)dx
−∞
İntegralin sınırları x’in tanım aralığıdır.
&
%
YTÜ-İktisat İstatistik II
'
İstatistik I Gözden Geçirme
58
$
Önceki örnekteki ooyf’nu kullanarak X ve Y rassal değişkenlerinin
marjinal olasılık yoğunluk fonksiyonlarını bulalım.
f (x)
=
=
=
&
2
1
(x + y)dy
0 3
2
1
y 2 xy +
3
2 0
2
(x + 1)
3
Z
%
YTÜ-İktisat İstatistik II
'
İstatistik I Gözden Geçirme
59
$
Böylelikle X için moyf’nu şöyle yazılır:

 2 (x + 1), 0 < x < 1 ise;
3
f (x) =
 0,
degilse.
Benzer şekilde Y ’nin moyf’nu

 1 (y + 1 ), 0 < y < 2 ise;
3
2
g(y) =
 0,
degilse.
olur.
&
YTÜ-İktisat İstatistik II
'
%
İstatistik I Gözden Geçirme
60
$
KOŞULLU OLASILIK YOĞUNLUK FONKSİYONU
Y = y değeri verilmişken X’in koşullu yoğunluk fonksiyonu:
f (x|y) =
f (x, y)
f (y)
Benzer şekilde X = x verilmişken Y ’nin koşullu yoğunluk fonksiyonu
f (y|x) =
&
f (x, y)
f (x)
%
YTÜ-İktisat İstatistik II
'
İstatistik I Gözden Geçirme
61
$
BAĞIMSIZLIK
Hatırlarsak aşağıdaki koşul sağlanıyorsa A ve B bağımsız olaylardır denir:
P (A ∩ B) = P (A)P (B)
Benzer şekilde X ve Y iki bağımsız sürekli r.d. ise
f (x, y) = f (x)f (y)
koşulu sağlanmalıdır.
i.e., ortak yoğunluk fonksiyonu, marjinal yoğunlukların çarpımı olarak
yazılabiliyorsa bu iki r.d. birbirinden bağımsızdır.
&
%
YTÜ-İktisat İstatistik II
'
İstatistik I Gözden Geçirme
62
$
BAĞIMSIZLIK: önceki koşul genelleştirilebilir.
X1 , X2 , . . . , Xn rassal değişkenlerinin ortak olasılık yoğunluk fonksiyonu
marjinal yoğunluk fonksiyonlarının çarpımı olarak yazılabiliyorsa
f (x1 , x2 , . . . , xn )
=
=
f1 (x1 ) · f2 (x2 )·, . . . , ·fn (xn )
n
Y
fj (xj )
j=1
bu rassal değişkenler birbirinden bağımsızdır denir. Bu özellik
kullanılarak Maksimum Olabilirlik (Maximum Likelihood) tahmin
edicileri türetilebilmektedir. Bu konuya Tahmin Yöntemleri başlığı
altında değineceğiz.
&
%
YTÜ-İktisat İstatistik II
'
İstatistik I Gözden Geçirme
63
$
BAĞIMSIZLIK
ÖRNEK: Önceki örnekteki ortak oyf ve marjinal oyf’nı kullanarak X ve
Y ’nin bağımsız olup olmadığını bulalım.
1
1
2
(x + 1) (y + )
3
3
2
6= f (x, y)
f (x)g(x) =
olduğundan X ve Y rassal değişkenleri bağımsız değildir.
&
YTÜ-İktisat İstatistik II
'
%
İstatistik I Gözden Geçirme
64
$
BAĞIMSIZLIK
ÖRNEK: Aşağıda verilen ooyf’nu kullanarak moyf’nı bularak bağımsız
olup olmadıklarına karar verelim.

 1 , 1 < x < 4, 1 < y < 4 ise;
9
f (x, y) =
 0, degilse.
Marjinal olasılık yoğunluk fonksiyonları
Z 4
1
dy =
f (x) =
1 9
Z 4
1
dx =
g(y) =
1 9
Buradan
1
f (x, y) = = f (x)g(y) =
9
1
3
1
3
1
1
3
3
koşulu sağlandığı için X ve Y rassal değişkenleri bağımsızdır.
&
%
YTÜ-İktisat İstatistik II
'
İstatistik I Gözden Geçirme
65
$
NORMAL DAĞILIM:
Notasyon: X ∼ N (µ, σ 2 )
1
1
2
f (x; µ, σ ) = √ exp − 2 (x − µ) ,
2σ
σ 2π
2
−∞ < x < ∞
E(X) = µ
V ar(X) = σ 2
skewness = 0
kurtosis = 3
&
%
YTÜ-İktisat İstatistik II
'
İstatistik I Gözden Geçirme
66
Normal Dağılım oyf, σ 2 = 1, farklı lokasyon parametreleri (µ)
$
Normal Dagilim, σ2=1
0.4
µ=2
µ=0
µ=5
0.35
µ = −2
0.3
µ = −5
φ(x)
0.25
0.2
0.15
0.1
0.05
0
−10
&
−8
−6
−4
−2
0
x
2
4
6
8
10
%
YTÜ-İktisat İstatistik II
'
İstatistik I Gözden Geçirme
67
$
Normal Dağılım oyf, µ = 0, farklı varyans (scale) parametreleri
Normal Dagilim, µ=0
0.4
0.35
2
σ = 1, µ = 0
0.3
φ(x)
0.25
0.2
2
σ = 2, µ = 0
0.15
0.1
2
σ = 3, µ = 0
0.05
0
−10
−8
−6
−4
−2
0
x
2
4
6
8
10
&
%
YTÜ-İktisat İstatistik II
'
İstatistik I Gözden Geçirme
STANDART NORMAL DAĞILIM:
Z = X−µ
σ ,
1
1 2
φ(z) = √ exp − z ,
2
2π
68
$
−∞ < z < ∞
E(Z) = 0
V ar(Z) = 1
Birikimli dağılım fonksiyonu:
Φ(z) = P (Z ≤ z) =
&
Z
z
−∞
1 2
1
√ exp − t dt
2
2π
%
YTÜ-İktisat İstatistik II
'
İstatistik I Gözden Geçirme
STANDART NORMAL DAGILIM φ(z)
69
$
STANDART NORMAL DAGILIM Φ(z)
0.4
1
0.9
0.35
0.8
0.3
0.7
0.25
0.6
0.2
0.5
0.4
0.15
0.3
0.1
0.2
0.05
0.1
0
−4
−3
−2
−1
0
1
2
3
4
0
−4
−3
−2
−1
0
1
2
3
4
&
YTÜ-İktisat İstatistik II
'
%
İstatistik I Gözden Geçirme
70
$
NORMAL DAĞILIM OLASILIKLARININ HESAPLANMASI
X ∼ N (µ, σ 2 ) olsun. Aşağıdaki olasılığı hesaplamak istiyoruz:
Z b
1
1
2
√ exp − 2 (x − µ) dx
P (a < X < b) =
2σ
a σ 2π
Bu integralin açık bir çözümü yoktur. Ancak nümerik yöntemlerle istenen
kesinlik düzeyinde hesaplanabilir. Bunun için her seferinde bilgisayarda
hesap yapmak yerine, standart normal dağılım tablolarını kullanabiliriz.
İstenen olasılığı aşağıdaki gibi yazalım:
a−µ
X −µ
b−µ
b−µ
a−µ
<
<
<Z<
=P
P
σ
σ
σ
σ
σ
&
%
YTÜ-İktisat İstatistik II
'
İstatistik I Gözden Geçirme
71
$
NORMAL DAĞILIM OLASILIKLARININ HESAPLANMASI
P
b−µ
a−µ
<Z<
σ
σ
=Φ
b−µ
σ
−Φ
a−µ
σ
Burada Φ(z) = P (Z ≤ z) standart normal dağılımın z’deki değeridir.
Kitaptaki notasyonda Φ(z) yerine F (z) kullanıldığına dikkat edin.
Standart Normal olasılık tablosu: Ek Çizelge 3
&
%
YTÜ-İktisat İstatistik II
'
İstatistik I Gözden Geçirme
72
$
NORMAL DAĞILIM OLASILIKLARININ HESAPLANMASI
Bu tabloda sadece pozitif değerler için dağılım fonksiyonu değerleri
verilmiştir. Negatif değerler için Φ(z) = P (Z ≤ z)’nin simetri özelliği
kullanılabilir:
Φ(−z)
= P (Z ≤ −z)
= P (Z ≥ z)
= 1 − P (Z ≤ z)
= 1 − Φ(z)
e.g.:
P (Z ≤ −1.25)
&
=
Φ(−1.25)
=
1 − Φ(1.25)
=
1 − 0.8944 = 0.1056
%
YTÜ-İktisat İstatistik II
'
İstatistik I Gözden Geçirme
73
$
0.4
0.35
0.3
0.25
0.2
0.15
0.1
0.05
0
−4
−3
−2
−1
0
1
2
3
4
&
%
YTÜ-İktisat İstatistik II
'
İstatistik I Gözden Geçirme
74
$
0.4
0.35
P(−1.25<Z<1.25) = Φ(1.25) −
Φ(−1.25)
= Φ(1.25) − (1−Φ(1.25))
= 0.8944 − 0.1056 = 0.7888
0.3
0.25
0.2
0.15
1 − Φ(1.25) = 0.1056
0.1
Φ(−1.25) = 0.1056
0.05
0
−4
&
−3
−2
−1
0
1
2
3
4
%
YTÜ-İktisat İstatistik II
'
İstatistik I Gözden Geçirme
75
$
MERKEZİ LİMİT TEOREMİ (CENTRAL LIMIT THEOREM)
X1 , X2 , . . . , Xn herbirinin ortalaması µ ve varyansı σ 2 olan ve aynı
dağılıma uyan n tane bağımsız r.d. olsun. Başka bir şekilde ifade
etmek istersek:
Xi ∼ i.i.d (µ, σ 2 ),
i = 1, 2, . . . , n
iid: türdeş (identical), ve bağımsız (independent) dağılımlı
Burada dağılımın ne olduğunu belirtmediğimize dikkat edin. Bu r.d.’lerin
toplamlarının beklenen değeri ve varyansı:
E[X1 + X2 + . . . + Xn ] = E[X1 ] + E[X2 ] + . . . + E[Xn ] = nµ
V ar[X1 + X2 + . . . + Xn ] = V ar[X1 ] + V ar[X2 ] + . . . + V ar[Xn ] = nσ 2
&
%
YTÜ-İktisat İstatistik II
'
İstatistik I Gözden Geçirme
76
$
MERKEZİ LİMİT TEOREMİ (CENTRAL LIMIT THEOREM)
Bu r.d.’lerin toplamına X diyelim. Yani, X = X1 + X2 + . . . + Xn
Z
=
=
=
X − nµ
X − E(X)
p
= √
V ar(X)
nσ 2
X
n −µ
n1/2
n σ
X −µ
√ ∼ N (0, 1)
σ/ n
MLT’ye göre gözlem sayısı arttıkça, yani, n → ∞, yukarıdaki ifade
standart normal dağılıma yakınsar, yani, Z → N (0, 1)
&
%
YTÜ-İktisat İstatistik II
'
İstatistik I Gözden Geçirme
n= 1
n= 2
4000
4000
1500
3000
3000
1000
2000
2000
500
1000
1000
0
0.2
0.4
0.6
0.8
1
0
0
0.2
0.4
n= 10
0.6
0.8
1
0
0
0.2
0.4
n= 30
6000
$
n= 3
2000
0
77
0.6
0.8
1
n= 50
5000
6000
4000
4000
4000
3000
2000
2000
2000
1000
0
0
0.2
0.4
0.6
0.8
1
0
0.2
0.3
n= 75
0.4
0.5
0.6
0.7
0
n= 1000
6000
6000
6000
4000
4000
4000
2000
2000
2000
0
0.35 0.4 0.45 0.5 0.55 0.6 0.65
n= 100
0
0.35 0.4 0.45 0.5 0.55 0.6 0.65
0.35 0.4 0.45 0.5 0.55 0.6 0.65
0
0.44
0.46
0.48
0.5
0.52
0.54
0.56
&
%
YTÜ-İktisat İstatistik II
'
İstatistik I Gözden Geçirme
78
$
BÜYÜK SAYILAR KANUNU (LAW of LARGE NUMBERS)
Merkezi Limit Teoremi, Büyük Sayılar Kanunu ile yakından ilişkilidir.
Büyük Sayılar Kanununa göre, türdeş dağılımlı (aynı anakütle beklenen
değeri µ ve varyansına σ 2 sahip), birbirinden bağımsız ve sonlu varyanslı
n r.d.’in aritmetik ortalaması (örneklem ortalaması) n büyüdükçe
anakütle ortalamasına yakınsar. X n = n1 (X1 + X2 + . . . + Xn ) örneklem
ortalaması olsun. Büyük sayılar yasasına göre
n −→ ∞,
X n −→ µ
Başka bir deyişle, istediğimiz kadar küçük seçebileceğimiz ǫ gibi pozitif
herhangi bir sayı için:
lim P |X n − µ| < ǫ = 1
n→∞
&
%
YTÜ-İktisat İstatistik II
'
İstatistik I Gözden Geçirme
79
$
MERKEZİ LİMİT TEOREMİ
ÖRNEK: X1 , X2 , . . . , X12 birbirinden bağımsız ve herbiri U ∼ (0, b),
b > 0 dağılımına sahip rassal değişkenler olsun. Merkezi Limit Teoremini
kullanarak P ( 4b < X < 3b
4 ) olasılığının yaklaşık 0.9973 olduğunu
gösterelim.
CEVAP: Bu 12 bağımsız r.d. uniform anakütleden geldiğine göre önce
anakütledeki ortalama ve varyansı bulmamız gerekir. Uniform(a, b)
dağılım için beklenen değer ve varyans
µx =
b+a
,
2
σx2 =
(b − a)2
12
olduğuna göre, örneğimizde
µx =
b
,
2
σx2 =
b2
12
olur.
&
%
YTÜ-İktisat İstatistik II
'
İstatistik I Gözden Geçirme
80
$
MERKEZİ LİMİT TEOREMİ
b2
σx2
=
n
144
CEVAP (devam): MLT’yi kullanarak:
V ar(X) =
P
&
b
3b
<X<
4
4
b
4
−
b
2
X − µx
< p
<
σx2 /n
3b
4
−
b
2
!
=
P
=
P (−3 < Z < 3) = Φ(3) − (1 − Φ(3))
=
0.99865 − (1 − 0.99865) = 0.9973
b
12
b
12
%
Download