YTÜ-İktisat İstatistik II ' İstatistik I Gözden Geçirme 1 $ İSTATİSTİK I KAVRAMLARININ GÖZDEN GEÇİRİLMESİ Hüseyin Taştan Yıldız Teknik Üniversitesi, İktisat Bölümü, email: [email protected] & YTÜ-İktisat İstatistik II ' % İstatistik I Gözden Geçirme 2 $ İSTATİSTİK BİLİMİNİN UĞRAŞI ALANLARI • Veriden anlam çıkarılması, özetlenmesi • Belirsizlik: neyin olduğu değil, neyin olası olduğu • Örnekleme (sampling): anakütlenin (population) tümüne ait bilgi toplamak çoğu zaman imkansızdır. Bunun yerine anakütleye ilişkin analiz bu anakütleyi en iyi temsil eden bir örnekleme dayandırılabilir. • İktisadi ilişkilerin analizi: Ekonometrinin alanı • Kestirim (Prediction) • Belirsizlik altında karar alma & % YTÜ-İktisat İstatistik II ' İstatistik I Gözden Geçirme 3 $ İSTATİSTİK İSTATİSTİK I İSTATİSTİK II Olasılık Teorisi Örnekleme ve Örneklem Dağılımları Rassal Değişkenler Nokta ve Aralık Tahmini Kesikli ve Sürekli R.D. Hipotez Testi Olasılık Fonksiyonu Regresyon ve Korelasyon Beklenen Değer, Moment Parametrik Olmayan Testler Normal Dağılım Varyans Analizi Merkezi Limit Teoremi & YTÜ-İktisat İstatistik II ' % İstatistik I Gözden Geçirme 4 $ RASSAL DEĞİŞKENLER ve OLASILIK DAĞILIMLARI • Rassal (Stokastik) Değişken (r.d.) : Alacağı değer belli bir rassal denemenin sonucuna bağlı olan, bu değere ilişkin kesinlik bulunmayan değişken. Büyük harflerle göstereceğiz. • x: rassal değişken X’in aldığı belli bir değer. • Kesikli r.d. : Alacağı değerler sayılabilir (sonlu ya da sonsuz) olan rassal değişkenler. Örneğin, iki zar atımında üste gelen sayıların toplamı, belli bir üretim bandında bir çalışanın yaptığı hata sayısı, bir bankaya 15 dk içinde gelen müşteri sayısı, vb. • Sürekli r.d.: Belli bir aralıkta her hangi bir değeri alabilen rassal değişken. Bir çok iktisadi değişken bu gruba girer, örneğin, bir şehirdeki ortalama harcanabilir gelir, belli bir dönemdeki enflasyon oranı, İMKB100 endeksinin kapanış değeri, bir yılda yapılan toplam ihracat tutarı, vb. & % YTÜ-İktisat İstatistik II ' İstatistik I Gözden Geçirme 5 $ OLASILIK DAĞILIMLARI - KESİKLİ • f (x) ile göstereceğiz, • f (x) ≥ 0, • f (x) = P (X = x), P • x f (x) = 1, Bu toplam x’in alabileceği tüm değerler üzerinedir, P • Birikimli dağılım fonksiyonu: P (X ≤ x0 ) = F (x0 ) = x≤x0 f (x) & YTÜ-İktisat İstatistik II ' % İstatistik I Gözden Geçirme 6 $ KESİKLİ OLASILIK DAĞILIMLARI • Örnek: 3 para atılıyor ve tura (T) gelme sayısı X ile gösteriliyor. • Bu deneyde ortaya çıkabilecek sonuçlar şunlardır: (TTT), (TTY), (TYT), (YTT), (TYY), (YTY), (YYT), ve (YYY). Bu 8 sonuç karşılıklı olarak bağdaşmazdır ve herbirinin gelme olasılığı aynıdır. Olasılık: 1/8. • X’in alabileceği değerler: 0, 1, 2, and 3. • X rassal değişkeninin dağılımını bulalım. & % YTÜ-İktisat İstatistik II ' İstatistik I Gözden Geçirme Sonuçlar x f (x) YYY 0 1/8 YYT 1 YTY 1 TYY 1 YTT 2 TYT 2 TTY 2 TTT 3 7 $ 3/8 3/8 1/8 & % YTÜ-İktisat İstatistik II ' İstatistik I Gözden Geçirme 8 $ X’in olasılık dağılımı: • P x x 0 1 2 3 f (x) = P (X = x) 1 8 3 8 3 8 1 8 f (x) = 1 • P (X ≤ 1) =? • P (1 ≤ X ≤ 3) =? & % YTÜ-İktisat İstatistik II ' İstatistik I Gözden Geçirme 9 $ X’in birikimli olasılık dağılımı 0, 1 8, 1 F (x) = P (X ≤ x) = 2, 7 8, 1, x < 0; 0 ≤ x < 1; 1 ≤ x < 2; 2 ≤ x < 3; x ≥ 3. & % YTÜ-İktisat İstatistik II ' İstatistik I Gözden Geçirme 10 $ OLASILIK FONKSIYONU 0.4 0.35 0.3 f(x) 0.25 0.2 0.15 0.1 0.05 0 −1 −0.5 0 0.5 1 1.5 x 2 2.5 3 3.5 4 2.5 3 3.5 4 BIRIKIMLI OLASILIK FONKSIYONU 1 0.8 F(x) 0.6 0.4 0.2 0 −1 & −0.5 0 0.5 1 1.5 x 2 % YTÜ-İktisat İstatistik II ' İstatistik I Gözden Geçirme 11 $ Kesikli r.d.’lerin BEKLENEN DEĞERLERİ • Kesikli r. d. X’in beklenen değeri E(X) = X xf (x) x • g(x), X’in bir fonksiyonu olsun, g(x)’in beklenen değeri X E(g(X)) = g(x)f (x) x & YTÜ-İktisat İstatistik II ' % İstatistik I Gözden Geçirme 12 $ ÖRNEK • Önceki örnekte X’in beklenen değerini bulun. 1 3 3 1 3 E(X) = 0 + 1 + 2 + 3 = 8 8 8 8 2 • (i) g(x) = x2 ’nin beklenen değerini bulun. 1 3 3 1 E(X 2 ) = 0 + 1 + 4 + 9 = 3 8 8 8 8 & % YTÜ-İktisat İstatistik II ' İstatistik I Gözden Geçirme 13 $ Kesikli r.d.’lerin VARYANSları • Tanım: V ar(X) h = 2 i E (X − E(X)) E (X 2 − 2XE(X) + (E(X))2 ) E X 2 − 2E (XE(X)) + E (E(X))2 ) 2 E X 2 − 2E(X)2 + (E(X)) E X 2 − E(X)2 = = = = • µx = E(X) dersek varyans V ar(X) = E X 2 − µ2x olarak yazılabilir. & % YTÜ-İktisat İstatistik II ' İstatistik I Gözden Geçirme 14 $ Kesikli r.d.’lerin MOMENTLERİ • Tanım: Kesikli r.d. X’in knci momenti X µk = E(X k ) = xk f (x) k = 0, 1, 2, ... x 1. moment µ1 = E(X) =⇒ populasyon ortalaması 2. moment µ2 = E(X 2 ) = V ar(X) + µ21 3. moment µ3 = E(X 3 ) 4. moment µ4 = E(X 4 ) & % YTÜ-İktisat İstatistik II ' İstatistik I Gözden Geçirme 15 $ Kesikli r.d.’lerin MERKEZİ MOMENTLERİ • Tanım: Kesikli r.d. X’in knci merkezi momenti X mk = E((X − µ1 )k ) = (x − µ1 )k f (x) k = 0, 1, 2, ... x 1. merkezi moment m1 = 0 2. merkezi moment m2 = 3. merkezi moment m3 = E((X − µ1 )2 ) 4. merkezi moment m4 = = V ar(X) E((X − µ1 )3 ) E((X − µ1 )4 ) & % YTÜ-İktisat İstatistik II ' İstatistik I Gözden Geçirme 16 $ Kesikli r.d.’lerin STANDART MOMENTLERİ • Tanım: Kesikli r.d. X’in knci standart momenti mk γk = k k = 0, 1, 2, ... σ Burada σ populasyon standart sapmasıdır: r h i p 2 σ = V ar(X) = E (X − µ1 ) 1. standart moment γ1 = 0 2. standart moment γ2 = 1 neden? 3. standart moment γ3 = çarpıklık (skewness) 4. standart moment γ4 = m3 σ3 m4 σ4 & basıklık (kurtosis) % YTÜ-İktisat İstatistik II ' İstatistik I Gözden Geçirme 17 $ Bazı Kesikli Dağılımlar • Bernoulli • Binom • Hipergeometrik • Poisson & % YTÜ-İktisat İstatistik II ' İstatistik I Gözden Geçirme 18 $ Bernoulli(p) Dağılımı: Beklenen Değer: p, f (x) = 1 − p, E(X) = if X = 1 if X = 0 X xf (x) = p · 1 + (1 − p) · 0 = p X x2 f (x) = p · 1 + (1 − p) · 0 = p x İkinci Moment: E(X 2 ) = x Varyans (ikinci merkezi moment): V ar(X) = E(X 2 ) − (E(X))2 = p − p2 = p(1 − p) & % YTÜ-İktisat İstatistik II ' İstatistik I Gözden Geçirme 19 $ BİNOM DAĞILIMI X, n bağımsız Bernoulli denemesinde 1 değerini alma (başarı) sayısı P olsun. Yani eğer Y Bernoulli(p) ise X = (Y ), Binom(n, p) dağılımına uyar. X toplam başarı sayısı. n n! px (1 − p)n−x = px (1 − p)n−x , x = 0, 1, 2, . . . , n f (x) = x!(n − x)! x E(X) = np V ar(X) = np(1 − p) & % YTÜ-İktisat İstatistik II ' İstatistik I Gözden Geçirme 20 $ HİPERGEOMETRİK DAĞILIM Eğer Bernoulli denemeleri birbirinden bağımsız değilse, toplam başarı sayısı Binom dağılımına uymaz. İçinde B tane başarı bulunan N nesneli rassal bir örneklemde, toplam başarı sayısı X’in olasılık dağılımı f (x) = B x N n N −B n−x Burada x max(0, n − (N − B)) ve min(n, B) arasında tamsayı değerler alabilir E(X) = np, & V ar(X) = N −n np(1 − p), N −1 p= B N % YTÜ-İktisat İstatistik II ' İstatistik I Gözden Geçirme 21 $ POISSON DAĞILIMI Bir olayın belli bir zaman diliminde gerçekleşme sayısı Notasyon: X ∼ P oisson(λ), pmf: λx e−λ f (x, λ) = , x! x = 0, 1, 2, . . . E(X) = λ V ar(X) = λ 1 skewness = √ λ excess kurtosis = 1 λ & % YTÜ-İktisat İstatistik II ' İstatistik I Gözden Geçirme 22 $ Kesikli r.d. için ORTAK DAĞILIMLAR ORTAK OLASILIK FONKSİYONU: Birden fazla r.d.’in ortak davranışını betimlemek istiyoruz. Önce iki değişkenli durumu inceleyelim. X ve Y iki r.d. olsun. Bunların ortak olasılık fonksiyonu f (x, y) = P (X = x ∩ Y = y) Daha genel olarak X1 , X2 , . . . , Xk k tane kesikli r.d. ise bunların ortak olasılık fonksiyonu şöyle olur: f (x1 , x2 , . . . , xk ) = P (X1 = x1 ∩ X2 = x2 , ∩, . . . , ∩Xk = xk ) & % YTÜ-İktisat İstatistik II ' İstatistik I Gözden Geçirme 23 $ X: Bir bankada 1 nolu gişede sırada bekleyen müşteri sayısı, Y : Bir bankada 2 nolu gişede sırada bekleyen müşteri sayısı. Bu iki r.d. için ortak olasılık fonksiyonu aşağıdaki tabloda verilmiştir. y\x 0 1 2 3 Toplam 0 0.05 0.21 0 0 0.26 1 0.20 0.26 0.08 0 0.54 2 0 0.06 0.07 0.02 0.15 3 0 0 0.03 0.02 0.05 Toplam 0.25 0.53 0.18 0.04 1.00 & % YTÜ-İktisat İstatistik II ' İstatistik I Gözden Geçirme 24 $ MARJİNAL OLASILIK FONKSİYONU Ortak olasılık fonksiyonu biliniyorsa, bundan hareketle marjinal ya da tekil olasılık fonksiyonları elde edilebilir. X’in marjinal olasılık fonksiyonu: f (x) = X f (x, y) X f (x, y) y Y ’nin marjinal olasılık fonksiyonu: f (y) = x & % YTÜ-İktisat İstatistik II ' İstatistik I Gözden Geçirme 25 $ KOŞULLU OLASILIK FONKSİYONU Ortak olasılık fonksiyonu biliniyorsa, bundan hareketle koşullu olasılık fonksiyonları elde edilebilir. Y = y verilmişken X’in koşullu olasılık fonksiyonu: f (x|y) = f (x, y) f (y) X = x verilmişken Y ’nin koşullu olasılık fonksiyonu: f (y|x) = f (x, y) f (x) & % YTÜ-İktisat İstatistik II ' İstatistik I Gözden Geçirme 26 $ BAĞIMSIZLIK X ve Y r.d.’lerinin istatistik bakımından bağımsız olduğunu söyleyebilmemiz için aşağıdaki koşulun sağlanması gerekir: f (x, y) = f (x)f (y) Başka bir deyişle f (x|y) = f (x), & vef (y|x) = f (y) % YTÜ-İktisat İstatistik II ' İstatistik I Gözden Geçirme 27 $ KOVARYANS g(X, Y ), X ve Y r.d.’lerinin herhangi bir fonksiyonunu ifade etsin. Bu fonksiyonun beklenen değeri: XX E [g(X, Y )] = g(x, y)f (x, y) x y g(X, Y ) = (X − µx )(Y − µy ) olsun. Bu fonksiyonun beklenen değerine KOVARYANS denir: XX Cov (X, Y ) = (x − µx )(y − µy )f (x, y) x y & % YTÜ-İktisat İstatistik II ' İstatistik I Gözden Geçirme 28 $ SÜREKLİ RASSAL DEĞİŞKENLER ve OLASILIK DAĞILIMLARI X sürekli bir r.d. ise verilmiş bir aralıkta herhangi bir değeri alabilir. Bir sürekli rassal değişkenin belli bir değere eşit olma olasılığından (kesikli r.d. gibi) bahsedemeyiz. Ancak verilmiş bir aralık içine düşme olasılıklarını bulabiliriz. f (x): olasılık yoğunluk fonksiyonu. Özellikleri: • f (x) ≥ 0 R∞ • −∞ f (x)dx = 1 • P r(a < X < b) = & Rb a f (x)dx % YTÜ-İktisat İstatistik II ' İstatistik I Gözden Geçirme 29 $ f(x) P(a <X <b) = 0 a Rb a b f(x)dx x & YTÜ-İktisat İstatistik II ' % İstatistik I Gözden Geçirme 30 $ BİRİKİMLİ OLASILIK FONKSİYONU X sürekli r.d. için birikimli olasılık fonksiyonu, ya da dağılım fonksiyonu, X’in belli bir x değerini aşmama olasılığı olarak tanımlanır ve F (x) ile gösterilir. Z x F (x) = P (X ≤ x) = f (t)dt −∞ oyf ile dağılım fonksiyonu arasındaki ilişki: f (x) = & dF (x) dx % YTÜ-İktisat İstatistik II ' İstatistik I Gözden Geçirme 31 $ BİRİKİMLİ OLASILIK FONKSİYONU F (x)’in özellikleri: F (−∞) = 0, F (+∞) = 1 Buna göre F (x), x’in azalmayan bir fonksiyonudur. x1 ≤ x2 olmak üzere F (x1 ) ≤ F (x2 ). Z b f (x)dx P (a < X < b) = F (b) − F (a) = a P (−∞ < X < +∞) = P (−∞ < X < a)+P (a < X < b)+P (b < X < +∞) Z +∞ Z b Z a Z ∞ f (x)dx f (x)dx + f (x)dx + f (x)dx = b a −∞ −∞ F (+∞) − F (−∞) = [F (a) − F (−∞)] + P (a < X < b) + [F (+∞) − F (b)] 1 = F (a) − 0 + P (a < X < b) + 1 − F (b) P (a < X < b) = F (b) − F (a) & YTÜ-İktisat İstatistik II ' % İstatistik I Gözden Geçirme 32 $ f(x) F (+∞ ) −F (b ) = 1 −F (b ) F (a) −F (−∞ ) = F (a) Rb a 0 & a f(x)dx = F (b ) −F (a) b x % YTÜ-İktisat İstatistik II ' İstatistik I Gözden Geçirme 33 $ SÜREKLİ r.d.’lerin BEKLENEN DEĞERLERİ Z ∞ xf (x)dx E(X) ≡ µx = −∞ g(x), X’in bir fonksiyonu ise, Z E(g(X)) = ∞ g(x)f (x)dx −∞ V ar(X) = Z ∞ −∞ (x − µx )2 f (x)dx & % YTÜ-İktisat İstatistik II ' İstatistik I Gözden Geçirme 34 $ İntegral özellikleri kullanılarak V ar(X) aşağıdaki gibi yazılabilir: Z ∞ 2 V ar(X) = E (X − E(X)) ≡ (x − µx )2 f (x)dx = Z ∞ 2 x f (x)dx + −∞ = Z = −∞ ∞ −∞ ∞ −∞ µ2x Z 2 x f (x)dx − 2 E(X ) − µ2x Z ∞ −∞ f (x)dx − 2µx 2 xf (x)dx Z ∞ xf (x)dx −∞ R∞ R∞ Burada −∞ f (x)dx = 1 ve −∞ xf (x)dx = E(X) ≡ µx özelliklerini kullandık. Bunu kesikli r.d.ler için de göstermiştik. & % YTÜ-İktisat İstatistik II ' İstatistik I Gözden Geçirme 35 $ Sürekli r.d.’lerin MOMENTLERİ • Tanım: Sürekli r.d. X’in knci momenti Z k µk = E(X ) = xk f (x)dx k = 0, 1, 2, ... x∈X 1. moment µ1 = E(X) =⇒ populasyon ortalaması 2. moment µ2 = E(X 2 ) = V ar(X) + µ21 3. moment µ3 = E(X 3 ) 4. moment µ4 = E(X 4 ) & % YTÜ-İktisat İstatistik II ' İstatistik I Gözden Geçirme 36 $ Sürekli r.d.’lerin MERKEZİ MOMENTLERİ • Tanım: Sürekli r.d. X’in knci merkezi momenti Z k mk = E((X − µ1 ) ) = (x − µ1 )k f (x)dx k = 0, 1, 2, ... x∈X 1. merkezi moment m1 = 0 2. merkezi moment m2 = 3. merkezi moment m3 = E((X − µ1 )2 ) 4. merkezi moment m4 = & = V ar(X) E((X − µ1 )3 ) E((X − µ1 )4 ) % YTÜ-İktisat İstatistik II ' İstatistik I Gözden Geçirme 37 $ BEKLENTİ İŞLEMCİSİNİN ÖZELLİKLERİ • Doğrusallık: X rassal değişkeninin doğrusal bir fonksiyonu Y = a + bX olsun. Y ’nin beklenen değeri: E[Y ] = E[a + bX] = a + bE(X) • X1 , X2 , . . . , Xn rassal değişkenlerinin aşağıdaki gibi bir fonksiyonu tanımlanıyor: Y = b 1 X 1 + b n X 2 + . . . + bn X n Y ’nin beklenen değeri: E[Y ] = b1 E[X1 ] + b2 E[X2 ] + . . . + bn E[Xn ] ya da kısaca E(Y ) = E n X bi X i i=1 & YTÜ-İktisat İstatistik II ' ! = n X bi E(Xi ) i=1 İstatistik I Gözden Geçirme % 38 $ BEKLENTİ İŞLEMCİSİNİN ÖZELLİKLERİ • X’in doğrusal olmayan bir fonksiyonu için genellikle E[h(X)] 6= h(E(X)) • Örneğin, E(X 2 ) 6= (E(X))2 , E(ln(X)) 6= ln(E(X)) • X ve Y gibi iki r.d. için E & X Y 6= E(X) E(Y ) % YTÜ-İktisat İstatistik II ' İstatistik I Gözden Geçirme 39 VARYANSIN ÖZELLİKLERİ $ • Herhangi bir c sabit sayısı için V ar(c) = 0 • Y = bX’in varyansı, b sabit V ar(Y ) = V ar(bX) = b2 V ar(X) • Y = a + bX’in varyansı V ar(Y ) = V ar(a + bX) = b2 V ar(X) • X ve Y iki bağımsız r.d. ise V ar(X + Y ) = V ar(X) + V ar(Y ) V ar(X − Y ) = V ar(X) + V ar(Y ) Bu kural n r.d. için genelleştirilebilir. & YTÜ-İktisat İstatistik II ' İstatistik I Gözden Geçirme % 40 $ Sürekli Standart Uniform (Tekdüze) Dağılım: Notation: X ∼ U (0, 1), oyf: 1, if 0 < x < 1, f (x) = (1) 0, otherwise. E(X) = V ar(X) = & 1 2 1 12 % YTÜ-İktisat İstatistik II ' İstatistik I Gözden Geçirme 41 $ (Genel) Uniform (Tekdüze) Dağılım: Notation: X ∼ U (a, b), oyf: 1 if a < x < b, b−a f (x; a, b) = 0, otherwise. b−a 2 b−a M edian = 2 (b − a)2 V ar(X) = 12 Skewness = 0 E(X) = Excess kurtosis = − 6 5 & YTÜ-İktisat İstatistik II ' % İstatistik I Gözden Geçirme 42 $ X ∼ U (a, b) için beklenen değer ve varyans: Z b x dx E(X) = a b−a 2 b − a2 1 = b−a 2 (b − a)(b + a) = 2(b − a) a+b = 2 & % YTÜ-İktisat İstatistik II ' İstatistik I Gözden Geçirme 43 $ X ∼ U (a, b) için g(x) = x2 fonksiyonunun beklenen değerini bulalım. Z b 1 x2 E[g(x)] = b−a a = = = b3 − a3 3(b − a) (b − a)(b2 + ab + a2 ) 3(b − a) a2 + ab + b2 = E[X 2 ]. 3 & % YTÜ-İktisat İstatistik II ' İstatistik I Gözden Geçirme 44 $ X ∼ U (a, b) için varyans: V ar(X) = = = & E[(X − E(X))2 ] = E(X 2 ) − [E(X)]2 (a2 + ab + b2 ) (a + b)2 − 3 4 2 (b − a) 12 % YTÜ-İktisat İstatistik II ' İstatistik I Gözden Geçirme 45 $ U ∼ (a, b) için dağılım fonksiyonu: F (x) = P (X ≤ x) Z x 1 dt = a b−a x t = b − a a = x−a , b−a a ≤ x ≤ b aralığı için yazılabilir. Öyleyse X ∼ U (a, b)’nin 0, x−a F (x) = b−a , 1, bof’nu şöyle olur: x < a için; a ≤ x ≤ b için; x > b için. & % YTÜ-İktisat İstatistik II ' İstatistik I Gözden Geçirme f(x) & $ F (x) 1 b −a 0 46 1 a b x 0 a b x % YTÜ-İktisat İstatistik II ' İstatistik I Gözden Geçirme 47 $ ÖRNEK: Aşağıda verilen fonksiyonu düşünelim. e−x , 0 < x < ∞ ise; f (x) = 0, değilse. 1. Bunun bir oyf olduğunu gösterin. 2. Bu fonksiyunun grafiğini çizin ve X > 1 olasılığı ile ilgili alanı işaretleyin. 3. P (X > 1) olasılığını hesaplayın. 4. Birikimli olasılık fonksiyonunu bulun. & % YTÜ-İktisat İstatistik II ' İstatistik I Gözden Geçirme 48 $ CEVAP: 1. Olasılık yoğunluk fonksiyonları özelliklerini sağlayıp sağlamadığına bakalım: (a) (i) İlk olarak, f (x) ≥ 0 koşulunun 0 < x < ∞ aralığındaki her x değeri için sağlandığı açıktır. (b) (ii) Ayrıca, x’in değerler aralığında oyf’nin integralinin 1 olması gerekir. Z ∞ e−x dx = 1 0 ∞ −e−x 0 = 1 −e−∞ − (−e0 ) = 1 0+1 = 1 −e−∞ = limx→∞ −e−x = 0 olarak düşünülmelidir. Bu koşul da sağlandığına göre fonksiyon bir oyf’dir. & % YTÜ-İktisat İstatistik II ' İstatistik I Gözden Geçirme 49 $ 1. P (X > 1) olasılığı grafikte gösterilmiştir. 2. P (X > 1) Z ∞ e−x dx 1 ∞ −e−x = = 1 −1 = e ≈ 0.36787 3. F (x) = = Z x e−t dt 0 x −e−t = −e & YTÜ-İktisat İstatistik II ' 0 −x + e0 = 1 − e−x İstatistik I Gözden Geçirme % 50 $ Buradan birikimli olasılık fonksiyonu 0, x < 0; F (x) = 1 − e−x , 0 < x < ∞. olarak bulunur. & % YTÜ-İktisat İstatistik II ' İstatistik I Gözden Geçirme oyf : f( x) =e−x f ( 1x ) 0.9 0.9 0.8 0.8 0.7 0.7 0.6 P ( X > 1) = R∞ 1 0.5 0.6 e−x dx 0.5 0.4 0.4 0.3 0.3 0.2 0.2 0.1 0.1 0 0 1 2 $ bof : f( x) =1 −e−x 1x ) F ( 51 3 4 0 5 0 1 2 3 x 4 5 x & % YTÜ-İktisat İstatistik II ' İstatistik I Gözden Geçirme 52 $ ORTAK OLASILIK YOĞUNLUK FONKSİYONU X ve Y , sırasıyla, −∞ < X < +∞ ve −∞ < Y < +∞ aralıklarında tanımlı iki sürekli r.d. olsun. Bu iki r.d. için ortak olasılık yoğunluk fonksiyonu, f (x, y) ile gösterilir ve aşağıdaki gibi tanımlanır. f (x, y) ≥ 0, Z ∞ −∞ Z ∞ f (x, y)dxdy = 1, −∞ P r(a < X < b, c < Y < d) = Z c & d Z b f (x, y)dxdy. a % YTÜ-İktisat İstatistik II ' 2 f (x, y) = xye−(x fonksiyonu İstatistik I Gözden Geçirme +y 2 ) 53 $ , x > 0, y > 0, için ortak olasılık yoğunluk f(x,y) 0.2 0.18 0.16 0.14 0.12 0.1 0.08 0.06 0.04 0.02 0 3 2.5 3 2 2.5 1.5 y 2 1.5 1 1 0.5 0.5 0 x 0 & % YTÜ-İktisat İstatistik II ' İstatistik I Gözden Geçirme 54 $ Örnek: Aşağıda verilen iki değişkenli fonksiyonun bir ortak olasılık yoğunluk fonksiyonu olmasını sağlayacak k sabit sayısını bulun. Elde ettiğiniz ooyf’nu kullanarak P 0 < X < 12 , 1 < Y < 2 olasılığını bulun. k(x + y), 0 < x < 1, 0 < y < 2 ise; f (x, y) = 0, değilse. & % YTÜ-İktisat İstatistik II ' İstatistik I Gözden Geçirme 55 $ Öncelikle f (x, y) > 0 koşulunun sağlanabilmesi için k > 0 olmalı. İkinci koşuldan hareketle Z 2Z 1 k(x + y)dxdy = 1 0 0 = k Z 2 0 = 3k = 1 k= 1 3 2 1 y 2 1 + y dy = k y+ 2 2 2 0 bulunur. Öyleyse ooyf f (x, y) = 1 3 (x 0, + y), 0 < x < 1, 0 < y < 2 ise; değilse. & YTÜ-İktisat İstatistik II ' % İstatistik I Gözden Geçirme 56 $ İstenen olasılık ooyf’nun altındaki hacim olarak bulunur: Z 2 Z 12 1 1 P 0<X< , 1<Y <2 = (x + y) dxdy 2 1 0 3 2 Z 1 2 1 1 1 1 y 2 = + y dy = y+ 3 1 8 2 3 8 4 1 7 = 24 & % YTÜ-İktisat İstatistik II ' İstatistik I Gözden Geçirme 57 $ MARJİNAL YOĞUNLUK FONKSİYONU X’in myf: f (x) = ∞ Z f (x, y)dy −∞ İntegralin sınırları y’nin tanım aralığıdır. Y ’nin myf: f (y) = ∞ Z f (x, y)dx −∞ İntegralin sınırları x’in tanım aralığıdır. & % YTÜ-İktisat İstatistik II ' İstatistik I Gözden Geçirme 58 $ Önceki örnekteki ooyf’nu kullanarak X ve Y rassal değişkenlerinin marjinal olasılık yoğunluk fonksiyonlarını bulalım. f (x) = = = & 2 1 (x + y)dy 0 3 2 1 y 2 xy + 3 2 0 2 (x + 1) 3 Z % YTÜ-İktisat İstatistik II ' İstatistik I Gözden Geçirme 59 $ Böylelikle X için moyf’nu şöyle yazılır: 2 (x + 1), 0 < x < 1 ise; 3 f (x) = 0, degilse. Benzer şekilde Y ’nin moyf’nu 1 (y + 1 ), 0 < y < 2 ise; 3 2 g(y) = 0, degilse. olur. & YTÜ-İktisat İstatistik II ' % İstatistik I Gözden Geçirme 60 $ KOŞULLU OLASILIK YOĞUNLUK FONKSİYONU Y = y değeri verilmişken X’in koşullu yoğunluk fonksiyonu: f (x|y) = f (x, y) f (y) Benzer şekilde X = x verilmişken Y ’nin koşullu yoğunluk fonksiyonu f (y|x) = & f (x, y) f (x) % YTÜ-İktisat İstatistik II ' İstatistik I Gözden Geçirme 61 $ BAĞIMSIZLIK Hatırlarsak aşağıdaki koşul sağlanıyorsa A ve B bağımsız olaylardır denir: P (A ∩ B) = P (A)P (B) Benzer şekilde X ve Y iki bağımsız sürekli r.d. ise f (x, y) = f (x)f (y) koşulu sağlanmalıdır. i.e., ortak yoğunluk fonksiyonu, marjinal yoğunlukların çarpımı olarak yazılabiliyorsa bu iki r.d. birbirinden bağımsızdır. & % YTÜ-İktisat İstatistik II ' İstatistik I Gözden Geçirme 62 $ BAĞIMSIZLIK: önceki koşul genelleştirilebilir. X1 , X2 , . . . , Xn rassal değişkenlerinin ortak olasılık yoğunluk fonksiyonu marjinal yoğunluk fonksiyonlarının çarpımı olarak yazılabiliyorsa f (x1 , x2 , . . . , xn ) = = f1 (x1 ) · f2 (x2 )·, . . . , ·fn (xn ) n Y fj (xj ) j=1 bu rassal değişkenler birbirinden bağımsızdır denir. Bu özellik kullanılarak Maksimum Olabilirlik (Maximum Likelihood) tahmin edicileri türetilebilmektedir. Bu konuya Tahmin Yöntemleri başlığı altında değineceğiz. & % YTÜ-İktisat İstatistik II ' İstatistik I Gözden Geçirme 63 $ BAĞIMSIZLIK ÖRNEK: Önceki örnekteki ortak oyf ve marjinal oyf’nı kullanarak X ve Y ’nin bağımsız olup olmadığını bulalım. 1 1 2 (x + 1) (y + ) 3 3 2 6= f (x, y) f (x)g(x) = olduğundan X ve Y rassal değişkenleri bağımsız değildir. & YTÜ-İktisat İstatistik II ' % İstatistik I Gözden Geçirme 64 $ BAĞIMSIZLIK ÖRNEK: Aşağıda verilen ooyf’nu kullanarak moyf’nı bularak bağımsız olup olmadıklarına karar verelim. 1 , 1 < x < 4, 1 < y < 4 ise; 9 f (x, y) = 0, degilse. Marjinal olasılık yoğunluk fonksiyonları Z 4 1 dy = f (x) = 1 9 Z 4 1 dx = g(y) = 1 9 Buradan 1 f (x, y) = = f (x)g(y) = 9 1 3 1 3 1 1 3 3 koşulu sağlandığı için X ve Y rassal değişkenleri bağımsızdır. & % YTÜ-İktisat İstatistik II ' İstatistik I Gözden Geçirme 65 $ NORMAL DAĞILIM: Notasyon: X ∼ N (µ, σ 2 ) 1 1 2 f (x; µ, σ ) = √ exp − 2 (x − µ) , 2σ σ 2π 2 −∞ < x < ∞ E(X) = µ V ar(X) = σ 2 skewness = 0 kurtosis = 3 & % YTÜ-İktisat İstatistik II ' İstatistik I Gözden Geçirme 66 Normal Dağılım oyf, σ 2 = 1, farklı lokasyon parametreleri (µ) $ Normal Dagilim, σ2=1 0.4 µ=2 µ=0 µ=5 0.35 µ = −2 0.3 µ = −5 φ(x) 0.25 0.2 0.15 0.1 0.05 0 −10 & −8 −6 −4 −2 0 x 2 4 6 8 10 % YTÜ-İktisat İstatistik II ' İstatistik I Gözden Geçirme 67 $ Normal Dağılım oyf, µ = 0, farklı varyans (scale) parametreleri Normal Dagilim, µ=0 0.4 0.35 2 σ = 1, µ = 0 0.3 φ(x) 0.25 0.2 2 σ = 2, µ = 0 0.15 0.1 2 σ = 3, µ = 0 0.05 0 −10 −8 −6 −4 −2 0 x 2 4 6 8 10 & % YTÜ-İktisat İstatistik II ' İstatistik I Gözden Geçirme STANDART NORMAL DAĞILIM: Z = X−µ σ , 1 1 2 φ(z) = √ exp − z , 2 2π 68 $ −∞ < z < ∞ E(Z) = 0 V ar(Z) = 1 Birikimli dağılım fonksiyonu: Φ(z) = P (Z ≤ z) = & Z z −∞ 1 2 1 √ exp − t dt 2 2π % YTÜ-İktisat İstatistik II ' İstatistik I Gözden Geçirme STANDART NORMAL DAGILIM φ(z) 69 $ STANDART NORMAL DAGILIM Φ(z) 0.4 1 0.9 0.35 0.8 0.3 0.7 0.25 0.6 0.2 0.5 0.4 0.15 0.3 0.1 0.2 0.05 0.1 0 −4 −3 −2 −1 0 1 2 3 4 0 −4 −3 −2 −1 0 1 2 3 4 & YTÜ-İktisat İstatistik II ' % İstatistik I Gözden Geçirme 70 $ NORMAL DAĞILIM OLASILIKLARININ HESAPLANMASI X ∼ N (µ, σ 2 ) olsun. Aşağıdaki olasılığı hesaplamak istiyoruz: Z b 1 1 2 √ exp − 2 (x − µ) dx P (a < X < b) = 2σ a σ 2π Bu integralin açık bir çözümü yoktur. Ancak nümerik yöntemlerle istenen kesinlik düzeyinde hesaplanabilir. Bunun için her seferinde bilgisayarda hesap yapmak yerine, standart normal dağılım tablolarını kullanabiliriz. İstenen olasılığı aşağıdaki gibi yazalım: a−µ X −µ b−µ b−µ a−µ < < <Z< =P P σ σ σ σ σ & % YTÜ-İktisat İstatistik II ' İstatistik I Gözden Geçirme 71 $ NORMAL DAĞILIM OLASILIKLARININ HESAPLANMASI P b−µ a−µ <Z< σ σ =Φ b−µ σ −Φ a−µ σ Burada Φ(z) = P (Z ≤ z) standart normal dağılımın z’deki değeridir. Kitaptaki notasyonda Φ(z) yerine F (z) kullanıldığına dikkat edin. Standart Normal olasılık tablosu: Ek Çizelge 3 & % YTÜ-İktisat İstatistik II ' İstatistik I Gözden Geçirme 72 $ NORMAL DAĞILIM OLASILIKLARININ HESAPLANMASI Bu tabloda sadece pozitif değerler için dağılım fonksiyonu değerleri verilmiştir. Negatif değerler için Φ(z) = P (Z ≤ z)’nin simetri özelliği kullanılabilir: Φ(−z) = P (Z ≤ −z) = P (Z ≥ z) = 1 − P (Z ≤ z) = 1 − Φ(z) e.g.: P (Z ≤ −1.25) & = Φ(−1.25) = 1 − Φ(1.25) = 1 − 0.8944 = 0.1056 % YTÜ-İktisat İstatistik II ' İstatistik I Gözden Geçirme 73 $ 0.4 0.35 0.3 0.25 0.2 0.15 0.1 0.05 0 −4 −3 −2 −1 0 1 2 3 4 & % YTÜ-İktisat İstatistik II ' İstatistik I Gözden Geçirme 74 $ 0.4 0.35 P(−1.25<Z<1.25) = Φ(1.25) − Φ(−1.25) = Φ(1.25) − (1−Φ(1.25)) = 0.8944 − 0.1056 = 0.7888 0.3 0.25 0.2 0.15 1 − Φ(1.25) = 0.1056 0.1 Φ(−1.25) = 0.1056 0.05 0 −4 & −3 −2 −1 0 1 2 3 4 % YTÜ-İktisat İstatistik II ' İstatistik I Gözden Geçirme 75 $ MERKEZİ LİMİT TEOREMİ (CENTRAL LIMIT THEOREM) X1 , X2 , . . . , Xn herbirinin ortalaması µ ve varyansı σ 2 olan ve aynı dağılıma uyan n tane bağımsız r.d. olsun. Başka bir şekilde ifade etmek istersek: Xi ∼ i.i.d (µ, σ 2 ), i = 1, 2, . . . , n iid: türdeş (identical), ve bağımsız (independent) dağılımlı Burada dağılımın ne olduğunu belirtmediğimize dikkat edin. Bu r.d.’lerin toplamlarının beklenen değeri ve varyansı: E[X1 + X2 + . . . + Xn ] = E[X1 ] + E[X2 ] + . . . + E[Xn ] = nµ V ar[X1 + X2 + . . . + Xn ] = V ar[X1 ] + V ar[X2 ] + . . . + V ar[Xn ] = nσ 2 & % YTÜ-İktisat İstatistik II ' İstatistik I Gözden Geçirme 76 $ MERKEZİ LİMİT TEOREMİ (CENTRAL LIMIT THEOREM) Bu r.d.’lerin toplamına X diyelim. Yani, X = X1 + X2 + . . . + Xn Z = = = X − nµ X − E(X) p = √ V ar(X) nσ 2 X n −µ n1/2 n σ X −µ √ ∼ N (0, 1) σ/ n MLT’ye göre gözlem sayısı arttıkça, yani, n → ∞, yukarıdaki ifade standart normal dağılıma yakınsar, yani, Z → N (0, 1) & % YTÜ-İktisat İstatistik II ' İstatistik I Gözden Geçirme n= 1 n= 2 4000 4000 1500 3000 3000 1000 2000 2000 500 1000 1000 0 0.2 0.4 0.6 0.8 1 0 0 0.2 0.4 n= 10 0.6 0.8 1 0 0 0.2 0.4 n= 30 6000 $ n= 3 2000 0 77 0.6 0.8 1 n= 50 5000 6000 4000 4000 4000 3000 2000 2000 2000 1000 0 0 0.2 0.4 0.6 0.8 1 0 0.2 0.3 n= 75 0.4 0.5 0.6 0.7 0 n= 1000 6000 6000 6000 4000 4000 4000 2000 2000 2000 0 0.35 0.4 0.45 0.5 0.55 0.6 0.65 n= 100 0 0.35 0.4 0.45 0.5 0.55 0.6 0.65 0.35 0.4 0.45 0.5 0.55 0.6 0.65 0 0.44 0.46 0.48 0.5 0.52 0.54 0.56 & % YTÜ-İktisat İstatistik II ' İstatistik I Gözden Geçirme 78 $ BÜYÜK SAYILAR KANUNU (LAW of LARGE NUMBERS) Merkezi Limit Teoremi, Büyük Sayılar Kanunu ile yakından ilişkilidir. Büyük Sayılar Kanununa göre, türdeş dağılımlı (aynı anakütle beklenen değeri µ ve varyansına σ 2 sahip), birbirinden bağımsız ve sonlu varyanslı n r.d.’in aritmetik ortalaması (örneklem ortalaması) n büyüdükçe anakütle ortalamasına yakınsar. X n = n1 (X1 + X2 + . . . + Xn ) örneklem ortalaması olsun. Büyük sayılar yasasına göre n −→ ∞, X n −→ µ Başka bir deyişle, istediğimiz kadar küçük seçebileceğimiz ǫ gibi pozitif herhangi bir sayı için: lim P |X n − µ| < ǫ = 1 n→∞ & % YTÜ-İktisat İstatistik II ' İstatistik I Gözden Geçirme 79 $ MERKEZİ LİMİT TEOREMİ ÖRNEK: X1 , X2 , . . . , X12 birbirinden bağımsız ve herbiri U ∼ (0, b), b > 0 dağılımına sahip rassal değişkenler olsun. Merkezi Limit Teoremini kullanarak P ( 4b < X < 3b 4 ) olasılığının yaklaşık 0.9973 olduğunu gösterelim. CEVAP: Bu 12 bağımsız r.d. uniform anakütleden geldiğine göre önce anakütledeki ortalama ve varyansı bulmamız gerekir. Uniform(a, b) dağılım için beklenen değer ve varyans µx = b+a , 2 σx2 = (b − a)2 12 olduğuna göre, örneğimizde µx = b , 2 σx2 = b2 12 olur. & % YTÜ-İktisat İstatistik II ' İstatistik I Gözden Geçirme 80 $ MERKEZİ LİMİT TEOREMİ b2 σx2 = n 144 CEVAP (devam): MLT’yi kullanarak: V ar(X) = P & b 3b <X< 4 4 b 4 − b 2 X − µx < p < σx2 /n 3b 4 − b 2 ! = P = P (−3 < Z < 3) = Φ(3) − (1 − Φ(3)) = 0.99865 − (1 − 0.99865) = 0.9973 b 12 b 12 %