İstatistik Doç. Dr. Şakir GÖRMÜŞ SAÜ| e-FEK Bu konuyu çalıştıktan sonra: - Sürekli Rassal değişken kavramını açıklayabilir. Sürekli rassal değişkenlerin olasılıklarını hesaplayabilir. Normal dağılımı açıklayabilir ve hesaplayabilir. Merkezi Limit Teoremini açıklayabilir. 2 1. SÜREKLİ RASSAL DEĞİŞKENLER 2. SÜREKLİ RASSAL DEĞİŞKENLERİN OLASILIK DAĞILIMLARI 1. Birikimli Olasılık Fonksiyonu 2. Aralık Olasılığı ve Birikimli Olasılık Fonksiyonu 3. Olasılık Yoğunluk Fonksiyonu 3. NORMAL DAĞILIM 1. Normal Dağılım Olasılık Yoğunluk Fonksiyonu 2. Normal Dağılımın Özellikleri 3. Normal Rassal Değişkenlerin Aralık Olasılıkları 4. Standart Normal Dağılım 4. MERKEZİ LİMİT TEOREMİ - Sürekli Rassal değişken kavramını açıklayabilir. 1. SÜREKLİ RASSAL DEĞİŞKENLER Bu bölümde belli bir sayı çizgisi aralığında bütün değerleri alabilen değişkenler incelenecektir ki bu değişkenlere “Sürekli Rassal Değişkenler” denir. Zaman, uzaklık, sıcaklık, boy, kilo vb. ölçüler sürekli rassal değişkene örnek olarak verilebilir. Genellikle sürekli rassal değişkenlerin belli bir aralıkta olma olasılığı bu bölümde ilgi alanımızdır. Örneğin; Rassal olarak seçilen bir öğrencinin not ortalamasının 85-90 arasında olma olasılığı Rassal olarak seçilen bir ailenin yıllık gelirinin 15000-20000 TL arasında olma olasılığı Rassal olarak seçilen bir öğrencinin not ortalamasının 50’den düşük olma olasılığı Rassal olarak seçilen bir ailenin yıllık gelirinin 20000 TL’den yüksek olma olasılığı gibi - Sürekli rassal değişkenlerin olasılıklarını hesaplayabilir. 2. SÜREKLİ RASSAL DEĞİŞKENLERİN OLASILIK DAĞILIMLARI 2.1. Birikimli Olasılık Fonksiyonu X sürekli bir rassal değişkeni ve x ise bu değişkenin alabileceği belli bir değeri göstermektedir. X’in Birikimli Olasılık Fonksiyonu, X sürekli rassal değişkeninin belli bir x değerini aşmama olasılığını x’in bir fonksiyonu olarak verir. X’in Birikimli Olasılık Fonksiyonu: F (x) = P (X ≤ x ) = 𝑥 ƒ −∞ 𝑡 𝑑𝑡 2.2. Aralık Olasılığı ve Birikimli Olasılık Fonksiyonu X sürekli rassal değişkeni a ve b gibi iki değer alabiliyorsa, rassal değişkenin bu iki aralık arasında bir değer alma olasılığı, P (a < X < b) = F (b) – F (a) = 𝑏 ƒ 𝑎 𝑥 𝑑𝑥 - Sürekli rassal değişkenlerin olasılıklarını hesaplayabilir. 2.3. Olasılık Yoğunluk Fonksiyonu Uygulamada kolaylık sağladığı için “Olasılık Yoğunluk Fonksiyonu” daha yaygın kullanılmaktadır. X sürekli rassal değişkeninin belli bir aralıkta olma olasılığı “Olasılık Yoğunluk Fonksiyonu” ile hesaplanabilir. Sürekli rassal bir değişkenin Olasılık Yoğunluk Fonksiyonu aşağıdaki özelliklere sahiptir: 1. Olasılık Yoğunluk Fonksiyonu ƒ(x) ile gösterilir. 2. x’in bütün değerleri için ƒ(x) ≥ 0 (eğri yatay ekseni kesmez) 3. Olasılık Yoğunluk Fonksiyonu eğrisi altında kalan alan 1’e eşittir. - Sürekli rassal değişkenlerin olasılıklarını hesaplayabilir. X rassal değişkeninin a ve b değerleri arasında bir değer olma olasılığı, Olasılık Yoğunluk Fonksiyonu altında bu iki değer arasında kalan alandır. (a<b) P(a<X<b)= 𝑏 ƒ 𝑎 𝑥 𝑑𝑥 - Sürekli rassal değişkenlerin olasılıklarını hesaplayabilir. ÖRNEK: 𝑐𝑥 2 , 0≤𝑥≤3 𝑓 𝑥 = 0, 𝑑𝑖ğ𝑒𝑟 𝑥 𝑑𝑒ğ𝑒𝑟𝑙𝑒𝑟𝑖 𝑖ç𝑖𝑛 - Sürekli rassal değişkenlerin olasılıklarını hesaplayabilir. a) Yukarıdaki fonksiyonun olasılık yoğunluk fonksiyonu olabilmesi için c hangi değeri almalıdır? 𝑓 𝑥 = x3 =c 3 𝑐= |30 33 =c 3 𝑥 𝑓 −∞ 𝑥 𝑑𝑥 = 03 −c 3 = 3 2 𝑐𝑥 𝑑𝑥 0 =1 27 27 𝑐= 𝑐 = 1′𝑑𝑒𝑛 3 3 3 bulunur. 27 3 2 𝑥 , 27 𝑓 𝑥 = 0, b) Olasılık yoğunluk fonksiyonunu gösteriniz? 0≤𝑥≤3 𝑑𝑖ğ𝑒𝑟 𝑥 𝑑𝑒ğ𝑒𝑟𝑙𝑒𝑟𝑖 𝑖ç𝑖𝑛 - Sürekli rassal değişkenlerin olasılıklarını hesaplayabilir. c) F (x) kümülatif olasılık dağılım fonksiyonunu bulunuz? 𝑥 𝐹 𝑥 = 𝑥 𝑓 𝑡 𝑑𝑥 = −∞ 0 3 2 3 t3 x 3 x3 𝑡 𝑑𝑥 = = | = 27 27 3 0 27 3 d) F (2) ‘yi hesaplayınız? 𝑥3 = 27 - Sürekli rassal değişkenlerin olasılıklarını hesaplayabilir. e) P ( x ≥ 1) ‘in olasılık yoğunluk fonksiyonunu hesaplayınız? 3 𝑝 𝑥 ≥1 = 1 3 2 3 x3 𝑥 𝑑𝑥 = 27 27 3 27 1 |13 3 33 = 27 3 26 3 13 − 27 3 = 27 − 27 = 27 = 0.96 X rassal değişkeninin 1’den büyük olma olasılığı yüzde 96’dır. = - Sürekli rassal değişkenlerin olasılıklarını hesaplayabilir. f) P ( 1 ≤ X ≤ 2) ‘in olasılık yoğunluk fonksiyonunu hesaplayınız? 2 𝑝 1 ≤𝑥 ≤2 = 1 3 2 3 x3 𝑥 𝑑𝑥 = 27 27 3 |12 3 23 3 13 8 1 7 = − = − = = 0.26 27 3 27 3 27 27 27 X rassal değişkeninin 1ile 2 arasında olma olasılığı yüzde 26’dır. - Normal dağılımı açıklayabilir ve hesaplayabilir. 3. NORMAL DAĞILIM Günlük hayatta karşılaşılan birçok olayın olasılık yoğunluk fonksiyonu aritmetik ortalama etrafında yüksek ve uçlara doğru ise azalan bir seyir göstermektedir. Bu tür dağılımlara “Normal Dağılım” denir ve istatistik analizlerinde en çok kullanılandır. Normal olasılık yoğunluk fonksiyonu aşağıdaki şekilde görüldüğü üzere aritmetik ortalama etrafında simetrik bir dağılıma sahiptir. Normal olasılık yoğunluk fonksiyonu çana benzediğinden “Çan Eğrisi” olarak ta adlandırılır. - Normal dağılımı açıklayabilir ve hesaplayabilir. 3.1. Normal Dağılım Olasılık Yoğunluk Fonksiyonu X rassal değişkeninin Normal dağılımın olasılık yoğunluk fonksiyonu aşağıda verilmiştir. 𝑓 𝑥 = 1 𝑒 𝜎 2𝜋 (𝑥− µ)2 − 2𝜎2 , - ∞ < x < ∞ için Normal dağılımın olasılık yoğunluk fonksiyonunda yer alan sembollerin açıklanmaya ihtiyacı vardır. x = olasılığı hesaplanacak tesadüfi değişken e = 2.718 (tabii logaritmanın tabanı) π = 3.141 (pi sayısı) - Normal dağılımı açıklayabilir ve hesaplayabilir. µ ve σ2, eksi sonsuz ile artı sonsuz arasında bir değer alabilir. Bundan dolayı tek bir normal dağılım yoktur µ ve σ2 alacağı değerlere göre farklı olabilirler. X rassal değişkeninin ortalaması µ ve varyansı σ2 olan normal dağılıma sahip ise bu aşağıdaki şekilde gösterilir. X N (μ ,σ2 ) X rassal değişkeninin istenilen bir aralıkta olma olasılığı aşağıdaki şekilde hesaplanabilir. 𝑏 𝑓 𝑥 =𝑃 𝑎<𝑋<𝑏 = 𝑎 1 𝜎 2𝜋 (𝑥− µ)2 − 𝑒 2𝜎2 𝑑𝑥 - Normal dağılımı açıklayabilir ve hesaplayabilir. X rassal değişkeninin ortalaması µ ve varyansı σ2 olan normal dağılıma uyduğu düşünülürse aşağıdaki özelliklere sahip olacaktır. 1. X rassal değişkeninin ortalaması E (X) = µ 2. X rassal değişkeninin varyansı Var (X) = E [ ( X- µ )2 ] = σ2 3. Skewness = 0 (Basıklık katsayısı) X rassal değişkeninin dağılımın ortalaması ve varyansı bu değişkenin olasılık fonksiyonunun şeklini belirler. Dağılımın iki parametresi olan ortalama ve varyansı değiştikçe normal dağılım grafiğinin şeklide aşağıdaki örneklerde görüldüğü üzere değişecektir. - Normal dağılımı açıklayabilir ve hesaplayabilir. Şekil A’da normal dağılıma sahip ortalamaları aynı varyansları farklı iki tane olasılık yoğunluk fonksiyonu verilmektedir. Şekilden de görüldüğü üzere varyans azaldıkça olasılık yoğunluk fonksiyonu sivrileşmektedir (Basıklığı azalmaktadır). Şekil B’de normal dağılıma sahip varyansları aynı ortalamaları farklı iki tane olasılık yoğunluk fonksiyonu verilmektedir. Şekilden de görüldüğü üzere ortalama artıkça yoğunluk fonksiyonu yana kayarken biçiminde herhangi bir değişme söz konusu değildir. - Normal dağılımı açıklayabilir ve hesaplayabilir. 3.3. Normal Rassal Değişkenlerin Kümülatif (Birikimli) Olasılık Fonksiyonu Ortalaması µ ve varyansı σ2 olan normal dağılıma sahip bir X rassal değişkeninin Kümülatif olasılık fonksiyonu F (x) = P ( X ≤ x0 ) olarak gösterilir. X rassal değişkeninin belli bir x0 değerinde küçük olma olasılığını gösterir. Yukarıdaki şekilde gri taralı alan, normal dağılıma sahip X rassal değişkeninin herhangi bir x0 değerinden küçük olma olasılığını vermektedir. Bu alan aşağıdaki genel formül yardımıyla bulunabilir. 𝑥0 𝐹 𝑥 =𝑃 𝑋≤ 𝑥0 = −∞ 1 𝜎 2𝜋 𝑒 − (𝑥− µ)2 2𝜎2 𝑑𝑥 - Normal dağılımı açıklayabilir ve hesaplayabilir. Ortalaması µ ve varyansı σ2 olan normal dağılıma sahip bir X rassal değişkeninin aralıklı olasılık fonksiyonu F (a) – F (b) = P ( a < X < b ) olarak gösterilir. X rassal değişkeninin a ve b gibi iki değer arasında olma olasılığını gösterir (a < b koşuluyla). Yukarıdaki şekilde gri taralı alan, normal dağılıma sahip X rassal değişkeninin a ve b gibi iki değer arasında olma olasılığını vermektedir. Bu alan aşağıdaki genel formül yardımıyla bulunabilir. 𝑏 𝑓 𝑥 =𝑃 𝑎<𝑋<𝑏 = 𝑎 1 𝜎 2𝜋 (𝑥− µ)2 − 𝑒 2𝜎2 𝑑𝑥 - Normal dağılımı açıklayabilir ve hesaplayabilir. 3.5. Standart Normal Dağılım Normal olasılık fonksiyonlarını hesaplamak bazı güçlükler içerdiğinden her seferinde bilgisayar yardımıyla sayısal yöntemler kullanılarak hesaplamamız gerekir. Bu işlemi yapmak yerine standart normal dağılım (Z) tablosu kullanılabilir. Bu tablolarda her bir normal olasılık dağılımının olasılıkları çizelgeleştirilmiş ve tek bir normal dağılım olasılıklarıyla ifade edilmiştir. X ortalaması 0 ve varyansı 1 olan normal rassal değişken ise Standart normal dağılıma (Z) sahip demektir ve aşağıdaki şekilde gösterilir. Z N (μ=0 ,σ2 =1) X rassal değişkeninin Normal dağılımın olasılık yoğunluk fonksiyonu aşağıda verilmiştir. 2 𝑓 𝑧 = 𝑍 1 − 2 𝑒 2𝜋 , - ∞ < x < ∞ için - Normal dağılımı açıklayabilir ve hesaplayabilir. Standart Normal Dağılımın Özellikleri 1. X rassal değişkeninin ortalaması E (X) = µ 2. X rassal değişkeninin varyansı Var (X) = E [ ( X- µ )2 ] = σ2 3. Skewness = 0 (Basıklık katsayısı) 4. Kurtosis = 3 (Çarpıklık Katsayısı) Standart normal dağılımın olasılık yoğunluk fonksiyonunda yer alan sembollerin açıklanmaya ihtiyacı vardır. Z= 𝑋− µ 𝜎 E (Z) = µ = 0 Var (Z) = σ = 1 Z değeri belirli bir değerin aritmetik ortalamadan kaç standart sapma aşağıda ya da yukarıda olduğunu belirlemek için kullanılır. - Normal dağılımı açıklayabilir ve hesaplayabilir. Yukarıdaki şekilde standart normal dağılıma sahiptir. 1. Dağılım ortalamaya göre simetriktir. %50'si sağda, %50'si soldadır. 2.Normal dağılım eğrisinin altında kalan alan 1’e eşittir. 3. Normal dağılımı gösteren değişkenlerin aldıkları değerlerin; Gözlemlerin %68 ‘ i ortalama ile 1 standart sapma aralığına, Gözlemlerin %95‘ i ortalama ile 2 standart sapma aralığına, ve Gözlemlerin %99 ‘ i ortalama ile 3 standart sapma aralığına düşer. - Normal dağılımı açıklayabilir ve hesaplayabilir. Normal Dağılımın Standart Normal Dağılıma Çevrilmesi Normal dağılımları standart normal dağılımlara kolaylıkla çevirebiliriz. Bu çevirme işleminden sonrada olasılıkları standart normal dağılım (Z) tablosu yardımıyla bulabiliriz. ÖRNEK 1: Sakarya Üniversitesi öğrencilerinin gelirleri normal dağılıma sahiptir. Ortalamasının (μ) 400 ve standart sapmanın (σ) 50 olduğu bilindiğine göre tesadüfü seçilen bir öğrencinin geliri 500 (X) olsun. Bu normal dağılımı standart normal dağılıma çeviriniz. Z= 𝑋− µ 𝜎 = 500−400 50 =2 Bu durumda seçilen öğrencinin geliri, ortalamadan 2 standart sapma daha yüksektir. - Normal dağılımı açıklayabilir ve hesaplayabilir. - Normal dağılımı açıklayabilir ve hesaplayabilir. ÖRNEK 2: Sakarya Üniversitesi öğrencilerinin gelirleri normal dağılıma sahiptir. Ortalamasının (μ) 400 ve standart sapmanın (σ) 50 olduğu bilindiğine göre tesadüfü seçilen bir öğrencinin geliri 350 (X) olsun. Bu normal dağılımı standart normal dağılıma çeviriniz. Z= 𝑋− µ 𝜎 = 350−400 50 = −1 Bu durumda seçilen öğrencinin geliri, ortalamadan 1 standart sapma düşüktür. - Normal dağılımı açıklayabilir ve hesaplayabilir. z 0.00 0.01 0.02 0.03 0.04 0.05 0.06 0.07 0.08 0.09 0.0 0.0000 0.0040 0.0080 0.0120 0.0160 0.0199 0.0239 0.0279 0.0319 0.0359 0.1 0.0398 0.0438 0.0478 0.0517 0.0557 0.0596 0.0636 0.0675 0.0714 0.0753 0.2 0.0793 0.0832 0.0871 0.0910 0.0948 0.0987 0.1026 0.1064 0.1103 0.1141 0.3 0.1179 0.1217 0.1255 0.1293 0.1331 0.1368 0.1406 0.1443 0.1480 0.1517 0.4 0.1554 0.1591 0.1628 0.1664 0.1700 0.1736 0.1772 0.1808 0.1844 0.1879 0.5 0.1915 0.1950 0.1985 0.2019 0.2054 0.2088 0.2123 0.2157 0.2190 0.2224 0.6 0.2257 0.2291 0.2324 0.2357 0.2389 0.2422 0.2454 0.2486 0.2517 0.2549 0.7 0.2580 0.2611 0.2642 0.2673 0.2704 0.2734 0.2764 0.2794 0.2823 0.2852 0.8 0.2881 0.2910 0.2939 0.2967 0.2995 0.3023 0.3051 0.3078 0.3106 0.3133 0.9 0.3159 0.3186 0.3212 0.3238 0.3264 0.3289 0.3315 0.3340 0.3365 0.3389 1.0 0.3413 0.3438 0.3461 0.3485 0.3508 0.3531 0.3554 0.3577 0.3599 0.3621 1.1 0.3643 0.3665 0.3686 0.3708 0.3729 0.3749 0.3770 0.3790 0.3810 0.3830 1.2 0.3849 0.3869 0.3888 0.3907 0.3925 0.3944 0.3962 0.3980 0.3997 0.4015 1.3 0.4032 0.4049 0.4066 0.4082 0.4099 0.4115 0.4131 0.4147 0.4162 0.4177 - Normal dağılımı açıklayabilir ve hesaplayabilir. Standart normal dağılım tablosunun bir kısmı aşağıda verilmiştir. Bu tabloyu okumayı bilmemiz gerekir. Z tablosu •Artı eksi 3.49 arasında değişiyor. •Bu, teorik evrenin %99.98’ine karşılık geliyor. •Z tablosu 1/10’luk aralarla standart sapmayı gösteriyor •Araştırmacılar z tablosundaki birkaç değerle ilgilenir. Çünkü çoğu hipotez testlerinde %95 ve %99’luk alanlarla ilgileniyor. - Normal dağılımı açıklayabilir ve hesaplayabilir. ÖRNEK 1. Standart normal dağılıma dönüştürülen bir normal dağılımın P(Z<0.68) olduğunu varsayalım. Bunun için ilk önce mavi dikey ve mavi yatay sütunlara bakmalıyız. 0.68 bu sütunlarda .6 ve .08 noktalarının (.6 + .08 = .68) kesiştiği yerde aranır. Böylece P(Z<0.68) = .7517 deriz. - Normal dağılımı açıklayabilir ve hesaplayabilir. ÖRNEK 2. Standart normal dağılıma dönüştürülen bir normal dağılımın P(Z>2.18) olduğunu varsayalım. Bu olasılığı tabloda arayabilmenin tek koşulu P(Z<Z0) şeklinde yazılabilmesidir. P(Z>2.18) = 1 - P(Z<2.18) = 1- 0.9854 = 0.0146 şeklinde bulunur. - Normal dağılımı açıklayabilir ve hesaplayabilir. ÖRNEK 3. Standart normal dağılıma dönüştürülen bir normal dağılımın P(1.36<Z<1.96) olduğunu varsayalım. Bu aralıklardaki olasılık P(Z<1.96) - P(Z<1.36) = 0.9750- 0.9131 =0.0619 şeklinde bulunur.