3.12.14 1 EME 3105 Girdi Analizi Prosedürü 2 • Modellenecek sistemi (prosesi) dokümante et Sistem Simülasyonu • Veri toplamak için bir plan geliştir • Veri topla • Verilerin grafiksel ve istatistiksel analizini yap Dağılıma İyi Uyum Testleri Ders 10 • Olası dağılımları hipotez et • Dağılımların parametrelerini tahmin et • Hipotezlenen dağılımların uygunluğunu kontrol et • Simulasyon çıktıları üzerinde girdilerin duyarlılığını kontrol et Olasılık Çizgesi Dağılıma Uyumun Kontrol Edilmesi 3 4 Dağılımının ne olduğunu bilmediğiniz bir ana kitleden (populasyon) alınan n birimlik örnekleminiz olduğunu varsayalım. Veri grubunun hipotezlenen bir dağılıma uyup uymadığını nasıl kontrol edebiliriz? • İyi uyum testleriyle • Grafiksel olarak olasılık çizgeleriyle 1 3.12.14 Dağılıma Uyum Testleri Bir Hipotezin Testi 5 Uyum testleri, verilerin seçilen dağılıma ne kadar iyi uyduğunu gösterir. • Belirli bir hipotez hakkında bir karara yol açan bir prosedürdür. Verilerin uyumu, • Hipotez testi prosedürü, kitleden alınan bir rasgele örneklemdeki bilginin kullanılmasına dayanır. • 2 Ki-kare ( χ ) • Kolmogorov Smirnov (Sadece Sürekli dağılımlar) • Anderson Darling (Kesikli ve Sürekli dağılımlar) • Eğer bu bilgi hipotezle tutarlı ise, hipotezin doğru olduğu sonucuna; eğer bu bilgi hipotez ile tutarlı değilse, hipotezin yanlış olduğu kararına varırız. (Sadece Sürekli dağılımlar) testleriyle kontrol edilir. Ki-kare ( χ ) İyi Uyum Testi 2 Hipotez Testinin Adımları 1. Problemin içeriğinden ilgili parametreyi tanımla. H0: Örneklem verileri hipotezlenen dağılıma uyar. 2. Sıfır Hipotezini (H0 )ifade et. H1: Örneklem verileri hipotezlenen dağılıma uymaz. 3. Uygun bir alternatif hipotez (H1) belirt. § Test, Ki-kare dağılımına dayanır. 4. Bir anlam düzeyi (önem düzeyi) α seç. • Gi, i. sınıf aralığında gözlenen frekans, • Bi, i. sınıf aralığında beklenen frekans olsun. 5. Uygun bir test İstatistiği belirle. 6. İstatistik için red bölgesini belirle. f (x) 7. Herhangi bir gerekli örneklem miktarı hesapla, bunları test istatistiği için α /2 denklemde yerine koy ve bu değeri hesapla. f (x) Test İstatistiği: 2 ! 2α /2, n – 1 x (a) Bi α α !χ2α2, n – 1 0 α ,v x (b) MONTGOMERY: Applied Statistics, 3e Fig. 9.10 W-160 2 i=1 ! 2n – 1 α /2 8. H0’ın reddedilip reddedilmeyeceğine karar ver ve problem bağlamında 0 ! 21 – α /2, n – 1 bunu rapor et. (Gi − Bi )2 f (x) !χ2nα–,v1 ! 2n – 1 k χ 02 = ∑ 0 x ! 21 – α , n – 1 (c) 3.12.14 Hipotez Testlerinde I.Tip ve II.Tip Hatalar H0 doğru olduğu halde reddedildiğinde I. Tip Hata yapılır. Örnek 1 Testing for Goodness of Fit Belli bir ebattaki metal levha üzerindeki hata sayılarının Poisson dağılımına uyup, uymadığını araştıralım. 60 birimlik rassal örneklem alınmış ve aşağıda verilen hata sayıları gözlenmiştir. H0 yanlış olduğu halde kabul edildiğinde II.Tip Hata yapılır. Hata Sayısı Gözlenen Frekans KARAR H0 Kabul H0 Red H0 Doğru Doğru Karar I. Tip Hata H0 Yanlış II. Tip Hata Doğru Karar α=P(H0 red|H0 doğru)=P(I.Tip Hata) β=P(H0 kabul|H0 yanlış)=P(II. Tip Hata) Hipotezlenen λ=0.75 hata/levha parametreli Poisson dağılımından i. sınıf aralığıyla ilgili pi olasılıklarını aşağıdaki gibi hesaplayabiliriz. e− λ λ x x! ∀i ∀i i i i 32.0 + 15.1+ 9.2 + 4.3 = = 0.75 60 Example 9-12 Örnek 1 (devam) Örnek 1 (devam) f (x) = P(X = x) = ∑ f x nasıl SORU: Poisson Dağılımının Parametresini E[X] = λ = ∑f ** Bu örnekte, varsayılan Poisson tahmin edersiniz? dağılımının ortalaması bilinmemektedir, ve örneklem verisinden tahmin edilmelidir. Beklenen frekansları hesaplamak için örneklem büyüklüğü n=60 ve pi olasılıkları çarpılır. Bi=n.pi Hata Sayısı x = 0,1,2,... Olasılık Beklenen Frekans 0.472*(60) (veya daha fazla) Eğer beklenen frekans 5’ten küçükse, önceki sınıfla birleştir: Hata Sayısı (veya daha fazla) 3 Gozlenen Frekans Beklenen Frekans 3.12.14 2 Normal Dağılıma Sahip Bir Kitlenin Varyans χ = 3.84 0.05,1 ve Standart Sapması İçin Hipotez Testi Örnek 1 (devam) α=0.05 anlam düzeyi seçerek 8 adımlı hipotez testi prosedürünü uygulayalım: 1. İlgili değişken, levha üzerindeki hata sayısının dağılımının uyumudur. 2. H0: Lavha üzerindeki hata sayısı Poisson dağılımına uyar. 3. H1: Levha üzerindeki hata sayısı Poisson dağılımına uymaz. 4. α=0.05 Eğer H0 doğruysa, χ k (Gi − Bi )2 i=1 Bi χ 02 = ∑ 5. Test İstatistigi: 2 0 ‘nin, k-p-1 serbestlik dereceli ki-kare dağılımına uyduğu gösterilebilir p: Hipotez edilen dağılımın parametre sayısı, k: Sınıf sayısıdır. Örnek 1 (devam) P-Değeri Yaklaşımı 2 6. Eger χ 02 > χ 0.05,1 = 3.84 ise H 0 red n 7. Hesaplamalar: χ 02 = ( 32 − 28.32 )2 + (15 − 21.24 )2 + (13 − 10.44 )2 = 2.94 28.32 21.24 10.44 H0’ı reddetme kriteri olarak α’nın kullanımı; H0’ın zayıf bir şekilde mi yoksa güçlü bir şekilde mi reddedildiğini söylemez. Bunu bilmek için P-Değeri yaklaşımını kullanırız: Tanım P değeri, verilen veriyle (H 0 ) sıfır hipotezinin reddedilmesine yol açan en küçük anlam seviyesidir. 8. Sonuclar: SORU: Testin sonucu ne olur? 2 χ 02 = 2.94 < χ 0.05,1 = 3.84 oldugu icin levha üzerindeki hata sayısının ( P = P χ 2 > χ 02 Poisson dagılımına uyduguna iliskin H 0 hipotezini reddecek yeterli istatistiksel kanıt yoktur. 4 ) ( χ 2 Uyum testi icin) 3.12.14 P-Değeri Yaklaşımı f (x) ! 2nχ–α1,v 2 ! 2n – 1 Örnek 1 (devam) f (x) χ 02 = 28.32 = 2.94 α /2 ! 2α /2, n – 1 α /2, n – 1 x α Pα 0 (a) (b) 2 χ0 !2 α, n – 1 = 2.94 ( 21.24 10.44 ) ( ) P = P χ 2 > χ 02 = P χ 2 > 2.94 = ? x 0 x ! 21 – α , n – 1 2.94 2 χ0 = 2.94 dir ve bu, tablodaki 2,71 ve 3,84 değerleri arasındadır. Bu nedenle, P değeri, 0.05 ve 0.10 arasında olmalıdır. 0.05 < P < 0.10 0 P=0.086 (c) MONTGOMERY: Applied Statistics, 3e Fig. 9.10 W-160 Örnekte, H0 Kabul ! 2n –)21 (13 − 10.44 )2 ( 32 − 28.32 )2 + (15 − 21.24 + Cumulative Distribution Function Chi-Square with 1 DF x 2,94 P( X <= x ) 0,913589 P değeri=1-0,913589 ≈ 0,086 5 1 H0 Red Test kriteri: P degeri > α ise H 0'ı reddetme degeri ≤ α ise 'ı reddet SORU: TestinPsonucu neH olur? 0 Sonuç: α=0.05<P=0.086 olduğundan H0 Kabul