Girdi Analizi II

advertisement
3.12.14 1
EME 3105
Girdi Analizi Prosedürü
2
•  Modellenecek sistemi (prosesi) dokümante et
Sistem Simülasyonu
•  Veri toplamak için bir plan geliştir
•  Veri topla
•  Verilerin grafiksel ve istatistiksel analizini yap
Dağılıma İyi Uyum Testleri
Ders 10
•  Olası dağılımları hipotez et
•  Dağılımların parametrelerini tahmin et
•  Hipotezlenen dağılımların uygunluğunu kontrol et
•  Simulasyon çıktıları üzerinde girdilerin duyarlılığını kontrol et
Olasılık Çizgesi
Dağılıma Uyumun Kontrol Edilmesi
3
4
Dağılımının ne olduğunu bilmediğiniz bir ana kitleden
(populasyon) alınan n birimlik örnekleminiz olduğunu
varsayalım.
Veri grubunun hipotezlenen bir dağılıma uyup uymadığını
nasıl kontrol edebiliriz?
•  İyi uyum testleriyle
•  Grafiksel olarak olasılık çizgeleriyle
1 3.12.14 Dağılıma Uyum Testleri
Bir Hipotezin Testi
5
Uyum testleri, verilerin seçilen dağılıma ne kadar iyi uyduğunu
gösterir.
•  Belirli bir hipotez hakkında bir
karara yol açan bir prosedürdür.
Verilerin uyumu,
•  Hipotez testi prosedürü, kitleden
alınan bir rasgele örneklemdeki
bilginin kullanılmasına dayanır.
• 
2
Ki-kare ( χ )
• 
Kolmogorov Smirnov (Sadece Sürekli dağılımlar)
• 
Anderson Darling
(Kesikli ve Sürekli dağılımlar)
•  Eğer bu bilgi hipotezle tutarlı ise,
hipotezin doğru olduğu sonucuna;
eğer bu bilgi hipotez ile tutarlı
değilse, hipotezin yanlış olduğu
kararına varırız.
(Sadece Sürekli dağılımlar)
testleriyle kontrol edilir.
Ki-kare ( χ ) İyi Uyum Testi
2
Hipotez Testinin Adımları
1. Problemin içeriğinden ilgili parametreyi tanımla.
H0: Örneklem verileri hipotezlenen dağılıma uyar.
2. Sıfır Hipotezini (H0 )ifade et.
H1: Örneklem verileri hipotezlenen dağılıma uymaz.
3. Uygun bir alternatif hipotez (H1) belirt.
§  Test, Ki-kare dağılımına dayanır.
4. Bir anlam düzeyi (önem düzeyi) α seç.
• 
Gi, i. sınıf aralığında gözlenen frekans,
• 
Bi, i. sınıf aralığında beklenen frekans olsun.
5. Uygun bir test İstatistiği belirle.
6. İstatistik için red bölgesini belirle.
f (x)
7. Herhangi bir gerekli örneklem miktarı hesapla, bunları test istatistiği için
α /2
denklemde yerine koy ve bu değeri hesapla.
f (x)
Test İstatistiği:
2
! 2α /2, n – 1
x
(a)
Bi
α
α
!χ2α2, n – 1
0
α ,v
x
(b)
MONTGOMERY: Applied Statistics, 3e
Fig. 9.10
W-160
2 i=1
! 2n – 1
α /2
8. H0’ın reddedilip reddedilmeyeceğine karar ver ve problem bağlamında
0 ! 21 – α /2, n – 1
bunu rapor et.
(Gi − Bi )2
f (x)
!χ2nα–,v1
! 2n – 1
k
χ 02 = ∑
0
x
! 21 – α , n – 1
(c)
3.12.14 Hipotez Testlerinde
I.Tip ve II.Tip Hatalar
H0 doğru olduğu halde reddedildiğinde I. Tip Hata yapılır.
Örnek
1
Testing
for Goodness of Fit
Belli bir ebattaki metal levha üzerindeki hata sayılarının Poisson
dağılımına uyup, uymadığını araştıralım. 60 birimlik rassal örneklem
alınmış ve aşağıda verilen hata sayıları gözlenmiştir.
H0 yanlış olduğu halde kabul edildiğinde II.Tip Hata yapılır.
Hata
Sayısı
Gözlenen
Frekans
KARAR
H0 Kabul
H0 Red
H0 Doğru
Doğru Karar
I. Tip Hata
H0 Yanlış
II. Tip Hata
Doğru Karar
α=P(H0 red|H0 doğru)=P(I.Tip Hata)
β=P(H0 kabul|H0 yanlış)=P(II. Tip Hata) Hipotezlenen λ=0.75 hata/levha parametreli Poisson dağılımından
i. sınıf aralığıyla ilgili pi olasılıklarını aşağıdaki gibi hesaplayabiliriz.
e− λ λ x
x!
∀i
∀i
i i
i
32.0 + 15.1+ 9.2 + 4.3
=
= 0.75
60
Example 9-12
Örnek 1 (devam)
Örnek 1 (devam)
f (x) = P(X = x) =
∑ f x nasıl
SORU: Poisson Dağılımının Parametresini
E[X] = λ =
∑f
** Bu örnekte, varsayılan Poisson
tahmin edersiniz?
dağılımının ortalaması bilinmemektedir,
ve örneklem verisinden tahmin edilmelidir.
Beklenen frekansları hesaplamak için örneklem büyüklüğü n=60 ve
pi olasılıkları çarpılır. Bi=n.pi
Hata
Sayısı
x = 0,1,2,...
Olasılık
Beklenen
Frekans
0.472*(60)
(veya daha fazla)
Eğer beklenen frekans 5’ten küçükse, önceki sınıfla birleştir:
Hata
Sayısı
(veya daha fazla)
3 Gozlenen
Frekans
Beklenen
Frekans
3.12.14 2
Normal Dağılıma Sahip Bir Kitlenin Varyans
χ
= 3.84
0.05,1
ve Standart Sapması İçin Hipotez Testi
Örnek 1 (devam)
α=0.05 anlam düzeyi seçerek 8 adımlı hipotez testi prosedürünü uygulayalım:
1.  İlgili değişken, levha üzerindeki hata sayısının dağılımının uyumudur.
2.  H0: Lavha üzerindeki hata sayısı Poisson dağılımına uyar.
3.  H1: Levha üzerindeki hata sayısı Poisson dağılımına uymaz.
4.  α=0.05
Eğer H0 doğruysa,
χ
k
(Gi − Bi )2
i=1
Bi
χ 02 = ∑
5.  Test İstatistigi:
2
0 ‘nin,
k-p-1 serbestlik dereceli ki-kare dağılımına uyduğu gösterilebilir
p: Hipotez edilen dağılımın parametre sayısı,
k: Sınıf sayısıdır.
Örnek 1 (devam)
P-Değeri Yaklaşımı
2
6. Eger χ 02 > χ 0.05,1
= 3.84 ise H 0 red
n 
7. Hesaplamalar:
χ 02 =
( 32 − 28.32 )2 + (15 − 21.24 )2 + (13 − 10.44 )2 = 2.94
28.32
21.24
10.44
H0’ı reddetme kriteri olarak α’nın kullanımı; H0’ın zayıf bir şekilde mi
yoksa güçlü bir şekilde mi reddedildiğini söylemez. Bunu bilmek için
P-Değeri yaklaşımını kullanırız:
Tanım
P değeri, verilen veriyle (H 0 ) sıfır hipotezinin
reddedilmesine yol açan en küçük anlam seviyesidir.
8.
Sonuclar:
SORU:
Testin sonucu ne olur?
2
χ 02 = 2.94 < χ 0.05,1
= 3.84 oldugu icin levha üzerindeki hata sayısının
(
P = P χ 2 > χ 02
Poisson dagılımına uyduguna iliskin H 0 hipotezini reddecek yeterli
istatistiksel kanıt yoktur.
4 )
( χ 2 Uyum testi icin)
3.12.14 P-Değeri Yaklaşımı
f (x)
! 2nχ–α1,v
2
! 2n – 1
Örnek 1 (devam)
f (x)
χ 02 =
28.32
= 2.94
α /2
! 2α /2, n – 1
α /2, n – 1
x
α
Pα
0
(a)
(b)
2
χ0
!2
α, n – 1
= 2.94
(
21.24
10.44
) (
)
P = P χ 2 > χ 02 = P χ 2 > 2.94 = ?
x
0
x
! 21 – α , n – 1
2.94
2
χ0
= 2.94 dir ve bu, tablodaki 2,71 ve 3,84 değerleri arasındadır.
Bu nedenle, P değeri, 0.05 ve 0.10 arasında olmalıdır.
0.05 < P < 0.10
0 P=0.086
(c)
MONTGOMERY: Applied Statistics, 3e
Fig. 9.10
W-160
Örnekte,
H0 Kabul
! 2n –)21 (13 − 10.44 )2
( 32 − 28.32 )2 + (15 − 21.24
+
Cumulative Distribution Function
Chi-Square with 1 DF
x
2,94
P( X <= x )
0,913589
P değeri=1-0,913589
≈ 0,086
5 1
H0 Red
Test kriteri: P degeri > α ise H 0'ı reddetme
degeri ≤ α ise
'ı reddet
SORU: TestinPsonucu
neH olur?
0
Sonuç: α=0.05<P=0.086 olduğundan
H0 Kabul
Download