Normal populasyondan örnekleme Merkezi eğilim Yayılım

advertisement
MERKEZİ LİMİT TEOREMİ
Günlük yaşantımız içerisindeki uygulamaların
çoğunda karşılaşılan şans değişkeni ( x ), oldukça büyük
sayıda bağımsız şans değişkeninin toplamı yada
ortalaması ( doğrusal bir fonksiyonu ) dır.
x1 , x2 ..............., xn n tane bağımsız şans değişkeni
olsun. Ortalamaları varyansı  
 x  x1  x2  ..........  xn elde edilen yeni değişken için
aşağıdakiler söylenebilir.
E x   E x1   E x2   ...........  E xn 
Varx   Varx1   Varx2   ...........  Varxn 
Ex  n
Varx   n 2
X  E  X  X  n X  n X n  n  n
z



2
n
 n n
Var  X 
n
x 
x 



n

n
n n
1
Tanım1: Merkezi Limit Teoremi
ortalaması 
2
 olan ve birbirinden farklı dağılımlara
uyan n adet bağımsız şans değişkeni
olsun. Bu şans değişkenlerinin toplamını
X, ortalamasını x ile gösterelim, n
büyüdükçe,
x  n x  
z


n 2
n
olan z değişkeni standart normal dağılışa
yaklaşır.
2
x1 , x2 ..............., xn ;
Tanım2:
Eğer n gözlemlik bir şans örneği herhangi bir
populasyondan seçilirse, ve n yeteri kadar büyük
ise, x ’nın örnekleme dağılışı normal dağılış
olacaktır. Örnek büyüklüğü n büyüdükçe, x ’nın
örnekleme dağılışına normalite yaklaşımı daha iyi
olur.
3
n adet bağımsız üniform x şans değişkeninin
ortalamasının olasılık yoğunluk fonksiyonları
f( x )
f( x )
n=1
x
n=2
x
f( x )
n=10
x
4
Teorem: Normal dağılışa sahip bir
populasyondan
çekilen
örneklerin
ortalamaları, örnek büyüklüğü dikkate
alınmaksızın, normal dağılışa sahiptir.
Teorem: Örnek büyüklüğü artışı ile ( n → ∞ )
herhangi bir dağılıştan çekilen örneklerin
ortalamalarının normal dağılışa yaklaşır. Bu
teorem merkezi limit teoremidir.
2
2



Not: x
5
Teorem: Eğer, ortalaması  standart sapması
olan bir dağılıştan n hacimli şans örnekleri
çekilir ise bu örneklerin aritmetik ortalamaları;
ortalaması  ve standart sapması  n olan
yaklaşık normal dağılış gösterir. Bu yaklaşım n
büyüdükçe daha doğru olur.
Veya bir başka ifadeyle,
Tekrar tekrar örnek alındığında eğer n yeteri
kadar büyükse, gözlemlerin toplamı da yani,
n
 xi , ortalaması n, standart sapması
olan normal dağılış gösterir.
6
Bu teorem iki bakımdan önemlidir.
1) Niçin bazı gözlemler yaklaşık normal
dağılış gösterir.
2) Tahminleyicilerin
gösterdiği
varsayım
hakkında karar verilir.
normal
dağılış
ile
populasyon
Teoremin sakıncası
“ n yeteri kadar büyük olmalıdır “
cümlesinin anlamı amaca göre değişir.
Ancak her zaman doğru olmamakla
beraber bayağı küçük örnekler için de
geçerli olabilir.
7
Farklı örnek büyüklükleri ( n )
ve farklı populasyonlar için ’nın örnekleme dağılışı
orjinal
populasyon
n=2 için
n=5 için
n=30 için
x
x
x
8
x
Örnek: X ~ Bernoulli(p ) olan bir populasyondan n hacimlik bir
örnek alındığına göre;
a) x ’nın örnekleme dağılışının ortalamasını ve standart
sapmasını bulunuz.
  E ( x)  0(q)  1( p)  p
 2  E ( x   ) 2  0  p 2 q  1  p 2 p
 p q  q p  pq( p  q)  pq
2
2
b)
p = 0.8
ve
n = 1, 10, 25,
100
için örnek ortalamasını ve
standart sapmasını formüle ediniz.
 x  p  0.8
x 
pq
(0.8)(0.2) 0.4


n
n
n
E(x)    p
x 

n
pq
n

n
x
x
1
10
25
100
0,8
0,8
0,8
0,8
0,4
0,1265
0,08
0,04
9
ÖRNEKLEME DAĞILIŞI
Parametre
n adet ölçümden oluşan bir örnekten
hesaplanan bir örnek istatistiği için
örnekleme dağılışı, bu istatistiğin bir
olasılık dağılışıdır.
Aritmetik
ortalama
Medyan
Varyans
Standart
sapma


M

Örnek
istatistiği
2

m
s2
s
ÖRNEK :
Büyük bir populasyondan alınmış 3
ölçümün (0, 3, 12) olasılık dağılışı
aşağıdaki gibidir.
x
P(x)
0
1
3
3
1
3
12
1
3
10
Mümkün Örnekler
(n = 3 için)
x
m
Olasılık
0
0
0
0
0
1
0
0
3
1
0
1
0
0
12
4
0
1
0
3
0
1
0
1
0
3
3
2
3
1
0
3
12
5
3
1
0
12
0
4
0
1
0
12
3
5
3
1
0
12
12
8
12
1
3
0
0
1
0
1
3
0
3
2
3
1
3
0
12
5
3
1
3
3
0
2
3
1
27
p=x/n
(toplamın
tek sayı
gelmesi
durumu)
0/3
27
1/3
27
0/3
27
1/3
27
2/3
27
1/3
27
0/3
27
1/3
27
0/3
27
1/3
27
2/3
27
1/3
27
2/3
11
Mümkün Örnekler
(n = 3 için)
x
m
Olasılık
3
3
3
3
3
1
3
3
12
6
3
1
3
12
0
5
3
1
3
12
3
6
3
1
3
12
12
9
12
1
12
0
0
4
0
1
12
0
3
5
3
1
12
0
12
8
12
1
12
3
0
5
3
1
12
3
3
6
3
1
12
3
12
9
12
1
12
12
0
8
12
1
12
12
3
9
12
1
12
12
12
12
12
1
27
p=x/n
(toplamın
tek sayı
gelmesi
durumu)
3/3
27
2/3
27
1/3
27
2/3
27
1/3
27
0/3
27
1/3
27
0/3
27
1/3
27
2/3
27
1/3
27
0/3
27
1/3
27
0/3
12
Aritmetik Ortalama Örnekleme Dağılışı
x
0
P x 
1
27
1
3
27
2
3
3
1
27
27
4
3
27
5
6
6
3
27
27
8
3
27
9 12
3
27
1
27
Medyan Örnekleme Dağılışı
m
P (m)
0
7
27
3
13
27
12
7
27
13
Örnek: Buca ilçesindeki kiralık evlerin aylık kira ücretlerinin
ortalaması 400 YTL., standart sapması 10 YTL. olan Normal
Dağılışa uygun olduğu bilinmektedir.
a)Kiralık bir evin aylık kira miktarının 380 YTL. İle 410 YTL.
arasında olma olasılığını hesaplayınız.
b)36 kiralık evin aylık kira miktarlarının ortalamasının 395 YTL
ile 402 YTL arasında olma olasılığını hesaplayınız.
  400 YTL.   10 YTL.
a) P ( 380 < X < 410 ) = ?
410  400 
 380  400
P(380  X  410)  P
z
  P(2  z  1)
10
10


 0,4772  0,3413  0,8185
b) P ( 395 <
x < 420) = ?
 395  400
402  400 
  P(3  z  1,2)
P(395  x  402)  P
z

10
36
10
36


14
 0,4987  0,3849  0,8836
İSTATİSTİKSEL
TAHMİNLEME VE
ÖRNEKLEME
TEORİSİ
İSTATİSTİKSEL TAHMİNLEME VE
YORUMLAMA SÜRECİ
YORUMLAMA SÜRECİ
ÖRNEKLEME VE ÖRNEKLEME
ÖRNEKLEME
VE ÖRNEKLEME
DAĞILIMLARI
DAĞILIMLARI
15
Yorumlama süreci
Tahminler
ve testler
Populasyon
Örnek
İstatistikleri
( X , ps)
Örnek
16
Örnek Tipleri
Örnek
Tipi
Olasılık Dışı
Olasılık
Basit
Şans
Yargı
Kota
Sistematik
Tabakalı
Kümeli
Kitle
17
Niçin Örnek?
Anakütle parametrelerinin örnek değerleri(örnek istatistikleri)
yardımıyla tahmin edilmesine imkan sağlamak modern
istatistiğin önemli bir görevidir.
Anakütlenin tamamı incelenmez.
Anakütleden bir şans örneği alınır.
Elde edilen örnek değerlerinin anakütle parametresi yerine
kullanılması için iki şart vardır:
a. Örnek şans örneği olmalı. Anakütledeki her birimin örneğe
girme şansı eşit olmalı
b. Örnek yeterince büyük olmalı
18
Örnekleme;
İadeli örnekleme:Çekilen birimin anakütleye tekrar iade
edilmesidir.
İadesiz örnekleme:Çekilen birim anakütleye iade edilmez.
Bir anakütleden alınan şans örneklerinin her birisi için örnek
istatistikleri hesaplandığında örnekleme dağılımları ortaya
çıkar:
Bir örneğin ortalaması hesaplanmışsa elde edilen
Xi
dağılımı ortalamaların örnekleme dağılımı,
Her örnek için p oranları hesaplandığında oranların örnek
dağılımı elde edilir.
19
İki ayrı anakütlenin karşılaştırılması yapılıyorsa farklarla
ilgili örnekleme dağılımı ortaya çıkar:
Her iki anakütleden alınan nA ve nB büyüklüğündeki
örneklerin ortalamaları hesaplanmış ve bu
ve
XA
XB
değerleri arasındaki farklar belirlenmişse elde edilen
dağılım ortalamalar arası farkların örnekleme
dağılımıdır.
Anakütlelerden alınan örnekler için oranlar hesaplanmış ve
bu oranların anakütleler itibariyle gösterdikleri farklılıklar
ortaya konulmuşsa elde edilen dağılım oranlar arası
farkların örnekleme dağılımıdır.
20

Bir populasyon parametresini tahminlemek için şans
değişkenleri kullanılır:
 Örnek ortalaması, örnek oranı, örnek medyanı…
Örnek
hacmi
arttıkça
(n  30) ...
Merkezi Limit Teoremi
Örnekleme
dağılışı normal
dağılıma
yaklaşır.
21
X
ORTALAMALARIN ÖRNEKLEME DAĞILIMI
Ortalamaların örnekleme dağılımı anakütle ortalamasının iyi
bir tahmincisidir.
Her biri n hacimli çok sayıda örneğe ait ortalamaların
gösterdiği dağımın değişkenliği tek örneğin değişkenliğinden
daha azdır.
Standart sapma bir örneğin değişkenliği hakkında bilgi
verirken ,
Ortalamaların örnekleme dağılımının değişkenliği standart
hatayla gösterilir.
22
Aşırı değerlerin etkisinin önemli ölçüde yok edilmesi,
ortalamaların örnekleme dağılımının değişkenliğini azaltıcı bir
faktördür.
Ana kütle standart sapması bilindiğinde standart hata
x 
x
n
eşitliğiyle hesaplanır.
Z
Standart z değerleri
X 
x
formulüyle hesaplanır. Ortalamaların örnekleme dağılımında
X X
x  x
x x
yerini alır.
23
Herhangi bir
Z
değerinin standart Z değerine dönüştürmesinde
X
X 
Z
x
X  x

x
eşitliği kullanılır.
Örnekleme dağılımı
Standart normal
dağılım
X
z = 1

X
X
Z = 0
Z
24
Normal populasyondan örnekleme
•Merkezi eğilim
 
Populasyon dağılımı
 = 10
X
Yayılım

 
X
n
  50
X
Örnekleme dağılımı
n=4
X = 5
n =16
X = 2.5
  50
X
X
25
Alıştırma
•Türk telekomda çalışan bir operatörsünüz.
Uzun mesafeli telefon görüşmeleri  = 8 dk.
&
 = 2 dk. ile normal dağılmaktadır. Eğer
25 lik örnekler seçilirse örnek ortalamalarının
% kaçı 7.8 & 8.2 dk. arasında olacaktır?
26
Çözüm
x 

n

2
25
 0.4
X 
7.8  8
Z

 .50
 n 2 25
Örnekleme
dağılımı
Z
X 

X = .4
n

8.2  8
2
25
 .50
Standart normal
dağılım
Z = 1
.3830
.1915 .1915
7.8 8 8.2 X
-.50 0 .50
Z27
ORANLARIN ÖRNEKLEME DAĞILIMI
Oranların örnek dağılımının ortalaması anakütle oranına eşittir.
P 1  P 
P 
n
Z
pP
P 1  P 
n
ÖRNEK: Büyük bir alışveriş merkezinde 15000 YTL’den fazla alışveriş
yapan müşterilerin %30’unun kredi kartı kullandığı tespit edilmiştir. 15000
YTL’den fazla alışveriş yapan 100 müşteri için oranların örneklem
dağılımının standart hatası nedir?
P 
P 1  P 
n

0.30 1  0.30 
100
 0.0458
28
ORANLARIN ÖRNEKLEME DAĞILIMI
Aynı örnek için 15000 YTL’den fazla alışveriş yapan 100 müşteriden %20 ile
%25’inin kredi kartı kullanması ihtimalini hesaplayınız.
p1  P
0.20  0.30
Z1 

 2.18
0.30(1  0.30)
P 1  P 
100
n
Z2 
p2  P
P 1  P 
n

0.25  0.30
 1.09
0.30(1  0.30)
100
0.1233
0.3621
-2.18
-1.09
0.4854
P(0.20  P  0.25)  P(2.18  Z  1.09)  0.4854  0.3621
P(0.20  P  0.25)  0.1233
29
ORTALAMALAR ARASI FARKLARIN ÖRNEKLEME
DAĞILIMI
Ortalamalar arası farkın örnek dağılımının ortalaması μ1 – μ2 ve standart
hatası da 1 - 2 ile gösterilir.
 X1  X2
 


n1 n 2
2
1
2
2
X

Z
1
 X 2    1   2 
12  22

n1 n 2
30
ORTALAMALAR ARASI FARKLARIN ÖRNEKLEME
DAĞILIMI
Örnek: İki farklı un fabrikasında paketlenen standart 1 kg’lık un paketleri test
edilmiş ve birinci fabrikadan alınan 100 paketin ortalaması 1.03 kg, standart
sapması 0.04kg; ikinci fabrikadan alınan 120 paketin ortalaması 0.99 kg,
standart sapması 0.05 kg bulunmuştur. Anakütle standart sapmaları bilinmediği
için örnek standart sapmalarından hareketle ortalamalar arası farkın standart
hatası,
 X1  X2
12 22
s12 s 22




n1 n 2
n1 n 2
(0.04) 2 (0.05) 2
=

100
120
= 0.006
31
ORANLAR ARASI FARKLARIN ÖRNEKLEME
DAĞILIMI
Oranlar arası farkın örnek dağılımının ortalaması P1 –P2 ve standart hatası
da 1 - 2 ile gösterilir.
P
1
Z
 P2
P1 1  P1  P2 1  P2 


n1
n2
 p1  p2    P1  P2 
P1 1  P1  P2 1  P2 

n1
n2
32
ORANLAR ARASI FARKLARIN ÖRNEKLEME
DAĞILIMI
Örnek: Birinci fabrikadaki kusurlu mamul oranının 0.08 ve ikinci fabrikadaki
kusurlu mamul oranının 0.05 olduğu bilinmektedir. Tesadüfi olarak birinci
fabrikadan 100, ikinci fabrikadan 150 mamul seçilmiş ve birinci örnekteki
kusurlu mamul oranı 0.09, ikinci örnekteki kusurlu mamul oranı 0.06 olarak
gözlenmiştir. Buna göre kusur oranları arasındaki farkın standart hatası:
P P 
1
2
P P 
1
2
P P
1
2
P1 1  P1 
n1

0.08  0.92 
100
 0.0324
P2 1  P2 
n2

0.05  0.95 
150
33
İstatistiksel metotlar
İstatistiksel
metotlar
Tanımlayıcı
istatistikler
Yorumlayıcı
istatistikler
Tahminleme
Hipotez
Testi
34
Yorumlayıcı İstatistikler
• Aralık tahminleme
ve hipotez testlerini
içerir.
Populasyon?
• Amacı populasyon
karakteristikleri
hakkında karar
vermektir.
35
Tahmin süreci
Populasyon
Ortalama, ,
bilinmiyor
Şans örneği
Ortalama
X = 50
%95 eminim ki,
40 ile 60
arasındadır.
36
Bilinmeyen populasyon
parametreleri tahminlenir...
Populasyon Örnek istatistiğiyle
Tahminle!
parametresini
Ortalama

X
Oran
P
p
Varyans
2
s
Farklar
12
X1  X2
2
37
Tahminleyicilerin Özellikleri
1. Sapmasızlık
P(X )
Sapmasız
A
Sapmalı
B
X


N birimlik aynı anakütleden farklı sayıda örneklem seçilebileceği için tahmin
edicinin değeri de seçilen örnekleme göre değişmektedir. Bu durumda
örneklem sayısı kadar elde edilen tahmin edici, bir rassal değişken olup,
ortalaması ve varyansı olan bir olasılık dağılımına sahiptir. Bu dağılımın
beklenen değerinin anakütle parametresine eşit olmasına, diğer bir ifadeyle
bir istatistiğin beklenen değeri ile bilinmeyen anakütle parametresi
arasındaki farkın sıfıra eşit olmasına “sapmasızlık” denir.
E(X)    E(X)    0
38
Tahminleyicilerin Özellikleri
2. Tutarlılık (Kararlılık)
Büyük örnek hacmi
P(X)
B
Küçük örnek hacmi
A
X
Örneklemdeki birim sayısı sonsuza doğru arttırıldığında, tahmin
edicinin değerinin anakütle değerine yaklaşması ve n=N olması
durumunda aralarındaki farkın sıfıra inmesi özelliğine “tutarlılık”
denir.


lim P        1
n 
̂ ,’nın tutarlı tahmincisidir.
39
Tahminleyicilerin Özellikleri
3. Etkinlik
Etkin Tahminci
P(X)
B
A
X

Birden fazla sapmasız ve tutarlı tahminci olması durumunda,
bir tahmincinin varyansının, aynı anakütle parametresinin
başka bir tahmincisinin varyansından daha küçük olması
durumunda elde edilen tahmincilere “etkin” tahminci adı
verilmektedir.
40
İstatistiksel Tahminleme
Nokta Tahmini
Populasyon parametresinin
tek bir tahmin değerini verir
X  μ̂
s  σ̂
p  P̂
Aralık Tahmini
Populasyon parametresinin
tahmin aralığını verir. Nokta
tahmini kullanılarak
hesaplanır.
20  μ  60
2.5  σ  3.4
2
0.25  P  .035
41
Güven Aralığı Tahmini


Bir değer aralığı verir.
Populasyon parametresine yakınlık hakkında bilgi
verir.

Olasılık terimleriyle ifade edilir.
Güven Aralığı Tahmininin Elemanları
Populasyon parametresinin aralık içinde bir yere
düşmesinin olasılığı
Örnek istatistiği
Güven aralığı
Alt güven sınırı
42
Üst güven sınırı
42
Download