BÖLÜM 4 KESĠKLĠ ġANS SEĞĠġKENĠ DAĞILIMLARI ( )

advertisement
BÖLÜM 4
KESĠKLĠ ġANS SEĞĠġKENĠ DAĞILIMLARI
Bu kısımda, gerçek yaşamdan ortaya çıkan pek çok rassal olayın modellenmesinde faydalı
olan, kesikli (tek değişkenli) parametrik olasılık dağılımlarından bazıları incelenecektir. Ele
alınacak dağılımlar, bir hipotetik örnekleme süreci ile ilgili varsayımlar kümesi altında
matematiksel olarak elde edilmiş teorik dağılımlardır. Bu teorik dağılımlar, belirli
parametrelere göre bir olasılık kütle (mass) ailesini tanımlayan kurallar kümesi ile ifade
edilirler.
Bir şans değişkeni X ve bir parametre  verilmiş olsun. f ( x, ) ise bir kesikli teorik olasılık
kütle fonksiyonunu tanımlayan kural olsun. Eğer  bir reel sayı ise, bu parametre farklı
olasılık kütle fonksiyonlarının; f ( x,1 ), f ( x, 2 ), bütün bir kümesini belirler. Sonuç olarak,
bu parametrik kesikli dağılım ailesinin değişik elemanlarını içeren küme    f (X , ) /   elde
edilir. Bir şans değişkeni X için kesikli olasılık kütle fonksiyonu ailesini tanımlamakta
kullanılabilecek parametre tipleri aşağıda listelenmiştir;
Sayım (count) parametresi; bir şans deneyindeki belirli bir çıktının ortaya çıkış sayısı.
Orantı (proportion) parametresi; bir şans deneyindeki belirli bir çıktının ortaya çıkış sayısının
toplam deneme sayısına göreceli oranı.
Yer (location) parametresi: X-ekseni üzerinde, olasılık kütle fonksiyonunun pozisyonunu
(orijine göre göreceli olarak) belirler.
Ölçek (scale) parametresi: şans değişkeninin ölçümlendiği birimleri belirler, fonksiyonun
grafiğini daraltarak ya da genişleterek olasılık kütle fonksiyonun yayılımını etkiler.
Biçim (shape) parametresi: bir olasılık kütle fonksiyonunun şeklini (örneğin simetrisi) etkiler.
Oran (rate) parametresi: bir rassal sürecin zaman, uzay, hacim, üzerinden çıktılarının oluşum
yoğunluğunu belirler (örneğin verilen bir zaman periyodunda bir olayın ortaya çıkış sayısı).
4.1 KESĠKLĠ UNĠFORM (TEKDÜZE) DAĞILIM
Bir kesikli şans değişkeni X, her biri 1/ k eşit olasılıklı k adet farklı değer alabiliyor ise bu
şans değişkeni kesikli tekdüze dağılıma sahiptir.
Tanım (Üniform şans değişkeni): k pozitif bir tam sayı olmak üzere olasılık dağılımı
1 k
f x; k   
0
x  1,, k
d .d
fonksiyonu ile belirlenen bir X şans değişkeni, kesikli uniform şans değişkeni olarak
adlandırılır.
Teorem: Eğer X bir kesikli uniform dağılıma sahip ise,
a. E  X  
k 1
,
2
b. V  X  
k 2 1
12
k
c. M X t    e tx
1
k
x 1
Ġspat: İlk olarak
k
x
x 1
k k  1
ve
2
k
x
2

x 1
k k  12k  1
olduğu hatırlanarak,
12
1 k 1

k
2
k
a. E  X    x
x 1
elde edilir.
1 k k  1k  2 

k
12
b. E X 2    x 2
k
x 1
olduğundan,
 
V  X   E X 2  E  X 

2
k  1k  1
12
k 1

12

2

bulunur.
4.2 BERNOULLĠ DAĞILIMI
Benzer koşullarda tekrarlabilir bir deney bir olayın gerçekleşip gerçekleşmemesi yönünden
incelediğinde ortaya iki ayrık olay ile incelenebilecek bir deney çıkar ve bu deneye ait örnek
uzayı S  A, Ac  olacaktır. Örneğin, bir üretimin kusurlu ve kusursuz diye belirlenmesi,
piyasaya çıkan yeni bir malın beğenilip beğenilmemesi gibi deneyler iki sonuçlu olaylardır.
Bir bernoulli deneyi, çıktısı iki ayrık olay olarak tanımlanabilen bir rassal deneydir. Bir
denemede elde edilecek iki sonuç genellikle 0 ve 1 değerleri ile kodlanır. 1 değeri deneyin
başarılı olmasına, 0 değeri deneyin başarısızlığına karşılık gelir, X  A  1 ve X Ac   0 ve bu
olaylara ait olasılıklar, P X  1  p ve P X  0  1  p olarak tanımlanabilir.
Tanım (Bernoulli şans değişkeni): Bernoulli rasgele değişkeni; bir X rasgele değişkeni için
yalnız iki sonuç varsa X ‟ e Bernoulli rasgele değişkeni denir. Bernoulli olasılık fonksiyonu,
f x; p   p x 1  p 
1 x
olur.
x  0,1
Teorem: Eğer X şans değişkeni bir bernoulli dağılımına sahip ise,
a. E ( X )  p
b. V ( X )  p(1  p)
c. M X t   e t p  1  p 
Ġspat:
1
a. E  X    xp x (1  p )1 x  p
x0
b. E  X 2    x 2 p x (1  p )1 x  p
1
x 0
V  X   p  p2  p(1  p)
c. E  etX    etx p x (1  p )1 x  et p  (1  p )
1
x0
bulunur.
4.3 BĠNOM DAĞILIMI
Binom dağılımı Bernoulli deneylerinden ortaya çıkar. İadeli örnekleme ile birbirinden
bağımsız n adet Bernoulli deneyi uygulanarak, bir Bernoulli süreci tanımlansın. Eğer
deneyler özdeş ise başarı olasılığı p deneyden deneye değişmez ve sonuç olarak binom
olasılık dağılımı ortaya çıkar.
Tanım (Binom şans değişkeni): Birbirinden bağımsız n adet Bernoulli denemesinden başarılı
olanların toplam sayısı X şans değişkeni olsun. Bir tek deneme için başarılı olma olasılığı p,
başarısız olma olasılığı (1  p) ise aşağıdaki koşulları sağlayan X‟ e binom şans değişkeni
denir ve şu özellikleri taşır:
a. Deney n adet özdeş denemeden oluşmaktadır. (Deneme sayısı n sabit olmalı.)
b.Her deneme için yalnız iki sonuç vardır. Başarı veya bunun tümleyeni olan
başarısızlık.
c.Başarı olasılığı p deneyden deneye değişmez. Başarısızlık olasılığı q  1  p dir.
d.Denemeler birbirinden bağımsızdır.
Teorem (Binom Dağılımı): Birbirinden bağımsız n Bernoulli denemesi için X, her bir
denemede başarı olasılığı p, başarısızlık olasılığı (1  p) olan binom rasgele değişkeni ise, X‟
in olasılık fonksiyonu;
n
n x
f  x; n, p     p x 1  p 
 x
x  0,1,2,...., n
olur.
Ġspat: n bağımsız denemede başarı sayısı X, 0,1,2,....,n değerlerini alabilir. Aşağıdaki diziyi
ele alınsın:
1
,1
,
,1, 0
,0
,
,0



n x
x
Burada 1 başarıyı, 0 başarısızlığı gösterir. Çarpım teoreminden yukarıdaki dizinin olasılığı,
yani ilk x adet denemenin başarılı, geri kalan (n  x) denemenin başarısız olması olasılığı
p x 1  p n  x ile hesaplanır. Denemeler birbirinden bağımsız olduğundan, diğer bir x
“başarı” ve (n  x) “başarısızlık” dizisinin olasılığı da
p x 1  p n  x ‟dir. Bir grupta x,
n
diğerinde (n  x) terim bulunan n elemanın farklı dizilişlerinin sayısı   dir. Bir defada
 x
sadece bir diziliş elde edileceğinden bu olaylar ayrıktırlar. Bu nedenle toplama kuralı
nedeniyle X şans değişkeninin olasılık fonksiyonu; ( n denemedeki başarı sayısı)
n
n x
f ( x)    p x 1  p 
 x
x  0,1,2,3,..., n
dir. Bu f ( x) fonksiyonuna binom olasılık fonksiyonu denir. f ( x) fonksiyonunun bir
olasılık fonksiyonu olduğunun ispatı aşağıda verilmiştir. 0,1,2,3…,n kez başarma
olasılıklarının toplamı binom açılımındaki ardışık terimlere karşılık gelir. Eğer n pozitif
tamsayı olmak üzere,
a  b   
n  x n x
a b
x 0  x 
n
olduğundan a  p ve b  1  p alınarak, olasılıklar toplamı;
n

x 0
f ( x) 
n
  x  p 1  p 
n
x
n x
 1  (1  p)  1
n
x 0
elde edilerek ispat tamamlanır.
Binom olasılık fonksiyonu için,
f x; n, p   f n  x; n, 1  p 
eşitliği geçerlidir. Ardışık binom olasılıklarının hesaplanması ise,
f  x  1; n, p  
(n  x) p
f  x; n, p  x  0,1,..., n  1
( x  1)(1  p )
eşitliğinden elde edilir.
Teorem: Eğer X bir binom dağılımına sahip bir şans değişkeni ise,
a. E ( X )  np
b. V ( X )  np(1  p)


c. M X t   e t p  1  p 
n
n
n
Ġspat: a. E  X    x   p x (1  p ) n  x
x0  x 
n
(n  1)!
n x
 np 
p x 1 1  p 
x  0 ( x  1)!( n  x )!
 np[ p  (1  p)]n 1
 np
NOT: Burada
 n  1
(n  1)!
n 1

   p  (1  p)  1
( x  1)!(n  x)!  x  1
b. E  x 2    x  x  1
n  n  1 n  2 !
n
x0
x  x  1 x  2 ! n  x !
p 2 p x  2 1  p 
n x
n
  xf  x 
x0
 n  2 ! p x  2 1  p n  x  np


x  2  x  2 ! n  x !
n
 n  n  1 p 2 
 np 2  n  1  np
V  x   n 2 p 2  np 2  np  n 2 p 2
 np 1  p 
c. M X (t )  E  etX 
n
n
  etx   p x (1  p) n  x
x 0
 x
n
n
  etx   (et p) x (1  p) n  x
x 0
 x
Burada binom teoremine göre a  et p ve b  (1  p) alınarak


M X t   e t p  1  p 
n
bulunur.
Binom dağılımında p ve (1  p) değeri birbirine yaklaştıkça simetri artar, p  (1  p)  1 / 2
ise simetriktir.
NOT: Binom dağılımından olasılıkların elde edilmesinde n değeri büyüdükçe hesaplama
zorlukları ortaya çıkar:
Simetrik bir binom dağılımı ( p değerinin çok büyük ya da çok küçük olmadığı durumlar)
n   için normal dağılıma yakınsar.
Asimetrik bir binom dağılımı ( p değerinin çok büyük ya da küçük olduğu durumlar) n  
için Poisson dağılıma yakınsar.
Binom dağılımının yakınsaması ileriki konularda daha detaylı olarak ele alınacaktır.
4.4 GEOMETRĠK DAĞILIMI
Binom olasılık dağılımında olduğu gibi bir Bernoulli sürecinden türetilen rassal deneylerin
çıktısı ile ilgilenilsin. Bu süreçte çıktı ayrık iki olayı (başarı ve başarısızlık) tanımlar ve başarı
olasılığı p deneyden deneye değişmez.
Tanım (Geometrik şans değişkeni): Şans değişkeni X ilk başarı elde edilinceye kadar
gerçekleştirilen deney sayısı olarak tanımlandığında, şans değişkeni geometrik dağılıma
sahiptir. İlk başarının elde edilmesi için gerekli denemelerin sayısı X, geometrik şans
değişkenidir.
Teorem: X , bir tek denemede başarısızlık olasılığı 1  p ve başarı olasılığı p olan
geometrik rasgele değişken ise, X şans değişkeninin olasılık fonksiyonu;
f x, p   p1  p 
x 1
x  1,2,3,
Ġspat: İlk başarının elde edilmesi için gereken denemelerin sayısı x ve ilk başarıdan önceki
başarısızlıkların sayısı x  1 olsun. Bu durum aşağıdaki dizi ile gösterilebilir.
0
,0
,
,0,1



x 1
O halde x  1 başarısızlığı, başarının takip ettiği dizinin olasılığı p1  p x 1 ‟dir. Bu nedenle
X rasgele değişkeninin olasılık fonksiyonu;
f x, p   p1  p 
x 1
ile tanımlanır.
x  1,2,3,
f ( x) fonksiyonunun bir olasılık fonksiyonu olduğunun ispatı aşağıda
verilmiştir. Geometrik dağılımın bir olasılık kütle fonksiyonu olduğunun ispatı gerçekte
geometrik serinin özelliklerine dayanmaktadır. Herhangi bir a  1 için,

a
x 1
x 1

1
1 a
olduğundan, 1, 2,... denemede ilk başarının elde edilmesi olasılıkları aşağıdaki sonsuz serideki
ardışık terimlere karşılık gelir.

 f x   p  1  p  p  1  p 
2
p 
x 0


 p 1  1  p   1  p   
2


1
  1
 p
 1  1  p  
İspat tamamlanır.
Geometrik dağılım daima sağa çarpık bir dağılımdır.
Teorem: Eğer X bir geometrik dağılıma sahip ise,
1
p
a. E ( X ) 
b. V ( X ) 
(1  p )
p2
c. M X t   pe t

1
1  e t (1  p )

Ġspat: a. Geometrik dağılımın beklenen değeri,
E( X ) 

 xp (1  p)
x 1
x 1
p

 x(1  p)
x 1
x 1
p
Buradan

d
x
 (1  p) 
d (1  p)  x 1




p
d
(1  p)  (1  p) 2  ...
d (1  p)
p
d
(1  p) 1  (1  p)  (1  p 2 )  ...
d (1  p)
p


d
1
(1  p )

d (1  p ) 
1  (1  p ) 





1
 1  x  x 2  ... eşitliği kullanılmıştır.
1 x

1
2 
E( X )  p
 (1  p )1  (1  p ) 
1  (1  p )

 1 (1  p ) 
 p 

p2 
p

1
.
p
b. Geometrik dağılımın varyansı,


E( X 2 ) 
x( x  1) p (1  p ) x 1 
x 1

 xp (1  p)
x 1
x 1
 p (1  p )

 x( x  1)(1  p)
x2
 E ( x)
x 1
d2
(1  p)1  (1  p)  ...   E ( x)
d (1  p) 2
 p(1  p)
 p (1  p )
d2
d (1  p ) 2
 (1  p ) 

  E ( x)
1  (1  p ) 

 1
d
1
1

 (1  p).


2
d (1  p) 
1  (1  p)  p
1  (1  p)
 p(1  p)

1
2 1
1
 p(1  p) 2  2  (1  p). 3  
p
p  p

p

 p  p  2 2p 1
 p(1  p)

p3

 p


2(1  p) 1

p
p2
Buradan varyans,
2(1  p) 1  1 
  
p  p
p2
V (X ) 

2
(1  p)
p2
bulunur.
c. Geometrik dağılımın moment türeten fonksiyonu,
M x (t )  E[e xt ] 

e
tx
p(1  p) x 1
x 1



p
(1  p )
p
1 p
e
tx
(1  p) x
x 1
 e (1  p)

x
t
x 1



p
et (1  p) 1  et (1  p)  ...
1 p
 pe t
bulunur.

1
1  e (1  p)

t

Geometrik dağılımın kümülatif dağılım fonksiyonu,
F x   PrX  x  
x
 p1  p 
x 1
X 1

 p 1  1  p   ...  1  p 
x 1

1  1  p x 
 p.

 1  1  p  
 1  1  p 
x
bulunur.
Geometrik dağılım ile binom dağılımı arasındaki ilişki,
f ( x, p ) 
1
f ( x  1; n  x; p)
x
olarak tanımlanır. Geometrik dağılım hafızasızlık özelliğine sahiptir.
Teorem (Hafızasızlık özelliği): s  t olan tamsayılar için,
Pr X  s X  t   Pr X  s  t 
Ġspat: Herhangi n tamsayısı için,
Pr X  n  p
 1  P 
n
( n denemede başarı olmama olasılığı)
Bu durumda,
Pr  X  s X  t  

Pr( X  s ve X  t )
Pr( X  t )
Pr  X  s 
Pr( X  t )
 1  p 
s t
 Pr  X  s  t 
Hafızasızlık özelliği; t
adet gözlenmiş başarısızlığa
s  t adet daha başarısızlığın
eklenmesinin olasılığının, serinin başlangıcında s  t adet başarısızlık oluşma olasılığı ile
aynı olduğunu belirtir. Diğer bir deyişle, başarısızlığa ait bir dizinin ortaya çıkma olasılığı
dizinin başladığı deneye değil deney sayısına bağımlıdır.
4.5 NEGATĠF BĠNOM (PASCAL) DAĞILIMI
Geometrik dağılımın genel şeklidir. Bir deney birbirinden bağımsız Bernoulli denemelerinden
oluşmaktadır. Deneye k adet başarı elde edilinceye kadar devam edilirse k başarının elde
edilmesi için gerekli denemelerin sayısı negatif binom rasgele değişkenidir.
Negatif binom dağılımında, denemelerin sayısı bir rasgele değişkendir ve başarıların sayısı
sabittir; binom dağılımda başarının sayısı rasgele değişkendir ve denemelerin sayısı sabittir.
Tanım (Negatif binom şans değişkeni): Bağımsız Bernoulli denemelerinde her bir denemede
başarı olasılığı p olmak üzere k  1 başarının elde edilmesi için gereken denemelerin sayısı X
rasgele değişkeni olsun. Bu koşul altında X‟e negatif binom şans değişkeni denir.
Teorem: Bir tek denemedeki başarısızlık olasılığı 1  p ve başarı olasılığı p olmak üzere, X
negatif binom şans değişkeninin olasılık fonksiyonu aşağıdadır:
 x  1 k
 p 1  p x  k
f x; p, k   
 k  1
x  k , k  1,
Ġspat: k  1 başarının gerçekleşmesi için gereken denemelerin sayısı X olsun. X şans
değişkeni k , k  1, değerlerini alabilir. Son deneme (x-inci deneme) k-ıncı başarıyı vermek
zorunda olduğundan, k 1 adet başarı veren denemelerin sayısını x 1 olacaktır. x 1
denemedeki k 1 başarının olasılığı ve x-inci denemede başarı elde etme olasılığı aşağıdaki
gibi bulunur.
Aşağıdaki A ve B olayları ele alınsın:
A  ilk x - 1 deneme k - 1 başaşaiçerir 
B  x - inci deneme başaşaiçerir 
Denemeler birbirinden bağımsız kabul edildiğinden A ve B olayları da birbirinden
bağımsızdır. Pr(B)  p ´dir. O halde,
f ( x)  Pr( X  x)  P(A  B)  PAPB
yazılır. Görüldüğü gibi ( x  1)  k  1 ya da eşdeğer olarak x  k için P(A)  0 ‟ dır. x  k ise
binom dağılımdaki yaklaşım kullanılarak,
 x  1 k 1
 p 1  p x  k
PA   
 k  1
bulunur. Sonuç olarak f (x) olasılık fonksiyonu
 x  1 k
 p 1  p x  k
f  x; p, k   
 k  1
dır. Bu olasılık fonksiyonuna sahip dağılıma Pascal Dağılımı da denir. k  1 ise negatif binom
dağılımı geometrik dağılıma indirgenir.
Teorem: Eğer X bir negatif binom dağılımına sahip ise,
a. E ( X ) 
k
p
b. V ( X ) 
k 1  p 
p2
c. M x (t )  p k e xt
1
[1  [e (1  p)]]k
t
Ġspat. a Negatif binom dağılımının beklenen değeri;
E( X ) 

( x  1)!
 x ( x  k )!(k  1)! p
k
(1  p) x  k
xk
 p k (1  p ) x  k

( x  1)!
 x ( x  k )!(k  1)!(1  p)
x
xk
k (k  1)(k  2)


 p k (1  p) k k (1  p) k  k (k  1)(1  p) k 1 
(1  p) k  2  ....
2
!



(k  1)( k  2)


 p k (1  p )  k k (1  p) k 1  (k  1)(1  p) 
(1  p ) 2  .... 
2!



Burada köşeli parantez içindeki ifade, f (1  p)  1  (1  p) k 1 fonksiyonunun MacLauren
açılımına eşittir.
f (1  p)  1  (1  p)
 k 1
 f (0)  1
f (1  p)  (k  1)1  (1  p)
k 2
(1)  f ' (0)  (k  1)
f (1  p)  (k  1)(k  2)1  (1  p)
k 3
(1)  f (0)  (k  1)(k  2)
buradan,
f (1  p)  1  (1  p)
 k 1
 1
(k  1)
(k  1)(k  2)
(1  p) 
(1  p) 2  .....
1!
2!
elde edilir. Sonuç olarak,
E ( X )  p k k 1  (1  p)
 k 1
k
p

bulunur.
b. Negatif Binom Dağılımının Varyansı
E( X 2 ) 

x
2
f ( x)
xk



x( x  1) f ( x) 
xk


 xf ( x)
xk

( x  1)!
 x( x  1) ( x  k )!(k  1) p
k
(1  p) x  k  E ( X )
xk
 p k (1  p)  k

( x  1)!
 x( x  1) ( x  k )!(k  1)!(1  p)
xk
x
 E( X )
E (X ) için izlenen yol kullanılarak,
E( X 2 ) 
k (k  1)  2k (1  p) k

p
p2

k 2  kp  k
p2
olarak bulunur.
V (X ) 

k 2  kp  k k 2
 2
p2
p
k (1  p)
p2
bulunur.
c. Negatif binom dağılımının moment türeten fonksiyonu,
M x (t )  E[e xt ]


e
xk
xt
( x  1)!
p k (1  p) x  k
( x  k )!(k  1)!
 p k (1  p )  k

e
xk
tx
( x  1)!
(1  p ) x
( x  k )!(k  1)
k
k (k  1)


 p k (1  p)  k e xt (1  p) k  et ( k 1) (1  p) k 1  et ( k  2)
(1  p) k  2  ...
1!
2!


k (k  1)


 p k (1  p) k e xt (1  p) k 1  et (1  p)k  e 2t (1  p) 2
 ...
2!


burada köşeli parantezin içi [1  [e t (1  p )]]  k fonksiyonunun MacLauren açılımı olduğundan,
M x (t )  p k e xt
1
[1  [e (1  p )]] k
t
olarak bulunur.
Bazı durumlarda negatif binom dağılımı, k-ıncı başarıdan önce ortaya çıkan başarısızlık
sayısına göre de tanımlanabilir. Eğer Y şans değişkeni k-ıncı başarıdan önce ortaya çıkan
başarısızlık sayısı ise,
 y  k  1 k
 p (1  p) y
f ( y; p, k )  
y

y  0,1,....
olasılık kütle fonksiyonu, daha önce verilen ve X şans değişkeninin k-ıncı başarı elde
edilinceye kadar gerçekleştirilen deney sayısını tanımladığı olasılık kütle fonksiyonuna
denktir. Burada Y  X  k olarak tanımlanabilir. Negatif binom dağılımı adını
 y  k  1
 k 
(k )( k  1)(  k  2)...( k  y  1)

  (1) y    (1) y
y ( y  1)( y  2)...( 2)(1)
y

y 
ilişkisinden almaktadır. Olasılık kütle fonksiyonu,
 k 
f ( y; p, k )  (1) y   p k (1  p) y
 y 
 k 
y
   p k  (1  p )
 y 
olarak tanımlanabilir. Dağılışın beklenen değer ve varyansı,
E (Y ) 

y 0

 y  k  1 k
 p (1  p) y

 y y

(k  y  1)!
 ( y  1)!(k  1)!p
k
(1  p) y
y 1
k
k



(k  y  1)!
 ( y  1)!(k  1)!p
k
(1  p) y
y 1

 k  y  1 k
 p (1  p) y

 k  y  1
y 1
Burada z  y  1 dönüşümü yapılarak:
E (Y ) 

z k k
 p (1  p ) z 1

 k  z
z 0

k 1  p    z  1  k  1 k 1

 p (1  p ) z
p z  0  z


k 1  p 
p

bulunur. Dağılımın varyansı ise,
V Y  
k 1  p 
p2
olarak tanımlanmıştır. Negatif binom dağılımının varyansı ortalamasının karesel bir
fonksiyonudur, yukarıda elde edilen E Y  kullanılarak,
V Y   E Y  
1
EY 2
k
bulunur.
Negatif binom dağılımı limit durumunda Poisson dağılımına yakınsar. Eğer k   ve p  1
ise k 1  p    olduğundan,
E Y  
k 1  p 

p
V Y  
k 1  p 

p2
sonuçları elde edilir ki bunlar Poisson dağılımının ortalaması ve varyansıdır.
Binom dağılımı ve negatif binom dağılımı arasındaki fark aşağıda açıklanmıştır:
X şans değişkeni, n ve p parametreleri ile binom dağılımına sahip olsun. Yani X, n adet
Bernoulli denemesindeki başarı sayısıdır. Y şans değişkeni ise, k ve p parametreli negatif
binom dağılımına sahip olsun. Diğer bir deyişle Y, k adet başarı elde etmek için gereken
Bernoulli denemelerinin sayısıdır.
a. PrY  n  Pr X  k 
İlk n denemede k ya da daha çok başarı varsa, ilk k başarıyı elde etmek için n ya da daha az
deneme gerekir.
b. PrY  n  Pr X  k 
İlk n denemede k dan az başarı varsa, k başarıyı elde etmek için n den çok deneme gerekir.
4.6 HĠPERGEOMETRĠK DAĞILIM
İçinde iki çeşit nesne bulunan sonlu sayıda öğeden oluşan bir anakütle ele alınsın. Tekrar
yerine koymaksızın, ardışık olarak sabit büyüklükte bir örneklem seçilsin. Örneklemdeki iki
çeşit öğeden herhangi birinin sayısını ise şans değişkenini tanımlasın. Hipergeometrik
dağılım, sonlu elemanlı anakütle ile ilgilenildiğinde oldukça uygun bir modeldir.
Anakütledeki eleman sayısının N olduğu ve alınan örnek hacminin n olduğu varsayılsın.
Anakütlede ilgilenilen özelliğe sahip eleman sayısı ise M olsun. Alınan n hacimli örnekte X
adet başarının ortaya çıkma olasılığı, hipergeometrik dağılım gösterir
Tanım (Hipergeometrik şans değişkeni): Sonlu sayıda N öğeden oluşan bir anakütle içinde
belli bir A tipindeki öğelerin sayısı M olsun. Tekrar yerine koymaksızın rasgele çekilen ve n
birimden oluşan bir örneklemdeki A tipindeki öğelerin sayısı X şans değişkeni olsun. X
hipergeometrik şans değişkenidir ve hipergeometrik olasılık kütle fonksiyonu;
 M  N  M 
 

X  n  x 

f ( x; N , M , n) 
N
 
n
x  0,1,...., n
Teorem: Eğer X şans değişkeni hipergeometrik dağılıma sahip ise,
a. E ( X ) 
nM
N
b. V (X ) 
c. M X t  
Ġspat: Hipergeometrik dağılımın beklenen değer ve varyansı
 M  N  M 
 

x  n  x 

E( X ) 
x

N
x 0
 
n
n

 M  N  M 
 

 x  n  x 
N
x 1
 
n
n

( x  0 daki değer sıfırdır)
Bu ifadeyi değerlendirmek için aşağıdaki eşitlikler kullanılır.
M 
 M  1

x   M 
 x
 x 1 
 N  N  N  1
   

 n  n  n 1 
Bu durumda
 M  1 N  M 


M 
x  1  n  x 

EX  
N  N  1
x 1


n  n  1 
 M  1 N  M 



n 
x  1  n  x 
nM


N x 1
 N  1


 n 1 
n


bulunur. Eşitliğin en sağındaki ifade parametreleri
N  1 , M  1 ve n  1 olan bir başka
hipergeometrik dağılımın olasılıklarının toplamıdır. Bunu görebilmek için
tanımlanır ve f (x) bir olasılık fonksiyonu olduğundan,
 M  N  M   N 

   
 n  x   n 
x 0
n
  x
eşitliği geçerlidir ve
 M  1 N  M 
 M  1 N  M 


 n 1 


 x  1  n  x  
 y  n  y  1
 N  1
 N  1
x 1
y 0




 n 1 
 n 1 
n



n 1
 f y; N  1, M  1, n  1
y 0
1
Sonuç olarak,
y  x 1
E X  
nM
N
bulunur.
b. Dağılımın varyansı
n
E( X 2 )  
 a  N  a 


 x  n  x 
N
 
n 
 x.( x  1)  x 
x0
 a  N  a 
 a  N  a 
x( x  1)  
 n x  

 x  n  x  
 x  n  x 


N
N
x0
x 0
 
 
n 
n 
n

a (a  1)n(n  1) na
na


(a  1)(n  1)  ( N  1)
N ( N  1)
N N ( N  1)
V  X   E ( X 2 )  [ E ( X )]2

nM (nM  M  n  N ) n 2 M 2 N  n M  M 


n 1  
N ( N  1)
N 1 N 
N
N2
elde edilir.
NOT: p  M / N ve 1  p  ( N  M ) / N olduğundan;
E X   n
M
 np
N
 N n M
V X   
n
 N 1  N
 M
1 
N


 N n
  np 1  p 


 N 1 
şeklinde de ifade etmek mümkündür.
Hipergeometrik dağılımın moment türeten fonksiyonu yoktur.
Alternatif olarak, iadesiz ardışık örnekleme yapılabilir. i-inci denemedeki başarı sayısı Yi
olsun. Her bir çekilişte ortaya çıkabilecek sonuç başarı (Yi = 1) ya da başarısızlık (Yi = 0)
olacağından, Yi „ler binary (ikili) değerler alır. Yi „ler bağımsız olmadıkları için denemeler
Bernoulli denemesi değildir. Açıkça görülmektedir ki PYi  1 
başarı oranıdır. Şimdi Y2 ele alınsın. Bu durumda,
PY2  1 | Y1  1 
r 1
N 1
PY2  1 | Y1  0 
r
N 1
r
 p değeri, anakütledeki
N
olur. Toplam olasılık kuralına göre P A  P A | B .PB   PA | B c .PB c ‟dir. Böylece
PY2  1  PY2  1 | Y1  1.PY1  1  PY2  1 | Y1  0.PY1  0
r 
 r 1  r  r  

.  
.1  
 N 1 N  N 1  N 

r N  1
N  1N

r
p
N
Tümevarım yolu ile tüm i denemeleri için PYi  1 
r
 p olduğu gösterilebilir. Başarı
N
olasılığı (koşulsuz) tüm denemeler için Bernoulli denemelerinde olduğu gibi aynıdır.
Denemeler
bağımlı
oldukları
için
bu
denemeler
Bernoulli
denemesi
değildir.
(Unutulmamalıdır ki örnekleme iadeli olarak yapılırsa denemeler Bernoulli denemesi olur ve
X şans değişkeni de başarı olasılığı p olan n denemeli Binom dağılımı olur.)
Örnekleme ister bir grubun topluca rassal olarak seçilmesi ister tek tek iadesiz olarak
yapılıyor olsa da X‟nin dağılımı aynıdır. Tek tek yapılan seçimde X‟nin ortalama ve
varyansını hesaplamak daha kolaydır.
Doğrudan Hipergeometrik dağılımın olasılık
fonksiyonundan elde edilen momentlerin hesaplamaları karşılaştırılsın.
Öncelikle
tüm
denemeler
X  Y1  Y2    Yn
için
olduğunda
E Yi   01  p   1 p  p 
Binom
r
‟dir.
N
dağılımında
E  X   E Y1  Y2    Yn   E Y1   E Y2     E Yn   p  p   p  np 
Bu
yüzden
olduğu
gibi
nr
N
Y‟ler bağımsız olmadıkları için Var  X  ‟yi bulmak nispeten zordur.
 n 
Var X   Var Yi  
 i 1 

VarY   2 CovY , Y 
n
i
i
i 1
j
i j
Y‟ler binary oldukları ve aynı başarı olasılığı p‟ye sahip olduklarından, tüm i-ler için
Var Yi   p1  p  ‟dir. Genel olarak,

 E Y Y    

CovYi , Y j   E Yi  i Y j   j 
i
j
i
j
E YiY j  ‟yi elde edebilmek için, Y‟lerin binary oldukları bilindiğine göre YiYj‟nin 0 ya da 1
olacağı unutulmamalıdır. Bu nedenle,
E YiY j   1.P YiY j  1
 P Yi  1, Y j  1
 P Y j  1 | Yi  1.PYi  1

r  1 r
N  1 N
ve
2

r  1 r  r 
CovYi , Y j  
 
N  1 N  N 
r N r  1  r N  1

N  1N 2
r N  r 

N  1N 2
p1  p 

N 1
(Negatif kovaryans ve dolayısıyla korelasyon, bir denemede elde edilen başarının diğer bir
denemenin başarısının olabilirliğini azaltma eğilimindedir.)
Sonuç olarak, Var  X  ‟nin elde edilebilmesi için n adet eş varyans ve
nn  1
adet eş
2
kovaryansın toplanması gerekmektedir. Böylece,
Var  X   np 1  p   2
nn  1  p1  p  


2 
N 1 
n 1 

 np1  p 1 

 N 1
İlgili Hipergeometrik dağılımın standart sapmasını elde edebilmek için Binom dağılımının
standart sapmasıyla çarpım halinde olan
1
n 1
faktörüne sonlu anakütle düzeltme
N 1
faktörü denir.
Unutulmamalıdır ki genelde örnek hacmi popülasyon hacminden oldukça küçüktür n<<N. Bu
nedenle sonlu popülasyon düzeltme faktörü 1‟e yakındır ve Binom dağılımından elde edilen
standart sapma Hipergeometrik dağılımın gerçek standart sapmasına mükemmel bir
yakınsama sağlar. Aslında Binom dağılımı Hipergeometrik dağılıma çok iyi bir yakınsama
sağlar.
Hipergeometrik dağılımın binom dağılımına yaklaşımı aşağıda açıklanmıştır. Anakütledeki
eleman sayısı N çok büyük ise ve n ile p sabit kaldıkça hipergeometrik dağılım binom
dağılımına yaklaşır.
N  M !
M!
x!M  x ! n  x !N  M  n  x !
f x; N , M , n  
N!
n!N  n !

N  n!
M M  1....M  x  1M  x !
n!
M  x !
N N  1...N  n  1N  n!
x!n  x !
N  M N  M  1...N  M  n  x  1N  M  n  x !
N  M  n  x !
M ...M  x  1 N  M ...N  M  n  x 
n!

x!n  x ! N ...N  n  1

Burada, N   için,
N ...N  n  1  N n
N  M ...N  M  n  x   N  M n x
M ...M  x  1  M x
yaklaşımları kullanılarak,
f x; N , M , n  
M x N  M 
Nn
n x
x
n!
x!n  x !
M  N M 
  

N  N 
Burada p 
n x
n!
x!n  x !
N M
M
ve 1  p  
alınarak
N
N
f x; n, p  
n!
n x
p x 1  p 
x!n  x !
sonucuna ulaşılır. Bu da binom dağılışının olasılık kütle fonksiyonudur.
Eğer örnek hacmi n büyük fakat hala n<<N ise X‟nin dağılımı Merkezi Limit Teoremi ile
ortalaması np ve varyansı np1  p  olan Normal dağılıma yakınsar. Buna benzer olarak örnek
x
n
oranı pˆ  ‟in dağılımı ortalaması p ve varyansı
p 1  p 
olan Normal dağılıma yakınsar.
n
4.7 POĠSSON DAĞILIMI VE SÜRECĠ
Belirli sürekli bir ölçekte rasgele olarak ortaya çıkan olay sayısı ile ilgileniliyor olsun. Bu tip
şans değişkenleri poisson dağılımına sahiptir. Bu şans değişkenlerini türeten süreç ise poisson
sürecidir.
Poisson Sürecinin Varsayımları:
Poisson dağılımı, poisson postulate adı verilen temel varsayımlar setinden ele edilebilir. Bu
varsayımlar incelenen sürecin fiziksel özellikleri ile ilgilidir ve aşağıdaki teorem ile
özetlenmiştir.
Teorem: Her bir t  0 değeri için, X t aşağıdaki özelliklere sahip tam sayı değerli bir şans
değişkeni olsun; (Burada X t , 0 ile t aralığında otaya çıkan rasgele olay sayısı olarak
düşünülebilir).
a. x0  0 (Başlangıç sınırındaki olay sayısı sıfırdır)
b. s  t olmak üzere x s ve xt  xs bağımsızdır. (Ayrık periyotlardaki olay sayıları
bağımsızdır)
c. x s ve xt  s  xt özdeş dağılmıştır. (Ortaya çıkan olay sayısı sadece periyot
uzunluğuna bağlıdır)
d. lim
t 0
P( xt  1)
  (Ortaya çıkış olasılığı eğer periyot küçük ise periyot uzunluğu ile
t
doğru orantılıdır)
P( xt  1)
 0 (Olaylar eşanlı olarak oluşmazlar).
t 0
t
e. lim
Eğer a-e varsayımları sağlanıyor ise herhangi bir X tamsayısı için,
f ( xt  x)  e  t
(t ) x
x!
olup xt ~ Poisson (t ) ‟ dir.
Tanım (Poisson şans değişkeni): Sürekli bir ölçekte rasgele olarak ortaya çıkan olay sayısı X
olsun. Eğer X şans değişkeni yukarıda verilen teoremin özelliklerini sağlıyor ise X‟e Poisson
şans değişkeni denir ve olasılık fonksiyonu,
f x;   
e  x
x!
x  0,1,2,
Şeklinde tanımlanır.
Teorem: f x;   bir olasılık fonksiyonudur.
Ġspat: Bu fonksiyonun olasılık fonksiyonu olduğu e y fonksiyonunun Taylor serisine açılımı
kullanılarak,
ey 

yi
 i!
i 0
olduğundan,


x 0
f x;    e  

x
 x!
x 0
 e  e
1
ispat tamamlanır.
Teorem: Eğer X bir poisson dağılımına sahip ise,
a. E(X )  
b. V (X )  
t
c. M x  e e 1
x.e   x
x!
x 0


Ġspat: a. E ( X )   xf ( x) 
x 0


e   x

x 1
 ( x  1)!  e   ( x  1)!

x 1
x 1
Burada y  x  1 dönüşümü ile denklemin sağ yanındaki toplam e  ‟ ya eşit olur.
E ( X )  e   e   
elde edilir.
x 2 e   x
x!
x 0


b. E ( X 2 )   x 2 f ( x) 
x 0
Bu denklemde x 2  x( x  1)  x özdeşliğini kullanarak,
   x( x  1) x! xe

E X2 

x
x 0


x( x  1)e   x  xe   x

x!
x!
x 0
x 0



e   x

x 2 ( x  2)!


 2e  


e   x
 ( x  1)!
x 1
x  2
 ( x  2)!  E  X 
x2
Burada y  x  2 dönüşümü ile denklemin sağ yanındaki toplam e  ya eşit olur.
 
E X 2  2  
ve sonuç olarak,
 
V  X   E X 2  E  X   
2
elde edilir.
c. Poisson Dağılımının Moment Çıkaran Fonksiyonu,
  e
M x t   E etx 

tx
x 0
e

e   x
x!


x 0
 e e
t
e  
t
x!
x
 e  ee
t

1
olur.
Poisson dağılmış bir tesadüfi değişkenle ilgili olasılıkları hesaplamak için verilecek λ
değerlerine karşılık gelen e 
ve  x
sayısal değerlerine ihtiyaç vardır. İşlemleri
kolaylaştırmak için verilen her λ ve X değerlerine göre poisson dağılımlarına karşı gelen
olasılıkları veren tablolar hazırlanmıştır.
Poisson dağılımı gerçekleşme olasılığı çok küçük olan olayların tekrarlı denemeleri için
uygun bir dağılımdır. Diğer taraftan Poisson dağılımı Pr X  x   0.01 ve n  20 olduğunda
binom dağılımı için iyi bir yaklaşımdır.
Binom Dağılımının Poisson Dağılımına YaklaĢımı
Simetrik bir binom dağılımı, örnek çapı büyüdükçe normal bir dağılıma yakınsamaktadır.
Ancak n→∞ bile olsa, eğer p ya da q dan biri sıfıra, diğeri 1‟e yaklaşırsa, asimetri çok
şiddetleneceğinden normal dağılımdan yararlanılamaz. Bu durumda binom dağılımı bir
poisson dağılımına yaklaşır.
Binom dağılımının n parametresi sonsuza ve p parametresi sıfıra yaklaşıyor ise np sabit
kalıyor ise binom dağılımı poisson dağılımına yaklaşır. Bu durumda np   olduğu kabul
edilir.
f x; n, p  
n!
n x
p x 1  p 
n  x ! x!
x
n
x

nn  1...n  x  1         

1
1
  
n 
x!

 
n 

n
nn  1...n  x  1 x 1   n 1    x

x! 
nx
 
n 
  1 
x 1   x   
 11  ...1    1  
n
  n   n n  x! 

n
n
 
1  
n

x
n
  1   x 1   x      
lim f x; n, p   lim 11  ......1     1   1  
n   n n   x!  n   n 
n 
n  
Burada
Limn→∞ (1  x  1)....(1  2 )(1  1 )(1)  1 dir.

n
n
n

x
Limn→∞ {1   
 n

n
 
}
 e 
Limn→∞ (1   ) x  1
n
olduklarından,
lim f  x; n, p   1
n 

x 
e 1
x!
x 
e
x!
bulunur.
4.8 ÇOK TERĠMLĠ (MULTĠNOMĠAL) DAĞILIM
Bir deneyde E1 , E2 ,, Ek ile gösterilen ayrık olaylar tanımlanmış olsun. Denemeler n kez
tekrarlandığında her bir Ei olayının elde ediliş sayısının Xi ortak dağılımı çok terimli
dağılımdır. Örneğin bir zar n kez atılsın zarın üst yüzüne gelen 1‟lerin sayısı x1, 2‟lerin sayısı
x2, 6‟larin sayısı x6 ile tanımlanır. Her bir Ei olayının elde edilme olasılığı ise pi ile tanımlanır
ve tüm deneler için sabit olduğu varsayılır. Bu dağılım binom dağılımının genelleştirilmiş
halidir.
Teorem: Sabit n adet denemede her bir Ei, i  1,2,, k , olayının ortaya çıkış sayısının ortak
olasılık dağılımı
k

xi n ve
p
i
 1 koşulları altında,
i 1
i 1
f x1 , x2 ,, xk  
k
n!
p1x1 . p2x 2 ... pkx k
x1! x2!....xk !
xi  0,1,2,, n
fonksiyonu ile belirlenir ve bu dağılıma çok terimli dağılım adı verilir.
İspat: n adet bağımsız denemede belli bir sırada E1 olayının x1 kez, E2 olayının x2 kez,…., Ek
olayının xk kez elde edilmesi olasılığı,
p1x1 . p2x 2 ... pkx k
eşitliğinden elde edilir. Olayların herhangi bir sırada elde edilmesi ile ilgilenildiğinden, diğer
bir deyişle sıralama önemsiz olduğundan, buradaki eşanlı olayların farklı dizilişlerinin sayısı;
n!
x1! x2!....xk !
olacaktır. Bu nedenle
k
x
i
i 1
n ve
k
p
i
 1 olmak üzere X1 , X 2 ,, X k şans değişkenlerinin
i 1
ortak olasılık fonksiyonu elde eilen iki sonucun çarpılması ile tanımlanır.
4.9 ÇOK DEĞĠġKENLĠ HĠPERGEOMETRĠK DAĞILIM
Eğer hipergeometrik dağılımda ana kütledeki birimler iki değil de k tane gruba ayrılıyor ise
genelleştirilmiş hipergeometrik dağılıma geçilir. Her bir Ei olayının elde edilme olasılığı ise pi
deneyden deneye değişiyor ise deney n kez tekrarlandığında, x1 kez E1, x2 kez E2,  , xk kez
Ek sonuçlarının ortak oluşma olasılıkları genelleştirilmiş (çok değişkenli) hipergeometrik
dağılım ile bulunur. Çok değişkenli hipergeometrik dağılımın olasılık fonksiyonu,
 N1  N 2   N k 
   
x
x
x
f x1 , x2 ,, xk    1  2   k 
N
 
n 
olup burada, N1  N 2    N k  N ve x1  x2    xk  n eşitlikleri ile tanımlanmıştır.
BÖLÜM 4 EKLER
E.4 POĠSSON OLASILIK YOĞUNLUK FONKSĠYONUNUN ELDE
EDĠLMESĠ
Olayların h uzunluğundaki bir periyotta yaklaşık olarak homojen bir şekilde ortaya çıktığı
varsayılsın. Belirlenen periyot için aşağıdaki durumlarla karşılaşılabilir:
— Sadece bir olay ortaya çıkar,
— Hiç olay oluşmayabilir,
— Birden fazla olay ortaya çıkabilir.
h periyodundaki olasılıklar P( x, h) ile belirtilsin, o(h) fonksiyonu:
 oh  
lim  
0
h 0
 h 
h 2  oh 
oh  oh  oh
özelliklerini sağlayan bir fonksiyon olsun.
Varsayım d için; w  h olan küçük bir aralık için bir olayın ortaya çıkma olasılığı P(1, h) ,
aralığın uzunluğu ile h şeklinde doğru orantılıdır. Burada  sabit pozitif oransal bir çarpımı
ifade eder. Başka bir ifade ile
P1, h   h  oh 
Varsayım e için; w  h olan küçük bir aralık için iki veya daha fazla olayın ortaya çıkma
olasılığı,

 Px, h   oh 
x2
Varsayım b için; Kesişmeyen aralıklardaki olay sayısı birbirinden bağımsızdır.
Varsayım d ve e‟ den en az bir olayın h aralığında oluşmasının olasılığı,
Px  1, h  h  oh   oh  h  oh
bunun sonucu olarak, h aralığında hiç olay oluşmamasının olasılığı,
P0, h   1  h  oh 
olup, Varsayım b ile, periyodu h  w olan bir aralıkta hiç olay oluşmamasının olasılığı
P(0, h  w) ,
w aralığında hiç olay olmama olasılığı P(0, w) ile
h aralığında hiç olay olmama olasılığı P(0, h) ‟nın çarpımına eşittir:
P0, h  w  P0, w1  h  oh
P0, w  h  P0, w
oh
 P0, w  P0, w
h
h
h  0 için limit alınarak,
dP0, w
 P0, w
dw
diferansiyel denklemi elde edilir. Bu diferansiyel denklemin çözümü aşağıda verilmiştir:
dP 0, w
 dw
P0, w
dP 0, w
 P0, w    dw
ln P0, w  w  c
P0, w  e  w c
bulunur. Eğer w  0 ise varsayım a ile, P(0,0)  1 olur. Bu koşul altında c  1 elde edilir.
Sonuç olarak:
P0, w  e  w .
Periyodu w  h olan bir aralıkta x adet olay olmasının olasılığı, P( x, w  h) :
w aralığında x olay olmasının olasılığı P( x, w) ile
h aralığında hiç olay olmamasının olasılığı [1  h  o(h)] çarpımı artı,
w aralığında x  1 olay olmasının olasılığı P( x  1, w) ile
h aralığında bir olay olmasının olasılığı h  oh çarpımı artı,
w aralığında x  2 olay olmasının olasılığı P( x  2, w) ile
h aralığında iki olay olmasının olasılığı o(h) çarpımından oluşur;
Px, w  h  Px, w1  h  oh  Px  1, wh  oh  Px  2, woh
Px, w  h  Px, w
oh
 Px, w  Px  1, w 
Px  2, w
h
h
ve h  0 için limit alınarak,
dPx, w
 Px, w  Px  1, w
dw
türev eşitliği bulunur. Bu diferansiyel denkleminin çözümü aşağıda verilmiştir:
x  1 için;
dP 1, w 
dw
dP 1, w 
dw
  P 1, w    P  0, w 
  P 1, w    e  w
(1)
Bu ifade birinci mertebeden doğrusal bir diferansiyel denklemdir. Bu diferansiyel denklemin
integral çarpanı,
T w  e 
dw
 e w
P1, wew  ew e w dw

P1, we w  w  c
P1, w  e  w w  c 
bulunur. w  0 için P(1,0)  0 olduğundan, c  0 bulunur. Sonuç olarak:
P1, w  we  w
elde edilir. Türev eşitliğinde yerine konarak P(2, w) ve sırasıyla diğer terimler bulunur ve
P  x, w
  w

x
e  w
x
x  1,2,... ,
Poisson olasılık fonksiyonu elde edilir.
Poisson süreci ile ilişkili dağılımlar (gama, üstel ve bazı sürekli dağılışlar) ve olasılık
yoğunluk fonksiyonlarının elde edilişleri ilgili dağılışların ele alındığı kısımlarda
açıklanmıştır.
Download