Sürekli Raslantı Değişkenlerinin Olasılık Dağılımları Normal Dağılım

advertisement
BAŞKENT ÜNİVERSİTESİ
TİCARİ BİLİMLER
FAKÜLTESİ
SİGORTACILIK VE RİSK
BÖLÜMÜ
Ankara / TÜRKİYE
Prof.Dr. Serpil CULA
DERS4
Olasılık Dağılımları / Olasılık Modelleri
 Sigortacılık alanında karşılaşılan fiziksel ya da fiziksel olmayan rasgele değişken büyüklüklerin
olasılık dağılımları için, model alınabilecek çok sayıda sürekli ve kesikli fonksiyon bulunmaktadır.
 Sürekli X rasgele değişkenine ilişkin f(x) fonksiyonunun yalnızca biçiminin tahmin edilmiş
olmasının, fonksiyona ilişkin eğrinin altında kalan alanlarla belirlenen olasılıkların hesaplanmasını
sağlamayacağı göz önünde bulundurulmalıdır. Çünkü söz konusu alanların hesaplanabilmesi için
anılan eğrinin denkleminin de belirlenmiş olması gerekir.
 Olasılıksal problemlerin çözümünde ise, model (fonksiyon) belirlendikten sonra, modele ilişkin
parametreler, örnekleme sonucu sağlanan istatistiksel verilerle tahmin edilir; ortalaması, standart
sapması gibi. Bu bağlamda en uygun modelin seçimi, var olan fonksiyonların özelliklerinin çok
yakından bilinmesini gerektirir.
 Sigortacılık alanında karşılaşılan rasgele değişkenlerin deneysel dağılımlarının çoğunu çok yakından
betimleyen çözümsel modellerin bazıları:
 Normal dağılım,
 Üssel dağılım,
• t tağılımı,
 Lognormal dağılım,
 Gamma dağılımı,
• F dağılımı,
 Binom dağılımı,
 Khi-kare dağılımı,
• Üniform dağılım,
 Poisson dağılımı
 Geometrik dağılım
• Beta dağılım vb.dir.
Bazı Kesikli Olasılık Dağılımları
 Binom Dağılımı (İki Terimli Dağılım):
 X raslantı değişkeni aşağıdaki koşulları sağlıyorsa, bu raslantı değişkeni binom raslantı
değişkenidir:
 Deneyde iki sonuç vardır. Başarılı olma olasılığı p, başarısız olma olasılığı
(1-p)=q
olarak tanımlanır.
 Deney boyunca yapılan n deneme, aynı koşullar altında gerçekleştirilir.
 Bir tek deneme için başarılı olma olasılığı p ve başarısızlık olasılığı q her deneme için
aynıdır.
 Denemeler birbirinden bağımsızdır.
 Deney boyunca n sabit kalır.
 n
 Binom dağılımının olasılık fonksiyonu; P( X  x)    p x (1  p) n  x ,
x  0,1,2,3,..., n
x
 
olarak yazılır. Burada, örneklem büyüklüğü n, ilgilenilen olayın olasılığı p, p+q=1’dir.
 Binom Dağılımının Ortalaması, Varyansı ve Standart Sapması:
 Binom dağılımının ortalaması, varyansı ve standart sapması sırasıyla aşağıda verilmiştir:
  E(X)  np
2
.  npq
  npq
dır.
Bazı Kesikli Olasılık Dağılımları
 Örnek: A şirketinde bir poliçeyi tekrar yenileme olasılığı 0,40’dır. Seçilen 5 poliçeden;
2’sinin yenilenme olasılığı nedir?
 5
P(X  2)   0,402 0,603  0,3456
 2
 En çok 2’sinin yenilenmesi olasılığı nedir?
P(X  2)  P(X  0)  P(X  1)  P(X  2)  0,0778  0,2592  0,3456  0,6826
 En az 3 poliçenin yenilenmesi olasılığı nedir?
P(X  3)  P(X  3)  P(X  4)  P(X  5)
5
5
5
=  0,403 0,602   0,404 0,601   0,405 0,600  0,2304  0,0768  0,0102  0,3174
 3
 4
 5
Bazı Kesikli Olasılık Dağılımları
 Poisson Dağılımı:
 Belli bir zaman aralığında, belli bir alanda ya da hacimde nadir rastlanan olayların olasılık
dağılımları Poisson dağılımı ile modellenebilir. Aşağıda Poisson dağılımı ile modellenebilecek
örnekler verilmiştir:
 Bir iş kolunda belli bir sözleşme döneminde gerçekleşen grev sayısı
 Bir dakikada bir kasaya gelen müşterilerin sayısı
 Bir bölgede yapılan taramada, kanser hastalığı yaşanmış bireylerin sayısı
 Poisson dağılımının ortalaması ve varyansı aynı olup, tek bir parametresi vardır ve bu
parametre  ile gösterilir.
X Poisson raslantı değişkeninin olasılık fonksiyonu,
(t ) x et
olarak tanımlanır.
P( X  x ) 
x!
Burada, e=2,71828
x= ilgilenilen olay sayısı,
t=t birim zaman içinde ilgilenilen olayın ortalama oluş sayısıdır.
Genellikle t= 1 alınır. Bu durumda Poisson dağılımının olasılık fonksiyonu;
( ) x e  
P( X  x ) 
x!
olur.
Dağılıma ilişkin E(X)= = ; 2= ve standart sapma,
 
dır.
Bazı Kesikli Olasılık Dağılımları
 Örnek: Bir sigorta şirketine 9.00-14.00 saatleri arasında gelen telefonların ortalama sayısı =3
olan Poisson dağılımı göstermektedir. Bu şirkete bu saatler arasında,
Hiçbir müşterinin gelmemesi olasılığını,
3 0 e 3
P(X  0) 
 0,0498
0!
 2’den az müşterinin gelmesi olasılığını,
P(X<2)=P(X=0)+P(X=1)=0,0498+0,1494=0,1992
 2 ve daha fazla müşterinin gelmesi olasılığını bulunuz.
P(X2)=1-P(X<2)
=1-0,1992=0,8008
Sürekli Raslantı Değişkenlerinin Olasılık Dağılımları
 Normal Dağılım:
 Olasılık yoğunluk fonksiyonlarından biri olan ve istatistikte çok yaygın kullanılan normal
dağılım, istatistik bilimi için büyük önem taşır. X sürekli raslantı değişkeninin olasılık yoğunluk
fonksiyonu normal dağılım gösteriyorsa, aşağıda belirtilen özelliklere sahiptir:
Tek tepeli bir dağılımdır.
Ortalamasına (X=) göre simetriktir.
Ortalama, ortanca, tepe değeri birbirine eşittir.
X raslantı değişkeni - ile + arasında değerler alır.
 Daha önce de belirtildiği gibi gözlemlerin yaklaşık olarak;
%68’i,
1
%95’i,
2
%99,7’si, 3
%100’ü 4 arasındadır.
 Normal dağılımın olasılık yoğunluk fonksiyonu
f (x) 
1
 2
e
1  x  
 

2  
2
,
- <x< dır.
Sürekli Raslantı Değişkenlerinin Olasılık Dağılımları
 Burada; raslantı değişkeninin herhangi bir değeri, =Kitlenin standart sapması, =Kitlenin
ortalaması ve e2,76183’dir. Aşağıda normal dağılımın grafiği verilmiştir.
f(x)
σ
μ
x
 Yukarıda verilen ifade bir olasılık yoğunluk fonksiyonu olduğu için integralinin değeri 1’e
eşittir. Yani,




1
 2
e
x  2
2 2
dx  1
dır.
 Dağılımı tanımlayabilmek için  ve ’yı bilmek gerekir. İntegral ile bulunan belli sınırlar
arasında eğrinin alanı, belli bölgelerde bulunma olasılıklarını verir. P(aXb) olasılığı,
b
1

x  2
22
dx integralinin alınması ile bulunur.

2

a
 Bu integralin alınması pratik ve kolay bir iş değildir. Bunun için dağılımın standartlaştırılması
işlemi uygulanır. Bu uygulama, olasılık yoğunluk fonksiyonunun belli sınırlar arasındaki alan
hesaplamasında kolaylık sağlar.
 Tanım: Bir dağılımın standartlaştırılması, alanı değişmemek şartı ile ortalamanın sıfıra
kaydırılması, varyansın 1’e eşitlenmesidir. Tüm normal dağılımlar standart normal dağılıma
dönüştürülebilir.

e
Sürekli Raslantı Değişkenlerinin Olasılık Dağılımları
 Standart Normal Dağılım (SND):
 Standart normal dağılımda ortalama 0, varyans 1’dir. Ortalamaya göre tam simetrik bir
dağılımdır. SND’ın olasılık yoğunluk fonksiyonu
f (z) 
1
2
e

z2
2
,
- <z< dur.
Z
X

dönüşümü ile,
 Bu dağılım, X raslantı değişkenlerinin belli bölgelerde bulunma olasılığını bulmak için
kullanılır. Örneğin bir standart normal dağılımda, Z=0,00 ile Z=1,45 arasında bulunma olasılığı,
P (0  Z  1,45) 
1, 4 5

0

1
e
2
z2
2
dz
integrali alınarak elde edilir.
 Ancak uygulamada, bu alanlar için daha önce oluşturulmuş tablolar kullanılır. Ek 3’de verilmiş
tablo, bir SND tablosudur ve Z’nin sıfırdan, 3,09’a kadar olan değerleri için çeşitli alanları
vermektedir. Simetrik bir dağılım olduğu için, sol tarafa ait bilgiler verilmemiştir. Çünkü dağılım
simetrik olup sağ taraf ile aynı değerlere sahiptir. Örneğin, P(0<Z<0,52)=P(-0,52<Z<0) dır.
 Bazı kaynaklar Ek 3’de verilen tablo yerine,
z
F( Z)   f (z)dz

ile tanımlanan standart normal dağılımın birikimli olasılıklarını veren
tabloları kullanırlar (Ek 4).
Sürekli Raslantı Değişkenlerinin Olasılık Dağılımları
 Ortalaması,  ve Varyansı, 2, Bilinen Normal Dağılımlarda Olasılık Hesabı:
 Normal dağılım ND(;2) ya da N(;2 ) ile gösterilir. Gösterimin anlamı, ortalaması  ve
varyansı 2 olan dağılım demektir. Her ND(;2) dağılım, standart dağılım olan SND(0;1)’e
dönüştürülebilir. Bu dönüştürme işlemi kitle için;
X   dir.
Z

örneklem için;
Z
XX
S
ile gerçekleştirilir.
Standart normal dağılım (SND) grafiği verilmiştir.
Şekil Standart Normal Dağılım
 SND tablosunu kullanmak için; dağılımında, Z değerlerinin tam sayı kısmı ve virgülden sonra
gelen ilk hane satırdan okunur. Virgülden sonra gelen ikinci hane ise, sütundan okunur, ikisinin
kesiştikleri yerde olan rakam, sıfır ile o, Z değeri arasında bulunma olasılığıdır.
Sürekli Raslantı Değişkenlerinin Olasılık Dağılımları
 Örnek: Haftalık hasar ortalaması =3000 TL ve standart sapması =1000 TL olan bir sigorta
şirketinin gerekli işlemlerde iş hacmini belirleyebilmek için aşağıdaki olasılıklara ihtiyacı vardır.
Aşağıdaki olasılıkları hesaplayınız.
 Bu şirkette haftalık hasarın 2500 TL ve daha fazla olma olasılığı nedir?
1. Adım: İstenen olasılık bölgesi yazılır.
P(X>2500)=P(X2500)
2. Adım: ND(3000;10002) da verilen X değerinin SND(0;1)da karşıtı bulunur.
Z
2500  3000
 0,5
1000
3. Adım: Bu olasılığın SND’da karşıtı yazılır ve tablodan bulunabilecek şekle getirilir.
Yani P(Z>-0,5) olarak yazılır. Grafik çizilerek istenen bölge belirlenir.
4. Adım: 3. adımda taranarak gösterilen olasılıklar tablodan bakılıp yazılır.
P(-0,5<Z<0)=0,1915’dir. P(0<Z<)=0,5’dir.
Taralı alanın olasılığı 0,5+0,1915=0,6915 olacaktır.
P(-0,5<Z<)=0,6915’dir.
Sürekli Raslantı Değişkenlerinin Olasılık Dağılımları
 Haftalık hasarın 2500 TL’den az olma olasılığı nedir?
P(X<2500)=
 X   2500  3000 
P

  P( Z  0,5)
1000
 

Şekil çizerek istenen bölge bulunabilir.
İstenen bölge; P(Z<-0,5)=0,5-0,1915=0,3085’dir.
 Haftalık hasarın 4000 TL ile 5000 TL arasında olma olasılığı nedir?
P(4000<X<5000)=
 4000  3000 X   5000  3000 
P


  P(1  Z  2)
1000

1000


P(1<Z<2)=P(0<Z<2)-P(0<Z<1)=0,4772-0,3413=0,1359
Sürekli Raslantı Değişkenlerinin Olasılık Dağılımları
 Haftalık hasarın 2000 TL ile 5000 TL arasında olma olasılığı nedir?
P(2000<X<5000)=
 2000  3000 X   5000  3000 
P


  P( 1  Z  2)
1000

1000


P(-1<Z<2)=P(-1<Z<0)+P(0<Z<2)=0,3413+0,4772=0,8185
 Haftalık hasarın1000 TL ile 2000 TL arasında olma olasılığı nedir?
 1000  3000 X   2000  3000 


  P( 2  Z  1)
1000

1000


P(1000<X<2000)= P
P(-2<Z<-1)=P(-2<Z<0)-P(-1<Z<0)=0,4772-0,3413=0,1359 olacaktır.
Sürekli Raslantı Değişkenlerinin Olasılık Dağılımları
 Örnek : Başkent radyosunda dinlenen bir müzik programının haftalık dinlenme süresi μ=4 saat
ve σ=1 saat parametrelerine sahip olan bir normal dağılım gösterdiği bilinmektedir.
 Haftalık müzik dinleme süresinin üç saatten az olma olasılığı nedir?
3 4

P(X  3)  P Z 
  P( Z  1)
1 

=0,5-0,3413=0,1587
 Bu sürenin 3,5 saat ile 4,5 saat arasında gerçekleşme olasılığı nedir?
4,5  4 
 3,5  4
P(3,5  X  4,5)  P
Z
  P(0,5  Z  0,5)
1
1


=0,1915+0,1915=0,3830
Download