BÖLÜM 3: FREKANS DAĞILIŞLARI ve ŞANS DEĞİŞKENLERİ

advertisement
BÖLÜM 3: FREKANS DAĞILIŞLARI ve ŞANS
DEĞİŞKENLERİ
Pek çok deneyde, orijinal olasılık yapısı (kümeler ya da olaylar) ile çalışmaktansa özel bir değişkenle
ilgilenmek ve bu yeni değişkene ait olasılıkları belirleyebilmek işlemleri kolaylaştır. Örneğin bazı
deney sonuçlarının tanımladığı örnek uzayları, bir çift paranın üst yüzüne gelen sembol gibi,
S  Y , Y , T , Y , Y , T , T , T  , sayılarla ifade edilmemektedir. Deneyde ortaya çıkan yazı sayısı ile
ilgilenildiğinde yeni bir değişken tanımlanmış olur. Farklı bir örnek olarak, bir soru için doğru ya da
yanlış olup olmadığı 50 kişiye sorulduğunda ve doğru cevabı 1 yanlış cevabı 0 ile kayıt altına
alındığında bu deneyin örnek uzayı 250 elemandan oluşur ve her bir eleman 50 digit uzunluğunda 1 ve
0’ların farklı sıralamalarından oluşur. Bu örnek uzayı, doğru cevabını verenlerin sayısı şeklinde bir
şans değişkeni ile tanımlanarak basite indirgenebilir. Bu durumda X şans değişkeni örnek uzayı
0,1,  ,50
aralığında tam sayılar kümesi olacaktır ve bu örnek uzayı ile çalışmak işlemleri daha
kolaylaştıracaktır. Bu X değerinin tanımlanması ile gerçekte, orijinal örnek uzayından yeni bir örnek
uzayına genellikle gerçel sayıların bir kümesine bir fonksiyon tanımlanmıştır.
Bu kısımda bir S örnek uzayındaki ei elemanlarını sayılarla ifade edebilecek kuralların nasıl
formülleştirileceği açıklanacaktır.
Sonucunda rassal sayılar üreten birçok rassal deney mevcuttur. Örneğin; üç çocuklu ailelerdeki kız
çocuğu sayısı, bir paranın 10 kere atılmasıyla ortaya çıkan tura sayısı gibi. Rassal deneyin sonucu bir
sayı olduğunda, ilgilenilen bazı özelliklerin ölçümlenmesine olanak sağlar. Örneğin
1. Ortalama değerin hesaplanabilmesi
2. Deneyin çıktılarının ortalama değerden ne kadar saptığının belirlenmesi,
3. Farklı rassal değişkenler arasındaki ilişkinin belirlenebilmesi,
gibi. Bu liste daha da genişletilebilir.
İlk aşamada “ölçümlenen kümeler nedir?” sorusu akla gelebilir. Çünkü birçok farklı örnek uzayı
mevcuttur. Bununla birlikte, S = {yazı, tura}, S = {aynı, farklı}, S = {Fenerbahçe kazanır, Galatasaray
kazanır} şeklinde kategorik olarak tanımlanmış tüm bu farklı denemelere ait örnek uzayları kısaca
rakamlarla ifade edilebilir:
S  0,1
Problemi rassal değişkenler ile tanımlamanın iki temel amacı vardır. Bunlar:
1.Birbirinden farklı örnek uzaylarını aynı terimlerle ifade etmek. Örneğin: S  0,1, P 1  p
ve P0  1  p iki mümkün sonucu olan tüm deneyleri tanımlamaktadır.
2.Ortalamaları, varyansları, ilişkileri vb için genel kurallar geliştirilmek istenen ve rassal
sayılar üreten rassal deneylere isim vermek. Diğer bir ifade ile rassal modeller ile tanımlamak,
şeklinde ifade edilebilir.
50
3.1 ŞANS DEĞİŞKENİ ve FREKANS DAĞILIMI KAVRAMLARI
Örnek uzayından şans değişkeni kavramına geçişi açıklamak amacıyla bir madeni paranın bir kez
havaya atıldığı deney ele alınsın. Bu deney için örnek uzayı S  T , Y  ’dır. Daha belirgin hale
getirmek için tura olayına 1, yazı olayına 0 reel sayısı atanabilir. Şans değişkeni X ile gösterilen bu
atama şu şekilde tarif edilebilir:
T 
Y 
 
Y

1
0 
 
Fonksiyonel gösterim ile, Y : S   olup atama kuralı şu şekilde tanımlanmıştır:
Y T   1
Y Y   0
Bir diğer örnek ise zarın iki kez atıldığı ve üst yüze gelen tura sayısıyla ilgilenildiği deney olsun. Bu
deney için örnek uzayı S  TT , TY , YT , YY  kümesi ile gösterilir. Çıktılardan TT’ya 2, TY ve YT’ya 1
ve YY’ya 0 reel sayısı atanıyor. Bu atamanın birkaç farklı gösterimi aşağıda verilmiştir:
Y şans değişkeni ile gösterilen doğrudan atama:
TT
YT

TY 
YY 
X

2 1
1 0 


Fonksiyonel gösterim ise, X : S   şeklindedir ve atama kuralı şu şekilde tanımlanmıştır:
X TT   2 ,
X TY   X YT   1 ,
X YY   0
Doğrudan atama yerine, bir ara işlem ile sıralı ikili sayılar her bir çıktıya atanabilir. Örneğin, her bir
tura için 1 ve her bir yazı için 0 atanabilir. Bu atama Y : S   2 ile gösterilir. Bu bağlamda
y   y1 , y 2  ’ye şans vektörü denir.
Şans vektörü x’in her bir elemanı bir şans değişkenidir ve
doğrudan atama
TT
YT

TY 
YY 
Y

 1,1
0,1

1,0
0,0
ile gösterilir. Şans vektöründeki Y1 ve Y2 şans değişkenleri kullanılarak yeni bir şans değişkeni,
g  y1 , y 2   y1  y 2
şeklinde tanımlanabilir. Yeni şans değişkeni Y1 ve Y2 şans değişkenlerinin bir fonksiyonu olarak
g : 2  
Tanımlanmıştır. g(y) yapısı, şans değişkeni X’ye denktir ve şu şekilde gösterilebilir:
TT
YT

TY 
YY 
Y

 1,1
0,1

1,0
0,0
g

2 1
1 0 


51
Y1 şans değişkeni ilk atışta gözlenen tura sayısını, Y2 şans değişkeni ise ikinci atışta gözlenen tura
sayısını temsil etmektedir. Bu iki şans değişkeninin toplamı y1  y 2 , X şans değişkenine denktir.
Şans değişkeni X’in oluşturulmasının temel sebebi, incelenen deneyle ortaya çıkan olasılık uzayını,
tüm mümkün çıktıları reel sayılar olan olasılık uzayı ile değiştirmektir. Bu nedenle orijinal örnek uzayı
S, sayı doğrusu  ile değiştirilir. Dönüşümün tamamlanabilmesi için ’nin hangi alt kümelerinin olay
olarak tanımlanacağı ve bu olaylara ait olasılıkların nasıl hesaplanacağının belirlenmesi gerekir.
Tanım (Şans değişkeni): Örnek uzayı S olan bir şans deneyi ele alınsın. Örnek uzayındaki her bir
elemanı;
ei  S
bir ve yalnız bir gerçel sayıya atayan X fonksiyonuna;
X ei   x
bir şans değişkeni denir. Genellikle,
X :S  
(3.1)
ile tanımlanır.
Rassal değişkenler için büyük harfler kullanılırken (X), rassal değişkenlerin aldıkları değerler küçük
harflerle gösterilir (x).
Şans değişkeninin tanımlanması ile aynı zamanda yeni bir örnek uzayı da (şans değişkenin tanım
kümesi) tanımlanmış olur. Bu nedenle orijinal örnek uzayı üzerine tanımlanan olasılık fonksiyonunun
bu şans değişkeni içinde kullanılıp kullanılamayacağı kontrol edilmelidir. Şans değişkeninin uzayı
genellikle gerçel sayılar kümesidir:
R  x : X e   x, e  S
Şans değişkenleri genel olarak dört sınıfta incelenir:
1.Kesikli şans değişkenleri.
2.Sürekli şans değişkenleri.
3.Karma (mixed) şans değişkenleri.
4. Çok değişkenli şans değişkenleri.
Bölüme ait alt kısımlarda her bir sınıf detaylı olarak incelenmiştir.
Şans değişkenine ait veriler, bir olayın ortaya çıkma sıklığı ya da tekrar sayıları olarak gösterildiğinde
bu düzenlemeye frekans dağılımı denmektedir. Şans değişkeninin davranışını açıklamak için frekans
dağılımı kullanılarak elde edilen formüle genel olarak ‘frekans eğrisi’ adı verilmiştir. Frekans eğrisi
kullanılarak her bir şans değişkenine ait dağılış tümü ile belirlenip yorumlanabilmektedir. Bunun
sonucu olarak frekans eğrisinin kullanıldığı araştırmalarda araştırmacı şans değişkenine ait örnekten
elde edilen birkaç adet istatistik tahmininden daha fazlasına sahip olacaktır.
Bazı dağılışlar şans değişkenin belli değerlerinin tanımladığı aralıklara düşen tekrar sayısını verirken,
Şekil 3.1 bazıları ise tam değer için tekrar sayısını vermektedir, Şekil 3.2.
Her hangi bir şans değişkeninin olasılık yapısını tanımlamakta kullanılan iki temel fonksiyon:
52
1.Olasılık yoğunluk/kütle fonksiyonu, f(x).
2.Birikimli dağılım fonksiyonu, F(x).
şeklinde tanımlanabilir. Bu fonksiyonlar ve temel özellikleri her bir şans değişkeni yapısı için ayrı ayrı
incelenecektir.
Şekil 3.1 Sürekli şans değişkenleri için histogram
Şekil 3.2 Kesikli şans değişkeni için çubuk grafik
3.2 KESİKLİ ŞANS DEĞİŞKENLERİ
Bir paranın atıldığı basit şans deneyi ele alınsın. Bu deneye ait örnek uzayı S  Y , T  olup örnek
uzayındaki elemanları temsil eden e elemanı Y ya da T değerini alır. Bir X fonksiyonu aşağıdaki gibi
tanımlansın:
X e1   0, e1  T ise,
X e2   1, e2  Y ise.
Tanımlanan X fonksiyonu örnek uzayı S üzerine tanımlı gerçel değerli bir fonksiyon olup örnek
uzayının elemanlarını bir gerçel sayı uzayına R  0,1 bire bir atamaktadır.
53
 uzayının bir alt uzayı A olsun Bölüm 2’de S örnek uzayında tanımlanan bir C olayının olasılığı
P(C) ile tanımlanmıştı. Şimdi A olayının olasılığı ile ilgilenilecek ve C olayı ile A olayının olasılıkları
arasındaki ilişki kurularak, Pr  X  A  ile gösterilen A olayının olasılığı belirlenmeye çalışılacaktır.
İlk olarak A olayına karşılık gelecek şekilde C olayının kümesi belirlenmelidir:
C  e : e  S ve X e  A.
Diğer bir deyişle S örnek uzayındaki C olayı, elemanları A alt uzayındaki X şans değişkenlerini veren
elemanlardan seçilmiştir. Bu nedenle;
Pr  X  A   PA   PC 
olmalıdır. Sonuç olarak, Pr  X  A  ifadesi X şans değişkenine ait R uzayının bir alt kümesi olan A alt
kümesine bir olasılık atamasıdır. Eğer P(C) bir olasılık küme fonksiyonu ise ona denk olan P(A)
fonksiyonu da Bölüm 2’de verilen olasılık küme fonksiyonuna ait üç aksiyomu sağlar. Bu nedenle
P(A)’da bir olasılık küme fonksiyonudur, bkz. Ek 3.1.
P(A) ve P(C) her ikisi de küme fonksiyonu olsalar da farklı kümeler üzerine tanımlandıkları için eşit
küme fonksiyonları değil denk küme fonksiyonudurlar.
Örnek: İki para atışı ile gerçekleştirilen bir şans denemesinin örnek uzayı;
S  e : T , T , Y , T , T , Y , Y , Y 
ele alınsın ve şans değişkeni fonksiyonu aşağıdaki gibi tanımlansın:
X e1   0, e1  TT
X e2   1, e2  YT
X e3   1, e3  TY
X e4   2, e4  YY
Şans değişkeninin tanım kümesi,
R  x : 0,1,2
olacaktır. R kümesinin bir alt kümesi A  1 alınsın. P(A) olasılığı nasıl elde edilir?
Çözüm: İlk olarak X şans değişkeninin A kümesindeki değerine sahip olan S örnek uzayındaki
elemanlar ile bir C olayı tanımlanır:
C1  e1 : TT  , C 2  e 2 : YT , C 3  e3 : TY  , C 4  e 4 : YY .
X ei   1 değeri için e 2  YT ve e3  TY olduğundan:
C  C 2 , C 3   C 2  C 3
Bu kümeye ait olasılıkların hesaplanabilmesi için S üzerine tanımlı P(.) olasılık küme fonksiyonun
belirlenmesi gereklidir:
e
TT
YT
TY
YY
P(Ci)
1/4
1/4
1/4
1/4
54
PC   PC 2  C 3   PC 2   PC 3   1 / 2
PA   Px  1  PC   1 / 2
bulunur. Sonuç olarak R üzerine tanımlı bütün ayrık Ai olayları üzerinden P(A) küme fonksiyonu da
elde edilebilir:
x
0
1
2
P(Ai)=Pr(X=x)
1/4
1/2
1/4
ya da şans değişkenine ait olasılık kütle fonksiyonu
 2  1 
Pr X  x     
 x  2 
2
xR.
tanımlanabilir. Görüldüğü üzere
Pr X  A 
 f x 
x
xA
eşitliği geçerlidir.
Kesikli bir rassal değişken olan X ele alındığında, S örnek uzayının artık bir önemi yoktur. X’in
mümkün değerleri ve bu değerlere karşılık gelen olasılık değerlerini listelemek yeterlidir. Bu bilgiyi
X’in olasılık kütle fonksiyonunda barındırmaktadır.
Tanım (Kesikli şans değişkeni): X şans değişkeni eğer X’in mümkün değerlerinin kümesi X(S)
sayılabilir ise kesikli şans değişkenidir.
Tanım (Olasılık kütle fonksiyonu): Kesikli bir şans değişkeni X’in olasılık kütle fonksiyonu
f :   0,1 şu şekilde tanımlanmıştır:
f x   P X  a  ,
 x.
(3.2)
Tanım (Olasılık kütle fonksiyonu koşulları): X şans değişkeni bir boyutlu R uzayında tanımlı olsun. R
kümesinin sayılabilir (sonlu ya da sonsuz) elemanlara sahip olduğu varsayılsın. Böyle bir R uzayı
kesikli noktaların kümesi olarak adlandırılır. Bu küme üzerinde eğer bir f(x) fonksiyonu;
1. f x   0
2.
xR .
 f x   1
(3.3)
(3.4)
R
koşullarını sağlıyor ise X kesikli bir şans değişkenidir ve f(x) ise X şans değişkeninin olasılık kütle
(mass) fonksiyonu olarak adlandırılır.
Olasılık fonksiyonu f(x), X şans değişkenine ait tüm mümkün değerleri listeler ve her bir değere bir
olasılık değeri atar. Bir olasılık kütle fonksiyonu ile X şans değişkeninin olasılık dağılımı tam olarak
belirlenebilir. Şans değişkenine ait olasılık dağılımının belirlenmesinde kullanılabilecek diğer bir
fonksiyon ise F(x) birikimli dağılım fonksiyonudur.
X kesikli şans değişkenine ait olasılık küme fonksiyonu P(A) olsun. A kümesi gerçel sayılar üzerinde
   X  x aralığında olsun. Bu şekilde tanımlanmış tüm A kümeleri için olasılık değerleri;
55
PA   Pr x  A   Pr  X  x 
şeklinde elde edilebilir. Olasılık değerlerinin x noktasına bağımlı olduğu açıktır. Diğer bir deyişle bu
olasılık x noktasının bir fonksiyonudur. Bu özelliğe sahip fonksiyonlara birikimli dağılım fonksiyonu
denir.
f x 
2 4
1 4
x
0
1
2
Şekil 3.3 Kesikli şans değişkeni olasılık fonksiyonu
Tanım (Birikimli dağılım fonksiyonu): Bir kesikli X şans değişkeninin birikimli dağılım fonksiyonu
F :   0,1 ,
F x   Pr X  x  
 f x  ,
 x
(3.5)
X x
şeklinde tanımlanır. Tanım kümesi  gerçel sayılar ve görüntü kümesi R  0,1 dir.
Şekil 3.4 Kesikli şans değişkeni birikimli dağılım fonksiyonu
Her X kesikli şans değişkeninin kendisine ait bir birikimli dağılım fonksiyonu mevcuttur. F(x)
fonksiyonu tüm x değerlerinde tanımlıdır. F(x)
fonksiyonu kesikli şans değişkenleri için x
değerlerinde sıçramalara sahiptir. Bu sıçramaların büyüklüğü Pr  X  x  olasılık değerine eşittir.
56
Belirli x değerlerindeki bu sıçramalarda F(x) fonksiyonu sürekli değildir. Bununla birlikte F(x)
tanımlıdır çünkü sıçrama noktasında fonksiyon sıçramadaki üst değeri alır. Bu özellik sağdan
süreklilik olarak bilinir. Çünkü bir noktaya sağdan yaklaşıldığında fonksiyon süreklidir. Sağdan
süreklilik kümülatif dağılım fonksiyonunun tanımının bir sonucudur. Eğer F x   Pr  X  x  olarak
tanımlansaydı, F(x) soldan sürekli olacaktı. Bir kesikli şans değişkeni için F(x) fonksiyonu
kullanılarak f(x) olasılık kütle fonksiyonu belirlenebilir.
Teorem: X kesikli şans değişkeninin tanımlı olduğu değerler; x1  x 2  x3   olsun,
f  x1   F  x1 
(3.6a)
f xi   F xi   F xi 1 
i 1
(3.6b)
eşitlikleri geçerlidir.
Teorem: F(x) fonksiyonu ancak ve ancak aşağıdaki üç şart sağlandığında kesikli bir şans değişkeninin
birikimli dağılım fonksiyonudur.
1. lim F x   0 ve lim F x   1
(3.7)
2. lim F x  h   F x 
(3.8)
x  
x 
h 0
F(x) sağdan sürekli bir fonksiyondur.
3. a  b için F a   F b 
(3.9)
F(x) fonksiyonu azalmayan bir fonksiyonudur, bkz Ek3.2.
Son özellik,
Pr a  x  b   F b   F a 
(3.10)
şeklinde oldukça kullanışlı bir ilişkiyi de tanımlamaktadır. Tanım aralığı 0,1,2, olan kesikli rassal
değişkenler için farklı bir eşitlik ise
Pa  X  b   Pa  1  X  b  1  F b  1  F a  1
şeklinde tanımlanabilir.
3.3 SÜREKLİ ŞANS DEĞİŞKENLERİ
Aralarındaki boşluklar sayılabilen değerlerden oluşmayan, aksine belli aralıklardan ya da bu
aralıkların birleşimlerinden oluşan şans değişkenleri sürekli tipteki şans değişkenleri adını almaktadır.
Bu şekilde bir şans değişkeninin göreli frekans histogramı F(x) negatif olmayan bir fonksiyondur ve
bunun grafiği ile x ekseni arasında kalan alan 1’e eşittir. Bu nedenle sürekli şans değişkenine ait bir
dağılım söz konusu olduğunda oluşum sıklıklarının çok küçük aralıklarda incelenmesi daha uygun bir
yaklaşımdır.
Sürekli şans değişkenlerinin daha iyi anlaşılabilmesi için aşağıdaki örneğin incelenmesi faydalı
olacaktır.
Yarıçapı 1 birim ve merkezi iki boyutlu uzayın başlangıç noktası olan bir dairenin iç bölgesinden bir
noktanın seçilmesi şans deneyini oluştursun. Bu uzay S ile belirtilsin. Dairenin alanı r2 eşitliğinden 
57
olarak belirlenir. Rassal seçimin sonucunda noktanın S üzerinde tanımlanan bir C kümesinden
gelmesinin olasılığı, C  S koşulu ile;
PC  
C kümesinin alanı

İlk olarak P C   0 ve PS  1 olduğu görülebilir. Eğer C1 kümesi S kümesinin birinci bölgesini
tanımlayan bir alt küme ise P C1   1 4 . Eğer C2 yarıçapı 1/3 olan ve C 2  S koşulunu sağlayan bir
daire ise P(C2)=1/9. Analitik geometriden bilindiği üzere bir noktanın, bir doğrunun ya da bir eğrinin
alanı sıfırdır. Bu nedenle bunlara ait olasılıklar da sıfır olacaktır. Örneğin C 3 kümesi C2 ile tanımlanan
dairenin sınırlarını (çemberini) tanımlıyor ise PC1   0 .
Bu rassal deneye ait şans değişkeni orijinden seçilen bir noktaya olan uzaklık olsun. Şans değişkeninin
uzayı; R  x : 0  x  1 . Her hangi bir x  R için Pr  X  x   0 olacaktır. Çünkü X  x olayı daire
üzerinde rassal olarak seçilen bir noktaya karşılık gelen olayı tanımlamaktadır. Diğer bir deyişle
orijine uzaklığı (yarıçapı) x olan bir çemberi tanımlamaktadır ki buna karşılık gelen alan sıfırdır.
Bununla birlikte X  x ile tanımlanan bir olay için olasılık araştırılabilir. Bu olayın olasılığı, x  R
koşulu ile,
Pr X  x  
x yarçaplı dairenin alanı

eşitliğinden bulunabilir. Bu olasılık X şans değişkenin birikimli dağılım fonksiyonuna karşılık
gelmektedir ve
F x   Pr X  x   x 2
0  x 1
ya da,
0

F x    x 2
1

x0
0  x 1
1 x
şeklinde tanımlanabilir.
Tanım (Birikimli dağılım fonksiyonu): Eğer X sürekli bir şans değişkeni ve f(x) onun olasılık yoğunluk
fonksiyonu ise;
F x   Pr X  x  
x
 f t dt
(3.11)

 F x   F     F x   0  F x 
eşitliği ile tanımlanan F(x) fonksiyonu X şans değişkeninin birikimli dağılım fonksiyonu olarak
adlandırılır.
Sürekli şans değişkenine ait bir birikimli dağılım fonksiyonunun temel özellikleri ile kesikli şans
değişkenine ait dağılım fonksiyonunun özellikleri hemen hemen aynıdır. Tek fark sürekli şans
değişkenine ait dağılım fonksiyonu hem sağdan hem de soldan süreklidir.
58
F x 
1
x
Şekil 3.5 Sürekli şans değişkeni birikimli dağılım fonksiyonu
Sürekli şans değişkenlerinde nokta olasılığı sıfır olduğu için, F ve f fonksiyonlarını ilişkilendiren bir
yaklaşımının tanımlanması da gereklidir. Bu yaklaşım 168 koşucunun 10 adet 100m koşu zamanlarını
ele alan örnek ile daha detaylı olarak incelenmiştir. Toplamda 1680 zaman verisi bulunmaktadır. Bu
veri setine ait farklı zaman aralıkları için oluşturulan histogramlar Şekil 3.6’da verilmiştir. Şekilden de
görüldüğü gibi, her bir histogramda çubukların uzunlukları ve aralıkların genişlikleri farklı olsa da
hepsinin şekli kabaca aynıdır. Histogramlar dağılışın şekli hakkında sezgisel olarak bilgi
sağlamaktadırlar. Buna göre; en olası zamanlar 10.2 saniye civarındadır, zamanların dağılımı soldan
uzun kuyruğa sahiptir (sola çarpıktır), 10.0 saniyenin altında ve 10.3 saniyenin üstündeki zamanların
olasılıkları düşüktür. Dağılışın şeklini görebilmek için bu histogramlardan herhangi birine eğri uyumu
yapılabilir. Fakat burada sorun histogramların standardize olmamasıdır. Aralığın genişliği her
değiştirildiğinde çubukların boyları da değişmektedir. Histogramların hepsini kapsayacak şekilde,
aralık genişliği değişse de yüksekliği değişmeyecek bir eğri ya da fonksiyon nasıl türetilebilir? Bunu
başarabilmek için standart histogramın oluşturulması gereklidir.
1680 adet koşu zamanının ele alınması yerine, koşu zamanları dağılımının ideal fonksiyonu üzerinde
durulsun. Amaç histogramdaki çubukların her bir genişliği için yüksekliğin aynı kalacağı bir eğri ya
da bir fonksiyon türetmektir. İlk yaklaşım: nisbi frekansları olasılık olarak değerlendiren bir şeklin
çizilmesidir. Bu durumda histogramdaki her bir çubuk, bir gözlemin o çubukta yer alma olasılığını
göstermektedir. Bu yaklaşım, amaca uygun değildir. Çünkü yükseklik (olasılık) hala çubuğun
genişliğine bağlıdır. Daha geniş çubuklar, daha büyük olasılık değerlerine sahiptir. İkinci yaklaşım:
çubuk genişliğine bölünmüş nisbi frekans değerlerine ait grafiğin çizilmesidir. Histogramdaki her bir
çubuğun yüksekliği bir gözlemin o çubukta yer alması olasılığının, çubuğun genişliğine oranını
göstermektedir.
59
Şekil 3.6 Koşu zamanlarına ait histogramlar
Şekil 3.7 incelendiğinde istenilen amaca ulaşıldığı görülmektedir. Tüm histogramlar için, genişliği ne
olursa olsun çubukların yükseklikleri aynıdır ve aynı eğri ile uyum yapılabilmektedir. Bu tür
histogramlar standardize histogramlardır. Uyumu yapılan eğri de olasılık yoğunluk fonksiyonu olarak
adlandırılır. Verilen bir dağılış için herhangi bir standardize histogramda uyumu yapılabilen yalnızca
bir eğri vardır. Bu eğriye olasılık yoğunluk fonksiyonu denmektedir. Sürekli bir rassal değişken olan X
için olasılık yoğunluk fonksiyonu; f(x) ile gösterilmektedir. Olasılık yoğunluk fonksiyonu kesinlikle X
şans değişkenine ait olasılıkları vermez. Örneğin koşu zamanlarına ait veriler için f x   4 elde
edilebilmektedir. Standardize histogramlarda çubuklar daraltıldıkça olasılık yoğunluk fonksiyonu
eğrisine yaklaşılmaktadır. Yaklaşımda ortaya çıkan hata aralık uzunluğu x değeri küçültülerek
azaltılır. Sonuç olarak histogramdaki sınıf sayısı n sınırsız bir şekilde artarken ve sınıf aralıklarının
uzunlukları sıfıra doğru düşerken F(x) fonksiyonunun limitinin ne olacağı önemli bir konudur. Bu
durumda F(x) adım fonksiyonunun sınırlarının gittikçe düzgünleşen bir fonksiyon olması beklenir.
Aslında olasılık yoğunluk fonksiyonu, çubukların genişliği sıfıra giderken standardize histogramın
limitine eşittir.
Herhangi bir x ile x  x aralığı için standardize histogram, bir gözlemin bu aralığa düşme
olasılığının, aralığın genişliğine oranıdır. O halde x ile x  x aralığında standardize histogramın
yüksekliği,
60
Şekil 3.7 Koşu zamanlarına ait standart histogramlar
olasilik
Px  X  x  x  F x  x   F x 


aralik genisligi
x
x
(3.12)
Burada F(x) kümülatif dağılım fonksiyonudur. Şimdi de histogram çubuğunun genişliği x sıfıra
giderken limit değeri ele alınsın. Bu limit x noktasında olasılık yoğunluk fonksiyonunu tanımlar:
 F x  x   F x 
f x   lim 

x 0 
x

Bu ifade aynı zamanda F(x)’in türevine eşittir. O halde olasılık yoğunluk fonksiyonu,
f x   F x  
dF x 
dx
(3.13)
61
olup sonuç olarak, sonsuz adet çok küçük değerin toplanmasında integral işleminden faydalanılabilir.
Örneğin uzunluğu x olan çok küçük aralıklar için x, x  x  olasılık değerinin tahmini göreli bir
standart histogram fonksiyonu kullanılarak,
x  x
 F ( x)dx
x
ya da daha genel olarak,
F x  
x
 f t dt
(3.14)

integralinden elde edilebilir. X şans değişkeninin frekans dağılımından elde edilen herhangi bir
standardize histogramın şeklini tanımlayan, değişmeyen tek bir eğridir. Olasılık yoğunluk fonksiyonu
ile, X’in dağılımının şekli elde edilebilir. Olasılık yoğunluk fonksiyonu değeri bir olasılık değildir. Her
zaman f x   0 olur. Fakat f  x   1 olmak zorunda değildir. Bu ifadedeki tam olasılık değeri f(x)
eğrisinin altında kalan alana karşılık gelir. Sonuç olarak sürekli bir X şans değişkeni için f(x) çok
küçük aralıklara ait olasılıkların belirlenmesinde kullanılsa da doğrudan doğruya bir olasılık değeri
değildir. Şans değişkeni için olasılık yoğunluğunu atayan bir fonksiyondur.
Teorem: Eğer F(x) ve f(x) fonksiyonları X şans değişkenin birikimli dağılım ve olasılık yoğunluk
fonksiyonları ise her hangi a  b şeklinde tanımlanan iki gerçel değer için:
Pr a  x  b   F b   F a  .
(3.15)
Sürekli şans değişkenlerinin birikimli dağılım fonksiyonları elde edilirken yapay değişkenin
kullanılması en doğru yaklaşımdır.
F x  
x
 f t dt

yazılmasının anlamı, f(t)’in -’dan x’e kadar toplanmasıdır.
F x  
x
 f x dx

x
yazılması yanlış ve anlamsızdır.
 f x dx
‘in anlamı f(x)’in -’dan x’e kadar toplanmasıdır. Bu

durumda x, -’dan x’e kadar nasıl değer alabilir?
Olasılık yoğunluk fonksiyonu eğrisi altında kalan toplam alanın ise

 f x dx  F    F     1  0  1

olduğu görülmektedir. Diğer bir deyişle f(x) fonksiyonu X ekseni ile grafiği arasındaki alan 1’e eşit
olan bir pozitif fonksiyondur.
62
Tanım (Olasılık yoğunluk fonksiyonu):Tanım uzayı R bir aralık ya da aralıkların birleşiminden oluşan
şans değişkeni X olsun. Bir f(x) fonksiyonu
1. f x   0
2.
xR
(3.16)
 f x dx  1
(3.17)
R
koşullarını sağlıyor ise X sürekli bir şans değişkenidir ve f(x) ise X şans değişkeninin olasılık yoğunluk
fonksiyonu olarak adlandırılır.
Sürekli bir şans değişkeni için, A  R olmak üzere, bir olasılık küme fonksiyonu P(A), olasılık
yoğunluk fonksiyonuna göre,
PA   Prx  A  
 f xdx
(3.18)
A
ifade edilebilir. Eğer f(x) sürekli bir X şans değişkeninin olasılık yoğunluk fonksiyonu ise ve tanım
uzayı üzerine belirlenen bir küme A  x  R : a  X  b ise PA   Pr x  A  ifadesi;
Pra  X  b  
b
 f x dx
(3.19)
a
olarak yazılabilir. Pr a  X  b  olasılığı; f(x)’in grafiği, x ekseni, x  a ve x  b doğruları ile
sınırlanmış alandır. Eğer A kümesi tek bir noktadan oluşuyor ise;
PA   Prx  A   Pr X  a  
a
 f x dx  0
(3.20)
a
Nokta olasılığın limit değerinde sıfır olması nedeni ile;
Pr a  X  b   Pr a  X  b   Pr a  X  b   Pr a  X  b 
(3.21)
eşitlikleri geçerlidir. Sürekli şans değişkenlerinin bu özelliğine dayanarak eğer iki olasılık yoğunluk
fonksiyonu sadece sıfır olasılığa sahip sonlu elemanlı bir küme için farklılık gösteriyor ise bu iki
olasılık küme fonksiyonunun tamamen aynı olduğu söylenebilir. Kesikli şans değişkenleri bu özelliğe
sahip değildir.
Matematik bakış açısıyla sonlu pozitif bir integrale (ya da toplama) sahip olan negatif olmayan
herhangi bir fonksiyon bir olasılık yoğunluk (ya da olasılık kütle) fonksiyonuna dönüştürülebilir.
Örneğin eğer h(x) bir A kümesi üzerinde pozitif ve diğer durumlarda sıfır değerini alan herhangi bir
negatif olmayan fonksiyon ise ve
 hx dx  K  
A
ise
f x  
1
h x 
K
(3.22)
fonksiyonu A kümesindeki değerleri alan bir X şans değişkeninin olasılık yoğunluk fonksiyonudur.
63
Eğer X sürekli tipte bir şans değişkeni ise olasılık yoğunluk fonksiyonu f(x) her sonlu aralıkta en fazla
sonlu sayıda süreksizliğe sahip olabilir. Diğer bir ifade ile süreksiz olduğu nokta sayısı sonsuz olamaz.
Buradan;
F(x) dağılım fonksiyonunun her yerde sürekli olduğu,
f(x) fonksiyonunun sürekli olduğu her noktada F(x) fonksiyonunun X şans değişkenine göre
türevinin var olduğu ve bu türevin f(x) fonksiyonuna eşit olduğu
sonucu çıkarılabilir.
Tanım: F(x) fonksiyonu bir X şans değişkeninin olasılık dağılımını tamamen belirler.
Bu tanım, (a,b), [a,b),(a,b] ve [a,b] şeklindeki tüm gerçel sayı aralıklarını içeren en küçük sigma cebiri
 ile gösterilirse, eğer Pr x  A  olasılığı sadece ’daki A olayları için geçerli ise doğrudur. Eğer
olasılıklar olayların daha büyük bir sınıfı için tanımlanmış ise iki şans değişkeninin aynı dağılım
fonksiyonuna sahip olsalar bile her olay için aynı olasılık değerine sahip olmamaları mümkündür.
Tanım: Şans değişkenleri X ve Y, AR’ deki her küme için, eğer Pr x  A   Pr  y  A  ise özdeş
dağılmışlardır.
İki şans değişkeninin özdeş dağılması onların eşit olduğu anlamına gelmez diğer bir deyişle yukarıdaki
tanım X  Y olduğunu söylemez.
Bir olasılık küme fonksiyonu P(.) kullanılarak dağılım fonksiyonu F(x) belirlenebilir. Çok kolay
olmasa da bir dağılım fonksiyonu F(x) kullanılarak bir olasılık küme fonksiyonu P(.) bulunabilir.
Sonuç olarak P(.) ve F(x) fonksiyonlarının olasılık dağılımı ile ilgili aynı bilgiyi verdikleri
söylenebilir.
3.4 KARMA ŞANS DEĞİŞKENLERİ
Bir şans değişkeni dağılımının tamamen sürekli ya da kesikli olarak tanımlanamadığı durumlarla da
karşılaşmak mümkündür. Bu özelliğe sahip şans değişkenlerinin dağılım fonksiyonları tamamen adım
fonksiyon ya da tamamen sürekli olmayıp karma bir yapı sergilerler. Eğer bir X şans değişkeninin
dağılım fonksiyonu;
F x   aFk x   1  a Fs x 
yapısında ise bu şans değişkeninin karma tipte bir şans değişkenidir. Burada 0  a  1 olup Fk(x) ve
Fs(x) sırası ile kesikli ve sürekli yapıların dağılım fonksiyonlarıdır.
Tanım: Kısmi kesikli ve kısmi mutlak sürekli olarak tanımlanan bir kümülatif dağılım fonksiyonuna
ait yoğunluk fonksiyonu eğer kümülatif dağılım:
F x   aFk x   1  a Fs x 
(3.23)
f x   af k x   1  a  f s x 
(3.24)
ise
şeklindedir. Burada fk(x), Fk(x)’nin kesikli olasılık kütle fonksiyonu, fs(x) ise Fs(x)’nin olasılık
yoğunluk fonksiyonudur.
64
Örnek: Bir sürücü trafik ışıklarında beklemeden geçme ve bekleme süreleri için model oluşturmak
istemektedir. Işıktan beklemeden geçme olasılığı Pr  X  0   0.4 olarak belirlenmiştir. Işıkta bekleme
süresi ise üstel dağılıma uymaktadır. Bu durumda;
Fk  x   1 , Fs x   1  e x , a  0.4
alınarak,

F x   0.4  0.6 1  e x

model belirlenir. Sürücünün 0.5 dakikadan az beklemesinin olasılığı,


Pr 0.5  0.4  0.6 1  e 0.5  0.636
bulunur.
3.5 ÇOK DEĞİŞKENLİ ŞANS DEĞİŞKENLERİ
Bazı şans deneyi sonuçlarında çıktı üzerinde birden fazla özellik ile ilgilenilebilir. Bu gibi durumlarda
ortaya çıkan şans değişkeni modellerine çok değişkenli dağılımlar adı verilir. En basit çok değişkenli
model iki şans değişkenini içerir. Örneğin üç adet para atıldığında ilk iki atışta gelen yazı sayısı bir
değişkeni tüm üç atışta gelen yazı sayısı ikinci değişkeni tanımlasın. Bu deneyin örnek uzayı:
S={e:e1=TTT, e2=TTY, e3=TYT, e4=YTT, e5=TYY, e6=YTY, e7=YYT, e8=YYY}
Bu örnek uzayı üzerine tanımlanmış iki şans değişkeni X1 ve X2:
X1(e1)=0
X2(e1)=0
X1(e2)=0
X2(e2)=1
X1(e3)=1
X2(e3)=1
X1(e4)=1
X2(e4)=1
X1(e5)=1
X2(e5)=2
X1(e6)=1
X2(e6)=2
X1(e7)=2
X2(e7)=2
X1(e8)=2
X2(e8)=3
olsun. Şans değişkeni fonksiyonları S örnek uzayındaki her bir elemanı gerçel değerli sıralı sayı
ikilileri uzayına;
R  x1 , x 2  : 0,0, 0,1, 1,1, 1,2, 2,2, 2,3
götürmektedir. Diğer bir deyişle bu şans değişkenlerinin uzayı iki boyutlu bir gerçel kümedir.
Tanım: Örnek uzayı S olan bir şans deneyi ele alınsın S uzayının her bir ei elemanını bir ve yalnız bir
sıralı sayı çiftine, X 1 ei   x1 , X 2 ei   x 2 , atayan şans değişkenleri X1 ve X2 olsun. X1 ve X2 şans
değişkenlerinin uzayı sıralı sayı ikililerinin kümesidir:
R  x1, , x2 : X 1 ei   x1 , X 2 ei   x2 , ei S
Amaç R uzayı üzerine tanımlanmış bir A olayının Pr x1 , x 2  A  ile ifade edilen olasılığının, S örnek
uzayında ona karşılık gelen bir C olayının,
C  ei : e1  S, X 1 ei , X 2 ei  A
65
olasılığını kullanarak,
Pr x1 , x 2  A   PC 
belirleyebilmektir. Burada P(.), S örnek uzayı üzerine tanımlı bir olasılık küme fonksiyonudur.
Pr x1 , x 2   A  ifadesinin bu olasılık küme fonksiyonu ile gösterimi,
Pr x1 , x 2  A  PA 
şeklindedir. Bu sonucun belirlenebilmesi için S örnek uzayı üzerine tanımlı P fonksiyonunun
belirlenmesi gerektiği açıktır. Konuyu açıklamak amacıyla örneğe geri dönüp R kümesi üzerinde bir A
olayı;
A  x1 , x 2  : 1,1, 1,2
tanımlansın. P(A) değerinin bulunabilmesi için A kümesindeki x1 , x2  elemanlarına karşılık gelen S
örnek uzayındaki C kümesinin elemanları belirlenmelidir:
X1(e3)=1
X2(e3)=1
X1(e5)=1
X2(e5)=2
X1(e4)=1
X2(e4)=1
X1(e6)=1
X2(e6)=2
Burada;
PA   Pr x1 , x 2  A  PC 
koşulunu sağlayan C kümesi,
C  ei : e3 , e4 , e5 , e6 
belirlenmiştir. Olasılık küme fonksiyonu P(.)’nin belirlenmesi için paranın hilesiz olduğu varsayımı ile
PY   PT   1 2 ve denemelerin birbirinden bağımsız olduğu varsayımı ile;
P ei   1 8
ve sonuç olarak;
ei
TTT
TTY
TYT
YTT
TYY
YTY
YYT
YYY
P({ei})
1/8
1/8
1/8
1/8
1/8
1/8
1/8
1/8
(x1,x2)
(0,0)
(0,1)
(1,1)
(1,2)
(2,2)
(2,3)
Pr[(x1,x2)]
1/8
1/8
2/8
2/8
1/8
1/8
ve P(A)=1/2 elde edilir.
Tanım (Ortak olasılık kütle fonksiyonu): Eğer X ve Y tanım uzayı R olan iki kesikli şans değişkeni ise
tanım aralığındaki tüm (x,y) sıralı ikilileri için ancak ve ancak,
1. f  x, y   0
2.
 x, y   R
 f x, y   1
x
(3.25)
(3.26)
y
koşullarını sağlıyor ise
f x, y   Pr  X  x, Y  y 
(3.27)
66
fonksiyonu X ve Y kesikli şans değişkenlerinin ortak olasılık kütle fonksiyonudur.
Tanım (Ortak birikimli dağılım fonksiyonu): Eğer X ve Y tanım uzayı R olan iki kesikli şans değişkeni
ise ve f(s,t) kesikli şans değişkenlerinin ortak olasılık kütle fonksiyonu ise
F x, y   PrX  x, Y  y  
 f s, t 
(3.28)
s x t  y
fonksiyonu X ve Y kesikli şans değişkenlerinin ortak birikimli dağılım fonksiyonudur.
Yukarıda kesikli şans değişkenleri için verilen fonksiyon tanımları tek değişkenli durumda açıklanan
bazı küçük farklılıklar dikkate alınarak sürekli şans değişkenleri için de verilebilir.
Tanım (Ortak olasılık yoğunluk fonksiyonu): Eğer X ve Y tanım uzayı R olan iki sürekli şans değişkeni
ise tanım aralığındaki tüm (x,y) sıralı ikilileri için ancak ve ancak,
1. f  x, y   0
2.
 x, y   R
 f x, y dxdy  1
(3.29)
(3.30)
R
koşullarını sağlıyor ise f(x,y) fonksiyonu X ve Y sürekli şans değişkenlerinin ortak olasılık yoğunluk
fonksiyonudur.
Sürekli bir şans değişkenlerine ait iki değişkenli bir veri setinin histogramı Şekil 3.8’de, İki şans
değişkenine ait ortak olasılık yoğunluk fonksiyonu grafiği ise Şekil 3.9’da gösterilmiştir.
Şekil 3.8 İki şans değişkenli histogram
Sürekli şans değişkenleri X ve Y için bir olasılık küme fonksiyonu P(A) olsun. Eğer A alt kümesi;
A  s, t  : s  x, t  y
yapısında sınırsız bir küme ise araştırılan olasılık değeri,
P A  Pr x, y  A  Pr  X  x, Y  y 
67
ile tanımlanabilir. Bu olasılık değeri (x,y) noktasının bir fonksiyonu olup bu fonksiyon X ve Y sürekli
şans değişkenlerinin ortak birikimli dağılım fonksiyonudur.
Şekil 3.9 İki şans değişkenli olasılık yoğunluk fonksiyonu grafiği
Tanım (Ortak birikimli dağılım fonksiyonu): Eğer X ve Y tanım uzayı R olan iki sürekli şans değişkeni
ise ve f(s,t) sürekli şans değişkenlerinin ortak olasılık yoğunluk fonksiyonu ise
F x, y   PrX  x, Y  y  
x y
  f s, t dsdt
(3.31)

fonksiyonu X ve Y sürekli şans değişkenlerinin ortak birikimli dağılım fonksiyonudur.
Eğer A alt kümesi;
A  x, y  : a  X  b, c  Y  d 
ise araştırılan olasılık değeri ortak olasılık yoğunluk fonksiyonu kullanılarak:
PA   Pra  X  b, c  Y  d  
b d
  f x, y dxdy
(3.32)
a c
bulunabilir. R uzayı üzerinde tanımlı bir A kümesinin olasılığı f(x,y) fonksiyonu ile bulunabileceği
gibi F(x,y) fonksiyonu ile de hesaplanabilir. Eğer PA   Pr a  X  b, c  Y  d  ise
Pr a  X  b, c  Y  d   F b, d   F b, c   F a, d   F a, c 
(3.33)
İki değişkenli sürekli dağılımlarda yoğunluk ve dağılım fonksiyonları arasındaki ilişki,
f  x, y  
 2 F  x, y 
xy
(3.34)
ile tanımlanmıştır.
İki şans değişkenli durum için elde edilen sonuçlar n adet şans değişkenli durum için genellenebilir.
Şans değişkenlerinin kesikli olması durumunda ortak olasılık kütle fonksiyonu;
f x1 ,  , x n   Pr X 1  x1 ,  , X n  x n 
(3.35)
ve ortak birikimli dağılım fonksiyonu;
68
F x1 ,  , x n   Pr X 1  x1 ,  , X n  x n 
(3.36)
olup sürekli şans değişkenleri için ise ortak birikimli dağılım fonksiyonu;
x1
xn


F x1 , , x n   
  f t ,, t dt  dt
1
n
1
(3.37)
n
ve ortak olasılık yoğunluk fonksiyonu;
f x1 ,  , x n  
 n F x1 ,  , x n 
x1  x n
(3.38)
eşitlikleri ile tanımlanmıştır.
3.6 MARJİNAL DAĞILIMLAR
Marjinal dağılımlar birden fazla şans değişkenine sahip olasılık dağılımları için söz konusudur. X ve Y
şans değişkenlerinin ortak olasılık kütle/yoğunluk fonksiyonu f(x,y) olsun. Tanımlanan iki değişkenli
dağılımda
A  x : a  X  b
olayı
ile
ilgilenilsin.
Bu
olay
ancak
ve
ancak
B  x, y  : a  X  b,  Y   olayı oluştuğunda gerçekleşebilir. Gerçekte bu iki olay birbirine
denktir ve aynı olasılığa sahiptirler. B olayının olasılığı, sürekli değişkenler için;
Pra  x  b;  y    
b 
  f x, y dydx
a 
ve kesikli değişkenler için;
Pra  x  b;  y   
b

a

 f x, y 
eşitliklerinden elde edilir. İşlem iki aşamalıdır. İlk aşamada Y şans değişkeni integral ya da toplama
işlemi ile elimine edilir:
g x  

 f x, y dy
ya da g x  

 f x, y 
y
Sadece X değişkenine bağlı olarak elde edilen g(x) fonksiyonu marjinal olasılık kütle/yoğunluk
fonksiyonu olarak adlandırılır. A olayı için araştırılan olasılık marjinal olasılık fonksiyonu kullanılarak
b
Pra  x  b  g x dx ya da Pra  x  b 

a
b
 g x 
a
hesaplanır. f(x,y) iki değişkenli dağılımda değişkenlerden sadece birinin davranışı ile ilgilenildiğinde,
marjinal dağılıma gereksinim vardır.
Tanım (Kesikli marjinal dağılımlar): X ve Y kesikli şans değişkenleri, f(x,y)’de bunların ortak olasılık
kütle fonksiyonu ise X şans değişkeninin tanım aralığındaki her x için,
g x  
 f x, y 
(3.39)
y
ile gösterilen fonksiyona X’in marjinal dağılımı
69
h y  
 f  x, y 
(3.40)
x
fonksiyonuna ise Y’nin marjinal dağılımı denir
Tanım (Sürekli marjinal dağılımlar): X ve Y sürekli şans değişkenleri, f(x,y)’de bunların ortak olasılık
yoğunluk fonksiyonu ise X şans değişkeninin tanım aralığındaki her x için,

g x  
 f x, y dy
(3.41)

ile gösterilen fonksiyona X’in marjinal dağılımı
h y  

 f x, y dx
(3.42)

fonksiyonuna ise Y’nin marjinal dağılımı denir.
Şekil 3.10 iki şans değişkenli sürekli bir dağılıma ait marjinal olasılık fonksiyonlarının grafiklerini
göstermektedir.
Şekil 3.10 İki şans değişkenli marjinal olasılık yoğunluk fonksiyonu grafiği
Marjinal dağılımların bilinmesi durumunda kümülatif marjinal dağılımlar elde edilebilir. Kesikli X
şans değişkeni için,
F x  
  f x, y    g x
 x y
(3.43)
 x
 F  x,  
sürekli X şans değişkeni için,
70
F x  
x 

f s, t dtds 
  
x
 g s ds
(3.44)

 F  x,  
eşitliklerinden elde edilebilir.
3.7 KOŞULLU DAĞILIMLAR
İlk bölümde koşullu olasılık kavramı bir örnek uzayı üzerinde tanımlı olaylar üzerinden açıklanmıştı.
Bu kavram şans değişkenleri ve onlara ait olasılık fonksiyonları ile genişletilebilir. f(x,y) iki değişkenli
dağılış olsun. Y şans değişkeninin bilinen değerleri için X şans değişeninin yoğunluğu ile ilgilenilsin.
Bu yoğunluk f(x/y) ile temsil edilir.
Rassal bir deneyde Y değişkeninin gözlendiğini fakat X değişkeninin elde edilemediği varsayılsın.
Elde edilen Y değerine karşın X şans değişkeninin a  X  b aralığında olma olasılığı
Pr a  X  b / Y  y 
olup bu olasılık kesikli şans değişkenleri için,
Pra  X  b / Y  y  
b
 f x / y 
(3.45)
a
ve sürekli şans değişkenleri için,
Pra  X  b / Y  y  
b
 f x / y dx
(3.46)
a
şeklinde hesaplanır.
Tanım (Kesikli/Sürekli şans değişkenleri için koşullu dağılım):Kesikli şans değişkenleri X ile Y’nin
ortak olasılık kütle/yoğunluk fonksiyonu f(x,y) ve Y şans değişkeninin marjinal dağılımı h(y) ise,
verilen Y  y için X şans değişkeninin koşullu dağılımı:
f x / y  
f  x, y 
h y 
h y   0
(3.47)
ve X şans değişkeninin marjinal dağılımı g(x) ise verilen X  x için Y şans değişkeninin koşullu
dağılımı,
f  y / x 
f  x, y 
g x 
g x   0
(3.48)
eşitlikleri ile tanımlanır.
İki şans değişkenli bir sürekli dağılım için koşullu dağılımın grafiği Şekil 3.11 ile gösterilmiştir.
İkiden daha fazla şans değişkeninin tanımladığı ortak dağılımlarla çalışıldığında, ister kesikli isterse
sürekli olsun, farklı yapıda koşullu dağılışlar ile karşılaşılabilir. Örneğin f(x1,x2,x3,x4) ortak olasılık
kütle/yoğunluk fonksiyonu olsun. Verilen bir X1=x1,X2=x2 ve X3=x3 için X4 değişkeninin koşullu
dağılımı:
71
f x4 / x1 , x2 , x3  
f x1 , x2 , x3 , x4 
.
g x1 , x2 , x3 
Benzer bir yaklaşımla ortak koşullu dağılımlarda tanımlanabilir. Örneğin verilen bir X1=x1 ve X2=x2
için X3 ve X4 şans değişkenlerinin koşullu ortak dağılımı:
f x3 , x4 / x1 , x2  
f x1 , x2 , x3 , x4 
.
g x1 , x2 
Şekil 3.11 İki şans değişkenli koşullu olasılık yoğunluk fonksiyonu grafiği
Teorem: X1 ve X2 sürekli şans değişkenleri olsun. f(x1,x2) ortak olasılık yoğunluk fonksiyonu ve g(x1)
ise marjinal olasılık yoğunluk fonksiyonu ise f(x2/x1) koşullu fonksiyonu sürekli bir şans değişkenine
ait olasılık yoğunluk fonksiyonudur, bkz. Ek3.3
3.8 BAĞIMSIZ ŞANS DEĞİŞKENLERİ
Eğer şartlı olasılık f(x/y), Y şans değişkenini içermiyorsa, olasılıksal anlamda, X şans değişkeni Y şans
değişkeninden bağımsızdır. Ortak olasılık yoğunluk/kütle fonksiyonları f(x,y) ve marjinal olasılık
yoğunluk/kütle fonksiyonları g(x) ve h(y) olan (kesikli ya da sürekli) şans değişkenleri X ve Y olsun.
Koşullu dağılışın özelliği kullanılarak,
f x, y   f x / y h y 
yazılabilir. Burada f(x/y) fonksiyonu Y değişkenine bağımlı değilse X şans değişkeninin marjinal
olasılık yoğunluk/kütle fonksiyonu (sürekli şans değişkeni için):
 f x, y dy   f x / y h y dy
g x   f x / y  h y dy

g x   f x / y 
(3.49)
elde edilir. Bu sonuç kullanılarak, f(x/y) fonksiyonu Y değişkenine bağımlı olmadığında,
72
f  x, y   g  x h y 
yazılabilir. Diğer bir deyişle verilen bir Y=y değeri için X şans değişkenin koşullu dağılımı Y ile ilgili
her hangi bir varsayımdan bağımsız ise f x, y   g x h y  yazılabilir.
Tanım (Bağımsız şans değişkenleri): X ve Y şans değişkenleri ancak ve ancak
f  x, y   g  x h y 
(3.50)
koşulu sağlanıyor ise birbirinden bağımsızdır. Bağımsız değiller ise bağımlıdırlar.
Teorem: Marjinal olasılık kütle/yoğunluk fonksiyonları g(x) ve h(y) olan birbirinden bağımsız iki şans
değişkeni X ve Y olsun. a, b, c, d
sabitler olmak üzere her a<b ve c<d için:
Pr a  X  b, c  Y  d   Pr a  X  b  Pr c  Y  d 
(3.51)
eşitliği geçerlidir, bkz. Ek3.4.
3.9 SEÇİMLİK KONULAR
Teorem: Ortak olasılık yoğunluk/kütle fonksiyonları f(x,y) ve marjinal olasılık yoğunluk/kütle
fonksiyonları g(x) ve h(y) olan (kesikli ya da sürekli) şans değişkenleri X ve Y olsun. X ve Y ancak ve
ancak f(x,y) fonksiyonu, sadece X değişkeninin bir fonksiyonu olan ve negatif olmayan bir fonksiyon
ile sadece Y değişkeninin bir fonksiyonu olan ve yine negatif olmayan bir fonksiyonun çarpımı olarak;
f(x,y)=u(x)v(y)
yazılabiliyor ise, X için tanım kümesi A ve Y için tanım kümesi B olmak koşulu ile iki değişkenli
dağılımın tanım kümesi R={(x,y): f(x,y)>0};
R  AB
bir Kartezyen çarpımdan elde edilmiş ise birbirinden bağımsızdır, bkz. Ek3.5.
İki şans değişkeni için elde edilen sonuçlar n adet şans değişkeni için genellenebilir.
Teorem: X1,…,Xn şans değişkenleri ancak ve ancak aşağıdaki özellikler sağlanıyor ise
F x1 ,  , x n   F x1  F x n 
(3.52)
f x1 ,  , x n   f x1  f x n 
(3.53)
birbirinden bağımsızdır.
Tanım Ampirik (Örnek) Dağılım Fonksiyonu: X 1 , X 2 ,..., X n bağımsız eş dağılımlı şans değişkenleri,
F x   Pr  X  x  de dağılım fonksiyonu olsun. Ampirik dağılım fonksiyonu
Fn x  
1
n
n
 I X
i
 x
i 1
şeklinde tanımlanmıştır. Burada I gösterge fonksiyonudur ve I  X i  x  fonksiyonu X i  x ise 1,
diğer durumlarda 0 değerini alır. Bu fonksiyon X 1 , X 2 ,..., X n noktalarına 1 n kütle atayan, kesikli bir
şans değişkeninin dağılım fonksiyonudur.
Herhangi bir ölçülebilir B kümesi için ampirik olasılık
73
Prn B  
1
n
n
 I X
i
 B
i 1
şeklinde tanımlanabilir. Örneğin sıralaması, Fn’in hesaplanmasında önemli değildir.
Örnek: 0,1,2,2,4,6,6,7 gözlemleri için ampirik dağılım fonksiyonu oluşturulsun (n =8). Her adımda
elde edilen olasılıkla, o adıma kadar elde edilen kümülatif olasılık toplanır.
Dağılım fonksiyonunun tanımı gereği,
Fn  x   0 , x < 0 için
Fn x  
1
, 0  x  1 için
8
Fn x  
2
, 1  x  2 için
8
Veri setinde iki adet 2 değeri bulunduğu için,
Fn x  
2 2 4
  , 2 x4
8 8 8
Fn x  
5
, 4  x  6 için
8
Veri setinde iki adet 6 değeri bulunduğu için,
Fn x  
5 2 7
  , 6  x  7 için
8 8 8
Son olarak,
Fn x  
7 1 8
   1 , x  7 için
8 8 8
Şekil 3.12 Ampirik (örnek) dağılım fonksiyonu grafiği
74
EK 3
Ek3.1 İspat: P(C) bir olasılık küme fonksiyonu olduğundan ve P(A)=P(C) eşitliği geçerli olduğundan;
P(C)=P(A)0
Aksiyom 1.
Eğer C kümesi yerine S kümesi alınır ise;
S={e:eS ve X(e)R} ve P(S)=P(R)=1
Aksiyom 2.
Son aksiyomu ispatlamak için R uzayı üzerine tanımlı iki ayrık olay A1 ve A2 ele alınsın. Burada;
C={e:eS ve X(e)A1A2} ya da P(C)= P(A1A2).
Bu ifade;
C={e:eS ve X(e)A1}{e:eS ve X(e)A2} ya da C= C1C2
Burada C1 ve C2 ayrık kümelerdir. Çünkü eğer her iki kümeye de ait bir ei elemanı için elde edilen
X(ei) değeri aynı olup A1 ve A2 kümeleri ayrık olduğundan hem X(ei)A1 hem de X(ei)A2
olamayacağı için sonuç olarak C1 ve C2 ayrık kümelerdir. Ayrık olaylar için aksiyom 3 kullanılarak;
P(C)= P(C1)+P(C2).
ve
P(C1)=P(A1) ve P(C2)=P(A2)
olduğundan sonuç olarak iki ayrık küme için,
P(A1A2)=P(A1)+P(A2)
Aksiyom 3
elde edilir.
Ek3.2 İspat:Son özellik (-,b] şeklindeki bir aralık iki ayrık kümenin birleşimi olarak yazılarak
ispatlanabilir:
(-,b]= (-,a](a,b]
Bu kümelere ait olasılıklar:
F(b)=F(a)+Pr(a<xb)
Aksiyom 1 ile Pr(a<xb)0 olduğundan F(a)F(b) elde edilir.
Ek3.3 İspat: f(x1,x2)0 ve g(x1)0 olduğundan.
f x 2 / x1  
2)
 f x
2
f x1 , x 2 
0.
g x1 
/ x1 dx2 
f x1 , x 2 
dx2 
 g x 
1

1
f x1 , x 2 dx2
g x1 

g x1 
g x1 
=1.
Ek3.4 İspat: X ve Y birbirinden bağımsız olduğu için, sürekli şans değişkenleri için;
b d
Pr[a  X  b, c  Y  d ] 

a c
f x, y ,dxdy 
b d
  g x h y dxdy
a c
75
b
d

  g x dx  h y dy
 a
  c



=Pr[a<X<b]Pr[c<Y<d].
Ek3.5 İspat:X ve Y birbirinden bağımsız ise marjinal olasılık fonksiyonları kullanılarak,
f(x,y)= g(x)h(y)
yazılabilir. Marjinal olasılık kütle/yoğunluk fonksiyonu oldukları için negatif olmayan fonksiyonlardır
bu nedenle koşul sağlanır. Buna karşın f(x,y)=u(x)v(y) yazılabiliyor ise:
g x   ux v y dy  ux  v y dy  c1ux 


h y   ux v y dx  v y  ux dx  c2 v y 


burada c1 ve c2 sabitlerdir. Olasılık yoğunluk fonksiyonu tanımından:
 f x, ydxdy   uxv ydxdy



1  ux dx v y dy
1  c1c 2
olmalıdır. Sonuç olarak:
f(x,y)= g(x)h(y)= u(x)v(y).
76
Download