BÖLÜM 3: FREKANS DAĞILIŞLARI ve ŞANS DEĞİŞKENLERİ Pek çok deneyde, orijinal olasılık yapısı (kümeler ya da olaylar) ile çalışmaktansa özel bir değişkenle ilgilenmek ve bu yeni değişkene ait olasılıkları belirleyebilmek işlemleri kolaylaştır. Örneğin bazı deney sonuçlarının tanımladığı örnek uzayları, bir çift paranın üst yüzüne gelen sembol gibi, S Y , Y , T , Y , Y , T , T , T , sayılarla ifade edilmemektedir. Deneyde ortaya çıkan yazı sayısı ile ilgilenildiğinde yeni bir değişken tanımlanmış olur. Farklı bir örnek olarak, bir soru için doğru ya da yanlış olup olmadığı 50 kişiye sorulduğunda ve doğru cevabı 1 yanlış cevabı 0 ile kayıt altına alındığında bu deneyin örnek uzayı 250 elemandan oluşur ve her bir eleman 50 digit uzunluğunda 1 ve 0’ların farklı sıralamalarından oluşur. Bu örnek uzayı, doğru cevabını verenlerin sayısı şeklinde bir şans değişkeni ile tanımlanarak basite indirgenebilir. Bu durumda X şans değişkeni örnek uzayı 0,1, ,50 aralığında tam sayılar kümesi olacaktır ve bu örnek uzayı ile çalışmak işlemleri daha kolaylaştıracaktır. Bu X değerinin tanımlanması ile gerçekte, orijinal örnek uzayından yeni bir örnek uzayına genellikle gerçel sayıların bir kümesine bir fonksiyon tanımlanmıştır. Bu kısımda bir S örnek uzayındaki ei elemanlarını sayılarla ifade edebilecek kuralların nasıl formülleştirileceği açıklanacaktır. Sonucunda rassal sayılar üreten birçok rassal deney mevcuttur. Örneğin; üç çocuklu ailelerdeki kız çocuğu sayısı, bir paranın 10 kere atılmasıyla ortaya çıkan tura sayısı gibi. Rassal deneyin sonucu bir sayı olduğunda, ilgilenilen bazı özelliklerin ölçümlenmesine olanak sağlar. Örneğin 1. Ortalama değerin hesaplanabilmesi 2. Deneyin çıktılarının ortalama değerden ne kadar saptığının belirlenmesi, 3. Farklı rassal değişkenler arasındaki ilişkinin belirlenebilmesi, gibi. Bu liste daha da genişletilebilir. İlk aşamada “ölçümlenen kümeler nedir?” sorusu akla gelebilir. Çünkü birçok farklı örnek uzayı mevcuttur. Bununla birlikte, S = {yazı, tura}, S = {aynı, farklı}, S = {Fenerbahçe kazanır, Galatasaray kazanır} şeklinde kategorik olarak tanımlanmış tüm bu farklı denemelere ait örnek uzayları kısaca rakamlarla ifade edilebilir: S 0,1 Problemi rassal değişkenler ile tanımlamanın iki temel amacı vardır. Bunlar: 1.Birbirinden farklı örnek uzaylarını aynı terimlerle ifade etmek. Örneğin: S 0,1, P 1 p ve P0 1 p iki mümkün sonucu olan tüm deneyleri tanımlamaktadır. 2.Ortalamaları, varyansları, ilişkileri vb için genel kurallar geliştirilmek istenen ve rassal sayılar üreten rassal deneylere isim vermek. Diğer bir ifade ile rassal modeller ile tanımlamak, şeklinde ifade edilebilir. 50 3.1 ŞANS DEĞİŞKENİ ve FREKANS DAĞILIMI KAVRAMLARI Örnek uzayından şans değişkeni kavramına geçişi açıklamak amacıyla bir madeni paranın bir kez havaya atıldığı deney ele alınsın. Bu deney için örnek uzayı S T , Y ’dır. Daha belirgin hale getirmek için tura olayına 1, yazı olayına 0 reel sayısı atanabilir. Şans değişkeni X ile gösterilen bu atama şu şekilde tarif edilebilir: T Y Y 1 0 Fonksiyonel gösterim ile, Y : S olup atama kuralı şu şekilde tanımlanmıştır: Y T 1 Y Y 0 Bir diğer örnek ise zarın iki kez atıldığı ve üst yüze gelen tura sayısıyla ilgilenildiği deney olsun. Bu deney için örnek uzayı S TT , TY , YT , YY kümesi ile gösterilir. Çıktılardan TT’ya 2, TY ve YT’ya 1 ve YY’ya 0 reel sayısı atanıyor. Bu atamanın birkaç farklı gösterimi aşağıda verilmiştir: Y şans değişkeni ile gösterilen doğrudan atama: TT YT TY YY X 2 1 1 0 Fonksiyonel gösterim ise, X : S şeklindedir ve atama kuralı şu şekilde tanımlanmıştır: X TT 2 , X TY X YT 1 , X YY 0 Doğrudan atama yerine, bir ara işlem ile sıralı ikili sayılar her bir çıktıya atanabilir. Örneğin, her bir tura için 1 ve her bir yazı için 0 atanabilir. Bu atama Y : S 2 ile gösterilir. Bu bağlamda y y1 , y 2 ’ye şans vektörü denir. Şans vektörü x’in her bir elemanı bir şans değişkenidir ve doğrudan atama TT YT TY YY Y 1,1 0,1 1,0 0,0 ile gösterilir. Şans vektöründeki Y1 ve Y2 şans değişkenleri kullanılarak yeni bir şans değişkeni, g y1 , y 2 y1 y 2 şeklinde tanımlanabilir. Yeni şans değişkeni Y1 ve Y2 şans değişkenlerinin bir fonksiyonu olarak g : 2 Tanımlanmıştır. g(y) yapısı, şans değişkeni X’ye denktir ve şu şekilde gösterilebilir: TT YT TY YY Y 1,1 0,1 1,0 0,0 g 2 1 1 0 51 Y1 şans değişkeni ilk atışta gözlenen tura sayısını, Y2 şans değişkeni ise ikinci atışta gözlenen tura sayısını temsil etmektedir. Bu iki şans değişkeninin toplamı y1 y 2 , X şans değişkenine denktir. Şans değişkeni X’in oluşturulmasının temel sebebi, incelenen deneyle ortaya çıkan olasılık uzayını, tüm mümkün çıktıları reel sayılar olan olasılık uzayı ile değiştirmektir. Bu nedenle orijinal örnek uzayı S, sayı doğrusu ile değiştirilir. Dönüşümün tamamlanabilmesi için ’nin hangi alt kümelerinin olay olarak tanımlanacağı ve bu olaylara ait olasılıkların nasıl hesaplanacağının belirlenmesi gerekir. Tanım (Şans değişkeni): Örnek uzayı S olan bir şans deneyi ele alınsın. Örnek uzayındaki her bir elemanı; ei S bir ve yalnız bir gerçel sayıya atayan X fonksiyonuna; X ei x bir şans değişkeni denir. Genellikle, X :S (3.1) ile tanımlanır. Rassal değişkenler için büyük harfler kullanılırken (X), rassal değişkenlerin aldıkları değerler küçük harflerle gösterilir (x). Şans değişkeninin tanımlanması ile aynı zamanda yeni bir örnek uzayı da (şans değişkenin tanım kümesi) tanımlanmış olur. Bu nedenle orijinal örnek uzayı üzerine tanımlanan olasılık fonksiyonunun bu şans değişkeni içinde kullanılıp kullanılamayacağı kontrol edilmelidir. Şans değişkeninin uzayı genellikle gerçel sayılar kümesidir: R x : X e x, e S Şans değişkenleri genel olarak dört sınıfta incelenir: 1.Kesikli şans değişkenleri. 2.Sürekli şans değişkenleri. 3.Karma (mixed) şans değişkenleri. 4. Çok değişkenli şans değişkenleri. Bölüme ait alt kısımlarda her bir sınıf detaylı olarak incelenmiştir. Şans değişkenine ait veriler, bir olayın ortaya çıkma sıklığı ya da tekrar sayıları olarak gösterildiğinde bu düzenlemeye frekans dağılımı denmektedir. Şans değişkeninin davranışını açıklamak için frekans dağılımı kullanılarak elde edilen formüle genel olarak ‘frekans eğrisi’ adı verilmiştir. Frekans eğrisi kullanılarak her bir şans değişkenine ait dağılış tümü ile belirlenip yorumlanabilmektedir. Bunun sonucu olarak frekans eğrisinin kullanıldığı araştırmalarda araştırmacı şans değişkenine ait örnekten elde edilen birkaç adet istatistik tahmininden daha fazlasına sahip olacaktır. Bazı dağılışlar şans değişkenin belli değerlerinin tanımladığı aralıklara düşen tekrar sayısını verirken, Şekil 3.1 bazıları ise tam değer için tekrar sayısını vermektedir, Şekil 3.2. Her hangi bir şans değişkeninin olasılık yapısını tanımlamakta kullanılan iki temel fonksiyon: 52 1.Olasılık yoğunluk/kütle fonksiyonu, f(x). 2.Birikimli dağılım fonksiyonu, F(x). şeklinde tanımlanabilir. Bu fonksiyonlar ve temel özellikleri her bir şans değişkeni yapısı için ayrı ayrı incelenecektir. Şekil 3.1 Sürekli şans değişkenleri için histogram Şekil 3.2 Kesikli şans değişkeni için çubuk grafik 3.2 KESİKLİ ŞANS DEĞİŞKENLERİ Bir paranın atıldığı basit şans deneyi ele alınsın. Bu deneye ait örnek uzayı S Y , T olup örnek uzayındaki elemanları temsil eden e elemanı Y ya da T değerini alır. Bir X fonksiyonu aşağıdaki gibi tanımlansın: X e1 0, e1 T ise, X e2 1, e2 Y ise. Tanımlanan X fonksiyonu örnek uzayı S üzerine tanımlı gerçel değerli bir fonksiyon olup örnek uzayının elemanlarını bir gerçel sayı uzayına R 0,1 bire bir atamaktadır. 53 uzayının bir alt uzayı A olsun Bölüm 2’de S örnek uzayında tanımlanan bir C olayının olasılığı P(C) ile tanımlanmıştı. Şimdi A olayının olasılığı ile ilgilenilecek ve C olayı ile A olayının olasılıkları arasındaki ilişki kurularak, Pr X A ile gösterilen A olayının olasılığı belirlenmeye çalışılacaktır. İlk olarak A olayına karşılık gelecek şekilde C olayının kümesi belirlenmelidir: C e : e S ve X e A. Diğer bir deyişle S örnek uzayındaki C olayı, elemanları A alt uzayındaki X şans değişkenlerini veren elemanlardan seçilmiştir. Bu nedenle; Pr X A PA PC olmalıdır. Sonuç olarak, Pr X A ifadesi X şans değişkenine ait R uzayının bir alt kümesi olan A alt kümesine bir olasılık atamasıdır. Eğer P(C) bir olasılık küme fonksiyonu ise ona denk olan P(A) fonksiyonu da Bölüm 2’de verilen olasılık küme fonksiyonuna ait üç aksiyomu sağlar. Bu nedenle P(A)’da bir olasılık küme fonksiyonudur, bkz. Ek 3.1. P(A) ve P(C) her ikisi de küme fonksiyonu olsalar da farklı kümeler üzerine tanımlandıkları için eşit küme fonksiyonları değil denk küme fonksiyonudurlar. Örnek: İki para atışı ile gerçekleştirilen bir şans denemesinin örnek uzayı; S e : T , T , Y , T , T , Y , Y , Y ele alınsın ve şans değişkeni fonksiyonu aşağıdaki gibi tanımlansın: X e1 0, e1 TT X e2 1, e2 YT X e3 1, e3 TY X e4 2, e4 YY Şans değişkeninin tanım kümesi, R x : 0,1,2 olacaktır. R kümesinin bir alt kümesi A 1 alınsın. P(A) olasılığı nasıl elde edilir? Çözüm: İlk olarak X şans değişkeninin A kümesindeki değerine sahip olan S örnek uzayındaki elemanlar ile bir C olayı tanımlanır: C1 e1 : TT , C 2 e 2 : YT , C 3 e3 : TY , C 4 e 4 : YY . X ei 1 değeri için e 2 YT ve e3 TY olduğundan: C C 2 , C 3 C 2 C 3 Bu kümeye ait olasılıkların hesaplanabilmesi için S üzerine tanımlı P(.) olasılık küme fonksiyonun belirlenmesi gereklidir: e TT YT TY YY P(Ci) 1/4 1/4 1/4 1/4 54 PC PC 2 C 3 PC 2 PC 3 1 / 2 PA Px 1 PC 1 / 2 bulunur. Sonuç olarak R üzerine tanımlı bütün ayrık Ai olayları üzerinden P(A) küme fonksiyonu da elde edilebilir: x 0 1 2 P(Ai)=Pr(X=x) 1/4 1/2 1/4 ya da şans değişkenine ait olasılık kütle fonksiyonu 2 1 Pr X x x 2 2 xR. tanımlanabilir. Görüldüğü üzere Pr X A f x x xA eşitliği geçerlidir. Kesikli bir rassal değişken olan X ele alındığında, S örnek uzayının artık bir önemi yoktur. X’in mümkün değerleri ve bu değerlere karşılık gelen olasılık değerlerini listelemek yeterlidir. Bu bilgiyi X’in olasılık kütle fonksiyonunda barındırmaktadır. Tanım (Kesikli şans değişkeni): X şans değişkeni eğer X’in mümkün değerlerinin kümesi X(S) sayılabilir ise kesikli şans değişkenidir. Tanım (Olasılık kütle fonksiyonu): Kesikli bir şans değişkeni X’in olasılık kütle fonksiyonu f : 0,1 şu şekilde tanımlanmıştır: f x P X a , x. (3.2) Tanım (Olasılık kütle fonksiyonu koşulları): X şans değişkeni bir boyutlu R uzayında tanımlı olsun. R kümesinin sayılabilir (sonlu ya da sonsuz) elemanlara sahip olduğu varsayılsın. Böyle bir R uzayı kesikli noktaların kümesi olarak adlandırılır. Bu küme üzerinde eğer bir f(x) fonksiyonu; 1. f x 0 2. xR . f x 1 (3.3) (3.4) R koşullarını sağlıyor ise X kesikli bir şans değişkenidir ve f(x) ise X şans değişkeninin olasılık kütle (mass) fonksiyonu olarak adlandırılır. Olasılık fonksiyonu f(x), X şans değişkenine ait tüm mümkün değerleri listeler ve her bir değere bir olasılık değeri atar. Bir olasılık kütle fonksiyonu ile X şans değişkeninin olasılık dağılımı tam olarak belirlenebilir. Şans değişkenine ait olasılık dağılımının belirlenmesinde kullanılabilecek diğer bir fonksiyon ise F(x) birikimli dağılım fonksiyonudur. X kesikli şans değişkenine ait olasılık küme fonksiyonu P(A) olsun. A kümesi gerçel sayılar üzerinde X x aralığında olsun. Bu şekilde tanımlanmış tüm A kümeleri için olasılık değerleri; 55 PA Pr x A Pr X x şeklinde elde edilebilir. Olasılık değerlerinin x noktasına bağımlı olduğu açıktır. Diğer bir deyişle bu olasılık x noktasının bir fonksiyonudur. Bu özelliğe sahip fonksiyonlara birikimli dağılım fonksiyonu denir. f x 2 4 1 4 x 0 1 2 Şekil 3.3 Kesikli şans değişkeni olasılık fonksiyonu Tanım (Birikimli dağılım fonksiyonu): Bir kesikli X şans değişkeninin birikimli dağılım fonksiyonu F : 0,1 , F x Pr X x f x , x (3.5) X x şeklinde tanımlanır. Tanım kümesi gerçel sayılar ve görüntü kümesi R 0,1 dir. Şekil 3.4 Kesikli şans değişkeni birikimli dağılım fonksiyonu Her X kesikli şans değişkeninin kendisine ait bir birikimli dağılım fonksiyonu mevcuttur. F(x) fonksiyonu tüm x değerlerinde tanımlıdır. F(x) fonksiyonu kesikli şans değişkenleri için x değerlerinde sıçramalara sahiptir. Bu sıçramaların büyüklüğü Pr X x olasılık değerine eşittir. 56 Belirli x değerlerindeki bu sıçramalarda F(x) fonksiyonu sürekli değildir. Bununla birlikte F(x) tanımlıdır çünkü sıçrama noktasında fonksiyon sıçramadaki üst değeri alır. Bu özellik sağdan süreklilik olarak bilinir. Çünkü bir noktaya sağdan yaklaşıldığında fonksiyon süreklidir. Sağdan süreklilik kümülatif dağılım fonksiyonunun tanımının bir sonucudur. Eğer F x Pr X x olarak tanımlansaydı, F(x) soldan sürekli olacaktı. Bir kesikli şans değişkeni için F(x) fonksiyonu kullanılarak f(x) olasılık kütle fonksiyonu belirlenebilir. Teorem: X kesikli şans değişkeninin tanımlı olduğu değerler; x1 x 2 x3 olsun, f x1 F x1 (3.6a) f xi F xi F xi 1 i 1 (3.6b) eşitlikleri geçerlidir. Teorem: F(x) fonksiyonu ancak ve ancak aşağıdaki üç şart sağlandığında kesikli bir şans değişkeninin birikimli dağılım fonksiyonudur. 1. lim F x 0 ve lim F x 1 (3.7) 2. lim F x h F x (3.8) x x h 0 F(x) sağdan sürekli bir fonksiyondur. 3. a b için F a F b (3.9) F(x) fonksiyonu azalmayan bir fonksiyonudur, bkz Ek3.2. Son özellik, Pr a x b F b F a (3.10) şeklinde oldukça kullanışlı bir ilişkiyi de tanımlamaktadır. Tanım aralığı 0,1,2, olan kesikli rassal değişkenler için farklı bir eşitlik ise Pa X b Pa 1 X b 1 F b 1 F a 1 şeklinde tanımlanabilir. 3.3 SÜREKLİ ŞANS DEĞİŞKENLERİ Aralarındaki boşluklar sayılabilen değerlerden oluşmayan, aksine belli aralıklardan ya da bu aralıkların birleşimlerinden oluşan şans değişkenleri sürekli tipteki şans değişkenleri adını almaktadır. Bu şekilde bir şans değişkeninin göreli frekans histogramı F(x) negatif olmayan bir fonksiyondur ve bunun grafiği ile x ekseni arasında kalan alan 1’e eşittir. Bu nedenle sürekli şans değişkenine ait bir dağılım söz konusu olduğunda oluşum sıklıklarının çok küçük aralıklarda incelenmesi daha uygun bir yaklaşımdır. Sürekli şans değişkenlerinin daha iyi anlaşılabilmesi için aşağıdaki örneğin incelenmesi faydalı olacaktır. Yarıçapı 1 birim ve merkezi iki boyutlu uzayın başlangıç noktası olan bir dairenin iç bölgesinden bir noktanın seçilmesi şans deneyini oluştursun. Bu uzay S ile belirtilsin. Dairenin alanı r2 eşitliğinden 57 olarak belirlenir. Rassal seçimin sonucunda noktanın S üzerinde tanımlanan bir C kümesinden gelmesinin olasılığı, C S koşulu ile; PC C kümesinin alanı İlk olarak P C 0 ve PS 1 olduğu görülebilir. Eğer C1 kümesi S kümesinin birinci bölgesini tanımlayan bir alt küme ise P C1 1 4 . Eğer C2 yarıçapı 1/3 olan ve C 2 S koşulunu sağlayan bir daire ise P(C2)=1/9. Analitik geometriden bilindiği üzere bir noktanın, bir doğrunun ya da bir eğrinin alanı sıfırdır. Bu nedenle bunlara ait olasılıklar da sıfır olacaktır. Örneğin C 3 kümesi C2 ile tanımlanan dairenin sınırlarını (çemberini) tanımlıyor ise PC1 0 . Bu rassal deneye ait şans değişkeni orijinden seçilen bir noktaya olan uzaklık olsun. Şans değişkeninin uzayı; R x : 0 x 1 . Her hangi bir x R için Pr X x 0 olacaktır. Çünkü X x olayı daire üzerinde rassal olarak seçilen bir noktaya karşılık gelen olayı tanımlamaktadır. Diğer bir deyişle orijine uzaklığı (yarıçapı) x olan bir çemberi tanımlamaktadır ki buna karşılık gelen alan sıfırdır. Bununla birlikte X x ile tanımlanan bir olay için olasılık araştırılabilir. Bu olayın olasılığı, x R koşulu ile, Pr X x x yarçaplı dairenin alanı eşitliğinden bulunabilir. Bu olasılık X şans değişkenin birikimli dağılım fonksiyonuna karşılık gelmektedir ve F x Pr X x x 2 0 x 1 ya da, 0 F x x 2 1 x0 0 x 1 1 x şeklinde tanımlanabilir. Tanım (Birikimli dağılım fonksiyonu): Eğer X sürekli bir şans değişkeni ve f(x) onun olasılık yoğunluk fonksiyonu ise; F x Pr X x x f t dt (3.11) F x F F x 0 F x eşitliği ile tanımlanan F(x) fonksiyonu X şans değişkeninin birikimli dağılım fonksiyonu olarak adlandırılır. Sürekli şans değişkenine ait bir birikimli dağılım fonksiyonunun temel özellikleri ile kesikli şans değişkenine ait dağılım fonksiyonunun özellikleri hemen hemen aynıdır. Tek fark sürekli şans değişkenine ait dağılım fonksiyonu hem sağdan hem de soldan süreklidir. 58 F x 1 x Şekil 3.5 Sürekli şans değişkeni birikimli dağılım fonksiyonu Sürekli şans değişkenlerinde nokta olasılığı sıfır olduğu için, F ve f fonksiyonlarını ilişkilendiren bir yaklaşımının tanımlanması da gereklidir. Bu yaklaşım 168 koşucunun 10 adet 100m koşu zamanlarını ele alan örnek ile daha detaylı olarak incelenmiştir. Toplamda 1680 zaman verisi bulunmaktadır. Bu veri setine ait farklı zaman aralıkları için oluşturulan histogramlar Şekil 3.6’da verilmiştir. Şekilden de görüldüğü gibi, her bir histogramda çubukların uzunlukları ve aralıkların genişlikleri farklı olsa da hepsinin şekli kabaca aynıdır. Histogramlar dağılışın şekli hakkında sezgisel olarak bilgi sağlamaktadırlar. Buna göre; en olası zamanlar 10.2 saniye civarındadır, zamanların dağılımı soldan uzun kuyruğa sahiptir (sola çarpıktır), 10.0 saniyenin altında ve 10.3 saniyenin üstündeki zamanların olasılıkları düşüktür. Dağılışın şeklini görebilmek için bu histogramlardan herhangi birine eğri uyumu yapılabilir. Fakat burada sorun histogramların standardize olmamasıdır. Aralığın genişliği her değiştirildiğinde çubukların boyları da değişmektedir. Histogramların hepsini kapsayacak şekilde, aralık genişliği değişse de yüksekliği değişmeyecek bir eğri ya da fonksiyon nasıl türetilebilir? Bunu başarabilmek için standart histogramın oluşturulması gereklidir. 1680 adet koşu zamanının ele alınması yerine, koşu zamanları dağılımının ideal fonksiyonu üzerinde durulsun. Amaç histogramdaki çubukların her bir genişliği için yüksekliğin aynı kalacağı bir eğri ya da bir fonksiyon türetmektir. İlk yaklaşım: nisbi frekansları olasılık olarak değerlendiren bir şeklin çizilmesidir. Bu durumda histogramdaki her bir çubuk, bir gözlemin o çubukta yer alma olasılığını göstermektedir. Bu yaklaşım, amaca uygun değildir. Çünkü yükseklik (olasılık) hala çubuğun genişliğine bağlıdır. Daha geniş çubuklar, daha büyük olasılık değerlerine sahiptir. İkinci yaklaşım: çubuk genişliğine bölünmüş nisbi frekans değerlerine ait grafiğin çizilmesidir. Histogramdaki her bir çubuğun yüksekliği bir gözlemin o çubukta yer alması olasılığının, çubuğun genişliğine oranını göstermektedir. 59 Şekil 3.6 Koşu zamanlarına ait histogramlar Şekil 3.7 incelendiğinde istenilen amaca ulaşıldığı görülmektedir. Tüm histogramlar için, genişliği ne olursa olsun çubukların yükseklikleri aynıdır ve aynı eğri ile uyum yapılabilmektedir. Bu tür histogramlar standardize histogramlardır. Uyumu yapılan eğri de olasılık yoğunluk fonksiyonu olarak adlandırılır. Verilen bir dağılış için herhangi bir standardize histogramda uyumu yapılabilen yalnızca bir eğri vardır. Bu eğriye olasılık yoğunluk fonksiyonu denmektedir. Sürekli bir rassal değişken olan X için olasılık yoğunluk fonksiyonu; f(x) ile gösterilmektedir. Olasılık yoğunluk fonksiyonu kesinlikle X şans değişkenine ait olasılıkları vermez. Örneğin koşu zamanlarına ait veriler için f x 4 elde edilebilmektedir. Standardize histogramlarda çubuklar daraltıldıkça olasılık yoğunluk fonksiyonu eğrisine yaklaşılmaktadır. Yaklaşımda ortaya çıkan hata aralık uzunluğu x değeri küçültülerek azaltılır. Sonuç olarak histogramdaki sınıf sayısı n sınırsız bir şekilde artarken ve sınıf aralıklarının uzunlukları sıfıra doğru düşerken F(x) fonksiyonunun limitinin ne olacağı önemli bir konudur. Bu durumda F(x) adım fonksiyonunun sınırlarının gittikçe düzgünleşen bir fonksiyon olması beklenir. Aslında olasılık yoğunluk fonksiyonu, çubukların genişliği sıfıra giderken standardize histogramın limitine eşittir. Herhangi bir x ile x x aralığı için standardize histogram, bir gözlemin bu aralığa düşme olasılığının, aralığın genişliğine oranıdır. O halde x ile x x aralığında standardize histogramın yüksekliği, 60 Şekil 3.7 Koşu zamanlarına ait standart histogramlar olasilik Px X x x F x x F x aralik genisligi x x (3.12) Burada F(x) kümülatif dağılım fonksiyonudur. Şimdi de histogram çubuğunun genişliği x sıfıra giderken limit değeri ele alınsın. Bu limit x noktasında olasılık yoğunluk fonksiyonunu tanımlar: F x x F x f x lim x 0 x Bu ifade aynı zamanda F(x)’in türevine eşittir. O halde olasılık yoğunluk fonksiyonu, f x F x dF x dx (3.13) 61 olup sonuç olarak, sonsuz adet çok küçük değerin toplanmasında integral işleminden faydalanılabilir. Örneğin uzunluğu x olan çok küçük aralıklar için x, x x olasılık değerinin tahmini göreli bir standart histogram fonksiyonu kullanılarak, x x F ( x)dx x ya da daha genel olarak, F x x f t dt (3.14) integralinden elde edilebilir. X şans değişkeninin frekans dağılımından elde edilen herhangi bir standardize histogramın şeklini tanımlayan, değişmeyen tek bir eğridir. Olasılık yoğunluk fonksiyonu ile, X’in dağılımının şekli elde edilebilir. Olasılık yoğunluk fonksiyonu değeri bir olasılık değildir. Her zaman f x 0 olur. Fakat f x 1 olmak zorunda değildir. Bu ifadedeki tam olasılık değeri f(x) eğrisinin altında kalan alana karşılık gelir. Sonuç olarak sürekli bir X şans değişkeni için f(x) çok küçük aralıklara ait olasılıkların belirlenmesinde kullanılsa da doğrudan doğruya bir olasılık değeri değildir. Şans değişkeni için olasılık yoğunluğunu atayan bir fonksiyondur. Teorem: Eğer F(x) ve f(x) fonksiyonları X şans değişkenin birikimli dağılım ve olasılık yoğunluk fonksiyonları ise her hangi a b şeklinde tanımlanan iki gerçel değer için: Pr a x b F b F a . (3.15) Sürekli şans değişkenlerinin birikimli dağılım fonksiyonları elde edilirken yapay değişkenin kullanılması en doğru yaklaşımdır. F x x f t dt yazılmasının anlamı, f(t)’in -’dan x’e kadar toplanmasıdır. F x x f x dx x yazılması yanlış ve anlamsızdır. f x dx ‘in anlamı f(x)’in -’dan x’e kadar toplanmasıdır. Bu durumda x, -’dan x’e kadar nasıl değer alabilir? Olasılık yoğunluk fonksiyonu eğrisi altında kalan toplam alanın ise f x dx F F 1 0 1 olduğu görülmektedir. Diğer bir deyişle f(x) fonksiyonu X ekseni ile grafiği arasındaki alan 1’e eşit olan bir pozitif fonksiyondur. 62 Tanım (Olasılık yoğunluk fonksiyonu):Tanım uzayı R bir aralık ya da aralıkların birleşiminden oluşan şans değişkeni X olsun. Bir f(x) fonksiyonu 1. f x 0 2. xR (3.16) f x dx 1 (3.17) R koşullarını sağlıyor ise X sürekli bir şans değişkenidir ve f(x) ise X şans değişkeninin olasılık yoğunluk fonksiyonu olarak adlandırılır. Sürekli bir şans değişkeni için, A R olmak üzere, bir olasılık küme fonksiyonu P(A), olasılık yoğunluk fonksiyonuna göre, PA Prx A f xdx (3.18) A ifade edilebilir. Eğer f(x) sürekli bir X şans değişkeninin olasılık yoğunluk fonksiyonu ise ve tanım uzayı üzerine belirlenen bir küme A x R : a X b ise PA Pr x A ifadesi; Pra X b b f x dx (3.19) a olarak yazılabilir. Pr a X b olasılığı; f(x)’in grafiği, x ekseni, x a ve x b doğruları ile sınırlanmış alandır. Eğer A kümesi tek bir noktadan oluşuyor ise; PA Prx A Pr X a a f x dx 0 (3.20) a Nokta olasılığın limit değerinde sıfır olması nedeni ile; Pr a X b Pr a X b Pr a X b Pr a X b (3.21) eşitlikleri geçerlidir. Sürekli şans değişkenlerinin bu özelliğine dayanarak eğer iki olasılık yoğunluk fonksiyonu sadece sıfır olasılığa sahip sonlu elemanlı bir küme için farklılık gösteriyor ise bu iki olasılık küme fonksiyonunun tamamen aynı olduğu söylenebilir. Kesikli şans değişkenleri bu özelliğe sahip değildir. Matematik bakış açısıyla sonlu pozitif bir integrale (ya da toplama) sahip olan negatif olmayan herhangi bir fonksiyon bir olasılık yoğunluk (ya da olasılık kütle) fonksiyonuna dönüştürülebilir. Örneğin eğer h(x) bir A kümesi üzerinde pozitif ve diğer durumlarda sıfır değerini alan herhangi bir negatif olmayan fonksiyon ise ve hx dx K A ise f x 1 h x K (3.22) fonksiyonu A kümesindeki değerleri alan bir X şans değişkeninin olasılık yoğunluk fonksiyonudur. 63 Eğer X sürekli tipte bir şans değişkeni ise olasılık yoğunluk fonksiyonu f(x) her sonlu aralıkta en fazla sonlu sayıda süreksizliğe sahip olabilir. Diğer bir ifade ile süreksiz olduğu nokta sayısı sonsuz olamaz. Buradan; F(x) dağılım fonksiyonunun her yerde sürekli olduğu, f(x) fonksiyonunun sürekli olduğu her noktada F(x) fonksiyonunun X şans değişkenine göre türevinin var olduğu ve bu türevin f(x) fonksiyonuna eşit olduğu sonucu çıkarılabilir. Tanım: F(x) fonksiyonu bir X şans değişkeninin olasılık dağılımını tamamen belirler. Bu tanım, (a,b), [a,b),(a,b] ve [a,b] şeklindeki tüm gerçel sayı aralıklarını içeren en küçük sigma cebiri ile gösterilirse, eğer Pr x A olasılığı sadece ’daki A olayları için geçerli ise doğrudur. Eğer olasılıklar olayların daha büyük bir sınıfı için tanımlanmış ise iki şans değişkeninin aynı dağılım fonksiyonuna sahip olsalar bile her olay için aynı olasılık değerine sahip olmamaları mümkündür. Tanım: Şans değişkenleri X ve Y, AR’ deki her küme için, eğer Pr x A Pr y A ise özdeş dağılmışlardır. İki şans değişkeninin özdeş dağılması onların eşit olduğu anlamına gelmez diğer bir deyişle yukarıdaki tanım X Y olduğunu söylemez. Bir olasılık küme fonksiyonu P(.) kullanılarak dağılım fonksiyonu F(x) belirlenebilir. Çok kolay olmasa da bir dağılım fonksiyonu F(x) kullanılarak bir olasılık küme fonksiyonu P(.) bulunabilir. Sonuç olarak P(.) ve F(x) fonksiyonlarının olasılık dağılımı ile ilgili aynı bilgiyi verdikleri söylenebilir. 3.4 KARMA ŞANS DEĞİŞKENLERİ Bir şans değişkeni dağılımının tamamen sürekli ya da kesikli olarak tanımlanamadığı durumlarla da karşılaşmak mümkündür. Bu özelliğe sahip şans değişkenlerinin dağılım fonksiyonları tamamen adım fonksiyon ya da tamamen sürekli olmayıp karma bir yapı sergilerler. Eğer bir X şans değişkeninin dağılım fonksiyonu; F x aFk x 1 a Fs x yapısında ise bu şans değişkeninin karma tipte bir şans değişkenidir. Burada 0 a 1 olup Fk(x) ve Fs(x) sırası ile kesikli ve sürekli yapıların dağılım fonksiyonlarıdır. Tanım: Kısmi kesikli ve kısmi mutlak sürekli olarak tanımlanan bir kümülatif dağılım fonksiyonuna ait yoğunluk fonksiyonu eğer kümülatif dağılım: F x aFk x 1 a Fs x (3.23) f x af k x 1 a f s x (3.24) ise şeklindedir. Burada fk(x), Fk(x)’nin kesikli olasılık kütle fonksiyonu, fs(x) ise Fs(x)’nin olasılık yoğunluk fonksiyonudur. 64 Örnek: Bir sürücü trafik ışıklarında beklemeden geçme ve bekleme süreleri için model oluşturmak istemektedir. Işıktan beklemeden geçme olasılığı Pr X 0 0.4 olarak belirlenmiştir. Işıkta bekleme süresi ise üstel dağılıma uymaktadır. Bu durumda; Fk x 1 , Fs x 1 e x , a 0.4 alınarak, F x 0.4 0.6 1 e x model belirlenir. Sürücünün 0.5 dakikadan az beklemesinin olasılığı, Pr 0.5 0.4 0.6 1 e 0.5 0.636 bulunur. 3.5 ÇOK DEĞİŞKENLİ ŞANS DEĞİŞKENLERİ Bazı şans deneyi sonuçlarında çıktı üzerinde birden fazla özellik ile ilgilenilebilir. Bu gibi durumlarda ortaya çıkan şans değişkeni modellerine çok değişkenli dağılımlar adı verilir. En basit çok değişkenli model iki şans değişkenini içerir. Örneğin üç adet para atıldığında ilk iki atışta gelen yazı sayısı bir değişkeni tüm üç atışta gelen yazı sayısı ikinci değişkeni tanımlasın. Bu deneyin örnek uzayı: S={e:e1=TTT, e2=TTY, e3=TYT, e4=YTT, e5=TYY, e6=YTY, e7=YYT, e8=YYY} Bu örnek uzayı üzerine tanımlanmış iki şans değişkeni X1 ve X2: X1(e1)=0 X2(e1)=0 X1(e2)=0 X2(e2)=1 X1(e3)=1 X2(e3)=1 X1(e4)=1 X2(e4)=1 X1(e5)=1 X2(e5)=2 X1(e6)=1 X2(e6)=2 X1(e7)=2 X2(e7)=2 X1(e8)=2 X2(e8)=3 olsun. Şans değişkeni fonksiyonları S örnek uzayındaki her bir elemanı gerçel değerli sıralı sayı ikilileri uzayına; R x1 , x 2 : 0,0, 0,1, 1,1, 1,2, 2,2, 2,3 götürmektedir. Diğer bir deyişle bu şans değişkenlerinin uzayı iki boyutlu bir gerçel kümedir. Tanım: Örnek uzayı S olan bir şans deneyi ele alınsın S uzayının her bir ei elemanını bir ve yalnız bir sıralı sayı çiftine, X 1 ei x1 , X 2 ei x 2 , atayan şans değişkenleri X1 ve X2 olsun. X1 ve X2 şans değişkenlerinin uzayı sıralı sayı ikililerinin kümesidir: R x1, , x2 : X 1 ei x1 , X 2 ei x2 , ei S Amaç R uzayı üzerine tanımlanmış bir A olayının Pr x1 , x 2 A ile ifade edilen olasılığının, S örnek uzayında ona karşılık gelen bir C olayının, C ei : e1 S, X 1 ei , X 2 ei A 65 olasılığını kullanarak, Pr x1 , x 2 A PC belirleyebilmektir. Burada P(.), S örnek uzayı üzerine tanımlı bir olasılık küme fonksiyonudur. Pr x1 , x 2 A ifadesinin bu olasılık küme fonksiyonu ile gösterimi, Pr x1 , x 2 A PA şeklindedir. Bu sonucun belirlenebilmesi için S örnek uzayı üzerine tanımlı P fonksiyonunun belirlenmesi gerektiği açıktır. Konuyu açıklamak amacıyla örneğe geri dönüp R kümesi üzerinde bir A olayı; A x1 , x 2 : 1,1, 1,2 tanımlansın. P(A) değerinin bulunabilmesi için A kümesindeki x1 , x2 elemanlarına karşılık gelen S örnek uzayındaki C kümesinin elemanları belirlenmelidir: X1(e3)=1 X2(e3)=1 X1(e5)=1 X2(e5)=2 X1(e4)=1 X2(e4)=1 X1(e6)=1 X2(e6)=2 Burada; PA Pr x1 , x 2 A PC koşulunu sağlayan C kümesi, C ei : e3 , e4 , e5 , e6 belirlenmiştir. Olasılık küme fonksiyonu P(.)’nin belirlenmesi için paranın hilesiz olduğu varsayımı ile PY PT 1 2 ve denemelerin birbirinden bağımsız olduğu varsayımı ile; P ei 1 8 ve sonuç olarak; ei TTT TTY TYT YTT TYY YTY YYT YYY P({ei}) 1/8 1/8 1/8 1/8 1/8 1/8 1/8 1/8 (x1,x2) (0,0) (0,1) (1,1) (1,2) (2,2) (2,3) Pr[(x1,x2)] 1/8 1/8 2/8 2/8 1/8 1/8 ve P(A)=1/2 elde edilir. Tanım (Ortak olasılık kütle fonksiyonu): Eğer X ve Y tanım uzayı R olan iki kesikli şans değişkeni ise tanım aralığındaki tüm (x,y) sıralı ikilileri için ancak ve ancak, 1. f x, y 0 2. x, y R f x, y 1 x (3.25) (3.26) y koşullarını sağlıyor ise f x, y Pr X x, Y y (3.27) 66 fonksiyonu X ve Y kesikli şans değişkenlerinin ortak olasılık kütle fonksiyonudur. Tanım (Ortak birikimli dağılım fonksiyonu): Eğer X ve Y tanım uzayı R olan iki kesikli şans değişkeni ise ve f(s,t) kesikli şans değişkenlerinin ortak olasılık kütle fonksiyonu ise F x, y PrX x, Y y f s, t (3.28) s x t y fonksiyonu X ve Y kesikli şans değişkenlerinin ortak birikimli dağılım fonksiyonudur. Yukarıda kesikli şans değişkenleri için verilen fonksiyon tanımları tek değişkenli durumda açıklanan bazı küçük farklılıklar dikkate alınarak sürekli şans değişkenleri için de verilebilir. Tanım (Ortak olasılık yoğunluk fonksiyonu): Eğer X ve Y tanım uzayı R olan iki sürekli şans değişkeni ise tanım aralığındaki tüm (x,y) sıralı ikilileri için ancak ve ancak, 1. f x, y 0 2. x, y R f x, y dxdy 1 (3.29) (3.30) R koşullarını sağlıyor ise f(x,y) fonksiyonu X ve Y sürekli şans değişkenlerinin ortak olasılık yoğunluk fonksiyonudur. Sürekli bir şans değişkenlerine ait iki değişkenli bir veri setinin histogramı Şekil 3.8’de, İki şans değişkenine ait ortak olasılık yoğunluk fonksiyonu grafiği ise Şekil 3.9’da gösterilmiştir. Şekil 3.8 İki şans değişkenli histogram Sürekli şans değişkenleri X ve Y için bir olasılık küme fonksiyonu P(A) olsun. Eğer A alt kümesi; A s, t : s x, t y yapısında sınırsız bir küme ise araştırılan olasılık değeri, P A Pr x, y A Pr X x, Y y 67 ile tanımlanabilir. Bu olasılık değeri (x,y) noktasının bir fonksiyonu olup bu fonksiyon X ve Y sürekli şans değişkenlerinin ortak birikimli dağılım fonksiyonudur. Şekil 3.9 İki şans değişkenli olasılık yoğunluk fonksiyonu grafiği Tanım (Ortak birikimli dağılım fonksiyonu): Eğer X ve Y tanım uzayı R olan iki sürekli şans değişkeni ise ve f(s,t) sürekli şans değişkenlerinin ortak olasılık yoğunluk fonksiyonu ise F x, y PrX x, Y y x y f s, t dsdt (3.31) fonksiyonu X ve Y sürekli şans değişkenlerinin ortak birikimli dağılım fonksiyonudur. Eğer A alt kümesi; A x, y : a X b, c Y d ise araştırılan olasılık değeri ortak olasılık yoğunluk fonksiyonu kullanılarak: PA Pra X b, c Y d b d f x, y dxdy (3.32) a c bulunabilir. R uzayı üzerinde tanımlı bir A kümesinin olasılığı f(x,y) fonksiyonu ile bulunabileceği gibi F(x,y) fonksiyonu ile de hesaplanabilir. Eğer PA Pr a X b, c Y d ise Pr a X b, c Y d F b, d F b, c F a, d F a, c (3.33) İki değişkenli sürekli dağılımlarda yoğunluk ve dağılım fonksiyonları arasındaki ilişki, f x, y 2 F x, y xy (3.34) ile tanımlanmıştır. İki şans değişkenli durum için elde edilen sonuçlar n adet şans değişkenli durum için genellenebilir. Şans değişkenlerinin kesikli olması durumunda ortak olasılık kütle fonksiyonu; f x1 , , x n Pr X 1 x1 , , X n x n (3.35) ve ortak birikimli dağılım fonksiyonu; 68 F x1 , , x n Pr X 1 x1 , , X n x n (3.36) olup sürekli şans değişkenleri için ise ortak birikimli dağılım fonksiyonu; x1 xn F x1 , , x n f t ,, t dt dt 1 n 1 (3.37) n ve ortak olasılık yoğunluk fonksiyonu; f x1 , , x n n F x1 , , x n x1 x n (3.38) eşitlikleri ile tanımlanmıştır. 3.6 MARJİNAL DAĞILIMLAR Marjinal dağılımlar birden fazla şans değişkenine sahip olasılık dağılımları için söz konusudur. X ve Y şans değişkenlerinin ortak olasılık kütle/yoğunluk fonksiyonu f(x,y) olsun. Tanımlanan iki değişkenli dağılımda A x : a X b olayı ile ilgilenilsin. Bu olay ancak ve ancak B x, y : a X b, Y olayı oluştuğunda gerçekleşebilir. Gerçekte bu iki olay birbirine denktir ve aynı olasılığa sahiptirler. B olayının olasılığı, sürekli değişkenler için; Pra x b; y b f x, y dydx a ve kesikli değişkenler için; Pra x b; y b a f x, y eşitliklerinden elde edilir. İşlem iki aşamalıdır. İlk aşamada Y şans değişkeni integral ya da toplama işlemi ile elimine edilir: g x f x, y dy ya da g x f x, y y Sadece X değişkenine bağlı olarak elde edilen g(x) fonksiyonu marjinal olasılık kütle/yoğunluk fonksiyonu olarak adlandırılır. A olayı için araştırılan olasılık marjinal olasılık fonksiyonu kullanılarak b Pra x b g x dx ya da Pra x b a b g x a hesaplanır. f(x,y) iki değişkenli dağılımda değişkenlerden sadece birinin davranışı ile ilgilenildiğinde, marjinal dağılıma gereksinim vardır. Tanım (Kesikli marjinal dağılımlar): X ve Y kesikli şans değişkenleri, f(x,y)’de bunların ortak olasılık kütle fonksiyonu ise X şans değişkeninin tanım aralığındaki her x için, g x f x, y (3.39) y ile gösterilen fonksiyona X’in marjinal dağılımı 69 h y f x, y (3.40) x fonksiyonuna ise Y’nin marjinal dağılımı denir Tanım (Sürekli marjinal dağılımlar): X ve Y sürekli şans değişkenleri, f(x,y)’de bunların ortak olasılık yoğunluk fonksiyonu ise X şans değişkeninin tanım aralığındaki her x için, g x f x, y dy (3.41) ile gösterilen fonksiyona X’in marjinal dağılımı h y f x, y dx (3.42) fonksiyonuna ise Y’nin marjinal dağılımı denir. Şekil 3.10 iki şans değişkenli sürekli bir dağılıma ait marjinal olasılık fonksiyonlarının grafiklerini göstermektedir. Şekil 3.10 İki şans değişkenli marjinal olasılık yoğunluk fonksiyonu grafiği Marjinal dağılımların bilinmesi durumunda kümülatif marjinal dağılımlar elde edilebilir. Kesikli X şans değişkeni için, F x f x, y g x x y (3.43) x F x, sürekli X şans değişkeni için, 70 F x x f s, t dtds x g s ds (3.44) F x, eşitliklerinden elde edilebilir. 3.7 KOŞULLU DAĞILIMLAR İlk bölümde koşullu olasılık kavramı bir örnek uzayı üzerinde tanımlı olaylar üzerinden açıklanmıştı. Bu kavram şans değişkenleri ve onlara ait olasılık fonksiyonları ile genişletilebilir. f(x,y) iki değişkenli dağılış olsun. Y şans değişkeninin bilinen değerleri için X şans değişeninin yoğunluğu ile ilgilenilsin. Bu yoğunluk f(x/y) ile temsil edilir. Rassal bir deneyde Y değişkeninin gözlendiğini fakat X değişkeninin elde edilemediği varsayılsın. Elde edilen Y değerine karşın X şans değişkeninin a X b aralığında olma olasılığı Pr a X b / Y y olup bu olasılık kesikli şans değişkenleri için, Pra X b / Y y b f x / y (3.45) a ve sürekli şans değişkenleri için, Pra X b / Y y b f x / y dx (3.46) a şeklinde hesaplanır. Tanım (Kesikli/Sürekli şans değişkenleri için koşullu dağılım):Kesikli şans değişkenleri X ile Y’nin ortak olasılık kütle/yoğunluk fonksiyonu f(x,y) ve Y şans değişkeninin marjinal dağılımı h(y) ise, verilen Y y için X şans değişkeninin koşullu dağılımı: f x / y f x, y h y h y 0 (3.47) ve X şans değişkeninin marjinal dağılımı g(x) ise verilen X x için Y şans değişkeninin koşullu dağılımı, f y / x f x, y g x g x 0 (3.48) eşitlikleri ile tanımlanır. İki şans değişkenli bir sürekli dağılım için koşullu dağılımın grafiği Şekil 3.11 ile gösterilmiştir. İkiden daha fazla şans değişkeninin tanımladığı ortak dağılımlarla çalışıldığında, ister kesikli isterse sürekli olsun, farklı yapıda koşullu dağılışlar ile karşılaşılabilir. Örneğin f(x1,x2,x3,x4) ortak olasılık kütle/yoğunluk fonksiyonu olsun. Verilen bir X1=x1,X2=x2 ve X3=x3 için X4 değişkeninin koşullu dağılımı: 71 f x4 / x1 , x2 , x3 f x1 , x2 , x3 , x4 . g x1 , x2 , x3 Benzer bir yaklaşımla ortak koşullu dağılımlarda tanımlanabilir. Örneğin verilen bir X1=x1 ve X2=x2 için X3 ve X4 şans değişkenlerinin koşullu ortak dağılımı: f x3 , x4 / x1 , x2 f x1 , x2 , x3 , x4 . g x1 , x2 Şekil 3.11 İki şans değişkenli koşullu olasılık yoğunluk fonksiyonu grafiği Teorem: X1 ve X2 sürekli şans değişkenleri olsun. f(x1,x2) ortak olasılık yoğunluk fonksiyonu ve g(x1) ise marjinal olasılık yoğunluk fonksiyonu ise f(x2/x1) koşullu fonksiyonu sürekli bir şans değişkenine ait olasılık yoğunluk fonksiyonudur, bkz. Ek3.3 3.8 BAĞIMSIZ ŞANS DEĞİŞKENLERİ Eğer şartlı olasılık f(x/y), Y şans değişkenini içermiyorsa, olasılıksal anlamda, X şans değişkeni Y şans değişkeninden bağımsızdır. Ortak olasılık yoğunluk/kütle fonksiyonları f(x,y) ve marjinal olasılık yoğunluk/kütle fonksiyonları g(x) ve h(y) olan (kesikli ya da sürekli) şans değişkenleri X ve Y olsun. Koşullu dağılışın özelliği kullanılarak, f x, y f x / y h y yazılabilir. Burada f(x/y) fonksiyonu Y değişkenine bağımlı değilse X şans değişkeninin marjinal olasılık yoğunluk/kütle fonksiyonu (sürekli şans değişkeni için): f x, y dy f x / y h y dy g x f x / y h y dy g x f x / y (3.49) elde edilir. Bu sonuç kullanılarak, f(x/y) fonksiyonu Y değişkenine bağımlı olmadığında, 72 f x, y g x h y yazılabilir. Diğer bir deyişle verilen bir Y=y değeri için X şans değişkenin koşullu dağılımı Y ile ilgili her hangi bir varsayımdan bağımsız ise f x, y g x h y yazılabilir. Tanım (Bağımsız şans değişkenleri): X ve Y şans değişkenleri ancak ve ancak f x, y g x h y (3.50) koşulu sağlanıyor ise birbirinden bağımsızdır. Bağımsız değiller ise bağımlıdırlar. Teorem: Marjinal olasılık kütle/yoğunluk fonksiyonları g(x) ve h(y) olan birbirinden bağımsız iki şans değişkeni X ve Y olsun. a, b, c, d sabitler olmak üzere her a<b ve c<d için: Pr a X b, c Y d Pr a X b Pr c Y d (3.51) eşitliği geçerlidir, bkz. Ek3.4. 3.9 SEÇİMLİK KONULAR Teorem: Ortak olasılık yoğunluk/kütle fonksiyonları f(x,y) ve marjinal olasılık yoğunluk/kütle fonksiyonları g(x) ve h(y) olan (kesikli ya da sürekli) şans değişkenleri X ve Y olsun. X ve Y ancak ve ancak f(x,y) fonksiyonu, sadece X değişkeninin bir fonksiyonu olan ve negatif olmayan bir fonksiyon ile sadece Y değişkeninin bir fonksiyonu olan ve yine negatif olmayan bir fonksiyonun çarpımı olarak; f(x,y)=u(x)v(y) yazılabiliyor ise, X için tanım kümesi A ve Y için tanım kümesi B olmak koşulu ile iki değişkenli dağılımın tanım kümesi R={(x,y): f(x,y)>0}; R AB bir Kartezyen çarpımdan elde edilmiş ise birbirinden bağımsızdır, bkz. Ek3.5. İki şans değişkeni için elde edilen sonuçlar n adet şans değişkeni için genellenebilir. Teorem: X1,…,Xn şans değişkenleri ancak ve ancak aşağıdaki özellikler sağlanıyor ise F x1 , , x n F x1 F x n (3.52) f x1 , , x n f x1 f x n (3.53) birbirinden bağımsızdır. Tanım Ampirik (Örnek) Dağılım Fonksiyonu: X 1 , X 2 ,..., X n bağımsız eş dağılımlı şans değişkenleri, F x Pr X x de dağılım fonksiyonu olsun. Ampirik dağılım fonksiyonu Fn x 1 n n I X i x i 1 şeklinde tanımlanmıştır. Burada I gösterge fonksiyonudur ve I X i x fonksiyonu X i x ise 1, diğer durumlarda 0 değerini alır. Bu fonksiyon X 1 , X 2 ,..., X n noktalarına 1 n kütle atayan, kesikli bir şans değişkeninin dağılım fonksiyonudur. Herhangi bir ölçülebilir B kümesi için ampirik olasılık 73 Prn B 1 n n I X i B i 1 şeklinde tanımlanabilir. Örneğin sıralaması, Fn’in hesaplanmasında önemli değildir. Örnek: 0,1,2,2,4,6,6,7 gözlemleri için ampirik dağılım fonksiyonu oluşturulsun (n =8). Her adımda elde edilen olasılıkla, o adıma kadar elde edilen kümülatif olasılık toplanır. Dağılım fonksiyonunun tanımı gereği, Fn x 0 , x < 0 için Fn x 1 , 0 x 1 için 8 Fn x 2 , 1 x 2 için 8 Veri setinde iki adet 2 değeri bulunduğu için, Fn x 2 2 4 , 2 x4 8 8 8 Fn x 5 , 4 x 6 için 8 Veri setinde iki adet 6 değeri bulunduğu için, Fn x 5 2 7 , 6 x 7 için 8 8 8 Son olarak, Fn x 7 1 8 1 , x 7 için 8 8 8 Şekil 3.12 Ampirik (örnek) dağılım fonksiyonu grafiği 74 EK 3 Ek3.1 İspat: P(C) bir olasılık küme fonksiyonu olduğundan ve P(A)=P(C) eşitliği geçerli olduğundan; P(C)=P(A)0 Aksiyom 1. Eğer C kümesi yerine S kümesi alınır ise; S={e:eS ve X(e)R} ve P(S)=P(R)=1 Aksiyom 2. Son aksiyomu ispatlamak için R uzayı üzerine tanımlı iki ayrık olay A1 ve A2 ele alınsın. Burada; C={e:eS ve X(e)A1A2} ya da P(C)= P(A1A2). Bu ifade; C={e:eS ve X(e)A1}{e:eS ve X(e)A2} ya da C= C1C2 Burada C1 ve C2 ayrık kümelerdir. Çünkü eğer her iki kümeye de ait bir ei elemanı için elde edilen X(ei) değeri aynı olup A1 ve A2 kümeleri ayrık olduğundan hem X(ei)A1 hem de X(ei)A2 olamayacağı için sonuç olarak C1 ve C2 ayrık kümelerdir. Ayrık olaylar için aksiyom 3 kullanılarak; P(C)= P(C1)+P(C2). ve P(C1)=P(A1) ve P(C2)=P(A2) olduğundan sonuç olarak iki ayrık küme için, P(A1A2)=P(A1)+P(A2) Aksiyom 3 elde edilir. Ek3.2 İspat:Son özellik (-,b] şeklindeki bir aralık iki ayrık kümenin birleşimi olarak yazılarak ispatlanabilir: (-,b]= (-,a](a,b] Bu kümelere ait olasılıklar: F(b)=F(a)+Pr(a<xb) Aksiyom 1 ile Pr(a<xb)0 olduğundan F(a)F(b) elde edilir. Ek3.3 İspat: f(x1,x2)0 ve g(x1)0 olduğundan. f x 2 / x1 2) f x 2 f x1 , x 2 0. g x1 / x1 dx2 f x1 , x 2 dx2 g x 1 1 f x1 , x 2 dx2 g x1 g x1 g x1 =1. Ek3.4 İspat: X ve Y birbirinden bağımsız olduğu için, sürekli şans değişkenleri için; b d Pr[a X b, c Y d ] a c f x, y ,dxdy b d g x h y dxdy a c 75 b d g x dx h y dy a c =Pr[a<X<b]Pr[c<Y<d]. Ek3.5 İspat:X ve Y birbirinden bağımsız ise marjinal olasılık fonksiyonları kullanılarak, f(x,y)= g(x)h(y) yazılabilir. Marjinal olasılık kütle/yoğunluk fonksiyonu oldukları için negatif olmayan fonksiyonlardır bu nedenle koşul sağlanır. Buna karşın f(x,y)=u(x)v(y) yazılabiliyor ise: g x ux v y dy ux v y dy c1ux h y ux v y dx v y ux dx c2 v y burada c1 ve c2 sabitlerdir. Olasılık yoğunluk fonksiyonu tanımından: f x, ydxdy uxv ydxdy 1 ux dx v y dy 1 c1c 2 olmalıdır. Sonuç olarak: f(x,y)= g(x)h(y)= u(x)v(y). 76