BÖLÜM 6: SÜREKLİ ŞANS SEĞİŞKENİ DAĞILIMLARI Bu kısımda, gerçek yaşamdan ortaya çıkan pek çok rassal olayın modellenmesinde faydalı olan, sürekli (tek değişkenli) parametrik olasılık dağılımlarından bazıları incelenecektir. Ele alınacak dağılımlar, bir hipotetik örnekleme süreci ile ilgili varsayımlar kümesi altında matematiksel olarak elde edilmiş teorik dağılımlardır. Bu teorik dağılımlar, belirli parametrelere göre bir olasılık yoğunluk (density) ailesini tanımlayan kurallar kümesi ile ifade edilirler. Bir şans değişkeni X ve bir parametre verilmiş olsun. f ( x, ) ise bir sürekli teorik olasılık kütle fonksiyonunu tanımlayan kural olsun. Eğer bir reel sayı ise, bu parametre farklı olasılık yoğunluk fonksiyonlarının; f ( x, 1 ), f ( x, 2 ), bütün bir kümesini belirler. Sonuç olarak, bu parametrik sürekli dağılım ailesinin değişik elemanlarını içeren küme f (X , ) / elde edilir. 6.1 TEKDÜZE (ÜNİFORM) DAĞILIM Sürekli şans değişkenleri için kullanılan en basit dağılımlardan biri tekdüze dağılımdır. Matematiksel hesaplamalara uygunluğuyla özellikle teorik istatistik için oldukça kullanışlı bir dağılımdır. Bu dağılımın diğer bir önemi istatistik kuramının çeşitli yönlerini açıklamaya, basitliği nedeniyle, çok yatkın olmasıdır. Tanım (sürekli tekdüze şans değişkeni): Bir sürekli şans değişkeni X, x aralığındaki her biri değeri eşit olasılıkla alabiliyor ise bu şans değişkeni kesikli tekdüze dağılıma sahiptir ve tek düzen dağılımın olasılık yoğunluğu şu şekildedir: f (x; , ) 1 Burada ile reel sabitlerdir ve şeklindedirler. Tek düzen dağılımda olduğuna göre 0 ’ dır ve f (x) bir olasılık yoğunluk fonksiyonu olabilmenin ilk koşulunu sağlar. Diğer bir deyişle 0 olduğu için f ( x) 0 ’dır. Teorem: f ( x; , )dx 1 koşulu sağlanır. 167 Şekil: Tekdüzen Dağılış Teorem: Eğer X şans değişkeni [ , ] aralığında tekdüzen dağılış gösteriyorsa; a. E ( X ) 2 b. V ( X ) ( ) 2 12 c. M (t ) e t e t ( )t şeklindedir. İspat: E X x 1 dx 2 2 2 2 V X E X 2 E X x2 2 1 dx 2 2 3 3 2 3 4 2 12 M x t E e xt e xt 1 dx e t e t t 168 Tekdüzen dağılış adını [a, b] aralığındaki tekdüzen yoğunluğundan ve grafikteki şeklinden almaktadır. Bu dağılıma dikdörtgen biçimli dağılım da denmektedir. Teorem: Tek düzen şans değişkeninin birikimli dağılım fonksiyonu, F ( x) (x ) ( ) ile tanımlanmıştır. İspat: x F ( x) 1 x dt . Bu sonuç bazı rassal olgularda araştırıcı için kullanışlı olmaktadır. Örneğin; rassal bir X değişkeninin değerleri sadece [a, b] gibi bir sınırlı alan içinde dağılıyorsa; [a, b] aralığının eşit mesafeli iki alt aralığının X şans değişkenini içerme olasılıkları eşitse o zaman X, [a, b] aralığında tekdüze dağılış göstermektedir. Ya da [0,1] aralığında herhangi bir sayı ele alındığında, aslında bu aralıkta tekdüzen dağılış gösteren bir şans değişkeninden bahsedilmektedir. Teorem: Herhangi bir sürekli X şans değişkeni için tanımlanan yoğunluk fonksiyonu, uniform yoğunluk fonksiyonuna y Gx alınarak (burada G(x), X şans değişkeninin kümülatif dağılım fonksiyonudur) dönüştürülebilir. f y 1 0<y<1 Bu teorem ile sadece birim aralıktaki uniform dağılım için birçok sürekli dağılımın özellikleri ispatlanarak gösterilebilir. Tekdüzen dağılımın belirli kapalı bir [a, b] aralığında dağıldığını tanımlamıştık. Ayrıca (a, b) açık aralığı ya da (a, b] ve [a, b) yayı açık yarı kapalı aralıklarında da aynı tanımı yapmak mümkündür. Burada bilinmesi gereken her dört olasılık yoğunluğunun da aynı birikimli dağılış fonksiyonuna sahip olduğudur. 6.2 GAMA DAĞILIŞI İstatistikte önemli rol oynayan dağılımlardan ikisi, bir dağılım ailesi olarak görebileceğimiz gama ve üstel dağılımlardır. Bu iki dağılımın birlikte ele alınmasının sebepleri; üstel dağılımın, gama dağılımının özel bir durumu olması ve üstel şans değişkenlerinin toplamının gama dağılımı göstermesidir. Gama dağılışı sık sık bekleme zamanlarının olasılık modeli olarak kullanılmaktadır. Örneğin yaşam zamanı testinde ölüme kadar geçen süre gama dağılışına uyan bir şans değişkeni göstermektedir. Gama dağılımının Poisson süreci ile ilişkisi bölüm sonundaki eklerde E.6.3 Kısmında verilmiştir. Tanım (Gama şans değişkeni): Bir X şans değişkeni aşağıdaki olasılık yoğunluğuna uyuyorsa (gama dağılımı) gama şans değişkeni olarak adlandırılır. 169 f x 1 x 1e x 0 ( ) olasılık yoğunluk fonksiyonu tanımlanabilir. Bu dağılış tek parametreli gama dağılımıdır. Eğer y x şeklinde bir şans değişkeni tanımlanırsa, iki parametreli gama dağılımı elde edilir. Tanım: Bir X şans değişkeni aşağıdaki olasılık yoğunluğuna uyuyorsa (gama dağılımı) gama şans değişkeni olarak adlandırılır. f ( x; , ) 1 x 1e x / ( ) x0 Burada 0, 0 ve ( ) 0 şeklindedir. Burada ölçek, şekil parametresidir. Teorem: Eğer X şans değişkeni, ve parametreli gama dağılışı gösteriyorsa, a. E (X ) b. V ( X ) 2 c. M (t ) (1 t ) şeklindedir. İspat: a. Dağılışın beklenen değeri, EX 1 x e x dx 0 y x ile tanımlanan değişken dönüşümü uygulanarak, dx dy , EX 1 y e y dy 0 y e y dy 0 1 elde edilir. b. Gama dağılışının varyansı da benzer şekilde, E X2 1 x 1e x 0 y 1 dx 1 y e dy 0 2 y 1e y dy 0 170 2 2 1 2 ve V X E X 2 E X 2 2 bulunur. c. Gama dağılışının moment türeten fonksiyonu ise; E (e tX ) 1 ( ) x dx 0 1 ( ) e tx x 1e x 1 e 1 x t dx 0 burada x y dönüşümü ile, dx dy , E (e tX ) 1 y 1e y (1 t ) dy ( ) 0 burada z y(1 t ) dönüşümü ile, dy dz 1 t E (e ) tX 1 ( )1 t 1 1 t z 1 z e dz 0 olup bu fonksiyon, t 1 için geçerlidir. Sonuç olarak gama dağılımı için, 1 M x t 1 t bulunur. Teorem: Gama dağılımının orijine göre r-inci momenti, r ( r ) ( ) r eşitliğinden elde edilir. İspat: Gama dağılışının r-inci momenti, EX r 1 x r 1 e x dx 0 y x ile tanımlanan değişken dönüşümü uygulanarak, dx dy , 171 E Xr r y r 1e y dy 0 Gama fonksiyonun tanımı gereği sağ tarafın integrali (r ) olduğuna göre, r r r ispat tamamlanmış olur. Gamma dağılımının kümülatif dağılım fonksiyonu, F x 1 ( ) x t 1e t / dt 0 olup α pozitif tamsayı olduğunda bu integral nümerik metotlarla elde edilebilir. 2 3 x 1x 1 x 1 x x F x 1 1 e 3! ! 2! x0 Bu F fonksiyonuna incomplete gamma fonksiyonu denir. İki parametreli gama dağılımı 1 alınarak poisson dağılımının parametresine göre de ifade edilebilir, bkz. Kısım E6.3. 6.3 ÜSTEL DAĞILIM Üstel dağılım yaşam sürelerinin modelleşmesinde kullanılabilir ve kesikli durumlarda kullanılan geometrik dağılışın benzeridir. Gama dağılışında 1 olması durumunda ortaya çıkar. Üstel dağılışın parametresi ile Poisson dağılımının parametresi arasında çok yakın bir ilişki vardır. Poisson dağılımında belirli bir zaman aralığında ya da belirli bir bölgede herhangi bir olayın meydana gelme olasılığının nasıl bulunacağı ile ilgilenilir. Oysa ki bu zaman aralığında birbirini izleyen olaylar arasında geçen süre de bir tesadüfi değişkendir. Tanım (Üstel şans değişkeni): Bir X şans değişkeninin olasılık yoğunluğu aşağıdaki tanıma uyuyorsa üstel dağılış gösterir ve üstel şans değişkeni adını alır. f ( x; ) 1 e x / x0 Burada 0 olup ölçek parametresidir. Teorem: Eğer X şans değişkeni üstel dağılış gösteriyorsa beklenen değeri, varyansı ve moment türeten fonksiyonu şu şekildedir: a. E X b. V X 2 c. M x t 1 t 1 İspat: a.Üstel dağılımın beklenen değeri, 172 E( X ) 1 xe x / dx 0 kısmi integrasyonunda x y alınarak, dx dy , E ( X ) ye y dy 0 integrali kısmi integral ile çözülebilir, bununla birlikte integral bir gama integrali olup, 2 1 değerini verir ve sonuç olarak EX bulunur. b. Üstel dağılışın varyansı da benzer şekilde, 1 E( X 2 ) x e 2 x / dx 0 2 y 2 y e dy 0 2 3 ve V X 2 2 2 2 olarak elde edilir. c.Üstel dağılımın moment türeten fonksiyonu da, e Ee 1 xt xt e x dx 0 burada x y dönüşümü uygulanarak, e Ee xt y 1 t dy 0 1 1 t olup, 1 t için, M x t 1 1 t bulunur. Üstel dağılımın önemli bir özelliği hafızasızlık özelliğidir. Teorem: Eğer X şans değişkeni parametreli üstel dağılıma sahip ise, s t 0 olmak üzere, 173 Prx s / x t Prx s t eşitliği geçerlidir. İspat: Prx s / x t Prx s, x t Prx t burada s t olduğundan, Prx s / x t 1 Prx s Prx t e x / 1 x / s e dx dx e s / e s t e t / t Prx s t X bir makine parçasının çalışma ömrü olarak kabul edilsin. Bu parçanın t birim zamanda bozulmaması şartıyla s birim zamanda bozulmama şartlı olasılığı s t birim zamanda bozulmama olasılığına eşittir. Diğer bir deyişle eski çalışan bir parçanın çalışma ömrünün dağılışı ile yeni çalışan parçanın çalışma ömrünün dağılımı aynıdır. 6.4 BETA DAĞILIMI 1895 yılında Karl Pearson tarafından tanıtılan beta dağılımını açıklamak için bir beta fonksiyonu tanımlanır ve bu fonksiyon sayesinde beta dağılımı bulunur. Beta fonksiyonu Eularian integralinin birinci tipidir ve bölüm sonu eklerde Kısım E.6.2’de açıklanmıştır. Eğer bir süreç Gamma dağılışı gösteren değişkenlerin oranlarını göz önüne alan tipte ise Beta dağılımı çok yararlı bir dağılıştır. Beta dağılımının olasılık yoğunluk fonksiyonu 0,1 aralığında belirlenmiş olduğundan birçok deneysel dağılış Beta dağılışına uyabilir. Tanım (Beta şans değişkeni): Bir X şans değişkeninin olasılık yoğunluğu aşağıdaki tanıma uyuyorsa beta dağılışı gösterir ve beta şans değişkeni adını alır. f ( x; , ) ( ) 1 x (1 x) 1 ( ).( ) 0 x 1 Burada , 1 olup şekil parametreleridir. Teorem: X şans değişkeni Beta dağılımına sahip ise, a. E X r b. E ( X ) c. V ( X ) ( ) ( r ) ( r ) ( ) ( ) ( ) ( 1) 2 İspat: a. Bir beta dağılımının r-inci momenti, beta fonksiyonunun özellikleri kullanılarak, 174 ( ) x r 1 (1 x) 1 dx ( )( ) 0 1 E( X k ) ( ) (r )( ) ( )( ) (r ) ( ) ( r ) (r ) ( ) bulunur. b. Eğer r 1 alınır ise ( ) ( 1) ( 1)! ( 1)! ( 1) ( ) ( )( 1)! ( 1)! E( X ) ( ) bulunur. c. Eğer r 2 alınır ise E( X 2 ) ( ) ( 2) ( 1)! ( 1) ( 1)! ( 2) ( ) ( 1)( )( 1)! ( 1)! ( 1) ( 1)( ) ve sonuç olarak varyans, V (X ) ( 1) 2 ( 1)( ) ( ) 2 ( ) ( 1) 2 bulunur. Bu dağılımın moment türeten fonksiyonu basit bir yapıda olmadığı için kullanışlı değildir. Beta dağılımının özel durumu: Eğer 1 ve 1 ise Beta dağılımı sürekli üniform dağılımı tanımlar. (2) x 0 (1 x) 0 (1)(1) 1 f ( x;1;1) 0 x 1 Beta dağılımı için 1 2 noktasında simetrik olup ortalaması da 1 2 değerine eşittir. 6.5 NORMAL DAĞILIM Uygulamalı istatistikte kullanılan tekniklerin çoğu Normal dağılıma dayanmaktadır. Bu dağılım ilk kez 1733’te Abraham de Moivre (1667–1745), tarafından Binom dağılımı gösteren değişkenlerin toplamının yakınsadığı bir dağılım olarak keşfedilmiştir. Birçok bakımdan istatistik kuramının temel taşı sayılan normal dağılış, daha sonra ölçme hatalarının şaşılacak derecede düzenlilik göstermesini 175 gözlemleyen bilim adamlarınca, Pierre Laplace (1749–1827) ve Karl Gauss (1777–1855) tarafından incelenmiştir. Gözlenen dağılımların, normal hata eğrileri adı verilen ve şans kurallarına bağlanan sürekli eğrilere çok yakın olduğu bulunmuştur. İlk olarak bu tür normal eğrileri tanımlayan h z e 1 z2 2 fonksiyonunun matematiksel özellikleri araştırılmıştır. İlk aşamada integralin mevcut olup olmadığı ele alınsın, I e 1 z2 2 dz bu integralin integrandı pozitif sürekli bir fonksiyon olduğundan ve integrali alınabilir bir fonksiyonla sınırlı olduğu, 0e için e 1 z2 2 z 1 e z 1 0 dz e z z 1 dz e e dz 0 0 z 1 z 1 dz e z 1 dz 0 0 k e lim e dz e lim e z dz t z t k 0 2e mevcuttur. Teorem: I integralinin değeri sonlu olup 1 z2 e 2 dz 2 değerine eşittir. İspat: I integralinin kendisi ile çarpımı I 2 ise I 2 e y2 z2 2 dydz bu integralin çözümü için kutupsal koordinatlara dönüşüm y r cos ve z r sin yapılarak ve jakobian determinantı; dy J dr dy d dz dr cos dz r sin d sin rdrd r cos hesaplanarak, 176 2 I2 e 1 r2 2 rdrd 0 0 bulunur. Bu integralde, u r 2 2 dönüşümünü yapılarak, du rdr 2 I2 e u dud 0 0 2 e u d 0 0 2 d 0 2 ve I 2 elde edilerek ispat tamamlanır. Tanım (Normal Dağılım): Eğer ortalaması µ ve varyansı σ2 olan bir X şans değişkeninin olasılık yoğunluk fonksiyonu aşağıdaki gibiyse bu şans değişkeni Normal dağılım göstermektedir. f x; , 1 2 e x 2 2 2 x Burada parametreler için sınırlar , 0 eşitsizlikleri ile tanımlanmıştır. Bu dağılım X N , 2 ile gösterilir. Normal dağılım aynı zamanda Gauss dağılımı ya da hata (error) dağılımı olarak da bilinir. Öncelikle normal dağılıma ait fonksiyonun oyf olma koşullarını sağladığı ispatlansın. Teorem: f x; , bir olasılık yoğunluk fonksiyonudur. İspat: z x ve dx dz dönüşümü yapılarak, A f x; , dx 1 2 2 e z2 2 dz e 2 z2 2 dz 0 ve w z 2 2 alınarak, z 2w ve dz w 1 2 2 dw olur ve gama fonksiyonunun özelikleri kullanılarak, A 1 w 1 2 w e dw 0 1 2 1 ispat tamamlanır. Alternatif bir yaklaşım kutupsal koordinatların kullanılmasıdır, e 1 z2 2 dz 2 olduğu hatırlanarak, 177 1 2 e 1 z2 2 dz 1 elde edilir. Teorem: Eğer X şans değişkeni X N , 2 dağılışı gösteriyorsa; a. E X b. V X 2 2 2 c. M x t e t t 2 İspat: İlk olarak a şıkkı incelenmiştir. EX 1 2 xe x 2 2 2 dx Değişken değiştirme tekniği ile z x ise x z ve dx dz olur, EX 1 2 z e 2 ze z 2 2 dz 1 z2 2 1 dz e 2 z2 2 dz Eşitliğin sağındaki ilk integral Z değişkeninin tek bir fonksiyonudur ve yarı integral sonucu ze z 2 dz 1 2 0 sonlu olduğundan integral sonucu sıfıra eşittir. İkinci integral ise ortalaması sıfır varyansı bir olan standart normal değişkenin olasılık yoğunluk fonksiyonu olduğundan integral sonucu bire eşittir. Sonuç olarak, EX . b. Var X E X 2 1 2 2 2 x e 2 x 2 2 2 dx x 2 e x 2 2 2 2 dx z x dönüşümü ile, dx dz olur, V X 2 1 2 z 2e z 2 2 dz ve w z 2 2 alınarak, z 2w 12 ve dz w1 2 2 dw olur, integral içindeki fonksiyon çift fonksiyon olduğundan, 178 V X 2 2 1 2 w 2 2w2w e dw 2 2 0 w 1 2 w e dw 0 ve gama fonksiyonunun özelikleri, 3 2 2 kullanılarak, V X 2 3 2 2 2 elde edilir. c. M x t E etx et E et x 1 e 2 t et t x e 1 x 2 2 2 dx 1 exp 2 x 1 2 e 2 2 2 2t x dx üstel fonksiyonunun üs kısmı ele alınsın. x 2 2 2t x x 2 2 2t x 4t 2 4t 2 2 x 2t 4t 2 Bu bilgi integralde yerine konulursa, M x t et e 2 2 t 2 1 2 1 exp 2 x t dx 2 2 2 En son elde edilen eşitlikteki integral, ortalaması 2t ve varyansı 2 olan bir Normal dağılımın olasılık yoğunluk fonksiyonudur. Dolayısıyla bu eğrinin altında kalan alan 1’e eşittir. Böylece ispat tamamlanır. Normal dağılımın kümülatif dağılım fonksiyonu, F x 1 2 x e t 2 2 2 dt integrali ile elde edilir. Normal değişken için kümülatif dağılım fonksiyonu kapalı formda elde edilemez. Bilgisayar üzerinden yapılan hesaplamalarda polinomlar üzerinden nümerik yakınsamalar kullanılmaktadır. Kümülatif dağılım fonksiyonu, sürekli türevlenebilir olduğunda olasılık yoğunluk fonksiyonu üzerinden elde edilebilir. Kümülatif dağılım fonksiyonunun sürekli türevlenebilir olmadığı noktalarda olasılık yoğunluk fonksiyonu 0 değerini almaktadır. Eğer z x dönüşümü yapılırsa, 179 1 F x 2 x t e 2 2 2 dt şeklinde elde edilir. Yukarıdaki kullanılan z x dönüşümü özel bir durumdur ve standart normal şans değişkeni olarak adlandırılır. Standart normal şans değişkeni ortalaması sıfır, varyansı ise bir olan dağılıma sahiptir. Bu şans değişkenine ait olasılık fonksiyonu ise f z 1 z2 2 e 2 z şeklindedir. Eğer Z N 0,1 ise standart normal kümülatif dağılım fonksiyonu, z z f t dt şeklinde elde edilir. Standart normal olasılık fonksiyonunda f z f z eşitliği tüm reel Z değerleri için geçerlidir. Çünkü f z çift fonksiyonudur. Bir başka deyişle, standart normal dağılım z 0 etrafında simetriktir. f z ’nin özel yapısı nedeniyle, f z zf z ve f z z 2 1 f z elde edilir. Sonuç olarak f z , z 0 noktasında eşsiz bir maksimuma ve z 1 noktalarında ise büküm noktalarına sahiptir. Ayrıca z için f z 0 ve f z z 2 expz 2 0 ’dır. 2 Aşağıda normal dağılımın örnekleme dağılımları olarak adlandırılan ve istatistik uygulamalarında ve teorisinde önemli yer tutan Student t, ki-kare 2 ve F Dağılımları incelenecektir. 6.6 CAUCHY DAĞILIMI Cauchy dağılımı, istatistik teorileri içerisinde özel bir rol oynar. Tahminler için aşırı bir durum simgeler. Örneğin gözlemlerin oranlarını hesaplamada alışılmış bir uygulamadır. İlginç olan bir durum da iki standart normalin bir Cauchy dağılımına sahip olmasıdır. Cauchy dağılımı simetrik bir dağılımdır ve , aralığında çan biçiminde bir dağılış gösterir. Cauchy dağılımı normal dağılımdan çok farklı görünmemesine rağmen normal dağılıma göre büyük farklar içerir. Bunlardan biri Cauchy dağılımının ortalamasının mevcut olmamasıdır. Tanım(Cauchy Dağılımı): Bir X şans değişkeninin olasılık yoğunluğu aşağıdaki gibiyse standart Cauchy dağılımına uyar ve Cauchy şans değişkeni adını alır, f ( x; 0; 1) 1 (1 x 2 ) x 180 tek parametreli (yer parametresi) Cauchy olasılık yoğunluk fonksiyonu: f ( x; ; 1) 1 1 1 ( x )2 x ve iki parametreli (yer ve ölçek) Cauchy olasılık yoğunluk fonksiyonu: f ( x; ; ) 1 x 2 1 x olarak tanımlanmıştır. Cauchy dağılımı etrafında simetrik olmasına rağmen ortalaması ve daha büyük momentleri mevcut değildir. Diğer bir deyişle moment türeten fonksiyonu mevcut değildir. Teorem: X şans değişkeni standart Cauchy dağılımına sahip ise a. E ( X ) belirsiz b. V ( X ) belirsiz İspat: a. E X 1 x (1 x )dx 2 Eğer u x 2 ise du 2 xdx E( X ) 1 du 2u 1 1 ln(1 x 2 ) k 2 Lim k k belirsizliği bulunur. b. E X 2 1 x2 dx (1 x 2 ) 1 1 1 (1 x )dx 2 1 1 dx dx (1 x 2 ) Lim k 1 x k k Lim k 1 ln(1 x 2 ) 2 k k belirsizliği bulunur. Teorem: f ( x; 0; 1) fonksiyonu bir olasılık yoğunluk fonksiyonudur. 181 İspat: 1 f ( x)dx 1 (1 x )dx 2 Lim k t 1 k 1 t (1 x 2 ) dx d 1 olduğundan, arctanx dx 1 x2 Burada, f ( x)dx Lim arctanx 1 k t k t 1 2 2 1 bulunur. Cauchy dağılımında parametresi dağılımın merkezi ölçümünü tanımlar ve Pr(x ) 0.5 olduğu için dağılımın medyanıdır. İki standart normal şans değişkeninin oranı Cauchy dağılımına sahiptir.(ispat için bkz… ) 6.7 LOGNORMAL DAĞILIM Eğer X logaritması normal dağılım gösteren log X ~ N ( , 2 ) bir şans değişkeni ise, X şans değişkeni bir lognormal dağılıma sahiptir. X şans değişkenin olasılık yoğunluk fonksiyonu normal dağılımın olasılık yoğunluk fonksiyonuna logaritmik dönüşüm uygulanarak elde edilebilir. Tanım(lognormal dağılımı): Bir X şans değişkeninin olasılık yoğunluğu aşağıdaki gibiyse lognormal dağılımına uyar ve lognormal şans değişkeni adını alır, f x; , 1 1 log x 2 e 2 x 2 2 0 x Teorem: Eğer X bir lognormal dağılıma sahip ise, a. E ( X ) e ( 2 / 2) b. V ( X ) e2( ) e2 2 2 İspat: X şans değişkenlerinin momentleri Y log X ~ N ( , 2 ) ilişkisi ile normal dağılımdan, E ( X ) E[elogX ] E[eY ] ile bulunabilir. Bununla birlikte X şans değişkeninin momentleri olasılık yoğunluk fonksiyonu ile de bulunabilinir. 1 a. E ( X ) 2 e 1 log x 2 2 dx 0 182 Burada t Logx dönüşümü ile dx et dt 1 E( X ) 2 e 1 t2 e 2 dt e 2 t e ( t 2 2t ) 2 dt t 2 2t 2 2 2 e e 2 dt e / 2 2 2 e t 2 2 dt Burada t z dönüşümü ile dt dz , e z2 2 dt 2 olur. Sonuç olarak, E( X ) e 2 2 bulunur. 1 b. E ( X ) 2 2 xe 1 log x 2 2 dx Burada t Logx dönüşümü ile dx et dt E( X 2 ) 1 2 e2 2 e2 2 et e 1 t2 2 et dt 1 t2 2 dt e 2t e t 2 4t 4 2 4 2 2 e dt e 2 2 2 2 e t 2 2 2 dt Burada t 2 z dönüşümü ile dt dz , E X 2 e 2 2 2 bulunur ve V ( X ) e 2 2 2 2 e 2 2 183 e 2 ( ) e 2 2 2 elde edilir. Lognormal dağılım sağa çarpık bir dağılımdır. 6.8 LAPLACE (ÇİFT ÜSTEL) DAĞILIMI Bu dağılım birbirinden bağımsız iki üstel dağılışlı şans değişkeninin aralarındaki farkların dağılımıdır. Tanım: Bir X şans değişkeninin olasılık yoğunluk fonksiyonu aşağıdaki gibi ise X değişkeni laplace şans değişkeni adını alır. 1 f x; , e 2 x x Burada ve 0 ile tanımlanmıştır. Şekil: Laplace Dağılımı Teorem: Laplace dağılışının ortalaması ve varyansı şu şekildedir. a. E (X ) b. V ( X ) 2 2 6.9 İKİ DEĞİŞKENLİ NORMAL DAĞILIM İki değişkenli normal dağılım, çok değişkenli normal dağılımın en basit şeklidir. Çok değişkenli normal dağılımı açıklamak için matris cebiri kullanmak gerektiğinden sadece iki değişkenli normal dağılım ana hatlarıyla anlatılacaktır. Tanım: X1 ve X2 rassal değişken çiftinin ortak olasılık yoğunlukları aşağıdaki gibiyse iki değişkenli normal dağılıma uyarlar ve ortak normal dağılmış şans değişkenleri olarak adlandırılırlar. ve için; 184 2 x 2 x1 1 x2 2 x2 2 1 1 1 exp 2 p 2 2 ( 1 ) 1 1 2 2 f ( x1 , x2 ) 2 2 1 2 1 Burada x1 , x2 , 1 0 , 2 0 ve 1 1 olup korelasyon katsayısıdır. Yukarıdaki olasılık yoğunluk fonksiyonda 0 konulduğunda, olasılık yoğunlukları f x1 ve f x2 olan bağımsız X1 ve X2 tesadüfi değişkenlerinin olasılık yoğunluk fonksiyonlarının çarpımı elde edilir. Bu ortak dağılımı inceleyebilmek için önce 1 , 2 ,1 , 2 parametrelerinin, X1 ve X2 şans değişkenlerinin, ortalamalarıyla standart sapmaları olduğu gösterilmelidir. Yoğunluk fonksiyonundan hareketle X2’ ye göre integral alınırsa X1’ in marjinal yoğunluğu elde edilir: 2 x1 1 1 exp 2 x 2 2(1 ) 1 x1 1 x2 2 1 2 2 dx2 f ( x1 ) exp 2 2 2 1 2 1 2 1 2 2(1 ) 2 Gösterimi basitleştirmek için z1 x1 1 1 ve z2 x2 2 şeklinde değişken dönüşümü yapıldığında 2 aşağıdaki ifadeye ulaşılır: 1 exp z12 2 2(1 ) 1 f ( z1 ) 2 2 1 1 2 1 exp 2(1 2 ( z22 2 z1 z2 )dz2 ) Aşağıdaki eşitlik kullanılarak; z22 2z1z2 ( z2 z1 ) 2 2 z12 ve terimler toplanarak şu aşamaya gelinir: 1 exp z12 2 1 g ( x) 1 2 2 2 1 z2 z1 exp dz2 1 2 2 1 2 1 Burada köşeli parantez içindeki ifade z1 ve 2 1 2 olan normal şans değişkeninin , aralığındaki integralidir. Dolayısıyla bu ifadeyi 1 ’ e eşitlersek x için şunu buluruz: 1 1 x exp z12 1 1 1 2 2 f ( x1 ) e 1 1 2 1 2 Bu ifade görüldüğü gibi; X1’ in marjinal yoğunluğu, ortalaması μ ve standart sapması σ olan bir normal dağılıştır. Simetriden dolayı da X2’ in marjinal yoğunluğu, ortalaması μ ve standart sapması σ olan bir normal dağılış olacaktır. 185 Teorem: X1 ve X2, iki değişkenli normal dağılıma uyuyorsa X1 x1 verilmişken X2’ nin koşullu yoğunluğu, ortalaması; x2 / x1 2 2 x 1 1 1 varyansı x22 / x1 22 1 2 olan bir normal dağılımdır. X 2 x2 verilmişken X1’in koşullu yoğunluğu, ortalaması x1 / x2 1 1 x 2 2 2 varyansı x21 / x2 12 1 2 olan bir normal dağılımdır. İspat: f x2 / x1 x 1 x 2 f x2 , x1 olduğuna göre; ifadeyi basitleştirmek için z1 1 ve z2 2 1 2 f x1 yazıldığında şu ifade bulunur: f ( x2 / x1 ) 2 1 2 2 1 2 2 1 exp 2 z12 2 z1 z2 z22 2 1 2(1 ) 2 1 2 2 1 exp z12 2 z1 z2 z 22 2 1 2(1 ) 1 1 exp z12 1 2 2 1 2 1 z2 z1 exp 2 1 2 2 1 Bu sonuç ilk değişkenlerin cinsinden yazılırsa şu elde edilir: 2 2 x2 2 x 1 1 1 1 1 f ( x2 / x1 ) exp 2 2 1 2 2 1 2 2 Görüldüğü gibi bu ifade; ortalaması x2 / x1 2 2 x ve varyansı x22 / x1 22 1 2 olan 1 1 1 bir normal yoğunluktur. X 2 x2 verilmişken X1’ in koşullu yoğunluğuna karşılık gelen bulgular simetri yoluyla bulunabilir. Teorem: İki şans değişkeni, iki değişkenli normal dağılıma uyuyorlarsa ve 0 ise bağımsızdırlar. 186 İspat: 0 için; 1 x 2 x 2 1 2 2 f ( x1 , x2 ) exp 1 21 2 2 1 2 1 sonucuna ulaşılır ki bunlar f ( x1 ) ve f ( x2 ) olasılık yoğunluk fonksiyonlarıdır. İstendiği takdirde çarpım bir şekilde parçalanarak da yazılabilir. Teorem: İki değişkenli normal dağılımın moment türeten fonksiyonu 1 M x1 , x2 expt11 t2 2 (t12 12 2 t1t2 1 2 t22 22 ) 2 şekildedir. Bu fonksiyondan hareketle X1 ve X2’ nin beklenen değer, varyans ve kovaryansları bulunabilir. Bunun için yapılması gereken istenen değişkenin t değerine göre türev alıp sıfıra eşitlemektir. 1 A t11 t2 2 (t12 12 2 t1t2 1 2 t22 22 ) 2 olsun. E ( X1 ) E( X 2 ) E ( X 12 ) M x1 , x2 (t1 , t2 ) t1 t1 t2 0 M x1 , x2 (t1 , t2 ) t2 t1 t2 0 2 M x1 , x2 (t1 , t2 ) t1 t2 0 t12 M x1 , x2 (t1 , t2 ) ( 1 t1 12 2 t2 1 2 0)e A t1 t2 0 ( 2 t2 22 2 t1 1 2 0)e A ( 12e A ( 1 t1 12 t2 2 ) 2 e A 1 t1 t2 0 t1 t2 0 2 12 12 2 E ( X 22 ) t1 t2 0 t22 ( 22e A ( 2 t2 22 t1 1 ) 2 e A t1 t2 0 22 22 V ( X1 ) E ( X12 ) [ E ( X1 )]2 12 12 12 12 V ( X 2 ) E ( X 22 ) [ E ( X 2 )]2 22 22 22 22 Cov( X1, X 2 ) E[(x1 1 )(x2 2 )] E( X1 X 2 ) 12 E ( X1 X 2 ) 2 M x1 , x2 (t1 , t2 ) t1t2 t1 t2 0 1 2 12 yerine koyulduğunda; Cov( X1, X 2 ) 1 2 12 12 1 2 elde edilir. 187 BÖLÜM 6 EKLER Ek6.1 TEK VE ÇİFT FONKSİYONLAR Her hangi bir f x fonksiyonu, f x f x ise çift fonksiyondur, f x f x ise tek fonksiyondur. Eğer f x çift fonksiyon ise f x dx 0 f x dx f x dx 0 2 f x dx . 0 Eğer f x tek fonksiyon ise ve f x dx K ise, 0 0 0 f xdx f xdx f xdx 0 0 f x dx f x dx 0 elde edilir. Ek6.2 GAMA FONKSİYONUNUN ÖZELLİKLERİ Gama dağılış ailesi ele alınmadan önce, 0 y 1e y dy integrali ile tanımlanan gama fonksiyonu incelenecektir. Eğer 1 ise 1 0 e y dy 1 Eğer 1 ise, y 1e y 0 1 0 y 2e y dy 1 2 Ardışık iterasyon ile; ( ) 1! bulunur. Değerlendirilmesi gereken özel durumlardan biri de 1 2 değeridir. 188 1 1 1 1 1! 2 2 1 ! 2 1 1 ! 2 2 1 12 y y e dy 2 0 Burada, y z 2 2 dönüşümü yapılarak, 1 2 1 1 z z2 2 zdz ! 0 e 2 2 2 2 1 2e z 2 dz 0 2 1 z2 2 . .e dz 2 0 2 Bu integral standart normal dağılımın yarı alanına eşit olduğundan 1 ! 2 2 bulunur. Ayrıca gerekli olan diğer bir bilgi 1 2 ’ dir. 1 y 2 e y dy 2 0 1 Burada y z 2 2 alındığında, 1 z 2 0 2 2 0 1 2 e z 2 zdz 2 2e z 2 dz 2 Burada normal dağılıştan, e z 2 dz 2 , olduğu hatırlanarak 2 0 e z 2 dz 2 2 , ve sonuç 2 olarak, 2 1 2 2 2 bulunur. Ek6.3 BETA FONKSİYONUNUN ÖZELLİKLERİ (a,b) aralığında tanımlanan f x C x a b x 1 1 . 189 Bu fonksiyondaki C sabit ve , tamsayı olarak ifade ederiz. , >0 olmak üzere ve (a,b) tanım aralığını beta dağılımının olasılık yogunluk fonskiyonu olarak tanımlayabileceğimiz (0,1) aralığı alırsak; 1 B , x 1 1 x 1 dx 0 beta fonksiyonunu elde ederiz. Beta fonksiyonu tanımlamak için iki gama fonksiyonunun çarpımından faydalanılır: ( 1)( 1) ( x e d x )( y e y d y ) x 0 0 0 Burada u 0 x y e ( x y ) d x d y y.d u x u. y dönüşümü uygulanarak x ve d x ve u değişkeninin sınırları x y (1 u ) 2 (1 u ) 0 x 1 olacaktır, 1 u. y (1u ) y y e ( 1)( 1) du d y (1 u ) (1 u ) 2 0 0 y Bu integralde y v(1 u) dönüşümü ile d y (1 u )d v ve burada v değişkeninin sınırları 0 v olacaktır, 1 ( 1)( 1) ( 0 0 1 u.v(1 u ) v(1 u ) ) (v(1 u )) e v (1 u )du d v (1 u ) (1 u ) 2 u v v (1 u ) e v vdu d v 0 0 1 v 1e v d v u (1 u ) du 0 0 ( 2) 1 u .(1 u ) .du 0 ( 1).( 1) ( 2) eşitliğinin solundaki ifade Beta fonksiyonudur: 1 ( 1; 1) u .(1 u ) .du 0 Gama ve Beta fonksiyonları arasındaki ilişki ise; ( ; ) ( ).( ) ( ) 190 Yukarıda elde edilen Beta fonksiyonu kullanılarak, ( ).( ) x 1 (1 x) 1 dx ( ) 0 1 ( ) x 1 (1 x) 1.dx ( ).( ) 0 1 1 eşitliği bulunabilir. Ek6.4 GAMA DAĞILIŞININ POİSSON SÜRECİ İLE İLİŞKİSİ Bazı durumlarda W şans değişkeni k adet olay ortaya çıkıncaya kadar geçen ölçeği tanımlar. Eğer sabit olarak kabul edilse, W’ nun dağılım fonksiyonu, Gw PrW w 1 PrW w W uzunluğunda k adet olay ortaya çıkıyorsa, W w durumu için en fazla k 1 adet olay ortaya çıkar. Başka bir deyişle 0, w aralığında k 1 adet olay mevcuttur: P(W w) k 1 (w) x x 0 e w X! ve G( w) 1 k 1 x1 (w) x e w e w X! olup w şans değişkeninin olasılık yoğunluk fonksiyonu G' (w) g (w) ; g ( w) e w (w) x X (w) x 1 e w w e x ! x ! x 1 k 1 (w) x e w (w) x 1 e w w e x! ( x 1)! x 1 k 1 (w)1 e w (w)1 e w (w) 2 e w e w ... 1! 1! 2! .. (w) k 3 e w (k 3)! e w e w (w) k 2 e w (k 2)! (w) k 2 e w (k 2)! (w) k 1 e w (k 1)! e w (w) k 1 e w (k 1)! ( ) k ( w) k 1 e w (k 1)! Burada k ve ( ) ( 1)! alındığında; g ( w) 1 w w e ( ) bulunur ki bu da gama şans değişkeni için olasılık yoğunluk fonksiyonudur. 191 Ek6.5 ÜSTEL DAĞILIMIN POİSSON SÜRECİ İLE İLİŞKİSİ İlk olay oluşuncaya kadar geçen rasgele uzunluğun W olduğu kabul edilsin. W uzunluğunun dağılım fonksiyonu: Gw PrW w 1 PrW w İlk olayın ortaya çıkmasının uzunluğu W’nun w uzunluğundan büyük olması, w uzunluğunda hiç olay oluşmaması anlamına gelir. Başka bir deyişle bu olasılık, Pr0, w değerine eşittir. Bu durumda, Gw 1 Pr0, w 1 ew g w ew Üstel dağılım olasılık yoğunluk fonksiyonu elde edilir. Burada , w ’ ya göre bir sabittir ve d dw 1 G w g w e w 1 G w 1 G w 1 1 e w (2) ya da lim P 1, h h 0 h olarak tanımlanır. Güvenilirlik analizinde hata oranı (failure rate) olarak bilinir. Burada ile arasındaki ilişkiye bakılacak olursa 1/ , bir olay meydana gelirken geçen sürelerin dağılımını gösterir. Yani burada = 1/ olacaktır. Şüphesiz pek çok durum için, ekipmanların ya da insanların hata oranı, w ’ dan bağımsız değildir, ( w) . Eşitlik (2)’ nin en solundaki basit diferansiyel denklem, x 1 G w için, ve G 0 0 sınır koşulu için; w ln 1 G w t dt 0 G w için çözüldüğünde, w G w 1 exp t dt 0 W ’ nin o.y.f., w g w w exp t dt 0 bulunur. Üstel dağılım koşullar arası bekleme sürelerine de uygulanabilir. Örneğin bekleme kuyruğu problemlerinde üstel dağılım oldukça kullanışlı olmaktadır. Müşteriye hizmet süresinin belirsiz olduğu durumlarda bu belirsizlik çoğu zaman yakın bir biçimde üstel dağılım gösterebilir. 192 Ek6.6 BİNOM DAĞILIMININ NORMAL DAĞILIMA YAKLAŞIMI X, tesadüfi değişkeni binom dağılım gösteren bir kesikli değişken olsun. X değişkeninin olasılık fonksiyonu, n f(x)=Pr{X=x}= p x (1 p) n x dir. n ve x’in stirling formülünün uygulanmasına imkan verecek kadar x büyük olduğunu varsayalım: n!= 2 n n Pr{X=x}= 1 2 e n x!= 2 x , x 1 2 e x bu durumda; n! p x (1 p) n x (n x)!x! 2 n = 2 (n x) n = n 2 (n x) n x n 1 2 e n 1 2 e( n x) x 1 2 n x 1 2 x x 1 2 2 x x 1 2 e x p x (1 p) n x her iki tarafı n n 1 np(1 p) Pr{X=x}= 2 (n x) n n1 p x (1 p) n x n x 1 2 x x 1 2 p x 1 2 (1 p) np(1 p) ile çarpalım. n x 1 2 x np p x 1 p n x 2 = olarak bulunur. Burada u= dönüşümü ( ) 2( ) nx 2 x np(1 p) 1 1 yardımıyla, x=np+u np(1 p) n-x=n-np-u np(1 p) elde edilir. Bu değerleri yukarıdaki eşitlikte yerlerine koyalım ve (1-p)=q olarak yazalım. n n1 p npq PrX x ( ) npu 2 np u npq = 1 1 2 (1 u q / np ) q nq u npq nqu npq1/ 2 npq1/ 2 npu npq1 / 2 x 1 (1 u p / nq ) nqu npq1 / 2 elde edilir. A (1 u q / np ) npu npq1 / 2 x(1 u p / nq ) nqu npq1 / 2 olsun. log A (np u npq 1 / 2) log(1 u q / np ) (nq u npq 1 / 2) log(1 u p / nq ) Burada her iki logaritmik fonksiyonu seriler halinde geliştirirsek, n olduğu da dikkate alındığında, 193 log A (np u npq 1 / 2)(u q / np u 2 q / 2np ....) (nq u npq 1 / 2)(u p / nq u 2 p / 2nq ...) = npu q / np u 2 q 1 / 2u q / np nqu p / nq u 2 p (1 / nq)u p / nq = npu q / np nqu p / nq u 2 q u 2 p u 2 q / 2 u 2 p / 2 u 2 2 p q log A u 2 2 elde edilir ve eu 2 /2 A bulunur. Şimdi bu değerleri dikkate alarak, 1 1 1 u 2 / 2 npq Pr X x x e 2 A 2 1 2 e ( x np) 2 2 npq , u Pr X x x np olduğundan, npq 1 npq 2 e ( x np) 2 2 npq Binom dağılımında np ve 2 np1 p olduğundan, Pr X x f x 1 2 e 1 x 2 ( ) 2 olarak elde edilir. Şu halde binom dağılım ortalaması np, varyansı npq olmak üzere bir normal dağılıma yaklaşır. n’in büyük olduğu durumda Binom olasılık fonksiyonu aracılığıyla ilgilenilen olasılıkların hesaplanması oldukça güçleşir. Dolayısıyla binom bir dağılım gösteren X kesikli tesadüfi değişkeni için p q ise, dağılımın simetrik olduğunu bilinmektedir. Şu halde n’in büyük olduğu durumda p ile q birbirlerine yakın iseler binom dağılımı yaklaşık olarak normal dağılıma benzeyecektir. Bu durumda X tesadüfi değişkeninin sürekli bir değişken halini aldığını düşünerek ilgilenilen olasılıkların hesaplanmasında normal dağılımdan yararlanırız. 194