2 ÖNSÖZ Đstatistik Laboratuarı 1990 yılından itibaren bölümümüz müfredatında yer alan derslerden birisidir. O yıllarda: “… yürütmekte olduğumuz bu laboratuar çalışmalarında, yer ve alet imkansızlıklarına rağmen öğrencilerimizin büyük bir istekle deneyleri yaptıkları ve değişik bir bilgi elde etmenin mutluluğu ile çalışmalarını yürüttüklerini gözlüyoruz. Önümüzdeki yıllarda daha geniş mekanlarda her öğrenciye bir bilgisayar düşecek şekilde her yıl için en az bir laboratuar dersinin yer aldığı bir programın özlemi ve gerçekleşeceği inancı içindeyiz…” demişiz. Evet, bugün bilgisayar problemimiz yok, ancak mekân sıkıntısı anlatılacak gibi değil ve yakında çözülecek gibi görünmüyor. Tüm sıkıntılara rağmen deneylerimizi ve çalışmalarımızı yapmaya devam edeceğiz. Bu laboratuar kılavuzu ĐST 251 Đstatistik Laboratuarı deneyleri için hazırlanmıştır. Buradaki deneyler ve çalışmaların amacı, şu ana kadar görülen derslerin çerçevesinde, rasgelelik olgusunun anlaşılması ve anlatılması (modellenmesi) problemini kavratabilmek, öğrenilen temel bilgileri pekiştirmek ve ileride öğrenilecek istatistik kavram ve yöntemleri öğrenmede kolaylık sağlayacak sezgisel bir altyapı oluşturmaktır. Bu laboratuar kılavuzunun istatistik kavramlar ve yöntemler öğreten bir kitap olmadığını; deneyler yapmanızı, grafikler çizmenizi, bilgisayar programları yazmanızı, istatistik paket programları çalıştırmanızı, veri analizi ve yorumlar yapmanızı, üstelik bunları kendi gayretinizle yapmanızı isteyen bir rehber olduğunu unutmayın. 1) Laboratuara hazırlıklı gelin. Yapacağınız laboratuar çalışmasıyla ilgili ön bilgileri kitaplar ve ders notlarından okuyun. 2) Laboratuar kılavuzundaki bilgisayar programlarını gözden geçirin ve çalışır hale getirin. 3) Yanınızda cetvel, kurşun kalem, silgi ve bilgisayar bulundurun. 4) Laboratuar çalışmalarınızı mümkün olduğunca sessiz ve bireysel yürütünüz. Bitiremediğiniz deney veya raporlarınızı evde tamamlayınız. Birçok kusurunun var olacağını doğal karşıladığımız bu laboratuar kılavuzunun iyileştirilmesi hususunda öğrencilerle meslektaşlarımız tarafından gelecek her türlü öneri ve eleştiri için önceden teşekkür eder öğrencilerimize çalışmalarında başarılar dileriz. 10 Ağustos 2011 Ankara 3 ĐÇĐNDEKĐLER Sayfa GĐRĐŞ LABORATUAR ÇALIŞMASI 1 Olgu-Deney-Model-Benzetim (Simülasyon)………………….…..…….. 6 LABORATUAR ÇALIŞMASI 2 Bazı Modelleme Örnekleri …..…………………………..…………...… 17 LABORATUAR ÇALIŞMASI 3 Rasgele Sayılar ve Üretimi ……………………………………………… 28 LABORATUAR ÇALIŞMASI 4 Olasılık Dağılımlarından Sayı Üretme ……….…. ……………………… 39 LABORATUAR ÇALIŞMASI 5 Bir Boyutlu Kesikli Dağılımlar ………………………………………….. 45 LABORATUAR ÇALIŞMASI 6 Poisson Dağılımı ve Uygulamaları …………………………………….... 65 LABORATUAR ÇALIŞMASI 7 Bir Boyutlu Sürekli Dağılımlar ……….………………………………….. 67 LABORATUAR ÇALIŞMASI 8 Üstel ve Gamma Dağılımı. Güvenilirlik Analizi.………..………….…….. 75 LABORATUAR ÇALIŞMASI 9 Normal Dağılım ve Uygulamaları …….…………………………………. 91 LABORATUAR ÇALIŞMASI 10 Çok Boyutlu Dağılımlar. Marjinal ve Koşullu Dağılımlar ……………… 102 LABORATUAR ÇALIŞMASI 11 Bağımsız Rasgele Değişkenlerin Toplamı ve Ortalaması.……..…………. 112 LABORATUAR ÇALIŞMASI 12 Büyük Sayılar Kanunu ………………………………………………....…. 119 LABORATUAR ÇALIŞMASI 13 Merkezi Limit Teoremi…..……………………………………………….. 128 4 Giriş DERSIN KODU ĐST 251 DERSIN ADI Đstatistik Laboratuvarı I DERSIN TÜRÜ Zorunlu DERSIN SINIF VE DÖNEMĐ 2.sınıf / Güz DERSĐN VERĐLDĐĞĐ BÖLÜM Đstatistik DERSĐN KREDĐSĐ: (0,0,2)1 4 AKTS DERSĐ VEREN ÖĞRETĐM ÜYESĐ/ÜYELERĐ DERSĐN AMACI,ÖĞRENĐM HEDEFĐ, ÖĞRENĐM METODU, ÖĞRETME VE ÖĞRENME MATERYALĐ Đstatistik eğitiminin amacı olan rasgelelik olgusunun modellenmesi problemini öğrencilere kavratabilmek, birinci sınıfta edinilen temel istatistik bilgilerini pekiştirmek ve ileride öğrenilecek istatistiksel kavram ve yöntemleri anlamada kolaylık sağlayacak bir alt yapı oluşturmak. 1) DERSĐN AMACI 2) DERSĐN ÖĞRENĐM HEDEFLERĐ KAZANDIRILAN BĐLGĐ KAZANDIRILAN BECERĐ 3) ÖĞRETĐM METODU 4) ÖĞRETME MATERYALI 5) DERSĐN ÖLÇME VE DEGERLENDĐRME YÖNTEMLERĐ Örnek uzay, olay, olasılık ölçüsü, olasılık uzayı, rasgele değişken, olasılık (yoğunluk) fonksiyonu, dağılım fonksiyonu, beklenen değer, varyans v.s. gibi kavramlar. Lisans öğrenimi boyunca kullanılacak temel kavramların pekiştirilmesi ve istatistik yöntemlerin deney ortamında öğrenilmesi. Gerçek ve sanal deneyler yapmak. Değişik deney araç ve gereçleri, bilgisayar. Laboratuar kılavuzundaki ödev ve deney sonuçlarının haftalık değerlendirilmesi, ara sınav ve dönem sonu sınavı 5 DERS PLANI VE ĐÇERĐĞĐ HAFTA Laboratuar Çalışmasının Konusu 1 Deney-model-benzetim (simülasyon). Dik atış: modellenmesi ve benzetimi. Tazı-tavşan kovalamacası. 2 Bazı modelleme örnekleri. Rasgelelik içeren olguların modellenmesi. 3 Rasgele sayılar ve üretimi. 4 Olasılık dağılımlarından sayı üretme. 5 Bir boyutlu kesikli dağılımlar. 6 Poisson dağılımı ve uygulamaları. 7 Bir boyutlu sürekli dağılımlar. 8 Üstel ve Gamma dağılımı. Güvenilirlik analizi. 9 Normal dağılım ve uygulamaları. 10 Çok boyutlu dağılımlar. Marjinal ve koşullu dağılımlar. 11 Bağımsız rasgele değişkenlerin toplamı ve ortalaması. 12 13 14 Büyük Sayılar Kanunu Merkezi Limit Teoremi Ara Sınav F. Öztürk, L. Özbek ve F.M. Kaya (1993) Đstatistik Laboratuarı I, Ankara. KAYNAKLAR F. Öztürk (2011) Olasılık ve Đstatistiğe Giriş I, Gazi Kitabevi, Ankara. ĐST 101, ĐST102 ve ĐST201 Ders Notları. Ara sınav ve dönem sonu sınavı. Sınavlar yazılı veya deneysel SINAVLAR olarak yapılır. Laboratuar kılavuzundaki ödev ve deney sonuçları ile ilgili değerlendirmeler başarı notuna katkıda bulundurulur. 6 Laboratuar Çalışması 1 Olgu-Deney-Model-Benzetim (Simülasyon) Aklımız ile gerçek dünyadaki olguları anlamaya ve anlatmaya çalışırız. Bu anlamaanlatma işine modelleme ve anlatımın kendisine de model denir. Modellemede, dilden sonra, aklımızın kullandığı ifade araçlarından en önde gelenleri matematik ve istatistiktir. Model, gerçek dünyadaki bir olgunun ilgili olduğu bilim sahasının (fizik, kimya, biyoloji, jeoloji, astronomi, ekonomi, sosyoloji,...) kavram ve kanunlarına bağlı olarak ifade edilmesidir. Model gerçek dünyadaki bir olgunun bir anlatımıdır, bir tasviridir. Gerçek dünyanın çok karmaşık olması sebebiyle modeller, anlatmak istedikleri olgu ve sistemleri basitleştirerek belli varsayımlar altında ele almaktadır. Modeller gerçeğin kendileri değildir ve ne kadar karmaşık görünseler de gerçeğin bir eksik anlatımıdırlar. Model denilen şey model kurucunun gerçeği anlayışının bir ürünüdür, bir sanıdır. Simülasyon (benzetim) model üzerinde olgunun irdelenmesidir, “model üzerinde deney yapmaktır” diyebiliriz. Simülasyon yoluyla elde edilen verilere sanal veri diyelim. Sanal veriler, olgunun gerçeğinden elde edilen verilere (gözlemlere) benzemektedir, maket modellerde olduğu gibi. Olguları modellemede düşünce tarzı aşağıdaki gibidir. Gerçek Dünya Olgu Veri (Data) Model Matematik çözümleme Đstatistik çözümleme Ölçme Sonuç çıkarım Bir modelin yararlı olması için verilerden, sonuçların nasıl çıkarılacağına dair bir çözüm yönteminin bilinmesi gerekir. Örneğin belli bir olgu bir diferansiyel denklem ile modellendiğinde bu denklemin çözüm yolunun da bilinmesi gerekir. Bu, matematiğin bir sorunudur. Eğer model stokastik ise çözümleme istatistiğin bir sorunudur. Verilerin nasıl toplanacağı da istatistiğin bir sorunudur. Kısaca, istatistik yukarıdaki döngünün her safhasında yer almaktadır. Olguya temas ölçme ile olmaktadır. Ölçme, içinde istatistik de barındıran başlı başına bir konudur. Fizik, kimya, biyoloji, jeoloji, astronomi, ekonomi, sosyoloji ve başka birçok bilim dalının gerçek dünyada ilgilendiği kendi konuları (sahaları) vardır ve çoğunun arakesiti boş değildir. Matematik ve Đstatistiğin gerçek dünyada bir konusu olmamasına rağmen, gerçek dünyadaki olguları anlama ve anlatmada, yani modellemede insan aklının en güçlü iki aracı matematik ve istatistiktir. Đstatistik, rasgelelik içeren olguların modellenmesinde öne çıkmaktadır. Bu laboratuar çalışmasında sebep-sonuç ilişkileri kesin, başka bir ifade ile deterministik modelleri ele alacağız. 7 Dik Atış Yukarıya doğru atılan bir cismin hareketini ele alalım. Ölçümler mks sisteminde yapılsın, yani uzunluğun birimi metre (m), kütlenin birimi kilogram (kg) ve zamanın birimi saniye (s) olsun. Hareketin doğrusal, hava ile sürtünme olmadığı ve yerçekimi ivmesinin yükseklikle değişmediği gibi bazı varsayımlar yaparak ve Newton prensiplerinden 1. Eylemsizlik prensibi, 2. Etki-tepki prensibi, 3. Momentum prensibi, Fdt = dmv , F = m dv = ma dt faydalanarak hareketi matematiksel olarak modellemeye çalışalım. Hareketi, yeryüzüne dik bir eksen üzerinde irdeleyelim. Yerçekimi kuvveti P , yerçekimi kuvvetinin büyüklüğü P = mg olmak üzere, t = 0 anında cismin konumu y (0) = 0 ve hızı v(0) = v0 olsun. Bir t anında cisme etki eden kuvvet, sadece yerçekimi kuvveti P olmak üzere, F = P eşitliğindeki kuvvetlerin büyüklükleri için y ekseninin yönü de göz önüne alınarak, ma = − mg dv = −g dt d2y = −g dt 2 veya y ′′(t ) = − g yazılır. Başlangıç değerlerle birlikte, y ′′(t ) = − g y (0) = 0 , y '(0) = v0 diferansiyel denklemi, hareketin matematiksel bir anlatımıdır, yani bir matematiksel modeldir. 8 Diferansiyel denklem kavramı matematiğin bir kavramıdır. Bu denklemi çözmeye çalışalım. Denklemin her iki yanında, t t 0 0 ∫ y ′′(t )dt = −∫ gdt integrallerinin alınmasıyla, y ′(t ) = − gt + v0 elde edilir. Böylece, t anında cismin hızını veren formülü elde etmiş olduk. Cismin konumu için, t t 0 0 ∫ y ′(t )dt = ∫ (− gt + v 0 )dt ve 1 y (t ) = − gt 2 + v0 t 2 formülü elde edilir. Hareketin yol-zaman ve hız-zaman grafikleri, gibidir. Yol-zaman grafiğinde t1 den t 2 anına kadar geçen zaman aralığındaki yol miktarı y (t 2 ) − y (t1 ) farkına eşittir. Bu yol miktarının hız-zaman grafiğindeki karşılığı taralı alana eşittir. Yol-zaman grafiği ya da hız-zaman grafiği de tek başına bu hareketi anlatmaktadır. Dolayısıyla bunlar da hareketin birer matematiksel modelidir. Modelden, cismin ne kadar bir yüksekliğe çıkabileceği, ne kadar bir zaman sonra yere düşeceği, yere düştüğü andaki hızı, belli bir anda bulunduğu konumu ve hızı gibi hareket ile ilgili sonuçlar elde edilebilir. Bu sonuçlar deney sonuçları ile karşılaştırılarak modelin geçerliliği sınanır. Modelin verdikleri ile gerçek dünyada olup bitenlerin tamamıyla aynı olduğu söylenemez. Modeller, gerçek olguların eksik birer anlatımıdır. Örneğin, başlangıç anında modelin anlattığına göre hız aniden v0 değerine ulaşmaktadır. Bu gerçeğe ters düşmektedir. Cisim atılırken neler olmaktadır? Bunu da göz önüne alarak bir model nasıl kurulabilir? Yeryüzüne dik doğrultuda atılan bir cismin hareketini gözlemlemek, bazı ölçümler almak bir deneydir. Zamana bağlı olarak konum hesaplaması yapıp, bir kâğıda çizili bir eksen üzerinde işaretlenen bir noktanın hareketini izlemek dik atışın kâğıt üzerinde bir simülasyonudur (benzetimidir). Bunu, bir monitörde yapmak bir bilgisayar simülasyonudur. QBASIC dilinde yazılmış aşağıdaki gibi bir bilgisayar programıyla dik atışın görüntülü bir simülasyonu (animasyon) yapılabilir. 9 SCREEN 12 WINDOW (-10, 250)-(10, -10) LINE (-10, 0)-(10, 0) INPUT "Başlangıç hızı="; vo INPUT "deltat="; deltat FOR t = 0 TO 2 * vo / 9.81 STEP deltat y = vo * t - (1 / 2) * 9.81 * t ^ 2 IF t<vo/9.81 THEN CIRCLE (0, y) , 0.1 , 2 ELSE CIRCLE (0, y) , 0.1 , 0 END IF NEXT t Serbest Düşme Belli bir h yüksekliğinden düşen cismin hareketini modellemeye çalışalım. Dik atıştakine benzer varsayımlar ve düşüncelerle, y′′(t ) = g y (0) = 0 , y ′(0) = 0 diferansiyel denklemine ulaşılır. Bu denklemin çözülmesiyle, y (t ) = 12 gt 2 bulunur. Buna göre, cismin yere düşünceye kadar geçirdiği zaman süresi, 2 * 1 2h / g 2 gt = h ⇒ t = ve yere düştüğü andaki hızı, v(t * ) = y ′(t * ) = gt * = 2 gh olarak bulunur. 1000 metre yükseklikten yeryüzüne sürtünmesiz düşen bir cismin uygun bir koordinat sisteminde hız-zaman ve yol-zaman grafiklerini çiziniz. Cismin yere düşünceye kadar geçirdiği zaman süresini ve yere düştüğü andaki hızını hesaplayınız. Yerçekimi 10 ivmesini 9.81 m / sn 2 alınız. Bu hareketin simülasyonunu yapan bir bilgisayar programı yazınız ve işletiniz. Sürtünmeli Düşme Hareketi 11 Şimdi, cismin hareketinde hava ile sürtünme de gözönüne alınsın. Diğer varsayımlar dik atıştaki gibi kalsın. Cisme etki eden kuvvetler için F = P − Fs yazılabilir. Sürtünme kuvvetinin yönü hareketin ters yönünde olduğu açık, ancak büyüklüğü nedir? Sürtünme kuvvetinin büyüklüğünün hızın büyüklüğü ile orantılı olduğu varsayılırsa, my ′′(t ) = mg − ky ′(t ) yazılabilir. Böylece, y ′′(t ) + k y ′(t ) = g m y (0) = 0 , y ′(0) = 0 modeli oluşturulabilir. Buradan, k m2 −mt m m2 y (t ) = g 2 e + g t − g 2 k k k bulunur. Yol formülünde türev alınırsa, cismin hızı için y ′(t ) = v(t ) = − g k m −mt m e +g k k elde edilir. Her ne kadar hareket sonsuza kadar sürmese de, m −kt m m lim − g e m + g = g t →∞ k k k limiti, zaman ilerledikçe düşen cismin hızının sabitleşeceğini söylemektedir. Gerçek dünyada bu sabitleşme k ve m sabitlerine bağlı olmakla birlikte, kısa bir zamanda gerçekleşmektedir. Yani kısa bir zaman sonrası düşen cismin hızı limit değere ulaşmakta ve sabitleşerek daha fazla artmamaktadır. Yağan yağmur taneciklerinin veya paraşütle yüksekten atlayan birisinin yeryüzüne düştüğündeki hızının büyük olmaması bundan olsa gerek. Aşağıdaki Matlab programını işletiniz. Sürtünme katsayısının değişik değerlerinde, sürtünmeli hareketi (mavi çizgi) gözleyiniz. 12 clc clear all close all axis ( [0 500 0 1000]) k=0.3; y0=1000; g=-9.81; hold on for i=1 : 500 t(i)=i*.1; y1(i)=y0+0.5*g*(t(i)^2); y2(i)=y0+g*(1/k^2)*exp(-k*t(i))+g*(1/k)*t(i)-g*(1/k^2); if (y1>0) h1=plot(y1, 'r');%sürtünme yok set(h1,'EraseMode', 'none'); drawnow; end if(y2>0) h2=plot(y2, 'b');% sürtünmeli set(h2,'EraseMode', 'none');drawnow; end end Not: Yatay eksen zamanı temsil etmektedir (gerçek zaman değil). Tazı-Tavşan Kovalamacası Bir tazının bir tavşanı gördüğü doğrultu ve yönde kovaladığını, tavşanın dosdoğru yuvasına doğru kaçtığını ve her ikisinin de koşabilecekleri en büyük hızları ile yorulmadan koştuklarını varsayalım. Tavşan kendi yuvasının 100 metre doğusunda bulunsun ve her ikisi de birbirini aynı anda fark etsin. Tazının konumu, Durum 1: tavşanın 100 metre batısında, Durum 2: tavşanın 100 metre güneyinde, Durum 3: tavşanın 100 metre güney batısında, olsun. Tazının ( □ ) tavşanı ( △ ) yuvasına ( ○ ) varmadan önce yakalaması için hızının büyüklüğü tavşanınkinin kaç katı olmalıdır? Başka bir ifade ile hızların büyüklükleri oranı ne olmalıdır? Durum 1 Durum 2 Durum 3 Tavşanın hızını V1 ve tazının hızını V2 vektörü ile gösterelim. Birinci durumda, tazının tavşanı yakalaması için V2 > 2V1 olması gerektiğini hemen söyleyebiliriz. Durum 2 de tazının yörüngesi bir doğru parçası olmayacaktır (aşağıdaki gibi bir eğri olabilir). Tazının hızının büyüklüğü sabit olup doğrultusu her an değişecektir. Tavşanı gördüğü yere doğru koşması matematik dilinde ne anlama gelmektedir? 13 Birinci durumdaki koşma olgusunu biraz daha yakından irdeleyelim. Tazının hızı V2 = 20 metre/saniye ve tavşanın hızı V1 = 15 metre/saniye olsun. Küçük ∆t ( ∆t =0,1) gibi zaman aralıkları sonunda tazı ile tavşanın konumlarını bir eksen üzerinde işaretleyerek hareketin gelişimini izleyebiliriz. Her ∆t zaman aralığında birer adım attıklarını düşünürsek, tazının adım uzunluğu 2 metre ve tavşanın adım uzunluğu 1,5 metre olmak üzere, ilk üç işaretleme sonunda tazı ile tavşanın konumları aşağıdaki gibi olur. Đkinci ve üçüncü durumlar için ∆t gibi küçük zaman aralıkları içinde hareketin sabit hızla (doğrultu, yön ve büyüklük olarak) yapıldığını düşünerek Durum 1 deki gibi bir işaretleme ile hareketin gelişimini izleyebiliriz. Kovalamacadaki heyecanı yaşayabilmek için aşağıdakileri adım adım kendiniz de çiziniz. 14 Zaman aralığı ∆t ‘yi küçük tutarsak, yaptığımız çizimlerle hareket olgusuna daha iyi yaklaştığımızı söyleyebiliriz. Yeterli gördüğümüz küçük bir ∆t seçip, değişik V2 / V1 oranları için tavşanın yakalanıp yakalanmadığını görebiliriz. Çizerek deneyin. 15 Şimdiye kadar elle yaptığımız bu çizimleri bir bilgisayara yaptırmaya kalkışsak, nasıl olur? Örneğin, Durum 2 de tazının hızı V2 = 20 (m/sn), tavşanın hızı V1 = 15 (m/sn) ve ∆t zaman aralığı 0.2 ve 0.01 olduğunda bilgisayarda çizilen yörüngeler, 80 80 60 60 y 100 y 100 40 40 20 20 0 0 0 50 x 100 0 50 x 100 dır. Bu çizimlere benzer çizimleri, çok kolay bir programlama dili olan QBASIC dilinde, aşağıdaki programı işleterek bilgisayarınızda yapabilirsiniz. CLS : SCREEN 12 WINDOW (-10, 110)-(110, -10) LINE (-10, 0)-(110, 0) LINE (0, 110)-(0, -10) CIRCLE (100, 100), 1 INPUT "tavsanin hizini giriniz, v1=", v1 INPUT "tazinin hizini giriniz,v2=", v2 INPUT "deltat degerini giriniz, deltat=", deltat x1 = 0: y1 = 100: x2 = 0: y2 = 0 10 PSET (x1, y1): PSET (x2, y2) x1 = x1+deltat * v1: y1 = 100 x2 = x2+deltat*(x1 - x2)/SQR((x1 - x2)^2 +(y1 - y2)^2)*v2 y2 = y2+deltat*(y1 - y2)/SQR((x1 - x2)^2 +(y1 - y2)^2)*v2 IF SQR((x1 - x2)^2+(y1 - y2)^2)<.001 THEN 20 IF x1>100 THEN 30 GOTO 10 20 PRINT "tavsan yakalandi":GOTO 40 30 PRINT "tavsan kurtuldu" 40 END Küçük bir ∆t seçip değişik V2 / V1 oranları için bilgisayar programını işleterek tavşanın yakalanıp yakalanmadığını gözleyiniz. V2 / V1 oranı hangi sayıdan büyük olduğunda tavşan yakalanmaktadır? Belirlemeye çalışınız. 16 Kaynak: Bir Tazı-Tavsan Kovalamacası http://80.251.40.59/science.ankara.edu.tr/ozturk/Yazilar/Lise/TaziTavsan.doc 17 Laboratuar Çalışması 2 Bazı Modelleme Örnekleri Aklımız ile gerçek dünyadaki olguları anlamaya ve anlatmaya çalışırız. Bu anlamaanlatma işine modelleme ve anlatımın kendisine de model denir. Önceki laboratuar çalışmasında, y ′′(t ) = − g y (0) = 0 , y '(0) = v0 gibi bir diferansiyel denklemin (türev bulunduran denklem) dik atış hareketini modellediğini (anlattığını) gördük. Ayrıca, * Deterministik (sebep-sonuç ilişkileri kesin) * Stokastik (rasgelelik içeren) modellerden söz ettik. Yukarıdaki model deterministik bir modeldir. Bu laboratuar çalışmasında bazı stokastik model örnekleri üzerinde duracağız. Elektronik Parçaların Dayanma Süresi Dayanma süreleri rasgele olan belli bir tür elektronik parça için bozulma oranının (beli bir zamana kadar dayanan parçalardan bir birim zaman aralığında bozulanların oranı) sabit kaldığı gözlenmiş olsun. T rasgele değişkeni dayanma süresi olmak üzere, bozulma oranı ile ilgili söylenen matematiksel olarak ifade edilirse, lim ∆t →0 P (t < T ≤ t + ∆t / T > t ) =c ∆t P (t < T ≤ t + ∆t ) ∆t → 0 ∆t =c P (T > t ) lim lim ∆t → 0 F (t + ∆t ) − F (t ) ∆t =c 1 − F (t ) F ′(t ) =c 1 − F (t ) 18 f (t ) =c 1 − F (t ) yazılır. Burada F, f sırasıyla T nin dağılım ve yoğunluk fonksiyonunu göstermektedir. F ′(t ) = r (t ) 1 − F (t ) diferansiyel denkleminin F (0) = 0 başlangıç değerine bağlı çözümü t ∫ − r ( t ) dt F (t ) = 1 − e 0 dır. Buna göre, ce − ct , t > 0 f (t ) = , d.y. 0 olarak elde edilir. Dayanma süresi üstel dağılıma sahiptir. Başka bir ifade ile bu parçaların dayanma süresi üstel dağılım ile modellenmektedir (anlatılmaktadır). Bu modelde c sabitinin değerinin bilinmesi gerektiğine dikkat edin. Parçaların dayanma süresinin beklenen değeri (ortalaması) ve varyansı, 1 1 E (T ) = , Var ( X ) = 2 c c dır. F ve f fonksiyonlarının grafikleri şekildeki gibidir. Sürekli bir rasgele değişkenin belli bir aralıkta olması olasılığı dağılım fonksiyonunda yorumlandığında, aralığın uç noktalarında fonksiyon değerleri arasındaki fark (grafikte yükseklik), yoğunluk fonksiyonunda yorumlandığında, bu aralığın üzerinde yoğunluk fonksiyonunun integrali (grafikteki alan) olmaktadır. Bu düşünce tarzı yol-zaman ve hızzaman grafiklerinde de aynıdır. Yol-zaman grafiğinde fonksiyon değerleri arasındaki fark ve hız-zaman grafiğinde belli bir aralığın üzerindeki alan yol miktarını anlatmaktadır. 19 Basamak fonksiyonu biçiminde olan dağılım fonksiyonları basamakların bulunduğu noktalarda, basamak yükseklikleri büyüklüğünde olasılıklar bulunan kesikli olasılık dağılımlarının anlatımında kullanılmaktadır. Basamak fonksiyonu biçiminde olan bir yolzaman grafiğinin (fonksiyonunun) anlatmak istediği hareket nasıl bir şey olabilir? Bir örnek verin. Düzgün Bir Tavla Zarının Atılması Deneyi Düzgün bir tavla zarının atılması ve üste gelen yüzeyin gözlenmesi deneyinde örnek uzay, Ω= olmak üzere, tüm olaylar ile ilgilendiğimizde sigma cebir U = 2Ω olur. Zar düzgün olduğunda, P :U → R n( A) A → P ( A) = n(Ω) olasılık ölçüsü kullanılabilir. Özetlersek, bu deney Ω= Olasılık Uzayı ile modellenebilir (anlatılabilir). , U = 2Ω , P ( A) = n( A) n(Ω) 20 X rasgele değişkeni üste gelen yüzeydeki nokta sayısı olsun. Ω= X R 0 1 2 3 4 5 6 7 X rasgele değişkeni’nin dağılım fonksiyonu, F : R → [0,1] x → F ( x) = P ( X ≤ x ) 0 , x <1 x F ( x) = P( X ≤ x) = , 1≤ x < 6 6 x≥6 , 1 ve grafiği, F(x) 1 5/6 4/6 3/6 2/6 1/6 1 2 x 3 4 5 6 7 dır. X in olasılık fonksiyonu, f ( x) = P( X = x) = 1 , x ∈ DX = {1, 2,3, 4,5, 6} 6 ve grafiği, grafik ( f ) = {( x, f ( x)) : x = 1, 2,3, 4,5, 6} f(x) 1/6 • • • • • • 1 2 3 4 5 6 olmak üzere, bu grafik x 21 f(x) 1/6 x 1 2 3 4 5 6 biçiminde de gösterilir. Okların yükseklikleri o noktalardaki olasılıkları göstermektedir. Dağılım fonksiyonunda ise basamakların yükseklikleri olasılıkları göstermektedir. Suda Çözülen Madde Miktarı x C sıcaklıkta 100 gr su içinde çözülen bir maddenin kütlesi ( y ) aşağıdaki gibi gözlenmiştir. 10 20 30 30 40 40 40 50 60 60 y (gr) 59 65 68 70 73 74 75 81 92 93 xoC Bu gözlemlere dayanarak y ile x arasında bir bağıntı araştıralım. Gözlemlerin bir x O y koordinat sistemindeki görüntüsü (serpilme diyagramı) aşağıdaki gibidir. Belli bir x sıcaklığında 100 gr su içinde çözülen madde miktarı için farklı farklı değerler gözlenebilmektedir. Bu sebeple çözülen madde miktarını bir Y rasgele değişkenin aldığı değer olarak görebiliriz. Belli bir x değerinde Y rasgele değişkeninin ortalaması (koşullu ortalaması) µY / x = E (Y / x) olmak üzere, E (Y / x) = a + bx varsayımı altında, Yi = a + bxi + ε i , i = 1, 2,...,10 22 denklemini (regresyon modelini) göz önüne alalım. Burada a ve b katsayılarını 10 10 i=1 i=1 ∑ εi2 = ∑ [ yi − (a + bxi )] 2 εi ‘ler birer rasgele değişkendir. hata kareler toplamı minimum olacak şekilde belirlediğimizde, 10 bˆ = ∑ (x i =1 i − x )( y i − y ) 10 ∑ (x i =1 i − x) = 0.661 2 aˆ = y − bˆx = 49.881 bulunur. Bu katsayılar, gözlem noktalarının arasından gözlemlere yakın olacak şekilde çizilen doğrunun eğimini ve ordinatı kestiği noktayı göstermektedir. µˆY / x = 49.881 + 0.661x denklemi yardımıyla belli x sıcaklığında 100 gr su içinde çözülen ortalama madde miktarını tahmin edebiliriz. Buna tahmin denklemi diyelim. C1 10 20 30 30 40 40 40 50 60 60 C2 59 65 68 70 73 74 75 81 92 93 Regression Analysis: C2 versus C1 The regression equation is C2 = 49,9 + 0,661 C1 S = 2,56938 Coef 49,881 0,66102 SE Coef 2,168 0,05289 T 23,01 12,50 P 0,000 0,000 R-Sq = 95,1% S c a tte r p l o t o f C 2 v s C 1 95 90 85 80 C2 Predictor Constant C1 75 70 65 60 55 10 20 30 40 C1 50 60 23 xO y koordinat sistemindeki serpilme diyagramındaki ( xi , yi ) noktaları, z i = xi2 dönüşümü sonucu, ( zi , yi ) noktaları olarak zOy koordinat sisteminde yeniden işaretlendiğinde aşağıdaki gibi bir serpilme diyagramı ortaya çıkmaktadır. Bu serpilme diyagramına bakıldığında, E (Y / z ) = c + dz ve Yi = c + dzi + δi , i = 1, 2, ...,10 gibi bir model uygun görünmektedir. Katsayılar, 10 10 i=1 i=1 ∑ δi2 = ∑[ yi − (c + dzi )] kareler toplamı minimum olacak şekilde belirlendiğinde, tahmin denklemi µˆY / z = 60 + 0.00893z µˆY / x = 60 + 0.00893x 2 olarak elde edilir. Her iki model için 10 ˆ ) ∑ yi − (aˆ + bx i 2 = 52.8 i=1 10 2 y − (cˆ + dx ˆ 2 ) = 14.2 ∑ i i i=1 olmak üzere, bu değerlere göre ikinci model daha iyi görünmektedir. 2 24 ĐST251 dersini alan öğrenciler için boy uzunluğuna bağlı olarak ağırlığı veren bir bağıntı bulmaya çalışınız. 25 Top Çekme Deneyleri Đçinde 5 beyaz, 3 mavi ve 2 sarı top bulunan bir torbadan rasgele bir top çekilmesi ve renginin gözlenmesi deneyinin örnek uzayını yazınız. Bu deney ile ilgili bir olay tanımlayınız. Deneyi bir kez yapınız. Tanımladığınız olay gerçekleşti mi? Çekilen topu torbaya geri atarak ard arda 3 top çekilmesi deneyinin örnek uzayını yazınız. Bu deney ile ilgili bir olay tanımlayınız. Deneyi bir kez yapınız. Tanımladığınız olay gerçekleşti mi? Torbadan 3 topun aynı anda (çekileni yerine koymadan ) çekilmesi deneyinde örnek uzayı yazınız. Bu deney ile ilgili bir olay tanımlayınız. Tanımlanan olay gerçekleşti mi? Yukarıdaki deneyleri en az 20 kez tekrarlayınız ve gelen beyaz topların sayılarını kaydediniz. Bu sayıların kaç kez geldiğini ve gözlenen sıklıklar (frekanslar) için bir grafik (çubuk diyagramı) çiziniz. Gelen beyaz topların sayısının ortalamasını bulunuz. 26 Boncuk Deneyleri Tabanın kenar uzunluğu 20 cm olan bir dik kare prizma içine küçük bir boncuk (yarıçapı çok küçük olan bir bilye) atılması ve düştüğü noktanın gözlenmesi deneyinin örnek uzayını yazınız. Tabana bir üçgen çiziniz. Boncuğun bu üçgenin içine düşmesi olasılığını uygun gördüğünüz bir olasılık uzayında hesaplayınız. Deneyi 50 kez yapınız. Boncuğun, üçgenin içine düşme oranını gözleyiniz ve bu oranı olasılık ile yukarıda hesapladığınız karşılaştırınız. Tabanın köşegenlerinden bir tanesini çiziniz ve deney sonucunda bilyenin düştüğü noktanın çizilen bu köşegene uzaklığını gözleyiniz. Bir rasgele değişken olan bu uzaklığın olasılık dağılımını bulunuz. Deneyi en az 50 kez tekrarlayınız. Gözlenen uzaklıklar için histogram çiziniz. 27 Evde: Bir masada (veya herhangi düz bir zeminde) işaretlenmiş bir nokta üzerine 10 cm yükseklikten bir boncuk bırakınız. Boncuk düşüp konumlandıktan sonra işaretlenmiş olan noktaya uzaklığını gözleyiniz (ölçünüz). Bunu en az 50 kez tekrarlayınız. Gözlemler için histogram çiziniz. Uzaklığın olasılık dağılımı hakkında ne söyleyebilirsiniz? Uzaklığın ortalaması ve varyansı hakkında ne söylenebilir? 28 Laboratuar Çalışması 3 Bu laboratuarda: 1) Rasgele Rakamlar Tablosu (RRT) 2) (0,1) Aralığından Rasgele Sayı Üretimi 3) Gerçek ve Sanal Deney ile tanışacaksınız. Rasgele Rakamlar Tablosu (RRT) 428553 186157 846880 961690 115400 259683 017488 627678 321483 110756 530576 715740 746000 249016 927425 528532 392120 491924 444132 319011 337798 956550 493572 805497 100590 748564 394596 572560 792905 536690 219844 299936 935326 201723 155422 272754 625130 479450 763156 512328 398592 529365 346804 255658 356124 977200 982230 207767 223855 192603 592214 858416 750335 029617 614796 675484 873144 210914 912862 599449 238585 315625 359612 592751 181410 162965 408123 586412 572018 777506 382604 175093 147775 282387 315513 971757 761695 828251 134099 934677 372967 750855 712653 737241 153352 991487 049221 905558 719157 137551 860682 621103 907876 711821 814726 990553 815785 310487 406848 411654 976927 409567 291738 494433 868338 879778 428690 146965 381879 900936 203198 631810 572948 249092 405866 884142 367940 325861 124368 732234 994087 474823 379009 008300 541048 241431 181606 196119 199029 014147 418472 998489 932945 217910 539610 452228 154461 996114 343786 488428 729848 352688 149926 639924 805119 591423 117498 148510 845972 280062 246813 529428 299325 746498 724368 575452 675599 995735 885100 842099 991521 52894 539822 816621 621194 892568 993559 274102 956565 930864 341212 840400 090997 207582 059399 912220 931874 747833 510318 276034 361543 437182 739118 402303 853487 067952 456736 251527 154909 501948 281978 726291 151596 583984 287854 238706 393336 790214 812939 011379 648993 059349 250596 205509 663809 488748 597666 925877 777180 160036 762545 960366 607938 621588 745474 89690 384330 733872 749607 316255 015349 055553 367653 949097 837618 105962 660118 671589 657529 185105 439117 175415 415283 251636 379447 291330 597009 036413 213835 995199 202594 509360 282807 516767 604359 406172 408802 349400 264975 158455 911482 249332 400977 763131 904544 832384 283015 803979 901212 27947 819001 561513 081027 290721 778844 213097 020088 423523 897533 532191 626165 247072 706366 006290 428226 638969 574229 975327 681379 942418 278733 152620 201723 937060 429485 872008 288322 207609 367800 312924 829433 20635 564946 591077 580089 958739 882699 949747 396929 546337 174536 509131 077110 949874 999576 436620 161770 606842 388329 926846 704251 899559 724315 856797 955997 239469 361147 28819 393365 525083 935560 750052 432324 956409 269976 283512 496412 726944 165466 439144 455763 763144 526123 578518 392594 569247 943382 28628 699720 663656 237840 257262 855174 291014 337415 380602 995854 968238 544041 629716 047380 631149 003491 244421 143457 434574 957207 471418 782022 766418 569411 324843 54263 815933 184143 698729 989084 173858 002268 326715 313953 343644 604392 670594 511778 463190 813713 956760 720821 465200 890577 756109 574099 156878 074215 231305 047769 952891 347449 630701 059559 963966 955462 580850 575731 654230 264574 515901 837859 349097 045983 067787 609350 399508 301831 146160 268906 122211 675375 17622 644317 336005 144634 817307 188572 569832 383258 966669 951686 243930 584291 940329 132010 950272 981936 427918 102659 892512 540124 489401 035721 332287 382819 046963 776010 672991 664791 911504 263235 381454 788809 998810 740735 641185 599986 129631 882568 474869 719744 595774 786280 234912 168055 331046 855426 804037 592390 742308 626896 503243 Kendinize yukarıdaki gibi yarım sayfalık bir RRT hazırlayınız. 29 RRT ile 0, 1, … ,99 sayılarından birinin rasgele seçilmesi deneyini nasıl gerçekleştirebilirsiniz? Elinizdeki RRT yardımıyla 1000 tane 6 rakamlı sayı üretebilir misiniz? Varsa, sorun nedir? 30 (0,1) Aralığından Rasgele Sayı Üretimi “(0,1) aralığındaki reel sayılardan (noktalardan) rasgele bir sayı (nokta) çekme” deneyi yapılabilir mi? Bunu nasıl gerçekleştirebilirsiniz? RRT ile nasıl gerçekleştirebilirsiniz? Aşağıdaki bilgisayar programlarını çalıştırıp çıktılarını gözleyiniz. QBasic Matlab FOR I = 1 TO 20 >> rand(20,1) PRINT RND NEXT I Programı bir kez daha çalıştırınız. Sonuç? Aşağıdaki bilgisayar programlarını birkaç kez çalıştırınız ve çıktıları gözleyiniz. PRINT RND RANDOMIZE 12345 PRINT RND RANDOMIZE TIMER PRINT RND 31 Aşağıdaki çıktıları gözden geçiriniz. >> rand('seed',1234) >> rand ans = 0.9296 >> rand('seed',1234) >> rand ans = 0.9296 >> rand('seed',12345) >> rand ans = 0.8608 >> rand('seed',12345) >> rand ans = 0.8608 >> rand('seed',12) >> rand ans = 0.1549 >> rand ans = 0.5258 >> rand ans = 0.2047 >> rand ans = 0.1405 QBASIC‘deki “RND” veya Matlab’daki “rand” fonksiyonu ( komutu ) nasıl çalışmaktadır? 32 [0,1) Aralığından Rasgele Sayı Üretilmesi “[0,1) aralığındaki reel sayılardan rasgele bir sayı çekilmesi” başka bir ifade ile “[0,1) aralığındaki noktalardan rasgele bir nokta seçilmesi” nasıl gerçekleştirilebilir? Yapılabilir mi sorusunu bir tarafa bırakarak, derinliğine inmeksizin, bunu iki yoldan yapmaya çalışacağız. Biri doğal (gerçek dünyadaki) rasgeleliği kullanarak, diğeri ise aklımızın (soyut) dünyasında bir şeyler yapacağız. Bir tahta üzerine çizilmiş, uzunluğu bir metre olan bir çember milimetre cinsinden ölçeklenmiş olsun. Saat yelkovanı gibi ince uçlu bir ibre bu çemberin merkezi etrafında rahatça döndürülüyor olabilsin. Böyle bir alete “döndürgeç” diyelim. Çevirip, ibre durduktan sonra metre cinsinden okunan sayıyı [0,1) aralığından çekilen bir rasgele sayı olarak düşünebiliriz. Ancak, dikkat edilirse bazı sayılar hiç çekilmeyecektir (gözlenemeyecektir). Ölçeği, milimetrenin alt birimine indirme imkânımız olsa bile ibre ve okuma sorunu ortaya çıkacaktır. Yine de, imkânlar çerçevesinde [0,1) aralığından rasgele sayı çekebildiğimizi düşünebiliriz. Deneyebilirsiniz (evde). 0,1,...,9 rakamlarından birinin rasgele olarak çekilmesi deneyi çok değişik biçimde gerçekleştirilebilir. Örneğin, üzerinde bu rakamlar yazılı 10 tenis topu bir torbaya konup iyice karıştırıldıktan sonra biri çekilebilir. Benzer bir işlem mekanik olarak milli piyango çekilişlerindeki makinelerde yapılmaktadır. 0,1,2,...,9 rakamlarının rasgele üretilmesi problemi çözüldüğünde [0,1] aralığındaki her reel sayının bir ondalık açılımının olduğu göz önüne alınırsa, [0,1] aralığındaki sayılardan birinin rasgele üretilmesi sorunu da çözülebilecek gibi görünmektedir. Ancak, [0,1] aralığındaki reel sayılar ile bunların ondalık açılımları arasındaki bire-bir eşlemeye dikkat edilirse, 1 1 π = 0,333... = 0.3 , = 0.5 = .50 , 0 = 0.0 , 1 = 0.9 , = 1,0471... 3 2 3 olmak üzere 0,1,2,...,9 rakamlarının rasgele üretilmesi ile bir sayı elde etmek için sonsuz tane rakam üretmek gerekecektir. Bunun pratik olarak gerçekleştirilmesi mümkün değildir. Yine de ihtiyaçlarımızı karşılayacak kadar, [0,1] aralığından rasgele sayı çekecek bir yöntem olarak kullanılabilir. Bunu da kolayca deneyebilirsiniz. 33 Düzgün bir paranın atılması deneyinde, yazı gözlendiğinde 0, tura gözlendiğinde 1 rakamları yazılsın. Paranın atılmasıyla 0,1 rakamlarından oluşan belli uzunluklu rasgele diziler elde edilebilir. Böyle bir dizinin elemanları 2-li sayma sisteminde, tam kısmı sıfır olan bir sayının virgülden sonraki basamaklarını doldursun. Bu sayı 10-lu sayma sistemine çevrilebilir. Böylece para atışı ile de [0,1] aralığında sayı üretilebilir. Olgulardaki doğal rasgelelikten faydalanarak rasgele sayı üretmek için pek çok yöntem geliştirilebilir. Milli piyango çekilişlerindeki işlem, hemen hemen hiç kimsede şüphe bırakmayacak şekilde ihtiyacı karşılamaktadır. Ancak zaman açısından hiç de elverişli değildir. Milyarlarca rasgele üretilmiş sayıya ihtiyaç olduğunda böyle bir yöntem, hattâ çekilişleri önceden yapıp, kayda geçirip bu kayıtlardan istifade etmek şeklinde olsa bile, bilgisayarlarda yer tutma açısından çok uygun değildir. Rasgele sayı üretmek için çok değişik yöntemler düşünülmüştür. Bu yöntemlerin çoğu, belli bir sayıdan ( u1 ) başlayıp belli bir dönüşüm kuralına göre ardışık olarak, u 2 = g (u1 ) u 3 = g (u 2 ) = g ( g (u1 )) = g 2 (u1 ) ⋮ u n = g (u n −1 ) = g n −1 (u1 ) ⋮ dizisini üretmektir. Kesin bir kurala göre elde edilen böyle sayılara sözde rasgele sayılar (pseudo random numbers) denir. Sayı üreteçleri arasında en yaygın olanları Lineer Kongrüans Üreteçler’dir. Kongrüans hesap, modüler hesap veya saat aritmetiği doğal sayılara, belli bir bölene (modüle) göre kalanını karşılık getiren bir işlemdir. Lineer kongrüans üreteçler: m (m > 0) bir doğal sayı olmak üzere, X 1 ∈ {1,2,..., m − 1} başlangıç değerini seçip, X i +1 = aX i + c (mod m ) algoritmasına göre X 1 , X 2 , X 3 ,... sayılarını ve bu sayılar yardımıyla, u1 = X 1 / m , u2 = X 2 / m , u3 = X 3 / m ,... ∈ [0,1) sayılarını üretmektedir. IBM bilgisayarlarında a = 16807 veya a = 630360016 , c=0, m = 2 31 − 1 değerleri alınmıştır. m = 2 35 ve a = 513 olduğunda üretecin devir uzunluğu, yani kongrüans hesabında ortaya çıkan bir kalanın tekrarlanması için atılan adım sayısı 2 33 dır. 34 X i +1 = aX i + c (mod m ) gibi bir kongrüans üretecinde a, c, m ’ye değişik değerler vererek elde edeceğiniz sayıları gözden geçirebilirsiniz. Bu amaçla aşağıdaki gibi bir bilgisayar programı kullanabilirsiniz. INPUT "Deneme sayısı=",N DIM X(N) INPUT "A sabiti=",A: INPUT "C sabiti=",C INPUT "MOD=",M : INPUT "Başlangıç değer=",X(1) FOR I=2 TO N X(I)=A*X(I-1)+C IF X(I)< M THEN GO TO 100 W=INT(X(I)/M) X(I)=X(I)-W*M 100 PRINT "X(I)=",X(I) NEXT I Kesin matematiksel formüllere dayalı olarak sayı üreteçleri ile üretilen sayılar esasında rasgele olmayıp, görünüşte rasgeledir. Sayılarda belli bir özelliğin (örüntünün) ortaya çıkması rasgeleliğin bozulmasının bir göstergesi olabilir. Örneğin belli bir sayının belli aralıklarda tekrar etmesi böyle bir özelliktir. Rasgeleliği bozan bir özelliğin tanımlanmasından sonra var olup olmadığını ortaya çıkaran bir test geliştirilebilir. Bu şekilde çok sayıda test geliştirilmiştir. Bunlara genel olarak, rasgelelik testleri denmektedir. Uzun yıllar bilgisayarlarda kullanımda olan bazı rasgele sayı üreteçleri, sonraki yıllarda yapılan istatistik testlerinde başarılı olamamıştır. Rasgele sayı üretiminin kendi başına bir araştırma sahası olduğunu belirtelim. 35 Gerçek ve Sanal Deney 1. a) Düzgün bir tavla zarını 25 kez atınız ve gelen nokta sayısını gözleyiniz. b) RRT tablosu kullanarak “25 atış yapınız”. c) RND’yi kullanarak “25 atış yapınız”. 36 2. a) Bir parayı 10 kez atınız ve üste gelen yüzeyi yazı (Y), tura (T) olarak gözleyiniz. b) RRT tablosu kullanarak “10 atış yapınız”. c) RND’yi kullanarak “25 atış yapınız”. 3. Varsa kameranızı veya cep telefonunuzu kullanarak a) şıklarındaki gerçek deneyleri bilgisayarda izlettirebilir misiniz? Buna ne deniyor? 4. RND’yi kullanarak c) şıklarında yapılan sanal deneyler için QBASIC de kalmak şartıyla animasyon yaptırabilir misiniz? 5. Bilgisayarlardaki tavla oyunlarında zar atışları nasıl yapılmaktadır? 37 6. Đçinde 3 beyaz, 2 mavi top bulunan bir torbadan rasgele bir top çekilmesi ve renginin gözlenmesi deneyinin örnek uzayını yazınız. Bu deney ile ilgili bir olay tanımlayınız. Deneyi bir kez yapınız. Tanımladığınız olay gerçekleşti mi? Çekilen topu torbaya geri atarak ard arda 3 top çekilmesi deneyinin örnek uzayını yazınız. Bu deney ile ilgili bir olay tanımlayınız. Deneyi bir kez yapınız. Tanımladığınız olay gerçekleşti mi? Torbadan 3 topun aynı anda (çekileni yerine koymadan) çekilmesi deneyinde örnek uzayı yazınız. Bu deney ile ilgili bir olay tanımlayınız. Tanımlanan olay gerçekleşti mi? Yukarıdaki deneyleri en az 20 kez tekrarlayınız ve gelen beyaz topların sayılarını kaydediniz. Bu sayıların kaç kez geldiğini ve gözlenen sıklıklar (frekanslar) için bir grafik (çubuk diyagramı) çiziniz. Yukarıdaki top çekme deneylerini bilgisayarda yapınız (sanal olarak gerçekleştiriniz). 38 7. Tabanın yarıçapı 10 cm olan bir silindirin içine çok küçük bir bilyenin (küçük boncuk) rasgele atılması ve düştüğü noktanın gözlenmesi deneyinin örnek uzayını yazınız. Bu deney ile ilgili bir olay tanımlayınız (tabanda bir bölge belirlenip, boncuğun bu bölgeye düşüp düşmediğine bakılabilir). Deneyi bir kez yapınız. Tanımladığınız olay gerçekleşti mi? Tabanın merkezi ile boncuk arasındaki uzaklığı gözleyiniz. Deneyi en az 30 kez tekrarlayınız. Deneyleri bilgisayarda yapınız (sanal olarak gerçekleştiriniz). 39 Laboratuar Çalışması 4 Olasılık Dağılımlarından Sayı Üretme Ters Dönüşüm Yöntemi F dağılım fonksiyonuna sahip bir X rasgele değişkenin dağılımından sayı üretmek için en çok kullanılan yöntemlerden biri, F dağılım fonksiyonunun genelleştirilmiş tersi denen F − : (0,1) → R u → F − (u) = inf { x: F ( x ) ≥ u} fonksiyonuna dayalı X = F − (U ) dönüşümünü kullanmaktır. Burada U rasgele değişkeni (0,1) aralığı üzerindeki düzgün dağılıma, yani U ( 0 , 1) dağılımına sahiptir. X = F − (U ) dönüşümü integral dönüşümü olarak bilinmektedir. X sürekli bir rasgele değişken olduğunda dağılımın destek kümesi üzerinde F artan bir fonksiyon olmakta ve bu durumda yukarıdaki dönüşüm X = F −1 (U ) biçimini almaktadır. Bu durumda, X = F −1 (U ) rasgele değişkeninin dağılım fonksiyonu, P ( X ≤ x ) = P F −1 (U ) ≤ x = P F ( F −1 (U )) ≤ F ( x ) = P U ≤ F ( x) = F ( x) dır. U ( 0 , 1) düzgün dağılımdan üretilen sayılar integral dönüşümü sonucunda X rasgele değişkenin dağılımından üretilmiş sayılar olacaktır. Böylece herhangi bir X rasgele değişkenin dağılımından sayı üretme işlemi çözülmüş gibi görünmektedir, ancak buradaki zorluk bazı dağılımlar için F − genelleştirilmiş ters fonksiyonunun açık bir ifadesinin elde edilememesidir. Örneğin X ~N (0,1) için, x z2 − 1 F ( x) = e 2 dz , x ∈ R ∫ 2π −∞ ve F − (u ) = F −1 (u ) , u ∈ (0,1) olmak üzere, F −1 (u ) değerleri u ‘ya bağlı olarak açık bir şekilde kolayca yazılıp hesaplanamamaktadır. 40 F dağılım fonksiyonunun F −1 ters fonksiyonunun değerlerinin hesaplanabilir olması durumunda sürekli bir X rasgele değişkeninin dağılımından sayı üretmek için algoritma aşağıdaki gibidir. Algoritma 1. U ( 0 , 1) dağılımından U üretilir 2. X = F −1 (U ) hesaplanır Örnek : X rasgele değişkeninin olasılık yoğunluk fonksiyonu ve dağılım fonksiyonu, 2 x , 0 ≤ x ≤ 1 f ( x) = 0, d . y. 0, F ( x) = x 2 , 1, −1 1/ 2 = U olup, X = F (U ) = U x<0 0≤ x ≤1 x >1 dönüşümü ile X rasgele değişkeninin dağılımından sayı üretilebilir. En az 50 tane sayı üretiniz ve üretilen sayıların bu dağılımdan gelip gelmediğini irdeleyiniz. 41 Örnek: θ parametreli üstel dağılımın olasılık yoğunluk fonksiyonu ve dağılım fonksiyonu, 1 −θx , x≥0 f ( x) = θ e 0 , d . y. 0 F ( x) = x − 1 − e θ , x<0 , x≥0 ve F −1 (u ) = −θ ln(1 − u ) , 0 < u < 1 olmak üzere, X = F −1 (U ) = −θ ln(1 − U ) dönüşümü ile üretilen X rasgele sayıları üstel dağılımdan üretilmiş sayılardır. U ~ U (0,1) için 1 − U rasgele değişkeninin de U (0,1) düzgün dağılımına sahip olduğu göz önüne alınırsa, θ parametreli üstel dağılımdan sayı üretmek için X = −θ ln(U ) dönüşümü de kullanılabilir. θ parametresine bir değer verip en az 50 tane sayı üretiniz ve üretilen sayıların bu dağılımdan gelip gelmediğini irdeleyiniz. 42 Kesikli rasgele değişkenler için F − fonksiyonunu belirlemek zor değildir. Örnek: X rasgele değişkeninin olasılık fonksiyonu X=x 1 2 3 f(x) 0.2 0.5 0.3 olsun. Kesikli bir rasgele değişken olan X ’ in dağılım fonksiyonu , x <1 0 0.2 , 1 ≤ x ≤ 2 F ( x) = 0.7 , 2 ≤ x < 3 1 , x≥3 dır. F − fonksiyonu, 1, 0 < u ≤ 0.2 F (u ) = 2, 0.2 < u ≤ 0.7 3, 0.7 < u < 1 − olmak üzere, 1, 0 < U ≤ 0.2 X = F − (U ) = 2, 0.2 < U ≤ 0.7 3, 0.7 < U < 1 dönüşümü ile X rasgele değişkenin dağılımından sayı üretilebilir. En az 20 tane sayı üretiniz ve üretilen sayıların bu dağılımdan gelip gelmediğini irdeleyiniz. 43 Kabul-Red Yöntemi DX X rasgele değişkeninin olasılık yoğunluk fonksiyonu f ve aldığı değerler kümesi olsun. V rasgele değişkenin olasılık yoğunluk fonksiyonu g ve aldığı değerlerin kümesi D olmak üzere V sayıları kolayca üretilebilsin. a > 0 sabiti ve ∀x ∈ DX için f ( x) ≤ a ⋅ g( x) koşulu sağlansın. Bu durumda aşağıdaki algoritma ile olasılık yoğunluk fonksiyonu f olan dağılımından sayı üretilebilir. Algoritma 1) V sayısı olasılık yoğunluk fonksiyonu g olan dağılımından üretilsin 2) V ’den bağımsız olarak U ~ U ( 0 , 1) üretilsin. U ⋅ a ⋅ g (V ) ≤ f (V ) ise X = V kabul edilsin yani bir X sayısı üretilmiş olsun, aksi durumda reddedilsin yani 1. adıma geçilsin (başka bir ifade ile Y ~ U (0, a ⋅ g (V )) üretilsin. Y < f (V ) ise X kabul edilsin, aksi durumda reddedilsin.) Algoritmayı aşağıdaki gibi de yazabiliriz. 1) Birbirinden bağımsız olarak V ~ g ve U ~ U (0,1) üretilsin. f (V ) 2) Eğer U ≤ ise X = V olsun ve X sayısı çıkılsın. ag (V ) Örnek: X rasgele değişkeninin olasılık yoğunluk fonksiyonu 2 x(2 − x) , 0 < x < 2 f ( x) = π 0 , d.y. olsun, uygun bir g fonksiyonu da ,0 < x < 2 1 g ( x) = 2 , d.y. 0 şeklinde seçilsin. Bu durumda a = 2 için f ( x) ≤ 2 g ( x) ( x ∈ (0,2) ) dır. Buna göre algoritma aşağıdaki gibi olacaktır. f(x) 1 1 2 x 1) U ~ U (0,1) dağılımından bir U 1 sayısı üretilip V = 2U 1 alınır. U(0,1) dağılımından bir U 2 sayısı üretilir. 2) Eğer U 2 ≤ 2 π V (2 − V ) yani U 2 ≤ 2. 12 2 π V (2 − V ) ise X = V alınır ve X sayısı çıkılır. 44 Yukarıdaki algoritmaya dayalı, BASIC programlama dilinde aşağıdaki program yazılabilir. X=2*RND IF RND < (2/3.14)*SQR(X*(2-X)) THEN PRINT X Bilgisayar programında V sayısını X ile göstermek ( X adresine yazdırmak) ikinci adımda kolaylık sağlamaktadır. Karışıklığa yol açmadığı takdirde algoritmanın birinci adımında g olasılık yoğunluk fonksiyonuna sahip dağılımdan üretilen V sayısı yerine X yazılabilir. Buna göre algoritma aşağıdaki şekli alır. 1) Birbirinden bağımsız olarak X ~ g ve U ~ U (0,1) üretilir. f (X ) 2) Eğer U ≤ ise X kabul edilir aksi halde red edilir. ag ( X ) Kolayca sayı üretilebilen yardımcı dağılımın olasılık yoğunluk fonksiyonu olan g fonksiyonu f fonksiyonuna ne kadar çok benziyorsa ve grafikleri birbirine yakınsa simülasyon zamanı kısadır, red olunmalar o kadar az olur. g fonksiyonu seçildikten sonra a f ( x) f ( x) sabiti ∀x ∈ DX için a ≥ olacak şekilde ve değerleri bire yakın olacak şekilde g ( x) ag ( x) seçilmelidir. Bu şartlar altında g seçildikten sonra a sabiti, a = sup x∈DX f ( x) g ( x) olarak seçilebilir. Yukarıdaki örnekte sayı üretilmek istenen dağılımın olasılık yoğunluk fonksiyonu 2 x(2 − x) f ( x) = π 0 , 0< x<2 , d.y. ve yardımcı dağılımın olasılık yoğunluk fonksiyonu 21 , 0< x<2 g ( x) = , d.y. 0 dır. f ( x) 2 =2 g ( x) π x( 2 − x ) olmak üzere, a = sup x∈DX f ( x) 4 f (1) 4 = max = x(2 − x) = g ( x) x∈DX π g (1) π olarak seçilirse algoritmadaki Uag ( X ) ≤ f ( X ) eşitsizliği U ≤ X (2 − X ) biçiminde olur. 45 Algoritma: 1) Birbirinden bağımsız olarak X ~ U (0,2) ve U ~ U (0,1) üretilir. 2) Eğer U ≤ X (2 − X ) ise X kabul edilir aksi halde red edilir. BASIC deyimleri: X=2*RND IF RND < SQR(X*(2-X)) THEN PRINT X. olmak üzere, bu algoritma (program) ile bir önceki, X=2*RND IF RND < (2/3.1415)*SQR(X*(2-X)) THEN PRINT X algoritmasını (programını) hız açısından karşılaştırmak amacıyla her ikisi ile üretilen 100’er tane X sayısı için döngü sayılarını gözleyiniz. Örnek: Olasılık yoğunluk fonksiyonu 1 2 2 e − 2 x π f ( x) = 0 , x≥0 , d . y. olan dağılımdan sayı üretilmek istensin. Dikkat edilirse bu dağılım standart normal dağılımın sağ yarısıdır. Bu dağılıma sahip rasgele değişkeni X ile gösterelim. Kabul-red yöntemine göre bu dağılımdan sayı üretmek için olasılık yoğunluk fonksiyonu bu dağılımınkine benzeyen ve kolayca sayı üretilebilen bir dağılım olarak θ = 1 parametreli üstel dağılım seçilsin. Buna göre, g( x) = e − x , x ≥ 0 dır. a = max gf (( xx)) = max x ≥0 olmak üzere x = 1 değerinde x≥0 f ( x) g ( x) 2 πe − 12 ( x 2 − 2 x ) maksimum değerine ulaşır. Bu durumda a = f (1) g (1) = 2 π 1 e2 değerini alır ve birbirinden bağımsız olarak üretilen X ~ g ve U ~ U (0,1) sayıları için U≤ f ( x) a. g ( x ) yani U ≤ e − 12 ( x −1) 2 ise X kabul edilir. Aşağıdaki program ile bu dağılımdan sayı üretilebilir. X= -LOG(RND) IF RND < EXP (-(X-1)^2) THEN PRINT X 46 Bu dağılımdan üretilen sayılar kullanılarak standart normal dağılımdan da sayı üretilebilir. Bu amaçla yazılan bilgisayar programı aşağıda verilmiştir. X= -LOG(RND) IF RND>EXP (-(X-1)^2) THEN GOTO 10 IF RND < 0.5 THEN PRINT X ELSE PRINT –X 10 En az 50 tane sayı üretiniz ve üretilen sayıların standart normal dağılımdan gelip gelmediğini irdeleyiniz. 47 Örnek: Standart normal dağılımın bir d ( d > 0 ) sayısının sağında kalan kısmından (kuyruğundan) sayı üretme problemini ele alalım. Başka bir ifade ile olasılık yoğunluk fonksiyonu ce − 2 x f ( x) = 0 1 2 , x≥d , d.y. olan dağılımdan sayı üretilmek istensin ( c sabiti f bir olasılık yoğunluk fonksiyonu olacak şekildedir). Kolayca sayı üretilebilecek yardımcı dağılım olarak ötelenmiş üstel dağılım, yani olasılık yoğunluk fonksiyonu e − x + d , x ≥ d g ( x) = , d.y. 0 olan dağılım seçilmiş olsun. x2 − +x f ( x) = ce − d e 2 g ( x) x2 olmak üzere, − + x ifadesi x < 1 için artan x > 1 için azalan olduğundan, 0 < d ≤ 1 , için 2 f ( x) f (1) a = max = = ce − d e1 / 2 x≥d g ( x) g (1) ve d > 1 için d2 − f ( x) f (d ) a = max = = ce 2 x≥d g ( x) g (d ) dır. Buna göre algoritmada yer alan Uag ( X ) ≤ f ( X ) eşitsizliği, 0 < d ≤ 1 durumunda U ≤e 1 − ( X −1) 2 2 ve d > 1 durumunda 1 U ≤ e2 ( d −1) 2 e 1 − ( X −1) 2 2 biçiminde olacaktır. Đlgili bilgisayar programı BASIC dilinde aşağıdaki gibi olabilir. INPUT D X=-LOG(RND)+D A=EXP(-0.5*(X-1)^2 IF D<=1 AND RND<A THEN PRINT X IF D>1 AND RND<A*EXP(0.5*(D-1)^2) THEN PRINT X 48 Örnek: >> z=randn(100,1); >> [z(1:20,1) z(21:40,1) z(41:60,1) z(61:80,1) z(81:100,1)] 0.7160 1.5986 -2.0647 -0.7436 0.1762 0.5278 -0.5532 0.2983 -1.2266 -0.1897 -0.3017 0.9570 -0.5334 -0.9011 -0.8926 0.2787 -0.7458 1.6035 0.5743 0.3207 -0.1514 0.3158 1.3437 -2.2378 1.2929 -0.3785 0.0025 0.8846 0.5825 -1.6142 -1.5037 0.5736 -0.9105 -1.6313 -0.3591 -0.3976 -1.1613 -1.1098 0.2907 -1.9102 1.3148 0.6653 -0.2751 -0.0230 -0.9080 -1.0437 0.3735 0.9015 1.2785 -0.1285 0.6128 1.9565 2.2663 -0.3740 2.2380 -0.1596 -0.7033 0.5635 -0.0503 1.1636 0.6588 -1.5501 -3.0291 0.5406 -1.0090 0.9080 1.5823 -0.9791 1.0079 0.1585 -0.5869 1.5741 -0.5166 1.2278 1.5839 -2.0890 2.9495 1.3561 1.0501 -0.7672 -0.2577 -1.3718 -1.2677 -0.8949 0.5891 1.8426 1.3480 -0.4913 -2.1776 0.2370 -0.7354 -1.7794 0.4480 0.5812 0.8566 -0.2663 -0.4175 -0.2058 -0.1743 0.2176 >> hist(z) 25 20 15 10 5 0 -4 -3 -2 -1 0 1 2 Random Number Generators betarnd binornd chi2rnd copularnd evrnd exprnd frnd gamrnd geornd gevrnd gprnd hygernd iwishrnd Random numbers from beta distribution Random numbers from binomial distribution Random numbers from chi-square distribution Random numbers from copula Random numbers from extreme value distribution Random numbers from exponential distribution Random numbers from F distribution Random numbers from gamma distribution Random numbers from geometric distribution Random numbers from generalized extreme value distribution Random numbers from generalized Pareto distribution Random numbers from hypergeometric distribution Random numbers from inverse Wishart distribution 3 49 johnsrnd Random numbers from Johnson system of distributions lhsdesign Generate latin hypercube sample lhsnorm Generate latin hypercube sample with normal distribution lognrnd Random numbers from lognormal distribution mhsample Markov chain Metropolis-Hastings sampler mnrnd Random numbers from multinomial distribution mvnrnd Random numbers from multivariate normal distribution mvtrnd Random numbers from multivariate t distribution nbinrnd Random numbers from negative binomial distribution ncfrnd Random numbers from noncentral F distribution nctrnd Random numbers from noncentral t distribution ncx2rnd Random numbers from noncentral chi-square distribution normrnd Random numbers from normal distribution pearsrnd Random numbers from Pearson system of distributions poissrnd Random numbers from Poisson distribution randg Gamma distributed random numbers and arrays (unit scale) random Random numbers from specified distribution randsample Random sample, with or without replacement randtool Interactive random number generation raylrnd Random numbers from Rayleigh distribution slicesample Markov chain slice sampler trnd Random numbers from Student's t distribution unidrnd Random numbers from discrete uniform distribution unifrnd Random numbers from continuous uniform distribution wblrnd Random numbers from Weibull distribution wishrnd Random numbers from Wishart distribution >> hist(trnd(10,100,1)) >> hist(randn(100,1)) 30 30 20 20 10 10 0 -3 -2 -1 0 1 2 3 0 -4 -2 0 2 4 6 50 Laboratuar Çalışması 5 Bir Boyutlu Kesikli Dağılımlar Bazı Kesikli Dağılımlar o.f. Düzgün Dağılım m.ç.f. 1 , x = a1 , a2 ,..., an n a t n ei M X (t ) = ∑ , t ∈R i =1 n f ( x) = n ortalama E( X ) = a = ∑a i i =1 n n varyans parametre Bernoulli Dağılımı b (1, p ) o.f. m.ç.f. n a1 , a2 ,..., an ∈ R , n ∈ {1,2,...} f ( x) = p x (1 − p ) 1− x varyans Var ( X ) = p (1 − p ) o.f. ortalama varyans parametre o.f. m.ç.f. ortalama varyans parametre , x =0,1 M X (t ) = 1 − p + pet , t ∈ R E( X ) = p m.ç.f. Hipergeometrik i =1 2 i ortalama parametre Binom b ( n, p ) Var ( X ) = ∑(a − a ) p ∈ (0,1) , n ∈ {1,2,...} n n− x f ( x) = p x (1 − p ) , x = 0,1,...,n x M X (t ) = (1 − p + pet ) , t ∈ R n E ( X ) = np Var ( X ) = np (1 − p ) p ∈ (0,1) , n ∈ {1,2,...} a N − a N f ( x) = x n − x n açık biçimi yok a N N −n a a Var ( X ) = × n × × (1 − ) N −1 N N N , a, n ∈ {1, 2,...} , a < N , n < N E( X ) = n × 51 o.f. Poisson m.ç.f. ortalama varyans parametre Geometrik o.f. m.ç.f. Negatif Binom e−λ λ x f ( x) = , x = 0,1, 2,... x! λ et −1 M X (t ) = e E( X ) = λ Var ( X ) = λ λ ∈ (0, ∞) f ( x) = (1 − p ) M X (t ) = ortalama E( X ) = varyans Var ( X ) = parametre p ∈ (0,1) o.f. m.ç.f. ortalama varyans parametre x −1 , t ∈R p , x =1,2,... pet , 1 − (1 − p ) et t < − ln(1 − p ) 1 p 1− p p2 x − 1 k k −r f ( x) = p (1 − p ) , x = k , k + 1,... k − 1 pet M X (t ) = 1 − (1 − p ) et k E( X ) = p k (1 − p ) Var ( X ) = p2 p ∈ (0,1) , k ∈ {1, 2,...} k , t < − ln(1 − p ) Probability Density Functions binopdf Binomial probability density function geopdf Geometric probability density function hygepdf Hypergeometric probability density function nbinpdf Negative binomial probability density function poisspdf Poisson probability density function unidpdf Discrete uniform probability density function Cumulative Distribution Functions binocdf Binomial cumulative distribution function ecdf Empirical cumulative distribution function geocdf Geometric cumulative distribution function hygecdf Hypergeometric cumulative distribution function poisscdf Poisson cumulative distribution function unidcdf Discrete uniform cumulative distribution function Inverse Cumulative Distribution Functions binoinv Inverse of binomial cumulative distribution function geoinv Inverse of geometric cumulative distribution function hygeinv Inverse of hypergeometric cumulative distribution function nbininv Inverse of negative binomial cumulative distribution function poissinv Inverse of Poisson cumulative distribution function unidinv Inverse of discrete uniform cumulative distribution function 52 1 X ∼ b(n = 3, p = ) olsun. Bu dağılım ile ilgili aşağıdaki Matlab çıktılarını gözden geçiriniz. 2 >>x=0:3 x= 0 1 >> binopdf(x,3,1/2) ans = 0.125 0.375 2 0.375 3 0.125 >> plot(x,binopdf(x,3,1/2),'.') 0.45 0.4 0.35 0.3 0.25 0.2 0.15 0.1 0 0.5 >> binocdf(x,3,1/2) ans = 0.125 0.5 0.875 1 1.5 2 2.5 3 1 >> stairs(x, binocdf(x,3,1/2)) 1 0.8 0.6 0.4 0.2 0 0 0.5 1 1.5 2 2.5 3 53 1 X ∼ b(n = 10, p = ) 2 >> x=0:10 x= 0 1 2 >> binopdf(x,10,1/2) ans = 0.0010 0.0098 0.0439 3 4 5 6 7 0.1172 0.2051 0.2461 0.2051 0.1172 8 9 10 0.0439 0.0098 0.0010 >> plot(x,binopdf(x,10,1/2),'.') 0.25 0.2 0.15 0.1 0.05 0 0 1 2 3 4 5 6 7 8 9 10 3 4 5 6 7 8 9 10 >> stairs(x,binocdf(x,10,1/2)) 1 0.9 0.8 0.7 0.6 0.5 0.4 0.3 0.2 0.1 0 0 1 2 54 50 tane top arasında 40 tanesi beyaz ve 10 tanesi siyah olsun. Birini, rasgele, bilgisayarda sayı üreterek seçmek istersek QBASIC programlama dilinde, IF RND<0.80 THEN PRINT “beyaz” ELSE PRINT “siyah” deyimini kullanabiliriz. Đadeli olarak 10 çekiliş yapmak istersek, FOR i=1 TO 1 IF RND<0.80 THEN PRINT “beyaz” ELSE PRINT “siyah” NEXT i deriz. 10 çekiliş yapınız. Đadesiz olarak 10 çekilişi nasıl yaptırırız? Bilgisayar programı yazınız ve çalıştırınız. 55 Bir torbada 4 beyaz ve 1 siyah top bulunsun. Đadeli olarak siyah top gelinceye kadar toplar çekilmektedir. Bu çekilişleri yapan ve çekiliş sayısını (X) çıkan bir bilgisayar programı yazınız. Bu programı 50 defa işletiniz ve X ‘in aldığı değerleri kaydedip çubuk diyagramı çiziniz. X ‘in olasılık tablosu ile karşılaştırın. 56 Bir torbada 4 beyaz ve 1 siyah top bulunsun. Đadeli olarak çekilişler yapan ve 5 ‘inci defa siyah top geldiğinde durup, çekiliş sayısını (X) çıkan bir bilgisayar programı yazınız. Bu programı 50 defa işletiniz ve X ‘in aldığı değerleri kaydedip çubuk diyagramı çiziniz. X ‘in olasılık tablosu ile karşılaştırın. 57 Numaralanmış 3 tane tenis topu, aynı şekilde 1,2,3 olarak numaralanmış 3 kutuya rasgele atılsın. * Örnek uzayı yazınız. * Top numarası ile kutu numarasının aynı olmaması olasılığı nedir? * Top numarası ile kutu numarası aynı olduğunda, o kutuda eşleme vardır denir. X rasgele değişkeni eşleme sayısı olsun. X rasgele değişkeninin olasılık fonksiyonunu bulunuz ve grafiğini çiziniz. X ‘in beklenen değerini ve varyansını bulunuz. * Bu deneyde (oyunda) top numarası ile kutu numarası aynı olursa, yani eşleme olursa, her eşleme için 1 TL kazanılsın. Kazancın olasılık dağılımını bulunuz. Oyunun dürüst olması için kaç TL’ye oynatılmalıdır. 58 Top ve kutu sayısı 5 olsun. X rasgele değişkeni eşleme sayısı olsun. X rasgele değişkeninin olasılık fonksiyonunu bulunuz. X ‘in beklenen değeri ve varyansı nedir? 59 Top ve kutu sayısı 100 olsun. X rasgele değişkeni eşleme sayısı olsun. X ‘in beklenen değeri ve varyansı nedir? 60 Laboratuar Çalışması 6 Poisson Dağılımı ve Uygulamaları Poisson Dağılımı, sürekli (zaman, alan, hacim gibi) ortamlarda kesikli sonuçlar veren ve aşağıdaki a),b),c) şıklarında belirtilen özelliklere sahip deneylerin modellenmesinde kullanılan bir dağılımdır. Poisson Dağılımı ile ilgili açıklamaları ortamın zaman olması halinde yapalım. (0, t ] zaman aralığında meydana gelen sonuçların (bir olayın gerçekleşme) sayısı X olsun. Sonuçları ortaya çıkaran deney ile ilgili aşağıdaki özellikler geçerli olsun: a) Küçük ∆t uzunluklu bir zaman aralığında bir başarı elde etme olasılığı ∆t ile orantılıdır. b) Küçük ∆t uzunluklu bir zaman aralığında iki veya daha çok başarı elde etme olasılığı yaklaşık olarak sıfırdır. c) ∆t uzunluklu ayrık aralıklar için elde edilen sonuçlar bağımsız birer Bernoulli Denemesidir. (0, t ] zaman aralığında meydana gelen sonuç sayısı X, kesikli bir rasgele değişken olmak üzere, X ‘in aldığı değerler x = 0,1,2,… dır. X ‘in olasılık fonksiyonunu bulmaya t çalışalım. (0, t ] aralığını yeterince küçük ∆t uzunluklu, n= tane alt aralığa ∆t parçalayalım. Belli bir parçada 0 veya 1 tane sonuç ortaya çıkabilir diyebiliriz. ∆t zaman aralığında bir sonuç çıkması veya çıkmaması bir Bernoulli Denemesi olup, sonucun ortaya çıkması olasılığı ∆t ile orantılıdır. Bu olasılık, c bir sabit olmak üzere, p = c∆t olsun. (0, t ] aralığında n tane ∆t uzunluklu ayrık aralık bulunmakta ve bu aralıklarda bağımsız sonuçlar veren p = c∆t olasılıklı Bernoulli Denemeleri gerçekleşmektedir. O zaman (0, t ] aralığında t , p = c∆t ) Binom Dağılımına sahip olacaktır. ∆t → 0 ∆t t t t için n = → ∞ , np = c∆t = ct = λ olmak üzere, b(n = , p = c∆t ) Binom ∆t ∆t ∆t Dağılımındaki olasılıkların limitleri Poisson Dağılımındaki olasılıkları verecektir. Başka bir ifade ile, (0, t ] zaman aralığında meydana gelen sonuç sayısı olan ve Poisson dağılımına sahip olan X rasgele değişkeninin olasılık fonksiyonu, elde edilen sonuçların sayısı b(n = t −x t / ∆t x ∆ f ( x) = P( X = x) = ∆lim (c∆t ) (1 − c∆t ) t t →0 x n λ x λ n− x = lim ( ) (1 − ) n →∞ x n n 61 −x n n! λx λ λ . . 1 − . 1 − = lim n →∞ x !( n − x ) ! n x n n n ( n − 1) ...(n − ( x − 1)) λ − x λ n λx = lim 1 − . 1 − x ! n →∞ nx n n e− λ λ x = , x = 0,1,2,3,... x! dır. n ( n − 1) (n − 2)...(n − ( x − 1)) n 1 2 x − 1 n →∞ = 1 − 1 − ... 1 − →1 nx n n n n −x λ λ n →∞ n →∞ →1 , 1 − → e−λ 1 − n n n X Poisson Dağılımına sahip bir rasgele değişken olduğunda, f ( x) = e−λ λ x x! , x = 0,1,2,3,... ve t M X (t ) = E (etX ) = ∑ etx f ( x) = eλ (e −1) t∈R , x olmak üzere, E( X ) = t dM X (t ) = λ et eλ ( e −1) = λ t =0 dt t =0 E( X 2 ) = 2 t t d 2 M X (t ) = λ et eλ ( e −1) + ( λ et ) eλ ( e −1) = λ + λ 2 2 dt t =0 t =0 Var ( X ) = E ( X 2 ) − ( EX ) = λ + λ 2 − λ 2 = λ 2 dır. Poisson Dağılımının parametresi olan λ (λ ∈ (0, ∞)) sayısı aynı zamanda dağılımın beklenen değeri (ortalaması) ve varyansıdır. λ parametresinin bazı değerleri için Poisson dağılımının olasılık fonksiyonunun grafikleri aşağıdaki gibidir. λ =1 0.4 0.3 0.2 0.1 0 0 5 10 15 20 25 30 35 40 45 50 62 λ = 2.5 0.35 0.3 0.25 0.2 0.15 0.1 0.05 0 0 5 10 15 20 25 30 35 40 45 50 0 5 10 15 20 25 30 35 40 45 50 λ =5 0.2 0.15 0.1 0.05 0 λ = 10 0.14 0.12 0.1 0.08 0.06 0.04 0.02 0 0 5 10 15 20 25 30 35 40 45 50 λ = 20 0.1 0.08 0.06 0.04 0.02 0 0 5 10 15 20 25 30 35 40 45 50 63 Şehirlerarası bir petrol istasyonuna bir dakikada ortalama bir araba gelmektedir. Bir dakikada gelen araba sayısı λ =1 olan Poisson Dağılımına sahip bir rasgele değişken olarak düşünülsün. λ =1 olan Poisson Dağılımının olasılık tablosunu hazırlayınız. 64 Bir dakikada gelen araba sayısı λ =1 olan Poisson Dağılımına sahip bir rasgele 1 değişken olmak üzere, bir saniyede gelen araba sayısı λ = olan Poisson dağılımına sahip 60 bir rasgele değişken olarak düşünülebilir. Bir saniyede gelen araba sayısının iki veya daha çok olması olasılığı 0.00013736 olup (hesaplayın), yaklaşık olarak sıfır alınabilir. Ayrıca bir saniyelik bir zaman aralığında istasyona bir araba gelmesi olasılığı, 1 − 1 e 60 ( )1 1 − 601 60 p= = e = 0.016391 1! 60 dır. Bir dakikalık bir zaman aralığının her saniyesi için p = 0.016391 başarı olasılıklı bir Bernoulli Denemesi yapıp istasyona gelen araba sayısını sayın. Bunu 100 defa tekrarlayın (bilgisayarda). Gözlediğiniz bu 100 değer için çubuk diyagramı hazırlayın ve yukarıdaki olasılık tablosu ile karşılaştırın. 65 * Bir dakikalık bir zaman aralığının her saniyesi için p = 0.016391 başarı olasılıklı bir Bernoulli Denemesi yapıp istasyona gelen arabaların geliş anlarını kaydedin. * On dakikalık bir zaman aralığının her saniyesi için p = 0.016391 başarı olasılıklı bir Bernoulli Denemesi yapıp istasyona gelen arabaların geliş anlarını kaydedin. * Bir saatlik bir zaman aralığının her saniyesi için p = 0.016391 başarı olasılıklı bir Bernoulli Denemesi yapıp istasyona gelen arabaların geliş anlarını kaydedin. 66 ** Bir saatlik bir zaman aralığında gelen arabaların gelişleri arasında geçen zamanları gözleyin. ** Bir saatlik bir zaman aralığında gelen arabaların gelişleri arasında geçen zamanları gözleyip histogram çizin. 67 Laboratuar Çalışması 7 Bir Boyutlu Sürekli Dağılımlar Düzgün Dağılım X ∼ U (θ1 ,θ 2 ) , θ1 ,θ 2 ∈ Θ = R , θ1 < θ 2 1 I ( x) b − a ( a ,b ) a+b (b − a )2 E( X ) = , Var ( X ) = , M X (t ) = ( ebt − e at ) ( b − a ) , t ∈ R 2 12 f ( x) = X ∼ U ( 0,1) 2 0 -2 -1 0 1 2 1 , 0 < x < 1 f ( x) = I ( 0,1) ( x ) = 0 , d . y. 1 1 E( X ) = , Var ( X ) = , M X (t ) = et − 1 2 12 Normal Dağılım X ∼ N ( µ , σ 2 ) , µ ∈ R , σ 2 ∈ (0, ∞) , ( µ , σ 2 ) ∈ Θ = R × (0, ∞) ⊂ R 2 1 x−µ − 1 f ( x; µ ,σ ) = e 2 2πσ 2 E( X ) = µ , 2 σ Var ( X ) = σ , 2 Z ∼ N ( 0,1) x∈R , M X (t ) = e 0.4 0.3 0.2 0.1 0 -4 f ( z) = 1 e 2π -2 − z2 2 0 , 2 4 z∈R E ( Z ) = 0 , Var ( X ) = 1 , M Z (t ) = e t2 2 µt −σ 2t 2 2 , t∈R 68 Üstel Dağılım X ∼ Üstel (θ ) , θ ∈ Θ = (0, ∞) ⊂ R 1.5 1 0.5 0 -2 f ( x;θ ) = 1 θ 0 e − E( X ) = θ 2 4 6 x θ , I (0,∞ ) Var ( X ) = θ 2 , M X (t ) = 1 , t∈R 1−θt Ki-kare Dağılımı X ∼ χ (2r ) , r ∈ {1, 2,3,...} 0.2 0.1 0 0 10 20 1 f ( x; r ) = x r 2−1e − x 2 I ( 0,∞ ) ( x ) r 2 Γ ( r 2) 2 E( X ) = r , Var ( X ) = 2r , M X (t ) = (1 − 2t ) −r 2 , t<1 2 Gamma Dağılımı X ∼ Γ (α , β ) , α , β ∈ (0, ∞) , (α , β ) ∈ Θ× Θ ⊂ R 2 0.4 0.2 0 0 f ( x; α , β ) = E ( X ) = αβ 5 1 Γ (α ) β α , 10 x α −1 − x β e I ( 0,∞ ) ( x ) Var ( X ) = αβ 2 , M X (t ) = (1 − β t ) −α , t<β −1 69 Beta Dağılımı X ∼ B (α , β ) , α , β ∈ (0, ∞) , (α , β ) ∈ Θ× Θ ⊂ R 2 4 2 0 0 0.5 1 Γ (α + β ) I ( 0,1) ( x ) Γ (α ) Γ ( β ) Moment Çıkaran Fonksiyonu’nun açık biçimi yok. f ( x; α , β ) = E( X ) = α α +β xα −1 (1 − x ) Var ( X ) = , β −1 αβ (α + β + 1)(α + β ) 2 Cauchy Dağılımı X ∼ C ( µ , σ ) , µ ∈ R , σ ∈ (0, ∞) , ( µ , σ ) ∈ Θ = R × (0, ∞) ⊂ R 2 2 1 x−µ f ( x; µ , σ ) = 1 + πσ σ −1 , x∈R Moment Çıkaran Fonksiyonu yok. Momentleri yok. ϕ X (t ) = e µit −σ t , t ∈R X ∼ C ( 0,1) 1.5 1 0.5 0 -5 0 5 f ( x) = 1 1 + x2 , x∈R t-Dağılımı X ∼ t(υ ) , υ ∈ {1, 2,3,...} 0.4 0.2 0 -5 −(υ +1) 2 0 Γ (υ + 1) 2 x 2 5 f ( x;υ ) = , x∈R 1 + υπ Γ (υ 2 ) υ Moment Çıkaran Fonksiyonu’nun açık biçimi yok. E( X ) = 0 , Var ( X ) = υ υ −2 , (υ > 2) 70 F Dağılımı X ∼ Fn ,m , n, m ∈ {1, 2,3,...} 0.8 0.6 0.4 0.2 0 0 5 10 15 n n 2 mm 2 Γ ( n + m ) 2 x n 2−1 I ( 0,∞ ) ( x ) nπ Γ ( n 2 ) Moment Çıkaran Fonksiyonu’nun açık biçimi yok. 2m 2 ( n + m − 2 ) E ( X ) = m ( m − 2 ) , ( m>2 ) , Var ( X ) = , 2 n ( m − 2) ( m − 4) f ( x; n, m) = f ( x; n, m) = ( m > 4) Log-Normal Dağılım X ∼ LN ( µ , σ 2 ) , µ ∈ R , σ 2 ∈ (0, ∞) , ( µ , σ 2 ) ∈ Θ = R × (0, ∞) ⊂ R 2 0.1 0.05 0 0 10 20 −( log x − µ ) 2σ 2 1 x −1e I ( 0,∞ ) ( x ) 2πσ Moment Çıkaran Fonksiyonu yok. E ( X ) = µ , 2 f ( x; µ , σ 2 ) = Var ( X ) = σ 2 Weibull Dağılımı X ∼ W (α ,θ ) , α ,θ ∈ (0, ∞) , (α ,θ ) ∈ Θ × Θ ⊂ R 2 0.8 0.6 0.4 0.2 0 0 2 4 6 8 10 α α α −1 − xθ f ( x; α ,θ ) = x e I ( 0,∞ ) ( x ) θ Moment Çıkaran Fonksiyonu’nun açık biçimi yok. E ( X ) = θ 1 α Γ (α −1 + 1) Var ( X ) = θ 2 α Γ ( 2α −1 + 1) − Γ (α −1 + 1) 2 71 Probability Density Functions betapdf Beta probability density function chi2pdf Chi-square probability density function exppdf Exponential probability density function fpdf F probability density function gampdf Gamma probability density function gppdf Generalized Pareto probability density function lognpdf Lognormal probability density function normpdf Normal probability density function pdf Probability density function for specified distribution raylpdf Rayleigh probability density function tpdf Student's t probability density function unifpdf Continuous uniform probability density function wblpdf Weibull probability density function Cumulative Distribution Functions betacdf Beta cumulative distribution function cdf Cumulative distribution function for specified distribution chi2cdf Chi-square cumulative distribution function expcdf Exponential cumulative distribution function fcdf F cumulative distribution function gamcdf Gamma cumulative distribution function gpcdf Generalized Pareto cumulative distribution function logncdf Lognormal cumulative distribution function normcdf Normal cumulative distribution function raylcdf Rayleigh cumulative distribution function tcdf Student's t cumulative distribution function unifcdf Continuous uniform cumulative distribution function wblcdf Weibull cumulative distribution function Inverse Cumulative Distribution Functions betainv Inverse of beta cumulative distribution function chi2inv Inverse of chi-square cumulative distribution function finv Inverse of F cumulative distribution function gaminv Inverse of gamma cumulative distribution function gpinv Inverse of generalized Pareto cumulative distribution function icdf Inverse cumulative distribution function for specified distribution logninv Inverse of lognormal cumulative distribution function norminv Inverse of normal cumulative distribution function raylinv Inverse of Rayleigh cumulative distribution function tinv Inverse of Student's t cumulative distribution function unifinv Inverse of continuous uniform cumulative distribution function wblinv Inverse of Weibull cumulative distribution function >> x=-4:.1:4; >> plot(x,normpdf(x)) >> plot(x,normcdf(x)) 1 0.8 0.4 0.6 0.3 0.4 0.2 0.2 0.1 0 -4 -2 0 2 4 0 -4 -2 0 2 4 72 QBASIC ’de WINDOW (-4,0.5)-(-0.05,4) LINE (-4,0)-(4,0) LINE (0,-0.05)-(0,0.5) FOR z=-4 TO 4 STEP 0.001 PLOT(z , EXP(-z^2/2)/SQR(2*3,14))) NEXT z Matlab ‘da >> x=-4:.001:4; >> plot(x,normpdf(x,0,1),'.') QBASIC ’de T=0 FOR z= 0 TO 1 STEP 0.001 T = T + 0.001* EXP(-z^2/2)/SQR(2*3,14)) NEXT z PRINT z,T Matlab ‘da >> normcdf(1,0,1)- normcdf(0,0,1) programlarını işletiniz. 73 Tablodaki dağılımların olasılık yoğunluk ve dağılım fonksiyonlarının grafiklerini parametrelerin farklı değerlerinde çizdiriniz ve alacağı şekilleri gözden geçiriniz. Bu dağılımlardan sayı üretip histogram çizdiriniz ve olasılık yoğunluk fonksiyonunun grafiği ile karşılaştırınız. 74 75 Laboratuar Çalışması 8 Üstel ve Gamma Dağılımı Güvenilirlik Analizi Üstel Dağılım Bir X rasgele değişkeninin olasılık yoğunluk fonksiyonu, 1 −θx , x>0 e f ( x ) = θ 0 , dy olduğunda X rasgele değişkenine üstel dağılıma sahiptir denir. Üstel dağılımın parametresi θ (θ ∈ Θ = ( 0, ∞ ) ) dır. Üstel dağılıma sahip bir X rasgele değişkeni için, 0 , x<0 0 x F ( x ) = 1 −θx = −x θ e dx , x ≥ 0 1 − e θ 0 ∫ , x<0 , x≥0 F(x) f(x) 1 1/ θ• M X (t ) = E (e E(X ) = x x ∞ tX ) = ∫e dM X ( t ) tx 0 t =0 dt 2 d M X (t ) E(X2) = dt 2 1 θ − x e dx = (1 − θ t )−1 = ( −1)( −θ )(1 − θ t ) t =0 , t< θ = ( −2 ) θ (1 − θ t ) −2 −3 t =0 θ =θ ( −θ ) t =0 = 2θ 2 Var ( X ) = E ( X 2 ) − ( E ( X )) 2 = 2θ 2 − θ 2 = θ 2 dır. 1 76 U ∼ U (0,1) ve θ ∈ ( 0, ∞ ) için X = −θ ln U dönüşümü ile verilen X rasgele değişkeni θ parametreli üstel dağılıma sahiptir. X = −θ ln U dağılımdan sayı üretmek için kullanabiliriz. dönüşümünü simülasyonlarda üstel >>-5*log(rand(20,5)) ans= 0.25578 7.3237 2.4975 3.6079 0.57537 1.3584 3.9212 19.949 0.98366 4.0518 8.2142 1.912 5.9741 3.0655 9.4567 1.7984 4.8594 0.75406 0.79111 2.6081 2.4272 1.1663 0.40708 1.5176 8.6787 4.5106 0.33353 0.43378 4.4547 0.56221 3.5004 0.52808 0.98233 2.1932 1.0046 2.0758 5.3652 6.194 5.3766 3.136 14.246 5.2083 1.0341 23.096 9.8704 7.9784 8.0793 2.5226 6.5063 8.077 1.5934 5.8674 0.8807 2.8276 4.9657 1.7638 3.0205 4.0498 1.8223 2.3796 20.908 1.4599 4.0473 0.35313 3.818 4.3536 0.83488 3.2204 7.9814 1.9864 1.1482 0.2206 3.2448 0.63837 8.7735 0.10229 6.5199 6.8851 0.66343 1.5237 0.88297 19.651 1.9189 4.8448 0.92082 3.4377 1.7162 4.2328 5.9435 8.3129 9.9564 22.217 0.56081 8.0687 6.0412 2.0667 6.2867 3.7834 13.684 0.058693 Bu sayılar için histogram, 50 40 30 20 10 0 0 5 10 15 20 dır. Bu sayılar bir x vektöründe toplandıktan sonra, >>mean(x) = 4.5786 >>var(x) = 23.84 >> sqrt(ans) = 4.8827 elde edilmektedir. θ = 5 olan üstel dağılıma sahip bir X rasgele değişkeni için E( X ) = 5 dır. σ 2 = Var ( X ) = 25 σ =5 25 77 Gamma ve Ki-kare Dağılımları Hatırlatma: ∞ Γ(α) = ∫ xα−1e− x dx , α ∈ R 0 fonksiyonuna Gamma fonksiyonu denir. Bu fonksiyon için, ∞ ∞ ∞ Γ(α ) = ∫ x e dx = x (−e ) + (α −1) ∫ x α−2 e− x dx = (α −1)Γ(α −1) x =0 u dv 0 0 α−1 −x α−1 −x 0 ∞ Γ(1) = ∫ e− x dx = 1 0 Γ(α ) = (α −1)! , α ∈ Z + ve ∞ 1 − 1 Γ( ) = ∫ x 2 e− x dx = π 2 0 (matematik derslerinde göreceksiniz) dır. Örneğin, ∞ ∫ xe −x dx = ∫ x 2−1e− x dx = Γ(2) = (2 −1)! = 1 0 ∞ ∫xe 5 −x 0 ∞ ∫x 0 ∞ 0 ∞ dx = ∫ x 6−1e− x dx = Γ(6) = (6 −1)! = 5! = 120 0 5 2 −x 7 5 5 5 3 3 5 3 1 1 5 3 1 15 π e dx = Γ( ) = Γ( ) = × Γ( ) = × × Γ( ) = × × × π = 2 2 2 2 2 2 2 2 2 2 2 2 2 8 dır. Matlab’da gamma fonksiyonu: >> gamma(2) ans = 1 >> gamma(6) ans = 120 >> gamma(7/2) ans = 3.3234 >> gamma(1/2) ans = 1.7725 >> sqrt(pi) ans = 1.7725 >> gamma(2.2) ans = 1.1018 >> gamma(-2.2) ans = -2.205 >> alfa=-5:0.1:5; >> plot(alfa,gamma(alfa) 25 20 15 10 5 0 -5 -10 -15 -5 -4 -3 -2 -1 0 1 2 3 4 5 78 Tanım: Bir X rasgele değişkenin olasılık yoğunluk fonksiyonu, xα−1e− x / β , x>0 1 f ( x) = β α Γ(α) , α, θ = β ∈ (0, ∞) β 0 , d.y biçiminde olduğunda, X ‘e Gamma Dağılımına sahiptir denir ve X ∼ Γ(α, β ) biçiminde gösterilir. Γ(α = 1, β ) dağılımının olasılık yoğunluk fonksiyonu, e− x / β , x>0 f ( x) = β , d.y 0 olmak üzere, bu β parametreli üstel dağılımın olasılık yoğunluk fonksiyonudur. Γ(α = 1, β ) dağılımı β parametreli üstel dağılımdır. >> x=0:0.1:15; >> plot(x,gampdf(x,1,2)) 0.5 0.4 0.3 0.2 0.1 0 0 5 10 15 Gamma dağılımının parametreleri α, β ∈ (0, ∞) olmak üzere, bu parametrelere bağlı olarak olasılık yoğunluk fonksiyonu değişik biçimler almaktadır. >> plot(x,gampdf(x,3,.5)) >> hold on >> plot(x,gampdf(x,2,.5),'r') >> hold on >> plot(x,gampdf(x,0.5,3),'g') >> hold on >> plot(x,gampdf(x,5,.5)) >> hold on >> plot(x,gampdf(x,2,2),'r') >> hold on >> plot(x,gampdf(x,0.5,10),'g' ) >> plot(x,gampdf(x,10,0.5),'k' ) 1 0.9 0.8 0.7 0.6 0.5 0.4 0.3 0.2 0.1 0 0 5 10 15 79 >> plot(x,gampdf(x,5,1)) >> figure >> plot(x,gamcdf(x,5,1)) 0.2 0.15 0.1 0.05 0 0 5 10 15 5 10 15 1 0.8 0.6 0.4 0.2 0 0 Gamma dağılımına sahip bir X ∼ Γ(α, β ) rasgele değişkeni için, x 1 α −1 − β x e α f ( x ) = Γ (α ) β 0 M X (t ) = E (e ∞ tX , x>0 , ) = ∫ e Γ (α ) β tx dy 1 α x − x e dx = (1 − β t ) α −1 β −α t< , 0 E(X ) = dM X ( t ) E(X2) = dt t =0 d 2 M X (t ) dt 2 = −α (1 − β t ) t =0 − (α −1) −α − 2 ( −β ) 2 t =0 = (α 2 − α ) β 2 Var ( X ) = E ( X 2 ) − ( E ( X ) ) = (α 2 − α ) β 2 − (αβ ) = αβ 2 dır. β ( − β ) t =0 = αβ = −α ( −α + 1)(1 − β t ) 2 1 2 80 Güvenilirlik Analizi Belli bir işlevi olan bir sistemin veya bir bileşenin ömrü sonludur. Ömür, örneğin elektronik parçalarda dayanma süresi, canlılarda yaşama süresi olmak üzere, zaman olarak ölçüldüğünde sürekli bir rasgele değişken olarak ele alınabilir. Dayanma (yaşam) süresi, başka bir ifade ile bozuluncaya (ölünceye) kadar geçen zaman T ile gösterilsin. R(t ) = P(T > t ) , t≥0 fonksiyonuna güvenilirlik fonksiyonu (reliability function) denir. Bir sistemin belli bir t anındaki güvenilirliği ( R(t ) ) bu sistemin t anında görev yapabilir olmasının olasılığıdır, başka bir ifade ile t anına kadar bozulmamış olmasının olasılığıdır veya bozulmanın t anından sonra olması olasılığıdır. P(t < T ≤ t +△t / T > t ) , t≥0 △ t →0 △t fonksiyonuna bozulma oranı (ölüm oranı, risk, hazard) fonksiyonu denir. h(t)= lim h(t)△ t ≈ P(t < T ≤ t +△t / T > t ) olmak üzere, h(t)△t değeri, sistemin t anına kadar bozulmadığı bilindiğinde (t , t +△t ] zaman aralığında bozulması olasılığı olarak düşünülürse, h(t) ≈ P(t < T ≤ t +△t / T > t ) △t olup, birim zamanda bozulma oranıdır. f , F , R , h fonksiyonlarından birinin bilinmesi durumunda diğerleri elde edilebilir. t ∫0 F ( t ) = f ( t ) dt h ( t ) =− R '( t ) R (t ) R ( t ) =1− F ( t ) → F ← → R ← → h f ← t F (t ) F ( t ) =1− R ( t ) f (t )= R (t ) =e dt Dayanma süresi T üstel dağılıma sahip olduğunda, 1 −θt e f (t ) = θ 0 , t >0 , d.y. 0 F (t ) = − t 1-e θ R(t ) = e h(t ) = dır. 1 θ − , t<0 , t≥0 t θ , t≥0 , t≥0 − ∫ h ( t ) dt 0 81 Güvenilirlik analizinde çok kullanılan dağılımlardan birisi de Weibull dağılımıdır. Bu dağılım için, αβ t α −1e − β t f (t ) = 0 α α h(t ) = αβ t α −1 , d.y. , t<0 0 F (t ) = − β tα 1 − e R(t ) = e− β t , t>0 , t≥0 , t≥0 , t≥0 dır. Dağılımın parametrelerine ( α , β > 0 ) bağlı olarak Weibull dağılımı W (α , β ) ile gösterilir. W (1, β ) dağılımı 1/ β parametreli üstel dağılımdır. W (2, β ) dağılımına Rayleigh dağılımı denir. W (α = 2, β = 2) dağılımı için olasılık yoğunluk, dağılım, güvenilirlik ve bozulma oranı fonksiyonlarının grafikleri aşağıdaki gibidir. 2 1 0 0 0.5 1 1.5 2 2.5 3 0 0.5 1 1.5 2 2.5 3 0 0.5 1 1.5 2 2.5 3 0 0.5 1 1.5 2 2.5 3 1 0.5 0 1 0.5 0 20 10 0 T ∼ W (α , β ) olmak üzere, 1 1 E (T ) = ( ) Γ( α β α + 1) 2 2 E (T ) = ( ) Γ( + 1) 2 1 1 β α α 2 1 2 Var (T ) = ( ) Γ( + 1) − (Γ( + 1)) 2 β α α 1 dır. α 82 Sistem Güvenilirliği Bir sistemde, dayanma sürelerinin olasılık dağılımları bilinen bazı bileşenler (parçalar) görev yapsın. Bileşenlerin dayanma süreleri bağımsız olsun. Bileşenlerden bazıları bozulduğu zaman diğerlerinin dayanma süreleri üzerinde bir etkisi olmasın. Aşağıdaki sistemi göz önüne alalım. a1 a2 a3 a4 S1 Sistem paralel görev yapan iki alt sistemden oluşmaktadır. Alt sistemlerin her biri seri görev yapan iki parçadan oluşmaktadır. Ai olayı i numaralı ( i = 1,2,3,4 ) parçanın t zaman biriminden (yıldan) fazla dayanması olayı olsun. Sistemin en az t yıl (t yıldan fazla) dayanması olayının olasılığı, P ( A1 ∩ A2 ) ∪ ( A3 ∩ A4 ) =P ( A1 ∩ A2 ) + P ( A3 ∩ A4 ) − P ( A1 ∩ A2 ∩ A3 ∩ A4 ) = P( A1 )P( A2 ) + P( A3 )P( A4 ) − P( A1 )P( A2 )P( A3 )P( A4 ) dır. Parçalar için dayanma süresi Ti (i = 1,2,3,4) rasgele değişkeni ve güvenilirlik fonksiyonu Ri (t ) = P(Ti > t ) ile gösterilirse, sistemin güvenilirlik fonksiyonu, RS 1 (t ) = R1 (t )R2 (t ) + R3 (t ) R4 (t ) − R1 (t )R2 (t ) R3 (t ) R4 (t ) olur. Parçaların aynı türden olduğu göz önüne alınırsa, RS1 (t ) = R12 (t )(2 − R12 (t ) ) , t>0 yazılır. Örneğin parçalar için dayanma süresi θ = 10 yıl ortalama ile üstel dağılıma sahip olduğunda, ∞ t t − 1 −10 e dt =e 10 10 t R1 (t ) = P(T1 > t ) = ∫ ve R S1 (t ) = e − 2t 10 (2 − e − 2t 10 ) olmak üzere S1 sisteminin en az 10 yıl görev yapması olasılığı, ( ) R S1 (10) = e −2 2 − e −2 = 0.2551 dır. Sistemin dayanma süresi TS1 ile gösterilsin. TS1 ‘in dağılım fonksiyonu, FS1 (t ) = 1− RS1 dır. 2t 2t − − 10 10 (t ) = 1− e (2 − e ) , t>0 83 Sistemin ortalama dayanma süresi, ∞ 0 0 −∞ ∞ E (TS1 ) = ∫ (1− FS1 ( x))dx − ∫ FS 1 ( x)dx = ∫ RS1 (t )dt 0 olmak üzere, parçaların dayanma süreleri θ = 10 olan üstel dağılıma sahip olduğunda, ∞ E (TS1 ) = ∫ e−2t /10 (2 − e−2t /10 )dt = 7.5 0 elde edilir. (Burada sürekli bir X rasgele değişkeninin beklenen değeri için söz konusu olan ∞ ∞ 0 −∞ 0 −∞ E(X ) = ∫ xf ( x)dx =∫ (1 − F ( x))dx − ∫ F ( x)dx formülü kullanılmıştır). Şimdi bu sistemlerin en az t yıl dayanması olasılığını yani güvenilirlik fonksiyonunun t deki değerini simülasyon yaparak elde etmeye çalışalım. Parçaların dayanma süreleri T1 , T2 , T3 , T4 olmak üzere, bunların dağılımlarından sayı üreterek T1 , T2 , T3 , T4 rasgele değişkenlerin aldığı değerleri gözleyebiliriz. Sistemin dayanma süresi, TS 1 = max{min{T1 , T2 }, min{T3 , T4 }} olup, ilgili Matlab programı, n=10000 for i=1:n T1=-10*log(rand(1)); T2=-10*log(rand(1)); T3=-10*log(rand(1)); T4=-10*log(rand(1)); TS1(i)=max(min(T1,T2),min(T3,T4)); end RS1=sum(TS1>10)/n ETS1=mean(TS1) hist(TS1) dır. Bu programı işletiniz ve sonuçları yorumlayınız. 84 Bileşenlerin dayanma sürelerinin olasılık dağılımlarına bağlı olarak sistemin dayanma süresinin olasılık dağılımı teorik (analitik) olarak elde edildiğinde simülasyona gerek kalmayabilir. Bazı durumlarda sistemlerin karmaşık yapıda olması veya bileşenlerin dayanma sürelerinin dağılımları ile ilgili fonksiyonların karmaşık olması nedeniyle sistemin dayanma süresi ile ilgili bilgilerin teorik olarak elde edilmesi mümkün olmamaktadır. Bu nedenle simülasyon sistem güvenilirliğinde çok yaygın olarak kullanılmaktadır. Simülasyon ile gözlenen dayanma süreleri için çizilen histogram dayanma süresinin dağılımının biçimi hakkında bilgi vermektedir. 85 Aşağıdaki sistemi göz önüne alalım. a1 a2 a5 a3 a4 S2 Bu sisteminin eşdeğeri olan sistem, a1 a1 a2 a5 a3 a3 a4 a4 a5 a2 olmak üzere güvenilirlik fonksiyonu, RS 2 (t ) = R1 (t )R2 (t ) + R1 (t )R5 (t ) R4 (t ) + R3 (t ) R4 (t ) + R3 (t )R5 (t ) R2 (t ) − R1 (t )R2 (t ) R5 (t )R4 (t ) − R1 (t ) R2 (t ) R3 (t ) R4 (t ) R1 (t ) R2 (t ) R3 (t ) R5 (t ) − − R1 (t )R5 (t ) R4 (t )R3 (t ) − R1 (t ) R5 (t ) R4 (t ) R3 (t )R2 (t ) − R3 (t ) R4 (t ) R5 (t ) R2 (t ) +4 R1 (t ) R2 (t ) R5 (t ) R4 (t ) R3 (t ) − R1 (t ) R2 (t ) R3 (t ) R4 (t ) R5 (t ) = 2 R12 (t ) + 2 R13 (t ) − 5R14 (t ) + 2 R15 (t ) dır. Parçalar θ = 10 parametreli üstel dağılıma sahip olsun. Sistemin en az 10 yıl dayanması olasılığı, RS 2 (10) = 2e−2 + 2e −3 − 5e −4 + 2e−5 = 0.2921 olur. 86 Sistemin dayanma süresinin olasılık yoğunluk fonksiyonu, dR (t ) f (t ) = − S 2 , t>2 dt olmak üzere, bu fonksiyonun biçimini simülasyon ile gözlenen dayanma süreleri için çizilen histogram yardımıyla görmeye çalışınız. Sistemin ortalama dayanma süresini simülasyon yaparak elde etmeye çalışınız. 87 a 2 , a4 parçalarının yerine bozulma oranı, h(t ) = 10 −2 t , t > 0 fonksiyonu ile verilen b2 , b4 parçaları konmuş olsun. Böyle parçalar için, t −∫ h (t ) dt R (t ) = e 0 t −∫ 10−2 tdt =e 0 − F (t ) = 1− R(t ) = 1− e 1 2 t 200 F −1 (u ) = −200 ln(1− u ) 1 f (t ) = 1 − 200 t te 100 ∞ E (T ) = ∫ t 0 − =e 1 2 t 200 , t>0 , t>0 , 0 < u <1 2 , t>0 1 1 − 200 t 2 te = 50π 100 dır. S1, S2 sistemlerinde a 2 , a4 parçalarının yerine b2 , b4 parçalarının bulunduğu durum için simülasyon yapmak için yukarıdaki bilgisayar programlarında T2 ile T4 değişkenleri için T2=sqrt(-200*log(rand)) T4=sqrt(-200*log(rand)) yazılması yeterli olacaktır. Đlgili Matlab programı, clc;clear all;close all n=10000 for i=1:n T1=-10*log(rand(1)); T3=-10*log(rand(1)); T5=-10*log(rand(1)); T2=sqrt(-200*log(rand(1))); T4=sqrt(-200*log(rand(1))); TS1(i)=max(min(T1,T2),min(T3,T4)); TS2(i)=max([min(T1,T2),min([T1 T5 T4]),min(T3,T4),min([T3 T5 T2])]); end RS1=sum(TS1>10)/n RS2=sum(TS2>10)/n ORTS1=sum(TS1)/n ORTS2=sum(TS2)/n subplot(2,1,1);hist(TS1) subplot(2,1,3);hist(TS2) dır. 88 Yukarıdaki programı işletiniz ve sonuçları yorumlayınız. 89 Belli bir tür elektronik parça için dayanma süresi 1 yıl ortalama ile üstel dağılıma sahip olsun. Dayanma süreleri birbirinden bağımsız ve böyle parçalardan oluşan aşağıdaki devre elemanlarının ortalama dayanma süreleri nedir? Bu devre elemanlarının az 1 yıl dayanmaları olasılıkları nedir? birbirinin yedeği olarak görev yapan üç parça Çözüm: 90 Simülasyon: 91 Laboratuar Çalışması 9 Normal Dağılım ve Uygulamaları Bir X rasgele değişkeninin olasılık yoğunluk fonksiyonu, 1 e 2πσ f ( x) = x− − 1 2 σ µ 2 , − ∞ < x < +∞ biçiminde olduğunda, X rasgele değişkenine normal dağılıma sahiptir denir ve X ∼ N ( µ , σ 2 ) biçiminde gösterilir. µ ∈ R ve σ 2 ∈ (0, ∞) dağılımın parametreleridir. µ = 0 ve σ 2 = 1 olan dağılıma standart normal dağılım denir. Standart normal dağılıma sahip rasgele değişken genellikle Z harfi ile gösterilir. Standart normal dağılıma sahip Z ∼ N (0,1) rasgele değişkeninin olasılık yoğunluk fonksiyonu, 2 1 − z2 f ( z) = e 2π dağılım fonksiyonu, , −∞ < z < ∞ F : R → [0,1] z z → F ( z) = ∫ −∞ 2 1 − z2 e dz 2π ve grafikleri, >> x=-4:.1:4; >> plot(x,normpdf(x,0,1)) 0.4 0.35 0.3 0.25 0.2 0.15 0.1 0.05 0 -4 -3 -2 -1 0 -1 0 1 2 3 4 >> plot(x,normcdf(x,0,1)) 1 0.8 0.6 0.4 0.2 0 -4 -3 -2 1 2 3 4 dır. Olasılık yoğunluk fonksiyonunun grafiği çan kesitine benzemekte olup, çan eğrisi olarak isimlendirilmektedir. z I ( z) = ∫ 0 2 1 − z2 e dz 2π 92 integralinin yaklaşık değerini, Riemann toplamı olarak Basic programı yardımıyla z = 0 : 0.5 : 4 için hesaplayınız. hesaplayan aşağıdaki INPUT DELX , Z T=0 FOR X = 0 TO Z STEP DELX T = T + 1 / EXP (-0.5 *(DELX / 2 + X)^2 ) NEXT X I = 1 / SQR ( 2*3.14159 )* T* DELX PRINT I END Aynı değerleri Matlab’ da elde edin. >> z=0:.5:4; >> normcdf(z)-0.5 Normal dağılıma sahip bir X ∼ N ( µ , σ 2 ) rasgele değişkenin olasılık yoğunluk fonksiyonu, f ( x) = 1 e 2πσ x− − 1 2 σ µ 2 , − ∞ < x < +∞ 93 olmak üzere, grafiğinin biçimi çan eğrisi gibi olmakla birlikte, şekli µ ∈ R ve σ ∈ (0, ∞) parametrelerine göre değişmektedir. Örneğin, µ =2 ve σ = 16 için olasılık 2 2 yoğunluk fonksiyonunun grafiği, >> x=-15:.1:15; >> plot(x,normpdf(x,2,4)) 0.1 0.08 0.06 0.04 0.02 0 -15 -10 -5 0 5 10 15 dır. Grafikten de görüldüğü gibi olasılık yoğunluk fonksiyonu x= µ =2 için maximum değerini almaktadır ve x= µ =2 ye göre simetriktir. Dağılım fonksiyonunun grafiği de, >> x=-15:.1:15; >> plot(x,normcdf(x,2,4)) 1 0.8 0.6 0.4 0.2 0 -15 -10 -5 0 5 10 15 dır. µ = −5, −2.5, 0,3, 6.6 ve σ 2 = 9 olan normal dağılımların olasılık yoğunluk ve dağılım fonksiyonlarının grafikleri, 0.14 0.12 0.1 0.08 0.06 0.04 0.02 0 -15 -10 -5 0 5 10 15 94 1 0.8 0.6 0.4 0.2 0 -15 -10 -5 0 5 10 15 olmak üzere, görüldüğü gibi µ parametresi dağılımın konumunu belirlemektedir. µ = 0 ve σ 2 = 0.25, 0.81,1, 9, 20 fonksiyonlarının grafikleri, olan normal dağılımların olasılık yoğunluk 0.8 0.7 0.6 0.5 0.4 0.3 0.2 0.1 0 -15 -10 -5 0 5 10 15 olmak üzere, görüldüğü gibi σ 2 parametresine bağlı olarak dağılımın yayılımı değişmektedir. Grafiği kırmızı çizgi olan olasılık yoğunluk fonksiyonu N (0,1) standart normal dağılımınkidir. σ 2 değeri arttıkça, olasılık yoğunluk fonksiyonu basıklaşmaktadır, küçüldükçe sivrileşmektedir. Normal dağılımına sahip bir X ∼ N ( µ , σ 2 ) rasgele değişkeninin olasılık yoğunluk fonksiyonu, f ( x) = 1 e 2πσ x− − 1 2 σ µ 2 , − ∞ < x < +∞ ve parametreleri µ ∈ R , σ 2 ∈ (0, ∞) olmak üzere, ∞ E( X ) = ∫ x −∞ 2 1 x−µ − 1 e 2πσ 2 σ dx = µ Var ( X ) = σ 2 MX dır. 2 2 µ t +σ t 2 (t ) = e , −∞ < t < ∞ 95 Örnek: Yapılan araştırmalar sonucunda, Ankara doğumlu 18 aylık çocukların ağırlıklarının N ( µ = 13.5 (kg ), σ 2 = 2.25 ) dağılımına sahip olduğu tespit edilmiştir. a) Rasgele seçilen bir çocuğun ağırlığının 18 kg´dan fazla olması olasılığı nedir? b) Rasgele seçilen bir çocuğun ağırlığının 12 kg´dan az olması olasılığı nedir? c) Ağırlıkları 12 kg ile 15 kg arasında olan çocukların oranı nedir? d) Rasgele seçilen 10 çocuktan en az 8 tanesinin [10,17] aralığında olması olasılığı nedir? 10 çocuktan kaç tanesinin [10,17] aralığına düşmesi beklenir? e) Çoçuklardan %25 ‘nin ağırlığı hangi değerin altındadır? f) Çoçuklardan %75 ‘nin ağırlığı hangi değerin altındadır? g) En hafif %5 ‘lik çocuklar için ağırlıklar hangi değerin altındadır. h) En ağır %5 ‘lik çocuklar için ağırlıklar hangi değerin üzerindedir? ı) Rasgele seçilen 1000 tane çocuktan aşağıdaki aralıklara düşenlerin beklenen sayıları nedir? (9 kg’dan az) , (9,10] , (10,11] , (11,12] , (12,13] , (13,14] , (14,15] , (15,16] , (16,17] , (17,18] , (18 kg’dan çok) a) X : rasgele seçilen bir çocuğun ağırlığı olsun. X ~ N ( µ = 13.5, σ 2 = 2.25) dağılımlıdır. 18 − 13.5 P ( X > 18) = P Z > = P ( Z > 3) = 1 − P ( Z ≤ 3) = 1 − normcdf (3) = 1 − 0.9987 = 0.0013 1.5 12 − 13.5 b) P ( X < 12) = P Z < = P ( Z < −1) = normcdf (−1) = 0.1587 1.5 c) P (12 < X < 15) = normcdf(15,13.5,1.5)-normcdf(12,13.5,1.5)= 0.6826 ≈ %68 d) Rasgele seçilen bir çocuğun 10 kg ile 17 kg arasında olması olasılığı, p= P (10 < X < 17) = normcdf(17,13.5,1.5)-normcdf(10,13.5,1.5)= 0.98037 ≈ %98 dır. Y rasgele değişkeni rasgele seçilen 10 çocuk arasında ağırlıkları [10,17] aralığında olanların sayısı olsun. Y ∼ b( n = 10, p = 0.98037) dağılımına sahiptir. Buna göre, 10 10 P (Y ≥ 8) = ∑ p x q10−x = sum(binopdf([8 9 10],10,0.98037)) = 0.99918 x =8 x dır. E (Y ) = np = 10× 0.98037=9.8037 olmak üzere, rasgele seçilen 10 çocuktan [10,17] aralığına düşenlerin sayısının beklenen değeri 9.8037 dir. e) P ( X < x0.25 ) = 0.25 olmak üzere, x0.25 = FX−1 (0.25) = norminv(0.25,13.5,1.5) = 12.488 dır. f) x0.75 = FX−1 (0.75) = norminv(0.75,13.5,1.5) = 14.512 g) x0.05 = FX−1 (0.05) = norminv(0.05,13.5,1.5) = 11.033 96 h) x0.95 = FX−1 (0.95) = norminv(0.95,13.5,1.5) = 15.967 ı) P ( X < 9) = normcdf(9,13.5,1.5)=0.0013 P (9 < X < 10) = normcdf(10,13.5,1.5)-normcdf(9,13.5,1.5) = 0.0085 P (10 < X < 11) = normcdf(11,13.5,1.5)-normcdf(10,13.5,1.5) =0.0380 P (11 < X < 12) = normcdf(12,13.5,1.5)-normcdf(11,13.5,1.5) =0.1109 P (12 < X < 13) = normcdf(13,13.5,1.5)-normcdf(12,13.5,1.5) =0.2108 P (13 < X < 14) = normcdf(14,13.5,1.5)-normcdf(13,13.5,1.5) =0.2611 P (14 < X < 15) = normcdf(15,13.5,1.5)-normcdf(14,13.5,1.5) =0.2108 P (15 < X < 16) = normcdf(16,13.5,1.5)-normcdf(15,13.5,1.5) =0.1109 P (16 < X < 17) = normcdf(17,13.5,1.5)-normcdf(16,13.5,1.5) =0.0380 P (17 < X < 18) = normcdf(18,13.5,1.5)-normcdf(17,13.5,1.5) =0.0085 P ( X > 18) = 1 − P ( X ≤ 18) = 1-nomcdf(18,13.5,1.5)=1-0.9987=0.0013 0.35 0.3 0.25 0.2 0.15 0.1 0.05 0 5 10 15 20 olmak üzere, 1000 çocuktan bu arlıklara düşenlerin beklenen sayıları, 1000 P ( X < 9) = 1.3 1000 P (9 < X < 10) = 8.5 1000 P (10 < X < 11) = 38 1000 P (11 < X < 12) = 110.9 1000 P (12 < X < 13) = 210.8 1000 P (13 < X < 14) = 261.1 1000 P (14 < X < 15) = 210.8 1000 P (15 < X < 16) = 110.9 1000 P (16 < X < 17) = 38 1000 P (17 < X < 18) = 8.5 1000 P ( X > 18) = 1.3 dır. Ankara’da yaşayan 18 aylık çocukların ağırlıklarının dağılımını ortaya çıkarmak için yapılan araştırmada: • 18 aylık çocukların kitlesi nasıl belirlendi? • Bu kitleden bir örnek (örneğin 200 tane çocuk) nasıl seçildi? • Verileri toplama zaman olarak ne kadar sürdü? • Toplanan 200 tane sayı nasıl analiz edildi? • Ağırlığın normal dağılıma sahip olduğu kararı nasıl verildi? • Bir yıl sürmüş olması gereken böyle bir çalışmada elde edilen bulgular sonraki yıllarda 18 aylık çocuklar için geçerliliğini koruyacak mıdır? • Erkek ve kız çocukları için farklı dağılımlar söz konusu olabilir mi? gibi sorular ve başka birçok sorun ortaya çıkacaktır. Bunların çözüm yollarını ileride öğreneceksiniz. 97 ĐST251 dersini alan öğrencilerin boy uzunluklarının ve ağırlıklarının histogramlarını çiziniz. Ağırlığı anlatan (modelleyen) bir dağılım ve boy uzunluğunu anlatan bir dağılım önerebilir misiniz? 98 99 N (0,1) standart normal dağılımın olasılık yoğunluk fonksiyonu ve dağılım fonksiyonu grafikleri aşağıdaki gibidir. 0.4 0.3 0.2 0.1 0 -4 -3 -2 -1 0 1 2 3 4 -3 -2 -1 0 1 2 3 4 1 0.8 0.6 0.4 0.2 0 -4 Dağılım fonksiyonunun grafiğinin bulunduğu koordinat sisteminin y-ekseninin [0,1] aralığında U (0,1) düzgün dağılımdan 100 tane sayı üretip, bunları dağılım fonksiyonun tersi ile x-eksenine dönüştürürsek N (0,1) dağılımından sayı üretmiş oluruz. >> hist(norminv(rand(100,1)),6) 25 20 15 10 5 0 -3 -2 -1 0 1 2 3 100 Matlab’da randn(100,1) fonksiyonu ile doğrudan N (0,1) dağılımından 100 tane sayı üretip histogram çizdiriniz. 101 N (µ = 60, σ 2 = 100) dağılımının olasılık yoğunluk ve dağılım fonksiyonlarının grafiklerini çizdiriniz. Bu dağılımından 100 tane sayı üretip histogram çizdiriniz. 102 Laboratuar Çalışması 10 Çok Boyutlu Dağılımlar Marjinal ve Koşullu Dağılımlar Kesikli Dağılımlar 2 1 3 3 1 1 3 2 2 2 1 2 3 3 2 1 3 2 1 3 Yukarıdaki kavanozdan bir top çekilmesi ve renk ile birlikte üzerindeki sayının gözlenmesi deneyini modelleyen bir olasılık uzayı oluşturunuz. 103 X 1 rasgele değişkeni çekilen topun üzerindeki sayıyı, X 2 rasgele değişkeni ise sarı top için 0, yeşil top için 1, pembe top için 2, gri top için 3 değerini alsın. ( X1, X 2 ) rasgele vektörünün olasılık tablosunu yazınız. X 1 ve X 2 rasgele değişkenlerin marjinal dağılımlarını bulunuz. X1 x2 = 3 ve X2 x1 = 3 ‘nin koşullu dağılımını bulunuz. 104 Đadeli olarak 50 çekiliş yapıp aşağıdaki tablonun gözelerine ilgili frekansları yazınız. Gözlemler: x1 x2 0 1 2 3 1 2 3 Satır tolamı Toplam Beklenen frekanslar nedir? Beklenen frekansları hesaplayıp aşağıdaki tablonun içine yazınız. 0 1 2 3 x1 x2 1 2 3 Satır tolamı f ijg : i.satır − j.sütundaki gözlenelen frekans f ijb : i.satır − j.sütundaki beklenen frekans olmak üzere, 3 ∑∑ i =1 j =1 dır. (f g ij Sütun toplamı Toplam Gözlenen frekanslar ile beklenen frekansları bir tek tabloya yazınız. 0 1 2 x1 x2 1 2 3 2 Sütun toplamı − f ijb ) fijb 2 = 3 105 Korelasyon Katsayısı 2 4 3 3 1 1 3 2 2 4 2 3 3 2 2 1 3 4 1 1 Bir top çekilmesi ve renk ile birlikte üzerindeki sayının gözlenmesi deneyinde: a) X 1 çekilen topun üzerindeki sayı, X 2 ise beyaz top için 0, sarı top için 1, yeşil top için 2, pembe top için 3, gri top için 4 değerini alsın. X 1 ile X 2 arasındaki Pearson korelasyon katsayısını hesaplayınız. 106 b) X 2 beyaz top için 0, sarı top için 2, yeşil top için 4, pembe top için 6 ve gri top için 8 değerini aldığında X 1 ile X 2 arasındaki korelasyon katsayısı ne olur? c) X 1 ile X 2 bağımsız mıdır? X 1 ile X 2 aynı marjinal dağılımlara sahip olma koşuluyla bağımsız olsalardı, ortak olasılık tablosundaki olasılıklar ne olurdu. Bu olasılıkları hesaplayınız ve önceki şıklardaki olasılıklar ile karşılaştırınız. Dikkat edilirse bağımsızlık incelemesinde sadece marjinal olasılıklar ile ortak olasılıklar göz önüne alınmaktadır. Şimdi, olasılık tablosunun kenarındaki (marjindeki) X 2 nin aldığı 0,1,2,4 değerlerini siliniz ve yerlerine renk isimlerini yazınız. “ X 1 ile X 2 bağımsız mıdır?” sorusu “Topların üzerindeki sayılar ile topların renkleri bağımsız mıdır?” sorusuna dönüşmüş oldu. 107 Aşağıdaki kavanozların hangisinde topların üzerindeki sayılar ile topların renkleri arasındaki “bağımsızlıktan uzaklaşma” daha küçüktür?” 2 4 3 3 1 1 3 2 2 4 3 2 2 3 2 1 3 4 1 1 2 4 3 3 1 4 1 2 2 2 3 2 2 4 2 1 3 4 1 1 108 Sürekli Dağılımlar X 1 ve X 2 rasgele değişkenlerinin ortak olasılık yoğunluk fonksiyonu, 1 , 0 ≤ x1 ≤ π / 2 , 0 ≤ x2 ≤ 10 f X1 , X 2 ( x1 , x2 ) = 5π 0 , d . y. olsun. Dağılımın destek kümesi, DX1 X 2 = {( x1 , x2 ) : 0 ≤ x1 ≤ π / 2 , 0 ≤ x2 ≤ 10} ⊂ R 2 dır. A = {( x1 , x2 ) : 0 < x1 < π / 2 , 0 < x2 < 7sin x1} ⊂ DX1 X 2 olayının olasılığı, π /2 7sin x1 π /2 1 1 7 14 π /2 P (( X 1 , X 2 ) ∈ A) = ∫ ∫ dx2 dx1 = 7 sin x1dx1 = (− cos x2 ) 0 = ∫ 5π 5π 0 5π 10π 0 0 dır. Böyle bir olay gerçek dünyada söz konusu olabilir mi? Aralarındaki uzaklık 20 cm olan paralel doğruların bulunduğu bir düzleme, uzunluğu 14 cm olan bir iğne’nin rasgele atılması deneyinde (Buffon’un Đğne Deneyi), X 1 : iğnenin doğrultusu ile paralel doğrular arasındaki dar açının büyüklüğü (radyan cinsinden), X 2 : iğnenin orta noktasının en yakın olan doğruya uzaklığı (cm cinsinden) olsun. π X 1 rasgele değişkeni (0, ) aralığında düzgün dağılıma sahip olup, olasılık yoğunluk 2 fonksiyonu, 1 π / 2 , 0 ≤ x1 ≤ π / 2 f X1 ( x1 ) = 0 , d . y. 109 ve X 2 rasgele değişkeni (0,10) aralığında düzgün dağılıma sahip olup, olasılık yoğunluk fonksiyonu, 1 10 , 0 ≤ x1 ≤ 10 f X 2 ( x2 ) = 0 , d . y. dır. X 1 ile X 2 bağımsız iki rasgele değişken olarak düşünülebilir. Buna göre, X 1 ve X 2 ‘nin ortak olasılık yoğunluk fonksiyonu, 1 , 0 ≤ x1 ≤ π / 2 , 0 ≤ x2 ≤ 10 f X1 , X 2 ( x1 , x2 ) = 5π 0 , d . y. olur. A = {( x1 , x2 ) : 0 < x1 < π / 2 , 0 < x2 < 7sin x1} ⊂ DX1 X 2 olayı iğne ile doğruların kesişmesi olayı olup, 14 P ( A) = = 0.4456 10π dır. Paralel doğrular arasındaki uzaklık 2a ve iğnenin uzunluğu 2l (l<a) olmak üzere, iğne 2l ile doğruların kesişmesi olayının olasılığı p = dır. πa a olması durumunda 2 destekleniyor mu? l= p= 1 π = 0.3183 dır. Bu sonuç deneyler tarafından 110 Evde: Bir boncuğu 10 cm yükseklikten çizdiğiniz bir ( x1 , x2 ) -koordinat sisteminin başlangıç noktası üzerine bırakınız ve konumlandığı noktayı işaretleyiniz. Bunu 100 defa tekrarlayınız (önceki gözlemlerinize 50 gözlem daha ekleyiniz). Đşaretlenen noktalar, gözlenen ( x1 , x2 ) ‘ler için serpilme (saçılım) grafiği oluşturacaktır. a) Gözlediğiniz x1 ‘ler için histogram çiziniz. b) Gözlediğiniz x2 ‘ler için histogram çiziniz. c) Gözlediğiniz ( x1 , x2 ) ‘ler için histogram çizmeye çalışınız. 111 Aşağıdaki gibi bir olasılık yoğunluk fonksiyonu göz önüne alalım. f ( x1 , x2 ) = 1 2π θ 2 1 x2 x2 − ( 12 + 22 ) e 2 θ θ , −∞ < x1 < ∞ −∞ < x2 < ∞ , (θ ∈ (0, ∞)) Bu olasılık yoğunluk fonksiyonu ile ilgili marjinal dağılımlar f X 1 ( x1 ) = f X 2 ( x2 ) = 1 2π θ 1 2π θ − e x12 2θ 2 − e x22 2θ 2 , −∞ < x1 < ∞ , −∞ < x2 < ∞ dır. X1 ve X 2 rasgele değişkenleri boncuğun konumlandığı noktanın koordinatları olsun. X1 ile X 2 ‘nin ortak olasılık yoğunluk fonksiyonu ve marjinal olasılık yoğunluk fonksiyonları yukarıdaki gibi birer fonksiyon olabilir mi? θ (θ ∈ (0, ∞)) parametresinin değişik değerleri için yukarıdaki fonksiyonların grafiklerini çiziniz (bilgisayarda çizdiriniz) ve gözlemlerle ilişkilendirmeye çalışınız. 112 Laboratuar Çalışması 11 Bağımsız Rasgele Değişkenlerin Toplamı ve Ortalaması X 1 , X 2 ..., X n rasgele değişkenlerin beklenen değerleri E ( X i ) , i = 1, 2,..., n ve kovaryansları Cov( X i , X j ) , i, j = 1, 2,..., n mevcut olduğunda a1 , a2 ,..., an ∈ R olmak üzere, n n E ∑ ai X i = ∑ ai E ( X i ) i=1 i=1 ve n n n Var ∑ ai X i = ∑∑ ai a j Cov( X i , X j ) i=1 i=1 j=1 n n = ∑ ai2Var ( X i ) + 2∑ i =1 n ∑ a a Cov( X , X i j i j ) i =1 j =i +1 dır. X 1 , X 2 ..., X n rasgele değişkenleri bağımsız olduğunda kovaryanslar sıfır olacağından, n n Var ∑ ai X i = ∑ ai2Var ( X i ) i =1 i =1 1 ve ai = , i = 1, 2,..., n için n n n X ∑ Var ( X i ) i ∑ i=1 i =1 Var = n2 n dır. X 1 , X 2 ..., X n rasgele değişkenlerinin ortalaması alışılagelmiş olarak X n veya X ile gösterilir. X 1 , X 2 ..., X n rasgele değişkenleri aynı ( µ ) ortalamalı olduklarında, n ∑ Xi E ( X n ) = E i =1 n =µ dır. X 1 , X 2 ..., X n rasgele değişkenleri aynı ( µ ) ortalamalı, aynı ( σ 2 ) varyanslı ve bağımsız olduklarında, n n X ∑ i ∑ Xi σ 2 = µ , Var ( X n ) = Var i =1 = E ( X n ) = E i =1 n n n dır. 113 n Bağımsız X 1 , X 2 ..., X n rasgele değişkenleri için ∑X i ve X n rasgele değişkenlerinin i =1 dağılımlarını elde etmek bazen çok kolay olmaktadır. Bağımsız rasgele değişkenler için n M n ∑ Xi ( ) (t ) = ∏ M X i (t ) = M X1 (t ) i =1 i=1 n n özelliğinden faydalanarak ∑X i ‘nin dağılımı ve buradan X n ‘nin dağılımı bulunabilir. i =1 * X 1 , X 2 ..., X n rasgele değişkenleri bağımsız ve aynı b(1, p ) Bernoulli dağılımına sahip olduğunda M X i (t ) = q + pet , i = 1, 2,..., n olmak üzere, n M n ∑ Xi (t ) = ∏ M X i (t ) = (q + pet )n i =1 i=1 n olup, ∑X i ∼ b(n, p ) binom dağılımına sahiptir. i =1 * X 1 , X 2 ..., X k rasgele değişkenleri bağımsız ve aynı p parametreli geometrik dağılıma sahip olduğunda M X i (t ) = q + pet , i = 1, 2,..., k olmak üzere, M k pet n ( t ) = M ( t ) = ( ) ∏ Xi k t 1 qe + i = 1 X ∑ i i=1 k dır. ∑X rasgele değişkeni k başarı elde edinceye kadar yapılan deneme sayısı olup, negatif i i =1 binom dağılımına sahiptir. * X 1 , X 2 ..., X n rasgele değişkenleri bağımsız ve aynı λ parametreli Poisson dağılıma sahip olsun. M X i (t ) = eλ (e −1) , i = 1, 2,..., n t olmak üzere, k M k ∑ Xi (t ) = ∏ M X i (t ) = (eλ ( e −1) ) n = enλ (e −1) t t i =1 i=1 k olup, ∑X i =1 i rasgele değişkeni parametresi nλ olan Poisson dağılımına sahiptir. 114 * X 1 , X 2 ..., X n rasgele değişkenleri bağımsız ve aynı θ parametreli üstel dağılıma sahip olsun. M X i (t ) = (1− θt )−1 , i = 1,2,..., n olmak üzere, k M k ∑ Xi (t ) = ∏ M X i (t ) = ((1− θt )−1 ) = (1− θt )−n n i =1 i=1 k olup, ∑X rasgele değişkeni parametreleri α = n ve β = θ olan gamma dağılımına i i =1 k ∑X sahiptir. i ∼ Γ(n, θ ) dır. i =1 * X 1 , X 2 ..., X n rasgele değişkenleri bağımsız, aynı µ ortalamalı ve aynı σ 2 varyanslı N (µ, σ 2 ) normal dağılımına sahip olsun. M X i (t ) = e 2 2 µt+σ t 2 , i = 1,2,..., n olmak üzere, 2 2 µ t +σ 2 t 2 nµ t + nσ t 2 2 M k (t ) = ∏ M X i (t ) = e = e = 1 i X ∑ i n k i=1 k olup, ∑X i ∼ N (nµ, nσ 2 ) dır. i =1 n n ∑X i nin dağılımı bilindiğinde X n = i =1 ∑X i =1 n i ‘nin dağılımını elde etmek kolaydır. n Kesikli halde, X n ‘nin aldığı değerler ∑X i rasgele değişkeninin aldığı değerlerin n ‘e i =1 bölünmüşleridir. Olasılıklar ise aynıdır. * X 1 , X 2 ..., X n rasgele değişkenleri bağımsız ve aynı b(1, p ) Bernoulli dağılımına sahip n olduğunda, Y = ∑ X i ∼ b(n, p ) rasgele değişkeninin aldığı değerler, y = 0,1, 2,..., n olmak i =1 üzere, olasılık fonksiyonu, n fY ( y ) = P (Y = y ) = P (∑ X i = y ) i =1 n = p y q n− y , y = 0,1, 2,..., n y dır. 115 n ∑X i Y 1 2 3 rasgele değişkeninin aldığı değerler, xn = 0, , , ,...,1 olup, bu n n n n n değerleri alması olasılıkları Xn = i =1 = n f X n ( xn ) = P( X n = xn ) = P(∑ X i = nxn ) i =1 n nx n−nx 1 2 3 n p nq , xn = 0, , , ,...,1 = nxn n n n dır. Sürekli dağılımlar için X n ‘nin dağılımı, n X i ( n X ) t n ∑ i=1 ∑ i n t t t X nt n i = 1 M X (t ) = E (e ) = E e = M n ( ) = M X1 ( ) = E e n n ∑ Xi n i=1 moment çıkaran fonksiyonundan bulunabilir. * X 1 , X 2 ..., X n rasgele değişkenleri bağımsız ve aynı θ parametreli üstel dağılıma sahip k olduğunda, ∑X i ∼ Γ(n, θ ) ve i =1 t t θ M X (t ) = M X1 ( ) = (1− θ )−n = (1− t )−n n n n n θ olup, X n ∼ Γ(α = n, β = ) dır. n n * X 1 , X 2 ..., X n rasgele değişkenleri bağımsız, aynı µ ortalamalı ve σ 2 varyanslı k N (µ, σ 2 ) normal dağılıma sahip olsun. ∑X i ∼ N (nµ, nσ 2 ) ve i =1 2 σ2 t2 t σ 2 nt n µt + n t µ + 2 M X (t ) = M X1 ( ) = e n 2 = e n n n olup, X n ∼ N (µ, σ2 ) dır. n 116 Düzgün bir tavla zarını n=1,2,3,...,20 defa atınız. Gelen nokta sayıları sırasıyla X 1 , X 2 ..., X 20 rasgele değişkenleri olmak üzere, bu rasgele değişkenlerin aldığı x1 , x2 ..., x20 değerlerini gözleyiniz. n Xn = ∑X i i =1 , n=1,2,3,...,20 n rasgele değişkeninin aldığı x1 , x2 , x3 ,...x20 değerlerini, gözlenen x1 , x2 ..., x20 sayılarına bağlı olarak hesaplayınız. Yatay eksende atış sayısı olan n=1,2,3,...,20 sayıları ve düşey eksende karşılık gelen nokta sayısı ortalaması x1 , x2 , x3 ,...x20 olmak üzere (n, xn ) , n=1,2,3,...,20 noktalarını bir koordinat sisteminde elle işaretleyiniz. Zarı, yeniden 20 defa atınız ve (n, xn ) , n=1,2,3,...,20 noktalarını yukarıdaki koordinat sisteminde işaretleyiniz. 117 Düzgün zar atışı deneyini bilgisayarda yapınız. (n, xn ) , n=1,2,3,...,20 noktalarını bir koordinat sisteminde işaretleyiniz. (n, xn ) , n=1,2,3,...,20 noktalarını 10 kez aynı koordinat sisteminde işaretleyiniz. X 1 , X 2 ..., X n rasgele değişkenleri bağımsız ve aynı dağılımlı olmak üzere, n Xn = ∑X i i =1 n rasgele değişkeninin kesikli halde olasılık, sürekli halde olasılık yoğunluk fonksiyonunu aşağıdaki dağılımların her biri için elde ediniz. 1 a) b(1, p = ) 2 b) b(1, p = 0.8) c) λ = 3 parametreli Poisson d) θ = 3 parametreli üstel e) N (µ = 3, σ 2 = 25) f) N (µ = 3, σ 2 = 100) n=5,10,20,50,100 için X n ‘nin olasılık (yoğunluk) fonksiyonunun grafiğini, dağılımların her biri için çiziniz (çizdiriniz). 118 119 Laboratuar Çalışması 12 Büyük Sayılar Kanunu X 1 , X 2 ,…, X n bağımsız rasgele değişkenler ve E ( X i ) = µ , Var ( X i ) = σ 2 , i = 1, 2,…, n olsun. X 1 , X 2 ,…, X n ‘ler aynı dağılımlı olmayabilir. n Xn = ∑X i , n = 1, 2,3,... i =1 n olmak üzere, X 1 , X 2 ,…, X n ,... ortalamalar dizisini göz önüne alalım. E X eşitsizliğinden, ( P | X n − µ X |< kσ X ve k = n n ) = P | X n n = µ ve Var ( X n ) = − µ |< k σ2 σ 1 ≥ 1− k2 n ε n σ , ε=k > 0 için σ n P (| X n − µ |< ε ) ≥ 1 − 1 2 ε n σ yazılır. Eşitsizliğin her iki tarafının n → ∞ için limiti alınırsa, 1 lim P (| X n − µ |< ε ) ≥ lim 1 − 2 n →∞ n →∞ ε n σ ve olasılılığın birden büyük olamayacağı düşünülürse, lim P (| X n − µ |< ε ) = 1 n →∞ elde edilir. Bu durum Zayıf Büyük Sayılar Kanunu olarak bilinmektedir. Küçük her ε > 0 değeri için, lim P (| X n − µ |< ε ) = 1 n →∞ olması durumu, “ X n olasılıkta µ ‘ye yakınsar “ diye ifade edilmekte ve P X n →µ n→∞ biçiminde gösterilmektedir. n olup, Chebyshev 120 Zayıf Büyük Sayılar Kanunu: X 1 , X 2 ,…, X n ,... bağımsız ve aynı µ ortalamalı σ 2 < ∞ P → µ dır. varyanslı rasgele değişkenler ise X n n→∞ Olasılık Teorisi çerçevesinde ispatlanan Zayıf Büyük Sayılar Kanunu gerçek dünyada da geçerlidir. Örneğin, düzgün bir tavla zarının ardı ardına atılışında gelen nokta sayıları sırasıyla X 1 , X 2 ..., X n ,... rasgele değişkenleri bağımsız ve 3.5 ortalamalı, 35/12 varyanslı olmak üzere, Zayıf Büyük Sayılar Kanunu’na göre n Xn = ∑X i P → µ = 3.5 n→∞ i =1 n dır. Bunu deneysel olarak görmeye çalışalım. Düzgün bir tavla zarının 150 kez atılışında aşağıdaki değerler gözlenmiştir. → 2 6 4 3 1 4 3 6 3 2 2 3 1 6 1 6 2 5 1 1 5 1 2 4 3 5 6 4 1 4 1 6 4 2 3 2 2 4 6 4 3 6 3 5 5 5 4 1 2 6 6 5 1 5 4 1 5 6 1 2 3 3 6 3 4 2 2 5 6 6 5 3 2 1 2 1 6 3 20 73 137 195 261 334 411 489 521 24 74 142 196 262 336 415 493 30 77 146 197 268 338 417 496 4 4 1 1 2 1 5 3 1 3 2 6 1 3 6 4 5 2 6 5 6 6 4 6 2 6 3 4 5 2 1 6 4 4 2 6 1 2 1 4 1 4 6 1 5 6 4 6 1 3 3 2 6 6 2 2 47 95 160 219 286 360 437 51 99 162 221 292 366 440 2 3 2 1 1 2 4 4 2 6 4 5 6 2 6 3 52 103 168 222 293 369 445 53 106 171 227 296 371 446 toplamlar: 2 59 118 180 248 318 394 465 501 8 63 121 181 254 323 399 471 503 9 64 126 185 255 324 405 477 509 13 65 130 187 257 325 409 481 511 15 69 136 193 259 328 410 487 516 35 80 148 203 273 344 421 39 84 149 208 274 350 427 40 87 151 212 279 352 429 45 89 157 218 285 354 432 55 109 173 233 300 374 449 ortalamalar: 2 4 3.9 3.6364 3.1053 3.15 3 3 3.1892 3.1842 3.2391 3.2128 3.2364 3.1964 3.0781 3.1231 3.1918 3.2027 3.1829 3.1566 3.2198 3.2174 3.25 3.2475 3.3028 3.3273 3.3814 3.4034 3.378 3.375 3.3897 3.3942 3.4552 3.4452 3 3.75 3.0476 2.9667 3.2308 3.2708 3.1579 3.1515 3.1867 3.1905 3.2258 3.2745 3.3243 3.4083 3.3876 3.413 3.4626 3.25 3.6154 2.9545 3.0645 3.25 3.2653 3.1207 3.1642 3.2237 3.2118 3.234 3.2621 3.3125 3.3884 3.3846 3.4317 3.4527 3 3.6429 3 3.0938 3.3171 3.24 3.1356 3.2059 3.2208 3.186 3.2632 3.25 3.3097 3.3689 3.3969 3.4357 3.4631 3.3333 3.4667 3.0417 3.1212 3.2619 3.2941 3.1167 3.1739 3.2564 3.2069 3.2917 3.2762 3.3246 3.374 3.3788 3.4539 3.4733 3.4286 3.3125 2.96 3.1176 3.3023 3.2885 3.1639 3.1571 3.2278 3.2386 3.2784 3.3019 3.3217 3.3629 3.3759 3.4437 3.75 3.2353 2.9615 3.1143 3.3182 3.2642 3.1452 3.1268 3.2125 3.2135 3.2959 3.2897 3.3448 3.368 3.3955 3.4476 3.8889 3.1667 2.963 3.1944 3.2889 3.2778 3.1111 3.1528 3.1975 3.2444 3.2727 3.2778 3.3675 3.3889 3.3926 3.4444 57 115 177 237 304 379 455 178 239 310 382 458 179 245 316 388 461 121 olmak üzere, yatay eksende atış sayısı ve düşey eksende gelen sayıların ortalaması işaretlenirse, 4 3.5 3 2.5 2 0 50 100 150 elde edilir. Deney sayısı n arttıkça, X n değerleri µ = 3.5 sayısına yaklaşmaktadır. Düzgün tavla zarı atılışı deneyini Matlab’da fix(unifrnd(1,7)) deyimi ile gerçekleştirebiliriz (simüle edebiliriz). unifrnd(1,7) fonksiyonu U (1, 7) düzgün dağılımdan rasgele sayı üretmekte olup, fix fonksiyonu bunun tam değerini vermektedir. Örneğin, >> fix(unifrnd(1,7,1,50)) 3 4 3 4 3 4 3 3 2 3 2 2 5 5 6 1 3 1 6 2 6 1 3 6 1 3 6 4 3 1 2 2 4 4 2 1 3 6 6 5 6 5 1 3 4 4 1 1 5 2 dır. hold on; for i=1:30 plot((1:100),cumsum(fix(unifrnd(1,7,1,100)))./(1:100)) end plot([0 100],[3.5,3.5]) 6 5.5 5 4.5 4 3.5 3 2.5 2 1.5 1 0 10 20 30 40 50 60 70 80 90 Zar atışı ile ilgili deneyi (50 atış) ve simülasyonunu kendiniz yapınız. 100 122 1 2 3 4 1 4 2 10 3 Yukarıdaki kavanozdan rasgele bir top çekilmesi deneyinde gelen sayı X rasgele değişkeni olsun. X rasgele değişkeninin olasılık tablosu, x f ( x) = P( X = x) ve µ = E ( X ) = 1 2/9 2 2/9 3 2/0 4 2/9 10 1/9 10 20 ve σ 2 = Var ( X ) = dır. 3 3 Kavanozdan iadeli olarak, n=1,2,3,...,25 kez top çekiniz ve gelen sayıları x1 , x2 , x3 ,..., x25 gözleyiniz. n=1,2,3,...,25 için X n rasgele değişkeninin aldığı değerleri x1 , x2 , x3 ,...x25 hesaplayınız. (n, xn ) , n=1,2,3,...,25 noktalarını bir koordinat sisteminde işaretleyiniz. 123 Bernoulli Büyük Sayılar Kanunu: Düzgün bir paranın ardı ardına atılışında gelen tura sayıları (0 ya da 1 tane) sırasıyla X 1 , X 2 ..., X n ,... rasgele değişkenleri (bağımsız ve 1 X i ∼ b(1, p = ) , i = 1, 2, 3,... ) olmak üzere, 2 n ∑X i n atışta gelen tura sayısı 1 P →µ = p = n→∞ n n 2 dır. Đstenildiği kadar küçük ε > 0 değeri için, 1 lim P | X n − |< ε = 1 n→∞ 2 dır. “Düzgün bir para atıldıkça gelen tura sayısı ortalaması 1/2 değerine yakınsamaktadır”. Xn = i =1 = 1 X 1 , X 2 ..., X n ,... rasgele değişkenleri bağımsız ve X i ∼ b(1, p = ) , i = 1, 2, 3,... olmak 2 üzere, Zayıf Büyük Sayılar Kanunu’na göre n ∑X i n denemedeki başarı sayısı P →p n→∞ n n dır. Zayıf Büyük Sayılar Kanunu’nun bu özel hali Bernoulli Büyük Sayılar Kanunu olarak bilinmektedir. Düzgün bir paranın ardı ardına atılışında gelen tura sayıları sırasıyla X 1 , X 2 ..., X n 1 rasgele değişkenleri (bağımsız ve X i ∼ b(1, p = ) , i = 1, 2, 3,... ) olmak üzere, n=1,2,3,...,25 2 atılış için X n rasgele değişkeninin aldığı değerleri x1 , x2 , x3 ,...x25 gözleyiniz. (n, xn ) , n=1,2,3,...,25 noktalarını bir koordinat sisteminde işaretleyiniz. Bernoulli Büyük Sayılar Kanununu bu grafik üzerinde yorumlayınız. Xn = i =1 = 124 ( Xn ), bağımsız ve aynı dağılımlı (dağılımın beklenen değeri µ sonlu) olan rasgele değişkenlerin bir dizisi ise, P X n →µ n→∞ dır (Khinchin Teoremi). X 1 , X 2 ..., X n ,... rasgele değişkenleri bağımsız ve her biri aşağıdaki dağılıma sahip olsun. 2 3 f X ( x) = x 0 , x >1 , d . y. µ = E( X ) = 2 E ( X 2 ) = ∞ , dağılımın varyansı yok Simülasyon yaparak, P X n →µ n→∞ yakınsamasını görmeye çalışalım. X n değerlerini sanal olarak (simülasyon yaparak) gözlemlemek için yukarıdaki dağılımdan rasgele sayı üretmemiz gerekmektedir. 0 , x <1 FX ( x) = 1 1− 2 , x ≥1 x ve dağılımın destek kümesi DX = (1, ∞) üzerinde bire-bir olan FX fonksiyonunun tersi FX−1 ( y ) = 1 1− y , 0 < y <1 dır. X= 1 1−U , U ∼ U (0,1) dönüşümü ile x1 , x2 ..., xn değerlerini üretip, x1 , x2 , x3 ,..., xn değerlerini elde edebiliriz. n=1,2,3,...,200 için (n, xn ) noktalarını bir koordinat sisteminde işaretleyip, P X n →2 n→∞ yakınsamasını sanal olarak görmeye çalışalım. 125 hold on for i=1:20 plot((1:200),cumsum(sqrt(1./(1-rand(1,200))))./(1:200)); end plot([0 200],[2,2]); 6 5.5 5 4.5 4 3.5 3 2.5 2 1.5 1 0 20 40 60 80 100 120 140 160 180 200 X 1 , X 2 ..., X n ,... rasgele değişkenleri bağımsız ve her biri aşağıdaki dağılıma sahip olsun. 1 2 , x >1 f X ( x) = , dağılımın beklenen değeri yok x , d . y. 0 için (n, xn ) noktalarını bir Simülasyon ile x1 , x2 ..., xn değerlerini üretip, n=1,2,3,...,200 koordinat sisteminde işaretleyelim. , x <1 0 FX ( x) = 1 1− , x ≥1 x ve dağılımın destek kümesi DX = (1, ∞) üzerinde bire-bir olan FX fonksiyonunun tersi 1 FX−1 ( y ) = , 0 < y <1 1− y dır. 1 X= , U ∼ U (0,1) 1− U dönüşümü ile x1 , x2 ..., xn değerlerini üretebiliriz. 126 hold on for i=1:20 plot((1:200),cumsum(1./(1-rand(1,200)))./(1:200)); end 200 180 160 140 120 100 80 60 40 20 0 0 20 40 60 80 100 120 140 160 180 200 800 900 1000 8000 9000 10000 hold on for i=1:20 plot((1:1000),cumsum(1./(1-rand(1,1000)))./(1:1000)); end 150 100 50 0 0 100 200 300 400 500 600 700 hold on for i=1:20 plot((1:10000),cumsum(1./(1-rand(1,10000)))./(1:10000)); end 250 200 150 100 50 0 0 1000 2000 Yakınsama olmamaktadır. 3000 4000 5000 6000 7000 127 * Khinchin Teoremi’ni bir kez daha ifade edelim: ( X n ) , bağımsız ve aynı dağılımlı (dağılımın beklenen değeri µ sonlu) olan rasgele değişkenlerin bir dizisi ise P X n →µ n→∞ dır. Dikkat edilirse Khinchin Teoremi’nde ( X n ) dizisindeki rasgele değişkenlerin ikinci momentleri-varyansları ile ilgili her hangi bir koşul yoktur, var olmaları bile aranmamaktadır. Ancak, aynı dağılımlı olmaları koşulu söz konusudur. ( X n ) dizisindeki rasgele değişkenler aynı µ ortalamalı ve sonlu, aynı varyanslı olmaları durumunda, aynı dağılımlı olmasalar bile P X n →µ n→∞ dır (yukarıda ispatlandı). * ( Xn ) dizisindeki rasgele değişkenler aynı µ ortalamalı ve sonlu, farklı σ X2 n = Var ( X n ) ∞ varyanslı olsunlar. ∑ n =1 σ X2 n n2 < ∞ koşulu sağlandığında, P X n →µ n→∞ olduğu ispatlanabilir. * ( X n ) dizisi, varyansları sınırlı, yani bir c sayısı için Var ( X n ) ≤ c , n = 1, 2,3,... ve aynı µ ortalamalı, i − j →∞ Cov( X i , X j ) → 0 olan rasgele değişkenlerin bir dizisi ise P X n →µ n→∞ dır. 128 Laboratuar Çalışması 13 Merkezi Limit Teoremi X 1 , X 2 ,…, X n ,... bağımsız ve aynı dağılımlı (bu Merkezi Limit Teoremi: dağılımın beklenen değeri µ , varyansı σ 2 < ∞ ) olan rasgele değişkenler olmak üzere, Xn − µ t 1 − z 2/ 2 ≤ t = lim P e dz σ/ n n→∞ −∞ 2n dır. ∫ Merkezi Limit Teoremi aşağıdaki gibi de ifade edilebilir. Merkezi Limit Teoremi: X 1 , X 2 ,…, X n ,... bağımsız ve varyansı mevcut, aynı dağılımlı rasgele değişkenler olmak üzere, n n X i − E( X i ) t 1 − z2/ 2 i =1 lim P i =1 ≤ t = e dz n n→∞ 2 n −∞ Var ( X i ) i =1 dır. ∑ ∑ ∫ ∑ Büyük n ler için, Xn − µ P σ/ n yani, Z ∼ N (0,1) olmak üzere Xn − µ P σ/ n ≤ t ≈ t ∫ −∞ 1 − z2/ 2 e dz 2n ≤ t ≈ P( Z ≤ t ) dır. Düzgün bir tavla zarının ardı ardına atılışında gelen nokta sayıları sırasıyla X 1 , X 2 ..., X n ,... rasgele değişkenleri (bağımsız ve 3.5 ortalamalı, 35/12 varyanslı) olmak üzere, Zayıf Büyük Sayılar Kanunu’na göre, n Xn = ∑X i =1 i P → µ = 3.5 n→∞ n yani, “zar atıldıkça gelen sayıların ortalaması 3.5 değerine yakınsamaktadır”. 100 atış ( ) sonucunda P X 100 − 3.5 ≤ 0.1 olasılığı nedir? 129 Merkezi Limit Teoreminden, büyük n ‘ler için X −µ P n ≤ t ≈ P( Z ≤ t ) σ/ n olmak üzere, − 3.5 0.1 X 100 P X 100 − 3.5 ≤ 0.1 = P ≤ σ 35 n 12 100 ( ) = P X 100 σ − 3.5 n 12 12 ≤ ≈ P Z ≤ 35 35 olup, P(− 12 12 ≤Z≤ ) = normcdf(sqrt(12/35),0,1)-normcdf(-sqrt(12/35),0,1) 35 35 = 0.44182 elde edilir. Düzgün bir tavla zarının 100 kez atılışında, ( ) P (3.4 ≤ X 100 ≤ 3.6) = P X 100 − 3.5 ≤ 0.1 = 0.44182 dır. ( ) P X 100 − 3.5 ≤ 0.5 olasılığı nedir? − µ 0.5 = P P X 100 − 3.5 ≤ 0.5 = P X 100 ≤ σ 35 n 12 100 ≈ P( Z ≤ 2.9277) ( ) X 100 − µ σ n ≤ 2.9277 = normcdf(2.9277,0,1)-normcdf(-2.9277,0,1) = 0.99659 Düzgün bir tavla zarının 100 kez atılışında, ( ) P (3 ≤ X 100 ≤ 4) = P X 100 − 3.5 ≤ 0.5 ≈ 0.99659 olmak üzere, bu sonucu Matlab’da simülasyon yaparak görmeye çalışın. 130 X 100 rasgele değişkenini en az 50 kez gözleyiniz. Histogram çizdiriniz. Düzgün bir paranın ardı ardına atılışında gelen tura sayıları (0 ya da 1 tane) sırasıyla 1 X 1 , X 2 ..., X n rasgele değişkenleri (bağımsız ve X i ∼ b(1, p = ) , i = 1, 2, 3,... ) olmak üzere, 2 n=100 atılışında gelen toplam tura sayısının 50 olması olasılığını Merkezi Limit Teoremini kullanarak hesaplayalım. 100 100 i =1 i =1 P(∑ X i = 50) = P(50 − 0.5 ≤ ∑ X i ≤ 50 + 0.5) 1 1 50.5 − 100 × 2 ≤Z≤ 2) ≈ P( 1 1 1 1 100 × × 100 × × 2 2 2 2 49.5 − 100 × = P(−0.1 ≤ Z ≤ 0.1) = normcdf(.1,0,1)-normcdf(-0.1,0,1) = 0.079656 Bu olasılığın gerçek değeri, 100 100 1 = binopdf(50,100,1/2) = 0.079589 50 2 dır. 131 Düzgün bir paranın n=100 atılışında gelen toplam tura sayısının 40‘dan çok ve 60‘dan az olması olasılığı nedir? Merkezi Limit Teoremi’nden 100 100 i =1 i =1 P(40 < ∑ X i < 60) = P(41 ≤ ∑ X i ≤ 59) 1 1 59.5 − 100 × 2 ≤Z≤ 2) ≈ P( 1 1 1 1 100 × × 100 × × 2 2 2 2 40.5 − 100 × = P(−1.9 ≤ Z ≤ 1.9) = normcdf(1.9,0,1)-normcdf(-1.9,0,1) = 0.94257 olup, bu olasılığın gerçek değeri sum(binopdf((41:59),100,1/2)) = 0.94311 dir. 100 Her biriniz birer parayı 100 kez atınız ve gelen toplam tura sayısını ( ∑ X i rasgele i =1 değişkenini) gözleyiniz. Tam 50 kez tura getiren kaç kişi oldu? Kaç kişi 40 ile 60 arasında tura getirdi? Bu sonuçları, 100 P(∑ X i = 50) = 0.079589 i =1 ve 100 P(40 < ∑ X i < 60) = sum(binopdf((41:59),100,1/2)) = 0.94311 i =1 olasılıkları ile karşılaştırınz. 132 100 100 Xi ∑ i =1 rasgele değişkeninin gözlenen değerleri ve X 100 = Xi ∑ i =1 100 rasgele değişkeninin gözlenen değerleri için histogram çiziniz. n Bilgisayarda, sınıftaki öğrenci sayısı (n) kadar 100‘er atışlık sanal deney yapınız ve n Xn = . Xi ∑ i =1 n rasgele değişkenlerinin gözlenen değerleri için histogram çizdiriniz. Xi ∑ i =1 ile 133 n 1 ∼ b(n = 100, p = ) binom dağılımındaki olasılıklar (mavi noktalar) ile 2 i =1 2 N ( µ = np = 50, σ = npq = 25) normal dağılımın olasılık yoğunluk fonksiyonunun grafiği (kırmızı çizgi) aşağıdaki gibidir. Yukarıdaki histogram ile karşılaştırınız. ∑X i 0.08 0.07 0.06 0.05 0.04 0.03 0.02 0.01 0 0 10 20 30 40 2 50 60 70 80 90 100 1 3 3 4 1 4 2 10 Yukarıdaki kavanozdan rasgele bir top çekilmesi deneyinde gelen sayı X rasgele değişkeni olsun. X rasgele değişkeninin olasılık tablosu, x f ( x) = P( X = x) 1 2/9 2 2/9 3 2/0 4 2/9 10 1/9 10 20 ve σ 2 = Var ( X ) = dır. 3 3 10 P X 20 − ≤ 0.1 olasılığını Merkezi Limit Teoremini kullanarak hesaplayınız. 3 ve µ = E ( X ) = 134 Bilgisayarda 30 tane düzgün tavla zarının 100 kez atılışında, her bir zar için her atış sonucunda xnj , n = 1, 2,...,100 , j = 1, 2,...,30 ortalamaları gözlenip aşağıdaki grafik (simülasyon sonucu) elde edilmiştir. >> hold on; plot([0 100],[3.5,3.5]) >> plot((1:100),cumsum(fix(unifrnd(1,7,1,100)))) ; %( 30 kez tekrarlandı) 6 5.5 5 4.5 4 3.5 3 2.5 2 1.5 1 0 10 20 30 40 50 60 70 Bu grafik üzerinde Büyük Sayılar Kanunu’nu yorumlayınız. 80 90 100 135 n = 25,50, 75,100 için Merkezi Limit Teoremini yorumlayınız. 60 zar için yukarıdaki simülasyonu yapınız. n = 25,50, 75,100 için xnj , j = 1, 2,..., 60 gözlemlerinin histogramlarını çizdiriniz ve Merkezi Limit Teoremini yorumlayınız.