İST251 İstatistik Laboratuarı

advertisement
2
ÖNSÖZ
Đstatistik Laboratuarı 1990 yılından itibaren bölümümüz müfredatında yer
alan derslerden birisidir. O yıllarda: “… yürütmekte olduğumuz bu laboratuar
çalışmalarında, yer ve alet imkansızlıklarına rağmen öğrencilerimizin büyük bir
istekle deneyleri yaptıkları ve değişik bir bilgi elde etmenin mutluluğu ile
çalışmalarını yürüttüklerini gözlüyoruz. Önümüzdeki yıllarda daha geniş
mekanlarda her öğrenciye bir bilgisayar düşecek şekilde her yıl için en az bir
laboratuar dersinin yer aldığı bir programın özlemi ve gerçekleşeceği inancı
içindeyiz…” demişiz. Evet, bugün bilgisayar problemimiz yok, ancak mekân
sıkıntısı anlatılacak gibi değil ve yakında çözülecek gibi görünmüyor. Tüm
sıkıntılara rağmen deneylerimizi ve çalışmalarımızı yapmaya devam edeceğiz.
Bu laboratuar kılavuzu ĐST 251 Đstatistik Laboratuarı deneyleri için
hazırlanmıştır. Buradaki deneyler ve çalışmaların amacı, şu ana kadar görülen
derslerin çerçevesinde, rasgelelik olgusunun anlaşılması ve anlatılması
(modellenmesi) problemini kavratabilmek, öğrenilen temel bilgileri pekiştirmek
ve ileride öğrenilecek istatistik kavram ve yöntemleri öğrenmede kolaylık
sağlayacak sezgisel bir altyapı oluşturmaktır. Bu laboratuar kılavuzunun
istatistik kavramlar ve yöntemler öğreten bir kitap olmadığını; deneyler
yapmanızı, grafikler çizmenizi, bilgisayar programları yazmanızı, istatistik paket
programları çalıştırmanızı, veri analizi ve yorumlar yapmanızı, üstelik bunları
kendi gayretinizle yapmanızı isteyen bir rehber olduğunu unutmayın.
1) Laboratuara hazırlıklı gelin. Yapacağınız laboratuar çalışmasıyla ilgili ön
bilgileri kitaplar ve ders notlarından okuyun.
2) Laboratuar kılavuzundaki bilgisayar programlarını gözden geçirin ve
çalışır hale getirin.
3) Yanınızda cetvel, kurşun kalem, silgi ve bilgisayar bulundurun.
4) Laboratuar çalışmalarınızı mümkün olduğunca sessiz ve bireysel
yürütünüz. Bitiremediğiniz deney veya raporlarınızı evde tamamlayınız.
Birçok kusurunun var olacağını doğal karşıladığımız bu laboratuar
kılavuzunun iyileştirilmesi hususunda öğrencilerle meslektaşlarımız tarafından
gelecek her türlü öneri ve eleştiri için önceden teşekkür eder öğrencilerimize
çalışmalarında başarılar dileriz.
10 Ağustos 2011
Ankara
3
ĐÇĐNDEKĐLER
Sayfa
GĐRĐŞ
LABORATUAR ÇALIŞMASI 1
Olgu-Deney-Model-Benzetim (Simülasyon)………………….…..……..
6
LABORATUAR ÇALIŞMASI 2
Bazı Modelleme Örnekleri …..…………………………..…………...…
17
LABORATUAR ÇALIŞMASI 3
Rasgele Sayılar ve Üretimi ………………………………………………
28
LABORATUAR ÇALIŞMASI 4
Olasılık Dağılımlarından Sayı Üretme ……….…. ………………………
39
LABORATUAR ÇALIŞMASI 5
Bir Boyutlu Kesikli Dağılımlar …………………………………………..
45
LABORATUAR ÇALIŞMASI 6
Poisson Dağılımı ve Uygulamaları ……………………………………....
65
LABORATUAR ÇALIŞMASI 7
Bir Boyutlu Sürekli Dağılımlar ……….…………………………………..
67
LABORATUAR ÇALIŞMASI 8
Üstel ve Gamma Dağılımı. Güvenilirlik Analizi.………..………….……..
75
LABORATUAR ÇALIŞMASI 9
Normal Dağılım ve Uygulamaları …….………………………………….
91
LABORATUAR ÇALIŞMASI 10
Çok Boyutlu Dağılımlar. Marjinal ve Koşullu Dağılımlar ………………
102
LABORATUAR ÇALIŞMASI 11
Bağımsız Rasgele Değişkenlerin Toplamı ve Ortalaması.……..………….
112
LABORATUAR ÇALIŞMASI 12
Büyük Sayılar Kanunu ………………………………………………....….
119
LABORATUAR ÇALIŞMASI 13
Merkezi Limit Teoremi…..………………………………………………..
128
4
Giriş
DERSIN KODU
ĐST 251
DERSIN ADI
Đstatistik Laboratuvarı I
DERSIN TÜRÜ
Zorunlu
DERSIN SINIF VE DÖNEMĐ
2.sınıf / Güz
DERSĐN VERĐLDĐĞĐ BÖLÜM
Đstatistik
DERSĐN KREDĐSĐ:
(0,0,2)1
4
AKTS
DERSĐ VEREN ÖĞRETĐM ÜYESĐ/ÜYELERĐ
DERSĐN AMACI,ÖĞRENĐM HEDEFĐ, ÖĞRENĐM METODU, ÖĞRETME VE ÖĞRENME MATERYALĐ
Đstatistik eğitiminin amacı olan rasgelelik olgusunun
modellenmesi problemini öğrencilere kavratabilmek,
birinci sınıfta edinilen temel istatistik bilgilerini
pekiştirmek ve ileride öğrenilecek istatistiksel kavram ve
yöntemleri anlamada kolaylık sağlayacak bir alt yapı
oluşturmak.
1) DERSĐN AMACI
2) DERSĐN ÖĞRENĐM HEDEFLERĐ
KAZANDIRILAN BĐLGĐ
KAZANDIRILAN BECERĐ
3) ÖĞRETĐM METODU
4) ÖĞRETME MATERYALI
5) DERSĐN ÖLÇME VE DEGERLENDĐRME YÖNTEMLERĐ
Örnek uzay, olay, olasılık ölçüsü,
olasılık uzayı, rasgele değişken,
olasılık (yoğunluk) fonksiyonu,
dağılım fonksiyonu, beklenen değer,
varyans v.s. gibi kavramlar.
Lisans öğrenimi boyunca kullanılacak
temel kavramların pekiştirilmesi ve
istatistik yöntemlerin deney
ortamında öğrenilmesi.
Gerçek ve sanal deneyler yapmak.
Değişik deney araç ve gereçleri,
bilgisayar.
Laboratuar kılavuzundaki ödev ve
deney sonuçlarının haftalık
değerlendirilmesi, ara sınav ve dönem
sonu sınavı
5
DERS PLANI VE ĐÇERĐĞĐ
HAFTA
Laboratuar Çalışmasının Konusu
1
Deney-model-benzetim (simülasyon).
Dik atış: modellenmesi ve benzetimi.
Tazı-tavşan kovalamacası.
2
Bazı modelleme örnekleri.
Rasgelelik içeren olguların modellenmesi.
3
Rasgele sayılar ve üretimi.
4
Olasılık dağılımlarından sayı üretme.
5
Bir boyutlu kesikli dağılımlar.
6
Poisson dağılımı ve uygulamaları.
7
Bir boyutlu sürekli dağılımlar.
8
Üstel ve Gamma dağılımı.
Güvenilirlik analizi.
9
Normal dağılım ve uygulamaları.
10
Çok boyutlu dağılımlar.
Marjinal ve koşullu dağılımlar.
11
Bağımsız rasgele değişkenlerin toplamı ve ortalaması.
12
13
14
Büyük Sayılar Kanunu
Merkezi Limit Teoremi
Ara Sınav
F. Öztürk, L. Özbek ve F.M. Kaya (1993) Đstatistik Laboratuarı I, Ankara.
KAYNAKLAR F. Öztürk (2011) Olasılık ve Đstatistiğe Giriş I, Gazi Kitabevi, Ankara.
ĐST 101, ĐST102 ve ĐST201 Ders Notları.
Ara sınav ve dönem sonu sınavı. Sınavlar yazılı veya deneysel
SINAVLAR olarak yapılır. Laboratuar kılavuzundaki ödev ve deney sonuçları
ile ilgili değerlendirmeler başarı notuna katkıda bulundurulur.
6
Laboratuar Çalışması 1
Olgu-Deney-Model-Benzetim (Simülasyon)
Aklımız ile gerçek dünyadaki olguları anlamaya ve anlatmaya çalışırız. Bu anlamaanlatma işine modelleme ve anlatımın kendisine de model denir. Modellemede, dilden sonra,
aklımızın kullandığı ifade araçlarından en önde gelenleri matematik ve istatistiktir.
Model, gerçek dünyadaki bir olgunun ilgili olduğu bilim sahasının (fizik, kimya,
biyoloji, jeoloji, astronomi, ekonomi, sosyoloji,...) kavram ve kanunlarına bağlı olarak ifade
edilmesidir. Model gerçek dünyadaki bir olgunun bir anlatımıdır, bir tasviridir. Gerçek
dünyanın çok karmaşık olması sebebiyle modeller, anlatmak istedikleri olgu ve sistemleri
basitleştirerek belli varsayımlar altında ele almaktadır. Modeller gerçeğin kendileri değildir
ve ne kadar karmaşık görünseler de gerçeğin bir eksik anlatımıdırlar. Model denilen şey
model kurucunun gerçeği anlayışının bir ürünüdür, bir sanıdır. Simülasyon (benzetim) model
üzerinde olgunun irdelenmesidir, “model üzerinde deney yapmaktır” diyebiliriz. Simülasyon
yoluyla elde edilen verilere sanal veri diyelim. Sanal veriler, olgunun gerçeğinden elde edilen
verilere (gözlemlere) benzemektedir, maket modellerde olduğu gibi.
Olguları modellemede düşünce tarzı aşağıdaki gibidir.
Gerçek Dünya
Olgu
Veri (Data)
Model
Matematik çözümleme
Đstatistik çözümleme
Ölçme
Sonuç çıkarım
Bir modelin yararlı olması için verilerden, sonuçların nasıl çıkarılacağına dair bir
çözüm yönteminin bilinmesi gerekir. Örneğin belli bir olgu bir diferansiyel denklem ile
modellendiğinde bu denklemin çözüm yolunun da bilinmesi gerekir. Bu, matematiğin bir
sorunudur. Eğer model stokastik ise çözümleme istatistiğin bir sorunudur. Verilerin nasıl
toplanacağı da istatistiğin bir sorunudur. Kısaca, istatistik yukarıdaki döngünün her
safhasında yer almaktadır. Olguya temas ölçme ile olmaktadır. Ölçme, içinde istatistik de
barındıran başlı başına bir konudur.
Fizik, kimya, biyoloji, jeoloji, astronomi, ekonomi, sosyoloji ve başka birçok bilim
dalının gerçek dünyada ilgilendiği kendi konuları (sahaları) vardır ve çoğunun arakesiti boş
değildir. Matematik ve Đstatistiğin gerçek dünyada bir konusu olmamasına rağmen, gerçek
dünyadaki olguları anlama ve anlatmada, yani modellemede insan aklının en güçlü iki aracı
matematik ve istatistiktir. Đstatistik, rasgelelik içeren olguların modellenmesinde öne
çıkmaktadır.
Bu laboratuar çalışmasında sebep-sonuç ilişkileri kesin, başka bir ifade ile
deterministik modelleri ele alacağız.
7
Dik Atış
Yukarıya doğru atılan bir cismin hareketini ele alalım. Ölçümler mks sisteminde
yapılsın, yani uzunluğun birimi metre (m), kütlenin birimi kilogram (kg) ve zamanın birimi
saniye (s) olsun. Hareketin doğrusal, hava ile sürtünme olmadığı ve yerçekimi ivmesinin
yükseklikle değişmediği gibi bazı varsayımlar yaparak ve Newton prensiplerinden
1. Eylemsizlik prensibi,
2. Etki-tepki prensibi,
3. Momentum prensibi, Fdt = dmv , F = m
dv
= ma
dt
faydalanarak hareketi matematiksel olarak modellemeye çalışalım. Hareketi, yeryüzüne dik
bir eksen üzerinde irdeleyelim. Yerçekimi kuvveti P , yerçekimi kuvvetinin büyüklüğü
P = mg olmak üzere, t = 0 anında cismin konumu y (0) = 0 ve hızı v(0) = v0 olsun.
Bir t anında cisme etki eden kuvvet, sadece yerçekimi kuvveti P olmak üzere, F = P
eşitliğindeki kuvvetlerin büyüklükleri için y ekseninin yönü de göz önüne alınarak,
ma = − mg
dv
= −g
dt
d2y
= −g
dt 2
veya
y ′′(t ) = − g
yazılır. Başlangıç değerlerle birlikte,
y ′′(t ) = − g
y (0) = 0 , y '(0) = v0
diferansiyel denklemi, hareketin matematiksel bir anlatımıdır, yani bir matematiksel
modeldir.
8
Diferansiyel denklem kavramı matematiğin bir kavramıdır. Bu denklemi çözmeye
çalışalım. Denklemin her iki yanında,
t
t
0
0
∫ y ′′(t )dt = −∫ gdt
integrallerinin alınmasıyla,
y ′(t ) = − gt + v0
elde edilir. Böylece, t anında cismin hızını veren formülü elde etmiş olduk. Cismin konumu
için,
t
t
0
0
∫ y ′(t )dt = ∫ (− gt + v
0
)dt
ve
1
y (t ) = − gt 2 + v0 t
2
formülü elde edilir. Hareketin yol-zaman ve hız-zaman grafikleri,
gibidir. Yol-zaman grafiğinde t1 den t 2 anına kadar geçen zaman aralığındaki yol miktarı
y (t 2 ) − y (t1 ) farkına eşittir. Bu yol miktarının hız-zaman grafiğindeki karşılığı taralı alana
eşittir. Yol-zaman grafiği ya da hız-zaman grafiği de tek başına bu hareketi anlatmaktadır.
Dolayısıyla bunlar da hareketin birer matematiksel modelidir. Modelden, cismin ne kadar bir
yüksekliğe çıkabileceği, ne kadar bir zaman sonra yere düşeceği, yere düştüğü andaki hızı,
belli bir anda bulunduğu konumu ve hızı gibi hareket ile ilgili sonuçlar elde edilebilir. Bu
sonuçlar deney sonuçları ile karşılaştırılarak modelin geçerliliği sınanır. Modelin verdikleri
ile gerçek dünyada olup bitenlerin tamamıyla aynı olduğu söylenemez. Modeller, gerçek
olguların eksik birer anlatımıdır. Örneğin, başlangıç anında modelin anlattığına göre hız
aniden v0 değerine ulaşmaktadır. Bu gerçeğe ters düşmektedir. Cisim atılırken neler
olmaktadır? Bunu da göz önüne alarak bir model nasıl kurulabilir?
Yeryüzüne dik doğrultuda atılan bir cismin hareketini gözlemlemek, bazı ölçümler
almak bir deneydir. Zamana bağlı olarak konum hesaplaması yapıp, bir kâğıda çizili bir
eksen üzerinde işaretlenen bir noktanın hareketini izlemek dik atışın kâğıt üzerinde bir
simülasyonudur (benzetimidir). Bunu, bir monitörde yapmak bir bilgisayar simülasyonudur.
QBASIC dilinde yazılmış aşağıdaki gibi bir bilgisayar programıyla dik atışın görüntülü bir
simülasyonu (animasyon) yapılabilir.
9
SCREEN 12
WINDOW (-10, 250)-(10, -10)
LINE (-10, 0)-(10, 0)
INPUT "Başlangıç hızı="; vo
INPUT "deltat="; deltat
FOR t = 0 TO 2 * vo / 9.81 STEP deltat
y = vo * t - (1 / 2) * 9.81 * t ^ 2
IF t<vo/9.81 THEN
CIRCLE (0, y) , 0.1 , 2
ELSE
CIRCLE (0, y) , 0.1 , 0
END IF
NEXT t
Serbest Düşme
Belli bir h yüksekliğinden düşen cismin hareketini modellemeye çalışalım.
Dik atıştakine benzer varsayımlar ve düşüncelerle,
y′′(t ) = g
y (0) = 0 , y ′(0) = 0
diferansiyel denklemine ulaşılır. Bu denklemin çözülmesiyle,
y (t ) = 12 gt 2
bulunur. Buna göre, cismin yere düşünceye kadar geçirdiği zaman süresi,
2
*
1
2h / g
2 gt = h ⇒ t =
ve yere düştüğü andaki hızı,
v(t * ) = y ′(t * ) = gt * = 2 gh
olarak bulunur.
1000 metre yükseklikten yeryüzüne sürtünmesiz düşen bir cismin uygun bir
koordinat sisteminde hız-zaman ve yol-zaman grafiklerini çiziniz. Cismin yere düşünceye
kadar geçirdiği zaman süresini ve yere düştüğü andaki hızını hesaplayınız. Yerçekimi
10
ivmesini 9.81 m / sn 2 alınız. Bu hareketin simülasyonunu yapan bir bilgisayar programı
yazınız ve işletiniz.
Sürtünmeli Düşme Hareketi
11
Şimdi, cismin hareketinde hava ile sürtünme de gözönüne alınsın. Diğer varsayımlar
dik atıştaki gibi kalsın.
Cisme etki eden kuvvetler için F = P − Fs yazılabilir. Sürtünme kuvvetinin yönü hareketin
ters yönünde olduğu açık, ancak büyüklüğü nedir? Sürtünme kuvvetinin büyüklüğünün hızın
büyüklüğü ile orantılı olduğu varsayılırsa,
my ′′(t ) = mg − ky ′(t )
yazılabilir. Böylece,
y ′′(t ) +
k
y ′(t ) = g
m
y (0) = 0 , y ′(0) = 0
modeli oluşturulabilir. Buradan,
k
m2 −mt
m
m2
y (t ) = g 2 e + g t − g 2
k
k
k
bulunur. Yol formülünde türev alınırsa, cismin hızı için
y ′(t ) = v(t ) = − g
k
m −mt
m
e +g
k
k
elde edilir. Her ne kadar hareket sonsuza kadar sürmese de,

m −kt
m
m
lim  − g e m + g  = g
t →∞
k
k
k

limiti, zaman ilerledikçe düşen cismin hızının sabitleşeceğini söylemektedir. Gerçek dünyada
bu sabitleşme k ve m sabitlerine bağlı olmakla birlikte, kısa bir zamanda gerçekleşmektedir.
Yani kısa bir zaman sonrası düşen cismin hızı limit değere ulaşmakta ve sabitleşerek daha
fazla artmamaktadır. Yağan yağmur taneciklerinin veya paraşütle yüksekten atlayan birisinin
yeryüzüne düştüğündeki hızının büyük olmaması bundan olsa gerek.
Aşağıdaki Matlab programını işletiniz. Sürtünme katsayısının değişik değerlerinde, sürtünmeli
hareketi (mavi çizgi) gözleyiniz.
12
clc
clear all
close all
axis ( [0 500 0 1000])
k=0.3;
y0=1000;
g=-9.81;
hold on
for i=1 : 500
t(i)=i*.1;
y1(i)=y0+0.5*g*(t(i)^2);
y2(i)=y0+g*(1/k^2)*exp(-k*t(i))+g*(1/k)*t(i)-g*(1/k^2);
if (y1>0)
h1=plot(y1, 'r');%sürtünme yok
set(h1,'EraseMode', 'none'); drawnow;
end
if(y2>0)
h2=plot(y2, 'b');% sürtünmeli
set(h2,'EraseMode', 'none');drawnow;
end
end
Not: Yatay eksen zamanı temsil etmektedir (gerçek zaman değil).
Tazı-Tavşan Kovalamacası
Bir tazının bir tavşanı gördüğü doğrultu ve yönde kovaladığını, tavşanın dosdoğru
yuvasına doğru kaçtığını ve her ikisinin de koşabilecekleri en büyük hızları ile yorulmadan
koştuklarını varsayalım. Tavşan kendi yuvasının 100 metre doğusunda bulunsun ve her ikisi
de birbirini aynı anda fark etsin. Tazının konumu,
Durum 1: tavşanın 100 metre batısında,
Durum 2: tavşanın 100 metre güneyinde,
Durum 3: tavşanın 100 metre güney batısında,
olsun. Tazının ( □ ) tavşanı ( △ ) yuvasına ( ○ ) varmadan önce yakalaması için hızının
büyüklüğü tavşanınkinin kaç katı olmalıdır? Başka bir ifade ile hızların büyüklükleri oranı ne
olmalıdır?
Durum 1
Durum 2
Durum 3
Tavşanın hızını V1 ve tazının hızını V2 vektörü ile gösterelim. Birinci durumda, tazının
tavşanı yakalaması için V2 > 2V1 olması gerektiğini hemen söyleyebiliriz. Durum 2 de tazının
yörüngesi bir doğru parçası olmayacaktır (aşağıdaki gibi bir eğri olabilir). Tazının hızının
büyüklüğü sabit olup doğrultusu her an değişecektir. Tavşanı gördüğü yere doğru koşması
matematik dilinde ne anlama gelmektedir?
13
Birinci durumdaki koşma olgusunu biraz daha yakından irdeleyelim. Tazının hızı
V2 = 20 metre/saniye ve tavşanın hızı V1 = 15 metre/saniye olsun. Küçük ∆t ( ∆t =0,1) gibi
zaman aralıkları sonunda tazı ile tavşanın konumlarını bir eksen üzerinde işaretleyerek
hareketin gelişimini izleyebiliriz. Her ∆t zaman aralığında birer adım attıklarını düşünürsek,
tazının adım uzunluğu 2 metre ve tavşanın adım uzunluğu 1,5 metre olmak üzere, ilk üç
işaretleme sonunda tazı ile tavşanın konumları aşağıdaki gibi olur.
Đkinci ve üçüncü durumlar için ∆t gibi küçük zaman aralıkları içinde hareketin sabit
hızla (doğrultu, yön ve büyüklük olarak) yapıldığını düşünerek Durum 1 deki gibi bir
işaretleme ile hareketin gelişimini izleyebiliriz. Kovalamacadaki heyecanı yaşayabilmek için
aşağıdakileri adım adım kendiniz de çiziniz.
14
Zaman aralığı ∆t ‘yi küçük tutarsak, yaptığımız çizimlerle hareket olgusuna daha iyi
yaklaştığımızı söyleyebiliriz. Yeterli gördüğümüz küçük bir ∆t seçip, değişik V2 / V1 oranları
için tavşanın yakalanıp yakalanmadığını görebiliriz. Çizerek deneyin.
15
Şimdiye kadar elle yaptığımız bu çizimleri bir bilgisayara yaptırmaya kalkışsak, nasıl
olur? Örneğin, Durum 2 de tazının hızı V2 = 20 (m/sn), tavşanın hızı V1 = 15 (m/sn) ve ∆t
zaman aralığı 0.2 ve 0.01 olduğunda bilgisayarda çizilen yörüngeler,
80
80
60
60
y
100
y
100
40
40
20
20
0
0
0
50
x
100
0
50
x
100
dır.
Bu çizimlere benzer çizimleri, çok kolay bir programlama dili olan QBASIC dilinde,
aşağıdaki programı işleterek bilgisayarınızda yapabilirsiniz.
CLS : SCREEN 12
WINDOW (-10, 110)-(110, -10)
LINE (-10, 0)-(110, 0)
LINE (0, 110)-(0, -10)
CIRCLE (100, 100), 1
INPUT "tavsanin hizini giriniz, v1=", v1
INPUT "tazinin hizini giriniz,v2=", v2
INPUT "deltat degerini giriniz, deltat=", deltat
x1 = 0: y1 = 100: x2 = 0: y2 = 0
10 PSET (x1, y1): PSET (x2, y2)
x1 = x1+deltat * v1: y1 = 100
x2 = x2+deltat*(x1 - x2)/SQR((x1 - x2)^2
+(y1 - y2)^2)*v2
y2 = y2+deltat*(y1 - y2)/SQR((x1 - x2)^2
+(y1 - y2)^2)*v2
IF SQR((x1 - x2)^2+(y1 - y2)^2)<.001 THEN 20
IF x1>100 THEN 30
GOTO 10
20 PRINT "tavsan yakalandi":GOTO 40
30 PRINT "tavsan kurtuldu"
40 END
Küçük bir ∆t seçip değişik V2 / V1 oranları için bilgisayar programını işleterek tavşanın
yakalanıp yakalanmadığını gözleyiniz. V2 / V1 oranı hangi sayıdan büyük olduğunda tavşan
yakalanmaktadır? Belirlemeye çalışınız.
16
Kaynak: Bir Tazı-Tavsan Kovalamacası
http://80.251.40.59/science.ankara.edu.tr/ozturk/Yazilar/Lise/TaziTavsan.doc
17
Laboratuar Çalışması 2
Bazı Modelleme Örnekleri
Aklımız ile gerçek dünyadaki olguları anlamaya ve anlatmaya çalışırız. Bu anlamaanlatma işine modelleme ve anlatımın kendisine de model denir. Önceki laboratuar
çalışmasında,
y ′′(t ) = − g
y (0) = 0 , y '(0) = v0
gibi bir diferansiyel denklemin (türev bulunduran denklem) dik atış hareketini modellediğini
(anlattığını) gördük. Ayrıca,
*
Deterministik (sebep-sonuç ilişkileri kesin)
* Stokastik (rasgelelik içeren)
modellerden söz ettik. Yukarıdaki model deterministik bir modeldir. Bu laboratuar
çalışmasında bazı stokastik model örnekleri üzerinde duracağız.
Elektronik Parçaların Dayanma Süresi
Dayanma süreleri rasgele olan belli bir tür elektronik parça için bozulma oranının (beli
bir zamana kadar dayanan parçalardan bir birim zaman aralığında bozulanların oranı) sabit
kaldığı gözlenmiş olsun. T rasgele değişkeni dayanma süresi olmak üzere, bozulma oranı ile
ilgili söylenen matematiksel olarak ifade edilirse,
lim
∆t →0
P (t < T ≤ t + ∆t / T > t )
=c
∆t
P (t < T ≤ t + ∆t )
∆t → 0
∆t
=c
P (T > t )
lim
lim
∆t → 0
F (t + ∆t ) − F (t )
∆t
=c
1 − F (t )
F ′(t )
=c
1 − F (t )
18
f (t )
=c
1 − F (t )
yazılır. Burada F, f sırasıyla T nin dağılım ve yoğunluk fonksiyonunu göstermektedir.
F ′(t )
= r (t )
1 − F (t )
diferansiyel denkleminin F (0) = 0 başlangıç değerine bağlı çözümü
t
∫
− r ( t ) dt
F (t ) = 1 − e
0
dır. Buna göre,
ce − ct , t > 0
f (t ) = 
, d.y.
0
olarak elde edilir. Dayanma süresi üstel dağılıma sahiptir. Başka bir ifade ile bu parçaların
dayanma süresi üstel dağılım ile modellenmektedir (anlatılmaktadır). Bu modelde c sabitinin
değerinin bilinmesi gerektiğine dikkat edin.
Parçaların dayanma süresinin beklenen değeri (ortalaması) ve varyansı,
1
1
E (T ) =
, Var ( X ) = 2
c
c
dır. F ve f fonksiyonlarının grafikleri şekildeki gibidir.
Sürekli bir rasgele değişkenin belli bir aralıkta olması olasılığı dağılım fonksiyonunda
yorumlandığında, aralığın uç noktalarında fonksiyon değerleri arasındaki fark (grafikte
yükseklik), yoğunluk fonksiyonunda yorumlandığında, bu aralığın üzerinde yoğunluk
fonksiyonunun integrali (grafikteki alan) olmaktadır. Bu düşünce tarzı yol-zaman ve hızzaman grafiklerinde de aynıdır. Yol-zaman grafiğinde fonksiyon değerleri arasındaki fark ve
hız-zaman grafiğinde belli bir aralığın üzerindeki alan yol miktarını anlatmaktadır.
19
Basamak fonksiyonu biçiminde olan dağılım fonksiyonları basamakların bulunduğu
noktalarda, basamak yükseklikleri büyüklüğünde olasılıklar bulunan kesikli olasılık
dağılımlarının anlatımında kullanılmaktadır. Basamak fonksiyonu biçiminde olan bir yolzaman grafiğinin (fonksiyonunun) anlatmak istediği hareket nasıl bir şey olabilir? Bir örnek
verin.
Düzgün Bir Tavla Zarının Atılması Deneyi
Düzgün bir tavla zarının atılması ve üste gelen yüzeyin gözlenmesi deneyinde örnek
uzay,
Ω=
olmak üzere, tüm olaylar ile ilgilendiğimizde sigma cebir U = 2Ω olur. Zar düzgün
olduğunda,
P :U → R
n( A)
A → P ( A) =
n(Ω)
olasılık ölçüsü kullanılabilir. Özetlersek, bu deney
Ω=
Olasılık Uzayı ile modellenebilir (anlatılabilir).
, U = 2Ω ,
P ( A) =
n( A)
n(Ω)
20
X rasgele değişkeni üste gelen yüzeydeki nokta sayısı olsun.
Ω=
X
R
0
1
2
3
4
5
6
7
X rasgele değişkeni’nin dağılım fonksiyonu,
F : R → [0,1]
x → F ( x) = P ( X ≤ x )
 0 ,
x <1

 x F ( x) = P( X ≤ x) = 
, 1≤ x < 6
 6

x≥6
,
 1
ve grafiği,
F(x)
1
5/6
4/6
3/6
2/6
1/6
1
2
x
3 4
5
6
7
dır. X in olasılık fonksiyonu,
f ( x) = P( X = x) =
1
, x ∈ DX = {1, 2,3, 4,5, 6}
6
ve grafiği,
grafik ( f ) = {( x, f ( x)) : x = 1, 2,3, 4,5, 6}
f(x)
1/6
• • • • • •
1 2 3 4 5 6
olmak üzere, bu grafik
x
21
f(x)
1/6
x
1 2 3 4 5 6
biçiminde de gösterilir. Okların yükseklikleri o noktalardaki olasılıkları göstermektedir.
Dağılım fonksiyonunda ise basamakların yükseklikleri olasılıkları göstermektedir.
Suda Çözülen Madde Miktarı
x C sıcaklıkta 100 gr su içinde çözülen bir maddenin kütlesi ( y ) aşağıdaki gibi
gözlenmiştir.
10
20
30
30 40
40
40 50
60
60
y (gr) 59
65
68
70 73
74
75 81
92
93
xoC
Bu gözlemlere dayanarak y ile x arasında bir bağıntı araştıralım. Gözlemlerin bir x O y
koordinat sistemindeki görüntüsü (serpilme diyagramı) aşağıdaki gibidir.
Belli bir x sıcaklığında 100 gr su içinde çözülen madde miktarı için farklı farklı
değerler gözlenebilmektedir. Bu sebeple çözülen madde miktarını bir Y rasgele değişkenin
aldığı değer olarak görebiliriz. Belli bir x değerinde Y rasgele değişkeninin ortalaması
(koşullu ortalaması) µY / x = E (Y / x) olmak üzere,
E (Y / x) = a + bx
varsayımı altında,
Yi = a + bxi + ε
i
, i = 1, 2,...,10
22
denklemini (regresyon modelini) göz önüne alalım. Burada
a ve b katsayılarını
10
10
i=1
i=1
∑ εi2 = ∑ [ yi − (a + bxi )]
2
εi
‘ler birer rasgele değişkendir.
hata kareler toplamı minimum olacak
şekilde belirlediğimizde,
10
bˆ =
∑ (x
i =1
i
− x )( y i − y )
10
∑ (x
i =1
i
− x)
= 0.661
2
aˆ = y − bˆx = 49.881
bulunur. Bu katsayılar, gözlem noktalarının arasından gözlemlere yakın olacak şekilde çizilen
doğrunun eğimini ve ordinatı kestiği noktayı göstermektedir.
µˆY / x = 49.881 + 0.661x
denklemi yardımıyla belli x sıcaklığında 100 gr su içinde çözülen ortalama madde miktarını
tahmin edebiliriz. Buna tahmin denklemi diyelim.
C1
10
20
30
30
40
40
40
50
60
60
C2
59
65
68
70
73
74
75
81
92
93
Regression Analysis: C2 versus C1
The regression equation is
C2 = 49,9 + 0,661 C1
S = 2,56938
Coef
49,881
0,66102
SE Coef
2,168
0,05289
T
23,01
12,50
P
0,000
0,000
R-Sq = 95,1%
S c a tte r p l o t o f C 2 v s C 1
95
90
85
80
C2
Predictor
Constant
C1
75
70
65
60
55
10
20
30
40
C1
50
60
23
xO y koordinat sistemindeki serpilme diyagramındaki ( xi , yi ) noktaları, z i = xi2
dönüşümü sonucu,
( zi , yi )
noktaları olarak
zOy
koordinat sisteminde yeniden
işaretlendiğinde aşağıdaki gibi bir serpilme diyagramı ortaya çıkmaktadır.
Bu serpilme diyagramına bakıldığında,
E (Y / z ) = c + dz
ve
Yi = c + dzi + δi
,
i = 1, 2, ...,10
gibi bir model uygun görünmektedir. Katsayılar,
10
10
i=1
i=1
∑ δi2 = ∑[ yi − (c + dzi )] kareler toplamı
minimum olacak şekilde belirlendiğinde, tahmin denklemi
µˆY / z = 60 + 0.00893z
µˆY / x = 60 + 0.00893x 2
olarak elde edilir. Her iki model için
10
ˆ )
∑  yi − (aˆ + bx
i 
2
= 52.8
i=1
10
2
 y − (cˆ + dx
ˆ 2 ) = 14.2
∑  i
i 
i=1
olmak üzere, bu değerlere göre ikinci model daha iyi görünmektedir.
2
24
ĐST251 dersini alan öğrenciler için boy uzunluğuna bağlı olarak ağırlığı veren bir bağıntı
bulmaya çalışınız.
25
Top Çekme Deneyleri
Đçinde 5 beyaz, 3 mavi ve 2 sarı top bulunan
bir torbadan rasgele bir top çekilmesi ve
renginin gözlenmesi deneyinin örnek uzayını
yazınız. Bu deney ile ilgili bir olay
tanımlayınız. Deneyi bir kez yapınız.
Tanımladığınız olay gerçekleşti mi?
Çekilen topu torbaya geri atarak ard arda 3
top çekilmesi deneyinin örnek uzayını
yazınız. Bu deney ile ilgili bir olay
tanımlayınız. Deneyi bir kez yapınız.
Tanımladığınız olay gerçekleşti mi?
Torbadan 3 topun aynı anda (çekileni yerine
koymadan ) çekilmesi deneyinde örnek uzayı
yazınız. Bu deney ile ilgili bir olay
tanımlayınız. Tanımlanan olay gerçekleşti
mi?
Yukarıdaki deneyleri en az 20 kez
tekrarlayınız ve gelen beyaz topların
sayılarını kaydediniz. Bu sayıların kaç kez
geldiğini ve gözlenen sıklıklar (frekanslar)
için bir grafik (çubuk diyagramı) çiziniz.
Gelen beyaz topların sayısının ortalamasını
bulunuz.
26
Boncuk Deneyleri
Tabanın kenar uzunluğu 20 cm olan bir dik
kare prizma içine küçük bir boncuk (yarıçapı
çok küçük olan bir bilye) atılması ve düştüğü
noktanın gözlenmesi deneyinin örnek uzayını
yazınız. Tabana bir üçgen çiziniz. Boncuğun
bu üçgenin içine düşmesi olasılığını uygun
gördüğünüz
bir
olasılık
uzayında
hesaplayınız.
Deneyi 50 kez yapınız. Boncuğun, üçgenin
içine düşme oranını gözleyiniz ve bu oranı
olasılık
ile
yukarıda
hesapladığınız
karşılaştırınız.
Tabanın köşegenlerinden bir tanesini çiziniz
ve deney sonucunda bilyenin düştüğü
noktanın çizilen bu köşegene uzaklığını
gözleyiniz. Bir rasgele değişken olan bu
uzaklığın olasılık dağılımını bulunuz.
Deneyi en az 50 kez tekrarlayınız. Gözlenen
uzaklıklar için histogram çiziniz.
27
Evde: Bir masada (veya herhangi düz bir zeminde) işaretlenmiş bir nokta üzerine 10 cm
yükseklikten bir boncuk bırakınız. Boncuk düşüp konumlandıktan sonra işaretlenmiş olan
noktaya uzaklığını gözleyiniz (ölçünüz). Bunu en az 50 kez tekrarlayınız. Gözlemler için
histogram çiziniz. Uzaklığın olasılık dağılımı hakkında ne söyleyebilirsiniz? Uzaklığın
ortalaması ve varyansı hakkında ne söylenebilir?
28
Laboratuar Çalışması 3
Bu laboratuarda:
1) Rasgele Rakamlar Tablosu (RRT)
2) (0,1) Aralığından Rasgele Sayı Üretimi
3) Gerçek ve Sanal Deney
ile tanışacaksınız.
Rasgele Rakamlar Tablosu (RRT)
428553
186157
846880
961690
115400
259683
017488
627678
321483
110756
530576
715740
746000
249016
927425
528532
392120
491924
444132
319011
337798
956550
493572
805497
100590
748564
394596
572560
792905
536690
219844
299936
935326
201723
155422
272754
625130
479450
763156
512328
398592
529365
346804
255658
356124
977200
982230 207767 223855 192603 592214 858416 750335 029617 614796
675484 873144 210914 912862 599449 238585 315625 359612 592751
181410 162965 408123 586412 572018 777506 382604 175093 147775
282387 315513 971757 761695 828251 134099 934677 372967 750855
712653 737241 153352 991487 049221 905558 719157 137551 860682
621103 907876 711821 814726 990553 815785 310487 406848 411654
976927 409567 291738 494433 868338 879778 428690 146965 381879
900936 203198 631810 572948 249092 405866 884142 367940 325861
124368 732234 994087 474823 379009 008300 541048 241431 181606
196119 199029 014147 418472 998489 932945 217910 539610 452228
154461 996114 343786 488428 729848 352688 149926 639924 805119
591423 117498 148510 845972 280062 246813 529428 299325 746498
724368 575452 675599 995735 885100 842099 991521 52894 539822
816621 621194 892568 993559 274102 956565 930864 341212 840400
090997 207582 059399 912220 931874 747833 510318 276034 361543
437182 739118 402303 853487 067952 456736 251527 154909 501948
281978 726291 151596 583984 287854 238706 393336 790214 812939
011379 648993 059349 250596 205509 663809 488748 597666 925877
777180 160036 762545 960366 607938 621588 745474 89690 384330
733872 749607 316255 015349 055553 367653 949097 837618 105962
660118 671589 657529 185105 439117 175415 415283 251636 379447
291330 597009 036413 213835 995199 202594 509360 282807 516767
604359 406172 408802 349400 264975 158455 911482 249332 400977
763131 904544 832384 283015 803979 901212 27947 819001 561513
081027 290721 778844 213097 020088 423523 897533 532191 626165
247072 706366 006290 428226 638969 574229 975327 681379 942418
278733 152620 201723 937060 429485 872008 288322 207609 367800
312924 829433 20635 564946 591077 580089 958739 882699 949747
396929 546337 174536 509131 077110 949874 999576 436620 161770
606842 388329 926846 704251 899559 724315 856797 955997 239469
361147 28819 393365 525083 935560 750052 432324 956409 269976
283512 496412 726944 165466 439144 455763 763144 526123 578518
392594 569247 943382 28628 699720 663656 237840 257262 855174
291014 337415 380602 995854 968238 544041 629716 047380 631149
003491 244421 143457 434574 957207 471418 782022 766418 569411
324843 54263 815933 184143 698729 989084 173858 002268 326715
313953 343644 604392 670594 511778 463190 813713 956760 720821
465200 890577 756109 574099 156878 074215 231305 047769 952891
347449 630701 059559 963966 955462 580850 575731 654230 264574
515901 837859 349097 045983 067787 609350 399508 301831 146160
268906 122211 675375 17622 644317 336005 144634 817307 188572
569832 383258 966669 951686 243930 584291 940329 132010 950272
981936 427918 102659 892512 540124 489401 035721 332287 382819
046963 776010 672991 664791 911504 263235 381454 788809 998810
740735 641185 599986 129631 882568 474869 719744 595774 786280
234912 168055 331046 855426 804037 592390 742308 626896 503243
Kendinize yukarıdaki gibi yarım sayfalık bir RRT hazırlayınız.
29
RRT ile 0, 1, … ,99 sayılarından birinin rasgele seçilmesi deneyini nasıl
gerçekleştirebilirsiniz?
Elinizdeki RRT yardımıyla 1000 tane 6 rakamlı sayı üretebilir misiniz?
Varsa, sorun nedir?
30
(0,1) Aralığından Rasgele Sayı Üretimi
“(0,1) aralığındaki reel sayılardan (noktalardan) rasgele bir sayı (nokta) çekme” deneyi
yapılabilir mi? Bunu nasıl gerçekleştirebilirsiniz? RRT ile nasıl gerçekleştirebilirsiniz?
Aşağıdaki bilgisayar programlarını çalıştırıp çıktılarını gözleyiniz.
QBasic
Matlab
FOR I = 1 TO 20
>> rand(20,1)
PRINT RND
NEXT I
Programı bir kez daha çalıştırınız.
Sonuç?
Aşağıdaki bilgisayar programlarını birkaç kez çalıştırınız ve çıktıları gözleyiniz.
PRINT RND
RANDOMIZE 12345
PRINT RND
RANDOMIZE TIMER
PRINT RND
31
Aşağıdaki çıktıları gözden geçiriniz.
>> rand('seed',1234)
>> rand
ans = 0.9296
>> rand('seed',1234)
>> rand
ans = 0.9296
>> rand('seed',12345)
>> rand
ans = 0.8608
>> rand('seed',12345)
>> rand
ans = 0.8608
>> rand('seed',12)
>> rand
ans = 0.1549
>> rand
ans = 0.5258
>> rand
ans = 0.2047
>> rand
ans = 0.1405
QBASIC‘deki “RND” veya Matlab’daki “rand” fonksiyonu ( komutu ) nasıl çalışmaktadır?
32
[0,1) Aralığından Rasgele Sayı Üretilmesi
“[0,1) aralığındaki reel sayılardan rasgele bir sayı çekilmesi” başka bir ifade ile “[0,1)
aralığındaki noktalardan rasgele bir nokta seçilmesi” nasıl gerçekleştirilebilir? Yapılabilir mi
sorusunu bir tarafa bırakarak, derinliğine inmeksizin, bunu iki yoldan yapmaya çalışacağız.
Biri doğal (gerçek dünyadaki) rasgeleliği kullanarak, diğeri ise aklımızın (soyut) dünyasında
bir şeyler yapacağız.
Bir tahta üzerine çizilmiş, uzunluğu bir metre olan bir çember milimetre cinsinden
ölçeklenmiş olsun. Saat yelkovanı gibi ince uçlu bir ibre bu çemberin merkezi etrafında
rahatça döndürülüyor olabilsin. Böyle bir alete “döndürgeç” diyelim. Çevirip, ibre durduktan
sonra metre cinsinden okunan sayıyı [0,1) aralığından çekilen bir rasgele sayı olarak
düşünebiliriz. Ancak, dikkat edilirse bazı sayılar hiç çekilmeyecektir (gözlenemeyecektir).
Ölçeği, milimetrenin alt birimine indirme imkânımız olsa bile ibre ve okuma sorunu ortaya
çıkacaktır. Yine de, imkânlar çerçevesinde [0,1) aralığından rasgele sayı çekebildiğimizi
düşünebiliriz. Deneyebilirsiniz (evde).
0,1,...,9 rakamlarından birinin rasgele olarak çekilmesi deneyi çok değişik biçimde
gerçekleştirilebilir. Örneğin, üzerinde bu rakamlar yazılı 10 tenis topu bir torbaya konup iyice
karıştırıldıktan sonra biri çekilebilir. Benzer bir işlem mekanik olarak milli piyango
çekilişlerindeki makinelerde yapılmaktadır. 0,1,2,...,9
rakamlarının
rasgele
üretilmesi
problemi çözüldüğünde [0,1] aralığındaki her reel sayının bir ondalık açılımının olduğu göz
önüne alınırsa, [0,1] aralığındaki sayılardan birinin rasgele üretilmesi sorunu da çözülebilecek
gibi görünmektedir. Ancak, [0,1] aralığındaki reel sayılar ile bunların ondalık açılımları
arasındaki bire-bir eşlemeye dikkat edilirse,
1
1
π
= 0,333... = 0.3 ,
= 0.5 = .50 , 0 = 0.0 , 1 = 0.9 ,
= 1,0471...
3
2
3
olmak üzere 0,1,2,...,9 rakamlarının rasgele üretilmesi ile bir sayı elde etmek için sonsuz tane
rakam üretmek gerekecektir. Bunun pratik olarak gerçekleştirilmesi mümkün değildir. Yine
de ihtiyaçlarımızı karşılayacak kadar, [0,1] aralığından rasgele sayı çekecek bir yöntem olarak
kullanılabilir. Bunu da kolayca deneyebilirsiniz.
33
Düzgün bir paranın atılması deneyinde, yazı gözlendiğinde 0, tura gözlendiğinde 1
rakamları yazılsın. Paranın atılmasıyla 0,1 rakamlarından oluşan belli uzunluklu rasgele
diziler elde edilebilir. Böyle bir dizinin elemanları 2-li sayma sisteminde, tam kısmı sıfır olan
bir sayının virgülden sonraki basamaklarını doldursun. Bu sayı 10-lu sayma sistemine
çevrilebilir. Böylece para atışı ile de [0,1] aralığında sayı üretilebilir.
Olgulardaki doğal rasgelelikten faydalanarak rasgele sayı üretmek için pek çok
yöntem geliştirilebilir. Milli piyango çekilişlerindeki işlem, hemen hemen hiç kimsede şüphe
bırakmayacak şekilde ihtiyacı karşılamaktadır. Ancak zaman açısından hiç de elverişli
değildir. Milyarlarca rasgele üretilmiş sayıya ihtiyaç olduğunda böyle bir yöntem, hattâ
çekilişleri önceden yapıp, kayda geçirip bu kayıtlardan istifade etmek şeklinde olsa bile,
bilgisayarlarda yer tutma açısından çok uygun değildir.
Rasgele sayı üretmek için çok değişik yöntemler düşünülmüştür. Bu yöntemlerin çoğu,
belli bir sayıdan ( u1 ) başlayıp belli bir dönüşüm kuralına göre ardışık olarak,
u 2 = g (u1 )
u 3 = g (u 2 ) = g ( g (u1 )) = g 2 (u1 )
⋮
u n = g (u n −1 ) = g n −1 (u1 )
⋮
dizisini üretmektir. Kesin bir kurala göre elde edilen böyle sayılara sözde rasgele sayılar
(pseudo random numbers) denir.
Sayı üreteçleri arasında en yaygın olanları Lineer Kongrüans Üreteçler’dir.
Kongrüans hesap, modüler hesap veya saat aritmetiği doğal sayılara, belli bir bölene (modüle)
göre kalanını karşılık getiren bir işlemdir.
Lineer kongrüans üreteçler:
m (m > 0) bir doğal sayı olmak üzere, X 1 ∈ {1,2,..., m − 1} başlangıç değerini seçip,
X i +1 = aX i + c (mod m )
algoritmasına göre X 1 , X 2 , X 3 ,... sayılarını ve bu sayılar yardımıyla,
u1 = X 1 / m , u2 = X 2 / m , u3 = X 3 / m ,... ∈ [0,1)
sayılarını üretmektedir.
IBM bilgisayarlarında a = 16807 veya a = 630360016 , c=0, m = 2 31 − 1 değerleri
alınmıştır. m = 2 35 ve a = 513 olduğunda üretecin devir uzunluğu, yani kongrüans hesabında
ortaya çıkan bir kalanın tekrarlanması için atılan adım sayısı 2 33 dır.
34
X i +1 = aX i + c (mod m ) gibi bir kongrüans üretecinde a, c, m ’ye değişik değerler
vererek elde edeceğiniz sayıları gözden geçirebilirsiniz. Bu amaçla aşağıdaki gibi bir
bilgisayar programı kullanabilirsiniz.
INPUT "Deneme sayısı=",N
DIM X(N)
INPUT "A sabiti=",A: INPUT "C sabiti=",C
INPUT "MOD=",M :
INPUT "Başlangıç değer=",X(1)
FOR I=2 TO N
X(I)=A*X(I-1)+C
IF X(I)< M THEN GO TO 100
W=INT(X(I)/M)
X(I)=X(I)-W*M
100 PRINT "X(I)=",X(I)
NEXT I
Kesin matematiksel formüllere dayalı olarak sayı üreteçleri ile üretilen sayılar esasında
rasgele olmayıp, görünüşte rasgeledir. Sayılarda belli bir özelliğin (örüntünün) ortaya çıkması
rasgeleliğin bozulmasının bir göstergesi olabilir. Örneğin belli bir sayının belli aralıklarda
tekrar etmesi böyle bir özelliktir. Rasgeleliği bozan bir özelliğin tanımlanmasından sonra var
olup olmadığını ortaya çıkaran bir test geliştirilebilir. Bu şekilde çok sayıda test
geliştirilmiştir. Bunlara genel olarak, rasgelelik testleri denmektedir.
Uzun yıllar bilgisayarlarda kullanımda olan bazı rasgele sayı üreteçleri, sonraki
yıllarda yapılan istatistik testlerinde başarılı olamamıştır. Rasgele sayı üretiminin kendi başına
bir araştırma sahası olduğunu belirtelim.
35
Gerçek ve Sanal Deney
1. a) Düzgün bir tavla zarını 25 kez atınız ve gelen nokta sayısını gözleyiniz.
b) RRT tablosu kullanarak “25 atış yapınız”.
c) RND’yi kullanarak “25 atış yapınız”.
36
2. a) Bir parayı 10 kez atınız ve üste gelen yüzeyi yazı (Y), tura (T) olarak gözleyiniz.
b) RRT tablosu kullanarak “10 atış yapınız”.
c) RND’yi kullanarak “25 atış yapınız”.
3. Varsa kameranızı veya cep telefonunuzu kullanarak a) şıklarındaki gerçek deneyleri
bilgisayarda izlettirebilir misiniz? Buna ne deniyor?
4. RND’yi kullanarak c) şıklarında yapılan sanal deneyler için QBASIC de kalmak şartıyla
animasyon yaptırabilir misiniz?
5. Bilgisayarlardaki tavla oyunlarında zar atışları nasıl yapılmaktadır?
37
6.
Đçinde 3 beyaz, 2 mavi top bulunan
bir torbadan rasgele bir top
çekilmesi ve renginin gözlenmesi
deneyinin örnek uzayını yazınız. Bu
deney
ile
ilgili
bir
olay
tanımlayınız. Deneyi bir kez
yapınız.
Tanımladığınız
olay
gerçekleşti mi?
Çekilen topu torbaya geri atarak ard
arda 3 top çekilmesi deneyinin
örnek uzayını yazınız. Bu deney ile
ilgili bir olay tanımlayınız. Deneyi
bir kez yapınız. Tanımladığınız olay
gerçekleşti mi?
Torbadan 3 topun aynı anda
(çekileni
yerine
koymadan)
çekilmesi deneyinde örnek uzayı
yazınız. Bu deney ile ilgili bir olay
tanımlayınız. Tanımlanan olay
gerçekleşti mi?
Yukarıdaki deneyleri en az 20 kez
tekrarlayınız ve gelen beyaz
topların sayılarını kaydediniz. Bu
sayıların kaç kez geldiğini ve
gözlenen sıklıklar (frekanslar) için
bir grafik (çubuk diyagramı)
çiziniz.
Yukarıdaki top çekme deneylerini
bilgisayarda yapınız (sanal olarak
gerçekleştiriniz).
38
7.
Tabanın yarıçapı 10 cm olan bir
silindirin içine çok küçük bir
bilyenin (küçük boncuk) rasgele
atılması ve düştüğü noktanın
gözlenmesi deneyinin örnek uzayını
yazınız. Bu deney ile ilgili bir olay
tanımlayınız (tabanda bir bölge
belirlenip, boncuğun bu bölgeye
düşüp düşmediğine bakılabilir).
Deneyi
bir
kez
yapınız.
Tanımladığınız olay gerçekleşti mi?
Tabanın merkezi ile boncuk
arasındaki uzaklığı gözleyiniz.
Deneyi en az 30 kez tekrarlayınız.
Deneyleri bilgisayarda yapınız
(sanal olarak gerçekleştiriniz).
39
Laboratuar Çalışması 4
Olasılık Dağılımlarından Sayı Üretme
Ters Dönüşüm Yöntemi
F dağılım fonksiyonuna sahip bir X rasgele değişkenin dağılımından sayı üretmek
için en çok kullanılan yöntemlerden biri, F dağılım fonksiyonunun genelleştirilmiş tersi denen
F − : (0,1) → R
u → F − (u) = inf { x: F ( x ) ≥ u}
fonksiyonuna dayalı X = F − (U ) dönüşümünü kullanmaktır. Burada U rasgele değişkeni
(0,1) aralığı üzerindeki düzgün dağılıma, yani U ( 0 , 1) dağılımına sahiptir. X = F − (U )
dönüşümü integral dönüşümü olarak bilinmektedir. X sürekli bir rasgele değişken olduğunda
dağılımın destek kümesi üzerinde F artan bir fonksiyon olmakta ve bu durumda yukarıdaki
dönüşüm X = F −1 (U ) biçimini almaktadır. Bu durumda, X = F −1 (U ) rasgele değişkeninin
dağılım fonksiyonu,
P ( X ≤ x ) = P F −1 (U ) ≤ x = P F ( F −1 (U )) ≤ F ( x )
= P U ≤ F ( x) = F ( x)
dır.
U ( 0 , 1) düzgün dağılımdan üretilen sayılar integral dönüşümü sonucunda X rasgele
değişkenin dağılımından üretilmiş sayılar olacaktır. Böylece herhangi bir X rasgele
değişkenin dağılımından sayı üretme işlemi çözülmüş gibi görünmektedir, ancak buradaki
zorluk bazı dağılımlar için F − genelleştirilmiş ters fonksiyonunun açık bir ifadesinin elde
edilememesidir. Örneğin X ~N (0,1) için,
x
z2
−
1
F ( x) =
e 2 dz , x ∈ R
∫
2π −∞
ve
F − (u ) = F −1 (u ) , u ∈ (0,1)
olmak üzere, F −1 (u ) değerleri u ‘ya bağlı olarak açık bir şekilde kolayca yazılıp
hesaplanamamaktadır.
40
F dağılım fonksiyonunun F −1 ters fonksiyonunun değerlerinin hesaplanabilir olması
durumunda sürekli bir X rasgele değişkeninin dağılımından sayı üretmek için algoritma
aşağıdaki gibidir.
Algoritma
1. U ( 0 , 1) dağılımından U üretilir
2. X = F −1 (U ) hesaplanır
Örnek : X rasgele değişkeninin olasılık yoğunluk fonksiyonu ve dağılım fonksiyonu,
2 x , 0 ≤ x ≤ 1
f ( x) = 
0, d . y.
0,

F ( x) = x 2 ,
1,

−1
1/ 2
= U
olup, X = F (U ) = U
x<0
0≤ x ≤1
x >1
dönüşümü ile X rasgele değişkeninin dağılımından sayı
üretilebilir. En az 50 tane sayı üretiniz ve üretilen sayıların bu dağılımdan gelip gelmediğini
irdeleyiniz.
41
Örnek: θ parametreli üstel dağılımın olasılık yoğunluk fonksiyonu ve dağılım fonksiyonu,
 1 −θx

, x≥0
f ( x) = θ e
0
, d . y.
0

F ( x) = 
x
−
1 − e θ
, x<0
,
x≥0
ve
F −1 (u ) = −θ ln(1 − u ) , 0 < u < 1
olmak üzere,
X = F −1 (U ) = −θ ln(1 − U )
dönüşümü ile üretilen X rasgele sayıları üstel dağılımdan üretilmiş sayılardır. U ~ U (0,1)
için 1 − U rasgele değişkeninin de U (0,1) düzgün dağılımına sahip olduğu göz önüne alınırsa,
θ parametreli üstel dağılımdan sayı üretmek için X = −θ ln(U ) dönüşümü de kullanılabilir.
θ parametresine bir değer verip en az 50 tane sayı üretiniz ve üretilen sayıların bu
dağılımdan gelip gelmediğini irdeleyiniz.
42
Kesikli rasgele değişkenler için F − fonksiyonunu belirlemek zor değildir.
Örnek: X rasgele değişkeninin olasılık fonksiyonu
X=x 1
2 3
f(x) 0.2 0.5 0.3
olsun. Kesikli bir rasgele değişken olan X ’ in dağılım fonksiyonu
, x <1
0
0.2 , 1 ≤ x ≤ 2

F ( x) = 
0.7 , 2 ≤ x < 3
1
, x≥3
dır. F − fonksiyonu,
1, 0 < u ≤ 0.2

F (u ) = 2, 0.2 < u ≤ 0.7
3, 0.7 < u < 1

−
olmak üzere,
1, 0 < U ≤ 0.2

X = F − (U ) = 2, 0.2 < U ≤ 0.7
3, 0.7 < U < 1

dönüşümü ile X rasgele değişkenin dağılımından sayı üretilebilir. En az 20 tane sayı üretiniz
ve üretilen sayıların bu dağılımdan gelip gelmediğini irdeleyiniz.
43
Kabul-Red Yöntemi
DX
X
rasgele değişkeninin olasılık yoğunluk fonksiyonu f ve aldığı değerler kümesi
olsun. V rasgele değişkenin olasılık yoğunluk fonksiyonu g ve aldığı değerlerin kümesi
D olmak üzere V sayıları kolayca üretilebilsin. a > 0 sabiti ve ∀x ∈ DX için
f ( x) ≤ a ⋅ g( x)
koşulu sağlansın. Bu durumda aşağıdaki algoritma ile olasılık yoğunluk fonksiyonu f olan
dağılımından sayı üretilebilir.
Algoritma
1) V sayısı olasılık yoğunluk fonksiyonu g olan dağılımından üretilsin
2) V ’den bağımsız olarak U ~ U ( 0 , 1) üretilsin.
U ⋅ a ⋅ g (V ) ≤ f (V ) ise X = V kabul edilsin yani bir X sayısı üretilmiş olsun, aksi
durumda reddedilsin yani 1. adıma geçilsin (başka bir ifade ile Y ~ U (0, a ⋅ g (V ))
üretilsin. Y < f (V ) ise X kabul edilsin, aksi durumda reddedilsin.)
Algoritmayı aşağıdaki gibi de yazabiliriz.
1) Birbirinden bağımsız olarak V ~ g ve U ~ U (0,1) üretilsin.
f (V )
2) Eğer U ≤
ise X = V olsun ve X sayısı çıkılsın.
ag (V )
Örnek: X rasgele değişkeninin olasılık yoğunluk fonksiyonu
 2 x(2 − x) , 0 < x < 2
f ( x) =  π
0
, d.y.
olsun, uygun bir g fonksiyonu da
,0 < x < 2
1
g ( x) =  2
, d.y.
0
şeklinde seçilsin. Bu durumda a = 2 için f ( x) ≤ 2 g ( x) ( x ∈ (0,2) ) dır. Buna göre algoritma
aşağıdaki gibi olacaktır.
f(x)
1
1
2
x
1) U ~ U (0,1) dağılımından bir U 1 sayısı üretilip V = 2U 1 alınır. U(0,1) dağılımından
bir U 2 sayısı üretilir.
2) Eğer U 2 ≤
2
π
V (2 − V )
yani U 2 ≤
2. 12
2
π
V (2 − V ) ise X = V alınır ve X sayısı çıkılır.
44
Yukarıdaki algoritmaya dayalı, BASIC programlama dilinde aşağıdaki program yazılabilir.
X=2*RND
IF RND < (2/3.14)*SQR(X*(2-X)) THEN PRINT X
Bilgisayar programında V sayısını X ile göstermek ( X adresine yazdırmak) ikinci adımda
kolaylık sağlamaktadır. Karışıklığa yol açmadığı takdirde algoritmanın birinci adımında g
olasılık yoğunluk fonksiyonuna sahip dağılımdan üretilen V sayısı yerine X yazılabilir. Buna
göre algoritma aşağıdaki şekli alır.
1) Birbirinden bağımsız olarak X ~ g ve U ~ U (0,1) üretilir.
f (X )
2) Eğer U ≤
ise X kabul edilir aksi halde red edilir.
ag ( X )
Kolayca sayı üretilebilen yardımcı dağılımın olasılık yoğunluk fonksiyonu olan g
fonksiyonu
f
fonksiyonuna ne kadar çok benziyorsa ve grafikleri birbirine yakınsa
simülasyon zamanı kısadır, red olunmalar o kadar az olur. g fonksiyonu seçildikten sonra a
f ( x)
f ( x)
sabiti ∀x ∈ DX için a ≥
olacak şekilde ve
değerleri bire yakın olacak şekilde
g ( x)
ag ( x)
seçilmelidir. Bu şartlar altında g seçildikten sonra a sabiti,
a = sup
x∈DX
f ( x)
g ( x)
olarak seçilebilir.
Yukarıdaki örnekte sayı üretilmek istenen dağılımın olasılık yoğunluk fonksiyonu
 2 x(2 − x)
f ( x) =  π
0
, 0< x<2
, d.y.
ve yardımcı dağılımın olasılık yoğunluk fonksiyonu
 21
, 0< x<2
g ( x) = 
, d.y.
0
dır.
f ( x)
2
=2
g ( x)
π
x( 2 − x )
olmak üzere,
a = sup
x∈DX
f ( x)
4
f (1) 4
= max
=
x(2 − x) =
g ( x) x∈DX π
g (1) π
olarak seçilirse algoritmadaki Uag ( X ) ≤ f ( X ) eşitsizliği U ≤
X (2 − X ) biçiminde olur.
45
Algoritma:
1) Birbirinden bağımsız olarak X ~ U (0,2) ve U ~ U (0,1) üretilir.
2) Eğer U ≤
X (2 − X ) ise X kabul edilir aksi halde red edilir.
BASIC deyimleri:
X=2*RND
IF RND < SQR(X*(2-X)) THEN PRINT X.
olmak üzere, bu algoritma (program) ile bir önceki,
X=2*RND
IF RND < (2/3.1415)*SQR(X*(2-X)) THEN PRINT X
algoritmasını (programını) hız açısından karşılaştırmak amacıyla her ikisi ile üretilen 100’er
tane X sayısı için döngü sayılarını gözleyiniz.
Örnek: Olasılık yoğunluk fonksiyonu
1 2
 2 e − 2 x
π
f ( x) = 
 0
, x≥0
, d . y.
olan dağılımdan sayı üretilmek istensin. Dikkat edilirse bu dağılım standart normal dağılımın
sağ yarısıdır. Bu dağılıma sahip rasgele değişkeni X ile gösterelim.
Kabul-red yöntemine göre bu dağılımdan sayı üretmek için olasılık yoğunluk
fonksiyonu bu dağılımınkine benzeyen ve kolayca sayı üretilebilen bir dağılım olarak θ = 1
parametreli üstel dağılım seçilsin. Buna göre,
g( x) = e − x , x ≥ 0
dır.
a = max gf (( xx)) = max
x ≥0
olmak üzere x = 1 değerinde
x≥0
f ( x)
g ( x)
2
πe
− 12 ( x 2 − 2 x )
maksimum değerine ulaşır. Bu durumda a =
f (1)
g (1)
=
2
π
1
e2
değerini alır ve birbirinden bağımsız olarak üretilen X ~ g ve U ~ U (0,1) sayıları için
U≤
f ( x)
a. g ( x )
yani U ≤ e
− 12 ( x −1) 2
ise X kabul edilir. Aşağıdaki program ile bu dağılımdan sayı
üretilebilir.
X= -LOG(RND)
IF RND < EXP (-(X-1)^2) THEN PRINT X
46
Bu dağılımdan üretilen sayılar kullanılarak standart normal dağılımdan da sayı
üretilebilir. Bu amaçla yazılan bilgisayar programı aşağıda verilmiştir.
X= -LOG(RND)
IF RND>EXP (-(X-1)^2) THEN GOTO 10
IF RND < 0.5 THEN PRINT X ELSE PRINT –X
10
En az 50 tane sayı üretiniz ve üretilen sayıların standart normal dağılımdan gelip gelmediğini
irdeleyiniz.
47
Örnek: Standart normal dağılımın bir d ( d > 0 ) sayısının sağında kalan kısmından
(kuyruğundan) sayı üretme problemini ele alalım. Başka bir ifade ile olasılık yoğunluk
fonksiyonu
ce − 2 x
f ( x) = 
0
1
2
, x≥d
, d.y.
olan dağılımdan sayı üretilmek istensin ( c sabiti f bir olasılık yoğunluk fonksiyonu olacak
şekildedir). Kolayca sayı üretilebilecek yardımcı dağılım olarak ötelenmiş üstel dağılım, yani
olasılık yoğunluk fonksiyonu
e − x + d , x ≥ d
g ( x) = 
, d.y.
0
olan dağılım seçilmiş olsun.
x2
− +x
f ( x)
= ce − d e 2
g ( x)
x2
olmak üzere, −
+ x ifadesi x < 1 için artan x > 1 için azalan olduğundan, 0 < d ≤ 1 , için
2
f ( x) f (1)
a = max
=
= ce − d e1 / 2
x≥d g ( x)
g (1)
ve d > 1 için
d2
−
f ( x) f (d )
a = max
=
= ce 2
x≥d g ( x)
g (d )
dır. Buna göre algoritmada yer alan
Uag ( X ) ≤ f ( X )
eşitsizliği, 0 < d ≤ 1 durumunda
U ≤e
1
− ( X −1) 2
2
ve d > 1 durumunda
1
U ≤ e2
( d −1) 2
e
1
− ( X −1) 2
2
biçiminde olacaktır. Đlgili bilgisayar programı BASIC dilinde aşağıdaki gibi olabilir.
INPUT D
X=-LOG(RND)+D
A=EXP(-0.5*(X-1)^2
IF D<=1 AND RND<A THEN PRINT X
IF D>1 AND RND<A*EXP(0.5*(D-1)^2) THEN PRINT X
48
Örnek: >> z=randn(100,1);
>> [z(1:20,1) z(21:40,1) z(41:60,1) z(61:80,1) z(81:100,1)]
0.7160
1.5986
-2.0647
-0.7436
0.1762
0.5278
-0.5532
0.2983
-1.2266
-0.1897
-0.3017
0.9570
-0.5334
-0.9011
-0.8926
0.2787
-0.7458
1.6035
0.5743
0.3207
-0.1514
0.3158
1.3437
-2.2378
1.2929
-0.3785
0.0025
0.8846
0.5825
-1.6142
-1.5037
0.5736
-0.9105
-1.6313
-0.3591
-0.3976
-1.1613
-1.1098
0.2907
-1.9102
1.3148
0.6653
-0.2751
-0.0230
-0.9080
-1.0437
0.3735
0.9015
1.2785
-0.1285
0.6128
1.9565
2.2663
-0.3740
2.2380
-0.1596
-0.7033
0.5635
-0.0503
1.1636
0.6588
-1.5501
-3.0291
0.5406
-1.0090
0.9080
1.5823
-0.9791
1.0079
0.1585
-0.5869
1.5741
-0.5166
1.2278
1.5839
-2.0890
2.9495
1.3561
1.0501
-0.7672
-0.2577
-1.3718
-1.2677
-0.8949
0.5891
1.8426
1.3480
-0.4913
-2.1776
0.2370
-0.7354
-1.7794
0.4480
0.5812
0.8566
-0.2663
-0.4175
-0.2058
-0.1743
0.2176
>> hist(z)
25
20
15
10
5
0
-4
-3
-2
-1
0
1
2
Random Number Generators
betarnd
binornd
chi2rnd
copularnd
evrnd
exprnd
frnd
gamrnd
geornd
gevrnd
gprnd
hygernd
iwishrnd
Random numbers from beta distribution
Random numbers from binomial distribution
Random numbers from chi-square distribution
Random numbers from copula
Random numbers from extreme value distribution
Random numbers from exponential distribution
Random numbers from F distribution
Random numbers from gamma distribution
Random numbers from geometric distribution
Random numbers from generalized extreme value distribution
Random numbers from generalized Pareto distribution
Random numbers from hypergeometric distribution
Random numbers from inverse Wishart distribution
3
49
johnsrnd
Random numbers from Johnson system of distributions
lhsdesign
Generate latin hypercube sample
lhsnorm
Generate latin hypercube sample with normal distribution
lognrnd
Random numbers from lognormal distribution
mhsample
Markov chain Metropolis-Hastings sampler
mnrnd
Random numbers from multinomial distribution
mvnrnd
Random numbers from multivariate normal distribution
mvtrnd
Random numbers from multivariate t distribution
nbinrnd
Random numbers from negative binomial distribution
ncfrnd
Random numbers from noncentral F distribution
nctrnd
Random numbers from noncentral t distribution
ncx2rnd
Random numbers from noncentral chi-square distribution
normrnd
Random numbers from normal distribution
pearsrnd
Random numbers from Pearson system of distributions
poissrnd
Random numbers from Poisson distribution
randg
Gamma distributed random numbers and arrays (unit scale)
random
Random numbers from specified distribution
randsample Random sample, with or without replacement
randtool
Interactive random number generation
raylrnd
Random numbers from Rayleigh distribution
slicesample Markov chain slice sampler
trnd
Random numbers from Student's t distribution
unidrnd
Random numbers from discrete uniform distribution
unifrnd
Random numbers from continuous uniform distribution
wblrnd
Random numbers from Weibull distribution
wishrnd
Random numbers from Wishart distribution
>> hist(trnd(10,100,1))
>> hist(randn(100,1))
30
30
20
20
10
10
0
-3
-2
-1
0
1
2
3
0
-4
-2
0
2
4
6
50
Laboratuar Çalışması 5
Bir Boyutlu Kesikli Dağılımlar
Bazı Kesikli Dağılımlar
o.f.
Düzgün Dağılım
m.ç.f.
1
, x = a1 , a2 ,..., an
n
a t
n
ei
M X (t ) = ∑
, t ∈R
i =1 n
f ( x) =
n
ortalama
E( X ) = a =
∑a
i
i =1
n
n
varyans
parametre
Bernoulli
Dağılımı
b (1, p )
o.f.
m.ç.f.
n
a1 , a2 ,..., an ∈ R , n ∈ {1,2,...}
f ( x) = p x (1 − p )
1− x
varyans
Var ( X ) = p (1 − p )
o.f.
ortalama
varyans
parametre
o.f.
m.ç.f.
ortalama
varyans
parametre
, x =0,1
M X (t ) = 1 − p + pet , t ∈ R
E( X ) = p
m.ç.f.
Hipergeometrik
i =1
2
i
ortalama
parametre
Binom
b ( n, p )
Var ( X ) =
∑(a − a )
p ∈ (0,1) , n ∈ {1,2,...}
n
n− x
f ( x) =   p x (1 − p ) , x = 0,1,...,n
 x
M X (t ) = (1 − p + pet ) , t ∈ R
n
E ( X ) = np
Var ( X ) = np (1 − p )
p ∈ (0,1) , n ∈ {1,2,...}
a N − a  N 
f ( x) =   
  
 x n − x   n 
açık biçimi yok
a
N
N −n
a
a
Var ( X ) =
× n × × (1 − )
N −1
N
N
N , a, n ∈ {1, 2,...} , a < N , n < N
E( X ) = n ×
51
o.f.
Poisson
m.ç.f.
ortalama
varyans
parametre
Geometrik
o.f.
m.ç.f.
Negatif Binom
e−λ λ x
f ( x) =
, x = 0,1, 2,...
x!
λ  et −1
M X (t ) = e 
E( X ) = λ
Var ( X ) = λ
λ ∈ (0, ∞)
f ( x) = (1 − p )
M X (t ) =
ortalama
E( X ) =
varyans
Var ( X ) =
parametre
p ∈ (0,1)
o.f.
m.ç.f.
ortalama
varyans
parametre

x −1
, t ∈R
p , x =1,2,...
pet
,
1 − (1 − p ) et
t < − ln(1 − p )
1
p
1− p
p2
 x − 1 k
k −r
f ( x) = 
 p (1 − p ) , x = k , k + 1,...
 k − 1

pet
M X (t ) = 
 1 − (1 − p ) et

k
E( X ) =
p
k (1 − p )
Var ( X ) =
p2
p ∈ (0,1) , k ∈ {1, 2,...}



k
,
t < − ln(1 − p )
Probability Density Functions
binopdf
Binomial probability density function
geopdf
Geometric probability density function
hygepdf
Hypergeometric probability density function
nbinpdf
Negative binomial probability density function
poisspdf
Poisson probability density function
unidpdf
Discrete uniform probability density function
Cumulative Distribution Functions
binocdf
Binomial cumulative distribution function
ecdf
Empirical cumulative distribution function
geocdf
Geometric cumulative distribution function
hygecdf
Hypergeometric cumulative distribution function
poisscdf
Poisson cumulative distribution function
unidcdf
Discrete uniform cumulative distribution function
Inverse Cumulative Distribution Functions
binoinv
Inverse of binomial cumulative distribution function
geoinv
Inverse of geometric cumulative distribution function
hygeinv
Inverse of hypergeometric cumulative distribution function
nbininv
Inverse of negative binomial cumulative distribution function
poissinv
Inverse of Poisson cumulative distribution function
unidinv
Inverse of discrete uniform cumulative distribution function
52
1
X ∼ b(n = 3, p = ) olsun. Bu dağılım ile ilgili aşağıdaki Matlab çıktılarını gözden geçiriniz.
2
>>x=0:3
x= 0
1
>> binopdf(x,3,1/2)
ans =
0.125
0.375
2
0.375
3
0.125
>> plot(x,binopdf(x,3,1/2),'.')
0.45
0.4
0.35
0.3
0.25
0.2
0.15
0.1
0
0.5
>> binocdf(x,3,1/2)
ans =
0.125
0.5
0.875
1
1.5
2
2.5
3
1
>> stairs(x, binocdf(x,3,1/2))
1
0.8
0.6
0.4
0.2
0
0
0.5
1
1.5
2
2.5
3
53
1
X ∼ b(n = 10, p = )
2
>> x=0:10
x=
0
1
2
>> binopdf(x,10,1/2)
ans =
0.0010
0.0098
0.0439
3
4
5
6
7
0.1172
0.2051
0.2461
0.2051
0.1172
8
9
10
0.0439
0.0098
0.0010
>> plot(x,binopdf(x,10,1/2),'.')
0.25
0.2
0.15
0.1
0.05
0
0
1
2
3
4
5
6
7
8
9
10
3
4
5
6
7
8
9
10
>> stairs(x,binocdf(x,10,1/2))
1
0.9
0.8
0.7
0.6
0.5
0.4
0.3
0.2
0.1
0
0
1
2
54
50 tane top arasında 40 tanesi beyaz ve 10 tanesi siyah olsun. Birini, rasgele, bilgisayarda sayı
üreterek seçmek istersek QBASIC programlama dilinde,
IF RND<0.80 THEN PRINT “beyaz” ELSE PRINT “siyah”
deyimini kullanabiliriz. Đadeli olarak 10 çekiliş yapmak istersek,
FOR i=1 TO 1
IF RND<0.80 THEN PRINT “beyaz” ELSE PRINT “siyah”
NEXT i
deriz. 10 çekiliş yapınız.
Đadesiz olarak 10 çekilişi nasıl yaptırırız? Bilgisayar programı yazınız ve çalıştırınız.
55
Bir torbada 4 beyaz ve 1 siyah top bulunsun. Đadeli olarak siyah top gelinceye kadar toplar
çekilmektedir. Bu çekilişleri yapan ve çekiliş sayısını (X) çıkan bir bilgisayar programı
yazınız. Bu programı 50 defa işletiniz ve X ‘in aldığı değerleri kaydedip çubuk diyagramı
çiziniz. X ‘in olasılık tablosu ile karşılaştırın.
56
Bir torbada 4 beyaz ve 1 siyah top bulunsun. Đadeli olarak çekilişler yapan ve 5 ‘inci defa
siyah top geldiğinde durup, çekiliş sayısını (X) çıkan bir bilgisayar programı yazınız. Bu
programı 50 defa işletiniz ve X ‘in aldığı değerleri kaydedip çubuk diyagramı çiziniz. X ‘in
olasılık tablosu ile karşılaştırın.
57
Numaralanmış 3 tane tenis topu, aynı şekilde 1,2,3 olarak numaralanmış 3 kutuya rasgele
atılsın.
* Örnek uzayı yazınız.
* Top numarası ile kutu numarasının aynı olmaması olasılığı nedir?
* Top numarası ile kutu numarası aynı olduğunda, o kutuda eşleme vardır denir. X
rasgele değişkeni eşleme sayısı olsun. X rasgele değişkeninin olasılık fonksiyonunu
bulunuz ve grafiğini çiziniz. X ‘in beklenen değerini ve varyansını bulunuz.
* Bu deneyde (oyunda) top numarası ile kutu numarası aynı olursa, yani eşleme
olursa, her eşleme için 1 TL kazanılsın. Kazancın olasılık dağılımını bulunuz.
Oyunun dürüst olması için kaç TL’ye oynatılmalıdır.
58
Top ve kutu sayısı 5 olsun. X rasgele değişkeni eşleme sayısı olsun. X rasgele değişkeninin
olasılık fonksiyonunu bulunuz. X ‘in beklenen değeri ve varyansı nedir?
59
Top ve kutu sayısı 100 olsun. X rasgele değişkeni eşleme sayısı olsun. X ‘in beklenen değeri
ve varyansı nedir?
60
Laboratuar Çalışması 6
Poisson Dağılımı ve Uygulamaları
Poisson Dağılımı, sürekli (zaman, alan, hacim gibi) ortamlarda kesikli sonuçlar veren
ve aşağıdaki a),b),c) şıklarında belirtilen özelliklere sahip deneylerin modellenmesinde
kullanılan bir dağılımdır.
Poisson Dağılımı ile ilgili açıklamaları ortamın zaman olması halinde yapalım. (0, t ]
zaman aralığında meydana gelen sonuçların (bir olayın gerçekleşme) sayısı X olsun. Sonuçları
ortaya çıkaran deney ile ilgili aşağıdaki özellikler geçerli olsun:
a) Küçük ∆t uzunluklu bir zaman aralığında bir başarı elde etme olasılığı ∆t ile
orantılıdır.
b) Küçük ∆t uzunluklu bir zaman aralığında iki veya daha çok başarı elde etme olasılığı
yaklaşık olarak sıfırdır.
c) ∆t uzunluklu ayrık aralıklar için elde edilen sonuçlar bağımsız birer Bernoulli
Denemesidir.
(0, t ] zaman aralığında meydana gelen sonuç sayısı X, kesikli bir rasgele değişken
olmak üzere, X ‘in aldığı değerler x = 0,1,2,… dır. X ‘in olasılık fonksiyonunu bulmaya
t
çalışalım.
(0, t ] aralığını yeterince küçük ∆t uzunluklu,
n=
tane alt aralığa
∆t
parçalayalım. Belli bir parçada 0 veya 1 tane sonuç ortaya çıkabilir diyebiliriz. ∆t zaman
aralığında bir sonuç çıkması veya çıkmaması bir Bernoulli Denemesi olup, sonucun ortaya
çıkması olasılığı ∆t ile orantılıdır. Bu olasılık, c bir sabit olmak üzere, p = c∆t olsun. (0, t ]
aralığında n tane ∆t uzunluklu ayrık aralık bulunmakta ve bu aralıklarda bağımsız sonuçlar
veren p = c∆t olasılıklı Bernoulli Denemeleri gerçekleşmektedir. O zaman (0, t ] aralığında
t
, p = c∆t ) Binom Dağılımına sahip olacaktır. ∆t → 0
∆t
t
t
t
için n =
→ ∞ , np = c∆t = ct = λ olmak üzere, b(n = , p = c∆t ) Binom
∆t
∆t
∆t
Dağılımındaki olasılıkların limitleri Poisson Dağılımındaki olasılıkları verecektir. Başka bir
ifade ile, (0, t ] zaman aralığında meydana gelen sonuç sayısı olan ve Poisson dağılımına
sahip olan X rasgele değişkeninin olasılık fonksiyonu,
elde edilen sonuçların sayısı b(n =
t −x
 t / ∆t 
x
∆
f ( x) = P( X = x) = ∆lim

 (c∆t ) (1 − c∆t ) t
t →0  x


n λ x
λ n− x
= lim
  ( ) (1 − )
n →∞ x
n
  n
61
−x
n

n!
λx  λ   λ  
. . 1 −  . 1 −  
= lim 
n →∞  x !( n − x ) ! n x
 n   n  

 n ( n − 1) ...(n − ( x − 1))  λ − x  λ n 
λx
=
lim 
 1 −  .  1 −  
x ! n →∞ 
nx
 n  n 
e− λ λ x
=
,
x = 0,1,2,3,...
x!
dır.
n ( n − 1) (n − 2)...(n − ( x − 1)) n  1  2   x − 1  n →∞
= 1 −  1 −  ...  1 −
→1
 
nx
n  n  n  
n 
−x
 λ
 λ
n →∞
n →∞
→1 , 1 −  
→ e−λ
1 −  
n
n




n
X Poisson Dağılımına sahip bir rasgele değişken olduğunda,
f ( x) =
e−λ λ x
x!
,
x = 0,1,2,3,...
ve
t
M X (t ) = E (etX ) = ∑ etx f ( x) = eλ (e −1)
t∈R
,
x
olmak üzere,
E( X ) =
t
dM X (t )
= λ et eλ ( e −1) = λ
t =0
dt t =0
E( X 2 ) =
2
t
t
d 2 M X (t )
= λ et eλ ( e −1) + ( λ et ) eλ ( e −1) = λ + λ 2
2
dt
t =0
t =0
Var ( X ) = E ( X 2 ) − ( EX ) = λ + λ 2 − λ 2 = λ
2
dır. Poisson Dağılımının parametresi olan λ (λ ∈ (0, ∞)) sayısı aynı zamanda dağılımın
beklenen değeri (ortalaması) ve varyansıdır. λ parametresinin bazı değerleri için Poisson
dağılımının olasılık fonksiyonunun grafikleri aşağıdaki gibidir.
λ =1
0.4
0.3
0.2
0.1
0
0
5
10
15
20
25
30
35
40
45
50
62
λ = 2.5
0.35
0.3
0.25
0.2
0.15
0.1
0.05
0
0
5
10
15
20
25
30
35
40
45
50
0
5
10
15
20
25
30
35
40
45
50
λ =5
0.2
0.15
0.1
0.05
0
λ = 10
0.14
0.12
0.1
0.08
0.06
0.04
0.02
0
0
5
10
15
20
25
30
35
40
45
50
λ = 20
0.1
0.08
0.06
0.04
0.02
0
0
5
10
15
20
25
30
35
40
45
50
63
Şehirlerarası bir petrol istasyonuna bir dakikada ortalama bir araba gelmektedir. Bir
dakikada gelen araba sayısı λ =1 olan Poisson Dağılımına sahip bir rasgele değişken olarak
düşünülsün. λ =1 olan Poisson Dağılımının olasılık tablosunu hazırlayınız.
64
Bir dakikada gelen araba sayısı λ =1 olan Poisson Dağılımına sahip bir rasgele
1
değişken olmak üzere, bir saniyede gelen araba sayısı λ =
olan Poisson dağılımına sahip
60
bir rasgele değişken olarak düşünülebilir. Bir saniyede gelen araba sayısının iki veya daha çok
olması olasılığı 0.00013736 olup (hesaplayın), yaklaşık olarak sıfır alınabilir. Ayrıca bir
saniyelik bir zaman aralığında istasyona bir araba gelmesi olasılığı,
1
−
1
e 60 ( )1
1 − 601
60
p=
= e = 0.016391
1!
60
dır. Bir dakikalık bir zaman aralığının her saniyesi için p = 0.016391 başarı olasılıklı bir
Bernoulli Denemesi yapıp istasyona gelen araba sayısını sayın. Bunu 100 defa tekrarlayın
(bilgisayarda). Gözlediğiniz bu 100 değer için çubuk diyagramı hazırlayın ve yukarıdaki
olasılık tablosu ile karşılaştırın.
65
* Bir dakikalık bir zaman aralığının her saniyesi için p = 0.016391 başarı olasılıklı bir
Bernoulli Denemesi yapıp istasyona gelen arabaların geliş anlarını kaydedin.
* On dakikalık bir zaman aralığının her saniyesi için p = 0.016391 başarı olasılıklı bir
Bernoulli Denemesi yapıp istasyona gelen arabaların geliş anlarını kaydedin.
* Bir saatlik bir zaman aralığının her saniyesi için p = 0.016391 başarı olasılıklı bir
Bernoulli Denemesi yapıp istasyona gelen arabaların geliş anlarını kaydedin.
66
** Bir saatlik bir zaman aralığında gelen arabaların gelişleri arasında geçen zamanları
gözleyin.
** Bir saatlik bir zaman aralığında gelen arabaların gelişleri arasında geçen zamanları
gözleyip histogram çizin.
67
Laboratuar Çalışması 7
Bir Boyutlu Sürekli Dağılımlar
Düzgün Dağılım
X ∼ U (θ1 ,θ 2 ) , θ1 ,θ 2 ∈ Θ = R , θ1 < θ 2
1
I
( x)
b − a ( a ,b )
a+b
(b − a )2
E( X ) =
, Var ( X ) =
, M X (t ) = ( ebt − e at ) ( b − a ) , t ∈ R
2
12
f ( x) =
X ∼ U ( 0,1)
2
0
-2
-1
0
1
2
1 , 0 < x < 1
f ( x) = I ( 0,1) ( x ) = 
0 , d . y.
1
1
E( X ) =
, Var ( X ) =
, M X (t ) = et − 1
2
12
Normal Dağılım
X ∼ N ( µ , σ 2 ) , µ ∈ R , σ 2 ∈ (0, ∞) , ( µ , σ 2 ) ∈ Θ = R × (0, ∞) ⊂ R 2
1  x−µ 
− 
1
f ( x; µ ,σ ) =
e 2
2πσ
2
E( X ) = µ ,
2
σ 
Var ( X ) = σ
,
2
Z ∼ N ( 0,1)
x∈R
, M X (t ) = e
0.4
0.3
0.2
0.1
0
-4
f ( z) =
1
e
2π
-2
−
z2
2
0
,
2
4
z∈R
E ( Z ) = 0 , Var ( X ) = 1 , M Z (t ) = e
t2
2
µt −σ 2t 2
2
, t∈R
68
Üstel Dağılım
X ∼ Üstel (θ ) , θ ∈ Θ = (0, ∞) ⊂ R
1.5
1
0.5
0
-2
f ( x;θ ) =
1
θ
0
e
−
E( X ) = θ
2
4
6
x
θ
,
I (0,∞ )
Var ( X ) = θ 2 , M X (t ) =
1
, t∈R
1−θt
Ki-kare Dağılımı
X ∼ χ (2r ) , r ∈ {1, 2,3,...}
0.2
0.1
0
0
10
20
1
f ( x; r ) =
x r 2−1e − x 2 I ( 0,∞ ) ( x )
r 2
Γ ( r 2) 2
E( X ) = r ,
Var ( X ) = 2r ,
M X (t ) = (1 − 2t )
−r 2
, t<1 2
Gamma Dağılımı
X ∼ Γ (α , β ) , α , β ∈ (0, ∞) , (α , β ) ∈ Θ× Θ ⊂ R 2
0.4
0.2
0
0
f ( x; α , β ) =
E ( X ) = αβ
5
1
Γ (α ) β α
,
10
x
α −1 − x β
e
I ( 0,∞ ) ( x )
Var ( X ) = αβ 2 ,
M X (t ) = (1 − β t )
−α
, t<β −1
69
Beta Dağılımı
X ∼ B (α , β ) , α , β ∈ (0, ∞) , (α , β ) ∈ Θ× Θ ⊂ R 2
4
2
0
0
0.5
1
Γ (α + β )
I ( 0,1) ( x )
Γ (α ) Γ ( β )
Moment Çıkaran Fonksiyonu’nun açık biçimi yok.
f ( x; α , β ) =
E( X ) =
α
α +β
xα −1 (1 − x )
Var ( X ) =
,
β −1
αβ
(α + β + 1)(α + β )
2
Cauchy Dağılımı
X ∼ C ( µ , σ ) , µ ∈ R , σ ∈ (0, ∞) , ( µ , σ ) ∈ Θ = R × (0, ∞) ⊂ R 2
2
1   x−µ  
f ( x; µ , σ ) =
1 +

πσ   σ  
−1
, x∈R
Moment Çıkaran Fonksiyonu yok. Momentleri yok. ϕ X (t ) = e
µit −σ t
, t ∈R
X ∼ C ( 0,1)
1.5
1
0.5
0
-5
0
5
f ( x) =
1
1 + x2
,
x∈R
t-Dağılımı
X ∼ t(υ ) , υ ∈ {1, 2,3,...}
0.4
0.2
0
-5
−(υ +1) 2
0
Γ (υ + 1) 2   x 2 
5
f ( x;υ ) = 
, x∈R
1 + 
υπ Γ (υ 2 )  υ 
Moment Çıkaran Fonksiyonu’nun açık biçimi yok.
E( X ) = 0 ,
Var ( X ) =
υ
υ −2
, (υ > 2)
70
F Dağılımı
X ∼ Fn ,m , n, m ∈ {1, 2,3,...}
0.8
0.6
0.4
0.2
0
0
5
10
15
n n 2 mm 2 Γ ( n + m ) 2  x n 2−1
I ( 0,∞ ) ( x )
nπ Γ ( n 2 )
Moment Çıkaran Fonksiyonu’nun açık biçimi yok.
2m 2 ( n + m − 2 )
E ( X ) = m ( m − 2 ) , ( m>2 ) , Var ( X ) =
,
2
n ( m − 2) ( m − 4)
f ( x; n, m) = f ( x; n, m) =
( m > 4)
Log-Normal Dağılım
X ∼ LN ( µ , σ 2 ) , µ ∈ R , σ 2 ∈ (0, ∞) , ( µ , σ 2 ) ∈ Θ = R × (0, ∞) ⊂ R 2
0.1
0.05
0
0
10
20
−( log x − µ ) 2σ 2
1
x −1e
I ( 0,∞ ) ( x )
2πσ
Moment Çıkaran Fonksiyonu yok. E ( X ) = µ ,
2
f ( x; µ , σ 2 ) =
Var ( X ) = σ 2
Weibull Dağılımı
X ∼ W (α ,θ ) , α ,θ ∈ (0, ∞) , (α ,θ ) ∈ Θ × Θ ⊂ R 2
0.8
0.6
0.4
0.2
0
0
2
4
6
8
10
α
α α −1 − xθ
f ( x; α ,θ ) = x e I ( 0,∞ ) ( x )
θ
Moment Çıkaran Fonksiyonu’nun açık biçimi yok.
E ( X ) = θ 1 α Γ (α −1 + 1)
Var ( X ) = θ 2 α Γ ( 2α −1 + 1) − Γ (α −1 + 1) 
2
71
Probability Density Functions
betapdf
Beta probability density function
chi2pdf
Chi-square probability density function
exppdf
Exponential probability density function
fpdf
F probability density function
gampdf
Gamma probability density function
gppdf
Generalized Pareto probability density function
lognpdf
Lognormal probability density function
normpdf
Normal probability density function
pdf
Probability density function for specified distribution
raylpdf
Rayleigh probability density function
tpdf
Student's t probability density function
unifpdf
Continuous uniform probability density function
wblpdf
Weibull probability density function
Cumulative Distribution Functions
betacdf
Beta cumulative distribution function
cdf
Cumulative distribution function for specified distribution
chi2cdf
Chi-square cumulative distribution function
expcdf
Exponential cumulative distribution function
fcdf
F cumulative distribution function
gamcdf
Gamma cumulative distribution function
gpcdf
Generalized Pareto cumulative distribution function
logncdf
Lognormal cumulative distribution function
normcdf Normal cumulative distribution function
raylcdf
Rayleigh cumulative distribution function
tcdf
Student's t cumulative distribution function
unifcdf
Continuous uniform cumulative distribution function
wblcdf
Weibull cumulative distribution function
Inverse Cumulative Distribution Functions
betainv
Inverse of beta cumulative distribution function
chi2inv
Inverse of chi-square cumulative distribution function
finv
Inverse of F cumulative distribution function
gaminv
Inverse of gamma cumulative distribution function
gpinv
Inverse of generalized Pareto cumulative distribution function
icdf
Inverse cumulative distribution function for specified distribution
logninv
Inverse of lognormal cumulative distribution function
norminv
Inverse of normal cumulative distribution function
raylinv
Inverse of Rayleigh cumulative distribution function
tinv
Inverse of Student's t cumulative distribution function
unifinv
Inverse of continuous uniform cumulative distribution function
wblinv
Inverse of Weibull cumulative distribution function
>> x=-4:.1:4;
>> plot(x,normpdf(x))
>> plot(x,normcdf(x))
1
0.8
0.4
0.6
0.3
0.4
0.2
0.2
0.1
0
-4
-2
0
2
4
0
-4
-2
0
2
4
72
QBASIC ’de
WINDOW (-4,0.5)-(-0.05,4)
LINE (-4,0)-(4,0)
LINE (0,-0.05)-(0,0.5)
FOR z=-4 TO 4 STEP 0.001
PLOT(z , EXP(-z^2/2)/SQR(2*3,14)))
NEXT z
Matlab ‘da
>> x=-4:.001:4;
>> plot(x,normpdf(x,0,1),'.')
QBASIC ’de
T=0
FOR z= 0 TO 1 STEP 0.001
T = T + 0.001* EXP(-z^2/2)/SQR(2*3,14))
NEXT z
PRINT z,T
Matlab ‘da
>> normcdf(1,0,1)- normcdf(0,0,1)
programlarını işletiniz.
73
Tablodaki dağılımların olasılık yoğunluk ve dağılım fonksiyonlarının grafiklerini
parametrelerin farklı değerlerinde çizdiriniz ve alacağı şekilleri gözden geçiriniz. Bu
dağılımlardan sayı üretip histogram çizdiriniz ve olasılık yoğunluk fonksiyonunun grafiği ile
karşılaştırınız.
74
75
Laboratuar Çalışması 8
Üstel ve Gamma Dağılımı
Güvenilirlik Analizi
Üstel Dağılım
Bir X rasgele değişkeninin olasılık yoğunluk fonksiyonu,
 1 −θx
, x>0
 e
f ( x ) = θ
 0
, dy

olduğunda X rasgele değişkenine üstel dağılıma sahiptir denir. Üstel dağılımın parametresi
θ (θ ∈ Θ = ( 0, ∞ ) ) dır.
Üstel dağılıma sahip bir X rasgele değişkeni için,

0
, x<0  0
x
F ( x ) =  1 −θx
= 
−x
 θ e dx , x ≥ 0 1 − e θ
0
∫
, x<0
, x≥0
F(x)
f(x)
1
1/ θ•
M X (t ) = E (e
E(X ) =
x
x
∞
tX
) = ∫e
dM X ( t )
tx
0
t =0
dt
2
d M X (t )
E(X2) =
dt 2
1
θ
−
x
e dx = (1 − θ t )−1
= ( −1)( −θ )(1 − θ t )
t =0
, t<
θ
= ( −2 ) θ (1 − θ t )
−2
−3
t =0
θ
=θ
( −θ ) t =0 = 2θ 2
Var ( X ) = E ( X 2 ) − ( E ( X )) 2 = 2θ 2 − θ 2 = θ 2
dır.
1
76
U ∼ U (0,1) ve θ ∈ ( 0, ∞ ) için X = −θ ln U dönüşümü ile verilen X rasgele değişkeni θ
parametreli üstel dağılıma sahiptir. X = −θ ln U
dağılımdan sayı üretmek için kullanabiliriz.
dönüşümünü simülasyonlarda üstel
>>-5*log(rand(20,5))
ans=
0.25578
7.3237
2.4975
3.6079
0.57537
1.3584
3.9212
19.949
0.98366
4.0518
8.2142
1.912
5.9741
3.0655
9.4567
1.7984
4.8594
0.75406
0.79111
2.6081
2.4272
1.1663
0.40708
1.5176
8.6787
4.5106
0.33353
0.43378
4.4547
0.56221
3.5004
0.52808
0.98233
2.1932
1.0046
2.0758
5.3652
6.194
5.3766
3.136
14.246
5.2083
1.0341
23.096
9.8704
7.9784
8.0793
2.5226
6.5063
8.077
1.5934
5.8674
0.8807
2.8276
4.9657
1.7638
3.0205
4.0498
1.8223
2.3796
20.908
1.4599
4.0473
0.35313
3.818
4.3536
0.83488
3.2204
7.9814
1.9864
1.1482
0.2206
3.2448
0.63837
8.7735
0.10229
6.5199
6.8851
0.66343
1.5237
0.88297
19.651
1.9189
4.8448
0.92082
3.4377
1.7162
4.2328
5.9435
8.3129
9.9564
22.217
0.56081
8.0687
6.0412
2.0667
6.2867
3.7834
13.684
0.058693
Bu sayılar için histogram,
50
40
30
20
10
0
0
5
10
15
20
dır. Bu sayılar bir x vektöründe toplandıktan sonra,
>>mean(x) = 4.5786
>>var(x) = 23.84
>> sqrt(ans) = 4.8827
elde edilmektedir. θ = 5 olan üstel dağılıma sahip bir X rasgele değişkeni için
E( X ) = 5
dır.
σ 2 = Var ( X ) = 25
σ =5
25
77
Gamma ve Ki-kare Dağılımları
Hatırlatma:
∞
Γ(α) = ∫ xα−1e− x dx , α ∈ R
0
fonksiyonuna Gamma fonksiyonu denir. Bu fonksiyon için,
∞
∞
∞
Γ(α ) = ∫ x e
dx = x (−e ) + (α −1) ∫ x α−2 e− x dx = (α −1)Γ(α −1)
x =0
u
dv
0
0
α−1
−x
α−1
−x
0
∞
Γ(1) = ∫ e− x dx = 1
0
Γ(α ) = (α −1)! , α ∈ Z +
ve
∞
1
−
1
Γ( ) = ∫ x 2 e− x dx = π
2
0
(matematik derslerinde göreceksiniz)
dır. Örneğin,
∞
∫ xe
−x
dx = ∫ x 2−1e− x dx = Γ(2) = (2 −1)! = 1
0
∞
∫xe
5 −x
0
∞
∫x
0
∞
0
∞
dx = ∫ x 6−1e− x dx = Γ(6) = (6 −1)! = 5! = 120
0
5
2 −x
7
5 5
5 3 3
5 3 1 1
5 3 1
15 π
e dx = Γ( ) = Γ( ) = × Γ( ) = × × Γ( ) = × × × π =
2
2 2
2 2 2
2 2 2 2
2 2 2
8
dır.
Matlab’da gamma fonksiyonu:
>> gamma(2)
ans = 1
>> gamma(6)
ans = 120
>> gamma(7/2)
ans = 3.3234
>> gamma(1/2)
ans = 1.7725
>> sqrt(pi)
ans = 1.7725
>> gamma(2.2)
ans = 1.1018
>> gamma(-2.2)
ans = -2.205
>> alfa=-5:0.1:5;
>> plot(alfa,gamma(alfa)
25
20
15
10
5
0
-5
-10
-15
-5
-4
-3
-2
-1
0
1
2
3
4
5
78
Tanım: Bir X rasgele değişkenin olasılık yoğunluk fonksiyonu,
 xα−1e− x / β

, x>0
1
f ( x) =  β α Γ(α)
, α, θ = β ∈ (0, ∞)

β
0
, d.y

biçiminde olduğunda, X ‘e Gamma Dağılımına sahiptir denir ve X ∼ Γ(α, β ) biçiminde
gösterilir.
Γ(α = 1, β ) dağılımının olasılık yoğunluk fonksiyonu,
 e− x / β

, x>0
f ( x) =  β

, d.y
 0
olmak üzere, bu β parametreli üstel dağılımın olasılık yoğunluk fonksiyonudur. Γ(α = 1, β )
dağılımı β parametreli üstel dağılımdır.
>> x=0:0.1:15;
>> plot(x,gampdf(x,1,2))
0.5
0.4
0.3
0.2
0.1
0
0
5
10
15
Gamma dağılımının parametreleri α, β ∈ (0, ∞) olmak üzere, bu parametrelere bağlı
olarak olasılık yoğunluk fonksiyonu değişik biçimler almaktadır.
>> plot(x,gampdf(x,3,.5))
>> hold on
>>
plot(x,gampdf(x,2,.5),'r')
>> hold on
>>
plot(x,gampdf(x,0.5,3),'g')
>> hold on
>> plot(x,gampdf(x,5,.5))
>> hold on
>>
plot(x,gampdf(x,2,2),'r')
>> hold on
>>
plot(x,gampdf(x,0.5,10),'g'
)
>>
plot(x,gampdf(x,10,0.5),'k'
)
1
0.9
0.8
0.7
0.6
0.5
0.4
0.3
0.2
0.1
0
0
5
10
15
79
>> plot(x,gampdf(x,5,1))
>> figure
>> plot(x,gamcdf(x,5,1))
0.2
0.15
0.1
0.05
0
0
5
10
15
5
10
15
1
0.8
0.6
0.4
0.2
0
0
Gamma dağılımına sahip bir X ∼ Γ(α, β ) rasgele değişkeni için,
x
1

α −1 − β
x
e

α
f ( x ) =  Γ (α ) β

0

M X (t ) = E (e
∞
tX
, x>0
,
) = ∫ e Γ (α ) β
tx
dy
1
α
x
−
x
e dx = (1 − β t )
α −1
β
−α
t<
,
0
E(X ) =
dM X ( t )
E(X2) =
dt
t =0
d 2 M X (t )
dt 2
= −α (1 − β t )
t =0
− (α −1)
−α − 2
( −β )
2
t =0
= (α 2 − α ) β 2
Var ( X ) = E ( X 2 ) − ( E ( X ) ) = (α 2 − α ) β 2 − (αβ ) = αβ 2
dır.
β
( − β ) t =0 = αβ
= −α ( −α + 1)(1 − β t )
2
1
2
80
Güvenilirlik Analizi
Belli bir işlevi olan bir sistemin veya bir bileşenin ömrü sonludur. Ömür, örneğin
elektronik parçalarda dayanma süresi, canlılarda yaşama süresi olmak üzere, zaman olarak
ölçüldüğünde sürekli bir rasgele değişken olarak ele alınabilir.
Dayanma (yaşam) süresi, başka bir ifade ile bozuluncaya (ölünceye) kadar geçen
zaman T ile gösterilsin.
R(t ) = P(T > t )
, t≥0
fonksiyonuna güvenilirlik fonksiyonu (reliability function) denir. Bir sistemin belli bir t
anındaki güvenilirliği ( R(t ) ) bu sistemin t anında görev yapabilir olmasının olasılığıdır,
başka bir ifade ile t anına kadar bozulmamış olmasının olasılığıdır veya bozulmanın t
anından sonra olması olasılığıdır.
P(t < T ≤ t +△t / T > t )
, t≥0
△ t →0
△t
fonksiyonuna bozulma oranı (ölüm oranı, risk, hazard) fonksiyonu denir.
h(t)= lim
h(t)△ t ≈ P(t < T ≤ t +△t / T > t )
olmak üzere, h(t)△t değeri, sistemin t anına kadar bozulmadığı bilindiğinde (t , t +△t ] zaman
aralığında bozulması olasılığı olarak düşünülürse,
h(t) ≈
P(t < T ≤ t +△t / T > t )
△t
olup, birim zamanda bozulma oranıdır.
f , F , R , h fonksiyonlarından birinin bilinmesi durumunda diğerleri elde edilebilir.
t
∫0
F ( t ) = f ( t ) dt
h ( t ) =−
R '( t )
R (t )
R ( t ) =1− F ( t )
→ F ←

→ R ←
→ h
f ←

t
F (t )
F ( t ) =1− R ( t )
f (t )=
R (t ) =e
dt
Dayanma süresi T üstel dağılıma sahip olduğunda,
 1 −θt
 e
f (t ) = θ
 0

, t >0
, d.y.
 0
F (t ) =  − t
1-e θ
R(t ) = e
h(t ) =
dır.
1
θ
−
, t<0
, t≥0
t
θ
, t≥0
, t≥0
− ∫ h ( t ) dt
0
81
Güvenilirlik analizinde çok kullanılan dağılımlardan birisi de Weibull dağılımıdır. Bu
dağılım için,
αβ t α −1e − β t
f (t ) = 
 0
α
α
h(t ) = αβ t
α −1
, d.y.
, t<0
 0
F (t ) = 
− β tα
1 − e
R(t ) = e− β t
, t>0
, t≥0
, t≥0
, t≥0
dır. Dağılımın parametrelerine ( α , β > 0 ) bağlı olarak Weibull dağılımı W (α , β ) ile
gösterilir. W (1, β ) dağılımı 1/ β parametreli üstel dağılımdır. W (2, β ) dağılımına Rayleigh
dağılımı denir.
W (α = 2, β = 2) dağılımı için olasılık yoğunluk, dağılım, güvenilirlik ve bozulma
oranı fonksiyonlarının grafikleri aşağıdaki gibidir.
2
1
0
0
0.5
1
1.5
2
2.5
3
0
0.5
1
1.5
2
2.5
3
0
0.5
1
1.5
2
2.5
3
0
0.5
1
1.5
2
2.5
3
1
0.5
0
1
0.5
0
20
10
0
T ∼ W (α , β ) olmak üzere,
1
1
E (T ) = ( ) Γ(
α
β
α
+ 1)
2
2
E (T ) = ( ) Γ( + 1)
2
1
1
β
α
α
2
1
 2

Var (T ) = ( )  Γ( + 1) − (Γ( + 1)) 2 
β  α
α

1
dır.
α
82
Sistem Güvenilirliği
Bir sistemde, dayanma sürelerinin olasılık dağılımları bilinen bazı bileşenler (parçalar)
görev yapsın. Bileşenlerin dayanma süreleri bağımsız olsun. Bileşenlerden bazıları bozulduğu
zaman diğerlerinin dayanma süreleri üzerinde bir etkisi olmasın. Aşağıdaki sistemi göz önüne
alalım.
a1
a2
a3
a4
S1
Sistem paralel görev yapan iki alt sistemden oluşmaktadır. Alt sistemlerin her biri seri
görev yapan iki parçadan oluşmaktadır. Ai olayı i numaralı ( i = 1,2,3,4 ) parçanın t zaman
biriminden (yıldan) fazla dayanması olayı olsun. Sistemin en az t yıl (t yıldan fazla)
dayanması olayının olasılığı,
P ( A1 ∩ A2 ) ∪ ( A3 ∩ A4 ) =P ( A1 ∩ A2 ) + P ( A3 ∩ A4 ) − P ( A1 ∩ A2 ∩ A3 ∩ A4 )
= P( A1 )P( A2 ) + P( A3 )P( A4 ) − P( A1 )P( A2 )P( A3 )P( A4 )
dır. Parçalar için dayanma süresi Ti (i = 1,2,3,4) rasgele değişkeni ve güvenilirlik fonksiyonu
Ri (t ) = P(Ti > t ) ile gösterilirse, sistemin güvenilirlik fonksiyonu,
RS 1 (t ) = R1 (t )R2 (t ) + R3 (t ) R4 (t ) − R1 (t )R2 (t ) R3 (t ) R4 (t )
olur. Parçaların aynı türden olduğu göz önüne alınırsa,
RS1 (t ) = R12 (t )(2 − R12 (t ) )
,
t>0
yazılır. Örneğin parçalar için dayanma süresi θ = 10 yıl ortalama ile üstel dağılıma sahip
olduğunda,
∞
t
t
−
1 −10
e dt =e 10
10
t
R1 (t ) = P(T1 > t ) = ∫
ve
R S1 (t ) = e
−
2t
10
(2 − e
−
2t
10
)
olmak üzere S1 sisteminin en az 10 yıl görev yapması olasılığı,
(
)
R S1 (10) = e −2 2 − e −2 = 0.2551
dır.
Sistemin dayanma süresi TS1 ile gösterilsin. TS1 ‘in dağılım fonksiyonu,
FS1 (t ) = 1− RS1
dır.
2t
2t
−
−
10
10
(t ) = 1− e (2 − e )
, t>0
83
Sistemin ortalama dayanma süresi,
∞
0
0
−∞
∞
E (TS1 ) = ∫ (1− FS1 ( x))dx − ∫ FS 1 ( x)dx = ∫ RS1 (t )dt
0
olmak üzere, parçaların dayanma süreleri θ = 10 olan üstel dağılıma sahip olduğunda,
∞
E (TS1 ) = ∫ e−2t /10 (2 − e−2t /10 )dt = 7.5
0
elde edilir. (Burada sürekli bir X rasgele değişkeninin beklenen değeri için söz konusu olan
∞
∞
0
−∞
0
−∞
E(X ) =
∫ xf ( x)dx =∫ (1 − F ( x))dx − ∫ F ( x)dx
formülü kullanılmıştır).
Şimdi bu sistemlerin en az t yıl dayanması olasılığını yani güvenilirlik fonksiyonunun
t deki değerini simülasyon yaparak elde etmeye çalışalım. Parçaların dayanma süreleri
T1 , T2 , T3 , T4 olmak üzere, bunların dağılımlarından sayı üreterek T1 , T2 , T3 , T4 rasgele
değişkenlerin aldığı değerleri gözleyebiliriz. Sistemin dayanma süresi,
TS 1 = max{min{T1 , T2 }, min{T3 , T4 }}
olup, ilgili Matlab programı,
n=10000
for i=1:n
T1=-10*log(rand(1));
T2=-10*log(rand(1));
T3=-10*log(rand(1));
T4=-10*log(rand(1));
TS1(i)=max(min(T1,T2),min(T3,T4));
end
RS1=sum(TS1>10)/n
ETS1=mean(TS1)
hist(TS1)
dır. Bu programı işletiniz ve sonuçları yorumlayınız.
84
Bileşenlerin dayanma sürelerinin olasılık dağılımlarına bağlı olarak sistemin dayanma
süresinin olasılık dağılımı teorik (analitik) olarak elde edildiğinde simülasyona gerek
kalmayabilir. Bazı durumlarda sistemlerin karmaşık yapıda olması veya bileşenlerin dayanma
sürelerinin dağılımları ile ilgili fonksiyonların karmaşık olması nedeniyle sistemin dayanma
süresi ile ilgili bilgilerin teorik olarak elde edilmesi mümkün olmamaktadır. Bu nedenle
simülasyon sistem güvenilirliğinde çok yaygın olarak kullanılmaktadır. Simülasyon ile
gözlenen dayanma süreleri için çizilen histogram dayanma süresinin dağılımının biçimi
hakkında bilgi vermektedir.
85
Aşağıdaki sistemi göz önüne alalım.
a1
a2
a5
a3
a4
S2
Bu sisteminin eşdeğeri olan sistem,
a1
a1
a2
a5
a3
a3
a4
a4
a5
a2
olmak üzere güvenilirlik fonksiyonu,
RS 2 (t ) = R1 (t )R2 (t ) + R1 (t )R5 (t ) R4 (t ) + R3 (t ) R4 (t ) + R3 (t )R5 (t ) R2 (t )
− R1 (t )R2 (t ) R5 (t )R4 (t ) − R1 (t ) R2 (t ) R3 (t ) R4 (t ) R1 (t ) R2 (t ) R3 (t ) R5 (t ) −
− R1 (t )R5 (t ) R4 (t )R3 (t ) − R1 (t ) R5 (t ) R4 (t ) R3 (t )R2 (t ) − R3 (t ) R4 (t ) R5 (t ) R2 (t )
+4 R1 (t ) R2 (t ) R5 (t ) R4 (t ) R3 (t )
− R1 (t ) R2 (t ) R3 (t ) R4 (t ) R5 (t )
= 2 R12 (t ) + 2 R13 (t ) − 5R14 (t ) + 2 R15 (t )
dır.
Parçalar θ = 10 parametreli üstel dağılıma sahip olsun. Sistemin en az 10 yıl
dayanması olasılığı,
RS 2 (10) = 2e−2 + 2e −3 − 5e −4 + 2e−5 = 0.2921
olur.
86
Sistemin dayanma süresinin olasılık yoğunluk fonksiyonu,
dR (t )
f (t ) = − S 2
, t>2
dt
olmak üzere, bu fonksiyonun biçimini simülasyon ile gözlenen dayanma süreleri için çizilen
histogram yardımıyla görmeye çalışınız.
Sistemin ortalama dayanma süresini simülasyon yaparak elde etmeye çalışınız.
87
a 2 , a4 parçalarının yerine bozulma oranı,
h(t ) = 10 −2 t , t > 0
fonksiyonu ile verilen b2 , b4 parçaları konmuş olsun. Böyle parçalar için,
t
−∫ h (t ) dt
R (t ) = e
0
t
−∫ 10−2 tdt
=e
0
−
F (t ) = 1− R(t ) = 1− e
1 2
t
200
F −1 (u ) = −200 ln(1− u )
1
f (t ) =
1 − 200 t
te
100
∞
E (T ) = ∫ t
0
−
=e
1 2
t
200
, t>0
, t>0
, 0 < u <1
2
, t>0
1
1 − 200 t 2
te
= 50π
100
dır.
S1, S2 sistemlerinde a 2 , a4 parçalarının yerine b2 , b4 parçalarının bulunduğu durum
için simülasyon yapmak için yukarıdaki bilgisayar programlarında T2 ile T4 değişkenleri için
T2=sqrt(-200*log(rand))
T4=sqrt(-200*log(rand))
yazılması yeterli olacaktır. Đlgili Matlab programı,
clc;clear all;close all
n=10000
for i=1:n
T1=-10*log(rand(1));
T3=-10*log(rand(1));
T5=-10*log(rand(1));
T2=sqrt(-200*log(rand(1)));
T4=sqrt(-200*log(rand(1)));
TS1(i)=max(min(T1,T2),min(T3,T4));
TS2(i)=max([min(T1,T2),min([T1 T5 T4]),min(T3,T4),min([T3 T5 T2])]);
end
RS1=sum(TS1>10)/n
RS2=sum(TS2>10)/n
ORTS1=sum(TS1)/n
ORTS2=sum(TS2)/n
subplot(2,1,1);hist(TS1)
subplot(2,1,3);hist(TS2)
dır.
88
Yukarıdaki programı işletiniz ve sonuçları yorumlayınız.
89
Belli bir tür elektronik parça için dayanma süresi 1 yıl ortalama ile üstel dağılıma
sahip olsun. Dayanma süreleri birbirinden bağımsız ve böyle parçalardan oluşan aşağıdaki
devre elemanlarının ortalama dayanma süreleri nedir? Bu devre elemanlarının az 1 yıl
dayanmaları olasılıkları nedir?
birbirinin yedeği olarak görev
yapan üç parça
Çözüm:
90
Simülasyon:
91
Laboratuar Çalışması 9
Normal Dağılım ve Uygulamaları
Bir X rasgele değişkeninin olasılık yoğunluk fonksiyonu,
1
e
2πσ
f ( x) =
 x−
− 1 
2 σ
µ 


2
, − ∞ < x < +∞
biçiminde olduğunda, X rasgele değişkenine normal dağılıma sahiptir denir ve
X ∼ N ( µ , σ 2 ) biçiminde gösterilir. µ ∈ R ve σ 2 ∈ (0, ∞) dağılımın parametreleridir. µ = 0
ve σ 2 = 1 olan dağılıma standart normal dağılım denir. Standart normal dağılıma sahip
rasgele değişken genellikle Z harfi ile gösterilir. Standart normal dağılıma sahip Z ∼ N (0,1)
rasgele değişkeninin olasılık yoğunluk fonksiyonu,
2
1 − z2
f ( z) =
e
2π
dağılım fonksiyonu,
,
−∞ < z < ∞
F : R → [0,1]
z
z → F ( z) = ∫
−∞
2
1 − z2
e dz
2π
ve grafikleri,
>> x=-4:.1:4;
>> plot(x,normpdf(x,0,1))
0.4
0.35
0.3
0.25
0.2
0.15
0.1
0.05
0
-4
-3
-2
-1
0
-1
0
1
2
3
4
>> plot(x,normcdf(x,0,1))
1
0.8
0.6
0.4
0.2
0
-4
-3
-2
1
2
3
4
dır. Olasılık yoğunluk fonksiyonunun grafiği çan kesitine benzemekte olup, çan eğrisi olarak
isimlendirilmektedir.
z
I ( z) = ∫
0
2
1 − z2
e dz
2π
92
integralinin yaklaşık değerini, Riemann toplamı olarak
Basic programı yardımıyla z = 0 : 0.5 : 4 için hesaplayınız.
hesaplayan
aşağıdaki
INPUT DELX , Z
T=0
FOR X = 0 TO Z STEP DELX
T = T + 1 / EXP (-0.5 *(DELX / 2 + X)^2 )
NEXT X
I = 1 / SQR ( 2*3.14159 )* T* DELX
PRINT I
END
Aynı değerleri Matlab’ da elde edin.
>> z=0:.5:4;
>> normcdf(z)-0.5
Normal dağılıma sahip bir X ∼ N ( µ , σ 2 ) rasgele değişkenin olasılık yoğunluk
fonksiyonu,
f ( x) =
1
e
2πσ
 x−
− 1 
2 σ
µ 


2
, − ∞ < x < +∞
93
olmak üzere, grafiğinin biçimi çan eğrisi gibi olmakla birlikte, şekli
µ ∈ R ve
σ ∈ (0, ∞) parametrelerine göre değişmektedir. Örneğin, µ =2 ve σ = 16 için olasılık
2
2
yoğunluk fonksiyonunun grafiği,
>> x=-15:.1:15;
>> plot(x,normpdf(x,2,4))
0.1
0.08
0.06
0.04
0.02
0
-15
-10
-5
0
5
10
15
dır. Grafikten de görüldüğü gibi olasılık yoğunluk fonksiyonu x= µ =2 için maximum değerini
almaktadır ve x= µ =2 ye göre simetriktir. Dağılım fonksiyonunun grafiği de,
>> x=-15:.1:15;
>> plot(x,normcdf(x,2,4))
1
0.8
0.6
0.4
0.2
0
-15
-10
-5
0
5
10
15
dır.
µ = −5, −2.5, 0,3, 6.6 ve σ 2 = 9 olan normal dağılımların olasılık yoğunluk ve
dağılım fonksiyonlarının grafikleri,
0.14
0.12
0.1
0.08
0.06
0.04
0.02
0
-15
-10
-5
0
5
10
15
94
1
0.8
0.6
0.4
0.2
0
-15
-10
-5
0
5
10
15
olmak üzere, görüldüğü gibi µ parametresi dağılımın konumunu belirlemektedir.
µ = 0 ve σ 2 = 0.25, 0.81,1, 9, 20
fonksiyonlarının grafikleri,
olan normal dağılımların olasılık yoğunluk
0.8
0.7
0.6
0.5
0.4
0.3
0.2
0.1
0
-15
-10
-5
0
5
10
15
olmak üzere, görüldüğü gibi σ 2 parametresine bağlı olarak dağılımın yayılımı değişmektedir.
Grafiği kırmızı çizgi olan olasılık yoğunluk fonksiyonu N (0,1) standart normal
dağılımınkidir. σ 2 değeri arttıkça, olasılık yoğunluk fonksiyonu basıklaşmaktadır, küçüldükçe
sivrileşmektedir.
Normal dağılımına sahip bir X ∼ N ( µ , σ 2 ) rasgele değişkeninin olasılık yoğunluk
fonksiyonu,
f ( x) =
1
e
2πσ
 x−
− 1 
2 σ
µ 
2


, − ∞ < x < +∞
ve parametreleri µ ∈ R , σ 2 ∈ (0, ∞) olmak üzere,
∞
E( X ) = ∫ x
−∞
2
1 x−µ 
− 


1
e
2πσ
2 σ

dx = µ
Var ( X ) = σ 2
MX
dır.
2 2
µ t +σ t
2
(t ) = e
,
−∞ < t < ∞
95
Örnek: Yapılan araştırmalar sonucunda, Ankara doğumlu 18 aylık çocukların ağırlıklarının
N ( µ = 13.5 (kg ), σ 2 = 2.25 ) dağılımına sahip olduğu tespit edilmiştir.
a) Rasgele seçilen bir çocuğun ağırlığının 18 kg´dan fazla olması olasılığı nedir?
b) Rasgele seçilen bir çocuğun ağırlığının 12 kg´dan az olması olasılığı nedir?
c) Ağırlıkları 12 kg ile 15 kg arasında olan çocukların oranı nedir?
d) Rasgele seçilen 10 çocuktan en az 8 tanesinin [10,17] aralığında olması olasılığı nedir?
10 çocuktan kaç tanesinin [10,17] aralığına düşmesi beklenir?
e) Çoçuklardan %25 ‘nin ağırlığı hangi değerin altındadır?
f) Çoçuklardan %75 ‘nin ağırlığı hangi değerin altındadır?
g) En hafif %5 ‘lik çocuklar için ağırlıklar hangi değerin altındadır.
h) En ağır %5 ‘lik çocuklar için ağırlıklar hangi değerin üzerindedir?
ı) Rasgele seçilen 1000 tane çocuktan aşağıdaki aralıklara düşenlerin beklenen sayıları
nedir?
(9 kg’dan az) , (9,10] , (10,11] , (11,12] , (12,13] , (13,14] , (14,15] , (15,16] , (16,17] , (17,18] , (18 kg’dan çok)
a) X : rasgele seçilen bir çocuğun ağırlığı olsun. X ~ N ( µ = 13.5, σ 2 = 2.25) dağılımlıdır.
18 − 13.5 

P ( X > 18) = P  Z >
 = P ( Z > 3) = 1 − P ( Z ≤ 3) = 1 − normcdf (3) = 1 − 0.9987 = 0.0013
1.5 

12 − 13.5 

b) P ( X < 12) = P  Z <
 = P ( Z < −1) = normcdf (−1) = 0.1587
1.5 

c) P (12 < X < 15) = normcdf(15,13.5,1.5)-normcdf(12,13.5,1.5)= 0.6826 ≈ %68
d) Rasgele seçilen bir çocuğun 10 kg ile 17 kg arasında olması olasılığı,
p= P (10 < X < 17) = normcdf(17,13.5,1.5)-normcdf(10,13.5,1.5)= 0.98037 ≈ %98
dır. Y rasgele değişkeni rasgele seçilen 10 çocuk arasında ağırlıkları [10,17] aralığında
olanların sayısı olsun. Y ∼ b( n = 10, p = 0.98037) dağılımına sahiptir. Buna göre,
10 
10
P (Y ≥ 8) = ∑  p x q10−x = sum(binopdf([8 9 10],10,0.98037)) = 0.99918
 
x =8  x 
dır. E (Y ) = np = 10× 0.98037=9.8037 olmak üzere, rasgele seçilen 10 çocuktan [10,17]
aralığına düşenlerin sayısının beklenen değeri 9.8037 dir.
e) P ( X < x0.25 ) = 0.25 olmak üzere,
x0.25 = FX−1 (0.25) = norminv(0.25,13.5,1.5) = 12.488
dır.
f) x0.75 = FX−1 (0.75) = norminv(0.75,13.5,1.5) = 14.512
g) x0.05 = FX−1 (0.05) = norminv(0.05,13.5,1.5) = 11.033
96
h) x0.95 = FX−1 (0.95) = norminv(0.95,13.5,1.5) = 15.967
ı)
P ( X < 9) = normcdf(9,13.5,1.5)=0.0013
P (9 < X < 10) = normcdf(10,13.5,1.5)-normcdf(9,13.5,1.5) = 0.0085
P (10 < X < 11) = normcdf(11,13.5,1.5)-normcdf(10,13.5,1.5) =0.0380
P (11 < X < 12) = normcdf(12,13.5,1.5)-normcdf(11,13.5,1.5) =0.1109
P (12 < X < 13) = normcdf(13,13.5,1.5)-normcdf(12,13.5,1.5) =0.2108
P (13 < X < 14) = normcdf(14,13.5,1.5)-normcdf(13,13.5,1.5) =0.2611
P (14 < X < 15) = normcdf(15,13.5,1.5)-normcdf(14,13.5,1.5) =0.2108
P (15 < X < 16) = normcdf(16,13.5,1.5)-normcdf(15,13.5,1.5) =0.1109
P (16 < X < 17) = normcdf(17,13.5,1.5)-normcdf(16,13.5,1.5) =0.0380
P (17 < X < 18) = normcdf(18,13.5,1.5)-normcdf(17,13.5,1.5) =0.0085
P ( X > 18) = 1 − P ( X ≤ 18) = 1-nomcdf(18,13.5,1.5)=1-0.9987=0.0013
0.35
0.3
0.25
0.2
0.15
0.1
0.05
0
5
10
15
20
olmak üzere, 1000 çocuktan bu arlıklara düşenlerin beklenen sayıları,
1000 P ( X < 9) = 1.3
1000 P (9 < X < 10) = 8.5
1000 P (10 < X < 11) = 38
1000 P (11 < X < 12) = 110.9
1000 P (12 < X < 13) = 210.8
1000 P (13 < X < 14) = 261.1
1000 P (14 < X < 15) = 210.8
1000 P (15 < X < 16) = 110.9
1000 P (16 < X < 17) = 38
1000 P (17 < X < 18) = 8.5
1000 P ( X > 18) = 1.3
dır.
Ankara’da yaşayan 18 aylık çocukların ağırlıklarının dağılımını ortaya çıkarmak için
yapılan araştırmada:
• 18 aylık çocukların kitlesi nasıl belirlendi?
• Bu kitleden bir örnek (örneğin 200 tane çocuk) nasıl seçildi?
• Verileri toplama zaman olarak ne kadar sürdü?
• Toplanan 200 tane sayı nasıl analiz edildi?
• Ağırlığın normal dağılıma sahip olduğu kararı nasıl verildi?
• Bir yıl sürmüş olması gereken böyle bir çalışmada elde edilen bulgular sonraki
yıllarda 18 aylık çocuklar için geçerliliğini koruyacak mıdır?
• Erkek ve kız çocukları için farklı dağılımlar söz konusu olabilir mi?
gibi sorular ve başka birçok sorun ortaya çıkacaktır. Bunların çözüm yollarını ileride
öğreneceksiniz.
97
ĐST251 dersini alan öğrencilerin boy uzunluklarının ve ağırlıklarının histogramlarını çiziniz.
Ağırlığı anlatan (modelleyen) bir dağılım ve boy uzunluğunu anlatan bir dağılım önerebilir
misiniz?
98
99
N (0,1) standart normal dağılımın olasılık yoğunluk fonksiyonu ve dağılım fonksiyonu
grafikleri aşağıdaki gibidir.
0.4
0.3
0.2
0.1
0
-4
-3
-2
-1
0
1
2
3
4
-3
-2
-1
0
1
2
3
4
1
0.8
0.6
0.4
0.2
0
-4
Dağılım fonksiyonunun grafiğinin bulunduğu koordinat sisteminin y-ekseninin [0,1]
aralığında U (0,1) düzgün dağılımdan 100 tane sayı üretip, bunları dağılım fonksiyonun tersi
ile x-eksenine dönüştürürsek N (0,1) dağılımından sayı üretmiş oluruz.
>> hist(norminv(rand(100,1)),6)
25
20
15
10
5
0
-3
-2
-1
0
1
2
3
100
Matlab’da randn(100,1) fonksiyonu ile doğrudan N (0,1) dağılımından 100 tane sayı
üretip histogram çizdiriniz.
101
N (µ = 60, σ 2 = 100) dağılımının olasılık yoğunluk ve dağılım fonksiyonlarının
grafiklerini çizdiriniz. Bu dağılımından 100 tane sayı üretip histogram çizdiriniz.
102
Laboratuar Çalışması 10
Çok Boyutlu Dağılımlar
Marjinal ve Koşullu Dağılımlar
Kesikli Dağılımlar
2 1
3
3
1
1
3
2
2
2 1 2 3 3
2
1
3 2 1
3
Yukarıdaki kavanozdan bir top çekilmesi ve renk ile birlikte üzerindeki sayının
gözlenmesi deneyini modelleyen bir olasılık uzayı oluşturunuz.
103
X 1 rasgele değişkeni çekilen topun üzerindeki sayıyı, X 2 rasgele değişkeni ise sarı top için 0,
yeşil top için 1, pembe top için 2, gri top için 3 değerini alsın. ( X1, X 2 ) rasgele vektörünün
olasılık tablosunu yazınız.
X 1 ve X 2 rasgele değişkenlerin marjinal dağılımlarını bulunuz.
X1
x2 = 3
ve
X2
x1 = 3
‘nin koşullu dağılımını bulunuz.
104
Đadeli olarak 50 çekiliş yapıp aşağıdaki tablonun gözelerine ilgili frekansları yazınız.
Gözlemler:
x1
x2
0
1
2
3
1
2
3
Satır
tolamı
Toplam
Beklenen frekanslar nedir?
Beklenen frekansları hesaplayıp aşağıdaki tablonun içine yazınız.
0
1
2
3
x1
x2
1
2
3
Satır
tolamı
f ijg : i.satır − j.sütundaki gözlenelen frekans
f ijb : i.satır − j.sütundaki beklenen frekans
olmak üzere,
3
∑∑
i =1 j =1
dır.
(f
g
ij
Sütun
toplamı
Toplam
Gözlenen frekanslar ile beklenen frekansları bir tek tabloya yazınız.
0
1
2
x1
x2
1
2
3
2
Sütun
toplamı
− f ijb )
fijb
2
=
3
105
Korelasyon Katsayısı
2 4
3
3
1
1
3
2
2
4
2 3 3
2
2
1
3 4 1
1
Bir top çekilmesi ve renk ile birlikte üzerindeki sayının gözlenmesi deneyinde:
a) X 1 çekilen topun üzerindeki sayı, X 2 ise beyaz top için 0, sarı top için 1, yeşil top için 2,
pembe top için 3, gri top için 4 değerini alsın. X 1 ile X 2 arasındaki Pearson korelasyon
katsayısını hesaplayınız.
106
b) X 2 beyaz top için 0, sarı top için 2, yeşil top için 4, pembe top için 6 ve gri top için 8
değerini aldığında X 1 ile X 2 arasındaki korelasyon katsayısı ne olur?
c) X 1 ile X 2 bağımsız mıdır? X 1 ile X 2 aynı marjinal dağılımlara sahip olma koşuluyla
bağımsız olsalardı, ortak olasılık tablosundaki olasılıklar ne olurdu. Bu olasılıkları
hesaplayınız ve önceki şıklardaki olasılıklar ile karşılaştırınız. Dikkat edilirse bağımsızlık
incelemesinde sadece marjinal olasılıklar ile ortak olasılıklar göz önüne alınmaktadır. Şimdi,
olasılık tablosunun kenarındaki (marjindeki) X 2 nin aldığı 0,1,2,4 değerlerini siliniz ve
yerlerine renk isimlerini yazınız. “ X 1 ile X 2 bağımsız mıdır?” sorusu “Topların üzerindeki
sayılar ile topların renkleri bağımsız mıdır?” sorusuna dönüşmüş oldu.
107
Aşağıdaki kavanozların hangisinde topların üzerindeki sayılar ile topların renkleri arasındaki
“bağımsızlıktan uzaklaşma” daha küçüktür?”
2 4
3
3
1
1
3
2
2
4
3
2
2
3
2
1
3 4 1
1
2 4
3
3
1
4
1
2
2
2
3
2
2
4
2
1
3 4 1
1
108
Sürekli Dağılımlar
X 1 ve X 2 rasgele değişkenlerinin ortak olasılık yoğunluk fonksiyonu,
1
, 0 ≤ x1 ≤ π / 2 , 0 ≤ x2 ≤ 10

f X1 , X 2 ( x1 , x2 ) =  5π
0
, d . y.
olsun. Dağılımın destek kümesi,
DX1 X 2 = {( x1 , x2 ) : 0 ≤ x1 ≤ π / 2 , 0 ≤ x2 ≤ 10} ⊂ R 2
dır.
A = {( x1 , x2 ) : 0 < x1 < π / 2 , 0 < x2 < 7sin x1} ⊂ DX1 X 2
olayının olasılığı,
π /2 7sin x1
π /2
1
1
7
14
π /2
P (( X 1 , X 2 ) ∈ A) = ∫ ∫
dx2 dx1 =
7 sin x1dx1 =
(− cos x2 ) 0 =
∫
5π
5π 0
5π
10π
0
0
dır. Böyle bir olay gerçek dünyada söz konusu olabilir mi?
Aralarındaki uzaklık 20 cm olan paralel doğruların bulunduğu bir düzleme, uzunluğu
14 cm olan bir iğne’nin rasgele atılması deneyinde (Buffon’un Đğne Deneyi),
X 1 : iğnenin doğrultusu ile paralel doğrular arasındaki dar açının
büyüklüğü (radyan cinsinden),
X 2 : iğnenin orta noktasının en yakın olan doğruya
uzaklığı (cm cinsinden)
olsun.
π
X 1 rasgele değişkeni (0, ) aralığında düzgün dağılıma sahip olup, olasılık yoğunluk
2
fonksiyonu,
 1
 π / 2 , 0 ≤ x1 ≤ π / 2

f X1 ( x1 ) = 
0
, d . y.


109
ve X 2 rasgele değişkeni (0,10) aralığında düzgün dağılıma sahip olup, olasılık yoğunluk
fonksiyonu,
1
10 , 0 ≤ x1 ≤ 10

f X 2 ( x2 ) = 
0
, d . y.


dır. X 1 ile X 2 bağımsız iki rasgele değişken olarak düşünülebilir. Buna göre, X 1 ve X 2 ‘nin
ortak olasılık yoğunluk fonksiyonu,
1
, 0 ≤ x1 ≤ π / 2 , 0 ≤ x2 ≤ 10

f X1 , X 2 ( x1 , x2 ) =  5π
0
, d . y.
olur.
A = {( x1 , x2 ) : 0 < x1 < π / 2 , 0 < x2 < 7sin x1} ⊂ DX1 X 2
olayı iğne ile doğruların kesişmesi olayı olup,
14
P ( A) =
= 0.4456
10π
dır.
Paralel doğrular arasındaki uzaklık 2a ve iğnenin uzunluğu 2l (l<a) olmak üzere, iğne
2l
ile doğruların kesişmesi olayının olasılığı p =
dır.
πa
a
olması durumunda
2
destekleniyor mu?
l=
p=
1
π
= 0.3183 dır. Bu sonuç deneyler tarafından
110
Evde: Bir boncuğu 10 cm yükseklikten çizdiğiniz bir ( x1 , x2 ) -koordinat sisteminin başlangıç
noktası üzerine bırakınız ve konumlandığı noktayı işaretleyiniz. Bunu 100 defa tekrarlayınız
(önceki gözlemlerinize 50 gözlem daha ekleyiniz). Đşaretlenen noktalar, gözlenen ( x1 , x2 ) ‘ler
için serpilme (saçılım) grafiği oluşturacaktır.
a) Gözlediğiniz x1 ‘ler için histogram çiziniz.
b) Gözlediğiniz x2 ‘ler için histogram çiziniz.
c) Gözlediğiniz ( x1 , x2 ) ‘ler için histogram çizmeye çalışınız.
111
Aşağıdaki gibi bir olasılık yoğunluk fonksiyonu göz önüne alalım.
f ( x1 , x2 ) =
1
2π θ 2
1 x2 x2
− ( 12 + 22 )
e 2 θ θ
, −∞ < x1 < ∞
−∞ < x2 < ∞ , (θ ∈ (0, ∞))
Bu olasılık yoğunluk fonksiyonu ile ilgili marjinal dağılımlar
f X 1 ( x1 ) =
f X 2 ( x2 ) =
1
2π θ
1
2π θ
−
e
x12
2θ 2
−
e
x22
2θ 2
, −∞ < x1 < ∞
, −∞ < x2 < ∞
dır.
X1 ve X 2 rasgele değişkenleri boncuğun konumlandığı noktanın koordinatları olsun.
X1 ile X 2 ‘nin ortak olasılık yoğunluk fonksiyonu ve marjinal olasılık yoğunluk
fonksiyonları yukarıdaki gibi birer fonksiyon olabilir mi? θ (θ ∈ (0, ∞)) parametresinin
değişik değerleri için yukarıdaki fonksiyonların grafiklerini çiziniz (bilgisayarda çizdiriniz) ve
gözlemlerle ilişkilendirmeye çalışınız.
112
Laboratuar Çalışması 11
Bağımsız Rasgele Değişkenlerin Toplamı ve Ortalaması
X 1 , X 2 ..., X n rasgele değişkenlerin beklenen değerleri E ( X i ) , i = 1, 2,..., n ve
kovaryansları Cov( X i , X j ) , i, j = 1, 2,..., n mevcut olduğunda a1 , a2 ,..., an ∈ R olmak üzere,
n
 n

E ∑ ai X i  = ∑ ai E ( X i )
 i=1
 i=1
ve
n
n
 n

Var ∑ ai X i  = ∑∑ ai a j Cov( X i , X j )
 i=1
 i=1 j=1
n
n
= ∑ ai2Var ( X i ) + 2∑
i =1
n
∑ a a Cov( X , X
i
j
i
j
)
i =1 j =i +1
dır. X 1 , X 2 ..., X n rasgele değişkenleri bağımsız olduğunda kovaryanslar sıfır olacağından,
n
 n

Var ∑ ai X i  = ∑ ai2Var ( X i )


i =1
i =1
1
ve ai = , i = 1, 2,..., n için
n
n
 n


X
∑ Var ( X i )
i
 ∑
 i=1
i =1
Var 
=
n2
 n 



dır. X 1 , X 2 ..., X n rasgele değişkenlerinin ortalaması alışılagelmiş olarak
X n veya X ile
gösterilir. X 1 , X 2 ..., X n rasgele değişkenleri aynı ( µ ) ortalamalı olduklarında,
 n
 ∑ Xi
E ( X n ) = E  i =1
 n




=µ



dır.
X 1 , X 2 ..., X n rasgele değişkenleri aynı ( µ ) ortalamalı, aynı ( σ 2 ) varyanslı ve
bağımsız olduklarında,
 n

 n

X
∑ i 
 ∑ Xi  σ 2
 = µ , Var ( X n ) = Var  i =1
=
E ( X n ) = E  i =1
 n 
 n  n








dır.
113
n
Bağımsız X 1 , X 2 ..., X n rasgele değişkenleri için
∑X
i
ve X n rasgele değişkenlerinin
i =1
dağılımlarını elde etmek bazen çok kolay olmaktadır. Bağımsız rasgele değişkenler için
n
M
n
∑ Xi
(
)
(t ) = ∏ M X i (t ) = M X1 (t )
i =1
i=1
n
n
özelliğinden faydalanarak
∑X
i
‘nin dağılımı ve buradan X n ‘nin dağılımı bulunabilir.
i =1
* X 1 , X 2 ..., X n rasgele değişkenleri bağımsız ve aynı b(1, p ) Bernoulli dağılımına sahip
olduğunda M X i (t ) = q + pet , i = 1, 2,..., n olmak üzere,
n
M
n
∑ Xi
(t ) = ∏ M X i (t ) = (q + pet )n
i =1
i=1
n
olup,
∑X
i
∼ b(n, p ) binom dağılımına sahiptir.
i =1
* X 1 , X 2 ..., X k rasgele değişkenleri bağımsız ve aynı p parametreli geometrik dağılıma sahip
olduğunda M X i (t ) = q + pet , i = 1, 2,..., k olmak üzere,
M
k
pet n
(
t
)
=
M
(
t
)
=
(
)
∏
Xi
k
t
1
qe
+
i
=
1
X
∑ i
i=1
k
dır.
∑X
rasgele değişkeni k başarı elde edinceye kadar yapılan deneme sayısı olup, negatif
i
i =1
binom dağılımına sahiptir.
* X 1 , X 2 ..., X n rasgele değişkenleri bağımsız ve aynı λ parametreli Poisson dağılıma sahip
olsun.
M X i (t ) = eλ (e −1) , i = 1, 2,..., n
t
olmak üzere,
k
M
k
∑ Xi
(t ) = ∏ M X i (t ) = (eλ ( e −1) ) n = enλ (e −1)
t
t
i =1
i=1
k
olup,
∑X
i =1
i
rasgele değişkeni parametresi nλ olan Poisson dağılımına sahiptir.
114
* X 1 , X 2 ..., X n rasgele değişkenleri bağımsız ve aynı θ parametreli üstel dağılıma sahip
olsun.
M X i (t ) = (1− θt )−1 , i = 1,2,..., n
olmak üzere,
k
M
k
∑ Xi
(t ) = ∏ M X i (t ) = ((1− θt )−1 ) = (1− θt )−n
n
i =1
i=1
k
olup,
∑X
rasgele değişkeni parametreleri α = n ve β = θ olan gamma dağılımına
i
i =1
k
∑X
sahiptir.
i
∼ Γ(n, θ ) dır.
i =1
* X 1 , X 2 ..., X n rasgele değişkenleri bağımsız, aynı µ ortalamalı ve aynı σ 2 varyanslı
N (µ, σ 2 ) normal dağılımına sahip olsun.
M X i (t ) = e
2 2
µt+σ t
2
, i = 1,2,..., n
olmak üzere,
2 2
 µ t +σ 2 t 2 
nµ t + nσ t

2
2

M k (t ) = ∏ M X i (t ) = e
 = e


=
1
i
X
∑ i
n
k
i=1
k
olup,
∑X
i
∼ N (nµ, nσ 2 ) dır.
i =1
n
n
∑X
i
nin dağılımı bilindiğinde X n =
i =1
∑X
i =1
n
i
‘nin dağılımını elde etmek kolaydır.
n
Kesikli halde, X n ‘nin aldığı değerler
∑X
i
rasgele değişkeninin aldığı değerlerin n ‘e
i =1
bölünmüşleridir. Olasılıklar ise aynıdır.
* X 1 , X 2 ..., X n rasgele değişkenleri bağımsız ve aynı b(1, p ) Bernoulli dağılımına sahip
n
olduğunda, Y = ∑ X i ∼ b(n, p ) rasgele değişkeninin aldığı değerler, y = 0,1, 2,..., n olmak
i =1
üzere, olasılık fonksiyonu,
n
fY ( y ) = P (Y = y ) = P (∑ X i = y )
i =1
n 
=   p y q n− y , y = 0,1, 2,..., n
 y 
dır.
115
n
∑X
i
Y
1 2 3
rasgele değişkeninin aldığı değerler, xn = 0, , , ,...,1 olup, bu
n
n
n n n
değerleri alması olasılıkları
Xn =
i =1
=
n
f X n ( xn ) = P( X n = xn ) = P(∑ X i = nxn )
i =1
n  nx n−nx
1 2 3
n
 p nq
, xn = 0, , , ,...,1
= 

nxn 
n n n
dır.
Sürekli dağılımlar için X n ‘nin dağılımı,
 n X 
i
 ( n X ) t 

n
 ∑
i=1
 ∑ i n 
t

t
t 

X nt

n
i
=
1



M X (t ) = E (e ) = E e
 = M n ( ) =  M X1 ( )
 = E e
n


n 



∑ Xi n


i=1



moment çıkaran fonksiyonundan bulunabilir.
* X 1 , X 2 ..., X n rasgele değişkenleri bağımsız ve aynı θ parametreli üstel dağılıma sahip
k
olduğunda,
∑X
i
∼ Γ(n, θ ) ve
i =1

t 
t
θ
M X (t ) =  M X1 ( ) = (1− θ )−n = (1− t )−n
n

n 
n
n
θ
olup, X n ∼ Γ(α = n, β = ) dır.
n
n
*
X 1 , X 2 ..., X n rasgele değişkenleri bağımsız, aynı µ ortalamalı ve σ 2 varyanslı
k
N (µ, σ 2 ) normal dağılıma sahip olsun.
∑X
i
∼ N (nµ, nσ 2 ) ve
i =1

 2 
σ2 t2
 t σ 2  nt  
n
µt + n


t   µ +
2
M X (t ) =  M X1 ( ) = e n 2  = e
n



n  



n
olup, X n ∼ N (µ,
σ2
) dır.
n
116
Düzgün bir tavla zarını n=1,2,3,...,20 defa atınız. Gelen nokta sayıları sırasıyla
X 1 , X 2 ..., X 20 rasgele değişkenleri olmak üzere, bu rasgele değişkenlerin aldığı x1 , x2 ..., x20
değerlerini gözleyiniz.
n
Xn =
∑X
i
i =1
, n=1,2,3,...,20
n
rasgele değişkeninin aldığı x1 , x2 , x3 ,...x20 değerlerini, gözlenen x1 , x2 ..., x20 sayılarına bağlı
olarak hesaplayınız.
Yatay eksende atış sayısı olan n=1,2,3,...,20 sayıları ve düşey eksende karşılık gelen
nokta sayısı ortalaması x1 , x2 , x3 ,...x20 olmak üzere (n, xn ) , n=1,2,3,...,20 noktalarını bir
koordinat sisteminde elle işaretleyiniz.
Zarı, yeniden 20 defa atınız ve (n, xn ) , n=1,2,3,...,20 noktalarını yukarıdaki koordinat
sisteminde işaretleyiniz.
117
Düzgün zar atışı deneyini bilgisayarda yapınız. (n, xn ) , n=1,2,3,...,20 noktalarını bir
koordinat sisteminde işaretleyiniz.
(n, xn ) , n=1,2,3,...,20 noktalarını 10 kez aynı koordinat sisteminde işaretleyiniz.
X 1 , X 2 ..., X n rasgele değişkenleri bağımsız ve aynı dağılımlı olmak üzere,
n
Xn =
∑X
i
i =1
n
rasgele değişkeninin kesikli halde olasılık, sürekli halde olasılık yoğunluk fonksiyonunu
aşağıdaki dağılımların her biri için elde ediniz.
1
a) b(1, p = )
2
b) b(1, p = 0.8)
c) λ = 3 parametreli Poisson
d) θ = 3 parametreli üstel
e) N (µ = 3, σ 2 = 25)
f) N (µ = 3, σ 2 = 100)
n=5,10,20,50,100 için X n ‘nin olasılık (yoğunluk) fonksiyonunun grafiğini, dağılımların
her biri için çiziniz (çizdiriniz).
118
119
Laboratuar Çalışması 12
Büyük Sayılar Kanunu
X 1 , X 2 ,…, X n bağımsız rasgele değişkenler ve E ( X i ) = µ , Var ( X i ) = σ 2 , i = 1, 2,…, n
olsun. X 1 , X 2 ,…, X n ‘ler aynı dağılımlı olmayabilir.
n
Xn =
∑X
i
, n = 1, 2,3,...
i =1
n
olmak üzere,
X 1 , X 2 ,…, X n ,...



ortalamalar dizisini göz önüne alalım. E X
eşitsizliğinden,
(
P | X n − µ X |< kσ X
ve k =
n
n
) = P  | X
n

n 
= µ ve Var ( X n ) =
− µ |< k
σ2
σ 
1
 ≥ 1− k2
n
ε n
σ
, ε=k
> 0 için
σ
n
P (| X n − µ |< ε ) ≥ 1 −
1
2
ε n 


 σ 
yazılır. Eşitsizliğin her iki tarafının n → ∞ için limiti alınırsa,






1
lim P (| X n − µ |< ε ) ≥ lim 1 −

2
n →∞
n →∞
 ε n  
  σ  
 
 
ve olasılılığın birden büyük olamayacağı düşünülürse,
lim P (| X n − µ |< ε ) = 1
n →∞
elde edilir. Bu durum Zayıf Büyük Sayılar Kanunu olarak bilinmektedir.
Küçük her ε > 0 değeri için,
lim P (| X n − µ |< ε ) = 1
n →∞
olması durumu, “ X n olasılıkta µ ‘ye yakınsar “ diye ifade edilmekte ve
P
X n 
→µ
n→∞
biçiminde gösterilmektedir.
n
olup, Chebyshev
120
Zayıf Büyük Sayılar Kanunu:
X 1 , X 2 ,…, X n ,... bağımsız ve aynı µ ortalamalı σ 2 < ∞
P
→ µ dır.
varyanslı rasgele değişkenler ise X n 
n→∞
Olasılık Teorisi çerçevesinde ispatlanan Zayıf Büyük Sayılar Kanunu gerçek dünyada
da geçerlidir. Örneğin, düzgün bir tavla zarının ardı ardına atılışında gelen nokta sayıları
sırasıyla X 1 , X 2 ..., X n ,... rasgele değişkenleri bağımsız ve 3.5 ortalamalı, 35/12 varyanslı
olmak üzere, Zayıf Büyük Sayılar Kanunu’na göre
n
Xn =
∑X
i
P

→ µ = 3.5
n→∞
i =1
n
dır. Bunu deneysel olarak görmeye çalışalım. Düzgün bir tavla zarının 150 kez atılışında
aşağıdaki değerler gözlenmiştir.
→ 2
6
4
3
1
4
3
6
3
2
2
3
1
6
1
6
2
5
1
1
5
1
2
4
3
5
6
4
1
4
1
6
4
2
3
2
2
4
6
4
3
6
3
5
5
5
4
1
2
6
6
5
1
5
4
1
5
6
1
2
3
3
6
3
4
2
2
5
6
6
5
3
2
1
2
1
6
3
20
73
137
195
261
334
411
489
521
24
74
142
196
262
336
415
493
30
77
146
197
268
338
417
496
4
4
1
1
2
1
5
3
1
3
2
6
1
3
6
4
5
2
6
5
6
6
4
6
2
6
3
4
5
2
1
6
4
4
2
6
1
2
1
4
1
4
6
1
5
6
4
6
1
3
3
2
6
6
2
2
47
95
160
219
286
360
437
51
99
162
221
292
366
440
2
3
2
1
1
2
4
4
2
6
4
5
6
2
6
3
52
103
168
222
293
369
445
53
106
171
227
296
371
446
toplamlar:
2
59
118
180
248
318
394
465
501
8
63
121
181
254
323
399
471
503
9
64
126
185
255
324
405
477
509
13
65
130
187
257
325
409
481
511
15
69
136
193
259
328
410
487
516
35
80
148
203
273
344
421
39
84
149
208
274
350
427
40
87
151
212
279
352
429
45
89
157
218
285
354
432
55
109
173
233
300
374
449
ortalamalar:
2
4
3.9
3.6364
3.1053 3.15
3
3
3.1892 3.1842
3.2391 3.2128
3.2364 3.1964
3.0781 3.1231
3.1918 3.2027
3.1829 3.1566
3.2198 3.2174
3.25
3.2475
3.3028 3.3273
3.3814 3.4034
3.378
3.375
3.3897 3.3942
3.4552 3.4452
3
3.75
3.0476
2.9667
3.2308
3.2708
3.1579
3.1515
3.1867
3.1905
3.2258
3.2745
3.3243
3.4083
3.3876
3.413
3.4626
3.25
3.6154
2.9545
3.0645
3.25
3.2653
3.1207
3.1642
3.2237
3.2118
3.234
3.2621
3.3125
3.3884
3.3846
3.4317
3.4527
3
3.6429
3
3.0938
3.3171
3.24
3.1356
3.2059
3.2208
3.186
3.2632
3.25
3.3097
3.3689
3.3969
3.4357
3.4631
3.3333
3.4667
3.0417
3.1212
3.2619
3.2941
3.1167
3.1739
3.2564
3.2069
3.2917
3.2762
3.3246
3.374
3.3788
3.4539
3.4733
3.4286
3.3125
2.96
3.1176
3.3023
3.2885
3.1639
3.1571
3.2278
3.2386
3.2784
3.3019
3.3217
3.3629
3.3759
3.4437
3.75
3.2353
2.9615
3.1143
3.3182
3.2642
3.1452
3.1268
3.2125
3.2135
3.2959
3.2897
3.3448
3.368
3.3955
3.4476
3.8889
3.1667
2.963
3.1944
3.2889
3.2778
3.1111
3.1528
3.1975
3.2444
3.2727
3.2778
3.3675
3.3889
3.3926
3.4444
57
115
177
237
304
379
455
178
239
310
382
458
179
245
316
388
461
121
olmak üzere, yatay eksende atış sayısı ve düşey eksende gelen sayıların ortalaması
işaretlenirse,
4
3.5
3
2.5
2
0
50
100
150
elde edilir. Deney sayısı n arttıkça, X n değerleri µ = 3.5 sayısına yaklaşmaktadır.
Düzgün tavla zarı atılışı deneyini Matlab’da
fix(unifrnd(1,7))
deyimi ile
gerçekleştirebiliriz (simüle edebiliriz). unifrnd(1,7) fonksiyonu U (1, 7) düzgün dağılımdan
rasgele sayı üretmekte olup, fix fonksiyonu bunun tam değerini vermektedir. Örneğin,
>> fix(unifrnd(1,7,1,50))
3 4 3 4 3 4
3 3 2 3 2 2
5 5 6 1 3 1
6
2
6
1
3
6
1
3
6
4
3
1
2
2
4
4
2
1
3
6
6
5
6
5
1
3
4
4
1
1
5
2
dır.
hold on;
for i=1:30
plot((1:100),cumsum(fix(unifrnd(1,7,1,100)))./(1:100))
end
plot([0 100],[3.5,3.5])
6
5.5
5
4.5
4
3.5
3
2.5
2
1.5
1
0
10
20
30
40
50
60
70
80
90
Zar atışı ile ilgili deneyi (50 atış) ve simülasyonunu kendiniz yapınız.
100
122
1
2
3
4
1
4
2
10
3
Yukarıdaki kavanozdan rasgele bir top çekilmesi deneyinde gelen sayı X rasgele değişkeni
olsun. X rasgele değişkeninin olasılık tablosu,
x
f ( x) = P( X = x)
ve µ = E ( X ) =
1
2/9
2
2/9
3
2/0
4
2/9
10
1/9
10
20
ve σ 2 = Var ( X ) =
dır.
3
3
Kavanozdan iadeli olarak, n=1,2,3,...,25 kez top çekiniz ve gelen sayıları
x1 , x2 , x3 ,..., x25 gözleyiniz. n=1,2,3,...,25 için X n rasgele değişkeninin aldığı değerleri
x1 , x2 , x3 ,...x25 hesaplayınız. (n, xn ) , n=1,2,3,...,25 noktalarını bir koordinat sisteminde
işaretleyiniz.
123
Bernoulli Büyük Sayılar Kanunu: Düzgün bir paranın ardı ardına atılışında gelen tura
sayıları (0 ya da 1 tane) sırasıyla X 1 , X 2 ..., X n ,... rasgele değişkenleri (bağımsız ve
1
X i ∼ b(1, p = ) , i = 1, 2, 3,... ) olmak üzere,
2
n
∑X
i
n atışta gelen tura sayısı
1
P


→µ = p =
n→∞
n
n
2
dır. Đstenildiği kadar küçük ε > 0 değeri için,


1
lim P  | X n − |< ε  = 1
n→∞
2


dır. “Düzgün bir para atıldıkça gelen tura sayısı ortalaması 1/2 değerine yakınsamaktadır”.
Xn =
i =1
=
1
X 1 , X 2 ..., X n ,... rasgele değişkenleri bağımsız ve X i ∼ b(1, p = ) , i = 1, 2, 3,... olmak
2
üzere, Zayıf Büyük Sayılar Kanunu’na göre
n
∑X
i
n denemedeki başarı sayısı
P


→p
n→∞
n
n
dır. Zayıf Büyük Sayılar Kanunu’nun bu özel hali Bernoulli Büyük Sayılar Kanunu olarak
bilinmektedir.
Düzgün bir paranın ardı ardına atılışında gelen tura sayıları sırasıyla X 1 , X 2 ..., X n
1
rasgele değişkenleri (bağımsız ve X i ∼ b(1, p = ) , i = 1, 2, 3,... ) olmak üzere, n=1,2,3,...,25
2
atılış için X n rasgele değişkeninin aldığı değerleri x1 , x2 , x3 ,...x25 gözleyiniz. (n, xn ) ,
n=1,2,3,...,25 noktalarını bir koordinat sisteminde işaretleyiniz. Bernoulli Büyük Sayılar
Kanununu bu grafik üzerinde yorumlayınız.
Xn =
i =1
=
124
( Xn ),
bağımsız ve aynı dağılımlı (dağılımın beklenen değeri µ sonlu) olan rasgele
değişkenlerin bir dizisi ise,
P
X n 
→µ
n→∞
dır (Khinchin Teoremi).
X 1 , X 2 ..., X n ,... rasgele değişkenleri bağımsız ve her biri aşağıdaki dağılıma sahip
olsun.
 2
 3
f X ( x) = 
x

0
, x >1
, d . y.
µ = E( X ) = 2
E ( X 2 ) = ∞ , dağılımın varyansı yok
Simülasyon yaparak,
P
X n 
→µ
n→∞
yakınsamasını görmeye çalışalım. X n değerlerini sanal olarak (simülasyon yaparak)
gözlemlemek için yukarıdaki dağılımdan rasgele sayı üretmemiz gerekmektedir.
0
, x <1

FX ( x) = 
1
1− 2
, x ≥1
 x
ve dağılımın destek kümesi DX = (1, ∞) üzerinde bire-bir olan FX fonksiyonunun tersi
FX−1 ( y ) =
1
1− y
, 0 < y <1
dır.
X=
1
1−U
, U ∼ U (0,1)
dönüşümü ile x1 , x2 ..., xn değerlerini üretip, x1 , x2 , x3 ,..., xn değerlerini elde edebiliriz.
n=1,2,3,...,200 için (n, xn ) noktalarını bir koordinat sisteminde işaretleyip,
P
X n 
→2
n→∞
yakınsamasını sanal olarak görmeye çalışalım.
125
hold on
for i=1:20
plot((1:200),cumsum(sqrt(1./(1-rand(1,200))))./(1:200));
end
plot([0 200],[2,2]);
6
5.5
5
4.5
4
3.5
3
2.5
2
1.5
1
0
20
40
60
80
100
120
140
160
180
200
X 1 , X 2 ..., X n ,... rasgele değişkenleri bağımsız ve her biri aşağıdaki dağılıma sahip
olsun.
 1
 2
, x >1
f X ( x) = 
, dağılımın beklenen değeri yok
x

, d . y.
0
için (n, xn ) noktalarını bir
Simülasyon ile x1 , x2 ..., xn değerlerini üretip, n=1,2,3,...,200
koordinat sisteminde işaretleyelim.
, x <1
0

FX ( x) =  1
1−
, x ≥1
 x
ve dağılımın destek kümesi DX = (1, ∞) üzerinde bire-bir olan FX fonksiyonunun tersi
1
FX−1 ( y ) =
, 0 < y <1
1− y
dır.
1
X=
, U ∼ U (0,1)
1− U
dönüşümü ile x1 , x2 ..., xn değerlerini üretebiliriz.
126
hold on
for i=1:20
plot((1:200),cumsum(1./(1-rand(1,200)))./(1:200));
end
200
180
160
140
120
100
80
60
40
20
0
0
20
40
60
80
100
120
140
160
180
200
800
900
1000
8000
9000
10000
hold on
for i=1:20
plot((1:1000),cumsum(1./(1-rand(1,1000)))./(1:1000));
end
150
100
50
0
0
100
200
300
400
500
600
700
hold on
for i=1:20
plot((1:10000),cumsum(1./(1-rand(1,10000)))./(1:10000));
end
250
200
150
100
50
0
0
1000
2000
Yakınsama olmamaktadır.
3000
4000
5000
6000
7000
127
* Khinchin Teoremi’ni bir kez daha ifade edelim: ( X n ) , bağımsız ve aynı dağılımlı
(dağılımın beklenen değeri µ sonlu) olan rasgele değişkenlerin bir dizisi ise
P
X n 
→µ
n→∞
dır.
Dikkat edilirse Khinchin Teoremi’nde ( X n ) dizisindeki rasgele değişkenlerin ikinci
momentleri-varyansları ile ilgili her hangi bir koşul yoktur, var olmaları bile aranmamaktadır.
Ancak, aynı dağılımlı olmaları koşulu söz konusudur. ( X n ) dizisindeki rasgele değişkenler
aynı µ ortalamalı ve sonlu, aynı varyanslı olmaları durumunda, aynı dağılımlı olmasalar bile
P
X n 
→µ
n→∞
dır (yukarıda ispatlandı).
*
( Xn )
dizisindeki rasgele değişkenler aynı µ ortalamalı ve sonlu, farklı σ X2 n = Var ( X n )
∞
varyanslı olsunlar.
∑
n =1
σ X2
n
n2
< ∞ koşulu sağlandığında,
P
X n 
→µ
n→∞
olduğu ispatlanabilir.
*
( X n ) dizisi, varyansları sınırlı, yani bir c sayısı için
Var ( X n ) ≤ c , n = 1, 2,3,...
ve aynı µ ortalamalı,
i − j →∞
Cov( X i , X j ) → 0
olan rasgele değişkenlerin bir dizisi ise
P
X n 
→µ
n→∞
dır.
128
Laboratuar Çalışması 13
Merkezi Limit Teoremi
X 1 , X 2 ,…, X n ,... bağımsız ve aynı dağılımlı (bu
Merkezi Limit Teoremi:
dağılımın beklenen değeri µ , varyansı σ 2 < ∞ ) olan rasgele değişkenler
olmak üzere,
 Xn − µ
 t 1 − z 2/ 2
≤ t  =
lim P 
e
dz
 σ/ n
n→∞

 −∞ 2n
dır.
∫
Merkezi Limit Teoremi aşağıdaki gibi de ifade edilebilir.
Merkezi Limit Teoremi: X 1 , X 2 ,…, X n ,... bağımsız ve varyansı mevcut, aynı
dağılımlı rasgele değişkenler olmak üzere,
n
 n


X i − E( X i )  t
1 − z2/ 2


i =1
lim P  i =1
≤
t
=
e
dz

n
n→∞
2
n

 −∞
Var ( X i )


i =1


dır.
∑
∑
∫
∑
Büyük n ler için,
 Xn − µ
P 
 σ/ n
yani, Z ∼ N (0,1) olmak üzere
 Xn − µ
P 

σ/ n

≤ t  ≈

t
∫
−∞
1 − z2/ 2
e
dz
2n

≤ t  ≈ P( Z ≤ t )

dır.
Düzgün bir tavla zarının ardı ardına atılışında gelen nokta sayıları sırasıyla
X 1 , X 2 ..., X n ,... rasgele değişkenleri (bağımsız ve 3.5 ortalamalı, 35/12 varyanslı) olmak
üzere, Zayıf Büyük Sayılar Kanunu’na göre,
n
Xn =
∑X
i =1
i
P

→ µ = 3.5
n→∞
n
yani, “zar atıldıkça gelen sayıların ortalaması 3.5 değerine yakınsamaktadır”. 100 atış
(
)
sonucunda P X 100 − 3.5 ≤ 0.1 olasılığı nedir?
129
Merkezi Limit Teoreminden, büyük n ‘ler için
 X −µ

P  n
≤ t  ≈ P( Z ≤ t )
 σ/ n

olmak üzere,






− 3.5
0.1
X
100


P X 100 − 3.5 ≤ 0.1 = P
≤
 σ

35


n
12


100 

(
)


= P


X
100
σ
− 3.5
n


12 
12 
≤
≈ P  Z ≤


35 
35 


olup,
P(−
12
12
≤Z≤
) = normcdf(sqrt(12/35),0,1)-normcdf(-sqrt(12/35),0,1)
35
35
= 0.44182
elde edilir. Düzgün bir tavla zarının 100 kez atılışında,
(
)
P (3.4 ≤ X 100 ≤ 3.6) = P X 100 − 3.5 ≤ 0.1 = 0.44182
dır.
(
)
P X 100 − 3.5 ≤ 0.5 olasılığı nedir?







−
µ
0.5
 = P
P X 100 − 3.5 ≤ 0.5 = P  X 100
≤

 σ

35



n

12


100 

≈ P( Z ≤ 2.9277)
(
)
X 100 − µ
σ
n


≤ 2.9277 


= normcdf(2.9277,0,1)-normcdf(-2.9277,0,1) = 0.99659
Düzgün bir tavla zarının 100 kez atılışında,
(
)
P (3 ≤ X 100 ≤ 4) = P X 100 − 3.5 ≤ 0.5 ≈ 0.99659
olmak üzere, bu sonucu Matlab’da simülasyon yaparak görmeye çalışın.
130
X 100 rasgele değişkenini en az 50 kez gözleyiniz. Histogram çizdiriniz.
Düzgün bir paranın ardı ardına atılışında gelen tura sayıları (0 ya da 1 tane) sırasıyla
1
X 1 , X 2 ..., X n rasgele değişkenleri (bağımsız ve X i ∼ b(1, p = ) , i = 1, 2, 3,... ) olmak üzere,
2
n=100 atılışında gelen toplam tura sayısının 50 olması olasılığını Merkezi Limit Teoremini
kullanarak hesaplayalım.
100
100
i =1
i =1
P(∑ X i = 50) = P(50 − 0.5 ≤ ∑ X i ≤ 50 + 0.5)
1
1
50.5 − 100 ×
2 ≤Z≤
2)
≈ P(
1 1
1 1
100 × ×
100 × ×
2 2
2 2
49.5 − 100 ×
= P(−0.1 ≤ Z ≤ 0.1)
= normcdf(.1,0,1)-normcdf(-0.1,0,1)
= 0.079656
Bu olasılığın gerçek değeri,
100
100   1 

  = binopdf(50,100,1/2) = 0.079589
 50   2 
dır.
131
Düzgün bir paranın n=100 atılışında gelen toplam tura sayısının 40‘dan çok ve 60‘dan
az olması olasılığı nedir? Merkezi Limit Teoremi’nden
100
100
i =1
i =1
P(40 < ∑ X i < 60) = P(41 ≤ ∑ X i ≤ 59)
1
1
59.5 − 100 ×
2 ≤Z≤
2)
≈ P(
1 1
1 1
100 × ×
100 × ×
2 2
2 2
40.5 − 100 ×
= P(−1.9 ≤ Z ≤ 1.9)
= normcdf(1.9,0,1)-normcdf(-1.9,0,1)
= 0.94257
olup, bu olasılığın gerçek değeri sum(binopdf((41:59),100,1/2)) = 0.94311 dir.
100
Her biriniz birer parayı 100 kez atınız ve gelen toplam tura sayısını ( ∑ X i rasgele
i =1
değişkenini) gözleyiniz. Tam 50 kez tura getiren kaç kişi oldu?
Kaç kişi 40 ile 60 arasında tura getirdi?
Bu sonuçları,
100
P(∑ X i = 50) = 0.079589
i =1
ve
100
P(40 < ∑ X i < 60) = sum(binopdf((41:59),100,1/2)) = 0.94311
i =1
olasılıkları ile karşılaştırınz.
132
100
100
Xi
∑
i =1
rasgele değişkeninin gözlenen değerleri ve X 100 =
Xi
∑
i =1
100
rasgele değişkeninin
gözlenen değerleri için histogram çiziniz.
n
Bilgisayarda, sınıftaki öğrenci sayısı (n) kadar 100‘er atışlık sanal deney yapınız ve
n
Xn =
.
Xi
∑
i =1
n
rasgele değişkenlerinin gözlenen değerleri için histogram çizdiriniz.
Xi
∑
i =1
ile
133
n
1
∼ b(n = 100, p = ) binom dağılımındaki olasılıklar (mavi noktalar) ile
2
i =1
2
N ( µ = np = 50, σ = npq = 25) normal dağılımın olasılık yoğunluk fonksiyonunun grafiği
(kırmızı çizgi) aşağıdaki gibidir. Yukarıdaki histogram ile karşılaştırınız.
∑X
i
0.08
0.07
0.06
0.05
0.04
0.03
0.02
0.01
0
0
10
20
30
40
2
50
60
70
80
90
100
1
3
3
4
1
4
2
10
Yukarıdaki kavanozdan rasgele bir top çekilmesi deneyinde gelen sayı X rasgele değişkeni
olsun. X rasgele değişkeninin olasılık tablosu,
x
f ( x) = P( X = x)
1
2/9
2
2/9
3
2/0
4
2/9
10
1/9
10
20
ve σ 2 = Var ( X ) =
dır.
3
3


10
P  X 20 − ≤ 0.1 olasılığını Merkezi Limit Teoremini kullanarak hesaplayınız.

3

ve µ = E ( X ) =
134
Bilgisayarda 30 tane düzgün tavla zarının 100 kez atılışında, her bir zar için her atış
sonucunda xnj , n = 1, 2,...,100 , j = 1, 2,...,30 ortalamaları gözlenip aşağıdaki grafik
(simülasyon sonucu) elde edilmiştir.
>> hold on; plot([0 100],[3.5,3.5])
>> plot((1:100),cumsum(fix(unifrnd(1,7,1,100)))) ;
%( 30 kez tekrarlandı)
6
5.5
5
4.5
4
3.5
3
2.5
2
1.5
1
0
10
20
30
40
50
60
70
Bu grafik üzerinde Büyük Sayılar Kanunu’nu yorumlayınız.
80
90
100
135
n = 25,50, 75,100 için Merkezi Limit Teoremini yorumlayınız.
60 zar için yukarıdaki simülasyonu yapınız. n = 25,50, 75,100 için xnj , j = 1, 2,..., 60
gözlemlerinin histogramlarını çizdiriniz ve Merkezi Limit Teoremini yorumlayınız.
Download