Document

advertisement
BÖLÜM 3
ġANS DEĞĠġKENLERĠNĠN BEKLENEN DEĞER VE
MOMENTLERĠ
Matematiksel beklenti kavramı şans oyunlarından doğmuştur. En yalın biçimiyle, bir
oyuncunun kazanabileceği miktar ile kazanma olasılığının çarpımıdır. Sözgelimi büyük
ödülün 4800TL olduğu bir çekilişteki 10.000 biletten birine sahip olan bir kişinin
matematiksel beklentisi 4800*1/10.000 = 0,48 TL olur.
3.1 BEKLENEN DEĞER ve ÖZELLĠKLERĠ
Beklenen değer ya da matematiksel beklenti kavramı matematiğin istatistik bilimine yaptığı
bir katkı olarak düşünülebilir. Bir X şans değişkeninin ya da bu şans değişkeninin herhangi bir
g(x) fonksiyonunun beklenen değeri, değişkenin tüm değerleri üzerinden, olasılık fonksiyonun
ortalama değerinin bulunmasıyla elde edilir. Beklenen değer teorik ya da ideal değerdir. Her
hangi bir denemede X şans değişkeninin beklenen değerini alması gerçekte beklenemez. Bir
X şans değişkeni için matematiksel beklenti ya da beklenen değer E(X) ile gösterilir. Bu bakış
açısıyla sürekli bir şans değişkeninin beklenen değerinin nasıl hesaplanması gerektiği sorusu
akla gelebilir. Örneğin X, olasılık yoğunluk fonksiyonu f ile tanımlanan ve f fonksiyonu [0,1]
aralığı dışında 0 olan bir şans değişkeni olsun. Burada X,
1 2
n 1
, ,...,
,1 değerlerini alan
n n
n
kesikli bir şans değişkeni Y olarak ele alınabilir. X şans değişkeninin frekanslarını dikkate
k 1 k 
,  aralığına atayan fonksiyon,
alarak olasılıkları 
 n n
k
k

 k 1
P Y    P
 X     f x dx
n
n  k 1 n

 n
k n
olsun. Bu ifade büyük n değerleri için f cinsinden yaklaşık olarak,
k n
k
1 k

P Y     f x dx  f  
n  k 1 n
n n

şeklinde tanımlanır. Ağırlık merkezi yorumuna göre Y’nin beklenen değeri E(Y), X’in
beklenen değeri E(X)’e yakınsamalıdır. Yukarıdaki eşitlik kullanılarak,
k 
k n k k1
P Y     f  
n  k 1 n  n  n

k 1 n
n
E Y   
elde edilir. Belirli integralin tanımından, büyük n değerleri için sağ taraftaki ifade için
yaklaşık olarak,
1
1
 xf x dx
0
sonucu bulunur.
Tanım (Beklenen değer): Bir X şans değişkeninin olasılık fonksiyonu f(x) olsun. Şans
değişkeninin beklenen değeri, kesikli ve sürekli şans değişkenleri için sırasıyla,
E( X ) 
 x f ( x)
x

E ( X )  xf ( x)dx
x
herhangi tipteki bir şans değişkeni için,
E( X ) 

0
0

 1  F xdx   F xdx
eşitlikleri ile tanımlanır.
Bu eşitlik gerçekte X şans değişkeninin bir ağırlıklı ortalamasıdır. Burada ağırlıkları
olasılıklar tanımlamaktadır.
Diğer bir ifade ile X şans değişkeninin tanımladığı f(x)
yoğunluğunun ağırlık merkezinin X eksenindeki değeridir. Beklenen değerin tanımlı
olabilmesi için toplam ya da integral işlemlerinin yakınsak olması gereklidir.
Ayrıca E(X) ifadesine X’in beklenen değeri ya da ortalaması denir. E(X), f ile gösterilen
fonksiyonun ağırlık merkezidir:

EX  

 xf x dx 

 xf x dx


 f x dx

Bir şans değişkenin beklenen değeri, şans değişkeninin olasılık fonksiyonuna ya da birikimli
dağılım fonksiyonuna göre tanımlandığı için şans değişkeni referans alınmadan bu
fonksiyonlara göre elde edilebilir.
Yukarıdaki tanım dikkate alındığında sonlu bir beklenen değere sahip her şans değişkeni için,
E (X )  
yazılabilir. Diğer bir ifade ile şans değişkenin beklenen değeri anakütle ortalamasına eşittir.
Daha önce belirtildiği üzere beklenen değer mevcut olmayabilir. Sorun, toplamların veya
integrallerin ıraksak ya da belirsiz olması problemidir. Bir şans değişkeninin beklenen değeri,
a) sonlu bir reel sayı olabilir,
b) sonsuz (integral ya da toplam sonucu ıraksak ise) olabilir,
c) var olmayabilir (integral ya da toplam sonucu belirsiz ise).
2
Sürekli değişkenlerden beklenen değeri var olmayanlara bir örnek Cauchy dağılışı gösteren
şans değişkenidir. Cauchy dağılımının olasılık yoğunluk fonksiyonu,
f x  
1
,
 1 x2

   x   için

olup, bu şans değişkeni için,


 1
E  X   x.
dx  
ln 1  x 2
2
2


1

x




1



 

belirsizliği ortaya çıktığı için beklenen değer yoktur.
Beklenen değerin sonsuz olduğu durum için verilebilecek örnek de α = 1 olan Pareto
dağılımıdır. Sürekli şans değişkeni X’in beklenen değeri E(X)’teki integral için tanımlanan bu
özellikler kesikli şans değişkeni X’in beklenen değeri E(X)’teki toplama işlemi için de
geçerlidir.
Beklenen değer işlemi ile temel özellikler aşağıdaki teorem ile verilmiştir.
Teorem: X şans değişkenin anakütle ortalaması  ve a ile b sabit sayılar olmak üzere:
1. E a   a
2. EaX   aE  X 
1
1
3. Genelde E ( X )  0 için E   
 X  E( X )
Özellik (1) ve (2)’nin bir sonucu olarak tanımlanabilecek E aX  b durumu ise Kısım 3.4’de
açıklanmıştır.
İspat: İspat sürekli şans değişkenleri için verilmiştir.
1. Ea    af x dx  a  f x dx  a
2. E aX    axf x dx  a  xf x dx  a
3. Bkz. Jensen eşitsizliği


n
i 0  i 
n
Teorem: E (a  bX ) n    a i b n  i E ( X n  i )
n
 n
n i
İspat: (a  bx) n    a i bx olduğuna göre,
i 0  i 


 n  n
 n  n
E (a  bX ) n  E   aibn i X n i    aib n i E ( X n i )
 i 0  i 
 i 0  i 


3
Beklenen değer ile ilgili diğer özellikler ileriki kısımlarda açıklanacaktır. Beklenen değer
şans değişkeninin anakütle ortalamasına eşit olduğundan sonuç olarak bir yer ölçüsüdür. Bir
sonraki kısımda şans değişkenleri için kullanılabilecek diğer yer ölçülerinden bazıları
tanıtılacaktır.
3.2 TEMEL YER ÖLÇÜLERĠ
Şans değişkeni dağılımını farlı bakış açıları ile tanımak amacıyla farklı yer ölçüleri
kullanılmaktadır bu yer ölçülerinden bazıları aşağıda tanıtılmıştır.
Tanım (Kantil): X şans değişkeninin ya da ona ait dağılımın p-inci kantili xp ile gösterilir ve
F(xp)p
koşulunu sağlayan en küçük şans değişkeni değeridir. Eğer X sürekli bir şans değişkeni ise pinci kantil
F(xp)=p
koşulunu sağlayan en küçük şans değişkeni değeridir.
Tanım (Medyan): X şans değişkeninin ya da ona ait dağılımın 0.5-inci kantili x0.5 ile ya da M
gösterilir ve medyan olarak adlandırılır. Genel olarak:
Pr[XM]1/2 ya da Pr[XM]1/2
tanımlanır. Eğer X sürekli bir şans değişkeni ise medyan:
M



f x dx  1 / 2   f x dx .
M
Medyan veya ortanca, bir frekans dağılımında frekansları iki eşit parçaya bölen şans değişkeni
değeridir.
Bir şans değişkeninin en çok rastlanan değerine mod denir. Bir frekans dağılımında, özellikle
homojen olmayan dağılımlarda birden fazla mod değeri bulunabilir. Mod değeri olmayan
dağılımlar da vardır.
Tanım (Mod): X şans değişkenine ait olasılık fonksiyonunun x  x0 noktasında bir maksimum
değeri f(x0) var ise x0 değeri mod olarak adlandırılır. Eğer X sürekli bir şans değişkeni ise:
df x 
0
dx x x0
Bir kesikli değişkenin modu, frekansların maksimum olduğu değişken değeridir. f(x)’i
maksimum yapan şans değişkeni değeridir.
Yukarıda açıklanan yer ölçüleri farklı değerler alabileceği gibi dağılım biçiminin özel bir
durumunu tanımlayan simetrik dağılımlarda her üç yer ölçüsü de aynı değere sahiptir.
Tanım (Simetri): Olasılık fonksiyonu f(x) için,
4
f x  c   f x  c 
özelliğine sahip olan dağılımlar c noktasına ya da diğer bir deyişle x  c doğrusuna göre
simetriktir.
Eğer bir f(x) dağılımı c noktasına göre simetrik ve anakütle ortalaması  sonlu ise c  
olmalıdır.
3.3 VARYANS
Şans değişkeninin dağılımı ile ilgili önemli bir ölçü grubu da yayılım ölçüleridir. Aşağıda bazı
önemli yayılım ölçüleri kısaca açıklanmıştır.
Tanım (Varyans): X bir şans değişkeni ve E  X    ise şans değişkeninin varyansı V(X) ile
ya da 2 ile gösterilir. Kesikli ve sürekli şans değişkenleri için sırasıyla,

  x   
V X   E X    
2
2
i
f xi 
i

  x   
V X   E X    
2

2
f x dx

ve herhangi bir şans değişkeni için ise,

V  X   2 x1  F x   F  x dx   2

0
şeklinde tanımlanır.
Varyansın mevcut olabilmesi için toplam serisinin ya da integralin yakınsak olması gereklidir.
Bir şans değişkenin beklenen değerin de olduğu gibi varyansı da, şans değişkeninin olasılık
fonksiyonuna ya da birikimli dağılım fonksiyonuna göre tanımlandığı için şans değişkeni
referans alınmadan bu fonksiyonlara göre tanımlanabilir.
Gözlenen değerleri ortalamaya göre uzaklaşmaya meyilli X şans değişkenine göre değerleri
ortalama civarında olan bir Y şans değişkenin varyans değerleri karşılaştırıldığında X şans
değişkeninin varyansı daha büyük değerler aldığından varyans bir yayılım ölçüsüdür.
Varyansın formülleri incelendiğinde negatif olmayan değerlere sahip bir ölçüt olduğu
görülebilir. Varyans şans değişkeni ile aynı ölçü birimine sahip değildir. Varyansın bu
eksikliğini gideren yayılım ölçüsüne ise standart sapma denir.
Tanım (Standart sapma): X şans değişkeninin standart sapması  ile gösterilir ve
  V X 
ile tanımlanır.
Pek çok uygulamada şans değişkeni ile aynı ölçü birimine sahip olduğu için varyansa göre
tercih edilir. Varyansa ait temel bazı özellikler aşağıda verilmiştir.
5
Teorem: Bir sabitin varyansı sıfırdır.
V c   0


İspat: V c   E c  E c 2  0 .
Teorem: Bir sabit ile bir şans değişkeninin çarpımının varyansı:
V cX   c 2V  X 

 
 c E X  E  X  .
İspat: V cX   E cX  E cX 2  E cX  cE  X 2

2
2
c0 ise, bir rasal değişkenin değerlerinin sabit bir sayıyla çarpılması varyansın da aynı sabit
sayının karesiyle çarpılması demek olduğundan, dağılım yayıklığında da ona uygun bir
değişmeyle karşılaşılır.
Teorem: Bir sabit ile bir şans değişkeninin toplamının varyansı:
V c  X   V  X 

 E X  E  X  
 
İspat: V c  X   E c  X  E c  X 2  E c  X  c  E  X 2

2
Teoremin sonucuna göre; bir rassal değişkenin değerlerine sabit bir sayının eklenmesinin x’in
bütün değerlerinin sağa ya da sola kaymasına yol açtığını ama onun dağılım yayıklığını hiç
etkilemediği görülmektedir.
Varyans, şans değişkeninin beklenen değeri etrafındaki yoğunlaşmasının zayıf bir ölçütüdür.
Bununla birlikte simetrik dağılışlar için yeterli bir ölçüdür. Varyans özellikle asimetrik
dağılışlar ve yoğunluğun küçük bir kısmının ortalamadan oldukça uzak olduğu dağılımlar için
yetersiz bir yayılım ölçüsüdür. Bir şans değişkeninin varyansının her zaman varolması gerekli
değildir.
3.4 ġANS DEĞĠġKENĠNĠN BĠR FONKSĠYONUN BEKLENEN DEĞERĠ
Bazı durumlarda doğrudan X şans değişkeni ile değil onun bir fonksiyonu y  g x  şeklinde
ortaya çıkan şans değişkenleri ile ilgilenilir. Bu gereksinim genellikle araştırmalarda şans
değişkenine ait ölçü biriminin değiştirilmesi gerekli olduğunda ortaya çıkar. Örneğin ısı
Celsius biriminden ölçümlendiğinde ve bu veriler Fahrenheit’e dönüştürüldüğünde beklenen
değer bu döüşümden nasıl etkilenir? Burada yeni tanmlanan şans değişkeni Fahrenheit ölçü
birimine sahiptir ve Celsius ile aralarında, a ve b sabitler olmak üzere, g x   ax  b ilişkisi
vardır. Sonuç olarak, sürekli şans değişkenleri için,
E aX  b 
 ax  bf xdx
x
6
 a xf x dx  b f x dx


x
x
 aE  X   b
elde edilir. Benzer bir sonuç kesikli şans değişkenleri için de bulunabilir.
Beklenen değer alma işlemi doğrusal bir operasyondur. Bu nedenle X’ in doğrusal bir
fonksiyonunun beklenen değeri sabitlerin etkisi dikkate alınarak kolayca bulunabilir.
Tanım: X olasılık fonksiyonu f (x) olan bir şans değişkeni olsun. Şans değişkeninin bir
fonksiyonunun g (x) ’ in beklenen değeri kesikli ve sürekli şans değişkenleri için sırasıyla,
E g ( x)   g ( x) f ( x)
x
Eg ( x) 

 g ( x) f ( x)dx

tanımlanır.
Teorem: X bir şans değişkeni, f(x)’de onun olasılık fonksiyonu c1, c2…,cn birer sabit sayı
ise gi(x) i=1,…,n fonksiyonlarının sabitlerle çarpımlarının toplamının beklenen değeri:
n
 n
E  ci g i ( x)   ci Eg i ( x).
 i 1
 i 1
n
n

n

İspat: E  ci g i ( x)    ci g i ( x). f ( x)   ci g i ( x) f ( x)
i 1 x
 i 1
 x  i 1

n
n
=  c i  g i ( x) f ( x)   c i E g i ( x).
i 1
x
i 1
Teorem: X bir şans değişkeni, f(x)’de onun olasılık fonksiyonu olmak üzere, eğer tüm x
değerleri için g1 ( x)  0 ise
Eg1 ( x)  0 .
Teorem: X bir şans değişkeni, f(x)’de onun olasılık fonksiyonu olmak üzere, eğer tüm x
değerleri için g1(x)  g2(x) ise
E[g1(x)]  E[g2(x)] .
Teorem: X bir şans değişkeni ve a, b ise sabitler olsun. Beklenen değerleri mevcut g (x) ,
fonksiyonları için eğer tüm X değerleri için a  g ( x)  b ise
a  Eg ( x)  b .
3.6 OLASILIK ÜZERĠNE EġĠTSĠZLĠKLER
Beklenen değer kavramı kullanılarak olasılıklar üzerine bazı eşitsizlikler elde edilebilir. Bu
eşitsizliklerin en önemlileri Chebyshev ve Jensen eşitsizlikleri olarak bilinir.
7
3.6.1 Chebyshev EĢitsizliği
Chebyshev teoremi belirli bir olasılık için üst sınırın bulunmasına imkan verir. Bu sınırların
tam olasılık değerlerine eşit ya da yakın olması gerekli değildir. Bu nedenle bir olasılık
değerine yakınsamak için genelde bu teorem kullanılmaz. Bu teoremin ana kullanım
alanlarından biri Büyük Sayılar Kanunudur.
Teorem: Şans değişkeni X’in olasılık fonksiyonu f(x) ve negatif olmayan bir fonksiyonu g(x)
olsun. Eğer E[g(x)] mevcut ise her bir pozitif k sabiti için;
Prg x   k  
Eg x 
k
İspat: Şans değişkeni X için A={x:g(x)k} olsun. Bu durumda,
Eg x   g x  f x dx  g x  f x dx 


x
A
 g x f xdx
Ac
Eşitliğin sağındaki her iki integral de negatif olmayan değerlere sahip olduğundan,
Eg x   g x  f x dx

A
Eğer xA bu durumda g(x)k olacağı için g(x) yerine k yazılması eşitsizliğin sağ tarafının
değerini artırmaz.
Eg x   k f x dx

A
Burada
 f xdx  Prx  A  Prg x  k  olduğundan,
A
Eg x   k Prg x   k 
İspat tamamlanır.
Açıklanan teoerem, Chebyshev eşitsizliği olarak adlandırılan bir eşitsizliğin genellenmiş
şeklidir. Bir şans değişkenin olasılık dağılımından bağımsız sadece beklenen değer ve varyans
bilgileri kullanılarak şans değişkeni ile ilgili bazı olasılık eşitsizlikleri elde edilebileceği, Rus
matematikçisi Chebyshev tarafından ispatlanmıştır.
Teorem: Şans değişkeni X’in bir olasılık dağılışına ve sonlu varyansa sahip olduğu
varsayılsın, (bu durumda mutlaka sonlu bir anakütle ortalaması vardır). Bu koşul altında her
k  0 için,
a) Markov eşitsizliği, g x  x   , r  0 alınarak,
r

 Exk   .
r
Pr x    k r 
r
r
b) Markov eşitsizliğinde özel durum olarak r  2 alınarak,
8

 Exk   
2
Pr x     k 2 
2
2

2
k2
ve k  c alınarak,

2

2

Pr x     c 2 2 

1
c2
Pr x     c 2 2  1 
1
c2
ve sonuç olarak
Pr c  x    c   1 
1
.
c2
bulunur. Burada c değeri birden büyük olarak alınır. Yukarıda verilen teoreme göre  ile  ,
X rassal değişkeninin ortalaması ve standart sapması ise, herhangi bir pozitif c sabiti için X’in
ortalamanın iki yanında c standart sapma aralığında bir değer alabilme olasılığı en az 1 
1
c2
kadardır.
Örneğin, X rassal değişkeninin ortalamanın her iki yanında, iki standart sapma aralığında bir
değer alma olasılığı en az 1-(1/22)=3/4; 3 standart sapma aralığında bir değer alma olasılığı
1-(1/32)=8/9; 5 standart Sapma aralığında bir değer alma olasılığı 1-(1/52)=24/25 olur. Elde
edilen sonuçlar şans değişkeninin standart sapmasının, değişkenin yayılımını etkileyen önemli
bir faktör olduğunu belirtmektedir.
Chebyshev teoreminin verdiği olasılığın bir alt sınır olduğu açıktır. Belli bir rassal değişkenin
ortalamanın iki yanında c standart sapma aralığında bir değer alma olasılığının 1-(1/c2)’den
büyük olup olmadığını bilinemez ama Chebyshev teoremi bu olasılığın kesinlikle 1-(1/c2)’den
9
küçük olamayacağını söyler. Bir rassal değişkenin dağılımı bilinirse ancak o zaman tam
olasılık hesaplanabilir.
3.6.2 Jensen EĢitsizliği
Şans değişkeninin g(x) ile tanımlanan bir fonksiyonunun gerçek dağılışı hesaplanmadan
E g x  ile g E  X  arasındaki ilişki belirlenebilir. g x   ax  b doğrusal dönüşümün de
Eg x   g E  X  olduğu bilinmektedir. Fakat bu eşitliği başka g fonksiyonları için kullanmak
yaygın bir yanlıştır. Aslında bu eşitlik doğrusal olmayan g için oldukça ender ortaya çıkar.
Örneğin, mikro elektronik parçalar üreten bir firmanın günlük üretim hedefinin 240 çip
üretmek olduğu fakat ardışık üç günde sırasıyla 40, 60 ve 80 çip ürettiği varsayılsın. Bu üç
günün ortalama üretimi 60 çiptir ve hedef değere ulaşılabilmesi için bu ortalamanın 4 katı
üretim yapılması gerekmektedir. Bir başka bakış açısı da şudur: belirtilen 3 günde üretim
miktarı sırasıyla 240/40 = 6, 240/60 = 4 ve 240/80 = 3 kat fazla olmalıydı. Bu değerlerin
ortalaması alındığında,
1
6  4  3  4.3333
3
kat fazla üretim yapılmalı. (Burada X, gerçekleştirilmiş üretim miktarıdır ve üç çıktı değeri
1/6, 1/4 ve 1/3’ü eşit olasılıkla alabilmektedir.) Yukarıdaki ifadeler pozitif değerler alan bir
şans değişkeni X ile açıklanırsa V  X   0 olmadıkça her zaman,
1
1
 E 
EX 
X
eşitsizliği geçerlidir. Bu eşitsizlik 0,   aralığında g  x   1 x durumunu göstermektedir ve
aşağıdaki sonuçlar tüm konveks g fonksiyonları için geçerlidir.
Tanım (Jensen Eşitsizliği): g konveks bir fonksiyon ve X bir şans değişkeni olmak üzere,
g E  X   Eg x  .
İki kez türevlenebilen g fonksiyonu A kümesinde, A  0,   tanımlı tüm x’ler için g x   0
ise zayıf konveks, g x   0 ise güçlü konvekstir. X, değerlerini A kümesinden alan bir şans
değişkeni ve g fonksiyonu da güçlü konveks ise güçlü eşitsizlik g E  X   Eg x  geçerlidir.
10
Örneğin yukarıdaki şekilde sadece a ve b değerleri alan bir X şans değişkeni için bu sonuçlar
gösterilmiştir. X şans değişkeni a ve b değerlerini sırasıyla 3/4 ve 1/4 olasılıkla almaktadır. g
fonksiyonunun
konveks
olması
dolayısıyla
şekildeki
iki
nokta
bir
doğru
ile
birleştirilebilmektedir. Böylece a, g a  ’dan b, g b  ’ye bir doğru çizilirse,
E  X , Eg x    3 a  1 b, 3 g a   1 g b  3 a, g a   1 b, g b
4
4
4
4

4
4
g fonksiyonun grafiğinde bu nokta E  X , Eg x  noktasının yukarısında yer alır. Böylece
g E  X   Eg x  olur.
Basit bir örnek de g  x   x 2 ’dir. Bu fonksiyon konveks olduğu için [ g x   2 , tüm x’ler
için],
E  X 2  E X 2 
Bu eşitsizlik V  X   E X 2   E  X 2  0 eşitsizliğinin doğru olduğunu kanıtlamaktadır.
3.7 MOMENTLER
Moment terimi fizik biliminden gelmektedir. Moment bir f(x) frekansının (kuvvetinin) x birim
uzaklıkta olduğu bir nokta üzerinde oluşturduğu etkidir. Momentler, bir şans değişkenin
dağılışının kesin şeklini belirler. Bir dağılımın momentleri şans değişkeninin kuvvetlerinin
beklenen değeridir. Momentler genel olarak üç grupta incelenir.
1. Orijine göre momentler
2. Merkezi momentler
3. Herhangi bir a noktasına göre momentler
Tanım (Orijine göre moment): X rassal değişkeninin  r ile gösterilen, sıfır noktası
dolayındaki r-inci momenti, x r fonksiyonunun beklenen değeridir.
11
 r  E ( X r )   x r f ( x)
x
r  E ( X r )   x r f x dx
En çok kullanılan iki özel durum:
  
r  0 iken 0  E X 0  f x dx  1
r  1 iken  '1  E ( X )   xf x dx
olur. Bu da X rassal değişkeninin beklenen değerinden başka bir şey değildir.
Tanım : 1 ifadesine X dağılımının anakütle ortalaması ya da kısaca X şans değişkeninin
ortalaması denir ve  ile gösterilir.
Tanım (Merkezi moment): X şans değişkeninin  ile gösterilen, ortalama dolayındaki r-inci
momenti, x   fonksiyonunun beklenen değeridir, r  0,1,2, için
 r  E[( X   ) r ]   ( x   ) r f ( x)
x

r  E[( X   ) ]   ( x   ) r f ( x)dx
r

Teorem:  değeri var olan her rassal değişken için  0  1
ve 1  0 eşitlikleri daima
geçerlidir.
İspat: Merkezi birinci moment;
1  E[( X   )]

  xf ( x)dx    f ( x)dx
 ( x   ) f ( x)dx
0
Bu sonuç tanımlayıcı istatistikten bilinen, aritmetik ortalamadan sapmaların toplamının sıfır
olmasının teorik ispatıdır.
Bir dağılımın tüm momentleri ile ilgili bilgi bu dağılımı eşsiz olarak belirler. Ortalama
dolayındaki ikinci moment, bir rassal değişken dağılımının yayılımının bir göstergesi
olduğundan istatistikte özel bir önem taşır. Merkezi ikinci moment şans değişkeninin


2  E  X   2  V  X 
varyansıdır. Bir dağılımın varyansı, dağılımın ortalama etrafındaki yoğunluğunun ölçümünü
verdiği daha önce açıklanmıştı.
Tanım (Herhangi Bir a Noktasına Göre Momentler): X şans değişkeninin, bir a noktası
etrafındaki r-inci momenti, x  a r fonksiyonunun beklenen değeridir.
12


r  E  X  a r   x  a  f x 
r
x


 r  E  X  a r   x  a  f x 
r
x
Tanım: Eğer  r' mevcut ise k  r için  k' momentleri mevcuttur.
Tanımın bir sonucu olarak eğer E X 2  mevcut ise E  X  mevcuttur ve sonuçta V  X  bulunur.
Bu nedenle V  X  ’in varlığı E  X  ’in var olduğunu belirtir.
Teorem: Merkezi ikinci moment, yani varyans, daima herhangi bir a noktasına göre ikinci
dereceden momentten daha küçük veya ona eşittir. Buna varyansın minimum olma özelliği
denir:

 
E X     E X  a
2
2

ya da eşdeğer olarak

 
Min a E ( X  a) 2  E ( X  E ( X )) 2


 
İspat: E  X  a 2  E  X  E  X   E  X   a 2



 E X  E  X   EE  X   ba  2E  X   a EX  E  X 
 E X  E  X   E  X   a 
 E X  E  X   E  X   a   2E  X   a X  E  X 
2
2
2
2
2
2
Eşitliğin sağındaki ikinci terim daima pozitif olup ancak ve ancak E  X   a olduğunda sıfır
alabilir.
Teorem: Eğer X bir şans değişkeni ise;
Min a E X  a  E X  med .
3.7.1 Merkezi Momentlerin Orijine Göre Momentler Cinsinden Hesabı:
Hesaplama kolaylığı açısından merkezi momentler orijine göre momentler cinsinden
bulunabilir. Orijine göre momentlerle merkezi momentler arasındaki ilişki Binom teoremi
kurulanarak bulunabilir. Bilindiği gibi binom açılımı;
n
 n
(a  b) n    b i a ni
i 0  i 
olup bu açılım ortalamaya göre momentlerde kullanıldığında;
x   r   (1) i  i x r i 
r
i 0
r

i
sonuç olarak,
13

 
E X    
r



r
  1i  i E X r  i
 
r r
  1i  i  r'  i
i 0  i 
 
r
i 0  i

Teorem: Eğer r  2 alınırsa  2   2   2
'

 

İspat :  2  E ( X   ) 2  E X 2  2 X   2  E ( X 2 )  2E ( X )  E (  2 )
= E ( X 2 )  2   2   2 '   2 .
3.7.2 Orijine Göre Momentlerin Merkezi Momentler Cinsinden Hesabı:
Orijine göre momentler de merkezi momentler cinsinden hesaplanabilir ve
 ' r  E X r 
 E ( X   )   
r
 r

    E ( X   ) i  r i 
 i

r
     i  r i
i
olarak bulunur.
3.7.3 Momentlere Dayanan Asimetri ve Basıklık Ölçüleri
Bir olasılık dağılımının biçimi ile ilgili ek bilgiler üçüncü ve dördüncü merkezi momentler
yardımı ile elde edilebilir. Bu ek bilgiler genellikle dağılımın çarpıklık ve basıklığı olarak
adlandırılır. Bir frekans dağılışının ortalama değerine göre simetriden ayrılış derecesine
asimetri ya da çarpıklık denir. Asimetri ölçüleri için beklenen temel özellikler:
a) Değişkenin ölçme biriminden bağımsız olmalı
b) Dağılım simetrik olduğunda sıfır değerini almalı
X şans değişkeninin üçüncü merkezi momenti,

3  E  X   3

kullanılarak asimetriyi ölçebilmek için 1 ölçüsü Pearson tarafından tek modlu dağılımlar için
bulunmuştur:
1 
3 2  3 2
2 3  2 3
Bu parametre değişkenin ölçü biriminden bağımsızdır. Simetrik dağılışlarda 1  0 ve
asimetrik dağılışlarda 1  0 eşitsizliği daima sağlanır.
1 parametresininin işaret eksikliğini gidermek için Fisher tarafından standartlaştırılmış
üçüncü moment ya da diğer adıyla çarpıklık katsayısı önerilmiştir:
14
1 
3

 33
32
2  
1 parametresi de değişkenin ölçü biriminden bağımsızdır. Simetrik dağılışlarda  1  0 olup,
sağa çarpık dağılışlarda  1  0 , sola çarpık dağılışlarda  1  0 eşitsizlikleri sağlanır.
3  0
olduğu halde simetrik olmayan dağılışlarda mevcuttur. Bunun nedeni aşırı
büyüklükteki uç değerlerin aritmetik ortalamaya etki edip, onu büyütüp, küçültmeleridir.
E  X  değerinde oluşan bu değişme 3’e yansımaktadır.
Bir dağılışın modunun, aynı beklenen değer ve varyansa sahip bir normal dağılımın moduna
göre daha aşağıda ya da daha yukarıda bulunmasına basıklık farkı denir. Dağılışın tepe
noktası normal dağılımdan daha yüksekse sivri, alçaksa basık dağılımdır. Sivri dağılımda
beklenen değer etrafında yoğunlaşma daha fazladır.
X şans değişkeninin dördüncü merkezi momenti:

 4  E  X   4

kullanılarak basıklığı ölçebilmek için 2 ölçüsü Pearson tarafından tek modlu dağılımlar için
bulunmuştur:
2 
4

 42
2
 2   2
 
15
Bu parametre değişkenin ölçü biriminden bağımsızdır. Normal dağılışlarda  2  3 , normale
göre basık dağılışlarda 1   2  3 , normale göre sivri dağılışlarda ise  2  3 eşitsizlikleri
sağlanır. Fisher basıklık ölçüsü ise
 2  2  3
olup değişkenin ölçü biriminden bağımsızdır. Normal dağılışlarda  2  0 , normale göre basık
dağılışlarda  2  0 , normale göre sivri dağılışlarda  2  0 eşitsizlikleri sağlanır.
Bir ya da bir kaç tane momentin dağılış hakkında verdiği bilgi sınırlıdır. Aşağıdaki şekil ilk
dört momenti eşit olan iki dağılımı göstermektedir. Bununla birlikte momentlerin bütün bir
seti 1, 2 , dağılımı tam olarak belirler.
Şans değişkeni X, standart değişkene dönüştürülürse;
Z
X 

E Z   0 olduğu için Z değişkeninin merkezi momentleri ile orijine göre momentleri eşittir.
Bu özellik kullanılarak Z değişkeninin r-inci merkezi momenti, X değişkeninin r-inci merkezi
momenti cinsinden ifade edilebilir:
 X    r  1
r
   r [E( X   ) ]
    
 r ( z )  E ( Z r )  E 

µr ( x)

r

µr ( x)
[  2 ( x)]r / 2
Sonuç olarak, V (Z )  2 ( z )  1 elde edilir. Görüldüğü gibi bir X
şans değişkeninin
standartlaştırılması ortalama ve varyansı etkilemekte fakat
 1 ( z )   1 ( x)
 2 ( z )   2 ( x)
standartlaştırılmış üçüncü ve dördüncü momenti etkilememektedir.
16
3.8 ÇOK DEĞĠġKENLĠ DAĞILIMLAR ĠÇĠN BEKLENEN DEĞER
Beklenen değer ve varyans kavramları çok değişkenli durum için de genellenebilir. Örneğin
bir Z şans değişkeni X1 ve X2 gibi iki şans değişkeninin z  f x1 , x2  ya da daha genel olarak
X1 , X 2 ,, X k sonlu sayıdaki şans değişkenlerinin bir fonksiyonu f x1 , x2 ,, xk  olarak ortaya
çıkabilir. Bu gibi durumlarda gereksinim duyulabilecek bazı önemli teoremler aşağıda
verilmiştir.
Teorem: X1 ve X2 şans değişkenleri, f x1, x2  bunların ortak olasılık fonksiyonları ise X1’nin
ve X2’nin beklenen değeri:
E  X1  
 x f x , x 
1
x1
E  X1  
1
EX 2  
2
x2
 x f x , x 
2
x2
  x f x , x dx dx
1
1
2
2
EX 2  
1
x1 x 2
1
2
x1
  x f x , x dx dx
2
1
2
1
2
.
x 2 x1
Teorem: X1 ve X2 şans değişkenleri, f x1 , x2  bunların ortak olasılık fonksiyonları ise ve
marjinal dağılımlar f x1 x1  ile f x2 x2  biliniyorsa X1 ve X2 şans değişkenlerinin beklenen
değeri:
E  X1  
 x f x 
1 x1
E X 2  
1
x1
 x f x 
2 x2
2
x2
E  X 1   x1 f x1 x1 dx1
E  X 2   x2 f x2 x2 dx2 .


x1
x2
Teorem: X1 ve X2 şans değişkenleri, f x1 , x2  bunların ortak olasılık fonksiyonları ise:
E  X1  X 2   E  X1   E  X 2 
İspat:
Sadece kesikli şans değişkenleri için gerçekleştirilecektir. X1 ve X2 şans
değişkenlerinin aldıkları değerler sırası ile a1 , a2 , ve b1 , b2 , olsun,
E X1  X 2  
 a  b f X
i
i

 a f X
i
i

1
 ai , X 2  b j
1

 b f X
 ai , X 2  b j 
j

i
j
i
 a  f X
i

j
j

1
j

 ai , X 2  b j  

1
 ai , X 2  b j

j
  b  f X
j
j

i
1

 ai , X 2  b j 


 a f x    b f x 
i x1
1
i
j x2
2
j
 E  X1   E  X 2 
Yukarıdaki teoremden görüldüğü gibi beklenen değer işlemi doğrusal bir işlemdir. Diğer bir
ifade ile şans değişkenlerinin toplamlarının beklenen değeri, daima ayrı ayrı beklenen
17
değerlerin toplamına eşittir. Bu eşitliğin geçerli olabilmesi için şans değişkenlerinin bağımsız
olması şart değildir. Bu teoremin daha genel yapısı aşağıdaki tanımda verilmiştir.
Tanım (Beklenen değerin doğrusallık özelliği): X1, X 2 ,, X k şans değişkenleri ve c1 , c2 ,, ck
ile b sabitler olmak üzere,
E c1 X1  c2 X 2    ck X k  b  c1E  X1   c2 E  X 2     ck E  X k   b
eşitliği daima geçerlidir.
Teorem: X1 ve X2 şans değişkenleri, f x1 , x2  bunların ortak olasılık fonksiyonları ise şans
değişkenlerinin her hangi bir g x1 , x2  fonksiyonunun beklenen değeri kesikli ve sürekli şans
değişkenleri için:
Eg x1 , x2  
 g x , x f x , x 
1
x1
Eg x1 , x2  
2
1
2
x2
  g x , x  f x , x dx dx
1
2
1
2
2
1
.
x1 x 2
Teorem: X1, X 2 ,, X k şans değişkenleri, f x1 , x2 ,, xk  bunların ortak olasılık fonksiyonları
ve c1 , c2 ,, ck sabitler olmak üzere şans değişkenlerinin her hangi bir g x1 , x2 ,, xk 
fonksiyonunun beklenen değeri kesikli ve sürekli şans değişkenleri için:


E  ci g x1 , , x k    ci Eg x1 , , x k 
 i
 i
eşitliği sağlanır.
3.9 ÇOK DEĞĠġKENLĠ DAĞILIMLAR ĠÇĠN KOġULLU BEKLENEN
DEĞER
X1 ve X2 ortak olasılık fonksiyonları f x1 , x2  olan iki şans değişkeni olsun. Eğer tüm X1
değerleri için f x1 x1   0 ise koşullu ortak olasılık fonksiyonu f x1 / x2  tanımlıdır. Bu koşul
altında tüm X2 değerleri üzerinden X1 şans değişkenin koşullu beklenen değeri (orijine göre
birinci momenti) E  X1 / X 2  x2  ile gösterilir.
Teorem: X1 şans değişkeni ve f x1 / x2  ’de verilen X2 değeri için X1’in şartlı olasılık
fonksiyonu ve f x2 / x1  fonksiyonu verilen X1 değeri için X2’in şartlı olasılık fonksiyonu ise
X1’in ve X2’nin şartlı beklenen değeri kesikli ve sürekli şans değişkenleri için:
E  X1 / X 2  
 x f x / x 
1
1
2
E X 2 / X1  
 x f x
2
2
/ x1 
x1
x2
E  X 1 / X 2   x1 f x1 / x2 dx1
E  X 2 / X 1   x2 f x2 / x1 dx2

x1

x2
18
Verilen X2 değeri yerine konduğunda E  X 1 / X 2  sabit bir sayıdır, başka bir deyişle şartlı
beklenen değer X2 değişkeninin bir fonksiyonudur. Benzer şekilde E  X 2 / X 1  ‘de X1’in bir
fonksiyonudur. E  X 2 / X 1  , X1’in belli bir değeri için sabit, fakat x’in değişen değerlerine bağlı
olarak değiştiği için bir şans değişkenidir. E  X 2 / X 1  ’in dağılımının beklenen değeri
EE  X 2 / X1  olup, E  X 2 / X 1  regresyon fonksiyonu olarak da adlandırılır.
Teorem: Koşullu dağılımların beklenen değerlerinin beklenen değeri için, eğer E  X 2  ve
E  X 2 / X 1  mevcut ise, X2 şans değişkeni için beklenen değer;
E  X 2   EE  X 2 / X1 
eğer E  X 1  ve E  X 1 / X 2  mevcut ise, X1 şans değişkeni için beklenen değeri;
E  X1   EE  X1 / X 2  .
İspat: E  X 2 / X 1    x2 f x2 / x1 dx2 değerinin X1 değişkeninin bir fonksiyonu olduğu belirtildi.
x2
Bu nedenle ikinci beklenen değer işlemi X1 şans değişkeni üzerinden uygulanır.


E E  X 2 / X 1    x2 f x2 / x1 dx2  f x1 x1 dx1


x1  x 2

 
  x f x

2
2
/ x1  f x1 x1 dx2 dx1
x1 x 2

  x f x , x dx dx
2
1
2
2
1
x1 x 2
 EX 2 
Teorem: X1 ve X2 şans değişkenleri ve f x2 / x1  ’de verilen X1 değeri için X2’in şartlı olasılık
fonksiyonu ve g x2  , X2 şans değişkeninin bir fonksiyonu ise verilen X1 değeri için g x2  ’in
şartlı beklenen değeri:
Eg  X 2  / X1  
 g x  f x
2
2
/ x1 
x2
Eg  X 2  / X 1   g x2  f x2 / x1 dx2 .

x2
Teorem: g  X 2  , X2 şans değişkeninin bir fonksiyonu olmak üzere,
Eg  X 2   EEg  X 2  / X1 
İspat: Eg  X 2  / X1    g x2  f x2 / x1 dx2 değeri X1 değişkeninin bir fonksiyonu olduğundan
x2
ikinci beklenen değer işlemi X1 şans değişkeni üzerinden uygulanır.
19


E E g  X 2  / X 1    g x2  f x2 / x1 dx2  f x1 x1 dx1


x1  x 2

 

  g x  f x
2
2
/ x1  f x1 x1 dx2 dx1
x1 x 2

  g x  f x , x dx dx
2
1
2
2
1
x1 x 2
 Eg  X 2 
Teorem: X1 ve X2 şans değişkenleri ve g x1  , X1 şans değişkeninin bir fonksiyonu ise E  X 2 
sonlu olmak üzere X1 şans değişkeninin tüm değerleri için,
EX 2 g x1  / X1   g x1 EX 2 / X1 
tanımlıdır.
İspat: EX 2 g x1  / X1   g x1   x2 f x2 / x1 dx2
x2
 g x1 EX 2 / X1 
elde edilir.
Bu teoremin özel bir durumu x2  1 ile tanımlanır. Diğer bir deyişle,
Eg x1  / X 1   g x1  f x2 / x1 dx2

x2
 g x1 
Burada f x2 / x1  ’nin bir olasılık yoğunluk fonksiyonu olduğu unutulmamalıdır.
Teorem: Eğer X1 ve X2 şans değişkenleri stokastik bağımsız ise, diğer bir deyişle
f x1 , x2   f x1 x1  f x 2 x2 
ise, veya şartlı ve şartsız dağılımlar arasında fark yoksa:
E  X1 / X 2   E  X1 
E  X 2 / X1   E  X 2 
eşitlikleri geçerlidir.
3.10 ĠKĠ ġANS DEĞĠġKENĠ ĠÇĠN ÇARPIM MOMENTLERĠ
Bu kısımda iki şans değişkeninin ortak dağılımı dikkate alınarak şans değişkenlerinin çarpım
halindeki momentleri elde edilecektir.
Tanım (İki şans değişkeninin orijine göre çarpım momenti): X1 ve X2 şans değişkenlerinin
ortak olasılık fonksiyonları f x1 , x2  ise orijin civarındaki r-inci ve s-inci dereceden orijine
20
göre çarpım momentleri  r , s ile gösterilir ve x1r x2s fonksiyonunun beklenen değeri ile elde
edilir:

 r , s  E X 1r X 2s

Kesikli ve sürekli şans değişkenleri için sırasıyla;


r , s  E X1r X 2s   x1r x2s f x1 , x2 
x1

x2

r , s  E X1r X 2s    x1r x2s f x1 , x2 dx2 dx1
x1 x 2
eşitlikleri ile tanımlanır. Çarpım momentleri marjinal (tek değişkenli) momentlere
dönüşebilir. Örneğin s  1 alınarak 1,0  E  X1  ya da r  1 alınarak 0 ,1  E  X 2  ile
tanımlanabilir. Özel bir durum r  s  1 ise ortaya çıkar ve
1,1  E  X 1 X 2 
ile gösterilir.
Teorem: Z1 ve Z2 şans değişkenleri için,
E Z1   E Z 2   0 , V Z1   V Z 2   1
koşulları sağlanıyor (standart değişkenler) ise,
a)  1  E Z1Z 2   1 ya da E Z1Z 2 2  1
b) E Z1Z 2   1 ancak ve ancak Pz1  z2   1 ise,
E Z1Z 2   1 ancak ve ancak Pz1   z2   1 ise,
eşitsizlik ve eşitlikleri sağlanır.
İspat: a şıkkı için ilk olarak aşağıdaki eşitsizlik ele alınsın,

 

0  E Z1  Z 2   E Z12  2Z1Z 2  Z 22  2  2 E Z1Z 2 
2
 2  2E Z1Z 2 
1  E Z1Z 2 
bulunur. İkinci olarak,

 

0  E Z1  Z 2   E Z12  2Z1Z 2  Z 22  2  2 E Z1Z 2 
2
 2  2E Z1Z 2 
 1  E Z1Z 2 
elde edilir ve bu iki sonuç birlikte kullanılarak ispat tamamlanır. Teoremin b şıkkı için ise
Pz1  z2   1 alındığında,
 
E Z1Z 2   E Z12  V Z1   1
21
Pz1   z2   1 alındığında,
 
E Z1Z 2    E Z12  V Z1   1
elde edilerek ispat tamamlanır. Yukarıdaki ispat ters yönden de gerçekleştirilebilir: ilk olarak
E Z1Z 2   1 alınsın bu durumda,



V Z1  Z 2   E Z1  Z 2   E Z1  Z 2   E Z1  Z 2 
2
2

2


 E Z12  2Z1Z 2  Z 22  2  2 E Z1Z 2 
0
elde edilir. İki şans değişkeni arasındaki varyansın sıfır olabilmesi için Z1  Z 2 diğer bir
deyişle Pz1  z2   1 olmalıdır. E Z1Z 2   1 için ise V Z1  Z 2   0 olduğu görülebilir ve bu
durum için sonuç olarak Pz1   z2   1 elde edilebilir.
Eğer Z1  Z 2 ise,
Z1 
X 1   x1
 x1
, Z2 
X 2   x2
 x2
alınarak,
X 2   x2 
 x2
X   x1 
 x1 1
yazılabilir. Yukarıda Pz1  z2   1 ve Pz1   z2   1 için elde edilen sonuçlar, a bir sabit
olmak üzere, Z 2  Z1  a  ve Z 2  Z1  a  için de geçerlidir. Örneğin Z 2  Z1  a ise,
 
E Z1Z 2   EZ1 Z1  a   E Z12  aE Z1   1
ya da
V Z 2  Z1   V a   0
bulunabilir. Bu durumda,
X 2   x 2  a x 2 
 x2
X   x1 
 x1 1
ya da eşitliğin sağındaki ilk iki terim sabit olduğundan,
X2   
 x2
X   x1 
 x1 1
yazılabilir. Elde edilen sonuçların şans değişkenlerinin kovaryans ve korelasyonu ile ilişkisi
Kısım 3.11’de verilmiştir.
Teorem: X1 ve X2 bağımsız şans değişkenleri, f x1, x2  bunların ortak olasılık fonksiyonları
ise:
E  X1 X 2   E  X1 E  X 2  .
22
İspat: Sadece kesikli şans değişkenleri için verilecektir:
E  X1 X 2  
 x x f x , x 
1 2
x2
1
2
x1
Eğer şans değişkenleri bağımsız ise f x1 x1  ve f x2 x2  marjinal olasılık fonksiyonları olmak
üzere ortak olasılık fonksiyonu;
f x1 , x2   f x1 x1  f x 2 x2 
ve
E  X1 X 2  
 x x f x  f x 
1 2 x1
x2



1
x2
2
x1

 x f x   x
1 x1
x1
1
  x2
2 f x2

x2 

 E  X 1 E  X 2 
Teorem: X1, X 2 ,, X k sonlu sayıdaki bağımsız şans değişkenleri, f x1 , x2 ,, xk  bunların
ortak olasılık fonksiyonları ise çarpımlarının beklenen değeri
E  X1 X 2  X k   E  X1 E X 2  E X k 
şeklinde elde edilir.
Tanım (İki şans değişkeninin merkezi çarpım momenti): X1 ve X2 şans değişkenlerinin olasılık
fonksiyonları f x1 , x2  ise orijin civarındaki r-inci ve s-inci dereceden merkezi çarpım
momentleri  r , s ile gösterilir ve X 1  E  X 1 r X 2  E  X 2 s fonksiyonunun beklenen değeri ile
elde edilir:

 r ,s  E X 1  E  X 1 r X 2  E  X 2 s

Kesikli ve sürekli şans değişkenleri için sırasıyla;


r , s  E X1  E X1 r X 2  E X 2 s  X1  E X1 r X 2  E X 2 s f x1, x2 
x1

x2

r ,s  E X 1  E  X 1 r X 2  E  X 2 s    X 1  E  X 1 r X 2  E  X 2 s f x1 , x2 dx1dx2
x1 x2
Çarpım momentleri marjinal (tek değişkenli) momentlere dönüşebilir. Örneğin s  0 için
2,0  V  X1  ya da r  0 için 0, 2  V  X 2  ile tanımlanabilir.
Teorem (Cauchy-Schwarz eşitsizliği): Ortalamaları  x1 ve  x 2 , varyansları  x21 ve  x22 olan
X1 ve X2 şans değişkenleri için,
a)
EX
1

 E X
 x1 X 2  x2
  x1  x 2
1
  x1
   
X     
2
2
x1
2
ya da eşdeğer olarak,
2
x2
x2
x1
 x2
23
eşitsizlikleri geçerlidir.


 x2

X 1   x1   1 ise
 x1

b) ancak ve ancak P  X 2   x2 




E X 1   x1 X 2   x 2   x1 x 2 ,

ve ancak ve ancak P  X 2   x2 





 x2

X 1   x1   1
 x1

E X 1   x1 X 2   x 2   x1 x 2
eşitlikleri geçerlidir.
İspat: a şıkkı için, bir önceki teoremde,
E Z1Z 2 2  1 ya da
 1  E Z1Z 2   1
eşitsizlikleri ispatlanmıştı bu eşitsizliklerde standart değişkenler yerine konarak,

  X 1   x1
E 
 x1

 
 X 2   x 2

  x
2

 X 1   x
1
 1  E 
  x1
2
 
 
1
 
 

 X 2   x 2

  x
2


  1


ispat tamamlanır. b şıkkı için de benzer yaklaşım kullanılır.
Cauchy-Schwarz eşitsizliğinin daha fazla bilinen yapısı ise,
E  X 1 X 2 2  E X 12 E X 22 
şeklindedir.
3.11 KOVARYANS ve KORELASYON
İstatistikte özel öneme sahip bir merkezi çarpım momenti 1,1 ’ dir ve kovaryans olarak
adlandırılır. Kovaryans iki şans değişkeni arasındaki doğrusal ilişkinin bir ölçümünü verir.
Aralarındaki kovaryans sıfır olan şans değişkenlerine doğrusal ilişkisiz adı verilir. Stokastik
bağımsızlık doğrusal ilişkisizliği de otomatik olarak sağlar. Fakat doğrusal ilişkisizliğin
mutlaka stokastik bağımsızlık anlamına geleceği söylenemez. Tek istisna normal dağılmış
şans değişkenleridir. Normal dağılmış iki değişken doğrusal ilişkisiz ise aynı zamanda
stokastik bağımsızdır.
Tanım (Kovaryans): X1 ve X2 iki şans değişkeni ve onların ortalamaları sırası ile  x1 ve  x 2
ise, X1 ve X2 şans değişkenleri arasındaki kovaryans Cov  X1, X 2  ile ya da  x1 x 2 ile gösterilir
ve:


Cov  X 1 , X 2   E X 1   x1 X 2   x2

24
eşitliğinden elde edilir.
Teorem: İki şans değişkeni X1 ve X2 arasındaki kovaryans orijine göre çarpım momentleri
cinsinden de ifade edilebilir:
 x1 x 2  1,1  1,0 0 ,1
 1,1   x1  x 2 .
İspat: Beklenen değerle ilgili teoremler kullanılarak,

 E X X

 x1x2  E X 1   x1 X 2   x2 
1
2
 X 1 x 2  X 2  x1   x1  x 2

 E  X 1 X 2    x 2 E  X 1    x1 E  X 2    x1  x 2
 1,1   x1  x 2
Teorem: İki şans değişkeni X1 ve X2 bağımsız ise kovaryansları sıfıra eşittir,  x1 x2  0 .
İspat: Bağımsız şans değişkenleri için;
E  X1 X 2   E  X1 E  X 2 
olduğu için
 x1 x 2  1,1   x1  x2  E  X 1 X 2   E  X 1 E  X 2   0
Teorem: Eğer X1 ve X2 şans değişkenleri ve a ile b sabitler ise:
Cov aX 1, bX 2   abCov  X1, X 2 
Cov  X1  a, X 2  b  Cov  X1 , X 2 
Cov  X1, aX 1  b  aV  X1  .
İki değişken arasındaki kovaryans, değişkenlerin ölçülmesinde kullanılan birimlere bağlıdır.
İlişkinin ölçü birimlerinden arıtılmış ifadesi, ortak anakütle korelasyon katsayısıdır.
Tanım (Korelasyon): Ortalamaları  x1 ve  x 2 , varyansları  x21 ve  x22 olan X1 ve X2 şans
değişkenlerinin tanımladığı standart,
Z1 
X 1   x1
 x1
, Z2 
X 2   x2
 x2
değişkenler arasındaki kovaryans Cov Z1 , Z 2  ,  ile sembolize edilir,
 X 1   x
1



x1
  E 
 X 2   x 2

  x
2





ve korelasyon katsayısı olarak adlandırılır.
Yukarıdaki eşitlik dikkate alındığında korelesyon katsayısının orijinal X1 ve X2 şans
değişkenleri için,
25

Cov  X 1 , X 2 
 x1 x 2
şeklinde tanımlanabileceği de görülebilir.
Korelasyon katsayısının temel özellikleri:
1. Korelasyon katsayısı ‘nun işareti Cov  X1, X 2  ’nin işaretine göre değişir.
2. Cov  X1, X 2   0 ise   0 olur.
3. Korelasyon katsayısı  ‘nun alabileceği maksimum ve minimum değerler:
1    1
4.   1 olması X1 ve X2 arasında tam doğrusal ilişki bulunduğunu belirtir.
  1 durumunda x2  a  bx1 doğrusunun grafiği X1 ve X2’nin tüm olasılık dağılımını içerir.
Tüm x1 , x2  ikilileri bu doğrunun üzerindedir. Bu ekstrem durum için Px2  a  bx1   1 olur.
Ekstrem durum haricinde, X1 ve X2’nin tüm olasılık dağılımı x2  a  bx1 doğrusunun
çevresinde bir bant içindedir.
3.12 ÇOK DEĞĠġKENLĠ DAĞILIMLAR ĠÇĠN VARYANS
Beklenen değerdeki doğrusallık kuralının aksine V  X1  X 2  genellikle V  X 1   V  X 2 
değerine eşit değildir. V  X1  X 2  ’nin belirlenmesi için varyans tanımından hareketle,
V  X 1  X 2   EX 1  X 2  E  X 1  X 2 
2
ve eşitliğin sağındaki terim
X1  X 2  E  X1  X 2   X1  E X1   X 2  E  X 2 
şeklinde
düzenlenerek karesi alındığında,
X1  X 2  E  X1  X 2 2  X1  E  X1 2  X 2  E  X 2 2  2X1  E  X1 X 2  E  X 2 
Elde edilir ve her iki tarafın da beklenen değeri alındığında
V  X1  X 2   V  X1   V  X 2   2EX1  E  X1 X 2  E  X 2 
 V  X1   V  X 2   2Cov  X1 , X 2 
olur.
Teorem: X1 ve X2 şans değişkenleri, a ve b sabitler olmak üzere:
V aX 1  bX 2   a 2V  X 1   b 2V  X 2   2abCov  X 1 , X 2 
Şans değişkenleri doğrusal ilişkisiz ise Cov  X1, X 2   0 . Bu teoremin daha genel yapısı
aşağıdaki tanımda verilmiştir.
Tanım (Varyans-kovaryans matrisi): X1, X 2 ,, X k sonlu sayıdaki şans değişkenlerinin
tanımladığı k1 boyutlu bir şans vektörü xT   X 1 ,, X k  için varyans–kovaryans matrisi Σ olsun.
26
Her bir şans değişkeninin varyansı, V  X i  ve her hangi iki şans değişkeninin kovaryansı, Cov X i , X j 
olsun. Sonuç olarak k1 boyutlu bir şans vektörünün varyans-kovaryans matrisi kk boyutlu,


Σ  E x  E x x  E x 
T
 X 1  E  X 1  




 E 

X 1  E  X 1   X k  E  X k 
 X  E  X 

k 
 k

Cov  X 1 , X 2   Cov  X 1 , X k 
 V  X1 
Cov  X , X 
V X 2 
 Cov  X 2 , X k 
2
1










V X k  
Cov  X k , X 1  Cov  X k , X 2  
simetrik bir matristir. Şans değişkenlerinin toplamlarının varyansı ise 11 boyutlu bir skalerdir,


V  X 1  X 2    X k   E x  E x  x  E x 
T

 X1  E  X1   


 E X 1  E  X 1   X k  E  X k 







X

E
X
k 
 k

 V  X1     V  X k   2Cov  X1 , X 2     2Cov  X k 1 , X k  .
Teorem: X1, X 2 ,, X k sınırlı sayıdaki bağımsız şans değişkenleri ise,
V  X1  X 2    X k   V  X1     V  X k  .
Bu konuda daha detaylı bilgi Kısım 3.13’de verilmiştir.
Teorem: X1 ve X2 şans değişkenlerinin f x1 / x2  ve f x2 / x1  şartlı dağılışlarının varyansı:
a. V  X 1 / X 2   E X 12 / X 2   E  X 1 / X 2 2
b. V  X 2 / X 1   E X 22 / X 1   E  X 2 / X 1 2
eşitliklerinden ya da daha açık olarak kesikli ve sürekli şans değişkenleri için sırasıyla:


V X1 / X 2   


 x  E X
V  X1 / X 2  
1
1
x1
 x  E X
1
1/

2


/ X 2   f x1 / x2  , V  X 2 / X 1   




 x

X 2  f x1 / x2 dx1 , V  X 2 / X 1  
2
x1
2
x2
 x
2
2

 E  X 2 / X 1   f x2 / x1 



 E  X 2 / X 1  f x2 / x1 dx2
2
x2
İspat: Sadece (a) şıkkına ait sürekli değişkenler için verilmiştir.


 E X  2 X E  X / X   E  X / X  
  x  2 x E  X / X   E  X / X  f  X
V  X 1 / X 2   E X 1  E  X 1 / X 2 
2
2
2
1
2
1
1
1
2
1
2
2
1
1
2
1
2
1/
X 2 dx1
x1
27
 x12 f  X 1 / X 2 dx1  2E  X 1 / X 2  x1 f  X 1 / X 2 dx1  E  X 1 / X 2 


x1
x1

 E X

  E X
2
 f X
1
/ X 2 dx1
x1
 E X 12 / X 2  2 E  X 1 / X 2 E  X 1 / X 2   E  X 1 / X 2 
2
1
/ X2
2
/ X 2  .
2
1
Koşullu beklenen değerin varyansının elde edilmesi ile ilgili önemli bir teorem de aşağıda
verilmiştir.
Teorem: X1 ve X2 şans değişkenleri, E  X 2  ise sonlu olsun. E  X 2 / X 1  mevcut ise,
V  X 2   EV  X 2 / X1   V E  X 2 / X1  .
Son eşitlikte, X2 şans değişkeninin varyansı iki farklı varyansın toplamı olduğu görülmektedir.
İlki X2 şans değişkeninin değişen X1 değerleri için şartlı varyanslarının beklenen değeri.
İkincisi ise X2 şans değişkeninin değişen X1 değerleri için şartlı dağılımlarına ait
ortalamalarının varyansıdır.
İspat: E  X 2    x 2 olarak tanımlansın.

V  X 2   E X 2   x2

2


 E X 2  E X 2 / X1   E X 2 / X1   x2


2
 
 E X 2  E X 2 / X1   E EX 2 / X1   x2
2
  2EX
2
2
Bu eşitlikteki son bileşen,




 E X 2 / X1  E X 2 / X1   x2



E X 2  E X 2 / X1  E X 2 / X1   x2  EX 2 E X 2 / X1   x2 E X 2   E E X 2 / X1   x2 EE X 2 / X1 

2

 EEX 2 E X 2 / X1  / X1  x2 EE X 2 / X1   E E X 2 / X1   x2 EE X 2 / X1 
2
olup burada,
EX 2 E  X 2 / X 1  / X 1   E  X 2 / X 1 E  X 2 / X 1   E  X 2 / X 1 
2
alınarak,
 





E X 2  E X 2 / X1  EX 2 / X1   x2  E E X 2 / X1   x2 EE X 2 / X1   E E X 2 / X1   x2 EE X 2 / X1 
2
2
0
elde edilir. Bu durumda,


 
 EX  E X / X   EE X / X     
 EX  2 X E X / X   E X / X   EE X
V  X 2   E X 2  E X 2 / X1   E E X 2 / X1   x2
2
2
2
2
2
1
2
1
x2
2
2
2
 
Burada E X   E E X
2
2
2
1
2
1
/ X1   EE( X 2 / X1 )
2
2

 E X 22  2 E  X 2 E E  X 2 / X 1   EE  X 2 / X 1 E E  X 2 / X 1   V E  X 2 / X 1 
2
2
2
2

/ X 1 ve E  X 2   EE  X 2 / X1  olduğu hatırlanarak,
28

 E E X

V  X 2   E E X 22 / X 1  E E  X 2 / X 1 E E  X 2 / X 1   V E  X 2 / X 1 
2
2


/ X 1  E  X 2 / X 1   V E  X 2 / X 1 
2
 EV  X 2 / X1   V E  X 2 / X1 
elde edilerek ispat tamamlanır.
Bu teoremin önemli bir sonucu olarak, EV  X 2 / X1   0 eşitsizliği daima sağlanacağı için,
V  X 2   V E  X 2 / X1 
eşitsizliği yazılabilir.
3.13 ġANS DEĞĠġKENLERĠNĠN DOĞRUSALKOMBĠNASYONLARININ
MOMENTLERĠ
Bazı durumlarda n adet şans değişkeninin X1, X 2 ,, X k doğrusal kombinasyonundan ortaya
çıkan bir Y1 şans değişkeninin beklenen değer ve varyansı ile ya da n adet şans değişkeninin
tanımladığı iki doğrusal kombinasyondan elde edilen iki şans değişkeni Y1 ve Y2 arasındaki
kovaryans ile ilgilenilebilir. Bu konu özellikle istatistiksel yorumlama da önemlidir.
Teorem: Eğer X1, X 2 ,, X k şans değişkenleri ve c1 , c2 ,, ck ile d1 , d 2 ,, d k sabitler olmak
üzere bu şans değişkenlerinin doğrusal fonksiyonu olarak;
y1 
k
c x ,
i i
y2 
k
d x
i i
i 1
i 1
tanımlanan iki şans değişkeni Y1 ,Y2 olsun.
n
a) E Y1    ci E  X i 
i 1
b) V Y1    ci2V  X i   2 ci c j CovX i , X j 
k
i 1
i  j k
c) CovY1 , Y2    ci diV  X i   2 ci d j CovX i , X j .
k
i 1
i  j k
İspat: a şıkkı için beklenen değerin doğrusallık özelliği kullanılarak,
 k

E Y1   E  ci X i 
 i 1



k
 a EX  .
i
i
i 1
Teoremin b şıkkı için,

V Y1   E Y1  E Y1 
2
2
k
k

 


 E  ci X i  ci E  X i  
i 1
 

 i 1




29
2
k

 


 E  ci X i  E  X i  
 

 i 1


Köşeli
parantezin
içinin
açılması
çokterimli
bir
ifadenin
açılımıdır.
Örneğin
x  y  z 2  x 2  y 2  z 2  2 xy  2 xz  2 yz gibi:
k


2
V Y1   E  ci2 X i  E  X i  

i j
 i 1
 c c X


 c EX
k
2
i
i 1
i


 E  X i  X j  E X j 



  c c EX
 E  X i  
2
i
i j
i j
i
 

 
 E  X i  X j  E X j
i j
Varyans ve kovaryansın tanımı kullanılarak,
V Y1  
 c V X    c c CovX , X 
k
2
i
i
i j
i 1
i
j
i j
ve Cov X i , X j   Cov X j , X i  olduğundan,
V Y1  
 c V X   2 c c CovX , X 
k
2
i
i
i j
i 1
i
j
i j k
Teoremin c şıkkı için,
Cov Y1 , Y2   EY1  E Y1 Y2  EY2 
k


 k
  k

 E  ci X i  E ci X i   d j X j  E

 i1
  j 1


 i1


 k
 E  ci X i 
 i1


 k
ci E  X i   d j X j 
i 1
  j 1
k


 
 k
 E 
 i 1
k
 c d X

i
j
j 1
 c d EX
k
k
i
j
i
i



 d E X  
k
j
j 1
 k
 k
 E  ci X i  E  X i   d j X j  E X j
 i 1
  j 1

 

d j X j  

j 1
 

k
j


  
 
 
 E  X i  X j  E X j  
 


 
 
 E  X i  X j  E X j
i 1 j 1

 c d CovX , X 
k
k
i
j
i
j
i 1 j 1
Burada, Cov  X i , X i   V  X i  olduğundan,
CovY1 , Y2  
 c d V X   2 c d CovX , X .
k
i i
i 1
i
i
j
i
j
i  j k
30
Teorem: Eğer X1, X 2 ,, X k şans değişkenleri birbirinden bağımsız ve c1 , c2 ,, ck sabitler ise;
Y1 
k
c x
i i
i 1
ile tanımlanan şans değişkeninin varyansı;
V Y1  
k
 c V X  .
2
i
i
i 1
Teorem: Eğer X1, X 2 ,, X k şans değişkenleri birbirinden bağımsız ve c1 , c2 ,, ck ile
d1 , d 2 ,, d k sabitler ise;
Y1 
k

ci xi ve Y2 
i 1
k
d x
i i
i 1
şeklinde tanımlanan iki şans değişkeni arasındaki kovaryans,
Cov Y1 , Y2  
k
 c d V X  .
i i
i
i 1
3.14 FAKTÖRĠYEL MOMENTLER
Özellikle kesikli şans değişkenlerinin momentlerinin bulunmasında faydalı olan bir yaklaşım
dağılımın faktöriyel momentleridir. İlk olarak şans değişkeninin karesi ele alınsın;
x 2  x x  1  x
bu ifadenin beklenen değeri alınarak,
 
E X 2  EX  X  1  E  X 
Sonuç olarak;
 
E X  X  1  E X 2  E  X    2  1
bulunur. Bu yaklaşım daha büyük momentler için de geçerlidir. Örneğin şans değişkeninin
üçüncü faktöriyel momenti
 
 
EX  X  1 X  2  E X 3  3E X 2  2 E  X   3  3 2  21
olup, üçüncü faktöriyel moment kullanılarak,
3  EX  X  1 X  2  32  21
bulunabilir. Genel olarak r-inci faktöriyel moment
EX  X  1 X  2 X  r  1
olarak tanımlanır.
3.15 MOMENT TÜRETEN FONKSĠYONLAR
Beklenen
değer
tanımı
kullanılarak
momentler
elde
edilebilir.
Bu
yaklaşımın
hesaplamalarında zorluk olması durumunda dağılımın momentleri, bir fonksiyon yardımı ile
31
hesaplanabilir. Moment türeten fonksiyonlar sürekli veya kesikli bir X şans değişkenin
dağılımın momentlerinin hesaplanmasına yarayan bir fonksiyondur. X şans değişkeninin
moment türeten fonksiyonu M x (t ) ile gösterilir. Bir X şans değişkeninin orijine göre veya
merkezi moment türeten fonksiyonu bulunabilir.
Şans değişkeni X için moment türeten fonksiyon şans değişkenine ait f (x) olasılık
fonksiyonunun Laplace dönüşümü olarak da adlandırılır.
Tanım (Moment türeten fonksiyon): Olasılık fonksiyonu f (x) olan bir şans değişkeni X
olsun. Eğer  h 2  t  h 2 aralığındaki t ‘nin her bir değeri için şans değişkeninin beklenen
değeri mevcut ise, e tx fonksiyonunun beklenen değeri X şans değişkeninin moment türeten
fonksiyonu olarak adlandırılır. Kesikli ve sürekli şans değişkenleri için moment türeten
fonksiyon:
  e
M x t   E etx 
tx
f (x)

 etx f ( x)dx
Eğer bir moment türeten fonksiyon mevcut ise, orijin civarında sürekli olarak türevlenebilir.
Çünkü  h 2  t  h 2 aralığı t  0 değerini içerir. Moment türeten fonksiyon t parametresinin
fonksiyonudur. Bu parametrenin gerçek bir anlamı yoktur, sadece momentlerin belirlenmesine
yardımcı olan matematiksel bir araçtır. Kukla değişkendir. Moment türeten fonksiyon;
a) tüm t   için,
b) sadece t  A , A   için,
c) sadece t  0 için,
elde edilebilir. Son durumu sağlayan dağılımlar için moment türeten fonksiyon mevcut
değildir. Bunun nedeni t  0 için M x (0) fonksiyonu daima tanımlı olup 1 değerine eşittir.
Teorem: Eğer X şans değişkeninin moment türeten fonksiyonu M x (t ) ise ve
M xr  0 
dr
M x t 
dt r
t 0
olarak tanımlanmış ise
 
E X r  M xr  0 
olur.
İspat: İntegral işareti altında türev alınabileceği varsayımı altında, moment türeten
fonksiyonun t ‘ ye göre türevi, sürekli şans değişkenleri için,
32

d
d
M x t  
e tx f x dx

dt
dt 

d
 dt e  f xdx

tx


 xe f x dx

tx


 E Xe xt

ve t  0 alınırsa;
M x 0 
 
d
M x t   E xe xt
dt
t 0
t 0
 EX 
Bu yaklaşım r-inci türev için genellendiğinde,
M xr  0 

dr
M x t   E x r e xt
dtr
t 0

t 0
 
E Xr .
Sonuç olarak; bir dağılımın momentleri, moment türeten fonksiyonun yapay değişken t’ye
göre türevi alınarak elde edilebilir. Fonksiyona neden moment türeten fonksiyon dendiğini
açıklayabilmek amacı ile E (e xt ) yerine bu fonksiyonun Maclaurin seri açılımı konulur.
Maclaurin serisi, matematikteki fonksiyonların seri açılımlarını elde etmek amacıyla
kullanılan Taylor yaklaşımının,

( x  a) 2
( x  a) r
( x  a) n
 ...  f r (a )
 ...   f n (a )
2!
r!
n!
n 0
özel olarak a  0 alınarak oluşturulmuş serisidir.
f ( x)  f (a )  f (a )( x  a )  f (a )
f ( x)  f (0)  f (0) x  f (0)

x2
xr
xn
 ....  f r (0)
 .... 
f n ( 0)
2!
r!
n!
n 0

Burada maclaurin serisine e x fonksiyonu uygulanmasının nedeni 1 değerine yakınsamasıdır.
Momentler şöyle bulunabilir; f ( x)  e x fonksiyonu maclaurin serisiyle açılırsa,
ex 1 x 
x2
xr
 ... 
 ...
2!
r!
buradan da,
e xt  1  xt 
x2 2
xr r
t  ... 
t  ...
2!
r!
elde edilir ve M x (t ) ‘ in seri açılımı f (x) ‘ in momentlerine göre bulunabilir.
33


x2 2
xr r
t2
tr
M x t   E (e xt )  E 1  xt 
t  ... 
t  ...  E (1)  tE ( x)  E ( x 2 )  .... E ( x r )  ....
2!
r!
2!
r!



t2
tr
1
 1  t1   2  ...   r  ...    r' t i
2!
r!
i  0 i!
Bu durum  r ‘ nin, M x (t ) ‘ nin r defa türevi alınıp daha sonra t  0 konularak elde
edilebileceğinin bir diğer kanıtıdır.
Örneğin birinci momenti bulmak için M x (t) nin t ye göre birinci türevi alınır;
E ( x)  M x (t ) 
dM x (t )
dt
t 0
r 1
rt
 2t  3t 
 1   2   3  ... 
r
2!
3!
r!
t 0
burada t=0 olduğunda
1   olarak bulunur.

İkinci moment  2 isteniyor ise
d  dM x (t ) 

E ( x 2 )  M x (t )  
t 0 M x (t)
dt  dt 
2  6t 
r (r  1)t r  2 
  2   3  ... 
r
2!
3!
r!
= 2
t 0

Burada söylenmesi gereken bir şans değişkeninin momentlerini belirlemek için bir moment
türeten fonksiyonun Maclaurin serisini kullanmaktaki asıl güçlük moment türeten
fonksiyonunu bulmak değil buna Maclaurin serisini uygulamaktır. Bazı dağılımlarda M(t), t
‘nin bütün değerleri için hesaplanabilir; bazı dağılımlarda ise M(t), t’ nin sadece belirli bir
aralıktaki değerleri için bulunabilir. Örneğin üstel dağılım.
Eğer M(t) mevcut ise, X’ in dağılımı eşsiz ve tam olarak belirlenir. Eğer iki şans değişkeni
aynı moment türeten fonksiyona sahip ise, bu şans değişkenleri aynı olasılık dağılımına

sahiptir. Bazı durumlarda
e
tx

f ( x)dx ’ in integrali ve
e
tx
f (x ) ‘ in toplamı mevcut
x
değildir. Böyle durumlarda X’ in moment türeten fonksiyon bulunamaz. Diğer bir deyişle her
dağılımın moment türeten fonksiyonu yoktur. Bu tip dağılımlarda momenti bulmak için
karakteristik fonksiyon kullanılır.
3.15.1 Moment Türeten Fonksiyonlarla Ġlgili Teoremler
34
Teorem: c bir sabit sayı olmak üzere y  cx ’ in moment türeten fonksiyonu;
M cx (t )  M x (ct ) ’ dir.


    e f xdx   e
İspat: M cx t   E e
cxt
cxt

x ( ct )
f ( x)dx  M x ct  ’ dir.

Teorem: Bir X şans değişkeninin moment türeten fonksiyonu M(t) olsun, c sabit bir sayı
olmak üzere y  c  x ’ in moment türeten fonksiyonu;
M c x  (t )  e ct M x (t ) ’ dir.






İspat: M ( c t ) (t )  E e ( c  x )t   e ct e xt f ( x)dx  e ct  e xt f t dx  e ct M x t  ’ dir.
Teorem: y  ax  b şeklinde tanımlanan y şans değişkeninin moment türeten fonksiyonu;
M y t   ebt M x at  ’ dir.
  
 

 
İspat: M y t   E e yt  E e axb t  E e axt e bt  e bt E e axt  M x at e bt ’ dir.
Teorem: Bir X şans değişkeninin moment türeten fonksiyonu M(t) olsun, y 
x  a 
b
olmak
üzere;
 
M y t   E e yt  ea / b t M x (t / b) ’ dir.
Bu teoremde a   ve b   olarak alınır ise
M  x  /  t   e   /  t M x t /  
olacaktır. Bu fonksiyon standart normal değişkenin moment türeten fonksiyonu olarak da
bilinir.
Teorem: Eğer iki şans değişkeni aynı moment türeten fonksiyona sahipse bu iki şans
değişkeni aynı dağılıma sahiptir. X şans değişkeninin moment türeten fonksiyonu Mx(t) ve Y
şans değişkeninin moment türeten fonksiyonu My(t) olsun, eğer  h 2  t  h 2 aralığındaki tüm
t değerleri için M x (t )  M y (t ) ise X ve Y şans değişkenleri aynı olasılık dağılımına sahiptir.
Örneğin X şans değişkeninin dağılımı N  ; 2  olsun y  ax  b şeklinde ve normal dağılımlı
M y t   ebt M x at olsun. M x t   e t 

M y t   ebt eat  a 
2 2
t /2
 e
 2t 2
2
olduğuna göre;
b  a t a 2 t 2 / 2
e
’ dir.
Bu ise ortalaması a  b ve varyansı a 2 2 olan normal bir dağılımın moment türeten
fonksiyonudur.
35
Moment türeten fonksiyonun kullanılabileceği konulardan biri de bağımsız şans
değişkenlerinin toplamının dağılışının belirlenmesidir.
Teorem: X ve Y bağımsız ve aynı dağılıma sahip iki tesadüfi değişken ve bunların moment
türeten fonksiyonları sırasıyla M x (t ) ve M y (t ) olsun z  x  y şeklinde tanımlanan bir Z
tesadüfi değişkeninin moment türeten fonksiyonu;
M z (t )  M x (t ) M y (t ) ’ dir.
İspat: M z (t )  E e zt   E e  x  y t   E e xt e yt 
X ve Y bağımsız olduklarından;
M z (t )  E e xt E e yt 
M z (t )  M x (t ) M y (t )
olur.
Eğer bu teorem n tane tesadüfi değişken için genişletilir ise;
M z (t )  M x1 (t ) M x2 (t )... M xn (t ) .
Tanım (Bir şans değişkeninin fonksiyonunun moment türeten fonksiyonu): X şans


değişkeninin herhangi bir fonksiyonu g (x) ise M g  x  (t )  E e g  x t dir.

M g  x  (t )  e g  x t f x dx


M g  x  (t ) 
 e   f x  olur.
g x t
x
3.15.2 Merkezi Moment Türeten Fonksiyon
Bir X şans değişkeninin kendi anakütle ortalamasına göre de moment türeten fonksiyonu
bulunabilir. Bu da genellikle M  x    (t ) ile ifade edilir.
M  x  (t )  Ee   Ee xt   e  t M x (t ) ’ dir.
Buna göre kesikli veya sürekli bir X şans değişkeninin orijine göre moment türeten
fonksiyonu biliniyorsa bu fonksiyon e  t ile çarpılarak anakütle ortalaması etrafındaki
moment türeten fonksiyon kolayca bulunabilir.
3.15.3 Faktöriyel Moment Türeten Fonksiyon
X şans değişkeninin faktöriyel moment türeten fonksiyonu eğer t x fonksiyonunun beklenen
değeri mevcutsa
G t   E (t x )
36
ile tanımlanır. Bu fonksiyon f x  olasılık fonksiyonunun Mellin-Stieltjes dönüşümü olarak
da adlandırılır ve
dr
E (t x ) t 1  E[ X ( X  1).......( X  r  1)]
dt r
eşitliğini sağlar. Eşitliğin sağ tarafı r-inci dereceden faktöriyel momenttir. Eğer X kesikli bir
şans değişkeni ise,
E (t x ) 
t
x
f ( x)
x
yazılabilir. Bu ifadede kuvvet serisinin katsayıları olasılıklar olduğu için faktöriyel moment
türeten fonksiyon, olasılık türeten fonksiyon olarak adlandırılır. Burada x  k olasılığını elde
etmek için
1 dk
E (t x ) t 0  f x  k  .
k! dt k
Bu fonksiyonun çeşitli derecelerden türevleri alınıp, t yerine 1 konduğunda x şans
değişkenine ilişkin faktöriyel momentler bulunur.
Birinci türevi;
 dt x 
d

  E Xt x 1
Gx t   E t x  E

dt
dt


 


t 1
 G1  E  X   
bulunur. İkinci türevi;
G 1  EX  X  1
bulunur. r -inci türevi;
G r  1  E X  X  1... X  r  t 
Faktöriyel moment özellikle kesikli değişkenlerde önemlidir.
37
Download