BÖLÜM 4: ġANS DEĞĠġKENLERĠNĠN BEKLENEN DEĞER VE

advertisement
BÖLÜM 4: ġANS DEĞĠġKENLERĠNĠN
BEKLENEN DEĞER VE
MOMENTLERĠ
Bir örnek veri seti veya deneysel dağılım, merkezi eğilimi, yayılımı, çarpıklığı ve basıklığı gibi
özellikleri analiz edilerek tanımlanabilmektedir. Bir olasılık dağılımı da benzer biçimde karakterize
edilmektedir. Rassal bir değişkenin anakütle dağılımı için tanımlayıcı ölçüler parametreleridir. Bu
bölümde rassal değişkenlerin dağılımları için tanımlayıcı ölçüler ele alınacaktır. Tanımlayıcı
istatistiklerin ilki olan merkezi eğilim ölçülerinden özellikle beklenen değer, yayılım ölçülerinden ise
varyans incelenecektir. Diğer merkezi eğilim ve yayılım ölçülerine ise daha az değinilecektir. Ayrıca
çarpıklık ve basıklık ölçülerinin özeti, olasılık dağılımlarının momentleriyle olan ilişkisi de
incelenecektir.
Beklenen değer ya da matematiksel beklenti kavramı, matematiğin istatistik bilimine yaptığı bir katkı
olarak düşünülebilir. Matematiksel beklenti kavramı şans oyunlarından doğmuştur. En yalın biçimiyle,
bir oyuncunun kazanabileceği miktar ile kazanma olasılığının çarpımıdır. Sözgelimi büyük ödülün
5700TL olduğu bir çekilişteki 10.000 biletten birine sahip olan bir kişinin matematiksel beklentisi
5700*1/10.000 = 0,57 TL olur.
Beklenen değerin tanımı için genel bir yaklaşım, olasılıkların frekanslar dikkate alınarak yapılan
yorumu ile sağlanmaktadır. Bu yorumlamada sonsuz sayıda ardışık tekrarlı bağımsız deney
gerçekleştirildiği ve herhangi bir E olayı için, E olayının gerçekleştiği durumların olasılığının PE 
olduğu varsayılmaktadır. Bir X şans değişkeninin Px1 , Px2 ,..., Pxn  olasılıklarına karşılık gelen
x1 , x2 ,...,x n değerlerinden birini alabildiği ve X‟in tek bir oyun için kazanılan miktarı gösterdiği
düşünülsün. Bu durumda Pxi  olasılığıyla xi birimi kazanılmaktadır. Frekans yorumlamasıyla, bu
oyun sürekli olarak oynandığında xi kazanç değerinin olasılığı artık Pxi  olacaktır. Bu durum tüm
i  1,2,...,n için geçerlidir. Ayrıca oyun başına ortalama kazanç miktarı
 x P X  x 
i
i
i
olarak elde edilir. Bu sonucu daha iyi kavrayabilmek için, N çok büyük bir değer olmak üzere, oyunun
N defa oynandığı varsayılsın. Bu durumda yaklaşık olarak NP xi  oyundan xi miktar kazanılır ve N
oyunda toplam kazanç miktarı
N
 x NP x 
i
i
i 1
olur. Oyun başına ortalama kazanç miktarı ise
82
N

i 1
xi NP xi 

N
N
 x P x 
i
i
i 1
olarak elde edilir. Oyun başına ortalama kazanç miktarının matematiksel istatistikteki genel karşılığı
beklenen değer ifadesidir ve bir X şans değişkeni için matematiksel beklenti ya da beklenen değer
E  X  ile gösterilir.
4.1 BEKLENEN DEĞER ve ÖZELLĠKLERĠ
Bir X şans değişkeninin ya da bu şans değişkeninin herhangi bir g x  fonksiyonunun beklenen değeri,
değişkenin tüm değerleri üzerinden olasılık fonksiyonun ortalama değerinin bulunmasıyla elde edilir.
Beklenen değer teorik ya da ideal değerdir. Herhangi bir denemede X şans değişkeninin beklenen
değerini alması gerçekte beklenemez. Kesikli şans değişkenleri için genel yaklaşımı yukarıda
açıklanan beklenen değer kavramı, kesikli ve sürekli şans değişkenleri için aşağıda ayrı ayrı
incelenmiştir.
Kesikli şans değişkeni X‟in alabileceği mümkün değerler x1 , x2 ,... ise, X şans değişkeninin beklenen
değeri,
EX  
 x PrX  x    x f x 
i
i
i
i
i
i
şeklinde tanımlanır. Başka bir deyişle X‟in beklenen değeri, şans değişkeninin her değerinin kendine
ait olasılığıyla ağırlıklandırıldığı, X‟in alabileceği tüm mümkün değerlerin ağırlıklı ortalamasıdır.
Örneğin, X‟in olasılık kütle fonksiyonu
Prx  0  Prx  1  1 2
şeklinde verilmişse beklenen değeri
E X   0  1 2  1 1 2  1 2
olarak elde edilir. Bu da X‟in alabileceği iki mümkün değer olan 0 ve 1‟in sıradan ortalamasıdır. Diğer
taraftan eğer
Prx  0  1 3 , Prx  1  2 3
ise
E X   0  1 3  1 2 3  2 3
olur. Bu sonuç iki mümkün durum olan 0 ve 1‟in ağırlıklı ortalamasıdır. Prx  1  2 Prx  0 olduğu
için 1 değerine 0 değerine göre iki kat fazla ağırlık verilmiştir.
Bu bakış açısıyla sürekli bir şans değişkeninin beklenen değerinin nasıl hesaplanması gerektiği sorusu
akla gelebilir. Örneğin X, olasılık yoğunluk fonksiyonu f x  ile tanımlanan ve f x  fonksiyonu [0,1]
aralığı dışında 0 olan bir şans değişkeni olsun. Burada X şans değişkeni, 1 n , 2 n ,...,n  1 n ,1
değerlerini alan kesikli bir şans değişkeni Y olarak ele alınabilir. X şans değişkeninin frekanslarını
dikkate alarak olasılıkları k  1 n , k n aralığına atayan fonksiyon,
83
k n
PrY  k n   Prk  1 n  X  k n 
 f xdx
k 1 n
olsun. Bu ifade büyük n değerleri için f cinsinden yaklaşık olarak,
k n
PrY  k n  
 f xdx  n f k n
k 1
1
n
şeklinde tanımlanır. Ağırlık merkezi yorumuna göre Y‟nin beklenen değeri E(Y), X‟in beklenen değeri
E(X)‟e yakınsamalıdır. Yukarıdaki eşitlik kullanılarak,
E Y  
n
n
k
k
1
PY  k n  
f k n 
n
k 1 n
k 1 n


elde edilir. Belirli integralin tanımından, büyük n değerleri için sağ taraftaki ifade için yaklaşık olarak,
1
 xf x dx
0
sonucu bulunur.
Tanım (Beklenen değer): Bir X şans değişkeninin olasılık fonksiyonu f x  olsun. Şans değişkeninin
beklenen değeri, kesikli ve sürekli şans değişkenleri için sırasıyla,
E( X ) 
 x f ( x)
(4.1)
x

E ( X )  xf ( x)dx
(4.2)
x
herhangi tipteki bir şans değişkeni için,

E ( X )  1  F x dx 

0
0
 F xdx
(4.3)

eşitlikleri ile tanımlanır.
Bu eşitlik gerçekte E  X  şans değişkeninin bir ağırlıklı ortalamasıdır. Burada ağırlıkları olasılıklar
tanımlamaktadır. Diğer bir ifade ile E  X  şans değişkeninin tanımladığı f x  yoğunluğunun ağırlık
merkezinin X eksenindeki değeridir.
Bölüm 2‟de olasılık için P(X) kullanılmıştı ve P X   lim fi N biçimindeydi. Burada f i verilen bir
N 
anakütledeki mutlak frekansı göstermektedir. Böylece kesikli şans değişkenleri için
N
   xi Pxi 
i 1

f  1
xi  i  
N N
i 1
N

N
fx
i i
i 1
bulunur. Elde edilen bu son formül gruplandırılmış veriler için aritmetik ortalama formülüne denktir.
Eşitlik (4.1) dikkate alındığında sonlu bir beklenen değere sahip her şans değişkeni için,
84
E (X )  
(4.4)
yazılabilir. Diğer bir ifade ile şans değişkenin beklenen değeri anakütle ortalamasına eşittir. Benzer bir
yaklaşımla, sürekli şans değişkenleri için E(X), f x  ile gösterilen fonksiyonun ağırlık merkezidir ve

EX  

 xf x dx 

 xf x dx


 f x dx

EX   
elde edilebilir. Bir şans değişkenin beklenen değeri, şans değişkeninin olasılık fonksiyonuna ya da
birikimli dağılım fonksiyonuna göre tanımlandığı için şans değişkenine ait bir veri seti referans
alınmadan bu fonksiyonlara göre elde edilebilir.
Beklenen değerin tanımlı olabilmesi için toplam ya da integral işlemlerinin yakınsak olması gereklidir.
Daha önce belirtildiği üzere beklenen değer mevcut olmayabilir. Sorun, seri toplamlarının veya
integrallerin ıraksak ya da belirsiz olması problemidir. Bir şans değişkeninin beklenen değeri,
a) sonlu bir reel sayı olabilir,
b) sonsuz (integral ya da toplam sonucu ıraksak ise) olabilir,
c) var olmayabilir (integral ya da toplam sonucu belirsiz ise).
Sürekli değişkenlerden beklenen değeri var olmayanlara bir örnek Cauchy dağılışı gösteren şans
değişkenidir. Cauchy dağılımının olasılık yoğunluk fonksiyonu,
f x  
1
,
 1  x2

  x  

olup, bu şans değişkeni için,


1
 1
E  X   x.
dx  
ln 1  x 2
2
2


1

x









belirsizliği ortaya çıktığı için beklenen değer yoktur.
Beklenen değerin sonsuz olduğu durum için verilebilecek örnek ise   1 parametreli Pareto
dağılımıdır. Sürekli şans değişkeni X‟in beklenen değerindeki integral için tanımlanan bu özellikler
kesikli şans değişkeni X‟in beklenen değerindeki seri toplamları için de geçerlidir.
Teorem (Sınırlı rassal reğişkenler için beklenen değerin ortaya çıkması): Her x   için eğer x  c
ise E  X  vardır.
Beklenen değer işlemine ait temel özellikler aşağıdaki teorem ile verilmiştir.
Teorem: X şans değişkenin anakütle ortalaması  ve a ile b sabit sayılar olmak üzere:
1. E a   a
(4.5)
2. EaX   aE X 
(4.6)
 
3. E X p  EX 
p
p  1 hariç
(4.7)
85
4. Genelde g x   a  bx (a ve b sabit) şeklinde ise E f  X   f EX  ‟tir.
1
1
Bunun haricinde E f  X   f EX  olur, örneğin E ( X )  0 için E   
 X  E( X )
eşitsizliği
geçerlidir.
Özellik (1) ve (2)‟nin bir sonucu olarak tanımlanabilecek E aX  b durumu ise Kısım 4.4‟de
açıklanmıştır. İspatlar için bkz. Ek4.1.
Beklenen değer ile ilgili diğer özellikler ileriki kısımlarda açıklanacaktır. Beklenen değer, şans
değişkeninin anakütle ortalamasına eşit olduğundan sonuç olarak bir yer ölçüsüdür. Bir sonraki
kısımda şans değişkenleri için kullanılabilecek diğer yer ölçülerinden bazıları tanıtılacaktır.
4.2 TEMEL YER ÖLÇÜLERĠ
Şans değişkeni dağılımını farlı bakış açıları ile tanımak amacıyla farklı yer ölçüleri kullanılmaktadır .
Bu yer ölçülerinden bazıları aşağıda tanıtılmıştır.
Tanım (Kantil): X şans değişkeninin ya da ona ait dağılımın p-inci kantili xp ile gösterilir ve
 
F xp  p
koşulunu sağlayan en küçük şans değişkeni değeridir. Eğer X sürekli bir şans değişkeni ise p-inci
kantil
 
F xp  p
koşulunu sağlayan en küçük şans değişkeni değeridir.
Tanım (Medyan): X şans değişkeninin ya da ona ait dağılımın 0.5-inci kantili x0.5 ile ya da M ile
gösterilir ve medyan olarak adlandırılır. Genel olarak:
Pr X  M   1 2 ya da Pr X  M   1 2
tanımlanır. Eğer X sürekli bir şans değişkeni ise medyan:
M


M
 f x dx  1/ 2   f x dx .
Medyan veya ortanca, bir frekans dağılımında frekansları iki eşit parçaya bölen şans değişkeni
değeridir.
Bir şans değişkeninin en çok rastlanan değerine mod denir. Bir frekans dağılımında, özellikle homojen
olmayan dağılımlarda birden fazla mod değeri bulunabilir. Mod değeri olmayan dağılımlar da vardır.
Tanım (Mod): X şans değişkenine ait olasılık fonksiyonunun x  x0 noktasında bir maksimum değeri
f(x0) var ise x0 değeri mod olarak adlandırılır. Eğer X sürekli bir şans değişkeni ise:
df x 
0
dx x  x0
Bir kesikli değişkenin modu, frekansların maksimum olduğu değişken değeridir. f x  ‟i maksimum
yapan şans değişkeni değeridir.
86
Yukarıda açıklanan yer ölçüleri farklı değerler alabileceği gibi dağılım biçiminin özel bir durumunu
tanımlayan simetrik dağılımlarda her üç yer ölçüsü de aynı değere sahiptir.
Tanım (Simetri): Olasılık fonksiyonu f x  için,
f x  c   f x  c 
özelliğine sahip olan dağılımlar c noktasına ya da diğer bir deyişle x  c doğrusuna göre simetriktir.
Eğer bir f x  dağılımı c noktasına göre simetrik ve anakütle ortalaması  sonlu ise c   olmalıdır.
4.3 VARYANS
Şans değişkeninin dağılımı ile ilgili önemli bir ölçü grubu da yayılım ölçüleridir. Aşağıda bazı önemli
yayılım ölçüleri kısaca açıklanmıştır.
Tanım (Varyans): X bir şans değişkeni ve E  X    ise şans değişkeninin varyansı V(X) ile ya da 2
ile gösterilir. Kesikli ve sürekli şans değişkenleri için sırasıyla,

  x   
V X   E X    
2
2
i
f xi 
(4.8)
i

  x   
V X   E X    
2

2
f x dx
(4.9)

ve herhangi bir şans değişkeni için ise,

V  X   2 x1  F x   F  x dx   2

(4.10)
0
şeklinde tanımlanır.
Varyansın mevcut olabilmesi için toplam serisinin ya da integralin yakınsak olması gereklidir. Bir şans
değişkenin beklenen değerinde olduğu gibi varyansı da şans değişkeninin olasılık fonksiyonuna ya da
birikimli dağılım fonksiyonuna göre tanımlandığı için şans değişkenine ait bir veri seti referans
alınmadan bu fonksiyonlara göre tanımlanabilir.
Gözlenen değerleri ortalamaya göre uzaklaşmaya meyilli X şans değişkenine göre değerleri ortalama
civarında olan bir Y şans değişkenin varyans değerleri karşılaştırıldığında X şans değişkeninin varyansı
daha büyük değerler aldığından varyans bir yayılım ölçüsü olarak kullanılmaktadır. Varyansın
formülleri incelendiğinde negatif olmayan değerlere sahip bir ölçüt olduğu görülebilir. Varyans şans
değişkeni ile aynı ölçü birimine sahip değildir. Varyansın bu eksikliğini gideren yayılım ölçüsüne ise
standart sapma denir.
Tanım (Standart sapma): X şans değişkeninin standart sapması  ile gösterilir ve
  V X 
(4.11)
ile tanımlanır.
Pek çok uygulamada şans değişkeni ile aynı ölçü birimine sahip olduğu için varyans yerine tercih
edilir. Varyansa ait temel bazı özellikler aşağıda verilmiştir.
Teorem: X şans değişkenin anakütle ortalaması  sonlu ve c sabit sayı olmak üzere:
87
a. V c   0
(4.12)
b. V cX   c 2V  X 
(4.13)
c. V c  X   V  X 
(4.14)
İspatlar için bkz. Ek4.2.
Teoremin sonucuna göre c  0 ise, bir rasal değişkenin değerlerinin sabit bir sayıyla çarpılması,
varyansın da aynı sabit sayının karesiyle çarpılması demek olduğundan, dağılım yayılımında da ona
uygun bir değişmeyle karşılaşılır. Bir rassal değişkenin değerlerine sabit bir sayının eklenmesinin X‟in
bütün değerlerinin sağa ya da sola kaymasına yol açtığını ama onun dağılım yayıklığını hiç
etkilemediği görülmektedir.
Varyans, asimetrik dağılımlar için şans değişkeninin beklenen değeri etrafındaki yoğunlaşmasının
zayıf bir ölçütüdür. Bununla birlikte, simetrik dağılışlar için yeterli bir ölçüdür. Varyans, özellikle
asimetrik dağılışlar ve yoğunluğun küçük bir kısmının ortalamadan oldukça uzak olduğu dağılımlar
için yetersiz bir yayılım ölçüsüdür. Bir şans değişkeninin varyansının her zaman var olması gerekli
değildir.
4.4 ġANS DEĞĠġKENĠNĠN FONKSĠYONUN BEKLENEN DEĞERĠ
Bazı durumlarda doğrudan X şans değişkeni ile değil onun bir fonksiyonu y  g x  şeklinde ortaya
çıkan şans değişkenleri ile ilgilenilir. Beklenen değer operatörü, E . , genellikle rassal değişkenin
keyfi bir fonksiyonu g x  olarak tanımlanır. Pratikte g (x) birçok formda bulunabilir. Örneğin,
 x, x 2 , x p formlarında bulunabilir. Bu gereksinim genellikle araştırmalarda şans değişkenine ait ölçü
biriminin değiştirilmesi gerekli olduğunda ortaya çıkar. Örneğin ısı Celsius biriminden
ölçümlendiğinde ve bu veriler Fahrenheit‟e dönüştürüldüğünde beklenen değer bu dönüşümden nasıl
etkilenir? Burada yeni tanmlanan şans değişkeni Fahrenheit ölçü birimine sahiptir ve Celsius ile
aralarında, a ve b sabitler olmak üzere, g x   ax  b ilişkisi vardır. Sonuç olarak, sürekli şans
değişkenleri için,
E aX  b  
 ax  bf xdx
x
 a xf x dx  b f x dx


x
x
 aE X   b
(4.15)
elde edilir. Benzer bir sonuç kesikli şans değişkenleri için de bulunabilir.
Beklenen değer alma işlemi doğrusal bir operasyondur. Bu nedenle X şans değişkeninin doğrusal bir
fonksiyonunun beklenen değeri, sabitlerin etkisi dikkate alınarak kolayca bulunabilir.

   ni a b
 
Teorem: E (a  bX ) n 
n
i n i
E ( X n i )
(4.16)
i 0
88
İspat: (a  bx) n 
n
 n
  i a bx
n i
i
olduğuna göre,
i 0


 n  n
 n  n
E (a  bX ) n  E   a i b n  i X n  i    a i b n  i E ( X n  i )
 i 0  i 
 i 0  i 


Tanım: X, olasılık fonksiyonu
f (x) olan bir şans değişkeni olsun. Şans değişkeninin bir
fonksiyonunun g (x) ‟in beklenen değeri kesikli ve sürekli şans değişkenleri için sırasıyla,
Eg ( x) 
 g ( x) f ( x)
(4.17a)
x
Eg ( x) 

 g ( x) f ( x)dx
(4.17b)

tanımlanır.

Beklenen değerin ortaya çıkması için sadece ve sadece
 g ( x) dx   olmalıdır.

Teorem: X bir şans değişkeni, f (x) ‟de onun olasılık fonksiyonu ve c1 , c2 ,, cn birer sabit sayı ise
i  1,, n olmak üzere gi x  fonksiyonlarının sabitlerle çarpımlarının toplamının beklenen değeri:
 n

E  ci gi ( x) 
 i 1


n
 c Eg ( x)
i
i
(4.18)
i 1
İspat için bkz. Ek4.3.
Teorem: X bir şans değişkeni, a ve b ise sabitler olsun. Beklenen değerleri mevcut g1 ( x) ve g 2 ( x)
fonksiyonları için,
eğer tüm X değerleri için g1 ( x)  0 ise
Eg1 ( x)  0
(4.19)
eğer tüm x değerleri için g1 ( x)  g 2 ( x) ise
Eg1 ( x)  Eg2 ( x) .
(4.20)
eğer tüm X değerleri için a  g ( x)  b ise
a  Eg ( x)  b .
(4.21)
eşitsizlikleri geçerlidir.
X şans değişkeninin doğrusal olmayan bir fonksiyonunun beklenen değeri ile ilgilenildiğinde ise
izlenebilecek iki yol vardır. İlk seçenek doğrudan eşitlik (4.17)‟nin kullanılmasıdır. İkinci yol ise
Y  g x  ile tanımlanan şans değişkeninin olasılık fonksiyonunu, f  y  bularak, bkz Bölüm 7,
Eg ( x)  E  y  

 yf ( y)dy
(4.22)

89
eşitliğinden elde etmektir. g (x) , konkav veya konveks olduğunda, Jensen eşitsizliği fonksiyonun
beklenen değeri ve rassal değişkenin beklenen değerinin fonksiyonu arasındaki ilişkiyi tanımlamada
kullanılabilir.
Çok değişkenli dağılımlar için beklenen değer ve varyansa ait özellikler Kısım 4.8‟de incelenmiştir.
4.5 STANDART ġANS DEĞĠġKENLERĠ
İstatistiksel araştırmalarda standart şans değişkenleri ile çalışmak bazı kolaylıklar sağlamaktadır.
Standart şans değişkenlerinin beklenen değerleri daima sıfır, varyansları ise bir değerini alır. Herhangi
bir dağılıma sahip şans değişkeni, beklenen değerinden çıkarılıp kendi standart sapmasına bölünerek
standartlaştırılır. Standart şans değişkenleri genellikle Z ile gösterilirler. X şans değişkeni beklenen
değeri , standart sapması  olan herhangi bir dağılıma sahip olsun. Bu değişkene ait standart şans
değişkeni,
Z
X 
(4.23)

dönüşümü ile elde edilir. Standart şans değişkeninin beklenen değeri,
 X    EX   
E Z   E 


  
0
daima sıfırdır. Varyansı ise

  
V Z   E Z  E Z   E Z 2
2
EX     2
 X 
 E
 2
 
2

  
2
2
1
daima birdir. Z dönüşümü orijinal olasılık fonksiyonunun genel yapısında herhangi değişiklik
oluşturmaz. Diğer bir deyişle, herhangi bir Z değerine ait olasılık ile karşılık gelen X değerinin
olasılığı bir birine eşittir. Her bir X değerine bir ve yalnız bir Z değeri karşılık gelir. Z dönüşümü ile X
değişkenin ölçeği orijinal ölçekten standart ölçeğe dönüşmüş yer (konum) ölçüsü de merkezlenmiş
olur.
4.6 OLASILIK ÜZERĠNE EġĠTSĠZLĠKLER
Bir olasılık dağılımını tamamen belirleyebilmek için şans değişkeninin olasılık fonksiyonunun
bilinmesi gereklidir. Bununla birlikte, şans değişkeninin beklenen değeri ve standart sapması biliniyor
ise olasılık dağılımı tam olarak bilinmese dahi şans değişkeni ile ilgili bazı önemli bilgilere
ulaşılabilir. Bu amaçla, eğer şans değişkeni sonlu beklenen değer ve standart sapmaya sahip ise,
beklenen değer kavramı kullanılarak olasılıklar üzerine bazı eşitsizlikler elde edilebilir. Bu
eşitsizliklerin en önemlileri Chebyshev ve Jensen eşitsizlikleri olarak bilinir.
4.6.1 Chebyshev EĢitsizliği
90
Chebyshev teoremi belirli bir olasılık için alt sınırın bulunmasına imkan verir. Bu sınırların tam
olasılık değerlerine eşit ya da yakın olması gerekli değildir. Bu nedenle bir olasılık değerine
yakınsamak için genelde bu teorem kullanılmaz. Bu teoremin ana kullanım alanlarından biri Büyük
Sayılar Kanunudur.
Teorem: Şans değişkeni X‟in olasılık fonksiyonu f x  ve negatif olmayan bir fonksiyonu g x  olsun.
Eğer Eg (x) mevcut ise her bir pozitif k sabiti için;
Prg x   k  
Eg x 
k
(4.24)
İspat: Şans değişkeni X için A  x : g x   k olsun. Bu durumda,
Eg x   g x  f x dx  g x  f x dx  g x  f x dx


x
A

Ac
yazılabilir ve eşitliğin sağındaki her iki integral de negatif olmayan değerlere sahip olduğundan,
Eg x   g x  f x dx

A
Eğer x  A ise bu durumda g x   k olacağı için g x  yerine k yazılması eşitsizliğin sağ tarafının
değerini artırmaz.
Eg x   k f x dx

A
Burada
 f xdx  Prx  A  Prg x  k  olduğundan,
A
Eg x   k Prg x   k 
ispat tamamlanır.
Açıklanan teorem, Chebyshev eşitsizliği olarak adlandırılan bir eşitsizliğin genellenmiş şeklidir. Bir
şans değişkenin olasılık dağılımından bağımsız, sadece beklenen değer ve varyans bilgileri
kullanılarak şans değişkeni ile ilgili bazı olasılık eşitsizliklerinin elde edilebileceği, Rus matematikçisi
Chebyshev tarafından ispatlanmıştır.
Teorem: X şans değişkeninin bir olasılık dağılışına ve sonlu varyansa sahip olduğu varsayılsın (bu
durumda mutlaka sonlu bir anakütle ortalaması vardır). Bu koşul altında her k  0 için,
a) Markov eşitsizliği, g x   x   , r  0 alınarak,
r

 Exk   .
r
Pr x    k r 
r
r
b) Markov eşitsizliğinde özel durum olarak r  2 alınarak,

 Exk   
2
Pr x     k 2 
2

2
2
k2
91
ve k  c alınarak,


Pr x     c 2 2 
2
1
c2
ya da bütünleyen ayrık olay için


Pr x     c 2 2  1 
2
1
c2
elde edilebilir ve sonuç olarak
Pr c  x    c   1 
1
.
c2
(4.25)
bulunur. Burada c değeri birden büyük olarak seçilir. Yukarıda verilen teoreme göre  ile  sırasıyla,
X şans değişkeninin ortalaması ve standart sapması ise, herhangi bir pozitif c sabiti için X‟in
ortalamanın iki yanında c standart sapma aralığında bir değer alabilme olasılığı en az 1  1 c 2
kadardır. Örneğin, X şans değişkeninin ortalamanın her iki yanında, iki standart sapma aralığında bir
 
değer alma olasılığı en az 1  1 22  3 4 ; 3 standart sapma aralığında bir değer alma olasılığı
 
 
1  1 32  8 9 ; 5 standart Sapma aralığında bir değer alma olasılığı 1  1 52  24 25 olur. Elde
edilen sonuçlar şans değişkeninin standart sapmasının, değişkenin yayılımını etkileyen önemli bir
faktör olduğunu belirtmektedir.
Chebyshev teoreminin verdiği olasılığın bir alt sınır olduğu açıktır. Belli bir şans değişkeninin
ortalamanın iki yanında c standart sapma aralığında bir değer alma olasılığının 1  1 c 2 ‟den büyük
olup olmadığını bilinemez ama Chebyshev teoremi bu olasılığın kesinlikle 1  1 c 2 ‟den küçük
olamayacağını söyler. Bir şans değişkeninin dağılımı bilinirse ancak o zaman tam olasılık
hesaplanabilir.
ġekil 4.1 Asimetrik bir dağılım için Chebyshev eşitsizliği
Chebyshev eşitsizliğinin önemli olmasının nedeni, herhangi bir şans değişkeni için uygulanabilir
olmasıdır. Böyle genel bir sonuç elde edilmesine karşın bu eşitsizlik ile elde edilen sınırlar, belirli bir
92
dağılımdan elde edilen sınırlar kadar dar değildir. Bu nedenle olasılıkların tahmin edilmesi için pratik
bir yöntem sağlamaz. Örneğin P X    h  1 h2 eşitsizliğinin sağ tarafı genellikle sol tarafından
daha büyüktür. Bu bakış açısıyla bu eşitsizlik ile varyans (ya da standart sapma) kavramları uygun bir
şekilde yorumlanabilmekte ve ayrıca büyük sayıların zayıf kanunun ispatında kullanılabilmektedir.
4.6.2 Jensen EĢitsizliği
Şans değişkeninin g x  ile tanımlanan bir fonksiyonunun gerçek dağılışı hesaplanmadan Eg x  ile
g E  X  arasındaki ilişki belirlenebilir. Eşitlik (4.15) ile g x   ax  b doğrusal dönüşümünde
Eg x   g E X  olduğu bilinmektedir. Fakat bu eşitliği başka g fonksiyonları için kullanmak yaygın
bir yanlıştır. Aslında bu eşitlik doğrusal olmayan g x  için oldukça ender ortaya çıkar.
Örneğin, mikro elektronik parçalar üreten bir firmanın günlük üretim hedefinin 240 çip üretmek
olduğu fakat ardışık üç günde sırasıyla 40, 60 ve 80 çip ürettiği varsayılsın. Bu üç günün ortalama
üretimi 60 çiptir ve hedef değere ulaşılabilmesi için bu ortalamanın 4 katı üretim yapılması
gerekmektedir. Bir başka bakış açısı da şudur: belirtilen 3 günde üretim miktarı sırasıyla 240 40  6 ,
240 60  4 ve 240 80  3 kat fazla olmalıydı. Bu değerlerin ortalaması alındığında,
1 3  6  4  3  4.3333
kat fazla üretim yapılmalıdır. Burada X, gerçekleştirilmiş üretim miktarıdır ve üç çıktı değeri 1 6 , 1 4
ve 1 3 ‟ü eşit olasılıkla alabilmektedir. Yukarıdaki ifadeler pozitif değerler alan bir şans değişkeni X ile
açıklanırsa V  X   0 olmadıkça her zaman,
1
 E 1 X 
EX 
eşitsizliği geçerlidir. Bu eşitsizlik 0,   aralığında g x   1 x durumunu göstermektedir ve aşağıdaki
sonuçlar tüm konveks g x  fonksiyonları için geçerlidir, bkz Ek4.9.
Tanım (Jensen Eşitsizliği): g x  konveks bir fonksiyon ve X bir şans değişkeni olmak üzere,
g E X   Eg x  .
(4.26)
İki kez türevlenebilen g x  fonksiyonu A kümesinde, A  0,  tanımlı tüm X‟ler için g x   0 ise
zayıf konveks, g x   0 ise güçlü konvekstir. X, değerlerini A kümesinden alan bir şans değişkeni ve
g x  fonksiyonu da güçlü konveks ise güçlü eşitsizlik g E X   Eg x  geçerlidir.
93
ġekil 4.2 Jensen eşitsizliği
Örneğin yukarıdaki şekilde sadece a ve b değerleri alan bir X şans değişkeni için bu sonuçlar
gösterilmiştir. X şans değişkeni a ve b değerlerini sırasıyla 3 4 ve 1 4 olasılıkla almaktadır. g x 
fonksiyonunun konveks olması dolayısıyla şekildeki iki nokta bir doğru ile birleştirilebilmektedir.
Böylece a, g a  ‟dan b, g b  ‟ye bir doğru çizilirse,
E X , Eg x    3 a  1 b, 3 g a   1 g b  3 a, g a   1 b, g b
4
4
4
g x  fonksiyonun grafiğinde bu nokta
4

4
E X , Eg x
4
noktasının yukarısında yer alır. Böylece
g E X   Eg x  olur.
Basit bir örnek de g x   x 2 ‟dir. Bu fonksiyon tüm x değerleri için g x   2 olduğundan konvekstir,
E X 2  E X 2 
 
Bu eşitsizlik V  X   E X 2  E X   0 eşitsizliğinin doğru olduğunu kanıtlamaktadır.
2
4.6.3 Büyük Sayıların Zayıf Kanunu
X1, X 2 ,..., X n , her birinin ortalaması E  X i    olan bağımsız ve eş dağılımlı ardışık şans
değişkenleri olsun. Bu durumda herhangi bir   0 için,
 X Xn

P 1
    0, n 
n


(4.27)
Ġspat: Bu ispatın yapılabilmesi için ek olarak şans değişkenlerinin sonlu bir varyansa  2 sahip
oldukları varsayımı eklenmelidir. Böylece,
 X Xn  
 X Xn 
E 1

   ve Var  1
n
n

 n


2
olduğu için Chebyshev eşitsizliği ile,
 X Xn
 2
P 1
    2
n

 n
94
elde edilir ve ispat tamamlanır.
Örneğin birbirinden bağımsız deneyler gerçekleştirildiği varsayılsın. E herhangi bir olay ve Pr(E) ise
herhangi bir denemede E olayının meydana gelme olasılığı olsun. Eğer
i - inci denemede E olayı gerçekleşe iş ise
1
Xi  
0 i - inci denemede E olayı gerçekleşe emiş ise
şeklinde tanımlanırsa, X1  X 2    X n ifadesi ilk n denemede E olayının kaç kez ortaya çıktığını
gösterir. E X i   PrE olduğu için büyük sayıların zayıf kanuna göre herhangi bir pozitif ε için, ilk n
denemede E olayının ortaya çıktığı durumların oranının
Pr(E)‟den farkının ε‟dan fazla olması
olasılığı, n arttıkça sıfıra yaklaşır.
4.7 MOMENTLER
Moment terimi fizik biliminden gelmektedir. Moment bir f x  frekansının (kuvvetinin) x birim
uzaklıkta olduğu bir nokta üzerinde oluşturduğu etkidir. Momentler, bir şans değişkenin dağılışının
kesin şeklini belirler. Bir dağılımın momentleri, şans değişkeninin kuvvetlerinin beklenen değeridir.
Momentler genel olarak üç grupta incelenir.
1. Orijine göre momentler
2. Merkezi momentler
3. Herhangi bir a noktasına göre momentler
Tanım (Orijine göre moment): X şans değişkeninin  r ile gösterilen, sıfır noktasına göre r-inci
momenti, x r fonksiyonunun beklenen değeridir. Kesikli ve sürekli şans değişkenleri için orijine göre
momentler sırası ile,
r  E ( X r )   x r f ( x)
(4.28)
x
r  E ( X r )   x r f x dx
(4.29)
eşitlikleri ile tanımlıdır.
En çok kullanılan iki özel durum:
 
0  E X 0   f x dx  1
 '1  E ( X )   xf x dx
olur. Son eşitlik, X şans değişkeninin beklenen değerinden başka bir şey değildir.
Tanım : 1 ifadesine, X dağılımının anakütle ortalaması ya da kısaca X şans değişkeninin ortalaması
denir ve  ile gösterilir.
Tanım (Merkezi moment): X şans değişkeninin  ile gösterilen, anakütle ortalamasına göre r-inci
momenti,
x   r
fonksiyonunun beklenen değeridir, r  0,1,2, için
r  E[( X   ) r ]   ( x   ) r f ( x)
(4.30)
x
95

r  E[( X   ) r ]   ( x   ) r f ( x)dx
(4.31)

Teorem:  değeri var olan her şans değişkeni için 0  1 ve 1  0 eşitlikleri daima geçerlidir.
İspat: Merkezi birinci moment;
1  E[( X   )]   ( x   ) f ( x)dx


 xf ( x)dx   f ( x)dx
0
Bu sonuç tanımlayıcı istatistikten bilinen, aritmetik ortalamadan sapmaların toplamının sıfır olmasının
teorik ispatıdır.
Bir dağılımın tüm momentleri ile ilgili bilgi, bu dağılımı eşsiz olarak belirler. Ortalama dolayındaki
ikinci moment, bir rassal değişken dağılımının yayılımının bir göstergesi olduğundan istatistikte özel
bir önem taşır. Merkezi ikinci moment, şans değişkeninin


2  E  X   2  V  X 
varyansıdır. Bir dağılımın varyansı, dağılımın ortalama etrafındaki yoğunluğunun ölçümünü verdiği
daha önce açıklanmıştı.
Tanım (Herhangi bir a noktasına göre momentler): X şans değişkeninin bir a noktası etrafındaki rinci momenti, x  a r fonksiyonunun beklenen değeridir.


r  E  X  a r   x  a  f x 
r
(4.32)
x


r  E  X  a r   x  a  f x 
r
(4.33)
x
Tanım: Eğer  r mevcut ise, k  r için tüm  k momentleri mevcuttur.
 
Tanımın bir sonucu olarak eğer E X 2 mevcut ise E  X  mevcuttur ve sonuçta V  X  bulunur. Bu
nedenle V  X  ‟in varlığı, E  X  ‟in var olduğunu belirtir.
Teorem: Merkezi ikinci moment, yani varyans, daima herhangi bir a noktasına göre ikinci dereceden
momentten daha küçük veya ona eşittir. Buna varyansın minimum olma özelliği denir:

 
E X     E X  a
2
ya da eşdeğer olarak

2

 

Mina E ( X  a)2  E ( X  E ( X ))2 .
(4.34)
İspat için bkz. Ek4.4. Bu yaklaşım ile herhangi bir örnek veri seti için  parametresinin EKK
tahminleyicisinin x olduğu görülebilir.
Teorem: Eğer X bir şans değişkeni ise;
Mina E X  a  E X  med .
(4.35)
96
4.7.1 Merkezi Momentlerin Orijine Göre Momentler Cinsinden Hesabı
Hesaplama kolaylığı açısından merkezi momentler orijine göre momentler cinsinden bulunabilir.
Orijine göre momentlerle merkezi momentler arasındaki ilişki Binom teoremi kullanılarak elde
edilebilir. Bilindiği gibi binom açılımı merkezi momentlerde kullanıldığında;
x   r   (1)i  i x r i 
r

i
r
i 0
sonuç olarak,

 


r
  1i  i r  i
 
r
  1i  i E X r i
i 0  i 
 
E X    
r

r
r

(4.36)
i 0  i 
elde edilir.
Teorem: Eğer r  2 alınırsa
 2  2   2
ya da
 
V  X   E X 2  E  X 
2
İspat için bkz. Ek 4.5.
4.7.2 Orijine Göre Momentlerin Merkezi Momentler Cinsinden Hesabı
Orijine göre momentler de merkezi momentler cinsinden hesaplanabilir ve
 
r  E X r

r
 E( X   )     E 



r
  i ( X   ) 
i
r i 


r
  i  r  i
i
(4.37)
olarak bulunur.
4.7.3 Faktöriyel Momentler
Özellikle kesikli şans değişkenlerinin momentlerinin bulunmasında faydalı olan bir yaklaşım,
dağılımın faktöriyel momentleridir. İlk olarak şans değişkeninin karesi ele alınsın;
x 2  xx  1  x
bu ifadenin beklenen değeri alınarak,
 
E X 2  EX  X  1  E  X 
Sonuç olarak;
 
EX  X  1  E X 2  E X   2  1
97
bulunur. Bu yaklaşım daha büyük momentler için de geçerlidir. Örneğin şans değişkeninin üçüncü
faktöriyel momenti
 
 
EX  X  1 X  2  E X 3  3E X 2  2E X   3  32  21
olup, üçüncü faktöriyel moment kullanılarak,
3  EX  X  1 X  2  32  21
bulunabilir. Genel olarak r-inci faktöriyel moment
EX  X  1 X  2 X  r  1
olarak tanımlanır.
4.7.4 Momentlere Dayanan Asimetri ve Basıklık Ölçüleri
Bir olasılık dağılımının biçimi ile ilgili ek bilgiler, üçüncü ve dördüncü merkezi momentler yardımı ile
elde edilebilir. Bu ek bilgiler genellikle dağılımın çarpıklık ve basıklığı olarak adlandırılır. Bir frekans
dağılışının ortalama değerine göre simetriden ayrılış derecesine asimetri ya da çarpıklık denir.
Asimetri ölçüleri için beklenen temel özellikler:
a) Değişkenin ölçme biriminden bağımsız olmalı
b) Dağılım simetrik olduğunda sıfır değerini almalı
X şans değişkeninin üçüncü merkezi momenti,

3  E  X   3

(4.38)
kullanılarak asimetriyi ölçebilmek için 1 ölçüsü Pearson tarafından tek modlu dağılımlar için
bulunmuştur:
1 
3 2  3 2
2 3  2 3
(4.39)
Bu parametre, değişkenin ölçü biriminden bağımsızdır. Simetrik dağılışlarda 1  0 ve asimetrik
dağılışlarda 1  0 eşitsizliği daima sağlanır.
1 parametresininin işaret eksikliğini gidermek için Fisher tarafından standartlaştırılmış üçüncü
moment ya da diğer adıyla çarpıklık katsayısı önerilmiştir:
1 
3

 33
32
2  
(4.40)
1 parametresi de değişkenin ölçü biriminden bağımsızdır. Simetrik dağılışlarda  1  0 olup, sağa
çarpık dağılışlarda  1  0 , sola çarpık dağılışlarda  1  0 eşitsizlikleri sağlanır.
98
ġekil 4.3 Simetrik dağılımlar 3  0
3  0 olduğu halde simetrik olmayan dağılışlar da mevcuttur. Bunun nedeni aşırı büyüklükteki uç
değerlerin aritmetik ortalamaya etki edip, onu büyütüp küçültmeleridir. E  X  değerinde oluşan bu
değişme 3 ‟e yansımaktadır.
ġekil 4.4 Asimetrik dağılımlar 3  0
Bir dağılışın modunun, aynı beklenen değer ve varyansa sahip bir normal dağılımın moduna göre daha
aşağıda ya da daha yukarıda bulunmasına basıklık farkı denir. Dağılışın tepe noktası normal
dağılımdan daha yüksekse sivri, alçaksa basık dağılımdır. Sivri dağılımda beklenen değer etrafında
yoğunlaşma daha fazladır.
X şans değişkeninin dördüncü merkezi momenti,

4  E  X   4

(4.41)
kullanılarak basıklığı ölçebilmek için 2 ölçüsü Pearson tarafından tek modlu dağılımlar için
bulunmuştur:
2 
4

 42
2
2   2
 
(4.42)
Bu parametre değişkenin ölçü biriminden bağımsızdır. Normal dağılışlarda  2  3 , normale göre
basık dağılışlarda 1   2  3 , normale göre sivri dağılışlarda ise  2  3 eşitsizlikleri sağlanır. Fisher
basıklık ölçüsü ise
 2  2  3
(4.43)
olup değişkenin ölçü biriminden bağımsızdır. Normal dağılışlarda  2  0 , normale göre basık
dağılışlarda  2  0 , normale göre sivri dağılışlarda  2  0 eşitsizlikleri sağlanır.
99
Bir ya da bir kaç tane momentin dağılış hakkında verdiği bilgi sınırlıdır. Şekil 4.5 ilk dört momenti
eşit olan iki dağılımı göstermektedir. Bununla birlikte momentlerin bütün bir seti
1, 2 , dağılımı
tam olarak belirler.
Şans değişkeni X, standart değişkene dönüştürülürse E Z   0 olduğu için Z değişkeninin merkezi
momentleri ile orijine göre momentleri eşittir. Bu özellik kullanılarak Z değişkeninin r-inci merkezi
momenti, X değişkeninin r-inci merkezi momenti cinsinden ifade edilebilir
 X    r  1
r
r ( z )  E ( Z )  E 
   r [E( X   ) ]






r

µr ( x)

r

(4.44)
µr ( x)
[  2 ( x)]r / 2
Eşitlikte r  2 alındığında V (Z )  2 ( z)  1 elde edilir. Görüldüğü gibi bir X şans değişkeninin
standartlaştırılması ortalama ve varyansını etkilemekte fakat
 1 ( z )   1 ( x)
 2 ( z )   2 ( x)
standartlaştırılmış üçüncü ve dördüncü momenti etkilememektedir.
4.8 ÇOK DEĞĠġKENLĠ DAĞILIMLAR ĠÇĠN BEKLENEN DEĞER VE
MOMENTLER
Beklenen değer ve varyans kavramları çok değişkenli durum için de genellenebilir. Örneğin bir Z şans
değişkeni X1 ve X2 gibi iki şans değişkeninin z  f x1 , x2  ya da daha genel olarak X1 , X 2 ,, X n
sonlu sayıdaki şans değişkenlerinin bir fonksiyonu z  f x1, x2 ,, xn  olarak ortaya çıkabilir. Bu gibi
durumlarda gereksinim duyulabilecek bazı önemli teoremler aşağıda verilmiştir. Genellikle iki şans
değişkenli durum için verilen teoremler n değişkenli durumlar için genellenebilir.
ġekil 4.5 İlk dört momenti eşit iki olasılık dağılımı
4.8.1 Çok DeğiĢkenli Dağılımlar Ġçin Beklenen Değer
100
Teorem: X1 ve X2 şans değişkenleri, f x1 , x2  bunların ortak olasılık fonksiyonu olsun. X1’nin ve
X2‟nin beklenen değeri, kesikli ve sürekli şans değişkenleri için sırasıyla,
E X1  
 x f x , x 
1
x1
E X1  
1
EX 2  
2
 x f x , x 
x2
2
x2
  x f x , x dx dx
1
1
2
2
EX 2  
1
x1 x2
1
(4.45)
2
x1
  x f x , x dx dx
2
1
2
1
2
.
(4.46)
x 2 x1
Teorem: X1 ve X2 şans değişkenleri, f x1 , x2  bunların ortak olasılık fonksiyonları ise ve marjinal
dağılımlar f x1 x1  ile f x2 x2  biliniyorsa X1 ve X2 şans değişkenlerinin beklenen değeri, kesikli ve
sürekli şans değişkenleri için sırasıyla,
E X1  
 x f x 
1 x1
EX 2  
1
x1
x
2 f x2
x2 
(4.47)
x2
E  X 1   x1 f x1 x1 dx1
E  X 2   x2 f x2 x2 dx2 .


x1
(4.48)
x2
Teorem: X1 ve X2 şans değişkenleri, f x1 , x2  bunların ortak olasılık fonksiyonu ise:
E  X1  X 2   E  X1   E X 2 
(4.49)
Ġspat: Sadece sürekli şans değişkenleri için gerçekleştirilecektir. X1 ve X2 şans değişkenlerinin
aldıkları değerler sırası ile a1 , a2 , ve b1 , b2 , olsun,
E X1  X 2  
  x  x  f x , x dx dx
1
2
1
2
1
2
x1 x2

  x f x , x   x f x , x dx dx
1
1
2
2
1
2
1
2
x1 x 2

  x f x , x dx dx    x f x , x dx dx
1
1
2
1
2
2
x1 x 2

1
2
1
2
x 2 x1
  x  f x , x dx dx    x f x , x dx dx
1
1
2
x1 x 2
1
2
2
1
2
1
2
x 2 x1
 E  X1   E  X 2 
Yukarıdaki teoremden görüldüğü gibi beklenen değer işlemi doğrusal bir işlemdir. Diğer bir ifade ile,
şans değişkenlerinin toplamlarının beklenen değeri, daima ayrı ayrı beklenen değerlerin toplamına
eşittir. Bu eşitliğin geçerli olabilmesi için şans değişkenlerinin bağımsız olması şart değildir. Bu
teoremin daha genel yapısı aşağıdaki tanımda verilmiştir.
Tanım (Beklenen değerin doğrusallık özelliği): X1, X 2 ,, X k şans değişkenleri ve c1 , c2 ,, ck ile b
sabitler olmak üzere,
Ec1 X1  c2 X 2    ck X k  b  c1E X1   c2 E X 2     ck E X k   b
(4.50)
eşitliği daima geçerlidir.
101
f x1 , x2  bunların ortak olasılık fonksiyonu ise şans
Teorem: X1 ve X2 şans değişkenleri,
değişkenlerinin herhangi bir g x1 , x2  fonksiyonunun beklenen değeri kesikli ve sürekli şans
değişkenleri için:
Eg x1 , x2  
 g x , x f x , x 
1
x1
Eg x1 , x2  
2
1
(4.51)
2
x2
  g x , x  f x , x dx dx .
1
2
1
2
2
1
(4.52)
x1 x 2
Teorem: X1 , X 2 ,, X n şans değişkenleri, f x1 , x2 ,, xn  bunların ortak olasılık fonksiyonu ve
c1 , c2 ,, cn sabitler olmak üzere şans değişkenlerinin herhangi bir g x1 , x2 ,, xn  fonksiyonunun
beklenen değeri kesikli ve sürekli şans değişkenleri için:

E


 c g x ,, x    c Eg x ,, x 
i
1
n
i
i
1
n
(4.53)
i
eşitliği sağlanır.
4.8.2 Çok DeğiĢkenli Dağılımlar Ġçin Çarpım Momentleri
Bu kısımda iki şans değişkeninin ortak dağılımı dikkate alınarak şans değişkenlerinin çarpım halindeki
momentleri elde edilecektir.
Tanım (İki şans değişkeninin orijine göre çarpım momenti): X1 ve X2 şans değişkenlerinin ortak
olasılık fonksiyonu f x1 , x2  ise orijin civarındaki r-inci ve s-inci dereceden orijine göre çarpım
momentleri  r, s ile gösterilir ve x1r x2s fonksiyonunun beklenen değeri ile elde edilir. Kesikli ve
sürekli şans değişkenleri için sırasıyla;


r ,s  E X 1r X 2s   x1r x2s f x1 , x2 
x1

(4.54)
x2

r , s  E X1r X 2s    x1r x2s f x1 , x2 dx2 dx1
(4.55)
x1 x 2
eşitlikleri ile tanımlanır.
Çarpım momentleri marjinal (tek değişkenli) momentlere dönüşebilir. Örneğin s  1 alınarak
1,0  E  X1  ya da r  1 alınarak 0 ,1  E X 2  ile tanımlanabilir. Özel bir durum r  s  1 ise ortaya
çıkar ve
1,1  E  X1 X 2 
ile gösterilir.
Teorem: Z1 ve Z2 standart değişkenler ise,
a)  1  EZ1Z 2   1 ya da E Z1Z 2   1
2
b) E Z1Z 2   1 ancak ve ancak Pz1  z2   1 ise,
EZ1Z 2   1 ancak ve ancak Pz1   z2   1 ise,
102
eşitsizlik ve eşitlikleri sağlanır. İspat için bkz. Ek4.6.
İki şans değişkeni arasındaki varyansın sıfır olabilmesi için Z1  Z 2 diğer bir deyişle Pz1  z2   1
olmalıdır. EZ1Z 2   1 için ise V Z1  Z 2   0 olduğu görülebilir ve bu durum için sonuç olarak
Pz1   z2   1 elde edilebilir.
Eğer Z1  Z 2 ise,
Z1 
X 1   x1
 x1
, Z2 
X 2   x2
 x2
alınarak,
X 2   x2 
 x2
X   x1 
 x1 1
(4.56)
yazılabilir. Yukarıda Pz1  z2   1 ve Pz1   z2   1 için elde edilen sonuçlar, a bir sabit olmak
üzere, Z 2  Z1  a  ve Z 2  Z1  a  için de geçerlidir. Örneğin Z 2  Z1  a ise,
 
EZ1Z 2   EZ1 Z1  a   E Z12  aEZ1   1
ya da
V Z 2  Z1   V a   0
bulunabilir. Bu durumda,
X 2   x2  a x2 
 x2
X   x1 
 x1 1
ya da eşitliğin sağındaki ilk iki terim sabit olduğundan,
X2   
 x2
X   x1 
 x1 1
yazılabilir. Elde edilen sonuçların şans değişkenlerinin kovaryans ve korelasyonu ile ilişkisi Kısım
4.8.3‟de verilmiştir.
Teorem: X1 ve X2 bağımsız şans değişkenleri, f x1 , x2  bunların ortak olasılık fonksiyonu ise:
E X1 X 2   E X1 E X 2  .
İspat: Sadece kesikli şans değişkenleri için ispat verilecektir:
E  X1 X 2  
 x x f x , x 
1 2
x2
1
2
x1
Eğer şans değişkenleri bağımsız ise f x1 x1  ve f x2 x2  marjinal olasılık fonksiyonları olmak üzere
ortak olasılık fonksiyonu;
f x1, x2   f x1 x1  f x2 x2 
ve
E  X1 X 2  
 x x f x  f x 
1 2 x1
x2
1
x2
2
x1
103




 x f x   x
1 x1
1
x1
  x2
2 f x2

x2 

 E X1 E X 2 
Teorem: X1, X 2 ,, X k sonlu sayıdaki bağımsız şans değişkenleri, f x1 , x2 ,, xk  bunların ortak
olasılık fonksiyonu ise, çarpımlarının beklenen değeri
E X1 X 2  X k   E X1 E X 2  E X k 
(4.57)
şeklinde elde edilir.
Tanım (İki şans değişkeninin merkezi çarpım momenti): X1 ve X2 şans değişkenlerinin olasılık
fonksiyonu f x1 , x2  ise orijin civarındaki r-inci ve s-inci dereceden merkezi çarpım momentleri  r , s
ile gösterilir ve X1  E  X1 r X 2  E X 2 s fonksiyonunun beklenen değeri ile elde edilir. Kesikli ve
sürekli şans değişkenleri için sırasıyla;


r ,s  E X 1  E  X 1 r X 2  E  X 2 s   X 1  E  X 1 r X 2  E  X 2 s f x1 , x2 
x1

(4.58)
x2

r , s  E X1  E  X1 r X 2  E  X 2 s    X1  E  X1 r X 2  E  X 2 s f x1 , x2 dx1dx2
(4.59)
x1 x 2
eşitlikleri ile tanımlanır.
Çarpım momentleri marjinal (tek değişkenli) momentlere dönüşebilir. Örneğin
s0
için
2,0  V  X1  ya da r  0 için 0, 2  V  X 2  ile tanımlanabilir.
Teorem (Cauchy-Schwarz eşitsizliği): Ortalamaları  x1 ve  x 2 , varyansları  x21 ve  x22 olan X1 ve X2
şans değişkenleri için,
a)
EX
1

  x1 X 2   x2
ya da eşdeğer olarak,

  
2
2
x1
 x22


  x1 x2  E X1   x1 X 2   x2   x1 x2
(4.60)
eşitsizlikleri geçerlidir.

x
b) ancak ve ancak P  X 2   x 2  2 X 1   x1
 x1






  1 ise

E X1   x1 X 2   x2   x1 x2 ,

x
ve ancak ve ancak P  X 2   x 2  2 X 1   x1
 x1






  1 ise

E X1   x1 X 2   x2   x1 x2
eşitlikleri geçerlidir.
İspat: Standart şans değişkenleri için,
EZ1Z2 2  1 ya da
 1  EZ1Z 2   1
104
eşitsizlikleri ispatlanmıştı bu eşitsizliklerde standart değişkenler yerine konarak,

  X 1   x1
E 
 x1

 
 X 2   x 2

  x
2

 X 1   x
1
 1  E 



x1
2
 
 
1
 

 
 X 2   x2

  x
2


  1


ispat tamamlanır. b şıkkı için de benzer yaklaşım kullanılır.
Cauchy-Schwarz eşitsizliği, üçgen eşitsizliğinin bir versiyonudur ve çarpımın karesinin beklenen
değerinin, karelerin çarpımından az olduğunu ifade eder. Cauchy-Schwarz eşitsizliğinin daha fazla
bilinen yapısı ise,
E X1 X 2 2  EX12 EX 22 
(4.61)
şeklindedir.
4.8.3 Çok DeğiĢkenli Dağılımlar Ġçin Varyans Kovaryans ve Korelasyon
Rassal değişkenlerin toplamının beklenen değeri değişkenlerin ayrı ayrı beklenen değerlerinin
toplamına eşittir. Bu durum varyans için genellikle geçerli değildir:
V  X  X   V 2 X 
 4V  X 
 V X   V X 
Rassal değişkenlerin toplamının varyansının, varyanslarının toplamına eşit olduğu önemli bir durum
vardır. Değişkenler bağımsız olduklarında bu eşitlik söz konusudur. Bu özel durum ispatlanmadan
önce iki rassal değişkenin kovaryans kavramı tanımlansın.
İstatistikte özel öneme sahip bir merkezi çarpım momenti 1,1 ‟ dir ve kovaryans olarak adlandırılır.
Kovaryans iki şans değişkeni arasındaki doğrusal ilişkinin bir ölçümünü verir. Aralarındaki kovaryans
sıfır olan şans değişkenlerine doğrusal ilişkisiz adı verilir. Stokastik bağımsızlık doğrusal ilişkisizliği
de otomatik olarak sağlar. Fakat doğrusal ilişkisizliğin mutlaka stokastik bağımsızlık anlamına
geleceği söylenemez. Tek istisna normal dağılmış şans değişkenleridir. Normal dağılmış iki değişken
doğrusal ilişkisiz ise aynı zamanda stokastik bağımsızdır.
Temel istatistik derslerinde frekans dağılımının konum ve yayılım ölçüleri ile nasıl özetlenebileceği
açıklanmıştır. Tıpkı bunun gibi X şans değişkeninin olasılık dağılımı da ortalama ve varyans
parametreleri gibi benzer ölçülerle özetlenebilmektedir. Sorulması gereken soru, ortak olasılık
dağılımı f x1 , x2   Pr X1  x1 , X 2  x2  olan X1 ve X2 şans değişkenleri ikililerinin dağılımının nasıl
özetlenebileceğidir. Konum ile ilgilenildiğinde X1 ve X2 için ilgili marjinal dağılıma karşılık gelen
E  X 1  ve E  X 2  kullanılmaktadır. Aynı şekilde yayılım için de V  X 1  ve V  X 2  kullanılmaktadır.
Ortak dağılımlar için bir adım öteye geçilerek X1 ve X2 arasındaki ilişki incelenebilir. Örneğin,
f x1 , x2  ortak dağılımı için aşağıda verilen tablo ele alınsın:
105
X2
X1
0
1
0
0,7
0,1
1
0,1
0,1
Eğer (X1,X2) ikilisi bu dağılıma göre rastgele seçilirse,  X1 , X 2   0 olasılığı 0,70 iken, X1  0 ve
X 2  0 olasılıklarının çarpımı 0,8*0,8  0,64  0.70 olur. Bu durumda X1  0 ve X 2  0 bağımlı
olaylardır. Burada ortaya çıkabilecek bir diğer soru da bahsedilen bu bağımlılığın nasıl ölçüleceğidir.
Bağımlılığı ölçmek için kullanılabilecek birçok yol mevcuttur. Bu kısımda bunlardan biri olan
kovaryans yaklaşımı incelenecektir.
X1 ve X2‟nin bağımlılık göstergelerinden birisi “birlikte değişim”dir. Ortak olasılık fonksiyonu
f x1 , x2  , X1‟in ortalamasının üstündeki sapmaları x1  E  X1  ve X2‟nin ortalamasının üstündeki
sapmaları x2  E X 2  ifade eden
x1, x2 
ikililerine daha yüksek olasılık atayabilir. Bu nedenle
örneğin verilen bir x1 , x2  ikilisinde X1‟in pozitif sapmaya sahip olduğu biliniyorsa, sıra dışı bir
durum olmadığı müddetçe X2‟nin de ortalamadan sapması pozitiftir. Bu tip bir bilgi için sayısal bir
ölçü,
 x  EX x
1
x1
1
2
 E  X 2  f x1 , x2 
x2
terimler toplamıdır. Yukarıda belirtilen türdeki bağımlılık için bu toplam, büyük pozitif terimler
türetme eğilimindedir. X1 ve X2‟nin bağımlılık göstergelerinden başka birisi de “karşıt değişim”dir.
x1, x2  ikilileri için
x1  E  X1  ve x2  E X 2  ‟den birisi pozitif diğeri negatiftir.
Sonuç olarak yukarıdaki toplam, X ve Y arasındaki bağımlılığın türü hakkında bilgi vermektedir. Bu
terime kovaryans adı verilmektedir.
Tanım (Kovaryans): X1 ve X2 iki şans değişkeni ve ortalamaları sırası ile  x1 ve  x 2 ise, X1 ve X2 şans
değişkenleri arasındaki kovaryans Cov X1 , X 2  ile ya da  x1 x 2 ile gösterilir ve


Cov X1 , X 2   E X1   x1 X 2   x2

(4.62)
eşitliğinden elde edilir.
Bu eşitlik,

Cov( X1 , X 2 )  E X1 X 2  μx1 X 2  X1 μx2  μx1 μx2

 E  X1 X 2   μx1 μx2
ya da
Cov( X1 , X 2 )  E X1 X 2   E X1 E X 2 
(4.63)
ya da orijine göre çarpım momentleri cinsinden de ifade edilebilir:
Cov( X1, X 2 )  1,1  1,0 0 ,1
 1,1   x1  x2 .
106
Kovaryasın işlemcisinin bazı temel özellikleri aşağıda teoremler ile verilmiştir.
Teorem: Kovaryans, tanımından da görülebileceği üzere, simetriktir.
Cov X1, X 2   Cov X 2 , X1 
(4.64)
Teorem: Kovaryans, değişkenlere ait her bir koordinata göre doğrusaldır (bilinear). Bu özelliğin iki
önemli anlamı vardır: İlki, bir değişkene ait çarpımsal sabit bir diğer koordinata geçirilebilir;
CovaX1, X 2   aCov X1, X 2   Cov X1, aX 2 
(4.65)
Ġspat: CovaX1 , X 2   EaX1  EaX1 X 2  E X 2 
 EaX1  E X1 X 2  E X 2   aEX1  E X1 X 2  E X 2 
 aCov X 1 , X 2 
İkincisi ise her bir koordinata ait toplama işleminin korunmasıdır;
Cov X1  X 2 , Y   Cov X1, Y   Cov X 2 , Y 
(4.66)
Cov X , Y1  Y2   Cov X , Y1   Cov X , Y2  .
(4.67)
ve
Ġspat: Cov X1  X 2 , Y   E X1  X 2 Y   E X1  X 2 EY 
 E X1Y   E X 2Y   E X1   E X 2 EY 
 E X1Y   E X1 EY   E X 2Y   E X 2 EY 
 Cov X1 , Y   Cov X 2 , Y  .
Bu teorem aşağıdaki teorem ile tanımlanan eşitliği göstermek için genelleştirilebilir.
Teorem: Tek bir eksendeki şans değişkenlerinin toplamının diğer eksendeki şans değişkeni ile
kovaryansı
 n

Cov X i , Y  
 i 1


n
 Cov X , Y 
(4.68)
i
i 1
eşitliği ile elde edilir.
Teorem: Her iki eksendeki şans değişkenlerinin toplamının birbirleri ile kovaryansı
 n
Cov X i ,
 i 1


Yj  

j 1

m
 
 CovX , Y 
n
m
i
(4.69)
j
i 1 j 1
eşitliği ile tanımlanır.
 n
Ġspat: Cov X i ,
 i 1


Yj  

j 1

m
 


Cov X i ,

i 1

n


n
Y 
j
j 1


m
 Cov Y , X 

i 1


m
j
i
j 1

 CovY , X 
n
eşitlik (4.68) ile
eşitlik (4.64) ile
m
j
i
eşitlik (4.68) ile
i 1 j 1
107
Teorem: Kovaryans her bir şans değişkenine yapılan sabit eklemelerden etkilenmez, sabit ve şans
değişkeni birbirinden bağımsızdır. a, b, c, d   olmak üzere,
CovaX1  b, X 2   aCov X1, X 2 
(4.70)
CovaX1  b, cX 2  d   acCov X1 , X 2 
(4.71)
Ġspat: CovaX1  b, cX 2  d   EaX1  b  EaX1  bcX 2  d  EcX 2  d 
 EaX1  b  aE X1   bcX 2  d  cE X 2   d 
 acCov X 1 , X 2  .
Bir diğer önemli özellik ise varyans ve kovaryans arasındaki ilişki olup
Cov X1, X1   V  X1 
(4.72)
eşitliği ile verilebilir.
Teorem: İki şans değişkeni X1 ve X2 bağımsız ise kovaryansları sıfıra eşittir, Cov( X1, X 2 )  0 . Tersi
geçerli değildir.
Ġspat: Bağımsız şans değişkenleri için;
E X1 X 2   E X1 E X 2 
eşitliği sağlandığından
Cov( X1, X 2 )  E X1 X 2   E X1 E X 2   0 .
Şimdi bu kısmın başlangıcında ele alınan iki şans değişkeninin toplamının varyansı V  X1  X 2  ele
alınsın.
Teorem: Şans değişkenleri, x   X1 , X 2  vektörü ile tanımlansın. Şans değişkenlerinin toplamının
varyansı:
V  X1  X 2   V  X1   V  X 2   2Cov X1, X 2 
Ġspat: Varyans tanımından hareketle,
V  X1  X 2   EX1  X 2  E X1  X 2 
2
ve eşitliğin sağındaki terim düzenlenerek karesi alındığında,
X1  X 2  EX1  X 2 2  X1  EX1   X 2  EX 2 2
 X1  E X1   X 2  E X 2   2X1  E X1 X 2  E X 2 
2
2
elde edilir ve her iki tarafın da beklenen değeri alındığında
V  X1  X 2   V  X1   V  X 2   2EX1  E X1 X 2  E X 2 
 V  X1   V  X 2   2Cov X1, X 2 
(4.73)
ispat tamamlanır.
Teorem: Eğer X1 ve X2 bağımsız ise ya da en azından doğrusal ilişkisiz ise
V  X1  X 2   V  X1   V  X 2 
(4.74)
sonucu elde edilir.
108
Teorem: X1 ve X2 şans değişkenleri, a ve b sabitler olmak üzere:
V aX1  bX 2   a 2V  X1   b2V  X 2   2abCov X1, X 2 
(4.75)
Eşitlik (4.75) kullanılarak n adet rassal değişkenin toplamının varyansı için aşağıdaki teorem
tanımlanabilir.
Teorem: Eğer X1 , X 2 ,, X n şans değişkenleri ve c1 , c2 ,, cn sabitler olmak üzere bu şans
değişkenlerinin doğrusal fonksiyonu olarak,
Y  c1 X1  c2 X 2    cn X n
şeklinde tanımlanan şans değişkeninin varyansı,
 n

V  ci X i  
 i 1


n

ci2Var  X i  
i 1
 c c CovX ,X 
n
n
i j
i
(4.76)
j
i 1 j 1
j i
eşitliği ile tanımlanır.

Ġspat: V Y   E Y  E Y 
2
n


 E  ci X i 

 i 1



ci E  X i 
i 1

n

2





2
k

 


 E  ci X i  E  X i  
 

 i 1


Köşeli parantezin içinin açılması çokterimli bir ifadenin açılımıdır. Örneğin,
aX  bY  cZ 2  a2 X 2  b2Y 2  c2 Z 2  2abXY  2acXZ  2bcYZ
gibi. Açılım sonucunda


2
V Y   E  ci2 X i  E  X i  

 i1
n

 c EX
n

2
i
i j
i j
i 1
i


 E  X i  X j  E X j 


  c c EX
 E  X i  
2
i
 c c X
i j

i
 

 
 E  X i  X j  E X j
i j
elde edilir ve varyans ve kovaryansın tanımı kullanılarak,
V Y  
 c V  X    c c CovX , X 
n
2
i
i
i 1

i j
i
j
i j



ve Cov X i , X j  Cov X j , X i olduğundan,
V Y  
 c V  X   2 c c CovX , X 
n
2
i
i 1
i
i j
i
j
i j n
elde edilerek ispat tamamlanır.
Teorem: Eğer X1, X 2 ,, X k şans değişkenleri birbirinden bağımsız ve c1 , c2 ,, ck sabitler ise;
Y
k
c x
i i
i 1
109
ile tanımlanan şans değişkeninin varyansı;
V Y  
k
 c V X  .
2
i
(4.77)
i
i 1
eşitliği ile tanımlanır.
Teorem: X1 ve X2 şans değişkenleri için eğer, V  X1   V  X 2  eşitliği geçerli ise X1  X 2 ve X1  X 2
şans değişkenleri doğrusal ilişkisizdir.
Kovaryans iki rassal değişken arasındaki sadece doğrusal ilişkinin göstergesidir. Bağımlılığın
ölçümünde kullanılan diğer yaklaşımlarda tersi de doğru olmak üzere, eğer ölçüm değeri 0 ise
değişkenler bağımsızdır. Fakat kovaryans ölçüsü için tersi doğru değildir.
Örnek: Aşağıdaki ortak olasılık dağılımı ele alınsın.
X2
X1
-1
0
1
0
0
1/3
0
1
1/3
0
1/3
Bu dağılım için X1 ve X2 arasında oldukça güçlü bir ilişki vardır. 0 olasılıklı x1 , x2  ikilileri göz ardı
edildiğinde,
X 1  X 22
eşitliği elde edilir. Eşitlikten görülebileceği gibi değişkenler arasında karesel (eğrisel) bir ilişki vardır.
Diğer taraftan,
 
 
Cov X1 , X 2   E X1 X 2   E X1 E X 2   E X 23  E X1 .0  E X 23  0
olur. Böylelikle kovaryans ölçüsünün bağımlılık yapısının tamamının belirlenmesinde başarısız olduğu
görülebilir. Kovaryans hakkındaki ön sonuçlar:
a. X1 ve X2 bağımsız ise Cov( X1, X 2 )  0 ‟dır.
b. Cov( X1, X 2 )  0 , bir bağımsızlık göstergesi değildir.
c.
Cov( X1, X 2 )  0 , bağımlılığın varlığını gösterir (fakat hangi tür?)
Sıfırdan farklı kovaryans değerinin anlamının yorumlanabilmesi için, Cov( X 1 , X 2 ) ‟nin değerinin ne
kadar büyük olabileceğinin belirlenmesi gerekir. Eşitlik (4.60) ile gösterildiği üzere kovaryans değeri,
X1 ve X2‟nin varyansları cinsinden ifade ile, daima iki sınır arasında yer alır,
  X1 X 2  Cov X1 , X 2    X1 X 2
Cauchy-Schwarz eşitsizliğine ait teoremden görülebileceği üzere, kovaryansın x1  E  X1  ve
x2  E X 2  bileşenleri oransal olduğunda bu sınır değerlerinden birini alabilir. Örneğin bir c sabiti
için,
x1  E X1   cx2  E X 2 
110
x2 
1
E  X1  

x1   E  X 2  

c
c 

X1 ve X2 arasında x2  ax1  b şeklinde doğrusal bir ilişki vardır.
Kovaryans, X1 ve X2 arasındaki doğrusal ilişkinin derecesini ölçmektedir. Yukarıdaki örnekte X 1  X 22
olduğu
ve
X1 değişkeni,
X2 değişkeninin
sıfır
değeri
etrafında
simetrik
olduğu
için
Cov( X1, X 2 )  0 ‟dır. Bu ilişki tamamen kareseldir. Doğrusal değildir.
Böylece kovaryansın belirli bir bağımlılık türünü ölçtüğü (doğrusal ilişkinin derecesi) görülmektedir.
Kovaryans ölçüsünün gücüne  x1 x2 ‟nin alabileceği en büyük değerle kıyaslayarak karar verilebilir.
Eğer Cov( X 1 , X 2 ) bu büyüklüğe ulaşabiliyorsa, X1 ve X2 tamamen doğrusal bir ilişkiye sahiptir. Eğer
Cov( X1, X 2 )  0 ise X1 ve X2 arasındaki ilişkinin doğrusal olmayan bir yapıda olduğu ya da
değişkenlerin bağımsız oldukları söylenebilir. Eğer Cov( X 1 , X 2 ) bu iki değer arasında yer alıyorsa, X1
ve X2 arasındaki ilişkinin doğrusal ve diğer bileşenlerin karışımından oluşan bir yapıda olduğu
söylenebilir.
Kovaryans ölçümünün istenmeyen bir özelliği, değişken dönüşümü yapıldığında değerinin
değişmesidir. Örneğin X1 ve X2 değişkenleri için aşağıdaki dönüşüm ele alınsın:
W  cX1 , V  dX 2
CovW ,V   EW  EW V  EV 
 Ec X1  E X 2 d  X 2  E X 2 
 cdCov X1, X 2 
Görüldüğü üzere kovaryans ölçü birimine bağımlıdır. Ölçümlerdeki birimlere duyarlı olmayan
bağımlılık ölçüleri tercih sebeplerindendir. Bu bağlamda “boyutsuz” olan bir ölçü bir sonraki adımda
ele alınacaktır.
Kovaryans değerinin, iki şans değişkeninin varyanslarına bağlı olarak alabileceği değerlerin
sınırlarından bahsedilmişti. Kovaryansın belirli bir değerinin “büyük” ya da “küçük” olduğuna karar
verebilmek için değerinin, iki şans değişkeninin varyanslarına oranlanması gerekir. Bunu
gerçekleştirmenin bir yolu kovaryansın, değişkenlerin standart sapmalarının çarpımına bölünmesidir.
Elde edilen bu ifadeye, X1 ve X2‟nin korelasyonu denir ve  sembolü ile gösterilir.
 x1 x2 
 X  E  X   X  E  X    x x
Cov X 1 , X 2 
1 
2
2 
1 2
 E  1


  x  x
 x1

V  X1  V  X 2 

x
2
1
2


Buradan da görülebileceği gibi bu ölçü X1 ve X2‟deki W  cX1 , V  dX 2 gibi bir dönüşüme bağlı
olarak değişmeyecektir.
Tanım (Korelasyon): Ortalamaları  x1 ve  x 2 , varyansları  x21 ve  x22 olan X1 ve X2 şans
değişkenlerinin tanımladığı standart değişkenler arasındaki kovaryans CovZ1, Z 2 
111
 X  E  X   X  E  X  
1
1 
2
2 







x1
x2



  E 
(4.78)
korelasyon katsayısı olarak adlandırılır.
Ayrıca kovaryans için elde edilen sınır değerleri korelasyona uyarlandığında,
 1   x1 x2  1
(4.79)
olduğu görülür. Böylelikle korelasyon değeri sınırlara yaklaştığında bağımlılığın gücü hakkında karar
verilebilir. Ancak unutulmamalıdır ki kovaryansta olduğu gibi korelasyon da sadece belirli bir tür
bağımlılığa (doğrusal bağımlılık) duyarlıdır. Korelasyon 0 olsa dahi diğer türlerden güçlü bir
bağımlılık söz konusu olabilir.
Korelasyon hangi durumlarda +1 ve -1 değerlerini alır? X2‟nin X1 ile X 2  a  bX1 şeklinde bir
dönüşüm ile tam olarak ilişkili olduğu durum ele alınsın. O halde,
 
E X1 X 2   EX1 a  bX1   aE X1   bE X12
V  X 2   b 2V  X1 
alınarak,

 
Cov X1 , X 2   E X1 X 2   E X1 E X 2   aE X1   bE X12  E X1 Ea  bX1 
 
 aE X1   bE X12  aE X1   bE X1 
2
 bV  X1 
bulunur ve tam doğrusal ilişki durumu için,
bV  X 1 
 x1 x2 
V  X 1 b V  X 1 
2

b
b
(4.80)
elde edilir. Bu ifade b  0 için +1 ve b  0 için -1 değerini alır. Diğer bir deyişle, korelasyon sadece
tam doğrusal ilişki söz konusu olduğunda +1 ve -1 değerlerini alır. Örneğin X1  X 2 durumu ele
alınsın. Bu durumda kullanılacak doğrusal dönüşümde a  0 ve b  1 ‟dir. Korelasyon ise
 x1 x1  1
eşitliği ile tanımlanır. İki değişken arasındaki kovaryans, değişkenlerin ölçülmesinde kullanılan
birimlere bağlıdır. İlişkinin ölçü birimlerinden arıtılmış ifadesi, ortak anakütle korelasyon katsayısıdır.
Korelasyon katsayısının temel özellikleri:
1. Korelasyon katsayısı „nun işareti Cov X1 , X 2  ‟nin işaretine göre değişir.
2.
Cov X1 , X 2   0 ise   0 olur.
3. Korelasyon katsayısı  „nun alabileceği maksimum ve minimum değerler:
1    1
4.   1 olması X1 ve X2 arasında tam doğrusal ilişki bulunduğunu belirtir.
112
  1 durumunda X 2  a  bX1 doğrusunun grafiği, X1 ve X2‟nin tüm olasılık dağılımını içerir. Tüm
x1, x2 
ikilileri bu doğrunun üzerindedir. Bu ekstrem durum için Pr X 2  a  bX1   1 olur. Ekstrem
durum haricinde, X1 ve X2‟nin tüm olasılık dağılımı X 2  a  bX1 doğrusunun çevresinde bir bant
içindedir. Doğrusal regresyon analizi bu mantığa dayanarak geliştirilmiştir.
Tanım (Varyans-kovaryans matrisi): X1, X 2 ,, X k sonlu sayıdaki şans değişkenlerinin tanımladığı
k1 boyutlu bir şans vektörü xT   X1 ,, X k  için varyans–kovaryans matrisi Σ olsun. Her bir şans


değişkeninin varyansı, V  X i  ve herhangi iki şans değişkeninin kovaryansı, Cov X i , X j olsun. Sonuç
olarak k1 boyutlu bir şans vektörünün varyans-kovaryans matrisi kk boyutlu,

Σ  E x  E xx  E x
T

 X 1  E  X 1  




 E 

X 1  E  X 1   X k  E  X k 
 X  E  X 

k 
 k

Cov X 1 , X 2   Cov X 1 , X k 
 V  X1 
Cov X , X 
V X 2 
 Cov X 2 , X k 
2
1










V X k  
Cov X k , X 1  Cov X k , X 2  
(4.81)
simetrik bir matristir. Şans değişkenlerinin toplamlarının varyansı ise 11 boyutlu bir skalerdir.
4.8.4 ġans DeğiĢkenlerinin Doğrusal Kombinasyonlarının Momentleri
Bazı durumlarda n adet şans değişkeninin X1 , X 2 ,, X n doğrusal kombinasyonundan ortaya çıkan bir
Y1 şans değişkeninin beklenen değer ve varyansı ile ya da n adet şans değişkeninin tanımladığı iki
doğrusal kombinasyondan elde edilen iki şans değişkeni Y1 ve Y2 arasındaki kovaryans ile
ilgilenilebilir. Bu konu özellikle tahminleyicilerin şans değişkenlerinin doğrusal kombinasyonu olarak
tanımlandığı istatistiksel yorumlamada önemlidir.
Teorem: Eğer X1 , X 2 ,, X n şans değişkenleri ve c1 , c2 ,, cn ile d1 , d 2 ,, d n sabitler olmak üzere
bu şans değişkenlerinin doğrusal fonksiyonu olarak;
y1 
n

ci xi , y2 
i 1
n
d x
i i
i 1
tanımlanan iki şans değişkeni Y1 ,Y2 olsun.
a) E Y1  
n
 c E X  eşitlik (4.50) ile
i
i
i 1
b) V Y1  
 c V  X   2 c c CovX , X  eşitlik (4.76) ile
n
2
i
i
i 1
c) CovY1 , Y2  
i j
i
j
i j n
 c d V  X   2 c d CovX , X .
n
i i
i 1
i
i
j
i
j
(4.82)
i  j n
113
İspat: Teoremin c şıkkı için,
CovY1 , Y2   EY1  EY1 Y2  EY2 
n


 n
  n

 E  ci X i  E  ci X i   d j X j  E 

 i 1
  j 1


 i 1


n


 E  ci X i 

 i 1



n
n
 c E X   d
i
i
 j 1
i 1
jX j

n
d
j 1
n


 E 

 i 1
n
 c d X

i
j
j 1
 c d EX
n
i
n
i
j
i

n
j
j 1
 
 
 
 
 


 d E X  
n

 n

 E  ci X i  E  X i   d j X j  E X j

  j 1
 i1

jX j
j


  
 



 E  X i  X j  E X j  
 



 
 
 E  X i  X j  E X j
i 1 j 1

 c d CovX , X 
n
n
i
j
i
j
i 1 j 1
Burada, Cov X i , X i   V  X i  olduğundan,
CovY1 , Y2  
 c d V  X   2 c d CovX , X 
n
i i
i
i
i 1
j
i
j
i j n
ispat tamamlanır.
Teorem: Eğer X1 , X 2 ,, X n şans değişkenleri birbirinden bağımsız ve c1 , c2 ,, cn ile d1 , d 2 ,, d n
sabitler ise;
Y1 
n

ci xi ve Y2 
i 1
n
d x
i i
i 1
şeklinde tanımlanan iki şans değişkeni arasındaki kovaryans,
CovY1 , Y2  
n
 c d V X  .
i i
i
(4.83)
i 1
eşitliği ile tanımlanır.
4.9 ÇOK DEĞĠġKENLĠ DAĞILIMLAR ĠÇĠN KOġULLU BEKLENEN
DEĞER VE VARYANS
X1 ve X2 ortak olasılık fonksiyonu f x1 , x2  olan iki şans değişkeni olsun. Eğer tüm Xi şans
değişkenleri için marjinal olasılık fonksiyonları tanımlı ise koşullu ortak olasılık fonksiyonu f x1 / x2 
tanımlıdır. Bu koşul altında tüm X2 değerleri üzerinden X1 şans değişkenin koşullu beklenen değeri
(orijine göre birinci momenti) E X1 / X 2  x2  ile gösterilir.
114
Teorem: X1 şans değişkeni ve f x1 / x2  de verilen X2 değeri için X1‟in şartlı olasılık fonksiyonu ve
f x2 / x1  fonksiyonu verilen X1 değeri için X2‟in şartlı olasılık fonksiyonu ise X1‟in ve X2‟nin şartlı
beklenen değeri kesikli ve sürekli şans değişkenleri için,
E X1 / X 2  
 x f x / x 
1
1
E X 2 / X1  
2
 x f x
2
2
/ x1 
x1
x2
E  X 1 / X 2   x1 f x1 / x2 dx1
E  X 2 / X 1   x2 f x2 / x1 dx2

(4.84)

x1
(4.85)
x2
eşitlikleri ile tanımlıdır.
Verilen X2 değeri yerine konduğunda E  X1 / X 2  sabit bir sayıdır. Başka bir deyişle, şartlı beklenen
değer X2 değişkeninin bir fonksiyonudur. Benzer şekilde E  X 2 / X1  de X1‟in bir fonksiyonudur.
E  X 2 / X1  , X1‟in belli bir değeri için sabit, fakat X1‟in değişen değerlerine bağlı olarak değiştiği için
bir şans değişkenidir. E  X 2 / X1  ‟in dağılımının beklenen değeri EE X 2 / X1  olup, E  X 2 / X1 
regresyon fonksiyonu olarak da adlandırılır.
X
EX 2 | X1  c
2
Regresyon
fonksiyonu
E X 2 | X1  b
EX 2 
E X 2 | X1  a
a
b
EX1 
c
X
1
Teorem: Koşullu dağılımların beklenen değerlerinin beklenen değeri için, eğer E  X 2  ve E  X 2 / X1 
mevcut ise, X2 şans değişkeni için beklenen değer;
E X 2   EE X 2 / X1 
(4.86)
eğer E  X 1  ve E  X1 / X 2  mevcut ise, X1 şans değişkeni için beklenen değeri;
E X1   EE X1 / X 2  .
(4.87)
eşitlikleri ile tanımlıdır.
115
İspat: E  X 2 / X 1   x2 f x2 / x1 dx2 değerinin X1 değişkeninin bir fonksiyonu olduğu belirtildi. Bu

x2
nedenle ikinci beklenen değer işlemi X1 şans değişkeni üzerinden uygulanır.


EE  X 2 / X 1    x2 f x2 / x1 dx2  f x1 x1 dx1


x1  x 2

 
  x f x

2
2
/ x1  f x1 x1 dx2 dx1
x1 x 2

  x f x , x dx dx
2
1
2
2
1
x1 x 2
 EX 2 
EX1 | X 2  ‟nin, şans değişkeni X2‟nin bir fonksiyonu olduğu unutulmamalıdır.
Örnek: X şans değişkeninin bileşenleri X1 ve X2 olan iki değişkenli Normal dağılıma sahip olduğu,
μ  1
 2  12 
varsayılsın. Bu durumda
2 T ve Σ   1
2
 12  2 
EX 1 | X 2  x2   1 
 12
x2  2 
 22
olur. Sonuç olarak,



EEX1 | X 2   E  1  122 x2  2 
2


 1 
12
Ex2   2 
 22
 1 
 12
2  2 
 22
 1
elde edilir.
Örnek: x şans değişkeninin bileşenleri X1 ve X2 olan iki değişkenli Normal dağılıma sahip olduğu,
 2  12 
varsayılsın.
μ  0 ve Σ   1
2
 12  2 
E X1 X 2   EE X1 X 2 | X 2 
 EX 2 E X1 | X 2 
 

 E  X 2  122 X 2 
   2


 
 
 12

E X 22  122  22
2
2
2
116
  12
Teorem: x, X 1 ve X 2 ‟yi içeren iki değişkenli rassal değişken ve EX1 | X 2   c olsun. Bu durumda
EX1   c olur.
EX1   EEX1 | X 2   Ec  c.
Tekrarlı beklenen değer kanunu, koşul koymanın beklenen değer almanın sonucunu değiştirmediğini
göstermek için koşullu beklenen değeri kullanmaktadır. Bir başka deyişle, beklenen değer alma
sırasının bir önemi yoktur. Koşullu beklenen değer kullanılırken, koşul koyulan şans değişkeni “sanki”
şans
değişkeni
değilmiş
gibi
davranır
(koşullu
beklenen
değerde)
ve
böylece
EEX1 X 2 | X 2   EX 2 EX1 | X 2  yazılabilir. EX1 | X 2  ifadesi X2‟nin bilinen bir fonksiyonu
olduğunda, tekrarlı beklenen değer kanunu ile bu bilgi birlikte değerlendirildiğinde oldukça kullanışlı
bir araç haline gelmektedir.
Teorem: X1 ve X2 şans değişkenleri ve f x2 / x1  de verilen X1 değeri için X2‟in şartlı olasılık
fonksiyonu ve g x2  , X2 şans değişkeninin bir fonksiyonu ise verilen X1 değeri için g x2  ‟in şartlı
beklenen değeri,
Eg  X 2  / X1  
 g x  f x
2
2
/ x1 
(4.88)
x2
Eg  X 2  / X 1   g x2  f x2 / x1 dx2 .

(4.89)
x2
eşitlikleri ile tanımlıdır.
Teorem: g  X 2  , X2 şans değişkeninin bir fonksiyonu ve f x2 / x1  koşullu olasılık fonksiyonu olmak
üzere,
Eg  X 2   EEg  X 2  / X1 
(4.90)
eşitliği geçerlidir.
Ġspat: Eg  X 2  / X 1   g x2  f x2 / x1 dx2 değeri X1 değişkeninin bir fonksiyonu olduğundan ikinci

x2
beklenen değer işlemi X1 şans değişkeni üzerinden uygulanır.


EEg  X 2  / X 1    g x2  f x2 / x1 dx2  f x1 x1 dx1


x1  x 2

 

  g x  f x
2
2
/ x1  f x1 x1 dx2 dx1
x1 x 2

  g x  f x , x dx dx
2
1
2
2
1
x1 x 2
 Eg  X 2 
117
Teorem: X1 ve X2 şans değişkenleri ve g x1  , X1 şans değişkeninin bir fonksiyonu ise E  X 2  sonlu
olmak üzere X1 şans değişkeninin tüm değerleri için,
EX 2 g x1  / X1   g x1 EX 2 / X1 
(4.91)
tanımlıdır.
İspat: EX 2 g x1  / X 1   g x1  x2 f x2 / x1 dx2

x2
 g x1 EX 2 / X1 
elde edilir.
Bu teoremin özel bir durumu x2  1 ile tanımlanır. Diğer bir deyişle,
Eg x1  / X 1   g x1  f x2 / x1 dx2

x2
 g x1 
Burada f x2 / x1  ‟nin bir olasılık yoğunluk fonksiyonu olduğu unutulmamalıdır.
Teorem: Eğer X1 ve X2 şans değişkenleri stokastik bağımsız ise, diğer bir deyişle
f x1, x2   f x1 x1  f x2 x2 
ise, veya şartlı ve şartsız dağılımlar arasında fark yoksa:
E  X1 / X 2   E  X1 
E  X 2 / X1   E  X 2 
eşitlikleri geçerlidir.
Koşulsuz olarak bağımsız olan şans değişkenlerinin diğer özellikleri, koşullu olarak bağımsız şans
değişkenleri için de geçerlidir. Örneğin; X1 ve X2 şans değişkenleri X3 koşulu altında bağımsız ise, X1
ve X2 arasındaki koşullu kovaryans 0‟dır (koşullu korelasyonda olduğu gibi) ve
EEX1 X 2 | X 3   EEX1 | X 3 EX 2 | X 3 
olur. Çarpımın koşullu beklenen değeri, koşullu beklenen değerlerin çarpımına eşittir.
Tanım (Koşullu moment): Rassal değişken X‟in yine bir rassal değişken Y‟ye göre r-inci koşullu
merkezi momenti;

r  E  X  EX | Y r | Y

r  2,3,...
ile gösterilir.
Teorem: X1 ve X2 şans değişkenlerinin f x1 / x2  ve f x2 / x1  şartlı dağılışlarının varyansı,

/ X   E X

/ X   E X
a. V  X1 / X 2   E X12 / X 2  E X1 / X 2 
(4.92)
/ X1 
(4.93)
b. V  X 2
1
2
2
1
2
2
2
eşitliklerinden ya da daha açık olarak kesikli ve sürekli şans değişkenleri için sırasıyla,


V  X1 / X 2   








 x2


2
2

 x1  E X1 / X 2   f x1 / x2  , V  X 2 / X1    x2  E X 2 / X1   f x2 / x1 
x1
118
 x  E X
V  X1 / X 2  
1
1/

X 2  f x1 / x2 dx1 , V  X 2 / X 1  
2
x1
 x
2

 E  X 2 / X1  f x2 / x1 dx2
2
x2
eşitlikleri ile tanımlıdır.
İspat: Sadece (a) şıkkına ait sürekli değişkenler için verilmiştir.


 EX  2 X E X / X   E X / X  
  x  2 x E  X / X   E  X / X  f  X
V  X1 / X 2   E X1  E X1 / X 2 
2
2
2
1
1
1
2
1
2
2
2
1
1
1
2
1
2
1
/ X 2 dx1
x1
 x12 f  X1 / X 2 dx1  2E  X1 / X 2  x1 f  X1 / X 2 dx1  E  X 1 / X 2 


x1
x1

 E X

 EX
2
 f X
1/
X 2 dx1
x1
 E X12 / X 2  2E X1 / X 2 E X1 / X 2   E X1 / X 2 
2
1
/ X2
2
1/
X 2  .
2
Koşullu beklenen değerin varyansının elde edilmesi ile ilgili önemli bir teorem de aşağıda verilmiştir.
Teorem: X1 ve X2 şans değişkenleri, E  X 2  ise sonlu olsun. E  X 2 / X1  mevcut ise,
V  X 2   EV  X 2 / X1   V E X 2 / X1  .
(4.94)
İspat için bkz. Ek4.7.
Son eşitlikte, X2 şans değişkeninin varyansı iki farklı varyansın toplamı olduğu görülmektedir. İlki X2
şans değişkeninin değişen X1 değerleri için şartlı varyanslarının beklenen değeri. İkincisi ise X2 şans
değişkeninin değişen X1 değerleri için şartlı dağılımlarına ait ortalamalarının varyansıdır.
Bu teoremin önemli bir sonucu olarak, EV  X 2 / X1   0 eşitsizliği daima sağlanacağı için,
V  X 2   V E X 2 / X1 
(4.95)
eşitsizliği yazılabilir.
Teorem (Toplam kovaryans kuralı): X ve Y şans değişkenleri arasındaki kovaryans, eğer X,Y ve Z
rassal değişkenleri aynı olasılık uzayında ve X ve Y arasındaki kovaryans sonlu ise aşağıdaki gibi ifade
edilebilir:
Cov X , Y   ECov X , Y | Z   CovE X | Z , EY | Z 
(4.96)
Ġspat: Toplam kovaryans kuralı ya da kovaryans ayrıştırma formülü olarak adlandırılan bu eşitliğin
ispatında toplam beklenen değer kuralından yararlanılmaktadır.
Cov( X , Y )  EXY   EX EY 
 EEXY | Z   EEX | Z EEY | Z 
 ECovX , Y | Z   EX | Z EY | Z   EEX | Z EEY | Z 
 ECovX , Y | Z   CovEX | Z , EY | Z 
İspat tamamlanır.
119
Kovaryansın İç Çarpım Uzayı ile İlişkisi
Doğrusal kombinasyonlar bir vektör uzayı oluşturur. Bu doğrusal fonksiyonlara ait kovaryansları ilgili
uzaydaki iki vektörün iç çarpımıdır, bkz Ek4.8.
 x, y  Cov X , Y 
Aradaki ilişkiyi açıklamak amacı ile x şans vektörünün normunun (vektörün uzunluğunun) karesi,
2
x  x12  x22    xn2
ele alınsın. Bu ifade x şans vektörünün kendisi ile iç çarpımıdır ve istatistiksel olarak şans vektörüne
ait varyans toplamını,
|| x ||2   x, x  Cov X , X   V  X    X2
ifade eder. Şans vektörünün normu ise || x || 2 ‟nin kare köküdür ve x ile sembolize edilir. x ve y şans
vektörleri arasındaki θ açısı ise
cos 

 x, y
|| x || || y ||
Cov X , Y 
 x y
  xy
eşitliği ile tanımlanır. Eşitlikten görüldüğü gibi iki şans vektörü arasındaki θ açısı, korelasyon
katsayısının arccosinüsüdür.
4.10 TÜRETEN FONKSĠYONLAR
Rassal bir değişkenin türeten fonksiyonu değişkenin belirli bir dönüşümünün beklenen değeridir.
İstatistikte en sık kullanılan türeten fonksiyonlar;
Olasılık türeten fonksiyon
Moment türeten fonksiyon
olup bu fonksiyonlar, dört önemli özelliği paylaşır:
1.Zayıf koşullar altında; türeten fonksiyon dağılımı tamamen belirler.
2.Bağımsız değişkenlerin toplamının türeten fonksiyonu, türeten fonksiyonların çarpımıdır.
3.Rassal bir değişkenin momentleri, türeten fonksiyonunun türevlerinden elde edilebilir.
4.Bir dizi türeten fonksiyonların noktasal yakınsaklığı, ilgili dağılımların özel yakınsaklığına
karşılık gelir.
Birinci özellik, en önemli özelliktir. Genellikle türeten fonksiyonun belirli bir yapıda (şekil, form,
biçim) olduğu gösterilerek rassal bir değişkenin belirli bir dağılıma sahip olduğu gösterilir. Dağılımın
türeten fonksiyon üzerinden değerlendirilmesi süreci, ters çevirme (inversion) olarak bilinir. İkinci
özellik, sıklıkla bağımsız değişkenlerin toplamının dağılımının belirlenmesi için kullanılır. Buna
karşılık; bağımsız değişkenlerin toplamının olasılık yoğunluk fonksiyonunun, marjinal yoğunluk
fonksiyonlarının convolution‟u olduğu düşünülürse çok daha karmaşık bir işlem olduğu görülür. Çoğu
zaman momentleri, türeten fonksiyondan hesaplamak, doğrudan hesaplamaktan daha kolay
120
olduğundan üçüncü özellik kullanışlıdır. Son özellik, süreklilik teoremi olarak bilinir. Çoğu zaman
türeten fonksiyonların yakınsamasını göstermek, doğrudan dağılımların yakınsamasını göstermekten
daha kolaydır.
Türeten fonksiyonlar, matematikte yaygın biçimde kullanılır ve olasılık teorisinde önemli bir role
sahiptir. Her hangi bir gerçel sayılar dizisi,
ai : i  0,1,2,,
ele alınsın. Bu sayılar, türeten
fonksiyonların çeşitli biçimlerinde ifade edilebilir. Dizinin sıradan türeten fonksiyonu şu şekilde
tanımlanır:
G t  

a t
i
i
i 0
Bu toplamın yakınsaklığı t parametresi üzerinden değerlendirilir. Verilen dizi için, bir yakınsaklık
yarıçapı r  0 bulunur. Diğer bir ifade ile t  r ise toplam mutlak yakınsaktır, t  r ise ıraksaktır.
t  r olduğunda G t  fonksiyonu birkaç kez türevlenebilir ya da integrali alınabilir. İyi tanımlanmış
çoğu dizi için G t  kapalı formda yazılabilir ve dizideki katsayılar seri açılımı ya da türevlerinin
alınması yoluyla tekrar elde edilebilir.
4.10.1 Olasılık Türeten (Faktöriyel Moment Türeten) Fonksiyon
X kesikli bir şans değişkeni olsun. Şans değişkeninin olasılık türeten fonksiyonu eğer t x
fonksiyonunun beklenen değeri mevcutsa
GX t   E (t x ) 

 t f x 
x
(4.97)
x 0
ile tanımlanır. Bu eşitlikten,
GX 1 

 f x 1
x 0
olduğu görülebilir. Bu nedenle t  1 için seri mutlak yakınsaktır. Bu fonksiyon f x  olasılık
fonksiyonunun Mellin-Stieltjes dönüşümü olarak da adlandırılır.
Teorem: X kesikli bir şans değişkeni ve onun olasılık türeten fonksiyonunun t  1 noktasındaki r-inci
türevi GXr  1 ise
GXr  1 
dr
E (t x ) t 1  E[ X ( X  1).......(X  r  1)]
r
dt
(4.98)
eşitliğini sağlar. (Eşitliğin sağ tarafı r-inci dereceden faktöriyel momenttir.)
Ġspat: GXr  t  

dr
dr   x




G
t

t f x 
X
r
r 
dt
dt  x 0


Türev ve toplam işleminin yer değiştirebileceği varsayılarak, bkz Ek4.10,


GXr  t    xx  1x  r  1t x  r f x 
 x 0


121
bu seri t  1 için seri mutlak yakınsaktır ve


GXr  1   xx  1x  r  1 f x 
 x 0


elde edilir.
Bu ifade faktöriyel moment türeten fonksiyon olarak da adlandırılır. Bu fonksiyonun çeşitli
derecelerden türevleri alınıp, t yerine 1 konduğunda X şans değişkenine ilişkin faktöriyel momentler
bulunur. Birinci türevi;
GX t  
 dt x 
d
  E Xt x 1
E t x  E 

dt
dt


 


t 1
GX 1  E X 
bulunur. İkinci türevi;
GX 1  EX  X  1
bulunur. Faktöriyel moment özellikle kesikli değişkenlerde önemlidir.
Olasılık türeten fonksiyon kullanılarak Prx  k   f k  olasılığını elde etmek için aşağıdaki iki
yöntemden biri kullanılabilir:
X şans değişkeninin olasılık türeten fonksiyonu S t  olsun. S t  fonksiyonu t değişkenine göre açılır
ve t k teriminin katsayısı
f k   sk
olarak elde edilir. İkinci yaklaşım ise
dk
S t  t 0  f k 
dt k
eşitliği ile tanımlanabilir.
4.10.2 Moment Türeten Fonksiyonlar
Beklenen değer tanımı kullanılarak momentler elde edilebilir. Bu yaklaşımın hesaplamalarında zorluk
olması durumunda dağılımın momentleri, bir fonksiyon yardımı ile de hesaplanabilir. Moment türeten
fonksiyonlar sürekli veya kesikli bir X şans değişkenin dağılımın momentlerinin hesaplanmasına
yarayan bir fonksiyondur. X şans değişkeninin moment türeten fonksiyonu M x (t ) ile gösterilir. Bir X
şans değişkeninin orijine göre veya merkezi moment türeten fonksiyonu bulunabilir. Moment Türeten
Fonksiyon (MTF), X rassal değişkeninin bütün momentlerini yine bir değişken olan t‟nin basit bir
kuvvet serisi olarak elde edilmesini sağlar ve aşağıdaki gibi tanımlanır;
E (e Xt ) 
 E ( X k )t k
k!
k 0

 




Bazı momentler sonsuz olduğunda moment türeten fonksiyon bulunmayabilir. İntegral alma
sorunlarında moment belirli bir değere sahip olmayabilir. Ayrıca momentlerin hepsi sonlu ve bir
122
değere sahip olsa bile MTF, t‟nin herhangi bir değeri için 0‟a yakınsar. Genel olarak yakınsama ve
sonsuzluk problemleri gerçek hayatta nadiren ortaya çıkar.
Fonksiyona neden moment türeten fonksiyon dendiğini açıklayabilmek amacı ile E (e xt ) yerine bu
fonksiyonun Maclaurin seri açılımı konulur. Maclaurin serisi, matematikteki fonksiyonların seri
açılımlarını elde etmek amacıyla kullanılan Taylor yaklaşımının,
f ( x)  f (a)  f (a)(x  a)  f (a)

( x  a) 2
( x  a) r
( x  a) n
 ...  f r (a)
 ... 
f n (a)
2!
r!
n!
n 0

özel olarak a  0 alınarak oluşturulmuş serisidir.
f ( x)  f (0)  f (0) x  f (0)

x2
xr
xn
 ....  f r (0)  .... 
f n (0)
2!
r!
n!
n 0

Burada maclaurin serisine e x fonksiyonu uygulanmasının nedeni 1 değerine yakınsamasıdır.
Momentler şöyle bulunabilir; f ( x)  e x fonksiyonu maclaurin serisiyle açılırsa,
ex  1 x 
x2
xr
 ...   ...
2!
r!
buradan da,
e xt  1  xt 
x2 2
xr
t  ...  t r  ...
2!
r!
elde edilir ve M x (t ) „ in seri açılımı f (x) „ in momentlerine göre bulunabilir.


x2
xr
t2
tr
M x t   E (e xt )  E 1  xt  t 2  ...  t r  ...  E (1)  tE ( x)  E ( x 2 )  ....  E ( x r )  ....
2!
r!
2!
r!


 1  t1 

t2
tr
1 ' k
2  ...  r  ... 
k t
2!
r!
k  0 k!

Bu durum  r „ nin, M x (t ) „ nin r defa türevi alınıp daha sonra t  0 konularak elde edilebileceğinin
bir diğer kanıtıdır. Örneğin birinci momenti bulmak için M x t  nin t ye göre birinci türevi alınır;
E ( x)  M x (t ) 
 1 
dM x (t )
dt
t 0
2t
3t
rt r 1
2  3  ... 
r
2!
3!
r!
t 0
burada t  0 olduğunda, 1   olarak bulunur. İkinci moment  2 isteniyor ise
E( x2 ) 

d  dM x (t ) 
t 0
dt  dt 
2
6t
r (r  1)t r  2
2  3  ... 
r
2!
3!
r!
t 0
 2
123
Burada söylenmesi gereken bir şans değişkeninin momentlerini belirlemek için bir moment türeten
fonksiyonun Maclaurin serisini kullanmaktaki asıl güçlük moment türeten fonksiyonunu bulmak değil
buna Maclaurin serisini uygulamaktır. Bazı dağılımlarda M x (t ) , t„nin bütün değerleri için
hesaplanabilir; bazı dağılımlarda ise M x (t ) , t‟nin sadece belirli bir aralıktaki değerleri için bulunabilir.
Örneğin üstel dağılım. Şans değişkeni X için moment türeten fonksiyon şans değişkenine ait f (x)
olasılık fonksiyonunun Laplace dönüşümü olarak da adlandırılır.
Tanım (Moment türeten fonksiyon): Olasılık fonksiyonu f (x) olan bir şans değişkeni X olsun. Eğer
 h2  t  h2 aralığındaki t„nin her bir değeri için şans değişkeninin beklenen değeri mevcut ise, etx
fonksiyonunun beklenen değeri X şans değişkeninin moment türeten fonksiyonu olarak adlandırılır.
Kesikli ve sürekli şans değişkenleri için moment türeten fonksiyon:
  e
M x t   E etx 
tx
f (x)

 etx f ( x)dx
Eğer bir moment türeten fonksiyon mevcut ise, orijin civarında sürekli olarak türevlenebilir. Çünkü
 h2  t  h2 aralığı t  0 değerini içerir. Moment türeten fonksiyon t parametresinin fonksiyonudur.
Bu parametrenin gerçek bir anlamı yoktur, sadece momentlerin belirlenmesine yardımcı olan
matematiksel bir araçtır. Kukla değişkendir. Moment türeten fonksiyon;
a) tüm t   için,
b) sadece t  A , A   için,
c) sadece t  0 için,
elde edilebilir. Son durumu sağlayan dağılımlar için moment türeten fonksiyon mevcut değildir.
Bunun nedeni t  0 için M x (0) fonksiyonu daima tanımlı olup 1 değerine eşittir. Beklenen değerin
ortaya çıkması biraz zor bir durumdur. Sürekli rassal değişkenler için, eğer büyük keyfi bir gözlemin
olasılığı çok büyük ise (mutlak değer açısından) beklenen değer ortaya çıkmayabilir. Örneğin,
Student‟s t dağılışında serbestlik derecesi v, 1‟e eşitse (Cauchy dağılışı), x büyüklüğündeki bir
gözlemin olasılığı büyük x değerleri için x 1 ile orantılıdır (diğer bir deyişle f ( x)  cx1 ) ve büyük
x‟ler için xf ( x)  c olur. Aralık sınırsız olduğunda sabitin integrali, çok küçük bile olsa, herhangi bir
değere yakınsamaz ve beklenen değer ortaya çıkmaz. Diğer taraftan, bir rassal değişken sınırlı ise her
zaman beklenen değeri vardır.
Teorem: Eğer X şans değişkeninin moment türeten fonksiyonu M x (t ) ise ve
M xr  0 
dr
M x t 
dt r
t 0
olarak tanımlanmış ise
 
E X r  M xr  0
124
olur.
İspat: İntegral işareti altında türev alınabileceği varsayımı altında, moment türeten fonksiyonun t„ye
göre türevi, sürekli şans değişkenleri için,

d
d
M x t  
etx f x dx
dt
dt  



d
 dt e  f x dx
tx



 xe f x dx
tx


 E Xext

ve t  0 alınırsa;
M x 0 
 
d
M x t   E xe xt
dt
t 0
 EX 
t 0
Bu yaklaşım r-inci türev için genellendiğinde,
M xr  0 

dr
M x t   E x r e xt
dt r
t 0

t 0
 
 E Xr .
Sonuç olarak; bir dağılımın momentleri, moment türeten fonksiyonun yapay değişken t‟ye göre türevi
alınarak elde edilebilir.
Moment türeten fonksiyonların kullanılmasının bir diğer nedeni de dağılışı karakterize etmeleridir.
Eğer M x (t ) mevcut ise, X‟ in dağılımı eşsiz ve tam olarak belirlenir.
Teorem: Eğer iki şans değişkeni aynı moment türeten fonksiyona sahipse bu iki şans değişkeni aynı
dağılıma sahiptir.  h, h tanım aralığındaki bütün t değerleri için X ve Y rassal değişkenlerinin moment
türeten fonksiyonları M x (t ) ve M y (t ) olsun. Bu durumda;
Eğer tüm t   h, h için M X t   M Y t  ise, tüm X‟ler için P X  x   PY  y 
Eğer tüm t   h, h için M X n t   M X t  ve P X  x  sürekli ise, tüm X‟ler için
P X n  x   P X  x 
Bu özellik sayesinde çeşitli tipteki bağımsız rassal değişkenlerin toplamının dağılışları kolaylıkla elde
edilebilir. MTF‟nin üstel bir fonksiyona sahip olması rassal değişkenlerin toplamlarını beklenen
değerlerinin çarpımları halinde yazabilmemize olanak sağlar. Bu özelliğe MTF‟nin üretkenlik
(reproductive) özelliği denir.
Teorem: X ve Y bağımsız ve aynı dağılıma sahip iki tesadüfi değişken ve bunların moment türeten
fonksiyonları sırasıyla M x (t ) ve M y (t ) olsun z  x  y şeklinde tanımlanan bir Z tesadüfi
değişkeninin moment türeten fonksiyonu;
125
M z (t )  M x (t )M y (t )
  
 
İspat: M z (t )  E e zt  E e x  y t  E e xt e yt

X ve Y bağımsız olduklarından;
  
M z (t )  E e xt E e yt
M z (t )  M x (t ) M y (t )
olur. Eğer bu teorem n tane tesadüfi değişken için genişletilir ise;
M z (t )  M x1 (t )M x2 (t )...M xn (t ) .
Örnek: Birbirinden bağımsız Poisson şans değişkenlerinin toplamlarının da Poisson olduğunu
gösteriniz.
Birbirinden bağımsız n adet Poisson şans değişkeni X1 , X 2 ,..., X n şu şekilde verilmiş olsun. Her hangi
bir i parametreli Poisson dağılımına ait moment türeten fonksiyon,
t
M X i t   ei e 1
eşitliği ile tanımlandığı için
t
t
t
M X 1  X n t   e1 e 1e2 e 1 en e 1
 e1 n e 1
t
olur ve X1  X 2    X n ‟in dağılışı parametresi 1  n  olan bir Poisson dağılımıdır.
Benzer şekilde, birbirinden bağımsız Normal şans değişkenlerinin toplamlarının da Normal olduğu
ispatlanabilir.
Teorem: X şans değişken için E  X    , V  X    2 ve tüm t‟ler için M X t  ‟nin sonlu olduğu
varsayılsın. X1 , X 2 ,..., X n eş dağılımlı, bağımsız şans değişkenleri için Sn  X1  X 2    X n olsun.
Tn 
S n  n
 n
ise, tüm X değişkenleri için n   iken
PTn  x   PZ  x 
Burada Z standart Normal şans değişkenidir.
Ġspat: Y 
X 

ve Yi 
Xi  

olsun. O halde Yi‟ler bağımsız ve Y ile eş dağılımlıdır, E Yi   0 ve
V Yi   1 ‟dir.
Tn 
Y1    Yn X 1  X 2    X n  n

n
 n
 
İspatın tamamlanabilmesi için n   iken M Tn t   M Z t   exp t 2 2 olduğu gösterilmelidir.
 
M Tn t   E etTn
126

 E e

t
n
Y1 
t
n


  E e


Yn
t
n
Y1 

  E e


t
n
Yn


  E e




t
1 t2
1 t3
 1 
E Y  
E Y2 
E Y 3  
32
2 n
6n
n


 
 
n

  t2 1 
1 t 2 1 t3
3
  1 

 1  0 

E
Y


32
 

2
n
6
2
n
n

 

 
t
Y
n



n
n
n
t2
e2
Yukarıdaki eşitlikte
X i ‟lerin birbirinden bağımsız oldukları varsayımı kullanılarak rassal
değişkenlerin üslü toplamlarının beklenen değerleri beklenen değerlerinin çarpımları olarak
yazılmıştır.
Moment türeten fonksiyonun kullanılabileceği konulardan biri de şans değişkenlerinin doğrusal
fonksiyonlarının dağılışının belirlenmesidir.
Tanım (Bir şans değişkeninin fonksiyonunun moment türeten fonksiyonu): X şans değişkeninin


herhangi bir fonksiyonu g (x) ise M g  x  (t )  E e g  x t eşitliğinden elde edilir:

M g  x  (t ) 
e
g  x t
f x dx

M g  x  (t ) 
 e   f x 
g xt
x
olur.
Teorem: c bir sabit sayı olmak üzere y  cx ‟in moment türeten fonksiyonu:
M cx (t )  M x (ct )

  e
İspat: M cx t   E ecxt 
cxt
f x dx 


e
x ( ct )
f ( x)dx  M x ct 

Teorem: Bir X şans değişkeninin moment türeten fonksiyonu M X t  olsun, c sabit bir sayı olmak
üzere y  c  x ‟in moment türeten fonksiyonu;
M c  x  (t )  ect M x (t )


 e
İspat: M ( c  t ) (t )  E e( c  x )t 

e f ( x)dx  ect e xt f t dx  ect M x t 

ct xt


Teorem: y  ax  b şeklinde tanımlanan y şans değişkeninin moment türeten fonksiyonu;
M y t   ebt M x at 
  
 

 
İspat: M y t   E e yt  E eax b t  E eaxtebt  ebt E eaxt  M x at ebt
127
Teorem: Bir X şans değişkeninin moment türeten fonksiyonu M X t  olsun, y  x  a  b olmak
üzere;
 
M y t   E e yt  ea / b t M x (t / b)
Bu teoremde a   ve b   olarak alınır ise
M  x    /  t   e  /  t M x t /  
olacaktır. Bu fonksiyon standart normal değişkenin moment türeten fonksiyonu olarak da bilinir.

Örneğin X şans değişkeninin dağılımı N  ; 2

olsun y  ax  b şeklinde ve normal dağılımlı
M y t   ebt M x at  olsun. M x t   e t   2t 2 2 olduğuna göre;

M y t   ebt eat  a 
2 2
t /2
 e
b  a t a 2 t 2 / 2
e
olarak elde edilir. Bu ise ortalaması a  b ve varyansı a 2 2 olan normal bir dağılımın moment
türeten fonksiyonudur.
Bazı durumlarda



etx f ( x)dx ‟in integrali ve
e
tx
f (x) „in toplamı mevcut değildir.
Böyle
durumlarda X‟in moment türeten fonksiyon bulunamaz. Diğer bir deyişle her dağılımın moment
türeten fonksiyonu yoktur. Bu tip dağılımlarda momenti bulmak için karakteristik fonksiyon kullanılır.
Moment türeten fonksiyonu kullanmanın bir nedeni de büyük sapmaların hesaplanmasıdır.
Sn  X1  ...  X n olsun. X i ‟ler birbirinden bağımsız ve ortalaması E  X    , moment türeten
fonksiyonu M X t  olan X rassal değişkeni ile aynı dağılışa sahip olsun. S n , kendi ortalaması n ‟den
çok uzakta olduğunda, daha spesifik olarak P(Sn  an) , a   iken, olasılık hesaplamak bir
problemdir. Burada Chebyshev eşitsizliği kullanılarak 1 n -inci dereceden bir sınır elde edilebilir.
Ancak bu durumda olasılık çok küçük olma eğiliminde olur, bkz Kısım 4.12.1.
4.11.2 Merkezi Moment Türeten Fonksiyon
Bir X şans değişkeninin kendi anakütle ortalamasına göre de moment türeten fonksiyonu bulunabilir.
Bu da genellikle M  x    (t ) ile ifade edilir.
  
M  x    (t )  E e  E e xt  e t M x (t )
Buna göre kesikli veya sürekli bir X şans değişkeninin orijine göre moment türeten fonksiyonu
biliniyorsa bu fonksiyon e  t ile çarpılarak anakütle ortalaması etrafındaki moment türeten fonksiyon
kolayca bulunabilir.
4.12 SEÇĠMLĠK KONULAR
4.12.1 Moment Türeten Fonksiyonlar Üzerine
Kısım 4.11.1 de kısaca tanımlanan büyük sapma sınırına ait teorem ve ispatı aşağıda verilmiştir.
Teorem: t  0 için M X (t ) ‟nin sonlu olduğu varsayılsın. Herhangi bir a   için,
128
P(Sn  an)  exp nI (a)
olur ve burada
I (a)  supt  0 : at  log M X (t )  0
olarak gösterilir.
Ġspat: Herhangi bir t  0 için Markov Eşitsizliği kullanılarak;


P(Sn  an)  P(etS n  ant  1)  E etS n  ant  eantM X (t )n  exp nat  log M X (t )
elde edilir.
(t )  at  log M X (t ) olduğunda t  0 için (0)  0 eşitliği sağlanmaktadır. İntegral işareti altında
türev alınabilidiği varsayımı ile;
' (t )  a 
M X (t )
E ( XetX )
a
M X (t )
M X (t )
yazılabilir ve buradan
' (0)  a    0
olduğu görülebilir. Çok küçük pozitif t değerleri için ' (t )  0 olur.
Örnek: Hilesiz bir zar n kere atılsın ve S n üst yüze gelen sayıların toplamı olsun. S n ‟in kendi
ortalamasından en az n kadar büyük olması olasılığını n=100 ve n=1000 olduğunda tahmin ediniz.
Yukarıdaki teoreme göre   3.5 ve ESn   3.5n olur. a  4.5n olduğunda P(Sn  4.5n) olasılığı için
üst sınır elde edilmelidir. Moment türeten fonksiyonu;
M X (t ) 
1
6
6

eit 
i 1
et (e6t  1)
6(et  1)
olur ve t  0 için I (4.5) değeri hesaplanmalı ve I a  fonksiyonunun tanımına göre en büyük değeri
belirlenmelidir. En büyük değer belirlenirken kullanılacak fonksiyon;
4.5t  log M X (t )
dir. Fonksiyonun grafiği aşağıdadır.
Bu problem kalkülüs ile çözülemeyeceği için nümerik hesaplamalardan yararlanılacaktır. Maksimum
nokta t  0.37105 ve sonuç olarak I(4.5) değeri, 0.178‟den biraz daha büyüktür. Böylelikle üst sınır
PSn  4.5n  e0.178n
n=10 için yaklaşık 0.17, n=100 için 1.83x10-8 ve n=1000 için 4.16x10-78‟dir. Aynı olasılık için
Chebyshev eşitsizliği ile elde edilen 35 12n sınırı büyük n değerleri için çok daha büyüktür.
4.12.2 Entropi
Verilen bir rassal değişken X için X  x olduğunda ne kadarlık bir bilgi elde edilir? X  x olduğunda
ki bilgi miktarı geçmişte X‟in x‟e eşit olabilirliğine bağlıdır. Dahası, geçmişte X‟in x‟e eşit olmaması
olasılığı daha fazla bilgi içerebilir. Örneğin, eğer X iki hilesiz zarın üst yüzüne gelen sayıların toplamı
129
olursa X‟in 12‟ye eşit olması X‟in 7‟ye eşit olmasından daha fazla bilgi içermektedir. Burada birinci
olasılık 1/36 iken ikinci olasılık 1/6‟dır.
Bir olayın içerdiği bilgi miktarı I  p  ve olayın ortaya çıkma olasılığı p olsun. I  p  negatif olmayan
ve p‟nin azalan bir fonksiyonudur. Dağılışın formunu belirlemek için, X ve Y bağımsız rassal
değişkenler ve P( X  x)  p ve P(Y  y)  q olsun. X  x ve Y  y olduğunda bu durum ne kadar
bilgi içermektedir? Cevabı, birinci için bilgi miktarı X  x olduğunda I  p  olacaktır. Önceki
bilgilerden X‟in x‟e eşit olması Y‟nin y‟ye eşit olma olasılığını etkilemediğinden (X ve Y bağımsız)
Y  y olduğunda ek bilgi miktarı I q  olacaktır. Böylece, X, x‟e eşit ve Y, y‟ye eşit olduğunda bilgi
miktarı I  p   I (q) olacaktır. Ancak diğer taraftan X‟in x‟e ve Y‟nin y‟ye eşit olduğunda bilgi miktarı
I  pq  ‟dur.
P( X  x, Y  y)  P( X  x) P(Y  y)  pq
Burada I fonksiyonu I ( pq)  I  p   I (q) eşitliğini sağlamaktadır. Ancak, eğer bir G fonksiyonu;
G p   I (2 p )
şeklinde tanımlanırsa


 I 2 2 
 I 2   I 2 
G p  q   I 2  p  q 
 p q
p
q
 G p   Gq 
eşitliği görülebilir. Ancak, G‟nin sadece monoton fonksiyonları için yukarıdaki fonksiyonel ilişkinin
G p   cp
formunda sağlanabildiği gösterilebilir (c bir sabit). Böylece;
I (2 p )  cp veya q  2 p yazılarak
I q   c log2 q
bazı pozitif c sabitleri için yazılabilir. Genellikle c=1 olur ve bilgi binary digitlerle ölçülmüştür denir.
x1, x2, …, xn değerlerini p1, p2,…, pn olasılıkları ile alan bir rassal değişken X ile ilgilenilsin. X‟in xi‟ye
eşit olduğunda içerdiği bilgi miktarı  log pi ile gösterilir ve X rassal değişkeninin taşıdığı bilgi
miktarının beklenen değeri;
H(X )  
n
 p log
i
2
pi
i 1
olarak elde edilir.
H(X)‟in miktarı enformasyon (bilgi) teorisinde X rassal değişkeninin entropisi olarak bilinir.
130
BÖLÜM 4 EKLER
Ek4.1 Ġspat: İspat sürekli şans değişkenleri için verilmiştir.
1. E a   af x dx  a f x dx  a


2. E aX   axf x dx  a xf x dx  a


3. Bkz. Jensen eşitsizliği


2. V cX   EcX  EcX   EcX  cE X  
 c EX  E  X  .
3. V c  X   Ec  X  Ec  X   Ec  X  c  E X  
 EX  E  X  
Ek4.2 Ġspat: 1. V c   E c  E c 2  0 .
2
2
2
2
2
2
2

n

n

c
g
(
x
)

c
g
(
x
)
.
f
(
x
)

ci g i ( x) f ( x)
 i i  x 

i i

i 1
i 1 x
 i 1

n
Ek4.3 Ġspat: E 
n
=

n
 ci  g i ( x) f ( x)   ci Eg i ( x).
i 1
 
i 1
x
Ek4.4 Ġspat: E  X  a 2  E  X  E X   E X   a 2



 EX  E X   EE X   ba  2E X   aEX  E X 
 EX  E X   E  X   a
 E X  E X   E X   a  2E X   aX  E X 
2
2
2
2
2
2
Eşitliğin sağındaki ikinci terim daima pozitif olup ancak ve ancak E  X   a olduğunda sıfır alabilir.

 

Ek4.5 Ġspat:  2  E ( X   ) 2  E X 2  2 X   2  E( X 2 )  2E( X )  E ( 2 )
= E ( X 2 )  2   2  2   2 .
Ek4.6 Ġspat: a şıkkı için ilk olarak aşağıdaki eşitsizlik ele alınsın,

 

0  E Z1  Z 2   E Z12  2Z1Z 2  Z 22  2  2EZ1Z 2 
2
 2  2E Z1Z 2 
1  E Z1Z 2 
bulunur. İkinci olarak,

 

0  E Z1  Z 2   E Z12  2Z1Z 2  Z 22  2  2EZ1Z 2 
2
 2  2E Z1Z 2 
 1  EZ1Z 2 
131
elde edilir ve bu iki sonuç birlikte kullanılarak ispat tamamlanır. Teoremin b şıkkı için ise
Pz1  z2   1 alındığında,
 
E Z1Z 2   E Z12  V Z1   1
Pz1   z2   1 alındığında,
 
EZ1Z 2    E Z12  V Z1   1
elde edilerek ispat tamamlanır. Yukarıdaki ispat ters yönden de gerçekleştirilebilir: ilk olarak
E Z1Z 2   1 alınsın bu durumda,



V Z1  Z 2   E Z1  Z 2   EZ1  Z 2   E Z1  Z 2 
2
2

2


 E Z12  2Z1Z 2  Z 22  2  2E Z1Z 2 
0
elde edilir.
Ek4.7 Ġspat: E  X 2    x2 olarak tanımlansın.

V  X 2   E X 2   x2

2



 E X 2  E  X 2 / X1   E  X 2 / X1    x2

2
 
 E X 2  E  X 2 / X1   E E X 2 / X1    x2
2
  2EX
2
2
Bu eşitlikteki son bileşen,




 E  X 2 / X1  E  X 2 / X1    x2



E X 2  E X 2 / X1  E X 2 / X1    x2  EX 2 E  X 2 / X1    x2 E X 2   E E X 2 / X1    x2 EE X 2 / X1 

2

 EEX 2 E  X 2 / X1  / X1    x2 EE X 2 / X1   E E  X 2 / X1    x2 EE X 2 / X1 
2
olup burada,
EX 2 E X 2 / X1  / X1   E X 2 / X1 E X 2 / X1   E X 2 / X1 
2
alınarak,
 





E X 2  E X 2 / X1  E X 2 / X1    x2  E E X 2 / X1    x2 EE X 2 / X1   E E X 2 / X1    x2 EE  X 2 / X1 
2
2
0
elde edilir. Bu durumda,


 
 EX  E  X / X   EE  X / X     
 EX  2 X E X / X   E X / X   EE X
V  X 2   E X 2  E  X 2 / X1   E E  X 2 / X1    x2
2
2
2
2
2
2
1
2
1
x2
2
2
2
2
2
1
2
1
/ X1   EE ( X 2 / X1 )
2
2

 
Burada E X   EE X / X  ve E X   EE X / X  olduğu hatırlanarak,
V  X   EE X / X  EE X / X EE X / X   V E X / X 
 EE X / X   E X / X   V E X / X 
 E X 22  2E X 2 EE X 2 / X1   EE X 2 / X1 EE X 2 / X1   V E X 2 / X1 
2
2
2
2
1
2
2
2
2
1
2
2
2
2
1
1
2
1
2
1
2
1
2
1
2
1
132
 EV  X 2 / X1   V E X 2 / X1 
elde edilerek ispat tamamlanır.
Ek4.8 Ġç Çarpım Uzayları
V bir vektör uzayı olsun. x,y V için  x,y  ile gösterilen ve aşağıdaki koşulları sağlayan
 ,  : V  V   x,y   x , y 
Fonksiyonuna V üzerinde bir iç çarpım V ye de iç çarpım uzayı denir. Bu iç çarpım uzayı V , ,  ile
gösterilir.
i.  x,yV için  x,y  y, z  (simetrik)
ii.  x,y, zV için  x , y  z  x,y    x,z 
(2-lineer)
 x,y, zV için  x  y , z  x,z    y, z 
iii.  x,yV , c için  cx,y  x,cy  c  x,y 
iv. x V  x,x   0 ;  x,x  0  x  0 (pozitif yarı-tanımlı)
n de iç çarpım;
 x,yn  için x  x1, x2 , xn  ve y   y1, y2 , yn  olsun. x ve y vektörlerinin iç çarpımı
 x,y  x1, x2 , xn ,  y1, y2 , yn   x1 y1  x2 y2    xn yn biçiminde tanımlanmaktadır.
M nn uzayında iç çarpım;
 
A, B  M nn , A  aij
 A, B 



i 1 
n
 
, B  bij
n n
n
 a
ij
j 1
n n
olmak üzere

bij 


biçiminde tanımlanmaktadır.
Örnek:
1 2
2 0 
 , B  

A, B  M 22 , A  
3 4
 1  3
 A, B 



i 1 
2

aij bij  

j 1

2

2
 a b
i1 i1
 ai 2bi 2   a11b11  a12b12  a21b21  a22b22
i 1
 1.2  2.0  3.1  4.(3)  7
Tanım: V bir vektör uzayı olsun. x V için x vektörünün uzunluğu
x   x,x  biçimde tanımlanan bir sayıdır.
Teorem Cauchy-Schwarz Eşitsizliği: Eğer x ve y vektörleri n uzayında tanımlı ise,
 x,y   x y
eşitsizliği sağlanır.
133
Ġspat: Eğer x=0 ise teorem doğrulanır. Eğer x  0 ise t   olmak üzere tx  y vektörü dikkate
alınırsa;
tx  y , tx  y   0
tx  y , tx  y   t 2  x,x  2t  x,y    y, y   0
eşitsizliği sağlanır.
a  x,x  , b  2  x,y  , c  y, y  alınarak
at 2  bt  c  0 olur. Bu karesel ifade asla negatif olamayacağı için kökler karmaşık veya katlı
olabilir. Bu durumda diskriminant,
b2  4ac  0
olmalıdır.
Uyarı: Eğer karesel ifadenin t1 ve t2 gibi iki reel kökü olsaydı köklerden birinin negatif olma durumu
söz konusu olabilirdi.
Bu durumda;
4  x,y 2  4  x,x   y, y 
Karekök alınarak
 x,y 2 
 x,x 
 y, y 
 x,y   x y
elde edilir.
Ġç Çarpım ve Ġki vektör arasındaki açı
Sıfırdan farklı herhangi u ve v gibi iki vektör arasındaki  açısının belirlenebilmesi için üçgenler
üzerinde tanımlan Cosinüs Teoremi kullanılır:
2
uv  uv . uv
 v uv u uv
 v, v  2  u, v    u,u 
İç çarpım özellikleri uygulanarak, Cosinüs Teoremi:
v  u  v  u  2 u . v Cos
2
2
2
biçiminde tanımlanmaktadır.
Denklem Cos için çözüldüğünde,
134
v  u . v  u  u . u  v . v  2 u . v Cos
v1  u1 2    vn  un 2  v12    v2n  u12    u2n  2 u .
Cos 

v Cos
u1 v1    u n v n
u.v
 u, v 
u.v
elde edilir.
Ek4.9 Konvekslik Kavramı
Tanım (Lineer Operatör): X, Y aynı V vektör uzayı üzerinde iki lineer uzay olsunlar.
L : X  Y operatörü verilsin. Eğer DL  , X‟in bir alt uzayı ve her x, y  DL  ve her  ,  V için
Lx  y    Lx    L y 
ise L operatörüne lineer(doğrusal) operatör denir.
Tanım (Konveks Küme): L lineer bir uzay A  L ve x, y  A keyfi olmak üzere
B  z  L : z  x  1   y ,
0    1  A
ise A kümesine konveks küme denir. Eğer z  B ise z  x  1   y eşitliğindeki x, y ‟nin katsayıları
için   1     1 bağıntısı her zaman doğrudur. Bu sebeple konveks küme tanımındaki  , 1   
yerine     1 şartını sağlayan ve negatif olmayan ,  reel sayıları alınabilir. Geometrik olarak B
kümesi uç noktaları x ve y olan bir doğru parçasıdır. Bu durumda sezgisel olarak konveks küme, boş
olmayan ve herhangi iki noktasını birleştiren doğru parçasını içeren bir küme olacaktır.
Konveks Küme
Konveks Olmayan Küme
Tanım (Konveks Fonksiyon): I , ' de bir aralık ve f : I  R bir fonksiyon olmak üzere her x, y  I
ve   0,1 için,
f x  1   y    f x  1    f  y 
(1)
135
şartını sağlayan f fonksiyonuna konveks fonksiyon denir. Eğer (1) eşitsizliği x  y ve   0,1 için ise
f fonksiyonuna kesin konvekstir denir.
Tanım (J-Konveks Fonksiyon): I , ' de bir aralık ve f : I  R bir fonksiyon olmak üzere her
x, y  I için,
 x  y  f x   f  y 
f

2
 2 
şartını sağlayan f fonksiyonuna I üzerinde Jensen anlamında konveks veya J-konveks fonksiyon denir.
Tanım (Kesin J-Konveks Fonksiyon): I , ' de bir aralık ve f : I  R bir fonksiyon olmak üzere
her x, y  I ve x  y için,
 x  y  f x   f  y 
f

2
 2 
oluyorsa f fonksiyonuna I üzerinde kesin J-konveks fonksiyon denir.
I
üzerinde
tanımlı
bir
f fonksiyonunun
a, f a ve b, f b noktalarını içeren I
kesin
konveksliğinin
geometrik
anlamı
üzerindeki doğru parçasının f ‟nin grafiğinin üst kısmında
yer almasıdır. Bu durum aşağıdaki grafikte gösterilmiştir.
Ek4.10 Ġntegral ĠĢareti Altında Türev Almak
Fark ve toplam operatörlerinin sırasının yer değiştirme koşulları kalkülüs içindeki birçok teorem ve
ayrıntılı ispatlarıyla incelenmektedir.
Teorem (Leibnitz’s Kuralı): Eğer f x, , a  ve b  „ya göre türevlenebilir iseler bu durumda,
d
d
b ( )
b ( )
d
d

f x, dx  f b ,  b   f a ,  a  
f x, dx
d
d

a ( )
a ( )


biçimde tanımlanmaktadır. Eğer a  ve b  sabit sayılar ise, Leibnitz‟s Kuralının özel bir durumu
d
d
b
b
a
a

 f x, dx    f x, dx
136
şekline dönüşmektedir.
Böylece, genellikle sonlu bir aralıkta diferansiyellenebilir bir fonksiyonun integrali, integral işaretinin
diferansiyeli problem olmayacaktır. Fakat integralin sınırları sonsuz ise problemler meydana gelebilir.
İntegral ve türev operatörlerinin sıralarının değiştirilip değiştirilemeyeceği sorusu, gerçekte integral ve
limit operatörünün yer değiştirilip değiştirilemeyeceği sorusuna denktir. Çünkü türev, limitin özel bir
durumudur. f x,  türevlenebilirliği göz önüne alırsa,

f x,     f x, 
f x,   lim
 0


ise,

 f  x,      f  x ,   
f x,  dx  lim 
dx


0











iken ,
d
d


 f  x,      f  x,   
dx
 0



f x,  dx  lim


 
olmaktadır. Aşağıda verilen teoremler Lebesgue‟nin Baskın(güçlü) Yakınsaklık Teoreminin doğal
sonuçlarıdır.
Teorem: hx, y  fonksiyonu her x için y0 da sürekli ve g x  aşağıdaki koşulları sağlayan bir
fonksiyon olsun.
i.
için hx, y   g x 
x, y

ii.
 g x dx  

Bu durumda;

lim
y  y0

hx, y  dx 




lim hx, y  dx
y  y0
olur. Bu teoremdeki kilit nokta g x  fonksiyonunun sonlu olma şartıdır ve bu koşul integralin sonsuz
değer alamayacağını garanti etmektedir.
Teorem: f x,  fonksiyonu   0 noktasında türevlenebilir olsun. Yani,
 f x,0     f x,0   
lim 
f x, 


 
  0
 0 
x için bir tane g x,0  fonksiyonu ve  0  0 sabiti var olsun;
i.
   0 için
x ve
f  x,  0     f  x,  0 

 g  x,  0 

ii.
 g x, dx  
0

137
koşulları sağlanırsa;
d
d





f  x,  

dx






0 
 


f x,  dx

  0

f x,  Fonksiyonu   0 noktasında türevlenebilir her  0 değeri için (i) ve (ii) koşullarını sağlıyorsa
türev ve integral sırası yer değiştirebilir. Genellikle,  ve  0 arasındaki ayrım gözetmeden yukarıdaki
ifade;
d
d


f x,  dx 



  f x, dx

biçiminde yazılmaktadır.
Örnek 1.(türev ve integralin yer değiştirmesi-I ): X,  parametreli üstel bir rassal değişken olsun
olasılık yoğunluk fonksiyonu;
f x  
1

e x  , 0  x  
olsun. Aşağıda belirtilen ifade hesaplanmak istenirse

 
x
d
d
1
E Xn 
x n e  dx , n  
d
d 0 

Türev integral içine taşındığında,

x
  
d
 n1 
E Xn 
x e dx
d
 
0

xn  x   x 
 1 e
dx
2 




0



1

2


E X n 1 
1

 
E Xn
Türev ve integralin yer değiştirmesini doğrulamak için türevin sınırlı olduğu aşağıdaki gibi
gösterilebilir. x   0 olduğu için,
  x n  x   x ne x  x
x ne x   x 
 e


1

  1

  
2 
2   

0   0   koşulunu sağlayan bazı  0 sabiti için,
g x,   

x n e  x    0   x

 1
2 
   0      0 
alınırsa bu durumda,  ' ve   '   0 için
  xn  x  
 e


  

 g  x,  
 
'
138

Olur. Böylece üstel dağılış ve onun tüm momentleri    0  0 olduğu sürece
 g x,  dx  

sonludur, bu yüzden türev ve integralin yer değiştirmesini doğrulanmış olur.
Bu örnek ayrıca üstel dağılışın momentleri hakkında bir yineleme vermektedir;


 
E X n 1  E X n  2
 
d
E Xn
d
Örnek 2. (türev ve integralin yer değiştirmesi ): X, geometrik dağılış gösteren kesikli rassal değişken
olsun ve onu olasılık kütle fonksiyonu;
P X  x    1    , x  0,1, 0    1.
x
olmak üzere,


 1     d  1   
d
d
d
x
x 0
x
x 0

 1   

x
  x1   
x 1

x 0


 1   
1


 1   x 
x 0
1 
x
x 1   
1   x 0

1 ve her 0    1 olduğu için eşitliğin sol tarafında yer alan türev 0‟a eşittir. Böylelikle,
x
x 0

 1   x 
1

x 0
1 
x
x 1     0 ,
1   x 0

Yani,
1


1
E  X   0,
1
EX  
1

 1.
olur.

Teorem:
 h , x  serisinin a, b   aralığında tüm  değerleri için yakınsak ve,
x 0

h , x   da sürekli ,

i.
x için
ii.
  h , x  , a, b ‟nin her kapalı ve sınırlı alt aralığında düzgün yakınsak olsun.


x 0
O zaman
d
d


x 0
h , x  


  h , x
x 0
yazılabilir.
139
Teoremin kilit noktası düzgün yakınsaklık koşuludur. Unutulmamalıdır ki serilerin düzgün
yakınsaklığı onların kısmi toplamlar dizisinin düzgün yakınsak olması ile mümkün olur.
Örnek 3 ( örnek 2’nin devamı): h , x    1   x ve
d
x
x 1
h , x   1      x1    , ve
d


  h , x  ‟nın
düzgün yakınsaklığı için kısmi toplamlar
x 0
dizisi aşağıdaki gibi tanımlanırsa,
Sn   
 1   
n
  x1   
x 1
x

x 0
olur. Verilen   0 ve c, d   0,1 aralığında düzgün yakınsaklık için bir N sayısı bulunabilmelidir ki,
  c, d ve n  N için Sn    S    
olsun. Böylece,
1  1   
 1   x 
n 1
n

x 0
n
n
x 0
x 0
 x 1   x 1    
 


1   x

d
d
n
 1   x  
x 0
d
d
1  1   n 1 





1  1     n  1 1    .
n 1
n

olur. Son olarak kısmi toplam dizisi,
Sn   
1  1   
n 1


1  1     n  1 1   
n 1
n

,
 n  11   
n
Açıktır ki, her 0    1 için S  lim Sn    0. Bu durumda Sn   sürekli ve sınırlı kapalı herhangi
n 
bir aralık üzerinde düzgün yakınsaktır. Böylece serinin düzgün yakınsaklığı ve türev ile toplam
operatörünün yer değiştirmesi doğrulanmış olur.
Teorem: Her x için h , x  , ‟nın sürekli bir fonksiyonu ve

 h , x  serisi a, b üzerinde düzgün
x 0
yakınsak olsun. O zaman,
b 

a x 0
h , x  d 
 b
  h , xd
x 0 a
3 Moment Türeten Fonksiyonlardan DağılıĢlara
Örnek: Bir sigorta şirketinin ödemeler için günlük λ kadar (deterministik bir sayı) sabit bir akışa sahip
olduğu ve ayrıca günlük talebin, ortalaması μ varyansı σ2 olan Normal dağılıma uyduğu varsayılsın.
140
Günlük talepler birbirinden bağımsızdır. Kurallar gereği firma, n günlük süreçte ödemelerle talepleri
eşitlemek zorundadır. Ayrıca firma, kuralları sağlayamama olasılığının küçük bir sayı olan ε‟dan
küçük olmasını istemektedir. n, μ, σ ve ε sabitlenmiş parametrelerdir fakat λ firmanın kontrolündedir.
Buna göre λ‟yı belirleyiniz.


Çözüm: Talep Y‟nin Normal N  , 2 olduğu varsayımıyla X  Y     standart normaldir. Bu
durumda Y  X   olur. n günlük süreçteki talepler   X1  X n   n ‟dir. Burada Xi‟ler bağımsız
eş dağılımlı standart normaldir. Elde edilmesi gereken sınır,
     In

P X 1   X n 
n  e



1
log t   t 2 olduğundan, t > 0 için
2
 1 2
t t

2
maksimize edilmelidir. Maksimum değer,
1  
I 

2  
2
elde edilir ve
e In  
denkleminin çözümü ile
   
 2 log
n
elde edilir.
141
Download