NORMAL DAĞILIM VE NORMAL DAĞILIMLA İLGİLİ ÇIKARIMLAR

advertisement
ANKARA ÜNİVERSİTESİ
FEN BİLİMLERİ ENSTİTÜSÜ
YÜKSEK LİSANS TEZİ
NORMAL DAĞILIM VE NORMAL DAĞILIMLA İLGİLİ ÇIKARIMLAR
Şenol ÇELİK
İSTATİSTİK ANABİLİM DALI
ANKARA
2006
Her hakkı saklıdır
ÖZET
Yüksek Lisans Tezi
NORMAL DAĞILIM VE NORMAL DAĞILIMLA İLGİLİ ÇIKARIMLAR
Şenol ÇELİK
Ankara Üniversitesi
Fen Bilimleri Enstitüsü
İstatistik Anabilim Dalı
Danışman : Doç. Dr. Fahrettin ARSLAN
Bu tezin amacı, normal dağılımlı rasgele vektörlerin karesel formlarını ve dağılımlarını
araştırmak, karesel formların yapısını ve normal dağılımla olan ilişkisinden yararlanarak
özelliklerini görmek ve istatistiksel sonuçlar çıkarmaktır.
Normal dağılım istatistikte en önemli dağılım olarak bilinmektedir. Normal dağılımla
ilgili olarak hala çok sayıda araştırmalar yapılmaya devam edilmektedir.
Bu çalışmada, karesel formların incelenmesine normal dağılımdan yola çıktığımız için
normal dağılımla ilgili bilinen özelliklerini ifade ettik. Normal dağılımdan elde edilen
dağılımlar ve aralarındaki ilişki ele alındı.
Son olarak karesel formların dağılım özelliğinden yararlanarak F dağılımı ele alındı.
Ankara Üniversitesi Türkçe ve Yabancı Dil Araştırma ve Uygulama Merkezi (TÖMER)
tarafından yapılan lisansüstü yabancı dil sınavına giren öğrencilerin sınavdaki başarı
notları F testi ile incelendi. Fen Bilimleri, Sağlık Bilimleri, Sosyal Bilimler ve Eğitim
Bilimleri Enstitüsüne müracaat eden öğrencilerin sınavdaki başarı notları ortalamaları
arasındaki anlamlı farklılık olup olmadığı test edildi.
2006, 91 sayfa
Anahtar Kelimeler : Normal dağılım, rasgele vektörler, limit dağılımı, karesel formlar,
Ki-kare dağılımı, t dağılımı, F dağılımı, Varyans Analizi.
i
ABSTRACT
Master Thesis
NORMAL DISTRIBUTION AND RELATED OBTAINMENT FOR THE NORMAL
DISTRIBUTION
Şenol ÇELİK
Ankara University
Graduate School of Natural and Applied Sciences
Department of Statistics
Supervisor: Assoc. Prof. Dr. Fahrettin ARSLAN
Purpose of this thesis is to investigate quadratic forms of random vectors with normal
distributions and their distribution, to see the structure of quadratic forms and their
properties by means of the relation of normal distribution and to generate statistical
results.
Normal distribution has known the most important distribution in statistics. Many
researches have been continued interest with normal distribution.
In this work, we examined quadratic forms and expressed their properties with normal
distribution. Distributions were provided from normal distributions and between their
relations were considered.
Finally, F distribution was considered to benefit from distribution properties of
quadratic forms. The marks of students entered to postgraduate foreign language exam,
in Ankara University Turkish and Foreign Language Research and Application Center,
were investigated with F test. Whether significant differences or not among marks of
students whom of refer to Graduate School of Natural and Applied Sciences, Graduate
School of Health and Applied Sciences, Graduate School of Social and Applied
Sciences, Graduate School of Education and Applied Sciences among in the exam was
tested.
2006, 91 pages
Key Words: Normal distribution, random vectors, limiting distributions, quadratic
forms, chi-square distribution, t distribution, F distribution, Analysis of Variance.
ii
TEŞEKKÜR
Beni çalışmalarımın her safhasında yakın ilgi ve önerileri ile destekleyen ve katkıda
bulunan danışman hocam Sayın Doç. Dr. Fahrettin ARSLAN’a (Ankara Üniversitesi
Fen Fakültesi), akademik öğrenim boyunca desteklerini gördüğüm Sayın Prof. Dr.
Yalçın TUNCER’e (Ankara Üniversitesi Fen Fakültesi) ve Prof. Dr. Fikri ÖZTÜRK’e
(Ankara Üniversitesi Fen Fakültesi) ve bana çeşitli konularda destek sağlayan
bölümümüzdeki diğer tüm hocalarıma, ayrıca benim
yüksek lisans tezinin
yürütülmesinde iş yerimden izin veren amirlerime ve arkadaşlarıma sonsuz
teşekkürlerimi sunarım.
Şenol ÇELİK
Ankara, Ocak 2006
iii
İÇİNDEKİLER
ÖZET……………………………………………………………………………...……..i
ABSTRACT………………………………………………………………………….....ii
ÖNSÖZ ve EŞEKKÜR………………………………………………………………...iii
SİMGELER DİZİNİ……………………………….…………………………………vii
ŞEKİLLER DİZİNİ………………………………….………………………………viii
ÇİZELGELER DİZİNİ……………………………………………………………….xi
1.GİRİŞ……………………………………………………………………….................1
1.1 Normal Dağılımın Tarihçesi…………………………………….………................2
2. NORMAL DAĞILIM FONKSİYONU…………………………………………….3
2.1 Normal Dağılımın yapısı…………………………………………………………...3
2.1.1 Herschel tanımlaması…………………………………………………...….…….3
2.1.2 Maxwell tanımlaması…………………………………...……………..................6
2.1.3 Hagen tanımlaması…………………………………………………….................7
2.1.4 Olasılık yoğunluk fonksiyonu f olan bir dağılımın entropisi…………..…….8
2.1.5 Matematiksel tanımlama………………………………………….…….……….8
2.2 Normal Dağılımın Özellikleri…………………..………………………………...10
2.3 Normal Dağılım İçin Uygunluk Testleri…………………………………….…...11
2.3.1 Q-Q Nokta Grafik Yöntemi…………..………………………………….……..12
2.3.2 Çeyreklikler arası fark yardımıyla oluşan test………….………………….....13
2.3.3 Ki-Kare Uygunluk Testi…………………………………………….………......13
2.3.4 Kolmogorov-Simirnov Uygunluk testi…………………………...…………….14
2.3.5 Lilliefors Normallik Testi…………………………………………………….....15
2.3.6 Shapio-Wilk Normallik testi………………………………………………..…..16
2.3.7 İki ve daha fazla değişken için normallik testleri………………….…..……...17
2.4 Beklenen Değer……………………………………………………..……………..17
2.5 Varyans…………………………………………………………..………………...18
2.6 Moment Çıkaran Fonksiyon………………………………………………..…….18
2.7 Normal Dağılım İçin Bazı Önemli Teoremler……….………..……………..…..19
2.8 Yakınsama Teoremleri………...……………………………………..…………...22
2.9 İki Değişkenli Normal Dağılım…………...…………………………..…………..23
iv
2.10 Çok Değişkenli Normal Dağılım…………………………..………………...…..25
2.10.1 Çok Değişkenli Normal Dağılımın Beklenen Değeri ve Kovaryansı……......26
2.10.2 Çok Değişkenli Normal Dağılımdan çıkarılacak bazı sonuçlar…….....…....27
2.10.3 Çok Değişkenli Koşullu Dağılımlar ………………………..……………........32
2.10.4 Çok Değişkenli Normal Dağılımın Moment Çıkaran Fonksiyonu….....……34
3. NORMAL DAĞILIMIN DİĞER DAĞILIMLARLA İLİŞKİSİ………..………35
3.1 Stokastik Yakınsama…………...………………………………..………………..35
3.2 Moment Çıkaran Fonksiyon Yaklaşımı………………………..………………..36
3.3 Ki-kare Dağılımının Normal Dağılıma Yaklaşımı………………..…………......36
3.4 t Dağılımının Normal Dağılıma Yaklaşımı …………….…………..……….….39
3.5 Asimptotik Normal Dağılım……………………………………..…………….....39
3.6 Stokastik Yakınsamanın Özellikleri……………….…………..…………...……40
3.7 Limit Teoremleri…………...……………………………………..…………….....41
4. NORMAL DAĞILIMDAN ELDE EDİLEN ÖNEMLİ SONUÇLAR….…….....44
4.1 Ki-Kare Dağılımı……………………………………………………..……….......44
4.2 t Dağılımı…………………………………………………………..……………...47
4.3 F – Dağılımı………………………………………………………………..………48
4.4 Wishart Dağılımı………………………………………………………….…….....49
5. KARESEL FORMLAR………...………………………………………..………...52
5.1 Karesel Formların Dağılımı……………………………..…………………..…....54
5.2 Faktör, faktör düzeyleri ve işlemler………………………..…………..………...60
5.3 Tek yönlü Varyans Analizi ve Lineer Model (Tam Ranklı Olmayan Model)...60
5.4 Hata Terimleri Kareler Toplamı….………………………………..………….…64
5.5 Toplam (Genel) Kareler Toplamının parçalara ayrılması……..….……..…....65
5.6 Dağılım özellikleri……………………………………………..………….……….66
5.7 Çoklu karşılaştırmalar…………………………………………………..………..69
5.7.1 Student Newman-Keuls testi…………………………………………..………..69
5.7.2 Duncan Testi…..……….……………………………………………..………....71
5.7.3 Scheffe Testi…... …..……………………..…………………..………..………..71
6. UYGULAMA..………………… …….. ..……………………………………….…73
7. TARTIŞMA VE SONUÇ……………..….………………..……..…………….......87
KAYNAKLAR..……………………..………………..……………..………………...89
v
ÖZGEÇMİŞ..……………………..………………..…………….……………………91
vi
SİMGELER DİZİNİ
R
Reel sayılar
E(.)
“.” nın beklenen değeri
V(.)
“.” nın varyansı
Cov (.,.)
“.,.” nın kovaryansı
F(.)
“.” nın dağılım fonksiyonu
f (.)
“.” nın olasılık yoğunluk fonksiyonu
J
Jacobian’ın determinantı
M X (t )
Moment çıkaran fonksiyon
~
“.” nın dağılımı
ρ
korelasyon katsayısı
χ 2 (.)
“.” Serbestlik dereceli ki-kare dağılım
N (.,.)
“. Ortalamalı, . varyanslı” normal dağılım
t(.)
“.” Serbestlik dereceli t dağılım
Frk
r ve k serbestlik dereceli F dağılımı
∑
Çok değişkenli normal dağılımın kovaryans matrisi
G
Genelleştirilmiş inversler
GİKT
Gruplar İçi (Hata Terimleri) Kareler Toplamı
GAKT
Gruplar Arası Kareler Toplamı
GKT
Genel Kareler Toplamı
GİKO
Gruplar İçi Kareler Ortalaması
GAKO
Gruplar Arası Kareler Ortalaması
ANOVA
Tek Yönlü Varyans Analizi
vii
ŞEKİLLER DİZİNİ
Şekil 2.1 Kutupsal koordinatların grafikle gösterilişi……….….………………………..9
Şekil 2.2 Normal Olasılık Yoğunluk Fonksiyonu Grafiği……….………………..……11
viii
ÇİZELGELER DİZİNİ
Çizelge 5.1 Y = X β + ε modelinin parametreleri……….………………..…...............62
Çizelge 5.2 Y = X β + ε modeline uygun varyans analizi çizelgesi…………………...67
Çizelge 6.1 Ankara Üniversitesi Yüksek Lisans-Doktora sınavına müracaat eden
öğrencilerin yabancı dil sınavından aldıkları puanlar………………….....75
Çizelge 6.2 Yüksek Lisans ve Doktora sınavlarına giren öğrencilerin yabancı dil
sınavı başarı notlarının toplam ve ortalama değerleri…………………...79
Çizelge 6.3 Ankara Üniversitesi Lisansüstü Yabancı Dil sınavına giren öğrencilerin
başarı notlarına ilişkin Y = X β + ε modeline uygun Varyans
Analizi çizelgesi…..……………………...………………………….........84
Çizelge 6.4 Ankara Üniversitesi Lisansüstü Yabancı Dil sınavına giren öğrencilerin
başarıları arasındaki anlamlı farklılığın Scheffe testi ile çoklu
karşılaştırılması. …………………...……………………...………………86
ix
1. GİRİŞ
Normal dağılım istatistikte en önemli dağılımlardan biridir. Uygulama alanı en fazla
olan ve üzerinde en fazla araştırma yapılan
ve teorik olarak da bütün özellikleri
itibarıyla en fazla kullanılan dağılımdır. Normal dağılımın diğer olasılık dağılımlarla
önemli ilişkileri vardır. Normal dağılımın tarihçesi, uygulama alanları, oluşumu,
özellikleri ve önemli teoremleri genel olarak verilmiştir.
Normal dağılımlar yardımıyla elde edilen olasılık dağılımları, araştırmacılar için deney
veya gözlemlerden yararlanarak istatistiksel çıkarımlar elde etmesi açısından yol
gösterici olmaktadır.
Karesel formlar normal dağılımdan elde edilen önemli sonuçlardan biridir. Bu
çalışmada normal dağılımdan oluşacak çıkarımlar ve normal dağılımlı rasgele
vektörlerin karesel formlarıyla ilgilenileceği için normal dağılımla ilgili bilinen
özelliklerin bilinmesi gerekir. Normal dağılım ile ilişkisinden yararlanarak karesel
formların dağılımından istatistiksel sonuç çıkarılacaktır. Teorik olarak ele alınan karesel
formların bütün özellikleri uygulama yapılarak daha açık bir şekilde ifade edilebilir.
Normal dağılımdan elde edilen dağılımlar, karesel formların yapısını ve özelliklerini
belirtmede etkin bir rol oynamaktadır. Bir rasgele değişken normal dağılmamışsa,
normal dağılıma yaklaşımı sağlanabilir. Bu da limit dağılımı yardımıyla mümkün
olmaktadır. Karesel formlar işlemlerin karmaşık olmaması nedeniyle uygulama
yapmaya çok elverişlidir.
Karesel formlarda diskriminant hesapları yapılabilmektedir. İki karesel form uygun bir
dönüşüm ile birbirlerine dönüşüyorsa, aynı sayıları temsil ederler.
1
1.1 Normal Dağılımın Tarihçesi
18. yüzyılda bir istatistikçi ve risk danışmanı olan Abraham De Moivre çok fazla sayıda
düzgün para atma denemeleri yapmıştır. Bunun sonucunda elde ettiği düzgün eğri şekil
olarak Binom Dağılımına yaklaşmıştır.
De Moivre, bu eğri için matematiksel ifadeleri daha önce bulabilseydi, n defa para
atarak m veya daha fazla tura veya yazı gelme olasılığını bulma problemini daha kolay
çözebilecekti. Bu amaçla normal dağılım denilen eğriyi keşfetti.
Normal dağılıma yakınsama, birçok doğal olayların dağılımı sonucunda önem
kazanmaktadır. Astronomik gözlemlerle yapılan ölçüm hatalarının analizi normal
dağılımın ilk uygulamalarından biridir. Ölçüm hataları, kusurlu gözlemlerden dolayı
meydana gelmiştir.
Galileo 17. yüzyılda bu hataların simetrik olduğunu ve küçük hataların büyük
hatalardan daha sıklıkla meydana geldiğini belirtmiştir.
Çok sayıdaki deneyden elde edilen ölçümlerin gerçek değerlerden farklarının
değişiminde önemli bir benzerlik gözlenmiştir. Ölçme hatalarındaki değişimin çan
şeklinde sürekli bir eğriye uyduğu tespit edilince, buna hataların normal eğrisi
denmiştir.
Son derece önemli olan Merkezi Limit Teoremi türetildiğinde, aynı dağılım 1778
yılında Laplace tarafından keşfedilmişti. 1808 yılında matematikçi Adrian ve 1809
yılında Gauss “Normal Dağılım” için bu teoremi geliştirdi (Lane 2003).
2
2. NORMAL DAĞILIM FONKSİYONU
Bu bölümde tek ve çok değişkenli normal dağılımın bilinen fakat bu çalışma için önem
arz eden bir takım özelliklerine kısaca değineceğiz. Bunun için de normal dağılımın
çeşitli tanımlarını aşağıdaki şekilde ifade edeceğiz. Bu tanımlar normal dağılımın nasıl
ortaya çıktığını ve nasıl meydana geldiğini açıklamakta yardımcı olacaktır.
2.1 Normal Dağılımın Yapısı.
Bu kısımda normal dağılımın çeşitli şekillerde verilen tanımlarını aşağıda göreceğiz.
Bunlar da,
1. Herschel tanımlaması
2. Maxwell tanımlaması
3. Hagen tanımlaması
4. Olasılık yoğunluk fonksiyonu f olan bir dağılımın entropisi
5. Matematiksel tanımlama
2.1.1 Herschel Tanımlaması
Bir x, y koordinat sisteminin başlangıç noktasındaki hedefe atış yapılırsa (X,Y)
koordinatlı noktaya düştüğünü düşünelim. (X,Y) koordinatları atışın hedeften sapmasını
belirtir. Bu durumda gerekli varsayımlar şunlardır:
a) X ve Y hataları birbirinden bağımsız ve bunların marjinal dağılımlarının olasılık
yoğunluk fonksiyonları süreklidir.
b) ( x, y ) noktasındaki olasılık yoğunluğu, bu noktanın hedefe olan uzaklığı ise
r = x 2 + y 2 ye bağlıdır.
c) ( x, y ) yönündeki hatalar bağımsızdır.
3
( x, y ) noktasındaki yoğunluk için, f ( x)q ( y ) = s (r ) fonksiyonel denklemi yazılabilir.
X’in olasılık yoğunluk fonksiyonu olan f fonksiyonunu bulmamız gerekmektedir.
ϕ ( x) = ln
f ( x)
şeklinde tanımlanırsa
f (0)
x = 0 için,
f (0)q ( y ) = s ( y ) ⇒
q( y ) s( y )
=
q (0) s (0)
y = 0 için,
f ( x)q (0) = s ( x) ⇒
f ( x) s( x)
=
f (0) s (0)
ve
f ( x) q( y ) s(r )
=
olmak üzere
f (0) q (0) s (0)
ln
f ( x)
q( y )
s(r )
+ ln
= ln
f (0)
q (0)
s (0)
ϕ ( x) + ϕ ( y ) = ϕ (r ) ,
r 2 = x2 + y2
olur. Bununla birlikte
x 2 = x12 + x22
ϕ (r ) = ϕ ( y ) + ϕ ( x1 ) + ϕ ( x2 ) ,
r 2 = y 2 + x12 + x22
ve genel olarak
ϕ (r ) = ϕ ( x1 ) + ϕ ( x2 ) + ... + ϕ ( xk ) ,
∑x
2
i
= r2
k = n 2 seçerek ve x = x1 = ... = xk ifadesini fonksiyonda yerine koyarak
ϕ (nx) = n 2ϕ ( x)
veya x =1 için
ϕ (n) = n2ϕ (1)
dir.
x=
m
rasyonel sayısı için, n ≠ 0 .
n
4
m
 m
n 2ϕ   = ϕ  n.  = ϕ (m) = m 2ϕ (1)
n
 n
veya
m
m
ϕ   = c 
n
n
2
olur. Burada c = ϕ (1) ’dir.
ϕ ( x) = ϕ (1) x 2 dir. Burada ϕ süreklidir.
ϕ ( x) = cx 2 şeklinde bir fonksiyon ortaya çıkar. Bu fonksiyon,
f ( x) = f (0)ecx
2
şeklinde olur. f fonksiyonunun bir olasılık yoğunluk fonksiyonu olması için c sabitinin
negatif olması gerekir. c sabitini σ 2 sabitine bağlı olarak da ifade edebiliriz.
O zaman c = −
∞
∫
−
f (0)e
1
2σ 2
x2
1
2σ 2
biçiminde ifade edersek,
dx = 1 den,
−∞
f (0) =
1
2πσ
elde edilir. Bu şekilde meydana gelen normal olasılık yoğunluk fonksiyonu
1
− 2 x2
 1
2σ
e
, −∞ < x < ∞

f ( x) =  2πσ
0
, diğer hallerde

(2.1)
biçiminde bulunur. Aynı yoldan, Y için
1
− 2 y2
 1
2σ
e
, −∞ < y < ∞

q ( y ) =  2πσ
0
, diğer hallerde

(2.2)
biçiminde elde edilir.
X ve Y nin ortak olasılık yoğunluk fonksiyonu f ( x)q ( y ) olsun. x ekseni ile θ açısı
yapan ve başlangıç noktasından geçen bir doğru boyunca yapılan atış sonuçlarının
hedefe olan uzaklığı,
U = X cos θ + Y sin θ olsun.
U nun olasılık yoğunluk fonksiyonunu bulalım:
5
U = X cos θ + Y sin θ
V = X sin θ − Y cos θ
dönüşümü yapılır. U ve V nin ortak olasılık yoğunluk fonksiyonu,
1
− 2 (u 2 +v2 )
 1
2σ
, −∞ < u, v < ∞

e
fU ,V (u , v) =  2πσ 2
0
,diğer hallerde

(2.3)
olur. U nun marjinal olasılık yoğunluk fonksiyonu,
1
− 2 u2
 1
2σ
e
, −∞ < u < ∞

fU (u ) =  2πσ
0
,diğer hallerde

(2.4)
biçiminde elde edilir (Rao 1973).
2.1.2 Maxwell Tanımlaması
Moleküllerin hızları için aşağıdaki varsayımların sağlandığı düşünülsün:
a) Üç boyutlu ortogonal herhangi bir koordinat sistemine göre hız büyüklüğünün
bileşenleri u, v, w olsun. Bunların her biri bağımsızdır.
b) u, v, w’ nin marjinal dağılımları aynıdır.
c) Faz uzayı u, v, w bileşenlerine sahip moleküllerin yoğunluğu hızın yönüne değil
büyüklüğüne bağlıdır.
f
fonksiyonu, (u, v, w) hız bileşenlerinin olasılık yoğunluk fonksiyonu ve g
fonksiyonu, hızın olasılık yoğunluk fonksiyonu olsun,
g (v) = f (u ) f (v) f ( w) ,
fonksiyonel
denklemi
V 2 = u 2 + v 2 + w2
yazılır.
Bu
denklem
Herschel
tanımlamasındaki
ϕ ( x) + ϕ ( y ) = ϕ (r ) denklemine benzer. Bu denklem çözüldüğünde normal dağılımın
olasılık yoğunluk fonksiyonu ortaya çıkar (Rao 1973).
6
2.1.3 Hagen Tanımlaması
Hatalar için aşağıdaki varsayımları ele alalım:
a) Rasgele değişken olan belli bir hata, çok sayıda eşit büyüklükte, istenildiği kadar
küçük hata bileşenlerin toplamı olsun.
b) Hata bileşenleri bağımsızdır.
c) Her hata bileşeni için pozitif veya negatif olma olasılığı eşit olsun.
Her bir hata bileşeni, ±ε değerlerini
1
olasılığı ile alsın. Her bir hata bileşenlerinin
2
ortalaması 0 varyansı ε 2 dır. Hata bileşenleri toplamı
X = ε 1 + ε 2 + ... + ε n
ise beklenen değeri
E ( X ) = E (ε1 ) + E (ε 2 ) + ... + E (ε n ) = 0
varyansı
V ( X ) = V (ε1 ) + V (ε 2 ) + ... + V (ε n ) = nε 2 = σ 2
olur.
V ( X ) = nε 2 = σ 2 olacak şekilde, n → ∞ için ε i ’ in dağılımını bulmak için karakteristik
fonksiyonundan faydalanırız. ε i ’ in karakteristik fonksiyonu
n
n
M X (t ) = E (e ) = ∏ E (e
itX
i =1
itX i
 t2

t4
1

) =  (eitε + e − itε )  = 1 − ε 2 + ε 4 + ... 
4!
2

 2!

n
t σ
−
 t2 σ 2
 1 
n →∞
= 1 −
+ d    
→e 2
2 n
 n 

2
n
2
(2.5)
şeklinde oluşan bu karakteristik fonksiyon; ortalaması 0, varyansı σ 2 olan normal
dağılımın karakteristik fonksiyonudur (Rao 1973).
7
2.1.4 Olasılık yoğunluk fonksiyonu f olan bir dağılımın entropisi,
∞
H ( f ) = − ∫ f ( x) log f ( x)dx
−∞
şeklinde olan,
∞
∫
∞
∫
f ( x)dx = 1 ,
−∞
∞
xf ( x)dx = µ
−∞
,
∫ (x − µ)
2
f ( x)dx = σ 2
−∞
kısıtlaması altında, sürekli dağılımlar arasında entropisi maksimum olan dağılım,
1  x−µ 
 1
− 


e 2  σ  , −∞ < x < ∞
f ( x) =  2πσ

,diğer hallerde
0
2
(2.6)
şeklinde bir normal dağılım olarak ortaya çıkar (Rao 1973).
2.1.5 Matematiksel Tanımlama
Normal dağılımın olasılık yoğunluk fonksiyonunu elde etmek için diğer bir yöntem de
matematiksel tanımlamadır.
f ( x) = e− x
2
/2
ifadesini göz önüne alalım.
∞
I=
∫
∞
∫e
f ( x)dx =
−∞
− x2 / 2
dx
−∞
Bu integrali bu haliyle almak mümkün değildir. Ancak,
∞
I=
∫
∞
f ( y )dy =
−∞
∫e
− y2 / 2
dy
−∞
şeklinde ikinci bir tanımlama yapıldığında,
∞
∫e
−∞
−
x2
2
∞
dx =
∫e
−
y2
2
dy
−∞
dır. Bu durumda
8
∞
I =
2
∫e
−
x2
2
−∞
∞
dx. ∫ e
−
y2
2
∞ ∞
dy =
−∞
∫ ∫e
−
( x2 + y 2 )
2
∞ ∞
dxdy =
−∞ −∞
∫∫
f ( x, y )dxdy
(2.7)
−∞ −∞
şekline dönüşür. Buradan da kutupsal koordinatlar özelliklerine dayanarak,
y
r = x2 + y2
y
θ
x
x
Şekil 2.1. Kutupsal koordinatların grafikle gösterilişi
x = r cos θ ve y = r sin θ dönüşümü altında (2.7)’yi
∫∫ f ( x, y )dxdy = ∫∫ f (r cos θ , r sin θ )rdrdθ
R
şeklinde ifade ederiz.
G
Buradan da, x = g (u , v) ve y = h(u , v) Jacobian dönüşümü yardımıyla
∫∫ f ( x, y )dxdy = ∫∫ f ( g (u, v)h(u, v)) J (u, v) dudv
R
G
elde edilir.
∂x
∂ ( x, y ) ∂u
J (u , v) =
=
∂y
∂ (u , v)
∂u
∂x
∂r
J (r , θ ) =
∂y
∂r
∂x
∂v ∂x ∂y ∂y ∂x
= . − .
∂y ∂u ∂v ∂u ∂v
∂v
∂x
cos θ
∂θ
=
∂y
sin θ
∂θ
− r sin θ
r cos θ
= r (cos 2 θ + sin 2 θ ) = r
bulunur. (2.8) denklemini kullanarak
9
(2.8)
∫∫ f ( x, y )dxdy = ∫∫ f (r cos θ , r sin θ ) r drdθ = ∫∫ f (r cos θ , r sin θ )rdrdθ
R
G
G
elde edilir (Thomas and Finney 1998).
2π ∞
I =
2
∫ ∫e
−
r2
2
2π
rdrdθ =
0 0
∫ dθ = 2π
0
Ayrıca
∞
Ι2 =
∫e
− x2 / 2
dx = 2π
ise Ι = 2π
−∞
dır. Dolayısıyla
1
2π
∞
−x /2
∫ e dx = 1 ve
2
−∞
1
2π
∞
∫e
− y2 / 2
dy = 1
(2.9)
−∞
elde edilir.
İntegrale yeni değişken girersek y =
x−a
, b>0
b
∞
 ( x − a)2 
1
exp
−
 dx = 1
∫
2b 2 

−∞ b 2π
f ( x) =
 ( x − a)2 
1
exp  −
,
2b2 
b 2π

−∞ < x < ∞
(2.10)
Bu ifadede a yerine µ ve b yerine σ yazıldığında,
 1
 ( x − µ )2 
exp

−
,
f ( x) = σ 2π
2σ 2 

0
,

−∞ < x < ∞
diğer hallerde
normal olasılık yoğunluk fonksiyonu elde edilir (Hogg and Craig 1995).
2.2 Normal Dağılımın Özellikleri
1  x−µ 
σ 
− 
1
Olasılık yoğunluk fonksiyonu f ( x) =
e 2
2πσ
2
olan normal dağılımda;
a) Her µ için f ( µ + x) = f ( µ − x) olduğundan, fonksiyonun eğrisi x = µ ’ye göre
simetriktir. Aritmetik ortalama, mod ve medyan birbirine eşittir.
10
b) Dağılımın çarpıklık ölçüsü α 3 = 0 ve basıklık ölçüsü α 4 = 3 ’tür (Chiang 2003).
c) Dağılım x = µ değerinde bir maksimuma sahiptir (Chiang 2003).
d) Normal dağılım µ ve σ 2 olmak üzere iki parametreye sahiptir (Chiang 2003).
e)
f(x)
µ
x
Şekil 2.2. Normal Olasılık Yoğunluk Fonksiyonu Grafiği
Grafikte x = µ aşağı konkavdır.
Asimptotik olarak x → ±∞ iken f ( x) → 0 dır. Bütün x için f ( x) ≥ 0 olduğu için x’in
pozitif veya negatif bütün değerlerinde f grafiği yukarı konkavdır. Konkavlık
değişimi
olan bu noktaya büküm noktası denir ve f ′′( x) = 0 denklemi çözülerek bulunur.
x = µ ± σ ‘da oluşan büküm noktasını buluruz (Meyer 1970).
2.3 Normal Dağılım İçin Uygunluk Testleri
Veriler her zaman normal dağılıma uygun olmayabilir. Gözlenen her veri kümesi için
normal dağılıma uygun olduğunu varsayarak istediğimiz istatistiksel sonuçları elde
etmeye çalışırsak uygulamada yanıltıcı ve çelişkili durumlarla karşılaşılır. Bu amaçla
hata yapmamak ve bilinçli olmak için bir veri kümesinin hangi dağılıma uygun
olduğunu bilmek gerekir. Biz normal dağılımla ilgileneceğimiz için verilerin normal
dağılıma uygun olup olmadığını bilmemiz gerekmektedir. Bunun için aşağıdaki normal
dağılıma uygunluk testleri incelenecektir. Bu testler şunlardır:
11
1. Q-Q Nokta grafik yöntemi
2. Çeyreklikler arası fark yöntemiyle oluşan test
3. Ki-kare uygunluk testi
4. Kolmogorov-Simirnov uygunluk testi
5. Lilliefors normallik testi
6. Shapiro-Wilk normallik testi
7. İki ve daha fazla değişken için normallik testleri
2.3.1 Q-Q Nokta Grafik Yöntemi
Q-Q nokta grafik yöntemi, bir veri kümesinin normal dağılıma uygunluğunu belirleyen
yöntemlerden birisidir. Grafikteki noktalar, bir doğru etrafında kümelenmemişler ise
normallik varsayımının sağlanmadığı görülür. Normallikten ayrılışlar olduğunda
dönüşüm yapılarak dağılımın normal dağılım göstermesi sağlanabilir. Eğer gözlem
sayısı n ≥ 20 ise Q-Q nokta grafik yöntemi iyi sonuç vermektedir. Bu yöntem aşağıdaki
aşamalarda yapılır.
a) Bir veri kümesindeki gözlemler küçükten büyüğe doğru sıralanır.
b) Her bir gözleme ilişkin sırasıyla
pi =
i − .5
(i − 1/ 2)
veya pi =
n
n
n≠0
yüzdeliği hesaplanır. Burada i gözlem değeri, n gözlem sayısıdır.
c) pi yüzdeliğine karşılık gelen standart normal değerler z tablosundan bulunur.
d) Gözlem değerleri ( xi ), yüzdelik değerleri pi ’ye karşılık gelen zi değerleri ( xi , zi )
çiftleri için nokta grafiği çizilir ve nokta dağılımının bir doğru üzerinde olup olmadığına
bakılır. Grafikteki nokta dağılımı bir doğru üzerinde ise verilerin normal dağılım olduğu
görülmektedir (Johnson and Wichern 1992).
12
2.3.2 Çeyreklikler Arası Fark Yardımıyla Oluşan Test
Bir veri kümesinde çeyreklikler arası farkı standart sapmaya oranlanarak normallik testi
uygulanır. Önce birinci ve üçüncü çeyreği hesaplarız. Birinci çeyreği bulmak için önce
verileri küçükten büyüğe sıralarız. Oluşturulan seride
1
( n + 1) ’nci sıraya karşılık gelen
4
değer birinci çeyrek veya 25. yüzdelik diye adlandırılır, QL şeklinde gösterilir. Aynı
şekilde üçüncü çeyreği bulmak için de verileri küçükten büyüğe sıralarız. Oluşturulan
seride
3
( n + 1) ’nci sıraya karşılık gelen değer üçüncü çeyrek veya 75. yüzdelik diye
4
adlandırılır, QU şeklinde gösterilir. Çeyreklikler arası fark ile standart sapma arasındaki
oran hesaplanır. Bu oran IQR / s şeklinde gösterilir. Burada s değeri standart sapmadır.
IQR = QU − QL olduğuna göre, IQR / s ≅ 1,3 ise normal dağılıma yakınsama meydana
gelir (Sincich 1996).
2.3.3 Ki-Kare Uygunluk Testi
Ki-Kare testi rasgele değişkenlerin olasılık dağılımlarının hipotez testlerinde kullanılır.
Bir veri kümesinin normal dağılıma uygun olup olmadığını belirlemek için kullanılan
testlerden biridir. Ki-kare testi, herhangi bir durumda hipotezi kabul etmek veya
reddetmek için sağlanır. Bilinmeyen parametreleri tahmin etmek için gözlemlenen
değerler kullanılır. Parametrelerin tahmini gerçekleşirse beklenen frekanslar tanımlanır.
H 0 : F ( x) = F0 ( x) (Dağılıma Normal olasılık yoğunluk fonksiyonu uygundur).
H1 : F ( x) ≠ F0 ( x) ( Dağılıma Normal olasılık yoğunluk fonksiyonu uygun değildir).
biçimindeki hipotezler test edilir.
Ki-kare test istatistiği:
13
r
χ2 = ∑
i =1
( g i − ti ) 2
ti
(2.11)
formülünden elde edilmektedir.
Burada;
gi : i. sınıfta gözlenen birim sayısı (gözlenen frekanslar)
ti : i. sınıfta beklenen birim sayısı (teorik frekanslar)
r : Sınıf sayısı
olmaktadır.
Test istatistiği H 0 kabul edilirse r-1-k serbestlik dereceli ki-kare dağılımına sahiptir.
Burada k tahmin edilen parametre sayısıdır (Chiang 2003).
(2.11)’de hesaplanan test değeri α anlam düzeyinde ve r-1-k serbestlik dereceli ki-kare
tablo değerinden küçükse veriler normal dağılıma uygundur.
2.3.4
Kolmogorow-Simirnov Uygunluk Testi
Kolmogorow-Smirnov uygunluk testi bir veri kümesinin normalliğinin belirlenmesinde
kullanılan testlerden birisidir. Hipotez testi aşağıdaki biçimde kurulur.
H 0 : F ( x) = F0 ( x) ( Bütün x 'ler için )
H1 : F ( x) ≠ F0 ( x) ( En az bir x için)
Teorik birikimli dağılım fonksiyonu ile gözlenen birikimli dağılım fonksiyonu arasında
ilişki olup olmadığını ortaya koymak amacıyla; söz konusu dağılım fonksiyonları
karşılaştırılarak, dağılımlar arasındaki en büyük mutlak farkın test istatistiği oluşturulur.
Kolmogorow-Smirnov Uygunluk testinin test istatistiği;
sup F0 ( x) − S n ( x)
(2.12)
−∞< x <∞
formülünden elde edilmektedir.
14
Büyük örneklem için,
n sup F0 ( x) − S n ( x) ’in limit dağılımından elde edilen kritik
değerler 1948 yılında Smirnov tarafından tablolanmıştır (Lehmann 1986).
Elde edilen test istatistiğinin belirli bir örneklem büyüklüğü ve seçilen anlamlılık
düzeyindeki Kolmogorow-Smirnov tablo değerinden büyük olması durumunda H 0
reddedilmekle ve dağılımın normal olmadığı sonucuna ulaşılmaktadır.
Kolmogorov Simirnov uygunluk testinin Ki-kare uygunluk testine göre iki önemli
üstünlüğe sahip olduğu ileri sürülmektedir. Bu üstünlükler şunlardır:
a) Küçük mevcutlu örneklemlerde Kolmogorov-Simirnov testi daha güvenilir
sonuçlar verir.
b) Herhangi bir örneklem büyüklüğü için bu test çoğu zaman Ki-kare testinden
daha güçlü sonuçlar vermektedir (Lilliefors 1967).
2.3.5
Lilliefors Normallik Testi
Parametreler bilinmediğinde Lilliefors testini kullanmak gerekir. Bilinmeyen dağılım
fonksiyonu F(x)'den elde edilen X 1 , X 2 ,..., X n biçimindeki n hacimlik rasgele bir
örneklemin ortalaması ( X ) ve standart sapması S > 0 ise,
Zi =
Xi − X
S
(2.13)
değerlerini hesaplamak mümkündür. Elde edilen bu değerler gözlenen birikimli dağılım
fonksiyonunu oluşturmaktadır. Lilliefors testinin hipotezleri ise;
H 0 : Rasgele örneklem, ortalaması ve varyansı belirli olmayan bir normal dağılımdan
çekilmiştir.
H1 : X i ' lerin çekildiği dağılım fonksiyonu normal değildir.
şeklinde tanımlanabilir.
15
Yukarıdaki biçimde oluşturulmuş hipotezlerin testi için kullanılan Lilliefors test
istatistiği yine; (2.12)’de verilen
sup F0 ( x) − S n ( x)
−∞< x <∞
formülünden elde edilmektedir. Formüldeki kuramsal birikimli dağılım fonksiyonu
F0 ( x) ile gözlenen birikimli dağılım fonksiyonu S n ( x) arasındaki mutlak farkların en
büyüğü test istatistiğinin değerini oluşturmaktadır. Bu değer Lilliefors tablo değerinden
büyük bulunduğunda
X i ’lerin dağılım fonksiyonun normal olmadığı sonucuna
ulaşılmaktadır (Conower 1980).
2.3.6
Shapiro-Wilk Normallik Testi
Shapiro-Wilk testinde, dağılımı bilinmeyen bir fonksiyon olan F ( x) 'den çekilen
X 1 , X 2 ,..., X n
değerlerinden
oluşan
n
hacimlik
bir
örneklemin
verilerinden
yararlanılmaktadır. Shapiro-Wilk testi ile ilgili hipotezler ;
H 0 : F ( x) , ortalama ve varyansı belirli olmayan bir normal dağılıma sahiptir.
H1 : F ( x) ' in dağılımı normal değildir.
biçiminde oluşturulmaktadır.
Oluşturulan bu hipotezleri test etmek amacıyla,
2
 n

 ∑ ai ( X (i ) ) 

W =  in=1
∑ ( X i − X )2
(2.14)
i =1
biçimindeki Shapiro-Wilk test istatistiğine ulaşılmaktadır (Pearson and Hartley 1972).
Burada a değerine ise a′ = (a1 , a2 ,..., an ) = mV −1[m′V −1V −1m]−1/ 2 şeklinde ulaşılmaktadır.
16
m′ = (m1 , m2 ,..., mn ) ifadesi standart normal sıra istatistiklerinin beklenen değeridir.
V : (nxn) boyutlu kovaryans matrisidir.
X ′ = ( X 1 , X 2 ,..., X n ) rasgele örneklemdir.
Daha sonra örneklem verileri X (1) ≤ X (2) ≤ ... ≤ X ( n ) biçiminde sıralanmaktadır.
(2.14)’deki formülden elde edilen test istatistiği ve örneklem hacminden hareketle
Shapiro - Wilk tablosundan bulunan değer , seçilen anlamlılık düzeyinden büyük
olduğunda dağılımın normal olduğu sonucuna ulaşılmaktadır.
Normallik testlerinin güçleri arasında karşılaştırma yapıldığında Shapiro-Wilk testinin
en güçlü oduğu ileri sürülmektedir (Shapiro et al 1968).
2.3.7 İki ve Daha Fazla Değişken İçin Normallik Testleri
İki ve ikiden çok değişkenli dağılımlarda, sıralanmış uzaklıklar olan d i2 (i = 1,2,...,n) ile
χ 2 p;(i −0,5) / n değerlerine ilişkin nokta grafiğinin düz bir çizgi oluşturması durumunda
değişkenlerin yaklaşık olarak çok değişkenli normal dağıldığı görülür.
Sırasıyla
 1 − 1/ 2  2  2 − 1/ 2 
2  n − 1/ 2 
, χp 
 ,…, χ p 

 n 
 n 
 n 
χ p2 
değerlerine
karşılık
gelen
2
2
d (1)
≤ d (2)
≤ ... ≤ d (2n ) aralıklarının karesi grafikte düz bir çizgi oluşturursa veriler normal
dağılmaktadır (Johnson and Wichern 1992).
2.4 Beklenen Değer
X rasgele değişkenin olasılık yoğunluk fonksiyonu f ( x) olmak üzere, beklenen değeri;
1) Eğer X rasgele değişkeni kesikli ise
17
E ( X ) = ∑ xi P( X = xi ) =
x
∑ xf ( x)
(2.15)
x
2) X rasgele değişkeni sürekli ise
∞
E(X) =
∫ x f ( x)dx
(2.16)
−∞
ile ifade edilir. Burada E(X)’in var olabilmesi için E(X)’in mutlak yakınsak olması
şarttır. Yani E ( X ) < ∞ dir (Meyer 1970).
2.5 Varyans
X rasgele değişkeni için E ( X − EX ) 2 beklenen değerine bu rasgele değişkenin varyansı
denir.
Kesikli durumda varyans
σ 2 = E ( X − µ ) 2  = ∑ ( x − µ ) 2 f ( x)
(2.17)
x
dir. Sürekli durumda ise,
∞
σ 2 = E ( X − µ ) 2  = ∫ ( x − µ )2 f ( x)dx = E ( X 2 ) − µ 2
(2.18)
−∞
olarak belirlenir.
2.6 Moment Çıkaran Fonksiyon
X rasgele değişkeninin moment çıkaran fonksiyonu M X (t ) ile gösterilip t’nin bütün
gerçel değerleri için
M X (t ) = E (etX )
ile tanımlanır.
X rasgele değişkeni kesikli ise M X (t ) = E (etX ) = ∑ etx f ( x)
(2.19)
x
∞
X rasgele değişkeni sürekli ise M X (t ) = E (etX ) =
∫e
tx
f ( x)dx
(2.20)
−∞
olarak bulunur. Normal olasılık yoğunluk fonksiyonun moment çıkaran fonksiyonu ise
18
M X (t ) = e
1
2
µ t + σ 2t 2
şeklinde bulunur.
2.7 Normal Dağılım İçin Bazı Önemli Teoremler
Teorem 2.1 X 1 , X 2 ,..., X n bağımsız rasgele değişkenleri N ( µ1 , σ 21 ) , N ( µ 2 , σ 2 2 ) , ... ,
N ( µ n , σ 2 n ) normal dağılsın.
Y=k1 X 1 + k2 X 2 + ... + kn X n
rasgele değişkeninin k1, k2, ..., kn reel sabitlerle dağılımı
ortalaması k1µ1 + k2 µ 2 + ... + kn µ n ve varyansı k12σ 21 + k22σ 2 2 + ... + kn2σ n n olan normal
dağılıma sahip olur ve
n
n
i =1
i =1
N (∑ ki µi , ∑ k 2iσ 2 i )
(2.21)
biçiminde elde edilir.
İspat 2.1 X 1 , X 2 ,..., X n rasgele değişkenleri bağımsız oldukları için Y’nin moment
çıkaran fonksiyonu
M Y (t)=E ( exp[t(k1 X 1 + k2 X 2 + ... + kn X n )]) = E (etk1 X1 ) E (etk2 X 2 )...E (etkn X n )

σ 2t 2 
E (etX i ) = exp  µi t + i  bütün t, i =1,2,...,n için.
2 


σ i 2 ( ki t ) 2 
tki X i
E (e ) = exp  µi (ki t ) +

2


Y’nin moment çıkaran fonksiyonu
n


(
ki2σ i2 )t 2 
∑
2 2 2
n

n

(k σ )t 
i =1

M Y (t ) = ∏ exp  (ki µi )t + i i
 = exp  (∑ ki µi )t +
2
2
 i =1

i =1






n
n
i =1
i =1
N (∑ ki µi , ∑ k 2iσ 2 i )
dır.
19
Teorem 2.2 X 1 , X 2 ,..., X n bağımsız rasgele değişkenler M X i (t ) , i =1,2,3,...,n moment
n
Y = ∑ ai X i
çıkaran fonksiyonları ile gösterilirse,
ifadesinin moment çıkaran
i =1
fonksiyonu
n
M Y (t ) = ∏ M X i (ait )
(2.22)
i =1
şeklinde olur. Burada a1 , a 2 ,..., an reel sabitlerdir (Hogg and Craig 1995).
İspat 2.2 Y’nin moment çıkaran fonksiyonu
M Y (t ) = E etY  = E  et ( a1 X1 + a2 X 2 +...+ an X n )  = E  e a1tX1 e a2tX 2 ...e antX n  = E  e a1tX1  E  e a2tX 2  ...E  e antX n 
dır. Burada X 1 , X 2 ,..., X n bağımsızdır. Bununla birlikte,
E etXi  = M X i (t ) olduğu için
E eaitXi  = M X i (ai t )
dır. Böylece
M Y (t ) = M 1 (a1t ) M 2 (a2t )...M n (ant ) =
n
∏ M (a t )
i
i
(2.23)
i =1
Bu da Teorem 2.1’in genelleştirilmiş halidir.
Teorem 2.3 Farz edelim ki X 1 , X 2 ,..., X n rasgele örnekleminin moment çıkaran
fonksiyonu aşağıdaki şekillerde ifade edilebilir:
n
a) Y = ∑ X i ’nin moment çıkaran fonksiyonu
i =1
n
M Y (t ) = ∏ M (t ) = [ M (t )]
n
(2.24)
i =1
n
b) X = ∑ X i / n ’nin moment çıkaran fonksiyonu
i =1
 t    t 
M X (t ) = ∏ M   =  M   
 n    n 
i =1
n
n
(2.25)
dir .
20
Teorem 2.4 X ve Y olarak ifade edilen iki rasgele değişkenin moment çıkaran
fonksiyonları sırasıyla M X (t ) ve M Y (t ) olsun. Bütün t değerleri için M X (t ) = M Y (t )
ise X ve Y aynı dağılıma sahiptir.
Teorem 2.5 X ve Y bağımsız rasgele değişkenleri için Z = X+Y olsun. X, Y ve Z
rasgele değişkelerin moment çıkaran fonksiyonları M X (t ) , M Y (t ) ve M Z (t ) ise
M Z (t ) = M X (t ) M Y (t )
dır.
İspat 2.5 M Z (t ) = E (e Zt ) = E e( X +Y ) t  = E (e Xt .eYt ) = E (e Xt ) E (eYt )
= M X (t ) M Y (t )
(2.26)
Ayrıca X 1 , X 2 ,..., X n bağımsız değişkenlerin moment çıkaran fonksiyonu M X i ,
i =1,2,...,n ise o zaman Z = X 1 + X 2 + ... + X n ’in moment çıkaran fonksiyonu M Z ’dir.
M Z (t ) = M X1 (t ) M X 2 (t )...M X n (t )
(2.27)
Teorem 2.6 X 1 , X 2 ,..., X n bağımsız rasgele değişkenleri N ( µ i , σ i2 ) , i =1,2,...,n şeklinde
normal dağılmış ise Z = X 1 + X 2 + ... + X n ‘in dağılımı
n
 n

N  ∑ µ i , ∑ σ i2 
i =1
 i =1

(2.28)
olur. Bununla birlikte,
X 1 , X 2 ,..., X n rasgele değişkenleri N ( µ , σ 2 ) dağılmışlarsa
1) X ve X i − X terimleri bağımsızdırlar (i =1,2,…,n).
2) X ve S2 bağımsızdır.
3) nS 2 / σ 2 , (n-1) serbestlik dereceli ki-kare dağılır. Yani χ 2 ( n −1) dir.
21
2.8 Yakınsama Teoremleri
Yakınsama teoremleri ile gözlemlenen bir rasgele değişkenin normal dağılıma
yakınsaması incelenecektir.
Teorem (Lapunov) 2.7 X 1 , X 2 ,..., X n bağımsız rasgele değişkenlerinin ortalaması µ ,
varyansı σ 2 ve üçüncü derece momenti M 3 = E X i − µ
σ ( n ) = σ 12 + σ 22 + ... + σ n2
lim
n →∞
M (n)
σ
1
2π
ise
M ( n ) = µ13 + µ 23 + ... + µ n3 olsun.
= 0 ilişkisi varsa, Z =
(n)
3
X 1 + X 2 + ... + X n − µ1 − µ 2 − ... − µ n
σ (n)
rasgele değişkeni
x
∫e
−t 2 / 2
dt
(2.29)
−∞
dağılım fonksiyonu ile standart normal dağılıma yakınsar (Zubrzycki 1970).
Teorem (Lindeberg-Feller) 2.8 X 1 , X 2 ,..., X n değişkenleri FX ( x) dağılımlı ve
E ( X i ) = µi ortalamalı, V ( X i ) = σ i2 varyanslı bağımsız rasgele değişkenler olsun.
n
Z=
∑(X
i
− µ)
i =1
Cn
1/ 2
 n

Cn =  ∑ σ i2 
 i =1 
olarak tanımlanır. Her ε > 0 için
lim
n →∞
1
Cn2
n
∑∫
i =1
lim max
n→∞
1≤ i ≤ n
x
F ( x) =
∫
−∞
σi
Cn
x − µi >ε Cn
( x − µi ) 2 dFi ( x) = 0 olursa bu ilişki
=0
1 −t2 / 2
e
dt
2π
(2.30)
dağılımı ile ortalaması 0 ve varyansı 1 olan standart normal dağılıma yaklaşır.
22
2.9 İki Değişkenli Normal Dağılım
İki değişkenli rasgele değişkenler X = ( X 1 , X 2 )′ olsun. Bunların beklenen değeri ve
kovaryansı sırayla
 µ1 
E[X ] = µ =  
 µ2 
ve
σ ii = σ i2

σ ij
σ 12 
σ
Cov [ X 1 , X 2 ] = ∑ =  11
,
σ 21 σ 22 
i=j
i≠ j
olup det ∑ = σ 12σ 22 − σ 122 ≠ 0 olacağından öyle σ 12 = ρ12σ 1σ 2 eşitliğini kullanarak
∑ −1 =
 σ 22
σ 11σ 22 − σ 122  −σ 12
1
−σ 12 
 σ 22
1
=
σ 11  σ 11σ 22 (1 − ρ122 )  − ρ12σ 1σ 2
− ρ12σ 1σ 2 
σ 11 
elde edilir. O halde iki değişkenli normal olasılık yoğunluk fonksiyonu
( x − µ )′ ∑ −1 ( x − µ ) = ( x1 − µ1
x2 − µ2 )
 σ 22
1
2 
σ 11σ 22 (1 − ρ12 )  − ρ12σ 1σ 2
− ρ12σ 1σ 2  x1 − µ1 

σ 11 
 x2 − µ2 
σ 22 ( x1 − µ1 ) 2 + σ 11 ( x2 − µ 2 ) 2 − 2 ρ12σ 1σ 2 ( x1 − µ1 )( x2 − µ2 )
=
σ 11σ 22 (1 − ρ122 )
 x − µ  2  x − µ  2
 x1 − µ1  x2 − µ 2  
1
1
1
2
2

+
−
=
2
ρ

 



12 
σ
σ
(1 − ρ122 )  σ 1   σ 2 
1
2


 

şeklinde elde edilir. Buna göre iki değişkenli normal olasılık yoğunluk fonksiyonu
(2.31)’deki gibi tanımlanır.
f ( x1 , x2 ; µ , ∑) =
1
− ( x − µ ) ′ ∑ −1 ( x − µ )
1
e 2
2π det(∑)
yani
f ( x1 , x2 ) =
e

 x − µ  2  x − µ  2
 x − µ  x − µ   
1

 1 1  +  2 2  − 2 ρ12  1 1  2 2   
−
2
2(1− ρ12 )  σ 1   σ 2 
 σ1  σ 2   


(2.31)
2πσ 1σ 2 1 − ρ
2
12
dir (Johnson and Wichern 1992).
23
İki değişkenli normal olasılık yoğunluk fonksiyonu f ( x1 , x2 ) ’in özellikleri şunlardır.
1) f ( x1 , x2 ) birleşik olasılık yoğunluk fonksiyonudur.
2) X 1 değişkeni N ( µ1 ,σ 11 ) ve X 2 değişkeni N ( µ 2 , σ 22 ) olarak normal dağılır.
3) ρ değeri ise X 1 ve X 2 rasgele değişkenlerinin korelasyon katsayısı olup
ρ=
cov( X 1 , X 2 )
σ
= 12
V ( X 1 )V ( X 2 ) σ 1σ 2
(2.32)
ile hesaplanır ve −1 ≤ ρ ≤ 1 aralığında bir değerdir.
İki değişkenli normal dağılım µ1 , µ2 , σ 1 , σ 2 ve ρ12 olmak üzere beş parametreye
sahiptir (Hogg and Craig 1995).
Marjinal dağılımlar ise sırasıyla aşağıda gösterilmiştir. Bunlar,
∞
f ( x1 ) =
∫
f ( x1 , x2 )dx2 =
−∞
2
1
e − ( x1 − µ1 ) /(2σ11 )
σ 1 2π
(2.33)
ve
∞
f ( x2 ) =
∫
−∞
f ( x1 , x2 )dx1 =
1
σ 2 2π
e− ( x2 − µ2 )
2
/(2σ 22 )
(2.34)
şeklindedir. İki değişkenli normal dağılımda;
( X 1 , X 2 ) ~ BVN ( µ1 , µ 2 ,σ 11 , σ 22 , ρ12 ) ise
1) X 1 = x1 verildiğinde X 2 ’nin koşullu dağılımı


σ
X 2 x1 ~ N  µ 2 + ρ12 2 ( x1 − µ1 ), σ 22 (1 − ρ122 ) 
σ1


2) X 2 = x2 verildiğinde X 1 ’in koşullu dağılımı


σ
X 1 x2 ~ N  µ1 + ρ12 1 ( x2 − µ 2 ), σ 11 (1 − ρ122 ) 
σ2


şeklindedir (Bain and Engelhardt 1989).
İki değişkenli normal olasılık yoğunluk fonksiyonunun moment çıkaran fonksiyonu

σ 11t12 + 2 ρ12σ 1σ 2t1t2 + σ 22t22 
M X (t1 , t2 ) = exp  µ1t1 + µ 2t2 +

2


şeklinde tanımlanır (Hogg and Craig 1995).
24
(2.35)
2.10 Çok Değişkenli Normal Dağılım
Burada çok değişkenli normal dağılım fonksiyonun tanımı, özellikleri ve elde edilecek
önemli sonuçlar incelenecektir.
Tanım 2.1 Bir X vektörü Normal dağılıma sahipse, olasılık yoğunluk fonksiyonu, ∑
pozitif tanımlı bir matris olmak üzere

 1

−1
 exp  − 2 ( x − µ )′ ∑ ( x − µ ) 

 , x∈ Rp,µ ∈ Rp

p
1
f X ( x) = 
(2π ) 2 (det(∑)) 2


0
,diğer hallerde

(2.36)
şeklindedir. Buna göre,
∫∫ ...∫ f
X
( x)dx1dx2 ..dx p = 1
Rp
eşitliği görülebilir.
Bu tanıma William C. Horrace tarafından tanımlanan tanımı da ilave olarak verilebilir.
′
Tanım 2.2 Farz edelim ki X * =  x1* , x2* ,..., x*p  , p ≥ 2 ile p boyutlu rasgele
değişkenler olsunlar. Olasılık yoğunluk fonksiyonu
1
−
 1

f X * ( x, µ , ∑) = (2π ) − p / 2 (det ∑) 2 exp  − ( x − µ )′ ∑ −1 ( x − µ )  ; x ∈ R p
 2

(2.37)
ise X * değişkeni µ ′ =  µ1 , µ 2 ,..., µ p  ortalama vektörlü ve ( pxp ) boyutlu pozitif
tanımlı tekil olmayan korelasyon matrisli n değişkenli normal dağılıma sahiptir.
Standart notasyon olarak X * ~ N p ( µ , ∑ ) ifadesini kullanacağız.
c = c1 , c2 ,..., c p  ∈ R p altında X * in X ′ =  x1 , x2 ,..., x p  truncated hali şu şekilde
ifade edilir.
25
 1

(2π )− p / 2 (det ∑) −1/ 2 exp  − ( x − µ )′ ∑ −1 ( x − µ ) 
 2
 ;x∈Rp ;
f X ( x, µ , ∑, c ) =
≥c
∞
 1

−p/2
−1/ 2
−1
(2π )
(det ∑) ∫ e xp  − ( x − µ )′ ∑ ( x − µ )  dx
 2

c
 1

exp − ( x − µ )′ ∑ −1 ( x − µ ) 
 2
 ;x∈Rp ,
= ∞
≥c
 1

−1
∫c e xp − 2 ( x − µ )′ ∑ ( x − µ )  dx
(2.38)
∞
Burada
{
∫
integrali
c
p
boyutlu
c’den
∞ ’a
bir
Riemann
integralidir
ve
}
R≥pc = x ∈ R p : x ≥ c dir.
X * nın her elemanı için c altında truncated ile ilgilenilir. Bununla birlikte X * nın alt
kümeleri de truncated olur. Bu da X *j için limit −∞ dan c j ’e gider. Örneğin eliptik
p
truncated. Burada X
*
ifadesi
∑a
tj
X *j > atj biçiminden truncatedi dikkate alınırken
j =1
a < X *′ ∑ −1 X * < b şartı ile sınırlandırılır.
Sonuçta, ( X 1* , X 2* ) çiftinden truncated dikkate alırız, dağılımın spesifik bölümü
p
belirtilir ve
∑ x E( X
j
*
j
) olarak maksimize edilir. Aşağıda izleyeceğimiz tanımlama
j =1
yararlıdır.
M = c − µ , t ∈ R p ve X j sembolik elemanı ile P = c − µ − i ∑ t ifade edilirse,
( px1)
( px1)
sırasıyla t j , Pj ; j ∈ N , N = [1, 2,..., p ] ve i = −1 dir (Horrace 2004).
2.10.1 Çok Değişkenli Normal Dağılımın Beklenen Değeri ve Kovaryansı
X = X 1 , X 2 ,..., X p rasgele vektörünün beklenen değeri
26
 E ( X 1 )   µ1 
 E( X )   µ 
2   2
µ = E( X ) = 
=
 M  M 

  
 E ( X p )   µ p 
(2.39)
şeklinde tanımlanmış olup, kovaryansı ise
  X 1 − µ1 



X 2 − µ 2 

′

 X − µ1 , X 2 − µ 2 ,..., X p − µ p  
∑ = E ( X − µ )( X − µ ) = E
 M

 1



 X p − µp 





2

( X 1 − µ1 )
( X 1 − µ1 )( X 2 − µ2 ) K ( X 1 − µ1 ) ( X p − µ p ) 


2
 ( X − µ )( X − µ )
K ( X 2 − µ2 ) ( X p − µ p )
( X 2 − µ2 )
2
2
1
1


=E


M
M
K
M


2
( X p − µ p ) ( X 1 − µ1 ) ( X p − µ p ) ( X 2 − µ 2 ) K

µ
−
X
(
)
p
p


2

E ( X 1 − µ1 )
E ( X 1 − µ1 )( X 2 − µ2 )

2
 E ( X − µ )( X − µ )
E ( X 2 − µ2 )
2
2
1
1
=

M
M

 E ( X p − µ p ) ( X 1 − µ1 ) E ( X p − µ p ) ( X 2 − µ 2 )

cov( X 1, X 2 )
 V ( X1)
 cov( X X )
V (X2)
2, 1
=

...
...

 cov( X p , X 1 ) cov( X p , X 2 )
E ( X 1 − µ1 ) ( X p − µ p ) 

K E ( X 2 − µ2 ) ( X p − µ p )


K
M

2

K
E ( X p − µp )

K
... cov( X 1 , X p ) 
... cov( X 2 , X p ) 
=

...
...

...
V ( X p ) 
 σ 11 σ 12
σ
 21 σ 22
 ...
...

σ p1 σ p 2
... σ 1 p 
... σ 2 p 
(2.40)
... ... 

... σ pp 
şeklinde tanımlanır (Johnson and Wichern 1992).
2.10.2 Çok Değişkenli Normal Dağılımdan Çıkarılacak Bazı Sonuçlar
Sonuç 2.1 Bir ∑ matrisi tanımlanmışsa ∑ −1 de tanımlanabilir.
27
Eğer e vektörü ∑ ’nın λ öz değerine karşılık gelen öz birim vektörü ve ∑ ’nin tersi var
ise, o zaman e vektörü, ∑ −1 ’in
1
λ
öz değerine karşılık öz vektörüdür.
1
∑ e = λ e ise ∑ −1 e =   e olarak ifade edilir.
λ
1 
O halde, (λ , e) , ∑ için,  , e  de ∑ −1 için öz değer-öz vektör çiftidir. ∑ −1 de pozitif
λ 
tanımlıdır. Bu da aşağıdaki gibi ifade edilir.
∑ pozitif tanımlı ve e ≠ 0 için bir öz vektör, O halde,
0 < e′ ∑ e = e′(∑ e) = e′(λ e) = λ e′e = λ
nx1 boyutlu herhangi bir x vektörü için,
 p 1
x′ ∑ −1 x = x′  ∑ 
 i =1  λi
p
 ′
1
2
e
e
x
=
 i i 
 ( x′ei ) ≥ 0
∑
i =1  λi 


olduğu için λi−1 ( x′ei ) 2 her bir terimi pozitiftir. Yalnız x = 0 ise bütün i için x′ei = 0 dır.
p
1
∑  λ ( x′e )
i =1

i

i
2
> 0 ve ∑ −1 pozitif tanımlıdır.
Özetle, n boyutlu normal olasılık yoğunluk fonksiyonu
( x − µ )′ ∑ −1 ( x − µ ) = c 2
(2.41)
olacak şekilde bir elips tanımlar.
Bu elipsin merkezi µ ve eksenleri ise m c λi ei dir (i =1,2,...,p).
Burada ∑ ei = λi ei ’dir (Johnson and Wichern 1992).
Sonuç 2.2 X ~ N p ( µ , ∑) ise,
 a11 X 1 + a12 X 2 + ... + a1 p X p 


 a21 X 1 + a22 X 2 + ... + a2 p X p 
.

A X =
( qxp ) ( px1)
.




.


 aq1 X 1 + aq 2 X 2 + ... + aqp X p 
28
şeklindeki q bileşimleri N q ( Aµ , A ∑ A′) dağılır.
Yine, X + d ifadesi
( px1)
( px1)
N p ( µ + d , ∑)
(2.42)
dağılır. Burada d sabit vektördür.
Sonuç 2.3 X’ in bütün alt kümeleri normal dağılır. X ’i, X 1 ve X 2 olarak iki parçaya
ayırırsak, onların ortalama vektörü µ ve kovaryans matrisi ∑ olmak olsun.
 X1 
 ( qx1) 
X = K 
( px1)


 X2 
 (( p − q ) x1) 
 µ1 
 ( qx1) 
µ =  ... 


( px1)
 µ2 
 (( p − q ) x1) 
M
 ∑11
 ( pxq )
∑ = L
M
( pxp )

M
 ∑ 21
 (( p − q ) xq )
∑


L 

∑ 22 
(( p − q ) x ( p − q )) 
12
( qx ( p − q ))
X 1 ~ N q ( µ1 , ∑11 )
(2.43)
dağılımına sahiptir (Johnson and Wichern 1992).
Sonuç 2.4 a) X 1 ve X 2 bağımsız ise Cov( X 1 , X 2 ) = 0 dır.
(2.44)
q1 xq2 sıfır matrisidir.
  µ1   ∑11 M ∑12  
 X1 




b)  L  ~ N q1 + q2  L  ,  L M L  
  

 µ  ∑

 X 2 
  2   21 M ∑ 22  
ise yalnız ∑12 = 0 olduğunda X 1 ve X 2 bağımsızdır.
c) X 1 ve X 2 bağımsızsa ve sırasıyla N q1 ( µ1 , ∑11 ) ve N q2 ( µ2 , ∑ 22 ) dağılırsa,
  µ1   ∑11 M 0  
 X1 
  

 L  ise N
M L  
q1 + q2   L  ,  L
 
 µ   0 M ∑  
 X 2 
22  
 2 
(2.45)
şeklinde çok değişkenli normal dağılır (Johnson and Wichern 1992).
29
Sonuç 2.5 X rasgele değişkeni det(∑) > 0 olmak üzere N p ( µ , ∑) dağılır. O halde,
a) ( X − µ )′ ∑ −1 ( X − µ ) ifadesi p serbestlik dereceli ki-kare dağılır. ( χ (2p ) )
(2.46)
b) N p ( µ , ∑) dağılımı 1 − α olasılık ile { x : ( x − µ )′ ∑ −1 ( x − µ ) ≤ χ p2 (α )}
(2.47)
elipsine karşılık gelir.
Bunların nasıl oluştuğunu aşağıda sırasıyla göreceğiz.
a) Z1 , Z 2 ,..., Z p bağımsız rasgele değişkenleri N(0,1) dağılırken, Z12 + Z 22 + ... + Z p2
kareleri toplamı dağılımının χ (2p ) olduğunu biliyoruz. (2.48)’de ifade edilen Spectral
n
1
i =1
λi
Ayrışımlar yardımıyla A= ∑ ve ∑ −1 = ∑
ei ei′ elde edilir. Spectral Ayrışım kısaca
şöyle ifade edilir.
Bir A simetrik matrisi ( n × n ) boyutunda kare matris olsun. A matrisinin öz değerleri
sırasıyla λ1 , λ2 ,..., λn ve öz birim vektörleri ise sırasıyla e1 , e2 ,..., en olsun.
i = j ,
ei′e j = 
i ≠ j ,
1
0
i = 1,2,…,n dir. O halde Spectral Ayrışım
A = λ1 e1 e1′ + λ2 e2 e2′ + ... + λn en en′
( n× n )
( n×1) (1× n )
( n×1) (1×n )
(2.48)
( n×1) (1× n )
şeklinde tanımlanır.
Burada ∑ ei = λi ei ’dir. Böylece ∑ −1 ei = (1/ λi )ei
Sonuç olarak,
p
p
( X − µ )′ ∑ −1 ( X − µ ) = ∑ (1/ λi )( X − µ )′ei ei′( X − µ ) = ∑ (1/ λi )(ei′ ( X − µ )) 2
i =1
i =1
p
p
i =1
i =1
= ∑ [(1/ λi )ei′ (X − µ )]2 = ∑ Z i2
 (1/ λ )e ′ 
1 1


 (1/ λ2 )e2′ 
A =

( p× p )
M




 (1/ λ p )e p′ 
olarak belirttiğimizde
Z = A( X − µ ) ve X − µ ‘nin dağılımı N p (0, ∑) olur. Bu durumda,
 Z1 
Z 
2
Z =  ,
( p×1)
 M 
 
 Z p 
Z = A( X − µ ) değişkeni N p (0, A ∑ A′) şeklinde çok değişkenli normal dağılım gösterir.
30
 (1/

 (1/
A ∑ A′ = 
( p × p ) ( p × p ) ( p× p )


(1/
λ1 )e1′ 

′
λ2 )e2   p
 1
e1
  ∑ λi ei ei′  
M
  λ1
  i =1

λ p )e p′ 
 λ e′ 
 1 1 
 λ e ′ 1
=  2 2 
e1
M
λ


 1


 λ p e p′ 
1
λ2
e2 ...
1
λ2
e2 ...

ep 
λ p 
1

ep  = Ι
λ p 
1
Z1 , Z 2 ,..., Z p bağımsız standart normal değişkenler ve
( X − µ )′ ∑ −1 ( X − µ )
(2.49)
ifadesi p serbestlik derecesi ile ki-kare ( χ (2p ) ) dağılır (Johnson and Wichern 1992).
b) P[( X − µ )′ ∑ −1 ( X − µ ) ≤ c 2 ] olasılığı N p ( µ , ∑) ile dağılan ( X − µ )′ ∑ −1 ( X − µ ) ≤ c 2
elipsini ifade eder (Johnson and Wichern 1992).
Sonuç 2.6 X ~ N (µ , ∑) olmak üzere X ’in lineer dönüşümü olan,
U = AX + b
rasgele vektörü de normal dağılıma sahiptir. Gerçekten,
M U (t ) = E (et ′U ) = E (et ′( AX +b ) ) = et′b E (et′AX ) = et ′b M X ( A′t ) = et′b et′Aµ +(1/ 2)t′A ∑ (t′A)′
olmak üzere U rasgele vektörü,
U ~ N ( Aµ + b, A ∑ A′) dağılımına sahiptir (Akdeniz ve Öztürk 1996).
Sonuç 2.7 µ = 0 , ∑ = Ι olması durumunda N (0, Ι) dağılımına çok değişkenli standart
normal dağılım denir.
X ~ N (µ , ∑) olmak üzere, ∑:nxn kovaryans matrisinin ∑-1 invers matrisi kendi öz
değer ve öz vektörlerinin oluşturduğu matrisler cinsinden,
31
λ1 0 ... 0 
 0 λ ... 0 
2
−1
 P′
∑ = P
M M L 0


 M M L λ p 
olarak yazılsın ve
∑ −1/ 2



= P



λ1
0
...
0
λ2
...
M
M
L
M
M
L
0 

0 
P′
0 
λ p 
P = [e1 , e2 ,..., en ]nxn
olsun.
Z= ∑ -1/2 (Y-µ )
dönüşümü sonucu Z rasgele vektörü standart normal dağılıma sahiptir, yani
Z ~ N (0, Ι)
(2.50)
dır.
2.10.3 Çok Değişkenli Koşullu Dağılımlar
X 1 , X 2 ,..., X p rasgele değişkenleri için
 X1 
 µ1 
 ∑11 M ∑12 




X =  L  vektörü, µ = L  ortalamalı ve ∑ =  L M L  kovaryanslı normal
 ∑ 21 M ∑ 22 
 X 2 
 µ 2 
dağılır. Yani,
 X1 
X =  L  ~ N p ( µ , ∑) dir.
 X 2 
X 1 = x1 verildiğinde X 2 nin koşullu dağılımı ortalaması ve kovaryansı sırasıyla
aşağıdaki gibi olan
−1
E  X 2 X 1 = x1  = µ2 + ∑ 21 ∑11
( x1 − µ1 )
(2.51)
32
−1
Cov  X 2 X 1 = x1  = ∑ 22 − ∑ 21 ∑11
∑12
(2.52)
ile normal dağılır. Bunu kısaca şöyle gösterebiliriz.

Ι
M
 (( p − q ) x ( p − q ))
M
A= L

−1
 − ∑ 21 ∑11 M
 (( p − q ) xq )


L 

Ι 
( qxq )

0
(( p − q ) xq )
alalım. O zaman
 X 1 − µ1 
A( X − µ ) = A  ........  =
 X 2 − µ 2 


X 1 − µ1


 ...................................... 
 X − µ − ∑ ∑ −1 ( X − µ ) 
 2
2
21
11
1
1 
ifadesinin beklenen değeri E [ A( X − µ )] = AE [ X − µ ] = 0 ve kovaryans matrisi
0
 ∑11 M


Cov( A( X − µ )) = A ∑ A′ =  .... M ...................... 
−1
 0 M ∑ 22 − ∑ 21 ∑11
∑12 
olan normal dağılıma sahiptir.
−1
Bu nedenle, X 2 − µ2 − ∑ 21 ∑11
( X 1 − µ1 ) ve A( X − µ ) in X 1 − µ1 olan iki bileşenin
kovaryansı 0’dır. Böylece onlar bağımsızdır. Üstelik,
−1
−1
X 2 − µ2 − ∑ 21 ∑11
( X 1 − µ1 ) ~ N p − q (0, ∑ 22 − ∑ 21 ∑11
∑12 )
şeklinde dağılmaktadır. Bağımsızlıktan
−1
−1
X 2 − µ2 − ∑ 21 ∑11
( X 1 − µ1 ) X 1 = x1 ~ N p − q (0, ∑ 22 − ∑ 21 ∑11
∑12 )
−1
−1
X 2 − µ2 − ∑ 21 ∑11
( x1 − µ1 ) X 1 = x1 ~ N p − q (0, ∑ 22 − ∑ 21 ∑11
∑12 )
dağılımlarını elde ederiz. Sonuç olarak
−1
−1
X 2 X 1 = x1 ~ N p − q ( µ2 + ∑ 21 ∑11
( x1 − µ1 ), ∑ 22 − ∑ 21 ∑11
∑12 )
(2.53)
dağılımı oluşur. Aynı şekilde X 2 = x2 verildiğinde X 1 in koşullu beklenen değeri,
kovaryansı ve dağılımı ise sırasıyla aşağıda gösterilmiştir.
E  X 1 X 2 = x2  = µ1 + ∑12 ∑ −221 ( x2 − µ 2 )
Cov  X 1 X 2 = x2  = ∑11 − ∑12 ∑ −221 ∑ 21
−1
X 1 X 2 = x2 ~ N p − q ( µ1 + ∑12 ∑ −221 ( x2 − µ2 ), ∑11 − ∑12 ∑ 22
∑ 21 )
dir.
33
(2.54)
2.10.4 Çok Değişkenli Normal Dağılımın Moment Çıkaran Fonksiyonu
Bir X rasgele vektörü normal dağılıma sahip olduğunda moment çıkaran fonksiyonu
M X (t ) = E (et ′X ) =
∞
∫ ... ∫
−∞
= e
t ′µ +
∞
−∞
1
(2π )
n
−1
det(∑ )
t′ ∑ t
2
e

( x − µ )′ ∑ −1 ( x − µ ) 
 t ′x −

2


dx1...dxn
(2.55)
şeklindedir.
Burada µ ifadesi X rasgele vektörünün beklenen değeri olan ortalama vektörüdür. ∑
ise kovaryans matrisidir.
34
3. NORMAL DAĞILIMIN DİĞER DAĞILIMLARLA İLİŞKİSİ
Normal dağılımın diğer dağılımlarla olan ilişkisi Limit Dağılımı yardımıyla bulunur.
Bütün dağılımlar bazı şartlarda normal dağılıma yaklaşmaktadır.
Tanım 3.1 Her bir n = 1,2,… için ve X n rasgele değişkeninin dağılım fonksiyonu
Fn ( x) ve X rasgele değişkeninin dağılım fonksiyonu da F ( x) olsun. F ( x) dağılım
fonksiyonunun sürekli olduğu her x için
lim Fn ( x) = F ( x)
(3.1)
n →∞
ise X n rasgele değişkenler dizisi X rasgele değişkenine dağılımda yakınsıyor denir ve
d
X n 
→ X ile belirtilir. Buna X n ’in limit dağılımı denir (Bain and Engelhardt 1989).
x<c
0
Tanım 3.2 F ( x) = 
1
(3.2)
x≥c
ise x = c değerinde F ( x) fonksiyonu bozulan dağılımın dağılım fonksiyonudur (Bain
and Engelhardt 1989).
3.1 Stokastik Yakınsama.
X 1 , X 2 ,..., X n rasgele değişkenleri ve c bir sabit olmak üzere x = c’de limit dağılımına
sahipse buna stokastik yakınsama denir.
nb
 c
lim 1 +  = ecb
n →∞
 n
(3.3)
nb
lim d (n) = 0
n →∞
ise
 c d ( n) 
cb
lim 1 + +
 =e
n →∞
n 
 n
35
(3.4)
olur. (3.4) eşitliğinin her iki tarafının logaritmasını alarak kolayca çözebiliriz. (3.3)’deki
limite göre
 c
c

nb ln 1 +  = nb  + ...  = cb + ...
 n
n

(3.5)
elde edilir. Burada n → ∞ iken terimlerin geriye kalan kısmı (artık değerler) sıfıra
yaklaşır (Bain and Engelhardt 1989).
3.2 Moment Çıkaran Fonksiyon Yaklaşımı
Moment çıkaran fonksiyon yaklaşımı ile çeşitli olasılık dağılımları normal dağılıma
yakınsamaktadır.
Teorem 3.1 X 1 , X 2 ,..., X n rasgele değişkenleri olsun. Dağılım fonksiyonları sırasıyla
F1 ( x), F2 ( x),..., Fn ( x) ve moment çıkaran fonksiyonları M 1 (t ), M 2 (t ),..., M n (t ) dır.
M(t),
F ( x) dağılım fonksiyonun moment çıkaran fonksiyonu bütün t için
lim M n (t ) = M (t )
n →∞
-h < t < h ise o zaman
lim Fn ( x) = F ( x)
(3.6)
n →∞
dır.
3.3 Ki-Kare Dağılımının Normal Dağılıma Yaklaşımı
X n rasgele değişkeni ki-kare dağılımına sahipse ortalaması n , varyansı 2n olduğundan
Merkezi Limit Teoreminde bu değerler yerine konarak moment çıkaran fonksiyon
yardımıyla normal dağılıma yaklaşmaktadır.
n → ∞ iken X n ~ χ (2n ) ise Z n =
Xn − n
2n
d

→ Z ~ N (0,1)
X n ~ χ (2n )
36
X n ’ nin moment çıkaran fonksiyonu (1 − 2t ) − n / 2 ,
t<
1
2
E( X n ) = n
V ( X n ) = 2n
Z n = ( X n − n) / 2n
  X − n   

M Zn (t ) = E exp t  n
 

  2n   
=e
− tn / 2 n

M Zn (t ) =  et


2/ n
E (e
tX n / 2 n
2
− t et
n
  2  n 
2t  
) = exp  −  t
  1 −

2n  
  n   2  
2/ n



−n / 2
,t <
2n
2
−n / 2
, t<
2n
2
Taylor formülüne göre,
2
e
t 2/n
2 1  2  eξ ( n )  2 
= 1+ t
+ t
 +
t

n 2  n 
6  n 
 t 2 ψ ( n) 
M Zn (t ) = 1 − +

n
n 

3
−n / 2
2t 3eξ ( n )
2t 3 2t 4 eξ ( n )
ψ ( n) =
−
−
3n
3 n
n
lim iken limψ (n) = 0
n→∞
lim M Zn (t ) = et
2
/2
(3.7)
n →∞
Z n = ( X n − n) / 2n
standart normal dağılıma sahiptir. Yani ki-kare dağılımı bu
durumda standart normal dağılıma yakınsamış olur.
Teorem 3.2 De Moivre-Laplace Limit Teoremi. Binom dağılımına uyan X rasgele
değişkeni, yeterice büyük n defa bağımsız deneme yapılırken, meydana gelen başarılı
olay sayısı Sn olarak belirtilirse herhangi a < b için n → ∞ iken başarılan her sonuç p
olasılığı ile gerçekleşir.
37
Z=
Sn − np
(3.8)
np (1 − p)
ise
S n − np


≤ b  → F (b) − F (a )
P a ≤
np (1 − p )


olur.
İspat 3.2 (3.8)’e göre, binom dağılımına sahip X rasgele değişkeni N (np, npq )
dağılımına yaklaşır. Burada q = 1 − p dir.
Sn in karakteristik fonksiyonu
E (eitSn ) = (q + peit ) n dir.
Bu durumda Z’nin karakteristik fonksiyonu ise
it ( S −np )/ npq
E (eitZ ) = E (e n
)
=e
−itnp / npq
= ( qe
itr / npq
−itnp / npq
it / npq n
E (e
)=e
( q + pe
)
−itp / npq
itq / npq n
+ pe
)
son eşitlikteki ifadeyi Taylor açılımı ile yazabiliriz.
(it ) 2
(it )n
it
e = 1 + it +
+ ... +
olduğunu hatırlarsak
2!
n!
n
2
 t 2  t 2 
lim f (t ) = 1− + d    → e −t / 2
n→∞
 2n  n  
(3.9)
olduğu görülüyor (Rao 1973). Açıkça, dağılım ortalaması 0 ve varyansı 1 olan normal
dağılıma yaklaşmaktadır. Deneme sayısı büyük olduğunda Binom olasılıkları normale
yaklaşır. Burada d(.) değeri artık değerdir.
38
3.4 t Dağılımının Normal Dağılıma Yaklaşımı
Tn , n serbestlik dereceli t dağılımına sahip olsun (n=1,2,3,…). Bunun dağılım
fonksiyonu
t
F(Xn) =
t
∫
−∞
f ( xn )dx = ∫
−∞
Γ [ (n + 1) / 2]
1
dx ,
π nΓ( n / 2) (1 + x / n)( n+1) / 2
2
(3.10)
dir. Burada f n ( x) ifadesi Tn ‘in olasılık yoğunluk fonksiyonu olarak tanımlanır. Buna
göre,
t
lim Fn (t ) = lim
n →∞
n→∞
∫
t
f n ( x)dx =
−∞
∫ lim f
−∞
n →∞
n
( x)dx
 1  x 2   − n / 2 
 Γ [ (n + 1) / 2] 
1
lim f n ( x)dx = lim 
lim 
 1 +   
 .lim
n →∞
n →∞
n →∞ (1 + x 2 / n)1/ 2 n →∞
n  
n
/
2
Γ
(
n
/
2)
2
π





n
2
 x2 
lim 1 +  = e x
n →∞
n 

t
lim Fn (t ) =
n →∞
∫
−∞
1 − x2 / 2
e
dx
2π
(3.11)
olduğundan standart normal dağılıma yaklaşmış olur (Hogg and Craig 1995).
3.5 Asimptotik Normal Dağılım
(m′′(ξ ) − σ 2 )t 2
m(t ) = 1 +
+
2
2
σ 2t 2
(3.12)
eşitliğine göre örneklem ortalaması standartlaştırıldığında Merkezi Limit Teoreminden
d
Z n 
→ Z ~ N (0,1)
dir (Bain and Engelhardt 1989).
39
Tanım 3.3 X 1 , X 2 ,..., X n rasgele değişkenleri m ve c öyle sabit olsun ki,
Zn =
Xn − m
c/ n
d

→ Z ~ N (0,1)
n → ∞ iken X n , m asimptotik ortalama ve c 2 / n asimptotik varyanslı olarak
asimptotik normal dağılıma sahiptir (Bain and Engelhardt 1989).
3.6 Stokastik Yakınsamanın Özellikleri
Stokastik yakınsama, bilinmeyen kitle parametrelerinin iyi bir tahmini için gereken
özelliklere sahiptir.
Teorem 3.3 Her ε > 0 için X 1 , X 2 ,..., X n stokastik yakınsama lim P ( X n − c < ε ) = 1
n →∞
p
dir. Burada rasgele değişkenlerin sırası c sabiti için X n 
→ c ile tanımlanan olasılıkta
yakınsamadır.
Teorem 3.4 X 1 , X 2 ,..., X n ortalaması µ ve varyansı σ 2 olan aynı dağılımlı rasgele
örneklem olmak üzere bu örneklemin ortalaması X olasılıkta µ ye yakınsar.
p
→µ
Yani X 
dır.
(
)
İspat 3.4 E ( X ) = µ n , V ( X n ) = σ 2 / n ve P X n − µ < ε ≥ 1 −
(
)
lim P X n − µ < ε = 1
n →∞
σ2
ε 2n
(3.13)
40
dır. Bu sonuçlar kitle ortalamasını daha iyi tahmin etmeyi sağlayan örneklem
(
ortalamasını gösterir. X , n → ∞ iken P X n − µ < ε
herhangi bir ε > 0 ve 0 < δ < 1 için n >
(
)
değeri 1’e yaklaşır. Yani
σ2
ise
ε 2δ
)
P µ − ε < X < µ + ε ≥ 1−δ
dir.
d
d
Teorem 3.5 Z n = n ( X n − m) / c 
→ Z ~ N (0,1) ise X n 
→m
(3.14)
dir (Bain and Engelhardt 1989).
3.7 Limit Teoremleri
Bu bölümde limit teoremleri ve yakınsama teoremleri incelenecektir.
Tanım 3.4 Olasılıkta Yakınsama. Verilen herhangi bir ε > 0 sayısı için,
lim P  X n − X < ε  = 1 ise X n rasgele değişkeni X’ e olasılıkta yakınsamış olur ve
n →∞
p
X n 
→ X şeklinde ifade edilir (Bain and Engelhardt 1989).
p
d
Teorem 3.6 X n rasgele değişkenler olmak üzere X n 
→ X ise X n 
→X
(3.15)
dir. X = c özel durumu için limit dağılımı P [ X = c ] = 1 olasılıkla bozulan bir dağılımdır
(Bain and Engelhardt 1989).
41
Teorem 3.7
p
X n 
→c
ise herhangi g(x) fonksiyonu için c’de sürekli ise
p
g ( X n ) 
→ g (c )
(3.16)
dir (Bain and Engelhardt 1989).
İspat 3.7 Her ε > 0 ve g(x) c’de sürekli olduğu için burada ε > 0 öyle ifade edersek
x − c < δ , g ( x) − g (c) < ε mevcuttur.
P  g ( x) − g (c) < ε  ≥ P  X n − c < δ 
p
P( B ) ≥ P( A) olduğu için A ⊂ B . Fakat X n 
→ c olduğu için her δ > 0 için
lim P  g ( X n ) − g (c) < ε  ≥ lim P  X n − c < δ  = 1
n →∞
n →∞
p
ve g ( X n ) 
→ g (c )
Bu teoremde X n ve c, vektörler k boyutlu olduğunda geçerlidir. Bu teorem çok
kullanışlıdır.
p
p
Teorem 3.8 X n 
→ c ve Yn 
→ d de X n ve Yn rasgele iki değişkenler ise
p
→ ac + bd
1) aX n + bYn 
(3.17)
p
2) X nYn 
→ cd
(3.18)
p
→1
3) X n / c 
4) P[ X n ≠ 0] = 1
5) P [ X n ≥ 0] ise
c ≠ 0 için
Bütün n, c ≠ 0 için
(3.19)
1
1
p

→ dir.
Xn
c
p
X n 
→ c dir.
(3.20)
(3.21)
(Bain and Engelhardt 1989).
p
d
Teorem 3.9 Stutsky’s Teoremi. Öyle X n 
→ c ve Yn 
→ Y ’de X n ve Yn iki
bağımsız değişkenler ise
d
1) X n + Yn 
→c +Y
(3.22)
42
d
→ cY
2) X nYn 
(3.23)
d
3) Yn / X n 
→Y / c ; c ≠ 0
(3.24)
d
d
Teorem 3.10 X n 
→ X ise herhangi bir g(x) sürekli fonksiyon g ( X n ) 
→ g( X )
dir.
Teorem 3.11
d
n ( X n − m ) / c 
→ Z ~ N (0,1) ve g(x), x = m’de sıfırdan farklı türeve
sahipse yani g ′(m) ≠ 0 ise
n [ g ( X n ) − g ( m) ] d

→ Z ~ N (0,1)
cg ′(m)
(3.25)
standart normal dağılıma yaklaşır.
İspat 3.11 x ≠ m ve u(m)=0 ise
u ( x) = [ g ( x) − g (m)] /( x − m) − g ′(m)
p
u ( x) , u (m) = 0 ile m’de süreklidir. Böylece g ′(m) + u ( X n ) 
→ g ′(m)
n [ g ( X n ) − g (m) ]  n ( X n − m )  [ g ′(m) + u ( X n )]
=

c
g ′(m)
[ cg ′(m)]


(3.26)
Asimptotik normalliğe göre n büyük olduğunda,
X n ~ N (m, c 2 / n) ise
2

c 2 [ g ′(m) ] 
g ( X n ) ~ N  g (m),

n


(3.27)
dağılımına yaklaşır.
43
4. NORMAL DAĞILIMDAN ELDE EDİLEN ÖNEMLİ SONUÇLAR
Karesel formların oluşumu için normal dağılımın özelliklerinden yararlanılarak bazı
dağılımlar elde edilmektedir. Bu dağılımlar ki-kare dağılımı, t dağılımı, F dağılımı ve
Wishart dağılımıdır. Bunlar aşağıda açıklanacaktır.
4.1 Ki-Kare Dağılımı
Teorem 4.1 X rasgele değişkeni
σ 2 >0 olmak üzere
N (µ , σ 2 )
dağılırsa,
W = ( X − µ ) / σ rasgele değişkeni standart normal dağılır. Yani N (0,1) ’dir (Hogg and
Craig 1995).
Teorem 4.2 X rasgele değişkeni N ( µ , σ 2 ) sahipse σ > 0 , V = ( X − µ ) 2 / σ 2 rasgele
değişkeni 1 sebestlik derecesi ile Chi-square ( χ 2 (1) ) dağılır (Hogg and Craig 1995).
Teorem 4.3 X 1 , X 2 ,..., X n rasgele değişkenleri N ( µ , σ 2 ) normal dağılımından n sayıda
bir rasgele örneklem olsun.
2
 X −µ 
rasgele değişkeni n serbestlik dereceli Ki-kare dağılımına sahiptir
Y = ∑ i
σ 
i =1 
n
n
Aynı şekilde Y =
∑(X
i
− X )2
i =1
σ2
rasgele değişkeni ise n-1 serbestlik dereceli Ki-kare
dağılımına sahiptir. Yani aşağıdaki gibi ifade edilir.
n
∑(X
i
− X )2
i =1
σ2
~ χ (2n −1)
(4.1)
dır.
44
Teorem 4.4 X 1 , X 2 ,..., X n N (0,1) ’den rasgele bir örneklem olmak üzere
U = X 12 + X 22 + ... + X n2 rasgele değişkeni n serbestlik dereceli ki-kare ( χ (2n ) ) dağılır.
Kısaca,
V = X 2 olsun.
1  1 −v / 2
1 −v / 2 
e
+
e  dv

2 v  2π
2π

 1 −1/ 2 −1/ 2
v e dv

=  2π
0

,her v > 0 için
(4.2)
,diğer hallerde
Bu sonuçla v rasgele değişkeni 1 serbestlik dereceli ki-kare dağılır.
X 1 değişkeni N(0,1) dağılırsa X 12 değişkeni 1 serbestlik dereceli ki-kare dağılır. ( χ 2 (1) )
Aynı şekilde X 2 , X 3 ,..., X n değişkenleri N(0,1) dağıldığında,
X 22 , X 32 ,..., X n2 değişkenleri χ 2 (1) dağılır.
V1 = X 12 , V2 = X 22 ,..., Vn = X n2
U = V1 + V2 + ... + Vn ’in dağılımı ise
M V1 (t ) = (1 − 2t ) −1/ 2 = M V2 (t ) = (1 − 2t )−1/ 2 = ... = M Vn (t ) = (1 − 2t ) −1/ 2
M U (t ) = M V1 (t ) M V2 (t )...M Vn (t ) = (1 − 2t ) −1/ 2 (1 − 2t ) −1/ 2 ...(1 − 2t ) −1/ 2 = (1 − 2t ) − n (1/ 2)
= (1 − 2t ) − n (1/ 2)
(4.3)
Bu sonuçla U = X 12 + X 22 + ... + X n2 ’in dağılımı χ 2 ( n ) olur (Meyer 1970).
Ayrıca, X ~ χ (2n ) , X 1 ~ χ (2m ) , n > m, X 1 ile X 2 bağımsız ve X = X 1 + X 2 ise
2
X 2 = χ (n-m)
dır. Gerçekten, X 2 rasgele değişkeninin moment çıkaran fonksiyonu M X 2 (t ) olmak
üzere,
M X (t ) = M X1 (t ) M X 2 (t )
(1 − 2t ) − n / 2 = (1 − 2t )− m / 2 M X 2 (t )
ifadesinden
45
M X 2 (t ) = (1 − 2t )
−
n−m
2
2
oluşur yani, X 2 = χ (n-m)
dır.
Bundan başka, merkezi olmayan ki-kare dağılımı da vardır.
n
X ~ N (0, Ι n ) dağılsın. X ′X = ∑ X i2 merkezi ki-kare dağılımına sahiptir.
i =1
X ~ N ( µ , Ι) olduğunda U = X ′X dağılımını ele alalım. µ ≠ 0 olduğunda merkezi
olmayan ki-kare dağılımı oluşur. Burada,
1
1
µ ′µ = ∑ µi2 parametresi merkezi olmama
2
2
parametresi olarak bilinir. λ parametresi ile ifade edilir. Bu da λ =
µ ′µ
2
şeklinde
belirtilir. n serbestlik dereceli ve λ merkezi olmayan parametreli merkezi olmayan kikare dağılımı χ (2n ,λ ) ile gösterilir. Bu dağılımın olasılık yoğunluk fonksiyonu ise
∞
f ( x) = e− λ ∑
1
λk
x2
k!
1
n+k
2
k =0
2
1
n + k −1 − x
2
e
1

Γ n + k 
2

(4.4)
şeklinde ifade edilir.
Merkezi olmayan ki-kare dağılımının moment çıkaran fonksiyonu
M X (t ) = e
−λ
∞
∑ (λ
/ k !)(1 − 2t )
k
1

− n + k 
2

k =0
−1
= e− λ eλ (1− 2t ) (1 − 2t )
= (1 − 2t )
1
− n
2
1
− n
2
e− λ [1−(1− 2 t )
−1
]
(4.5)
biçiminde ifade edilir. Merkezi olmayan ki-kare dağılımının
Ortalaması
E ( X ) = n + 2λ
ve varyansı
V ( X ) = 2n + 8λ
dır. Dağılım merkezi olsaydı
46
Ortalaması E ( X ) = n
Varyansı V ( X ) = 2n
olurdu.
4.2 t Dağılımı
U ~ N(0,1) , V ~ χ (2n ) ve U ve V bağımsız iki rasgele değişken olmak üzere,
t=
U
V /n
(4.6)
rasgele değişkenin olasılık yoğunluk fonksiyonu
 n +1 
n +1
Γ
  x 2 − 2
2 
f ( x) = 
, −∞ < x < ∞
1 + 
2 
n
π nΓ  
2
(4.7)
dır. Bu olasılık yoğunluk fonksiyonuna sahip rasgele değişkenlere n serbestlik dereceli
t – dağılımı denir ve X ~ t( n ) biçiminde gösterilir (Akdeniz ve Öztürk 1996).
Teorem 4.5 t ~ t( n ) olmak üzere t nin limit dağılımı N(0,1) dır.
X ~ t( n ) olmak üzere,
E ( X ) = 0 , (n > 1)
(4.8)
ve
V (X ) =
n
, (n > 2)
n−2
(4.9)
d
t ~ t( n ) olmak üzere t 
→ (Z ~ N (0,1))
n n→∞
dır.
47
(4.10)
Teorem 4.6 X 1 , X 2 ,..., X n rasgele değişkenleri N(µ ,σ 2 ) dağılımından bir örneklem
olmak üzere,
X −µ
~ t( n −1)
S/ n
(4.11)
şeklinde dağılır (Bain and Engelhardt 1989).
Teorem 4.7 X ~ N ( µ , σ 2 ) , U ~ χ (2n ) ve X ile U bağımsız olmak üzere,
X
µ

~ t  n, δ = 
σ
U /n

dır.
4.3 F – Dağılımı
U ~ χ (2r1 ) , V ~ χ (2r2 ) ve U ile V bağımsız iki rasgele değişken olmak üzere,
X=
U / r1
V / r2
(4.12)
rasgele değişkenin olasılık yoğunluk fonksiyonu
  r1 + r2   r1 
r +r
−1 2
Γ
   r1 −1
  2   r2  2  r1  2
x 1 + 
,0 < x < ∞
,
f ( x) = 
 r2 
 Γ(r1 / 2)Γ(r2 / 2)
0
, diğer hallerde

(4.13)
dır. Bu olasılık yoğunluk fonksiyonuna ait rasgele değişkenlere F dağılımı denir ve
X ~ F (r1 , r2 ) biçiminde gösterilir.
Şimdi de merkezi olmayan F dağılımını inceleyelim.
U ~ χ 2 ( r1 ,λ ) , V ~ χ 2 ( r2 ) ve U ve V bağımsız iseler (4.12)’de ifade edilen rasgele
değişkeni r1 ve r2 serbestlik dereceli λ merkezi olmayan parametreli merkezi olmayan
48
F dağılımına sahiptir ve F ′(r1 , r2 , λ ) şeklinde gösterilir. Merkezi olmayan F dağılımının
olasılık yoğunluk fonksiyonu ise
r
r
1
2
+k
 r1 r2

r1
2
2
+ k −1
r
r
+ +k
−λ k 1
2 Γ
∞
e λ
x2
2 2


f ( x) = ∑
1
( r1 + r2 + k )
k!
r
 r 
k =0
Γ  1 + k  Γ  2  (r2 + r1 x) 2
2
 2
(4.14)
şeklindedir. Beklenen değeri ve varyansı ise sırasıyla aşağıdaki şekilde ifade edilir.
E( X ) =
r2 (r1 + 2λ )
, (r2 > 2)
r1 (r2 − 2)
2
 r  (r + 2λ ) 2 + (r1 + 4λ )(−2)
V (X ) = 2 2  1
, (r2 > 4)
(r2 − 2) 2 (r2 − 4)
 r1 
dır. λ = 0 ve k = 0 olduğunda merkezi F dağılımı elde edilir (Searle 1997).
4.4 Wishart Dağılımı
Wishart Dağılımını ilk kez 1915 yılında Fisher bulmuştur. Bu bulgu iki boyutlu
vektörlere ilişkindir. Dağılımı ikiden fazla boyuta genelleştiren ve yoğunluk
fonksiyonunu 1928 yılında John Wishart bulmuştur. Bu sebeple bu dağılıma Wishart
Dağılımı denir (Tuncer 2002).
Tanım 4.1 Birbirinden bağımsız olarak X ~ N p ( µi , ∑) , i =1,2,…,p biçiminde farklı
yasalara göre dağılan
X 1 , X 2 ,..., X m gözlem vektörleriyle bunların dış çarpım
toplamlarından oluşan
m
C = ∑ X i X i′
(4.15)
i =1
matrisi düşünülsün. Pozitif tanımlı olan C matrisine “Wishart matrisi” adı verilip, “m
serbestlik derecesi”, “ ∑ parametresi” ve “ Λ merkezi olmama parametresi” ile merkezi
49
olmayan Wishart dağılımına sahip olduğu ifade edilir. Kısaca C ~ Wp (m, ∑; Λ ) ile
simgelenir. ∑ parametresi pozitif tanımlı simetrik bir matristir. Λ merkezi olmayan
parametresi de Λ = ∑ −1 MM ′ ’dir. Burada M matrisi
M = ( µ1 , µ2 ,...µm )
(4.16)
şeklinde pxm boyutundadır. M = 0 ya da
m
C = ∑ ( X i − µi )( X i − µi )′
(4.17)
i =1
durumunda merkezi bir Wishart dağılımı söz konusudur ve C ~ Wp (m, ∑) şeklinde
gösterilir (Tuncer 2002).
Tanım 4.2 Birbirinden bağımsız X i ~ N p ( µ , ∑) şeklindeki aynı dağılım yasasına göre
dağılan X 1 , X 2 ,..., X m gözlem vektörleri verilip,
m
K = ∑ ( X i − µi )( X i − µi )′
i =1
oluşturulsun. ∑
matrisinin pozitif tanımlı olması şartıyla
K
matrisinin cij ,
i ≤ j = 1, 2,..., n gibi belirgin elemanlarının dağılımı

1
 1

det(k )( m − p −1) / 2  etr − ∑ −1 k 

m/2
 mp / 2  m 
 2

f K (kij , i ≤ j = 1, 2,..., p) =  2 Γ p   .[ det(∑)]
2



0
, diğer hallerde
m
şeklindeki olasılık yoğunluk fonksiyonu yardımıyla belirlenir. Bu ifadedeki Γ p  
2
simgesi “Çok Değişkenli Beta fonksiyonu” olarak da bilinen
m
Γp   = π
2
p ( p −1)
4
p
 m +1− k 

2

∏ Γ 
k =1
(4.18)
dir.
50
Tanım 4.3 α ∈ R p sıfırdan farklı sabit sayılardan oluşan bir vektör ve 4.17’de ifade
edilen C matrisi, C ~ Wp (m, ∑) ile bir Wishart matrisi olsun. Buna göre
χ m2 ~ χ (2mγ ) olmak üzere,
α ′Cα ile ((α ′ ∑ α ).χ m2 ) dağılımları birbirine eşittir (Tuncer 2002).
51
5. KARESEL FORMLAR
Bu kısımda karesel formların ne olduğu hakkında bilgi edineceğiz. Simetrik matrisli
karesel formlar çok değişkenli istatistik analizinde önemli yer tutar. Karesel formlar, p
boyutlu vektör uzayında küremsi, elipsimsi, v.b. geometrik kalıp oluştururlar. Sözü
edilen kalıplar, karesel formun “matris belliliği” adı verilen öz değerler kalıplarına
bağlıdır.
Tanım 5.1 f : R n → R bir fonksiyonda X : (nx1) boyutlu bir vektör ve A : (nxn)
boyutlu simetrik bir matris olsun. O zaman
n
n
f ( x) = X ′ AX = ∑∑ aij xi x j
(5.1)
i =1 j =1
şeklindeki forma karesel form denir. Burada
 x1 
x 
X =  2  ve X ′ = [ x1
M 
 
 xn 
 a11
a
21
A= 
 M

 an1
x2 L xn ] ve A matrisi de
a12 K a1n 
a22 K a2 n 
M
M
M 

an 2 K ann 
olmak üzere meydana gelen karesel form
= [ x1
x2
 a11
a
K xn ]  21
 M

 an1
a12
a22
M
an 2
K a1n   x1 
K a2 n   x2 
M
M  M 
 
K ann   xn 
= X ′ AX
şeklinde ifade edilebilir. Burada A simetrik bir matris olduğundan A′ = A ’dır.
52
Tanım 5.2 X ve Y (nx1) boyutunda iki vektör olsun. X ′Y iç çarpımı X ve Y
arasındaki bileşenlerinin çarpımının toplamıdır.
X .Y = x1 y1 + x2 y2 + ... + xn yn = [ x1
x2
 y1 
y 
K xn ]  2  = X ′Y
M 
 
 yn 
X = Y olduğunda
n
X ′ X = ∑ xi2
i =1
şeklinde meydana gelen karesel form bileşenlerinin karelerinin toplamıdır (Basilevsky
1994).
( nxn ) boyutlu bir A simetrik matrisi ile n değişkenli f ( x) = X ′ AX karesel form olsun.
A matrisini diagonal yapacak bir Q ortogonal matrisi vardır. Q′AQ = D eşitliğinde D
diagonal matristir. Karesel form içinde X = QY değişimi yaparak
X ′ AX = (QY )′ A(QY ) = Y ′Q′AQY = Y ′ DY
şeklinde karesel form oluşur. Eğer A’nın öz değerleri λ1 , λ2 ,..., λn ise (5.2)’de D
diagonal olacak şekilde Q seçebiliriz.
λ1 L 0 
D =  M O M 
 0 L λn 
(5.2)
Eğer y = [ y1 L yn ]′ ise yeni değişkenler
Y ′ DY = λ1 y12 + λ2 y22 + ... + λn yn2
karesel formu ile ifade edilir. Bu işleme diagonal bir karesel form denir (Poole 2003).
Teorem 5.1 Temel Eksen Teoremi. Her karesel form diagonal hale getirilebilir. ( nxn )
boyutlu simetrik bir A matrisi X ′ AX karesel formu ile incelenirse ve öyle bir
53
Q′AQ = D diagonal matrisi olacak şekilde bir Q ortogonal matrisi olursa, Y ′ DY
karesel formuna X = QY dönüşümü yapılıp X ′ AX karesel formu meydana gelir. A
matrisinin öz değerleri λ1 , λ2 ,..., λn ve y = [ y1 , y2 ,..., yn ]′ ise o zaman
X ′ AX = Y ′ DY = λ1 y12 + λ2 y22 + ... + λn yn2
karesel formu oluşur.
Tanım 5.3 f ( x) = X ′ AX şeklindeki bir karesel forma göre,
Bütün x için f ( x) ≥ 0 ise pozitif yarı tanımlıdır.
Bütün x ≠ 0 için f ( x) > 0 ise pozitif tanımlıdır.
5.1 Karesel Formların Dağılımı
Bu kısımda normal dağılıma sahip rasgele vektörlerin karesel formlarının olasılık
dağılımları incelenecektir.
X n×1 ~ N (0, Ι n ) olması durumunda,
X ′ X ~ χ (2n )
(5.3)
X n×1 ~ N (0, σ 2 Ι) olması durumunda da,
1
σ
2
X ′ X ~ χ (2n )
(5.4)
olduğunu biliyoruz.
Şimdi X n×1 ~ N (0, ∑) (rank ∑ = n) olmak üzere,
Q = X ′ ∑ −1 X
karesel formunun dağılımını bulmaya çalışalım. Q nun moment çıkaran fonksiyonu
(
′
M Q (t ) = E (etQ ) = E etX Σ
−1
X
)
54
∞
=
∞
∫ ... ∫
−∞
−∞
1
(
2π
) ( det Σ )
n
1/ 2
e
−
1− 2 t ′ −1
xΣ x
2
dx1...dxn = (1 − 2t ) − n / 2 , t < 1/2
olduğundan,
Q ~ χ (2n )
(5.5)
dır.
Bundan sonra X in dağılımı sırasıyla X ∼ N (0, Ι n ) ve X ∼ N (0, ∑) olması durumunda
X ′ AX gibi bir karesel formun merkezsel olmayan ki-kare dağılımına sahip olması için
A reel simetrik matrisinin sağlaması gereken özellikler elde edilecektir.
X ~ N ( µ , ∑) olması durumunda ise,
X ′ AX
gibi bir karesel formun merkezsel
olmayan ki-kare dağılımına sahiptir.
Teorem 5.2 X ∼ N (0, Ι n ) ve Anxn reel simetrik rankı r olan bir matris olmak üzere,
X ′ AX ~ χ (2r ) ⇔ A2 = A dır.
İspat 5.2 X ~ N (0, Ι n ) ve A reel simetrik bir matris olmak üzere
Q = X ′ AX
karesel formunu göz önüne alalım. Bu karesel formun moment çıkaran fonksiyonu,
(
′
)
M Q (t ) = E etX AX =
∞
∞
1
− x′ ( I − 2 tA ) x
1
−1/ 2
2
e
dx1dx2 ...dxn = [ det( I − 2tA)]
, t <h
n
(
2
π
)
−∞
∫ ... ∫
−∞
dır. Burada h sayısı, I-2tA matrisi pozitif tanımlı olacak şekilde sayıdır. A reel simetrik
bir matris olmak üzere, P ortogonal matrisi vardır, öyle ki
λ1 0 ... 0 
0 λ 0 0 
2

P′AP = 
M M
M


 0 0 ... λn 
ve
det ( I − 2tA) = det ( P′( I − 2tA) P ) = (1 − 2t λ1 ) (1 − 2t λ2 ) … (1 − 2t λn )
55
dır. Rank(A) = r olsun. 0 < r ≤ n olmak üzere A matrisinin öz değerlerinden r tanesi
sıfırdan farklıdır, bunlar λ1 , λ2 ,..., λr olsun. O zaman,
M Q (t ) = [ (1 − 2t λ1 ) (1 − 2t λ2 ) … (1 − 2t λr ]
−1/ 2
dır. Q = X ′ AX karesel formunun dağılımı ki-kare olması için moment çıkaran
fonksiyonunun (1 − 2t ) − k / 2 biçiminde olması gerekir.
İlk önce Q = X ′ AX ~ χ (2k ) olduğunu varsayalım. Bu durumda,
[(1 − 2tλ1 )
(1 − 2t λ2 ) … (1 − 2t λr ) ]
−1/ 2
= (1 − 2t λ )− k / 2
olacaktır. Polinomların özdeş olması için r = k ve λ1 = λ2 = ... = λr = 1 olması gerekir.
Diğer öz değerlerin de sıfır olduğu göz önüne alınırsa A matrisi idempotent bir matris
olmalıdır.
Diğer taraftan X ∼ N (0, Ι n ) ve reel simetrik A matrisi için rank(A) = r, A2 = A , yani
idempotent ise,
M Q (t ) = (1 − 2t ) − r / 2
ve
Q = X ′ AX ~ χ (2r )
(5.6)
olacaktır (Akdeniz ve Öztürk 1996).
Teorem 5.3 (Cochran Teoremi) X ~ N ( µ , σ 2 Ι n ) dağılsın. A1 , A2 ,..., Ak matrisleri
simetrik, sırasıyla n1 , n2 ,..., nk ranklı ve A1 + A2 + ... + Ak = I n , yani
X ′ X = X ′ A1 X + X ′ A2 X + ... + X ′ Ak X
k
olsun. Eğer
∑n
i
= n ise,
i=1
X ′ A1 X , X ′ A2 X ,..., X ′ Ak X karesel formları bağımsız ve i = 1,2,...,n için,
1
σ
2
X ′ Ai X ~ χ 2
1

 ni , λi = 2 µ ′ Ai µ 
2σ


56
dır. Cochran Teoremi karesel formların parçalanmasında çok kullanışlı bir teoremdir.
k
Bu teoremdeki
∑n
i
= n olması şartı, Ai Aj = 0 , i≠j, i,j =1,2,...,n ya da Ai2 = Ai ,
i =1
i =1,2,...,n
olması şartlarına denktir.
Örnek 5.1 X nx1 ~ N (0, σ 2 I ) olsun. X vektörünün X 1 , X 2 ,..., X n bileşenlerine
N (0, σ 2 ) dağılımından alınmış n birimlik bir örneklem olarak bakabiliriz.
1
1
Jn = 
M

1
1 L 1
1 L 1
, rank ( J n ) = n
M L M

1 L 1 n×n
ve
1/ n 1/ n L 1/ n 
1/ n 1/ n L 1/ n 
1

A = Jn = 
 M
M L M 
N


1/ n 1/ n L 1/ n 
olmak üzere,
nX
 1 
Q = X ′  2 A X = 2
σ
σ

2
karesel formunu göz önüne alalım. rank(A) =1 ve
nX
σ2
2
2
~ χ (1)
(5.7)
dır. Ayrıca A matrisi simetrik ve idempotent olduğundan bir dik izdüşüm matrisidir.
Gerçekte,
1
1
1
+
1n =   , 1n = [1,1,...,1]
M 
n

1
+
A = 1n .1n
57
olmak üzere, A matrisi R n deki vektörleri 1n vektörünün gerdiği [ 1n ] alt uzayı üzerine
dik izdüşümü,
1/ n 1/ n L 1/ n   X 1   X 
1/ n 1/ n L 1/ n   X   
  2  =  X  = X 1n
Xˆ = AX = 
 M
M L M  M   M 

   
1/ n 1/ n L 1/ n   X n   X 
Xˆ
2
2
= Xˆ ′ Xˆ = X ′ AX = n X
X̂ ile X − Xˆ vektörleri birbirine dik olduğundan,
X
2
= Xˆ
n
2
+ X − Xˆ
2
n
∑ X i2 = n X + ∑ ( X i − X )2
2
i =1
i =1
dır.
X
2
n
= ∑ X i2 = X ′ X de bir karesel formdur. Bu karesel formun matrisi, I birim
i =1
matrisidir. Bu karesel form ile ilgili,
 1
X′ 2
σ

I  X ~ χ (2n )

olduğu biliniyor.
n
∑(X
i
− X ) 2 de X ’in bir karesel formudur. Bu karesel formun matrisi,
i =1
B = In −
1
Jn
n
olmak üzere, bu matris simetrik, idempotent ve [1n ] alt uzayı üzerine dik izdüşüm
⊥
matrisidir.
n
1 

X ′ BX = X ′  I − J n  X = ∑ ( X i − X ) 2
n 

i =1
B matrisi ile X ’in varyans kovaryans matrisi olan σ 2 I matrisinin çarpımı olan matrisi
idempotent yapmak için B yerine
1
σ2
B yazılmasıyla,
58
 1 
X ′  2 B  X ~ χ (2r )
σ

(5.8)
yazılır. Buradaki r serbestlik derecesi B matrisinin rankı olmak üzere aynı zamanda B
matrisinin sütun vektörlerinin gerdiği [1n ] alt uzayının boyutudur.
⊥
B matrisi idempotent olduğundan,
1
1
rank ( B) = tr ( B) = tr ( I n ) − tr ( J n ) = n − n = n − 1
n
n
ve buna göre,
n
1 
1 
X ′ 2  In − Jn  X =
σ 
n 
∑(X
i
− X )2
~ χ (2n −1)
i =1
σ
2
(5.9)
dır (Akdeniz ve Öztürk 1996).
Örnek 5.2 Y ~ N (0, σ 2 I ) olsun. X n×r , rank(X) = r olmak üzere,
Q=
Y ′Y
σ2
, Q1 =
Y ′ X ( X ′X ) −1 X ′Y
σ2
, Q2 =
Y ′ ( I − X ( X ′X )−1 X ′)Y
σ2
karesel formların dağılımları,
 1
Q = Y′  2
σ

I  Y ~ χ (2n )

X ( X ′X )−1 X ′ idempotent, rank( X ( X ′X )−1 X ′ )=tr( X ′X ( X ′X )−1 )= tr ( I r ) = r olduğundan
 X ( X ′X ) −1 X ′ 
2
′
Q1 = Y 
 Y ~ χ(r )
2
σ


−1
ve I − X ( X ′X ) X ′ idempotent, rank ( I − X ( X ′X ) −1 X ′) = n − r olduğundan
 1

Q2 = Y ′  2 ( I − X ( X ′X )−1 X ′ )  Y ~ χ (2n − r )
σ

dır. Ayrıca,
X ( X ′X ) −1 X ′( I − X ( X ′X )−1 X ′) = 0
olduğundan Q1 ve Q2 karesel formları bağımsızdır.
Q1 n − r
~ F( r ,n − r )
Q2 r
dır.
(5.10)
59
Bir deney düzenlenirken bazı kitle değerlerinin tahmini veya bir hipotezin testi
düşünülür. Varyans Analizi kitlelerin ortalamaları hakkında sonuç çıkaran istatistiksel
işlemdir. Varyans Analizinin tek yönlü, iki yönlü ve çok yönlü olması faktör sayısına
bağlıdır. Bu durum bir lineer modeldir. Esas olarak, rasgele değişkenlerin dağılımında
dikkate alınan varsayımlar bağımsızlık, normallik ve eşit varyanslılıktır.
Esas analiz tekniği, kareler toplamının parçalanması ve test istatistiğidir. Test istatistiği
iki örneklem varyansının birbirine oranıdır yani F testidir (Chaing 2003).
5.2 Faktör, Faktör Düzeyleri ve İşlemler
Varyans Analizi modeli de kendine has bir terminolojiye sahiptir. Varyans Analizi
modelinin iyi anlaşılabilmesi için bu terminoloji geliştirilmelidir. Bu terminoloji faktör,
faktör düzeyi ve işlemden ibarettir.
Rasgele değişkeni etkileyen değişkenlere faktör, faktör elemanlarına ise faktör düzeyi
denilmektedir. İşlem, bir deneyde faktör düzeylerinin bileşenleridir (Sincich 1996).
5.3 Tek Yönlü Varyans Analizi ve Lineer Model (Tam Ranklı Olmayan Model)
Tek yönlü varyans analizinde rasgele değişkenler bir faktörün sınıflandırılması ile
tanımlanır. Örneğin k tür kanser tedavisinin etkinliği araştırıldığında, rasgele değişken
kanser hastalarının yaşam süresidir, faktör ise tedavi türüdür. Yaşam sürelerine, k
tedavi türü kitlelere bölünür. Yani k rasgele değişkenler Yi , (Y1 , Y2 ,..., Yk ) her bir tedavi
türüdür.
Y = Xβ +ε
(5.11)
modelini inceleyelim.
Y : (nx1) boyutlu gözlem vektörü.
β : ( px1) boyutlu parametre vektörü.
X : (nxp) boyutlu tasarım matrisi (0 ve 1 değerlerini alır).
60
ε : (nx1) boyutlu hata terimleri vektörü.
Öncelikle ε ‘yi inceleyeceğiz.
ε = Y − E (Y )
(5.12)
E (ε ) = 0
(5.13)
E (Y ) = X β
(5.14)
şeklinde beklenen değere ulaşılır.
ε ‘lerin varyansı eşittir ve σ 2 ‘dir. Yani
V (ε ) = E (εε ′ ) = σ 2 Ι n
(5.15)
Böylece,
ε ~ N (0, σ 2Ι) ve Y ~ N ( X β , σ 2Ι)
ile normal dağılır.
(5.11) modeli En Küçük Kareler ile tanımlanabilir.
X ′ X βˆ = X ′Y
(5.16)
yij = µ + α i + ε ij , j = 1, 2,..., ni i = 1, 2,..., k
(5.17)
Tek yönlü varyans analizinin lineer modelini incelersek,
µ : Kitle ortalaması
α i : i’nci faktörün etkisi
ε ij : Hata terimi
yij : Gözlem değerleri
yij rasgele değişkenleri bağımsız dağılmış olup, beklenen değeri
E ( yij ) = µ + α i , j = 1, 2,..., ni , i = 1, 2,..., k
(5.18)
ve σ e2 sabit varyanslı normal dağılmıştır. Sonuç olarak her bir hata terimi ε ij ise bu hata
terimleri E (ε ij ) = 0 beklenen değerli ve σ e2 varyanslı normal dağılıma sahiptir.
ε ~ N (0, σ e2 )
(5.19)
şeklinde ifade edilebilir.
(5.11)’de ifade edilen Y = X β + ε modeli yeniden incelenirse aşağıdaki şekilde ifade
edilebilir.
61
 y11  1
y  
 12  1
 M  M
 =
 M  M
 M  M
  
 yij  1
ε11 
1 0 L L
µ   

1 0 L 0   ε12 
 α1
0 1 0 M    M 
 α 2  +  
M M 1 M    M 
M
M 0 M M    M 
 α   
0 0 0 1   i   ε ij 
(5.20)
Yine burada,
Y : Gözlem vektörü.
β : Parametre vektörü.
X : Tasarım matrisi (0 ve 1 değerlerini alır).
ε : Hata terimleri vektörü.
β ′ = [ µ α1 α 2 K α i ]
dir. Bunları çizelgede gösterebiliriz (Searle 1997).
Çizelge 5.1 Y = X β + ε modelinin parametreleri
Parametreler
Gözlemler
µ
α1
α2
α3
K
αi
y11
1
1
0
0
M
0
y12
1
1
0
M
M
0
M
M
0
1
M
M
M
M
M.
M
M
M
M
M
M
M
M
0
1
M
M
yij
1
M
M
M
M
1
Çizelge 5.1’de, α1 , α 2 , …, α i sütunlarının toplamı, (5.20) denkleminden açıkça
görüldüğü gibi µ sütun değerine eşittir. (5.16)’da ifade edilen denklemde X ′X karesel
form ve simetriktir, elemanları X ’in bileşenlerinin kareleri toplamıdır. Normal
denklemlere
X ′Y ’de dahildir, elemanları Y
çarpımlarıdır.
62
vektörü ile X ’in sütunlarının iç
n
n
 1
X ′X =  n2

M
 ni
n2 L ni 
M M 0 
0 n2 M 0 

M M O M
0 L L ni 
n1
n1
1 1 L
1 1 0

X ′Y = 0 L 1

M M M
0 L L
(5.21)
L L 1  Y11  Y11 + Y12 + ... + Yij  Y 
  
  
L L 0  Y12   Y11 + ... + Y1 j  Y1 

L 0 M   M  =  Y21 + ... + Y2 j  = Y2 
  
  
1 M M M  
 M 
M
 Y 
L 1 1   Yij  
Yij

  i 
(5.22)
(5.21)’de ifade edilen denklemde matrisin rankı ve parametre sayısı farklı olduğundan
(5.16)’daki normal denklemler
βˆ = ( X ′X ) −1 X ′Y
ile çözülemez. Bu denklemi
çözebilmek için matrislerin genelleştirilmiş inversinden yararlanarak
X ′X β 0 = X ′Y
(5.23)
normal denklemini yazarız.
β 0 parametresini bulmaya çalışacağız. X ′X ifadesinin rankı parametre sayısına eşit
olduğunda denklem çözülür. (5.23) denklemi GX ′Y yardımıyla çözülebilir. Burada G
X ′X matrisinin genelleştirilmiş inversidir (tersidir) ve
X ′XGX ′X = X ′X
(5.24)
şeklinde tanımlanır.
(5.21) ve (5.22)’ den oluşan normal denklemler
n
n
 1
 n2

M
 ni
n1
n1
0
M
0
n2 L ni   µ  Y 
 0  
M M 0  α1  Y1 
n2 M 0  α 20  = Y2 
   
M O M   M  M 
 
L L ni  α i0  Yij 
 
0
şeklinde olur.
X ′X rankı parametre sayısına eşit olmadığı için X ′X ’in tersi yoktur ve (5.13)
ifadesinin çözümü yoktur. Yani tam ranklı olamayan modeldir. X ′X ’in genelleştirilmiş
inversi bulunarak
β 0 = GX ′Y
(5.25)
63
denklemi çözülür. Bu durum aşağıdaki teoremde daha kolay görülebilir.
Teorem. 5.4 A’nın bütün genelleştirilmiş inversi için, AX = Y denkleminden oluşan
bütün çözümler X = GY ’dir. (5.25) denkleminde β 0 notasyonu, (5.23) denkleminde
çözümü ile tanımlanmış denklem için bir çözümdür.
Yani,
µ 0   0 
 0  
α1   y1. 
0
β = α 20  =  y 2. 
M  M 
 0  
α a   y a . 
(5.26)
i = 1, 2,..., a için normal denklemlerin çözümü µ 0 = 0 ve α i0 = y i . dir.
X ′X ‘in genelleştirilmiş inversi G ise
0 
0
G=

 0 D {1/ ni }
(5.27)
dir. Burada D {1/ ni } ifadesi i = 1, 2,..., a için diagonal matristir.
5.4 Hata Terimleri Kareler Toplamı
Hata terimleri kareler toplamına Gruplar içi Kareler Toplamı da denilmektedir. Gruplar
içi Kareler Toplamı çalışma yapılan her bir grubun gözlem değerlerinin o gruba ait
örneklem ortalamasından olan sapmalarının kareleri toplamı olarak ifade edilir. Kısaca
HTKT veya GİKT ile gösterilir.
GİKT = ( y − X β 0 )′( y − X β 0 ) = Y ′ (Ι − XGX ′)′(Ι − XGX ′)Y
= Y ′ (Ι − XGX ′)Y
olarak hesaplanır. Çünkü Ι − XGX ′ idempotent ve simetriktir. Buradan da
GİKT = Y ′ (Ι − XGX ′)Y = Y ′Y − Y ′ XGX ′Y
64
= Y ′Y − β 0′ X ′Y
(5.28)
sonucuna ulaşılır (Searle 1997).
Aynı ifade aşağıdaki gibi de hesaplanır.
ni
k
GİKT = ∑∑ ( yij − y i ) 2
(5.29)
i =1 j =1
dir (Chaing 2003).
5.5 Toplam (Genel) Kareler Toplamının Parçalara Ayrılması
Genel Kareler Toplamı iki bileşenden oluşmaktadır. Bunlar Gruplar Arası Kareler
Toplamı ve Gruplar İçi Kareler Toplamıdır. GKT ile gösterilir.
k
ni
k
∑∑ ( y
ij
i =1 j =1
ni
k
ni
− y ) = ∑∑ ( yij − y i ) + ∑∑ ( y i − y ) 2
2
i =1 j =1
2
(5.30)
i =1 j =1
olarak ifade edilir. Buradan
n
GKT = ∑ yi2 − n y
2
i =1
(Chaing 2003). Yani
GKT = Y ′Y − n y
2
(5.31)
olarak hesaplanır (Searle 1997).
Gruplar Arası Kareler Toplamı ise Genel Kareler Toplamından Gruplar İçi Kareler
Toplamının farkıdır. GAKT ile gösterilir. Gruplar Arası Kareler Toplamı, örneklem
ortalamalarının genel ortalamadan olan farklarının kareleri toplamının örneklem hacmi
ile çarpımlarının toplamını vermektedir. (5.30) ifadesi kısaca
GKT = GİKT + GAKT
olarak da belirtilebilir. O halde Gruplar Arası Kareler Toplamı ise
GAKT = GKT – GİKT
(5.32)
olarak hesaplanır. (5.28)’de ve (5.31)’de bulunan değerleri (5.32)’de yerine koyarak
GAKT = (Y ′Y − n y ) − (Y ′Y − β 0′ X ′Y ) = β 0′ X ′Y − n y
2
şeklinde hesaplanır (Searle 1997). Aynı sonuç
65
2
(5.33)
k
ni
k
GAKT = ∑∑ ( y i − y ) 2 = ∑ ni ( y i − y ) 2
i =1 j =1
(5.34)
i =1
olarak da hesaplanır (Chaing 2003).
5.6 Dağılım Özellikleri
Hata terimleri normal, ortalaması sıfır ve eşit varyanslıdır.
ε ~ N (0, σ 2Ι n )
şeklinde ifade edilir.
a) Y rasgele vektörü normaldir.
Y = Xβ +ε
E (Y ) = X β
Y ~ N ( X β , σ 2Ι)
b) β 0 parametresi normal dağılır.
β 0 , Y ’nin lineer fonksiyonu olduğundan normal dağılır.
β 0 = GX ′Y ~ N ( H β , GX ′XG′σ 2 )
c) β 0 ve σˆ 2 bağımsızdır.
β 0 = GX ′Y ve GİKT = Y ′ ( I − XGX ′)Y
GX ′Ισ 2 (Ι − XGX ′) = G ( X ′ − X ′XGX ′)σ 2 = 0
olduğu için bağımsız oldukları ortaya çıkar.
d) GİKT / σ 2 ~ χ 2 ’ dir.
GİKT
σ2
GİKT
σ2
GİKT
σ2
=
Y ′ (Ι − XGX ′)Y
σ2
=
Ισ 2 (Ι − XGX ′)
σ2
= Ι − XGX ′
~ χ 2  k (Ι − XGX ′), β ′ X ′(Ι − XGX ′) X β / 2σ 2 


~ χ (2n − k )
(5.35)
66
Hata terimleri (gruplar içi) kareler toplamının varyansa oranı (n-k) serbestlik dereceli
ki-kare dağılır. XGX ′ in özelliklerinden dolayı r ( x) = k dır.
e)
GAKT
σ
GAKT
σ
~ χ 2 dır.
2
2
 
JJ ′  ′ 
JJ ′ 
2
~ χ 2  k  XGX ′ −
 , β X ′  XGX ′ −
 X β / 2σ 
n 
n 

 


 JJ ′ 
2
~ χ 2  k − 1, β ′ X ′  Ι −
 X β / 2σ 
n 



(5.36)
dir (Searle 1997).
Çizelge 5.2 Y = X β + ε modeline uygun varyans analizi çizelgesi
Varyasyon
S. d.
Kareler Toplamı
Kareler
kaynağı
F İstatistiği
Ortalaması
Model
k-1
GAKT = β 0′ X ′Y − n y
(Gruplar arası)
k
=
∑n (y
i
2
GAKO =
GAKT
k −1
− y )2
i
i =1
Gruplar içi
n-k
GİKT = Y ′Y − β 0′ X ′Y
k
=
ni
∑∑ ( y
ij
F=
GİKO =
GİKT
n−k
GAKO
GİKO
− yi )2
i =1 j =1
Genel Kareler n-1
GKT = Y ′Y − n y
Toplamı
n
=
∑y
2
i
2
− ny
2
i =1
Çizelgede GAKO ifadesi Gruplar Arası Kareler Ortalamasıdır. Gruplar Arası Kareler
Toplamının k − 1 serbestlik derecesine bölümüdür ve
GAKO =
GAKT
k −1
(5.37)
şeklinde ifade edilir.
GİKO ifadesi ise Gruplar İçi Kareler Ortalamasıdır. Gruplar İçi Kareler Toplamının
n − k serbestlik derecesine bölümüdür ve
67
GİKO =
GİKT
n−k
(5.38)
şeklinde ifade edilir.
F istatistiği çizelgede görüldüğü gibi Gruplar Arası Kareler Ortalaması (5.37)’de ifade
edilen GAKO ’ nın, (5.38)’de ifade edilen Gruplar İçi Kareler Ortalamasına GİKO ’na
oranıdır ve aşağıdaki gibi ifade edilir (Searle 1997).
F=
GAKT /(k − 1) GAKO
=
~ F( k −1,n − k )
GİKT /(n − k ) GİKO
(5.39)
Bu işlemlerden sonra hipotez testi yapılır. Kitle ortalamaları arasında istatistiksel olarak
anlamlı farklılığın olup olmadığının test edilmesi gerekir. Önce hipotezler kurulur.
H 0 : µ1 = µ2 = ... = µk
H1 : En az iki kitle ortalaması farklıdır.
Hipotezler belirlendikten sonra test istatistiği hesaplanır ve ret bölgesi belirlenir.
Test istatistiği: (5.39)’da belirtildiği gibi F =
GAKO
GİKO
Ret bölgesi: F > Fα
Fα : α =0,05 veya α =0,01 anlam düzeyinde ve (k-1) ile (n-k) serbestlik derecelerine
göre F tablo değeridir.
F > Fα ise H 0 reddedilir. Bu durumda kitle ortalamalar
arasında istatistiksel olarak anlamlı farklılık olduğuna karar verilir. Ancak bu farklılığın
hangi kitle ortalamaları arasındaki farktan kaynaklandığı araştırılmak istenebilir. Bunun
için çoklu karşılaştırma testleri yapılır. Eğer H 0 kabul edilmiş olursa kitle ortalamaları
arasında anlamlı farklılık olmadığından çoklu karşılaştırma testleri yapılmasına gerek
kalmaz.
F testi yapılması için aşağıdaki varsayımların sağlanması gerekir. Bunlar:
1) Bütün kitlelerin olasılık dağılımı normaldir.
2) Kitlelerin varyansı eşittir.
3) Her bir kitleden rasgele alınan örneklemler bağımsızdır (Sincich 1996).
68
5.7 Çoklu Karşılaştırmalar
Daha önce de belirttiğimiz gibi F testi sonucunda H 0 reddedilirse yani kitle ortalamaları
arasındaki farkın anlamlı olduğu sonucuna varıldığında, bu farklılığın hangi gruplardan
ileri geldiğini belirlemek için çoklu karşılaştırmalar yapılmasına ihtiyaç duyulmaktadır.
Bunlar Fisher, Duncan, Tukey, Hartley, Student-Newman-Keuls ve Dunnett Testleridir.
En çok kullanılan yöntemler şunlardır:
1. Student Newman-Keuls Testi.
2. Duncan Testi
3. Scheffe Testi.
5.7.1 Student Newman-Keuls Testi
Varyans Analizinde gruplar arasındaki anlamlı farklılığın hangi gruplar arasındaki
ortalama farklarından olduğunu belirtmeye yarayan testlerden biri de Student NewmanKeuls Testidir.
Farz edelim ki k adet grup arasındaki farklılığı test edelim. Testi gerçekleştirmek için şu
adımlar izlenmelidir.
1) K ( p ) = q (α , p, n − k ) GİKO / ni
(5.40)
formülü ile hesaplanması söz konusu olan kriter belirlenmiş olur. Burada
α : 0,05 veya 0,01 olarak ele alacağımız anlam seviyesi
p: 2,3,…,k örneklem grubu sayıları
k: Grup sayısı
n: Bütün gözlemlerin mevcudu.
GİKO : Gruplar içi kareler ortalaması (5.38)’de ifade edilmiştir).
ni : İlgili gruba ait örneklem sayısı
69
Örneğin faktör sayısı 4 ise ilgilenilecek ortalamaların sayısı sırayla p = 2,3 ve 4
olacaktır. Bu bilgilere dayanarak q tablo değerlerini ve (5.40) ifadesini hesaplayarak
karşılaştırma yapılacak ölçütü belirlemiş oluruz. p = 2,3,4 ve α = 0, 05 olarak belirlenen
(5.40)’daki ifadeyi
K (2) = q (0, 05, 2, n − k ) GİKO / ni
K (3) = q (0, 05, 3, n − k ) GİKO / ni
K (4) = q (0, 05, 4, n − k ) GİKO / ni
şeklinde hesaplarız.
2) Gruplarının örneklem ortalamaları küçükten büyüğe sıralanır.
3) Farklar aşağıda belirtilen sıraya göre test edilir.
En büyük ve en küçük ortalama arasındaki fark
En büyük ve ikinci en küçük ortalama arasındaki fark
M
İkinci en büyük ve en küçük ortalama arasındaki fark
İkinci en büyük ve ikinci en küçük ortalama arasındaki fark
M
İkinci en küçük ile en küçük ortalama arasındaki fark alınır.
Belirlenen farkların anlamlılığını karşılaştırmak için en büyük ortalama ile en küçük
ortalama arasındaki aralık olan çalışmamızda söz konusu olan dört ortalamayı
kapsadığına göre, istatistiksel olarak anlamlı olması için “en küçük anlamlı aralık”
değerinden büyük olması gerekir. İkinci en büyük ile en küçük ortalama arasındaki
aralık üç ortalamayı kapsamaktadır; bunun da anlamlı olması için ikinci en büyük
değerden büyük olması gerekir. İkili olarak karşılaştırılan örneklem ortalamaları
arasındaki fark K(2), K(3) ve K(4) gibi değerlerden büyük olursa ilgili grupların
örneklem ortalamaları hakkında anlamlı farklar olduğu sonucu ortaya çıkar (Carmer and
Swanson 1973).
70
5.7.2 Duncan Testi
Duncan Testi, Newman-Keuls testine oldukça benzemektedir. Testin sonuçlanmasında
izlenen adımlar Newman-Keuls testi ile hemen hemen aynıdır. Sadece tablo değeri
farklıdır. Bu testi yapmak için şu aşamalar izlenir:
1) R( p) = r (α , p, n − k ) GİKO / ni
(5.41)
değeri hesaplanır.
Duncan testi için göz önünde tutulacak ortalama sayısına eşit serbestlik dereceleri için
anlamlı aralıklar belirlenir. Yaptığımız çalışmada grup sayısı 4 ise karşılaştırmada ele
alınacak ortalamaların sayısı sırasıyla 2,3 ve 4 olacaktır. Bu 3 tane ortalama sayısı için
belirlenen anlam düzeyinde anlamlı aralık değerleri belirlenir. Belirlenen değerlere göre
(5.41) eşitliği hesaplanır. α = 0, 05 ve p = 2,3 ve 4 için hesaplanacak ölçüt ise,
(5.41)’deki formül yardımıyla aşağıdaki gibi yapılabilir.
R(2) = r (0, 05, 2, n − k ) GİKO / ni
R(3) = r (0, 05, 3, n − k ) GİKO / ni
R(4) = r (0, 05, 4, n − k ) GİKO / ni
2) Örneklem gruplarının ortalamaları küçükten büyüğe sıralanır.
3) Farklar Newman-Keuls testinde yapılan işleme benzer şekilde alınır.
Sonuç olarak ortalamalar arası fark ilgili gruplar için hesaplanan (5.41) değerinden
büyük ise bu farklılığın hangi örneklem ortalamaları arasında olduğu belirlenir (Carmer
and Swanson 1973).
5.7.3 Scheffe Testi
Scheffe testi, örneklem hacimlerinin farklı olduğu durumda oldukça kullanışlıdır. Bu
testte bütün faktörlerin örneklem ortalamaları farkı ikişerli olarak hesaplanarak F testi
belirlenir. Belirlenen F test istatistiği daha önce bulunan F testindeki α = 0,05 değeri ve
(k-1) ve (n-k) serbestlik derecesine göre bulunan F tablo değeri ile karşılaştırılır.
71
Karşılaştırmalar sonucunda elde edilen bulgulara göre anlamlı farklılığın hangi faktörler
arasında olduğu tespit edilir. Bu test istatistikleri aşağıdaki şekilde ifade edilir.
Fij =
( yi − y j )2
(5.42)
1 1
GİKO  +  (k − 1)
n n 
j 
 i
şeklinde hesaplanır. Burada
GİKO : (5.38)’de hesaplanan Gruplar İçi Kareler Ortalaması değeri
k : Grup sayısı
y i : Örneklem ortalamaları
ni : İlgili gruba ait örneklem hacmini ifade etmektedir.
Hesaplanan bu farkları daha önce bulunan kritik F tablo değerine göre karşılaştırırız. Bu
farklar ilgili anlam düzeyi ve serbestlik dereceleri ile belirlenen F tablo değerinden
büyükse ilgili grupların örneklem ortalamaları arasında bir farklılık vardır. Aksi halde
böyle bir farklılıktan bahsedilemez (Harris 1998).
72
6. UYGULAMA
2004-2005 öğretim yılı Bahar Dönemi Lisansüstü sınavına müracaat eden ve
19.12.2004 tarihinde Ankara Üniversitesi Türkçe ve Yabancı Dil Araştırma ve
Uygulama Merkezi (TÖMER) tarafından yapılan Ankara Üniversitesi Lisansüstü
(Yüksek Lisans-Doktora) Yabancı Dil sınavına giren öğrencilerin sınavdan aldıkları
başarı puanları arasındaki istatistiksel olarak anlamlı fark olup olmadığı incelenmek
istenmiştir. Sınava giren yabancı dili İngilizce olan 1029 öğrenciden 380 tanesi rasgele
seçilmiş olup bunlar arasından Fen Bilimleri, Sağlık Bilimleri, Sosyal Bilimler ve
Eğitim Bilimleri Enstitüsüne ait 95’er öğrencinin (toplam 380 öğrenci) sınav notu
incelenmiştir. Öğrencilerin başarı notları arasında anlamlı bir fark olup olmadığını
α = 0, 05 anlamlılık düzeyine göre inceleyeceğiz. Farklılık varsa bu farklılığın hangi
enstitü öğrencileri arasında olduğunu çoklu karşılaştırmalar testlerinden herhangi birini
uygulayarak belirleyeceğiz. Bu öğrencilerin yabancı dil sınavından aldıkları puanlar
çizelge 6.1’de gösterilmiştir.
Böyle bir problem Tek Yönlü ANOVA’ (Tek Yönlü Varyans Analizi) dır. ANOVA, F
dağılımına göre yapılır. F dağılımı karesel formlar yardımıyla oluşturulur. Başka bir
değişle bağımsız iki tane ki-kare dağılımının birbirlerine oranı F dağılımını oluşturur.
Bu amaçla pratikte en çok kullanılan testlerden biri de Varyans Analizidir. Yaptığımız
çalışmada 4 gruptaki (Fen, Sosyal, Sağlık ve Eğitim Bilimleri Enstitüsü) öğrencilerin
sınavdaki başarı notları incelenmiş her gruptan rasgele 95’er öğrenci seçilmiş, bu
öğrencilerin başarı notları arasında anlamlı bir farklılık olup olmadığı test edilecektir.
Aslında her gruptan 30’ar öğrenci alarak da araştırma yapılabilirdi. Ancak biz burada
daha açıklayıcı olması açısından ve daha fazla veri seçmeye elverişli olduğumuzdan
dolayı her enstitü için 95’er öğrenci seçmeyi uygun bulduk. Bunun için önce hipotezler
kurulacaktır. Kurulan hipotezler çözüm kısmında ayrıntılı biçimde ele alınacaktır.
Hesaplanan GİKT (5.28) ve GAKT (5.33) birer karesel formdur. Bu karesel formlar
(5.35) ve (5.36)’da belirtildiği gibi ki-kare dağılıma sahiptir. (5.37)’nin (5.38)’e oranı
(5.39)’da belirtildiği gibi F dağılımını oluşturur. Buna göre hipotez testi yapılır ve
gerekli işlemlerden sonra F test istatistiği hesaplanır. Elde edilen F test değeri ilgili
anlam seviyesi ve serbestlik derecelerine göre F tablo değeri ile karşılaştırılır. F test
73
istatistiği tablo değerinden büyükse H 0 hipotezi reddedilir. Öğrencilerin ortalamaları
arasında anlamlı bir farklılık olduğu ortaya çıkar. Test sonucunda 4 gruptaki
öğrencilerin başarı notları arasında anlamlı farklılık bulunmazsa çoklu karşılaştırmalar
testi yapmaya gerek yoktur. Ancak söz konusu gruplardaki öğrencilerin başarı notları
arasında anlamlı bir fark varsa bu farklılığın hangi gruplar arasında olduğunu tespit
etmek için çoklu karşılaştırmalar testleri yapılır. Biz bu karşılaştırma testlerinden birini
kullanarak farklılığın hangi enstitü öğrencileri arasında olduğunu belirleyeceğiz. Bu
farklılığın Fen Bilimleri ile Sosyal Bilimler arasında mı, Fen Bilimleri ile Sağlık
Bilimleri, Fen Bilimleri ile Eğitim Bilimleri arasında mı yoksa Sosyal Bilimler ile
Sağlık Bilimleri, Sosyal Bilimler ile Eğitim Bilimleri arasında mı veyahut Eğitim
Bilimleri ile Sağlık Bilimleri Enstitüsü öğrencilerinin başarı notları arasında olduğu
tespit edilecektir.
Karesel formlarla uygulama yapmak için normal dağılımla ilgili varsayımları da bilmek
gerekiyor. Bu varsayımlar 5.7. F Dağılımının Oluşturulması kısmında belirtilmiştir.
F dağılımında yani Varyans Analizi tablolarında hipotez testlerindeki test istatistiğini
oluşturan karesel formlar, bunların serbestlik dereceleri, beklenen değerleri gibi
sonuçlar toplu halde bulunmaktadır. Tablonun her satırı bir karesel form ile ilgilidir.
Her bir tabloda Y ′Y karesel formu ve σˆ 2 ile ilgili olan Y ′Y − βˆ ′ X ′Y karesel formu için
bir satır bulunmaktadır. Belli bir satırda karesel form ile ilgili bilgiler sütunlar halinde
verilmektedir. Varyans Analizi tablosunun ilk sütununda karesel formun ismi vardır.
İkinci sütununda kareler toplamları yani karesel formların kendileri, üçüncü sütunda
serbestlik dereceleri, dördüncü sütunda ortalama kareler toplamları ve son sütunda F
istatistiği yer almaktadır.
Uygulamayı karesel form yardımıyla yapmanın önemli avantajları vardır. Karesel
formlarla yapılan işlemler daha kolay ve anlaşılır olduğu için hata yapma olasılığı
hemen hemen yoktur. Ayrıca uzun hesaplamalar yapmayı gerektirmez. Bu durum
amacımıza daha kesin bir şekilde ulaşmamızı sağlar. Bu çalışmada karesel formlarla
yapılan çözümleme bu avantajlarından dolayı tercih edilir. Bu kolaylık araştırma yapan
istatistikçiler için önemli olduğu kadar, istatistikçiler dışındaki diğer okuyucular için de
ilgi konusu olabilir.
74
Çizelge 6.1 Ankara Üniversitesi Yüksek Lisans-Doktora sınavına müracaat eden
öğrencilerin yabancı dil sınavından aldıkları puanlar
Fen
Bilimleri
Enstitüsü
64
47
47
68
56
61
54
47
76
65
50
61
54
54
31
52
45
43
58
74
55
64
68
75
46
45
58
71
91
65
62
54
Sağlık
Bilimleri
Enstitüsü
67
55
80
63
74
87
33
46
85
35
72
62
53
51
71
60
73
59
91
57
54
66
40
41
69
84
83
37
70
50
53
42
Sosyal
Bilimler
Enstitüsü
69
35
75
63
52
82
78
49
45
79
78
62
40
50
87
80
58
46
34
68
85
81
41
62
65
56
49
53
57
46
79
49
Eğitim
Bilimleri
Enstitüsü
42
50
50
73
60
36
85
47
83
47
54
47
35
46
24
53
46
76
65
38
88
64
72
83
87
83
51
65
54
75
73
53
75
Çizelge 6.1 Ankara Üniversitesi Yüksek Lisans-Doktora sınavına müracaat eden
öğrencilerin yabancı dil sınavından aldıkları puanlar (devam)
Fen
Bilimleri
Enstitüsü
59
58
88
44
66
39
30
30
44
67
52
64
44
50
46
33
40
68
50
60
48
49
76
56
36
72
46
75
47
51
35
43
49
82
Sağlık
Bilimleri
Enstitüsü
73
48
59
74
55
51
25
46
79
72
78
76
57
62
39
31
66
54
68
64
73
76
69
61
55
75
45
72
47
40
81
35
74
76
Sosyal
Bilimler
Enstitüsü
60
61
48
64
57
66
54
91
59
63
38
69
76
72
72
90
89
37
74
84
81
84
65
49
67
38
80
80
30
72
44
72
83
65
Eğitim
Bilimleri
Enstitüsü
76
64
72
67
72
48
23
21
75
73
54
67
50
78
56
46
50
57
73
49
58
68
48
43
57
87
37
77
94
63
43
93
91
85
76
Çizelge 6.1 Ankara Üniversitesi Yüksek Lisans-Doktora sınavına müracaat eden
öğrencilerin yabancı dil sınavından aldıkları puanlar (devam)
Fen
Bilimleri
Enstitüsü
42
41
75
62
60
49
65
82
30
75
75
68
49
43
74
48
77
53
45
59
28
73
43
81
66
82
76
46
73
5398
56,82
Sağlık
Sosyal
Eğitim
Bilimleri
Bilimler
Bilimleri
Enstitüsü
Enstitüsü
Enstitüsü
47
48
70
56
46
74
79
76
60
56
42
55
28
61
70
63
51
61
50
56
78
52
65
37
50
54
43
59
78
65
51
87
63
55
38
63
55
87
61
70
54
47
74
59
24
47
90
78
64
81
54
37
60
39
50
84
44
57
44
64
45
57
64
74
69
53
72
58
51
72
49
69
94
74
58
69
77
42
74
35
53
79
70
77
50
64
36
Başarı Notları Toplamı
5748
6001
5673
Başarı Notları Ortalaması
60,51
63,17
59,72
77
Çözüm:
Sınava giren öğrencilerin yabancı dil sınavından elde ettikleri başarıları ölçmek için
hipotez testi yapmak gerekmektedir.
Önce hipotezleri kuralım ve varyans analizi tablosunu oluşturalım.
H 0 : µ1 = µ2 = µ3 = µ4 (4 Enstitü öğrencilerinin başarı ortalamaları aynıdır).
H1 : Kitle ortalamalarının en az ikisi farklıdır, ( µi ≠ µ j ) i, j = 1,2,3,4
(En az iki enstitü öğrencilerinin başarı ortalamaları farklıdır).
Burada;
µ1 = Fen Bilimleri Enstitüsü öğrencilerinin yabancı dil sınav başarı ortalaması
µ2 = Sağlık Bilimleri Enstitüsü öğrencilerinin yabancı dil sınav başarı ortalaması
µ3 = Sosyal Bilimler Enstitüsü öğrencilerinin yabancı dil sınav başarı ortalaması
µ4 = Eğitim Bilimleri Enstitüsü öğrencilerinin yabancı dil sınav başarı ortalaması
n1 = n2 = n3 = n4 = 95
n = n1 + n2 + n3 + n4 = 380 (Bütün gözlem sayısı)
k = 4 (Grup sayısı, yani Fen Bilimleri, Sağlık Bilimleri, Sosyal Bilimler ve Eğitim
Bilimleri Enstitüsü öğrencileri)
78
Çizelge 6.2 Yüksek Lisans ve Doktora sınavlarına giren öğrencilerin yabancı dil sınavı
başarı notlarının toplam ve ortalama değerleri
Enstitü
Fen Bilimleri
Sağlık Bilimleri
Başarı notları toplamı
n1
95
i =1
j =1
Eğitim Bilimleri
Genel Başarı
n1
y1 = ∑ y1 j =∑ y1 j = 5398
n2
y2 = ∑ y2 j =
j =1
Sosyal Bilimler
Başarı ortalaması
1j
y1 =
∑y
2j
= 5748
i =1
95
j =1
j =1
n4
95
i =1
j =1
y2 =
y4 = ∑ y4 j =∑ y4 j = 5673
nj
4
5398
= 56,821
95
i =1 j =1
i =1 j =1
∑y
=
5748
= 60,505
95
2j
j =1
n2
y3 =
y3 6001
=
= 63,168
n3
95
y4 =
y4 5673
=
= 59, 716
n4
95
k
95
Y = ∑ yi = ∑∑ yij = ∑∑ yij = 22820
i =1
n1
=
n2
y3 = ∑ y3 j = ∑ y3 j = 6001
k
j =1
95
n3
k
∑y
Y=
∑ ni y i
i =1
n
4
=
∑y
i
i =1
4
= 60,0526
Y = X β + ε modeline uygun olarak matrislerden yararlanarak çözmeye çalışalım. Bu
model aşağıda yeniden ele alınarak hesaplanacak ve istenen sonuca ulaşılacaktır.
Yaptığımız çalışmada ulaştığımız verilere göre,
 64 
 47 
 
M 
Y = 
M 
 77 
 
 36  (380 x1)
1
1

M

M
X =
M

M
1

1
1 0
M
M
0 1
M
M
M
0
M
M
M
M
0 0
L
M M 
M M

M M
1 M

M M
0 1

L M 
0
ε11 
µ 
ε 
α 
 12 
 1
M 
ε = 
β = α 2 
 
M 
M
 
 ε i1 
α i 
 
( i +1) x1
 ε ij 
olduğundan Y = X β + ε modeline uygun hale gelen işlemler aşağıda görülmektedir.
79
µ α1 α 2 α 3 α 4
1
1
 64 

 47 
M
 

M 
M
Y = 
= 

M
M 

 77 
M
 

 36  (380 x1) 1
1
1 0
M M
0 1
M
M
0
M
M
M
M
0 0
=
Y
M
L
M M 
M M

M M
1 M

M M
0 1

L M  380 x 5
0
µ
α 
 1
α 2  +
 
M 
α k 
5 x1
+ ε
β
X
ε11 
ε 
 12 
M 
 
M 
 ε i1 
 
 ε ij 
X: Tasarım matrisidir. Bu matrisin değerleri 0 ve 1 dir.
X tasarım matrisinin rankı 4’dür. Parametre sayısı da 5 dir. O zaman β̂ ’yı bulmak için
X ′Y = ( X ′X ) βˆ denklemlerinin çözümü genelleştirilmiş İnversler yardımıyla elde edilir.
Normal denklemleri tespit etmek için X ′ , X ′X ve X ′Y matrislerini oluşturalım.
1
1

X ′ = 0

M
 M
1 L L L L L 1
M 0 L L L L L
M 1 L 0 L L 0

M M L 1 L 0 L
M L L L L 1 L 5 x 380
elde edilir.
1
1

X ′X =  0

M
 M
1 L L
M
0
L
M
1
L
M
M
L
M L L
1
1
L L L 1
M
L L L L 
M
0 L L 0
 M
1 L 0 L 
M
L L 1 L 
1

1
1 0
M
M
0 1
M
M
M
0
M
M
M
M
0 0
şeklinde hesaplanır.
80
L
M M 
380 95 95 95 95
M M 
95 95 0 0 0 

M M 
=  95 0 95 0 0 
1 M 

  95 0 0 95 0 
M M
 95 0 0 0 95
0 1

L M 
0
1
1

X ′Y = 0

M
 M
 64 
1     22820 
47
L L L L    5398 
M 
0 L L 0    =  5748 
 M


1 L 0 L    6001 
 77 
L L 1 L    5673 
 36 
1 L L L L L
M
0
L
M
1
L
M
M
L
M L L
Burada β̂ ’yı hesaplamak için ve normal denklemleri oluşturacak gerekli olan matrisler
bulunmuştur. Bulduğumuz değerleri (5.16)’da ifade edilen aşağıdaki formülde yerine
koyarsak,
( X ′X ) βˆ = X ′Y
380 95 95 95 95  µˆ   22820 
 95 95 0 0 0  αˆ  5398 


 1 
 95 0 95 0 0  αˆ 2  = 5748 


  
 95 0 0 95 0  αˆ3  6001 
 95 0 0 0 95 αˆ 4  5673 
elde edilir. Bu denklem sisteminden β̂ vektörünün tahmin edilmesi gerekir. Ancak bu
model tam ranklı olmayan bir modeldir. Yani X ′X matrisinin rankı ile parametre sayısı
birbirine eşit değildir. Burada X ′X matrisinin rankı, rank(x) = 4, parametre sayısı da
5’tir. Eğer X ′X matrisinin rankı ile parametre sayısı eşit olsaydı ( X ′X ) −1 matrisinin
tersi alınabilecekti ve β̂ vektörü tahmin edilebilecekti. β̂ vektörünün tahminine
(5.16)’da belirtilen denklemden elde edilen βˆ = ( X ′X ) −1 X ′Y ile ulaşılamaz. Çünkü
( X ′X ) −1 matrisinin inversi (tersi) alınamamaktadır. Bundan dolayı (5.25)’te ifade edilen
genelleştirilmiş invers yardımıyla β̂ vektörü tahmin edilecektir. O halde
genelleştirilmiş inversi G ile gösterilip hesaplanırsa
0
0

G = 0

0
0

1/ 95 0
0
0 
0
1/ 95 0
0 

0
0
1/ 95 0 
0
0
0
1/ 95
0
0
0
0
elde edilir. βˆ 0 = GXY ′ eşitliğinden
81
X ′X ’in
0
0

βˆ 0 = 0

0
0
0
1/ 95
0
0
0
0
0
1/ 95
0
0
0
0
0
1/ 95
0
0   22820 
0  5398 
0  5748 


0   6001 
1/ 95 5673 
0

  0 
5398 / 95  56,821

 

= 5748 / 95 = 60,505 

 

 6001/ 95   63,168 
5673 / 95  59, 716 
elde edilir.
Bulunan değerler yardımıyla F testini oluşturmak için GAKT, GİKT ve GKT’nin
hesaplanması gerekir.
Gruplar Arası Kareler Toplamının hesaplanması:
(5.33)’de hesaplandığı gibi,
GAKT = β 0′ X ′Y − n y (Gruplar Arası Kareler Toplamı)
2
dir. Burada n = 380 değeri sınava giren incelenen öğrenci sayısıdır ve y = 60, 0526 ise
sınava giren öğrencilerin genel başarı ortalamasıdır. Bu değerler formülde yerine
konursa
 22820 
 5398 


GAKT = [ 0 56,821 60,505 63,168 59,168]  5748  − 380(60, 0526)2


 6001 
 5673 
= 1372345,663 – 1370399,611=1946,663
bulunur. Aynı işlem (5.34’de belirtildiği gibi)
k
GAKT =
∑ ni ( y i − y )2 =
i =1
4
∑n (y
i
i
− y )2
i =1
= 95 x(56,82 − 60, 05) 2 + 95 x(60,51 − 60, 05) 2 + 95 x(63,17 − 60, 05) 2
+95 x(59, 72 − 60, 05)2 = 1946,663
şeklinde de hesaplanabilir.
Gruplar Arası Kareler Ortalaması (5.37’de ifade edilmiştir),
82
GAKT
= 1946,663 / 3 = 648,888
k −1
GAKO =
Gruplar İçi Kareler Toplamı (5.28)’de belirtilmiştir),
GİKT = Y ′Y − β 0′ X ′Y şeklindedir.
Bulunan değerler eşitlikte yerine konulursa
 64 
 22820 
 47 
 5398 
 


M 
GİKT = [64 47 L L 77 36]   − [ 0 56,821 60,505 63,168 59, 716]  5748 


M 
 6001 
 77 
 5673 
 
36
 
= 1464054 – 1372345,663 = 91708,337
elde edilir. Aynı işlem (5.29)’da belirtilen formül yardımıyla da hesaplanabilir.
k
GİKT =
ni
4
95
∑∑ ( yij − y j )2 = ∑∑ ( yij − y j )2
i =1 j =1
i =1 j =1
= (64 − 56,82)2 + (47 − 56,82) 2 + ... + (73 − 56,82) 2 + (67 − 60,51)2 + ...
+ (50 − 60, 51)2 + (69 − 63,17)2 + ... + (64 − 63,17) 2 + (42 − 59, 72) 2 + ...
+ (36 − 59, 72) 2
= 91708,337
dir.
Gruplar İçi Kareler Ortalaması ise (5.38’de ifade edilmiştir),
GİKO =
GİKT 91708,337
=
= 243,905
n−k
380 − 4
Genel Kareler Toplamı ise (5.31’de ifade edildiği gibi),
GKT = Y ′Y − n y =1464054-1370399,611 = 93654,389
2
olarak bulunur.
F istatistiğinin değeri (5.39)’da belirtildiği gibi,
F=
GAKT /(k − 1) GAKO
648,888
=
=
= 2, 66
243, 905
GİKT /( N − k ) GİKO
elde edilir.
83
Bu sonuçlara göre elde edilen Varyans Analizi Tablosu aşağıdaki gibidir.
Çizelge 6.3 Ankara Üniversitesi Lisansüstü Yabancı Dil sınavına giren öğrencilerin
başarı notlarına ilişkin Y = X β + ε modeline uygun Varyans Analizi
çizelgesi
Varyasyon Toplam
Kareler s.d
Kaynağı
Toplamı
Gruplar
βˆ 0′ X ′Y − n y
Arası
Gruplar
İçi
Toplam
2
Ortalama Kareler Toplamı F İstatistiği
4-1=3
GAKO =
1946, 052
= 648,888
4 −1
=1946,052
Y ′Y − βˆ 0′ X ′Y
380-4=376
GİKO =
91708, 337
= 243,905
380 − 4
F=
648,888
243, 905
= 2, 66
= 91708,337
Y ′Y − n y
2
380-1=379
= 93654,389
Hesaplanan F istatistiği F = 2,66 olup, F tablo değeri ise 0,05 anlam seviyesi, 3 ve 376
serbestlik derecelerine göre 2,60 dır. Yani Fhes = 2, 66 > 0,05 F3376 = 2, 60 olduğundan H 0
reddedilir. Fen Bilimleri, Sağlık Bilimleri, Sosyal Bilimler ve Eğitim Bilimleri
Enstitüsüne Lisansüstü yabancı dil sınavına giren öğrencilerin başarı notları arasında
istatistiksel olarak anlamlı bir fark olduğu ortaya çıkmıştır.
H 0 hipotezi kabul edilmiş olsaydı öğrencilerin sınavdaki başarı durumu hakkında
anlamlı bir fark olmayacaktı ve çoklu karşılaştırma testleri yapılmayacaktı. Ancak
burada H 0 hipotezi reddedildi ve öğrencilerin sınavdaki başarı durumları arasında
istatistiksel olarak anlamlı bir farklılık olduğu ortaya çıktı ve bu anlamlı farklılığın
hangi gruplardan kaynaklandığının gereği duyuldu. Bu farklılığın hangilerinden dolayı
ileri geldiğini belirlemek için daha önce de belirtildiği gibi çeşitli testler geliştirilmiştir.
Çoklu karşılaştırmalar testlerinde bahsedilen bu yöntemlerle öğrencilerin yabancı dil
sınavındaki başarıları arasındaki farklılığın hangi enstitü öğrencileri arasında
gerçekleştiği belirlenecektir.
Scheffe Testi yardımıyla bu farklılığın hangi enstitüdeki öğrenciler arasında olduğunu
bulmaya çalışalım.
(5.42)’de ifade edilen formül ile daha önce F testi için karşılaştırma yaptığımız 0,05
anlam düzeyi ve k-1 ile n-k serbestlik dereceleri ile belirlenen F tablo değerini
84
karşılaştırırız. Eğer (5.42)’deki değer, F tablo değerinden büyükse öğrencilerinin
sınavdaki başarıları arasında anlamlı farklılığın ilgili enstitü öğrencileri arasında olduğu
görülür. (5.42)’de ifade edilen formül yardımıyla gerekli hesaplamalar yapılır ve tablo
halinde verilebilir. Burada,
y1 = Fen Bilimleri Enstitüsü öğrencilerinin yabancı dil sınav başarı ortalaması
y 2 = Sağlık Bilimleri Enstitüsü öğrencilerinin yabancı dil sınav başarı ortalaması
y 3 = Sosyal Bilimler Enstitüsü öğrencilerinin yabancı dil sınav başarı ortalaması
y 4 = Eğitim Bilimleri Enstitüsü öğrencilerinin yabancı dil sınav başarı ortalaması
olup daha önce de hesaplandığı gibi,
y1 = 56,821
y 2 = 60,505
y 3 = 63,168
y 4 = 59, 716
n1 = n2 = n3 = n4 = 95
k=4
GİKO = 243,905
dir. Bu hesaplamalar aşağıdaki çizelgede görülmektedir.
85
Çizelge 6.4 Ankara Üniversitesi Lisansüstü Yabancı Dil sınavına giren öğrencilerin
başarıları arasındaki anlamlı farklılığın Scheffe testi ile çoklu
karşılaştırılması
Sonuç (Öğrencilerin
Enstitü
Fij =
( yi − y j )
2
1 1
GİKO  +  (k − 1)
n n 
j 
 i
F tablo
değeri
başarıları arasındaki
Karşılaştırma anlamlı
hangi
farklılığın
gruplar
arasında olduğu)
Fen
Bilimleri-
Sağlık Bilimleri
Fen
Bilimleri-
Sosyal Bilimler
Fen
Bilimleri-
Eğitim Bilimleri
Sağlık BilimleriSosyal Bilimler
Sağlık BilimleriEğitim Bilimleri
Sosyal BilimlerEğitim Bilimleri
0,88
2,60
0,88 < 2,60
Anlamsız
2,62
2,60
2,62 > 2,60
Anlamlı
0,55
2,60
0,55 < 2,60
Anlamsız
0,46
2,60
0,46 < 2,60
Anlamsız
0,04
2,60
0,04 < 2,60
Anlamsız
0,77
2,60
0,77 < 2,60
Anlamsız
Sonuç olarak bu testte enstitü öğrencilerinin yabancı dil sınavında başarıları arasındaki
istatistiksel olarak anlamlı olan farklılığın Sosyal Bilimler Enstitüsü ile Fen Bilimleri
Enstitüsü öğrencileri arasında olduğu görülmektedir.
86
7. TARTIŞMA VE SONUÇ
Bu çalışmada öncelikle normal dağılımın bilinen temel özellikleriyle ilgili bilgiler
verildi. Normal dağılımın tarihçesi, yapısı, ortaya çıkışı ve özellikleri incelendi. Tek ve
çok değişkenli normal dağılımla ilgili önemli teoremler verilmiştir.
Bilindiği gibi normal dağılım istatistikte en önemli bir olasılık dağılımıdır. İstatistiksel
sonuç çıkarımlar normal dağılımdan elde edildiği için incelenen veriler ve değişkenler
normal dağılıma sahip olmasa bile limit dağılımı yardımıyla normal dağılıma
yaklaşmaktadır. Üçüncü bölümde bunun nasıl gerçekleştiğini limit dağılımı ve
yakınsama teoremleri yardımıyla gördük.
Dördüncü
bölümde normal dağılımdan elde edilen sonuçlar ifade edilmiştir. Burada
normal dağılımdan elde edilen istatistiksel dağılımlar incelenmiştir. Örneğin Ki-kare, t,
F ve Wishart gibi istatistiksel dağılımların nasıl ortaya çıktıkları ve nerelerde
kullanıldıkları görülmektedir. Normal dağılımdan elde edilen bu dağılımlarla daha iyi
sonuçlara ulaşarak uygulama yapmak mümkündür.
Beşinci bölümde karesel formlarla ilgili tanım, önemli teorem ve özellikler
açıklanmıştır. Karesel formlarla ilgili istatistikte neler yapılabileceği belirtilmektedir.
Karesel formlar da normal dağılımdan edilen önemli bir sonuçtur. Bir rasgele değişken
veya rasgele vektörün karesel formunun ki-kare dağıldığı, buna bağlı olarak da standart
normal dağılımın n serbestlik dereceli ki-kare dağılıma oranının t dağılımına sahip
olduğu, iki bağımsız r1 ve r2 serbestlik dereceli ki-kare dağılımların birbirine oranının
F dağıldığı görülmektedir. Wishart dağılımının ki-kare dağılımının genelleştirilmiş hali
olduğu görülmektedir. Yine Wishart dağılımının, ki-kare dağılımına ait özelliklerinin
birçoğuna sahip olduğu ifade edilmiştir.
Altıncı bölümde ise karesel formların dağılım özelliklerinden yararlanarak bir uygulama
yapıldı. Uygulamada, Ankara Üniversitesine Yüksek Lisans ve Doktora sınavlarına
müracaat eden öğrencilerin yabancı dil sınavında aldıkları notların başvuruda
87
bulundukları Enstitüye (Fen, Sağlık, Sosyal ve Eğitim Bilimleri) göre anlamlı bir
farklılık oluşturup oluşturmadıkları incelenmiştir. Sonuçta anlamlı bir farklılık olduğu
ve bu farklılığın Sosyal Bilimler Enstitüsü öğrencilerin aldıkları notlarla Fen Bilimleri
Enstitüsü öğrencilerin aldıkları notları arasında olduğu, çoklu karşılaştırma testleri
yapılarak saptanmıştır.
88
KAYNAKLAR
Akdeniz, F. ve Öztürk, F. 1996. Lineer Modeller, Ankara Üniversitesi Fen
Fakültesi Döner Sermaye İşletmesi Yayınları, No:38, 86-119, Ankara.
Bain, J. B. and Engelhardt M. 1989. Introduction to Probability and Mathematical
Statistics. PWS-KENT Publishing Company. Boston, 228-249.
Carmer and Swanson. 1973. IE 410 Lecture 6: More on Multiple Comparisons,
JASA Vol. 68. No: 341
Chiang, C. L. 2003. Statistical Methods of Analysis. World Scientific Publishing Co.
Pte. Ltd, 107-19, 349-354.
Conower, W. J. 1980. Practical Nonparametric Statistic, Second, Edition, Texas, Tech.
University, 357-364.
Harris, M.B. 1998. Basic Statistics for Behavioral Science Research, 334-357.
Hogg, V.R. and Craig T.A. 1995. Introduction to Mathematical Statistics. Prentice Hall,
Inc, 208-211, 238-239, 244-245.
Horrace, W. C. 2004. Some Results on the Multivariate Truncated Normal Distribution
Department of Economics, Syracuse University Working Paper Series, 1-16.
Johnson, R.A. and Wichern D.W. 1992. Applied Multivariate Statistical Analysis. New
Jersey, Prentice-Hall Inc, 129-142.
Lane, D. 2003. History of Normal Distribution. Connexions,
http://www.cnx.rice.edu/content/m11164/latest. Erişim Tarihi: 19.02.2004
Lehmann, E. L. 1986. Testing Statistical Hypotheses. Wiley series in probability and
mathematical statistics.
Lilliefors, H. W. 1967. “On the Kolmogorow-Smirnov” Test For Normality with Mean
and Variance Unknown JASA, 400 p.
Meyer, P. L. 1970. Introductury Probability and Statistical Applications. AddisonWesley Publishing Company, Inc, 183 p.
Pearson, A. V. and Hartley, H. O. 1972. Biometrica Tables for Statisticans, Vol 2.
Cambiridge, England.
Poole, D. 2003. Linear Algebra. A Modern Introduction. Trent Universty, 405-408,
USA.
89
Rao, C. R. 1973. Linear Statistical Inference and its Applications. Wiley series in
Probability and Mathematical Statistics, 158-163
Ross, S. 1997. A First Course in Probability. Prentice Hall, Inc, 355-358.
Searle, S.R.1997. Linear Models. N.Y. State College of Agriculture Cornell University,
Ithaca,N.Y, 175-177.
Shapiro, S. S. and Wilk, M. B., Chan, H. J. 1968. “A Comparative study of Various
Tests For Normality” JASA, 1343-1372.
Sincich, T. 1996. Business Statistics by Example. Prentice Hall, Inc, 273-275, USA.
Thomas, G. B. and Finney R. L. 1998. Calculus and Analytic Geometry. AddisonWesley Publishing Company, 1048-1053.
Tuncer, Yalçın. 2002. Çok Değişkenli İstatistik Analizine Giriş: Normal Teori.
Ankara Üniversitesi Fen Fakültesi İstatistik Bölümü, Bıçaklar Kitabevi, 72-83.
Ankara.
Zubrzycki, S. 1970. Lectures in Probability Theory and Mathematical Statistics.
American Elsevier Publishing Company, Inc, 183-184, New York.
90
ÖZGEÇMİŞ
Adı ve Soyadı : Şenol ÇELİK
Doğum Yeri
: Ilgın
Doğum Tarihi : 17.08.1969
Medeni Hali
: Bekar
Yabancı Dili : İngilizce
Eğitim Durumu (Kurum ve Yıl)
Lise
: Ilgın Lisesi (1984-1987)
Lisans
: Anadolu Üniversitesi Fen-Edebiyat Fakültesi İstatistik Bölümü
(1988-1992)
Yüksek Lisans : Ankara Üniversitesi Fen Bilimleri Enstitüsü İstatistik Ana Bilim
Dalı.
Çalıştığı Kurum/Kurumlar ve Yıl
Emniyet Genel Müdürlüğü Personel Daire Başkanlığı (1997-1998)
Emniyet Genel Müdürlüğü Trafik Araştırma Merkezi Müdürlüğü (1998’den bu yana)
Yayınları (SCI ve diğer)
91
Download