tc selçuk üniversitesi fen bilimleri enstitüsü marshall

advertisement
T.C.
SELÇUK ÜNİVERSİTESİ
FEN BİLİMLERİ ENSTİTÜSÜ
MARSHALL-OLKİN İKİ DEĞİŞKENLİ
DAĞILIMLARI VE İSTATİSTİKSEL SONUÇ
ÇIKARIMI
Umut ÖKSÜZ
YÜKSEK LİSANS
İstatistik Anabilim Dalını
Nisan-2014
KONYA
Her Hakkı Saklıdır.
TEZ BİLDİRİMİ
Bu tezdeki bütün bilgilerin etik davranış ve akademik kurallar çerçevesinde elde
edildiğini ve tez yazım kurallarına uygun olarak hazırlanan bu çalışmada bana ait
olmayan her türlü ifade ve bilginin kaynağına eksiksiz atıf yapıldığını bildiririm.
DECLARATION PAGE
I hereby declare that all information in this document has been obtained and
presented in accordance with academic rules and ethical conduct. I also declare that, as
required by these rules and conduct, I have fully cited and referenced all material and
results that are not original to this work.
Umut ÖKSÜZ
Tarih:
ÖZET
YÜKSEK LİSANS TEZİ
MARSHALL-OLKIN İKİ DEĞİŞKENLİ DAĞILIMLARI
VE
İSTATİSTİKSEL SONUÇ ÇIKARIMI
Umut ÖKSÜZ
Selçuk Üniversitesi Fen Bilimleri Enstitüsü
İstatistik Anabilim Dalı
Danışman: Doç. Dr. Coşkun KUŞ
2014, 51 Sayfa
Jüri
Doç. Dr. Coşkun KUŞ
Doç.Dr.Murat ERİŞOĞLU
Yrd.Doç.Dr.İsmail KINACI
Bu tez çalışmasında, Sahran ve Apaloo (2013) tarafından önerilen Genelleştirilmiş Chen
dağılımı ve Marshall ve Olkin (1967) nin yöntemi kullanılarak İki değişkenli Marshall-Olkin
Genelleştirilmiş Chen dağılımı önerilmiştir. Bu dağılımın olasılık yoğunluk fonksiyonu, dağılım
fonksiyonu ve yaşam fonksiyonu gibi dağılımsal özellikleri incelenmiştir. ML tahmin edicileri NelderMaid yöntemiyle elde edilmiştir. EM algoritması da geliştirilerek ML tahminlerine ulaşılmıştır. Önerilen
iki değişkenli dağılımın modelleme yeteneği gerçek örnek verilerek gösterilmiştir.
Anahtar Kelimeler: Genelleştirilmiş Chen dağılımı, Marshall-Olkin iki değişkenli dağılım,
EM algoritması, En çok olabilirlik tahmin edicisi
iv
ABSTRACT
MS THESIS
BIVARIATE MARSHALL-OLKIN DISTRIBUTIONS
AND
STATISTICAL INFERERNCE
Umut ÖKSÜZ
THE GRADUATE SCHOOL OF NATURAL AND APPLIED SCIENCE OF
SELÇUK UNIVERSITY
THE DEGREE OF MASTER OF SCIENCE
IN DEPARTMENT OF STATISTICS
Advisor: Doç. Dr. Coşkun KUŞ
2014, 51 Pages
Jury
Doç. Dr. Coşkun KUŞ
Doç.Dr.Murat ERİŞOĞLU
Yrd.Doç.Dr.İsmail KINACI
In this thesis, Bivariate Marshall-Olkin generalized Chen distribution is obtained with
generalized Chen distribution introduced by Sahran ve Apaloo (2013) using the same approach as was
adopted to obtain the Marshall-Olkin bivariate exponential distribution. Some distributional properties
such as probability density function, cumulative distribution function and survival function are
investigated. Maximum likelihood estimates (MLEs) are obtained using Nelder-Maid method. EM
algorithm is also provided to get the MLEs. A real example is also given to show the ability of the
moddeling of new introduced distribution.
Keywords: Generalized Chen distribution, Bivariate Marshall-Olkin distribution, EM
algorithm, Maximum likelihood estimate.
v
ÖNSÖZ
Çalışmamın not için değil, öğrenmek için olduğunu idrak ettiren ve aramızda
mesafeler olmasına rağmen benden yardımlarını, desteğini, sabrını ve bilgisini
esirgemeyen değerli danışman hocam Doç.Dr. Coşkun KUŞ’a, bu tez çalışmasında bana
her zaman destek olan, komutanlarım Binbaşı Serkan ERDOĞMUŞ ve Albay Adil
SARAÇ’a, sevgili Anneme ve Havva'ya teşekkürlerimi sunarım.
Umut ÖKSÜZ
KONYA–2014
vi
İÇİNDEKİLER
ÖZET ......................................................................................................................... iv
ABSTRACT.................................................................................................................v
ÖNSÖZ ...................................................................................................................... vi
İÇİNDEKİLER ........................................................................................................ vii
1. GİRİŞ .......................................................................................................................1
2. TEMEL KAVRAMLAR .........................................................................................3
2.1. Olasılık Teorisi ...................................................................................................3
2.2. İki Değişkenli Dağılım Fonksiyonları .................................................................4
2.3 Literatürdeki Yeni Dağılımlar ............................................................................17
2.3.1 İki Değişkenli Üstelleştirilmiş Doğrusal Bozulma Oranlı Dağılım...............17
2.3.2 İki Değişkenli Genelleştirilmiş Üstel Dağılım .............................................18
2.4. Asimptotik Normallik .......................................................................................19
2.5. Olabilirlik Fonksiyonu ......................................................................................20
2.6. Fisher Bilgi Matrisi...........................................................................................20
2.7. En Çok Olabilirlik Tahmin Edicileri .................................................................21
2.8. Asimptotik Güven Aralıkları.............................................................................21
3. İKİ DEĞİŞKENLİ ÜSTELLEŞTİRİLMİŞ CHEN DAĞILIMI .........................23
4. PARAMETRE TAHMİNİ ....................................................................................27
5. UYGULAMA.........................................................................................................32
5.1. Gerçek Örnek Üzerinde İstatistiksel Sonuç Çıkarımı.........................................32
5.2. MOBEC Dağılımından Üretilen Veri İçin İstatistiksel Sonuç Çıkarımı .............36
6. SONUÇ VE ÖNERİLER.......................................................................................39
EKLER ......................................................................................................................43
ÖZGEÇMİŞ...............................................................................................................52
vii
1
1. GİRİŞ
İki parametreli Chen dağılımı Chen (2000) tarafından önerilmiştir ve bu dağılım
yaşam zamanı verilerini modellemede kullanılmaktadır. Sahran ve ark.(2012), Rastogi
ve Tripathi (2012) Chen dağılımını reel datayı modellemede kullanmışlar ve Weibull,
üstel
ve
genelleştirilmiş
üstel
gibi
göstermişlerdir. Wu ve ark. (2011)
popular
dağılımlara
aday
olabileceğini
ve Wu (2008), ilerleyen tür tip-II sansürlü
örnekleme dayalı parametrelerin güven aralıklarını ve hipotez testlerini önermişleridir.
Rastogi ve ark. (2012), ilerleyen tür tip-II sansürlü örnekleme dayalı ML ve Bayes
tahmin edicilerini elde etmişler.
2013 yılında Sahran ve Apaloo (2013) Chen dağılımını genelleştirerek
Genelleştirilmiş Chen dağılımını elde etmiş, dağılımsal özellikleri incelemiş ve
parametre tahmini problemi üzerinde çalışmıştır. Reel data üzerinde de dağılımın
modellemede başarılı olduğunu göstermiştir.
1960 lı yıllarda Marshall-Olkin (1967), iki değişkenli üstel marjinalli MarshallOlkin (MOBE) dağılımı önermişlerdir. Son zamanlarda, Marshall ve Olkin’in MOBE
dağılımını elde etme yöntemi kullanılarak yeni iki değişkenli dağılımlar önerilmiştir.
Kundu ve Gupta (2009), iki değişkenli genelleştirilmiş üstel marjinalli Marshall-Olkin
dağılımı, Sahran ve ark. (2011) iki değişkenli genelleştirilmiş linear failure rate
marjinalli Marshall-Olkin dağılımını önermişlerdir.
Bu tez çalışmasında,
Sahran
ve
Apaloo
(2013)
tarafından önerilen
Genelleştirilmiş Chen dağılımı ve Marshall ve Olkin (1967) nin yöntemi kullanılarak İki
değişkenli Marshall-Olkin Genelleştirilmiş Chen dağılımı önerilmiştir. Bu dağılımın
oyf, df ve yaşam fonksiyonu gibi dağılımsal özellikleri incelenmiştir. ML tahmin
edicileri Nelder-Maid yönetmiyle elde edilmiştir. EM algoritması da geliştirilerek ML
tahminlerine ulaşılmıştır. Önerilen iki değişkenli dağılımın modelleme yeteneği, reel ve
simulatif bir örnek verilerek gösterilmiştir.
Bu tez çalışmasının 1. Bölümü giriş kısmından oluşmaktadır. 2. Bölümde, temel
kavramlar verilmiştir. 3. Bölümde, Genelleştirilmiş Chen dağılımı kullanılarak İki
değişkenli Marshall-Olkin Genelleştirilmiş Chen dağılımı önerilmiştir. Bu dağılımın
oyf, df ve yaşam fonksiyonu gibi dağılımsal özellikleri incelenmiştir. 4. Bölümde ise,
ML tahmin edicileri Nelder-Maid yöntemiyle elde edilmiştir. EM algoritması da
geliştirilerek ML tahminlerini ulaşılmıştır. Bölüm 5’de, elde edilen sonuçlar için
2
örnekler verilmiş ve sonuçlar yorumlanmıştır. 6. Bölüm’de ise sonuç ve önerilere yer
verilmiştir.
3
2. TEMEL KAVRAMLAR
Bu bölümde iki değişkenli rasgele vektörler, iki değişkenli dağılım
fonksiyonları,bazı olasılık teorisi kavramları ve literatürdeki bazı dağılımlara yer
verilmiştir. Bu bölümdeki verilen Tanımlar ve Teoremler tezde kullanıldığı için Öztürk
(1993) ve Rohatgi ve Ehsanes Saleh (2001) den derleme olarak verilmiştir.
2.1. Olasılık Teorisi
Tanım 2.1: W ¹ Æ, olmak üzere B1, B2 , K , Bn Ì W
n
UB
i
(n Î N )
kümeleri
= W,
(2.1)
i =1
Bi Ç B j = f , 1 £ i < j £ n
olacak biçimde belirlendiğinde B1, B2 , K, Bn 'lere W 'nın bir parçalanması denir.
Teorem 2.1 ÝI, U, PÞ olasılık uzayı,
P( Bi ) > 0
( Bi Î U , i = 1, 2,..., n )
B1, B2 , K, Bn ler W 'nın bir parçalanması ve
olmak üzere A Î U için
n
P( A) = å P( A | Bi ) P( Bi )
(2.2)
i =1
eşitliği yazılır.
İspat B1 , B2 , K , Bn 'ler W 'nın bir parçalanması olduğundan
n
W = U Bi
i =1
yazılabilir. Buradan
(2.3)
4
n
ì AVI = AV
4 Bi
i=1
n
ì PÝAÞ = P
4 A V Bi
i=1
n
ì PÝAÞ =
> PÝA V Bi Þ
i=1
n
ì PÝAÞ =
> PÝA|Bi ÞPÝBi Þ
i=1
(2.4)
şeklinde ispat tamamlanır.
2.2. İki Değişkenli Dağılım Fonksiyonları
ÝI, U, PÞ tanımlı bir X rasgele vektörü iki değişkenli olduğunda X rasgele
vektörünün dağılım fonksiyonu F aşağıda verilen teoremlerdeki özellikleri sağlar.
Teorem 2.2
0 £ FX , Y ( x, y ) £ 1
Teorem 2.3 X = ( X , Y ) ,
¢
marjinalli
FX ,Y ( x, y )
(2.5)
ÝI, U, PÞ olasılık uzayında tanımlı FX ( x ) ve FY ( y )
dağılım fonksiyonuna sahip 2 boyutlu rasgele vektör olmak
üzere;
lim FX , Y ( x, y ) = FX ,Y ( ¥, y ) = FY ( y )
(2.6)
lim FX , Y ( x, y ) = FX ,Y ( x, ¥ ) = FX ( x )
(2.7)
x ®¥
ve
y ®¥
dir.
İspat
lim n ®¥ FX ,Y ( n, y ) = FY ( y ) eşitliğinin doğruluğu,
lim x ®¥ FX , Y ( x, y ) = FY ( y )
eşitliğinin doğru olduğunu gösterir. Bu düşünceden hareketle
An = ( X £ n ) = {w : X (w ) £ n} , n = 1, 2, K
(2.8)
B = (Y £ y ) = {w : Y ( w ) £ y}
(2.9)
ve
için
A1 Ì A2 Ì L
eşitliğinin doğruluğu
olup
¥
lim An = U An = W
n ®¥
n =1
olduğu göz önüne alındığında (2.6)
5
lim FX ,Y ( n, y ) = lim P ( X £ n, Y £ y )
n ®¥
n ®¥
(
= lim P {w : X ( w ) £ n, Y (w ) £ y}
n ®¥
)
= lim P ( An Ç B )
n ®¥
(
= P lim ( An Ç B )
n ®¥
((
)
) )
= P lim An Ç B
n ®¥
(2.10)
= P (W Ç B)
= P (B)
(
= P {w : Y (w ) £ y}
)
= P (Y £ y )
= FY ( y )
şeklinde gösterilebilir. Yukarıdaki düşünce ile
lim y ®¥ FX ,Y ( x, y ) = FX ( x )
eşitliği
kolayca gösterilebilir.
¢
Teorem 2.4 X = ( X , Y ) , ÝI, U, PÞ olasılık uzayında tanımlı
FX ,Y ( x, y )
dağılım
fonksiyonuna sahip 2 boyutlu rasgele vektör olmak üzere
lim FX ,Y ( x, y ) = 0
(2.11)
lim FX ,Y ( x, y ) = 0
(2.12)
x ®-¥
ve
y ®-¥
dır.
İspat
lim n ®¥ FX ,Y ( - n, y ) = 0
eşitliğinin doğruluğu,
lim x ®-¥ FX ,Y ( x, y ) = 0
eşitliğinin doğru olduğunu gösterir. Bu düşünceden hareketle
An = ( X £ - n ) = {w : X (w ) £ - n} , n = 1, 2,K
(2.13)
B = (Y £ y ) = {w : Y ( w ) £ y}
(2.14)
ve
için A1 É A2 É L olup
¥
lim An = I An = Æ
n ®¥
n =1
olduğu göz önüne alındığında (2.11) eşitliğinin doğruluğu
(2.15)
6
lim FX ,Y ( -n, y ) = lim P ( X £ -n, Y £ y )
n ®¥
n ®¥
(
= lim P {w : X (w ) £ - n, Y ( w ) £ y}
n ®¥
)
= lim P ( An Ç B )
n ®¥
(
= P lim ( An Ç B )
n ®¥
((
)
(2.16)
) )
= P lim An Ç B
n ®¥
= P (Æ Ç B )
= P (Æ ) = 0
şeklinde gösterilebilir. Yukarıdaki düşünce ile lim y ®-¥ FX ,Y ( x, y ) = 0 eşitliği kolayca
gösterilebilir.
Teorem 2.5
X = ( X ,Y ) ,
¢
ÝI, U, PÞ olasılık uzayında tanımlı FX ,Y ( x, y ) dağılım
fonksiyonuna sahip 2 boyutlu rasgele vektör olmak üzere
lim FX , Y ( x, y ) = 1
(2.17)
x , y ®¥
dır.
İspat lim FX ,Y ( n, n ) = 1 eşitliğinin doğruluğu,
n ®¥
lim FX ,Y ( x, y ) = 1 eşitliğinin doğru
x , y ®¥
olduğunu gösterir. Bu düşünceden hareketle
An = ( X £ n ) = {w : X (w ) £ n} , n = 1, 2, K
(2.18)
Bn = ( Y £ n ) = {w : Y ( w ) £ n} , n = 1, 2,K
(2.19)
ve
için A1 Ì A2 Ì L olup
¥
lim An = UAn = W
n ®¥
(2.20)
n =1
ve B1 Ì B2 Ì L olup
¥
lim Bn = UBn = W
n ®¥
n =1
olduğu göz önüne alındığında (2.17) eşitliğinin doğruluğu
(2.21)
7
lim FX ,Y ( n, n ) = lim P ( X £ n, Y £ n )
n ®¥
n ®¥
(
= lim P {w : X ( w ) £ n, Y (w ) £ n}
n ®¥
)
= lim P ( An Ç Bn )
n ®¥
(
)
= P ( lim A Ç lim B )
= P lim ( An Ç Bn )
(2.22)
n ®¥
n ®¥
n
n ®¥
n
= P (W Ç W)
= P ( W)
=1
şeklinde gösterilebilir.
Teorem 2.6
X = ( X ,Y ) ,
fonksiyonuna sahip
¢
ÝI, U, PÞ olasılık uzayında tanımlı FX ,Y ( x, y ) dağılım
boyutlu rasgele vektör olmak üzere F ( x, y ) ,
x ’e ve y 'ye
göre sağdan süreklidir. Yani
lim F ( x + h, y ) = F ( x + , y ) = F ( x, y )
(2.23)
lim F ( x, y + h ) = F ( x, y + ) = F ( x, y )
(2.24)
h ®0+
ve
h ®0+
dir.
İspat
lim n ®¥ F ( x + 1n , y ) = F ( x, y )
lim h®0+ F ( x + h, y )= F ( x + , y )= F ( x, y )
eşitliğinin
doğruluğu,
eşitliğinin doğru olduğunu gösterir. Bu
düşünceden hareketle
1 ö
æ
lim F ç x + , y ÷ = F ( x, y )
n ®¥
n ø
è
(2.25)
olduğu gösterildiğinde F ( x, y ) in x 'e göre sağdan sürekli olduğu gösterilmiş olur.
1 ö
æ
lim F ç x + , y ÷ - F ( x, y ) = 0
n ®¥
n ø
è
(2.26)
1 ö
ì æ
ü
lim í F ç x + , y ÷ - F ( x, y ) ý = 0
n ®¥
n ø
î è
þ
(2.27)
olup (2.25) eşitliğinin doğruluğu (2.27) eşitliğinin doğruluğunu gerektirir. (2.25) eşitliği
ì æ
1 ö
ü
ì æ
1
ü
ö
lim í F ç x + , y ÷ - F ( x, y ) ý = lim í P ç X £ x + , Y £ y ÷ - P ( X £ x, Y £ y ) ý
n ®¥
n ø
n
ø
î è
þ n®¥ î è
þ
ì æ
1
öü
= lim í P ç x < X £ x + , Y £ y ÷ ý
n ®¥
n
øþ
î è
(2.28)
8
şeklinde yazılabilir.
1ö ì
1ü
æ
An = ç x < X £ x + ÷ = íw : x < X ( w ) £ x + ý
nø î
nþ
è
(2.29)
B = (Y £ y ) = {w : Y ( w ) £ y}
(2.30)
ve
için A1 É A2 É L olup
¥
lim An = I An = Æ
n ®¥
(2.31)
n =1
dir. (2.27) eşitliği kullanılarak
1 ö
1
ì æ
ü
ì æ
öü
lim í F ç x + , y ÷ - F ( x, y ) ý = lim í P ç x < X £ x + , Y £ y ÷ ý
n ®¥
n
®¥
n ø
n
øþ
î è
þ
î è
= lim P ( An Ç B )
n ®¥
(
= P lim ( An Ç B )
n ®¥
((
)
) )
= P lim An Ç B
n ®¥
(2.32)
= P (Æ Ç B )
= P (Æ )
=0
elde edilir. Burada gösterilmiş oldu ki
1 ö
ì æ
ü
lim í F ç x + , y ÷ - F ( x, y ) ý = 0
n ®¥
n ø
î è
þ
1 ö
æ
Þ lim F ç x + , y ÷ = F ( x, y )
n ®¥
n ø
è
Þ F ( x, y ) in x e göre sağdan süreklidir
Yukarıdaki düşünce ile lim h®0+ F ( x, y + h ) = F ( x, y + ) = F ( x, y )
eşitliği yani
F ( x, y ) in y 'ye göre sağdan sürekli olduğu kolayca gösterilebilir.
lim n ®¥ F ( x + 1n , y + 1n ) = F ( x, y )
lim h®0+ F ( x + h, y + h ) = F ( x + , y + ) = F ( x, y )
eşitliğinin
doğruluğu,
eşitliğinin doğru olduğunu gösterir. Bu
düşünceden hareketle
1
1ö
æ
lim F ç x + , y + ÷ = F ( x, y )
n ®¥
n
nø
è
(2.33)
9
olduğu gösterildiğinde
F ( x, y )
in
x 'e ve
y 'ye göre sağdan sürekli olduğu
gösterilmiş olur.
1
1ö
æ
lim F ç x + , y + ÷ = F ( x, y )
n ®¥
n
nø
è
1
1ö
æ
Þ lim F ç x + , y + ÷ - F ( x, y ) = 0
n ®¥
n
nø
è
(2.34)
ì æ
1
1ö
ü
Þ lim í F ç x + , y + ÷ - F ( x, y ) ý = 0
n ®¥
n
nø
î è
þ
(2.35)
olup (2.33) eşitliğinin doğruluğu (2.35) eşitliğinin doğruluğunu gerektirir. (2.33) eşitliği
ì æ
ü
1
1ö
lim í F ç x + , y + ÷ - F ( x, y ) ý
n ®¥
n
nø
î è
þ
1
1ö
ì æ
ü
= lim í P ç X £ x + , Y £ y + ÷ - P ( X £ x, Y £ y ) ý
n ®¥
n
nø
î è
þ
(2.36)
1
1 öü
ì æ
= lim í P ç x < X £ x + , y < Y £ y + ÷ ý
n ®¥
n
n øþ
î è
şeklinde yazılabilir.
1ö ì
1ü
æ
An = ç x < X £ x + ÷ = íw : x < X (w ) £ x + ý , n = 1, 2,K
nø î
nþ
è
(2.37)
1ö ì
1ü
æ
B = ç y < Y £ y + ÷ = íw : y < Y ( w ) £ y + ý , n = 1, 2, K
nø î
nþ
è
(2.38)
ve
için A1 É A2 É L olup
¥
lim An = I An = Æ
n ®¥
(2.39)
n =1
ve B1 É B2 É L olup
¥
lim Bn = I Bn = Æ
n ®¥
n =1
(2.40)
10
dir.
(2.35)
ve
(2.36)
eşitlikleri
kullanılarak
ì æ
1
1ö
ü
ì æ
1
1 öü
x, y ) ý lim í P ç x < X £ x + , Y £ y + ÷ ý
lim í F ç x + , y + ÷ - F (=
n ®¥
n
®¥
n
nø
n
n øþ
î è
þ
î è
= lim P ( An Ç Bn )
n ®¥
(
)
P ( lim A Ç lim B )
= P lim ( An Ç Bn )
n ®¥
=
n ®¥
n
(2.41)
n
n ®¥
= P (Æ Ç Æ )
= P (Æ )
= 0
elde edilir. Burada gösterilmiş oldu ki
1
lim F x + 1
n ,y + n
? FÝx, yÞ
n¸K
= 0
1
ì n¸K
lim F x + 1
n ,y + n
= FÝx, yÞ
ì FÝx, yÞ in x e ve y ye göre sağdan süreklidir
Teorem 2.7
X = ( X ,Y ) ,
¢
ÝI, U, PÞ olasılık uzayında tanımlı FX ,Y ( x, y ) dağılım
fonksiyonuna sahip 2 boyutlu rasgele vektör olmak üzere F ( x, y ) ,
göre azalmayandır. Yani "y Î R ve x1 < x2
x 'e ve y 'ye
için
F ( x1 , y ) £ F ( x2 , y )
(2.42)
"x Î R ve y1 < y2 için
F ( x, y1 ) £ F ( x, y2 )
(2.43)
dir.
İspat. Gerçekten x 1 < x 2 için
( X £ x1 ) Ì ( X £ x2 ) Þ ( X £ x1 , Y £ y ) Ì ( X £ x2 , Y £ y )
Þ P ( X £ x1 , Y £ y ) £ P ( X £ x2 , Y £ y )
Þ F ( x1 , y ) £ F ( x2 , y )
olup
F ( x, y ) ,
F ( x, y1 ) £ F ( x, y2 )
gösterilebilir.
x 'e göre azalmayandır. Yukarıdaki düşünce ile
olduğu yani F ( x, y ) 'in
(2.44)
y1 < y2
için
y 'e göre azalmayan olduğu kolayca
11
Teorem 2.8 (Frechet Sınırları) X = ( X , Y ) ,
¢
FX ( x )
ve FY ( y )
marjinalli FX ,Y ( x, y )
ÝI, U, PÞ olasılık uzayında tanımlı
dağılım fonksiyonuna sahip p boyutlu
rasgele vektör olmak üzere FX ,Y ( x, y )
max { FX ( x ) + FY ( y ) - 1, 0} £ F ( x, y ) £ min {FX ( x ) , FY ( x )}
(2.45)
eşitsizliğini sağlar. (http://mathworld.wolfram.com/FrechetBounds.html)
İspat. A = ( X £ x ) ve B = (Y £ y ) olaylar olmak üzere
P ( A È B ) = P ( A) + P ( B ) - P ( A Ç B ) £ 1
(2.46)
ifadesi göz önüne alındığında
P ( A Ç B ) ³ P ( A) + P ( B ) - 1
Þ P ( X £ x, Y £ y ) ³ P ( X £ x ) + P (Y £ y ) - 1
(2.47)
Þ F ( x, y ) ³ FX ( x ) + FY ( y ) - 1
elde edilir.
P ( A ) + P ( B ) - 1 = FX ( x ) + FY ( y ) - 1
(2.48)
ifadesinin pozitif olup olmadığı belli olmadığından (ki negatif çıkabilir), Kolmogorovun
i. aksiyomu gereği
max { FX ( x ) + FY ( y ) - 1, 0}
(2.49)
dir. Diğer taraftan
P ( A Ç B ) £ P ( A)
(2.50)
P ( A Ç B) £ P ( B)
(2.51)
ve
olduğundan
P ( X £ x, Y £ y ) £ P ( X £ x ) Þ F ( x, y ) £ FX ( x )
(2.52)
P ( X £ x, Y £ y ) £ P ( Y £ y ) Þ F ( x, y ) £ FY ( y )
(2.53)
ve
olup buradan
F ( x, y ) £ min { FX ( x ) , FY ( x )}
yazılabilir.
(2.54)
12
Teorem 2.9 X = ( X , Y ) ,
¢
marjinalli FX ,Y ( x, y )
üzere x1 < x2
ÝI, U, PÞ olasılık uzayında tanımlı FX ( x ) ve FY ( y )
dağılım fonksiyonuna sahip p boyutlu rasgele vektör olmak
için
P ( x1 < X £ x2 , Y £ y ) = F ( x2 , y ) - F ( x1 , y )
(2.55)
( X £ x2 , Y £ y ) = ( X £ x1 , Y £ y ) È ( x1 < X £ x2 , Y £ y )
(2.56)
dir.
İspat
eşitliği kullanılarak (2.55) eşitliği
Þ P ( X £ x2 , Y £ y ) = P ( X £ x1 , Y £ y ) È ( x1 < X £ x2 , Y £ y )
Þ P ( X £ x2 , Y £ y ) = P ( X £ x1 , Y £ y ) + P ( x1 < X £ x2 , Y £ y )
(2.57)
Þ F ( x2 , y ) = F ( x1 , y ) + P ( x1 < X £ x2 , Y £ y )
Þ P ( x1 < X £ x2 , Y £ y ) = F ( x2 , y )( x1 , y )
şeklinde gösterilebilir.
( X ,Y )
¢
Teorem 2.10
her x1 < x2
rasgele vektörünün dağılım fonksiyonu F ( x, y ) olmak üzere
ve y1 < y2 için
P ( x1 < X £ x2 , y1 < Y £ y2 ) = F ( x2 , y2 ) - F ( x2 , y1 ) - F ( x1 , y2 ) + F ( x1 , y1 )
(2.58)
eşitliği vardır.
İspat 2.10.1 A = ( X £ x1 ) ,
B = ( X £ x2 ) ,
C = ( Y £ y1 ) ,
D = ( Y £ y2 )
olaylar
olmak üzere
P ( x1 < X £ x2 , y1 < Y £ y2 ) = P {( B - A ) Ç ( D - C )}
(2.59)
olarak yazılabilir. Buradan
{
}
P ( x1 < X < x2 , y1 < Y < y2 ) = P éë B Ç ( D - C ) ùû - éë A Ç ( D - C ) ùû
yazılabilir. Burada
BÉ A
olduğundan
(2.60)
B Ç ( D - C ) É A Ç ( D - C ) 'dır. Böylece
(2.59) eşitliğinden
{
}
P {( B - A) Ç ( D - C )} = P éë B Ç ( D - C ) ùû - éë A Ç ( D - C ) ùû
= P {B Ç ( D - C )} - P { A Ç ( D - C )}
yazılabilir. Buradan
(2.61)
13
P {B Ç ( D - C )} - P { A Ç ( D - C )} = P {B Ç D - B Ç C} - P { A Ç D - A Ç C}
yazılabilir. Burada
DÉC
olduğundan
BÇ D É BÇC
ve
(2.62)
A Ç D É A Ç C 'dir.
Böylece
P ( x1 < X £ x2 , y1 < Y £ y 2 ) = P ( B Ç D ) - P ( B Ç C ) - P ( A Ç D ) + P ( A Ç C )
(2.63)
elde edilir. Yukarda tanımlanan A, B, C , D olaylarının eşiti cd5 eşitliğinde yazılırsa
P ( x1 < X £ x2 , y1 < Y £ y2 ) = F ( x2 , y2 ) - F ( x2 , y1 ) - F ( x1 , y2 ) + F ( x1 , y1 )
(2.64)
eşitliği elde edilir.
İspat 2.10.2 :
( x1 < X £ x2 , Y £ y2 ) = ( x1 < X £ x2 , Y £ y1 ) È ( x1 < X
£ x2 , y1 < Y £ y2 )
(2.65)
eşitliğinde
P ( x1 < X £ x2 , Y £ y2 ) = P ( x1 < X £ x2 , Y £ y1 ) + P ( x1 < X £ x2 , y1 < Y £ y2 )
(2.66)
yazılabilir. Teorem 2.10 (2.58) eşitliğine uygulandığında
F ( x2 , y2 ) - F ( x1 , y2 ) = F ( x2 , y1 ) - F ( x1 , y1 ) + P ( x1 < X £ x2 , y1 < Y £ y2 )
(2.67)
olup buradan
P ( x1 < X £ x2 , y1 < Y £ y2 ) = F ( x2 , y2 ) - F ( x2 , y1 ) - F ( x1 , y2 ) + F ( x1 , y1 )
(2.68)
elde edilebilir.
Sonuç: Olasılık ölçüsünün tanımı ve Teorem 2.10'dan
F ( x2 , y2 ) - F ( x2 , y1 ) - F ( x1 , y2 ) + F ( x1 , y1 ) ³ 0
(2.69)
dır.
Bu özellik Poincar´e's Teoremi(içerme dışlama prensibi) kullanılarak 3 ve daha
büyük boyutlu rasgele vektörlerin ortak dağılım için genelleştirilebilir.
Teorem 2.11
( X ,Y ) ,
marjinalli FX ,Y ( x, y )
2
üzere her Ýx, yÞ 5 §
¢
ÝI, U, PÞ olasılık uzayında tanımlı FX ( x )
FY ( y )
dağılım fonksiyonuna sahip p boyutlu rasgele vektör olmak
için
P { X > x, Y > y} = F ( x, y ) = 1 - FX ( x ) - FY ( y ) + F ( x, y )
eşitliği vardır.
ve
(2.70)
14
İspat
A = ( X £ x ) ve B = (Y £ y ) olaylar olmak üzere
P { X > x, Y > y} = P ( Ac Ç Bc )
yazılabilir. Eşitlik (2.70) ve daha sonra De Morgan kanunu uygulanırsa
(
P { X > x, Y > y} = 1 - P ( Ac Ç B c )
c
)
= 1- P ( A È B)
= 1 - éë P ( A) + P ( B ) - P ( A Ç B ) ùû
(2.71)
= 1 - P ( X £ x ) - P (Y £ y ) + P ( X £ x , Y £ y )
= 1 - FX ( x ) - FY ( y ) + F ( x, y )
ispat tamamlanır. İkinci bir yol olarak, ortak dağılım fonksiyonu için verilen 2. özellik
ve Teorem 2.10' dan
P { X > x, Y > y} = P ( x < X < ¥, y < Y < ¥ )
= F ( ¥ , ¥ ) - F ( ¥ , y ) - F ( x , ¥ ) + F ( x, y )
(2.72)
= 1 - FY ( y ) - FX ( x ) + F ( x, y )
ispat kolayca yapılabilir.
Teorem 2.12 F ,
R2
de tanımlı iki boyutlu bir fonksiyon olsun. F ,
X
ve Y
rasgele değişkenlerinin ortak dağılım fonksiyonudur ancak ve ancak
1.
2.
3.
F azalmayan
ve
lim x ®-¥ F ( x, y ) =0,
x1 < x2
her
değişken
lim y ®-¥ F ( x, y ) =0
için
ve
sağdan
sürekli
lim x , y ®¥ F ( x, y ) =1
ve y1 < y2 için
F ( x2 , y2 ) - F ( x2 , y1 ) - F ( x1 , y2 ) + F ( x1 , y1 ) ³ 0
Yukarıdaki iki boyutlu dağılım fonksiyonu ile ilgili elde edilen sonuçlar p > 2
boyutlu dağılım fonksiyonlar için de kolayca genelleştirilebilir.
1.
0 £ F ( x ) £ 1, x Î R p
2.
lim F ( x ) = F ( ¥, ¥, K , ¥ ) =1
3.
x ®¥
En az bir xi için i = 1, 2,K , p
lim F ( x ) =0
xi ®-¥
15
4.
F fonksiyonu sağdan süreklidir, yani
lim F ( x1 + h1 , x2 + h2 , K , x p + hp ) = F ( x )
hi ®-¥
i =1,2,K, p
(Öztürk, 1993).
5.
F azalmayandır, yani x1 £ x2 için F ( x1 ) £ F ( x2 ) 'dir. Bir başka deyişle
F , x 'in her bir elemanına göre azalmayandır.
Örnek 2.1 : İki değişkenli
0
,
x < 0 veya x + y < 1 veya y < 0
1
,
diğer yerlerde
FÝx, yÞ =
fonksiyonu ele alınsın. F ( x, y ) 1-5 özelliklerini sağlar.
1
æ1
ö
P ç < X £ 1, < Y £ 1÷
3
è3
ø
olasılığı, Teorem 2.10' dan
P ( x1 < X < x2 , y1 < Y < y2 ) = F ( x2 , y2 ) - F ( x2 , y1 ) - F ( x1 , y2 ) + F ( x1 , y1 )
1
æ1
ö
æ1 1ö
æ 1ö
æ1 ö
P ç < X £ 1, < Y £ 1÷ = F (1,1) + F ç , ÷ - F ç1, ÷ - F ç ,1÷
3
è3
ø
è 3 3ø
è 3ø
è3 ø
= 1 + 0 - 1 - 1 = -1 < 0
olduğundan F ( x, y )
dağılım fonksiyonu değildir. (Rohatgi, V.K. 1976, syf:106: An
Introduction to Probability Theory and Mathematical Statistics)
Not: F ( x1 , x2 ,K , xn ) ortak dağılım fonksiyonundan F1 ( x1 ) , F2 ( x2 ) ,K , Fn ( xn )
marjinal dağılım fonksiyonlar tek biçimde belirlenir. Fakat tersi doğru değildir. Yani,
aynı marjinal dağılım fonksiyonları farklı ortak dağılım fonksiyonunu verebilir.
Örnek 2.2: Aşağıda tanımlanan
f1
ve
f2
olasılık yoğunluk fonksiyonlar
farklı olmasına rağmen aynı marjinallere sahiptir.
f1 ( x, y ) = {1 , 0 < x, y < 1
f 2 ( x, y ) = {1 + a ( 2 x - 1)( 2 y - 1) , 0 < x, y < 1, - 1 < a < 1
16
Sonuç: Örnek 2.1 ve Örnek 2.2 den görüldüğü gibi aynı marjinallere sahip
birden çok ortak dağılım fonksiyonu olabilir.
17
2.3 Literatürdeki Yeni Dağılımlar
2.3.1 İki Değişkenli Üstelleştirilmiş Doğrusal Bozulma Oranlı Dağılım
Doğrusal Bozulma Oranlı Dağılımın (Linear Failure Rate Distribution, LFR)
dağılım fonksiyonu
g ü
ì
FLFR ( x; b , g ) = 1 - exp í- bx - x 2 ý
2 þ
î
b > 0, g > 0
(2.79)
şeklinde tanımlanır.
Sahran ve Kundu (2009) bu dağılımı genelleştirmişlerdir.
Sahran ve Kundu
(2009)’un önerdiği dağılım olan Üstelleştirilmiş Doğrusal Bozulma Oranlı Dağılımın
(GLFR) dağılım ve olasılık yoğunluk fonksiyonu, sırasıyla,
a
æ
g üö
ì
FGLFR ( x;a , b , g ) = çç1 - exp í- bx - x 2 ý ÷÷
2 þø
î
è
fGLFR ( x; a , b , g ) = a (b + gx )e
g ö
æ
- ç bx + x 2 ÷
2 ø
è
a > 0, b > 0, g > 0
(2.80)
a -1
g üö
æ
ì
çç1 - exp í- bx - x 2 ý ÷÷
2 þø
î
è
, a > 0, b > 0, g > 0 (2.81)
şeklindedir. X ~ GLFR(a , b , g ) ile gösterilir.
İki Değişkenli Üstelleştirilmiş Doğrusal Bozulma Oranlı Dağılımı (Bivariate
Generalized Linear Failure Rate, BGLFR) için; U 1 , U 2 ve U 3 bağımsız 3 rasgele
değişken ve her biri GLFR dağılımına sahip olsun. Burada
X 1 = max (U 1 ,U 3 ) ve
X 2 = max (U 2 , U 3 )
dönüşümleri tanımlansın. Bu durumda
( X 1, X 2 )¢
BGLFR dağılımının, dağılım
fonksiyonu, olasılık yoğunluk fonksiyonu ve marjinal olasılık yoğunluk fonksiyonları
sırasıyla aşağıda verilmiştir.
( X 1, X 2 )¢ ~ BGLFR(a1, a 2 , a 3 , b , g ) olmak üzere ( X 1, X 2 )¢ nin dağılım
fonksiyonu aşağıdaki gibi yazılabilir. (Sarhan ve ark.)
3
FX1 ,X 2 (x1 , x2 ) = P (X 1 ≤ x1 , X 2 ≤ x2 ) = ∏ FGLFR (xi ; αi , β , γ ) , x3 = min{x1 , x2 }
i =1
(2.82)
18
( X 1, X 2 )¢
nin olasılık yoğunluk fonksiyonu aşağıdaki gibi yazılabilir:
ì f1 ( x1 , x2 )
ï
f X 1 , X 2 ( x1 , x2 ) = í f 2 ( x1 , x2 )
ï f (x )
î 0
0 < x1 < x2 < ¥
0 < x1 < x2 < ¥
(2.83)
0 < x1 = x 2 = x < ¥
, burada
f1 ( x1 , x2 ) = f GLFR ( x1; a1 + a 3 , b , g ) f GLFR ( x2 ; a 2 , b , l )
f 2 ( x1, x2 ) = fGLFR ( x1; a1 , b , g ) f GLFR ( x2 ; a 2 + a 3 , b , l )
f 0 (x ) =
(2.84)
a3
fGLFR ( x; a1 + a 2 + a 3 , b , g )
a1 + a 2 + a 3
X 1 ve X 2 'nin marjinal dağılım fonksiyonları sırasıyla GLFR (α1 + α3 , β , γ) ve
GLFR (α 2 + α3 , β , γ) şeklindedir.
2.3.2 İki Değişkenli Genelleştirilmiş Üstel Dağılım
Tek değişkenli genelleştirilmiş üstel dağılımın dağılım fonksiyonu ve olasılık
yoğunluk fonksiyonu, sırasıyla, aşağıdaki gibidir:
FGE (x; α , λ) = (1 - e - λx )
α
(2.85)
f GE (x ; α , λ) = αλe - λx (1 - e- λx )
α-1
(2.86)
U1 ~ GE (a1, l ), U 2 ~ GE (a 2 , l ) ve U 3 ~ GE (a 3 , l )
birbirinden
bağımsız
değişkenler olduğu varsayılsın ve aşağıdaki dönüşüm tanımlansın.
X 1 = max (U 1 ,U 3 ) ve
Buna
göre,
X 2 = max (U 2 , U 3 )
( X 1, X 2 )¢ ~ BVGE (a1, a 2 , a 3 )
olmak
genelleştirilmiş üstel dağılımın ortak dağılım fonksiyonu
z = min{x1 , x2 } olmak üzere
üzere
İki
değişkenli
x1 > 0, x2 > 0 için ve
19
(
FX 1 , X 2 (x1, x2 ) = 1 - e - x1
) (1 - e ) (1 - e )
a1
- x2 a 2
-z a3
(2.87)
şeklindedir. (Kundu ve Gupta, 2009).
( X 1, X 2 ) ~ BVGE (a1 , a 2 , a 3 )
olmak üzere İki değişkenli genelleştirilmiş üstel
dağılımın olasılık yoğunluk fonksiyonu x1 > 0, x2 > 0 için ve z = min{x1 , x2 } olmak
üzere aşağıdaki gibidir:(Kundu ve Gupta, 2009)
f1 (x1 , x2 ) = f GE (x1 ; α1 + α3 ) f GE (x2 ; α2 )
= (α1 + α3 )α 2 (1 - e -x1 ) 1
α +α3 -1
(1 - e x )α -1 e- x -x
2
2
1
2
f 2 (x1 , x2 ) = f GE (x1 ; α1 ) f GE (x2 ; α2 + α3 )
= (α2 + α3 )α1 (1 - e -x1 ) 1 (1 - e -x2 ) 2
α -1
f 0 (x) =
α +α3 -1 - x - x
1 2
e
α3
f (x; α1 + α2 + α3 )
α1 + α2 + α3 GE
= α3 (1 - e
)
(2.88)
(2.89)
(2.90)
- x α1 +α2 +α3 -1 - x
e
( X 1, X 2 ) ~ BVGE (a1 , a 2 , a 3 )
dağılımın marjinal dağılımları
olmak üzere iki değişkenli genelleştirilmiş üstel
X 1 ~ GE (a1 + a3 ) ve X 2 ~ GE (a 2 + a 3 ) şeklindedir
(Kundu ve Gupta, 2009).
( X 1, X 2 ) ~ BVGE (a1 , a 2 , a 3 )
olmak üzere iki değişkenli genelleştirilmiş üstel
dağılımın ortak yaşam fonksiyonu aşağıdaki gibidir (Kundu ve Gupta, 2009):
S X1 ,X 2 (x1 , x2 ) = 1 - FX1 (x1 ) - FX 2 (x2 ) + FX1 ,X 2 (x1 , x2 )
(2.91)
2.4. Asimptotik Normallik
(X n )
rasgele değişkenlerin bir dizisi , Z , standart normal dağılıma sahip bir
d
rasgele değişken ve ¾¾
® , dağılımda yakınsamayı göstermek üzere,
X n - an d
¾¾
®Z
bn
olacak şekilde reel sayıların (an ) ve pozitif reel sayıların (bn ) dizileri varsa, ( X n )
dizisine asimptotik normal veya daha açık olarak “ an ortalaması” ve “ bn2 varyansı” ile
20
(
)
asimptotik normal dizisi denir ve X n ~ AN an , bn2 biçiminde gösterilir. Buradaki an
sayısı X n ’in beklenen değeri ve bn2 sayısı X n nin varyansı olmayabilir. Bu değerler
sırasıyla X n ’in asimptotik ortalama ve asimptotik varyans değerleridir (Öztürk 2010).
2.5. Olabilirlik Fonksiyonu
X 1 , X 2 ,..., X n örneklemi, olasılık (yoğunluk) fonksiyonu f ( x; γ ), γ Î ¡ p olan
kitleden alınan n birimlik bir örneklem olsun. Örneklemin ortak olasılık yoğunluk
fonksiyonu
f (x; γ ), x Î ¡ n
olmak üzere bu fonksiyona parametrenin bir fonksiyonu gözü ile bakıldığında
L ( γ ; x ) = f ( x; γ ) , γ Î G Ì ¡ p
(2.92)
şeklinde tanımlanan fonksiyona X 1 , X 2 ,..., X n örneklemine dayalı olabilirlik fonksiyonu
denir. Burada x = ( x1 , x2 ,K , xn )¢ ve γ = ( g 1 , g 2 , K , g n )¢
şeklinde olup G parametre
uzayıdır. Olabilirlik fonksiyonu L ( γ ; x ) in logaritması alınarak
l ( γ ) = log ( L ( γ; x ) ) , γ Î G Ì ¡ p
(2.93)
şeklinde elde edilen fonksiyona log-olabilirlik fonksiyonu denir.
2.6. Fisher Bilgi Matrisi
X 1 , X 2 ,..., X n örneklemi, olasılık (yoğunluk) fonksiyonu f ( x; γ ), γ Î ¡ p olan
kitleden alınan n birimlik bir örneklem olsun. Bu örneklem için Fisher bilgi
matrisi(Fisher information matrix)
21
ìæ ¶
öü
I ( γ ) = - E íç log ( L ( γ; X ) ) ÷ ý
øþ
îè ¶γ
ìæ ¶
öü
= - E íç l ( γ ) ÷ ý
øþ
îè ¶γ
æ ¶2l ( γ )
ç
2
ç ¶g 1
ç ¶2l γ
( )
ç
= - ç ¶g 2 ¶g 1
ç
ç M
ç ¶2l γ
( )
ç
ç ¶g ¶g
è p 1
¶ 2l ( γ )
¶ 2l ( γ ) ö
L
÷
¶g 1¶g 2
¶g 1¶g p ÷
¶ 2l ( γ )
¶ 2 l ( γ ) ÷÷
L
¶g 2 2
¶g 2¶g p ÷
÷
M
O
M ÷
¶ 2l ( γ )
¶ 2 l ( γ ) ÷÷
L
¶g p ¶g 2
¶g p 2 ÷ø
(2.94)
şeklinde tanımlanır, burada L ( γ ; X ) ve l ( γ ) sırasıyla eşitlik (2.92) ve (2.93) de verilen
olabilirlik ve log-olabilirlik fonksiyonlarıdır (Wu ve Kuş, 2009).
2.7. En Çok Olabilirlik Tahmin Edicileri
Olabilirlik veya log-olabilirlik fonksiyonunu maksimum yapan γ değeri
γˆ = arg max ( L ( γ; x ) ) = arg max ( l ( γ ) )
(2.95)
γ nın en çok olabilirlik tahmin edicisi (Maximum Likelihood Estimator, MLE) olarak
adlandırılır.
2.8. Asimptotik Güven Aralıkları
Eşitlik (1.17) de tanımlanan en çok olabilirlik tahmin edicisi γ̂ bazı düzgünlük
şartları altında
d
n ( γˆ - γ ) ¾¾
® N ( 0, I -1 ( γ ) )
olmak üzere asimptotik normaldir, burada I -1 ( γ ) , (2.94) eşitliğinde tanımlı Fisher Bilgi
Matrisidir. Fisher Bilgi matrisinin tersi γ̂ nın asimptotik varyans-kovaryans matrisidir.
22
Bu matrisin bilinmesi, büyük örneklemler için gˆ1 , gˆ2 ,K , gˆn tahmin edicilerinin ayrı ayrı
asimptotik varyanslarının bilinmesi anlamına gelmektedir. I -1 ( γ ) nın tutarlı bir tahmin
edicisi
æ ¶ 2l ( γ )
ç
2
ç ¶g 1
ç ¶ 2l γ
( )
ç
$I -1 ( γ ) = - ç ¶g ¶g
2
1
ç
ç M
ç ¶ 2l γ
( )
ç
ç ¶g p ¶g 1
è
¶2l ( γ )
L
¶g 1¶g 2
¶2l ( γ )
¶g 2 2
M
¶ l(γ)
¶g p ¶g 2
2
-1
¶ 2l ( γ ) ö
÷
¶g 1¶g p ÷
¶ 2l ( γ ) ÷÷
L
¶g 2¶g p ÷
÷
O
M ÷
¶ 2 l ( γ ) ÷÷
L
¶g p 2 ÷ø ˆ
g =g
(2.95a)
dır (Adamidis ve Loukas 1998). Buradan g i , i = 1, 2,K , p için gˆi ’ya dayalı asimptotik
güven aralığı
æ
ö
P ç gˆi - z a Vii < g i < gˆi + z a Vii ÷ @ 1 - a
112
2
è
ø
(2.95b)
şeklinde oluşturulabilir. Burada Vii , eşitlik (2.95a)’da verilen matrisin i. diogonal
elemanıdır ve a Î ( 0,1) için za , standart normal dağılımın a. kuantilidir (Wu ve Kuş
2009).
23
3. İKİ DEĞİŞKENLİ ÜSTELLEŞTİRİLMİŞ CHEN DAĞILIMI
X , üstelleştirilmiş Chen yani EC (a , l , b )
dağılımına sahip olduğunda
olasılık yoğunluk fonksiyonu ve dağılım fonksiyonu sırasıyla
((
f EC ( x ) = alb x b -1 exp l 1 - e x
(
{(
FEC ( x ) = 1 - exp l 1 - e x
b
b
) + x ) (1 - exp {l (1 - e )})
xb
b
a -1
(3.1)
)})
a
(3.2)
olarak verilir. (Sarhan ve Apaloo, 2013).
X 1 , X 2 , X 12
bağımsız
ve
EC (a1 , l , b ) ,
sırasıyla
EC (a 2 , l , b )
ve EC (a12 , l , b ) dağılımına sahip rasgele değişkenler olsun. Burada
T 1 = maxÝX 1 , X 12 Þ
ve
T 2 = maxÝX 2 , X 12 Þ
æ T1 ö
dönüşümleri tanımlansın. T = ç ÷
è T2 ø
rasgele vektörüne Marshal-Ollkin iki değişkenli
üstelleştirilmiş Chen dağılımı denilecektir ve
T ~ MOBEC (a1 , a 2 , a12 , l , b )
ile
gösterilecektir.
T ~ MOBEC (a1 , a 2 , a12 , l , b )
Teorem 3.1:
T1
ve
T2 'nin marjinal dağılım
fonksiyonlar sırasıyla EC (a1 + a12 , l , b ) ve EC (a 2 + a12 , l , b ) olacaktır.
İspat.
F1 (t1 ) = P(T1 < t1 ) = P(max ( X 1, X 12 ) < t1 )
F1 (t1 ) = P( X1 < t1, X 12 < t1 )
F1 (t1 ) = P( X1 < t1 )P( X12 < t1 )
( { ( )}) .(1 - exp{l (1 - e )})
F (t ) = (1 - exp{l (1 - e )})
F1 (t1 ) = 1 - exp l 1 - et1
b
1 1
t1b
a1
a1 + a12
t1b
a12
24
F2 (t2 ) = P(T2 < t2 ) = P(max ( X 2 , X 12 ) < t2 )
F2 (t2 ) = P( X 2 < t2 , X 12 < t2 )
F2 (t2 ) = P( X 2 < t2 )P( X 12 < t2 )
( { ( )}) (1 - exp{l (1 - e )})
F (t ) = (1 - exp{l (1 - e )})
a2
F2 (t2 ) = 1 - exp l 1 - et 2
b
2
t 2b
2
t 2b
a12
a 2 +a 12
Teorem 3.2 : T ~ MOBEC (a1 , a 2 , a12 , l , b ) ise
a) T 'nin dağılım fonksiyonu
3
FT ( t ) = Õ FEC ( xi , a i , l , b ) ,
(3.3)
i =1
burada x3 = min { x1 , x2 } 'dir
b) Ti ~ EC (a i + a 3 , l , b ) 'dır. (Kundu ve Gupta, 2009)
İspat.
P (T1 ≤t1 ,T2 ≤t 2 ) = P(max (X 1 , X 12 ) ≤t1 , max (X 2 , X 12 ) ≤t 2 )
P (T1 ≤t1 ,T2 ≤t 2 ) = P(X 1 ≤t1 , X 12 ≤t1 , X 2 ≤t 2 , X 12 ≤t2 )
= P (X 1 ≤t1 , X 2 ≤t2 , X 12 ≤t1 )
= P(X 1 ≤t1 , X 2 ≤t 2 , X 12 ≤t2 )
,t1 < t2
(3.4)
,t 2 < t1
= P (X 1 ≤t1 ).P(X 2 ≤t 2 ).P(X 12 ≤t1 )
= P(X 1 ≤t1 ).P (X 2 ≤t2 ).P (X 12 ≤t 2 )
,t1 < t2
, t2 < t1
Sonuç 3.1: T 'nin dağılım fonksiyonu
0 < t1 < t2 < ¥
ì FEC ( t1 , a1 + a3 ) FEC (t2 , a 2 ) ,
ï
FT ( t ) = í FEC ( t1 , a1 ) FEC (t2 , a 2 + a3 ) ,
0 < t2 < t1 < ¥ ,
ï F (t,a + a + a )
, 0 < t1 = t2 = t < ¥
1
2
3
EC
î
(3.5)
olup eşitlik (3.2) kullanılarak
(
(
{(
{(
)}) ( { ( )})
)}) ( { ( )})
{ ( )})
a1 +a 3
b
ì
t1b
e
1
exp
1
1 - exp l 1 - et2
l
ï
ï
a1
b
b
ï
FT ( t ) = í 1 - exp l 1 - et1
1 - exp l 1 - et2
ï
a1+a 2 +a3
ï
tb
e
1
exp
1
l
ï
î
(
şeklinde de yazılabilir.
a2
a 2 +a 3
,
0 < t1 < t2 < ¥
,
0 < t2 < t1 < ¥
, 0 < t1 = t2 = t < ¥
(3.6)
25
Sonuç 3.2 : T 'nin yaşam fonksiyonu teorem 2.11 gereği
S ( t1 , t2 ) = 1 - FT1 ( t1 ) - FT2 ( t2 ) + F ( t1 , t2 )
(3.7)
eşitliği kullanılarak açık bir biçimde ifade edilebilir.
Sonuç 3.3 : T 'nin olasılık yoğunluk fonksiyonu
0 < t1 < t2 < ¥
ì f1 ( t1 , t2 ) ,
ï
f T ( t ) = í f 2 ( t1 , t2 ) ,
0 < t2 < t1 < ¥ ,
ï
, 0 < t1 = t2 = t < ¥
î f0 (t )
(3.8)
burada
f1 ( t1 , t2 ) = f EC ( t1 ;a1 + a3 , l , b ) f EC ( t2 ;a 2 , l , b )
f 2 ( t1 , t2 ) = f EC ( t1 ;a1 , l , b ) f EC ( t2 ; a 2 + a 3 , l , b )
f0 (t ) =
(3.9)
a3
f EC ( t; a1 + a 2 + a 3 , l , b )
a1 + a 2 + a 3
olup burada
) ) (( ) )
´ (1 - exp {l (1 - e )})
(1 - exp{l (1 - e )})
f ( t , t ) = a (a + a ) l b ( t t ) exp ( l (1 - e ) + t ) exp ( l (1 - e ) + t )
´ (1 - exp {l (1 - e )}) (1 - exp {l (1 - e )})
f ( t ) = a lb t exp ( l (1 - e ) + t ) (1 - exp {l (1 - e )})
f1 ( t1 , t2 ) = a 2 (a1 + a3 ) l 2 b 2 ( t1t2 )
2
1
2
1
2
a1 -1
tb
b -1
b
b
t2b
b
1
t2b
b
a 2 -1
t 2b
t1b
1 2
t1b
0
b -1
2
3
((
exp l 1 - et1 + t1b exp l 1 - et2 + t2b
a1 +a 3 -1
t1b
2
b -1
b
2
(3.10)
a 2 +a3 -1
tb
a1 +a 2 +a3 -1
3
dır.
Teorem 3.2 T ~ MOBEC (a1 , a 2 , a12 , l , b ) ise max (T1,T2 ) ~ EC (a1 + a 2 + a12 , l , b )
Teorem 3.3
(T1 , T2 ) ~ EC (a1 , a 2 , a 3 , l , b )
ise aşağıdaki eşitlik yazılabilir:(Kundu ve
Gupta, 2009)
FT1 ,T2 ( t1 , t2 ) =
a3
a1 + a 2
Fa ( t1 , t2 ) +
Fs ( t1 , t2 ) ,
a1 + a 2 + a 3
a1 + a 2 + a 3
burada z = min {t1 , t2 } ,
(3.11)
26
(
{(
Fs ( t1 , t2 ) = 1 - exp l 1 - e z
b
)})
a1 +a 2 +a3
(3.12)
ve
Fa ( t1 , t2 ) =
(
(
{(
´ 1 - exp l 1 - e
dır.
{ ( )}) ( { ( )})
)}) - a a+ a (1 - exp {l (1 - e )})
b
a1 + a 2 + a 3
1 - exp l 1 - et1
a1 + a 2
zb
a3
a1
zb
3
1
b
1 - exp l 1 - et2
2
a2
a1 +a 2 +a 3
(3.13)
27
4. PARAMETRE TAHMİNİ
æ T11 ö æ T21 ö
æ Tn1 ö
ç ÷ , ç ÷ ,K , ç ÷ ,
è T12 ø è T22 ø
è Tn 2 ø
MOBEC (a1 , a 2 ,a12 , l , b ) dağılımından bağımsız n
birimlik bir örneklem olsun. Bu örnekleme dayalı log-olabilirlik fonksiyonu
l (a1 , a 2 ,a 3 , l , b ) = å ln f1 ( ti1, ti 2 ) + å ln f 2 ( ti1,ti 2 ) + å ln f 0 ( ti )
iÎI1
iÎI 2
(4.1)
iÎI 0
ve buradan
l (a1 , a 2 , a 3 , l , b ) = ( 2n1 + 2n2 + n0 ) {log ( l ) + log ( b )} + n1 log (a 2 ) + n1 log (a1 + a 3 )
å
+ ( b - 1)
iÎI1 È I 2
(
{(
log ( t1it2 i ) + (a1 + a3 - 1) å log 1 - exp l 1 - et1i
iÎl1
(
b
)})
{ ( )}) + n log (a ) + n log (a + a )
+ (a - 1) å log (1 - exp {l (1 - e )} )
+ (a + a - 1) å log (1 - exp {l (1 - e )}) + n log (a )
+ (a + a + a - 1) å log (1 - exp {l (1 - e )} )
+ (a 2 - 1) å 1 - exp l 1 - et2 i
iÎl1
b
2
1
2
2
3
t1bi
1
iÎl2
2
3
1
2
t2bi
0
iÎl2
3
tib
3
iÎl0
æ
b
b
b
+ ( b - 1) å log ( ti ) + l ç å 1 - et1i + å 1 - et2 i + å 1 - eti
ç iÎI È I
iÎI 0
iÎI1 È I 2
iÎI 0
è 1 2
+ å t1bi + å t2bi + åtib
(
iÎI1 È I 2
iÎI1 È I 2
iÎl0
)
(
)
(
ö
) ÷÷ø
(4.2)
şeklinde yazılabilir, burada
I1 = {i; ti1 < ti 2 }
I 2 = {i; ti1 > ti 2 }
I 0 = {i; ti1 = ti 2 = ti }
I = I 0 È I1 È I 2 = {1, 2,K , n}
ve
n0 = I 0 , n1 = I1 , n2 = I 2 'dır.
Bilinmeyen parametrelerin MLE'leri (4.2) maksimize edilerek elde edilebilir. Bu
beş boyutlu bir optimizasyon problemidir. MLE'leri hesaplamak için aynı anda 5 tane
non-lineer denklem çözümüne ihtiyaç olacaktır.
28
5-boyutlu optimizasyon sürecinin çözümüne göre 2-boyutlu optimizasyon
sürecinin çözümünde daha fazla yakınsama olacağından (T1 ,T2 ) rasgele vektörü ( l1 , l2 )
rasgele vektörüyle aşağıdaki gibi ilişkilendirilir:
ì1, X 1 > X 12 ise
L1 = í
î3, X 1 < X 12 ise
ve
ì2, X 2 > X 12 ise
L2 = í
î3, X 2 < X 12 ise
T1 = T2 olduğunda l1 = l2 = 3 olur. ∋T1 ,T2 ( Î I1 ise
(L1 , L 2 ) ’nin
muhtemel
değerleri (3,2) ya da (2,1)’dir. Eğer ∋T1 ,T2 ( Î I 2 ise (L1 , L 2 ) ’nin muhtemel değerleri
(1,3) ya da (1,2)’dir. EM algoritması, I 0 için tüm gözlem değerlerine uygulanacaktır.
Eğer gözlemler I1 ve I 2 ’den elde edilmişse EM algoritması kayıp gözlemler göz önünde
∋T1 ,T2 ( Î I1 ise ∋t1 ,t2 ( ’nin bir kısmı sırasıyla
bulundurularak uygulanacaktır.
∋t1 ,t2 ,u1 ∋θ ((
ve ∋t1 ,t2 ,u2 ∋θ (( formunda ifade edilir. Buradaki q , q = (a1 , a 2 , a 3 , b , g )
şeklinde bir parametre vektörüdür. u1 (q ) ve u 2 (q ) , T1 ; T2 durumunda şartlı olasılıkları
gösterir ve bu olasılıklar aşağıdaki gibidir:
u1 (q ) = P ( L1 = 3 T1 < T2 ) =
a3
a1
, u2 (q ) = P ( L1 = 1 T1 < T2 ) =
a1 + a 3
a1 + a 3
Benzer şekilde, ∋T1 ,T2 ( Î I 2 ise ∋t1 ,t2 ( ’nin bir kısmı sırasıyla ∋t1 ,t2 ,w1 ∋θ (( ve
∋t1 ,t2 ,w2 ∋θ ((
formunda ifade edilir. Buradaki q , q = (a1 , a 2 , a 3 , b , g ) şeklinde bir
parametre vektörüdür. w1 (q ) ve w2 (q ) , T1 = T2 durumunda şartlı olasılıkları gösterir ve
bu olasılıklar aşağıdaki gibidir:
w1 (q ) = P ( L 2 = 3 T1 > T2 ) =
a3
a2
, w2 (q ) = P ( L 2 = 1 T1 > T2 ) =
a2 + a3
a2 + a3
u1 (q ) , u 2 (q ) , w1 (q ) , w2 (q ) sırasıyla u1 , u 2 , w1 , w2 şeklinde kısaltılmış olarak
gösterilecektir.
29
EM algoritmasının uygulanabilmesi için “pseudo data” log-olabilirlik
fonksiyonu aşağıdaki gibi yazılır:
I 0 < ζt1i < t2i < ti için|
T1 < max ζ X1 , X12 | < t1i < ti
T2 < max ζ X 2 , X 12 | < t2i < ti
X 12 < ti Þ f ∋ti ,θ3 (
ve buradan X 1 ; ti Þ F ∋ti ,θ1 (
olmak üzere
X 2 ; ti Þ F ∋ti ,θ2 (
f 0 < f ∋ti ,θ3 ( F ∋ti ,θ3 ( F ∋ti ,θ2 (
(4.3)
I1 < ζt1i ; t2 i için|
T1 < max ζ X 1 , X 12 | < t1i
T2 < max ζ X 2 , X 12 | < t2 i
olmak üzere
X 1 < t1i Þ f ∋t1i ,θ1 (
X 12 < t1i Þ f ∋t1i ,θ3 (
X 12 ; t1i Þ F ∋t1i ,θ3 (
X 1 ; t1i Þ F ∋t1i ,θ1 (
ve buradan X 2 < t2i Þ f ∋t2 i ,θ2 ( veya X 2 < t2i Þ f ∋t2 i ,θ2 (
f1 < u2 ∋θ ( .ζ f ∋t1i ,θ1 ( . f ∋t2 i ,θ2 ( .F ∋t1i ,θ3 (| ∗ u1 ∋θ ( .ζ f ∋t1i ,θ3 ( . f ∋t2 i ,θ2 ( .F ∋t1i ,θ1 (| (4.4)
I 2 < ζt1i = t2 i için|
T1 < max ζ X 1 , X 12 | < t1i
T2 < max ζ X 2 , X 12 | < t2 i
olmak üzere
X 1 < t1i Þ f ∋t1i ,θ1 (
X 1 < t1i Þ f ∋t1i ,θ1 (
X 12 ; t2 i Þ F ∋t2 i ,θ3 (
X 12 ; t2 i Þ F ∋t2 i ,θ2 (
ve buradan X 2 < t2 i Þ f ∋t2i ,θ2 ( veya X 3 < t2i Þ f ∋t2i ,θ3 (
f 2 < w1 ∋θ ( .ζ f ∋t1i ,θ1 ( . f ∋t2 i ,θ3 ( .F ∋t2 i ,θ2 (| ∗ w2 ∋θ ( .ζ f ∋t1i ,θ1 ( . f ∋t2i ,θ2 ( .F ∋t2 i ,θ3 (| (4.5)
'E'-adımlı EM algoritmasını gerçekleştirebilmek için
qi = (a i , b , g ) ; i = 1, 2,3
notasyonu kullanılacaktır. f ( .;q i ) ve F (.;qi ) sırasıyla MOEC (a i , b , g ) ; i = 1, 2, 3 için
OYF ve DF' nu göstermektedir. 'pseudo data' ('E'-adım) log-olabilirlik fonksiyonu
aşağıdaki gibi yazılır:
30
I pseudo (q ) = å ln f ( ti ;q 3 ) + å ln F ( ti ;q1 ) + å ln F ( ti ;q 2 ) +
iÎI 0
iÎI0
iÎI 0
æ
ö
u1 ç å ln f ( ti1 ;q3 ) + å ln f ( ti 2 ;q 2 ) + å ln F ( ti1;q1 ) ÷ +
iÎI1
iÎI1
è iÎI1
ø
æ
ö
u2 ç å ln f ( ti1;q1 ) + å ln f ( ti 2 ;q 2 ) + å ln F ( ti1;q3 ) ÷ +
iÎI1
iÎI1
è iÎI1
ø
æ
ö
w1 ç å ln f ( ti1 ;q1 ) + å ln f ( ti 2 ;q 3 ) + å ln F ( ti 2 ;q 2 ) ÷ +
iÎI 2
iÎI 2
è iÎI2
ø
æ
ö
w2 ç å ln f ( ti1 ;q1 ) + å ln f ( ti 2 ;q 2 ) + å ln F ( ti 2 ;q 3 ) ÷
iÎI 2
iÎI 2
è iÎI 2
ø
= I1 (q1 ) + I 2 (q 2 ) + I 3 (q3 )
{(
Burada a ( x ; b , g ) = ln é1 - exp l 1 - e t
ëê
b
(4.6)
)}ùûú olmak üzere;
I1 (q1 ) = å ln F ( ti ;q1 ) + u1 å ln F ( ti1 ;q1 ) + u2 å ln f ( ti1;q1 ) + å ln f ( ti ;q1 )
iÎI0
iÎI1
iÎI1
iÎI 2
I 2 (q 2 ) = å ln F ( ti ;q 2 ) + w1 å ln F ( ti 2 ;q 2 ) + w2 å ln f ( ti 2 ;q 2 ) + å ln f ( ti 2 ;q 2 )
iÎI 0
iÎI 2
iÎI 2
(4.7)
iÎI1
I 3 (q3 ) = å ln f ( ti ;q3 ) + u1 å ln f ( ti1 ;q 3 ) + u2 å ln F ( ti1;q3 ) + w1 å ln f ( ti 2 ;q 3 ) + w2 å ln F ( ti 2 ;q3 )
iÎI0
iÎI1
iÎI1
iÎI 2
iÎI 2
Şimdi ‘M’-adımda bilinmeyen parametrelerle ilgili olarak (4.6)’nın maksimize
edilmesi gerekir. a1 , a 2 , a 3 parametreleri I1 (q1 ), I 2 (q 2 ), I 3 (q 3 ) maksimize edilerek
tahmin edilir ve tahmin değerleri I pseudo (q ) denkleminde yerine yazılarak b ve g için
model kurulmuş olur ve aşağıdaki gibi gösterilir:
a%1 ( b , g ) = -
u2 n1 + n2
å a ( ti ; b , g ) + å a ( ti1 ; b , g ) + å a ( ti1; b , g )
iÎI 0
a% 2 ( b , g ) = -
iÎI 2
w2 n2 + n1
å a ( ti ; b , g ) + å a ( t i 2 ; b , g ) + å a ( t i 2 ; b , g )
iÎI 0
a% 3 ( b , g ) = -
iÎI1
iÎI1
iÎI 2
n0 + u1n1 + w1n2
å a ( ti ; b , g ) + å a ( ti1; b , g ) + å a ( ti 2 ; b , g )
iÎI 0
iÎI1
iÎI 2
Son olarak q ile ilgili olarak I pseudo (q ) ’nın maksimizasyonu,
pseudo
profil
(4.8)
log-olabilirlik
fonksiyonu
b ve g 'nın
I pseudo (a~1 (b , g ), a~2 (b , g ), a~3 (b , g ), b , g )
31
~
maksizimize edilerek elde edilmesiyle gerçekleştirilmiş olur. b ve g~ pseudo profil log~
olabilirlik fonksiyonuyla maksimize edilirse, a~1 (b , g ), a~2 (b , g ), a~3 (b , g ), b , g~ parametre
tahminleri EM algoritmasında sonraki iterasyonda kullanılmaya başlanır. EM
algoritması tarafından bilinmeyen parametrelerin MLE’lerinin hesaplanmasında
kullanılan algoritma aşağıda verilmiştir.
EM Algoritması:
(
Adım 2; u (q ( ) ) , u (q ( ) ) , w (q ( ) ) ve w (q ( ) ) hesaplanır.
Adım 3; u (q ( ) ) , u (q ( ) ) , w (q ( ) ) ve w (q ( ) ) için b ve g
Adım 1; q başlangıç değerleri alır; q ( 0 ) = a1( 0) , a 2( 0 ) , a 3( 0 ) , b ( 0) , g ( 0)
0
0
1
0
2
0
0
1
2
0
1
0
2
)
0
1
2
ilgili olarak pseudo
log-olabilirlik fonksiyonu I pseudo (a%1 ( b , g ) ,a% 2 ( b , g ) , a% 3 ( b , g ) , b , g ) maximize edilerek
b (1) ve g (1) elde edilir.
(
)
(
)
(
)
Adım 4; a1(1) = a%1 b (1) , g (1) , a 2(1) = a% 2 b (1) , g (1) ve a 3(1) = a%3 b (1) , g (1) bulunur ve
(
)
bu sayede q (1) = a1(1) , a 2(1) , a 3(1) , b (1) , g (1) elde edilir.
Adım 5; q ( 0 ) 'ın yerine q (1) konularak 1.adıma dönülür ve yakınsama meydana
gelene kadar süreç bu şekilde devam eder.
32
5. UYGULAMA
5.1. Gerçek Örnek Üzerinde İstatistiksel Sonuç Çıkarımı
Veri seti Meintanis (2007)’den elde edilmiştir. Futbol verileri ev sahibi takımın
attığı en az bir gol ve herhangi bir takımın penaltı atışı, faul atışı veya diğer serbest
vuruşlardan attığı gollerin dakikasını temsil eder. T1 ; herhangi bir takımın ilk duran
toptan attığı golün dakikasını, T2 ; ev sahibi takımın attığı ilk golün dakikasını
göstermektedir. Bu durum T1 ; T2 ,T1 = T2 ,T1 < T2 gibi tüm olasılıklara açıktır. MOBEC
modeli kullanılarak veriler analiz edilecektir.
Tablo 1. UEFA Şampiyonlar Ligi Verisi
2005-2006
T1
T2
2004-2005
T1
T2
Lyon-Real Madrid
26
20
Internazional-Bremen
34
34
Milan-Fenerbahçe
63
18
Real Madrid-Roma
53
39
Chelsea-Anderlect
19
19
Man. United-Fenerbahçe
54
7
Club Brugge-Juventus
66
85
Bayern-Ajax
51
28
Fenerbahçe-PSV
40
40
Moscow-PSG
76
64
Internazionale-Rangers
49
49
Barcelona-Shakhtar
64
15
Panathinaikos-Bremen
8
8
Leverkusen-Roma
26
48
Ajax-Arsenal
69
71
Arsenal-Panathinaikos
16
16
Man. united-Benfica
39
39
Dynamo Kyiv-Real Madrid
44
13
Real Madrid-Rosenborg
82
48
Man. United-Sparta
25
14
Villarreal-Benfica
72
72
Bayern-M.telaviv
55
11
Juventus-Bayern
66
62
Bremen-Internazional
49
49
Club Brugge-Rapid
25
9
Anderlect-valencia
24
24
Olimpiacos-Lyon
41
3
Panathinakios-PSV
44
30
Internazionale-Porto
16
75
Arsenal-Rosenborg
42
3
Schalke-PSV
18
18
Liverpool-Olympiacos
27
47
Barcelona-Bremen
22
14
M. Tel Aviv-Juventus
28
28
Milan-Schalke
42
42
Bremen-Panathinaikos
2
2
Rapid-Juventus
36
52
33
Tablo 2. Uyum İyiliği Testi
Model
T1
T2
Log (L )
GLFR
-162.676
GC
-162.0294
AIC
BIC
KS
Log (L )
p değe ri
AIC
BIC
KS
336.3091
344.3637
0.0962
p değe ri
-162.938
334.0587
342.1133
0.1030
0.8270
-163.1545
0.8836
T1 değişkenine ait ölçümlere dayalı GC dağılımının parametre tahminleri
aˆ = 1.2069 , lˆ = 0.0078 , bˆ = 0.4165 ,
T2 değişkenine ait ölçümlere dayalı GC
dağılımının
aˆ= 1.7262 lˆ= 0.0551 bˆ= 0.3308
parametre
tahminleri
olarak
bulunmuştur. Tablo 2’de GLFR ve GC dağılımlarının T1 ve T2 rasgele değişkenlerinin
marjinal dağılımlarını modelleme de en uygun olanın seçimi için kullanılan bazı
kriterler, Kolmogorov-Smirnov test istatistiği ve p değerleri verilmiştir. Tablo 2’ye
göre, GC dağılımı Tablo 1’ deki veriyi modellemek için kullanılabilir.
Tablo 3. Hipotez Testi
Null
T1 MLEs
H0
lˆ = 0.0047
bˆ = 0.4340
Log (L )
L
-162.071
0.9591
-2 log (L )
p değe ri
0.0835
0.6191
T2 MLEs
lˆ = 0.0184
bˆ = 0.3794
Log (L )
L
-163.472
0.7283
-2 log (L )
p değe ri
0.6342
0.6948
Tablo 4. En Çok Olabilirlik Tahminleri, Olabilirlik, AIC ve BIC değerleri
Model
En Çok Olabilirlik Tahminleri
L
AIC
BIC
MO
lˆ1 = 0.0012 , lˆ2 = 0.014 , lˆ3 = 0.022
-339.006
684.012
688.845
BVGE
aˆ1 = 1.351 , aˆ 2 = 0.465 , aˆ 3 = 1.153 , bˆ = 0.039
-296.935
601.870
611.925
-293.379
596.757
604.813
-292.7794
595.5588 603.6134
BGLFR
MOBEC
aˆ1 = 0.492 , aˆ 2 = 0.166 , aˆ 3 = 0.411 ,
bˆ = 2.013 ´ 10 -4 , gˆ = 8.051´ 10 -4
ˆ 0.3996
ˆ 0.0104 b=
aˆ1= 0.6817 aˆ 2= 0.2441 aˆ12= 0.5980 l=
34
Şekil 1. EM iterasyonlarındaki parametrelerin yakınsamaları
(Parametre tahminleri için grafikte log ölçek kullanılmıştır.)
EM algoritmasıyla elde edilen tahminler (Tüm tahminler için ardışık tahminler
arası fark 10 -6
dan küçük olduğunda yakınsama sağlanmıştır.), Nelder-Maid
yöntemiyle(Termination tolerance, 10 -5 olarak alınmıştır) elde edilen tahminlere çok
yakın olduğu gözükmektedir (Noktadan sonra ilk dört basamak aynı). Ayrıca EM
algoritması içinde kullanılan Nelder-Maid yöntemi için Termination tolerance, 10-10
olarak alınmıştır. EM algoritması 248 iterasyon sonucunda yakınsama sağlamış olup
EM iterasyonlarındaki parametrelerin yakınsamaları Şekil 1’de verilmiştir.
Gözlenen Fisher Bilgi Matrisi (Observed Fisher Information Matrix)
æ 40.24436
ç
ç 2.54 ´ 10- 7
Iˆ = ç 3.664008
ç
ç - 2195.46
ç
è - 313.946
2.54 ´ 10-7
124.6846
23.97621
- 2497.9
- 282.538
3.664008 - 2195.46 - 313.946 ö
÷
23.97621 - 2497.9 - 282.538 ÷
÷
66.79531 - 2660.73 - 292.269 ÷
- 2660.73 541805.6 113399.3 ÷
÷
- 292.269 113399.3 26944.06 ø
şeklindedir. Nelder-Maid yöntemiyle elde edilen En Çok Olabilirlik Tahmin Edicilerin
asimptotik varyans-kovaryans matrisi
35
æ 0.163751
ç
ç 0.045489
ˆI -1 = S = ç 0.109644
ç
ç 0.005571
ç
è - 0.01987
0.045489
0.023375
0.033184
0.001826
- 0.00655
0.109644
0.033184
0.105442
0.004495
- 0.01615
0.005571
0.001826
0.004495
0.000228
- 0.00083
- 0.01987 ö
÷
- 0.00655 ÷
- 0.01615 ÷
÷
- 0.00083 ÷
÷
0.003034 ø
seklindedir. a1 , a 2 , a12 , l , b parametrelerinin %95 lik asimptotik güven aralıkları,
sırasıyla, (- 0.1114,1.4748) , (- 0.0556, 0.5437 ) , (- 0.0385,1.2344) , (- 0.0192,0.0399) ve
(0.2917,0.5076)
şeklindedir. Burada bütün parametrelerin sıfırdan büyük değerler
almak zorunda olduğu göz önüne alındığında %95 'lik güven aralıkları (0,1.4748) ,
(0, 0.5437) , (0,1.2344) , (0,0.0399) ve (0.2917,0.5076) biçiminde de yazılabilir.
Sürü Algoritması kullanılarak da parametre tahminleri 1000 iterasyon sonucunda
aˆ1 = 0.6814 aˆ 2 = 0.2442 aˆ12 = 0.6001 lˆ = 0.0104 bˆ = 0.3994 olarak bulunmuştur. Bu
sonuçla, EM algoritması, Nelder-Maid ve Sürü algoritmasının hemen hemen aynı
sonuçları verdiği görülmektedir. Sürü algoritması için iterasyon grafiği Şekil 2. de
verilmiştir.
Şekil 2. Sürü Algoritması iterasyonlarındaki parametrelerin yakınsamaları
36
5.2. MOBEC Dağılımından Üretilen Veri İçin İstatistiksel Sonuç Çıkarımı
Tablo 5. MOBEC ( a 1 = 0.5 a 2 = 1 a 12 = 2 l = 0.5 b = 3 ) dağılımından simule edilen data
T1
T2
T1
T2
1.3005
0.9741
1.2603
0.9549
1.2305
1.2397
1.2286
0.8664
1.2458
1.2152
0.8463
0.6003
1.0798
1.1753
1.0502
1.3005
1.3074
1.2603
0.9333
1.2305
1.2397
1.2286
0.8664
1.1987
1.2152
0.9898
0.9271
1.0959
0.8997
0.8870
0.7523
1.3004
0.9708
0.9319
1.2272
1.0916
0.9566
1.1098
0.9569
1.1787
0.9456
1.1241
1.0411
1.0883
0.8710
0.7970
1.3004
1.0034
0.9319
1.2272
1.0916
0.9566
1.1098
0.9569
1.1919
1.0616
1.1241
1.2714
0.9080
0.8710
Başlangıç değeri : [1,3,0.5,0.4,0.5] olduğunda Nelder Maid ile parametre
tahminleri
aˆ1 = 0.8098 , aˆ 2 = -2.1255 , aˆ12 = 0.6122 , lˆ = 0.7024 , bˆ = 1.1378
olarak
bulunmuştur. Görüldüğü gibi parametre tahminlerinden biri negatif çıkmıştır. Her bir
parametrenin sıfırdan büyük değer alabileceği düşünüldüğünde tahminler yanlıştır.
MOBEC( α1 = 0.5 , α2 = 1 , α12 = 2 , λ = 0.5 , β = 3 )
dağılımından sayı üretildiğinden
tahminlerin tutarsız olduğu da gözükmektedir. Başlangıç değeri : [0.5,1,2,0.5,0.3]
olduğunda
Nelder
Maid
ile
elde
edilen
α̂1 = 0.5163 , α̂ 2 = 0.8784 , α̂12 = 1.6811 , λ̂ = 0.5267 , β̂ = 2.8624
ML
tahminleri
olarak bulunmuştur.
Bu da EM algoritması ile elde edilen tahminlerle aynı olduğundan tahminlerin doğru
olduğu sonucu çıkarılabilir. Tahminler de datanın üretildiği dağılımın parametrelerine
yakın olduğu görülmektedir. Görüldüğü gibi Nelder-Maid yöntemi başlangıç
değerlerinin seçimine göre duyarlıdır. Bu nedenle tahminlerde EM algoritmasının
kullanılması daha iyi olacağı açıktır.
Tablo 6. En Çok Olabilirlik Tahminleri, Olabilirlik, AIC ve BIC değerleri
Model
En Çok Olabilirlik Tahminleri
MOBEC
α̂1 = 0.5163 , α̂ 2 = 0.8784 , α̂12 = 1.6811 , λ̂ = 0.5267 , β̂ = 2.8624
L
AIC
BIC
0.4563 9.0872 16.0932
37
Şekil 3. EM iterasyonlarındaki parametrelerin yakınsamaları
EM algoritmasıyla elde edilen tahminler (Tüm tahminler için ardışık tahminler
arası fark 10 -6
dan küçük olduğunda yakınsama sağlanmıştır.), Nelder-Maid
yöntemiyle(Termination tolerance, 10 -5 olarak alınmıştır) elde edilen tahminlere çok
yakın olduğu gözükmektedir (Noktadan sonra ilk dört basamak aynı). Ayrıca EM
algoritması içinde kullanılan Nelder-Maid yöntemi için Termination tolerance, 10-10
olarak alınmıştır. EM algoritması 254 iterasyon sonucunda yakınsama sağlamış olup
EM iterasyonlarındaki parametrelerin yakınsamaları Şekil 3’de verilmiştir.
Gözlenen Fisher Bilgi Matrisi (Observed Fisher Information Matrix)
0.0000
1.8638
æ 20.6195
ç
12.4273
0.7632
ç 0.0000
Î = ç 1.8638
0.7632
8.2885
ç
ç - 27.0742 - 25.8171 - 29.0251
ç 0.2767
- 0.1055
0.8360
è
0.2767 ö
÷
- 25.8171 - 0.1055 ÷
- 29.0251 0.8360 ÷
÷
294.6148 46.4236 ÷
46.4236 20.0246 ÷ø
- 27.0742
şeklindedir. Nelder-Maid yöntemiyle elde edilen En Çok Olabilirlik Tahmin Edicilerin
asimptotik varyans-kovaryans matrisi
æ 0.2018 0.2709 0.4771 0.1460 - 0.3597 ö
÷
ç
ç 0.2709 0.5601 0.8582 0.2589 - 0.6367 ÷
Iˆ -1 = S = ç 0.4771 0.8582 1.6892 0.4678 - 1.1571 ÷
÷
ç
ç 0.1460 0.2589 0.4678 0.1398 - 0.3444 ÷
÷
ç
è - 0.3597 - 0.6367 - 1.1571 - 0.3444 0.8982 ø
38
seklindedir. a1 , a 2 , a12 , l , b parametrelerinin %95 lik asimptotik güven aralıkları,
sırasıyla,
şeklindedir.
(0,1.3968) , (0, 0.3452) , (0,1.2284) , (0,1.2596)
ve
(1.0047,4.7199)
39
6. SONUÇ VE ÖNERİLER
İki
değişkenli
Marshal-Olkin
dağılımından
esinlenerek
iki
değişkenli
Genelleştirilmiş Chen dağılımı elde edilmiş ve bazı dağılımsal özellikleri bulunmuştur.
Elde edilen dağılımın parametrelerinin ML tahminleri için EM algortitması
geliştirilmiştir. Reel bir örnek üzerinde de önerilen dağılımın literatürde bulunan
dağılımlara modellemede alternatif olacağı gösterilmiştir.
Genelleştirilmiş Chen dağılımı dışındaki genelleştirilmiş (üstelleştirimiş)
dağılımlar kullanılarak Marshall-Olkin yöntemiyle farklı iki değişkenli dağılımlar elde
edilebilir. Hatta bu tez çalışmasındaki sonuçlar üstelleştirilmiş dağılımlar için
genelleştirilebilir.
40
7. KAYNAKLAR
Aarset, M.V., 1987, "How to identify a bathtub failure rate?", IEEE Transactions on
Reliability, vol. 36, 106-108.
Akaike, H., 1969, "Fitting autoregressive model for regression", Annals of the Institute
of Statistical Mathematics, vol. 21, 243 - 247.
Bain, L. J., 1974, "Analysis of the linear failure rate distribution", Technometrics, vol.
15, 875 - 887.
Barlow, R.E. and Proschan, F.,1981, Statistical Theory of Reliability and Life Testing,
Probability Models, Silver Spring, Maryland.
Blomqvist, N., 1950, “On a measure of dependence between two random variables",
Annals of Mathematical Statistics, vol. 21, 593 - 600.
Chen Z., 2000, “A new two-parameter lifetime distribution with bathtub shape or
increasing failure rate function”, Stat. Prob. Lett. 49 155–161.
Domma, F., 2009, “Some properties of the bivariate Burr type III distribution",
Statisics, to appear, DOI:10.1080/02331880902986547.
Franco, M. and Vivo, J-M, 2009, “A multivariate extension of Sarhan and
Balakrishnan’s bivariate distribution and its aging and dependence properties",
Journal of Multivariate Analysis, to appear DOI:10.1016/j/jmva.2009.08.008.
Joe, H., 1997 Multivariate model and dependence concept, Chapman and Hall, London.
Kim, G., Silvapulle, M.J. and Silvapulle, P., 2006, “Comparison of semiparametric and
parametric methods for estimating copulas", Computational Statistics and Data
Analysis, vol. 51, 2836 – 2850.
Kundu, D. and Gupta, R.D., 2009, “Bivariate generalized exponential distribution",
Journal of Multivariate Analysis, vol 100, 581 - 593.
Lehmann, E.L., 1966, “Some concepts of dependence", Ann. Math. Statist., 37, 1137 1153.
Lin, C.T., Wu, S.J.S., Balakrishnan, N., 2003, “Parameter estimation for the linear
hazard rate distribution based on records and inter-record times", Communications
in Statistics - Theory and Methods, vol. 32, 729 – 748.
Lin, C.T., Wu, S.J.S., Balakrishnan, N., 2006, “Monte Carlo methods for Bayesian
inference on the linear hazard rate distribution", Communications in Statistics –
Theory and Methods, vol. 35, 575 - 590.
Marshall, A.W. and Olkin, I., 1967, "A multivariate exponential model", Journal of the
American Statistical Association, vol. 62, 30 - 44.
41
Meintanis, S.G., 2007, "Test of fit for Marshall-Olkin distributions with applications",
Journal of Statistical Planning and Inference, vol. 137, 3954 - 3963.
Mudholkar, G.S., Srivastava, D.K. and Freimer, M., 1995, "The exponentiated Weibull
family; a reanalysis of the bus motor failure data", Technometrics, 37, 436 - 445.
Nelsen, R.B., 1999, An introduction to copulas, 2nd edition, Springer, New York.
Öztürk, F. (1993). Matematiksel İstatistik, AÜFF Basımevi.
Pandey, A., Singh, A. and Zimmer, W.J. (1993), \Bayes estimation of the linear hazard
model", IEEE Transactions on Reliability, vol. 42, 636 - 640.
Rastogi M.K., Tripathi Y.M, Wu S.J., 2012, Estimating the parameters of a bathtubshaped distribution under progressive type-II censoring, Journal of Applied
Statistics, 39:11, 2389-2411.
Rastogi M.K., Tripathi Y.M, 2013, “Estimation using hybrid censored data from a twoparameter distribution with bathtub shape” Computational Statistics & Data
Analysis 67, 268–281.
Rohatgi , V. K., Ehsanes Saleh, A. K. Md. 2001. An introduction to probability and
statistics, Wiley.
Sarhan, A. and Balakrishnan, N., 2007, "A new class of bivariate distributions and its
mixture", Journal of Multivariate Analysis, vol. 98, 1508 - 1527.
Sarhan, A. and Kundu, D., 2009, "Generalized linear failure rate distribution", Communications in Statistics - Theory and Methods, vol. 38, 642 - 660.
Sarhan, A.M., Hamilton, D.C., Smith, B., 2012, Parameter estimation for a twoparameter bathtub-shaped lifetime distribution. Applied Mathematical Modelling
36, 5380–5392.
Sarhan A.M., Apaloo J., 2013, Exponentiated modified Weibull extension distribution,
Reliability Engineering and System Safety 112(4):137–44.
Schwarz, G., 1978, "Estimating the dimension of a model", Annals of Statistics, vol. 6,
461 - 464.
Tamer , Seçkin, Karakuzu , Cihan. Parçacık Sürüsü Optimizasyon Algoritması ve
Benzetim ÖrnekleriWeb: http://Www.Emo.Org.Tr/Ekler/E5d75028d92047a_Ek.
Pdf.
Sen, A. and Bhattacharyya, G.K., 1995, "Inference procedures for linear failure rate
model", Journal of Statistical Planning and Inference, vol. 46, 59 - 76.
Wu S.J., 2008, Estimation of the two-parameter bathtub-shaped lifetime distribution
with progressive censoring, Journal of Applied Statistics 35,10, 1139-1150
42
Wu S.F., Wu C.C., Chou C.H., Lin H.M., 2011, Statistical inferences of a twoparameter distribution with the bathtub shape based on progressive censored
sample, Journal of Statistical Computation and Simulation, 81, 3, 315-329.
Wu, S.-J., Kuş, C., 2009. On estimation based on progressive first-failure-censored
sampling. Computational Statistics and Data Analysis 53, 3659–3670.
43
EKLER
Kullanılan Matlab Kodları
EK-1. Sürü Algoritması için Matlab Kodu
clear all; close all; clc
D=5; %vektor_boyut;
N=20; %population size (total function evaluations will be itmax*N)
itmax=1000;
c1=2; c2=2.5;
wmax=0.9; wmin=0.1; %set to same value for constant w
w=linspace(wmax,wmin,itmax); %linear variation of w
ag_bas_min=0; % 0 ile 100 arasında başlangıç ağırlıklarının
belirlenmesi
ag_bas_max=10;%
x= rand(N,D).*(ag_bas_max-ag_bas_min)+ ag_bas_min ;
%Problem and velocity bounds
ub=ones(1,D)*100; %/*lower bounds of the parameters. */
lb=ones(1,D)*0;%/*upper bound of the parameters.*/
vlb=ones(1,D)*-20;
vub=ones(1,D)*20;
% vmin=0;
% vmax=5;
Range = repmat((ub-lb),[N 1]);
Lower = repmat(lb, [N 1]);
% x = rand(N,D).* Range + Lower;
q=Range/4;
% vmax=2; vmin=0;
v=q.*rand(N,D);
%v=zeros(N,D);
objfun='objfun';
ObjVal=feval(objfun,x);% maliyet fonkuna gönderilen de?erler
%Find gbest and pbest (in this case coincides with x)
[fgbest,igbest]=min(ObjVal);
gbest=x(igbest,:);
pbest=x; fpbest=ObjVal;
%Iterate
for it=1:itmax;
%Update velocities and positions
v(1:N,1:D)=w(it)*v(1:N,1:D)+c1*rand*(pbest(1:N,1:D)x(1:N,1:D))+c2*rand*(repmat(gbest,N,1)-x(1:N,1:D));
%
%
%
%
if v>vmax
v=vmax;
end
44
%
%
%
if v<vmin
v=vmin;
end
for ii=1:N
ind=find(v(ii,:)<vlb);
v(ii,ind)=vlb(ind);
ind=find(v(ii,:)>vub);
v(ii,ind)=vub(ind);
end
x(1:N,1:D)=x(1:N,1:D)+v(1:N,1:D);
for ii=1:N
ind=find(x(ii,:)<lb);
x(ii,ind)=lb(ind);
ind=find(x(ii,:)>ub);
x(ii,ind)=ub(ind);
end
%Evaluate objectives
ObjVal=feval(objfun,x);
%Find gbest and pbest
[minf,iminf]=min(ObjVal);
if minf<= fgbest
fgbest=minf; gbest=x(iminf,:);
end
inewpb=find(ObjVal<=fpbest);
pbest(inewpb,:)=x(inewpb,:); fpbest(inewpb)=ObjVal(inewpb);
fprintf('İter=%d ObjVal=%g\n',it,fgbest);
gbest_grafik(it,:)=gbest(1,:);
end %end loop on iterations
45
EK-2 Örnek 1 için Nelder-Maid, EM Algoritması ve Güven Aralıklarını veren
Matlab Kodu
clc;clear;
rand('seed',sum(100*clock));
format long
alpha1=0.5;
alpha2=1;
alpha0=2;
lambda=0.5;
beta=3;
n=37;
ds=1;
eps=0.000001;
alp1say=0;
alp2say=0;
alp0say=0;
lambsay=0;
betsay=0;
%mat=[];
tt1=[0,0,0,0,0;0,0,0,0,0;0,0,0,0,0;0,0,0,0,0;0,0,0,0,0];
tt2=[0,0,0,0,0;0,0,0,0,0;0,0,0,0,0;0,0,0,0,0;0,0,0,0,0];
for j=1:ds
j
u1=log((lambda-log(-rand(n,1).^(1/alpha1)+1))/lambda).^(1/beta);
u2=log((lambda-log(-rand(n,1).^(1/alpha2)+1))/lambda).^(1/beta);
u12=log((lambda-log(-rand(n,1).^(1/alpha0)+1))/lambda).^(1/beta);
t1=max(u1,u12);
t2=max(u2,u12);
t1=[26;63;19;66;40;49;8;69;39;82;72;66;25;41;16;18;22;42;36;34;53;54;5
1;76;64;26;16;44;25;55;49;24;44;42;27;28;2;];
t2=[20;18;19;85;40;49;8;71;39;48;72;62;9;3;75;18;14;42;52;34;39;7;28;6
4;15;48;16;13;14;11;49;24;30;3;47;28;2;];
t=[t1 t2];
n1=0;n2=0;n0=0;
for i=1:n
if (t1(i)==t2(i))
n0=n0+1;
x0(n0,1)=t1(i);
x0(n0,2)=t1(i);
end
if (t1(i)<t2(i))
n1=n1+1;
x1(n1,1)=t1(i);
x1(n1,2)=t2(i);
end
if (t1(i)>t2(i))
n2=n2+1;
x2(n2,1)=t1(i);
x2(n2,2)=t2(i);
end
end
save x1;
save x2;
save x0;
46
%%Nelder&Mead
pp0 = [1,3,0.5,0.4,0.5];
% Starting guess
options = optimset('TolX',1e-5);
[p,fval1] = fminsearch(@objfun,pp0,options);
pa=p;
[H,err] = hessian(@objfun,p);
c1(j,1:5)=p;
kov=inv(H);
clear p;
%%EM algorithm
alp1=1;
alp2=3;
alp0=.5;
lam=0.4;
bet=0.5;
u1=alp0/(alp1+alp0);
u2=alp1/(alp1+alp0);
w1=alp0/(alp2+alp0);
w2=alp2/(alp2+alp0);
a0=0;
for i=1:n0
a0=a0+log(1-exp(lam*(1-exp(x0(i,1)^bet))));
end
a1=0;
a12=0;
for i=1:n1
a1=a1+log(1-exp(lam*(1-exp(x1(i,1)^bet))));
a12=a12+log(1-exp(lam*(1-exp(x1(i,2)^bet))));
end
a2=0;
a22=0;
for i=1:n2
a2=a2+log(1-exp(lam*(1-exp(x2(i,1)^bet))));
a22=a22+log(1-exp(lam*(1-exp(x2(i,2)^bet))));
end
alp1=-(u2*n1+n2)/(a0+a1+a2);
alp2=-(w2*n2+n1)/(a0+a12+a22);
alp0=-(n0+u1*n1+w1*n2)/(a0+a1+a22);
alp10=0;
alp20=0;
lam0=0;
bet0=0;
alp00=0;
h=0;
while (abs(alp1-alp10)>eps || abs(alp2-alp20) >eps || abs(lam-lam0)
>eps || abs(bet-bet0) >eps || abs(alp0-alp00) >eps)
alp10=alp1;
alp20=alp2;
lam0=lam;
bet0=bet;
alp00=alp0;
u1=alp0/(alp1+alp0);
u2=alp1/(alp1+alp0);
w1=alp0/(alp2+alp0);
w2=alp2/(alp2+alp0);
obj2=@(est)-(sum(alp1*log(1-exp(est(1)*(1exp(x0(:,1).^est(2))))))+u1*sum(alp1*log(1-exp(est(1)*(1exp(x1(:,1).^est(2))))))+u2*sum(log(alp1*est(1)*est(2))+(est(2)1)*log(x1(:,1))+est(1)*(1-exp(x1(:,1).^est(2)))+x1(:,1).^est(2)+(alp11)*log(1-exp(est(1)*(1-
47
exp(x1(:,1).^est(2))))))+sum(log(alp1*est(1)*est(2))+(est(2)1)*log(x2(:,1))+est(1)*(1-exp(x2(:,1).^est(2)))+x2(:,1).^est(2)+(alp11)*log(1-exp(est(1)*(1-exp(x2(:,1).^est(2))))))+sum(alp2*log(1exp(est(1)*(1-exp(x0(:,1).^est(2))))))+w1*sum(alp2*log(1exp(est(1)*(1exp(x2(:,2).^est(2))))))+w2*sum(log(alp2*est(1)*est(2))+(est(2)1)*log(x2(:,2))+est(1)*(1-exp(x2(:,2).^est(2)))+x2(:,2).^est(2)+(alp21)*log(1-exp(est(1)*(1exp(x2(:,2).^est(2))))))+sum(log(alp2*est(1)*est(2))+(est(2)1)*log(x1(:,2))+est(1)*(1-exp(x1(:,2).^est(2)))+x1(:,2).^est(2)+(alp21)*log(1-exp(est(1)*(1exp(x1(:,2).^est(2))))))+sum(log(alp0*est(1)*est(2))+(est(2)1)*log(x0(:,1))+est(1)*(1-exp(x0(:,1).^est(2)))+x0(:,1).^est(2)+(alp01)*log(1-exp(est(1)*(1exp(x0(:,1).^est(2))))))+u1*sum(log(alp0*est(1)*est(2))+(est(2)1)*log(x1(:,1))+est(1)*(1-exp(x1(:,1).^est(2)))+x1(:,1).^est(2)+(alp01)*log(1-exp(est(1)*(1-exp(x1(:,1).^est(2))))))+u2*sum(alp0*log(1exp(est(1)*(1exp(x1(:,1).^est(2))))))+w1*sum(log(alp0*est(1)*est(2))+(est(2)1)*log(x2(:,2))+est(1)*(1-exp(x2(:,2).^est(2)))+x2(:,2).^est(2)+(alp01)*log(1-exp(est(1)*(1-exp(x2(:,2).^est(2))))))+w2*sum(alp0*log(1exp(est(1)*(1-exp(x2(:,2).^est(2)))))));
options = optimset('TolX',1e-10);
[est,fval2] = fminsearch(obj2,[lam, bet],options);
lam=est(1);
bet=est(2);
a0=0;
for i=1:n0
a0=a0+log(1-exp(lam*(1-exp(x0(i,1)^bet))));
end
a1=0;
a12=0;
for i=1:n1
a1=a1+log(1-exp(lam*(1-exp(x1(i,1)^bet))));
a12=a12+log(1-exp(lam*(1-exp(x1(i,2)^bet))));
end
a2=0;
a22=0;
for i=1:n2
a2=a2+log(1-exp(lam*(1-exp(x2(i,1)^bet))));
a22=a22+log(1-exp(lam*(1-exp(x2(i,2)^bet))));
end
alp1=-(u2*n1+n2)/(a0+a1+a2);
alp2=-(w2*n2+n1)/(a0+a12+a22);
alp0=-(n0+u1*n1+w1*n2)/(a0+a1+a22);
h=h+1;
pariter(h,1:5)=[alp1,alp2,alp0,lam,bet];
end
p2=[alp1 alp2 alp0 est];
c2(j,1:5)=p2;
aic=2*5+2*fval1;
bic=5*log(n)+2*fval1;
aicbic(j,1:2)=[aic bic]
obj4=@(est2)(sum(est2(1)*log(1-exp(est2(4)*(1exp(x0(:,1).^est2(5))))))+u1*sum(est2(1)*log(1-exp(est2(4)*(1exp(x1(:,1).^est2(5))))))+u2*sum(log(est2(1)*est2(4)*est2(5))+(est2(5)
-1)*log(x1(:,1))+est2(4)*(1exp(x1(:,1).^est2(5)))+x1(:,1).^est2(5)+(est2(1)-1)*log(1exp(est2(4)*(1exp(x1(:,1).^est2(5))))))+sum(log(est2(1)*est2(4)*est2(5))+(est2(5)1)*log(x2(:,1))+est2(4)*(1exp(x2(:,1).^est2(5)))+x2(:,1).^est2(5)+(est2(1)-1)*log(1-
48
exp(est2(4)*(1-exp(x2(:,1).^est2(5))))))+sum(est2(2)*log(1exp(est2(4)*(1-exp(x0(:,1).^est2(5))))))+w1*sum(est2(2)*log(1exp(est2(4)*(1exp(x2(:,2).^est2(5))))))+w2*sum(log(est2(2)*est2(4)*est2(5))+(est2(5)
-1)*log(x2(:,2))+est2(4)*(1exp(x2(:,2).^est2(5)))+x2(:,2).^est2(5)+(est2(2)-1)*log(1exp(est2(4)*(1exp(x2(:,2).^est2(5))))))+sum(log(est2(2)*est2(4)*est2(5))+(est2(5)1)*log(x1(:,2))+est2(4)*(1exp(x1(:,2).^est2(5)))+x1(:,2).^est2(5)+(est2(2)-1)*log(1exp(est2(4)*(1exp(x1(:,2).^est2(5))))))+sum(log(est2(3)*est2(4)*est2(5))+(est2(5)1)*log(x0(:,1))+est2(4)*(1exp(x0(:,1).^est2(5)))+x0(:,1).^est2(5)+(est2(3)-1)*log(1exp(est2(4)*(1exp(x0(:,1).^est2(5))))))+u1*sum(log(est2(3)*est2(4)*est2(5))+(est2(5)
-1)*log(x1(:,1))+est2(4)*(1exp(x1(:,1).^est2(5)))+x1(:,1).^est2(5)+(est2(3)-1)*log(1exp(est2(4)*(1-exp(x1(:,1).^est2(5))))))+u2*sum(est2(3)*log(1exp(est2(4)*(1exp(x1(:,1).^est2(5))))))+w1*sum(log(est2(3)*est2(4)*est2(5))+(est2(5)
-1)*log(x2(:,2))+est2(4)*(1exp(x2(:,2).^est2(5)))+x2(:,2).^est2(5)+(est2(3)-1)*log(1exp(est2(4)*(1-exp(x2(:,2).^est2(5))))))+w2*sum(est2(3)*log(1exp(est2(4)*(1-exp(x2(:,2).^est2(5)))))));
[H2,err2,g2] = hessian(obj4,pa);
[g1,err3]=gradest(obj4,pa);
H3=-H2-g1'*g1;
H4=inv(H3);
tt2=tt2+H4;
%}
lam=4;
bet=5;
clear x1;
clear x2;
clear x0;
alp1alt=pa(1)-sqrt(kov(1,1))*1.96;
alp1ust=pa(1)+sqrt(kov(1,1))*1.96;
if alp1alt<alpha1 && alp1ust>alpha1
alp1say=alp1say+1;
end
[alp1alt alp1ust]
alp2alt=pa(2)-sqrt(kov(2,2))*1.96;
alp2ust=pa(2)+sqrt(kov(2,2))*1.96;
if alp2alt<alpha2 && alp2ust>alpha2
alp2say=alp2say+1;
end
[alp2alt alp2ust]
alp0alt=pa(3)-sqrt(kov(3,3))*1.96;
alp0ust=pa(3)+sqrt(kov(3,3))*1.96;
if alp0alt<alpha0 && alp0ust>alpha0
alp0say=alp0say+1;
end
[alp0alt alp0ust]
lambalt=pa(4)-sqrt(kov(4,4))*1.96;
lambust=pa(4)+sqrt(kov(4,4))*1.96;
if lambalt<lambda && lambust>lambda
49
lambsay=lambsay+1;
end
[lambalt lambust]
betalt=pa(5)-sqrt(kov(5,5))*1.96;
betust=pa(5)+sqrt(kov(5,5))*1.96;
if betalt<beta && betust>beta
betsay=betsay+1;
end
[betalt betust]
end;
tt1/ds
tt2/ds
alp1say/ds
alp2say/ds
alp0say/ds
lambsay/ds
betsay/ds
50
Ek 3. Tablo 2 için Matlab Kodu
clear all;clc;
rand('seed',sum(100*clock));
format long
alp=1;
lamb=4;
bet=5;
eps=0.00001;
n=37;
ds=1;
rs=0;
for ii=1:ds
%y=log((lamb-log(-rand(n,1).^(1/alp)+1))/lamb).^(1/bet);
y=[26;63;19;66;40;49;8;69;39;82;72;66;25;41;16;18;22;42;36;34;53;54;51
;76;64;26;16;44;25;55;49;24;44;42;27;28;2;];
%y=[20;18;19;85;40;49;8;71;39;48;72;62;9;3;75;18;14;42;52;34;39;7;28;6
4;15;48;16;13;14;11;49;24;30;3;47;28;2;];
ii
n=length(y);
x=sort(y);
nx=length(x);
hx=sort(x);
yx=[];
for i=1:nx-1
if hx(i)~=hx(i+1)
yx=[yx;hx(i)];
end
end
if hx(nx-1)~=hx(nx)
yx=[yx;hx(nx)];
end
yn=length(yx);
a1=ecdf(x);
obj3=@(par)-(n*log(par(1)*par(2)*par(3))+(par(3)1)*sum(log(x))+sum(par(2)*(1-exp(x.^par(3)))+x.^par(3))+(par(1)1)*sum(log(1-exp(par(2)*(1-exp(x.^par(3)))))));
pp0 = [1.2,0.7,0.4]';
% Starting guess
options = optimset('TolX',1e-5, 'Algorithm', 'active-set');
A=[ -1 0 0;0 -1 0;0 0 -1];
b=[0; 0; 0];
[par,fval1,exitflag,output,lambda,grad,He]=
fmincon(obj3,pp0,A,b,[],[],[],[],[],options);
-fval1;
aic=2*5+2*fval1;
bic=5*log(n)+2*fval1;
aicbic(ii,1:2)=[aic bic];
a2=(1-exp(par(2)*(1-exp(yx.^par(3))))).^par(1);
for i=1:yn
b1(i,1)=a1(i+1)-a2(i);
b2(i,1)=a2(i)-a1(i);
end
a=max(b1);
b=max(b2);
ks=max(a,b);
t1=0;
for i=1:10000
t1=t1+(-1)^(i-1)*exp(-2*i^2*n*ks^2);
51
end
pval=2*t1;
par
obj5=@(par2) -(n*log(par2(1)*par2(2))+(par2(2)1)*sum(log(x))+sum(par2(1)*(1-exp(x.^par2(2)))+x.^par2(2)));
p0=[0.05,0.33];
[par2,fval2] = fminsearch(obj5,p0);
par2;
-fval2
a2=(1-exp(par2(1)*(1-exp(yx.^par2(1)))));
for i=1:yn
b1(i,1)=a1(i+1)-a2(i);
b2(i,1)=a2(i)-a1(i);
end
a=max(b1);
b=max(b2);
ks2=max(a,b);
t1=0;
for i=1:10000
t1=t1+(-1)^(i-1)*exp(-2*i^2*n*ks^2);
end
kspval2=2*t1;
wilks=exp(-obj5(par2))/exp(-obj3(par));
logwilks=-2*log(exp(-obj5(par2))/exp(-obj3(par)));
wilkspval2=1-chi2cdf(wilks,2);
rs=rs+1;
end
par2;
rs/ds
52
ÖZGEÇMİŞ
KİŞİSEL BİLGİLER
Adı Soyadı
Uyruğu
Doğum Yeri ve Tarihi
Telefon
Faks
e-mail
:
:
:
:
:
:
Umut ÖKSÜZ
T.C
ZONGULDAK 09.09.1987
05378281024
[email protected]
EĞİTİM
Derece
Adı, İlçe, İl
Fener Lisesi (Yabancı Dil Ağırlıklı Lise), Merkez,
Lise
:
Zonguldak
Üniversite
: Selçuk Üniversitesi
Yüksek Lisans :
Doktora
:
Bitirme Yılı
2005
2010
İŞ DENEYİMLERİ
Yıl
2011-
Kurum
Türk Silahlı Kuvvetleri
UZMANLIK ALANI: İSTATİSTİK
YABANCI DİLLER: İNGİLİZCE
Görevi
Öğretim Görevlisi
Download