tahmin edici

advertisement
İKİ DEĞİŞKENLİ BASİT DOĞRUSAL
REGRESYON MODELİ
Regresyon Y ile X (X ler) arasındaki ortalama
ilişkinin matematik fonksiyonla ifadesidir.
E(Y|X)=f(X)=b1  b2 X
Sabit terim
Eğim
X’e bağlı olarak Y’nin ortalamasının nasıl değiştiğini
gösterir.
Yi  b1  b2 X  u
Yi deki değişim=[Düzenli değişim]+[Rassal değişim]
Yi deki değişim=[Açıklanan değişim]+[Açıklanamayan değişim]
Ekonometrik modelin ortaya çıkmasına sebep olan hata teriminin
kaynakları:
ÖLÇME HATALARI: Toplam tüketim ve milli gelir, kiralar ve
hane gelirleri gibi değişkenlerin değerlerinden hareketle
ekonometrik bir modeli tahmin ediyoruz. ‘‘Bu değerler nasıl
tespit edilmektedir’’sorusunun cevabı bize ölçme hatalarını
açıklayacaktır.
• Tarım ve sanayi sektöründe üreticilerin fiyatlarını tespit ederken
üreticiler yanlış beyanda bulunabilir. Yine hanelerle anket
yaparken gelirlerini düşük beyan ederken, çeşitli mal ve
hizmetler(kira,gıda,ulaştırma, vb.) yaptıkları harcama tutarlarını
olduğundan fazla söyleyebilirler. İşte bu tür hatalara ölçme
hataları veya sistematik hatalar denir.
• Bütün bu hatalar tüketim veya gelirler veyahut başka bir konuda
topladığımız rakamların gerçeklerden sapmasına sebep olurlar ki
bunların hepsine birden ölçme hataları denir.
• C ve Yd değerleri gerçeğe nazaran (C+X) ve (Yd+Z) gibi sapmalı
olacaktır. Böylece,
C=a+bYd
de 𝑎 ve
𝑏
tahmini değerleri, X ve Z sapmaları nisbetinde
güvenilemez olacaktır.
• İktisat kanunlarının doğruluğu veya anlaşılabilmesi, istatistik
verilerinin (tüketim,gelir, kira, nüfus miktarları ile ilgili
rakamların) kalitesine, doğruluğuna ve elde bulunmasına
bağlıdır.
• Bu rakamların objektif ve doğru bir şekilde toplanamaması halinde
ortaya çıkan ölçme hataları ortadan kaldırılamamaktadır. İstatistik
ve ekonometride gerçekleştirilen tüm metodolojik yenilikler,
bunların hatalı verilere uygulanması durumunda faydasız olacaktır.
TOPLAMA HATALARI: Ekonomik analizlerde birbirinden farklı
hane halklarına veya kişilere ait değerler toplanır ve bunların
ortalaması hesaplanır.(toplam tüketim,ortalama tüketim,ortalama
gelir gibi)
• Her ortalama ise serisini tek bir kıymetle ifade eden bir tahmindir.
• Ortalama hesabı ile her hane veya birime ait değerler bir tek
değere indirilmiş olmakta ve birimlerin kendi değerleri(özellikleri)
kaybolmaktadır.
• En yüksek gelirli ile en düşük gelirli; en yüksek kira ödeyenle en
az kira ödeyen ortalama gelir veya ortalama kira tutarı ile bir
tutulmaktadır. Burada bir hata olduğu açıktır, bu hatalarada
‘‘toplama hataları denilmektedir.’’
ÖRNEKLEME
STOKASTİK
HATALARI(TESADÜFİ
HATALAR):
Memurların
HATALAR,
dalgınlığı
veya
dikkatsizliği sonucu bazı rakamların yanlış yazılması ile ortaya
çıkan hatalarla örnekleme yapılması sebebiyle ortaya çıkan
hataları kapsar.
• Örneğin, Türkiye’de ortalama kirayı bulabilmek için, toplam 3
milyon kiracıdan %1’ini (30bin) seçerek örnekleme yapılabilir.
%1 örnekleme yerine binde bir yani 3bin kiracı alabiliriz veya 12
yıllık dönem yerine 25 yıllık dönem alabiliriz.
• Bu farklı hane sayısı veya yıl sayısı (örnek büyüklüğü) ile
yapılacak kira ve tüketim fonksiyonları için farklı katsayılar (a
ve b’ler) bulunacaktır. Muhtelif örnekler arasında, örneğe giren
birimlerin kiraları arasındaki farklılıklar sebebiyle ortaya çıkan
tahmin farklılıkları örnekleme hatalarını oluşturur.
• Bu hatalar artı ve eksi iki yönlüdür. Yani mümkün olan bütün
örnekler çekildiği ve kira fonksiyonu tahmin edildiğinde
𝑌 = 𝑏1 + 𝑏2 𝑋
, 𝑏1 ve 𝑏2 ’lerin bir kısmı anakütle gerçek b1 ve b2
katsayılarından küçük; bir kısmının da bu anakütle değerlerinden
büyük ve dağılımlarının normal olduğu görülür.
• Bu sebeple üç milyonluk anakütleden çekilebilecek tüm
örneklerin, 𝑏1 𝑣𝑒 𝑏2 katsayı tahminleri hesaplanır ve ayrı ayrı
ortalamaları veya beklenen değerleri 𝐸 𝑏1 𝑣𝑒 𝐸(𝑏2 )
hesaplanırsa, 𝐸 𝑏1 = 𝑏1 = 𝑎𝑛𝑎𝑘ü𝑡𝑙𝑒 𝑠𝑎𝑏𝑖𝑡 𝑡𝑒𝑟𝑖𝑚𝑖 ve
𝐸 𝑏2 = 𝑏2 = 𝑎𝑛𝑎𝑘ü𝑡𝑙𝑒 𝑟𝑒𝑔𝑟𝑒𝑠𝑦𝑜𝑛 𝑘𝑎𝑡𝑠𝑎𝑦ı𝑠ı (marjinal kira
tüketim eğilimi)’dır.
• Ölçme hataları, ortadan kaldırılmadığı halde örnekleme hataları
iki yönlü (artı ve eksi) olduklarından birbirinin tesirini ortadan
kaldırabilirler.
• SPESİFİKASYON HATALARI: İktisadi teori,gerçeğin bilerek
basitleştirilmiş şeklidir. Toplam tüketim sadece harcanabilir gelire
bağlı değildir, tüketicilerin zevkleri, fiyatlar seviyesi, servet gelir
dağılımı, yaş piramidi, tüketicilerin son zamanlardaki gelir
durumu gibi diğer bazı bağımsız değişkenlerede bağlıdır.
• Modele tüm bu değişkenleri alabilsek bile-ki uygulamalarda veri
noksanlığı gibi sebeplerle bu mümkün olamamaktadırdeğişkenler arasındaki ilişki C=a+b Yd şeklinde doğrusal
olmayabilir.
• Gerçek ilişki;
𝐶 = 𝑎𝑖 𝑙𝑜𝑔𝑌𝑑 + 𝑎2 𝑦 𝑥 𝑎3 𝑠ℎ 𝑌𝑑
gibi veya daha karmaşık bir ilişki olabilir. Veya tüketim fonksiyonu
böyle tek denklemli değilde, 6 denklemli bir model olarak çözülmesi
gerekebilir. Bütün bu sebeplerden ortaya çıkan hatalar
“spesifikasyon hataları” denilmektedir. Bu hatalar ekonometrik bir
araştırmada ilk olarak göz önünde tutulması gereken hatalardır.
E(y|x) = b0 + b1x
.{
u4
y
y4
y3
y2
y1
u2 {.
.} u3
} u1
.
x1
x2
x3
x4
x
Y
Yˆ  b1  b2 X
y2
ΔY= b2 ΔX
y1
ΔX
b1
x1
x2
X
Doğrusal denklemin grafiği düz bir çizgi olup sabit ve eğim
katsayılarını birbirinden ayırma özelliğine sahiptir. Sabit sayı
X=0 olduğu zaman Y’nin alacağı azami değer ve eğim ise ΔY/ ΔX
oranı olup X üzerindeki bir noktadan diğer bir noktaya olan
hareketliliği göstermektedir.
b1 ve b2 hakkında bazı çıkarsamalar:
Eğer b2 pozitif ise çizginin veya doğrunun eğimi
soldan sağa yukarıya doğru; yok eğer negatif ise
tersi geçerlidir.
Eğer b2’in mutlak değeri büyükse doğru daha
dik olmaktadır.
Eğer b2= 0 ise doğru X eksenine b1 noktasında
paralleldir.
Bir çok fonksiyonlar düz çizgi halinde değildirler
Anakütle Regresyon Denklemi
Örneğin: 4000 nüfuslu bir kasabada 500 hane bulunsun ve
bunlardan sadece 60’ı memur olsun.
Örnek Regresyon Denklemi
En Küçük Kareler Denklemleri
n
n
i 1
i 1
2
2
e
 i   Y  b 0  b1 X 
İfadesini minimize eden parametre tahmincilerinin değerlerini bulabilmek için
eşitliğin b0 ve b1 ‘e göre türevleri alınıp 0’a eşitlenir.
b0‘a göre türev alınırsa;
2
n
n


2
Y  b 0  b1 X 
e



i
b 0 i 1
b 0 i 1
b1‘e göre türev alınırsa;
2
n
n


2
Y  b 0  b1 X 
e



i
b1 i 1
b1 i 1
n
 2 X  Y  b 0  b1 X 
n
 2 Y  b 0  b1 X 
i 1
i 1
Her iki denklemi de 0’a eşitlersek;
n
 2 Y  b0  b1 X   0
i 1
n
 Y  b
0  b1 X   0
n
 2. X .Y  b0  b1 X   0
i 1
n
 X .Y  b
i 1
0
 b1 X   0
n
 2 Y  b0  b1 X   0
i 1
n
 Y  b0  b1 X   0
i 1
n
 2. X .Y  b0  b1 X   0
i 1
n
 X .Y  b
i 1
0
 b1 X   0
Parantezleri açarsak;
 Y  n.b0  b1  X  0
 XY  b0  X  b1  X 2  0
Bu denklemlere doğrunun NORMAL DENKLEMLERİ denir.
Normal denklemler alt alta yazılıp birlikte çözüldüklerinde b0 ve b1
tahmincileri bulunur.
( X ).(  Y )
 XY 
n
 Y  n.b0  b1  X
b1 
2
(

X
)
2
2

X

 XY  b0  X  b1  X
n
b0  Y  b1 X
şeklindeki formüller yardımıyla da tahminciler bulunabilir.
Ortalamadan Sapmalar Yoluyla En Küçük Kareler Denklemlerinin
İspatı
 xy
b̂ 2 
2
x
b̂1  Y  b̂ 2 X
olduğundan
Bu ifadenin her iki tarafını n ile böldüğümüzde
Elde edilen ifade çıkarılırsa ;
Veya
elde edilir.
Bu eşitlik ortalamalar orjinine göre regresyon denklemidir.
Ortalamalar orjinine göre regresyon denkleminden tahmini
anakütle regresyon denklemi şöyle yazılabilir:
elde edilir.
olmak üzere,
Hata terimleri kareleri toplamı şu şekilde ifade edilebilir:
Bu ifadenin
‘e göre türevi alınıp sıfıra eşitlendiğinde;
elde edilir.
için diğer bir formül ise şöyledir:
Basit En Küçük Kareler Regresyon Modelinin
Varsayımları
Varsayım 1: Hata terimi ui ortalaması sıfıra eşit stokastik bir
değişkendir:
• Hata terimi u, pozitif ve negatif her iki yöndeki çok sayıda
sebeplerin toplamının etkisini göstermektedir. Bu sebepten
anakütle hata terimi u, X’in her değeri için şansa bağlı olarak
pozitif, negatif veya sıfır değerlerini belli bir ihtimalle
alabilmektedir. Yani u stokastik bir değişkendir ve değerleri
önceden kesin olarak bilinmemektedir.
• Bazı bağımsız değişkenlerin modele alınamaması, modelin
matematiksel biçiminin yanlış seçilmiş olması, değişkenlerdeki
ölçme hataları, fertlerin davranışlarının yaradılış icabı farklı
olması gibi durumlar u’nun artı değer alabileceği gibi eksi değer
de alabileceğini gösterir.
• Modele dahil edilmeyen değişkenlerin etkisi, bazen Y’yi
gözlenebilecek olan değerinden daha büyük bazen de daha küçük
değerli yapabilecektir. Yani genelde, sürekli olarak artış yönünde
veya sürekli olarak azalış yönünde olan sapmalar(farklar)
beklenmeyecektir. Bu da u’nun stokastik olduğu anlamına gelir.
• u’lar sürekli artan veya sürekli azalan bir görünüm arzetmezler,
düzensiz bir görünüm sergilerler.
• Ayrıca, ui nin muhtelif değerleri birbirinden bağımsız stokastik
değişkenlerdir.
• Tüketim örneğinde, u’nun stokastik ve değerlerinin birbirinden
bağımsız olması şöyle açıklanabilir:
Bir hane için ui hata terim değerini pozitif elde etme ihtimali ne
artar, ne de azalır. Ayrıca u hata terimi değerlerinin dağılımının
normal, ortalamasının sıfır ve varyansının 𝜎𝑢2𝑖 olduğunu
varsayacağız.
• Sonuç olarak,
𝑢𝑖 ∼ 𝑁(0, 𝜎𝑢2𝑖 )
yazılabilir. Yani ui ler, birbirinden bağımsız, sıfır ortalamalı, eş,t
varyanslı normal dağılımlıdır.
Varsayım 2: Hata terimi u normal dağılımlıdır:
• EKK tahmincilerinin ihtimal dağılımları, ui nin ihtimal
dağılımı hakkında yapılan varsayıma bağlıdır. Bu sebepten b
tahminleri konusunda bir test uygulamak gerektiğinde (t,F
testi gibi)dağılımlarının normal olması gerekir, bu da ui nin
dağılımının normal olmasını gerektirmektedir.
• Uygulamalarda anakütle u değerleri bilinmediğinden,
Merkezi Limit Teoremi’ne göre normal dağıldıkları kabul
edilir.
E(ui)=0
u’ların normal dağılımı
ui değerleri
• Normal dağılım eğrisinde, absiste u’nun ortalamasına (0)
tekabül eden noktadan çıkılacak dikmenin iki tarafı tam bir simetri
arzeder. ui normal dağılıyorsa, EKK 𝑏1 𝑣𝑒 𝑏2 nin tahmincileride
normal dağılırlar.
• Uygulamalarda u’nun dağılımının normal olup olmadığı,
Lilliefors grafik testi, χ2 uygunluk testi ve Jarque-Bera testi ile
araştırılmaktadır.
Varsayım 3: Hata terimi ui değerleri arasında ilişki(otokorelasyon)
yoktur:
• u’nun herhangi bir ui değeri kendisinden önceki uj değeri ile
bağımlı değildir. Bu varsayım ui ve uj nin kovaryanslarının sıfıra
eşit olmasını gerektirir:
Kov(ui ,uj )=E[ui – E(ui)] [E[uj – E(uj)]
varsayım 1’e göre E(ui)=E(uj)=0’dır. O halde,
Kov(ui ,uj )=E(uiuj)=0, i≠j
Bu varsayım, Kov(Yi ,Yj )=0, i≠j varsayımı demektir.
Varsayım 4: Hata terimi ui nin varyansı eşittir,sabittir.
(homoskedastiklik veya eşit varyanslılık)
•
ui nin varyansının her Xi için eşit olduğu varsayımı şöyle ifade
edilmektedir:
Var(ui │Xi)= E[ui – E(ui)]2
Varsayım 1’e göre E(ui)=0 olduğundan,
Var(ui │Xi)= E[ui2]
Var(ui │Xi)=σ2 veya Var(ui)=σ2
(1)
(1) eşit varyanslık halini göstermektedir.
• Bu varsayımın anlamı şudur: Her Xi değeri için hata terimi ui’nin
varyansı belli bir sabit sayı olup σ2 ’ye eşittir. Buna
homoskedastiklik varsayımı, veya eşit(homo) dağılan(skedastik),
veya eşit varyans varsayımı da denir.
• Varsayım 5: Bağımsız değişken X, hata terimi u ile ilişkili
olmayıp, stokastik değildir:
• Bağımsız değişken Xi ile hata terimi ui arasında ilişki yoktur, yani
kovaryansları sıfıra eşittir:
Kov(ui,Xi)= E[ui – E(ui)] [Xi – E(Xi)]
Kov(ui ,Xi)=0
• X değişkeninin birden fazla olduğu çoklu modellerde de ui ile her
X değişkeni arasındaki kovaryans sıfıra eşit olmalıdır:
Kov(ui ,X2)=Kov(ui ,X3)=0
• Bu varsaymın anlamı şudur:
Anakütle Regresyon Denkleminde Xi ve u’nun Y’ye etkisi
ayrıayrıdır(toplanabilirdir). Eğer, X ile u arasında ilişki varsa,
herbirinin Y bağımlı değişkeni üzerindeki etkisini ferdi olarak
takdir edemeyiz.
Eğer X ile u arasında aynı yönde pozitif ilişki varsa, u artarken
X’de artacak ve u azalırken X’de azalacaktır. Benzer şekilde X ile
ters yönde negatif ilişkili iseler, u azalırken X artar ve u artarken
X azalır. Bu nedenle, X ve u’nun Y üzerindeki etkisinin tahmini
mümkün olmayacaktır.
Varsayım 6: Bağımsız değişken X, tekrarlı örneklere göre
sabittir. Xi ile ui arasında ilişki olmaması yani Kov(ui,Xi)=0
varsayımı X’in stokastik bir değişken olmamasını (tesadüfi
dağılmasını) gerektirir. Bu da istatistiki olarak, anakütleden
çekilebilecek tüm örnekler için X değerlerinin sabit değerli
olduğunu gösterir.(aynı X değişkeni değerleri için ayrı Y
değerleri sözkonusu.) Şöyleki:
Kov(ui,Xi)= E[ui – E(ui)] [Xi – E(Xi)]
Varsayım 1’e göre E(ui)=0 olduğundan:
Kov(ui,Xi)= E[ui(Xi – E(Xi)]
= E[uiXi– uiE(Xi)]
Xi ‘ler sabit kabul edilirse,
E[E(Xi)]=E(Xi)
Kov(ui,Xi)= E(uiXi)– E(ui)E(Xi)
Varsayım 1’ e göre E(ui)=0’dır. Yani;
Kov(ui,Xi)= E(uiXi)
= 0 (Varsayım 5 gereği)
Varsayım 7: Bağımsız değişken X’in varyansı sonlu pozitif
bir sayı olmalıdır.
Anakütleden çekilebilecek örneklerin herbiri için X değişkeni
değerlerinin sabit kabul edilmesi,X değişkeninin tüm
değerlerinin eşit olması demek değildir.
Buna rağmen X değerlerinin aynı zamanda eşit olması
halinde ,
Burada tüm X değerleri eşit ise
‘dır ve payda
olacaktır. Böylece sabit/0=
ve dolayısıyla
Yani
olacağından
tahmin edilemeyecektir.
,
Sonlu olmalıdır. Burada Q sonlu pozitif sabit bir sayıyı
göstermektedir.
Varsayım 8: Modelin spesifikasyonu doğrudur.
İki değişkenli doğrusal regresyon modelinin EKK ile
tahmininde kabul edilen en önemli varsayımlardan biri
regresyon modelinin spesifikasyonunun doğru yapıldığı,
modelin spesifikasyon hatası taşıyıp taşımadığıdır.
Modele bazı değişkenlerin alınmaması , eğrisel bir fonksiyon
alınması gerekirken doğrusal fonksiyon alınması, model
değişkenleri
konusunda
hatalı
varsayımlar
yapılması
hallerinde tahmin edilen fonksiyon güvenilir olmayacak,
spesifikasyon hatalı olacaktır.
Varsayım 9: Bağımsız değişkenler arasında İlişki yoktur.
(Çoklu doğrusal Bağlantı olmaması Varsayımı)
EKKY’nin bu varsayımı, birden fazla bağımsız değişkeni
olan çoklu modellerle ilgilidir. Bu varsayıma göre ,çoklu
modellerde bağımsız değişkenler arasında ilişki yoktur.
Bağımlı Değişken Y nin Dağılımı
Y bağımlı değişkeninin ortalaması
E (Y )  b1  b2 X
Varyansı
Var (Yi )  E (Yi  E (Yi ))  E (ui )  
2
olduğu gösterilecektir.
2
2
u
1. Y nin ortalaması kendisinin beklenen değerine eşittir.
Yi  b1  b2 X  ui
Beklenen değer alındığında
E (Yi )  E (b1  b2 X  ui )
E (Yi )  E (b1  b2 X )  E (ui )
E (ui )  0
b1 ve b2 parametreler iken Xi değerleri değişmez değerler
kümesinden geldikleri için
E (Yi )  b1  b2 X
bulunur.
2. Yi nin varyansı
Var (Yi )  E (Yi  E (Yi )) 2  E (ui 2 )   u2
Yi  b1  b2 X  ui
ve
E (Yi )  b1  b2 X
eşitliklerini varyans tanımında yerine koyarsak
Var (Yi )  E (b1  b2 X  u i b1  b2 X )  E (ui )  
2
ui lar sabit varyanslıdır. Yani hepsinin varyansı
sabit değerlidir.
E (ui2 )   u2

2
2
u
Yani
Var (Yi )  E (Yi  E (Yi ))  E (ui )  
2
2
2
u
2
u
3. Yi nin dağılımı normaldir.
Yi nin dağılımının biçimi, ui nin dağılımının biçimiyle
belirlenir ve bu dağılım varsayım gereğince normaldir. b1 ve
b2 sabit parametreler olmaları nedeniyle Yi nin dağılımını
etkilemezler. Ayrıca Xi açıklayıcı değişkenin değerleri de
varsayım gereğince değişmez değerler kümesinde olduğundan
Yi nin dağılım biçimini etkilemezler.
ÖRNEK REGRESYON DENKLEMİ
Ŷi  b̂1  b̂ 2 X i
Katsayıların Tahmini
 Normal Denklemler ile,
 Doğrudan Formüller ile,
 Ortalamadan Farklar ile,
Tüketim
Gelir
75
80
88
100
95
120
125
140
115
160
127
180
165
200
172
220
183
240
225
260
NORMAL DENKLEMLER
SY = n b̂1 +
SXY= SX b̂1 +
SX
b̂ 2 SX2
b̂ 2
SY=? , SX=? , SXY= ? , SX2= ? , n
Y
75
88
95
125
115
127
165
172
183
225
X
80
100
120
140
160
180
200
220
240
260
YX
6000
8800
11400
17500
18400
22860
33000
37840
43920
58500
X2
6400
10000
14400
19600
25600
32400
40000
48400
57600
67600
SY=1370 SX=1700 SYX=258220 SX2=322000
NORMAL DENKLEMLER
-170 /
1370 =
10 b̂1+
258220 = 1700 b̂1+
1700
b̂ 2 322000
b̂ 2
-232900 = -1700 b̂1 - b̂ 2 289000
258220 = 1700 b̂1 + b̂ 2 322000
25320 = b̂ 2 33000
b̂ 2 = 0.7672727
b̂1 = 6.5636364
ÖRNEK REGRESYON DENKLEMİ
Ŷi  b̂1  b̂ 2 X i
ˆ  6.5636364  0.7672727 X
Y
DOĞRUDAN FORMÜLLER
 X  Y   X  XY
b̂1 
n  X 2  (  X) 2
2
(322000).(1370)  (1700).( 258220)

10.(322000)  (1700) 2
= 6.5636364
DOĞRUDAN FORMÜLLER
n  XY   X  Y
b̂ 2 
2
2
n  X  ( X)
(10).( 258220)  (1700)(1370)

2
(10)(322000)  (1700)
= 0.7672727
ÖRNEK REGRESYON DENKLEMİ
Ŷi  b̂1  b̂ 2 X i
ˆ  6.5636364  0.7672727 X
Y
ORTALAMADAN FARKLAR
 xy
b̂ 2 
2
x
b̂1  Y  b̂ 2 X
X? Y ?
y=?
x=?
Syx=?
Sx2=?
Y
Y
i
y
N (X i , Y )
•
•
^ ^
ÖRD= Yi =b1 +b2X i
Yi
Y
0
•
•
i
•
•
•
•
X
•
•
•
y
•
}
e
i
}
•
i
•
y^ =y -e = Y - Y
i
i
i
i
x
( X, Y)
Xi
X
Ortalamalar Orijinine göre Örnek Regresyon Doğrusu
(ÖRD)
ORTALAMADAN FARKLAR
Y
75
88
95
125
115
127
165
172
183
225
X
y  YY
80
100
120
140
160
180
200
220
240
260
-62
-49
-42
-12
-22
-10
28
35
46
88
SY=1370 SX=1700
Y  137
X  170
Sy=0
x  X X
-90
-70
-50
-30
-10
10
30
50
70
90
Sx=0
ORTALAMADAN FARKLAR
yx
x2
y2
5580
3430
2100
360
220
-100
840
1750
3220
7920
8100
4900
2500
900
100
100
900
2500
4900
8100
3844
2401
1764
144
484
100
784
1225
2116
7744
Syx=25320
Sx2=33000
Sy2=20606
ORTALAMADAN FARKLAR
 xy
b̂ 2 
2
x
25320

33000
= 0.7672727
b̂1  Y  b̂ 2 X =137-(0.7672).(170) = 6.5636364
ÖRNEK REGRESYON DENKLEMİ
Ŷi  b̂1  b̂ 2 X i
ˆ  6.5636364  0.7672727 X
Y
ELASTİKİYETLERİN HESAPLANMASI
EY
Y / Yi dY Xi
E yx 
 lim

.
EX x 0 X / X i dX Yi
•Nokta Elastikiyet
•Ortalama Elastikiyet
NOKTA ELASTİKİYET
E YX
0
dY Xi

.
ˆ
dX Y
0
Xi
 b̂ 2 .
ˆ
Y0
X0 = 130
E YX0 130
130
 0.767.
ˆ
Y0
NOKTA ELASTİKİYET
Ŷ0  6.5636364  0.7672727 X0
 6.5636364  0.7672727 (130)
 106.3091
E Y X 0 130
130
 0.767.
 0.94
106.3091
ORTALAMA ELASTİKİYET
E YX
dY X

.
dX Y
Y  137
E YX
;
X
 b̂ 2 .
Y
X  170
170
 0.767 .
137
= 0.95
Tahminin Standart Hatası ve Varyansı
Tahminin standart hatası, regresyon doğrusu etrafındaki
dağılımın bir ölçüsüdür.
S(Yi  Ŷ )
s
n
S(Yi  Ŷi )
s
n2
2
Sei2

n
2

Se
n2
2
2
S
e
?
S
(
Y

Ŷ
)

Ŷ  ?
2
i
(n30 ise)
(n<30 ise)
Tahminin Standart Hatası ve Varyansı
Ŷi  b̂1  b̂ 2 X i
Ŷi  6.5636364  0.7672727 X i
Tahminin Standart Hatası ve Varyansı
Tüketim
Gelir
Ŷi
75
88
95
125
115
127
165
172
183
225
80
100
120
140
160
180
200
220
240
260
67.9455
83.2909
98.6364
113.9818
129.3273
144.6727
160.0182
175.3636
190.7091
206.0545
SY=1370
SŶi  1370
e i  Yi  Ŷi
7.0545
4.7091
-3.6364
11.0182
-14.3273
-17.6727
4.9818
-3.3636
-7.7091
18.9455
Se=0
ei2  (Yi  Ŷi ) 2
49.7666
22.1755
13.2231
121.4003
205.2707
312.3253
24.8185
11.3140
59.4301
358.9302
Se2=1178.6545
Tahminin Standart Hatası ve Varyansı
1178.6545
s
10 - 2
 147.3318
=12.138
s2= 147.3318
SY 2  b1SY  b 2SYX
s
n2
SY2 =?
SY = ?
SYX=?
b1 =?
b2 =?
208296  6.5636364(1370)  0.7672727(258220)
s
= 12.138
10  2
Tahminin Standart Hatası ve Varyansı
s
y  YY
s
Sy  b 2 Syx
n2
2
x  XX
Sy2 = ?
Syx = ?
20606  0.7672727(25320)
10  2
b2= ?
= 12.138
DEĞİŞKENLİKLER
S(Y  Y) 2  S(Ŷ  Y ) 2  S(Y  Ŷ) 2
Y
Yi
y
2
ŷ

2
2
e


S(Y  Y) 2 
S(Y  Ŷ) 2

S(Ŷ  Y ) 2
Y

X
Xi
X
DEĞİŞKENLİKLER
S(Y  Y)
3844
2401
1764
144
484
100
784
1225
2116
7744
Sy2=20600
2
S(Ŷ  Y ) 2
S(Y  Ŷ) 2
4768.5302
2884.6664
1471.7686
529.8367
58.8707
58.8707
529.8367
1471.7686
2884.6664
4768.5302
49.7666
22.1755
13.2231
121.4003
205.2707
312.3253
24.8185
11.3140
59.4301
358.9302
Sŷ 2  19427.3455
Se2=1178.6545
DEĞİŞKENLİKLER
S(Y  Y )2  S(Ŷ  Y ) 2 
Sy2
Sŷ 2
=
+
2
ˆ
S(Y  Y )
Se2
20606 = 19427.3455 + 1178.6545
Sy
Sŷ
Se



n2 n2 n2
2
2
2
s s s
2
y
2
yˆ
2
varyanslar
20606 19427.3455 1178.6545


2575.75 = 2428.4182 + 141.3318
10  2
10  2
10  2
BELİRLİLİK KATSAYISI
Noktaların doğruya yakınlık derecesini göstermektedir.
Y’deki değişmelerin yüzde kaçının X tarafından
açıklanabildiğini ifade etmektedir.
R2 0 ile 1 arasında değişmektedir.
KORELASYON KATSAYISI
Y ile X arasındaki ilişkinin yönünü ve şiddetini
vermektedir.
-1 ile +1 arasında yer almaktadır.
BELİRLİLİK KATSAYISI
s 2ŷ
Açıklanan varyans 2428.4182

r  2 
2575.75
sy
Toplam varyans
2
= 0.9428
2
s
Açıklanmay an varyans
147.3318
2
r  1 2 
 1
sy
Toplam varyans
2775.75
2
s
Açıklanmay an varyans 147.3318
2

1 r  2 
2575.75
sy
Toplam varyans
= 0.9428
= 0.0572
2
2
ˆ
ˆ
S(Y  Y )
S(Y  Y )
S(Y  Y )


2
2
2
S(Y  Y )
S(Y  Y )
S(Y  Y )
2
2
ˆ
y  y 
2
2
y y
2
e
y
2
2
2
2
ˆ
e
TD RBD HBD  y





2
2
TD TD
TD
y
y
 
e


y
2
1 r
2
2
e


y
2
1 r
2
2
Belirsizlik katsayısı
BELİRLİLİK KATSAYISI
2
2
(
25320
)
(
S
xy
)
2
r  2 2 
(33000)(20606)
Sx Sy
r
Sxy
= 0.9428
25320
= 0.9710

2
2
(33000)( 20606)
Sx Sy
DAĞILMA DİYAGRAMLARI
Y
Y
Y=3+0.5X
15
5
15
•
•
10
•
•
•
•
r=0.82
s=1.94
5
3
5
10
15
••
10
•
3
-6
Y=3+0.5X
20 X
-6
•
•
•
5
•
10
(a)
Y
15
10
Y
•
••
• •
•
Y=3+0.5X
•
10
r=0.82
s=1.94
•
••
•
•
5
3
3
5
10
(c)
20 X
15
15
5
-6
r=0.82
s=1.94
(b)
Y=3+0.5X
Aşırı kıymet
•
•
15
20 X
-6
5
10
(d)
r=0.82
s=1.94
15
20 X
STANDARTLAŞTIRILMIŞ HATA TERİMLERİ
ei
7.0545
4.7091
-3.6364
11.0182
-14.3273
-17.6727
4.9818
-3.3636
-7.7091
18.9455
ei/s
0.5812
0.38796
-0.29959
0.90774
-1.18037
-1.45598
0.41043
-0.27712
-0.63512
1.56084
Xi
80
100
120
140
160
180
200
220
240
260
e/s 'nin dağılma diyagramı
2
0
60
-2
100
140
180
220
260
EKK Tahminlerinin Standart Hataları ve
Kullanılışı
EKK tahminleri
b̂1
ve
b̂2 örnek verilerine dayanarak
hesaplanır.
Bir anakütleden bir çok örnek çekilebilir, bu durumda her örnek seti
için farklı tahminciler elde edilecektir. Örnek değerlerinin anakütle
değerleri b1 ve b2 ye ne ölçüde yakın olduğu standart hatalarla
hesaplanır.
Standart hata, tahmincinin örnekleme dağılımının standart
hatasıdır.
Bir tahmincinin örnekleme dağılımı anakütleden seçilebilecek aynı
büyüklükteki örneklerin
b̂ lerin dağılımıdır. (75 milyar)
60 hanelik anakütleden çekebileceğimiz onluk (75 milyar) örnek için
hesaplanan
b̂2
değerlerinin örnekleme dağılımı ortalama
E (bˆ2 )
etrafında normal dağılmaktadır.
Anakütleden çekilen örnekler için hesaplanan EKK
b̂2
leri
örneklerin farlı değerli Y(tüketim) ve X(gelir gibi) e sahip
hanelerden oluşması gibi örnekleme hatalarından dolayı gerçek
değerinden farklıdır.
Örnekleme hataları + ve – yönde aynı ihtimalle ortaya çıkan
hatalardır. Ortalama ölçüsü standart hatadır.
b2
En Küçük Karalerle Parametre Tahminlerinin
Ortalama ve Varyansı
b̂1’in ortalaması:
E (bˆ1 )  b1
b̂1’in varyansı:
2
2 X
ˆ
ˆ
Var (b1 )  E (b1  b1 )   u .
n x
2
i
2
i
b̂2’nin ortalaması:
E (bˆ2 )  b2
b̂2 ’n'in varyansı:
1
2
2
ˆ
ˆ
Var (b2 )  E (b2  b2 )   u .
2
x
i
EKK’de Parametre Tahminlerinin Ortalama ve
Varyansı
𝒃𝟐 ’nin Ortalamasının İspatı:
Y=b1+b2X
𝒃𝟐’nin ortalaması=E( )=b2
𝑦𝑖 = 𝑌𝑖 − 𝑌 eşitliğini yerine koyalım,
𝑏2 =
𝑥𝑖 𝑌𝑖 − 𝑌
=
2
𝑥𝑖
𝑥𝑖 𝑌𝑖 𝑌 𝑥𝑖
2 −
𝑥𝑖
𝑥𝑖2
𝑥𝑖 = 0 olduğundan,
𝑏2 =
𝑥𝑖 𝑌𝑖
2 =
𝑥𝑖
𝑥𝑖
2 𝑌𝑖
𝑥𝑖
Varsayım gereği x değerleri sabittir. Bunun sonucu olarak
𝑥𝑖 / 𝑥𝑖2 oranıda örnekten örneğe aynı kalır. Bu orana k
diyecek olursak, 𝑏2 ’nin tahminini şu biçimde
gösterebiliriz:
𝑏2 =
𝑘𝑖 𝑌𝑖
Y=b1+b2X+u eşitliğindeki Yi’yi burada yerine koyar ve bulduğumuz
ifadeyi yeniden düzenlersek;
𝑏2 = 𝑘𝑖 b1 + b2 X + u
= 𝑏1 𝑘 + 𝑏2 𝑘𝑋 + 𝑘𝑢
(∑k=0
∑kX=1)
∑k=0 için ispat:
𝑘=
𝑥𝑖
2 =
𝑥𝑖
𝑋−𝑋
0
=
2
2 =0
𝑥𝑖
𝑥𝑖
∑kX=1 için ispat:
𝑘𝑋 =
𝑥𝑖 𝑋
2 =
𝑥𝑖
𝑋−𝑋 𝑋
=
2
𝑥𝑖
𝑋2 − 𝑋 𝑋
𝑥𝑖2
Pay için;
𝑋 2 − 𝑋 𝑋 = 𝑋 2 − 𝑋 𝑛𝑋 = 𝑋 2 − 𝑛𝑋 2
Payda için;
𝑋
𝑋=
𝑛
𝑋 = 𝑛. 𝑋
𝑋 2 = (𝑋 − 𝑋)2 = (𝑋 2 − 2𝑋𝑋 + 𝑋 2 )
= 𝑋 2 − 2𝑋 𝑋 + 𝑛. 𝑋 2
𝑋
2
= 𝑋 −2
. 𝑋 + 𝑛. 𝑋 2
𝑛
=
2
(
𝑋
)
𝑋 2
2
𝑋 −2
+ 𝑛. (
)
𝑛
𝑛
= 𝑋 2 − 2.
𝑋
𝑛
2
( 𝑋)2
+
𝑛
1
= 𝑋 − . ( 𝑋)2
𝑛
2
1
= 𝑋 − . ( 𝑋)( 𝑋)) = 𝑋 2 − 𝑋 𝑋
𝑛
2
= 𝑋 2 − 𝑋. 𝑛. 𝑋 = 𝑋 2 − 𝑛. (𝑋)2
𝑋 2 − 𝑛. 𝑋 2
𝑘𝑋 =
=1
2
2
𝑋 − 𝑛. 𝑋
Bu nedenle;
x i ui
𝑏2 = b2 + ku = b2 +
xi2
𝐸 𝑏2 = 𝐸 𝑏2
𝐸 𝑏2 = 𝑏2
𝑥𝑖 𝑢𝑖
+ 𝐸(
2 )
𝑥𝑖
𝒃𝟐 ’nin varyansı: Şu ifadenin doğruluğu ispatlanabilir:
𝑉𝑎𝑟 𝑏2 = 𝐸 𝑏2 − 𝐸(𝑏2 )
2
= 𝐸(𝑏2 − 𝑏2 ) =
İspat:
𝑏2 =
𝜎𝑢2 .
𝑥𝑖
2 . 𝑌𝑖 =
𝑥𝑖
𝑉𝑎𝑟 𝑏2 = 𝑉𝑎𝑟
2
1
𝑥𝑖2
𝑘𝑖 𝑌𝑖
𝑘𝑖 𝑌𝑖 = 𝑘𝑖2 𝑉𝑎𝑟 𝑌𝑖
𝑉𝑎𝑟 𝑌𝑖 = 𝜎𝑢2
𝑉𝑎𝑟 𝑏2 = 𝑘𝑖2 𝜎𝑢2 = 𝜎𝑢2
=
𝜎𝑢2 .
1
𝑥𝑖2
𝑥𝑖2
𝑥𝑖2 2
 𝒃𝟏’in ortalaması için ispat:
𝐸 𝑏1 = 𝑏1
𝑏1 = 𝑌 − 𝑏2 𝑋
b2 = k i Yi
Y
b1 = Y − X. k i Yi =
− X k i Yi
n
1
= 𝑌 ( − 𝑋 𝑘𝑖 )
𝑛
n,k ve x ortalamanın örnekten örneğe sabit kaldığını
düşünürsek ve Y=b1+b2X’ ide yerine koyarsak;
𝐸 𝑏1 =
1
− 𝑋𝑘𝑖
𝑛
𝑏1 + 𝑏2 𝑋
𝑏1 𝑏2 𝑋
= ( +
− 𝑋𝑘𝑖 𝑏1 − 𝑋𝑘𝑖 𝑏2 𝑋)
𝑛
𝑛
= 𝑏1 + 𝑏2 𝑋 − 𝑏2 𝑋 = 𝑏1
𝐸 𝑏1 =b1
’in Varyansı:
İspat:
olduğundan;
dir.
Katsayıların Standart Hataları
SX 2
s (b̂1 )  s .
2
nSx
s (b̂ 2 ) 
s
Sx 2
322000
 12.138 .
10.(33000)
12.138
= 0.0668

33000
= 11.99
Aralık Tahminleri
b̂ 2 ±t a/2 . s( b̂ 2 )
= 0.7672727  2.306 (0.0668)
0.6132319< b2 <0.9213135
b̂1 ± t a/2 . s( b̂1 )
= 6.5636364  2.306 (11.99)
-21.0853 < b1 < 34.2126
Hipotez Testleri
Güven Aralığı Yaklaşımı İle
0.6132319< b2 <0.9213135
-21.0853 < b1 < 34.2126
Hipotez Testleri
Anlamlılık Testi Yaklaşımı İle
•Hipotezlerin Formüle Edilmesi
•Tablo Değerlerinin Bulunması
•Test İstatistiğinin Hesaplanması
•Karar Verilmesi
Hipotez Testleri
1.Aşama
H0: b 2 = 0
H1 : b 2  0
2.Aşama
a=?
= 0.05
; S.d.=? = n-k = 10-2=8
ta,sd =? t0.05,8=? =2.306
3.Aşama
t hes
4.Aşama
b̂ 2  b
*
2
0.7672727  0

? 
0.0668
s(b̂ 2 )
|thes= 11.4861 | > |ttab= 2.306 |
H0 hipotezi reddedilebilir
=11.4861
Regresyon ve Varyans Analizi
Değişkenlik Kaynağı
Regresyona Bağlı
Değişkenlik=RBD
Sapma Kareleri
Toplamı=SKT
2
ŷ
S
Serbestlik
Derecesi=sd
f1=k-1=1
Hata Terimine Bağlı
Değişkenlik=HBD
Se2
f1=n-k
Toplam
Değişkenlik=TD
Sy2
n-1
SKT Ortalaması=
SKTO
2
ŷ
S
 e2
=s2
nk
Regresyon ve Varyans Analizi
Değişkenlik
SKT
Kaynağı
RBD
19427.3455
HBD
1178.6545
TD
20606
sd
SKTO
2-1=1
10-2=8
19427.3455
147.3318
10-1=9
19427.3455
Fhes=
=131.8612
147.3318
EKK Modelinde Önceden Tahmin
•İleriye Ait Tahmin
•Önceden Tahmin
•Örnekten Tahmin Edilen İlişkinin Ayni Kaldığı
•X Değerlerinin Aynı Eğilimde Olacağı
Y’nin Aralık Tahmini
Ŷ0 ± t a/2
1 (X 0  X )
. s 1 
2
n
x
Ŷ0 ± ta/2 . s (Ŷ0 )
2
Y0’ın güven aralığı
Y’nin Aralık Tahmini
X0=80
Ŷ0
= 67.9455
67.9455 ±2.306.12.318
2

(
80
)
1
170
1 
10
33000
35.47840 Y0| X0 100.41251
Y’nin Ortalamasının Aralık Tahmini
Ŷ 0 ± t a /2 . s
Ŷ0 ± ta/2 . s (Ŷ0 )
 X )2
1 (X 0

2
x
n
Y’nin ortalamasının güven aralığı
Y’nin Ortalamasının Aralık Tahmini
X0=80
Ŷ0
= 67.9455
67.9455 ±2.306.12.318
2

1  ( 80 170)
10
33000
51.49402 E(Y0| X0) 84.39689
Y’nin Güven Aralıkları
Y’ninAralık Tahminleri
X0
Alt Sınır
Üst Sınır
80.00
100.00
120.00
140.00
160.00
180.00
200.00
220.00
240.00
260.00
35.47840
52.01572
68.28577
84.26359
99.93034
115.27579
130.29996
145.01304
159.43390
173.58749
100.41251
114.56610
128.98696
143.70004
158.72421
174.06966
189.73641
205.71423
221.98428
238.52160
Y’nin OrtalamasınınAralık
Tahminleri
Alt Sınır
Üst Sınır
51.49402
69.33821
86.90184
103.99618
120.34284
135.68829
150.03254
163.62911
176.75639
189.60311
84.39689
97.24361
110.37089
123.96746
138.31171
153.65716
170.00382
187.09816
204.66179
222.50598
Y
240
220
200
180
160
140
120
100
80
60
40
20
0
0
X
100
200
300
En Küçük Kareler Tahminlerinin Özellikleri
1. Tahmin Edicilerin Küçük Örnek Özellikleri
Genellikle bir tahminin ana kütle parametresinin gerçek
değerine yakın olması ve bu gerçek parametre
yakınlarında dar bir aralıkta değişmesi istenir. Ana kütle
parametresine ‘yakınlık’ çeşitli ekonometri tahmin
yöntemleri ile bulunmuş tahminlerin örnekteki
dağılımların ortalaması ve varyansıyla ölçülür.
En Küçük Kareler Tahminlerinin Özellikleri
 Burada her zamanki varsayımsal yenilemeli
örnekleme süreci kullanılır,
yani her biri n
gözlemli çok sayıda örneğin alındığı varsayılır.
Ekonometri yöntemlerinin her birini kullanarak her
örnekten b̂ hesaplanıp dağılımları oluşturulur.
 Küçük örnekten bulunmuş iyi bir tahmin edici için
temel ölçütler:Sapmasızlık, En küçük varyans,
Etkinlik, Doğrusal en iyi, sapmasızlık (DES), En
küçük ortalama hata karesi (OHK), Yeterlilik
dir.
a. Sapmasız Tahmin Edici
 Bir tahmin edicinin sapması, beklenen değeriyle
gerçek parametre arasındaki fark olarak tanımlanır.
Sapma= E (bˆ) -b
 Eğer sapma sıfırsa yani E (bˆ)= b ise, sapmasız olur.
Bu da örneklerin sayısı artıkça, sapmasız tahmin
edicinin, parametrenin gerçek değerlerine yaklaştığı
anlamına gelir. Sapmasız bir tahmin edici ‘ortalama
olarak’ parametrenin gerçek değerini verir.
 Aranan bir özellik olmasına karşın, sapmasızlık
kendi başına çok önemli değildir. Ancak küçük bir
varyansla birleşirse önemli olur.
a. Sapmasız Tahmin Edici
 b̂ , b’nin sapmasız
tahmin edicisidir
 b̂ , b’nin sapmalı tahmin
edicisidir
En Küçük Kareler Tahmin Edicilerinin
Doğrusallıkları ve Sapmasızlıkları
(1)
ve
olup bu da bize ’ in doğrusal bir tahmin edici olduğunu
gösterir, çünkü Y’nin doğrusal bir fonksiyonudur.
Aslında ‘ ler tartı olarak alındığında
‘ in Y’nin tartılı
ortalaması olduğu söylenebilir. Benzer biçimde
gösterilebileceği gibi, ’de doğrusal bir tahmin edicidir.
Sırası gelmişken
1)
’lerin şu özelliklerini görelim:
’lerin olasılıklı olmadığı varsayıldığına göre
’ler de olasılıklı değildir.
2)
3)
4)
Bu özellikler
bilir.
’nin tanımından doğrudan türetile-
Örnek olarak;
(verili bir örneklem için
dan sapmalar toplamı
bilindiği ve ortalamahep sıfır olduğu için)
Şimdi
biçimindeki anakütle
regresyon fonksiyonunu (ARF) denklem (1) de
yerine koyalım:
(2)
Burada ’ nin daha önce sözü edilen özelliklerinden
yararlanılmıştır.
Şimdi de denklem (2)’nin her iki yanının beklenen
değerini alalım. , olasılıklı olmadığı için ’yi sabit
gibi düşünür ve varsayım gereği
olduğunu
göz önünde bulundurursak;
sonucunu elde ederiz. Öyleyse,
sapmasız bir tahmin edicisidir.
Benzer biçimde kanıtlanabileceği gibi
sapmasız bir tahmin edicisidir.
’nin
,
,
’nin
b. En Küçük Varyanslı Tahmin Edici (En İyi Tahmin
Edici)…
Bir tahmin, başka ekonometri yöntemleriyle bulunmuş başka
herhangi bir tahminle karşılaştırıldığında en küçük varyansa sahip
olduğu görülürse en iyi tahmindir.b̂ nin en iyi olma koşulu:
E[bˆ  E(bˆ)]2 <
~
~ 2
E[b  E (b )]
Ya da;
~
Var(b̂ )<Var(b )
~
Burada b , gerçek parametre b nin (sapmasız olması gerekmeyen)
herhangi bir başka tahminidir.
b. …En Küçük Varyanslı Tahmin Edici (En İyi Tahmin Edici)
 Varyansı küçük olduğu halde sapması büyük olan bir tahmin
edici, gerçek b parametresinden oldukça uzak bir değer
etrafında toplanabilmektedir.
b̂ , b nin büyük varyanslı sapmasız tahmin edicisidir.
~
b , b nin küçük varyanslı sapmalı bir tahmin edicisidir.
En Küçük Kareler Tahmin Edicilerinin En Küçük
Varyans Özelliği
en küçük kareler tahmin edicisinin hem
sapmasız hem doğrusal olduğu gösterilmişti. (aynı
şey için
de geçerlidir.)
Bu tahmin edicilerin , bütün doğrusal sapmasız
tahmin ediciler içinde en düşük varyanslılar
olduğunu gösterebilmek için ,
en küçük kareler
tahmin edicisini ele alalım:
Burada,
biçimindedir. Bu da bize,
tartı görevi görmek
üzere,
‘nin Y’lerin tartılı ortalaması olduğunu
gösterir.
‘nin başka bir doğrusal tahmin edicisini şöyle
tanımlayalım:
olsun.
Buradaki wi ‘ler tartılıdır fakat
gerekmez.
‘lere eşit olması
Dolayısıyla
‘nın sapmasız olabilmesi için şunların
sağlanması gerekir:
Ayrıca şöyle de yazabiliriz:
(Açıklama:
)
(Açıklama:
)
(matematik hilesine
dikkat edin)
(3)
Burada, sondan ikinci satırın en son terimi ortadan
kayboldu.(Neden?)
(3) denkleminin son terimi sabit olduğundan
nin
varyansı ilk terimle oynayarak en düşüğe
indirgenebilir.
yazarsak (3) eşitliği şuna indirgenir;
Sözle belirtirsek “wi tartıları = ki en küçük kareler
tartıları” iken
, doğrusal tahmin edicisinin
varyansı , en küçük kareler tahmin edicisinin
varyansına eşittir; tartılar eşit değilse ;
olur.
Bir başka deyişle; eğer β2 ‘nin en küçük varyanslı
sapmasız, doğrusal bir tahmin edicisi varsa o da en
küçük kareler tahmin edicisidir.
Benzer biçimde gösterilebileceği gibi , ‘de β1’in
en küçük varyanslı, sapmasız, doğrusal bir tahmin
edicisidir.
c. Etkin Tahmin Edici
 Bir tahmin edici; sapmasız ve başka herhangi sapmasız
tahmin ediciyle karşılaştırıldığında daha düşük varyansa
sahipse etkin tahmin edicidir.
 Aşağıdaki iki koşul yerine getirilirse b̂ etkindir:
(i) E (bˆ)  b
ve
(ii) E[bˆ  E (bˆ)] 2  E[b *  E (b * )] 2
 Burada b * , gerçek b nin başka bir sapmasız tahmin
edicisidir. Başka bir deyişle, etkin tahmin edici, bütün
tahmin sapmasız ediciler sınıfı içinde en düşük (en iyi)
varyansa sahip olan tahmin edicidir.
d. Doğrusal Tahmin Edici…
 Bir tahmin edici, örnekteki gözlemlerin doğrusal bir
fonksiyonuysa doğrusal sayılır. Örnek gözlemleri
veriyken, doğrusal bir tahmin edici şu biçimi alır:
k1Y1  k2Y2  ...knYn
Burada ki ler sabit değerlerdir.
 Örneğin
1
k1  k2  ...kn 
n
olduğundan
Y
örnek ortalaması doğrusal bir tahmin edicidir. Çünkü:
d...Doğrusal Tahmin Edici…
Y 1
1
1
1
1

Y
  Y  Y  Y  ...  Y   Y  Y  ...  Y )
i
n
n
i
n
1
2
n
n
1
n
2
n
n
örnek ortalaması hesaplanırken her gözleme, 1/n ye eşit olan
aynı k ağırlığı verilmiştir.
Y
e. Doğrusal en iyi sapmasız tahmin edici
(DEST)
 Bir tahmin edici, doğrusalsa sapmasızsa ve gerçek
b nin öteki doğrusal sapmasız tahmin edicileriyle
karşılaştırıldığında en küçük varyansa sahipse,
DEST olur.
f. En küçük ortalama hata kareli (OHK)
tahmin edici
 Ortalama hata karesi ölçütü, sapmasızlık ve en küçük
varyans özelliklerinin bir bileşimidir. Burada OHK, tahmin
edicinin, ana kütledeki gerçek parametre b ile olan farkının
karelesinin beklenen değeri olarak tanımlanır:
OHK (bˆ)  E (bˆ  b) 2
 OHK nin, tahmin edicinin varyansıyla sapma karesinin
toplamına eşit olduğu gösterilebilir:
OHK (bˆ)  Var(bˆ)  sapma 2 (bˆ)
f… En küçük ortalama hata kareli (OHK)
tahmin edici…
İspat:
OHK  E (bˆ  b)2


 E bˆ  E (bˆ)  E (bˆ)  b 


2
2
2


 E bˆ  E (bˆ)    E (bˆ)  b   2E [bˆ  E (bˆ)][ E (bˆ)  b]

 

2
E bˆ  E (bˆ)   Var (bˆ)



2
 E bˆ  b   sapma 2 (b)


f. En küçük ortalama hata kareli (OHK)
tahmin edici
E [bˆ  E (bˆ)][ E (bˆ)  b]  0


Çünkü:


2
ˆ (bˆ)   E (bˆ)   bb
ˆ  bE (bˆ)
 E bE


2
2


  E (bˆ)    E (bˆ)   bE bˆ  bE bˆ  0

 

2 ˆ
ˆ
ˆ
OHK (b)  Var(b)  sapma (b)
g. Yeterli tahmin edici
 Yeterli bir tahmin edici, gerçek parametre
hakkında bir örneğin içerdiği bütün bilgileri
kullanıma koyan bir tahmin edicidir. Bu başka
hiçbir tahmin edicinin, tahmin edilmekte olan
gerçek ana kütle parametresi hakkında daha fazla
bilgi sunamayacağı anlamına gelir.
2. Tahmin edicilerin büyük örnek
özellikleri: Asimtotik özellikler
 Büyük örnek özelliklerinin, bir tahminin iyiliğini
belirleme ölçütü olarak kullanılması, örneğin
sonsuz büyük olmasını gerektirir. İşte bu nedenle
bu özelliklere asimtotik özellikler denir. Örnek
büyük olduğu zaman bu özelliklerin yaklaşık
olarak
sağlandığı
varsayılır.
Özellikler
ise
şunlardır: asimtotik sapmazlık, tutarlılık ve
asimtotik etkinlik.
2...Tahmin edicilerin büyük örnek
özellikleri: Asimtotik özellikler
Asimtotik dağılım:
Bir dizi rassal değişken düşünüldüğünde;
{Xn }  Xn1  .Xn2   X(nT )
Bunlardan her birinin kendi dağılımı, ortalaması ve
varyansı vardır. Dağılımlar gitgide artan örnek
büyüklüklerinden oluşturulmuştur. nT sonsuza
giderken bu dağılımlar da belli bir dağılıma doğru
yaklaşıyor olabilirler. İşte bu dağılıma {X(n)} dizisinin
asimtotik dağılımı denir.
a. Asimtotik sapmasızlık…
Eğer b̂ edicisinin asimtotik ortalaması, ana kütlenin
gerçek b parametresine eşit ise, bu tahmin edici, bu
parametrenin asimtotik sapmasız tahmin edicisidir.
lim E (bˆ n )  b
n
bˆ ' nin


 
ˆ )  b
asimtotik

lim
E
(
b

  n
 n 
 sapması 


 Bir tahmincinin asimtotik sapması, asimtotik
ortalaması ile gerçek parametre arsındaki farka eşittir.
a… Asimtotik sapmasızlık
Asimtotik bir sapmasız tahmin edici, örnek
büyüklüğü yeterine büyük olduğunda sapması
kaybolan bir tahmin edicidir.
 Eğer bir tahmin edici (sonlu küçük örneklerde)
sapmasızsa aynı zamanda asimtotik sapmasızdır,
ama bunun tersi doğru değildir.
b. Tutarlılık…
Bir b̂ edicisi, aşağıdaki iki koşulla, ana kütlenin b
gerçek parametresinin tutarlı bir tahmin edicisidir:
1.
bˆ,
asimtotik sapmasız olmalıdır.
lim E (bˆ n )  b
n
2. n sonsuza giderken
b̂
'nin varyansı sıfıra yaklaşmalıdır:
lim Var (bˆ)   0

n 
Tutarlılık…
 Eğer varyans sıfırsa, dağılım ana kütlenin gerçek
parametresinin üstünde bir noktada toplanır.
 Bir tahmin edicinin tutarlı olup olmadığını anlamak için, n
arttıkça sapmanın ve varyansının ne olduğuna bakılmalıdır.
(n) büyüdükçe hem sapma hem varyans azalmalı ve limitte
(n   iken) sıfır olmalıdır. Tutarlılık kavramı aşağıda
çizilmiştir. Örnek büyüklüğü artıkça hem sapma hem
varyans azalmaktadır.
c. Asimtotik etkinlik
Eğer
(1) b̂ tutarlıysa
(2)Başka herhangi bir tutarlı tahmin ediciye göre daha küçük
bir asimtotik varyansı varsa
bu tahmin edici ana kütlenin gerçek b parametresinin
asimtotik etkin bir tahmincisidir.
Eğer;
2
2
1
1

*
ˆ
E n (b n   b)  
lim E b n   b 

 n lim
n

 n n 



ise b̂ asimtotik etkindir. Burada b * , b nin başka bir tutarlı
tahmin
edicisidir.
Tutarlı
tahmin
ediciler
karşılaştırıldığında hangisinin varyansı daha hızla
sıfıra yaklaşıyorsa o, asimtotik etkendir.
3. En Küçük Kareler Tahmin Edicilerinin
Özellikleri
 Hata terimi u'nun bazı genel varsayımları yerine
getirmesi, yani ortalamasının sıfır ve varyansının
sabit olması koşuluyla, en küçük kareler
tahmincilerinin DES
( doğrusal, en iyi,
sapmasız) özelliklerini sağlamasına Gauss-Markow
en küçük kareler teoremi denmektedir.
a. Doğrusallık
 En küçük kareler tahminleri b̂1 ve b̂2 gözlenen örnekteki Yi
değerlerinin doğrusal fonksiyonlarıdır. Varsayım gereği Xi ler
hep aynı değerlerle göründüklerine göre en küçük kareler
tahminlerinin yalnız Y değerlerine bağlı olduğu gösterilebilir.
bˆ1  f (Y )
bˆ2  f (Y )
İspat:
xi
ˆ
b2  
Y   kiYi
2 i
 xi
xi
ki 
2
 xi
Varsayım gereği X değerleri sabit değerler kümesidir. Bu
durumda ki lerde örnekten örneğe değişmezler.
…Doğrusallık
Bu durumda şunu yazabiliriz:
bˆ2   kiYi  k1Y1  k2Y2  ...  knYn  f (Y )
Y’lerin doğrusal bir fonksiyonudur. Bağımlı değişken
değerlerinin doğrusal bir bileşimidir.
b̂2
1
ˆ
b1  [  Xki ]Yi
n
X
ve ki
Örnekten örneğe değişmez.
katsayı tahmini sadece Y ye bağlıdır.
b. Sapmasızlık

b̂1 ve b̂2 nin sapmasızlık özelliği E(bˆ1 )  b1 ve E(bˆ2 )  b2
şeklindedir. Bu özelliğin anlamı, örneklerin sayısı
artıkça tahminler de parametrelerin gerçek
değerine yaklaşır. Başka bir deyişle, n sayıda Y ve
X gözleminden oluşan, olanak içindeki bütün
örnekleri seçildiğinde ve b̂1 ile b̂2
tahminleri her örnek için hesaplandığında, bu
tahminlerden çok fazla sayıda elde edilir. Bunların
ortalaması ise ilişkinin parametrelerine eşit olur.
Tahminlerin dağılımı, orta nokta olarak
parametrenin
gerçek
b
değeri
üzerinde
toplanacaktır.
c. En Küçük Varyans
 Gauss-Markow teoremi ispatı: Bu teoreme göre en küçük
kareler tahminleri, başka ekonometri yöntemleriyle
bulunmuş herhangi bir başka doğrusal sapmasız tahmin
ediciler arasında en iyisidir ( varyansı en küçük olandır).
EKK yönteminin tercih edilmesinin temel nedeni de bu
özelliktir.
Doç. Dr. A. Talha YALTA- “Bağlanım Çözümlenmesi” slaytından alıntılar mevcuttur.
Download