İKİ DEĞİŞKENLİ BASİT DOĞRUSAL REGRESYON MODELİ Regresyon Y ile X (X ler) arasındaki ortalama ilişkinin matematik fonksiyonla ifadesidir. E(Y|X)=f(X)=b1 b2 X Sabit terim Eğim X’e bağlı olarak Y’nin ortalamasının nasıl değiştiğini gösterir. Yi b1 b2 X u Yi deki değişim=[Düzenli değişim]+[Rassal değişim] Yi deki değişim=[Açıklanan değişim]+[Açıklanamayan değişim] Ekonometrik modelin ortaya çıkmasına sebep olan hata teriminin kaynakları: ÖLÇME HATALARI: Toplam tüketim ve milli gelir, kiralar ve hane gelirleri gibi değişkenlerin değerlerinden hareketle ekonometrik bir modeli tahmin ediyoruz. ‘‘Bu değerler nasıl tespit edilmektedir’’sorusunun cevabı bize ölçme hatalarını açıklayacaktır. • Tarım ve sanayi sektöründe üreticilerin fiyatlarını tespit ederken üreticiler yanlış beyanda bulunabilir. Yine hanelerle anket yaparken gelirlerini düşük beyan ederken, çeşitli mal ve hizmetler(kira,gıda,ulaştırma, vb.) yaptıkları harcama tutarlarını olduğundan fazla söyleyebilirler. İşte bu tür hatalara ölçme hataları veya sistematik hatalar denir. • Bütün bu hatalar tüketim veya gelirler veyahut başka bir konuda topladığımız rakamların gerçeklerden sapmasına sebep olurlar ki bunların hepsine birden ölçme hataları denir. • C ve Yd değerleri gerçeğe nazaran (C+X) ve (Yd+Z) gibi sapmalı olacaktır. Böylece, C=a+bYd de 𝑎 ve 𝑏 tahmini değerleri, X ve Z sapmaları nisbetinde güvenilemez olacaktır. • İktisat kanunlarının doğruluğu veya anlaşılabilmesi, istatistik verilerinin (tüketim,gelir, kira, nüfus miktarları ile ilgili rakamların) kalitesine, doğruluğuna ve elde bulunmasına bağlıdır. • Bu rakamların objektif ve doğru bir şekilde toplanamaması halinde ortaya çıkan ölçme hataları ortadan kaldırılamamaktadır. İstatistik ve ekonometride gerçekleştirilen tüm metodolojik yenilikler, bunların hatalı verilere uygulanması durumunda faydasız olacaktır. TOPLAMA HATALARI: Ekonomik analizlerde birbirinden farklı hane halklarına veya kişilere ait değerler toplanır ve bunların ortalaması hesaplanır.(toplam tüketim,ortalama tüketim,ortalama gelir gibi) • Her ortalama ise serisini tek bir kıymetle ifade eden bir tahmindir. • Ortalama hesabı ile her hane veya birime ait değerler bir tek değere indirilmiş olmakta ve birimlerin kendi değerleri(özellikleri) kaybolmaktadır. • En yüksek gelirli ile en düşük gelirli; en yüksek kira ödeyenle en az kira ödeyen ortalama gelir veya ortalama kira tutarı ile bir tutulmaktadır. Burada bir hata olduğu açıktır, bu hatalarada ‘‘toplama hataları denilmektedir.’’ ÖRNEKLEME STOKASTİK HATALARI(TESADÜFİ HATALAR): Memurların HATALAR, dalgınlığı veya dikkatsizliği sonucu bazı rakamların yanlış yazılması ile ortaya çıkan hatalarla örnekleme yapılması sebebiyle ortaya çıkan hataları kapsar. • Örneğin, Türkiye’de ortalama kirayı bulabilmek için, toplam 3 milyon kiracıdan %1’ini (30bin) seçerek örnekleme yapılabilir. %1 örnekleme yerine binde bir yani 3bin kiracı alabiliriz veya 12 yıllık dönem yerine 25 yıllık dönem alabiliriz. • Bu farklı hane sayısı veya yıl sayısı (örnek büyüklüğü) ile yapılacak kira ve tüketim fonksiyonları için farklı katsayılar (a ve b’ler) bulunacaktır. Muhtelif örnekler arasında, örneğe giren birimlerin kiraları arasındaki farklılıklar sebebiyle ortaya çıkan tahmin farklılıkları örnekleme hatalarını oluşturur. • Bu hatalar artı ve eksi iki yönlüdür. Yani mümkün olan bütün örnekler çekildiği ve kira fonksiyonu tahmin edildiğinde 𝑌 = 𝑏1 + 𝑏2 𝑋 , 𝑏1 ve 𝑏2 ’lerin bir kısmı anakütle gerçek b1 ve b2 katsayılarından küçük; bir kısmının da bu anakütle değerlerinden büyük ve dağılımlarının normal olduğu görülür. • Bu sebeple üç milyonluk anakütleden çekilebilecek tüm örneklerin, 𝑏1 𝑣𝑒 𝑏2 katsayı tahminleri hesaplanır ve ayrı ayrı ortalamaları veya beklenen değerleri 𝐸 𝑏1 𝑣𝑒 𝐸(𝑏2 ) hesaplanırsa, 𝐸 𝑏1 = 𝑏1 = 𝑎𝑛𝑎𝑘ü𝑡𝑙𝑒 𝑠𝑎𝑏𝑖𝑡 𝑡𝑒𝑟𝑖𝑚𝑖 ve 𝐸 𝑏2 = 𝑏2 = 𝑎𝑛𝑎𝑘ü𝑡𝑙𝑒 𝑟𝑒𝑔𝑟𝑒𝑠𝑦𝑜𝑛 𝑘𝑎𝑡𝑠𝑎𝑦ı𝑠ı (marjinal kira tüketim eğilimi)’dır. • Ölçme hataları, ortadan kaldırılmadığı halde örnekleme hataları iki yönlü (artı ve eksi) olduklarından birbirinin tesirini ortadan kaldırabilirler. • SPESİFİKASYON HATALARI: İktisadi teori,gerçeğin bilerek basitleştirilmiş şeklidir. Toplam tüketim sadece harcanabilir gelire bağlı değildir, tüketicilerin zevkleri, fiyatlar seviyesi, servet gelir dağılımı, yaş piramidi, tüketicilerin son zamanlardaki gelir durumu gibi diğer bazı bağımsız değişkenlerede bağlıdır. • Modele tüm bu değişkenleri alabilsek bile-ki uygulamalarda veri noksanlığı gibi sebeplerle bu mümkün olamamaktadırdeğişkenler arasındaki ilişki C=a+b Yd şeklinde doğrusal olmayabilir. • Gerçek ilişki; 𝐶 = 𝑎𝑖 𝑙𝑜𝑔𝑌𝑑 + 𝑎2 𝑦 𝑥 𝑎3 𝑠ℎ 𝑌𝑑 gibi veya daha karmaşık bir ilişki olabilir. Veya tüketim fonksiyonu böyle tek denklemli değilde, 6 denklemli bir model olarak çözülmesi gerekebilir. Bütün bu sebeplerden ortaya çıkan hatalar “spesifikasyon hataları” denilmektedir. Bu hatalar ekonometrik bir araştırmada ilk olarak göz önünde tutulması gereken hatalardır. E(y|x) = b0 + b1x .{ u4 y y4 y3 y2 y1 u2 {. .} u3 } u1 . x1 x2 x3 x4 x Y Yˆ b1 b2 X y2 ΔY= b2 ΔX y1 ΔX b1 x1 x2 X Doğrusal denklemin grafiği düz bir çizgi olup sabit ve eğim katsayılarını birbirinden ayırma özelliğine sahiptir. Sabit sayı X=0 olduğu zaman Y’nin alacağı azami değer ve eğim ise ΔY/ ΔX oranı olup X üzerindeki bir noktadan diğer bir noktaya olan hareketliliği göstermektedir. b1 ve b2 hakkında bazı çıkarsamalar: Eğer b2 pozitif ise çizginin veya doğrunun eğimi soldan sağa yukarıya doğru; yok eğer negatif ise tersi geçerlidir. Eğer b2’in mutlak değeri büyükse doğru daha dik olmaktadır. Eğer b2= 0 ise doğru X eksenine b1 noktasında paralleldir. Bir çok fonksiyonlar düz çizgi halinde değildirler Anakütle Regresyon Denklemi Örneğin: 4000 nüfuslu bir kasabada 500 hane bulunsun ve bunlardan sadece 60’ı memur olsun. Örnek Regresyon Denklemi En Küçük Kareler Denklemleri n n i 1 i 1 2 2 e i Y b 0 b1 X İfadesini minimize eden parametre tahmincilerinin değerlerini bulabilmek için eşitliğin b0 ve b1 ‘e göre türevleri alınıp 0’a eşitlenir. b0‘a göre türev alınırsa; 2 n n 2 Y b 0 b1 X e i b 0 i 1 b 0 i 1 b1‘e göre türev alınırsa; 2 n n 2 Y b 0 b1 X e i b1 i 1 b1 i 1 n 2 X Y b 0 b1 X n 2 Y b 0 b1 X i 1 i 1 Her iki denklemi de 0’a eşitlersek; n 2 Y b0 b1 X 0 i 1 n Y b 0 b1 X 0 n 2. X .Y b0 b1 X 0 i 1 n X .Y b i 1 0 b1 X 0 n 2 Y b0 b1 X 0 i 1 n Y b0 b1 X 0 i 1 n 2. X .Y b0 b1 X 0 i 1 n X .Y b i 1 0 b1 X 0 Parantezleri açarsak; Y n.b0 b1 X 0 XY b0 X b1 X 2 0 Bu denklemlere doğrunun NORMAL DENKLEMLERİ denir. Normal denklemler alt alta yazılıp birlikte çözüldüklerinde b0 ve b1 tahmincileri bulunur. ( X ).( Y ) XY n Y n.b0 b1 X b1 2 ( X ) 2 2 X XY b0 X b1 X n b0 Y b1 X şeklindeki formüller yardımıyla da tahminciler bulunabilir. Ortalamadan Sapmalar Yoluyla En Küçük Kareler Denklemlerinin İspatı xy b̂ 2 2 x b̂1 Y b̂ 2 X olduğundan Bu ifadenin her iki tarafını n ile böldüğümüzde Elde edilen ifade çıkarılırsa ; Veya elde edilir. Bu eşitlik ortalamalar orjinine göre regresyon denklemidir. Ortalamalar orjinine göre regresyon denkleminden tahmini anakütle regresyon denklemi şöyle yazılabilir: elde edilir. olmak üzere, Hata terimleri kareleri toplamı şu şekilde ifade edilebilir: Bu ifadenin ‘e göre türevi alınıp sıfıra eşitlendiğinde; elde edilir. için diğer bir formül ise şöyledir: Basit En Küçük Kareler Regresyon Modelinin Varsayımları Varsayım 1: Hata terimi ui ortalaması sıfıra eşit stokastik bir değişkendir: • Hata terimi u, pozitif ve negatif her iki yöndeki çok sayıda sebeplerin toplamının etkisini göstermektedir. Bu sebepten anakütle hata terimi u, X’in her değeri için şansa bağlı olarak pozitif, negatif veya sıfır değerlerini belli bir ihtimalle alabilmektedir. Yani u stokastik bir değişkendir ve değerleri önceden kesin olarak bilinmemektedir. • Bazı bağımsız değişkenlerin modele alınamaması, modelin matematiksel biçiminin yanlış seçilmiş olması, değişkenlerdeki ölçme hataları, fertlerin davranışlarının yaradılış icabı farklı olması gibi durumlar u’nun artı değer alabileceği gibi eksi değer de alabileceğini gösterir. • Modele dahil edilmeyen değişkenlerin etkisi, bazen Y’yi gözlenebilecek olan değerinden daha büyük bazen de daha küçük değerli yapabilecektir. Yani genelde, sürekli olarak artış yönünde veya sürekli olarak azalış yönünde olan sapmalar(farklar) beklenmeyecektir. Bu da u’nun stokastik olduğu anlamına gelir. • u’lar sürekli artan veya sürekli azalan bir görünüm arzetmezler, düzensiz bir görünüm sergilerler. • Ayrıca, ui nin muhtelif değerleri birbirinden bağımsız stokastik değişkenlerdir. • Tüketim örneğinde, u’nun stokastik ve değerlerinin birbirinden bağımsız olması şöyle açıklanabilir: Bir hane için ui hata terim değerini pozitif elde etme ihtimali ne artar, ne de azalır. Ayrıca u hata terimi değerlerinin dağılımının normal, ortalamasının sıfır ve varyansının 𝜎𝑢2𝑖 olduğunu varsayacağız. • Sonuç olarak, 𝑢𝑖 ∼ 𝑁(0, 𝜎𝑢2𝑖 ) yazılabilir. Yani ui ler, birbirinden bağımsız, sıfır ortalamalı, eş,t varyanslı normal dağılımlıdır. Varsayım 2: Hata terimi u normal dağılımlıdır: • EKK tahmincilerinin ihtimal dağılımları, ui nin ihtimal dağılımı hakkında yapılan varsayıma bağlıdır. Bu sebepten b tahminleri konusunda bir test uygulamak gerektiğinde (t,F testi gibi)dağılımlarının normal olması gerekir, bu da ui nin dağılımının normal olmasını gerektirmektedir. • Uygulamalarda anakütle u değerleri bilinmediğinden, Merkezi Limit Teoremi’ne göre normal dağıldıkları kabul edilir. E(ui)=0 u’ların normal dağılımı ui değerleri • Normal dağılım eğrisinde, absiste u’nun ortalamasına (0) tekabül eden noktadan çıkılacak dikmenin iki tarafı tam bir simetri arzeder. ui normal dağılıyorsa, EKK 𝑏1 𝑣𝑒 𝑏2 nin tahmincileride normal dağılırlar. • Uygulamalarda u’nun dağılımının normal olup olmadığı, Lilliefors grafik testi, χ2 uygunluk testi ve Jarque-Bera testi ile araştırılmaktadır. Varsayım 3: Hata terimi ui değerleri arasında ilişki(otokorelasyon) yoktur: • u’nun herhangi bir ui değeri kendisinden önceki uj değeri ile bağımlı değildir. Bu varsayım ui ve uj nin kovaryanslarının sıfıra eşit olmasını gerektirir: Kov(ui ,uj )=E[ui – E(ui)] [E[uj – E(uj)] varsayım 1’e göre E(ui)=E(uj)=0’dır. O halde, Kov(ui ,uj )=E(uiuj)=0, i≠j Bu varsayım, Kov(Yi ,Yj )=0, i≠j varsayımı demektir. Varsayım 4: Hata terimi ui nin varyansı eşittir,sabittir. (homoskedastiklik veya eşit varyanslılık) • ui nin varyansının her Xi için eşit olduğu varsayımı şöyle ifade edilmektedir: Var(ui │Xi)= E[ui – E(ui)]2 Varsayım 1’e göre E(ui)=0 olduğundan, Var(ui │Xi)= E[ui2] Var(ui │Xi)=σ2 veya Var(ui)=σ2 (1) (1) eşit varyanslık halini göstermektedir. • Bu varsayımın anlamı şudur: Her Xi değeri için hata terimi ui’nin varyansı belli bir sabit sayı olup σ2 ’ye eşittir. Buna homoskedastiklik varsayımı, veya eşit(homo) dağılan(skedastik), veya eşit varyans varsayımı da denir. • Varsayım 5: Bağımsız değişken X, hata terimi u ile ilişkili olmayıp, stokastik değildir: • Bağımsız değişken Xi ile hata terimi ui arasında ilişki yoktur, yani kovaryansları sıfıra eşittir: Kov(ui,Xi)= E[ui – E(ui)] [Xi – E(Xi)] Kov(ui ,Xi)=0 • X değişkeninin birden fazla olduğu çoklu modellerde de ui ile her X değişkeni arasındaki kovaryans sıfıra eşit olmalıdır: Kov(ui ,X2)=Kov(ui ,X3)=0 • Bu varsaymın anlamı şudur: Anakütle Regresyon Denkleminde Xi ve u’nun Y’ye etkisi ayrıayrıdır(toplanabilirdir). Eğer, X ile u arasında ilişki varsa, herbirinin Y bağımlı değişkeni üzerindeki etkisini ferdi olarak takdir edemeyiz. Eğer X ile u arasında aynı yönde pozitif ilişki varsa, u artarken X’de artacak ve u azalırken X’de azalacaktır. Benzer şekilde X ile ters yönde negatif ilişkili iseler, u azalırken X artar ve u artarken X azalır. Bu nedenle, X ve u’nun Y üzerindeki etkisinin tahmini mümkün olmayacaktır. Varsayım 6: Bağımsız değişken X, tekrarlı örneklere göre sabittir. Xi ile ui arasında ilişki olmaması yani Kov(ui,Xi)=0 varsayımı X’in stokastik bir değişken olmamasını (tesadüfi dağılmasını) gerektirir. Bu da istatistiki olarak, anakütleden çekilebilecek tüm örnekler için X değerlerinin sabit değerli olduğunu gösterir.(aynı X değişkeni değerleri için ayrı Y değerleri sözkonusu.) Şöyleki: Kov(ui,Xi)= E[ui – E(ui)] [Xi – E(Xi)] Varsayım 1’e göre E(ui)=0 olduğundan: Kov(ui,Xi)= E[ui(Xi – E(Xi)] = E[uiXi– uiE(Xi)] Xi ‘ler sabit kabul edilirse, E[E(Xi)]=E(Xi) Kov(ui,Xi)= E(uiXi)– E(ui)E(Xi) Varsayım 1’ e göre E(ui)=0’dır. Yani; Kov(ui,Xi)= E(uiXi) = 0 (Varsayım 5 gereği) Varsayım 7: Bağımsız değişken X’in varyansı sonlu pozitif bir sayı olmalıdır. Anakütleden çekilebilecek örneklerin herbiri için X değişkeni değerlerinin sabit kabul edilmesi,X değişkeninin tüm değerlerinin eşit olması demek değildir. Buna rağmen X değerlerinin aynı zamanda eşit olması halinde , Burada tüm X değerleri eşit ise ‘dır ve payda olacaktır. Böylece sabit/0= ve dolayısıyla Yani olacağından tahmin edilemeyecektir. , Sonlu olmalıdır. Burada Q sonlu pozitif sabit bir sayıyı göstermektedir. Varsayım 8: Modelin spesifikasyonu doğrudur. İki değişkenli doğrusal regresyon modelinin EKK ile tahmininde kabul edilen en önemli varsayımlardan biri regresyon modelinin spesifikasyonunun doğru yapıldığı, modelin spesifikasyon hatası taşıyıp taşımadığıdır. Modele bazı değişkenlerin alınmaması , eğrisel bir fonksiyon alınması gerekirken doğrusal fonksiyon alınması, model değişkenleri konusunda hatalı varsayımlar yapılması hallerinde tahmin edilen fonksiyon güvenilir olmayacak, spesifikasyon hatalı olacaktır. Varsayım 9: Bağımsız değişkenler arasında İlişki yoktur. (Çoklu doğrusal Bağlantı olmaması Varsayımı) EKKY’nin bu varsayımı, birden fazla bağımsız değişkeni olan çoklu modellerle ilgilidir. Bu varsayıma göre ,çoklu modellerde bağımsız değişkenler arasında ilişki yoktur. Bağımlı Değişken Y nin Dağılımı Y bağımlı değişkeninin ortalaması E (Y ) b1 b2 X Varyansı Var (Yi ) E (Yi E (Yi )) E (ui ) 2 olduğu gösterilecektir. 2 2 u 1. Y nin ortalaması kendisinin beklenen değerine eşittir. Yi b1 b2 X ui Beklenen değer alındığında E (Yi ) E (b1 b2 X ui ) E (Yi ) E (b1 b2 X ) E (ui ) E (ui ) 0 b1 ve b2 parametreler iken Xi değerleri değişmez değerler kümesinden geldikleri için E (Yi ) b1 b2 X bulunur. 2. Yi nin varyansı Var (Yi ) E (Yi E (Yi )) 2 E (ui 2 ) u2 Yi b1 b2 X ui ve E (Yi ) b1 b2 X eşitliklerini varyans tanımında yerine koyarsak Var (Yi ) E (b1 b2 X u i b1 b2 X ) E (ui ) 2 ui lar sabit varyanslıdır. Yani hepsinin varyansı sabit değerlidir. E (ui2 ) u2 2 2 u Yani Var (Yi ) E (Yi E (Yi )) E (ui ) 2 2 2 u 2 u 3. Yi nin dağılımı normaldir. Yi nin dağılımının biçimi, ui nin dağılımının biçimiyle belirlenir ve bu dağılım varsayım gereğince normaldir. b1 ve b2 sabit parametreler olmaları nedeniyle Yi nin dağılımını etkilemezler. Ayrıca Xi açıklayıcı değişkenin değerleri de varsayım gereğince değişmez değerler kümesinde olduğundan Yi nin dağılım biçimini etkilemezler. ÖRNEK REGRESYON DENKLEMİ Ŷi b̂1 b̂ 2 X i Katsayıların Tahmini Normal Denklemler ile, Doğrudan Formüller ile, Ortalamadan Farklar ile, Tüketim Gelir 75 80 88 100 95 120 125 140 115 160 127 180 165 200 172 220 183 240 225 260 NORMAL DENKLEMLER SY = n b̂1 + SXY= SX b̂1 + SX b̂ 2 SX2 b̂ 2 SY=? , SX=? , SXY= ? , SX2= ? , n Y 75 88 95 125 115 127 165 172 183 225 X 80 100 120 140 160 180 200 220 240 260 YX 6000 8800 11400 17500 18400 22860 33000 37840 43920 58500 X2 6400 10000 14400 19600 25600 32400 40000 48400 57600 67600 SY=1370 SX=1700 SYX=258220 SX2=322000 NORMAL DENKLEMLER -170 / 1370 = 10 b̂1+ 258220 = 1700 b̂1+ 1700 b̂ 2 322000 b̂ 2 -232900 = -1700 b̂1 - b̂ 2 289000 258220 = 1700 b̂1 + b̂ 2 322000 25320 = b̂ 2 33000 b̂ 2 = 0.7672727 b̂1 = 6.5636364 ÖRNEK REGRESYON DENKLEMİ Ŷi b̂1 b̂ 2 X i ˆ 6.5636364 0.7672727 X Y DOĞRUDAN FORMÜLLER X Y X XY b̂1 n X 2 ( X) 2 2 (322000).(1370) (1700).( 258220) 10.(322000) (1700) 2 = 6.5636364 DOĞRUDAN FORMÜLLER n XY X Y b̂ 2 2 2 n X ( X) (10).( 258220) (1700)(1370) 2 (10)(322000) (1700) = 0.7672727 ÖRNEK REGRESYON DENKLEMİ Ŷi b̂1 b̂ 2 X i ˆ 6.5636364 0.7672727 X Y ORTALAMADAN FARKLAR xy b̂ 2 2 x b̂1 Y b̂ 2 X X? Y ? y=? x=? Syx=? Sx2=? Y Y i y N (X i , Y ) • • ^ ^ ÖRD= Yi =b1 +b2X i Yi Y 0 • • i • • • • X • • • y • } e i } • i • y^ =y -e = Y - Y i i i i x ( X, Y) Xi X Ortalamalar Orijinine göre Örnek Regresyon Doğrusu (ÖRD) ORTALAMADAN FARKLAR Y 75 88 95 125 115 127 165 172 183 225 X y YY 80 100 120 140 160 180 200 220 240 260 -62 -49 -42 -12 -22 -10 28 35 46 88 SY=1370 SX=1700 Y 137 X 170 Sy=0 x X X -90 -70 -50 -30 -10 10 30 50 70 90 Sx=0 ORTALAMADAN FARKLAR yx x2 y2 5580 3430 2100 360 220 -100 840 1750 3220 7920 8100 4900 2500 900 100 100 900 2500 4900 8100 3844 2401 1764 144 484 100 784 1225 2116 7744 Syx=25320 Sx2=33000 Sy2=20606 ORTALAMADAN FARKLAR xy b̂ 2 2 x 25320 33000 = 0.7672727 b̂1 Y b̂ 2 X =137-(0.7672).(170) = 6.5636364 ÖRNEK REGRESYON DENKLEMİ Ŷi b̂1 b̂ 2 X i ˆ 6.5636364 0.7672727 X Y ELASTİKİYETLERİN HESAPLANMASI EY Y / Yi dY Xi E yx lim . EX x 0 X / X i dX Yi •Nokta Elastikiyet •Ortalama Elastikiyet NOKTA ELASTİKİYET E YX 0 dY Xi . ˆ dX Y 0 Xi b̂ 2 . ˆ Y0 X0 = 130 E YX0 130 130 0.767. ˆ Y0 NOKTA ELASTİKİYET Ŷ0 6.5636364 0.7672727 X0 6.5636364 0.7672727 (130) 106.3091 E Y X 0 130 130 0.767. 0.94 106.3091 ORTALAMA ELASTİKİYET E YX dY X . dX Y Y 137 E YX ; X b̂ 2 . Y X 170 170 0.767 . 137 = 0.95 Tahminin Standart Hatası ve Varyansı Tahminin standart hatası, regresyon doğrusu etrafındaki dağılımın bir ölçüsüdür. S(Yi Ŷ ) s n S(Yi Ŷi ) s n2 2 Sei2 n 2 Se n2 2 2 S e ? S ( Y Ŷ ) Ŷ ? 2 i (n30 ise) (n<30 ise) Tahminin Standart Hatası ve Varyansı Ŷi b̂1 b̂ 2 X i Ŷi 6.5636364 0.7672727 X i Tahminin Standart Hatası ve Varyansı Tüketim Gelir Ŷi 75 88 95 125 115 127 165 172 183 225 80 100 120 140 160 180 200 220 240 260 67.9455 83.2909 98.6364 113.9818 129.3273 144.6727 160.0182 175.3636 190.7091 206.0545 SY=1370 SŶi 1370 e i Yi Ŷi 7.0545 4.7091 -3.6364 11.0182 -14.3273 -17.6727 4.9818 -3.3636 -7.7091 18.9455 Se=0 ei2 (Yi Ŷi ) 2 49.7666 22.1755 13.2231 121.4003 205.2707 312.3253 24.8185 11.3140 59.4301 358.9302 Se2=1178.6545 Tahminin Standart Hatası ve Varyansı 1178.6545 s 10 - 2 147.3318 =12.138 s2= 147.3318 SY 2 b1SY b 2SYX s n2 SY2 =? SY = ? SYX=? b1 =? b2 =? 208296 6.5636364(1370) 0.7672727(258220) s = 12.138 10 2 Tahminin Standart Hatası ve Varyansı s y YY s Sy b 2 Syx n2 2 x XX Sy2 = ? Syx = ? 20606 0.7672727(25320) 10 2 b2= ? = 12.138 DEĞİŞKENLİKLER S(Y Y) 2 S(Ŷ Y ) 2 S(Y Ŷ) 2 Y Yi y 2 ŷ 2 2 e S(Y Y) 2 S(Y Ŷ) 2 S(Ŷ Y ) 2 Y X Xi X DEĞİŞKENLİKLER S(Y Y) 3844 2401 1764 144 484 100 784 1225 2116 7744 Sy2=20600 2 S(Ŷ Y ) 2 S(Y Ŷ) 2 4768.5302 2884.6664 1471.7686 529.8367 58.8707 58.8707 529.8367 1471.7686 2884.6664 4768.5302 49.7666 22.1755 13.2231 121.4003 205.2707 312.3253 24.8185 11.3140 59.4301 358.9302 Sŷ 2 19427.3455 Se2=1178.6545 DEĞİŞKENLİKLER S(Y Y )2 S(Ŷ Y ) 2 Sy2 Sŷ 2 = + 2 ˆ S(Y Y ) Se2 20606 = 19427.3455 + 1178.6545 Sy Sŷ Se n2 n2 n2 2 2 2 s s s 2 y 2 yˆ 2 varyanslar 20606 19427.3455 1178.6545 2575.75 = 2428.4182 + 141.3318 10 2 10 2 10 2 BELİRLİLİK KATSAYISI Noktaların doğruya yakınlık derecesini göstermektedir. Y’deki değişmelerin yüzde kaçının X tarafından açıklanabildiğini ifade etmektedir. R2 0 ile 1 arasında değişmektedir. KORELASYON KATSAYISI Y ile X arasındaki ilişkinin yönünü ve şiddetini vermektedir. -1 ile +1 arasında yer almaktadır. BELİRLİLİK KATSAYISI s 2ŷ Açıklanan varyans 2428.4182 r 2 2575.75 sy Toplam varyans 2 = 0.9428 2 s Açıklanmay an varyans 147.3318 2 r 1 2 1 sy Toplam varyans 2775.75 2 s Açıklanmay an varyans 147.3318 2 1 r 2 2575.75 sy Toplam varyans = 0.9428 = 0.0572 2 2 ˆ ˆ S(Y Y ) S(Y Y ) S(Y Y ) 2 2 2 S(Y Y ) S(Y Y ) S(Y Y ) 2 2 ˆ y y 2 2 y y 2 e y 2 2 2 2 ˆ e TD RBD HBD y 2 2 TD TD TD y y e y 2 1 r 2 2 e y 2 1 r 2 2 Belirsizlik katsayısı BELİRLİLİK KATSAYISI 2 2 ( 25320 ) ( S xy ) 2 r 2 2 (33000)(20606) Sx Sy r Sxy = 0.9428 25320 = 0.9710 2 2 (33000)( 20606) Sx Sy DAĞILMA DİYAGRAMLARI Y Y Y=3+0.5X 15 5 15 • • 10 • • • • r=0.82 s=1.94 5 3 5 10 15 •• 10 • 3 -6 Y=3+0.5X 20 X -6 • • • 5 • 10 (a) Y 15 10 Y • •• • • • Y=3+0.5X • 10 r=0.82 s=1.94 • •• • • 5 3 3 5 10 (c) 20 X 15 15 5 -6 r=0.82 s=1.94 (b) Y=3+0.5X Aşırı kıymet • • 15 20 X -6 5 10 (d) r=0.82 s=1.94 15 20 X STANDARTLAŞTIRILMIŞ HATA TERİMLERİ ei 7.0545 4.7091 -3.6364 11.0182 -14.3273 -17.6727 4.9818 -3.3636 -7.7091 18.9455 ei/s 0.5812 0.38796 -0.29959 0.90774 -1.18037 -1.45598 0.41043 -0.27712 -0.63512 1.56084 Xi 80 100 120 140 160 180 200 220 240 260 e/s 'nin dağılma diyagramı 2 0 60 -2 100 140 180 220 260 EKK Tahminlerinin Standart Hataları ve Kullanılışı EKK tahminleri b̂1 ve b̂2 örnek verilerine dayanarak hesaplanır. Bir anakütleden bir çok örnek çekilebilir, bu durumda her örnek seti için farklı tahminciler elde edilecektir. Örnek değerlerinin anakütle değerleri b1 ve b2 ye ne ölçüde yakın olduğu standart hatalarla hesaplanır. Standart hata, tahmincinin örnekleme dağılımının standart hatasıdır. Bir tahmincinin örnekleme dağılımı anakütleden seçilebilecek aynı büyüklükteki örneklerin b̂ lerin dağılımıdır. (75 milyar) 60 hanelik anakütleden çekebileceğimiz onluk (75 milyar) örnek için hesaplanan b̂2 değerlerinin örnekleme dağılımı ortalama E (bˆ2 ) etrafında normal dağılmaktadır. Anakütleden çekilen örnekler için hesaplanan EKK b̂2 leri örneklerin farlı değerli Y(tüketim) ve X(gelir gibi) e sahip hanelerden oluşması gibi örnekleme hatalarından dolayı gerçek değerinden farklıdır. Örnekleme hataları + ve – yönde aynı ihtimalle ortaya çıkan hatalardır. Ortalama ölçüsü standart hatadır. b2 En Küçük Karalerle Parametre Tahminlerinin Ortalama ve Varyansı b̂1’in ortalaması: E (bˆ1 ) b1 b̂1’in varyansı: 2 2 X ˆ ˆ Var (b1 ) E (b1 b1 ) u . n x 2 i 2 i b̂2’nin ortalaması: E (bˆ2 ) b2 b̂2 ’n'in varyansı: 1 2 2 ˆ ˆ Var (b2 ) E (b2 b2 ) u . 2 x i EKK’de Parametre Tahminlerinin Ortalama ve Varyansı 𝒃𝟐 ’nin Ortalamasının İspatı: Y=b1+b2X 𝒃𝟐’nin ortalaması=E( )=b2 𝑦𝑖 = 𝑌𝑖 − 𝑌 eşitliğini yerine koyalım, 𝑏2 = 𝑥𝑖 𝑌𝑖 − 𝑌 = 2 𝑥𝑖 𝑥𝑖 𝑌𝑖 𝑌 𝑥𝑖 2 − 𝑥𝑖 𝑥𝑖2 𝑥𝑖 = 0 olduğundan, 𝑏2 = 𝑥𝑖 𝑌𝑖 2 = 𝑥𝑖 𝑥𝑖 2 𝑌𝑖 𝑥𝑖 Varsayım gereği x değerleri sabittir. Bunun sonucu olarak 𝑥𝑖 / 𝑥𝑖2 oranıda örnekten örneğe aynı kalır. Bu orana k diyecek olursak, 𝑏2 ’nin tahminini şu biçimde gösterebiliriz: 𝑏2 = 𝑘𝑖 𝑌𝑖 Y=b1+b2X+u eşitliğindeki Yi’yi burada yerine koyar ve bulduğumuz ifadeyi yeniden düzenlersek; 𝑏2 = 𝑘𝑖 b1 + b2 X + u = 𝑏1 𝑘 + 𝑏2 𝑘𝑋 + 𝑘𝑢 (∑k=0 ∑kX=1) ∑k=0 için ispat: 𝑘= 𝑥𝑖 2 = 𝑥𝑖 𝑋−𝑋 0 = 2 2 =0 𝑥𝑖 𝑥𝑖 ∑kX=1 için ispat: 𝑘𝑋 = 𝑥𝑖 𝑋 2 = 𝑥𝑖 𝑋−𝑋 𝑋 = 2 𝑥𝑖 𝑋2 − 𝑋 𝑋 𝑥𝑖2 Pay için; 𝑋 2 − 𝑋 𝑋 = 𝑋 2 − 𝑋 𝑛𝑋 = 𝑋 2 − 𝑛𝑋 2 Payda için; 𝑋 𝑋= 𝑛 𝑋 = 𝑛. 𝑋 𝑋 2 = (𝑋 − 𝑋)2 = (𝑋 2 − 2𝑋𝑋 + 𝑋 2 ) = 𝑋 2 − 2𝑋 𝑋 + 𝑛. 𝑋 2 𝑋 2 = 𝑋 −2 . 𝑋 + 𝑛. 𝑋 2 𝑛 = 2 ( 𝑋 ) 𝑋 2 2 𝑋 −2 + 𝑛. ( ) 𝑛 𝑛 = 𝑋 2 − 2. 𝑋 𝑛 2 ( 𝑋)2 + 𝑛 1 = 𝑋 − . ( 𝑋)2 𝑛 2 1 = 𝑋 − . ( 𝑋)( 𝑋)) = 𝑋 2 − 𝑋 𝑋 𝑛 2 = 𝑋 2 − 𝑋. 𝑛. 𝑋 = 𝑋 2 − 𝑛. (𝑋)2 𝑋 2 − 𝑛. 𝑋 2 𝑘𝑋 = =1 2 2 𝑋 − 𝑛. 𝑋 Bu nedenle; x i ui 𝑏2 = b2 + ku = b2 + xi2 𝐸 𝑏2 = 𝐸 𝑏2 𝐸 𝑏2 = 𝑏2 𝑥𝑖 𝑢𝑖 + 𝐸( 2 ) 𝑥𝑖 𝒃𝟐 ’nin varyansı: Şu ifadenin doğruluğu ispatlanabilir: 𝑉𝑎𝑟 𝑏2 = 𝐸 𝑏2 − 𝐸(𝑏2 ) 2 = 𝐸(𝑏2 − 𝑏2 ) = İspat: 𝑏2 = 𝜎𝑢2 . 𝑥𝑖 2 . 𝑌𝑖 = 𝑥𝑖 𝑉𝑎𝑟 𝑏2 = 𝑉𝑎𝑟 2 1 𝑥𝑖2 𝑘𝑖 𝑌𝑖 𝑘𝑖 𝑌𝑖 = 𝑘𝑖2 𝑉𝑎𝑟 𝑌𝑖 𝑉𝑎𝑟 𝑌𝑖 = 𝜎𝑢2 𝑉𝑎𝑟 𝑏2 = 𝑘𝑖2 𝜎𝑢2 = 𝜎𝑢2 = 𝜎𝑢2 . 1 𝑥𝑖2 𝑥𝑖2 𝑥𝑖2 2 𝒃𝟏’in ortalaması için ispat: 𝐸 𝑏1 = 𝑏1 𝑏1 = 𝑌 − 𝑏2 𝑋 b2 = k i Yi Y b1 = Y − X. k i Yi = − X k i Yi n 1 = 𝑌 ( − 𝑋 𝑘𝑖 ) 𝑛 n,k ve x ortalamanın örnekten örneğe sabit kaldığını düşünürsek ve Y=b1+b2X’ ide yerine koyarsak; 𝐸 𝑏1 = 1 − 𝑋𝑘𝑖 𝑛 𝑏1 + 𝑏2 𝑋 𝑏1 𝑏2 𝑋 = ( + − 𝑋𝑘𝑖 𝑏1 − 𝑋𝑘𝑖 𝑏2 𝑋) 𝑛 𝑛 = 𝑏1 + 𝑏2 𝑋 − 𝑏2 𝑋 = 𝑏1 𝐸 𝑏1 =b1 ’in Varyansı: İspat: olduğundan; dir. Katsayıların Standart Hataları SX 2 s (b̂1 ) s . 2 nSx s (b̂ 2 ) s Sx 2 322000 12.138 . 10.(33000) 12.138 = 0.0668 33000 = 11.99 Aralık Tahminleri b̂ 2 ±t a/2 . s( b̂ 2 ) = 0.7672727 2.306 (0.0668) 0.6132319< b2 <0.9213135 b̂1 ± t a/2 . s( b̂1 ) = 6.5636364 2.306 (11.99) -21.0853 < b1 < 34.2126 Hipotez Testleri Güven Aralığı Yaklaşımı İle 0.6132319< b2 <0.9213135 -21.0853 < b1 < 34.2126 Hipotez Testleri Anlamlılık Testi Yaklaşımı İle •Hipotezlerin Formüle Edilmesi •Tablo Değerlerinin Bulunması •Test İstatistiğinin Hesaplanması •Karar Verilmesi Hipotez Testleri 1.Aşama H0: b 2 = 0 H1 : b 2 0 2.Aşama a=? = 0.05 ; S.d.=? = n-k = 10-2=8 ta,sd =? t0.05,8=? =2.306 3.Aşama t hes 4.Aşama b̂ 2 b * 2 0.7672727 0 ? 0.0668 s(b̂ 2 ) |thes= 11.4861 | > |ttab= 2.306 | H0 hipotezi reddedilebilir =11.4861 Regresyon ve Varyans Analizi Değişkenlik Kaynağı Regresyona Bağlı Değişkenlik=RBD Sapma Kareleri Toplamı=SKT 2 ŷ S Serbestlik Derecesi=sd f1=k-1=1 Hata Terimine Bağlı Değişkenlik=HBD Se2 f1=n-k Toplam Değişkenlik=TD Sy2 n-1 SKT Ortalaması= SKTO 2 ŷ S e2 =s2 nk Regresyon ve Varyans Analizi Değişkenlik SKT Kaynağı RBD 19427.3455 HBD 1178.6545 TD 20606 sd SKTO 2-1=1 10-2=8 19427.3455 147.3318 10-1=9 19427.3455 Fhes= =131.8612 147.3318 EKK Modelinde Önceden Tahmin •İleriye Ait Tahmin •Önceden Tahmin •Örnekten Tahmin Edilen İlişkinin Ayni Kaldığı •X Değerlerinin Aynı Eğilimde Olacağı Y’nin Aralık Tahmini Ŷ0 ± t a/2 1 (X 0 X ) . s 1 2 n x Ŷ0 ± ta/2 . s (Ŷ0 ) 2 Y0’ın güven aralığı Y’nin Aralık Tahmini X0=80 Ŷ0 = 67.9455 67.9455 ±2.306.12.318 2 ( 80 ) 1 170 1 10 33000 35.47840 Y0| X0 100.41251 Y’nin Ortalamasının Aralık Tahmini Ŷ 0 ± t a /2 . s Ŷ0 ± ta/2 . s (Ŷ0 ) X )2 1 (X 0 2 x n Y’nin ortalamasının güven aralığı Y’nin Ortalamasının Aralık Tahmini X0=80 Ŷ0 = 67.9455 67.9455 ±2.306.12.318 2 1 ( 80 170) 10 33000 51.49402 E(Y0| X0) 84.39689 Y’nin Güven Aralıkları Y’ninAralık Tahminleri X0 Alt Sınır Üst Sınır 80.00 100.00 120.00 140.00 160.00 180.00 200.00 220.00 240.00 260.00 35.47840 52.01572 68.28577 84.26359 99.93034 115.27579 130.29996 145.01304 159.43390 173.58749 100.41251 114.56610 128.98696 143.70004 158.72421 174.06966 189.73641 205.71423 221.98428 238.52160 Y’nin OrtalamasınınAralık Tahminleri Alt Sınır Üst Sınır 51.49402 69.33821 86.90184 103.99618 120.34284 135.68829 150.03254 163.62911 176.75639 189.60311 84.39689 97.24361 110.37089 123.96746 138.31171 153.65716 170.00382 187.09816 204.66179 222.50598 Y 240 220 200 180 160 140 120 100 80 60 40 20 0 0 X 100 200 300 En Küçük Kareler Tahminlerinin Özellikleri 1. Tahmin Edicilerin Küçük Örnek Özellikleri Genellikle bir tahminin ana kütle parametresinin gerçek değerine yakın olması ve bu gerçek parametre yakınlarında dar bir aralıkta değişmesi istenir. Ana kütle parametresine ‘yakınlık’ çeşitli ekonometri tahmin yöntemleri ile bulunmuş tahminlerin örnekteki dağılımların ortalaması ve varyansıyla ölçülür. En Küçük Kareler Tahminlerinin Özellikleri Burada her zamanki varsayımsal yenilemeli örnekleme süreci kullanılır, yani her biri n gözlemli çok sayıda örneğin alındığı varsayılır. Ekonometri yöntemlerinin her birini kullanarak her örnekten b̂ hesaplanıp dağılımları oluşturulur. Küçük örnekten bulunmuş iyi bir tahmin edici için temel ölçütler:Sapmasızlık, En küçük varyans, Etkinlik, Doğrusal en iyi, sapmasızlık (DES), En küçük ortalama hata karesi (OHK), Yeterlilik dir. a. Sapmasız Tahmin Edici Bir tahmin edicinin sapması, beklenen değeriyle gerçek parametre arasındaki fark olarak tanımlanır. Sapma= E (bˆ) -b Eğer sapma sıfırsa yani E (bˆ)= b ise, sapmasız olur. Bu da örneklerin sayısı artıkça, sapmasız tahmin edicinin, parametrenin gerçek değerlerine yaklaştığı anlamına gelir. Sapmasız bir tahmin edici ‘ortalama olarak’ parametrenin gerçek değerini verir. Aranan bir özellik olmasına karşın, sapmasızlık kendi başına çok önemli değildir. Ancak küçük bir varyansla birleşirse önemli olur. a. Sapmasız Tahmin Edici b̂ , b’nin sapmasız tahmin edicisidir b̂ , b’nin sapmalı tahmin edicisidir En Küçük Kareler Tahmin Edicilerinin Doğrusallıkları ve Sapmasızlıkları (1) ve olup bu da bize ’ in doğrusal bir tahmin edici olduğunu gösterir, çünkü Y’nin doğrusal bir fonksiyonudur. Aslında ‘ ler tartı olarak alındığında ‘ in Y’nin tartılı ortalaması olduğu söylenebilir. Benzer biçimde gösterilebileceği gibi, ’de doğrusal bir tahmin edicidir. Sırası gelmişken 1) ’lerin şu özelliklerini görelim: ’lerin olasılıklı olmadığı varsayıldığına göre ’ler de olasılıklı değildir. 2) 3) 4) Bu özellikler bilir. ’nin tanımından doğrudan türetile- Örnek olarak; (verili bir örneklem için dan sapmalar toplamı bilindiği ve ortalamahep sıfır olduğu için) Şimdi biçimindeki anakütle regresyon fonksiyonunu (ARF) denklem (1) de yerine koyalım: (2) Burada ’ nin daha önce sözü edilen özelliklerinden yararlanılmıştır. Şimdi de denklem (2)’nin her iki yanının beklenen değerini alalım. , olasılıklı olmadığı için ’yi sabit gibi düşünür ve varsayım gereği olduğunu göz önünde bulundurursak; sonucunu elde ederiz. Öyleyse, sapmasız bir tahmin edicisidir. Benzer biçimde kanıtlanabileceği gibi sapmasız bir tahmin edicisidir. ’nin , , ’nin b. En Küçük Varyanslı Tahmin Edici (En İyi Tahmin Edici)… Bir tahmin, başka ekonometri yöntemleriyle bulunmuş başka herhangi bir tahminle karşılaştırıldığında en küçük varyansa sahip olduğu görülürse en iyi tahmindir.b̂ nin en iyi olma koşulu: E[bˆ E(bˆ)]2 < ~ ~ 2 E[b E (b )] Ya da; ~ Var(b̂ )<Var(b ) ~ Burada b , gerçek parametre b nin (sapmasız olması gerekmeyen) herhangi bir başka tahminidir. b. …En Küçük Varyanslı Tahmin Edici (En İyi Tahmin Edici) Varyansı küçük olduğu halde sapması büyük olan bir tahmin edici, gerçek b parametresinden oldukça uzak bir değer etrafında toplanabilmektedir. b̂ , b nin büyük varyanslı sapmasız tahmin edicisidir. ~ b , b nin küçük varyanslı sapmalı bir tahmin edicisidir. En Küçük Kareler Tahmin Edicilerinin En Küçük Varyans Özelliği en küçük kareler tahmin edicisinin hem sapmasız hem doğrusal olduğu gösterilmişti. (aynı şey için de geçerlidir.) Bu tahmin edicilerin , bütün doğrusal sapmasız tahmin ediciler içinde en düşük varyanslılar olduğunu gösterebilmek için , en küçük kareler tahmin edicisini ele alalım: Burada, biçimindedir. Bu da bize, tartı görevi görmek üzere, ‘nin Y’lerin tartılı ortalaması olduğunu gösterir. ‘nin başka bir doğrusal tahmin edicisini şöyle tanımlayalım: olsun. Buradaki wi ‘ler tartılıdır fakat gerekmez. ‘lere eşit olması Dolayısıyla ‘nın sapmasız olabilmesi için şunların sağlanması gerekir: Ayrıca şöyle de yazabiliriz: (Açıklama: ) (Açıklama: ) (matematik hilesine dikkat edin) (3) Burada, sondan ikinci satırın en son terimi ortadan kayboldu.(Neden?) (3) denkleminin son terimi sabit olduğundan nin varyansı ilk terimle oynayarak en düşüğe indirgenebilir. yazarsak (3) eşitliği şuna indirgenir; Sözle belirtirsek “wi tartıları = ki en küçük kareler tartıları” iken , doğrusal tahmin edicisinin varyansı , en küçük kareler tahmin edicisinin varyansına eşittir; tartılar eşit değilse ; olur. Bir başka deyişle; eğer β2 ‘nin en küçük varyanslı sapmasız, doğrusal bir tahmin edicisi varsa o da en küçük kareler tahmin edicisidir. Benzer biçimde gösterilebileceği gibi , ‘de β1’in en küçük varyanslı, sapmasız, doğrusal bir tahmin edicisidir. c. Etkin Tahmin Edici Bir tahmin edici; sapmasız ve başka herhangi sapmasız tahmin ediciyle karşılaştırıldığında daha düşük varyansa sahipse etkin tahmin edicidir. Aşağıdaki iki koşul yerine getirilirse b̂ etkindir: (i) E (bˆ) b ve (ii) E[bˆ E (bˆ)] 2 E[b * E (b * )] 2 Burada b * , gerçek b nin başka bir sapmasız tahmin edicisidir. Başka bir deyişle, etkin tahmin edici, bütün tahmin sapmasız ediciler sınıfı içinde en düşük (en iyi) varyansa sahip olan tahmin edicidir. d. Doğrusal Tahmin Edici… Bir tahmin edici, örnekteki gözlemlerin doğrusal bir fonksiyonuysa doğrusal sayılır. Örnek gözlemleri veriyken, doğrusal bir tahmin edici şu biçimi alır: k1Y1 k2Y2 ...knYn Burada ki ler sabit değerlerdir. Örneğin 1 k1 k2 ...kn n olduğundan Y örnek ortalaması doğrusal bir tahmin edicidir. Çünkü: d...Doğrusal Tahmin Edici… Y 1 1 1 1 1 Y Y Y Y ... Y Y Y ... Y ) i n n i n 1 2 n n 1 n 2 n n örnek ortalaması hesaplanırken her gözleme, 1/n ye eşit olan aynı k ağırlığı verilmiştir. Y e. Doğrusal en iyi sapmasız tahmin edici (DEST) Bir tahmin edici, doğrusalsa sapmasızsa ve gerçek b nin öteki doğrusal sapmasız tahmin edicileriyle karşılaştırıldığında en küçük varyansa sahipse, DEST olur. f. En küçük ortalama hata kareli (OHK) tahmin edici Ortalama hata karesi ölçütü, sapmasızlık ve en küçük varyans özelliklerinin bir bileşimidir. Burada OHK, tahmin edicinin, ana kütledeki gerçek parametre b ile olan farkının karelesinin beklenen değeri olarak tanımlanır: OHK (bˆ) E (bˆ b) 2 OHK nin, tahmin edicinin varyansıyla sapma karesinin toplamına eşit olduğu gösterilebilir: OHK (bˆ) Var(bˆ) sapma 2 (bˆ) f… En küçük ortalama hata kareli (OHK) tahmin edici… İspat: OHK E (bˆ b)2 E bˆ E (bˆ) E (bˆ) b 2 2 2 E bˆ E (bˆ) E (bˆ) b 2E [bˆ E (bˆ)][ E (bˆ) b] 2 E bˆ E (bˆ) Var (bˆ) 2 E bˆ b sapma 2 (b) f. En küçük ortalama hata kareli (OHK) tahmin edici E [bˆ E (bˆ)][ E (bˆ) b] 0 Çünkü: 2 ˆ (bˆ) E (bˆ) bb ˆ bE (bˆ) E bE 2 2 E (bˆ) E (bˆ) bE bˆ bE bˆ 0 2 ˆ ˆ ˆ OHK (b) Var(b) sapma (b) g. Yeterli tahmin edici Yeterli bir tahmin edici, gerçek parametre hakkında bir örneğin içerdiği bütün bilgileri kullanıma koyan bir tahmin edicidir. Bu başka hiçbir tahmin edicinin, tahmin edilmekte olan gerçek ana kütle parametresi hakkında daha fazla bilgi sunamayacağı anlamına gelir. 2. Tahmin edicilerin büyük örnek özellikleri: Asimtotik özellikler Büyük örnek özelliklerinin, bir tahminin iyiliğini belirleme ölçütü olarak kullanılması, örneğin sonsuz büyük olmasını gerektirir. İşte bu nedenle bu özelliklere asimtotik özellikler denir. Örnek büyük olduğu zaman bu özelliklerin yaklaşık olarak sağlandığı varsayılır. Özellikler ise şunlardır: asimtotik sapmazlık, tutarlılık ve asimtotik etkinlik. 2...Tahmin edicilerin büyük örnek özellikleri: Asimtotik özellikler Asimtotik dağılım: Bir dizi rassal değişken düşünüldüğünde; {Xn } Xn1 .Xn2 X(nT ) Bunlardan her birinin kendi dağılımı, ortalaması ve varyansı vardır. Dağılımlar gitgide artan örnek büyüklüklerinden oluşturulmuştur. nT sonsuza giderken bu dağılımlar da belli bir dağılıma doğru yaklaşıyor olabilirler. İşte bu dağılıma {X(n)} dizisinin asimtotik dağılımı denir. a. Asimtotik sapmasızlık… Eğer b̂ edicisinin asimtotik ortalaması, ana kütlenin gerçek b parametresine eşit ise, bu tahmin edici, bu parametrenin asimtotik sapmasız tahmin edicisidir. lim E (bˆ n ) b n bˆ ' nin ˆ ) b asimtotik lim E ( b n n sapması Bir tahmincinin asimtotik sapması, asimtotik ortalaması ile gerçek parametre arsındaki farka eşittir. a… Asimtotik sapmasızlık Asimtotik bir sapmasız tahmin edici, örnek büyüklüğü yeterine büyük olduğunda sapması kaybolan bir tahmin edicidir. Eğer bir tahmin edici (sonlu küçük örneklerde) sapmasızsa aynı zamanda asimtotik sapmasızdır, ama bunun tersi doğru değildir. b. Tutarlılık… Bir b̂ edicisi, aşağıdaki iki koşulla, ana kütlenin b gerçek parametresinin tutarlı bir tahmin edicisidir: 1. bˆ, asimtotik sapmasız olmalıdır. lim E (bˆ n ) b n 2. n sonsuza giderken b̂ 'nin varyansı sıfıra yaklaşmalıdır: lim Var (bˆ) 0 n Tutarlılık… Eğer varyans sıfırsa, dağılım ana kütlenin gerçek parametresinin üstünde bir noktada toplanır. Bir tahmin edicinin tutarlı olup olmadığını anlamak için, n arttıkça sapmanın ve varyansının ne olduğuna bakılmalıdır. (n) büyüdükçe hem sapma hem varyans azalmalı ve limitte (n iken) sıfır olmalıdır. Tutarlılık kavramı aşağıda çizilmiştir. Örnek büyüklüğü artıkça hem sapma hem varyans azalmaktadır. c. Asimtotik etkinlik Eğer (1) b̂ tutarlıysa (2)Başka herhangi bir tutarlı tahmin ediciye göre daha küçük bir asimtotik varyansı varsa bu tahmin edici ana kütlenin gerçek b parametresinin asimtotik etkin bir tahmincisidir. Eğer; 2 2 1 1 * ˆ E n (b n b) lim E b n b n lim n n n ise b̂ asimtotik etkindir. Burada b * , b nin başka bir tutarlı tahmin edicisidir. Tutarlı tahmin ediciler karşılaştırıldığında hangisinin varyansı daha hızla sıfıra yaklaşıyorsa o, asimtotik etkendir. 3. En Küçük Kareler Tahmin Edicilerinin Özellikleri Hata terimi u'nun bazı genel varsayımları yerine getirmesi, yani ortalamasının sıfır ve varyansının sabit olması koşuluyla, en küçük kareler tahmincilerinin DES ( doğrusal, en iyi, sapmasız) özelliklerini sağlamasına Gauss-Markow en küçük kareler teoremi denmektedir. a. Doğrusallık En küçük kareler tahminleri b̂1 ve b̂2 gözlenen örnekteki Yi değerlerinin doğrusal fonksiyonlarıdır. Varsayım gereği Xi ler hep aynı değerlerle göründüklerine göre en küçük kareler tahminlerinin yalnız Y değerlerine bağlı olduğu gösterilebilir. bˆ1 f (Y ) bˆ2 f (Y ) İspat: xi ˆ b2 Y kiYi 2 i xi xi ki 2 xi Varsayım gereği X değerleri sabit değerler kümesidir. Bu durumda ki lerde örnekten örneğe değişmezler. …Doğrusallık Bu durumda şunu yazabiliriz: bˆ2 kiYi k1Y1 k2Y2 ... knYn f (Y ) Y’lerin doğrusal bir fonksiyonudur. Bağımlı değişken değerlerinin doğrusal bir bileşimidir. b̂2 1 ˆ b1 [ Xki ]Yi n X ve ki Örnekten örneğe değişmez. katsayı tahmini sadece Y ye bağlıdır. b. Sapmasızlık b̂1 ve b̂2 nin sapmasızlık özelliği E(bˆ1 ) b1 ve E(bˆ2 ) b2 şeklindedir. Bu özelliğin anlamı, örneklerin sayısı artıkça tahminler de parametrelerin gerçek değerine yaklaşır. Başka bir deyişle, n sayıda Y ve X gözleminden oluşan, olanak içindeki bütün örnekleri seçildiğinde ve b̂1 ile b̂2 tahminleri her örnek için hesaplandığında, bu tahminlerden çok fazla sayıda elde edilir. Bunların ortalaması ise ilişkinin parametrelerine eşit olur. Tahminlerin dağılımı, orta nokta olarak parametrenin gerçek b değeri üzerinde toplanacaktır. c. En Küçük Varyans Gauss-Markow teoremi ispatı: Bu teoreme göre en küçük kareler tahminleri, başka ekonometri yöntemleriyle bulunmuş herhangi bir başka doğrusal sapmasız tahmin ediciler arasında en iyisidir ( varyansı en küçük olandır). EKK yönteminin tercih edilmesinin temel nedeni de bu özelliktir. Doç. Dr. A. Talha YALTA- “Bağlanım Çözümlenmesi” slaytından alıntılar mevcuttur.