Ölçme Hataları ve Normal Dağılım Yıl 1967. Fizik dersinin mekanik laboratuarında birinci laboratuar. Konusu: Ölçme ve çift kefeli terazilerin hassasiyeti. Mesaj: neyi ölçersen ölç, ölçmek istediğin şeyi bulamazsın, ölçü aletinin hassasiyet sınırları içinde bir şeye ulaşırsın. Laboratuar hocasından nasihat: “Marifet, hatalı ölçen alet ile doğru ölçmek”. Hata ne demek? Doğru ölçmek ne demek? Ölçülmesi istenen şeyi bulmak mı? Geometri dersindeki hocadan başka bir nasihat:”Geometri, yanlış çizim üzerinde doğru düşünme sanatıdır”. Yanlış çizim ne demek? Tahtaya çizilen dik üçgenin, en büyük açısı doksan derece değil mi, kenar uzunlukları için Pisagor teoremi sağlanmıyor mu? Hoca, çizemiyorsan biz ne yapalım. Doğru çiz, doğru düşünelim. Doğru düşünmek ne demek? Matematikte doğru düşünmek ne demek? (Ya istatistikte?! Bunu şimdi soruyorum. Yıl 2006.) Okulun açılışında bir nasihat da dekandan gelmişti:”Bu günkü gibi ilerde bir gün gelecek ve siz mezun olacaksınız. Çoğunuz öğretmen olacak. Matematik öğretmeni, fizik öğretmeni, kimya öğretmeni, biyoloji öğretmeni. Bir tornacı, bir civatayı işlerken hata yaparsa, o civatalar yeniden dökümhaneye gider, eritilir, çubuk haline getirilir ve yeniden tornacının önüne gelir. Sizin böyle bir hakkınız yok”. Hata yapmadan düşünmek (öyle yapmıyor muyuz yani), hatasız eğitim (zor bir iş) ve hatalı ölçümler (ne güzel bir hak, hele hatalar rasgele yani gelişigüzel olursa, ölçme aletlerine bu hakkı kim vermişse) ile ilgili nasihatler …ve yıl 1991 ĐS 152 Đstatistik Laboratuarı. Ölçme işleminde hata olabileceği, bunun ölçme aletlerinin doğasında bulunduğunu, pazardan alınan 1 kg domatesin kütlesinin ne olduğunu hiç kimsenin, ama hiç kimsenin bilemeyeceğini öğrencilere anlatma çabasındayım. Đnanmıyorlar. “Hocam belki siz bilemezsiniz, ama pazarcı bilir. Terazinin altına taş bağlıyormuş, ayrıca kese kâğıdını da hamurla yapıştırmış, ağır çeksin diye”, annem diyor. Đşim zor. Anlatmak istediğimi nasıl anlatacağım. -Çocuklar, pazardan alınan domatesi bakkal amcanın terazisinde tartsak aynı şeyi gözler miyiz? - Hayııır. - Eee, gördünüz mü? - Ama hocam, pazarcının terazisi, zaten … - Pekiyi, bakkaldaki gözlemi aklımızda tutup kuyumcuya gitsek aynı şeyi gözler miyiz? - Tamam hocam, tamam. Ne demek isteyecekseniz deyin. - Teraziden teraziye hassasiyet arttıkça, başka başka ölçüm değerleri gelmektedir. Hattâ, hassas bir terazide aynı şeyi iki kez ölçtüğümüzde farklı değerler gözlenmektedir. Bunu görmek için kimya laboratuarına gidiyoruz. - Hocam, çok yaşayın. - Siz de görün. Kalkın gidiyoruz. Hatırladığım kadarıyla bir tebeşir parçasının kütlesi ölçülmüştü. Sonra tebeşir parçası kefeden alınıp yeniden ölçülmüştü. Farklı gözlem çıktı. Sebebi nedir dendiğinde, öğrenciler, ellerimizden bir şeyler, nem gibi, tebeşire bulaşmış olabilir dediler. Tebeşiri ellemeden, sadece elektrikli terazinin düğmesi kapatılıp yeniden açılarak bir ölçüm daha yapıldı ve farklı bir gözlem çıktı. Öğrenciler şaşırmıştı. Bir camekânın içinde bulunan ve nefesimizden bile etkilenmeyen bu alet nasıl olur da bunu yapar. Aynı şekilde, 10 gözlem aldık (şu gözlem değerlerinin ondalık kısmı sekiz basamaklı, yaz yaz bitmiyor, kendilerine gelince Avogadro sayısı 6.023 × 1023 , gerçi ölçme sonucu söylenen bir sayı değil, iki gram hidrojendeki molekülleri saydıklarını sanmıyorum, ondalık kısmında anlamlı basamak sayısı sadece üç tane, bizde sekiz, hele son rakamı sıfır, ilk gözlemde bunu yazmayalım dedik, olmaz dediler, her halde kimyacıların bileceği bir şey dedik, 10 gözlemin onunda da son rakam sıfır gözlenmez mi, bu sefer de kimyacılar şaşırmıştı, başımıza böyle bir olay ilk defa geliyor dediler, gördünüz mü sıfırın intikamını diye aklımızdan geçirelim derken, kimyacı bunlar, adamın beynindeki kimyayı bile okurlar, siz istatistikçisiniz ve olasılık da bilirsiniz, böyle olması olasılığı nedir diye sormazlar mı, tamam, üşenmeden sekizinci ondalığı da hesaplarımıza katacağız, yeter ki siz şu olasılık hesabını unutun, anlaştık) ve kendi istatistik laboratuarımıza döndük. Gözlem değerleri tahtaya yazıldı. Veriler gözümüzün önünde. Tebeşir parçası da. Kütlesi ne?! - Tahtadaki sayılardan birisi olabilir mi, çocuklar? - Olabilir hocam, olmayabilir de. - Hocam gözlemlerden üc tanesi aynı, tebeşirin kütlesi bu olabilir. - Hayır. Bunlardan büyük olan altı tane başka gözlem var. Arkadaşın dediği olmaz hocam. - Sen ne diyorsun. - En küçük gözlem değeri ile en büyük gözlem değerinin ortasıdır diyorum. - Ne demek istiyorsun. - Hocam, arkadaş ortancayı diyor. - Hayır, ortanca başka bir şey. Arkadaş en küçük gözlem değeri ile en büyük gözlem değerinin ortalaması diyor, hocam. - Zaten onu söyledik. Ortalama başka bir şey. - Hocam, ortalamayı alsak olmaz mı? - Tamam alalım. Şimdi bu çıkan sayı tebeşirin kütlesi mi? - Evet.. Hayır...Olabilir de, olmayabilir de hocam. - Hocam, en küçük gözlem, şu birbirinin aynı olan gözlemlerden oldukça küçük, onu atalım, geri kalanların ortalamasını alalım. - Hocaam, en büyük gözlem de sırıtıyor, onu da atıp geriye kalan gözlemlerin ortalamasını alalım. - Hocaaam, gözlemlere ağırlık verelim ve ağırlıklı ortalama alalım. - Hocaaaam, birinci ve üçüncü çeyrekliğin ortalamasını alalım. - Hocaaaaam, çeyrekliklerin ortalamasını alalım. - Hocaaaaaam, çeyrekliklerin ağırlıklı ortalamasını alalım. - Hocaaaaaaam, tepe değer, ortanca ve ortalamanın ortalamasını alalım. - Hocaaaaaaaam, bunların ağırlıklı ortalamasını alalım, ama en ağırı ortalama olsun. - Çoçuklaaaaaaaaar yeter. Biz kütle ölçüyorduk, ağırlık nerden çıktı. Kafam karıştı. Kütle işi, ağırlık işi, bu fizikçinin işi. Kendi işimize dönelim. Bizim işimiz ne? - Tahmin etmek hocam. - Neyi tahmin etmek? - Şu tebeşirin kütlesini. - Hocam, örneklem ortalaması yansız bir tahmin edicidir. Derste görmüştük. Onu alalım. Diğerlerinden bazıları da yansız olabilir. - Hem tebeşirin kütlesini bilmiyorsunuz, hem de tahminin yansız olacağını söylüyorsunuz. - Sus. Bu soruyu derste hocaya biz de sormuştuk, her zamanki gibi ağzı açıldı ve öğle yemeğinden olduk. Derse gelsene. - Aranızda ne konuşuyorsunuz, yeni bir tahmin edici daha mı öneriyorsunuz. Ağırlıklı olmasın, ayrıca varyansını bilmiyorsanız söylemeyin. - Hocam ben, örneklem ortalamasının varyansını biliyorum. Örneklem ortalamasının varyansı kitle varyansı bölü n, yani örneklem hacmi. - Çocuklar, gene kafamı karıştırdınız. Biz kütle ölçüyorduk. Kitle nerden çıktı? Kitle ne demek? Nerede? Tebeşirlerin kitlesi mi? - Hayır hocam, siz bizim kafamızı karıştırmayın. Bazı araştırmalarda, kitle ve birim kavramları vardı ya, işte o. Bazı araştırmalarda da bu kavramı kullanmadığımızı söylemiştiniz. - Çocuklar, acaba doğru mu söylemiştim. Burada, kitle terazilerin kitlesi olmasın. Hayır hocam, burada kitle yok. Sadece şu tebeşir var. Terazi de kimya laboratuarında kaldı. Arkadaşın dediği sözgelimi: “kitle varyansı bölü örneklem hacmi”. Taktınız yine. Gerçek dünya ili ilgili problemimizi açık bir şekilde tanımladıktan sonra yola çıkmamız gerektiğini söylemiştiniz. Şuradaki tebeşirin kütlesini tahmin etmek istiyoruz, o kadar. - Tamam çocuklar toparlıyoruz. Her ne kadar fizikçiler, prestijleri sarsılmasın diye ölçme sonucu elde ettiklerine tahmin demeseler de bunlar birer tahmindir. Đşimizi bitirelim. Tebeşirin kütlesini kaç olarak tahmin ettiniz. - 12.34567890 gram çıktı hocam. Kimyacılar yok, sonundaki sıfırı atalım mı? - Aman kalsın Hocam, duyarlarsa olasılığı sorarlar. Belki başka hesaplamalarda çıkmaz. - Bu tebeşirin kütlesi 12.345679890 gram diyebilirmiyiz? - Olduğunu tahmin ettik Hocam. Ayrıca, fizikçiler aritmetik ortalamanın arkasına artı eksi bir şeyler de yazıyorlar. - O, çay paketlerinde de var. - Çocuklar onun tam olarak ne anlama geldiğini ben de bilmiyorum. Gauss hatası diye bir şeyler hesaplattırıyorlardı fizik laboratuarında. Her gözlem değerinden ortalama çıkartılıp, karesi alınıp n-1 e bölünüyordu ve onun karekökü yazılıyordu artı eksi diye. Niçin n değil de n-1 ‘e böldüklerini anlayamıyordum. - Biz biliyoruz hocam. Terazinin yaptığı hata bir rasgele değişken, bu rasgele değişkenin dağılımının varyansı için yansız bir tahmin edici, o söylediğiniz. Ama karekökü alındığında, standart sapma için yansız olur mu bilemeyiz. - Bana sormayın. Aklıma yeniden hata sözcüğünü getirdiniz. Çocuklar, rasgelelik olgusu içeren bir özelliği (buna bir rasgele değişken karşılık gelmektedir) incelerken, sadece özelliğin doğasındaki rasgeleliği ele alacağız. Örneğin, belli bir kitledeki bir yaşındaki çocukların ağırlıklarını incelemeye kalkıştığımızda ölçü aletinin hatasını görmezden geleceğiz. Sanki hatasız ölçüyormuşuz gibi düşüneceğiz. Đleride, ölçüm hatalarını da işin içine katarak istatistiksel sonuç çıkarım nasıl yapılır, lisansüstü derslerde öğrenirsiniz. Dikkat edin, lineer modellerdeki hata terimini ölçüm hatası ile karıştırmayın. Ölçüm Hatalı Modeller dersini de alın. Yıl 2006. Zaman ne kadar çabuk geçmiş. ĐST 502 Đstatistik Teorisi dersi. - Arkadaşlar, bu gün yeni imal edilmiş olan şuradaki kuyumcu terazinin yaptığı hata’yı araştırmaya çalışacağız. - Tamam hocam. Araştırma dediniz, adını söylemediniz. - Terazinin bir ölçmede yaptığı hatayı bir rasgele değişken olarak düşünüp, bunun dağılımı nedir, beklenen değeri nedir, varyansı nedir? Araştırma konumuz bu olsun. Ayrıca, bu terazi için hatanın beklenen değerinin sıfır olduğunu iddia ediyorlar. Haklıysak, aman bizi haksız çıkarmayın diyorlar. Biliyoruz siz istatistikçisiniz, öyle bir karar kuralı, yani sizin dilinizde bir test fonksiyonu bulun ki, dediğimiz doğru olduğunda test sonucu dediğimizin reddedilmesi olasılığı en çok %5 olsun, diyorlar. Bunu da araştıralım. - Hocam, tüketici hakları ne olacak. Teraziyi kullananlar yani. - Hocam, düzgün en güçlü test fonksiyonu ile işi bitiririz. - Tamam arkadaşlar. - Hocam, burada esas mesele terazinin yaptığı hatanın varyansında. Hatalar sıfıra göre simetrik bir dağılıma sahip ve varyans küçükse her iki tarafın da işine gelir. Hatanın varyansı için bir iddiaları var mı? - Varyans ile ilgili bir şey söylemediler. - Hocam. Kuyumcu terazileri için hatanın standart sapmasının 0.01 gramdan küçük, yani varyansın 0.0001 den küçük olmasını şart koşuyorlarmış. Bunu yokluk hipotezi olarak alıp %5 anlam düzeyinde test edelim. Belki işlerine yarar. Tamam arkadaşlar. Hocam, hatanın dağılımı ile ilgili varsayımda bulunacakmıyız? Örnekleme ve gözlemler nasıl yapılacak? Araştırmadaki gözlem alma işini iki şekilde yapalım. Birincisi, seneler önceden kalan şuradaki tebeşiri tartarak, ikincisi de standartlar enstitüsünden alınan ve 10 gram olduğu söylenen şuradaki nesneyi tartarak yapalım. Hocam, o nesnenin üstünde TSE damgası yok. Olsa ne fark edecekti ki? Kendileri 10 gram olduğunu nereden biliyor? Felsefe yok. Đş yapacağız arkadaşlar. Başlayalım. - - Đlk önce, ölçmelerdeki hatanın dağılımı meselesini ele alalım. Bildiğiniz gibi Gauss, astronomi ile ilgili ölçme hataları üzerinde çok çalışmış ve önemli sonuçlar elde etmiştir. Şimdi, C.R.Rao’nun “Linear Statistical Inference and Its Applications” isimli kitbından Hagen Tanımlaması’nı ele alalım. Hatalar için aşağıdaki varsayımlar söz konusu olsun: a) Rasgele değişken olan belli bir hata, küçük (istenildiği kadar küçük) ve aynı değeri alan çok sayıda hata bileşenlerinin toplamı olsun. b) Her hata bileşeni için değerin pozitif veya negatif olma olasılığı eşit olsun. c) Hata bileşenleri bağımsız olsun. Her bir hata bileşeni küçük ve ε büyüklüğünde olup, +ε ile −ε değerlerini 1 olasılıkları ile 2 alsın. Her bir hata bileşeninin ortalaması 0 ve varyansı ε 2 dır. Hata bileşenleri X 1 , X 2 ,..., X n ve hata X olmak üzere, X = X + X + ... + X 1 2 n ve E ( X ) = E ( X ) + E ( X ) + ... + E ( X ) = 0 n 1 2 Var ( X ) = Var ( X ) + Var ( X ) + ... + Var ( X ) = nε 2 1 2 n olur. Var ( X ) = nε 2 = σ 2 olacak şekilde, n → ∞ için X in dağılımını bulmak için karakteristik fonksiyonunu göz önüne alalım. X in karakteristik fonksiyonu, ϕ (t ) = E (eitX ) = X n n itX k ) = 1 (eitε + e−itε ) E ( e ∏ 2 k =1 n t2 t4 4 2 = 1 − ε + ε + ... 2! 4! olmak üzere, n t 2σ 2 t2 σ 2 − 1 n→∞ 1 − + o( ) →e 2 2! n n dır. Limitteki karakteristik fonksiyona karşılık gelen olasılık yoğunluk fonksiyonu, 1 f ( x) = 2π x2 ∞ − 2 1 2σ − itx e ϕ ( t ) dt = e ∫−∞ X 2πσ olup, bu, ortalaması 0, varyansı σ 2 olan normal dağılımın olasılık yoğunluk fonksiyonudur. Hatayı oluşturan bileşenlerin sayısı çok ve (a), (b), (c) şıklarındaki özellikler sağlanıyorsa hatanın dağılımı için yaklaşık olarak bu normal dağılımı alabiliriz. Kısaca, bir rasgele değişken olan hatanın dağılımı, ortalaması 0 ve varyansı σ 2 olan bir normal dağılımdır, ya da hata 0 ortalamalı ve σ 2 varyanslı normal dağılıma sahiptir diyeceğiz. Elimizdeki terazi için (a), (b), (c) şıklarındaki özellikler sağlanıyorsa ölçmelerde yaptığı hatanın normal dağılıma sahip olduğu söylenebilir. Hatanın doğası hakkında hiçbir şey bilinmiyorsa, gerektiğinde gözlemlerden bir sonuç çıkarılabilir. Belli bir dağılıma sahip olduğu varsayımında bulunuluyorsa gözlemlerden varsayımın doğruluğu sınanabilir (test edilebilir). Elimizdeki terazinin ölçmelerde yaptığı hata için (a), (b), (c) şıklarındaki özellikler sağlanıyor olsun. Bir ölçmedeki hata ε ile gösterilisin. ε ∼ N (0, σ 2 ) olmak üzere, bu dağılımın parametresini, yani varyansı tahmin etmek isteyelim. Gözlemlerimizi iki farklı şekilde yapacağımızı söylemiştik. Tebeşiri n kez tartarak, Y1 , Y2 ,..., Yn örneklemini (bağımsız ve her biri N ( µ , σ 2 ) dağılımına sahip rasgele değişkenleri) göz önüne alalım. Yi = µ + ε i , i = 1, 2,..., n olmak üzere, burada µ tebeşirin kütlesidir (şu an bizi ilgilendirmiyor). σ 2 için düzgün en küçük varyanslı yansız tahmin edici (UMVUE), n σ2 = Sn2−1 = ∑ (Y − Y ) i =1 2 i n −1 dir. 10 gramlık nesneyi n kez tartarak, Y1 , Y2 ,..., Yn örneklemini (bağımsız ve her biri N (10, σ 2 ) dağılımına sahip rasgele değişkenleri) göz önüne alalım. Yi − 10 = ε i , i = 1, 2,..., n olmak üzere, hataları doğrudan gözlemiş oluruz. ε , ε ,..., ε 1 2 n ler N (0, σ 2 ) dağılımından n birimlik örneklem olmak üzere, σ 2 için düzgün en küçük varyanslı yansız tahmin edici (UMVUE), ∑ε n σ2 = i =1 2 i n dir. Arkadaşlar, hipotez testine geçmeden önce, σ 2 için aralık tahmini de yapalım. Tebeşir tartmasında, σ 2 için bir pivot, Q( X , σ ) = 2 (n − 1)Sn2−1 σ 2 ∼ χ n2−1 . dır. (n − 1)Sn2−1 Pσ 2 a ≤ ≤ b = 1 − α 2 σ olmak üzere, (n − 1)Sn2−1 (n − 1)Sn2−1 2 ≤σ ≤ Pσ 2 = 1 − α . b a yazılabilir. O zaman, σ 2 için bu pivota dayalı 1 − α güven katsayılı güven aralıklarının sınıfı, ( n − 1)Sn2−1 (n − 1)Sn2−1 2 , ℂ = C ( X , a , b ) : C ( X , a , b ) = , a , b > 0, a < b , Pσ 2 σ ∈ C ( X , a , b ) = 1 − α b a ( ) dır. Bu sınıftaki bir güven aralığının uzunluğu, 1 1 ℓ (C ( X , a , b )) = (n − 1)Sn2−1 ( − ) . a b olmak üzere, en küçük uzunluklu aralık nedir? Başka bir ifade ile, 1 1 amaç : min (n − 1)Sn2−1 ( − ) a ,b a b kısıt: 0 < a < b , b ∫ fQ (q )dq = 1 − α a Optimizasyon probleminin çözümü nedir? Burada, fQ fonksiyonu χ n2−1 dağılımının olasılık yoğunluk fonksiyonudur. Çözüm, a fQ ( a) = b fQ (b ) 2 2 b ile ∫ fQ (q )dq = 1 − α . a denkemlerini sağlayan a , b değerleridir. Bu denklemlerin çözümleri için Tate and Klett (1959) tarafından tablolar hazırlanmıştır (“Optimum confidence intervals for the variance of the normal stribution” , JASA, Vol.54, pp.674-682). Bu çözümleri MATLAB da yazılmış aşağıdaki bilgisayar programını işleterek de bulabilirsiniz alfa=.05;n=26; aa=chi2inv(alfa,n-1); for a=.1:.01:aa b=chi2inv((1-alfa+chi2cdf(a,n-1)),n-1); if a^2*chi2pdf(a,n-1)-b^2*chi2pdf(b,n-1)>=0;break;end end [a b] ans = 14.2640 45.7100 Tate ve Klett’in tablosundaki değerler, a=14.2636 ve b=45.7051 dir. σ 2 için alışılmış (dengeli-kuyruklu, equally-tailed) güven aralığı, (n − 1)Sn2−1 (n − 1)Sn2−1 , 2 χ n2−1;α /2 χ n −1;1−α /2 dir. 10 gramlık nesne ile yapılan gözlemlerde, σ 2 için alışılmış güven aralığı, n n 2 ∑ ε i2 ∑ε i i =1 , i =1 χ n2;1−α /2 χ n2;α /2 dir. σ 2 için bir pivot, ∑ ε i2 n Q1 ( X , σ 2 ) = i =1 σ 2 ∼ χ n2 olmak üzere, bu pivota dayalı 1 − α güven katsayılı güven aralıklarının, n 2 n 2 ∑εi ∑εi 2 i =1 i =1 ℂ 1 = C ( X , a , b ) : C ( X , a , b ) = , , a , b > 0, a < b , Pσ 2 σ ∈ C ( X , a , b ) = 1 − α b a sınıfı içinde, en küçük uzunluklu olanı, ( a fQ ( a) = b fQ (b ) 2 2 ) b ile ∫ fQ (q )dq = 1 − α a denklemlerin çözümü olan a , b değerlerinden elde edilmektedir. Burada, fQ fonksiyonu χ n2 dağılımının olasılık yoğunluk fonksiyonudur. - Geldik hipotez testine. - Hocam tahmin problemi bitmedi ki. - Ne kaldı geriye? - Gözlemleri almak ve hesaplamak. - Gözlemleri siz alın, hesaplamaları da bilgisayar yapsın. - Tamam hocam. - Sonuçları yorumlamayı unutmayın. Ayrıca, hipotez testi kısmı da ödev olsun.