T.C. ANADOLU ÜN‹VERS‹TES‹ YAYINI NO: 2326 AÇIKÖ⁄RET‹M FAKÜLTES‹ YAYINI NO: 1323 CO⁄RAF‹ B‹LG‹ S‹STEMLER‹ ‹Ç‹N TEMEL ‹STAT‹ST‹K Yazar Prof.Dr. Adnan KONUK (Üniteler 1-8) Editör Yrd.Doç.Dr. Hakan UYGUÇG‹L ANADOLU ÜN‹VERS‹TES‹ Bu kitab›n bas›m, yay›m ve sat›fl haklar› Anadolu Üniversitesine aittir. “Uzaktan Ö¤retim” tekni¤ine uygun olarak haz›rlanan bu kitab›n bütün haklar› sakl›d›r. ‹lgili kurulufltan izin almadan kitab›n tümü ya da bölümleri mekanik, elektronik, fotokopi, manyetik kay›t veya baflka flekillerde ço¤alt›lamaz, bas›lamaz ve da¤›t›lamaz. Copyright © 2011 by Anadolu University All rights reserved No part of this book may be reproduced or stored in a retrieval system, or transmitted in any form or by any means mechanical, electronic, photocopy, magnetic, tape or otherwise, without permission in writing from the University. UZAKTAN Ö⁄RET‹M TASARIM B‹R‹M‹ Genel Koordinatör Prof.Dr. Levend K›l›ç Genel Koordinatör Yard›mc›s› Doç.Dr. Müjgan Bozkaya Ö¤retim Tasar›mc›s› Arfl.Gör.Dr. Mestan Küçük Grafik Tasar›m Yönetmenleri Prof. Tevfik Fikret Uçar Ö¤r.Gör. Cemalettin Y›ld›z Ö¤r.Gör. Nilgün Salur Ölçme De¤erlendirme Sorumlusu Ö¤r.Gör. H. Reha Akgün Grafikerler Ayflegül Dibek, Ufuk Önce, Hazal Y›ld›r›m, Adnan Çamur Kitap Koordinasyon Birimi Yrd.Doç.Dr. Feyyaz Bodur Uzm. Nermin Özgür Kapak Düzeni Prof. Tevfik Fikret Uçar Dizgi Aç›kö¤retim Fakültesi Dizgi Ekibi Co¤rafi Bilgi Sistemleri ‹çin Temel ‹statistik ISBN 978-975-06-1000-4 1. Bask› Bu kitap ANADOLU ÜN‹VERS‹TES‹ Web-Ofset Tesislerinde 250 adet bas›lm›flt›r. ESK‹fiEH‹R, Eylül 2011 iii ‹çindekiler ‹çindekiler Önsöz ............................................................................................................ vii Temel ‹statistik Kavramlar..................................................... 2 ÖRNEKLEME KAVRAMLARI ........................................................................ ‹statistiksel Kütle Türleri .............................................................................. Ana Kütle ve Örnek Kütle ............................................................................ Örnekleme Yöntemleri ................................................................................. Rassal Olmayan Örnekleme ................................................................... Rassal Örnekleme.................................................................................... VER‹LER‹N TOPLANMASI VE SER‹LER HAL‹NDE DÜZENLENMES‹ .......................................................................................... Zaman ve Mekan Serileri ............................................................................. Nitel (Kalitatif) Seriler ............................................................................. Nicel Seriler ............................................................................................. VER‹LER‹N SUNULMASI .............................................................................. Zaman Serilerinin Grafiksel Gösterimi (Kartezyen Grafik)......................... Nitel Serilerin Grafiksel Gösterimi (Pasta Grafi¤i) ..................................... Nicel Serilerin Grafiksel Gösterimi............................................................... Özet ............................................................................................................... Kendimizi S›nayal›m ..................................................................................... Kendimizi S›nayal›m Yan›t Anahtar› ............................................................ S›ra Sizde Yan›t Anahtar› .............................................................................. Yararlan›lan Kaynaklar.................................................................................. 3 3 4 4 5 5 8 8 10 10 14 14 15 16 18 19 20 20 20 Merkezi E¤ilim ve Da¤›l›m Ölçüleri....................................... 22 MERKEZ‹ E⁄‹L‹M ÖLÇÜLER‹ ...................................................................... Aritmetik Ortalama ........................................................................................ A¤›rl›kl› Ortalama .......................................................................................... Geometrik Ortalama...................................................................................... Harmonik Ortalama ..................................................................................... Kareli Ortalama ............................................................................................. Medyan .......................................................................................................... Mod ................................................................................................................ DA⁄ILIM ÖLÇÜLER‹ .................................................................................... De¤iflkenlik Aral›¤› ........................................................................................ Varyans ve Standart Sapma .......................................................................... De¤iflkenlik Katsay›s› .................................................................................... Özet................................................................................................................ Kendimizi S›nayal›m...................................................................................... Kendimizi S›nayal›m Yan›t Anahtar› ............................................................ S›ra Sizde Yan›t Anahtar› .............................................................................. Yararlan›lan Kaynaklar.................................................................................. 2. ÜN‹TE 23 23 28 29 31 32 33 36 37 37 38 39 41 42 43 44 45 Olas›l›k Da¤›l›m Modelleri ...................................................... 46 OLASILIK DA⁄ILIMLARINA GENEL BAKIfi................................................. BAZI KES‹KL‹ OLASILIK DA⁄ILIM MODELLER‹ ....................................... Binom Da¤›l›m› ............................................................................................ 1. ÜN‹TE 47 47 48 3. ÜN‹TE iv ‹çindekiler Poisson Da¤›l›m›............................................................................................ BAZI SÜREKL‹ OLASILIK DA⁄ILIM MODELLER‹ ...................................... Normal Da¤›l›m ............................................................................................. Standart Normal Da¤›l›m ........................................................................ Çarp›kl›k ve Bas›kl›k Katsay›s› ............................................................... Normal Olas›l›k E¤risinin Alt›nda Kalan Alanlar›n Hesaplanmas›........ Lognormal Da¤›l›m ...................................................................................... Özet ............................................................................................................... Kendimizi S›nayal›m ..................................................................................... Kendimizi S›nayal›m Yan›t Anahtar› ............................................................ S›ra Sizde Yan›t Anahtar› .............................................................................. Yararlan›lan Kaynaklar.................................................................................. 4. ÜN‹TE Güven Aral›¤› Tahminleri ....................................................... 68 ‹STAT‹ST‹KTE TAHM‹NLEME....................................................................... Nokta Tahmini............................................................................................... Güven Aral›¤› ve S›n›rlar› ............................................................................ ANA KÜTLE ORTALAMASI ‹Ç‹N GÜVEN ARALI⁄I ................................... Ortalaman›n Standart Hatas› ......................................................................... Büyük Örneklemelerde Ana Kütle Ortalamas›n›n Güven Aral›¤› .............. Küçük Örneklemelerde Ana Kütle Ortalamas›n›n Güven Aral›¤› .............. ANA KÜTLE ORANI ‹Ç‹N GÜVEN ARALI⁄I ............................................... Oran Ortalamas›n›n Standart Hatas›............................................................. Büyük Örneklemelerde Ana Kütle Oran Ortalamas›n›n Güven Aral›¤› .... Küçük Örneklemelerde Ana Kütle Oran› Ortalamas›n›n Güven Aral›¤› ... ‹K‹ ANA KÜTLE ORTALAMASI ARASINDAK‹ FARKIN GÜVEN ARALI⁄I ......................................................................................................... ‹ki Ana Kütle Ortalamas› Aras› Fark›n Standart Hatas›............................... Büyük Örneklemelerde ‹ki Ana Kütle Ortalamas› Aras›ndaki Fark›n Güven Aral›¤›..................................................................................... Küçük Örneklemelerde ‹ki Ana Kütle Ortalamas› Aras›ndaki Fark›n Güven Aral›¤›..................................................................................... ‹K‹ ANA KÜTLE ORANI ARASINDAK‹ FARKIN GÜVEN ARALI⁄I ............ ‹ki Ana Kütle Oranlar› Aras›ndaki Farklar›n Standart Hatas›...................... Büyük Örneklemelerde ‹ki Ana Kütle Oran› Aras›ndaki Fark›n Güven Aral›¤›............................................................................................................. Küçük Örneklemelerde ‹ki Ana Kütle Oran› Farklar›n›n Güven Aral›¤› ... VARYANS ‹Ç‹N GÜVEN ARALI⁄I ................................................................ Özet ............................................................................................................... Kendimizi S›nayal›m ..................................................................................... Kendimizi S›nayal›m Yan›t Anahtar› ............................................................ S›ra Sizde Yan›t Anahtar› .............................................................................. Yararlan›lan Kaynaklar.................................................................................. 5. ÜN‹TE 50 52 52 54 55 57 60 63 64 65 65 66 69 69 70 71 72 72 74 75 75 76 77 78 79 79 81 81 81 82 82 83 85 86 87 88 88 ‹statistiksel Karar Vermede Hipotez Testleri ...................... 90 H‹POTEZ‹N KURULMASI VE TEST‹............................................................. Hipotezlerin Kurulmas› ................................................................................. Red Bölgesinin Tan›mlanmas› ................................................................ Test ‹statisti¤ini Hesaplanmas› ve Karar Verme.................................... ANA KÜTLE ORTALAMASINA ‹L‹fiK‹N TESTLER ...................................... 91 92 92 93 94 v ‹çindekiler Büyük Örneklemelerde Ortalamalar›n Testi................................................ Küçük Örneklemelerde Ortalamalar›n Testi................................................ ANA KÜTLE ORANINA ‹L‹fiK‹N TESTLER .................................................. Büyük Örneklemelerde Oranlar›n Testi ...................................................... Küçük Örneklemelerde Oranlar›n Testi ..................................................... ANA KÜTLE ORTALAMALARI ARASINDAK‹ FARKLARIN TEST‹............... Büyük Örneklemelerde Ana Kütle Ortalamalar› Aras›ndaki Farklar›n Testi ............................................................................. Küçük Örneklemelerde Ortalamalar Aras›ndaki Farklar›n Testi ............................................................................ VARYANSLARIN TEST‹ ................................................................................. Özet................................................................................................................ Kendimizi S›nayal›m...................................................................................... Kendimizi S›nayal›m Yan›t Anahtar› ............................................................ S›ra Sizde Yan›t Anahtar› .............................................................................. Yararlan›lan Kaynaklar.................................................................................. 95 97 99 100 101 102 102 104 105 108 109 110 110 112 Regresyon ve Korelasyon........................................................ 114 DE⁄‹fiKENLER ARASI ‹L‹fiK‹LER ................................................................ Belirleyici ve Deneysel ‹liflkiler ................................................................... Ba¤›ml› ve Ba¤›ms›z De¤iflkenler................................................................. De¤iflkenler Aras› ‹liflkinin Yönü ve Derecesi............................................. BAS‹T DO⁄RUSAL REGRESYON VE KORELASYON ................................ Serpilme Diyagram›....................................................................................... En Küçük Kareler Yöntemi........................................................................... Standart Hata ve Tahminlerin Güven Aral›¤› .............................................. Korelasyon Katsay›s› ..................................................................................... Korelasyon Katsay›s›n›n Test Edilmesi......................................................... E⁄R‹SEL (ÜSTEL) REGRESYON VE BEL‹RL‹L‹K KATSAYISI .................... Üstel Regresyon ........................................................................................... Belirlilik Katsay›s› ve Standart hata.............................................................. Özet ............................................................................................................... Kendimizi S›nayal›m ..................................................................................... Kendimizi S›nayal›m Yan›t Anahtar› ............................................................ S›ra Sizde Yan›t Anahtar› .............................................................................. Yararlan›lan Kaynaklar.................................................................................. Jeoistatistiksel Kavramlar ....................................................... 144 BÖLGESELLEfiM‹fi DE⁄‹fiKENLER .............................................................. Yersellik (Lokalizasyon)................................................................................ Devaml›l›k .................................................................................................... Yönsel De¤iflim (Anizotropi) ....................................................................... Geçifller ......................................................................................................... VAR‹OGRAM VE SEM‹-VAR‹OGRAM........................................................... Deneysel Semi-Variogram Parametreleri .................................................... Külçe Varyans› (C0) ................................................................................ Eflik De¤er (C0+C) ................................................................................. Külçe Etki Oran› (e)................................................................................ Etki Mesafesi (a)...................................................................................... Yönsel Etki Mesafesi Oran› (Anisotropi Oran›) ................................... 6. ÜN‹TE 115 115 116 116 116 117 119 124 126 127 131 131 133 138 139 140 141 143 145 146 146 146 147 147 147 148 148 148 148 148 7. ÜN‹TE vi ‹çindekiler Semi-Variogram›n Yönsel De¤iflimi (Anizotropi) ........................................ Semi-Variogram Fonksiyonunun Orijine Yak›n Davran›fl› ........................ KURAMSAL SEM‹-VAR‹OGRAM MODELLER‹.............................................. Küresel (Spherical) Model ............................................................................ Üstel (Eksponansiyel) Model........................................................................ Do¤rusal Model ............................................................................................. Özet ............................................................................................................... Kendimizi S›nayal›m ..................................................................................... Kendimizi S›nayal›m Yan›t Anahtar› ............................................................ S›ra Sizde Yan›t Anahtar› .............................................................................. Yararlan›lan Kaynaklar.................................................................................. 8. ÜN‹TE 149 149 153 153 154 155 160 161 162 163 164 Konumsal Tahmin (‹nterpolasyon) ve Kriging.......................166 UZAKLI⁄A BA⁄LI TAHM‹N YÖNTEMLER‹ ................................................ KLAS‹K KONUMSAL TAHM‹N YÖNTEMLER‹ ............................................. En Yak›n Komflu Yöntemi ............................................................................ Yüzey Trend Analizi ..................................................................................... Uzakl›¤›n Tersi ‹le A¤›rl›kland›rma Yöntemi ............................................... KR‹G‹NG TAHM‹N YÖNTEM‹ .................................................................... Nokta Kriging ............................................................................................... Özet................................................................................................................ Kendimizi S›nayal›m...................................................................................... Kendimizi S›nayal›m Yan›t Anahtar› ............................................................ S›ra Sizde Yan›t Anahtar› .............................................................................. Yararlan›lan Kaynaklar.................................................................................. Ki Kare Tablosu............................................................................................. T Tablosu....................................................................................................... Z Tablosu....................................................................................................... 167 168 168 171 172 174 175 184 185 187 187 189 190 191 192 Önsöz Önsöz Günümüzde sosyal, ekonomik, tar›msal, çevresel vb. sorunlara yönelik konumsal verilerin toplanmas›, saklanmas› ve sunulmas› ifllevlerini gerçeklefltiren Co¤rafi Bilgi Sistemleri’nin kullan›m› gün geçtikçe yayg›nlaflmaktad›r. Co¤rafi Bilgi Sistemleri (CBS) ile konumsal gözlem veya araflt›rma yapan personelin ise toplanan büyük hacimli verileri istatistik yöntemlerle de¤erlendirerek yorumlanmas› ve karar verme çal›flmalar›nda istatistik bilgisine sahip olmas› gerekmektedir. Co¤rafi Bilgi Sistemlerinin üretti¤i bilgileri kullanan yöneticilerin de, gözlemlenen veya araflt›r›lan konumsal verilerden sonuç elde ederek süreçleri gelifltirebilmeleri, tahmin yapabilmeleri ve karar verebilmeleri için istatistik yöntemleri ve modelleri kullanabilmeleri gerekmektedir. Co¤rafi Bilgi Sistemleri ‹çin Temel ‹statistik ad› alt›nda haz›rlanm›fl olan bu kitapla, Co¤rafi Bilgi Sistemlerini kullanan personel ve karar verici konumundaki yöneticilere temel düzeyde ilgili istatistiksel problemleri çözebilecek istatistik bilgisini kazand›rmak amaçlanm›flt›r. Kitap, yayg›n olarak kullan›lan temel konular›n örnek uygulamalarla ele al›nd›¤› sekiz üniteden oluflmaktad›r. Kitapta birinci ünitede verilen temel istatistik kavramlar›n ard›ndan, ikinci ünitede merkezi e¤ilim ve da¤›l›m ölçüleri, üçüncü ünitede baz› kesikli ve sürekli olas›l›k da¤›l›m modelleri, dördüncü ünitede güven aral›¤› tahmin yöntemleri, beflinci ünitede istatistiksel karar vermede kullan›lan hipotez testi yöntemleri, alt›nc› ünitede regresyon ve korelasyon analizleri, yedinci ünitede jeoistatistiksel kavramlar ve sekizinci ünitede konumsal tahminde kullan›lan klasik istatistik ve jeoistatistik yöntemler ele al›nm›flt›r. Her ünitede konularla ilgili örneklere yer verilmifl, s›ra sizde sorular› ile ö¤renilen konular›n pekifltirilmesi ve kendimizi s›nayal›m bafll›¤› alt›nda verilen soru ve yan›tlarla kendinizi s›naman›z hedeflenmifltir. Temel istatistik bilgilerini kavrad›kça ve uygulamalarda kulland›kça, toplad›¤›n›z verileri daha iyi derledi¤inizi, yorumlad›¤›n›z› ve veriler yard›m›yla tahminler yap›p karar verebildi¤inizi göreceksiniz. Kitab›n, Co¤rafi Bilgi Sistemleri konusunda çal›flan ö¤renci, araflt›rmac› ve yöneticilere yararl› olmas› dileklerimle… Editör Yrd.Doç.Dr. Hakan UYGUÇG‹L vii CO⁄RAF‹ B‹LG‹ S‹STEMLER‹ ‹Ç‹N TEMEL ‹STAT‹ST‹K 1 Amaçlar›m›z N N N Bu üniteyi tamamlad›ktan sonra; Örnekleme kavramlar›n› ö¤renerek örnekleme yöntemi seçimini yapabilecek, ‹statistiksel verilerin toplanmas› ve düzenlenmesi çal›flmalar›n› temel anlamda gerçeklefltirebilecek, ‹statistiksel verileri sunabilecek bilgi ve becerilere sahip olacaks›n›z. Anahtar Kavramlar • • • • • Ana kütle Örnek kütle Örnekleme ‹statistik Seriler ‹statistik Grafikler • • • • • Rassal Örnekleme Küme Örnekleme Tabakal› Örnekleme Dilim Örnekleme Kota Örneklemesi ‹çindekiler Co¤rafi Bilgi Sistemleri ‹çin Temel ‹statistik Temel ‹statistik Kavramlar • ÖRNEKLEME KAVRAMLARI • VER‹LER‹N TOPLANMASI VE SER‹LER HAL‹NDE • DÜZENLENMES‹ • VER‹LER‹N SUNULMASI Temel ‹statistik Kavramlar ÖRNEKLEME KAVRAMLARI ‹statistiksel araflt›rmalarda genellikle belirli bir ana kütle de¤iflken ve parametreleri hakk›nda bilgi üretilmeye çal›fl›l›r. Ana kütle parametre ve de¤iflkenleri hakk›nda tam ve do¤ru bilgi üretebilmek için tüm ana kütlenin ele al›nmas› gerekir. Ancak, tüm ana kütlenin ele al›nmas› süreci hem çok zaman al›c› hem de pahal› oldu¤undan, genellikle ana kütleyi temsil edebilecek say›da örnek alarak, bu örnek kütle yard›m›yla ana kütle parametreleri hakk›nda bilgi üretilmeye çal›fl›r. Sorun, ana kütleyi temsil edecek düzeyde örnekleme yapmak ve örnek kütlenin boyutu hakk›nda karar vermektir. ‹statistiksel Kütle Türleri ‹statistikse anlamda kütleler, oluflum flekline göre gerçek ya da varsay›msal, sonlu ya da sonsuz ve sürekli ya da süreksiz olufluna göre s›n›fland›r›labilmektedir. Gerçek birimlerden oluflan kütleye gerçek kütle, gelecekte oluflturulabilecek birimlerden oluflan kütleye varsay›msal kütle denir. Örne¤in, bir toplu konut projesinde inflaat› tamamlanm›fl konutlar gerçek kütleyi olufltururken, gelecek y›llarda SIRA S‹ZDE tamamlanacak konutlar varsay›msal kütleyi oluflturur. Bir kütledeki birimler tam olarak say›labiliyorsa bu tür kütlelere sonlu kütle, kütleyi oluflturan birimler say›labiliyor olmakla birlikte tamam›n› sayabilmek mümD Ü fi Ü N E L ‹ M kün de¤il ise bu tür kütlelere sonsuz kütle denilir. Örne¤in, Çanakkale Bo¤az›ndan bir ayda geçen gemileri sayabilmek mümkün iken, bal›klar› sonlu say›da sayS O R U mak mümkün de¤ildir. Baz› kütleler sonlu olmakla birlikte, tam say›m yap›ld›¤›nda zarar görme D ‹ K K Aveya T yok olmas› sözkonusu olur. Bu gibi kütleleri de sonsuz kütle olarak kabul etmek gerekir. Örne¤in, bir binan›n beton sa¤laml›¤›n› test etmek için tüm kolonlar› örnekledi¤imizde, binan›n SIRA S‹ZDE göçmesi sözkonusudur. Bu durumda, bina kolonlar› betonunu sonsuz kütle kabul etmek gerekir. AMAÇLARIMIZ N N Do¤al birimlerden oluflan, parçaland›klar› ya da birlefltirildiklerinde niteliklerini kaybeden kütlelere süreksiz kütle; do¤al olmayan birimlerden oluflan, parçalanK ‹ Tise A sürekli P d›klar› ve birlefltirildiklerinde niteliklerini kaybetmeyen kütlelere kütle denir. Örne¤in, cam bardak ve porselen tabak süreksiz kütleyi oluflturur. Bununla SIRA S‹ZDE D Ü fi Ü N E L ‹ M S O R U D‹KKAT SIRA S‹ZDE AMAÇLARIMIZ K ‹ T A P TELEV‹ZYON TELEV‹ZYON ‹NTERNET ‹NTERNET 4 Co¤rafi Bilgi Sistemleri ‹çin Temel ‹statistik birlikte, cam bardak yap›m›nda kullan›lan silis kumu veya porselen tabak yap›m›nda kullan›lan kil madeni sürekli kütleyi oluflturur. SIRA S‹ZDE 1 D Ü fi Ü Nve E L ‹ MÖrnek Kütle Ana Kütle D Ü fi Ü N E L ‹ M Sonlu veya sonsuz say›da birimden oluflan canl› ya da cans›z toplulu¤un tamam›na ana kütleS denir. O R U Ana kütlenin ne oldu¤u hakk›nda karar verirken, ana kütleyi oluflturan birimlerin ayn› nedenlerin etkisi alt›nda kalmas›na, ayn› özelliklere sahip olmas›na veya baz› ortak özelliklerinin olmas›na dikkat etmemiz gerekmektedir. D‹KKAT Ana kütle birim say›s›n›n çok büyük olmad›¤›, mekansal olarak çok genifl bir alana yay›lmad›¤›, araflt›rma için ayr›lan bütçenin ve sürenin k›s›tl› olmad›¤› ve SIRA S‹ZDEbirimlerin zarar görme olas›l›¤›n›n olmad›¤› durumlarda ana araflt›rma s›ras›nda kütle birimlerinin tamam› hakk›nda bilgi elde edilme yoluna gidilir. Böyle bir çal›flmaya tam say›m denilmektedir (Orhunbilge, 2000). Örne¤in, bir s›n›ftaki ö¤renAMAÇLARIMIZ cilerin belirli bir dersteki not ortalamas›n› belirlemek için tüm ö¤rencilerin notlar› ele al›n›r. Ancak, bir binan›n beton kalitesini belirlemek için binaya zarar vermeden tüm kolonlar›n›n K ‹ T A P beton sa¤laml›¤›n› test etmek mümkün de¤ildir. S O R U D‹KKAT SIRA S‹ZDE AMAÇLARIMIZ Bir bölgede SIRA bulunan S‹ZDEa¤aç türleri üzerine araflt›rma yap›lmaktad›r. A¤aç türleri kütlesi, sonlu kütle mi yoksa sonsuz kütle midir? N N K ‹ T A P SIRA S‹ZDE Türkiye’de otoyol ar›zalar›n›n trafik kazalar›na etkilerinin araflt›r›ld›¤› bir çal›flmada, tam SIRA S‹ZDE say›m yapmak mümkün müdür? Nedenlerini aç›klay›n›z. TELEV‹ZYON D Ü fi Ü N E L ‹ M D Ü fi Ü N Esonsuz L‹M Ana kütlenin veya sonlu fakat çok say›da birimden olufltu¤u, tam say›m için bütçenin yetersiz ve fazla zaman›n olmad›¤› veya birimlerin tamam›n›n say›m› ‹ NST kütlenin s›ras›nda ana zarar görme olas›l›¤› oldu¤u durumlarda, ana kütleyi temsil OE RRNUE T edecek say›da birim seçilerek araflt›rmalar sürdürülür. Ana kütleyi temsil edecek say›da birimden oluflan kütleye örnek kütle denilir. Örne¤in, bir akarsuyun kirliliD‹KKAT ¤ini belirlemek için belirli zaman aral›klar›nda al›nan su örnekleriyle, su kirlili¤i hakk›nda fikir edinilebilir. SIRAbirimleri S‹ZDE say›s›n›n tamam›na ana kütle hacmi veya boyutu denilmekAna kütle te olup, “N” ile simgelenir. N birimlik ana kütleden elde edilen örnek kütlelerin birim say›s›na ise örnek hacmi veya örnek boyutu denilir ve “n” simgesi ile gösteriAMAÇLARIMIZ lir. Örnek kütle, ana kütleden elde edilen bir alt kütle oldu¤una göre, n<N olur (Serper, 2000). ‹statistiksel çal›flmalar›nda, ana kütleden elde edilen örnek kütle ile K ‹ Taraflt›rma A P ana kütle parametrelerini tahmin etmek mümkündür. Ancak, gerçe¤e yak›n ve tam say›m de¤erlerine yak›n sonuçlar elde edilebilmesi için örnek kütle birim say›s›n›n mümkün oldu¤unca büyük (çok say›da) olmas› gerekmektedir. Örnek boyutu (biTELEV‹ZYON rim say›s›) artt›kça, örnek kütle parametreleriyle ana kütle parametrelerinin tahminindeki hata büyüklü¤ü de o derecede azal›r. TELEV‹ZYON2 ‹ NSTOE RRNUE T D‹KKAT SIRA S‹ZDE AMAÇLARIMIZ N N Örnekleme K ‹ T Aboyutunu, P örneklemeden beklenen hata boyutuna ba¤l› olarak belirleyebiliriz. Bu kitab›n 4. ünitesinde, güven aral›¤› Ttahminleri E L E V ‹ Z ele Y O al›n›rken N örnekleme boyutu hakk›nda da bilgi sahibi olaca¤›z. ‹NTERNET ‹ N T E R NYöntemleri ET Örnekleme Ana kütle birimlerinin belirli bir k›sm›n›n gözlemlenmesi anlam›na gelen örneklemenin do¤ru yap›lmas›, ana kütlenin do¤ru tan›mlanmas›na ve amaca uygun olarak seçilen örnekleme yöntemine ba¤l› olarak de¤iflir. Ana kütleyi kapsayan birimlerin s›n›rland›r›lmas› ifllemi çerçevenin belirlenmesi ile gerçeklefltirilir. Örne¤in, fosil yak›tlar›n çevre kirlili¤i üzerindeki etkilerini araflt›ran bir araflt›rma yap›lacak- 5 1. Ünite - Temel ‹statistik Kavramlar sa, öncelikle sobalarda yak›lanlar›n m› yoksa termik santralin mi etkilerinin araflt›r›laca¤›na karar vermek gerekir. Ancak, her zaman çerçevenin belirlenmesi kolay olmaz veya çerçevenin tan›mlanmas› mümkün olmayabilir (Cula ve Muluk, 2006). Örnekleme yöntemleri, ana kütle birimlerinin yap›s›na ve örnekleme amac›na göre belirlenebilmektedir. Ana kütledeki birimlerin her birinin örnek kitleye girme olas›l›¤›na göre örnekleme yöntemlerini afla¤›daki gibi s›n›flamak mümkündür. Rassal Olmayan Örnekleme Ana kütleden örnek seçiminin rassal olarak yap›lmad›¤›, araflt›rmac›n›n kendi takdiri veya iradesi ile seçti¤i birimlerden oluflan örnekleme rassal olmayan örneklemedir. Ana kütleden yap›lan bu tür örneklemelerde, araflt›rmac›n›n ana kütle hakk›ndaki bilgisi, uzmanl›¤› ve yans›zl›¤› önemlidir. Araflt›rmac›n›n bilgisinin yetersiz veya yanl› olmas› durumunda, ana kütleden seçilecek örneklerin afl›r› küçük veya büyük olmas› ve örnek kütle ile yap›lacak de¤erlendirmelerin büyük hatalar içermesi söz konusu olabilir. Bu sak›ncalar› nedeniyle, rassal olmayan örnekleme istatistiksel çal›flmalarda tercih edilmemektedir. Bununla birlikte, baz› zorunlu durumlarda rassal olmayan örneklemeye baflvurmak gerekli olabilmektedir. Ana kütleyi oluflturan birimler çok genifl bir alana yay›lm›fl ise, tüm co¤rafik alanlardan örnekleme yapmak zaman ve bütçe aç›s›ndan mümkün olmayabilir. Bu durumda, ana kütleyi tüm özellikleriyle temsil edebilecek dar bir alandan örnekleme yap›lmas› gerekebilir. Bu tür örneklemelere rassal olmayan dilim örneklemesi denilmektedir (Cula ve Muluk, 2006). Örne¤in, Türkiye genelinde yap›lacak bir araflt›rmada ‹stanbul’un örnek flehir olarak seçilmesi yeterli olabilir. Ana kütlenin s›n›fland›r›lmas› halinde farkl› k›s›mlardan veya bölümlerden olufltu¤u biliniyorsa, örneklemenin tüm k›s›mlar› temsil etmesi amac›yla her bir k›sma belirli oranlarda kota konularak örnek al›nmas› tercih edilebilir. Bu tür örneklemelere kota örneklemesi denilmektedir (Orhunbilge, 2000). Örne¤in, belirli bir konuda bir üniversitede yap›lacak anket çal›flmas› için fakültelerin toplam ö¤renci say›lar› ile orant›l› ö¤renci say›lar› belirlenerek, anket uygulamas›n›n tüm fakültelerin ö¤rencilerini temsil etmesi sa¤lanabilir. ‹malat sanayinde çal›flan iflçilerin ifl kazas› geçirme olas›l›klar›n›n SIRA araflt›r›ld›¤› S‹ZDE bir çal›flmada, imalat sanayi iflletmelerinin makine, otomotiv, kimya, seramik, çimento gibi ayr› ayr› de¤erlendirildi¤i durumda, her ifl kolunda faaliyet gösteren iflletmelerin %10’undan örD Ü fi Ü N E L ‹ M nekleme yap›l›rsa, bu örnekleme ne tür örnekleme olur? Rassal Örnekleme S O R U AMAÇLARIMIZ D Ü fi Ü N E L ‹ M S O R U Ana kütle birimlerinin her birine belirli ve s›f›rdan büyük bir olas›l›kla örnek kütleye seçilme flans›n›n verildi¤i örneklemelere rassal örnekleme denilir. Rassal örD‹KKAT neklemenin en önemli özelli¤i, ana kütledeki her birimin örne¤e dahil olma olas›l›¤›n›n ayn› olmas›d›r. Ana kütlenin yap›s›na göre rassal örneklemeler farkl› flekilSIRA S‹ZDE lerde yap›labilmektedir. Basit Rassal Örnekleme 3 SIRA S‹ZDE N N N birimlik ana kütleden, her birine eflit seçilme flans› verilmesi ile n birimlik örnek seçilmesi ifllemine basit rassal örnekleme denilir. Bu tür örnekleme genellikle sonlu bir ana kütleden yap›lmakta olup, N birimlik ana kütledekiK ilk seçilme ‹ T birimin A P D‹KKAT SIRA S‹ZDE AMAÇLARIMIZ K ‹ T A P TELEV‹ZYON TELEV‹ZYON ‹NTERNET ‹NTERNET 6 Co¤rafi Bilgi Sistemleri ‹çin Temel ‹statistik Bir çok istatistik kitab›n›n ekinde rassal (tesadüfi veya rastgele) say›lar çizelgesi bulunabilir. Bu çizelgeler, dört veya befl basamakl› rassal ifllemlerle elde edilmifl say›lardan oluflabilece¤i gibi, s›f›r ile bir aras› say›lardan da oluflabilmektedir. Örne¤in, Neyran Orhunbilge’nin Tan›msal ‹statistik Olas›l›k ve Olas›l›k Da¤›mlar› (Avc›ol Bas›m Yay›n, ‹stanbul, 2000) isimli kitab›n›n ekinde verilen rassal say›lar çizelgesi befl basamakl› say›lardan oluflmaktad›r. Bu çizelgeyi 100 adet rassal örnekleme için kullanmak istersek, verilen befl basamakl› say›lar›n ilk iki basama¤›n›, 1000 adet rassal örnekleme için ise ilk üç basama¤›n› dikkate alarak elde edece¤imiz rassal say›lar› kullanabiliriz. Bilgisayar programlar›nda var olan RND fonksiyonu ise 0 ile 1 aras› say›lardan olufltu¤undan, bu say›lar› ise rassal örnek say›s› ile çarparak kullan›r›z. flans› 1/N’dir. Ancak, i=1’den N’e kadar daha sonraki seçimlerde, daha önceki örne¤in seçilme flans› olmad›¤›ndan, örneklerin seçilme flans› 1/(N-i) olur. Basit rassal örneklemede, sonlu say›daki N birimlik ana kütleden rassal örnek seçimi, kura yöntemi, rassal say›lar çizelgesi veya bilgisayar programlar›n›n rassal say› üreteci (RND fonksiyonu) kullan›labilir. Ana kütle birim say›s›n›n çok küçük oldu¤u durumlarda genellikle kura yöntemine baflvurulur (Orhunbilge, 2000). Örne¤in, 100 kifli çal›flan bir iflletmede çal›flan memnuniyetini belirlemek için yap›lacak anket çal›flmas› için 30 kiflinin seçilmesi gerekmektedir. Bu seçim iflleminde öncelikle, 100 kifli 1’den 100’e kadar numaraland›r›l›r. Sonra rassal say›lar çizelgesinden 30 adet say› belirlenir ve bu say›lara karfl›l›k gelen çal›flanlara anket uygulan›r. Basit rassal örnekleme yöntemi kullanman›n yararl› yönleri; • Ana kütledeki her birimin eflit seçilme flans› vard›r • Ana kütle çok büyük ve karmafl›k de¤ilse seçme ifllemi kolayd›r • Örnek kütle ile yap›lan istatistiksel ifllemlerde a¤›rl›kland›rma yapmaya gerek olmaz. Basit rassal örnekleme yöntemi kullanman›n sak›ncalar› ise; • Ana kütlenin çok büyük oldu¤u durumlarda, ana kütleyi s›ralamak ve ana kütleden seçmek güçtür. • Araflt›r›lan özellik, ana kütle birimlerinde baz› de¤ifliklikler gösterebilir. • Örnekleme seçilecek birimler mekansal olarak çok genifl bir alana da¤›lm›fl olabilir. Sistematik Rassal Örnekleme Sistematik rassal örnekleme yöntemi, ana kütle birimlerinin seri olarak numaraland›r›labildi¤i ya da kay›t alt›na al›nabildi¤i durumlar için uygulan›r. Bu yöntem, ana kütle birim say›s›n›n (N) sonlu ve birimlerin belirli bir s›rada dizildi¤i, örnek kütle say›s›n›n (n) da belirli oldu¤u durumlarda uygulanabilir. Yöntemin uygulanmas›nda, öncelikle anakütle 1 den N’e kadar numaralan›r. Daha sonra büyütme faktörü k=N/n ifllemi ile hesaplan›r. Bu ifllemler tamamland›ktan sonra s›ralanm›fl ana kütlenin ilk k tane birimi aras›ndan bir tanesi rassal olarak seçilir. Rassal olarak bafllang›ç noktas›n›n seçilmesinden sonra, ana kütlenin her k’›nc› birimi örnek kütleye seçilir. Ana kütleden, sistematik olarak “k” eklenerek seçim ifllemi, örnek kütle birey say›s›na (n) ulafl›ncaya kadar devam edilir. ÖRNEK 1 SIRA S‹ZDE D Ü fi Ü N E L ‹ M 4 Bir belediye, 1000 hane bulunan bir mahallede 50 haneyi örnek seçerek baz› uygulamalar› ile ilgili görüfllerini almak istemektedir. Bu durumda, k = 1000 / 50 = 20 olarak hesaplan›r ve her 20 hanede bir örnekleme yap›lmas› gerekecektir. Bafllang›ç say›s› rassal say›lar çizelgesinde 1 ile 20 aras›nda bir say› seçilerek bulunur. Örne¤in seçilen say› 12 ise önce 12’inci hanenin görüflleri örnek olarak al›n›r, sonra her 20 hanede bir hanenin görüflü al›n›r. Örneklenen n adet hanenin numaralar› 12, 32, 52, 72, ......992 olacakt›r. Bir sanayi bölgesinde SIRA S‹ZDEbulunan 100 tekstil fabrikas›ndan 20 tanesi seçilerek verimlilik analizleri yap›lmak istenmektedir. Rassal say›lar çizelgesinden seçilen say›, büyütme faktörü say›s›na eflit oldu¤una göre, hangi nolu fabrikalar› sistematik olarak rassal örnekleyebiliriz? D Ü fi Ü N E L ‹ M S O R U S O R U D‹KKAT D‹KKAT SIRA S‹ZDE SIRA S‹ZDE 1. Ünite - Temel ‹statistik Kavramlar 7 Mekansal (konumsal) ya da zamansal ana kütle birimlerinden eflit aral›klarla örnekleme yapmada da sistematik örnekleme yöntemi kullan›labilmektedir. Özellikle çevresel de¤iflimlerin ve maden yataklar›nda rezerv-tenör belirleme çal›flmalar›n›n yap›ld›¤› yerlerde sistematik örnekleme oldukça kullan›fll› bir yöntemdir. Ancak, örnekleme yap›lan alan büyüdükçe sistematik örnekleme zorlafl›r ve baz› yönsel sürekli de¤iflimlerin oldu¤u alanlarda, örnekleme rassall›ktan uzaklaflabilir. Örne¤in, ekolojik de¤iflimin araflt›r›ld›¤› bir alanda, belirlenen hatlar boyunca 10 m aral›klarla sistematik rassal bitki örnekleri al›nabilir. Ancak, bir maden yata¤›nda tenör de¤iflimini belirlemek amac›yla 100 m aral›klarla örnekler al›nd›¤›nda, örnekleme hatt›na ba¤l› olarak tenör de¤iflimlerinin yönsel farkl›l›klar gösterdi¤i de gözlenebilir. Küme Örnekleme Ana kütlenin küme ad› verilen gruplara ayr›ld›¤› ve kümelerden örneklerin al›nd›¤› yönteme küme örnekleme denilmektedir. Bu yöntemde N birimlik ana kütle M adet kümeye ayr›lmakta ve her kümeden rassal olarak m birimlik rassal örnek kütle seçilmektedir. Ana kütleyi oluflturan birimlerin listelenemedi¤i durumlarda veya co¤rafi olarak genifl bir alana yay›lm›fl birimler hakk›nda araflt›rma yap›ld›¤› durumlarda maliyetleri azaltmak amac›yla küme örneklemesinden yararlan›l›r. Küme örneklemeden yararlanarak ana kütle hakk›nda tahminde bulunurken, küme birimlerinin birbirinin benzeri oldu¤u durumlarda hata ihtimali de artabilmektedir. Maden iflletmelerinde ifl kazalar›n›n araflt›r›ld›¤› bir durumda, maden iflletmeleri kömür, metal, endüstriyel hammaddeler ve tafl-kum-m›c›r iflletmeleri olarak kümelere ayr›labilir. Bu durumda, üretim yöntemleri farkl› (örne¤in kömür madencili¤inde yer alt› ocak iflletmecili¤i yayg›nken tafl-kum-m›c›r iflletmelerinin tamam›nda yerüstü ocak iflletmecili¤i uygulan›r) ve çal›flan iflçi say›lar› farkl› olan kümelerden eflit say›larda m birimlik örnek al›n›p ana kütle hakk›nda tahmin yap›lmas› büyük hatalara neden olacakt›r. Küme örnekleme kademeli olarak ta yap›labilir. E¤er her bir kümeden m birimlik örnekler al›n›rsa, bu örnekleme türüne tek kademeli basit küme örneklemesi denilir. Ancak, her kümedeki m adet birimden ayr›ca rassal örnekleme yap›l›rsa, bu örneklemeye ise ikinci kademe küme örneklemesi denilir. Tabakal› Örnekleme Ana kütledeki birimlerin özelliklerinin önemli farkl›l›klar gösterdi¤i durumlarda, bu birimleri “tabaka” ad› verilen homojen alt gruplara ay›rmak gerekmektedir. Ana kütlenin tabakalara ayr›lmas› sonras›nda her bir tabakadan rassal örnekleme yap›l›r ve elde edilen sonuçlar birlefltirilirse tabakal› örnekleme yap›lm›fl olur (Serper, 2000). Tabakal› örnekleme, sonlu say›da birime sahip ana kütlelerde alt tabakalar veya alt birim gruplar›n›n var oldu¤u durumlarda kullan›l›r. Tabakal› örneklemede, tabakalar›n do¤ru oluflturulmas› gereklidir. Tabakal› örneklemeden iyi sonuç alabilmek için, tabakalar›n kendi içinde homojen olmas› ve tabakalar aras›nda gerçek bir farkl›l›k bulunmas› gerekir. Tabakal› örneklemelerde her tabakan›n birim say›s›n›n her zaman eflit olmas›n› sa¤lamak olanaks›zd›r. Bu durumda, iki farkl› yöntemle örnek seçimi yap›l›r. Birincisinde, tabakalardaki birim say›s› dikkate al›nmadan her tabakadan eflit say›da ör- ÖRNEK 2 8 Co¤rafi Bilgi Sistemleri ‹çin Temel ‹statistik nekleme yap›l›r. Orant›s›z seçim denilen bu yöntem sonucunda istatistiksel de¤erlendirmeler yap›l›rken, tabakalar›n birim say›lar› ile a¤›rl›kl› hesaplamalar yapmak gerekir. ‹kincisinde ise, tabakalardaki birim say›lar›yla orant›l› olarak örnekleme yap›l›r. Orant›l› seçim denilen bu yöntem sonucunda istatistiksel de¤erlendirmeler yap›l›rken aritmetik ortalama a¤›rl›ks›z hesaplan›r. Tabakal› örnekleme kullan›m›n›n yararlar›; • Tabakalanma iyi yap›l›r ise daha do¤ru bilgi elde etme olana¤› vard›r. • Her tabakadan al›nan örneklemin kendi tabakas›n› temsil yetene¤i oldu¤undan her tabaka için ayr› sonuç elde etme olana¤› da sa¤lar. Tabakal› örnekleme kullanman›n sak›ncalar› ise; • Örnekleme hatas›n› hesaplamak zor olabilir. • Tabakalar›n birim say›lar› düflük olursa, tabakalara ba¤l› araflt›rma sonucu elde edilecek bilginin do¤rulu¤u azal›r. ÖRNEK 3 Bir yerleflim biriminin y›ll›k ortalama hava s›cakl›¤› de¤iflimlerinin ölçülmek istendi¤i bir durumda, s›cakl›¤›n aylara ba¤l› de¤iflimi dikkate al›nmadan örnekleme yap›l›rsa, elde edilecek sonuçlar gerçe¤i yans›tmayabilir. Bunun için önce aylara göre tabakalama yap›lmal› ve her tabakadan basit rassal örnekleme yöntemiyle belirli say›da örnek ölçümler yap›l›rsa, sonuç daha anlaml› olacakt›r. VER‹LER‹N TOPLANMASI VE SER‹LER HAL‹NDE DÜZENLENMES‹ ‹statiksel veriler ya haz›r veri kaynaklar›ndan elde edilir ya da araflt›rmac›lar taraf›ndan anket, gözlem veya deney çal›flmalar› ile toplan›rlar. Elde edilen bu veriler genellikle ham veri fleklindedir. Ham verilerin istatistiksel analize uygun hale getirilmesi için düzenlenmesi gerekir. Veriler, örneklenen birimlerin zaman ve mekan özelliklerine, nitel ve nicel özellikleriyle da¤›lma flekillerine göre seriler fleklinde düzenlenebilirler. Zaman ve Mekan Serileri Zaman serileri, kullan›c›n›n veya araflt›rmac›n›n amac›na göre birden farkl› zaman birimi ile de gösterilebilmektedir. ÖRNEK 4 Örneklenen veya gözlemlenen verilerin çeflitli özelliklerinin saat, gün, ay ve y›l gibi bir zaman birimine göre s›ralamas› veya da¤›l›m› oluflturulursa, bu seriye zaman serisi denilir. Özellikle ülkelerin sosyal ve ekonomik geliflim göstergeleri, iflletmelerde verimlilik ve kalite verileri, hava s›cakl›¤› ve ya¤›fllar, trafik yo¤unlu¤u ile baz› deneysel veriler zamana ba¤l› olarak iki sütunlu seriler fleklinde gösterilirler. Türkiye ‹statistik Kurumu enflasyon oranlar›n›n de¤iflimini ayl›k ve y›ll›k zaman birimlerine göre ayr› ayr› zaman serileri fleklinde yay›nlamaktad›r. Tüketici fiyat endeksi (TÜFE) ile hesaplanan enflasyon oranlar› çizelgesinden de görüldü¤ü gibi, enflasyon oranlar› 2010 y›l› Ocak ay›nda %1,85 ve Haziran ay›nda -%0,56 olarak yay›nlanm›fl olmakla birlikte, 2010 y›l› Ocak-Aral›k aylar› aras› y›ll›k enflasyon oran› %6,4 olarak gerçekleflmifltir. 9 1. Ünite - Temel ‹statistik Kavramlar Tüketici Fiyat Endeksi (TÜFE) ile Hesaplanan Enflasyon Oranlar› Y›ll›k TÜFE Enflasyon Oranlar› Y›llar Y›ll›k TÜFE Enflasyon Oranlar› Oran (%) Aylar Oran (%) 2002 29,7 Ocak 1,85 2003 18,4 fiubat 1,45 2004 9,3 Mart 0,58 2005 7,7 Nisan 0,60 2006 9,7 May›s - 0,36 2007 8,4 Haziran - 0,56 2008 10,1 Temmuz - 0,48 2009 6,5 A¤ustos 0,40 2010 6,4 Eylül 1,23 Kaynak: TÜ‹K (http://www.hazine.org.tr/ekonomi/enflasyon.php) Örneklenen veya gözlemlenen verilerin çeflitli özelliklerinin köy, flehir, bölge, ülke ve k›ta gibi bir mekan (yerleflim) birimine göre s›ralamas› veya da¤›l›m› oluflturulursa, bu seriye mekan serisi veya yerleflim serisi denilir. Genellikle ülkelerin sosyal ve ekonomik göstergelerinin de¤iflimi, hava s›cakl›¤› ve ya¤›fllar›n de¤iflimi, çevresel ve ekolojik de¤iflimler, trafik yo¤unlu¤u ile hammadde kaynaklar›n›n da¤›l›mlar› iki sütunlu mekansal seriler fleklinde gösterilirler. Türkiye ‹statistik Kurumu (TÜ‹K) hava kalitesi veri taban›nda kent merkezlerinin hava kirlili¤i, havadaki kükürtdioksit miktarlar› (µg/m3) ölçüm sonuçlar›n›n ayl›k ortalamalar› al›narak yay›nlanmaktad›r. Belirli bir kent merkezi için ayl›k veriler dikkate al›nd›¤›nda bu seri zaman serisidir. Ancak, afla¤›daki çizelgede verildi¤i flekliyle sadece 2010 y›l› ocak ay› rakamlar›n›n farkl› kent merkezleri için yay›nlanmas› halinde ise bu seri mekan serisi olmaktad›r. 2010 Y›l› Ocak Ay› Hava Kirlili¤i (Kükürtdioksit) Ortalamalar› En Fazla Hava Kirlili¤i Yerleflim Merkezi En Az Hava Kirlili¤i Kükürtdioksit (µg/m3) Yerleflim Merkezi Kükürtdioksit (µg/m3) fi›rnak 336 Eskiflehir 3 Tekirda¤ 229 Adana 4 Bitlis 185 Kahramanmarafl 6 K›r›kkale 185 Osmaniye 7 Hakkari 179 ‹stanbul 9 Kaynak: TÜ‹K Hava Kalitesi Veri Taban› ÖRNEK 5 10 Co¤rafi Bilgi Sistemleri ‹çin Temel ‹statistik ‹ki sütunlu olarak oluflturulan bu serilerde, birinci sütunda nitel özelli¤in s›n›flar›, di¤er sütunda ise bu s›n›flara giren birimlerin say›lar› gösterilmektedir. Nitel (Kalitatif) Seriler ÖRNEK 6 Say›sal olarak ifade edilemeyen, özellik bak›m›ndan do¤al olarak s›n›fland›r›lm›fl ve kesin hatlarla birbirinden ayr›lan serilere nitel seriler denilir. Nitel serilerde s›n›flar do¤al olarak oluflmufl oldu¤undan, araflt›rmac› sadece her s›n›fa düflen gözlem say›lar›n› belirler. Nitel seriler iki sütunlu serilerdir. Nitel seriler düzenlenirken de¤iflkenin kaç s›n›ftan olufltu¤unun bilinmesi gerekir. Ancak, nitel de¤iflkenin hangi s›n›fta yer ald›¤› belirlenemiyorsa, s›n›f› belirlenemeyen veriler için “bilinmeyen” sat›r› oluflturulabilir (Orhunbilge, 2000). Verilerin bu flekilde seri haline getirilmesi ile nitel özellikler için frekans çizelgeleri oluflturulmufl olmaktad›r. ‹nsanlar›n cinsiyet, sosyal, kültürel ve ekonomik faaliyet durumlar›, bitki ve a¤aç türleri, tar›m ve hayvanc›l›k hakk›nda oluflturulacak seriler nitel seri türündedir. TÜ‹K Hayvanc›l›k ‹statistikleri veri taban›ndan 2009 y›l› için elde edilen büyükbafl hayvan say›lar› iki sütunlu nitel seri olarak afla¤›daki gibi düzenlenebilir. Birinci sütunda veriler özellikleri bak›m›ndan do¤al olarak s›n›flan›rken, ikinci sütunda say›sal olarak frekanslar verilmifltir. 2009 Y›l› Büyükbafl Hayvan Say›lar› Ad› Say›s› S›¤›r-Yerli 2.594.334 S›¤›-Kültür 3.723.583 S›¤›r-Melez 4.406.041 Manda 87.207 Deve 1.041 Kaynak: TÜ‹K Hayvanc›l›k ‹statistikler Veri Taban› SIRA S‹ZDE D Ü fi Ü N E L ‹ M S O R U D‹KKAT SIRA S‹ZDE AMAÇLARIMIZ K ‹ T A P TELEV‹ZYON ‹NTERNET 5 Köyden kente göçlerin SIRA S‹ZDE ve flehirleflmenin araflt›r›ld›¤› bir çal›flmada, nüfus verileri hangi özelliklerine göre do¤al s›n›flara ayr›labilir? D Ü fi Ü N E L ‹ M Nicel Seriler Say›sal olarak adet, uzunluk, a¤›rl›k, alan ve hacim gibi çeflitli ölçü birimleriyle ifade edilebilenS Oözelliklere göre s›ralanm›fl, s›n›fland›r›lm›fl veya grupland›r›lm›fl seriR U lere nicel seriler denilir. Nicel verilerde s›n›fland›rma veya grupland›rma do¤al olarak oluflmad›¤›ndan, araflt›rmac› her s›n›fa veya gruba düflen gözlem say›s›n› (freD‹KKAT kans›) kendisi belirler. Belirli bir ana kütleden rassal olarak yap›lan örneklemeler sonucunda elde S‹ZDEbasit, s›n›fland›r›lm›fl veya grupland›r›lm›fl seriler olarak olufledilen nicelSIRA veriler turulabilirler. N N AMAÇLARIMIZ Basit Seri Örneklemelerle elde edilen ham verilerin, elde edildikleri ya da gözlendikleri s›ra ile veya küçükten ya da büyükten küçü¤e s›ralanmas› ile oluflturulan seriK ‹ T A büyü¤e P lerdir. Genellikle örneklenen birim say›s›n›n çok az oldu¤u durumlarda kullan›lan ve tek sütundan oluflan serilerdir. Basit serilerde, örnekleme boyutu n ile ve örneklenen her Ti’inci birim Xi ile gösterilir. ELEV‹ZYON ‹NTERNET 11 1. Ünite - Temel ‹statistik Kavramlar Bir derse kay›tl› 30 ö¤rencinin derslere devams›zl›k saatlerinin say›lar› belirlenmifl olup, devams›zl›k saatleri afla¤›daki gibi verilmifltir. 2 6 2 8 14 0 1 12 6 8 8 10 8 5 14 5 1 6 2 12 10 8 6 10 5 5 8 10 12 14 ÖRNEK 7 Ö¤renci numaralar›na göre elde edildi¤i s›ra ile sunulan bu verileri pratik olarak kullanabilmek zordur. Örne¤in, derse 12 saatten fazla devams›zl›¤› olan ö¤rencilerin devams›zl›ktan dolay› dersten baflar›s›z olacaklar›n›n bilindi¤i bir durumda, kaç ö¤rencinin baflar›s›z oldu¤unu belirlemek istedi¤imizde, seriyi elde edildi¤i flekliyle kullanamay›z. Seriyi, devams›zl›k say›lar›na göre küçükten büyü¤e s›ralad›¤›m›zda ise, devams›zl›ktan kalacak ö¤renci say›s›n› kolay bir flekilde bulabiliriz. 0 1 1 2 2 2 5 5 5 5 6 6 6 6 8 8 8 8 8 8 10 10 10 10 12 12 12 14 14 14 S›n›fland›r›lm›fl Seri Ana kütleden örneklenmifl verilerin küçükten büyü¤e ya da büyükten küçü¤e do¤ru s›ralan›p, tekrarlanan verilerin tekrarlanma say›lar›n›n (frekanslar›n›n) bulunmas› ile elde edilen serilere s›n›fland›r›lm›fl seri veya frekans serisi denilir. Örnek kütle boyutu artt›kça basit seriler çok fazla yer kaplad›¤›ndan ve çal›flma zorluklar› ortaya ç›kt›¤›ndan, çal›flma kolayl›¤› aç›s›ndan s›n›fland›r›lm›fl serilerin kullan›m› daha uygun olmaktad›r. S›n›fland›r›lm›fl seri iki sütundan oluflur. Birinci sütunda örneklenen de¤iflkenin ald›¤› farkl› de¤erler (X i ) yer al›rken, ikinci sütunda de¤iflkenin ald›¤› de¤erlerin frekanslar› (f i ) gösterilir. Basit seriyi olufltururken ele ald›¤›m›z örnek verileri, tekrarlanma say›lar›n› da dikkate alarak s›n›fland›rd›¤›m›z da, afla¤›daki frekans serisini elde ederiz. S›n›fland›r›lm›fl seri ile istedi¤imiz de¤erin alt›ndaki veya üstündeki verilerin say›lar›n›, basit serilere göre daha kolay bulabiliriz. Örneklenen veri say›m›z n=30 iken, yapm›fl oldu¤umuz s›n›fland›rma sonucunda m=9 adet s›n›f elde ederiz. Devams›zl›k (Saat) Xi Frekanslar fi 0 1 1 2 2 3 5 4 6 4 8 6 10 4 12 3 14 3 ÖRNEK 8 S›n›fland›r›lm›fl serilerde örnek boyutu, frekanslar toplam›na eflit (n = ∑fi ) olmak zorundad›r. 12 Co¤rafi Bilgi Sistemleri ‹çin Temel ‹statistik Grupland›r›lm›fl Seri Genel olarak grup say›s›n›n 4’den az olmamas› 15’den de fazla olmamas› tercih edilmektedir. Grup say›s› 4’den az oldu¤unda baz› da¤›l›m testlerini yapmak mümkün olamamaktad›r. Örne¤in, da¤›l›m tipinin normal da¤›l›ma uygun olup olmad›¤›n› test etmede kullan›lan Ki-kare testinin yap›labilmesi için grup say›s›n›n en az 4 olmas› gerekir. SIRA S‹ZDE D Ü fi Ü N E L ‹ M K = 1 + 3,3. Log(n) S O R U S O R U Grup say›s› daima D ‹ K K Atam T say› olarak kullan›l›r. Grup say›s› hesaplama sonucu ondal›kl› bir say› olursa, ondal›k say›n›n alt veya üstünde bulunan tam say›lardan birisi grup say›s› olarak kullan›l›r. SIRA S‹ZDE D‹KKAT SIRA S‹ZDE SIRA S‹ZDE AMAÇLARIMIZ D Ü fi Ü N E L ‹ M K ‹ T A P N N Grup say›s›n›n belirlenmesinden sonra, verilerin en büyük (Xenb) ve en küçük SIRA S‹ZDE (Xenk) de¤erleri aras›ndaki farkla hesaplanan de¤iflim geniflli¤i (DG) dikkate al›naAMAÇLARIMIZ rak grup aral›¤›n› (GA) hesaplar›z. GA = DG S O/RKU TELEV‹ZYON D‹KKAT TELEV‹ZYON Hesaplanan grup verilerin tam say›lardan olufltu¤u durumlarda bir üst tam say›ya D ‹ K K aral›¤›, AT veya verilerin 1’den küçük ondal›k de¤erlerden olufltu¤u durumlarda ise ondal›kl› üst de¤ere tamamlan›r. N N Baz› örneklemelerde, örnekleme yönteminin ve AMAÇLARIMIZ verilerin özelliklerine uygun olarak de¤iflik aral›kl› gruplar›n oluflturulmas› da gerekebilmektedir. Örne¤in, K ‹ T A P parça boyutu elek analizi verilerinin grupland›r›lmas›nda, elek serisi aral›klar›n›n dikkate Tal›nmas› E L E V ‹ Zgerekebilmektedir YON (Konuk ve Önder, 1999). ‹NTERNET D Ü fi Ü N E L ‹ M K ‹ T –A XP DG = X enb enk S O R U SIRA S‹ZDE ‹NTERNET Ana kütleden örneklenen veri say›s›n›n çok fazla olmas› durumunda, verilerin belirli aral›klarla grupland›r›l›p ve her bir gruba düflen frekans de¤erlerinin belirlenmesi ile grupland›r›lm›fl seriler elde edilebilir. Örneklenen verilerin grupland›r›larak sunulmas› sayesinde serinin yorumlanmas›ndaki karmafla önlenece¤inden, örneklenen kütle kolayca kavranabilir ve ifllemlerde zamandan büyük tasarruf sa¤lan›r. Bununla birlikte, gruplama sonucunda örnekleme ile toplanan bilgilerin bir k›sm› kaybolabilir ve homojen olmayan birimlerin bir araya toplanmas› da söz konusu olabilir. Grupland›rma iflleminde öncelikle, örneklenen veya gözlemlenen veri say›s›na ve araflt›rmac›n›n amac›na ba¤l› olarak grup say›s› (K) belirlenir. Grup say›s›n›n çok fazla olmas› halinde veriler iyi bir flekilde özetlenmemifl, grup say›s›n›n çok az SIRA S‹ZDE olmas› durumunda ise bilgi kay›plar› olabilir. Grup say›s›n› (K), örneklenen veri say›s›na (n) ba¤l› olarak “Sturges Kural›” ile D Ü fi Ü N Eyard›m›yla L‹M afla¤›daki eflitlik hesaplayabiliriz (Ohunbilge, 2000; Gürtan, 1982). ‹SIRA N T E RS‹ZDE NET Grup aral›klar›n›n genellikle tüm gruplarda birbirine eflit al›nmas› tercih edilir. Grupland›r›lm›fl serilerde grupland›rmalar›n eflit aral›klarla yap›lmas›, seride bir düAMAÇLARIMIZ zenin sa¤lanmas›, eflit grup aral›klar›na düflen frekanslar aras›nda karfl›laflt›rmalar yap›labilmesi ve matematiksel ifllemleri kolaylaflt›rmas› aç›s›ndan tercih edilmekle K ‹ T A P birlikte, grupland›rmalar›n eflit aral›kl› yap›lmas› flart de¤ildir. Grup aral›klar›n›n belirlenmesinden sonra grup s›n›rlar›n› belirleriz. Grup s›n›rlar›n›n belirlenmesi ifllemine öncelikle ilk grubun alt ve üst s›n›rlar›n›n belirlenmesiyle bafllan›r. alt s›n›r›, gözlemlenen veriler içerisinde yer alan en küT E L E V‹lk ‹ Z Ygrubun ON çük (Xenk) de¤erden büyük olmayacak flekilde; ilk grubun üst s›n›r› ise ilk grubun alt s›n›r›na grup aral›¤›n›n eklenmesiyle belirlenir. Di¤er gruplar›n alt ve üst s›n›rlar›, bir önceki gruplar›n alt ve üst s›n›rlar›na grup aral›¤›n›n eklenmesiyle belirle‹NTERNET nir. Grupland›r›lm›fl serinin son grubu, mutlaka gözlem de¤erlerinin en büyü¤ünü (Xenb) içermelidir. SIRA S‹ZDE SIRA S‹ZDE D Ü fi Ü N E L ‹ M D Ü fi Ü N E L ‹ M 1. Ünite - Temel ‹statistik Kavramlar S O R U S O R U Verilerin grupland›r›lmas› iflleminde önemli olan en küçük de¤erin ilk D ‹ grupta K K A T ve en büyük de¤erin de son gurupta yer almas›d›r. SIRA S‹ZDE D‹KKAT N N Grup s›n›rlar›n› belirledikten sonra, örneklenen ham verilerin grup aral›klar›na düflen verilerinin tekrarlanma say›lar›n› (frekanslar›) belirleriz. Frekanslar›n belirlenmesinde, sayma veya tarama yöntemi kullan›labilmektedir. Herhangi bir i’inci AMAÇLARIMIZ grupta yer alan frekans say›s›, fi ile gösterilir. Her bir gruba düflen frekanslar›n toplam›, toplam gözlem say›s›na eflittir (∑fi = n). K ‹ T afla¤›daki A P Örneklenen verilerin grupland›r›lmas›nda uygulanan ifllemler örnek temel al›narak gösterilecektir. E L E V ‹pik Z Y Oak›m› N Bir bölge havzas›nda taflk›n riskini belirleme çal›flmalar› içinTy›ll›k ve ortalama pik ak›m› miktarlar›n› belirlemek amac›yla, bölge akarsular›na kurulan istasyonlarda 40 adet ölçüm gerçeklefltirilmifltir. Ölçümler sonucu elde edilen veriler afla¤›daki gibidir. ‹NTERNET Ölçüm No Ak›m (m3/s) Ölçüm No Ak›m (m3/s) Ölçüm No Ak›m (m3/s) Ölçüm No Ak›m (m3/s) 1 8 11 24 21 26 31 31 2 18 12 44 22 38 32 19 3 16 13 37 23 41 33 37 4 35 14 13 24 39 34 42 5 42 15 56 25 68 35 23 6 27 16 39 26 25 36 27 7 33 17 17 27 48 37 53 8 48 18 52 28 33 38 6 9 36 19 45 29 41 39 9 10 21 20 33 30 38 40 12 Grup say›s› K= 1 + 3,3. Log (n) eflitli¤inden, K= 1 + 3,3. Log (40) = 6,29 olarak bulunur. Bu durumda, gruplama yapt›¤›m›zda, grup say›s›n›n 6’dan az ve 7’den fazla olmamas› gerekmektedir. Örneklenen veriler içerisinde en büyük de¤er Xenb= 68 ve en küçük de¤er Xenk= 6 oldu¤undan, grup aral›¤› GA = (Xenb – Xenk) / K eflitli¤inden, GA= ( 68 - 6 ) / 6,29 = 9,86 olarak bulunur. Verilerin tam say› olmas› nedeniyle, GA = 10 alabiliriz. ‹lk grupta en küçük verinin ve son grupta en büyük verinin yer almas›na, grup say›s›n›n 6’dan az ve 7’den fazla olmamas›na ve grup aral›¤›n›n 10 olmas›na dikkat ederek grup s›n›rlar›n› farkl› biçimlerde oluflturabiliriz. Afla¤›da, üç farkl› flekilde oluflturulan grup s›n›rlar› görülmektedir. 13 SIRA S‹ZDE AMAÇLARIMIZ K ‹ T A P Ö TRE NL EEV ‹KZ Y O9N ‹NTERNET 14 Co¤rafi Bilgi Sistemleri ‹çin Temel ‹statistik Grup S›n›rlar› Tarama sütunu, ham verilerin girdi¤i grup aral›¤›n›n iflaretlenmesi ve daha sonra say›larak frekanslar›n belirlenmesi için kullan›lmaktad›r. Üst Alt Üst Alt Üst 6 16 3 13 0 10 16 26 13 23 10 20 26 36 23 33 20 30 36 46 33 43 30 40 46 56 43 53 40 50 56 66 53 63 50 60 66 76 63 73 60 70 Grup s›n›rlar›ndan herhangi birini tercih ederek ve tarama sütunu da oluflturarak, her bir grubun frekans›n› belirleyebiliriz. Grup S›n›rlar› D Ü fi Ü N E L ‹ M S O R U Tarama Sütunu Frekanslar fi Alt Üst (den az) 0 10 /// 3 10 20 ///// / 6 20 30 ///// // 7 30SIRA S‹ZDE 40 ///// ///// // 12 40 50 ///// /// 8 D Ü fi Ü N E L ‹ M 50 60 /// 3 60 70 / 1 S O R U Grup frekanslar›n›n D ‹ K K A T belirlenmesi s›ras›nda, ya alt s›n›rda yada üst s›n›rda yer alan de¤eri kapsam d›fl›nda b›rak›r›z. D‹KKAT AMAÇLARIMIZ Grup S›n›rlar› Alt SIRA S‹ZDE SIRA S‹ZDE Grup S›n›rlar› N N SIRA S‹ZDE VER‹LER‹N SUNULMASI Örneklemeler sonucunda elde edilen zaman serileri, nitel seriler ve nicel serilerden s›n›fland›r›lm›fl AMAÇLARIMIZve grupland›r›lm›fl seriler çeflitli grafikler halinde sunulurlar. Zaman Serilerinin Grafiksel Gösterimi (Kartezyen Grafik) K ‹ T A P TELEV‹ZYON ÖRNEK 10 ‹NTERNET K ‹ olan T A Pzaman serileri genellikle X ekseninde zaman birimi ve Y ekse‹ki de¤iflkenli ninde örneklenen birim say›lar› olmak üzere kartezyen grafikleri halinde gösterilirler. TELEV‹ZYON Türkiye ‹statistik Kurumu’nun (TÜ‹K) 2002-2010 y›llar› için yay›nlad›¤› Tüketici Fiyat Endeksine dayal› enflasyon oranlar›n›n de¤iflimi afla¤›daki flekildeki gibi gösterilebilir. ‹ N T E R N E T 15 1. Ünite - Temel ‹statistik Kavramlar fiekil 1.1 Tüketici Fiyat Endeksleri ile Hesaplanan Enflasyon Oranlar› TÜFE Enflasyon Oranlar› 35 Enflasyon Oran› (%) 30 25 20 15 10 5 0 2000 2002 2004 2006 Y›llar 2008 2010 2012 Kaynak: http://www.hazine.org.tr/ekonomi/enflasyon.php Nitel Serilerin Grafiksel Gösterimi (Pasta Grafi¤i) Nitel verilerden elde edilen serilerin sunulmas›nda pasta grafi¤i kullan›l›r. Pasta grafi¤i, daire fleklindeki bir pastan›n her bir dilimi, nitel de¤iflkenin ilgili s›n›f›n›n frekans›n› temsil edecek flekilde dilimlere ayr›larak haz›rlanmaktad›r. Pasta grafi¤i, veriler toplam›n›n s›n›f kategorilerine göre da¤›l›fl›n› ve s›n›flar›n veri say›lar› aras›ndaki ba¤›l farklar› göstermesi aç›s›ndan oldukça kullan›fll›d›r. Türkiye ‹statistik Kurumu’nun 2009 y›l› için yay›nlam›fl oldu¤u Hayvanc›l›k ‹statistiklerinden elde edilen büyükbafl hayvan say›lar› ve bunlar›n oranlar›, afla¤›daki gibi iki farkl› flekille gösterilebilir. Pasta grafi¤i üzerinde, nitel s›n›flar farkl› renklerle ve birim say›s›na göre dilim büyüklü¤ü ile gösterilebilece¤i gibi, nitel s›n›flardaki birimlerin yüzdeleri ile de gösterilebilirler. ÖRNEK 11 fiekil 1.2 2009 Y›l› Verileri ile Büyükbafl Hayvan Say›lar›n›n Pasta Diyagramla Sunumu 2009 Y›l› Büyükbafl Hayvan Say›lar› 2009 Y›l› Büyükbafl Hayvan Say›lar› S›¤›r-Yerli S›¤›-Kültür S›¤›r-Melez 41% Manda 10% S›¤›r-Yerli 24% S›¤›r-Melez Manda Deve Kaynak: TÜ‹K Hayvanc›l›k ‹statistikler Veri Taban› S›¤›r-Kültür 34% 16 Co¤rafi Bilgi Sistemleri ‹çin Temel ‹statistik Nicel Serilerin Grafiksel Gösterimi S›n›fland›r›lm›fl seriler, noktasal veya çizgisel olarak, s›n›f say›lar›n›n ve frekanslar›n de¤erlerini dikkate alacak flekilde koordinat sisteminde gösterilmektedirler. S›n›fland›r›lm›fl serinin de¤erleri ba¤›ms›z de¤iflken olarak X ekseninde, frekanslar ise ba¤›ml› de¤iflken olarak Y koordinat ekseninde gösterilmektedirler. Bu nedenle s›n›fland›r›lm›fl frekans serisinin grafi¤i koordinat sistemi üzerinde sütun veya çubuk fleklinde görülürler. ÖRNEK 12 A dersinden devams›zl›¤› olan ö¤rencilerin devams›zl›k süreleri afla¤›daki sütunçubuk diyagramdaki gibi gösterilebilir. Veri olmayan s›n›flar için çubuk diyagramda boflluk b›rak›labilece¤i gibi, bu de¤erler dikkate al›nmadan da diyagram, örnekteki gibi çizilebilir. fiekil 1.3 Ö¤rencilerin A Dersindeki Devams›zl›klar› Ö¤rencilerin Bir Dersteki Devams›zl›klar›n›n Sütun-Çubuk Gösterimi. 6 Ö¤renci Say›s› 5 4 3 2 1 0 0 1 2 5 6 8 Devams›zl›k (Saat) 10 12 14 Grupland›r›lm›fl seriler ise genellikle histogram fleklinde veya histogram orta noktalar›ndan geçen grafikler halinde gösterilebilmektedir. Histogram grafikleri de sütun-çubuk grafi¤ine benzerler, ancak sütunlar aras›nda boflluk yoktur. Sütun grafiklerde sütunlar belirli bir de¤erin frekans›n› gösterirken, histogram grafikler belli aral›ktaki de¤erlerin frekans›n› temsil eder. Histogram grafikleri ço¤unlukla verilerin da¤›l›m fleklini incelemek için kullan›l›rlar. S›n›fland›r›lm›fl ve grupland›r›lm›fl seriler, kümülatif (toplam) frekanslar halinde de gösterilebilirler. ÖRNEK 13 Bir bölge havzas›nda taflk›n riskini belirleme çal›flmalar› için bölge akarsular›nda kurulan istasyonlarda yap›lan 40 adet ak›m (m3/s) ölçüm sonuçlar›n›n grup aral›klar›na giren normal frekanslar› ve toplam frekanslar› gösterir histogramlar› afla¤›daki gibidir. 17 1. Ünite - Temel ‹statistik Kavramlar fiekil 1.4 Bölge Akasular›n›n Ak›m Ölçüm Sonuçlar›, a: Normal Frekanslar, b: Toplam Frekanslar. 0-10 10-20 20-30 30-40 40-50 50-60 60-70 Ak›m (m3/s) (a) Toplam Frekanslar Akarsu Ak›m Ölçüm Sonuçlar› Frekans 14 12 10 8 6 4 2 0 45 40 35 30 25 20 15 10 5 0 Akarsu Ak›m Ölçüm Sonuçlar› 0-10 10-20 20-30 30-40 40-50 50-60 60-70 Ak›m (m3/s) (b) 18 Co¤rafi Bilgi Sistemleri ‹çin Temel ‹statistik Özet N A M A Ç 1 Örnekleme kavramlar›n› ö¤renerek örnekleme yöntemi seçimini yapmak. ‹statistikte kütleler, oluflum flekline göre gerçek ya da varsay›msal, sonlu ya da sonsuz ve sürekli ya da süreksiz olarak s›n›fland›r›labilmektedir. Sonlu veya sonsuz say›da birimden oluflan canl› yada cans›z toplulu¤un tamam›na ana kütle denilmekte olup, tam say›m için bütçenin yetersiz ve fazla zaman›n olmad›¤› veya birimlerin tamam›n›n say›m› s›ras›nda ana kütlenin zarar görme olas›l›¤› oldu¤u durumlarda, ana kütleyi temsil edecek say›da birimden oluflan örnek kütle elde edilir. Ana kütleden örnek seçimi, araflt›rmac›n›n kendi takdiri veya iradesi ile seçti¤i birimlerden olufluyorsa bu tür örneklemelere rassal olmayan örnekleme denilmektedir. Genellikle istatistiksel çal›flmalarda rassal olmayan örnekleme tercih edilmemektedir. Dilim örnekleme ve kota örneklemesi rassal olmayan örnekleme yöntemleridir. Ana kütle birimlerinin her birine belirli ve s›f›rdan büyük bir olas›l›kla örnek kütleye seçilme flans›n›n verildi¤i örneklemelere rassal örnekleme denilmektedir. Ana kütlenin yap›s›na göre rassal örnekleme basit, sistematik, küme veya tabakal› yöntemlerle yap›labilmektedir. N A M A Ç 2 N A M A Ç 3 ‹statistiksel verilerin toplanmas› ve düzenlenmesi çal›flmalar›n› temel anlamda gerçeklefltirmek. ‹statistiksel çal›flmalarla toplanan ham verilerin analize uygun hale getirilmesi için düzenlenmesi gerekir. Veriler, örneklenen birimlerin zaman ve mekan özelliklerine, nitel ve nicel özellikleriyle da¤›lma flekillerine göre seriler fleklinde düzenlenebilmektedirler. Verilerin çeflitli özellikleri saat, gün, ay ve y›l gibi bir zaman birimine göre s›ralan›yor veya da¤›l›m› oluflturuyorsa, iki sütunlu bu serilere zaman serisi denilir. Verilerin çeflitli özelliklerinin köy, flehir, bölge, ülke ve k›ta gibi bir mekan (yerleflim) birimine göre s›ralan›yor veya da¤›l›m› oluflturuluyorsa, iki sütunlu bu serilere ise mekan serisi denilir. Say›sal olarak ifade edilemeyen ve s›n›flar›n do¤al olarak olufltu¤u serilere de nitel seri denilir. Say›sal olarak adet, uzunluk, a¤›rl›k, alan ve hacim gibi çeflitli ölçü birimleriyle ifade edilebilen özelliklere göre ifade edilen nicel veriler ise s›ralanarak, s›n›fland›r›larak veya grupland›r›larak serilere dönüfltürülebilmektedirler. ‹statistiksel verileri sunmak. Zaman serilerine ait veriler kartezyen grafik, nitel veriler pasta grafi¤i, nicel veriler ise sütun-çubuk veya histogram grafikleri fleklinde sunulabilmektedir. 1. Ünite - Temel ‹statistik Kavramlar 19 Kendimizi S›nayal›m 1. Ana kütleden örneklenmifl verilerin küçükten büyü¤e ya da büyükten küçü¤e do¤ru s›ralan›p, tekrarlanan verilerin tekrarlanma say›lar›n›n (frekanslar›n›n) bulunmas› ile elde edilen serilere ne ad verilir? a. Basit seri b. Grupland›r›lm›fl seri c. S›n›fland›r›lm›fl seri d. Bileflik seri e. Karmafl›k seri 2. Örneklenen verilerin çeflitli özellikleri köy, flehir, bölge, ülke ve k›ta gibi bir birime göre s›ralanmas›yla veya da¤›l›m›n›n oluflturulmas›yla elde edilen seriye ne ad verilir? a. Zaman serisi b. Mekân serisi c. Nitel seri d. Bileflik seri e. Basit seri 3. Serilerle ilgili afla¤›daki ifadelerden hangisi do¤rudur? a. Saat 8 ile 20 aras› her saat bafl›na bir bulvardan geçen araç say›s›n› gösteren iki sütunlu seriye basit seri denir. b. Bir sütunda a¤aç türlerinin ve di¤er sütunda say›lar›n›n verildi¤i seriye mekân serisi denir. c. Örneklenen birim say›s›n›n çok az oldu¤u durumlarda kullan›lan ve tek sütundan oluflan serilere zaman serisi denir. d. Bir sütunda yaban hayat›n› gelifltirme bölgesinde yaflayan hayvan türlerinin isimlerinin ve di¤er sütunda say›lar›n›n verildi¤i seriye nitel serisi denir. e. Bir sütunda bölge ismi ve di¤er sütunda kömür rezerv miktar›n›n verildi¤i seriye s›n›fland›r›lm›fl seri denir. 4. Örneklenen veri say›s› 40 oldu¤unda, “Sturges Kural›” ile veriler grupland›r›lmak istendi¤inde, grup say›s› (K) kaç olabilir? (log40=1,6 d›r) a. 3 b. 5 c. 7 d. 9 e. 11 5. Hava kirlili¤i üzerine yap›lan bir istatistiksel araflt›rmada, 40 adet ölçüm yap›ld›¤›nda havadaki kükürtdioksit oran›n›n en büyük de¤erinin 49 µg/m3 ve en küçük de¤erinin 5 µg/m3 oldu¤u belirlenmifltir. “Sturges Kural›” ile bu veriler grupland›r›lmak istendi¤inde, grup aral›¤› (GA) kaç olabilir? (GA= DG/K DG = Xenb – Xenk K = 1 + 3,3. Log(n) ve log(40) = 1,6 d›r) a. 3 b. 5 c. 7 d. 9 e. 11 6. Afla¤›dakilerden hangisi sonsuz kütledir? a. Bir dersten yap›lan s›navda ö¤rencilerin ald›klar› notlar b. Metalik paralar›n metal içeri¤i c. Merkez Bankas›n›n döviz rezervi d. Bir hafta içerisinde bir banka flubesine gelen günlük müflteri say›s› e. Bankalar›n mevduata uygulad›¤› faiz oranlar› 7. N birimlik bir ana kütleden, her birine eflit seçilme flans› verilmesi ile n birimlik örnek seçilmesi ifllemine ne ad verilir? a. Basit rassal örnekleme b. Sistematik örnekleme c. Kota örnekleme d. Dilim örneklemesi c. Kümeli örnekleme 8. Nitel verilerden elde edilen serilerin sunulmas›nda kullan›lan ve nitel de¤iflkenin ilgili s›n›f›n›n frekans›n› temsil edecek flekilde dilimlere ayr›lmas›yla haz›rlanan grafi¤e ne ad verilir? a. Kartezyen grafi¤i b. Çubuk grafi¤i c. Sütun grafi¤i d. Pasta grafi¤i e. Histogram 20 Co¤rafi Bilgi Sistemleri ‹çin Temel ‹statistik S›ra Sizde Yan›t Anahtar› 9. Belirli aral›klarla grupland›r›lm›fl serilerin sunulmas›nda afla¤›daki grafik yöntemlerinden hangisi kullan›l›r? a. Kartezyen grafi¤i b. Çubuk grafi¤i c. Sütun grafi¤i d. Pasta grafi¤i e. Histogram 10. Birinci sütunda örneklenen de¤iflkenin ald›¤› farkl› de¤erler (X i) yer al›rken, ikinci sütunda de¤iflkenin ald›¤› de¤erlerin frekanslar›n›n (f i) gösterildi¤i serilere ne ad verilir? a. Zaman serisi b. S›n›fland›r›lm›fl seri c. Nitel seri d. Grupland›r›lm›fl seri e. Basit seri Kendimizi S›nayal›m Yan›t Anahtar› 1. c 2. b 3. d 4. c 5. c 6. d 7. a 8. d 9. e 10. b Yan›t›n›z yanl›fl ise, “Verilerin Toplanmas› ve Seriler Halinde Düzenlenmesi” konusunu gözden geçiriniz. Yan›t›n›z yanl›fl ise, “Verilerin Toplanmas› ve Seriler Halinde Düzenlenmesi” konusunu gözden geçiriniz. Yan›t›n›z yanl›fl ise, “Verilerin Toplanmas› ve Seriler Halinde Düzenlenmesi” konusunu gözden geçiriniz. Yan›t›n›z yanl›fl ise, “Grupland›r›lm›fl Seriler” konusunu gözden geçiriniz. Yan›t›n›z yanl›fl ise, “Grupland›r›lm›fl Seriler” konusunu gözden geçiriniz. Yan›t›n›z yanl›fl ise, “‹statistiksel Kütle Türleri” konusunu gözden geçiriniz. Yan›t›n›z yanl›fl ise, “Rassal Örnekleme” konusunu gözden geçiriniz. Yan›t›n›z yanl›fl ise, “Verilerin Sunulmas›” konusunu gözden geçiriniz. Yan›t›n›z yanl›fl ise, “Verilerin Sunulmas›” konusunu gözden geçiriniz. Yan›t›n›z yanl›fl ise, “Verilerin Toplanmas› ve Seriler Halinde Düzenlenmesi” konusunu gözden geçiriniz. S›ra Sizde 1 A¤aç türleri say›labilir oldu¤undan sonlu kütledir. S›ra Sizde 2 Türkiye’de tüm otoyollarda ar›zalar›n trafik kazalar›na etkilerini araflt›rmak için tam say›m yapmak mümkün de¤ildir. Çünkü, Türkiye otoyollar› çok genifl bir co¤rafyaya yay›lm›fl oldu¤undan, tam say›m yap›lmas› hem çok büyük maliyetli hem de çok fazla zaman gerektirir. S›ra Sizde 3 Bu tür örneklemelere kota örneklemesi denilmektedir. S›ra Sizde 4 Büyütme faktörü k=100/20=5 ve rassal say› da 5 oldu¤undan 5, 10, 15, 20, 25, 30, 35, 40, 45, 50, 55, 60, 65, 70, 75, 80, 85, 90, 95 ve 100’üncü s›radaki iflletmeler örneklenir. S›ra Sizde 5 Köyden kente göçlerin ve flehirleflmenin araflt›r›ld›¤› bir çal›flmada, nüfus verileri il, ilçe, belde ve köy olmak üzere idari özelliklerine göre do¤al s›n›flara ayr›labilir. Yararlan›lan Kaynaklar Cula, S. & Muluk, Z. (2006). Temel ‹statistik Yöntemleri. Ankara: Baflkent Üniversitesi. Gürtan, K. (1982). ‹statistik ve Araflt›rma Metodlar›. No:2941. ‹stanbul: ‹stanbul Üniversitesi. Konuk, A. & Önder, S. (1999). Maden ‹statisti¤i. Mühendislik Mimarl›k Fakültesi Maden Mühendisli¤i Bölümü. Eskiflehir: Eskiflehir Osmangazi Üniversitesi. Orhunbilge, N. (2000). Tan›msal ‹statistik Olas›l›k ve Olas›l›k Da¤›l›mlar›. ‹flletme Fakültesi Yay›n No: 279. ‹stanbul: ‹stanbul Üniversitesi Serper, Ö. (2000). Uygulamal› ‹statistik II. Bursa: Ezgi. Ünver, Ö. & Gamgam, H. (2006). Uygulamal› Temel ‹statistik Yöntemler. Ankara: Seçkin. CO⁄RAF‹ B‹LG‹ S‹STEMLER‹ ‹Ç‹N TEMEL ‹STAT‹ST‹K 2 Amaçlar›m›z N N Bu üniteyi tamamlad›ktan sonra; Merkezi e¤ilim ölçülerini hesaplay›p kullanabilecek, Da¤›l›m ölçülerini hesaplay›p kullanabilecek bilgi ve becerilere sahip olacaks›n›z. Anahtar Kavramlar • • • • • • Ana kütle Örnek kütle Örnekleme ‹statistik Seriler Merkezi e¤ilim ölçüleri Da¤›l›m ölçüleri • • • • • • Ortalamalar Medyan Mod Varyans Standart sapma De¤iflkenlik katsay›s› ‹çindekiler Co¤rafi Bilgi Sistemleri ‹çin Temel ‹statistik Merkezi E¤ilim ve Da¤›l›m Ölçüleri • MERKEZ‹ E⁄‹L‹M ÖLÇÜLER‹ • DA⁄ILIM ÖLÇÜLER‹ Merkezi E¤ilim ve Da¤›l›m Ölçüleri MERKEZ‹ E⁄‹L‹M ÖLÇÜLER‹ Ana kütleden örneklenen verilerin düzenlenerek çizelgelerle ve grafiklerle sunulmas› sonras›nda, verileri tan›mlamak, karfl›laflt›rmak, yorumlamak veya ana kütle parametreleri hakk›nda genellemeler yapabilmek için baz› ölçülere gereksinim duyulur. Merkezi e¤ilim ölçüleri, verileri tan›mlamak için kullan›lan ve verileri özetlemeye yarayan ölçülerdir. Merkezi e¤ilim ölçüleri, verilerin tümünü temsil eden ve merkez noktas›na yak›n bir de¤er oldu¤undan, ortalamalar olarak da tan›mlanmaktad›r. Bir örnekleme sonucunda toplanan verilerin hangi de¤er etraf›nda topland›¤›n› gösteren ve verilerin oluflturdu¤u seriyi temsil eden rakama “ortalama” denilir. Bu nedenle ortalama, serideki en küçük ve en büyük de¤erler aras›nda bulunur. Ortalama, örneklenen verilerin normal de¤erlerini göstermesi, kolayl›kla ak›lda tutulabilme özelli¤ine sahip olmas› ve örneklenen farkl› serilerin karfl›laflt›r›lmas›nda kolayl›kla kullan›labilmesi nedenleriyle istatistiksel analizlerde yayg›n bir flekilde kullan›lmaktad›r. Örneklenen verilerin herhangi birinde meydana gelecek de¤er de¤iflikli¤i, ortalaman›n de¤erinde de de¤iflikli¤e yol aç›yorsa, ortalaman›n hesaplanmas›nda tüm örneklenen verileri dikkate alan duyarl› ortalama yöntemlerini kullanmak gerekir. Ancak, örneklenen verilerin baz›lar›nda meydana gelecek de¤iflim ortalaman›n de¤erini etkilemiyorsa, verilerin tümünü dikkate almayan duyars›z ortalama yöntemleri kullan›labilir. Bu ünitede, merkezi e¤ilim ölçüleri olarak duyarl› ortalamalardan aritmetik, a¤›rl›kl›, geometrik, harmonik ve kareli ortalama, duyars›z ortalamalardan ise mod ve medyan ortalama yöntemlerinin hesaplanmas› ve uygulamada kullan›m koflullar› incelenecektir. Aritmetik Ortalama Ana kütleden elde edilen nicel örnekleme verileri toplam›n›n veri say›s›na oran›na aritmetik ortalama denilmektedir. Aritmetik ortalama, seri türüne göre afla¤›daki eflitliklerle hesaplanabilmektedir. Basit serilerde: X = ∑ Xi n Duyarl› ortalamalara basit aritmetik, a¤›rl›kl› aritmetik, geometrik, harmonik ve kareli ortalamalar› örnek olarak verilebiliriz. Duyars›z ortalamalara ise kartil ortalamalar ile mod ve medyan ortalamay› örnek olarak verebiliriz. Bu ünitede, kartil ortalamalar kapsam d›fl›nda tutulmufltur. Kartil ortalamalar için ayr›nt›l› bilgilere Necmi Gürsakal’›n Bilgisayar Uygulamal› ‹statistik I (Alfa Yay›nlar› No: 1029, ‹stanbul, 2001) isimli kitaptan ulaflabilirsiniz. 24 Co¤rafi Bilgi Sistemleri ‹çin Temel ‹statistik S›n›flanm›fl serilerde: X = Gruplanm›fl serilerde: X = ∑ X i .fi ∑ fi ∑ m i .fi ∑ fi – Burada; X = aritmetik ortalama, Xi = i’inci s›n›f›n de¤eri, n = Toplam örnek say›s›, fi = i’inci s›n›f›n veya grubun frekans›, mi = i’inci grubun ortalamas›d›r. ÖRNEK 1 Afla¤›daki basit serinin aritmetik ortalamas›n› hesaplay›n›z. X ––––––––– 20 26 28 34 37 ––––––––– 145 Çözüm: Örneklenen verilerin toplam› dan, aritmetik ortalamay›; X = ∑X n = ∑ X = 145 ve veri say›s› n=5 oldu¤un- 145 = 29 5 olarak hesaplar›z. SIRA S‹ZDE D Ü fi Ü N E L ‹ M 1 ÖRNEK 2 S O R U D‹KKAT SIRA S‹ZDE AMAÇLARIMIZ K ‹ T A P TELEV‹ZYON ‹NTERNET Örneklenen SIRA verilerin S‹ZDEtoplam› 180 ve aritmetik ortalama 9 oldu¤una göre, örneklenen veri say›s› kaçt›r? D Ü fi Ü Ns›n›fland›r›lm›fl EL‹M Afla¤›da verilen serinin aritmetik ortalamas›n› hesaplay›n›z. X f –––––––– 20 S O R U –––––––– 1 26 4 28 8 D‹KKAT 34 5 37 2 ––––––––– SIRA S‹ZDE––––––––– 20 N N Çözüm: S›n›fland›r›lm›fl serilerde aritmetik ortalamay› hesaplayabilmek için önAMAÇLARIMIZ celikle seri de¤erleri ile frekanslar› çarp›p toplamlar›n› bulmam›z gerekmektedir. X f X.f –––––––– ––––––––– –––––––––– 20 1 20 K ‹ T A P 26 4 78 28 8 224 34 T E L E V ‹ Z Y O N 5 204 37 2 74 ––––––––– ––––––––– –––––––––– 20 600 ‹NTERNET 2. Ünite - Merkezi E¤ilim ve Da¤›l›m Ölçüleri Hesaplad›¤›m›z ∑ X.f = 600 ve frekanslar toplam› re, aritmetik ortalamay›; ∑ X.f ∑f X = = ∑f 25 = 20 oldu¤una gö- 600 = 30 20 olarak hesaplar›z. Bir bölge havzas›nda taflk›n riskini belirleme çal›flmalar› için y›ll›k pik ak›m› ve ortalama pik ak›m› miktarlar›n› belirlemek amac›yla, bölge akarsular›na kurulan 40 adet istasyonda yap›lan ak›m ölçümü verilerinin grupland›r›lm›fl seri halindeki flekli afla¤›daki gibidir. Bu grupland›r›lm›fl seride, öncelikle grup ortalamalar›n› bulur ve daha sonra aritmetik ortalamay› hesaplayabiliriz. Grup S›n›rlar› (m3/s) Frekanslar Grup Ortalamalar› mi fi x mi Alt Üst (den az) fi 0 10 3 5 15 10 20 6 15 90 20 30 7 25 175 30 40 12 35 420 40 50 8 45 360 50 60 3 55 165 60 70 1 65 65 ∑ fi = 40 ve ∑ fi . mi = 1290 olarak hesapland›¤›ndan, grupland›r›lm›fl serinin aritmetik ortalamas›; X= ∑ m i . fi ∑ fi = 1290 = 32, 25 m 3 / s 40 – X = 32,25 m3/s bulunur. Aritmetik ortalaman›n hesaplanmas›nda, verilerin çok fazla ve büyük de¤erlerden oluflmas› durumunda, verilerin aritmetik ortalamadan sapmalar›n›n cebirsel toplam›n›n s›f›ra eflit olma özelli¤inden faydalanarak, aritmetik ortalamay› k›sa yoldan hesaplamak mümkün olmaktad›r. Aritmetik ortalaman›n k›sa yoldan hesaplanmas› yöntemi, özellikle grupland›r›lm›fl serilerde kullan›lmaktad›r. Bunun için öncelikle, aritmetik ortalamaya en yak›n oldu¤u düflünülen bir grup ortalamas› (genellikle en büyük frekansa sahip grubun ortalamas›), geçici ortalama olarak seçilir (m0). Daha sonra, her bir grup ortalamas›ndan geçici ortalaman›n (m0) sapmalar›n›n grup aral›¤›na (A) oran› ile küçültülmüfl de¤erlerden oluflan grup ortalamalar› (ui ) elde edilir. ui = mi - m0 A Küçültülmüfl de¤erlerden oluflan serisinin aritmetik ortalamas›; ÖRNEK 3 26 Co¤rafi Bilgi Sistemleri ‹çin Temel ‹statistik u= ∑ ui .fi ∑ fi Eflitli¤i ile hesapland›ktan sonra, – – X = m0 + ( u . A) Eflitli¤i yard›m›yla aritmetik ortalama hesaplan›r. ÖRNEK 4 Örnek 1’deki verileri kullanarak küçültülmüfl de¤erlerle aritmetik ortalamay› hesaplay›n›z. Çözüm: Geçici ortalama olarak, en büyük frekansa sahip grubun ortalamas›n› (m0 = 35) alabiliriz. Grup aral›¤› da A = 10 oldu¤una göre, bu durumda küçültülmüfl grup ortalamalar›n›; ui = mi - 35 eflitli¤i ile hesaplar›z. 10 Grup S›n›rlar› (m3/s) Frekanslar Grup Ortalamalar› Küçültülmüfl Grup Ort. Alt Üst (den az) fi mi ui 0 10 3 5 -3 10 20 6 15 -2 20 30 7 25 -1 30 40 12 35 0 40 50 8 45 1 50 60 3 55 2 60 70 1 65 3 ∑ ui . fi = -11 ve lar›z. ∑ fi = 40 oldu¤undan, u = −11 = −0, 275 olarak hesap40 – – Aritmetik ortalama; X = m0 + ( u . A) = 35 + (-0,275.10) = 32,25 m3/s bulunur. SIRA S‹ZDE 2 Afla¤›da verilen serinin aritmetik ortalamas›n› küçültülmüfl de¤erlerle heSIRAgrupland›r›lm›fl S‹ZDE saplay›n›z. D Ü fi Ü N E L ‹ M D Ü fi Ü N E L ‹ M Alt Üst Frekanslar fi S O R U S O0R U D‹KKAT 1000 2000 D‹KKAT 3000 4000 1000 2000 3000 4000 5000 3 6 12 9 5 SIRA S‹ZDE AMAÇLARIMIZ N N SIRA S‹ZDE Grup S›n›rlar› Aritmetik ortalama baz› matematiksel özelliklere sahip oldu¤undan, birçok istatistiksel analiz yönteminde kullan›labilmektedir. Aritmetik ortalaman›n baz› maAMAÇLARIMIZ tematiksel özellikleri flunlard›r: K ‹ T A P K ‹ T A P TELEV‹ZYON TELEV‹ZYON 2. Ünite - Merkezi E¤ilim ve Da¤›l›m Ölçüleri 27 a. Örneklenen verilerin aritmetik ortalamadan sapmalar›n›n cebirsel toplam› s›f›rd›r. ∑ ( X i - X) = 0 b. Örneklenen verilerin aritmetik ortalamadan sapmalar›n›n kareleri toplam›, herhangi bir de¤erden farklar›n›n kareleri toplam›na göre en küçüktür. ∑ ( X i - X) 2 = En küçük c. Bir serinin de¤erleri ayn› s›radaki iki seri de¤erlerinin toplam›na eflitse, aritmetik ortalamas› da bu iki serinin aritmetik ortalamalar› toplam›na eflittir. – – – Xi = Yi + Zi ise X = Y + Z dir. d. Aritmetik ortalama, serideki afl›r› de¤erlerden oldukça fazla etkilenen hassas bir ortalamad›r. Afla¤›daki basit seride, verilerin aritmetik ortalamadan sapmalar›n›n toplam›n› bulunuz. ÖRNEK 5 X ––––––––– 12 14 18 26 30 ––––––––– 100 Çözüm: Aritmetik ortalama: X = 100 = 20 5 – X X-X 12 14 18 26 30 -8 -6 -2 6 10 ∑ X = 100 ∑( X - X ) = 0 Afla¤›da verilen basit seri de¤erlerinden aritmetik ortalama, en küçük de¤er ve en büyük de¤erleri ç›kararak, bulaca¤›n›z farklar›n kareleri toplamlar›n› karfl›laflt›r›n›z. X ––––––––– 6 7 9 13 15 ––––––––– 50 ÖRNEK 6 28 Co¤rafi Bilgi Sistemleri ‹çin Temel ‹statistik Çözüm: Serinin aritmetik ortalamas›: X = Örneklenen verilerin aritmetik ortalamadan sapmalar›n cebirsel toplam›n›n s›f›r ve aritmetik ortalamadan sapmalar›n kareleri toplam›n›n ek küçük olma özelli¤i, regresyonkorelasyon analizlerinin temelini oluflturmaktad›r. ∑ Xi = n 50 = 10 5 X (X - 10)2 (X - 6)2 (X - 15)2 6 16 0 81 7 9 1 64 9 1 9 36 13 9 49 4 15 25 81 0 ∑ X = 50 ∑ ( X - 10) 2 = 60 ∑ ( X - 6) 2 = 140 ∑ ( X - 15) 2 = 185 Seri de¤erlerinin aritmetik ortalamadan sapmalar›n›n kareleri toplam›, serinin en küçük ve en büyük de¤erden farklar›n›n kareleri toplam›na göre en küçüktür. A¤›rl›kl› Ortalama Aritmetik ortalama, her verinin a¤›l›klar›n›n (önem derecelerinin) birbirine eflit oldu¤u durumlarda kullan›l›r. Örneklenen verilerin önem derecesinin farkl› oldu¤u durumlarda ise, bu önem derecelerinin de hesaplamalara dahil edilmesi gerekir. Seri türlerine göre a¤›rl›kl› ortalaman›n hesaplanmas› afla¤›daki gibi yap›lmaktad›r: ∑ a i .X i X= Basit serilerde: ∑ ai S›n›flanm›fl serilerde: X = ∑ a i .X i .fi ∑ a i .fi Gruplanm›fl serilerde: X = ∑ a i .m i .fi ∑ a i .fi Burada, ai = i’inci örne¤in önem veya a¤›rl›¤›d›r. ÖRNEK 7 Bir maden iflletmecisi, maden yata¤›nda yapm›fl oldu¤u 5 adet sondaj sonucunda, sondajlar›n kesti¤i maden damar› kal›nl›klar›n›n afla¤›daki gibi oldu¤unu belirlemifltir. Sondajlar›n etki alanlar› farkl› oldu¤una göre, maden yata¤›n›n etki alan› ile a¤›rl›kl› ortalama damar kal›nl›¤› nedir? Damar Kal›nl›¤› (m)- Xi Etki Alan› (m2)- ai 1 12 2 8 3200 2350 Sondaj No 3 6 4600 4 14 5 9 3600 2950 Çözüm: Elde edilen veriler basit seri fleklinde oldu¤undan, etki alan›yla a¤›rl›kl› ortalamay› afla¤›daki gibi hesaplayabiliriz. ∑ ai = 16700 ve ∑ ai .X i = 161750 olarak hesapland›¤›ndan, basit serinin a¤›rl›kl› ortalamas›; 29 2. Ünite - Merkezi E¤ilim ve Da¤›l›m Ölçüleri X= ∑ a i .X i ∑ ai = 161750 = 9,7m bulunur. 16700 Bir firma flehir içinde çeflitli semtlerde bulunan 5 ma¤azas›nda ayn›SIRA ürünü promosyon uyS‹ZDE gulamas› nedeniyle farkl› fiyatlardan satmaktad›r. Afla¤›da firman›n ma¤azalar›nda sat›lan ürünlerin miktarlar› ve birim sat›fl fiyatlar› verilmifltir. Firma ürünlerini ortalama hangi fiD Ü fi Ü N E L ‹ M yattan satm›flt›r? Ma¤aza Ad› Birim Sat›fl Fiyat› (TL/adet) S O RMiktar› U Sat›lan Ürün (Adet) A 50 300 B 40 D ‹ K350 KAT C 60 150 D 70 E 55 100 SIRA S‹ZDE 200 AMAÇLARIMIZ Geometrik Ortalama 3 N N ‹NTERNET n D Ü fi Ü N E L ‹ M S O R U D‹KKAT Örneklenen verilerin oranlar ve yüzdelerden olufltu¤u durumlarda aritmetik ortalama uygun bir ortalama de¤ildir. Verilerin ani ve anormal farkl›l›klar ya K ‹ T A gösterdi¤i P da yüzde ve oranlarla ifade edildi¤i durumlarda geometrik ortalama daha kullan›fll›d›r. Aritmetik ortalama aritmetik dizi, geometrik ortalama ise geometrik dizi fleklindeki serilere uygun ortalama tipidir. TELEV‹ZYON Geometrik ortalama iki farkl› flekilde hesaplanabilir. a. Bir veri setinde bulunan n adet birimin çarp›m›n›n n’inci dereceden kökünün al›nmas›yla elde edilen de¤er geometrik ortalamay› verir. G= SIRA S‹ZDE SIRA S‹ZDE AMAÇLARIMIZ K ‹ T A P TELEV‹ZYON ‹NTERNET X 1 .X 2 .X 3 .X 4 .......X n b. Verilerin logaritmalar› al›narak bulunacak logaritmik aritmetik ortalaman›n eksponansiyeli (anti logaritmas›) hesaplanarak geometrik ortalama elde edilir. Seri türlerine göre geometrik ortalama afla¤›daki eflitliklerle hesaplanabilir. Basit serilerde: In G = S›n›flanm›fl serilerde: In G = Gruplanm›fl serilerde: In G = ∑ In X i n ∑ In X i .fi ∑ fi ∑ In m i .fi ∑ fi G = exp(InG ) SIRA S‹ZDE SIRA S‹ZDE D Ü fi Ü N E L ‹ M D Ü fi Ü N E L ‹ M S O R U S O R U Veri de¤erlerinin herhangi birinin s›f›r veya s›f›rdan küçük olmas› durumunda D ‹ K K A T geometrik ortalaman›n hesaplanmas› mümkün olamamaktad›r. SIRA S‹ZDE AMAÇLARIMIZ K ‹ T A P N N D‹KKAT SIRA S‹ZDE AMAÇLARIMIZ K ‹ T A P 30 Co¤rafi Bilgi Sistemleri ‹çin Temel ‹statistik ÖRNEK 8 Afla¤›daki basit serinin geometrik ortalamas›n› hesaplay›n›z. X (%) ––––––––– 20 40 35 45 55 Çözüm: Basit serilerde geometrik ortalamay› iki farkl› yöntemle hesaplayabiliriz. a. Veri setinde bulunan n adet birimin çarp›m›n›n n’inci dereceden kökünün al›nmas›: n=5 G= n X 1 .X 2 .X 3 .X 4 .......X n G = 5 20.40.35.45.55 = 37 b. Verilerin logaritmalar› al›narak aritmetik ortalaman›n hesaplanmas›: X (%) 20 40 35 45 55 SIRA S‹ZDE ∑ X = 195 ‹NTERNET 18,054 = 3,611 5 Geometrik ortalama D ‹ K K A T hesaplamada, n’inci dereceden kök alma zorlu¤u nedeniyle genellikle verilerin logaritmalar› al›narak hesaplama yöntemi tercih edilmektedir. N N ÖRNEK 9 TELEV‹ZYON n = ∑ LnX = 18,054 S O=R37 U G = e3,611 D‹KKAT K ‹ T A P ∑ D Ü fi Ü NLnX EL‹M Ln G = S O R U AMAÇLARIMIZ 2,996 3,689 3,555 3,807 4,007 SIRA S‹ZDE D Ü fi Ü N E L ‹ M SIRA S‹ZDE Ln X SIRA S‹ZDE Afla¤›da verilen grupland›r›lm›fl seri için geometrik ortalamay› hesaplay›n›z. AMAÇLARIMIZ Grup Aral›klar› fi mi ln mi 14-18 4 16 2,773 18-22 K ‹ T A P 7 20 2,996 22-26 10 24 3,178 26-30 6 28 3,332 30-34 3 32 3,466 TELEV‹ZYON ‹NTERNET 2. Ünite - Merkezi E¤ilim ve Da¤›l›m Ölçüleri 31 Çözüm: Geometrik ortalamay› hesaplayabilmek için öncelikle grup ortalamalar›n›n (mi) logaritmalar›n› (ln mi) buluruz. Logaritmik grup ortalamalar› ile frekanslar› çarparak toplad›¤›m›zda; ∑ In mi .fi = 94, 234 elde ederiz. Bu durumda geometrik ortalamay›; In G = ∑ In m i .fi ∑ fi = 94, 234 = 3,141 30 G = 23,13 olarak buluruz. Harmonik Ortalama Harmonik ortalama bir serideki gözlem de¤erlerinin terslerinin aritmetik ortalamas›n›n tersine eflittir. Seri türlerine göre harmonik ortalaman›n hesaplanmas› afla¤›daki eflitliklerdeki gibi yap›lmaktad›r. Basit serilerde: H= S›n›flanm›fl serilerde: H= n 1 ∑X i ∑ fi f ∑ Xi i Gruplanm›fl serilerde: H = ∑ fi f ∑ mi i Oran, yüzde ve bölme fleklinde ifade edilen seri de¤erlerinin ortalamas›n› hesaplamada aritmetik ortalama uygun bir ortalama olmay›p, bu gibi durumlarda harmonik ortalaman›n kullan›m› tercih edilir. Örne¤in, belirli bir zamanda al›nan yol ile hesaplanan h›z, belirli bir zamanda üretilen miktar ile hesaplanan verim ve belirli bir miktar için ödenen fiyat gibi de¤iflkenlerin ortalamas›n›n hesaplanmas›nda harmonik ortalaman›n kullan›m› daha uygun olmaktad›r. Borsada ifllem gören bir hisse senedinin bir haftal›k günlük ifllem fiyatlar› afla¤›daki gibi gerçekleflmifltir. Hisse senedinin haftal›k ortalama fiyat›n› aritmetik ortalama ve harmonik ortalama yöntemleriyle hesaplay›n›z. Günler Fiyat (TL/Hisse) Pazartesi 4,64 Sal› 4,97 Çarflamba 5,22 Perflembe 5,92 Cuma 5,40 ÖRNEK 10 32 Co¤rafi Bilgi Sistemleri ‹çin Temel ‹statistik Çözüm: Aritmetik Ortalama: X = Harmonik Ortalama: H = ∑ Xi n n 1 ∑X = 26,15 = 5, 23 TL 5 = 5 = 5, 20 TL 0,9624 i Örne¤in çözümünden de görüldü¤ü gibi, fiyatla ifade edilen hisse senedi serisinin ortalamas›n› aritmetik ortalama ile hesaplasayd›k, hisse bafl›na ortalama 0,03 TL daha yüksek hesaplayacakt›k. SIRA S‹ZDE 4 D Ü fi Ü N E L ‹ M Türkiye’de faaliyet gösteren bir Banka, tafl›t kredilerine uygulad›¤› faiz oranlar›n› y›l içeSIRA S‹ZDE risinde ekonomik geliflmelere ba¤l› olarak üç ayda bir olmak üzere 4 kez de¤ifltirmifltir. Y›l içinde uygulanan faiz oranlar› afla¤›daki gibi oldu¤una göre ortalama ayl›k faiz oran› D Ü fi Ü N E L ‹ M nedir? S O RDönemler U S O R U D‹KKAT SIRA S‹ZDE AMAÇLARIMIZ N N K ‹ T A P 1. Üç ay 1,05 D ‹ K K A 2. T Üç ay 1,25 3. Üç ay 1,39 4. Üç ay SIRA S‹ZDE 0,99 Kareli Ortalama AMAÇLARIMIZ Serideki de¤erlerin karelerinin aritmetik ortalamas›n›n kareköküne kareli ortalama denilir. Seri türlerine göre kareli ortalaman›n hesaplanmas› afla¤›daki eflitliklerdeki gibi yap›lmaktad›r: K ‹ T A P Basit serilerde: TELEV‹ZYON Bir seri de¤erinden aritmetik ortalaman›n ç›kar›lmas› ile elde edilen sapmalar serisinin ‹ N T E R toplam› N E T daima s›f›ra eflittir ( ) ( ∑ X i - X = 0 ). Bu nedenle, sapmalar serisinin ortalamas›n›n hesaplanmas›nda da kareli ortalama kullan›l›r. ÖRNEK 11 Ayl›k FaizOran› (%) K= ∑ X i2 n TELEV‹ZYON S›n›flanm›fl serilerde: K = ‹NTERNET Gruplanm›fl serilerde: K = ∑ fi .X i2 ∑ fi ∑ fi .mi2 ∑ fi Bir seride s›f›r ve/veya farkl› iflaretli (negatif veya pozitif) de¤erler varsa geometrik ve harmonik ortalamalar hesaplanamaz. Bu gibi serilerde, aritmetik ortalaman›n da mant›kl› sonuçlar vermedi¤inden kuflkulan›l›yorsa, kareli ortalaman›n kullan›m› tercih edilmektedir. Kareli ortalama, genellikle bir seride s›f›rdan küçük terimlerin bulundu¤u veya terimler toplam› s›f›ra eflit olan serilerde kullan›lmaktad›r. Bir madencilik flirketinin y›l›n ilk 6 ay›ndaki faaliyet kar/zararlar› afla¤›daki gibidir. fiirketin ayl›k ortalama karl›l›¤› nedir? 33 2. Ünite - Merkezi E¤ilim ve Da¤›l›m Ölçüleri Aylar Ocak fiubat Mart Nisan May›s Haziran Faaliyet Kar/Zarar› (TL) -5000 -7000 2000 4000 7000 9000 Çözüm: Kar/zarar verileri basit seri oldu¤undan, K = lama karl›l›¤› hesaplayabiliriz. n=6 ve K= ∑ X i2 n eflitli¤i ile orta- ∑ X i2 = 224000000 oldu¤undan ayl›k ortalama karl›l›¤›; ∑ X i2 n = 224000000 = 6110,1 TL olarak hesaplar›z. 6 Bir kent merkezinde Ocak ay›nda ölçülen günlük en yüksek hava s›cakl›klar› afla¤›da grupSIRA S‹ZDE land›r›lm›fl seri olarak verilmifltir. Ocak ay› günlük ortalama hava s›cakl›¤›n› hesaplay›n›z. D Ü fi Ü N E L ‹ M Grup Aral›klar› Alt Üst -8 -4 -4 0 0 4 4 8 8 12 12 16 SIRA S‹ZDE D Ü fi Ü N E L ‹ M fi S O R U 3 SIRA S‹ZDE S O R U SIRA S‹ZDE D ‹ K K A 10 T D Ü fi Ü N E L 6‹ M D‹KKAT D Ü fi Ü N E L ‹ M 7 4 SIRA S‹ZDE S O R U1 AMAÇLARIMIZ N N Normal bir seride ortalamalar aras›nda afla¤›daki gibi bir büyüklük iliflkisi D ‹ K K A vard›r. T Kareli > Aritmetik > Geometrik > Harmonik Ortalama – K>X >G>H K ‹ T A P SIRA S‹ZDE Medyan 5 N N Serideki de¤erler küçükten büyü¤e s›raland›¤›nda tam ortaya düflen ve seriyi iki AMAÇLARIMIZ TELEV‹ZYON eflit parçaya bölen de¤ere medyan (ortanca) denilir. Medyan, veri de¤erleri içindeki afl›r› küçük ve afl›r› büyük de¤erlerden etkilenmedi¤inden, aritmetik ortalamaya K ‹ T A P göre daha güvenlidir. Ancak medyan, basit bir s›ralama ile hesapland›¤›ndan has‹ N T E R N E T sas bir ortalama de¤ildir. S›ralanm›fl veri de¤erleri içerisindeki en küçük veya en büyük de¤erlerin, di¤erlerinden çok daha fazla uzaklaflmas› ile simetrik olmayan çarp›k ortaya T E L E da¤›l›mlar V‹ZYON ç›kmaktad›r. Örneklenen verilerin da¤›l›m›n›n çarp›k oldu¤u veya seride afl›r› küçük/büyük de¤erlerin bulundu¤u durumlarda, merkezi e¤ilim ölçüsü olarak medyan›n kullan›m› tercih edilebilmektedir. ‹NTERNET Basit serilerde medyan› bulabilmek için öncelikle veriler küçükten büyü¤e do¤ru s›ralan›rlar. Daha sonra serideki veri say›s›n›n tek veya çift say›da olup olmad›¤›na göre medyan belirlenir. SIRA S‹ZDE S O R U AMAÇLARIMIZ D‹KKAT KSIRA ‹ T S‹ZDE A P TAMAÇLARIMIZ ELEV‹ZYON K ‹ T A P ‹NTERNET TELEV‹ZYON ‹NTERNET 34 Co¤rafi Bilgi Sistemleri ‹çin Temel ‹statistik n+1 'inci gözlem de¤eri medyand›r. 2 n n – Veri say›s› çift ise; ve + 1'inci gözlem de¤erlerinin aritmetik ortalamas› 2 2 medyand›r. S›n›flanm›fl serilerde medyan, ((∑ fi ) + 1) / 2'inci frekans› içeren terimdir. Tam ortaya düflen bu terimi bulabilmek için frekanslar, kümülatif (toplam) frekanslar haline dönüfltürülür. Kümülasyon ifllemi genellikle küçükten büyü¤e yap›l›r. Grupland›r›lm›fl serilerde öncelikle medyan grubunun belirlenmesi gerekir. Medyan grubunun belirlenebilmesi için de öncelikle ayr› bir sütunda toplam frekanslar fi / 2 ifllemi ile medyan grubunun s›ra de¤eri belirlenir. Toplam frekanslar›n yar›s›na karfl›l›k bu de¤eri içeren grup, medyan grubudur. Medyan grubunun de¤erleri ele al›narak, afla¤›daki eflitlikle medyan hesaplan›r. – Veri say›s› tek ise; Burada; Lm = medyan grubunun alt s›n›r›n›, Sm = medyan grubunun aral›¤›n›, (∑ fi / 2) = toplam frekanslar›n yar›s›n›, m-1 ∑ fi = medyan i=1 grubundan bir önceki grubun toplam frekans›n›, fm = medyan grubunun frekans›n› ifade etmektedir. ÖRNEK 12 Me = Lm + Sm ∑ f m-1 i 2 - ∑ fi i=1 . fm Afla¤›daki basit serinin medyan›n› hesaplay›n›z. Xi ––––––––– 8 12 19 23 28 n+1 5+1 = = 3'üncü Çözüm: Basit serinin veri say›s› (n = 5) tek oldu¤undan, 2 2 gözlem de¤eri olan 19 medyand›r. Bu durumda, seriyi tam ortadan ikiye bölen medyan de¤eri; Me = 19 olmaktad›r. ÖRNEK 13 Afla¤›daki basit serinin medyan›n› hesaplay›n›z. Xi ––––––––– 8 12 19 23 28 35 n 6 = = 3 ve Çözüm: Basit serinin veri say›s› (n=6) çift oldu¤undan, 2 2 n 6 + 1 = + 1 = 4'üncü gözlem de¤erlerinin aritmetik ortalamas› medyan olacakt›r. 2 2 3’üncü gözlem de¤eri 19 ve 4’üncü gözlem de¤eri 23 oldu¤una göre medyan›; 19 + 23 = 21 2 olarak hesaplar›z. Me = 2. Ünite - Merkezi E¤ilim ve Da¤›l›m Ölçüleri Afla¤›da verilen s›n›fland›r›lm›fl serinin medyan›n› hesaplay›n›z. Xi fi –––––––– –––––––– 15 2 18 6 24 12 27 7 32 3 35 ÖRNEK 14 Çözüm: S›n›flanm›fl serilerde medyan, ((∑ fi ) + 1) / 2'inci frekans› içeren terim oldu¤undan, öncelikle her bir grubun kümülatif frekanslar› bulunur. X –––––––– 15 18 24 27 32 f ––––––––– 2 6 12 7 3 ∑ fi –––––––––– 2 8 20 27 30 ∑ fi + 1 = 30 + 1 = 15,5'inci kümülatif frekans› içeren de¤er 20 oldu¤undan; 2 2 Me = 24 bulunur. Mermer iflletmelerinde çal›flan iflçi say›lar› ile ilgili yap›lan bir araflt›rmada afla¤›daki grupland›r›lm›fl seri elde edilmifltir. Buna göre mermer iflletmelerinde çal›flan iflçi say›s›n›n medyan ortalamas› nedir? Grup Aral›klar› (Çal›flan Say›s›) ––––––––––––– 0-30 30-60 60-90 90-120 120-150 fi (iflletme Say›s›) –––––––––––––––– 8 20 15 6 3 Çözüm: Grupland›r›lm›fl serinin medyan›n› bulabilmek için öncelikle, her bir grubun kümülatif frekans›n› buluruz. Grup Aral›klar› (Çal›flan Say›s›) ––––––––––––– 0-30 30-60 60-90 90-120 120-150 fi (iflletme Say›s›) –––––––––––––––– 8 20 15 6 3 Medyan grubunun frekans› = ∑ fi 2 = ∑ fi –––––––––– 8 28 43 49 52 52 = 26 2 Medyan grubunun frekans› (26), toplam frekanslar›n 8 ile 28 oldu¤u aral›kta yer ald›¤›ndan, medyan grubu 30-60 grubudur. Bu durumda; ÖRNEK 15 36 Co¤rafi Bilgi Sistemleri ‹çin Temel ‹statistik Lm = 30, Sm = 10, Me = Lm + Sm m-1 (∑ fi / 2) = 26, ∑ fi = 8 i=1 ve fm = 20 oldu¤undan, ∑ f m-1 i 2 - ∑ fi i=1 . fm 26 - 8 M e = 30 + 10. = 39 20 Me = 39 kifli olarak hesaplan›r. SIRA S‹ZDE 6 Bir hastanede sigara kullananlar›n büyük tansiyonlar› ölçüldü¤ünde afla¤›daki da¤›l›m elSIRA S‹ZDE de edilmifltir. Sigara kullananlar›n büyük tansiyonlar›n›n medyan ortalamas› kaçt›r? D Ü fi Ü N E L ‹ M D Ü fi Ü N E L ‹ M Grup Aral›klar› Alt S O R U S O R U D‹KKAT SIRA S‹ZDE AMAÇLARIMIZ N N Basit seriler s›n›fland›r›lmam›fl olduklar›ndan, en çok tekrarlanan bulmak K ‹ T A de¤eri P söz konusu olamaz. Bu nedenle de, basit seriler için mod bulunamaz. TELEV‹ZYON ‹NTERNET Mod 120 130 D140 ‹KKAT 150 160 S‹ZDE SIRA Frekanslar Üst fi 130 140 150 160 170 5 12 18 16 9 AMAÇLARIMIZ Bir seride en çok gözlenen (tekrarlanan) de¤ere veya frekans› en büyük olan de¤ere mod denilir. Mod, serideki frekanslar›n önemli bir k›sm›n› içerdi¤inden, ortalamalar aras›nda en temsili olan›d›r. Ayr›ca mod, anormal afl›r› de¤erlerin etkisi alK ‹ T A P t›nda kalmaz. Bununla birlikte mod, tüm veri de¤erlerini göz önünde bulundurmad›¤› için tutarl› olmayan bir merkezi e¤ilim ölçüsüdür. S›n›fland›r›lm›fl ve grupland›r›lm›fl seriler için mod hesaplanabilir. TELEV‹ZYON S›n›flanm›fl serilerde, frekanslar› içeren sütunda en yüksek frekans saptand›ktan sonra, buna karfl›l›k gelen de¤er araflt›r›larak mod bulunabilir. Grupland›r›lm›fl serilerde mod de¤eri hesaplan›rken öncelikle, frekans› en bü‹ N T E grubu R N E T belirlenir. Mod grubu belirlendikten sonra, bu grup içerisinyük olan mod de yer alan modun de¤eri, grup frekans› ile bundan bir önceki ve bir sonraki gruplar›n frekanslar› dikkate al›narak hesaplan›r. Gruplanm›fl serilerde mod, afla¤›daki eflitlikle hesaplan›r. ∆1 M o = L mo + Smo . ∆ ∆ + 1 2 ∆1 = fmo - fmo-1 ∆2 = fmo - fmo+1 Burada, Lmo = mod grubunun alt s›n›r›, Smo = mod grubunun aral›¤›, fmo= mod grubunun frekans›, fmo-1 = mod grubundan önceki grubun frekans› ve fmo+1= mod grubundan bir sonraki grubun frekans›d›r. 37 2. Ünite - Merkezi E¤ilim ve Da¤›l›m Ölçüleri Bir kent merkezinde hane halk› büyüklü¤ünün mod ortalamas›n› araflt›rmak üzere çal›flma yap›lm›fl olup, afla¤›daki grupland›r›lm›fl seri elde edilmifltir. Hane halk› büyüklü¤ünün mod ortalamas›n› hesaplay›n›z. Grup Aral›klar› (Hane Halk›-Kifli) ––––––––––––––– 0-2 2-4 4-6 6-8 8-10 10-12 ÖRNEK 16 fi (Hane Say›s›-%) ––––––––––––––––– 12 27 42 13 4 2 Çözüm: En büyük frekans› (42) içeren mod grubu 4-6 grubu oldu¤undan, mod grubu dikkate al›narak afla¤›daki de¤erler belirlenir. fmo = 42, fmo-1 = 27, fmo+1 = 13, Lmo = 4, Smo = 2 ∆1 = fmo - fmo-1 = 42 - 27 = 15 ∆2 = fmo - fmo+1 = 42 - 13 = 29 M o = L mo ∆1 + Smo . + ∆ ∆ 1 2 15 Mo = 4 + 2. = 4,7 15 + 29 Mo = 4,7 kifli. DA⁄ILIM ÖLÇÜLER‹ SIRA göstermekle S‹ZDE Ortalamalar, rassal örneklenmifl verilerin merkezi e¤ilim ölçülerini birlikte, bu de¤er çevresindeki yay›l›m›n büyüklü¤ü hakk›nda bir bilgi vermez. Rassal örneklenen veri seti için bulunan merkezi e¤ilim ölçüsünü yorumlamak D Ü fi Ü N E L ‹ M ve birden fazla veri seti için verilerin da¤›l›mlar› aras›nda karfl›laflt›rmalar yapabilmek amac›yla baz› da¤›l›m ölçüleri kullan›labilmektedir. Da¤›l›m ölçüleri olarak ço¤unlukla deS O R U ¤iflkenlik aral›¤›, varyans, standart sapma ve de¤iflkenlik katsay›s› kullan›lmaktad›r. Örneklenen verilerin da¤›l›mlar›n›n yay›lmalar›n›n nas›l oldu¤u da önemlidir. Örne¤in, iki ayr› kent merkezinin ocak ay› hava kirlili¤i (kükürt) aritmetik ortalamas› 40 µg/m3 olarak ölçüldü¤ünde, her iki kentin hava kirlili¤inin ayn› oldu¤unu söylenebilir. Ancak, bir kent merkezinde hava kirlili¤i bir ay içerisinde 35-45 µg/m3 aras›nda de¤ifliyor iken di¤er kent merkezinde 5-75 SIRA S‹ZDE µg/m3 aras›nda de¤ifliyorsa, bu durumda her iki kentin hava kirlili¤i düzeylerinin farkl› oldu¤u;Daritmetik Ü fi Ü N E L ‹ M ortalamalar›n da hava kirlili¤i düzeyini aç›klamakta pek yeterli olmad›¤› S O R U anlafl›lacakt›r. Da¤›l›m ölçüsü, seriyi oluflturan verilere sabit bir say› eklendi¤indeD veya ‹ K K A ç›kar›ld›¤›nda T de¤eri de¤iflmeyen ölçüdür. De¤iflkenlik Aral›¤› SIRA S‹ZDE N N Örneklemeler sonucu elde edilen veriler aras›nda var olan en küçük ve en büyük de¤er aras›ndaki fark de¤iflkenlik aral›¤› (R) olarak tan›mlan›r. AMAÇLARIMIZ R = Xenb - Xenk K ‹ T ölçüt A P de¤iflkenDa¤›l›m ölçüleri içinde hesaplan›fl› en kolay olan fakat en kaba lik aral›¤›d›r. De¤iflkenlik aral›¤›, özellikle veri say›s›n›n çok oldu¤u durumlarda güvenilir de¤ildir. D‹KKAT SIRA S‹ZDE AMAÇLARIMIZ K ‹ T A P TELEV‹ZYON TELEV‹ZYON ‹NTERNET ‹NTERNET 38 Co¤rafi Bilgi Sistemleri ‹çin Temel ‹statistik Varyans ve Standart Sapma Verilerin da¤›l›m›n› veya yay›l›m›n›n büyüklü¤ünü ölçmek için en çok kullan›lan parametre varyanst›r. Varyans, rassal örneklenmifl verilerin aritmetik ortalamaya göre farklar›n›n karelerinin toplam›n›n ortalamas› olup, verilerin ortalamadan sapmas›n› ve ortalamaya göre yay›lman›n büyüklü¤ünü gösteren bir ölçüdür. Basit serilerde varyans, afla¤›daki eflitlikle hesaplanabilir. SIRA S‹ZDE nSIRA S‹ZDE 2 2 S = D Ü fi Ü N E L ‹ M ∑ ( X i - X) i=1 D Ü fi Ü NnE L ‹ M S O R U Burada; S2 = da¤›l›m›n varyans›, Xi = i’inci rassal örneklenmifl de¤iflkenin de¤e– S O R U ri, X = da¤›l›m›n örnek kütle aritmetik ortalamas›, n = kütlenin örnek say›s›d›r. D‹KKAT Basit serilerde D ‹ Ke¤er K A Tn<30 ise, varyans hesaplamada payda “n-1” olur. SIRA S‹ZDE N N k SIRA S‹ZDE 2 S›n›fland›r›lm›fl serilerde ise varyans; S = AMAÇLARIMIZ K ‹ T A P ∑ ( X i - X) 2 k ∑ fi AMAÇLARIMIZ i=1 eflitli¤i ile Burada, k = s›n›f say›s›, fi = i’inci s›n›f›n frekans›d›r. K ‹ hesaplanabilir. T A P l TELEV‹ZYON .fi i=1 TELEV‹ZYON Grupland›r›lm›fl serilerde de varyans; S = 2 ∑ ( m i - X) 2 .fi i=1 l ∑ fi i=1 ‹NTERNET N T Ehesaplanabilir. RNET eflitli¤i ‹ile Burada, l = grup say›s›n›, mi = i’inci grubun ortalama- s›n›, fi = i’inci grubun frekans›n› göstermektedir. Varyans›n büyük olmas›, de¤iflkenin ortalama çevresindeki yay›l›m›n›n büyük oldu¤unu gösterir. fiekil 2.1.’deki A1 ve A2 de¤iflkenlerinin ortalamalar› ayn› olmakla birlikte A1’in varyans› daha büyüktür. Bu nedenle, A1’in ortalamadan uzak de¤erler alma olas›l›¤›n›n daha büyük oldu¤unu söylemek mümkündür. Varyans›n boyutu, rassal de¤iflkenin boyutunun karesi gibidir. Bu nedenle ço¤u zaman, varyans›n karekökü olan “standart sapma” kullan›l›r. fiekil 2.1 Varyanslar› farkl› iki de¤iflkenin frekans da¤›l›fl› f´(x) A2 2 σA 1 2 σA A1 2 2. Ünite - Merkezi E¤ilim ve Da¤›l›m Ölçüleri 39 De¤iflkenlik Katsay›s› Ortalamalar› birbirinden farkl› olan örnek kütlelerden hangisinin yay›l›m›n›n büyük oldu¤unu anlamak için de, boyutsuz bir katsay› olan “de¤iflkenlik (varyasyon) katsay›s›”ndan yararlan›l›r. De¤iflkenlik katsay›s› afla¤›daki gibi hesaplan›r. – C = σ/ X De¤iflkenlik katsay›s›, ortalamaya göre yay›l›m›n büyüklü¤ünü gösteren bir katsay›d›r. ‹çme suyu temin edilmesi tasarlanan iki akarsuda (A ve B) su kalitesini belirlemek amac›yla ask›daki at›k maddeler (mg/l) analiz edilmifl olup, elde edilen veriler afla¤›daki gibidir. ‹çme suyunda ask›daki at›k madde miktar›n›n mümkün oldu¤unca az olmas› istendi¤ine göre, aritmetik ortalama, standart sapma ve de¤iflkenlik katsay›lar› dikkate al›nd›¤›nda, hangi akarsu içme suyu temini için tercih edilmelidir? A (mg/l) 1,8 3,9 5,5 6,6 9,8 4,7 12,4 7,6 6,7 8,3 7,2 4,9 B (mg/l) 5,6 5,2 4,7 9,4 9,1 4,4 8,2 7,8 6,3 5,8 9,6 6,7 Basit serinin aritmetik ortalamas›na göre; X= ∑ Xi n – – X A = 79,4 / 12 = 6,6 mg/l X B = 82,8 / 12 = 6,9 mg/l – – X A < X B oldu¤undan A akarsuyu tercih edilir. Standart sapmalar; ∑ ( X i - X) 2 S= SA = n-1 86,18 = 2,8 mg / l 12 -1 SB = 38,16 = 1,9 mg / l 12 -1 ÖRNEK 17 40 Co¤rafi Bilgi Sistemleri ‹çin Temel ‹statistik S B < S A oldu¤undan B akarsuyu tercih edilmelidir. Aritmetik ortalama ve standart sapman›n farkl› seçenekleri en iyiledi¤i durumlarda, mutlaka de¤iflkenlik katsay›s›n› da hesaplayarak karar vermek gerekir. De¤iflkenlik katsay›lar›; C= S X CA = 2,8 = 0, 424 6,6 CB = 1,9 = 0, 275 6, 9 CB < CA oldu¤undan B akarsuyu içme suyu temini için tercih edilir. A akarsuyunda ask›daki at›k madde miktar› ortalama olarak daha az olmakla birlikte, de¤iflkenlik daha fazlad›r. 2. Ünite - Merkezi E¤ilim ve Da¤›l›m Ölçüleri 41 Özet N A M A Ç 1 Merkezi e¤ilim ölçülerini hesaplay›p kullanmak. Verileri tan›mlamaya ve özetlemeye yarayan merkezi e¤ilim ölçüleri, verilerin tümünü temsil eden ve merkez noktas›na yak›n bir de¤er oldu¤undan, ortalamalar olarak da tan›mlanmaktad›r. Her verinin a¤›l›klar›n›n (önem derecelerinin) birbirine eflit oldu¤u durumlarda basit aritmetik ortalama, farkl› oldu¤u durumlarda ise a¤›rl›k ortalama kullan›lmaktad›r. Verilerin ani ve anormal farkl›l›klar gösterdi¤i ya da yüzde ve oranlarla ifade edildi¤i durumlarda geometrik ortalama kullan›lmaktad›r. Oran, yüzde ve bölme fleklinde ifade edilen seri de¤erlerinin ortalamas›n› hesaplamada harmonik ortalaman›n kullan›m› tercih edilmektedir. Bir seride s›f›r ve/veya farkl› iflaretli (negatif veya pozitif) de¤erler varsa, kareli ortalaman›n kullan›m› tercih edilmektedir. Merkezi e¤ilim ölçüleri serinin basit, s›n›fland›r›lm›fl veya grupland›r›lm›fl olma flekillerine göre farkl› yöntemlerle hesaplanabilmektedir. Serideki de¤erlerin tam ortas›na düflen ve seriyi iki eflit parçaya bölen medyan (ortanca), veri de¤erleri içindeki afl›r› küçük ve afl›r› büyük de¤erlerden etkilenmez. Ancak medyan, basit bir s›ralama ile hesapland›¤›ndan hassas bir ortalama de¤ildir. Bir seride en çok gözlenen (tekrarlanan) de¤ere veya frekans› en büyük olan de¤er olan mod ise, ortalamalar aras›nda en temsili olan›d›r. N A M A Ç 2 Merkezi e¤ilim ve da¤›l›m ölçülerini hesaplay›p kullanmak. Rassal örneklenen veriler için bulunan merkezi e¤ilim ölçüsünü yorumlamak ve birden fazla veri seti için verilerin da¤›l›mlar› aras› karfl›laflt›rmalar yapabilmek amac›yla de¤iflkenlik aral›¤›, varyans, standart sapma ve de¤iflkenlik katsay›s› kullan›lmaktad›r. Örneklenen verilerin en küçük ve en büyük de¤eri aras›ndaki farka de¤iflkenlik aral›¤› (R) denilmektedir. Örneklenen verilerin aritmetik ortalamaya göre farklar›n karelerinin toplam›n›n ortalamas›na varyans denilmekte olup, varyans ortalamaya göre yay›lman›n büyüklü¤ünü gösterir. Varyans›n kareköküne de standart sapma denilir. Standart sapman›n ortalamaya bölünmesiyle elde edilen ölçüte ise de¤iflkenlik katsay›s› denilmektedir. 42 Co¤rafi Bilgi Sistemleri ‹çin Temel ‹statistik Kendimizi S›nayal›m 1. Örneklenen 10 adet veri ile oluflturulan seride, gözlem de¤erleri toplam› ∑ X = 80 oldu¤una göre, serinin aritmetik ortalamas› kaçt›r? a. 2 b. 4 c. 6 d. 8 e. 10 2. Grup Aral›klar› fi ––––––––––––––––––––– 2-4 2 4-6 6 6-8 10 8-10 8 10-12 4 Yukar›daki grupland›r›lm›fl serinin medyan› kaçt›r? a. 4,5 b. 5,2 c. 6,4 d. 7,4 e. 10,1 5. Grup Aral›klar› fi ––––––––––––––––––––– 0-4 3 4-8 7 8-12 10 12-16 7 16-20 3 Yukar›daki grupland›r›lm›fl serinin aritmetik ortalamas› 10 oldu¤una göre, da¤›l›m›n varyans› kaçt›r? a. 4,5 b. 20,3 c. 10,4 d. 16,8 e. 8,8 6. X –––––––– 1 2 4 5 10 Yukar›daki basit serinin harmonik ortalamas› kaçt›r? a. 2,05 b. 2,25 c. 2,44 d. 4,10 e. 4,40 3. Grup Aral›klar› fi ––––––––––––––––––––– 20-30 10 30-40 30 40-50 40 50-60 25 60-70 5 Yukar›daki grupland›r›lm›fl serinin modu kaçt›r? a. 34 b. 44 c. 46 d. 48 e. 52 7. Örneklenen veri say›s› n=5 ve verilerin kareleri toplam› ∑ X 2i = 8000 olan, serinin kareli ortalamas› kaçt›r? a. 10 b. 20 c. 25 d. 35 e. 40 4. Aritmetik ortalamas› 20 ve de¤iflkenlik katsay›s› 0,4 olan bir da¤›l›m›n standart sapmas› kaçt›r? a. 4 b. 8 c. 16 d. 18 e. 20 8. 5, -4, 2, 0, -6, 8, 12, 15 Yukar›daki basit serinin kareli ortalamas› kaçt›r? a. 0 b. 4 c. 8 d. 10 e. 12 2. Ünite - Merkezi E¤ilim ve Da¤›l›m Ölçüleri 43 Kendimizi S›nayal›m Yan›t Anahtar› 9. 6, 8, 8, 6, 4, 5, 5, 6, 6, 7, 7, 4, 7, 5, 6 Yukar›daki basit serisinin modu kaçt›r? a. 4 b. 5 c. 6 d. 7 e. 8 1. d 10. 5. a X ––––––––– 2 12 8 22 16 Yukar›daki basit serinin de¤iflim aral›¤› kaçt›r? a. 4 b. 6 c. 10 d. 14 e. 20 2. d 3. b 4. b 6. c 7. e 8. c 9. c 10. e Yan›t›n›z yanl›fl ise, “Aritmetik Ortalama” konusunu gözden geçiriniz. Yan›t›n›z yanl›fl ise, “Medyan” konusunu gözden geçiriniz. Yan›t›n›z yanl›fl ise, “Mod” konusunu gözden geçiriniz. Yan›t›n›z yanl›fl ise, “De¤iflkenlik Katsay›s›” konusunu gözden geçiriniz. Yan›t›n›z yanl›fl ise, “Varyans ve Standart Sapma” konusunu gözden geçiriniz. Yan›t›n›z yanl›fl ise, “Harmonik Ortalama” konusunu gözden geçiriniz. Yan›t›n›z yanl›fl ise, “Kareli Ortalama” konusunu gözden geçiriniz. Yan›t›n›z yanl›fl ise, “Kareli Ortalama” konusunu gözden Yan›t›n›z yanl›fl ise, “Mod” konusunu gözden geçiriniz. Yan›t›n›z yanl›fl ise, “De¤iflkenlik Aral›¤›” konusunu gözden geçiriniz. 44 Co¤rafi Bilgi Sistemleri ‹çin Temel ‹statistik S›ra Sizde Yan›t Anahtar› S›ra Sizde 1 – X = 9 ve X = ∑ X i = 180 olarak verilmifl olup n = ? ∑ Xi n ⇒n= ∑ Xi X = 180 = 20 9 ui = eflitli¤i ile hesaplar›z. 1000 Grup S›n›rlar› Frekanslar Grup Küçültülmüfl Ortalamalar› Grup Ort. Alt Üst (den az) fi mi ui 0 1000 3 500 -2 1000 2000 6 1500 -1 2000 3000 12 2500 0 3000 4000 9 3500 1 4000 5000 5 4500 2 ∑ ui .fi = 7 ve ∑ fi = 35 oldu¤undan, u = 7 = 0, 2 35 olarak hesaplar›z. – – Aritmetik ortalama; X = m0 + (u .A) = 2500 + (0,2.1000) = 2700 bulunur. S›ra Sizde 3 Xi ai 50 300 40 350 60 150 70 100 55 200 ∑ ai .X i X = ∑ ai ∑ 1 Xi = 4 = 1,15 % 3, 482 Grup Aral›klar› mi m2i 3 -6 36 7 -2 4 4 10 2 4 4 8 6 6 36 8 12 4 10 100 12 16 1 14 196 Alt Üst -8 -4 -4 0 0 fi ∑ fi = 31 ve ∑ fi .mi2 = 988 oldu¤undan; K= ∑ fi .mi2 ∑ fi = 988 = 5,65 °C hesaplan›r. 31 S›ra Sizde 6 Grup S›n›rlar› Frekanslar Üst fi 120 130 5 5 130 140 12 17 140 150 18 35 150 160 16 51 160 170 9 60 Medyan grubunun frekans› = (∑ fi ) = 60 = 30 Xi Ayl›k Faiz Oran› (%) 1. Üç ay 1,05 2. Üç ay 1,25 3. Üç ay 1,39 4. Üç ay 0,99 2 2 Medyan grubu 140-150 grubudur. m-1 (∑ fi / 2) = 30, ∑ fi = 17 30 -17 M e = 140 + 10. = 147, 2 18 S›ra Sizde 4 ∑ fi Alt Lm = 140, Sm = 10, = 18 oldu¤undan, 56000 = = 50,9 1100 Dönemler n S›ra Sizde 5 S›ra Sizde 2 m0 = 2500 ve A = 1000 oldu¤una göre, bu durumda küçültülmüfl grup ortalamalar›n›; mi - 2500 H= i=1 ve fm 2. Ünite - Merkezi E¤ilim ve Da¤›l›m Ölçüleri Yararlan›lan Kaynaklar Çömlekçi, N. (1989). Temel ‹statistik ‹lke ve Teknikleri. ‹stanbul: Bilim Teknik. Gürsakal, N. (2001). Bilgisayar Uygulamal› ‹statistik I. No:1029. ‹stanbul: Alfa. Gürtan, K. (1982). ‹statistik ve Araflt›rma Metodlar›. No:2941. ‹stanbul: ‹stanbul Üniversitesi. Konuk, A. & Önder, S. (1999). Maden ‹statisti¤i. Mühendislik Mimarl›k Fakültesi Maden Mühendisli¤i Bölümü. Eskiflehir: Eskiflehir Osmangazi Üniversitesi. Orhunbilge, N. (2000). Tan›msal ‹statistik Olas›l›k ve Olas›l›k Da¤›l›mlar›. ‹flletme Fakültesi Yay›n No: 279. ‹stanbul: ‹stanbul Üniversitesi. Ünver, Ö. & Gamgam, H. (2006). Uygulamal› Temel ‹statistik Yöntemler. Ankara: Seçkin. Yüzer, A.F. (Ed.) (2009). ‹statistik. Aç›k Ö¤retim Fakültesi Yay›n No: 771. Eskiflehir: Anadolu Üniversitesi. 45 CO⁄RAF‹ B‹LG‹ S‹STEMLER‹ ‹Ç‹N TEMEL ‹STAT‹ST‹K 3 Amaçlar›m›z N N N Bu üniteyi tamamlad›ktan sonra; Kesikli ve sürekli rassal de¤iflken kavram›n› ö¤renerek verilerin uygun da¤›l›m modelini seçebilecek, Kesikli rassal de¤iflkenlerin da¤›l›m modellerinin (Binom ve Poission) parametrelerini hesaplay›p, spesifik uygulamalarda da¤›l›m parametrelerini kullanabilecek, Sürekli rassal de¤iflkenlerin da¤›l›m modellerinin (Normal ve Lognormal) parametrelerini hesaplay›p, spesifik uygulamalarda da¤›l›m parametrelerini kullanabilecek bilgi ve becerilere sahip olacaks›n›z. Anahtar Kavramlar • • • • • • Kesikli Da¤›l›m Sürekli Da¤›l›m Binom Da¤›l›m› Poisson Da¤›l›m› Normal Da¤›l›m Lognormal Da¤›l›m • • • • • • Standart Normal Da¤›l›m Çarp›kl›k Katsay›s› Bas›kl›k Katsay›s› Varyans Standart Sapma Ortalama ‹çindekiler Co¤rafi Bilgi Sistemleri için Temel ‹statistik Olas›l›k Da¤›l›m Modelleri • OLASILIK DA⁄ILIMLARINA GENEL BAKIfi • BAZI KES‹KL‹ (B‹NOM VE POISSON) OLASILIK DA⁄ILIM MODELLER‹ • BAZI SÜREKL‹ (NORMAL VE LOGNORMAL) OLASILIK DA⁄ILIM MODELLER‹ Olas›l›k Da¤›l›m Modelleri OLASILIK DA⁄ILIMLARINA GENEL BAKIfi Rassal de¤iflkenlerin tüm mümkün sonuçlar›n›n olas›l›klar›n›n say›sal veya grafiksel sunumuna olas›l›k da¤›l›mlar› denilmektedir. Rassal örneklenen de¤iflkenlerin ald›¤› de¤erlerin olas›l›k da¤›l›m flekli kesikli veya sürekli olabilmektedir. Rassal örneklenen verilerin ald›¤› de¤erler bir eksen üzerinde kesintisiz bir flekilde s›ralanabiliyorsa ve bir aral›ktaki bütün de¤erleri alabiliyorsa, bu de¤iflkenler sürekli de¤iflkenler olarak tan›mlanmaktad›r. Sürekli de¤iflkenlerde, iki de¤iflken de¤eri aras›na sonsuz say›da de¤er yerlefltirmek mümkündür. Buna karfl›l›k, rassal örneklenen bir de¤iflken sadece belirli say›da de¤erler alabiliyor ve yaln›zca say›labilir say›da de¤erler al›yorsa, bu de¤iflken kesikli de¤iflken olarak tan›mlanmaktad›r. Kesikli de¤iflkenlerde, iki de¤iflken aras›nda sonlu say›da de¤er bulunmaktad›r. Örne¤in, Üniversite ö¤rencilerinin bir dersten alm›fl olduklar› harf notlar›n›n katsay›lar›n› s›n›fland›rarak sundu¤umuzda, elde edece¤imiz da¤›l›m kesikli olur. Ö¤rencilerin bir dersten alaca¤› harf notunun katsay›s› 1, 2, 3 veya 4 olabilir. Buna karfl›l›k, s›n›ftaki ö¤rencilerin genel not ortalamalar›n› grupland›rarak sundu¤umuzda elde edece¤imiz da¤›l›m ise sürekli olur. Ö¤rencilerin tüm derslerden ald›klar› harf notlar›n›n genel ortalamas› 1.2, 2.6, 2.9 veya 3.4 gibi ara de¤erleri de alabilece¤inden, genel not ortalamalar› da¤›l›m› sürekli olur. Kesikli de¤iflkenlerde, belirli de¤erlerin noktasal olarak gerçekleflme olas›l›klar› belirlenebilir. Ancak, sürekli rassal de¤iflkenlerde belirli de¤erlere olas›l›klar verilemez. Örne¤in, kesikli bir de¤iflken olarak hava s›cakl›¤›n›n 20 °C olma olas›l›¤› hesaplanabilir. Ancak, sürekli de¤iflken olarak hava s›cakl›¤›n›n tan›mlanmas› halinde, hava s›cakl›¤›n›n belirli aral›¤› (örne¤in 18-22 °C) için gerçekleflme olas›l›¤› hesaplanabilir. Kesikli veya sürekli de¤iflkenlerin olas›l›k da¤›l›m›n›, matematiksel modellerle ifade etmek mümkündür. BAZI KES‹KL‹ OLASILIK DA⁄ILIM MODELLER‹ Co¤rafi bilgi sitemleri kapsam›nda örneklenen birçok kesikli da¤›lm›fl de¤iflkenler için Binom ve Poisson da¤›l›m modeli kullan›labilmektedir. Bu nedenle, bu bölümde kesikli da¤›l›mlardan sadece Binom ve Poisson da¤›l›m modellerinin hesaplanmas›n› ve bu parametrelerin uygulamada kullan›m›n› ele alaca¤›z. 48 Co¤rafi Bilgi Sistemleri ‹çin Temel ‹statistik Binom Da¤›l›m› X rassal de¤iflkeninin baflar› için 1 ve baflar›s›zl›k için 0 de¤erini ald›¤› durumda, X rassal de¤iflkeninin olas›l›k fonksiyonunun P(X=1)=p ve P(X=0)=1-p=q veya P(X=x)= px(1-p)1-x oldu¤u da¤›l›mlara Bernoulli da¤›l›m› denilmektedir. Binom deneydeki her tekrara, Bernoulli denemesi ya da s›namas› denilmektedir. Rassal koflullarda gerçeklefltirilen Bernoulli deneyleri sonucunda biri baflar› di¤eri baflar›s›zl›k olmak üzere iki farkl› sonuç ortaya ç›kar. Örne¤in, bir fabrika üretim hatt›ndan ç›kan ürünün kusursuz veya kusurlu olmas›, yere at›lan cam barda¤›n k›r›lmas› veya k›r›lmamas›, üzerine bas›nç uygulanan beton örne¤inin k›r›lmas› veya sa¤lam kalmas› gibi baz› deneylerde iki farkl› sonuç vard›r. Rassal olarak yap›lan n tekrarl› bir deneyde her tekrarda iki farkl› (kesikli) sonuçtan birinin gelmesi söz konusu ise, istenen sonucun gelme olas›l›klar›n›n bulunmas› amac›yla Binom olas›l›k da¤›l›m› kullan›lmaktad›r. Örne¤in bir seramik fabrikas›nda üretilen fayanslar›n kusurlu olma olas›l›¤› % 1 ise, üretim band›ndan rassal olarak örneklenen 10 adet fayans›n içinden bir tanesinin kusurlu olma olas›l›¤›n› Binom olas›l›k da¤›l›m›n› kullanarak belirleyebiliriz. Bernoulli deneylerinin n kez tekrarlanmas› halinde, bu deneylerdeki baflar›l› sonuçlar›n toplam› olan X rassal de¤iflkeni için afla¤›daki koflullar gerçeklefliyorsa, bu rassal de¤iflken Binom rassal de¤iflkeni olarak tan›mlan›r. • Deneyde, baflar›l› olma olas›l›¤› p ve baflar›s›z olma olas›l›¤› (1-p) olmak üzere iki sonuç olmal›d›r. • Deneylerin tümü (n), ayn› koflullar alt›nda gerçeklefltirilmelidir. • Her deneme sonucunda baflar›l› olma olas›l›¤› p ve baflar›s›zl›k olas›l›¤› q ayn›d›r. • Denemeler birbirinden ba¤›ms›z olmal› ve deney süresince n sabit kalmal›d›r. Bir ana kütlede sonucun baflar›l› olma olas›l›¤› p ve baflar›s›z olma olas›l›¤› q=1-p ise, bu ana kütleden çekilecek n adet örnek kütle içerisinden rassal ve iadeli olarak x adet birim çekildi¤inde, x adet birimin de baflar›l› gelme olas›l›¤› afla¤›daki Binom aç›l›m› ile hesaplanabilir. P( X = x ) = Faktöriyel, (!) sembolü ile gösterilir. n!, 1’den n’e kadar olan say›lar›n›n yan yana yaz›l›p çarp›m› demektir. Örne¤in, 5! demek 0’dan 5’e kadar say›lar›n yan yana yaz›l›p çarp›m› olup, 5!=120’dir. ÖRNEK 1 n! . p x . q n− x , x= 0,1,2,3,....,n x !( n − x)! Burada, !: ‹lgili birimin faktöriyelini göstermektedir. Binom da¤›l›m› eflitli¤i ile belirli bir baflar› say›s›na karfl›l›k gelen olas›l›k de¤eri bulunabildi¤i gibi, belirli bir aral›¤a düflen baflar› say›s›n›n olas›l›¤›n› da bulmak mümkündür. Belirli bir aral›¤a düflen baflar› say›s›n›n olas›l›¤›, o aral›ktaki bütün baflar› say›lar› olas›l›klar›n›n toplam›na eflittir. Bir mermer oca¤›ndan üretilen blok mermerlerin çatlaks›z olarak sat›labilme olas›l›¤›n›n %30 oldu¤u bilinmektedir. Mermer oca¤› üretim sürecinde örnek olarak al›nacak 5 adet blok içinden hiçbirinin çatlaks›z (hepsinin çatlakl›) ve 1, 2, 3, 4 ve 5’inin çatlaks›z olma olas›l›klar›n› hesaplayarak olas›l›k çizelgesini haz›rlay›n›z. Çözüm: Ele ald›¤›m›z örnekte; Çatlaks›z ürün olas›l›¤› : p= 0,3 (%30) Çatlakl› ürün olas›l›¤› : q= 1- p = 1- 0,3 = 0,7 (%70) Örnek kütle say›s› : n= 5 Oldu¤una göre, her bir X için baflar› (çatlaks›z blok) olas›l›klar›n› afla¤›daki gibi hesaplar›z. 3. Ünite - Olas›l›k Da¤›l›m Modelleri P( X = x ) = 49 n! p x q n− x x !( n − x )! n=5 adet bloktan hiçbirinin çatlaks›z (x=0) olma olas›l›¤›; P( X = 0) = 5! . 0, 30.0, 75−0 = 0,1681 0 !.(5 − 0)! n=5 adet bloktan 1’inin çatlaks›z (x=1) olma olas›l›¤›; P( X = 1) = 5! .0, 31.0, 75−1 = 0, 3602 1!.(5 − 1)! n=5 adet bloktan 2’sinin çatlaks›z (x=2) olma olas›l›¤›; P( X = 2) = 5! .0, 32.0, 75−2 = 0, 3087 2 !.(5 − 2)! n=5 adet bloktan 3’ünün çatlaks›z (x=3) olma olas›l›¤›; P( X = 3) = 5! .0, 33.0, 75−3 = 0, 1323 3!.(5 − 3)! n=5 adet bloktan 4’ünün çatlaks›z (x=4) olma olas›l›¤›; P( X = 4) = 5! .0, 34.0, 75−4 = 0, 0284 4 !.(5 − 4)! n=5 adet bloktan 5’inin (hepsinin) çatlaks›z (x=5) olma olas›l›¤›; P( X = 5) = x P(X=x) 5! .0, 35.0, 75−5 = 0, 0024 5!.(5 − 5)! 0 1 2 3 4 5 0,1681 0,3602 0,3087 0,1323 0,0284 0,0024 Örnek 1’deki verileri ve olas›l›k çizelgesini ele alarak mermer oca¤› üretim sürecinde örnek olarak al›nacak 5 adet blok içinden; a) 2 ile 3’ünün çatlaks›z olma olas›l›¤›n›, b) En çok birinin çatlaks›z olma olas›l›¤›n›, c) En az birinin çatlaks›z olma olas›l›¤›n› hesaplay›n›z. Çözüm: a) 2 ile 3’ünün çatlaks›z olma olas›l›¤›; P(2 ≤ X ≤ 3) = P(X=2) + P(X=3) = 0,3087 + 0,1323 = 0,441 b) En çok 1’inin çatlaks›z olma olas›l›¤›, P(X ≤ 1) = P(X=0) + P(X=1) = 0,1681 + 0,3602 = 0,5283 c) En az 1’inin çatlaks›z olma olas›l›¤›, P(X ≥ 1) = 1-P(X=0) =1- 0,1681=0,8319 ÖRNEK 2 50 Co¤rafi Bilgi Sistemleri ‹çin Temel ‹statistik SIRA S‹ZDE 1 D Ü fi Ü N E L ‹ M Elektronik ürünler pazarlayan bir ma¤azay› gezen müflterilerin %20’sinin ürün sat›n ald›SIRA S‹ZDE ¤› bilinmektedir. Bir saat içinde ma¤azay› gezen 6 müflterinin 2’sinin ürün sat›n alma olas›l›¤› nedir? D Ü fi Ü N E L ‹ M Binom da¤›l›m›n›n ortalamas›; S O R U S O R U X = E(x) = np Binom da¤›l›m›n›n varyans› ve standart sapmas›; D‹KKAT S x2 SIRA S‹ZDE K ‹ T A P = E(x - X ) = npq N N SIRA S‹ZDE S x = npq ÖRNEK 3 AMAÇLARIMIZ D‹KKAT 2 Tekstil sektöründe kot tafllama iflinde 5 y›l çal›flan iflçilerin sikoza (tafl tozu hastaAMAÇLARIMIZ l›¤›na yakalanma ihtimali nedeniyle) yaflama ihtimali %85’tir. Tekstil ürünleri üreten bir fabrikada kot tafllama iflinde 10 iflçi çal›fl›yorsa, bu iflçilerin yaflama ihtimali ortalamas›, ve standart sapmas›n› hesaplay›n›z. K ‹ T A varyans P n= 10, p=0,85, q=0,15, x=0,1,2,3,4,5,6,7,8,9,10 TELEV‹ZYON ‹NTERNET T E L :E V ‹ ZX Y O=N E(x) = np = 10.0,85 = 8,5 kifli Ortalama Varyans : S x2 = E(x - X )2 = npq = 10.0,85.0,15 = 1, 28 kifli ‹NTERNET Standart Sapma : S x = npq = 10.0,85.0,15 = 1,13 kifli Poisson Da¤›l›m› SIRA S‹ZDE D Ü fi Ü N E L ‹ M S O R U D‹KKAT SIRA S‹ZDE AMAÇLARIMIZ K ‹ T A P Örnek kütle boyutunun (n’nin) çok büyük ve beklenen bir olay›n meydana gelme olas›l›¤›n›n (p) s›f›ra çok yak›n oldu¤u nadir meydana gelen olaylarda, hesaplama SIRA S‹ZDE zorluklar› nedeniyle Binom da¤›l›m› kullan›lamaz. Bununla birlikte, belirli bir zaman aral›¤›nda, bir alanda ya da hacimde nadir rastlanan olaylar›n olas›l›k da¤›l›mlar›, Poisson D Ü fida¤›l›m› Ü N E L ‹ M ile daha kolay aç›klanabilmektedir. Örne¤in, bir y›l içinde meydana gelen trafik ve ifl kazalar›, fabrikalarda kusurlu ürün üretme, insanlar›n az rastlanan hastal›klara yakalanmas›, matbaada bas›lan kitab›n sayfalar›n bask› haS O R U talar› bulunmas› nadir rastlanan olaylard›r. Genellikle n>20 D ‹ K Kve A T p<0,10 oldu¤u durumlarda, Poisson da¤›l›m›n›n kullan›m› tercih edilmektedir. N N SIRA S‹ZDE X rassal de¤iflkeninin Poisson olas›l›k fonksiyonu, λ x .e-λ P(X =AMAÇLARIMIZ x) = x! olarak tan›mlan›r. Burada, e=2,71828, x= birim zaman içinde ilgilenilen olay saK ‹zaman T A P içinde ilgilenilen olay›n ortalama olufl say›s›d›r. y›s›, λ=birim Poisson da¤›l›m›n›n ortalamas›, E(X)= µ = λ TELEV‹ZYON TELEV‹ZYON ‹NTERNET ‹NTERNET 3. Ünite - Olas›l›k Da¤›l›m Modelleri 51 Da¤›l›m›n›n varyans› ve standart sapmas›, σ2 = λ ⇒ σ = λ Türkiye’de a¤›r ve tehlikeli ifller s›n›f›nda çal›flan iflletmelerde her y›l ortalama olarak 1000 iflçiden bir tanesi hayat›n› kaybetmektedir. 4000 iflçinin çal›flt›¤› bir iflletmede bir y›l içinde; a) Hiçbir iflçinin hayat›n› kaybetmemesi, b) 5 iflçinin hayat›n kaybetmesi, c) 2’den fazla iflçinin hayat›n kaybetmesi olas›l›klar›n› bulunuz. ÖRNEK 4 Çözüm: a) n=4000 ve p=1/1000= 0,001 oldu¤undan λ=n.p=4000.0,001=4 olur. Hiçbir iflçinin hayat›n› kaybetmemesi durumu x=0 oldu¤udan, hiçbir iflçinin hayat›n› kaybetmemesi olas›l›¤›; P(X = 0 ) = λ x .e-λ 40 .e-4 = = 0,0183 x! 0! Olarak hesaplan›r. b) ‹flletmede 5 iflçinin hayat›n› kaybetmesi (X=5) olas›l›¤›; P(X = 5 ) = λ x .e-λ 45.e-4 = = 0,1563 x! 5! c) ‹flletmede 2’den fazla iflçinin hayat›n› kaybetmesi (X>2) olas›l›¤›; P(X>2) = 1-P(X≤2) = 1-[P(X=0) + P(X=1) + P(X=2)] 41.e-4 42.e-4 = 1- 0,0183 + + = 1- [ 0,0183 + 0,0733 + 0,1465] 1! 2! = 0,7619 Bir otobüs dura¤›ndan 30 dakikada ortalama 2 belediye otobüsü geçmektedir. a) 30 dakika içerisinde 1 belediye otobüsü geçme olas›l›¤›n›, b) Bir saat içerisinde 2’den fazla otobüs geçme olas›l›¤›n› hesaplay›n›z. Çözüm: a) 30 dakikada ortalama otobüs geçme say›s› λ=2 oldu¤undan, 1 otobüs geçme olas›l›¤›; P(X = 1) = λ x .e-λ 21.e-2 = = 0, 2707 (%27, 07) x! 1! b) 30 dakikada 2 otobüs geçiyorsa, bir saatte 4 otobüs geçer. Bu durumda λ=4 olur. Bir saatte 2’den fazla otobüs geçme olas›l›¤›; P( X > 2) = 1- P( X ≤ 2) = 1- P( X = 0) + P( X = 1) + P( X = 2) 40.e-4 41.e-4 42.e-4 = 1- 0,0183 + 0, 0733 + 0,1465 = 0,7619 (%76, 19) + + 1- 0! 1! 2! ÖRNEK 5 52 Co¤rafi Bilgi Sistemleri ‹çin Temel ‹statistik SIRA S‹ZDE 2 D Ü fi Ü N E L ‹ M Bir bölge orman›nda SIRA S‹ZDEyap›lan gözlemlere göre e¤er yeni dikimler yap›lmazsa y›ll›k ormanl›k alan kayb›n›n 1000 Hektarl›k alana karfl›l›k 1 Hektar oldu¤u bilinmektedir. Toplam orman alan› 3000 Hektar oldu¤una göre, yeni dikim yap›lmad›¤› takdirde bir y›l içerisinde 2 D Ü fi Ü N E Lkayb› ‹M hektarl›k ormanl›k olas›l›¤› nedir? BAZI SÜREKL‹ OLASILIK DA⁄ILIM MODELLER‹ S O R U S O R U Co¤rafi bilgi sitemleri kapsam›nda yap›lan bilimsel araflt›rmalarda ço¤u kez karfl›lafl›lan de¤iflkenler, say›lamayacak kadar çok de¤erler alabilen de¤iflkenlerdir. SüD‹KKAT rekli de¤iflkenler olarak da tan›mlanan bu rassal de¤iflkenlerin büyük ço¤unlu¤unun frekans da¤›l›fl›, normal veya lognormal olas›l›k da¤›l›m› ad› verilen bir fonkSIRA S‹ZDE siyonla ifade edilmektedir. Bu nedenle, bu bölümde sürekli da¤›l›mlardan sadece Normal ve Lognormal da¤›l›m modellerinin hesaplanmas›n› ve bu parametrelerin uygulamada kullan›m›n› ele alaca¤›z. D‹KKAT SIRA S‹ZDE AMAÇLARIMIZ N N AMAÇLARIMIZ Normal Da¤›l›m Carl Friedrich Gauss (30 K ‹ T A P Nisan 1777 - 23 fiubat 1855), Alman kökenli matematikçi ve bilim adam›d›r. Katk›da Tbulundu¤u E L E V ‹ Z Yalanlardan ON baz›lar›; say›lar kuram›, analiz, diferansiyel geometri, jeodezi, elektrik, manyetizma, astronomi ve ‹ N T E RAntik N E Tça¤lardan beri optiktir. yaflam›fl en büyük matematikçi olarak da bilinen Gauss, 1918 y›l›nda Hannover’de yapt›¤› yüzey ölçümleri s›ras›nda, ölçüm hatalar›n›n istatistiksel da¤›l›m›n› veren (ve daha önce astronomi araflt›rmalar›nda da kulland›¤›) normal da¤›l›m fikrini kafas›nda iyice belirginlefltirmifltir (‹nternet Kaynak: http://tr.wikipedia.org/wiki/ Carl_Friedrich_Gauss) Normal da¤›l›m, parametreleri aritmetik ortalama ve standart sapma olan iki parametreli bir da¤›l›md›r. Birinci ünitede de ele ald›¤›m›z gibi, grupland›r›lm›fl serilerde aritmetik ortalama ve standart sapmay› flu flekilde hesaplayabiliriz. X = ∑ m .f i i ∑f i σ 2 ( = ) n 2 ∑ m - X .f i i i =1 n ∑ f i i =1 σ = σ 2 Sürekli de¤iflkenlerden frekans da¤›l›m› yaklafl›k olarak çan e¤risi fleklinde olan K ‹ T A P da¤›l›mlara normal da¤›l›m denilmektedir. 19. yüzy›l›n bafllar›nda C.F. Gauss isimli araflt›rmac›n›n astronomi alan›nda yapt›¤› çal›flmalar s›ras›nda gelifltirdi¤i normal da¤›l›m›n Tilk do¤ada gerçekleflen olaylar›n yorumlanmas›na büyük E L Euygulamalar›, V‹ZYON bir uyum göstermifltir. Bu nedenle, normal da¤›l›m olas›l›k fonksiyonunun flekline Gauss e¤risi de denilmektedir. Normal da¤›l›m›n yayg›n kullan›m›n›n en önemli nedeni de sürekli de¤iflkenlere uygulanabilirli¤inin yan›nda baz› kesikli de¤iflken‹ N T E Rda¤›l›fla NET lerinde normal yaklaflabilmesidir. Günlük hayat›m›zda karfl›lafl›lan birçok de¤iflken normal da¤›l›fl gösterir. Örne¤in, insanlar›n kan bas›nc› (tansiyon) ve kan›ndaki fleker miktar›n›n da¤›l›m›, ö¤rencilerin bir dersten ald›klar› notlar›n da¤›l›m›, ilkö¤retimde okuyan çocuklar›n boy ve kilolar›, bir fabrikan›n günlük üretim miktarlar› da¤›l›m›, ampul ve pillerin ömrünün da¤›l›m› genellikle normal kabul edilir. Sürekli bir X de¤iflkeninin normal da¤›l›m olas›l›k fonksiyonu afla¤›daki eflitlikte verildi¤i gibidir. fx ( x) = 1 2 σ . 2π - (x-X)2 .e 2σ 2 -∞ < x < ∞ için – Burada; x =rassal örneklenmifl de¤iflkeni, X= da¤›l›m›n ortalamas›n› ve σ = da¤›l›m›n standart sapmas›n› (σ2 = varyans›) göstermektedir. Da¤›l›m›n ortalamas› merkezi e¤ilim ölçüsünü verirken, varyans› da ortalaman›n – iki yan›ndaki yayvanl›¤›n bir ölçüsüdür. Bu nedenle, X ve σ2 parametrelerinin alaca¤› de¤erlere göre olas›l›k yo¤unluk fonksiyonunun flekli de de¤iflir. Örne¤in, fiekil 3.1 de görüldü¤ü gibi A kütlesinin ortalamas› B kütlesininkinden küçük iken, B kütlesinin varyans› da A kütlesininkinden daha küçüktür. Bu örnekte, A kütlesinin olas›l›k yo¤unluk fonksiyonunun B kütlesininkinden daha yayvan oldu¤unu söyleyebiliriz. X rassal de¤iflkeninin -∞ ve +∞ aral›¤› de¤erleri için normal da¤›l›m olas›l›k fonksiyonunun integralini ald›¤›m›zda, normal e¤ri alt›nda kalan toplam alan› 1,0 olarak bulabiliriz. ∞ P(-∞ ≤ x ≤ +∞) = ∫ f(x).dx = 1,0 -∞ 53 3. Ünite - Olas›l›k Da¤›l›m Modelleri Bu nedenle, normal frekans da¤›l›m›n›n e¤risinin (fiekil 3.2) alt›nda kalan alan olas›l›klar› verdi¤inden, e¤rinin kaplad›¤› toplam alan 1’e eflittir. fiekil 3.1 Normal da¤›l›m gösteren iki rassal de¤iflkenin olas›l›k yo¤unluk fonksiyonlar› fiekil 3.2 Frekans (f) Normal da¤›l›m frekans (çan) e¤risi De¤erler (Xi) Standart normal e¤rilerde X ekseni üzerinde, aritmetik ortalaman›n her iki yan›nda -σ ile +σ mesafeleri ile normal e¤ri aras›nda kalan alan, tüm e¤ri alan›n›n %68,3 ‘ünü kapsar (fiekil 3.3). Aritmetik ortalaman›n iki yan›nda -2σ ile +2σ noktalar› aras›nda kalan alan, tüm e¤ri alan›n›n %95,5 ‘ini kapsar. -3σ ile +3σ mesafeleri aras›nda kalan alan ise, bütün alan›n %99,7 ‘sini kapsamaktad›r (fiekil 3.3). Farkl› uygulamalar için olas›l›k da¤›l›m fonksiyonu e¤risi alt›nda kalan alanlar›n bulunabilmesi için integral al›nmas› zor oldu¤undan, normal da¤›l›m fonksiyonunun standart normal da¤›l›m fonksiyonuna dönüfltürülmesi tercih edilmektedir. 54 Co¤rafi Bilgi Sistemleri ‹çin Temel ‹statistik fiekil 3.3 Normal e¤ri alt›nda kalan alanlar›n standart sapmaya ba¤l› de¤iflimi -3σ -2σ -σ -σ +2σ +3σ Standart Normal Da¤›l›m – Normal da¤›l›m fonksiyonunda, Z= (X- X)/σ dönüfltürmesi yap›larak “standart normal da¤›l›m” elde edilebilir. Bu durumda standart normal da¤›l›m›n fonksiyonu, f(z) = 1 - .e Z2 2 2π fleklinde olup, aritmetik ortalamas› 0 ve varyans› 1’dir. Z rassal de¤iflkeninin -∞ ve +∞ aral›¤› için standart normal da¤›l›m fonksiyonunun integralini ald›¤›m›zda da, e¤ri alt›nda kalan toplam alan› 1,0 olarak bulabiliriz (fiekil 3.4.). Ayr›ca simetrik olan standart normal e¤rinin sa¤›nda kalan (-∞ ile 0 aral›¤›ndaki) ve solunda kalan (0 ile +∞ aral›¤›ndaki) yar›m alanlar da 0.5’e eflittir (fiekil 3.5). ∞ P(-∞ ≤ z ≤ +∞) = ∫ f(z).dz = 1,0 -∞ 0 P(-∞ ≤ z ≤ 0) = ∫ f(z).dz = 0,5 -∞ ∞ P(0 ≤ z ≤ +∞) = ∫ f(z).dz = 0,5 0 55 3. Ünite - Olas›l›k Da¤›l›m Modelleri fiekil 3.4 Standart normal e¤ri alt›nda kalan alan ∞ -∞ fiekil 3.5 f(z) f(z) Standart normal e¤rinin sa¤›nda ve solunda kalan alanlar 0,5 0,5 ∞ -∞ ∞ -∞ Çarp›kl›k ve Bas›kl›k Katsay›s› Normal da¤›l›m olas›l›k fonksiyonunun flekli, ortalama ve standart sapman›n alaca¤› de¤erlere göre de¤iflebilmektedir. Normal da¤›l›m fonksiyonu fleklinin sa¤a veya sola çarp›kl›¤›n› belirlemede çarp›kl›k katsay›s›, sivri veya bas›k olup olmad›¤›n›n belirlenmesinde ise bas›kl›k katsay›s› kullan›lmaktad›r. Standart normal da¤›l›m teorik olarak simetrik bir e¤riye sahiptir. Bu nedenle normal da¤›l›m›n teorik çarp›kl›k katsay›s›, α3 = 0’d›r. Sa¤a e¤ik serilerde α3 > 0 (fiekil 3.6.a) ve sola e¤ik serilerde α3 < 0’d›r (fiekil 3.6.b). Grupland›r›lm›fl serilerde da¤›l›m›n çarp›kl›k katsay›s› afla¤›daki gibi hesaplan›r. α3 = µ3 σ3 µ3 = Z’nin çeflitli de¤erlerine ait standart normal e¤ri alt›nda kalan alanlar› bulabilmek için integral alma ifllemi yapmak pratik bir ifllem olmad›¤›ndan, standart normal e¤ri alt›nda kalan alanlar istatistik kitaplar›n›n ekinde çizelgeler fleklinde sunulmaktad›r (Bu kitab›n ekindeki çizelgelere bak›n›z). ∑ fi .(m i - X)3 ∑ fi fiekil 3.6 fx(x) 3>0 (a) Sa¤a çarp›k e¤ri fx(x) 3=0 X 3=0 (b) Sola çarp›k e¤ri 3<0 X Standart normal da¤›l›mda çarp›kl›k 56 Co¤rafi Bilgi Sistemleri ‹çin Temel ‹statistik Bir serinin normal olabilmesi için hem simetrik olmas› hem de normal bir yüksekli¤e sahip olmas› gerekir. Bir serinin normal olup olmad›¤›n› ortaya koyan “bas›kl›k ölçüsü (α4)”, normal bir seride α4 = 3, sivri bir seride α4 > 3 (fiekil 3.7.a) ve bas›k bir seride α4 < 3’dür (fiekil 3.7.b). Grupland›r›lm›fl serilerde da¤›l›m›n bas›kl›k katsay›s› afla¤›daki gibi hesaplan›r. α4 = µ4 σ4 µ4 = ∑ fi .(m i - X)4 ∑ fi fiekil 3.7 Standart normal da¤›l›mda bas›kl›k fx(x) fx(x) 4>3 4=3 4=3 4 X (a) Sivri e¤ri ÖRNEK 6 3 X (a) Bas›k e¤ri Kent merkezinde bulunan bir inflaat flantiyesinde ifl makinelerinin yaratt›¤› gürültü seviyesini belirlemek amac›yla 24 ölçüm yap›lm›fl ve afla¤›daki grupland›r›lm›fl serideki frekans de¤erleri elde edilmifltir. a) Aritmetik ortalama ve standart sapmay› hesaplay›n›z. b) Da¤›l›m›n çarp›kl›k ve bas›kl›k katsay›lar›n› hesaplayarak, da¤›l›m›n fleklini yorumlay›n›z. Grup S›n›rlar› (Gürültü-dBA) Frekanslar Grup Ortalamalar› Alt Üst (den az) fi mi 0 20 4 10 20 40 8 30 40 60 6 50 60 80 4 70 80 100 2 90 Çözüm: a) Aritmetik ortalama ve standart sapmay› afla¤›daki eflitliklerle hesaplar›z. l ∑ m i .f i X= ∑ fi 2 σ = ∑ ( m i - X) 2 i=1 l .fi σ = σ2 ∑ fi i=1 ∑ mi . fi = 1040 X= ∑ fi = 24 1040 = 43,3 dBA 24 σ= ∑ ( mi - X )2 . fi = 13333, 4 13333, 4 = 23,6 dBA 24 57 3. Ünite - Olas›l›k Da¤›l›m Modelleri b) Çarp›kl›k katsay›s›n› afla¤›daki eflitlikle hesaplar›z. µ3 α3 = σ3 µ3 = ∑ fi .(m i - X)3 ∑ fi ∑ fi .( mi - X )3 = 115111,1 ∑ fi = 24 µ3 = 115111,1 = 4796, 3 24 α3 = 4796,3 (23,6)3 σ = 23,6 = 0,365 α3 = 0,365 > 0oldu¤undan, e¤ri tam simetrik da¤›l›ma göre sa¤a çarp›kt›r. Bas›kl›k katsay›s›n› da afla¤›daki eflitlikle hesaplayabiliriz. α4 = µ4 σ4 µ4 = ∑ fi .(m i - X)4 ∑ fi ∑ fi .( mi - X )4 = 16726370 µ4 = 16726370 = 696932,1 24 α4 = 696932,1 (23,6)4 = 2, 25 α4 = 2,25 < 3,0 oldu¤undan, e¤ri tam simetrik da¤›l›ma göre bas›kt›r. Bir iflyerinde çal›flan 50 personelin yafl gruplar›na göre da¤›l›m› afla¤›daki gibidir. PersoSIRA S‹ZDE nelin ortalama yafl›n› ve standart sapmas›n›, da¤›l›m›n çarp›kl›k ve bas›kl›k katsay›lar›n› hesaplayarak da¤›l›m fleklini yorumlay›n›z. 3 D Ü fi Ü N E L ‹ M Yafl Gruplar› Personel Say›s› 20-30 30-40 40-50 50-60 8 18 14 8 S O R U SIRA S‹ZDE D Ü fi Ü N E L ‹ M 60-70 2 D‹KKAT Normal Olas›l›k E¤risinin Alt›nda Kalan Alanlar›n Hesaplanmas› Belirli bir de¤iflken de¤erlerine karfl›l›k gelen normal olas›l›k e¤risinin alt›nda kaSIRA S‹ZDE lan alanlar›n hesaplanmas›nda standart normal da¤›l›m›n özelliklerinden yararlan›labilmektedir. Bunun için X de¤iflken de¤erleri öncelikle standart normal de¤ere dönüfltürülmekte ve daha sonra standart normal da¤›l›m fonksiyonu yard›m›yla AMAÇLARIMIZ integral alma ifllemi ile e¤ri alt›nda kalan alan hesaplanmaktad›r. Ancak, integral alma ifllemleri zaman al›c› olmas› ve pratik olmamas› nedenleriyle genellikle daha önceden haz›rlanm›fl çizelgelerden yararlan›lmas› tercih edilmektedir. K ‹ T A P Standart normal da¤›l›m simetrik bir da¤›l›m oldu¤u için, e¤ri alt›nda kalan toplam alan 1’e, ortalaman›n sa¤›nda ve solunda kalan yar›m alanlar da 0.5’e eflittir. Ortalaman›n solunda kalan alan ile sa¤›ndaki alan birbirine eflittir. Bu nedenle de, TELEV‹ZYON standart normal e¤ri alt›ndaki alanlar› gösteren integral çizelgeleri (Z çizelgesi) yar›m alan çizelgeleridir. Bu yüzden, ortalaman›n solunda kalan ve negatif Z de¤erlerine karfl›l›k gelen alan, Z’lerin pozitifmifl gibi düflünülmesiyle bulunabilmektedir. ‹ N T E R N E Tafla¤›da veStandart normal da¤›l›m çizelgesinin kullan›m› ile ilgili örnekler rilmifltir. N N S O R U D‹KKAT SIRA S‹ZDE AMAÇLARIMIZ K ‹ T A P TELEV‹ZYON ‹NTERNET 58 ÖRNEK 7 Co¤rafi Bilgi Sistemleri ‹çin Temel ‹statistik Bir bölgede GPS (Global Positioning System) ile yap›lan konum belirleme çal›flmalar›nda, ölçüm hatalar› ortalamas›n›n 7,8 m ve standart sapmas›n›n 2 m oldu¤u hesaplanm›flt›r. a) Ölçümlerde 5 m’den daha az hata yapma olas›l›¤› nedir? b) Ölçümlerde 10 m’den daha az hata yapma olas›l›¤› nedir? c) Ölçümlerde 10 m’den daha fazla hata yapma olas›l›¤› nedir? d) Ölçümlerde 5 m ile 10 m aras› hata yapma olas›l›¤› nedir? Çözüm: Örne¤imizde X = 7,8 m ve σ = 2,0 olarak verilmifltir. a) X=5 m için Z = ( X - X ) / σ = (5,0 - 7,8) / 2,0 = -1, 4 olarak bulunur. Ölçümlerde 5 m’de daha az hata yapma olas›l›¤› hesaplanmak istendi¤ine göre P(X<5)=P(Z<-1,4) olas›l›¤›n› bulmam›z gerekmektedir. Bu olas›l›k de¤erini Z çizelgesini kullanarak bulabiliriz. Z çizelgesinde Z=1,4 de¤erine karfl›l›k gelen de¤er A=0,419 dur. Ayn› de¤er Z=-1,4 için de geçerlidir. Afla¤›da verilen flekilden de görüldü¤ü gibi, taral› alan A=0,419 dur. Bu durumda, standart normal e¤rinin sol taraf›ndaki yar›m alan 0,5’e eflit oldu¤undan, ölçümlerde 5 m’den daha az hata yapma olas›l›¤›n›; P(X<5)=P(Z<-1,4)=0,5-0,419=0,081 olarak buluruz. f(z) b) X=10 m için Z = ( X - X ) / σ = (10,0 - 7,8) / 2,0 = 1,1 olarak bulunur. P(X<10)=P(Z<1.1) olas›l›¤›n› bulmam›z gerekmektedir. Z çizelgesinden Z=1,1 de¤erine karfl›l›k gelen A=0,364 de¤erini buluruz. Standart normal e¤rinin sol taraf›ndaki yar›m alan (=0,5) ile A alan›n› toplad›¤›m›zda, ölçümlerde 10 m’den daha az hata yapma olas›l›¤›n›; P(X<5)=P(Z<-1,4)=0,5+0,364=0,864 olarak buluruz. 0,5 0,364 0 1,1 Z 59 3. Ünite - Olas›l›k Da¤›l›m Modelleri c) X=10 m için Z=1,1 ve A=0,364 olarak bulunmufltu. P(X>10)=P(Z>1,1) olas›l›¤›n› bulmam›z gerekmektedir. Standart normal e¤rinin sa¤ taraf›ndaki yar›m alandan (=0,5) A alan›n› ç›kard›¤›m›zda, ölçümlerde 10 m’den daha fazla hata yapma olas›l›¤›n›; P(X>10)=P(Z>1,1)=0,5-0,364=0,136 olarak buluruz. f(x) 0,364 0,136 0 1,1 Z d) X1=5 m için Z1=-1,4 ve A1=0,419 X2=10 m için Z2=1,1 ve A2=0,364 olarak bulunmufltu. P(5<X<10)=P(-1,4<Z<1,1) olas›l›¤›n› bulmam›z gerekmektedir. Standart normal e¤rinin solunda kalan A1 ve sa¤›nda kalan A2 alanlar›n› toplad›¤›m›zda, ölçümlerde 5 m ile 10 m aras› hata yapma olas›l›¤›n›; P(5<X<10)=P(-1,4<Z<1,1)=0,419+0,364=0,783 olarak buluruz. f(x) 0,364 0,419 -1,4 0 1,1 Z Bir otomobil fabrikas›n›n üretti¤i ürünlere talep ortalamas› 800 adet ve S‹ZDE standart sapmas› SIRA 200 adettir. Sat›fllar›n en fazla 1000 adet olma olas›l›¤› nedir? Ü fi Ü N E L ‹ M Bir il merkezinde bulunan meteoroloji istasyonunda yap›lanDölçümlerde ilin Nisan ay› toplam ya¤›fl miktar› ortalamas›n›n 900 mm ve standart sapmas›n›n 200 S O Ren U düflük ve en mm oldu¤u hesaplanm›flt›r. %95 olas›l›kla ilin toplam ya¤›fl miktar› yüksek ne kadar olur? 4 Ü fiEÜ NKE L ‹8M Ö RD N D‹KKAT Çözüm: En düflük ve en yüksek ya¤›fl miktarlar›n› %95 olas›l›kla bulaca¤›m›za göre, öncelikle standart normal e¤ri alt›nda %95 olas›l›k de¤erine karfl›l›k gelen Z S‹ZDE bir e¤ri ve de¤erini bulmam›z gerekmektedir. Standart normal e¤ri, tamSIRA simetrik e¤rinin her iki taraf›nda kalan yar›m alanlar birbirine eflit oldu¤undan, Z çizelgesinden P=0,95/2=0,475 de¤erine karfl›l›k gelen de¤erin Z=1,96 oldu¤unu buluruz. AMAÇLARIMIZ K ‹ T A P SIRA S‹ZDE N N S O R U D‹KKAT SIRA S‹ZDE AMAÇLARIMIZ K ‹ T A P 60 Co¤rafi Bilgi Sistemleri ‹çin Temel ‹statistik En düflük ya¤›fl miktar›n› Z=-1,96 ve en büyük ya¤›fl miktar›n› Z=+1,96 de¤erlerini kullanarak bulabiliriz. Z= x- X ve x = X + ( Z .σ ) oldu¤undan σ En düflük ya¤›fl miktar›: x = X + ( Z .σ ) = 900 + (-1,96.200) = 508 mm En yüksek ya¤›fl miktar›: x = X + ( Z .σ ) = 900 + (-1,96.200) = 1292 mm olarak bulunur. Lognormal Da¤›l›m Negatif de¤erlerin logaritmas› tan›mlanmad›¤›ndan (al›namad›¤›ndan), lognormal da¤›l›m sadece rassal örneklenmifl pozitif de¤erli de¤iflkenler için kullan›labilir. Standart normal da¤›l›m›n özelliklerini, afl›r› çarp›k da¤›lm›fl rassal de¤iflkenler için kulland›¤›m›zda, çok önemli boyutlarda hatalar yapabiliriz. Bununla birlikte normal da¤›l›fl göstermeyen (çarp›k da¤›l›ml›) de¤iflkenler için baz› dönüflümler yaparak normal da¤›l›ma uydurmak mümkündür. Genellikle de çarp›k da¤›l›fl gösteren de¤iflkenlerin normallefltirilmesinde, ifllem kolayl›¤› nedeniyle e taban›na göre logaritmik dönüflüm (y=lnx) tercih edilmektedir. Rassal örneklenmifl X verilerinin do¤al logaritmalar› al›nd›¤›nda, logaritmik (lnX) de¤erlerin da¤›l›m› normal da¤›l›ma uyuyorsa, bu da¤›l›ma lognormal da¤›l›m denilmektedir. Genifl aral›klar için grupland›r›lm›fl de¤iflkenlerin da¤›l›m›, genellikle lognormal da¤›l›ma uymaktad›r. Lognormal da¤›l›m›n olas›l›k yo¤unluk e¤risi, bu da¤›l›m›n parametreleri olan logaritmik ortalama (α) ve logaritmik standart sapma (β)’n›n fonksiyonu olup, bu fonksiyon afla¤›daki eflitlikle ifade edilebilir. f x (x) = 1 x.β . 2π - (ln x - α )2 .e 2β 2 0 < x < +∞ için Burada; x=rassal örneklenmifl de¤iflkeni, x de¤iflkeninin olas›l›k yo¤unluk fonksiyonunu, α= da¤›l›m›n logaritmik ortalamas›n› ve β= da¤›l›m›n logaritmik standart sapmas›n› göstermektedir. Lognormal da¤›l›m›n parametreleri olan logaritmik ortalama ve logaritmik standart sapma iki yöntemle hesaplanabilmektedir. Bu yöntemler afla¤›da s›ra ile verilmektedir. – 1) Örnek de¤erlerinin normal aritmetik ortalamas› (X) ve standart sapmas› (σ) hesaplanarak, de¤iflkenlik katsay›s› (C ) belirlenir. C= σ X 2) De¤iflkenlik katsay›s›n›n 1,2’ye eflit ya da küçük olmas› durumunda afla¤›daki eflitlikler kullan›larak logaritmik ortalama (α) ve standart sapma (β) hesaplan›r. 1 α = lnX - β 2 2 σ2 β2 = ln + 1 X 2 β = β2 3. Ünite - Olas›l›k Da¤›l›m Modelleri 61 3) De¤iflkenlik katsay›s›n›n 1,2’den büyük olmas› durumunda, rassal örneklenmifl X de¤erlerinin logaritmik dönüflümleri (lnX) yap›larak, normal da¤›l›mda oldu¤u gibi aritmetik ortalama (α) ve standart sapma (β) hesaplan›r. Daha sonra, afla¤›daki eflitlikler kullan›larak logaritmik ortalama ve standart sapma normal de¤erlere dönüfltürülür. X=e 1 α+ β2 2 ( ) σ = X 2 . eβ - 1 2 Örnekleme de¤erlerinin do¤al logaritmalar› için yap›lan ifllemlerde normal da¤›l›m›n tüm özellikleri geçerlidir. Örne¤in, lognormal da¤›lm›fl X rassal de¤iflkeni için standart normal de¤erin bulunmas›nda; Z= LnX - α β eflitli¤i kullan›l›r. Kent merkezinde bulunan bir inflaat flantiyesinde zemin kaz›k çakma makinelerinin yaratt›¤› kesikli titreflim seviyesini belirlemek amac›yla 20 ölçüm yap›lm›fl ve afla¤›daki grupland›r›lm›fl serideki frekans de¤erleri elde edilmifltir. Da¤›l›m›n lognormal oldu¤u bilindi¤ine göre; a) Logaritmik ortalama ve standart sapmay› hesaplay›n›z. b) Kesikli titreflim seviyesinin 10 mm/s’nin üzerinde olma olas›l›¤›n› bulunuz. Grup S›n›rlar› (Titreflim:mm/s) Frekanslar Grup Ortalamalar› mi Alt Üst (den az) fi 0 3 3 1,5 3 6 9 4,5 6 9 5 7,5 9 12 2 10,5 12 15 1 13,5 Çözüm: a) Normal de¤erler için aritmetik ortalama ve standart sapmay› afla¤›daki eflitliklerle hesaplar›z. n ∑ m i .fi X= ∑ fi 2 σ = ∑ ( m i - X) 2 .fi i=1 n ∑ fi i=1 ∑ fi = 20 X= ∑ mi .fi = 117 117 = 5,85 mm / s 20 σ= ∑ ( mi - X )2 .fi = 188, 55 188,55 = 3,07 mm / s 20 Lognormal da¤›lm›fl X rassal de¤iflkeni için standart de¤erin bulunmas›nda, e¤er normal de¤erlerle hesaplanm›fl ortalama ve standart sapma kullan›l›rsa, bu standart normal de¤erle yap›lacak olas›l›k tahminleri önemli derecede hata içerir. ÖRNEK 9 62 Co¤rafi Bilgi Sistemleri ‹çin Temel ‹statistik σ 3,07 = 0,525 < 1, 2 oldu¤undan, seri de¤erleriX 5,85 nin logaritmalar›n› almaya gerek olmadan logaritmik ortalama ve standart sapma- De¤iflkenlik katsay›s› C = = y› afla¤›daki eflitliklerle hesaplayabiliriz. σ2 1 α = lnX - β2 β2 = ln + 1 β = β2 X 2 2 β 2 = ln( 3,07 2 5,852 + 1) = 0, 2433 β = 0, 4933 ln(mm / s) 1 α = ln(5,85) - ( .0, 2433) = 1,6447 ln (mm / s) 2 b) X= 10 mm/s α= 1,6447 ln(mm/s) Z= β= 0,4933 ln(mm/s) lnX - a Ln(10) -1,6447 = = 1,33 β 0, 4933 Z çizelgesinden Z=1,33 de¤erine karfl›l›k gelen alan A=0,408 Kesikli titreflim seviyesinin 10 mm/s’nin üzerinde olma olas›l›¤›; P(Z>1,33)=0,5-0,408=0,092 (%9,2) dir. E¤er da¤›l›m›n lognormal oldu¤unu göz önüne almadan kesikli titreflim seviyesinin 10 mm/s’nin üzerinde olma olas›l›¤›n› hesaplarsak; Z= X - X 10 - 5,85 = = 1,35 ve A=0,411 oldu¤undan, σ 3,07 P(Z>1,35)=0,5-0,411=0,089 (%8,9) olarak buluruz. Görüldü¤ü gibi, lognormal da¤›lma sahip rassal de¤iflkenler için bu da¤›l›fl› göz ard› edersek hatal› de¤erlendirme yapmam›z söz konusu olmaktad›r. Özellikle, afl›r› çarp›k da¤›l›mlarda, bu hata oran› daha da artabilmektedir. SIRA S‹ZDE D Ü fi Ü N E L ‹ M S O R U D‹KKAT SIRA S‹ZDE AMAÇLARIMIZ 5 Bir küçük sanayi bölgesinde bulunan 200 ifl yerinde yap›lan gürültü ölçümleri sonucu yaSIRA S‹ZDE p›lan grupland›rmada afla¤›daki veriler elde edilmifltir. Da¤›l›m›n lognormal oldu¤unu varsayarak logaritmik aritmetik ortalamay› ve standart sapmay› hesaplay›p, s›n›r de¤er D Üüzerinde fi Ü N E L ‹ M kaç ifl yerinin çal›flt›¤›n› bulunuz. olan 70 dB’in Gürültü (dB) S O R U 0-40 ‹flyeri Say›s› D ‹ K K35 AT N N SIRA S‹ZDE AMAÇLARIMIZ K ‹ T A P K ‹ T A P TELEV‹ZYON TELEV‹ZYON ‹NTERNET ‹NTERNET 40-80 80-120 120-160 160-200 200-240 120 20 15 8 2 3. Ünite - Olas›l›k Da¤›l›m Modelleri 63 Özet N A M A Ç 1 N A M A Ç 2 Kesikli ve sürekli rassal de¤iflken kavram›n› ö¤renerek verilere uygun da¤›l›m modelini seçmek. Rassal örneklenen veriler kesintisiz bir flekilde s›ralanabiliyor ve bir aral›ktaki bütün de¤erleri alabiliyorsa, bu de¤iflkenlere sürekli de¤iflkenler denilmektedir. Rassal örneklenen bir de¤iflken sadece belirli say›da de¤erler alabiliyor ve yaln›zca say›labilir say›da de¤erler al›yorsa da, bu de¤iflkenlere kesikli de¤iflken denilmektedir. Kesikli de¤iflkenler için belirli de¤erlerin noktasal olarak gerçekleflme olas›l›klar› hesaplanabilirken, sürekli rassal de¤iflkenler de ise belirli aral›klardaki de¤erler için gerçekleflme olas›l›klar› hesaplanabilmektedir. Kesikli rassal de¤iflkenlerin da¤›l›m modellerinin (Binom ve Poission) parametrelerini hesaplay›p, spesifik uygulamalarda da¤›l›m parametrelerini kullanmak. Bir ana kütlede sonucun baflar›l› olma olas›l›¤› p ve baflar›s›z olma olas›l›¤› q=1-p ise, bu ana kütleden çekilecek n adet örnek kütle içerisinden rassal ve iadeli olarak x adet birim çekildi¤inde, x adet birimin de baflar›l› gelme olas›l›¤› Binom aç›l›m› ile hesaplanabilmektedir. Binom da¤›l›m› eflitli¤i ile belirli bir baflar› say›s›na karfl›l›k gelen olas›l›k de¤eri bulunabildi¤i gibi, belirli bir aral›¤a düflen baflar› say›s›n›n olas›l›¤›n› da, bütün baflar› say›lar› olas›l›klar›n›n toplam› ile bulmak mümkün olabilmektedir. Örnek kütle boyutunun (n’nin) çok büyük ve beklenen bir olay›n meydana gelme olas›l›¤›n›n (p) s›f›ra çok yak›n oldu¤u nadir meydana gelen olaylarda ise, Poisson da¤›l›m› daha kolay kullan›labilmektedir. Genellikle n>20 ve p<0,10 oldu¤u durumlarda, Poisson da¤›l›m›n›n kullan›m› tercih edilmektedir. N A M A Ç 3 Sürekli rassal de¤iflkenlerin da¤›l›m modellerinin (Normal ve Lognormal) parametrelerini hesaplay›p, spesifik uygulamalarda da¤›l›m parametrelerini kullanmak. Sürekli de¤iflkenlerden frekans da¤›l›m› yaklafl›k olarak çan e¤risi fleklinde olan da¤›l›mlara normal da¤›l›m denilmektedir. Normal da¤›l›m iki parametreli bir da¤›l›m olup, da¤›l›m›n ortalamas› merkezi e¤ilim ölçüsünü verirken, varyans› da da¤›l›m›n yayvanl›¤›n›n bir ölçüsüdür. Normal frekans da¤›l›m e¤risinin kaplad›¤› toplam alan 1’e eflittir. – Normal da¤›l›m fonksiyonunda, Z= (X- X)/σ dönüfltürmesi yap›ld›¤›nda, aritmetik ortalamas› 0 ve varyans› 1 olan “standart normal da¤›l›m” elde edilebilmektedir. Belirli bir de¤iflken de¤erlerine karfl›l›k gelen normal olas›l›k e¤risinin alt›nda kalan alanlar›n hesaplanmas›nda standart normal da¤›l›m çizelgelerinden yararlan›labilmektedir. Normal da¤›l›m fonksiyonu fleklini aç›klamada çarp›kl›k katsay›s› ve bas›kl›k katsay›s› kullan›lmaktad›r. Tam simetrik normal da¤›l›m›n teorik çarp›kl›k katsay›s›, α3 = 0 olup, sa¤a e¤ik serilerde α3 > 0 ve sola e¤ik serilerde α3 < 0’d›r. Tam simetrik normal da¤›l›mda bas›kl›k katsay›s› α4 = 3 olup, sivri bir e¤ride α4 > 3 ve bas›k bir e¤ride α4 < 3’dür. Rassal örneklenmifl X verilerinin do¤al logaritmalar› al›nd›¤›nda, logaritmik (lnX) de¤erlerin da¤›l›m› normal da¤›l›ma uyuyorsa, bu da¤›l›ma lognormal da¤›l›m denilmektedir. Genifl aral›klar için grupland›r›lm›fl de¤iflkenlerin da¤›l›m›, genellikle lognormal da¤›l›ma uymaktad›r. Lognormal da¤›l›m›n parametreleri logaritmik ortalama (α) ve logaritmik standart sapma (β) d›r. Lognormal da¤›lm›fl X rassal de¤iflkeni için standart normal de¤erin bulunmas›nda Z= (LnX - α)/β eflitli¤i kullan›l›r. 64 Co¤rafi Bilgi Sistemleri ‹çin Temel ‹statistik Kendimizi S›nayal›m 1. 6! – 6. X, normal da¤›lm›fl sürekli bir de¤iflken, X = 16 ve σ = 4 oldu¤una göre, P(12<X<20) olas›l›¤› kaçt›r? a. 0,9500 b. 0,6826 c. 0,4750 d. 0,3413 e. 0,1707 iflleminin sonucu kaçt›r? 4!.(6 - 4)! a. 3 b. 5 c. 15 d. 20 e. 30 2. Bir hastanede yap›lan kalp ameliyatlar›nda hastan›n yaflama ihtimalinin %80 oldu¤u bilinmektedir. Hastanede bir günde 4 kalp hastas› ameliyat edildi¤ine göre, yaln›z 2 hastan›n yaflama ihtimali kaçt›r? a. 0,0013 b. 0,0256 c. 0,1536 d. 0,4096 e. 1,0000 3. Afla¤›daki çizelgede kusurlu ürün üretme say›lar› ve olas›l›klar› verilmifltir. x 0 1 2 3 4 P(X=x) 0,32 0,42 0,21 0,04 0,01 Bu çizelgeye göre, seçilecek bir ürünün kusurlu olmama olas›l›¤› kaçt›r? a. 0,42 b. 0,32 c. 0,21 d. 0,04 e. 0,01 4. Bir iflletmede çal›flan iflçilerin bir y›l içerisinde ifl kazas› geçirme olas›l›¤› %0,2 (p=0,002) dir. ‹flletmede 2000 iflçi çal›flt›¤›na göre (λ=4), bir y›l içinde 1 ifl kazas› olma olas›l›¤› kaçt›r? (e-4=0,018) a. 0,002 b. 0,004 c. 0,018 d. 0,072 e. 0,100 5. Normal da¤›l›ma sahip grupland›r›lm›fl bir serinin sola çarp›k oldu¤u belirlenmifltir. Buna göre, bu serinin çarp›kl›k katsay›s› (α3) afla¤›dakilerden hangisi olabilir? a. -0,4 b. 0 c. 0,4 d. 1 e. 2 7. X, n = 67 ve p = 0,40 olmak üzere binom da¤›lm›fl bir rassal de¤iflkendir. Buna göre, X’in standart sapmas› kaçt›r? a. 3 b. 3,42 c. 3,76 d. 4,01 e. 4,88 8. Standart sapmas› 6 olan bir normal da¤›l›mda, X=24 de¤eri Z=-2 standart de¤erine dönüflüyorsa aritmetik ortalamas› kaçt›r? a. 6 b. 6,9 c. 12,8 d. 16 e. 36 9. X, ortalamas› 20 ve standart sapmas› 5 olan bir normal da¤›l›m göstermektedir. Buna göre, X=22,5 de¤eri hangi standart Z de¤erine dönüflür? a. -1 b. -0,5 c. 0,5 d. 1 e. 1,5 10. X, ortalamas› 6 ve standart sapmas› 4 olan bir lognormal da¤›l›m göstermektedir. Buna göre, da¤›l›m›n logaritmik varyans› kaçt›r? a. 1,603 b. 0,967 c. 0,846 d. 0,607 e. 0,368 65 3. Ünite - Olas›l›k Da¤›l›m Modelleri Kendimizi S›nayal›m Yan›t Anahtar› 1. a 2. c 3. b 4. d 5. a 6. b 7. d 8. e 9. c 10. e Yan›t›n›z yanl›fl ise, “Binom Da¤›l›m›” konusuna bak›n›z. Yan›t›n›z yanl›fl ise, “Binom Da¤›l›m›” konusuna bak›n›z. Yan›t›n›z yanl›fl ise, “Binom Da¤›l›m›” konusuna bak›n›z. Yan›t›n›z yanl›fl ise, “Poission Da¤›l›m›” konusuna bak›n›z. Yan›t›n›z yanl›fl ise, “Normal Da¤›l›m” konusuna bak›n›z. Yan›t›n›z yanl›fl ise, “Normal Da¤›l›m” konusuna bak›n›z. Yan›t›n›z yanl›fl ise, “Binom Da¤›l›m›” konusuna bak›n›z. Yan›t›n›z yanl›fl ise, “Normal Da¤›l›m” konusuna bak›n›z. Yan›t›n›z yanl›fl ise, “Normal Da¤›l›m” konusuna bak›n›z Yan›t›n›z yanl›fl ise, “Lognormal Da¤›l›m” konusuna bak›n›z S›ra Sizde Yan›t Anahtar› S›ra Sizde 1 Ürün sat›n alma olas›l›¤› : p= 0,2 (%20) Ürün sat›n almama olas›l›¤› : q= 1- p = 1- 0,2 = 0,8 (%80) Örnek kütle say›s› : n= 6 Müflterinin 2’sinin (x=2) ürün sat›n alma olas›l›¤›; P(X = x) = P(X = 2) = n! x!( n - x )! 6! 2!.(6 - 2)! x! Frekanslar Grup Ortalamalar› Alt Üst (den az) fi mi 20 30 8 25 30 40 18 35 40 50 14 45 50 60 8 55 60 70 2 65 2 ∑ mi .fi = 2030 ∑ fi = 50 ∑ ( mi - X ) . fi = 5632 X = 2030 50 = 40, 6 σ= 5632 50 = 10, 6 3 ∑ fi .( mi - X ) = 20601, 6 µ3 = 20601, 6 50 = 412 α3 = 412 (10, 6) 3 = 0, 356 α3=0,356>0 oldu¤undan, e¤ri sa¤a çarp›kt›r. 4 ∑ fi .( mi − X ) =1549635 1549635 30992, 7 = 2, 455 4 (10, 6 ) µ4 = 2 6-2 .0, 2 .0,8 = 0, 2458 α4 = 2,455<3,0 oldu¤undan, e¤ri bas›kt›r. 2 Hektarl›k (x=2) ormanl›k alan kayb› olasl›¤›; λ x .e−λ Grup S›n›rlar›(Yafl) p x q n- x S›ra Sizde 2 Bir y›lda ormanl›k alan kayb› 1000 Hektar’da 1 Hektar (p=1/1000=0,001) d›r. P<0,1 oldu¤undan, bu soruyu poisson da¤›l›m› yard›m›yla çözebiliriz. n=3000 Hektar ve p=0,001 oldu¤una göre λ= 3000.0,001=3 dür. P( X = 2) = S›ra Sizde 3 = 32.e−3 2! = 0, 224(%22, 4 ) 50 = 30992, 7 α4 = S›ra Sizde 4 – X=800 adet ve σ=200 adet . X=1000 adet için Z = ( X - X ) / σ = (1000 - 800) / 200 = 1, 0 olarak bulunur. P(X≤1000)=P(Z≤1,0) = 0,5 + 0,3413 = 0,8413 66 Co¤rafi Bilgi Sistemleri ‹çin Temel ‹statistik Yararlan›lan Kaynaklar S›ra Sizde 5 Grup S›n›rlar› Frekanslar (Gürültü-dB) Grup Ortalamalar› Alt Üst (den az) fi mi 0 40 35 20 40 80 120 60 80 120 20 100 120 160 15 140 160 200 8 180 200 240 2 220 2 ∑ fi = 200 ∑ mi .fi = 13880 ∑ ( mi - X ) . fi = 332728 X = C= 138880 200 σ = X α = lnX - β 2 = ln( = 69, 4 dB σ = 40,8 69, 4 332728 200 = 40,8 dB = 0,59 < 1, 2 σ2 1 2 2 β β = ln + 1 β = β 2 X 2 2 40,82 + 1) = 0, 2969 β = 0,545 ln(dB) 2 69, 4 1 α = ln(69, 4) - ( .0, 2969) = 4, 091 2 X = 70 dB Z= lnX - α β = Ln(70) - 4, 091 0,545 = 0, 29 Z çizelgesinden Z=0,29 de¤erine karfl›l›k gelen alan A=0,1141 Gürültü seviyesinin 70 dB’nin üzerinde olma olas›l›¤›; P(Z>0,29)=0,5-0,1141=0,3859 dir. ‹flyeri say›s› = 200 x 0,3859 = 77 Cula, S. & Muluk, Z. (2006). Temel ‹statistik Yöntemleri. Ankara: Baflkent Üniversitesi. Gürsakal, N. (2001). Bilgisayar Uygulamal› ‹statistik I. No:1029. ‹stanbul: Alfa. Konuk, A. & Önder, S. (1999). Maden ‹statisti¤i. Mühendislik Mimarl›k Fakültesi Maden Mühendisli¤i Bölümü. Eskiflehir: Eskiflehir Osmangazi Üniversitesi. Newbold, P. (2005). ‹flletme ve ‹ktisat ‹çin ‹statsitik. Ümit fienesen (Çev.). ‹stanbul: Literatür. Orhunbilge, N. (2000). Tan›msal ‹statistik Olas›l›k ve Olas›l›k Da¤›l›mlar›. ‹flletme Fakültesi Yay›n No: 279. ‹stanbul: ‹stanbul Üniversitesi. Ünver, Ö. & Gamgam, H. (2006). Uygulamal› Temel ‹statistik Yöntemler. Ankara: Seçkin. CO⁄RAF‹ B‹LG‹ S‹STEMLER‹ ‹Ç‹N TEMEL ‹STAT‹ST‹K 4 Amaçlar›m›z N N N N Bu üniteyi tamamlad›ktan sonra; Nokta ve güven aral›¤› tahmini aras›ndaki fark› belirleyebilecek, Ana kütle ortalamas› ve oran› için güven aral›¤›n› tahmin edebilecek, ‹ki ana kütle ortalamas› ve oran› aras›ndaki farklar›n güven aral›¤›n› tahmin edebilecek, Ana kütle varyans› için güven aral›¤›n› tahmin edebilecek bilgi ve becerilere sahip olacaks›n›z. Anahtar Kavramlar • • • • • • Güven Aral›¤› Büyük Örnekleme Küçük Örnekleme Z Da¤›l›fl› Student t da¤›l›fl› Khi-kare da¤›l›fl› • • • • • • Ortalamalar›n Güven Aral›¤› Oranlar›n Güven Aral›¤› Varyans›n Güven Aral›¤› Farklar›n Güven Aral›¤› Nokta Tahmini Standart Hata ‹çindekiler Co¤rafi Bilgi Sistemleri ‹çin Temel ‹statistik Güven Aral›¤› Tahminleri • ‹STAT‹ST‹KTE TAHM‹NLEME • ANA KÜTLE ORTALAMASI ‹Ç‹N GÜVEN ARALI⁄I • ANA KÜTLE ORANI ‹Ç‹N GÜVEN ARALI⁄I • ‹K‹ ANA KÜTLE ORTALAMASI ARASINDAK‹ FARKIN GÜVEN ARALI⁄I • ‹K‹ ANA KÜTLE ORANI ARASINDAK‹ FARKIN GÜVEN ARALI⁄I • VARYANS ‹Ç‹N GÜVEN ARALI⁄I Güven Aral›¤› Tahminleri ‹STAT‹ST‹KTE TAHM‹NLEME Araflt›rma çal›flmalar›nda, araflt›rma maliyetlerini azaltmak ve zaman› etkin kullanabilmek amac›yla, örneklemelerle elde edilen verilerle ana kütle hakk›nda bilgiler edinmeye, tahminlerde bulunmaya veya karar vermeye u¤rafl›r›z. Örneklenen verilerin da¤›l›m parametrelerini hesaplay›p da¤›l›m fleklini belirledikten sonra, ana kütle parametrelerini tahmin etmeye ve tahminlerin güvenilirli¤i konusunda karar vermeye çal›fl›r›z. Örneklemenin amac› ana kütle hakk›nda tahminleme yapmakt›r. Taminleme, ana kütleden al›nan örnek veriler yard›m›yla ana kütlenin bir veya birkaç parametresini araflt›rmakt›r. Tahmin edilen parametre, ana kütlenin bilinmeyen ortalamas›, varyans› veya oran› olabilir. Tahminleme ile ana kütlenin tamam›n›n örneklenmesini (tam say›m›n›) gerektiren ifllemlere gerek olmaks›z›n ana kütle hakk›nda yorumlamalar yapabiliriz. ‹statistikte tahminleme nokta veya aral›k tahmini olmak üzere iki yöntemle yap›labilmektedir. Nokta tahmini, ana kütle parametrelerinin bilinmedi¤i hallerde örneklerden elde edilmifl verilerle tek bir tahmin yapmakt›r. Aral›k tahmini ise, ana kütleye ait herhangi bir bilinmeyen parametrenin, belirli bir hata pay› ile alt ve üst s›n›r de¤erleri verilerek tahmin edilmesidir. Nokta Tahmini Tek bir örnekleme ile hesaplanan parametreler yard›m›yla ana kütle parametrelerini noktasal olarak tahmin etmek, tek bir at›flta hedefe tam isabet ettirmek gibidir. Örne¤in, bir kent merkezi için Ocak ay›n›n 15’inci günün 30 y›ll›k ya¤an kar kal›nl›¤› verilerini ele alarak ortalama kal›nl›¤› 15 cm buldu¤umuz durumda, noktasal tahmin yaparsak, Ocak ay› 15’inci günü kar kal›nl›¤›n› 15 cm olarak genellememiz gerekir. Böyle bir noktasal tahminin sonucuna ne kadar güvenebilece¤imiz belirsizdir. Nokta tahminlerinin güvenilir sonuçlar verebilmesi için afla¤›da verilen baz› özelliklere sahip olmas› gerekir. a) Sapmas›zl›k: Ana kütleden çekilecek örnek kütlelerin parametrelerinin beklenen de¤erinin ana kütle parametresine eflit olmas›na sapmas›zl›k denilir. Örne¤in, N birimlik ana kütleden her seferinde tekrarl› olarak n’er birimlik – m adet örnekleme yap›p, her seferinde aritmetik ortalamay› (X) belirleyerek ortalamalar›n da¤›l›m›n›n beklenen de¤erini hesaplad›¤›m›zda, beklenen de¤erin ana kütle aritmetik ortalamas›na eflit olmas› gerekir. 70 Co¤rafi Bilgi Sistemleri ‹çin Temel ‹statistik – E (X ) = µ Ancak böyle bir durumda, ortalamalar›n da¤›l›m›n›n standart sapmas›n›n (standart hatan›n) s›f›r olmas› gerekir. Standart hatan›n s›f›rdan büyük oldu¤u durumlarda (ço¤unlukla böyle olur), tahminin sapmas›z veya yans›z oldu¤unu söylemek mümkün de¤ildir. b) Tutarl›l›k: Nokta tahmin hatas›n›n s›f›r olmas› durumuna tutarl›l›k denilir. Böyle bir durum ise, örnek kütle boyutunun ana kütle boyutuna yaklaflmas› ve hatta tam say›m yap›lmas› demektir. c) Etkinlik: Ana kütle parametrelerinin tahmininde, da¤›l›m standart sapmas› en küçük olan örnekleme parametresi kullan›ld›¤›nda, daha etkin bir tahmin yap›lmas›na etkinlik denilir. Bu durumda, etkinli¤i artt›rmak için ana kütleden tekrarl› örneklemeler yap›p, standart sapmas› en küçük olan› belirlemeye çal›flmak gerekir. d) Yeterlilik: Örnek kütledeki bilgilerin tamam›n› ele alan parametrelerin kullan›lmas›yla yap›lacak tahminler yeterli, kullanm›yorsa yetersiz kabul edilmektedir. Örne¤in, ana kütle aritmetik ortalamas›n›n tahmininde, örnek kütle verilerinin ele al›nmas›yla hesaplanan aritmetik ortalaman›n kullan›lmas› yeterlidir, ancak en çok tekrarlanan frekanslar› dikkate alarak hesaplanan mod ile yap›lacak tahmin yeterli de¤ildir. Bir ana kütleden çekilmifl örnek kütle ile yap›lacak nokta tahminlerinin sapmas›z, tutarl› ve etkin olmas›n› beklemek mümkün de¤ildir. Bu arada, nokta tahminlerin hata pay›n› belirlemek ve güvenilir tahminler yapmak da mümkün olamamaktad›r. Bu nedenle, bu ünitede ana kütle ortalamas›, oranlar› ve varyanslar› ile iki ayr› ana kütle ortalamalar› aras› farklar›n aral›k tahmini konusu genifl bir flekilde örneklerle ele al›nacakt›r. Tahminlerin güvenilirli¤inin belirlenmesinde uygulanan hipotez testi konusu ise 5. ünitede ele al›nacakt›r. Güven Aral›¤› ve S›n›rlar› Bilinmeyen bir ana kütle parametresi, bu ana kütleden elde edilen örnek kütle bilgisine dayanarak belirli bir aral›k dahilinde tahmin edilebilir. Bilinmeyen ana kütle parametresinin θ, alt güven s›n›r›n›n A ve üst güven s›n›r›n›n B oldu¤u durumda, θ parametresi belirli bir güven seviyesi (1 - α) için A ve B aral›¤›nda tahmin edilebilir. P( A < θ < B ) = 1 − α Burada α : güven efli¤i olup, 0 ile 1 aras›nda herhangi bir say›, (1- α): güven aral›¤› için belirlenen güven seviyesidir. Örne¤in, belirli bir örnek kütle verileriyle %90 güvenilirlikle (1 - α = 0,90) alt güven s›n›r› a’y› ve üst güven s›n›r› b’yi belirledi¤imizde, a ile b aral›¤›, bilinmeyen parametresinin güven aral›¤› olur. Normal da¤›l›ma sahip örnek kütleler için ana kütle güven aral›¤› gösterimi fiekil 4.1’de verildi¤i gibidir. 71 4. Ünite - Güven Aral›¤› Tahminleri fiekil 4.1 Normal da¤›l›m için güven aral›¤› ve s›n›rlar› 1−α α/2 α/2 a Θ b Güven aral›¤›n›n s›n›rlar›, ana kütleden al›nacak n birimlik her örnek kütle için de¤iflebilir. Ancak, bulunacak her güven aral›¤› s›n›rlar› içerisinde (1- α) olas›l›kla ana kütle parametresinin (θ) bulunmas› mümkündür. Bununla birlikte, belirli bir α olas›l›¤›yla da ana kütle parametresinin (θ) güven aral›¤› s›n›rlar› içerisinde bulunmamas› mümkündür. Güven aral›¤› ne kadar dar olursa, tahmin ana kütle parametresine o kadar yak›n olur. Güven aral›¤›n›n daralmas›, örnek kütle için hesaplanacak standart hatan›n küçük olmas›na veya güven seviyesinin küçük seçilmesine ba¤l›d›r. Standart hatay› küçültmek için mümkün oldu¤unca örnek kütle boyutunu büyük seçmek gerekir. ANA KÜTLE ORTALAMASI ‹Ç‹N GÜVEN ARALI⁄I Ana kütleden yap›lacak n bireylik örnekleme ile hesaplanacak örnek kütle aritmetik ortalamas›n› kullanarak, ana kütle ortalamas›n› belirli güven s›n›rlar› içerisinde tahmin edebiliriz. Bu durumda, ana kütle ortalamas› alt ve üst güven s›n›rlar› içerisinde yer alacakt›r. Bilinmeyen ana kütle ortalamas›n›n güven aral›¤›n›n belirlenmesi, ana kütle varyans›n›n bilinmesi veya bilinmemesi durumlar› için iki farkl› flekilde yap›lmaktad›r. Burada, ana kütle ortalamas›n›n bilinmedi¤i bir durumda varyans›n nas›l bilinebilece¤i sorusu ak›la gelmektedir. Asl›nda, ana kütle ortalamas›n›n bilinmedi¤i bir durumda varyans›n bilinmesi bir varsay›md›r. Genellikle büyük örnek kütleleri-büyük örneklemeler (n ≥ 30) için hesaplanan varyans›n (S2), ana kütle varyans›na (σ2) eflit olaca¤› (S2 = σ2) varsay›lmaktad›r. Ancak, küçük örnek kütleleri-küçük örneklemeler (n < 30) için S2 ≠ σ2 oldu¤u kabul edildi¤inden, ana kütle varyans›n›n bilinmedi¤i varsay›l›r. Ortalamas› µ ve varyans› σ2 bilinmeyen bir ana kütleden her seferinde n birey içerecek flekilde örneklemeler yaparak, her örnek kütlenin aritmetik ortalamas›n› hesapland›¤›m›zda ve ortalamalar›n da¤›l›m›n› araflt›r›ld›¤›m›zda, büyük örneklemelerde (n ≥ 30) da¤›l›fl›n normal da¤›l›ma ve küçük örneklemelerde (n < 30) ise da¤›l›fl›n normal da¤›l›mdan daha yayvan olan Student t da¤›l›m›na uydu¤unu görürüz. Bu nedenle, ana kütle ortalamas› için güven aral›¤› tahmininde, varyans›n bilindi¤i varsay›lan büyük örneklemeler için normal da¤›l›m›n özelliklerinden ve varyans›n bilinmedi¤i küçük örneklemeler için Student t da¤›l›m›n›n özelliklerinden yararlanaca¤›z. Uygulamada birçok araflt›rmac› güven seviyesi olarak %99 veya %95 tercihinde bulunmaktad›r. Güven seviyesi %99’dan %95’e düfltü¤ünde, güven aral›¤› daral›r. Özer Serper Uygulamal› ‹statistik II adl› kitab›nda bu seçimin arkas›nda herhangi bir teori veya mant›k aramamak gerekti¤ini ve tercihin al›flkanl›klardan kaynakland›¤›n› belirtmektedir(Özer Serper, Ezgi Kitabevi, Bursa, 2000, s.36) Ortalamas› µ olan normal da¤›lm›fl bir ana kütleden elde edilmifl n<30 bireyli – örnek kütlenin ortalamas› X ve standart sapmas› S iken hesaplanacak; t= X −µ S/ n rassal de¤iflkeni, v=n-1 serbestlik derecesi ile Student t da¤›l›m›na uyar. Standart normal da¤›l›mda (Z da¤›l›m›) oldu¤u gibi, Student t da¤›l›m›n›n da ortalamas› 0 ve standart sapmas› 1’dir. Ancak, Student t da¤›l›m›n›n olas›l›k yo¤unluk fonksiyonu, standart normal da¤›l›mdan daha yayvand›r. ‹adesiz yap›lan küçük örneklemelerde, ilk yap›lan örneklemelerden sonra sona kalan örne¤in serbest olamayaca¤› kabul edilerek, serbestlik derecesi v=n-1 al›n›r. 72 Co¤rafi Bilgi Sistemleri ‹çin Temel ‹statistik Ortalaman›n Standart Hatas› Ortalamas› µ ve varyans› σ2 olan bir ana kütleden her seferinde n birey içerecek flekilde yap›lan büyük örneklemelerde, örnek kütlelerin aritmetik ortalamalar› da¤›l›m›n›n standart sapmas› hesapland›¤›nda bulunan de¤ere standart hata denir. Ana kütle aritmetik ortalamalar›n›n standart hatas›; σX = σ . n N -n N -1 Olup, burada, N= ana kütle toplam birey say›s›, n= örnek kütlelerin birey say›s› ve σ = ana kütle standart sapmas›d›r. Genellikle N, n’den çok büyük oldu¤u için yaklafl›k olarak; N-n ≅1 N-1 olur. Bu durumda eflitli¤i; Standart hata (σ x σX = σ n veya S ) örnek x kütle boyutundan oldukça fazla etkilenmektedir. n – büyüdükçe, X n›n tahminlenmek istenen ana kütle ortalamas›na yaklaflmas› beklendi¤inden, standart hata küçülmektedir. fleklinde yaz›labilir. Küçük örneklemelerde (n < 30) S2 ≠ σ2 oldu¤undan, standart hata; S = x S n eflitli¤i ile hesaplan›r. Ana kütle aritmetik ortalamalar›n›n standart hatas› (σ x veya S x ) ana kütle de¤iflkenli¤inin göstergesi olan ana kütle/örnek kütle standart sapmas›na ve örnek kütlenin büyüklü¤üne (n) ba¤l›d›r. Standart hata, ana kütle/örnek kütle standart sapmas› ile do¤ru orant›l› iken örnek kütle büyüklü¤ü ile ters orant›l›d›r. Standart sapma artarken standart hata büyür, azal›rken de standart hata küçülür. Buna karfl›l›k, örnek say›s› küçüldükçe standart hata büyürken, örnek say›s› büyüdükçe standart hata küçülür. Standart hatay› küçültebilmenin tek yolu örnek say›s›n› artt›rmakt›r. Bununla birlikte, standart hata eflitli¤inin paydas›nda örnek büyüklü¤ü n ile de¤iflti¤inden, örnek büyüklü¤ünü artt›rman›n etkisi de az olmaktad›r. Bunun için, örnek büyüklü¤ü hakk›nda karar verirken, gerçe¤e yak›n tahminlerin sa¤layaca¤› faydalar ile çok say›da örnek alman›n gerektirdi¤i maliyetlerin dikkatli analiz edilmesi gerekmektedir. Büyük Örneklemelerde Ana Kütle Ortalamas›n›n Güven Aral›¤› Büyük örneklemelerde (n ≥ 30) ana kütle aritmetik ortalamas›n›n (µ) güven aral›– ¤›n›, örnek kütle aritmetik ortalamas› (X) ve standart hata ( σ x) yard›m›yla belirli bir (1 - α) güven seviyesi için afla¤›daki eflitlikle hesaplayabiliriz. X ∓ Zα / 2 . σ n 4. Ünite - Güven Aral›¤› Tahminleri 73 Bu eflitlikten de, ana kütle ortalamas›n› alt güven s›n›r› (AGS) ve üst güven s›n›r›n› (ÜGS) afla¤›daki eflitliklerle hesaplayabiliriz. σ AGS = X − Zα / 2 . ÜGS = X + Zα / 2 . n σ n Burada, Zα/2 de¤eri, standart normal olas›l›k da¤›l›m›ndaki P(Z > Zα/2) = α / 2 koflulunu sa¤layan Z de¤eridir. Güven seviyesi (1 - α) için güven aral›¤›n› belirlerken, standart normal da¤›l›m›n her iki ucunda kalan α / 2 kadarl›k k›s›mlar› güven s›n›rlar› d›fl›nda b›rak›lmaktad›r. Belirli bir (1 - α) güven seviyesi için standart normal da¤›l›m (Z) çizelgesinden bulabilmek için öncelikle α / 2 de¤erini belirleriz. Daha sonra, P(Z > Zα/2) = α / 2 olas›l›¤›na karfl›l›k gelen Zα/2 de¤erini Z çizelgesinden belirleriz. %95 güven seviyesi için (1 - α) = 0,95, α = 0,05 ve α / 2 =0,025 oldu¤una göre, ÖRNEK 1 P(Z > Zα/2) = 0,025 olas›l›¤›na karfl›l›k gelen Zα/2 = Z0,025 = 1,96’d›r. %90 güven seviyesi için (1 - α) = 0,90, α = 0,10 ve α / 2 = 0,05 oldu¤una göre, P(Z > Zα/2) = 0,05 olas›l›¤›na karfl›l›k gelen Zα/2 = Z0,05 = 1,645’dir. Katsay› Zα/2 AGS 0,90 1,645 – X - 1,645. σ 0,95 0,99 1,960 2,575 – X - 1,960. σ – X - 2,575. σ ÜGS x x x – X + 1,645. σ – X + 1,960. σ – X + 2,575. σ x x x Bir araç bak›m servisinde müflteri memnuniyetini belirlemek amac›yla yap›lan ankette, rassal olarak örneklenen 54 müflteriden, “Servis hizmetinde yap›lan bak›m-onar›mlar hakk›nda tam ve eksiksiz bilgi verildi” görüflünü 1 (kesinlikle kat›lm›yorum) ile 5 (kesinlikle kat›l›yorum) aras› bir ölçekte de¤erlendirmeleri istenmifltir. Yan›tlar›n örneklem ortalamas› 3.81 ve standart sapmas› 1.34 hesaplanm›flt›r. Yan›tlar›n ana kütle ortalamas›n›n %90 güven aral›¤›n› hesaplay›n›z. Çözüm: Örneklemden elde edilen veriler; – X1 = 3,81, S = 1,34 ve n = 54 dür. Bu de¤erin bulunmas›nda Z çizelgesini kullan›rken, Z çizelgesinin yar›m alan çizelgesi oldu¤unu unutmadan öncelikle A=0,50,025=0,475 olas›l›k de¤erine hesaplay›p, daha sonra bu A alan›na karfl›l›k gelen Z de¤erini bulmak gerekir. Bu konu detayl› olarak 3. ünitede ele al›nm›flt›. Uygulamada en çok kullan›lan güven seviyeleri için alt (AGS) ve üst (ÜGS) güven s›n›rlar› yandaki gibidir. ÖRNEK 2 74 Co¤rafi Bilgi Sistemleri ‹çin Temel ‹statistik Ana kütle standart sapmas› bilinmemekle birlikte, n = 54 > 30 oldu¤undan, σ = S = 1,34 al›nabilir. (1 - α) = 0,90, α = 0,10 ve α / 2 = 0,05 oldu¤undan Zα/2 = Z0,05 = 1,645’dir. Güven s›n›rlar›n›; X ∓ 1,645. σ eflitli¤i ile afla¤›daki gibi hesaplayabiliriz. n AGS = 3,81- 1,645. 1,34 = 3,51 54 ÜGS = 3,81 + 1,645. 1,34 = 4,11 54 SIRA S‹ZDE 1 D Ü fi Ü N E L ‹ M D Ü fi Ü N E L ‹ M Küçük Örneklemelerde Ana Kütle Ortalamas›n›n Güven Aral›¤› S O R U S O R U D‹KKAT SIRA S‹ZDE AMAÇLARIMIZ SIRA S‹ZDE Normal da¤›l›ml› bir ana kütleden rassal olarak elde edilmifl 36 bireyli örnek kütle verileri yard›m›yla oluflturulan ana kütle ortalamas› µ’nün güven aral›¤› 19.33 < µ < 20.27 fleklinde ise örneklem ortalamas› (µ) kaçt›r? Ana kütle ortalamas›n›n ve varyans›n›n bilinmedi¤i veya di¤er bir tan›mlamayla küçük örneklemelerde (n < 30), örneklerin ortalamalar›n›n da¤›l›m› Student t daD‹KKAT ¤›l›m›na uydu¤undan, t da¤›l›m›n›n özelliklerinden yararlan›larak ana kütle ortalamas›n›n güven aral›¤›, belirli bir (1 - α) güven seviyesi ve v = n - 1 serbestlik deSIRA S‹ZDE recesi için afla¤›daki eflitlikle hesaplan›r. N N K ‹ T A P TELEV‹ZYON ‹NTERNET X ± tαAMAÇLARIMIZ / 2,n .S X Burada, S K =‹ ST A: Örnek ortalamalar› da¤›l›m›n›n standart hatas›, x P n tα/2,v : v = n - 1 serbestlik derecesi ile α / 2 güven seviyesi için t de¤eri olup, Student da¤›l›m› belirlenmektedir. T E L E V ‹ ZtY çizelgesinden ON Belirli bir (1 - α) güven seviyesi ve v = n - 1 serbestlik seviyesi için Student da¤›l›m (t) çizelgesinden tα/2,v ’yi bulabilmek için öncelikle α / 2 ve V = n - 1 de¤erini belirleriz. Daha sonra, ‹NTERNET P(t > tα/2,v) = α / 2 olas›l›¤›na karfl›l›k gelen tα/2,v de¤erini t çizelgesinden belirleriz. ÖRNEK 3 Bir tu¤la fabrikas› üretimi sürecinden rassal olarak al›nan 15 tu¤lan›n a¤›rl›k ortalamas› 4,04 kg ve standart sapmas› 0.12 kg olarak belirlenmifltir. Bugün üretilen bütün tu¤lalar›n ortalama a¤›rl›¤›n›n güven aral›¤›n›, %95 güven seviyesi için bulunuz. Çözüm: Örneklemden elde edilen veriler; – X1 = 4,04 kg, S = 0,12 kg ve n = 15 dir. 75 4. Ünite - Güven Aral›¤› Tahminleri Küçük örnekleme (n = 15 < 30) söz konusu oldu¤undan; X ± tα / 2,v .S X eflitli¤i ile güven aral›¤› hesaplan›r. (1 - α) = 0,95, α = 0,05 ve α / 2 = 0,025 ve serbestlik derecesi v = n - 1 = 15 1 = 14 oldu¤undan Student t çizelgesinden tα/2,v = t0.025,14 = 2,145 elde ederiz. Ana kütle ortalamas›n›n %95 güven seviyesi için alt (AGS) ve üst (ÜGS) güven s›n›rlar›n› afla¤›daki gibi hesaplayabiliriz. AGS = 4,04 - 2,145. 0,12 = 3,97 kg 15 ÜGS = 4,04 + 2,145. 0,12 = 4,11 15 Bir ana kütleden çekilen 15 bireylik örnek kütlenin ortalamas› 40SIRA ve standart sapmas› S‹ZDE 10’dur. Seçilen bu örne¤e göre %90 güvenirlik seviyesi için ortalaman›n alt güven s›n›r› nedir? 2 D Ü fi Ü N E L ‹ M SIRA S‹ZDE D Ü fi Ü N E L ‹ M ANA KÜTLE ORANI ‹Ç‹N GÜVEN ARALI⁄I S O R sahip U Baz› araflt›rmalarda ana kütle içindeki birimlerin belirli bir özelli¤e olanlar›n›n oran› ile ilgileniriz. Örne¤in, bir ifl makinesinin performans›n› “fiili olarak çal›flt›¤› süre/toplam çal›flmas› gereken süre” fleklinde ifade ederiz. ‹fl makinesi toplam D‹KKAT sürenin tamam›nda çal›flt›¤›nda bu oran 1 iken, çal›flmad›¤›nda 0 olacakt›r. N adet birimden oluflan ana kütlede belirli özelli¤in gerçekleflme oran›n›n ortalamas› π ise SIRA S‹ZDE ö¤rencilegerçekleflememe oran› ortalamas› (1 - π) dir. Örne¤in, bir üniversitede rin derslere devam oran› ortalamas› %80 ise devams›zl›k oran› da %20’dir. N adet bireyden oluflan ana kütlede belirli bir w özelli¤inin gerçekleflme oran› AMAÇLARIMIZ aritmetik ortalamas› ve standart sapmas›, normal da¤›l›ma benzer flekilde hesaplanmakta olup, hesaplamalar sonucunda afla¤›daki eflitlikler elde edilmektedir. S O R U D‹KKAT N N Ana kütle oran› ortalamas› : µw = π Ana kütle oran› standart sapmas› : σw = π.(1- π) Oran Ortalamas›n›n Standart Hatas› AMAÇLARIMIZ K ‹ T A P K ‹ T A P TELEV‹ZYON TELEV‹ZYON Belirli bir özelli¤in gerçekleflme oran› ortalamas› π ve varyans› π (1 - π) olan bir ana kütleden her seferinde n birey içerecek flekilde yap›lan iadesiz büyük örnek‹NTERNET lemelerde, örnek kütlelerin oranlar›n›n aritmetik ortalamalar› (P) da¤›l›m›n›n standart sapmas› hesapland›¤›nda bulunan de¤ere standart hata denir. Oranlar›n ortalamas›n›n standart hatas› (σp); σP = SIRA S‹ZDE π .(1- π ) N - n . n N -1 olup, burada, N = ana kütle birey say›s›, n = örnek kütlelerin birey say›s› ve π = belirli bir özelli¤in gerçekleflme oran› (1 - π) = ve belirli bir özelli¤in gerçekleflmeme oran›d›r. Genellikle N, n’den çok büyük oldu¤u için yaklafl›k olarak; ‹NTERNET N-n ≅1 N -1 olur. Bu durumda eflitli¤i; σP = π.(1- π ) n fleklinde yaz›labiliriz. 76 Co¤rafi Bilgi Sistemleri ‹çin Temel ‹statistik Büyük örneklemelerde (n ≥ 30), örnek kütle ile hesaplanan varyans›n ana kütle varyans›na eflit oldu¤u kabul edildi¤inden, ana kütle varyans›n›n bilinmedi¤i durumlarda da; σP = π .(1- π ) = n P.(1- P) n alabiliriz. Burada P = örnek kütle için belirli bir özelli¤in gerçekleflme oran› ve (1 - P) = örnek kütle için belirli bir özelli¤in gerçekleflmeme oran›d›r. Küçük örneklemelerde ise oranlar›n standart hatas›n›; Sp = P.(1- P) n eflitli¤i ile hesaplar›z. Büyük Örneklemelerde Ana Kütle Oran Ortalamas›n›n Güven Aral›¤› Büyük örneklemelerde (n ≥ 30) ana kütle oran› aritmetik ortalamas›n›n (π) güven aral›¤›n›, örnek kütle oran› aritmetik ortalamas› (P) ve standart hata (σp) yard›m›yla belirli bir (1 - α) güven seviyesi için afla¤›daki eflitlikle hesaplayabiliriz. –Z P+ α/2 . σp SP = Ana kütle oran› ortalamas›n›n alt (AGS) ve üst (ÜGS) güven s›n›rlar›n›; AGS = P - Zα/2.σp ÜGS = P + Zα/2.σp π.(1- π ) = n Burada, Zα/2 de¤eri, standart normal olas›l›k da¤›l›m›ndaki P(Z > Zα/2) = α / 2 koflulunu sa¤layan Z de¤eridir. Örne¤in, %99 güven düzeyi için ana kütle oran› ortalamas› π’nin güven aral›¤› afla¤›daki gibi ifade olunacakt›r. eflitlikleriyle hesaplayabiliriz. P - 2,58. ÖRNEK 4 P.(1- P ) n P.(1- P) P.(1- P ) < π < P + 2,58. n n Bir havayolu flirketi uçufllarda koltuklar›n doluluk oran›n› araflt›rmak için 60 uçufla ait örnekleme yapm›fl ve doluluk oran› ortalamas›n› %80 olarak bulmufltur. Hava yolu flirketi uçaklar›n›n doluluk oran› için %95 güvenilirlikle güven aral›¤› s›n›rlar›n› bulunuz. Çözüm: Örneklemden elde edilen veriler; n = 60, P = 0,8 ve (1 - P) = 1- 0, 8 = 0,20’dir. Ana kütle varyans› bilinmemekle birlikte, n = 60 > 30 oldu¤undan, ana kütle oran› standart sapmas›n› afla¤›daki gibi hesaplayabiliriz. σP = π .(1- π ) = n P.(1- P ) 0,8.0, 2 = = 0,052 n 60 (1 - α) = 0,95, α = 0,05 ve α / 2 = 0,025 oldu¤undan Zα/2 = Z0,025 = 1,96’d›r. 77 4. Ünite - Güven Aral›¤› Tahminleri – 1,96 . σ eflitli¤i ile afla¤›daki gibi hesaplayabiliriz. Güven s›n›rlar›n›; P + p AGS = 0,80 - (1,96.0,052) = 0,698 AGS = 0,80 + (1,96.0,052) = 0,902 Hava yolu flirketi uçaklar›n›n doluluk oran› %95 güvenilirlikle, %69,8 ile %90,2 aral›¤›nda de¤iflecektir. Bir televizyon flirketi tüm gün izlenme oran›n›n %20’ye ulaflt›¤›n› iddia etmektedir. Bunu kan›tlamak için bir örnekleme yap›lacakt›r. Örnek oran›n›n gerçek ana kütle oran›ndan ± 0,05 (%5) uzakl›kta olaca¤›ndan (ana kütle oran›n›n tahmininde %5 hata yap›laca¤›ndan), %99 güvenirlikle emin olabilmek için ne büyüklükte örnekleme yapmak gerekecektir? ÖRNEK 5 Çözüm: Ana kütle oran› π = 0,20 ve tahmin hatas› e = 0,05 olup, tahmin hatas›n› afla¤›daki eflitlikle hesaplayabiliriz. e = 0,05 = Zα / 2 .σ p = Zα / 2 . π.(1 - π) n %99 güven seviyesi için, (1 - α) = 0,99, α = 0,01 ve α / 2 = 0,005 oldu¤undan Zα/2 = Z0,005 = 2,58’dir. Bu durumda, örnek kütle büyüklü¤ünü afla¤›daki gibi hesaplayabiliriz. 0,05 = 2,58. 0,2.(1 - 0,2) n n = 20 ⇒ n = 400 Bir banka müflterilerinin %15’inin internet üzerinden bankac›l›k ifllemi iddia etSIRA yapt›¤›n› S‹ZDE mektedir. Bunu kan›tlamak için bir örnekleme yap›lacakt›r. Örnek oran›n›n gerçek ana kütle oran›ndan ± 0,10 (%10) uzakl›kta olaca¤›ndan (ana kütle oran›n›n tahmininde %10 D Ü fi Ü N E L ‹ M hata yap›laca¤›ndan), %95 güvenirlikle emin olabilmek için ne büyüklükte örnekleme yapmak gerekecektir? 3 S O R U Küçük Örneklemelerde Ana Kütle Oran› Ortalamas›n›n Güven Aral›¤› D‹KKAT Küçük örneklemelerde (n < 30) ana kütle oran› aritmetik ortalamas›n›n (π) güven aral›¤›n›, örnek kütle oran› aritmetik ortalamas› (P) ve standart hata (Sp) yard›m›ySIRA S‹ZDE la belirli bir (1 - α) güven seviyesi için afla¤›daki eflitlikle hesaplayabiliriz. –t P+ α/2,v . Sp SP = P.(1- P ) n AMAÇLARIMIZ N N K ‹ T A P Bu eflitlikten de, ana kütle oran› ortalamas›n›n alt (AGS) ve üst (ÜGS) güven s›n›rlar›n› afla¤›daki eflitliklerle hesaplayabiliriz. SIRA S‹ZDE D Ü fi Ü N E L ‹ M S O R U D‹KKAT SIRA S‹ZDE AMAÇLARIMIZ K ‹ T A P TELEV‹ZYON TELEV‹ZYON ‹NTERNET ‹NTERNET 78 Co¤rafi Bilgi Sistemleri ‹çin Temel ‹statistik AGS = P - tα/2,v . Sp ÜGS = P + tα/2,v . Sp Buradaki tα/2,v de¤erini, α / 2 güven efli¤i ve v = n - 1 serbestlik derecesi için Student t da¤›l›m› çizelgesinden belirleriz. ÖRNEK 6 Bir sektörde faaliyet gösteren flirketlerin karl›l›k oranlar›n› araflt›rmak üzere 10 flirketin y›ll›k kar ve sat›fl gelirleri incelendi¤inde, karl›l›k oran› ortalamas›n›n %10 oldu¤u belirlenmifltir. ‹lgili sektörde faaliyet gösteren flirketlerin; a) Karl›l›k oranlar› ortalamas›n›n güven aral›¤›n› %90 güven seviyesi için belirleyiniz. b) Karl›l›k oranlar› ortalamas› %99 güvenilirlikle en fazla ne olabilir? Çözüm: Veriler n = 10, P = 0,1 ve (1 - P) = 0,9 dur. n < 30 oldu¤undan küçük örnekleme yap›lm›flt›r. a) (1 - α) = 0,90, α = 0,10 ve α / 2 = 0,05 ve serbestlik derecesi v = n - 1 = 10 1 = 9 oldu¤undan Student t çizelgesinden tα/2,v = t0.05,9 = 1,833 elde ederiz. Standart hatay›, S P = P.(1- P) 0,1.0,9 = = 0,095 olarak hesaplar›z. n 10 –t Güven aral›¤›n› P + α/2,v . Sp eflitli¤inden; – (1,833 . 0,095) 0,10 + – 0,174 ⇒ -0,074 < π < 0,274 0,10 + Bu örnekte alt güven s›n›r›n›n iflareti negatif (-) oldu¤undan, %90 ihtimalle baz› flirketlerin zarar etmesi beklenebilir. b) Karl›l›k oranlar› ortalamas›n›n %99 güvenilirlikle en fazla ne oldu¤unu bulmak için, güven aral›¤›n›n üst s›n›r de¤erini bulmam›z yeterlidir. (1 - α) = 0,99, α = 0,01 ve α / 2 = 0,005ve serbestlik derecesi v = n - 1 = 10 - 1 = 9 oldu¤undan Student t çizelgesinden tα/2,v = t0.005,9 = 3,25 elde ederiz. Standart hatay›, Sp = 0,095 olarak hesaplam›flt›k. ÜGS = P + tα/2,v . Sp Karl›l›k oranlar› ortalamas›n›n %99 güvenilirlikle en fazla; ÜGS = 0,10 + (3,25 . 0,095) = 0,409 (%40,9) olmas› beklenmektedir. ‹K‹ ANA KÜTLE ORTALAMASI ARASINDAK‹ FARKIN GÜVEN ARALI⁄I Baz› araflt›rmalarda normal da¤›l›m gösteren iki ana kütlenin merkezi e¤ilim ölçülerinden ortalamalar›n karfl›laflt›rmas› yap›larak, birbirleri aras›ndaki farklar›n bilinmesi önemli olabilmektedir. Örne¤in, kalibrasyonu yap›lm›fl ve yap›lmam›fl iki ayr› elektronik terazinin a¤›rl›k ölçüm sonuçlar› aras›nda farklar bulunup bulunmad›¤›n› araflt›rabiliriz. ‹ki ayr› ana kütlenin birincisinin aritmetik ortalamas› µ1 ve ikincisininki µ2 ise, iki ana kütle ortalamalar› aras›ndaki farklar›n iflaretini dikkate alarak; 4. Ünite - Güven Aral›¤› Tahminleri • µ1 - µ2 = + ise birinci ana kütlenin ortalamas›n›n ikinciden büyük oldu¤u, • µ1 - µ2 = - ise birinci ana kütlenin ortalamas›n›n ikinciden küçük oldu¤u, • µ1 - µ2 = 0 ise birinci ana kütlenin ortalamas› ile ikinci aras›nda fark olmad›¤›, Yorumlar›n› yapabiliriz. Ancak, ana kütle ortalamalar›n›n bilinmedi¤i ve sadece iki ayr› ana kütleden yap›lm›fl örneklemelerin oldu¤u durumda ise bu gibi yorumlar›, örnek kütle büyüklü¤üne ba¤l› olarak belirleyebilece¤imiz standart hatalar yard›m›yla güven aral›¤› ile yapabiliriz. ‹ki Ana Kütle Ortalamas› Aras› Fark›n Standart Hatas› Ana kütle boyutlar› N1 ve N2, bilinmeyen aritmetik ortalamalar› µ1 ve µ2, standart sapmalar› σ1 ve σ2 olan iki ayr› ana kütlenin birincisinden n1 ve ikincisinden n2 – – bireylik rassal örnek al›n›rsa, bu örneklerden, X1, S1 ve, X2,S2 hesaplanabilir. Her iki ana kütleden her seferinde n1 ve n2 bireyin bulundu¤u tekrarlamal› örnek al›– – n›rsa ve her seferinde (X1 - X2) hesaplan›rsa, hesaplanan bu de¤erler için bir ola– – s›l›k da¤›l›m› elde edilebilir. Büyük örneklemeler (n1 ve n2 ≥ 30) için (X1 - X2) fark– – lar›n›n da¤›l›m› yaklafl›k olarak normal da¤›l›fl gösterir. Normal da¤›lan (X1 - X2) – – farklar›n›n aritmetik ortalamas› µ(X -X ) ve standart hatas› σ(X -X ) olur. (X1 - X2) 1 2 1 2 farklar› olas›l›k da¤›l›m›n›n standart hatas›; σ(X - X ) = 1 2 σ12 σ2 + 2 n1 n2 eflitli¤i ile hesaplanabilir. σ1 ve σ2nin bilinmedi¤i ve (n1 ve n2 ≥ 30) oldu¤u durumlarda σ1 = S1 ve σ2 = S2 al›nabilir. – – Küçük örneklemeler (n1 ve n2 <30) için ise (X1 - X2) farklar› olas›l›k da¤›l›m›n›n standart hatas› afla¤›daki eflitlikle hesaplan›r. S(X - X ) = 1 2 S12 S2 + 2 n1 n2 Büyük Örneklemelerde ‹ki Ana Kütle Ortalamas› Aras›ndaki Fark›n Güven Aral›¤› Büyük örneklemelerde (n1 ve n2 ≥ 30) iki ana kütle ortalamas› aras›ndaki fark›n – – (µ1 - µ2) güven aral›¤›n›, örnek kütlelerin ortalama farklar› (X1 - X2) ve standart hata σ yard›m›yla, belirli bir (1 - α) güven seviyesi için afla¤›daki eflitlikle he( X1 - X2 ) saplayabiliriz. (X1 - X 2 ) ± Zα / 2 .σ(X 1 -X 2 ) Bu eflitlikten de, iki ana kütle ortalamas› farklar›n›n alt (AGS) ve üst (ÜGS) güven s›n›rlar›n› afla¤›daki eflitliklerle hesaplayabiliriz. AGS = ( X 1 - X 2 ) - Z a / 2 .σ ( X1-X2 ) ÜGS = ( X 1 - X 2 )+ Zα / 2 .σ ( X1-X2 ) 79 80 Co¤rafi Bilgi Sistemleri ‹çin Temel ‹statistik ‹ki ayr› ana kütle ortalamalar› aras›ndaki farklar›n alt ve üst güven s›n›rlar›n›n iflaretlerini dikkate alarak afla¤›daki yorumlar› yapabiliriz. • AGS = + ve ÜGS = + ise birinci ana kütlenin ortalamas›n›n ikinciden büyüktür. • AGS = - ve ÜGS = - ise birinci ana kütlenin ortalamas›n›n ikinciden küçüktür. • AGS = - ve ÜGS = + ise birinci ana kütlenin ortalamas› ile ikinci aras›nda önemli bir fark yoktur. ÖRNEK 7 ‹ki ayr› mermer fabrikas›n›n üretti¤i mermer plakalar›ndan al›nan 60’ar adet (n1 = n2 = 60) örnek üzerinde yap›lan afl›nma direnci (cm3/50 cm2) deneyleri sonucunda ortalama ve standart sapmalar afla¤›daki gibi belirlenmifltir. %90 güvenilirlikle ana kütle ortalamas› farklar›n›n güven aral›¤›n› bulunuz. Güven aral›¤›n› inceleyerek iki fabrikan›n üretti¤i mermer plakalar›n ortalama afl›nma dirençleri aras› farklar› yorumlay›n›z. – – X1 = 32 cm3/50 cm2 X2 = 29 cm3/50 cm2 S1 = 12 cm3/50 cm2 S2 = 9 cm3/50 cm2 Çözüm: Büyük örnekleme (n1 = n2 = 60 > 30) yap›ld›¤›ndan iki ana kütle ortalamas› farklar›n güven aral›¤›n› (1 - α) güvenirlikle bulmak için afla¤›daki eflitli¤i kullan›r›z. (X1 - X 2 ) ± Zα / 2 .σ(X 1 σ(X - X ) = 1 2 -X 2 ) σ12 σ2 + 2 n1 n2 ‹ki mermer fabrikas› plakalar›n›n afl›nma direnci ana kütle standart sapmalar› bilinmemekle birlikte, büyük örnekleme yap›ld›¤› için σ12 ve σ22 yerine S12 ve S22 kullanabiliriz. (1 - α) = 0,90, α = 0,10 ve α / 2 = 0,05 oldu¤undan Zα/2 = Z0,05 = 1,645 elde ederiz. ‹ki ana kütle ortalamas› farklar›n›n %90 güven seviyesi için alt (AGS) ve üst (ÜGS) güven s›n›rlar›n› afla¤›daki gibi hesaplayabiliriz. AGS = (X1 - X 2 ) - Zα / 2 . = (32 - 29) - 1,645. ÜGS = (X1 - X 2 ) + Zα / 2 . = (32 - 29) + 1,645. S12 n1 + S22 n2 122 92 + = -0, 2 cm3 / 50 cm 2 60 60 S12 n1 + S22 n2 122 92 = 6, 2 cm 3 / 50 cm 2 + 60 60 4. Ünite - Güven Aral›¤› Tahminleri Bu sonuç bize iki mermer fabrikas› plakalar› ortalama afl›nma dirençleri farklar›n›n %90’n›n -0,2 ile 6,2 (cm3/50 cm2) aras›nda olabilece¤ini göstermektedir. Alt güven s›n›r› negatif ve üst güven s›n›r› pozitif iflaretli oldu¤undan, iki mermer fabrikas› ürünlerinin afl›nma dirençleri aras›nda önemli bir fark olmad›¤›n› söyleyebiliriz. Küçük Örneklemelerde ‹ki Ana Kütle Ortalamas› Aras›ndaki Fark›n Güven Aral›¤› Küçük örneklemeler (n1 ve n2 < 30) için ise iki ana kütle ortalamas› aras›ndaki fark›n (µ1 - µ2) güven aral›¤›; ( X 1 - X 2 ) ± t α / 2,v .S ( X1 - X 2 ) eflitli¤i ile hesaplanabilmektedir. Bu eflitlikten de, iki ana kütle ortalamas› farklar›n›n alt (AGS) ve üst (ÜGS) güven s›n›rlar›n› afla¤›daki eflitliklerle hesaplayabiliriz. AGS = ( X 1 - X 2 ) - tα / 2,v .S ( X1 -X2 ) ÜGS = ( X 1 - X 2 )+ tα / 2,v .S ( X1-X2 ) ‹K‹ ANA KÜTLE ORANI ARASINDAK‹ FARKIN GÜVEN ARALI⁄I Baz› araflt›rmalarda normal da¤›l›m gösteren iki ana kütle oranlar› aras›ndaki farklar›n karfl›laflt›rmas›n›n yap›lmas› gerekebilmektedir. N1 adet birimden oluflan birinci ana kütlede belirli özelli¤in gerçekleflme oran›n›n ortalamas› π1 ve gerçekleflmeme oran› ortalamas› (1 - π1), N2 adet birimden oluflan ikinci ana kütlede belirli özelli¤in gerçekleflme oran›n›n ortalamas› π2 ve gerçekleflmeme oran› ortalamas› ise (1 - π2) oldu¤u durumda, iki ayr› ana kütle için belirli özelli¤in gerçekleflme oran› farklar›n›n (π1 - π2) karfl›laflt›r›lmas›nda güven aral›¤› mant›¤› kullan›labilmektedir. ‹ki Ana Kütle Oranlar› Aras›ndaki Farklar›n Standart Hatas› Ana kütle boyutlar› N1 ve N2, belirli özelli¤in gerçekleflme oran› π1 ve π2 olan iki ayr› ana kütlenin birincisinden n1 ve ikincisinden n2 bireylik rassal örnek al›n›rsa, bu örneklerden P1 ve P2 hesaplanabilir. Her iki ana kütleden her seferinde n1 ve n2 bireyin bulundu¤u tekrarlamal› örnek al›n›rsa ve her seferinde (P1 - P2) hesaplan›rsa, hesaplanan bu de¤erler için bir olas›l›k da¤›l›m› elde edilebilir. Büyük örneklemeler (n1 ve n2 ≥ 30) için (P1 - P2) farklar›n›n da¤›l›m› yaklafl›k olarak normal da¤›l›fl gösterir. Normal da¤›lan (P1 - P2) farklar›n›n aritmetik ortalamas› ve standart hatas› σ(P -P ) olur. (P1 - P2) farklar› olas›l›k da¤›l›m›n›n standart hatas›; 1 P1.(1- P1 ) σ(P - P ) = 1 2 n1 2 + P2 .(1- P2 ) n2 eflitli¤i ile hesaplanabilir. Küçük örneklemeler (n1 ve n2 <30) için de S(P - P ) = σ(P - P ) kabul edilerek standart hata hesaplanabilir. 1 2 1 2 81 82 Co¤rafi Bilgi Sistemleri ‹çin Temel ‹statistik Büyük Örneklemelerde ‹ki Ana Kütle Oran› Aras›ndaki Fark›n Güven Aral›¤› Büyük örneklemelerde (n1 ve n2 ≥ 30) iki ana kütle oran› aras›ndaki fark›n (π1 - π2) güven aral›¤›n›, örnek kütlelerin oran farklar› (P1 - P2) ve standart hata σ(P -P ) yar1 2 d›m›yla, belirli bir (1 - α) güven seviyesi için afla¤›daki eflitlikle hesaplayabiliriz. (P1 - P2 ) ± Zα / 2 .σ(P - P 1 2 ) Bu eflitlikten de, iki ana kütle oranlar› aras›ndaki farklar›n alt (AGS) ve üst (ÜGS) güven s›n›rlar›n› afla¤›daki eflitliklerle hesaplayabiliriz. AGS = (P1 - P2 ) - Zα / 2 .σ(P - P 1 2 ÜGS = (P1 - P2 )+ Zα / 2 .σ(P - P 1 ÖRNEK 8 2 ) ) ‹ki ayr› ifl makinesinin günlük fiili çal›flma rand›manlar›n› karfl›laflt›rmak üzere yap›lan örneklemeler sonucunda afla¤›daki veriler elde edilmifltir. n1 = 40 gün P1 = 0,70 (%70) n2 = 50 gün P2 = 0,64(%64) %90 güven seviyesi için iki ifl makinesinin fiili çal›flma rand›man (oran) farklar›n›n güven aral›¤›n› bulunuz. Çözüm: Büyük örnekleme (n1 ve n2 > 30) yap›ld›¤›ndan iki ana kütle oran farklar›n›n güven aral›¤›n› (1 - α) güvenilirlikle bulmak için afla¤›daki eflitlikleri kullan›r›z. (P1 - P2 ) ± Zα / 2 .σ(P - P 1 σ(P - P ) = 1 2 2 P1.(1- P1 ) n1 ) + P2 .(1- P2 ) n2 (1 - α) = 0,90, α = 0,10 ve α / 2 = 0,05 oldu¤undan Zα/2 = Z0,05 = 1,645 elde ederiz. ‹ki ana kütle oran› farklar›n›n %90 güven seviyesi için güven aral›¤›n› afla¤›daki gibi hesaplayabiliriz. (0,70 - 0,64) ∓ 1,645 . 0,70.(1- 0,70) 0,64.(1- 0,64) + 40 50 (0,70 - 0,64) ∓ 0,163 ⇒ AGS = -0,103 ve ÜGS = 0, 223 SIRA S‹ZDE D Ü fi Ü N E L ‹ M S O R U D‹KKAT SIRA S‹ZDE AMAÇLARIMIZ 4 ‹ki ayr› ifl makinesinin SIRA S‹ZDE günlük fiili çal›flma rand›manlar› (oranlar›) aras›ndaki fark› %90 güven seviyesi için yorumlay›n›z. D Ü fi Ü N E L ‹ M Küçük Örneklemelerde ‹ki Ana Kütle Oran› Farklar›n›n Güven Aral›¤› Küçük örneklemelerde (n1 ve n2 < 30), iki ana kütle oranlar› aras›ndaki farklar›n (π1 S O R U - π2) güven aral›¤›n›, örnek kütlelerin oran farklar› (P1 - P2) ve standart hata S(P - P ) 1 2 yard›m›yla, belirli bir (1 - α) güven seviyesi için afla¤›daki eflitlikle hesaplayabiliriz. D‹KKAT N N SIRA S‹ZDE AMAÇLARIMIZ 4. Ünite - Güven Aral›¤› Tahminleri (P1 - P2 ) ± tα / 2,v .S(P - P 1 2 ) Bu eflitlikten de, iki ana kütle oranlar› aras›ndaki farklar›n alt (AGS) ve üst (ÜGS) güven s›n›rlar›n› afla¤›daki eflitliklerle hesaplayabiliriz. AGS = (P1 - P2 ) - tα / 2,v .S(P - P ) 1 2 ÜGS = (P1 - P2 )+ tα / 2,v .S(P - P ) 1 2 VARYANS ‹Ç‹N GÜVEN ARALI⁄I Ana kütle ortalamas›n›n (µ) ve varyans›n›n (σ2) bilinmemesine ra¤men, ana kütle varyans›n›n büyüklü¤ünün önemli oldu¤u bir araflt›rmada, bu ana kütleden elde edilecek n birimlik Xi örnekleri ile örnek kütlenin ortalama ve varyans› hesaplanarak varyans›n büyüklü¤ü hakk›nda yorum yap›labilmektedir. Büyük örneklemelerde (n ≥ 30), örnek kütle varyans› ile ana kütle varyans› birbirine birbirine eflit (σ2 = S2) kabul edilebildiklerinden, örnek kütle varyans› yard›m›yla ana kütle varyans›n› yorumlamak mümkündür. Ancak küçük örneklemelerde ise, örnek kütle varyans› yard›m›yla ana kütle varyans›n›n büyüklü¤ünü yorumlamak mümkün de¤ildir. Küçük örneklemelerde varyans›; S2 = ∑ ( X - X )2 = n -1 1 ∑ ( X - X )2 n -1 eflitli¤i ile hesaplayabilmekteyiz. Varyans eflitli¤ini; ( n - 1).S 2 = ∑ ( X - X )2 fleklinde yazd›ktan sonra, eflitli¤in her iki taraf›n› ana kütle varyans›na (σ2) bölersek; ( n -1).S 2 σ2 = ∑ ( X - X )2 σ2 eflitli¤i ile ifade edilen (n - 1) serbestlik dereceli Khi-kare (χ2) da¤›l›m›n› elde ederiz. χ2 da¤›l›m›, 0 ile + ∞ aral›¤›nda tan›ml› olup, n < 30 oldu¤u sürece simetrik bir da¤›l›m de¤ildir. Serbestlik derecesi v = n - 1 olan Khi-kare da¤›l›m›n›; χv2 = ( n -1).S 2 σ2 yazabiliriz. Bu eflitlikten de, ana kütle varyans›n›; σ2 = ( n -1).S 2 χv2 elde ederiz. 83 84 Co¤rafi Bilgi Sistemleri ‹çin Temel ‹statistik χ2 da¤›l›m›nda, ana kütle varyans›n› (σ2) belirli bir güven düzeyinde (1 - α) içine alacak iki χ2 de¤eri vard›r (Cula ve Muluk, 2006). fiekil 4.2’den de görüldü¤ü gibi, Khi-kare da¤›l›m›nda alt ve üst s›n›ra karfl›l›k gelen Khi-kare de¤erleri; 2 χ 2A = χ(1α / 2),v ve χÜ2 = χ(2α / 2),v olup, χ2 çizelgelerinden elde edilebilmektedir. Khi-kare da¤›l›m› kullan›larak, v = n - 1 serbestlik derecesi ve belirli bir (1 - α) güven seviyesi için, örnek kütle varyans› kullan›larak ana kütle varyans›n›n güven aral›¤›n› belirleyebiliriz. AGS = (n - 1).S2 ÜGS = χ 2A (n -1).S2 χÜ2 fiekil 4.2 Khi-kare da¤›l›m›nda alt ve üst güven s›n›rlar› 1−α α/2 α/2 2 2 Kα/2,v K1 α/2,v ÖRNEK 9 2 K Bir bakliyat paketleme üretim hatt›ndan rassal örneklenen 10 paketin a¤›rl›klar›n›n standart sapmas› 12 gr ç›km›flt›r. Bu paketleme ana kütlesindeki varyans›n % 90 güven aral›¤› kaçt›r? Çözüm: n = 10, S = 12, S2 = 144 (1 - α) = 0,90, α = 0,10, α / 2 = 0,05, n = 10 ⇒ v = n - 1 = 10 - 1 = 9 α / 2 = 0,05 ve v = 9 için Khi-kare çizelgesinden; 2 2 χ 2A = χ(1α / 2),v = χ(1-0,05),9 = 16,92 2 χÜ2 = χ(2α / 2),v = χ(0,05),9 = 3,33 de¤erlerini elde ederiz. Bu de¤erleri kullanarak varyans›n güven aral›¤› s›n›rlar›n› bulabiliriz. AGS = ÜGS = (n - 1).S2 χ 2A (n -1).S2 χÜ2 = (10 - 1).144 = 76,6 gr 16,92 = (10 -1).144 = 389, 2 gr 3,33 85 4. Ünite - Güven Aral›¤› Tahminleri Özet N A M A Ç 1 N A M A Ç 2 Nokta ve güven aral›¤› tahmini aras›ndaki fark› belirlemek. Örneklemenin amac›, ana kütlenin bilinmeyen parametreleri hakk›nda tahminler yapmakt›r. Tahminleme ile ana kütlenin tamam›n›n örneklenmesini (tam say›m›n›) gerektiren ifllemlere gerek kalmamaktad›r. ‹statistikte tahminleme nokta veya aral›k tahmini olmak üzere iki yöntemle yap›labilmektedir. Nokta tahmini, ana kütle parametrelerinin bilinmedi¤i hallerde örneklerden elde edilmifl verilerle tek bir tahmin yapmakt›r. Nokta tahminleri ile sapmas›z, tutarl› ve etkin tahminler yap›lamamakta, hata pay› belirlenememekte ve güvenilirlik azalmaktad›r. Aral›k tahmini ile ise, ana kütleye ait herhangi bir bilinmeyen parametrenin belirli bir hata pay› ile alt ve üst s›n›r de¤erleri verilerek tahmin edilmesi mümkün olabilmektedir. N A M A Ç 3 • Büyük örneklemelerde (n1 ve n2 ≥ 30), standart normal de¤iflkeni (Zα/2) kullanarak, örnek kütle– – lerin ortalama farklar› (X 1 - X 2) ve standart hata σ ( X1 - X 2 ) rini (tα/2,v) kullanarak, örnek kütlelerin ortalama – – yard›farklar› (X 1 - X 2) ve standart hata S ( X1- X2 ) m›yla ( X 1 - X 2 ) ± t α / 2,v .S( X 1 - X 2 ) eflitli¤iyle, tahmin edilebilmektedir. ‹ki ana kütle oran› aras›ndaki fark›n (π1 - π2 ) güven aral›¤›, belirli bir (1 - α) güven seviyesi için; • Büyük örneklemelerde (n1 ve n2 ≥ 30), standart normal de¤iflkeni (Zα/2) kullanarak, örnek kütlelerin oran farklar› (P1 -P2) ve standart hata σ(P1 -P2 ) yard›m›yla (P1 - P2 ) ± Zα / 2 .σ(P1 - P2 ) eflitli¤iyle, • Küçük örneklemelerde (n1 ve n2 < 30), v = n - 1 serbestlik derecesi ile belirlenen Student t de¤e- x rini (tα/2,v) kullanarak, örnek kütlelerin oran farklar› (P1 -P2) ve standart hata S(P - P ) yard›m›yla • Küçük örneklemelerde (n < 30), v = n - 1 ser- 1 2 (P1 - P2 ) ± tα / 2,v .S(P - P ) eflitli¤iyle, tahmin edilebil- bestlik derecesi ile belirlenen Student t de¤erini X -X 2 ) serbestlik derecesi ile belirlenen Student t de¤e- de¤iflkeni (Zα/2) kullanarak, örnek kütle aritme– tik ortalamas› (X ) ve standart hata (σ ) yard›- la X ± tα / 2,n .S eflitli¤iyle, tahmin edilebilmekX tedir. Ana kütle oran›n›n (π) güven aral›¤›, belirli bir (1 - α) güven seviyesi için; • Büyük örneklemelerde (n ≥ 30), standart normal de¤iflkeni (Zα/2) kullanarak, örnek kütle ora– Z .σ n› (P) ve standart hata (σp)yard›m›yla P + α/2 p eflitli¤iyle, • Küçük örneklemelerde (n < 30), v = n - 1 serbestlik derecesi ile belirlenen Student t de¤erini (tα/2,v) kullanarak, örnek kütle oran› (P) ve stan– t .S dart hata (Sp) yard›m›yla eflitli¤iyle, P + α/2 p tahmin edilebilmektedir. eflitli- 1 • Küçük örneklemelerde (n1 ve n2 < 30), v = n - 1 • Büyük örneklemelerde (n ≥ 30), standart normal (tα/2,v) kullanarak, örnek kütle aritmetik ortala– mas› (X) ve standart hata (S ) yard›m›y- yard›m›yla ( X 1 - X 2 ) ± Zα / 2 .σ( X ¤iyle, Ana kütle ortalamas› ve oran› için güven aral›¤›n› tahmin etmek. Ana kütle aritmetik ortalamas›n›n (µ) güven aral›¤›, belirli bir (1 - α) güven seviyesi için; m›yla X ∓ Zα / 2 .σ eflitli¤iyle, X ‹ki ana kütle ortalamas› ve oran› aras›ndaki farklar›n güven aral›¤›n› tahmin etmek. ‹ki ana kütle ortalamas› aras›ndaki fark›n (µ1 − µ2) güven aral›¤›, belirli bir (1 - α) güven seviyesi için; mektedir. N A M A Ç 4 1 2 Ana kütle varyans› için güven aral›¤›n› tahmin etmek. Ana kütle varyans›n›n (σ2)güven aral›¤›, v = n 1 serbestlik derecesi ve belirli bir (1 - α) güven seviyesi için, Khi-kare de¤eri (χ2) ve örnek kütle varyans› (S2) yard›m›yla belirlenebilmektedir. AGS = (n - 1).S2 χ 2A ÜGS = (n - 1).S2 χÜ2 2 2 2 χ 2A = χ(1α / 2),v ve χÜ = χ( α / 2),v 86 Co¤rafi Bilgi Sistemleri ‹çin Temel ‹statistik Kendimizi S›nayal›m 1. Bir klinikte hastalara zay›flama rejimi uygulanmaktad›r. Rassal olarak örneklenen 30 hasta, rejimin sonunda ortalama olarak 20 kilogram zay›flam›flt›r. Örneklenen kütlenin standart sapmas› 5 kilogram ise ana kütle ortalamas› için % 90 güven aral›¤› afla¤›dakilerden hangisidir? a. 19,5 < µ < 20,5 b. 19,1 < µ < 20,9 c. 18,5 < µ < 21,5 d. 18,2 < µ < 21,8 e. 17,3 < µ < 22,7 2. Bir ana kütleden çekilen 25 bireylik örnek kütlenin ortalamas› 50 ve standart sapmas› 10’dur. Seçilen bu örne¤e göre, %95 güvenirlik seviyesi için ortalaman›n güven aral›¤› afla¤›dakilerden hangisidir? a. 43,55 < µ < 52,45 b. 44,84 < µ < 55,16 c. 45.87 < µ < 54,13 d. 46.17 < µ < 56,83 e. 48,44 < µ < 54,63 3. Bir GPS ile yap›lan konumsal ölçümlerin hassasiyetini belirlemek amac›yla teodolit ile yap›lan 40 noktal›k ölçüm sonuçlar› karfl›laflt›r›ld›¤›nda hata oran› ortalamas› %10 olarak bulunmufltur. Buna göre, %90 güven seviyesi için ana kütle oran›n›n alt güven s›n›r› yüzde kaçt›r? a. 17,8 b. 8,4 c. 4,8 d. 2,2 e. 1,8 4. Son ekonomik krizin seramik fabrikalar›n›n kapasite kullan›m oranlar›n› nas›l etkiledi¤ini belirlemek için yap›lan çal›flmada 10 farikada kapasite kullan›m oran›n›n %30 azald›¤› tespit edilmifltir. Buna göre, %99 güvenilirlikle ana kütle oran›n› güven aral›¤›n›n üst s›n›r› yüzde kaçt›r? a. 77 b. 66 c. 47 d. 27 e. 12 5. ‹ki ayr› demir madeni iflletmesinden al›nan 36’flar (n1 = n2 = 36) örnekler üzerinde yap›lan tenör (%Fe) analizleri sonucunda afla¤›daki veriler elde edilmifltir. – X 1 = 42 %Fe – X 2 = 34 %Fe S1 = 16 %Fe S2 = 12 %Fe Bu bilgilere göre, %90 güvenilirlikle ana kütle ortalamas› farklar› güven aral›¤›n›n alt s›n›r› kaç %Fe’dir? a. b. c. d. e. 1,36 2,52 6,42 8,66 13,48 6. Küçük ölçekli bir tekstil iflletmesinde çal›flanlar aras›nda ücret ödemelerinde cinsiyete göre farkl›l›k olup olmad›¤›n› belirlemek amac›yla yap›lan araflt›rmada, iflletmede çal›flan 20 erkek çal›flan›n ücretlerinin ortalamas› 1550 TL ve standart sapmas› 250 TL iken, 20 kad›n çal›flan›n ücretleri ortalamas›n›n 1450 TL ve standart sapmas›n›n 350 TL oldu¤u belirlenmifltir. Erkek ve kad›n çal›flanlar›n ücretleri aras›nda farklar›n güven aral›¤›n› %90 güven seviyesi için afla¤›dakilerden hangisidir? a. 33 < (µ1 - µ2) < 233 b. 66 < (µ1 - µ2) < 134 c. -66 < (µ1 - µ2) < 266 d. -166 < (µ1 - µ2) < -66 e. -166 < (µ1 - µ2) < -366 7. Normal bir da¤›l›mdan rassal olarak seçilmifl 16 bireyli örnek kütlenin varyans› 49 olarak hesaplanm›flt›r. Buna göre, ana kütle varyans›n›n üst güven s›n›r› %90 güvenirlikle kaçt›r? a. 36,4 b. 42,6 c. 69,5 d. 101,2 e. 203,7 4. Ünite - Güven Aral›¤› Tahminleri 87 Kendimizi S›nayal›m Yan›t Anahtar› 8. Standart sapmas› 27 olan normal bir da¤›l›mdan çekilmifl 36 gözlemli rassal bir örneklem verilerinden oluflturulan ana kütle ortalamas› µ’nün (1 - α) güven aral›¤› 43,7 < µ < 56,3 fleklinde ise, µ % kaçt›r? a. 5 b. 8 c. 12,01 d. 16,16 e. 18,36 1. c 2. c 3. d 4. a 9. Ana kütle ortalamas›n›n güven aral›¤› belirlenirken örneklem hacmi 17 ise, serbestlik say›s› kaçt›r? a. 15 b. 16 c. 17 d. 18 e. 19 10. Normal da¤›l›ml› bir ana kütleden rassal olarak çekilmifl 49 bireyden oluflan örneklem verileri ile ana kütle ortalamas› µ’nün % 90 güven aral›¤› 143,42 < µ < 156,58 fleklinde belirlenmifltir. Buna göre ana kütle standart sapmas› µ kaçt›r? a. 8 b. 18 c. 28 d. 38 e. 44 5. b 6. c 7. d 8. d 9. b 10. c Yan›t›n›z yanl›fl ise, “Büyük Örneklemelerde Ana Kütle Ortalamas› Güven Aral›¤›” konusunu yeniden gözden geçiriniz. Yan›t›n›z yanl›fl ise, “Küçük Örneklemelerde Ana Kütle Ortalamas› Güven Aral›¤›” konusunu yeniden gözden geçiriniz. Yan›t›n›z yanl›fl ise, “Büyük Örneklemelerde Ana Kütle Oran Ortalamas›n›n Güven Aral›¤›” konusunu yeniden gözden geçiriniz. Yan›t›n›z yanl›fl ise, “Küçük Örneklemelerde Ana Kütle Oran Ortalamas›n›n Güven Aral›¤›” konusunu yeniden gözden geçiriniz. Yan›t›n›z yanl›fl ise, “Büyük Örneklemelerde ‹ki Ana Kütle Ortalamas› Farklar›n›n Güven Aral›¤›” konusunu yeniden gözden geçiriniz. Yan›t›n›z yanl›fl ise, “Küçük Örneklemelerde ‹ki Ana Kütle Ortalamas› Farklar›n›n Güven Aral›¤›” konusunu yeniden gözden geçiriniz. Yan›t›n›z yanl›fl ise, “Varyans ‹çin Güven Aral›¤›” konusunu yeniden gözden geçiriniz. Yan›t›n›z yanl›fl ise, “Büyük Örneklemelerde Ana Kütle Ortalamas› Güven Aral›¤›” konusunu yeniden gözden geçiriniz. Yan›t›n›z yanl›fl ise, “Küçük Örneklemelerde Ana Kütle Ortalamas› Güven Aral›¤›” konusunu yeniden gözden geçiriniz. Yan›t›n›z yanl›fl ise, “Büyük Örneklemelerde Ana Kütle Ortalamas› Güven Aral›¤›” konusunu yeniden gözden geçiriniz. 88 Co¤rafi Bilgi Sistemleri ‹çin Temel ‹statistik S›ra Sizde Yan›t Anahtar› Yararlan›lan Kaynaklar S›ra Sizde 1 n = 36 oldu¤una göre, büyük örnekleme yap›lm›flt›r. Güven aral›¤›; 19,33 < µ < 20,27 oldu¤una göre, alt ve üst güven s›n›rlar› aras›ndaki fark; Cula, S. & Muluk, Z. (2006). Temel ‹statistik Yöntemleri. Ankara: Baflkent Üniversitesi. Gürtan, K. (1982). ‹statistik ve Araflt›rma Metodlar›. No: 2941. ‹stanbul: ‹stanbul Üniversitesi. Konuk, A. & Önder, S. (1999). Maden ‹statisti¤i. Mühendislik Mimarl›k Fakültesi Maden Mühendisli¤i Bölümü. Eskiflehir: Eskiflehir Osmangazi Üniversitesi. Montgomery, D.C. & Runger G.C. (2003). Applied Statistics and Probability for Engineers. USA: John Wiley & Sons. Newbold, P. (2005). ‹flletme ve ‹ktisat ‹çin ‹statsitik. Ümit fienesen (Çev.). ‹stanbul: Literatür. Püskülcü, H. & ‹kiz, F. (1989). ‹statisti¤e Girifl. ‹zmir: Bilgehan. Serper, Ö. (2000). Uygulamal› ‹statistik II. Bursa: Ezgi. Ünver, Ö. & Gamgam, H. (2006). Uygulamal› Temel ‹statistik Yöntemler. Ankara: Seçkin. Yüzer, A.F. (Ed.) (2009). ‹statistik. Aç›k Ö¤retim Fakültesi Yay›n No: 771, Eskiflehir: Anadolu Üniversitesi. ÜGS - AGS = 2.(Zα / 2 .σ ) X 2.( Zα / 2 .σ ) = 20, 27 - 19,33 = 0,94 ⇒ Zα / 2 .σ X X = 0,94 / 2 = 0, 47 AGS = X - (Zα / 2 .σ ) ⇒ 19,33 = X - 0, 47 ⇒ X = 19,8 X S›ra Sizde 2 n = 16 oldu¤una göre, küçük örnekleme yap›lm›flt›r. – X = 40 ve S = 10’dur. (1 - α) = 0,90, α = 0,10 ve α / 2 = 0,05 serbestlik derecesi v = n - 1 = 16 - 1 = 15 oldu¤undan Student t çizelgesinden tα/2,v. = t0.05,15 = 1,753 elde ederiz. AGS = X - tα / 2,v .S X S X = S = n 10 = 2,5 16 AGS = 40 - (1,753 . 2,5) = 35,62 S›ra Sizde 3 Ana kütle oran› π =0,15 ve tahmin hatas› e = 0,10 olup, tahmin hatas›n› afla¤›daki eflitlikle hesaplayabiliriz. e = 0,10 = Zα / 2 .σ p = Zα / 2 . π.(1 - π ) n %95 güven seviyesi için, (1 - α) = 0,95, α = 0,05 ve α / 2 = 0,025 oldu¤undan Zα/2 = Z0,025 = 1,96’d›r. Bu durumda, örnek kütle büyüklü¤ünü afla¤›daki gibi hesaplayabiliriz. 0,10 = 1,96. 0,15.(1- 0,15) n n = 7 ⇒ n = 49 S›ra Sizde 4 AGS = -0,103 ve ÜGS = 0,223 oldu¤undan iki ayr› ifl makinesinin günlük fiili çal›flma rand›manlar› (oranlar›) aras›nda %90 güvenirlikle önemli bir fark olmad›¤›n› söyleyebiliriz. CO⁄RAF‹ B‹LG‹ S‹STEMLER‹ ‹Ç‹N TEMEL ‹STAT‹ST‹K 5 Amaçlar›m›z N N Bu üniteyi tamamlad›ktan sonra; ‹statistiksel hipotez testi kavramlar›n› aç›klayabilecek, test sürecinin aflamalar›n› ve yap›lacak ifllemleri s›ralayabilecek, Ana kütle ortalamas›, oran› ve varyans› ile iki ana kütle ortalamalar› aras› farklar›n hipotez testi uygulamalar›n› yapabilecek bilgi ve becerilere sahip olacaks›n›z. Anahtar Kavramlar • • • • • • S›f›r Hipotezi Karfl›t Hipotez Red Bölgesi Tek Tarafl› Test Çift Tarafl› Test Test ‹statisti¤i • • • • • • Büyük Örnekleme Küçük Örnekleme Ortalamalar›n Testi Oranlar›n Testi Ortalama Farklar›n Testi Varyanslar›n Testi ‹çindekiler Co¤rafi Bilgi Sistemleri ‹çin Temel ‹statistik ‹statistiksel Karar Vermede Hipotez Testleri • H‹POTEZ‹N KURULMASI VE TEST‹ • ANA KÜTLE ORTALAMASINA ‹L‹fiK‹N TESTLER • ANA KÜTLE ORANINA ‹L‹fiK‹N TESTLER • ANA KÜTLE ORTALAMALARI ARASINDAK‹ FARKLARIN TEST‹ • VARYANSLARIN TEST‹ ‹statistiksel Karar Vermede Hipotez Testleri H‹POTEZ‹N KURULMASI VE TEST‹ Örnek kütleden elde etti¤imiz parametre bilgilerini kullanarak ana kütle hakk›nda, belirli bir güven aral›¤›nda tahminler yapabiliriz. Ancak, birçok araflt›rmada örnek kütleden elde etti¤imiz veriler yard›m›yla ana kütle hakk›nda karar vermek de isteriz. Örne¤in, yeni bir sulama sisteminin tar›mda ürün verimlili¤ini artt›rd›¤› iddia ediliyorsa, eski ile yeni sistemin verimliliklerini ayn› bitki için ayn› arazi koflullar›nda karfl›laflt›r›p karar vermeye çal›fl›r›z. Bununla birlikte, yeni sulama sisteminin verimi art›rd›¤› karar›n› verebilmek için, yeni sulama sisteminin eskisine göre verimi önemli oranda artt›rmas›n› ve verim oranlar› aras›nda önemli farklar›n bulunmas›n› bekleriz. Yeni cihaz veya yöntemin fark yaratmas›yla birlikte, bu fark›n büyüklü¤ü ve anlaml›l›¤› da önemlidir. Örne¤in, bir fabrikaya sat›n al›nan yeni paketleme makinesinin iflgücü verimlili¤ini artt›r›p artt›rmad›¤›n› belirlemeye yönelik bir araflt›rmada, yeni makinenin iflgücü bafl›na düflen paketleme miktar›n› 10 adet artt›rm›fl oldu¤unu saptam›fl olal›m. Paketleme veriminin 10 adet artm›fl olmas›, yeni makinenin verim art›fl› sa¤lad›¤›n› söyleyebilmemiz için yeterlimidir? Acaba aradaki bu art›fl, sat›n al›nan yeni makinenin üretim sürecine girmesinin mi bir sonucu, yoksa tamamen rassal örnekleme hatalar›ndan m› kaynaklanmaktad›r? Rassal örnekleme hatalar›n›n etkilerini devre d›fl› b›rakabilmek için, fark›n ne kadar büyüklükte olmas› gereklidir? Uygulanacak yeni bir yöntem veya kullan›lacak yeni bir makinenin/cihaz›n eskisine göre süreçte veya üretimde önemli büyüklükte farkl›l›k yaratmas›ndan çok, bu farkl›l›¤›n istatistiksel aç›dan ne kadar anlaml› oldu¤u önemlidir. Bir baflka deyiflle, bu farklar›n gerçekten mi yoksa rassal örnekleme hatalar›ndan m› meydana geldi¤inin incelenerek istatistiksel karar›n verilmesi gerekmektedir. Ana kütle de¤erlerinin bilindi¤i bir durumda, uygulanan teknolojide veya yöntemde yap›lan bir de¤ifliklik sonras›nda elde edilen örnek kütle de¤erlerinin farkl› olmas›nda, gerçek veya rassal de¤iflimden hangisinin etkili oldu¤una karar vermede, hipotez testleri kullan›labilmektedir. Bu ünitede, öncelikle istatistiksel hipotezin kurulmas› ve testi sürecinin aflamalar› aç›klanacak, daha sonra ana kütle ortalamas›, oran› ve varyans› ile ana kütle ortalamalar› aras›ndaki farklar›n testi konular› ele al›nacakt›r. Ana kütle parametreleri hakk›nda ileri sürülen hipotezin do¤rulu¤unu kan›tlaman›n en kesin yöntemi, ana kütlenin tam say›m›n› yapmakt›r. Ancak, zaman yetersizli¤i, maliyetinin yüksekli¤i ve yok edici etkileri dikkate al›nd›¤›nda, ileri sürü- Genel olarak hipotezler, bir durum hakk›nda ileri sürülen varsay›mlard›r. ‹statistiksel anlamda hipotezler ise ana kütlenin durumu hakk›nda ileri sürülen iddialar›n, örnek kütle olas›l›k da¤›l›m modeline göre araflt›r›lmas›d›r. Hipotez testinde, örnekten elde edilen bilgilere ba¤l› olarak belirli bir güvenirlik seviyesinde, ileri sürülen hipotezin do¤ru olup olmad›¤› test edilir. 92 Co¤rafi Bilgi Sistemleri ‹çin Temel ‹statistik len hipotezi kan›tlamak için tam say›m yerine örnek kütle parametrelerinden yararlanmak gerekmektedir. Hipotez testi, ana kütle parametresi hakk›nda yap›lacak araflt›rmaya uygun olarak hipotezlerin kurulmas›, red veya kabul koflullar›n›n belirlenmesi, olas›l›k da¤›l›m modeline uygun test istatisti¤inin hesaplanmas› ve karar verme aflamalar›ndan oluflur. Hipotezlerin Kurulmas› S›f›r hipotezi eskiden beri bilinen ve geçerli kabul edilen görüflü yans›t›rken, karfl›t hipotez yeni bir görüfltür. ÖRNEK S›f›r hipotezi do¤ru oldu¤u halde test sonucunda rededilirse, bir hata ifllenir ve buna I. Tip Hata denilmektedir. S›f›r hipotezi yanl›fl oldu¤u halde kabul ediliyorsa da bir hata ifllenmifl olur ve bu hataya da II. Tip Hata denilmektedir. Birinci tip ve ikinci tip hatalarla ilgili olarak Özer SERPER’in “Uygulamal› ‹statistik II” (Ezgi Kitapevi, 2000, Bursa) kitab›ndan daha ayr›nt›l› bilgi edinebilirsiniz. Hipotez testinde, örnek kütleden elde edilen parametrelerin ana kütle parametreleriyle uyumlu oldu¤unu iddia eden s›f›r hipotezi (H0 hipotezi) ve uyumlu olmad›¤›n› iddia eden karfl›t hipotez (H1 hipotezi) kurulur. S›f›r hipotezine istatistiksel hipotez, karfl›t hipoteze de araflt›rma hipotezi de denilmektedir. H0 hipotezi, ana kütlenin bilinen veya varsay›lan parametre de¤eri ile örnek kütleden elde edilen aras›nda önemli (anlaml›) bir fark olmad›¤› kabulü ön flart›n› içerir. Örnek kütleden elde edilen veriler H0 hipotezini çürütmedi¤i sürece, H0 hipotezi geçerlidir. H0 hipotezi geçerli oldu¤u sürece, örnek kütle ile ana kütle parametreleri aras›ndaki farkl›l›¤›n, rassal örnekleme hatalar›ndan (örnekleme yönteminin yanl›fl seçilmesinden veya örneklerin yetersizli¤inden) meydana geldi¤i kabul edilir. Ana kütlenin bilinen veya varsay›lan parametre de¤eri ile örnek kütleden elde edilen aras›nda önemli (anlaml›) bir fark oldu¤unu ileri süren hipoteze ise karfl›t (alternatif) hipotez (H1) denilir. Bu hipotez genellikle, örnek kütle verileriyle hesaplanan parametrenin ana kütle parametresinden farkl› (büyük, küçük veya eflit de¤il) oldu¤u fleklindedir. Eskiflehir kent merkezinden geçen Porsuk çay›nda a¤›r metallerden olan kurflun miktar›n›n 5 mg/kg’›n alt›nda oldu¤u bilinmektedir. Ancak, çevre araflt›rmac›lar›, Eskiflehir kent merkezi giriflinde ve ç›k›fl›nda Porsuk çay›ndaki kurflun miktar›n›n de¤iflti¤ini iddia etmektedirler. Bu durumda, Porsuk nehrinden örnekleme yapmadan önce, kurflun miktar› ortalamas› ile ilgili hipotezlerin flu flekilde kurulmas› gerekecektir. Bilinen ana kütle de¤eri ile örnek kütle de¤eri aras›nda fark olmad›¤› varsay›m›na dayanan s›f›r hipotezi afla¤›daki gibi kurulur. H0 : X = µ = 5 mg/kg Bilinen ana kütle de¤eri ile örnek kütle de¤eri aras›nda fark oldu¤u iddias›na dayanan karfl›t hipotez, üç farkl› flekilde kurulabilecektir. H1 : X > µ = 5 mg/kg H1 : X < µ = 5 mg/kg H1 : X ≠ µ = 5 mg/kg Karfl›t hipotezi kurarken, üç karfl›t hipotezden birine karar vermek gerekir. Red Bölgesinin Tan›mlanmas› S›f›r hipotezinin red edilebilece¤i bölgeyi tan›mlamadan önce testin anlaml›l›k düzeyini belirlememiz gerekir. S›f›r hipotezi do¤ru oldu¤u halde red edilebilme hatas›n› (I. Tip Hata) iflleyebilece¤imiz en büyük olas›l›k de¤erine anlaml›l›k düzeyi (α ) 93 5. Ünite - ‹statistiksel Karar Vermede Hipotez Testleri veya anlaml›l›k seviyesi denilmektedir. Araflt›rmalarda hata yapmamak, yanl›fl bir iddiada bulunmamak ve s›f›r hipotezini korumak için anlaml›l›k düzeyini küçük tutar›z. H0 hipotezinin do¤ru oldu¤u halde red edilmesi riskli ise ve örnek say›s›n› artt›rmak pahal›ya mal oluyorsa, α anlaml›l›k düzeyi çok küçük bir de¤er (%0,1 ile %5 aras›) al›nmal›d›r. Buna karfl›l›k, H0 hipotezinin yanl›fl oldu¤u halde kabul edilmesi tehlikeli olacaksa α anlaml›l›k düzeyi %5 den büyük tutulmal›d›r (Konuk ve Önder, 1999). Anlaml›l›k düzeyi dikkate al›narak s›f›r hipotezinin kabulü için tan›mlanan bölgeye kabul bölgesi ve reddi için tan›mlanan bölgeye ise red bölgesi denilmektedir. Güven düzeyinin belirlenmesinden sonra, örnek kütle da¤›l›m modeline uygun olarak red ve kabul bölgelerinin tan›mlanmas› gerekir. E¤er hesaplanacak test istatisti¤i de¤eri kabul bölgesinin içinde kal›rsa H0 hipotezi kabul edilir, tersi durumda ise H0 hipotezi red edilir. H1 hipotezindeki iddiaya göre, red bölgesi tek tarafl› veya çift tarafl› olarak tan›mlanabilmektedir. Örnek kütle parametresinin ana kütle parametresinden küçük veya büyük oldu¤u iddias› varsa, red bölgesi tek tarafl› olarak belirlenmekte ve bu gibi durumlarda yap›lan testlere tek tarafl› test denilmektedir. Örnek kütle parametresinin ana kütle parametresine eflit olmad›¤› iddias›n›n bulundu¤u (büyük veya küçük oldu¤unu bilmedi¤imizde) durumda, red bölgesi iki tarafl› olarak belirlenmekte ve çift tarafl› test denilmektedir. Örne¤in, ortalamalar›n testinde örnek kütle ortalamas›n›n (X) ana kütle ortalamas›ndan (μ ) büyük (H1 : X > µ ) veya küçük (H1: X < µ ) oldu¤u durumlarda tek tarafl› red bölgesi tan›mlan›rken, birbirine eflit olmad›¤› (H1 : X ≠ µ ) durum için ise çift tarafl› red bölgesi tan›mlanmaktad›r (fiekil 5.1). Mühendislik ve e¤itim bilimlerinde güven seviyesi genellikle %5 olarak al›n›rken, sa¤l›k bilimlerinde %1 ve sosyal bilimlerde %10 olarak al›nabilmektedir. Kabul ve red bölgeleri aras› s›n›r› tan›mlayan teorik test istatisti¤i, belirli bir α anlaml›l›k düzeyi (olas›l›¤›) ve örnek büyüklü¤üne ba¤l› olarak, örnek kütle da¤›l›m modeline göre seçilen çizelgelerden belirlenebilmektedir. fiekil 5.1 Tek ve çift tarafl› red bölgeleri α /2 α Kabul bölgesi a) Tek tarafl› red bölgesi Red bölgesi α /2 Red bölgesi Kabul bölgesi Red bölgesi b) Çift tarafl› red bölgesi Test ‹statisti¤ini Hesaplanmas› ve Karar Verme Örnek kütle ve ana kütle parametreleri aras›ndaki fark›n standart hataya oran›na test istatisti¤i denilmekte olup, örnek kütleden elde edilmifl ortalama, oran, varyans gibi parametrelere ve örnekleme büyüklü¤üne göre hesaplanmaktad›r. Test istatistiklerinin hesaplanmas›, afla¤›daki bölümlerde ayr›nt›l› olarak ele al›nacakt›r. Hesaplanan test istatisti¤inin red bölgesinde kalmas› durumunda H0 hipotezi red edilir ve H1 hipotezinde ileri sürülen iddian›n do¤ru oldu¤u karar› verilir. Test istatisti¤inin kabul bölgesinde kalmas› durumunda ise, H0 hipotezi kabul edilir ve H1 hipotezinde ileri sürülen iddian›n yanl›fl oldu¤una karar verilir. 94 Co¤rafi Bilgi Sistemleri ‹çin Temel ‹statistik ANA KÜTLE ORTALAMASINA ‹L‹fiK‹N TESTLER Yeni bir teknoloji veya yöntem uygulanmas› sonras› yap›lan örnekleme sonucunda hesaplanan örnek kütle ortalamas› ( X ) ile teorik olarak veya geçmifl gözlemlere göre belirlenen veya bilinen ana kütle kütle ortalamas› (μ ) aras›ndaki farkl›l›¤›n anlaml›l›¤› test edilebilir. Genellikle ana kütle ortalamas› bilinmemekle birlikte, bilindi¤i varsay›larak testler yap›l›r. Ana kütle ortalamas›n›n test edilmesinde H0 hipotezi; H0 : X = μ fleklinde kurulur. Uygulanan yeni teknoloji veya yöntemin ana kütle ortalamas›n› de¤ifltirmedi¤i kabulüne dayanan H0 hipotezine karfl›t olarak ise H1 hipotezi üç farkl› flekilde oluflturulabilir. H1 : X ≠ ÖRNEK μ (Çift tarafl› test) H1 : X > μ (Tek tarafl› test) H1 : X < μ (Tek tarafl› test) Bir yap› kimyasallar› üretimi yapan firman›n üretti¤i 50 kg’l›k torbalara paketlenen seramik yap›flt›r›c›lar›n›n a¤›rl›klar›n›n 50 kg’dan az oldu¤u iddia ediliyorsa, H0 ve H1 hipotezleri nas›l kurulur? Çözüm : Ana kütle ortalamas› μ = 50 kg olarak bilindi¤ine göre H0 hipotezi, iddiay› araflt›ran firma taraf›ndan, iddian›n yanl›fl oldu¤u ve örnek kütle ortalamas›n›n ( X ) ana kütle ortalamas›na eflit olaca¤› fleklinde kurulur. H0 : X = μ = 50 kg Buna karfl›l›k, müflterilerin iddias› olan H1 hipotezi ise, iddian›n do¤ru oldu¤u fleklinde kurulur. H1 : X < μ = 50 kg ÖRNEK Örnek kütledeki veri say›s› 30’dan büyük (n≥ 30) oldu¤unda (büyük örnekleme) normal da¤›l›m›n özelliklerinden yararlanarak, 30’dan küçük (n<30) oldu¤unda (küçük örnekleme) ise Student t da¤›l›m›n›n özelliklerinden yararlanarak red bölgesi tan›mlamas› yap›l›r ve test istatisti¤i hesaplan›r. Bir madencilik firmas› alt›n oldu¤u iddia edilen bir bölgeden ald›¤› örnekleri analiz ettirdi¤inde, sahada ortalama olarak 1 gr/ton alt›n oldu¤unu tespit etmifltir. Bu durumda hipotezleri nas›l kurars›n›z? Çözüm : Daha önceden ana kütle ortalamas› bilinmedi¤ine göre, ana kütle ortalamas›n› μ =0 kabul edebiliriz. Bu durumda H0 hipotezini, örnekleme sonucu bulunan de¤erin rassal olarak bulundu¤u, örneklemeye devam edilirse, asl›nda ortalaman›n s›f›r olaca¤› fleklinde kurar›z. H0 : X = μ =0 ‹ddia ise sahada alt›n oldu¤u ve eskiden bilinenin yanl›fl oldu¤u fleklinde oldu¤undan, H1 hipotezi afla¤›daki gibi kurulur. H1 : X > μ =0 Hipotezleri oluflturduktan sonra, s›ras›yla anlamal›l›k düzeyinin seçimi, red bölgesinin tan›mlanmas›, test istatisti¤inin hesaplanmas› ve karar verme ifllemleri uygulan›r. Red bölgesinin belirlenmesi ve test istatisti¤inin hesaplanmas›ndan önce 5. Ünite - ‹statistiksel Karar Vermede Hipotez Testleri 95 örnek büyüklü¤ünü dikkate alarak, örneklemenin büyük veya küçük örnekleme olup olmad›¤›n› incelemek gerekir. Büyük Örneklemelerde Ortalamalar›n Testi Örnek kütlede bulunan örnek say›s›n›n 30’dan büyük oldu¤u (n≥ 30) ve örneklerin normal da¤›l›m gösterdi¤i durumlarda red bölgesinin tan›mlanmas›nda ve test istatisti¤inin hesaplanmas›nda normal da¤›l›m›n özelliklerinden yararlan›l›r. Red bölgesini tan›mlayabilmek için öncelikle belirli bir α anlaml›l›k düzeyi için standart normal da¤›l›m (Z) çizelgelerinden, red bölgesi s›n›r›n› ifade eden teorik test istatisti¤i de¤eri belirlenir. H1 hipotezinin tek tarafl› veya çift tarafl› olmas›na göre ; • Tek tarafl› test için Z α • Çift tarafl› test için Z α/2 belirlendikten sonra ise red bölgesi tan›mlan›r. Ana kütle varyans›n›n ve standart sapmas›n›n bilindi¤i bir durumda, ana kütleden yap›lacak n’er bireylik büyük örneklemeler sonucunda, her seferinde ana kütle ortalamas› ile örnek kütle ortalamalar› aras› farklar› hesaplar ve bu farklar›n da¤›l›m›n› araflt›r›rsak, ortalamalar aras› farklar›n da¤›l›m› normal da¤›l›m gösterir. Bu nedenle, büyük örneklemeler için ortalamalar›n testinde, test istatisti¤ini afla¤›daki standart normal de¤er (Zh) eflitli¤i yard›m›yla hesaplayabiliriz. Zh = X−µ σ X Burada, σ X : ana kütle ve örnek kütle ortalamalar› aras›ndaki farklar›n da¤›l›m›n›n standart hatas› (standart sapmas›) olup, ana kütle birey say›s›n›n çok büyük oldu¤u durumlarda; σX = σ n Ana kütle standart sapmas›n›n (σ ) bilinmedi¤i, fakat örnek kütlenin standart sapmas›n›n (S) bilindi¤i büyük örneklemelerde, σ = S kabul edilebilmektedir. kabul edilebilmektedir. Bu eflitlikte ise, σ : ana kütlenin standart sapmas› ve n: örnek kütlenin birey say›s›d›r. Teorik test istatisti¤inin belirlenmesi ve test istatisti¤inin hesaplanmas› sonras›nda; • Zh > Zα veya Zα /2 ise, Zh red bölgesinde kalaca¤›ndan H0 hipotezi red edilir. • Zh < Zα veya Zα /2 ise, Zh kabul bölgesinde kalaca¤›ndan H0 hipotezi kabul edilir ve H1 red edilir. Bir yap› kimyasallar› üretimi yapan firman›n üretti¤i seramik yap›flt›r›c› torbalar›n›n üzerinde a¤›rl›¤›n›n 50 kg ve standart sapmas›n› 1 kg oldu¤u yazmaktad›r. Bir müflteri seramik yap›flt›r›c› torbalar› a¤›rl›klar›n›n 50 kg’dan az oldu¤unu iddia etmektedir. Bu idday› test etmek amac›yla 32 torba örnek tart›lm›fl ve örnek torbalar›n ortalama a¤›rl›¤› 48 kg olarak bulunmufltur. Müflterinin iddias›n› %5 anlaml›l›k düzeyine göre test ediniz. Müflterinin iddias› do¤rumudur? Çözüm : Veriler; μ =50 kg, σ =1 kg, n=32 ve X = 48 kg Hipotezler; H0 : X = μ = 50 kg H1 : X < μ = 50 kg (Tek tarafl› test) ÖRNEK 96 Co¤rafi Bilgi Sistemleri ‹çin Temel ‹statistik Anlaml›l›k düzeyine göre teorik test istatisti¤i; α =0,05 için Z çizelgesinden 0,45 olas›l›¤›na karfl›l›k gelen Zα = Z0.05 = 1,645 de¤erini buluruz. (Kitab›n sonundaki Z tablosuna bak›n›z). Red Bölgesini; Zh > Zα ise H0 red edilir, H1 kabul edilir fleklinde tan›mlar›z. Test istatisti¤i; Zh = X−µ σ X σ = X SIRA S‹ZDE D Ü fi Ü N E L ‹ M S O R U D‹KKAT SIRA S‹ZDE AMAÇLARIMIZ ÖRNEK K ‹ T A P TELEV‹ZYON ‹NTERNET Zh = σ n = 1 = 0, 177 32 SIRA S‹ZDE 48 − 50 = 11, 3 0,177 D Ü fi Ü N E L ‹ M Karar : Zh> Zα oldu¤undan H0 hipotezi reddedilir, H1 hipotezi kabul edilir. Müflterinin iddias› do¤rudur. Seramik yap›flt›r›c› torbalar›na 50 kg’dan daha az malS O R U zeme doldurulmaktad›r. Karar aflamas›nda, test istatisti¤i teorik istatisti¤in pozitif de¤eri ile karfl›laflt›D ‹ K K A hesaplanan T r›ld›¤›ndan, örnek kütle ortalamas›n›n ana kütle ortalamas›ndan küçük oldu¤u durumlarda, test istatisti¤ini hesaplarken bulunan de¤erin mutlak de¤erini almak gerekmektedir. N N SIRA S‹ZDE Bir kent merkezine kullanma suyu sa¤layan göletin kurflun içeri¤i ortalamas›n›n AMAÇLARIMIZ 3 mg/kg oldu¤u bilinmektedir. Göletin kurflun içeri¤inde de¤iflim olup olmad›¤› hususunda yap›lan bir araflt›rma kapsam›nda, göletten al›nan 40 örne¤in analizK ‹ T Akurflun P leri yap›ld›¤›nda içeri ortalamas›n›n 3,4 mg/kg ve standart sapmas›n›n 1,5 mg/kg oldu¤u belirlenmifltir. %5 anlaml›l›k düzeyine göre göletin kurflun içeri¤i ortalamas›nda de¤iflim olmufl mudur? TELEV‹ZYON Çözüm : Veriler; μ = 3 mg/kg, n=40, X =5 mg/kg ve S= 1,5 mg/kg d›r. Ana kütle standart sapmas› (σ ) bilinmemekle birlikte, n>30 oldu¤undan σ =S=1,5 mg/kg alabiliriz. ‹NTERNET Hipotezler; H0 : X = μ = 3 mg/kg H1 : X ≠ μ = 3 mg/kg (Çift tarafl› test) Anlaml›l›k düzeyine göre teorik test istatisti¤i; α =0,05 oldu¤undan α /2=0,025 için Z çizelgesinden 0,475 olas›l›¤›na karfl›l›k gelen Zα /2 = Z0.025 = 1,96 de¤erini buluruz. Z tablosuna bak›n›z). Red Bölgesini; Zh > Zα /2 ise H0 red edilir, H1 kabul edilir fleklinde tan›mlar›z. 97 5. Ünite - ‹statistiksel Karar Vermede Hipotez Testleri Test istatisti¤i; X−µ σ Zh = X σ = X Zh = σ = n 1, 5 = 0, 237 40 3, 4 − 3 = 1, 69 0, 237 Karar : Zh< Zα /2 oldu¤undan H0 hipotezi kabul edilir, H1 hipotezi red edilir. %95 olas›l›kla gölet suyu kurflun kirlili¤i ortalamas›nda de¤iflim olmam›flt›r. Farkl›l›k rassal olarak, örnekleme hatalar›ndan meydana gelmifl olabilir. Günlük ortalama üretimi 880 ton olan bir kömür iflletmesinde, yeni bir yöntemin SIRA S‹ZDE üretimi artt›rd›¤› ileri sürülmektedir. ‹ddiay› incelemek üzere arda arda 50 günün üretimi ele al›narak yap›lan hesaplamalar sonucunda ortalama üretimin 892 ton ve standart sapman›n 21 ton oldu¤u D Ü fi Ü N E L ‹ M bulunmufltur. Üretimin gerçekten art›p artmad›¤›n› %5 anlaml›l›k düzeyine göre test ediniz. 1 SIRA S‹ZDE D Ü fi Ü N E L ‹ M Küçük Örneklemelerde Ortalamalar›n Testi S O R U S O R U Örnek say›s›n›n 30’dan fazla oldu¤u büyük örneklemelerde, örneklerin istatistiksel da¤›l›m› normal olabilmektedir. Ancak, araflt›rmaya ayr›lan para, zaman ve materD‹KKAT yalin k›s›tl› oldu¤u durumlarda büyük örnekleme (n>30) yapma olana¤› olmayabilmektedir. Örnek say›s›n›n 30’dan küçük oldu¤u durumlarda ise örneklerin daSIRA S‹ZDE ¤›l›fl› normal da¤›l›m göstermez. Ayr›ca, örnek say›s› az oldu¤unda (n<30), σ yerine S kullan›lamaz. Örnek büyüklü¤ünün 30’dan az oldu¤u küçük örneklerde, red bölgesinin tan›mlanmas›nda ve test istatisti¤inin hesaplanmas›nda Student (t) da¤›AMAÇLARIMIZ l›fl›n›n özelliklerinden yararlan›l›r. Student t da¤›l›fl› simetrik bir da¤›l›fl olup, ortalamas› s›f›rd›r. Normal da¤›l›fla göre daha yayvan bir flekil gösterir. Student t da¤›l›fl›n›n serbestlik (v) deK ‹ T derecesi A P nilen bir tane parametresi vard›r ve v=n-1 ile ifade edilir. Küçük örneklemelerde red bölgesinin tan›mlanmas›nda, öncelikle belirli bir anlaml›l›k düzeyi ve v = n -1 serbestlik derecesi için StudentT EtL da¤›l›m› E V ‹ Z Y O N çizelgelerinden, red bölgesi s›n›r›n› ifade eden teorik test istatisti¤i de¤eri belirlenir. H1 hipotezinin tek tarafl› veya çift tarafl› olmas›na göre ; • Tek tarafl› test için tα ,v ‹NTERNET • Çift tarafl› test için tα /2,v belirlendikten sonra ise red bölgesi tan›mlan›r. Küçük örneklemeler için ortalamalar›n testinde, test istatisti¤ini afla¤›daki eflitlik yard›m›yla hesaplayabiliriz. t da¤›l›fl›n›n varyans› normal da¤›l›fl›n varyans›ndan büyük olup, serbestlik D‹KKAT derecesi büyüdükçe aradaki fark azal›r. Serbestlik derecesi (n-1)SIRA > 30 S‹ZDE oldu¤unda t da¤›l›fl› Z da¤›l›fla çok yaklafl›r. Örne¤in, 30 serbestlik derecesi ile α AMAÇLARIMIZ = 0,05 için t o, 05,30 = 1, 697 iken N N th = X −µ S X Burada, SX : ana kütle ve örnek kütle ortalamalar› aras›ndaki farklar›n da¤›l›m›n›n standart hatas› (standart sapmas›) olup, afla¤›daki eflitlikle hesaplan›r. SX = S n Z0.05 = 1, 645 ‘dir. K ‹ T A P TELEV‹ZYON ‹NTERNET 98 Co¤rafi Bilgi Sistemleri ‹çin Temel ‹statistik Teorik test istatisti¤inin belirlenmesi ve test istatisti¤inin hesaplanmas› sonras›nda afla¤›daki kararlar› verebiliriz. • th > tα, v veya tα /2,v ise, th red bölgesinde kalaca¤›ndan H0 hipotezi red edilir ve H1 kabul edilir. • th < tα /v veya tα /2,v ise, th kabul bölgesinde kalaca¤›ndan H0 hipotezi kabul edilir ve H1 red edilir. ÖRNEK Bir kent merkezinde bulunan bulvarda, araçlar›n h›z s›n›rlamas›na uymamalar› nedeniyle ortalama her ay 5 trafik kazas› meydana gelmektedir. Bulvar girifllerine yap›lan h›z kesiciler sonras›nda, 6 ay boyunca meydana gelen ayl›k trafik kazalar› araflt›r›ld›¤›nda, ayl›k trafik kazas› ortalamas›n›n 4,7 ve standart sapmas›n›n 0,7 oldu¤u belirlenmifltir. %5 anlaml›l›k düzeyi için trafik kazalar›nda azalma meydana gelip gelmedi¤ini test ediniz. Çözüm : Veriler; μ =5 kaza/ay, n=6, X = 4,7 kaza/ay ve S= 0,7 kaza/ay d›r. Hipotezler; H0 : X = μ = 5 kaza/ay H1 : X < μ = 5 kaza/ay (Tek tarafl› test) Anlaml›l›k düzeyine göre teorik test istatisti¤i; α =0,05 ve v=n-1=6-1=5 oldu¤undan, t çizelgesinden tα ,v = t0.05,5 = 2,015 de¤e rini buluruz. (Kitab›n sonundaki t tablosuna bak›n›z). Red Bölgesini; th > tα ,v ise H0 red edilir, H1 kabul edilir fleklinde tan›mlar›z. Test istatisti¤i; th = X−µ S X SX = th = S n = 0, 7 = 0, 286 6 4, 7 − 5 = 1, 049 0, 286 Karar : th < tα ,v oldu¤undan H0 hipotezi kabul edilir, H1 hipotezi red edilir. %95 olas›l›kla h›z kesiciler trafik kazalar›nda azalma sa¤lamam›flt›r. Farkl›l›k rassal olarak, örnekleme hatalar›ndan meydana gelmifl olabilir. ÖRNEK Bir kepçeli yükleyicinin yükleme, kepçeyi doldurma, 20 m tafl›ma, yükü boflaltma ve geri dönüfl için geçecek süre hakk›nda katalo¤unda verilen ortalama süre 200 saniyedir. ‹fl yerinde çal›flma s›ras›nda yap›lan 12 adet zaman etüdü sonucunda, süre ortalamas› 260 sn ve standart sapmas› 45 sn olarak bulunmufltur. Bu zaman etüdü sonucuna göre, katalogda verilen sürelerin her iflletme koflullar› için de kullan›l›p kullan›lmayaca¤›n› %1 anlaml›l›k düzeyi için test ediniz. 99 5. Ünite - ‹statistiksel Karar Vermede Hipotez Testleri Çözüm : Veriler; μ =200 sn, n=12, X =260 sn ve S= 45 sn dir. Hipotezler; H0 : X = μ = 200 sn H1 : X ≠ μ = 200 sn (Çift tarafl› test) Anlaml›l›k düzeyine göre teorik test istatisti¤i; α =0,01 ve α / 2 = 0,005 , v=n-1=12-1=11 oldu¤undan, t çizelgesinden tα /2.v = t0.005,11 = 3,106 de¤erini buluruz. Red Bölgesini; th > tα/2, v ise H0 red edilir, H1 kabul edilir fleklinde tan›mlar›z. Test istatisti¤i; X−µ S th = X SX = S n th = = 45 = 12, 99 12 260 − 200 = 4, 62 12, 99 Karar : th > tα/2, v oldu¤undan H0 hipotezi red, H1 hipotezi kabul edilir. %99 olas›l›kla katalogdaki de¤erler her iflletme koflulu için uygun de¤ildir. S‹ZDEakarsuya kaBir bölgede erozyon nedeniyle y›lda 1 km2’lik alandan ortalama 50 tonSIRA topra¤›n r›flt›¤› bilinmektedir. Erozyonu önlemek amac›yla yap›lan a¤açland›rma çal›flmalar› sonras›nda 5 y›l boyunca akarsuya kar›flan toprak miktar› araflt›r›lm›fl ve toprak kar›flma miktar› ortaD Ü fi Ü N E L ‹ M lamas›n›n y›ll›k 35 ton ve standart sapmas›n›n 15 ton oldu¤u belirlenmifltir. %5 anlaml›l›k düzeyine göre a¤açland›rma çal›flmalar›n›n erozyon miktar›n› azalt›p azaltmad›¤›n› test ediniz. ANA KÜTLE ORANINA ‹L‹fiK‹N TESTLER 2 S O R U D Ü fi Ü N E L ‹ M S O R U Baz› araflt›rmalarda belirli bir olay›n meydana gelme olas›l›¤› veya belirli bir birim D‹KKAT içindeki oran› önemli olabilmektedir. Oranlarla ifade edilen bu gibi istatistiksel olaylarda, ana kütleden çekilecek n birimlik örneklerin oranlar› hesaplanarak, ana kütle oran› hakk›nda karar vermek mümkün olabilmektedir. SIRA S‹ZDE Ana kütle oran›n›n (π) bilindi¤i bir durumda, ana kütleden elde edilen n birimlik örnek kütle oran›n›n (P) ana kütle oran› ile ne derecede uyumlu olup olmad›AMAÇLARIMIZ ¤›n› test etmede H0 hipotezini; N N H0 : P = π SIRA S‹ZDE K ‹ T A P D‹KKAT SIRA S‹ZDE AMAÇLARIMIZ K ‹ T A P fleklinde kurar›z. Örnek kütle oran› ile ana kütle oran›n›n birbirine eflit oldu¤u kabulüne dayanan H0 hipotezine karfl›t olarak ise H1 hipotezi üç farkl› flekilde kurabiliriz. H1 : P ≠ π (Çift tarafl› test) H1 : P > π (Tek tarafl› test) H1 : P < π (Tek tarafl› test) TELEV‹ZYON TELEV‹ZYON ‹NTERNET ‹NTERNET 100 Co¤rafi Bilgi Sistemleri ‹çin Temel ‹statistik Büyük Örneklemelerde Oranlar›n Testi Büyük örneklemelerde oranlar›n testinde de, belirli bir anlaml›l›k düzeyi için red bölgesinin tan›mlanmas› ve teorik test istatisti¤inin belirlenmesi, ortalamalar›n testindekinin benzeri flekilde yap›l›r. Daha sonra ise, test istatisti¤inin hesaplanmas›na geçilir. Ana kütleden yap›lacak n’er bireylik büyük örneklemeler sonucunda, her seferinde ana kütle oran› (π) ile örnek kütle oranlar› (P) aras› farklar› hesaplar ve bu farklar›n da¤›l›m›n› araflt›r›rsak, oranlar aras› farklar›n da¤›l›m› normal da¤›l›m gösterir. Bu nedenle, büyük örneklemeler için oranlar›n testinde, test istatisti¤ini afla¤›daki standart normal de¤er (Zh) eflitli¤i yard›m›yla hesaplayabiliriz. Zh = P−π σπ Burada, σ π : ana kütle ve örnek kütle oranlar› aras›ndaki farklar›n da¤›l›m›n›n standart hatas› (standart sapmas›) olup, afla¤›daki eflitlikle hesaplan›r. σπ = Ana kütle oran› varyans›n›n bilinmedi¤i, fakat örnek kütle oran› varyans›n›n [P.(1-P)] bilindi¤i büyük örneklemelerde, π .(1-π )=P.(1-P) kabul edilebilmektedir. ÖRNEK π.(1 − π ) n Bu eflitlikte ise, π.(1-π) : ana kütle oran›n›n varyans› ve n: örnek kütlenin birey say›s›d›r. Teorik test istatisti¤inin belirlenmesi ve test istatisti¤inin hesaplanmas› sonras›nda, hipotezlerin kabulü veya red edilmesi karar› da, ortalamalar›n testi yöntemindekine benzer flekilde yap›l›r. Bir karayolu ulafl›m flirketi flehirler aras› yolculuklarda koltuklar›n günlük doluluk oran› ortalamas›n›n %60 oldu¤unu tahmin etmektedir. Ancak, son reklam kampanyas› sonras›nda doluluk oran› ortalamas›n›n art›¤›n› iddia etmektedir. Bu amaçla 60 günlük verilerin ortalamas›n› hesaplad›¤›nda doluluk oran› ortalamas›n›n %75 oldu¤unu hesaplam›flt›r. Ulafl›m flirketi günlük koltuk doluluk oran› ortalamas›n›n art›p artmad›¤›n› %5 anlaml›l›k düzeyi için test ediniz. Çözüm : Veriler; π=0,60 , n=60, P=0,75 dir. Hipotezler; H0 : P = π = 0,60 H1 : P > π = 0,60 (Tek tarafl› test) Anlaml›l›k düzeyine göre teorik test istatisti¤i; α =0,05 oldu¤undan Z çizelgesinden 0,45 olas›l›¤›na karfl›l›k gelen Zα = Z0.05 = 1,645 de¤erini buluruz. Red Bölgesini; Zh > Zα ise H0 red edilir, H1 kabul edilir fleklinde tan›mlar›z. Test istatisti¤i; Zh = P−π σπ 101 5. Ünite - ‹statistiksel Karar Vermede Hipotez Testleri σπ = Zh = π.(1 − π ) 0, 60.(1 − 0, 60) = = 0, 063 n 60 0, 75 − 0, 60 = 2, 38 0, 063 Karar : Zh> Zα oldu¤undan H0 hipotezi red, H1 hipotezi kabul edilir. %95 olas›l›kla reklam kampanyas› ile ulafl›m flirketinin günlük koltuk doluluk oran› artm›flt›r. Maden iflletmelerinde kullan›lan kaz› makinelerinin fiili çal›flma/ teorik çal›flma SIRA S‹ZDE zaman› oran›n›n %60 oldu¤u bilinmektedir. Bir araflt›rmac› ise kömür iflletmelerinde 200 adet kaz›c› makine çal›flma oranlar›n› araflt›rd›¤›nda %70 oldu¤unu tesbit etmifltir. Acaba kömür iflletmeleÜ fi Ü N E Liçin ‹ M test ediniz. rinde kaz›c› makine çal›flma oranlar› daha m› yüksektir? %1 anlaml›l›kDdüzeyi Küçük Örneklemelerde Oranlar›n Testi 3 S O R U Küçük örneklemeler için oranlar›n testinde, test istatisti¤ini afla¤›daki eflitlik yard›m›yla hesaplayabiliriz. D‹KKAT P−π th = SP SIRA S‹ZDE N N Burada, Sp : ana kütle ve örnek kütle ortalamalar› aras›ndaki farklar›n da¤›l›m›n›n standart hatas› (standart sapmas›) olup, afla¤›daki eflitlikle hesaplan›r. AMAÇLARIMIZ SP = P.(1 − P) n S O R U D‹KKAT SIRA S‹ZDE AMAÇLARIMIZ K ‹ T A P TELEV‹ZYON TELEV‹ZYON Üniversite s›navlar›na haz›rl›k dershanelerinden birisi, üniversite girifl s›navlar›nda ö¤rencilerinin %70’inden fazlas›n›n dört y›ll›k lisans programlar›na yerleflebildi¤ini iddia etmektedir. 2010 y›l›nda rassal olarak seçilen 16‹ Nö¤rencinin 10’u liTERNET sans programlar›na yerleflmifltir. %1 anlaml›l›k düzeyine göre iddian›n do¤ru olup olmad›¤›n› test ediniz. Çözüm : Veriler; π = 0,70 , n=16, P = 10/16 = 0,625 dir. Hipotezler; H0 : P = π = 0,70 H1 : P > π = 0,70 (Tek tarafl› test) Anlaml›l›k düzeyine göre teorik test istatisti¤i; α =0,01 ve v=n-1=16-1=15 oldu¤undan, t çizelgesinden tα .v = t0.01,15 = 2,602 de¤erini buluruz. v D Ü fi Ü N E L ‹ M K ‹ T A P Teorik test istatisti¤inin belirlenmesi ve test istatisti¤inin hesaplanmas› sonras›nda, hipotezlerin kabulü veya red edilmesi karar› da, küçük örneklemeler için ortalamalar›n testi yöntemindekine benzer flekilde yap›l›r. Red Bölgesini; th >tα, SIRA S‹ZDE ise H0 red edilir, H1 kabul edilir fleklinde tan›mlar›z. ÖRNEK ‹NTERNET 102 Co¤rafi Bilgi Sistemleri ‹çin Temel ‹statistik Test istatisti¤i; P−π SP th = SP = th = P.(1 − P) 0, 625.(1 − 0, 625) = = 0,121 n 16 0, 625 − 0, 7 = 0, 62 0, 121 Karar : th < tα, v oldu¤undan H0 hipotezi kabul, H1 hipotezi red edilir. %99 olas›l›kla dershanenin iddias› yanl›flt›r. ANA KÜTLE ORTALAMALARI ARASINDAK‹ FARKLARIN TEST‹ Ana kütle ortalamalar› aras›ndaki farklar›n testinde amaç, iki ayr› ana kütle ortalamas› aras›nda fark olup olmad›¤›na hipotez testi yöntemi ile karar vermektir. ‹ki ana kütle ortalamalar› aras›ndaki farklar› test ederken, her iki ana kütlenin de normal da¤›l›ma sahip olmas› ve örneklem seçimlerinin birbirinden ba¤›ms›z olmas› gerekir. Ayr›ca, ana kütle birey say›lar›n›n da sonsuz büyüklükte olmas› gerekir. Ana kütle ortalamalar›n›n μ 1 ve μ 2 oldu¤u bilinen veya tahmin edilen iki ayr› ana kütleden n1 ve n2 birimlik örnekler al›r ve örnek kütlelerin ortalamalar›n› ( X 1 ve X 2) ve standart sapmalar›n› (S1 ve S2) hesaplarsak, bu örnek kütle ortalamalar› yard›m›yla ana kütle ortalamalar› aras›nda anlaml› bir fark olup olmad›¤›na hipotez testi yöntemiyle karar verebiliriz. Hipotez testinde, ana kütle ortalamalar› aras›nda fark olmad›¤›n› ifade eden H0 hipotezini afla¤›daki gibi kurar›z. H0 : ( X 1- X 2) = (μ 1−μ 2) =0 Örnek kütle ortalamalar› aras›ndaki farklara göre, ana kütle ortalamalar› aras›nda da fark oldu¤u iddias› ile H1 hipotezini de; H1 : ( X 1- X 2 ) > (μ 1-μ 2) = 0 (Tek tarafl› test) H1 : ( X 1- X 2 ) < (μ 1-μ 2) = 0 (Tek tarafl› test) H1 : ( X 1- X 2 ) ≠ (μ 1-μ 2) = 0 (Çift tarafl› test) olarak üç farkl› flekilde oluflturabiliriz. Büyük Örneklemelerde Ana Kütle Ortalamalar› Aras›ndaki Farklar›n Testi Büyük örneklemelerde ana kütle ortalamalar› aras›ndaki farklar›n testinde test istatisti¤i (Zh); Zh = ( X1 − X 2 ) − (µ1 − µ2 ) σ X1 − X 2 eflitli¤i ile hesaplanmaktad›r. Burada, σX1 −X 2 : ortalama farklar› da¤›l›m›n›n standart hatas› olup, afla¤›daki eflitlikle hesaplanabilir. 5. Ünite - ‹statistiksel Karar Vermede Hipotez Testleri σX -X = 1 2 σ12 n1 + σ22 n2 Burada da, σ 1 ve σ 2 : iki ayr› ana kütlenin standart sapmas›d›r. Teorik test istatisti¤inin belirlenmesi ve test istatisti¤inin hesaplanmas› sonras›nda, hipotezlerin kabulü veya red edilmesi karar› da, ortalamalar›n testi yöntemindekine benzer flekilde yap›l›r. Bir kömür havzas›nda bulunan iki ayr› kömür madeni oca¤›ndan al›nan örnekler üzerinde yap›lan ›s›l de¤er (kilokalori/kilogram) analizleri sonucunda afla¤›daki veriler elde edilmifltir. Bu analiz sonuçlar›na göre iki kömür madeni oca¤›n›n ortalama ›s›l de¤erleri aras›nda önemli bir fark var m›d›r? %95 güven seviyesine göre test ediniz. Kömür Oca¤› No n Örnek Büyüklü¤ü Ortalama (kcal/kg) S Std. Sapma (kcal/kg) 1 30 3600 900 2 40 3200 700 X Çözüm : Veriler; μ 1 - μ 2 = 0 kcal/kg, n1= 30 ve n2= 40, X 1= 3600 kcal/kg ve X 2=3200 kcal/kg, S1=900 kcal/kg ve S2=700 kcal/kg d›r. Ana kütlelerin standart sapmalar› (σ 1 ve σ 2) bilinmemekle birlikte, n1 ve n2>30 oldu¤undan σ 1 = S1 ve σ 2 = S2 kabul edebiliriz. Hipotezler; H0 : ( X 1 - X 2) = (μ 1−μ 2) =0 H1 : ( X 1 - X 2) ≠ (μ 1−μ 2) = 0 (Çift tarafl› test) Anlaml›l›k düzeyine göre teorik test istatisti¤i; α =0,05 oldu¤undan α /2=0,025 için Z tablosundan 0,475 olas›l›¤›na karfl›l›k gelen Zα /2 = Z0.025 = 1,96 de¤erini buluruz. Red Bölgesini; Zh > Zα Test istatisti¤i; Zh = ise H0 red edilir, H1 kabul edilir fleklinde tan›mlar›z. (X1 - X2 )- (µ1 - µ2 ) σ σX -X = 1 2 Zh = /2 X1 - X 2 σ12 σ2 9002 7002 + 2 = + = 198,1 kcal/kg n1 n2 30 40 (3600 -3200)-0 = 2,02 198,1 Karar : Zh> Zα /2 oldu¤undan H0 hipotezi red, H1 hipotezi kabul edilir. %95 olas›l›kla iki kömür madeni oca¤›n›n ›s›l de¤er ortalamalar› aras›nda önemli ve anlaml› farklar vard›r. 103 Ana kütlelerin standart sapmalar›n›n bilinmedi¤i (σ 1 ve σ 2), fakat örnek kütlelerin standart sapmalar›n›n (S1 ve S2) hesapland›¤› büyük örneklemelerde (n1 ve n2>30), σ 1 = S1 ve σ 2 = S2 kabul edilebilmektedir. ÖRNEK 104 Co¤rafi Bilgi Sistemleri ‹çin Temel ‹statistik Küçük Örneklemelerde Ortalamalar Aras›ndaki Farklar›n Testi Küçük örneklemelerde ana kütle ortalamalar› aras›ndaki farklar için test istatisti¤i (th); th = (X1 - X2 ) - (µ1 - µ2 ) S X1 - X 2 eflitli¤i ile hesaplanmaktad›r. Burada, : iki örnek kütle ortalama farklar› da¤›l›m›n›n standart hatas› olup, afla¤›daki eflitlikle hesaplanabilir (Serper, 2000). SIRA S‹ZDE D Ü fi Ü N E L ‹ M S O R U D‹KKAT SIRA S‹ZDE ÖRNEK AMAÇLARIMIZ K ‹ T A P TELEV‹ZYON ‹NTERNET (n1.S12 ) + (n2 .S22 ) 1 1 SX -X SIRA = S‹ZDE . + 1 2 n1 + n2 -2 n1 n2 Burada, S1 ve S2: iki ayr› örnek kütlenin standart sapmas›; n1 ve n2 : iki ayr› örD Ü fi Ü N E L ‹ M nek kütlenin birey say›lar›d›r. Küçük örneklemelerde teorik test istatisti¤inin (tα veya tα /2) belirlenmesinde, S O R U v = n +n - 2 olarak al›n›r (Serper, 2000). serbestlik derecesi 1 2 Küçük örneklemelerde D ‹ K K A T her iki ana kütleden al›nan örneklerin toplam› 30’dan küçük olmal›d›r. N N SIRA S‹ZDE ‹ki ayr› firma taraf›ndan üretilen dizüstü bilgisayarlar›n›n pillerinin flarj olduktan sonraki dayan›m sürelerinin farkl› oldu¤u iddia edilmektedir. Bu iddiay› kan›tlamak AMAÇLARIMIZ amac›yla firmalar›n bilgisayarlar›ndan örnekler al›nm›fl ve dayan›m süreleri test edildi¤inde afla¤›daki veriler elde edilmifltir. Bu analiz sonuçlar›na göre iki bilgisayar firmas› ürünlerinin ortalama pil dayan›m süreleri aras›nda önemK ‹bir T Afark P var m›d›r? %1 anlaml›l›k düzeyine göre test ediniz. li ve anlaml› Bilgisayar TELEV‹ZYON Firma No n Örnek Büyüklü¤ü Ortalama (Saat) S Std. Sapma (Saat) 1 5 6,2 0,9 2‹ N T E R N E T 6 5,4 0,7 X Çözüm : Veriler; μ 1− μ 2 = 0 Saat, n1 = 5 ve n2 = 6 , X 1=6,2 Saat ve X 2=5,4 Saat, S1=0,9 Saat ve S2=0,7 Saat dir. Hipotezler; H0 : ( X 1- X 2) = (μ 1− μ 2) = 0 H1 : ( X 1- X 2) ≠ (μ 1μ− 2) = 0 (Çift tarafl› test) Anlaml›l›k düzeyine göre teorik test istatisti¤i; α =0,01 ve α/ 2 = 0,005 , v=n1 + n2 - 2 = 5 + 6 - 2 = 9 oldu¤undan, t tablosundan tα /2.v = t0.005,9 = 3,250 de¤erini buluruz. Red Bölgesini; th>tα /2,v ise H0 red edilir, H1 kabul edilir fleklinde tan›mlar›z. 105 5. Ünite - ‹statistiksel Karar Vermede Hipotez Testleri Test istatisti¤i; th = (X1 - X2 ) - (µ1 - µ2 ) S SX - X = 1 2 th = X1 - X 2 (n1.S12 )+ (n2 .S22 ) n1 + n2 -2 . 1 1 (5.6,22 ) + (6.5,42 ) 1 1 . + = 3,87 + = 5+ 6 -2 5 6 n1 n2 (6,2-5,4)-0 = 0,21 3,87 Karar : th< tα/ 2,v oldu¤undan H0 hipotezi kabul, H1 hipotezi red edilir. %99 olas›l›kla bilgisayar firmalar›n›n ürünlerinin ortalama pil ömürleri aras›nda anlamal› bir fark yoktur. Bir ilaç firmas› eski A ilac›na göre yeni gelifltirdi¤i B ilac›n›n ayn› hastal›¤a yakalanm›fl kiSIRA S‹ZDE flilerin ortalama iyileflme sürelerini daha da k›saltt›¤›n› iddia etmektedir. Bu amaçla ayn› hastal›¤a yakalanm›fl iki farkl› hasta grubuna ilaçlar verilmifl ve afla¤›daki veriler elde edilD Ü fi Ü N Eazaltm›fl L‹M mifltir. %5 anlaml›l›k düzeyine göre yeni gelifltirilen ilaç iyileflme süresini m›d›r? 4 S O R U X ‹laç Ad› n Örnek Büyüklü¤ü A 10 48 B 12 38 VARYANSLARIN TEST‹ Ortalama Süre (Saat) 12 N N 10 AMAÇLARIMIZ Normal da¤›l›ml› ve varyans› bilinen bir ana kütleden n bireylik örnekleme yaparak bu örnek kütlenin varyans›n› (S2) hesaplarsak, S2’nin anaK kütle varyans›ndan ‹ T A P 2 (σ ) farkl› oldu¤u konusundaki bir iddiay› hipotez testi yöntemiyle test edebiliriz. Büyük örneklemelerde (n ≥ 30) , örnek kütle varyans› ile ana kütle varyans› birbirine birbirine eflit (σ 2 = S 2) kabul edilebildiklerinden, örnek kütle varyans› yard›TELEV‹ZYON m›yla ana kütle varyans› hakk›nda karar vermek mümkündür. Bu nedenle, varyanslar›n testi genellikle küçük örneklemeler için yap›lmaktat›r. Ana kütle varyans›n›n test edilmesinde H0 hipotezi; H0 : S 2 = σ ‹NTERNET 2 fleklinde kurulur. Uygulanan yeni teknoloji veya yöntemin ana kütle varyans›n› de¤ifltirmedi¤i kabulüne dayanan H0 hipotezine karfl›t olarak ise H1 hipotezi üç farkl› flekilde oluflturulabilir. H1 :S 2 ≠ σ 2 (Çift tarafl› test) H1 :S 2 > σ 2 (Tek tarafl› test) H1 :S 2 < σ 2 (Tek tarafl› test) D Ü fi Ü N E L ‹ M S O R U S Std. Sapma D‹KKAT (Saat) SIRA S‹ZDE SIRA S‹ZDE D‹KKAT SIRA S‹ZDE AMAÇLARIMIZ K ‹ T A P TELEV‹ZYON ‹NTERNET 106 Co¤rafi Bilgi Sistemleri ‹çin Temel ‹statistik H1 hipotezinin tek tarafl› veya çift tarafl› olmas›na göre red bölgesini tan›mlamada kullan›lan teorik test istatisti¤i de¤eri afla¤›daki flekilde belirlenir. 2 -Tek tarafl› test için χa,v Varyanslar›n testinde red bölgesinin tan›mlanmas›nda ve test istatisti¤inin hesaplanmas›nda Khi-kare (χ 2) da¤›l›fl›ndan yararlan›lmaktad›r. Red bölgesinin tan›mlanmas›nda, öncelikle belirli bir α anlaml›l›k düzeyi ve v=n-1 serbestlik derecesi için χ 2 da¤›l›m› çizelgelerinden, red bölgesi s›n›r›n› ifade eden teorik test istatisti¤i de¤eri belirlenir. Varyanslar›n testinde, test istatisti¤ini afla¤›daki eflitlik yard›m›yla hesaplayabiliriz. -Çift tarafl› test için 2 χa/2,v χ2h = (n -1).S2 σ2 Burada, S2= örnek kütle varyans›n›, σ 2= ana kütle varyans›n› ve n= örnek kütle birey say›s›n› göstermektedir. Teorik test istatisti¤inin belirlenmesi ve test istatisti¤inin hesaplanmas› sonras›nda afla¤›daki kararlar› verilebiliriz. 2 2 2 2 • χh > χa,v veya χa/ 2,v ise, χh red bölgesinde kalaca¤›ndan H0 hipotezi red edilir ve H1 kabul edilir. 2 2 2 2 • χh > χa,v veya χa/ 2,v ise, χh kabul bölgesinde kalaca¤›ndan H0 hipotezi kabul edilir ve H1 red edilir. ÖRNEK Bir çelik halat fabrikas›n›n üretti¤i 20 mm çapl› halatlar›n en küçük kopma mukavemetlerinin 225 kN ve standart sapmas›n›n 25 kN oldu¤u bilinmektedir. Ancak bir asansör imalatç›s› firma, çelik halat fabrikas›ndan sat›n ald›¤› 20 mm çapl› 10 adet halattan ald›¤› numuneler üzerinde yapt›¤› deneyler sonucunda kopma mukavemeti ortalamas›n›n 250 kN ve standart sapmas›n› 35 kN bulmufltur. Bunun üzerine, çelik halatlar›n kopma mukavemeti standart sapmas›n›n 25 kN’dan fazla oldu¤unu iddia etmeye bafllam›flt›r. %5 anlaml›l›k düzeyi için asansör firmas›n›n iddias›n› test edininiz. Çözüm : Veriler; σ = 25 kN ve σ (kN)2 dur. Hipotezler; 2= 625 (kN)2 , n = 10 , S=35 kN ve S2=1225 H0 : S2 = σ 2 = 625 (kN)2 H1 : S2 > σ 2 = 625 (kN)2 (Tek tarafl› test) Anlaml›l›k düzeyine göre teorik test istatisti¤i; 2 2 α =0,05 ve v=n-1=10-1=9 oldu¤undan, χ 2 tablosundan χa,v = χ0.05,9 = 16,919 de¤erini buluruz. (Kitab›n sonundaki χ 2 tablosuna bak›n›z). 2 2 Red Bölgesini; χh > χa,v ise H0 red, H1 kabul edilir fleklinde tan›mlar›z. Test istatisti¤i; χh2 = (n -1).S2 σ 2 = (10-1).1225 =17,64 625 107 5. Ünite - ‹statistiksel Karar Vermede Hipotez Testleri 2 2 Karar : χh > χa,v oldu¤undan H0 hipotezi red, H1 hipotezi kabul edilir. %95 olas›l›kla asansör firmas›n›n iddias› do¤rudur. Çelik halat fabrikas›n›n ürün standartlar›n› iyilefltirmesi gerekmektedir. Bir çimento fabrikas›n›n üretti¤i çimentodan yap›lan betonlar›n sa¤laml›¤›n›n SIRA S‹ZDEstandart sapmas›n›n 10 kg/cm2 ‘den fazla oldu¤u iddia edilmektedir. ‹ddiay› test etmek amac› ile 16 beton – örne¤i al›nm›fl ve bu örneklerin sa¤laml›klar›n›n ortalamas› X= 320 kg/cm2 ve standart sapD Ü fi Ü N E L ‹ M mas› S= 14 kg/cm2 olarak bulunmufltur. %5 anlaml›l›k düzeyine göre iddiay› test ediniz. 5 SIRA S‹ZDE D Ü fi Ü N E L ‹ M S O R U S O R U D‹KKAT D‹KKAT SIRA S‹ZDE AMAÇLARIMIZ N N SIRA S‹ZDE AMAÇLARIMIZ K ‹ T A P K ‹ T A P TELEV‹ZYON TELEV‹ZYON ‹NTERNET ‹NTERNET 108 Co¤rafi Bilgi Sistemleri ‹çin Temel ‹statistik Özet N A M A Ç 1 ‹statistiksel hipotez testi kavramlar›n› aç›klayabilmek, test sürecinin aflamalar›n› ve yap›lacak ifllemleri s›ralamak. Hipotez testinde öncelikle, örnek kütleden elde edilen parametrelerin ana kütle parametreleriyle uyumlu oldu¤unu iddia eden s›f›r hipotezi (Ho hipotezi) ve uyumlu olmad›¤›n› iddia eden karfl›t hipotez (H1 hipotezi) kurulmaktad›r. Daha sonra, belirli bir güven düzeyi belirlenerek, örnek kütle da¤›l›m modeline uygun olarak red ve kabul bölgeleri tan›mlanmaktad›r. Örnek kütle parametresinin ana kütle parametresinden küçük veya büyük oldu¤u iddias› varsa, red bölgesi tek tarafl› olarak; örnek kütle parametresinin ana kütle parametresine eflit olmad›¤› iddias› varsa da red bölgesi çift tarafl› olarak belirlenmektedir. Örnek kütle ve ana kütle parametreleri aras›ndaki fark›n standart hataya oran›na test istatisti¤i denilmekte olup, örnek kütleden elde edilmifl ortalama, oran, varyans gibi parametrelere ve örnekleme büyüklü¤üne göre hesaplanmaktad›r. Hesaplanan test istatisti¤i de¤eri kabul bölgesinin içinde kal›rsa H0 hipotezi kabul edilmekte, tersi durumda ise H0 hipotezi red edilmektedir. N A M A Ç 2 Ana kütle ortalamas›, oran› ve varyans› ile iki ana kütle ortalamalar› aras› farklar›n hipotez testi uygulamalar›n› yapmak. Ana kütle ortalamas›, oran› ve iki ana kütle ortalamalar› aras› farklar›n hipotez testinde, örnek kütlede bulunan örnek say›s›n›n 30’dan büyük oldu¤u (n ≥ 30) ve örneklerin normal da¤›l›m gösterdi¤i durumlarda, belirli bir α anlaml›l›k düzeyinde red bölgesinin s›n›r›n› ifade eden teorik test istatisti¤i de¤eri standart normal da¤›l›m (Z) çizelgelerinden belirlenmektedir. Ana kütle ortalamas›, oran› ve iki ana kütle ortalamalar› aras› farklar›n hipotez testinde, örnek büyüklü¤ünün 30’dan az oldu¤u küçük örneklerde, belirli bir α anlaml›l›k düzeyinde red bölgesinin s›n›r›n› ifade eden teorik test istatisti¤i de¤eri Student (t) çizelgelerinden belirlenmektedir.Varyanslar›n testinde ise red bölgesinin tan›mlanmas›nda ve test istatisti¤inin hesaplanmas›nda Khikare (χ 2) da¤›l›fl›ndan yararlan›lmaktad›r. 5. Ünite - ‹statistiksel Karar Vermede Hipotez Testleri 109 Kendimizi S›nayal›m 1. Bir içme suyu dolum tesisinde üretilen suyun ortalama pH’›n›n 7’den büyük oldu¤u iddias›n› test etmek amac›yla 30 damacanadan örnekleme yap›lm›flt›r. Bu testte, s›f›r hipotezi nas›l kurulur? a. X>µ=7 b. X=µ=7 c. X = µ = 30 d. X > µ = 30 e. X <µ=7 2. Bir içme suyu dolum tesisinde üretilen suyun ortalama pH’›n›n 7’den büyük oldu¤u iddias›n› test etmek amac›yla 30 damacanadan örnekleme yap›lm›fl ve örnek kütle ortalamas› 7,5 ve standart sapmas› 0,5 olarak bulunmufltur. Bu testte, karfl›t hipotez nas›l kurulur? a. X > µ = 7,5 b. X≠µ=7 c. X>µ=7 d. X > µ = 30 e. X < µ = 7,5 3. Ana kütle ortalamas›n›n 50’den büyük olup olmad›¤›n› %5 anlaml›l›k düzeyi için test edilmesi amac›yla 36 bireylik örnek al›nd›¤›nda, örnek kütle ortalamas› 54 ve standart sapmas› 12 olarak belirlenmifltir. Bu durumda test istatisti¤inin de¤eri ne olur? a. 1,05 b. 1,50 c. 1,75 d. 2,00 e. 4,50 4. Ana kütle ortalamas›n›n 36’dan farkl› olup olmad›¤›n› test etmek amac›yla 16 bireylik örnekleme yap›lm›fl olup, örnek kütlenin ortalamas› 32 ve standart sapmas› 8 olarak bulunmufltur. Bu verilerle, teorik test istatisti¤i 2,131 ve hesaplanan test istatisti¤i 2,0 bulundu¤una göre, ana kütle ortalamas› hakk›nda ne karar verilebilir? a. Ana kütle ortalamas› 36’dan büyüktür. b. Ana kütle ortalamas› 36’dan küçüktür. c. Ana kütle ortalamas› 32’ye eflittir. d. Ana kütle ortalamas› 32’den küçüktür. e. Ana kütle ortalamas› 36’ya eflittir. 5. Bir ilaç pazarlama flirketi piyasaya yeni ç›kard›klar› bir ilac›n 3 günlük dozunun solunum yolu enfeksiyonlar›nda %80 oran›ndan daha fazla etkili oldu¤unu iddia etmektedir. Bir sa¤l›k kuruluflunda ilgili ilaç 62 hastada kullan›lm›fl olup %90 oran›nda iyileflme saptanm›flt›r. %5 anlaml›l›k düzeyinde teorik test istatisti¤i 1,645 oldu¤una göre, yeni ilac›n solunum yolu enfeksiyonlar›nda %80 oran›ndan daha fazla etkili oldu¤u iddias› hakk›nda ne karar verilebilir? (Ana kütle ve örnek kütle oranlar› aras›ndaki farklar›n da¤›l›m›n›n standart hatas› σ p=0,05’dir) a. Yeni ilaç %80 oran›ndan daha fazla etkilidir. b. Yeni ilaç %80 oran›ndan daha az etkilidir. c. Yeni ilac›n etkili olup olmad›¤› belirsizdir. d. Yeni ilaç %90 oran›ndan fazla etkilidir. e. Yeni ilaç hiç etkili de¤ildir. 6. Bir iflyerinde çal›flan bayan personelin %50’den fazlas›n›n sürücü ehliyeti olmad›¤› iddas›n› test etmek amac›yla, rassal olarak yap›lan örnekleme sonucunda 15 bayan personelin 6’s›n›n ehliyetinin olmad›¤› belirlenmifltir. Ana kütle ve örnek kütle ortalamalar› aras›ndaki farklar›n da¤›l›m›n›n standart hatas› Sp = 0,125 oldu¤una göre test istatisti¤i (th) kaç olur? a. 0,5 b. 0,6 c. 0,8 d. 1,2 e. 2,0 7. Ayn› motor gücüne ve a¤›rl›klara sahip iki farkl› model binek arac›n›n 100 km’de tükettikleri yak›t ortalamalar› aras›nda fark olmad›¤› iddia edilmektedir. ‹ddiay› test etmek amac›yla her iki model binek arac›ndan rassal olarak seçilen 10’ar arac›n yak›t tüketimi ortalamalar› araflt›r›lm›fl ve %5 anlaml›l›k seviyesi için hipotez testi yap›lm›flt›r. Bu durumda teorik test istataisti¤i olarak afla¤›dakilerden hangisi kullan›l›r? a. Zα = Z0.05 = 1,645 b. Zα/2 = Z0.025 = 1, 96 c. t α,v = t0.05,9 = 1,833 d. t α/2,v = t0.025,9 = 2,262 e. t α/2,n = t0.025,10 = 2,228 110 Co¤rafi Bilgi Sistemleri ‹çin Temel ‹statistik Kendimizi S›nayal›m Yan›t Anahtar› 8. Uygulanan yeni teknoloji veya yöntemin ana kütle varyans›n› de¤ifltirmedi¤i iddias› çift tarafl› olarak test edilmek istendi¤inde, belirli bir α anlaml›l›k seviyesi için hangi teorik test istatisti¤i kullan›l›r? 2 a. χα,V b. 2 χα/2,V e. tα 2. c 3. d 4. e 5. a c. Zα d. Zα 1. b /2 ,v 9. Ana kütle standart sapmas› 4 olan bir ana kütleden rassal olarak 17 örnek al›narak örnek kütle varyans› hesapland›¤›nda 20 oldu¤u belirlenmifltir. Ana kütle varyans›nda de¤iflim olup olmad›¤› hakk›nda karar vermek amac›yla yap›lan hipotez testinde test istatisti¤i ne olur? a. 16 b. 17 c. 18 d. 19 e. 20 10. Ana kütle varyans›n›n 25’den büyük oldu¤u iddias›n› test etmek amac›yla 16 bireylik örnekleme yap›lm›fl olup, örnek kütlenin standart sapmas› 6 olarak bulunmufltur. Bu verilerle, teorik test istatisti¤i 25,0 ve hesaplanan test istatisti¤i 21,6 bulundu¤una göre, ana kütle varyans› hakk›nda ne karar verilebilir? a. Ana kütle varyans› 25’den büyük de¤ildir. b. Ana Kütle varyans› 25’den büyüktür. c. Ana kütle varyans› 25’den küçüktür. d. Ana kütle varyans› 6’dan küçüktür. e. Ana kütle varyans› 6’dan büyük de¤ildir. 6. c 7. d 8. b 9. e 10. a Yan›t›n›z yanl›fl ise, “Hipotezlerin Kurulmas›” konusuna bak›n›z. Yan›t›n›z yanl›fl ise, “Hipotezlerin Kurulmas›” konusuna bak›n›z. Yan›t›n›z yanl›fl ise, “Büyük Örneklemelerde Ortalamalar›n Testi” konusuna bak›n›z. Yan›t›n›z yanl›fl ise, “Küçük Örneklemelerde Ortalamalar›n Testi” konusuna bak›n›z. Yan›t›n›z yanl›fl ise, “Büyük Örneklemelerde Oranlar›n Testi” konusuna bak›n›z. Yan›t›n›z yanl›fl ise, “Küçük Örneklemelerde Oranlar›n Testi” konusuna bak›n›z. Yan›t›n›z yanl›fl ise, “Küçük Örneklemelerde Ortalamalar Aras›ndaki Farklar›n Testi” konusuna bak›n›z. Yan›t›n›z yanl›fl ise, “Varyanslar›n Testi” konusuna bak›n›z. Yan›t›n›z yanl›fl ise, “Varyanslar›n Testi” konusuna bak›n›z. Yan›t›n›z yanl›fl ise, “Varyanslar›n Testi” konusuna bak›n›z. S›ra Sizde Yan›t Anahtar› S›ra Sizde 1 Veriler; μ = 880 ton/gün, n=50, X = 892 ton/gün ve S=21 ton/gün dür. Ana kütle standart sapmas› (σ ) bilinmemekle birlikte, n>30 oldu¤undan σ =S=21 ton/gün alabiliriz. Hipotezler; H0 : X = μ = 880 ton/gün H1 : X > μ = 880 ton/gün (Tek tarafl› test) Anlaml›l›k düzeyine göre teorik test istatisti¤i; α =0,05 oldu¤undan Z çizelgesinden 0,45 olas›l›¤›na karfl›l›k gelen Zα =Z0.05=1,645 de¤erini buluruz. Red Bölgesini; Zh > Zα ise H0 red edilir, H1 kabul edilir fleklinde tan›mlar›z. Test istatisti¤i; Zh = σ X = X -µ σ X σ n = 21 50 = 2, 97 111 5. Ünite - ‹statistiksel Karar Vermede Hipotez Testleri Zh = 892 - 880 2, 97 = 4,04 Karar : Zh>Zα /2 oldu¤undan H0 hipotezi red, H1 hipotezi kabul edilir. %95 olas›l›kla uygulanan yeni yöntem üretimi artt›rm›flt›r. Zh = σπ = Zh = P-π σπ π.(1- π ) n 0, 60.(1- 0, 60) = 0, 70 - 0, 60 0,035 200 = 0,035 = 2,86 S›ra Sizde 2 Veriler; μ = 50 ton/km2 , n=5, X = 35 ton/km2 ve S=15 ton/km2 d›r. Hipotezler; Karar : Zh> Zα oldu¤undan H0 hipotezi red, H1 hipotezi kabul edilir. %95 olas›l›kla kömür iflletmelerinde kaz›c› makinelerin çal›flma oranlar› daha yüksektir. H0 : X = μ = 50 ton/km2 S›ra Sizde 4 H1 : X < μ = 50 ton/km2 (Tek tarafl› test) Anlaml›l›k düzeyine göre teorik test istatisti¤i; α =0,05 ve v=n-1=5-1=4 oldu¤undan, t çizelgesinden tα .v = t0.05,4 = 2,132 de¤erini buluruz. Red Bölgesini; t h > tα ,v ise H0 red edilir, H1 kabul edilir fleklinde tan›mlar›z. Test istatisti¤i; th = SX = th = X -µ S X S = 15 n 35 - 50 6, 71 = 6, 71 5 = 2,24 Veriler; μ 1 − μ 2 = 0 Saat, n1 = 10 ve n2 = 12 , X 1=48 Saat ve X 2=38 Saat, S1=12 Saat ve S2=10 Saat dir. Hipotezler; H0 : ( X 1 - X 2) = (μ 1− μ 2) = 0 H1 : ( X 1 - X 2) < (μ 1− μ 2) = 0 (Tek tarafl› test) Anlaml›l›k düzeyine göre teorik test istatisti¤i; α =0,05 ve v=n1+ n2 - 2 = 10 + 12 - 2 = 20 oldu¤undan, t çizelgesinden tα .v = t0.05,20= 1,725 de¤erini buluruz. Red Bölgesini; ise H0 red edilir, H1 kabul edilir fleklinde tan›mlar›z. Test istatisti¤i; th = ( X1 - X2 ) - (µ1 - µ2 ) S Karar : th > tα,v oldu¤undan H0 hipotezi red, H1 hipotezi kabul edilir. %95 olas›l›kla a¤açland›rma çal›flmalar› erezyonu azaltm›flt›r. S›ra Sizde 3 Veriler; π = 0,60 , n=200, P = 0,70 dir. Hipotezler; SX -X = 1 2 = Red Bölgesini; Zh > Zα ise H0 red edilir, H1 kabul edilir fleklinde tan›mlar›z. Test istatisti¤i; 2 2 (n1.S1 ) + (n2 .S2 ) n1 + n2 - 2 2 2 (10.12 ) + (12.10 ) H0 : P = π = 0,60 H1 : P > π = 0,60 (Tek tarafl› test) Anlaml›l›k düzeyine göre teorik test istatisti¤i; α =0,01 oldu¤undan Z çizelgesinden 0,49 olas›l›¤›na karfl›l›k gelen Zα =Z0.01=2,33 de¤erini buluruz. X1- X2 th = 10 +12 - 2 (48 - 38) - 0 4, 92 . 1 10 + 1 . n1 1 12 + 1 n2 = 4, 92 = 2,03 Karar : th > tα,v oldu¤undan H0 hipotezi red, H1 hipotezi kabul edilir. %95 olas›l›kla yeni ilaç hastal›k iyileflme süresinde azalma yaratmaktad›r. S›ra Sizde 5 Veriler; σ = 10kg/cm2 ve σ 2 = 100 (kg/cm2)2 , n = 16 , S=14 kg/cm2 ve S2=196 (kg/cm2)2 dir. Hipotezler; 112 Co¤rafi Bilgi Sistemleri ‹çin Temel ‹statistik Yararlan›lan Kaynaklar =σ 2 = 100 H1 : S2 > σ 2 = 100 (Tek tarafl› test) H0 : S2 Anlaml›l›k düzeyine göre teorik test istatisti¤i; α =0,05 ve v=n-1=16-1=15 oldu¤undan, χ 2 çizelgesin 2 2 den χα,v = χ0.05,15 = 25,0 de¤erini buluruz. 2 2 Red Bölgesini; χh > χα,v linde tan›mlar›z. ise H0 red, H1 kabul edilir flek- Test istatisti¤i; 2 χh = (n -1).S σ 2 2 = (16 -1).196 2 2 Karar : χh > χα,v 100 = 29, 4 oldu¤undan H0 hipotezi red, H1 hipotezi kabul edilir. %95 olas›l›kla çimento fabrikas›n›n üretti¤i çimentodan yap›lan betonlar›n sa¤laml›¤›n›n standart sapmas› 10 kg/cm2 ‘den fazlad›r. Cula, S. & Muluk, Z. (2006). Temel ‹statistik Yöntemleri. Ankara: Baflkent Üniversitesi. Konuk, A. & Önder, S. (1999). Maden ‹statisti¤i. Mühendislik Mimarl›k Fakültesi Maden Mühendisli¤i Bölümü. Eskiflehir: Eskiflehir Osmangazi Üniversitesi. Montgomery, D.C. & Runger G.C. (2003). Applied Statistics and Probability for Engineers. USA: John Wiley & Sons. Newbold, P. (2005). ‹flletme ve ‹ktisat ‹çin ‹statistik. Ümit fienesen (Çev.). ‹stanbul: Literatür. Püskülcü, H. & ‹kiz, Fw. (1989). ‹statisti¤e Girifl. ‹zmir: Bilgehan. Serper, Ö. (2000). Uygulamal› ‹statistik II. Bursa: Ezgi. Ünver, Ö. & Gamgam, H. (2006). Uygulamal› Temel ‹statistik Yöntemler. Ankara: Seçkin. Yüzer, A.F. (Ed.) (2009). ‹statistik. Aç›k Ö¤retim Fakültesi Yay›n No: 771, Eskiflehir: Anadolu Üniversitesi. CO⁄RAF‹ B‹LG‹ S‹STEMLER‹ ‹Ç‹N TEMEL ‹STAT‹ST‹K 6 Amaçlar›m›z N N N Bu üniteyi tamamlad›ktan sonra; De¤iflkenler aras› iliflkilerde ba¤›ml›l›k olmas› durumunda, bu iliflkinin fonksiyonunu, yönünü ve derecesini belirlemede kullan›lan yöntemleri aç›klayabilecek, De¤iflkenler aras› iliflkilerin do¤rusal oldu¤u durumlar için regresyon modeli parametrelerini hesaplayabilecek, korelasyon katsay›s›n› hesaplay›p test edebilecek ve regresyon model parametrelerini tahminlerde kullanabilecek, De¤iflkenler aras› iliflkilerin e¤risel (üstel) oldu¤u durumlar için regresyon modeli parametrelerini hesaplayabilecek, belirlilik katsay›s›n› hesaplay›p regresyon modelinin gözlem de¤erlerini ne derecede aç›klayabildi¤ini yorumlayabilecek bilgi ve becerilere sahip olacaks›n›z. Anahtar Kavramlar • • • • • • Deneysel ‹liflki Ba¤›ml› De¤iflken Ba¤›ms›z De¤iflken Regresyon Korelasyon Katsay›s› Serpilme Diyagram› • • • • • • Do¤rusal Regresyon En Küçük Kareler Yöntemi Normal Denklemler Standart Hata Üstel Regresyon Belirlilik Katsay›s› ‹çindekiler Co¤rafi Bilgi Sistemleri ‹çin Temel ‹statistik Regresyon ve Korelasyon • DE⁄‹fiKENLER ARASI ‹L‹fiK‹LER • DO⁄RUSAL REGRESYON VE KORELASYON • E⁄R‹SEL (ÜSTEL) REGRESYON VE BEL‹RL‹L‹K KATSAYISI Regresyon ve Korelasyon DE⁄‹fiKENLER ARASI ‹L‹fiK‹LER Günlük hayat›m›zda ve bilimsel çal›flmalarda karfl›laflt›¤›m›z sorunlar›n ço¤unlu¤unun çözümü için, iki veya daha fazla say›da de¤iflken aras›nda bir iliflki olup olmad›¤›n› araflt›r›r›z. De¤iflkenler aras›nda bir iliflki bulunup bulunmad›¤›n› belirlemede ve e¤er varsa bu iliflkinin derecesini saptamada, istatistiksel yöntemlerden regresyon-korelasyon analizlerini kullan›r›z. Regresyon-korelasyon analizleriyle de¤iflkenler aras›nda anlaml› bir fonksiyonel iliflkinin varl›¤›n›n belirlenmesinden sonra, bu fonksiyon yard›m›yla bir de¤iflken de¤eri için di¤er de¤iflkenin alabilece¤i de¤erin tahminini yap›labiliriz. ‹statistiksel anlamda de¤iflkenler aras›ndaki iliflki, bunlar›n kendi aralar›nda neden-sonuç iliflkisinin bulunmas› ve de¤erlerinin karfl›l›kl› de¤iflimleri aras›nda bir ba¤l›l›k olmas› fleklinde anlafl›l›r. Örne¤in, kiflilerin geliri ile harcamalar› ve çocuklarda yafl ile boy aras›nda bir neden-sonuç iliflkisi bulunmakta olup, kiflilerin gelirleri de¤ifltikçe harcamalar› ve çocuklar›n yafllar› de¤ifltikçe boylar› da de¤iflmektedir. Bu durumda, kiflilerin geliri ile harcamalar› aras›nda ve çocuklar›n yafllar› ile boylar› aras›nda bir iliflki bulundu¤u söylenebilir. Neden niteli¤indeki de¤iflken ile sonuç niteli¤indeki de¤iflken aras›ndaki fonksiyonel iliflkinin belirlenmesinde regresyon, iliflkinin güçlü olup olmad›¤›n› belirlemede ise korelasyon analizlerinden yararlanabiliriz. Bununla birlikte, regresyonkorelasyon analizlerinin hangi tip de¤iflkenler aras›ndaki fonksiyonel iliflkinin araflt›r›lmas›nda kullan›labilece¤ini belirlemek için de¤iflkenler aras› iliflki türlerini de bilmek gerekir. Belirleyici ve Deneysel ‹liflkiler Baz› de¤iflkenlerin aras›nda belirli bir teoriye dayanan ve kesin bir matematik bir fonksiyonla ifade edilen iliflkiler vard›r. Belirleyici (deterministik) iliflkiler olarak da isimlendirilen bu iliflkilerin günümüzde geçerlili¤i teorik olarak ispatlanm›flt›r. Örne¤in, bir borunun kesit alan› F (m2) ve borudan geçen suyun h›z› V (m/sn) ise, borunun kesit alan›, suyun h›z› ve borudan bir saniyede geçen su miktar› Q (m3/sn) aras›nda kesin olarak Q = FV bilinen fonsiyonel iliflkisi vard›r. Bu gibi teorik olarak matematiksel fonksiyonu bilinen de¤iflkenler aras› iliflkiler için tekrar regresyon analizleriyle fonksiyonel iliflki araflt›r›lmas›na gerek yoktur. Günlük hayatta karfl›lafl›lan baz› olaylar hakk›nda teorik iliflkiler bilinmez. Bu durumda, de¤iflkenler için gözlemler yap›ld›ktan sonra öncelikle de¤iflkenler aras› iliflkinin matematiksel modeli belirlenir ve daha sonra bu model parametrelerinin hesaplanmas›nda da regresyon analizleri kullan›l›r. Deneysel (ampirik) iliflkiler olarak isimlendirilen bu tür iliflkilerden elde edilebilecek regresyon denklemi ise, Baz› de¤iflkenler aras› iliflkiler teorik olarak bilinmekle birlikte, matematik eflitli¤in baz› parametrelerinin deneysel olarak saptanmas› gerekebilmektedir. Bu tip de¤iflkenler aras› iliflkilere yar› belirleyici iliflkiler denilmektedir. Örne¤in, ideal gaz kanununda gaz hacmi (V) ile gaz bas›nc› (P) aras›nda P.Vγ = Sabit fleklinde matematiksel bir iliflki var olup, buradaki γ parametresinin deneysel olarak tahmin edilmesi gerekmektedir (Püskülcü ve ‹kiz, 1989). 116 Co¤rafi Bilgi Sistemleri ‹çin Temel ‹statistik daha sonraki tahminlerde kullan›labilir. Örne¤in, ifl kazalar›na ifl yerlerinin fiziksel faktörlerinin etkileri hakk›nda kesin bilinen bir teorik iliflki olmamakla birlikte, derlenecek istatistiksel verilerin regresyon analizi ile tahmin amaçl› bir model gelifltirilebilir. Ba¤›ml› ve Ba¤›ms›z De¤iflkenler Bir araflt›rmada ba¤›ml› de¤iflken, güvenilir bir flekilde ölçülebilir olmal›d›r. Ayr›ca, ba¤›ml› de¤iflken olarak ölçülen sonucun basit ve karmafl›kl›ktan uzak olmas› tercih edilir. ‹ki adet de¤er aras›nda ancak bir do¤rusal iliflkinin var oldu¤u söylenebilirken, veri say›s› artt›kça ba¤›ml› ve ba¤›ms›z de¤iflkenler aras›nda do¤rusal olmayan iliflkiler de görülebilir. De¤iflkenler aras›ndaki neden-sonuç iliflkisinde neden ba¤›ms›z, sonuç ise ba¤›ml› de¤iflkendir. Matematiksel olarak ba¤›ml› ve ba¤›ms›z de¤iflken aras›ndaki iliflki Y= f(x) olarak gösterilir. Burada, X: Ba¤›ms›z de¤iflken ve Y: Ba¤›ml› de¤iflken olarak tan›mlan›r. Ba¤›ms›z de¤iflkenlerin de¤erlerini biz ya arzumuza göre düzenleriz veya kontrol etmeden ald›klar› de¤erleri gözleriz. Ba¤›ml› de¤iflkenler ise ba¤›ms›z de¤iflkenlerin ald›¤› de¤ere göre de¤er al›rlar. Ba¤›ms›z de¤iflkenin ayr› de¤erler ya da durumlar almas›, araflt›rmac›n›n yapaca¤› ayarlamalarla sa¤lan›r. Bununla birlikte, ba¤›ms›z de¤iflkenin alaca¤› de¤erler ya da durumlar gerçek hayatta anlam› olmal› ve aralar›nda yeterince fark olmal›d›r. Örne¤in, çal›flma süresinin verimlili¤e etkilerinin araflt›r›ld›¤› bir durumda, çal›flma süresini dakikalarla ifade etmenin bir anlam› yoktur. Ayr›ca, ba¤›m›z de¤iflkenin alaca¤› de¤er ya da durumlar›n say›s›, iliflkinin fonksiyonel fleklinin belirlenebilmesi için üçten fazla (n>3) olmal›d›r. De¤iflkenler aras› iliflkinin matematiksel fonksiyonu do¤rusal, üssel, e¤risel veya çoklu bir model olabilmektedir. Afla¤›daki bölümlerde, do¤rusal regresyon modelinin parametrelerinin hesaplanmas› detayl› bir flekilde ele al›nmakta ve daha sonra üstel model parametrelerini hesaplanma yöntemleri hakk›nda bilgiler verilmektedir. De¤iflkenler Aras› ‹liflkinin Yönü ve Derecesi De¤iflkenler aras› iliflkide, de¤iflkenlerin ayn› yönde mi yoksa ters yönlerde mi de¤ifltikleri önemlidir. Örne¤in iki de¤iflken aras› iliflkide, iki de¤iflken ayn› yönde de¤ifliyorsa yani ba¤›ms›z de¤iflken artarken ba¤›ml› de¤iflken de art›yorsa, bu iliflkinin fonksiyonu artan bir fonksiyondur. Buna karfl›l›k, ba¤›ms›z de¤iflken artarken ba¤›ml› de¤iflken azal›yorsa, bu iliflkinin fonksiyonu ise azalan bir fonksiyonel e¤riye sahiptir. ‹ki de¤iflken aras›ndaki ba¤l›l›¤›n kuvvetine, iliflkinin derecesi denilmektedir. Baz› gözlemlenen de¤iflkenler aras›nda çok kuvvetli fonksiyonel iliflkiler elde edilebilirken, baz›lar›nda ise oldukça zay›f bir iliflki elde edilebilmektedir. De¤iflkenler aras›nda hiçbir iliflkinin olmamas› da söz konusu olabilmektedir De¤iflkenler aras› iliflkinin derecesinin belirlenmesinde korelasyon katsay›s› kullan›lmaktad›r. BAS‹T DO⁄RUSAL REGRESYON VE KORELASYON Basit do¤rusal regresyon analizinde, tek bir ba¤›ms›z de¤iflken (X) ile ba¤›ml› de¤iflken (Y) aras›ndaki iliflki do¤rusal fonksiyonla ifade edilir. Basit do¤rusal regresyonda, do¤runun denklemi; Y = a + bX fleklindedir (fiekil 6.1). Burada; a do¤runun sabiti olup, X= 0 oldu¤unda do¤runun Y ekseninde kesti¤i de¤eri gösterir. b ise do¤runun e¤imi olup, X’deki bir birimlik de¤iflmenin Y’de yapt›¤› de¤iflikli¤i gösterir. a ve b katsay›lar›na regresyon katsay›lar› denilmektedir. 117 6. Ünite - Regresyon ve Korelasyon fiekil 6.1 Basit do¤rusal regresyon denklemi Serpilme Diyagram› ‹ki de¤iflken aras›ndaki iliflkinin do¤rusal fonksiyona uyup uymad›¤›n› belirlemek için regresyon analizine, serpilme diyagram› çizilerek bafllan›r. Serpilme diyagram›, kartezyen koordinatl› bir grafik üzerinde X ve Y de¤erlerine sahip verilerin noktasal gösterimidir (fiekil 6.2). Serpilme diyagram›nda noktalar›n oluflturdu¤u flekli inceleyerek, de¤iflkenler aras›nda do¤rusal fonksiyonla ifade edilebilecek iliflki olup olmad›¤›n›, iliflkinin yönünü ve yaklafl›k derecesini tahmin edebiliriz. fiekil 6.2 Ba¤›ms›z (X) ve ba¤›ml› (Y) de¤iflken verilerinin serpilme diyagram›ndaki görünümü. De¤iflkenler aras› iliflkide, her iki de¤iflken birlikte art›yor veya azal›yorsa iliflkinin yönü pozitif olup, bu durumda de¤iflkenler aras›nda artan bir iliflki oldu¤unu söyleyebiliriz (fiekil 6.3.a). Bununla birlikte, de¤iflkenlerden biri artarken di¤eri azal›yorsa iliflkinin yönü negatif olup, bu durumda da de¤iflkenler aras›nda azalan bir iliflki oldu¤unu söyleyebiliriz (fiekil 6.3.b). Serpilme diyagram›nda iflaretlenen noktalar ayn› çizgi üzerinde bulunuyorsa, de¤iflkenler aras›nda kesin veya güçlü bir iliflki vard›r (fiekil 6.4.a). Serpilme diyag- Basit do¤rusal regresyonda do¤runun e¤imi (b katsay›s›), iliflkinin yönü hakk›nda bize önemli bilgiler verir. E¤er, b’nin iflareti pozitif (+) ise de¤iflkenler aras›nda aratan, negatif (-) ise azalan bir iliflki oldu¤unu anlar›z. 118 Co¤rafi Bilgi Sistemleri ‹çin Temel ‹statistik ram›nda noktalar›n da¤›l›m› herhangi bir yönde de¤iflim e¤ilimi göstermeyecek flekilde da¤›n›kl›k gösteriyorsa da, de¤iflkenler aras›nda iliflki olmad›¤›n› ya da iliflkinin derecesinin zay›f oldu¤unu söyleyebiliriz (fiekil 6.4.b). fiekil 6.3 De¤iflkenler aras›nda artan ve azalan do¤rusal iliflki fiekil 6.4 De¤iflkenler aras›nda güçlü ve zay›f do¤rusal iliflki Hata teriminin baz› önemli özellikleri flunlard›r; - Hata terimi e rassal bir de¤iflken olup, hata terimlerinin ortalamas› s›f›ra eflittir. - Hata teriminin varyans› sabit olup, kendi ortalamalar› etraf›nda ayn› de¤iflkenli¤e sahiptir. - Hata terimleri kendi ortalamalar› etraf›nda simetrik bir normal da¤›l›fl gösterirler. Ana kütleden yap›lan gözlem de¤erleri genellikle bir do¤ru üzerinde s›ralanmay›p, rassall›¤a ba¤l› olarak do¤rudan sapmalar gösterirler. Bu durumda, de¤iflkenler aras›ndaki do¤rusal iliflkinin denklemi; Y = a + bX + e fleklinde, e hata terimini de içerir (fiekil 6.5). 119 6. Ünite - Regresyon ve Korelasyon fiekil 6.5 Regresyon do¤rusunun hata terimleri En Küçük Kareler Yöntemi Serpilme diyagram›nda X de¤erleri ile Y de¤erlerinin çak›flt›¤› gözlem noktalar›n›n görünüflü do¤rusal bir e¤ilim gösteriyorsa, X ile Y aras›ndaki fonksiyonel iliflkinin yaklafl›k olarak do¤rusal olabilece¤i kanaatine var›r›z. Bununla birlikte, gözlem noktalar› aras›ndan çok say›da do¤ru geçirebiliriz. Önemli olan, X de¤erlerine karfl›l›k Y de¤erlerini en küçük hata ile tahmin etmeye yarayacak do¤ruyu (Y’) geçirmektir. Serpilme diyagram›nda oluflan n adet nokta aras›ndan en küçük hata ile bir do¤ru geçirmede en küçük kareler yöntemi kullan›lmaktad›r. Xi de¤erlerine karfl›l›k Yi gözlem de¤erleri ile do¤rusal regresyon denkleminden tahmin edilen teorik Y’i de¤erler aras› farklarla hata terimlerini afla¤›daki gibi hesaplayabiliriz (fiekil 6.5). ei = Yi - Y’i Y’i = a + bXi ei = Yi - a - bXi Hata terimlerinin her iki taraf›n›n karesini al›p, bütün n gözlem için toplarsak; n n i =1 i =1 E = ∑ ei2 = ∑ ( Yi − a − bX i )2 ifadesini elde ederiz. Hata kareleri toplam›n› en küçük yapabilmek için, E eflitli¤inin a ve b katsay›lar›na göre k›smi türevlerini al›p, elde edece¤imiz eflitlikleri s›f›ra eflitlememiz gerekir. ∂E = ∑ 2.( Yi − a − bX i ).( −1 ) = 0 ∂a ∂E = ∑ 2.( Yi − a − bX i ).( − X i ) = 0 ∂b En küçük kareler yönteminde, gözlem verileri aras›ndan geçirilen do¤ru ile gözlem verileri aras›ndaki hatalar›n (gözlemlerin do¤rudan olan uzakl›klar›n›n) karelerin toplam› en küçük olmaktad›r. Bu yöntemde, X de¤erlerine karfl›l›k gelen do¤ru üzerindeki Y’ tahmin de¤eri ile Y gözlem de¤eri aras›ndaki farklar›n (hatalar›n) toplam› da s›f›r olmaktad›r. 120 Co¤rafi Bilgi Sistemleri ‹çin Temel ‹statistik K›smi türevi al›n›p s›f›ra eflitlenen bu eflitlikleri afla¤›daki gibi sadelefltirebiliriz. ∑ ( −Yi + a + bX i ) = 0 ∑ ( − X iYi + aX i + bX i2 ) = 0 Bu eflitliklerde de, negatif iflaretli terimleri eflitli¤in sa¤ taraf›na geçirir ve eflitlikleri yeniden düzenlersek, normal denklemler denilen afla¤›daki eflitlikleri elde ederiz. ∑ Yi = n.a + b∑ X i ∑ X iYi = a∑ X i + b∑ X i2 Bu iki bilinmeyenli (a ve b) iki eflitlik sisteminde, bilinenler olan ∑ Yi , ∑ X i ∑ X i2 ve ∑ X iYi toplam de¤erleri hesaplanarak yerine konulduktan sonra, eflitlik sisteminin çözümü ile bilinmeyen a ve b katsay›lar› hesaplanabilir. Seri de¤erlerinin ortalamadan farklar›n›; xi = X i − X ve yi = Yi − Y eflitliklerinde oldu¤u gibi hesaplayabiliriz. Normal denklemleri, seri de¤erlerinin ortalamadan farklar› cinsinden yeniden küçültülmüfl de¤erlerle yazarsak; ∑ yi = n.a + b∑ xi ∑ xi yi = a∑ xi + b∑ xi2 eflitliklerini elde ederiz. Seri de¤erlerinin ortalamadan farklar› toplam› s›f›rd›r. ∑ xi = ∑ ( X i − X ) = 0 ∑ yi = ∑ ( Yi − Y ) = 0 Bu durumda, küçültülmüfl de¤erlerle yaz›lan ikinci eflitlikten geriye ∑ xi yi = ∑ xi2 eflitli¤i kal›r ve bu eflitlikten de do¤runun e¤imi olan b katsay›s›n› afla¤›daki gibi hesaplayabiliriz. b= ∑ xi yi ∑ xi2 Birinci normal denklemin her iki taraf›n›n örnek say›s›na (n) bölünmesiyle elde edece¤imiz eflitlik yard›m›yla da; ∑ Yi = n a + b ∑ X i n n Y = a + bX n ⇒ a = Y − bX do¤rusal regresyon eflitli¤inin sabiti olan a parametresini hesaplar›z. 121 6. Ünite - Regresyon ve Korelasyon Do¤rusal regresyon modelinin parametrelerinin grafiksel görünümü fiekil 6.6’da verildi¤i gibidir. fiekil 6.6’dan da görüldü¤ü gibi, a : do¤runun sabitini ve b : do¤runun e¤imini göstermektedir. Regresyon do¤rusunun e¤imi olan b parametresinin iflareti, de¤iflkenler aras› iliflkinin yönünün bir göstergesidir. E¤er X ba¤›ms›z de¤iflkeni artarken Y’de art›yorsa b parametresinin iflareti pozitif (+), X ba¤›ms›z de¤iflkeni artarken Y azal›yorsa b parametresinin iflareti ise negatif (-) olur. fiekil 6.6 Regresyon do¤rusunun grafiksel görünümü Örnek 6.1: ‹nflaat zemin kaz›s›nda, kaz›lan malzemenin kuvars içeri¤i ile kaz› makinesi keski ucu afl›nma miktar› aras›ndaki iliflkiyi araflt›rmak üzere yap›lan deneyler sonucunda afla¤›daki veriler elde edilmifltir. Kuvars içeri¤i ile afl›nma miktar› aras›nda do¤rusal iliflki varoldu¤u bilindi¤ine göre, regresyon parametrelerini, a) Normal denklemleri oluflturarak, b) Seri de¤erlerinin ortalamadan farklar›n› kullanarak hesaplay›n›z. Kuvars Oran› (%) Afl›nma Miktar› (mg) 15 5 30 15 45 40 60 70 75 100 Çözüm: a) Normal denklemler; ∑ Yi = n.a + b∑ X i ∑ X iYi = a∑ X i + b∑ X i2 oldu¤undan, öncelikle denklemin bilinenlerini hesaplar›z. Ancak, regresyon parametrelerini hesaplamada, ba¤›ml› ve ba¤›ms›z de¤iflkenin belirlenmesi oldukça önemlidir. Ele ald›¤›m›z örnekte, kuvars oran›n›n afl›nma miktar›n› etkileme ihtimali söz konusu oldu¤undan, bu durumda ba¤›ms›z de¤iflken (X) kuvars oran› ve ba¤›ml› de¤iflken (Y) afl›nma miktar› olacakt›r. Veri say›s› n=5 dir. 122 Co¤rafi Bilgi Sistemleri ‹çin Temel ‹statistik X Kuvars Oran› (%) Y Afl›nma Miktar› (mg) X2 XY 15 5 225 75 30 15 900 450 45 40 2025 1800 60 70 3600 4200 75 100 5625 7500 ∑ Y = 230 ∑ X 2 = 12375 ∑ XY = 14025 ∑ X = 225 Hesaplanan bu de¤erler normal denklemlerde yerine konulursa; ∑ Yi = n.a + b∑ X i ∑ X i Yi = a ∑ X i + b∑ X i2 230 = 5.a + 225.b 14025 = 225.a + 12375.b eflitlik sistemi elde edilir. Bu eflitlik sistemini dengelemek için; 225 225 225 .230 = .5.a + .225.b 5 5 5 ifllemi yap›ld›¤›nda, afla¤›daki dengelenmifl eflitlik sistemi elde edilir. 10350 = 225.a + 10125.b 14025 = 225.a + 12375.b Bu iki eflitli¤i birbirinden ç›kar›rsak ve b parametresini yaln›z b›rak›rsak, b= 1,633 de¤erini elde ederiz. Daha sonra b parametresini herhangi bir normal denklemde yerine koyarak a parametresini a= -27,5 olarak hesaplar›z. Bu hesaplamalar sonras›nda ise regresyon do¤rusunu elde ederiz. a = -27,5 ve b = 1,633 Ŷ = -27,5 + 1,633.X (mg) b) Seri de¤erlerinin ortalamadan farklar›n› al›rsak, afla¤›daki küçültülmüfl de¤erleri elde ederiz. X Kuvars Oran› (%) Y Afl›nma Miktar› (mg) x= X−X y = Y −Y x2 xy 15 5 -30 -41 900 1230 30 15 -15 -31 225 465 45 40 0 -6 0 0 60 70 15 24 225 360 75 100 30 54 900 1620 ∑ X = 225 X= ∑ Y = 230 225 230 = 45 Y = = 46 5 5 ∑x =0 ∑ y=0 ∑x 2 = 2250 ∑ xy = 3675 123 6. Ünite - Regresyon ve Korelasyon Regresyon do¤rusunun e¤imi; b= ∑ xi yi = 3675 = 1, 633 ∑ xi2 2250 Regresyon do¤rusunun sabiti; a = Y − bX = 46 − (1, 633.45) = −27, 5 Regresyon do¤rusu; Y ' = −27, 5 + 1, 633.X (mg) Gözlem noktalar› aras›ndan geçen do¤ru afla¤›daki flekildeki gibidir. fiekil 6.7 S‹ZDE Bir kimyasal deneyde kar›flt›rma h›z›na ba¤l› olarak afla¤›daki ürünSIRA verim de¤erleri elde edilmifltir. Kar›flt›rma h›z› ile verim aras›ndaki iliflkinin do¤rusal oldu¤unu göz önüne alarak regresyon parametrelerini hesaplay›n›z. 1 D Ü fi Ü N E L ‹ M Kar›flt›rma H›z› (devir/dakika) SIRA S‹ZDE D Ü fi Ü N E L ‹ M Verim (%) 25 65 S O R U 30 70 35 74 D ‹ K K A T 40 75 45 78SIRA S‹ZDE 50 82 AMAÇLARIMIZ S O R U D‹KKAT N N SIRA S‹ZDE AMAÇLARIMIZ K ‹ T A P K ‹ T A P TELEV‹ZYON TELEV‹ZYON ‹NTERNET ‹NTERNET 124 Co¤rafi Bilgi Sistemleri ‹çin Temel ‹statistik Standart Hata ve Tahminlerin Güven Aral›¤› Araflt›rma veya deneysel çal›flmalarda, gözlenen her X de¤erine karfl›l›k gözlenmifl Y de¤erleri vard›r. Regresyon analizi ile elde edilen do¤ru denklemi yard›m›yla ise gözlenen her X de¤erine karfl›l›k Y’ tahminlerini yapabiliriz. En küçük kareler yöntemiyle regresyon denklemini elde ederken, gözlem de¤erleri ile tahmin de¤erleri aras›ndaki farklar›n (hatalar›n) kareleri toplam›n› ∑ (Y − Y ' ) = en küçük yapt›¤›m›zdan, en küçük de olsa bir tahmin hatas› vard›r. Gözlem de¤erler ile tahmin de¤erlerinin toplam› birbirine eflit olmakla birlikte, de¤erler tek tek karfl›laflt›r›ld›¤›nda aralar›nda az ya da çok farklar olabilmektedir. Bu tahmin hatalar›n›n genel ve ortalama ölçüsüne tahminlerin standart hatas› denilir. Basit do¤rusal regresyonda tahminlerin standart hatas›, büyük örneklemelerde (n ≥ 30) ; ∑ (Y − Y ′) 2 Sy = n küçük örneklemelerde (n < 30) ise; ∑ (Y − Y ′) 2 Sy = Basit do¤rusal regresyon denkleminin a ve b olmak üzere iki parametresi oldu¤undan, basit do¤rusal regresyon için k=2’dir. Standart hata büyüdükçe tahminlerin güvenilirli¤i azal›r, küçüldükçe ise artar. Standart hatan›n s›f›r (0) olmas› durumunda, gözlem noktalar› regresyon do¤rusu üzerinde yer al›r. n-k eflitlikleriyle hesaplan›r. Burada, Sy= tahminlerin standart hatas›, n= gözlem say›s› ve k= regresyon do¤rusundaki parametre say›s›d›r. Da¤›lma diyagram›nda noktalar›n regresyon do¤rusu etraf›ndaki da¤›l›mlar›n›n ortalama bir ölçüsü olan standart hata, yap›lan tahminlerde gerçe¤e nazaran ne kadar sapma (hata pay›) beklenildi¤ini gösterir. Büyük örneklemelerde, regresyon do¤rusuna göre tahmin hatalar›n›n da¤›l›m› normal oldu¤undan, herhangi bir X de¤iflken de¤eri için yap›lacak Y’ noktasal tahmininin güven aral›¤›n› da, belirli bir güven düzeyi (α) için standart normal de¤er (Zα/2) yard›m›yla belirleyebiliriz. Y ' ∓ Zα / 2 .S y Küçük örneklemelerde ise regresyon do¤rusuna göre tahmin hatalar›n›n da¤›l›m›, verilerin azl›¤› nedeniyle normal da¤›l›ma göre daha yayvan oldu¤undan, herhangi bir X de¤iflken de¤eri için yap›lacak Y’ noktasal tahmininin güven aral›¤›n›, belirli bir güven düzeyi (α) ve v=n-2 serbestlik derecesi için Student t da¤›l›fl de¤eri (ta/2, v) yard›m›yla belirleyebiliriz. Y ' ∓ tα / 2,V .S y Örnek 6.2: Bir tu¤la-kiremit fabrikas›nda kullan›lan kil malzemesinin %Al2O3 içeri¤i ile kusurlu ürün oran› aras›ndaki iliflki araflt›r›ld›¤›nda, afla¤›daki veriler için Y' = 3,84 0,165.X regresyon denklemi elde edilmifltir. a) Regresyon denklemi ile yap›lacak tahminlerin standart hatas›n› bulunuz. b) Kil malzemesinin %Al2O3 içeri¤i 15 oldu¤unda, %90 güvenirlikle (α = 0,10) kusurlu ürün oran› (%) güven aral›¤› ne olur? 6. Ünite - Regresyon ve Korelasyon Al2O3 içeri¤i (%) Kusurlu Ürün Oran› (%) 12 1,8 14 1,6 16 1,2 18 0,9 20 0,5 Çözüm: a) Y’ = 3,84 - 0,165.X regresyon denklemini kullanarak, gözlemlenen her bir X de¤eri için tahmin de¤erlerini hesaplayabiliriz. X=12 için Y’ = 3,84 - 0,165, X = 3,84 - 0,165.12 = 1,86 X Al2O3 içeri¤i (%) Y Kusurlu Ürün Oran› (%) 12 Y' (%) Y-Y' (%) (Y-Y' )2 1,8 1,86 -0,06 0,0036 14 1,6 1,53 0,07 0,0049 16 1,2 1,20 0 0 18 0,9 0,87 0,03 0,0009 20 0,5 0,54 -0,04 0,0016 ∑ (Y − Y ' )2 = 0, 011 Küçük örnekleme (n<30) yap›ld›¤›ndan tahminlerin standart hatas›n› afla¤›daki eflitlikle hesaplar›z. ∑ (Y − Y ′) 2 Sy = n-2 ∑ (Y − Y ) = 0, 011 ve n = 5 oldu¤undan standart hatay› ' 2 Sy = 0, 011 = 0, 061 5- 2 olarak hesaplar›z. b) X=15 %Al2O3 için kusurlu ürün oran›n›n nokta tahmini; Y ' = 3, 84 − 0,165. X = 3, 84 − 0,165.15 = 1, 36 % olarak buluru uz. Serbestlik derecesi v = n - k = 5 - 2 = 3’dür %90 güvenirlik seviyesinde α = 0,10 ve α/2 = 0,05 dir. n<30 oldu¤undan Student çizelgesinden t α/2,v = t0.05,3 = 2,353 elde ederiz. ' Güven aral›¤›n› Y ∓ tα / 2,V .S y eflitli¤inden; 1,36 ∓ (2,353.0,061) AGS= 1,22 ve ÜGS= 1,50 buluruz. 125 126 SIRA S‹ZDE Co¤rafi Bilgi Sistemleri ‹çin Temel ‹statistik 2 D Ü fi Ü N E L ‹ M S O R U Korelasyon katsay›s›n›n (r) iflareti yard›m›yla de¤iflkenler iliflkinin D ‹ K K A aras› T yönünü de belirlemek mümkündür. Ba¤›ms›z de¤iflken X artarken ba¤›ml› SIRA S‹ZDE de¤iflken Y de art›yorsa korelasyon katsay›s›n›n iflareti pozitif (+), X artarken Y azal›yorsa korelasyon AMAÇLARIMIZ katsay›s›n›n iflareti negatif (-) olmaktad›r. Ayr›ca, regresyon do¤rusunun iflareti ile korelasyon K ‹ T A iflareti P katsay›s›n›n de ayn› yönde olmaktad›r. Bir deneyselSIRA çal›flmada S‹ZDE 36 adet gözleme dayanan X ve Y de¤iflkenleri aras›nda Y' = 5 + 0,2.X do¤rusal iliflkisi elde edilmifltir. Regresyon denklemiyle yap›lacak tahminlerin standart hatas› 0,06 oldu¤una göre, X=1,4 de¤eri için %90 güvenirlikle (α = 0,10) tahmin ediÜ fi Ü N Earal›¤› L‹M len de¤erin Dgüven ne olur? Korelasyon S O R Katsay›s› U Regresyon denkleminden elde edilen tahmin de¤erleri ile gözlem de¤erleri aras›nda fark yoksa ve gözlem de¤erleri regresyon do¤rusu üzerinde yer al›yorsa, regD‹KKAT resyon denkleminin gözlem de¤erlerini tam olarak aç›klayabildi¤ini ve iki de¤iflken aras›ndaki iliflkinin tam oldu¤unu söyleyebiliriz. Buna karfl›l›k, X de¤erleri için SIRA S‹ZDE ile yap›lacak tahminlerde belirli bir standart hata hesaplanabiregresyon denklemi liyorsa, de¤iflkenler aras›ndaki iliflkinin derecesi standart hatan›n büyüklü¤üne göre de¤iflmektedir. AMAÇLARIMIZ ‹ki de¤iflken aras›ndaki do¤rusal regresyon denkleminin gözlenen de¤erleri ne derecede aç›klad›¤›n› incelemede ve de¤iflkenler aras› iliflkinin derecesinin belirlenmesinde korelasyon K ‹ T A P katsay›s› kullan›l›r. Korelasyon katsay›s›, ba¤›ms›z de¤iflken X’in ba¤›ml› de¤iflken Y üzerindeki do¤rusal etkisinin derecesini göstermektedir. Korelasyon katsay›s›n›n (r) hesaplanmas›nda afla¤›daki eflitliklerden birisi kullan›labilir. TELEV‹ZYON N N TELEV‹ZYON r= ‹NTERNET r= Korelasyon katsay›s›na güvenirli¤in artt›r›lmas› ve rassal nedenlerin etkilerinin azalt›labilmesi için gözlem say›s› mümkün oldu¤unca artt›r›lmal›d›r. Korelasyon katsay›s›n›n testi konusunda da görülece¤i gibi, ana kütleden yap›lacak örnekleme boyutu (gözlem say›s›) artt›kça korelasyon katsay›s›n›n standart hatas› azalmaktad›r. ∑ (X - X).(Y - Y) X)2 .∑ (Y- Y)2 ∑‹ N(XTERNET ∑ x.y ∑ x2 .∑ y2 ‹ki de¤iflkenin birlikte de¤iflim ölçüsü olarak da tan›mlanan korelasyon katsay›s› -1 ile +1 aras›nda de¤erler alabilmektedir. Korelasyon katsay›s›n›n; • r = 1 olmas›, de¤iflkenler aras› iliflkinin tam oldu¤unu, • r = 0 olmas› ise de¤iflkenler aras›nda hiçbir iliflkinin olmad›¤›n› gösterir. Ayr›ca, korelasyon katsay›s› ∓ 1’e yaklaflt›kça de¤iflkenler aras› iliflkinin güçlendi¤ini ve s›f›ra yaklaflt›kça ise zay›flad›¤›n› söyleyebiliriz. Bununla birlikte, korelasyon katsay›s› büyüklü¤ünün anlaml›l›¤› de¤erlendirilirken, de¤iflken gözlem say›lar› da dikkate al›nmal›d›r. Örnek 6.3: Örnek 6.1’deki verilere kullanarak de¤iflkenler aras› korelasyon katsay›s›n› hesaplay›n›z. Çözüm: Gözlem verilerini kullanarak X ve Y de¤iflkenlerinin ortalamalar›n› afla¤›daki gibi hesaplar›z. ∑ Y = 230 Y= 230 = 46 5 ∑ X = 225 X= 225 = 45 5 127 6. Ünite - Regresyon ve Korelasyon De¤iflkenlerin ortalamalar› yard›m›yla, seri de¤erlerinin ortalamadan farklar› olan küçültülmüfl x ve y de¤erleri ile bunlara ba¤l› olarak da x2, y2 ve xy de¤erlerini afla¤›daki çizelgede oldu¤u gibi hesaplar›z. X (%) Y (mg) x = X − X y = Y −Y x2 y2 xy 15 5 -30 -41 900 1681 1230 30 15 -15 -31 225 961 465 45 40 0 -6 0 36 0 60 70 15 24 225 576 360 75 100 30 54 900 2916 1620 ∑y=0 ∑x =0 ∑ x 2 = 2250 ∑ y 2 = 6170 ∑ xy = 3675 Korelasyon katsay›s›n›; r= ∑ x. y = ∑ x 2 .∑ y 2 3675 = 0, 973 2250.6170 olarak hesaplar›z. S‹ZDE S›ra Sizde 1 sorusundaki verileri kullanarak korelasyon katsay›s›n› SIRA hesaplay›n›z. Korelasyon Katsay›s›n›n Test Edilmesi D Ü fi Ü N E L ‹ M Korelasyon katsay›s›n›n test edilmesi de hipotez testleri bölümünde aç›klanan ifllemlerin benzeri bir flekilde gerçeklefltirilmektedir. Korelasyon katsay›s›n›n, ana S O R U kütleden örneklenen de¤iflken de¤erleri ile hesapland›¤› göz önüne al›narak hipotezler oluflturulmaktad›r. Daha önceden ana kütle de¤iflkenleri hakk›nda her hangi bir iliflki bilinmedi¤inden, H0 hipotezi ana kütle de¤iflkenleri aras› D ‹ K K Akorelasyonun T s›f›r oldu¤u ve örnek kütleler aras›nda hesaplanan korelasyonun da s›f›ra eflit olmas› gerekti¤i fleklinde oluflturulur. Karfl›t hipotez H1 ise örnek SIRAkütleler S‹ZDE aras›nda hesaplanan korelasyon katsay›s›n›n rassal olarak hesaplanmad›¤›, gerçekte de¤iflkenler aras›nda anlaml› bir iliflki var oldu¤u, dolay›s›yla s›f›ra eflit olmamas› gerekAMAÇLARIMIZ ti¤i fleklinde oluflturulur. H0 : r = ρ = 0 H1 : r ≠ ρ = 0 K ‹ T A P Sv = r Sv 1− r 2 n−2 SIRA S‹ZDE D Ü fi Ü N E L ‹ M S O R U D‹KKAT N N Korelasyon katsay›s›n›n testinde red bölgesinin tan›mlanmas›nda teorik test istatisti¤i, gözlem say›s› n ≥ 30 ise Z da¤›l›fl›ndan ve n < 30 ise t da¤›l›fl›ndan yararTELEV‹ZYON lan›larak belirlenir. Red bölgesi : n ≥ 30 oldu¤unda Zh>Zα/2 ise H0 hipotezi red, H1 kabul edilir. n<30 oldu¤unda th > tα/2,v ise H0 hipotezi red, H1 kabul edilir. Test istatisti¤i Zh veya th, ana kütleden örneklemelerle hesaplanacak ‹ N T E R N E T r’lerin da¤›l›m›n›n standart hatas›na (Sv) ba¤l› olarak afla¤›daki eflitlik yard›m›yla hesaplan›r. Zh = th = 3 SIRA S‹ZDE Do¤rusal regresyon eflitli¤inin iki AMAÇLARIMIZ adet parametresi (a ve b) oldu¤undan, t da¤›l›fl›n›n serbestlik derecesi v = n - 2 olur. K ‹ T A P TELEV‹ZYON ‹NTERNET 128 Co¤rafi Bilgi Sistemleri ‹çin Temel ‹statistik (Zh veya th) > (Zα/2veya tα/2,v) ise H0 red edilir ve iki de¤iflken aras›nda anlaml› bir do¤rusal iliflki vard›r karar›na var›l›r. Bu durumda, X ve Y de¤iflkenleri aras›nda gözlem de¤erleri ile elde edilen regresyon denklemi ile anlaml› ve güvenilir tahminler yap›labilir. (Zh veya th) < (Zα/2 veya tα/2,v) ise H0 kabul edilir ve iki de¤iflken aras›nda iliflki yoktur karar›na var›l›r. Bu durumda, X ve Y de¤iflkenleri aras›nda gözlem de¤erleri ile elde edilen regresyon denklemi ile güvenilir tahminler yap›lamaz. Örnek 6.4 : Örnek 6.3’de hesaplanan korelasyon katsay›s›n›n anlaml›l›¤›n› ve dolay›s›yla elde edilen regresyon denklemi ile yap›lacak tahminlerin güvenilir olup olmad›¤›n› α=0,05 güven (anlaml›l›k) düzeyi için test ediniz. Çözüm : Veriler; n=5 , r=0,973 ve α=0,05 dir. Hipotezler; H0 : r = ρ= 0 H1 : r ≠ ρ= 0 (Çift tarafl› test) Gözlem say›s› n<30 oldu¤undan küçük örnekleme yap›lm›flt›r. Bu durumda, teorik test istatisti¤ini; α/2 =0,025 ve v=n-2=5-2=3 oldu¤undan, t çizelgesinden tα/2.v= t0.025,3 = 3,182 olarak elde ederiz. Red Bölgesini; th>tα/2,v ise H0 red edilir, H1 kabul edilir fleklinde tan›mlar›z. Test istatisti¤i; Sv = 1− r 2 n−2 Sv = 1− (0, 973)2 = 0,133 5− 2 th = 0, 973 r = = 7, 316 0,133 Sv Karar : th= 7,316 > t∝/2,v = 3,182 oldu¤undan H0 hipotezi red, H1 kabul edilir. Korelasyon katsay›s› anlaml›d›r ve tu¤la-kiremit fabrikas›nda kullan›lan kil malzemesinin %Al2O3 içeri¤i ile kusurlu ürün oran› aras›nda gözlem de¤erleri ile elde edilen regresyon denklemiyle yap›lacak tahminler %95 olas›l›kla güvenilir olacakt›r. SIRA S‹ZDE D Ü fi Ü N E L ‹ M S O R U D‹KKAT SIRA S‹ZDE AMAÇLARIMIZ K ‹ T A P 4 Bir araflt›rmaSIRA çal›flmas›nda 10 adet gözleme dayal› X ve Y de¤iflkenleri aras›ndaki iliflkinin S‹ZDE korelasyon katsay›s› r=0,89 elde edilmifltir. %5 güven düzeyi için korelasyon katsay›s›n›n anlaml›l›¤›n› test ediniz. D Ü fi Ü N E L ‹ M Örnek 6.5 : S O R U Bir kent merkezinde ›s›nma döneminde (Ekim-Nisan aylar›) ayl›k ortalama hava s›cakl›klar› ve do¤algaz tüketimlerinin afla¤›daki gibi oldu¤u belirlenmifltir. Ayl›k ortalama hava s›cakl›¤› ile do¤algaz tüketimi aras›ndaki iliflkinin do¤rusal olduD‹KKAT ¤u tahmin edilmektedir. N N SIRA S‹ZDE AMAÇLARIMIZ K ‹ T A P 6. Ünite - Regresyon ve Korelasyon Ortalama Hava S›cakl›¤› (°C) Ort. Günlük Tüketim (1000 m3) 20 62 14 93 8 138 5 174 7 132 10 116 16 88 a) Basit do¤rusal regresyon denklemini bulunuz. b) Korelasyon katsay›s› ve standart hatay› hesaplay›n›z c) Korelasyon katsay›s›n› test ederek, regresyon denkleminin anlaml› ve güvenilir olup olmad›¤›n› yorumlay›n›z (α=0.05). d) Hava s›cakl›¤›n›n 12°C olmas› durumunda günlük do¤al gaz tüketiminin güven aral›¤›n› %95 güvenirlikle tahmin ediniz. Çözüm : Ele ald›¤›m›z örnekte, ortalama hava s›cakl›¤›n›n günlük do¤algaz tüketimini etkileme ihtimali söz konusu oldu¤undan, bu durumda ortalama hava s›cakl›¤› ba¤›ms›z de¤iflken (X) ve günlük do¤al gaz tüketim miktar› ba¤›ml› de¤iflken (Y) olacakt›r. Veri say›s› n=7 dir. a) Regresyon denklemini; b= ∑ xy ∑ x2 a = Y- bX eflitliklerinden hesaplayabiliriz. Y X y x y2 x2 x.y 62 20 -52 9 2704 81 -468 93 14 -21 2 441 4 -42 138 8 24 -4 576 16 -96 174 5 60 -7 3600 49 -420 132 7 18 -5 324 25 -90 116 10 2 0 4 0 0 88 16 -31 5 961 25 -155 ∑Y=798 ∑X=77 ∑y=0 ∑x=0 798 77 = 114 X = = 11 7 7 ∑ xy = −1271 = −6, 355 b= ∑ x 2 200 Y= a = Y- bX X =114-(-6,355 . 11) =183,905 Y ′ = 183, 905 − 6, 355.X ∑y2=8610 ∑x2=200 ∑x.y= -1271 129 130 Co¤rafi Bilgi Sistemleri ‹çin Temel ‹statistik Regresyon denkleminden de görüldü¤ü gibi, hava s›cakl›¤› (X) artarken günlük do¤al gaz tüketimi azalmaktad›r. Regresyon denklemi e¤iminin iflareti negatiftir (-). b) Korelasyon katsay›s›n›; ∑ xy = ∑ x 2 .∑ y2 r= −1271 = −0, 9686 200 . 8610 olarak hesaplar›z. Tahminlerin standart hatas›; ∑ (Y − Y ′) 2 Sy = n−2 eflitli¤inden hesaplan›r. Bunun için öncelikle, regresyon denklemini (Y ′ = 183, 905 − 6, 355.X) kullanarak her bir X de¤eri için Y' de¤erlerini tahmin ederiz. Daha sonra, gözlem ile tahmin de¤erleri aras› farklar›n karelerinin toplam›n› buluruz. X Y Y' Y-Y' (Y-Y')2 20 62 56,805 5,195 26,988 14 93 94,935 -1,935 3,744 8 138 133,065 4,935 24,354 5 174 152,13 21,87 478,297 7 132 139,42 -7,42 55,056 10 116 120,355 -4,355 18,966 16 88 82,225 5,775 33,351 ∑ (Y − Y ′) 2 ∑ (Y − Y ′) = 640, 756 2 Sy = n−2 = 640, 756 = 11, 32 7−2 c) Korelasyon katsay›s›n›n testi : Veriler; n=7 , r=-0,9686 ve α=0,05dir. Hipotezler; H0 : r = ρ= 0 H1 : r ≠ ρ = 0 (Çift tarafl› test) Gözlem say›s› n<30 oldu¤undan küçük örnekleme yap›lm›flt›r. Bu durumda, teorik test istatisti¤ini; ∝/2 =0,025 ve v=n-2=7-2=5 oldu¤undan, t çizelgesinden tα/2.v = t0.025,5 = 2,571 olarak elde ederiz. Red Bölgesini; th>tα/2,v ise H0 red edilir, H1 kabul edilir fleklinde tan›mlar›z. 6. Ünite - Regresyon ve Korelasyon Test istatisti¤i; Sv = 1− r 2 n−2 Sv = 1− (−0, 9686)2 = 0,111 7−2 th = −0, 9686 r = = 8, 726 Sv 0,111 Karar : th= 8,726 > t∝/2,v= 2,571 oldu¤undan H0 hipotezi red, H1 kabul edilir. Korelasyon katsay›s› anlaml›d›r ve hava s›cakl›¤› ile günlük do¤al gaz tüketim miktar› aras›nda gözlem de¤erleri ile elde edilen regresyon denklemiyle yap›lacak tahminler, %95 olas›l›kla güvenilir olacakt›r. d) Hava s›cakl›¤›n›n X=12°C olmas› durumunda günlük do¤al gaz tüketiminin %95 güvenirlikle tahmini; Y'=183,905-6,355.X X=12°C için nokta tahmini; Y'=183,905-(6,355.12)=107,645 (1000 m3) ∝= 0,05 , α/2=0,025 ve v=n-2=7-2=5 oldu¤undan t çizelgesinden; tα/2,v= t0.025,5=2,571 elde ederiz. AGS = Y'-tα/2,v.Sy =107,645 - (2,571.11,32)=78,541 (1000 m3) ÜGS = Y'+tα/2,v.Sy=107,645+(2,571.11,32)=136,749 (1000 m3) Hava s›cakl›¤›n›n X=12°C olmas› durumunda %95 ihtimalle en az 78541 m3 ve en fazla da 136749 m3 günlük do¤al gaz tüketiminin olaca¤› tahmin edilmektedir. E⁄R‹SEL (ÜSTEL) REGRESYON VE BEL‹RL‹L‹K KATSAYISI Gözlem verilerinin serpilme diyagram›ndaki flekli do¤rusal olmayan bir e¤ri biçimi gösteriyorsa, gözlem de¤erleri aras›ndan üstel bir e¤ri geçirilebilece¤i tahmin edilebilir. Üstel fonksiyonlar tek tarafl› veya çift tarafl› logaritmik dönüflümler yap›larak do¤rusallaflt›r›l›p, do¤rusal regresyon kurallar› uygulanarak regresyon parametreleri belirlenebilir. Üstel regresyon denklemi e¤risel bir flekle sahip oldu¤undan, X ve Y de¤iflkenleri aras›ndaki regresyon denkleminin gözlem de¤erlerini tam olarak aç›klay›p aç›klayamad›¤›n› ve iki de¤iflken aras›ndaki iliflkinin derecesini belirlemede korelasyon katsay›s› ( r ) kullan›lamaz. Üstel regresyon denkleminin gözlenen de¤erleri ne derece aç›klay›p aç›klamad›¤›n› anlamada belirlilik katsay›s› (R2 ) kullan›l›r. Üstel Regresyon Ba¤›ms›z X ile ba¤›ml› Y de¤iflkeni aras›ndaki fonksiyonel iliflkinin fiekil 6.8’deki gibi e¤risel olmas› durumunda, gözlem de¤erleri aras›ndan y=aXb fleklinde bir üs- 131 132 Co¤rafi Bilgi Sistemleri ‹çin Temel ‹statistik tel bir e¤ri geçirebiliriz. X ve Y de¤iflkenlerinin her ikisinin de logaritmas›n› al›r ve serpilme diyagram›n› tekrar çizersek, üstel fleklin do¤rusallaflt›¤›n› gözlemleriz (fiekil 6.9). fiekil 6.8 Gözlem de¤erlerinin üstel görünüflü fiekil 6.9 1,5 Logaritmik gözlem de¤erlerinin do¤rusal görünüflü 1 0,5 LnY 0 -0,5 -1 -1,5 -2 -1,5 -1 -0,5 0 0,5 1 LnX Üstel fonsiyonun logaritmik dönüflümle do¤rusallaflmas›; Y=aXb InY=lna+b.lnX eflitli¤indeki gibi olur. Logaritmik dönüflüm sonras›nda Z=lnY, A=lna, B=b ve V=lnX atamalar› yap›ld›¤›nda; Z=A+BV fleklinde do¤rusal regresyon denklemi elde edilebilir. Bu flekilde do¤rusallaflt›r›lan üssel iliflki için, do¤rusal regresyon yönteminde uygulanan yöntemlerle regresyon parametreleri hesaplanabilir. Do¤rusallaflt›r›lan üstel regresyon denklemi için elde edilecek afla¤›daki normal denklemlerden A ve B parametreleri hesaplanabilir. 6. Ünite - Regresyon ve Korelasyon 133 ∑ Zi = n. A + B∑ Vi ∑ Vi Zi = A∑Vi + b∑ Vi2 Z ve V logaritmik de¤iflkenleri için z = Z − Z ve v = V − V küçültme ifllemleri yapt›¤›m›zda da A ve B parametrelerini; B= ∑ vz ∑ v2 A = Z − B.V eflitliklerinden hesaplayabiliriz. Hesaplanan A parametresi için a=eA ve b=B dönüflümlerini yaparak da üstel regresyon denklemini elde ederiz. Y ' = aX b Belirlilik Katsay›s› ve Standart hata Do¤rusal regresyonda iki de¤iflken aras›nda iliflki olup olmad›¤›n› veya regresyon do¤rusunun gözlem de¤erlerini aç›klay›p aç›klamad›¤›n› anlamada korelasyon katsay›s› kullan›lmaktad›r. Korelasyon katsay›s›n›n iflareti, daima do¤runun e¤iminin iflaretiyle uyumludur. Üstel regresyon denklemi ise e¤risel oldu¤undan, bu e¤rinin birden fazla e¤imi söz konusudur. Bu durumda, üstel regresyon denklemi için korelasyon katsay›s›n› kullanamay›z. Bu nedenle, üstel regresyon denkleminin gözlem de¤erlerini ne derece aç›klay›p aç›klamad›¤›n› anlamada belirlilik katsay›s› (R2) kullan›l›r. Belirlilik katsay›s› afla¤›daki eflitlikle hesaplanabilir. 2 R = 1- S2y σy2 Burada, R2 : belirlilik katsay›s›n›, Sy : regresyon denklemiyle yap›lacak tahminlerin standart hatas›n› ve σy : ba¤›ml› de¤iflken Y’nin standart sapmas›n› göstermektedir. Belirlilik katsay›s› 0 ie 1 aras›nda de¤erler al›r. Belirlilik katsay›s›n›n s›f›r (R2=0) olmas› durumunda de¤iflkenler aras›nda hiçbir iliflki olmad›¤›, bir (R2=1) olmas› durumunda ise de¤iflkenler aras›nda tam bir iliflki oldu¤u karar›na var›r›z. R2’nin de¤eri 1,0’a yaklaflt›kça belirlilik artar ve de¤iflkenler aras› iliflki güçlenir, 0’a yaklaflt›kça ise belirsizlik artar ve de¤iflkenler aras› iliflki zay›flar. Üstel regresyon denklemi ile yap›lacak tahminlerde de standart hata; ∑ (Y − Y ′) 2 Sy = n−k eflitli¤i ile hesaplan›r. Burada, k = üstel regresyon denklemi parametre say›s›d›r (Üstel regresyon denkleminin a ve b parametresi oldu¤undan k = 2’dir). Belirlilik katsay›s› R2’nin 0,5’den büyük olmas› (R2>0,5) durumunda, regresyon denkleminin gözlem de¤erlerinin %50’den fazlas›yla uyumlu oldu¤u ve %50’den fazlas›n› aç›klayabildi¤ini söyleyebiliriz. Ayr›ca, R2>0,5 olmas› durumunda, de¤iflkenler aras›nda güçlü bir iliflki oldu¤u söylenebilir. 134 Co¤rafi Bilgi Sistemleri ‹çin Temel ‹statistik Ba¤›ml› de¤iflken Y’nin standart sapmas› ise afla¤›daki eflitliklerle hesaplan›r. • n≥30 için σ y = • n<30 için σ y = SIRA S‹ZDE D Ü fi Ü N E L ‹ M S O R U D‹KKAT SIRA S‹ZDE AMAÇLARIMIZ K ‹ T A P TELEV‹ZYON ‹NTERNET ∑ (Y − Y )2 n ∑ (Y − Y )2 n −1 Üstel regresyon e¤risine göre tahmin hatalar›n›n da¤›l›m› normal oldu¤undan, herhangi bir X de¤iflken de¤eri için yap›lacak Y’ noktasal tahmininin güven aral›¤›n› da, gözlem say›s›na göre belirli bir güven düzeyi (α) için standart normal de¤er (Zα/2) veya Student t istatistik de¤eri (tα/2,v) ile do¤rusal regresyonda oldu¤u SIRA S‹ZDE gibi belirleriz. Korelasyon katsay›s›n›n testinde, red bölgesi tan›mlama ve test istatisti¤i hesaplamada kullan›lan belirlilik katsay›s›n›n test edilmesinde kullan›lamaz. AnD Ü fi Ü N E L ‹yöntem, M cak, X ve Y de¤iflkenlerinin logaritmik gözlem de¤erleriyle hesaplanacak korelasyon katsay›s›n›n testi için, do¤rusal korelasyon katsay›s› testindeki yöntem uygulaS O R U nabilir. ‹ K Kfazla A T de¤iflkenli regresyon analizlerinde, regresyon denkleminin gözlem E¤risel ve ikiDden de¤erlerini aç›klay›p aç›klamad›¤›nda kullan›lan belirlilik katsay›s›n›n testinde, F testi (varyans analizi) uygulanmaktad›r. F testi bu ünitenin kapsam› d›fl›nda tutulmufltur. F tesSIRA S‹ZDE ti hakk›nda ayr›nt›l› bilgiyi Neyran Orhunbilge’nin “Uygulamal› Regresyon ve Korelasyon Analizi” (‹stanbul Üniversitesi, ‹flletme Fakültesi Yay›nlar› No:267) kitab›ndan elde edebilirsiniz. AMAÇLARIMIZ N N Örnek : ‹ T A P TürkiyeKMadencilik Sektöründe son befl y›lda meydana gelen ifl kazalar› ile sabit sermaye yat›r›mlar› aras›nda afla¤›daki veriler elde edilmifltir. Sabit Sermaye TELEV‹ZYON Yat›r›m› ‹fl Kazas› Say›s› (Milyon TL) 707 15040 ‹NTERNET 865 11007 1041 8848 1049 7856 1253 7069 a) Sabit sermaye yat›r›mlar› ile ifl kazalar› aras›ndaki fonksiyonel iliflkiyi serpilme diyagram›nda inceleyerek, iliflkinin do¤rusal veya üstel olup olmad›¤›na karar veriniz. b) Regresyon denklemini bulunuz. c) Regresyon denklemiyle yap›lacak tahminlerin standart hatas›n› ve belirlilik katsay›s›n› hesaplay›n›z. Belirlilik katsay›s›n› ele alarak, elde edilen regresyon denkleminin gözlem de¤erlerini ne derecede aç›klayabildi¤ini yorumlay›n›z. Çözüm : a) Mant›ksal olarak, sabit sermaye yat›r›mlar› ifl kazalar›n› etkiledi¤inden, sabit sermaye yat›r›mlar› ba¤›ms›z de¤iflken (X) ve ifl kazalar› say›s› ba¤›ml› de¤iflken 6. Ünite - Regresyon ve Korelasyon (Y) dir. X ve Y aras›ndaki fonksiyonel iliflkinin serpilme diyagram›ndaki görünüflü afla¤›daki gibidir. Serpilme diyagram›ndan da görüldü¤ü gibi, sabit sermaye yat›r›mlar› artt›kça ifl kazalar› say›s› e¤risel olarak azalmaktad›r. Bu durumda, X ile Y aras›nda üstel bir regresyon iliflkisi oldu¤unu söyleyebiliriz. b) Üstel regresyon denklemini elde edebilmek için öncelikle X ve Y de¤iflkenleri de¤erlerine logaritmik dönüflümler uygular›z ve daha sonra regresyon parametrelerini hesaplar›z. X Y V (LnX) Z (LnY) 707 15040 20,377 9,618 865 11007 20,578 9,306 1041 8848 20,763 9,088 1049 7856 20,771 8,969 1253 7069 20,949 8,863 ∑V = 103, 438 V= ∑V = 103, 438 = 20, 688 5 n Z= ∑ Z = 45, 845 = 9,169 5 n z = Z −Z v2 z2 vz 0,449 0,0967 0,2016 -0,1396 -0,109 0,137 0,0119 0,0188 -0,0149 9,088 0,076 -0,081 0,0058 0,0066 -0,0062 8,969 0,083 -0,200 0,0069 0,0400 -0,0166 8,863 0,261 -0,306 0,0681 0,0936 -0,0799 V Z v = V −V 20,377 9,618 -0,311 20,578 9,306 20,763 20,771 20,949 v 2 = 0,1894 ∑ z 2 = 0, 3606 Do¤rusallaflt›r›lm›fl üstel regresyon parametreleri; B= ∑ Z = 45, 845 ∑ vz = −0, 2572 = −1, 358 ∑ v 2 0,1894 ∑ vz = −0, 2572 135 136 Co¤rafi Bilgi Sistemleri ‹çin Temel ‹statistik A = Z − B.V = 9,169 − (−1, 358.20, 688) = 37, 263 Üstel regresyon parametreleri ve denklemi; b=B=-1,358 a=eA=e37,263=15244,6.1012 Y'=15244,6.1012.X-1,358 c) Tahminlerin standart hatas›n› afla¤›daki eflitlikle hesaplayabilmek için öncelikle her bir X de¤eri ile Y' de¤erlerini tahmin ederiz. X (106 TL) Y Y' Y-Y' (Y-Y')2 707 15040 14642 398 158295 865 11007 11134 -127 16109 1041 8848 8658 190 36097 1049 7856 8568 -712 507603 1253 7069 6731 338 114046 ∑ (Y − Y ')2 = 832151 Sy = ∑ (Y − Y ' )2 = n−2 832151 = 526, 7 5− 2 Belirlilik katsay›s›n›; S2y R 2 = 1− σ y2 eflitli¤inden hesaplar›z. Ancak bunun için öncelikle Y de¤iflkeninin standart sapmas›n› (σy) hesaplamam›z gerekmektedir. σy = ∑ (Y − Y )2 n −1 Y Y −Y (Y − Y )2 15040 5076 25765776 11007 1043 1087849 8848 -1116 1245456 7856 -2108 4443664 7069 -2895 8381025 ∑ Y = 49820 Y= 49820 = 9964 5 ∑ (Y − Y )2 = 40923770 137 6. Ünite - Regresyon ve Korelasyon σy = ∑ (Y − Y )2 R 2 = 1− n −1 S2y σ y2 = 1− = 40923770 = 3198, 6 5 −1 (526, 7 )2 (3198, 6)2 = 0, 973 Elde edilen üstel regresyon denklemi, gözlem de¤erlerinin %97,3’ünü aç›klayabilmektedir. R2 = 0, 973 > 0, 5 oldu¤undan, de¤iflkenler aras›nda oldukça güçlü bir iliflkinin var oldu¤unu söyleyebiliriz. Ayn› deprem büyüklü¤ünde bir kent merkezindeki dolgu zeminde SIRA uzakl›¤a S‹ZDEba¤l› olarak ölçülen en büyük (maksimum) h›zlar afla¤›daki gibidir. a) Uzakl›k ile h›z aras›ndaki fonksiyonel iliflkiyi serpilme diyagram›nda inceleyerek, iliflD Ü fi Ü N E L ‹ M kinin do¤rusal veya üstel olup olmad›¤›na karar veriniz. b) Regresyon denklemini bulunuz. 5 S O R U Uzakl›k(km) SIRA S‹ZDE D Ü fi Ü N E L ‹ M S O R U H›z(cm/sn) 5 40 D ‹ K K A T 10 33 15 20 32SIRA S‹ZDE 29 25 28 AMAÇLARIMIZ D‹KKAT N N SIRA S‹ZDE AMAÇLARIMIZ K ‹ T A P K ‹ T A P TELEV‹ZYON TELEV‹ZYON ‹NTERNET ‹NTERNET 138 Co¤rafi Bilgi Sistemleri ‹çin Temel ‹statistik Özet N A M A Ç 1 N A M A Ç 2 De¤iflkenler aras› iliflkilerde ba¤›ml›l›k olmas› durumunda, bu iliflkinin fonksiyonunu, yönünü ve derecesini belirlemede kullan›labilecek yöntemleri aç›klamak. De¤iflkenler aras›ndaki iliflki, bunlar›n kendi aralar›nda neden-sonuç iliflkisinin bulunmas› ve de¤erlerinin karfl›l›kl› de¤iflimleri aras›nda bir ba¤l›l›k olmas› fleklinde anlafl›l›r. De¤iflkenler aras›ndaki neden-sonuç iliflkisinde neden ba¤›ms›z (X), sonuç ise ba¤›ml› de¤iflkendir (Y). De¤iflkenler aras›ndaki fonksiyonel iliflkinin belirlenmesinde regresyon, iliflkinin güçlü olup olmad›¤›n› belirlemede ise korelasyon analizlerinden yararlanabiliriz. De¤iflkenler aras› iliflkinin regresyon modeli parametrelerini belirler ve daha sonraki tahminlerde kullan›labiliriz. De¤iflkenler aras› iliflkinin fonksiyonu artan veya azalan olabilir. Baz› gözlemlenen de¤iflkenler aras›nda çok kuvvetli fonksiyonel iliflkiler elde edilebilirken, baz›lar›nda ise oldukça zay›f bir iliflki elde edilebilmektedir. De¤iflkenler aras›nda hiçbir iliflkinin olmamas› da söz konusu olabilmektedir De¤iflkenler aras› iliflkinin derecesinin belirlenmesinde korelasyon katsay›s› kullan›lmaktad›r. De¤iflkenler aras› iliflkilerin do¤rusal oldu¤u durumlar için regresyon modeli parametrelerini hesaplamak, korelasyon katsay›s›n› hesaplay›p test etmek, ve regresyon model parametrelerini tahminlerde kullanmak. Bir ba¤›ms›z de¤iflken (X) ile ba¤›ml› de¤iflken (Y) aras›ndaki iliflkinin serpilme diyagram›nda Y = a + bX fleklinde basit do¤rusal görünüme sahip oldu¤u durumlarda, regresyon denkleminin parametrelerini en küçük kareler yöntemi ile hesaplayabiliriz. En küçük kareler yöntemiyle elde etti¤imiz normal denklemler veya küçültülmüfl de¤erlerden regresyon parametrelerini (a ve b) hesaplayabilmekteyiz. En küçük kareler yöntemi, gözlem de¤erleri aras›ndan hata kareleri toplam›n› en küçükleyecek do¤ru geçirilmesini garanti etmekle birlikte, elde etti¤imiz basit regresyon modeli ile yap›lacak tahminlerde, tahmin hatalar› da gözlenebilir. Bu tahmin hatalar›n›n genel ve ortalama ölçüsüne tahminlerin standart hatas› denilmektedir. Regresyon denklemi ile yap›lacak tahminlerin güven aral›¤›n› belirlemede, tahminlerin standart hatas› kullan›maktad›r. ‹ki de¤iflken aras›ndaki do¤rusal regresyon denkleminin gözlenen de¤erleri ne derecede aç›klad›¤›n› incelemede ve de¤iflkenler aras› iliflkinin derecesinin belirlenmesinde korelasyon katsay›s› (r) kullan›lmaktad›r. Korelasyon katsay›s› ∓ 1’e yaklaflt›kça de¤iflkenler aras› iliflkinin güçlendi¤ini ve s›f›ra yaklaflt›kça ise zay›flad›¤›n› söyleyebilmekteyiz. Korelasyon katsay›s›n›n anlaml›l›¤›n›n test edilmesinde, hipotez testleri bölümünde aç›klanan ifllemlerin benzeri yöntemler uygulanmaktad›r. N A M A Ç 3 De¤iflkenler aras› iliflkilerin e¤risel (üstel) oldu¤u durumlar için regresyon modeli parametrelerini hesaplamak belirlilik katsay›s›n› hesaplay›p regresyon modelinin gözlem de¤erlerini ne derecede aç›klayabildi¤ini yorumlamak. Gözlem verilerinin serpilme diyagram›ndaki flekli üstel bir e¤ri görünümünde ise gözlem de¤erlerine logaritmik dönüflümler yap›larak do¤rusallaflt›r›l›p, do¤rusal regresyon kurallar› uygulanarak regresyon parametreleri hesaplanabilmektedir. Üstel regresyon denkleminin gözlenen de¤erleri ne derece aç›klay›p aç›klamad›¤›n› anlamada belirlilik katsay›s› (R2 ) kullan›lmaktad›r. 6. Ünite - Regresyon ve Korelasyon 139 Kendimizi S›nayal›m 1. Serpilme diyagram›nda basit do¤rusal iliflki gözlenen de¤iflkenler aras›nda normal denklemler 20=5a+40b ve 240=40a+360b oldu¤una göre do¤runun e¤imi (b) ne olur? a. 1 b. 2 c. 3 d. 6 e. 12 2. ‹ki de¤iflken aras›nda azalan bir do¤rusal iliflki varsa, afla¤›dakilerden hangisi regresyon denkleminin e¤imi olabilir? a. + 0,9 b. + 1,2 c. + 2,5 d. -1,2 e. 0 3. ‹ki de¤iflken aras›nda herhangi bir iliflki yoksa, korelasyon katsay›s› ne olabilir? a. 1 b. 0,9 c. -0,9 d. 0,8 e. 0 4. Korelasyon katsay›s› hangi de¤erler aras›nda bulunur? a. -1 ≤ r ≤ +1 b. 0 ≤ r ≤ +1 c. -1 ≤ r ≤ 0 d. -0,5 ≤ r ≤ +0,5 e. -0,1 ≤ r ≤ +0,1 5. Bir araflt›rmada n=36 adet gözlem de¤eri aras›ndan Y'=32-6.X fleklinde do¤rusal regresyon denklemi geçirilmifltir. Tahminlerin standart hatas› SY =2 hesaplanm›fl ve α=0,10 güven düzeyi için standart normal de¤erin Zα/2=1,96 oldu¤u belirlenmifltir. Bu durumda, X=2 için tahminlerin alt güven s›n›r› (AGS) ne olur? a. 20 b. 23,92 c. 16,08 d. 12 e. 3,92 6. Eskiflehir’de son befl y›ll›k ya¤›fl miktar› (X) ile bu¤day verimi (Y) aras›ndaki iliflki araflt›r›ld›¤›nda do¤rusal bir regresyon iliflkisinin var oldu¤u belirlenmifltir. Regresyon denklemi tahminleri ile gözlem de¤erleri farklar›n›n kareleri toplam› (Y − Y ')2 = 1875 oldu¤una göre, tahminlerin standart hatas› nedir? a. 5 b. 25 c. 375 d. 625 e. 1875 ∑ 7. Eskiflehir’de son befl y›ll›k ya¤›fl miktar› (X) ile bu¤day verimi (Y) aras›nda araflt›r›lan do¤rusal bir regresyon denklemi için korelasy›n katsay›s›n›n r=0,96 ve korelasyon katsay›s›n›n standart hatas›n›n Sv=0,16 oldu¤u belirlenmifltir. Bu durumda test istatisti¤inin de¤eri ne olur? a. Zh=2 b. th=2 c. Zh=6 d. th=6 e. th=12 8. Bir araflt›rmada elde edilen üstel regresyon denklemi ile yap›lan tahminlerin standart hatas› Sy=4 ve ba¤›ml› Y de¤iflkeninin standart sapmas› σy=20 olarak elde edilmifltir. Belirlilik katsay›s› hesaplanarak elde edilen regresyon denkleminin gözlem de¤erleri hakk›nda ne söylenebilir. a. %4’ünü aç›klayabilmektedir. b. %20’sini aç›klayabilmektedir. c. %56’s›n› aç›klayabilmektedir. d. %90’›n› aç›klayabilmektedir. e. %96’s›n› aç›klayabilmektedir. 9. Afla¤›daki belirlilik katsay›s› de¤erlerinden hangisinde, tahminlerin standart hatas› en küçüktür? a. 0,20 b. 0,50 c. 0,75 d. 0,80 e. 0,95 140 Co¤rafi Bilgi Sistemleri ‹çin Temel ‹statistik Kendimizi S›nayal›m Yan›t Anahtar› 10. Bir madencilik firmas›n›n y›ll›k üretim kapasitesi (X) ile karl›l›¤› (Y) aras›nda Y'=1200.X0,5fleklinde üstel regresyon denklemi elde edilmifltir. Firman›n y›ll›k üretim kapasitesi X=40000 ton oldu¤unda, y›ll›k karl›l›¤› ne olur? a. 200.000 TL b. 240.000 TL c. 2.400.000 TL d. 400.000 TL e. 4.000.000 TL 1. b 2. d 3. e 4. a 5. c 6.b 7. d 8. e 9. e 10. b Yan›t›n›z yanl›fl ise, “En Küçük Kareler Yöntemi” konusuna bak›n›z. Yan›t›n›z yanl›fl ise, “Korelasyon Katsay›s›” konusuna bak›n›z. Yan›t›n›z yanl›fl ise, “Korelasyon Katsay›s›” konusuna bak›n›z. Yan›t›n›z yanl›fl ise, “Korelasyon Katsay›s›” konusuna bak›n›z. Yan›t›n›z yanl›fl ise, “Standart Hata ve Tahminlerin Güven Aral›¤›” konusuna bak›n›z. Yan›t›n›z yanl›fl ise, “Standart Hata ve Tahminlerin Güven Aral›¤›” konusuna bak›n›z. Yan›t›n›z yanl›fl ise, “Korelasyon Katsay›s›n›n Test Edilmesi” konusuna bak›n›z. Yan›t›n›z yanl›fl ise, “Belirlilik Katsay›s› ve Standart Hata” konusuna bak›n›z. Yan›t›n›z yanl›fl ise, “Belirlilik Katsay›s› ve Standart Hata” konusuna bak›n›z. Yan›t›n›z yanl›fl ise, “Üstel Regresyon” konusuna bak›n›z. 141 6. Ünite - Regresyon ve Korelasyon S›ra Sizde Yan›t Anahtar› S›ra Sizde 1 X Kar›flt›rma H›z› (devir/dakika) Y Verim (%) y = Y −Y x2 xy 25 65 -12,5 -9 156,25 112,5 30 70 -7,5 -4 56,25 30 35 74 -2,5 0 6,25 0 40 75 2,5 1 6,25 2,5 45 78 7,5 4 56,25 30 50 82 12,5 8 156,25 100 ∑x=0 ∑y=0 ∑ Y = 444 ∑ X = 225 X= x= X−X 225 = 37, 5 6 Y= ∑ x 2 = 437, 5 ∑ xy = 275 444 = 74 6 Regresyon do¤rusunun e¤imi; b= ∑ xi yi = 275 = 0, 63 ∑ xi2 437, 5 Regresyon do¤rusunun sabiti; a = Y − bX = 74 − (0, 63.37, 5) = 50, 4 Regresyon do¤rusu; Y ' = 50, 4 + 0, 63.X (%) S›ra Sizde 2 X=1,4 için nokta tahmini; ' Y ' = 5 + 0, 2. X = 5 + (0, 2.1, 4) = 5, 28 % olarak buluruz. Y ± Z∝/2 . Sy %90 güvenirlik seviyesinde α=0,10 ve α/2=0,05 dir. n>30 oldu¤undan Z çizelgesinden Zα/2=Ζ0,05 =1,645 elde ederiz. Güven aral›¤›n› Y ' ± Z∝/2 . Sy eflitli¤inden; 5, 28 ∓ (1, 645.0, 06) AGS=5,18 ve ÜGS=5,38 buluruz. S›ra Sizde 3 X Y x y x2 y2 xy 25 65 -12,5 -9 156,25 81 112,5 30 70 -7,5 -4 56,25 16 30 35 74 -2,5 0 6,25 0 0 40 75 2,5 1 6,25 1 2,5 45 78 7,5 4 56,25 16 30 50 82 12,5 8 156,25 64 100 ∑ x 2 = 437,5 ∑ y 2 = 178 ∑ xy = 275 142 Co¤rafi Bilgi Sistemleri ‹çin Temel ‹statistik Korelasyon katsay›s›n›; r= ∑ x. y = ∑ x 2 .∑ y 2 275 = 0, 9854 437, 5.178 olarak hesaplar›z. S›ra Sizde 4 Veriler; n=10 , r=0,89 ve α=0,05 dir. Hipotezler; H0 : r = = 0 H1 : r ≠ ρ = 0 (Çift tarafl› test) Gözlem say›s› n< 30 oldu¤undan küçük örnekleme yap›lm›flt›r. Bu durumda, teorik test istatisti¤ini; α/2 =0,025 ve v=n-2=10-2=8 oldu¤undan, t çizelgesinden tα/2.v = t0.025,8 = 2,306 olarak elde ederiz. Red Bölgesini; th > tα/ 2,v ise H0 red edilir, H1 kabul edilir fleklinde tan›mlar›z. Test istatisti¤i; Sv = 1− r 2 n−2 1− (0, 89)2 = 0,161 10 − 2 r 0, 89 th = = 5, 53 = Sv 0,161 Sv = Üstel regresyon denklemini elde edebilmek için öncelikle X ve Y de¤iflkenleri de¤erlerine logaritmik dönüflümler uygular›z ve daha sonra regresyon parametrelerini hesaplar›z. X Y V (LnX) Z (LnY) 5 40 1,609 3,689 10 33 2,303 3,497 15 32 2,708 3,466 20 29 2,996 3,367 25 28 3,219 3,332 ∑ V = 12, 835 ∑ Z = 17, 351 V= ∑ V = 12, 835 = 2, 567 n Z= 5 ∑ Z = 17, 351 = 3, 470 n 5 z = Z −Z v2 1,609 3,689 -0,958 0,219 0,917 -0,210 2,303 3,497 -0,264 0,027 0,070 -0,007 2,708 3,466 0,141 -0,004 0,020 -0,001 2,996 3,367 0,429 -0,103 0,184 -0,044 3,219 3,332 0,652 -0,138 0,425 -0,090 V Z v = V −V vz 1,615 -0,351 Karar : th= 5,53 > tα/2,v= 2,306 oldu¤undan H0 hipotezi red, H1 kabul edilir. Korelasyon katsay›s› anlaml›d›r. v 2 = 1, 615 ∑ vz = −0, 351 Do¤rusallaflt›r›lm›fl üstel regresyon parametreleri; S›ra Sizde 5 Mant›ksal olarak, uzakl›k deprem dalgas› yay›l›m h›z›n› etkiledi¤inden, uzakl›k ba¤›ms›z de¤iflken (X) ve h›z ba¤›ml› de¤iflken (Y) dir. X ve Y aras›ndaki fonksiyonel iliflkinin serpilme diyagram›ndaki görünüflü incelendi¤inde, X ve Y ara›snda üstel fonksiyonel iliflkinin oldu¤u tahmin edilmektedir. B= ∑ vz = −0, 351 = −0, 217 ∑ v 2 1, 615 A = Z − B.V = 3, 47 − (−0, 217.2, 567 ) = 4, 028 Üstel regresyon parametreleri ve denklemi; b=B=-0,217 a=eA=e4,028=5 6,15 Y ' = 56,15. X −0,217 6. Ünite - Regresyon ve Korelasyon Yararlan›lan Kaynaklar Akdeniz, F. (2007). Olas›l›k ve ‹statistik. Adana: Nobel. Cula, S. & Muluk, Z. (2006). Temel ‹statistik Yöntemleri. Ankara: Baflkent Üniversitesi. Çömlekçi, N. (1989). Temel ‹statistik ‹lke ve Teknikleri. ‹stanbul: Bilim Teknik. Konuk, A. & Önder, S. (1999). Maden ‹statisti¤i. Mühendislik Mimarl›k Fakültesi Maden Mühendisli¤i Bölümü. Eskiflehir: Eskiflehir Osmangazi Üniversitesi. Navidi, W. (2008). Statistics for Engineers and Scientists. New York, NY: McGraw-Hill. Newbold, P. (2005). ‹flletme ve ‹ktisat ‹çin ‹statistik. Ümit fienesen (Çev.). ‹stanbul: Literatür. Orhunbilge, N. (1996). Uygulamal› Regresyon ve Korelasyon Analizi. ‹flletme Fakültesi Yay›n No: 267. ‹stanbul: ‹stanbul Üniversitesi. Püskülcü, H. & ‹kiz, F. (1989). ‹statisti¤e Girifl. ‹zmir: Bilgehan. Serper, Ö. (2000). Uygulamal› ‹statistik II. Bursa: Ezgi. Ünver, Ö. & Gamgam, H. (2006). Uygulamal› Temel ‹statistik Yöntemler. Ankara: Seçkin. Yüzer, A.F. (Ed.) (2009). ‹statistik. Aç›k Ö¤retim Fakültesi Yay›n No: 771, Eskiflehir: Anadolu Üniversitesi. 143 CO⁄RAF‹ B‹LG‹ S‹STEMLER‹ ‹Ç‹N TEMEL ‹STAT‹ST‹K 7 Amaçlar›m›z N N N Bu üniteyi tamamlad›ktan sonra; Bölgesel de¤iflkenlerin özelliklerini aç›klayabilecek, Semi-variogram fonksiyonunun özelliklerini aç›klayabilecek, Kuramsal semi-variogram model (küresel, üstel ve do¤rusal) parametrelerini hesaplayabilecek ve temel uygulamalarda kullanabilecek bilgi ve becerilere sahip olacaks›n›z. Anahtar Kavramlar • • • • • • Jeoistatistik Bölgeselleflmifl de¤iflken Yönsel de¤iflim (anizotropi) Variogram Semi-variogram Külçe varyans› (nugget) • • • • • • Eflik de¤er (sill) Etki mesafesi Külçe etki oran› Anizotropi oran› Örnek çiftleri Küresel model ‹çindekiler Co¤rafi Bilgi Sistemleri ‹çinTemel ‹statistik Jeoistatistiksel Kavramlar • BÖLGESELLEfiM‹fi DE⁄‹fiKENLER • VAR‹OGRAM VE SEM‹-VAR‹OGRAM • KURAMSAL SEM‹-VAR‹OGRAM MODELLER‹ Jeoistatistiksel Kavramlar BÖLGESELLEfiM‹fi DE⁄‹fiKENLER Klasik istatistikte, örneklerin birbirinden ba¤›ms›z ve say›sal bir de¤ere sahip bireyler olduklar› kabul edilir. Buna karfl›l›k, konumsal veya mekansal örnekler ise belirli bir co¤rafi bölge içerisinde birbirleri aras›nda ba¤›ml›l›¤› ve alansal, hacimsel veya a¤›rl›ksal de¤erleri olan örneklerdir. Bu gibi örneklerin klasik istatistiksel yöntemlerle analizinin yap›lmas›, önemli belirsizliklere ve hatalara yol açabilmektedir. Örne¤in, çevre, ya¤›fl, bitki örtüsü, toprak, jeolojik yap› ve madenlerin de¤iflkenli¤i bölgesel olarak farkl›l›klar içerebilmekte ve al›nan örnekler, al›nd›¤› konum koordinatlar›yla ve al›nd›¤› miktarla (hacimsel ve a¤›rl›ksal) ifade edilebilmektedir. Klasik istatistik yöntemler, al›nan örneklerin yerlerini (konumlar›n›), birbirlerini ne flekilde takip ettiklerini, örneklerin etki alanlar›n›n ne oldu¤unu ve bu etki alan›n›n yönsel de¤ifliminin nas›l oldu¤unu dikkate almayan yöntemlerdir. Bu nedenle, klasik istatistik yöntemleri kullanan enterpolasyon yöntemleriyle yap›lacak tahminlerde, hata büyüklü¤ü artmakta ve tahminlerin güvenilirli¤i azalmaktad›r. George Matheron taraf›ndan 1963 y›l›ndan itibaren gelifltirilmeye bafllanm›fl olan jeoistatistik, farkl› nicelikte ve duyarl›l›ktaki veri örneklerinin birbiri aras›ndaki konumsal iliflkisini göz önünde bulunduran uygulamal› istatistik bilim dal›d›r. Jeoistatistik yöntemler, bölgeselleflmifl de¤iflkenler olarak bilinen, bulunduklar› yerlere göre konumsal farkl›l›k gösteren ve birçok özelli¤in tan›mlanmas›nda kullan›lan yöntemlerin genel ad›d›r. Jeoistatisti¤in ilk uygulamalar›, maden yataklar›ndan al›nan bölgesel de¤iflkenlik gösteren tenör, kalori ve kal›nl›k gibi örnek de¤erleri ile örneklenmemifl noktalar›n de¤erlerinin kestirilmesi ve maden yataklar›nda rezerv tahmini yap›lmas› çal›flmalar›ndan oluflmufltur. Ancak, daha sonra güçlü matematiksel temelleri olmas› nedeniyle jeoistatistik, demografik de¤iflimler, çevre ve iklim de¤iflimlerinin izlenmesi, ya¤›fllar›n tahmini, tar›msal hasat tahmini, bitki, orman, zemin ve toprak alanlar›ndaki de¤iflimlerin izlenmesi ve haritalanmas› çal›flmalar›nda kullan›lmaya bafllanm›flt›r. Belirli bir bölgeye özgü de¤erler alan ve konumlar› koordinatlarla tan›mlanan örneklenmifl de¤iflkenlere, bölgeselleflmifl de¤iflkenler denilir. Bölgeselleflmifl de¤iflkenler, rassal örneklenmifl de¤iflkenler olmad›klar›ndan, örnekleme yap›lmam›fl noktalar›n bilinmeyen de¤erlerinin tahmininde, rassal örnekleme kurallar›n› kullanamay›z. Matematiksel bir bak›fl aç›s›yla incelendi¤imizde, bölgeselleflmifl de¤iflkenin de¤erini bulundu¤u konumun bir fonksiyonu olarak ifade edebiliriz. Co¤rafi anlamda bölgesel farkl›l›klar gösteren, birbirleriyle belirli bir mesafe içerisinde ba¤›ml› olan ve miktarsal ölçülerle al›nan örnekler yard›m›yla tahminde, klasik istatistik yöntemler yerine jeoistatistiksel yöntemler uygulamam›z gerekmektedir. Rassal olarak seçilen ölçme noktalar›ndaki de¤iflken de¤erleri yersel olarak ba¤›ms›zken, seçildikleri alan bir bölge oluflturuyorsa bölgesel anlamda birbirleri ile iliflkilidir. 146 Co¤rafi Bilgi Sistemleri ‹çin Temel ‹statistik De¤iflkenin konumsal ba¤›ml›l›¤›n› ifade etmek için, x bir noktan›n koordinat›n› ifade edecek flekilde, Z(x) gösterimi kullan›lmaktad›r. x noktas›nda ölçülmüfl z örnek de¤erini Z(x) rassal de¤iflkeni fleklinde ifade edebiliriz. Böylece Z(x) rassal de¤iflkeni farkl› olas›l›ksal da¤›l›mla her x örnek noktas›nda farkl› z ölçüm de¤erine sahip olabilmektedir. Asl›nda bu karars›z ve düzensiz yap›n›n ard›nda, birbirine yak›n olanlar, birbirine uzak olanlardan daha fazla benzerlik e¤ilimi göstermektedir. Bu karakteristik davran›fl veya yap›, bölgeselleflmifl de¤iflkenin konumsal tutarl›l›¤›n› göstermektedir. Bu durum bölgeselleflmifl de¤iflkenin iki karakteristik yap›s›n› vurgulamaktad›r; • Do¤al bir oluflumun rassal veya karars›z de¤erleri yersel özellikler gösterebilir. • Do¤al bir oluflumun yap›s› bölgesel anlamda genel da¤›l›m› ile iliflkili olabilir. Olas›l›ksal yorumlama bu iki karakteristik yap›y›, rassal fonksiyonlar›n içinde göz önünde bulundurmaktad›r (Journel and Huijbregts, 1978). x noktas›nda Z(x) yersel olarak bir rassal de¤iflkendir. Bölgesel olarak incelendi¤inde Z(x) ve Z(x+h), h uzakl›¤›na ba¤l› olarak her ölçüm noktas›nda ba¤›ms›z de¤ildir ve konumsal otokorelasyonla birbirleri aras›nda bir iliflki söz konusudur (Journel and Huijbregts, 1978). Bölgeselleflmifl de¤iflkenlerin özelliklerini afla¤›daki gibi özetleyebiliriz. Yersellik (Lokalizasyon) Bölgesel de¤iflkenlerin de¤erleri, belirli bir geometrik alan (veya üç boyutlu olarak hacim) s›n›rlar› içinde birbirine ba¤›ml› de¤iflimler gösterir. Do¤adan elde edilen birbirine yak›n mesafedeki veriler benzer özellikler gösterirken, aralar›ndaki uzakl›k artt›kça bu benzerlik azalmaktad›r. Bu durum yersellik (lokalizasyon) kavram› ile aç›klanmaktad›r. Yersellik, belirli konumsal noktalardan al›nan örnek de¤erlerinin, konumlar›na ba¤l› olarak sistematik bir iliflki içinde olmas›n› ifade etmektedir. Belirli bir bölgenin herhangi bir noktas›ndaki de¤iflken de¤eri, o noktadan al›nacak örne¤in flekli, boyutlar› ve do¤rultusu ile de aç›klan›r. Bunlardan herhangi birinde yap›lacak de¤ifliklikle, yeni bir bölgeselleflmifl de¤iflken elde edilir. Örne¤in, ayn› yerden 1 kg’l›k ve 10 kg’l›k iki örnek al›nd›¤›m›zda, iki örne¤ide ayn› yerden almam›za ra¤men, iki ayr› bölgeselleflmifl de¤iflken elde ederiz. Örnek büyüklükleri birbirinden farkl› oldu¤undan, örneklerin ortalama de¤erleri de farkl›laflacakt›r. Devaml›l›k Konumsal olarak al›nan baz› örnekler aras›nda belirli bir mesafe içerisinde sürekli veya devaml› bir iliflki gözlenirken, belirli bir mesafeden sonra ise gözlenmez. Birbirine komflu baz› konumsal örnekler aras›nda ise hiçbir devaml›l›k gözlenmez. Örne¤in, sedimanter orijinli cevherler hidrotermal orijinli cevherlerden, genellikle çok daha iyi devaml›l›k gösterirler. Bununla birlikte, baz› nadir metalik maden (alt›n, platin gibi) yataklar›nda ise belirli bir devaml›l›k görülmez ve maden yata¤›ndaki cevher da¤›l›m› rassald›r. Yönsel De¤iflim (Anizotropi) Bir bölgeselleflmifl de¤iflken için al›nan konumsal örne¤in etki alan› bütün yönlerde ayn› uzan›m› göstermeyebilmektedir. Belirli bir yönde, belirli bir mesafe içerisinde süreklilik gözlenmesine karfl›l›k, bir baflka yönde süreksiz ve düzensiz de¤i- 7. Ünite - Jeoistatistiksel Kavramlar 147 fliklikler görülebilmektedir. Bölgeselleflmifl bir de¤iflken örnekleri aras›nda belirli bir mesafe içerisinde devaml›l›¤›n yönsel farkl›l›klar göstermesi, ilgili de¤iflkenin anizotropik bir de¤iflken oldu¤unu ifade eder. Geçifller Konumsal olarak al›nan baz› örnekler aras›nda belirli aral›klarla devaml›l›k gözlenirken, baz› mesafe aral›klar›nda ise devaml›l›k gözlenmeyebilir. Bu olay geçifller halinde devam eder. VAR‹OGRAM VE SEM‹-VAR‹OGRAM Jeoistatistiksel yöntemlerde, konumsal de¤iflkenler aras›nda belirli bir uzakl›¤a ve yöne ba¤l› bir bölgeselleflmifl iliflkinin var oldu¤u ve bu iliflkinin variogram fonksiyonu ile ifade edilebilece¤i aç›klanmaktad›r. Variogram fonksiyonu yard›m›yla de¤iflkenlerin yap›sal özellikleri belirlenebilmekte ve bilinmeyen noktalar›n de¤erlerinin tahmininde, bu özellikler kullan›labilmektedir. Bölgeselleflmifl de¤iflkenin de¤erleri aras›ndaki farklar [z(x1)-z(x2)] de¤iflkenin benzerlik derecesini ortaya koydu¤undan, uzakl›¤a ba¤l› iliflkiyi incelemede önemlidir. Bölgeselleflmifl de¤iflkenlerden al›nan iki örnek de¤eri aras›ndaki fark, bu örneklerin hacmine ve aralar›ndaki uzakl›¤a ba¤l› olarak de¤iflir. Bölgeselleflmifl ana kütleden düzenli aral›klarla yap›lan örneklemeler sonucunda, aralar›nda uzakl›klara ba¤l› olarak oluflan örnek çiftleri aras› farklar›n kareleri toplam›n›n örnek çifti say›s›na oran›na variogram denilmekte olup, bu fonksiyon afla¤›daki gibidir. 2c* (h) = Variogram hesaplamalar›nda, örnek çiftlerinin say›s›n›n 30’dan az olmamas› tercih edilir. Örnek çiftlerinin say›s› azald›kça, semi-variogram de¤erlerinde afl›r› sapmalar görülmeye bafllamaktad›r. 2 1 ∑ z(x) - z(x + h) n Burada, 2γ* (h) = h uzakl›k fark›na göre hesaplanan deneysel variogram, n = örnek çiftlerinin say›s›, z(x) = x noktas›ndan al›nan örne¤in de¤iflken de¤eri, z(x+h) = x noktas›ndan h uzakl›kta al›nan örne¤in de¤eridir. Variogram›n yar›s› semi-variogram› verir ve afla¤›daki fonksiyonla ifade edilir. c* (h) = 2 1 ∑ z(x) - z(x + h) 2n Örneklenen de¤iflken de¤erleri ile elde edilen semi-variogram de¤erlerine, deneysel semi-variogram de¤erleri denilmektedir. Deneysel semi-variogram de¤erlerini hesaplamaya bafllamadan önce, örneklenen de¤iflken de¤erlerinin da¤›l›m modelinin belirlenmesi gerekmektedir. Konumsal de¤iflkenlerin da¤›l›m›, normal, lognormal veya üstel (eksponansiyel olabilmektedir. E¤er, da¤›l›m modeli araflt›r›lmadan deneysel semi-variogram hesaplamalar› yap›l›rsa, elde edilen de¤erlere model uyarlamak mümkün olamayabilir. Örne¤in, lognormal da¤›l›ma sahip bir de¤iflken için deneysel semi-variogram hesaplamalar›n›, de¤iflkenin logaritmik de¤erleri ile yapmazsak, elde edilen de¤erlere uyan model ya hatal› olacakt›r, ya da uygun bir model bulmak mümkün olamayacakt›r. Deneysel Semi-Variogram Parametreleri Örneklenen veri çiftleri de¤iflken de¤erleri aras›ndaki aras›ndaki farklar›n kareleri toplam›n›n uzakl›¤a ba¤l› de¤iflimi ile elde edilen deneysel semi-variogram›n ge- Semi-variogram, genel anlamda h’n›n artan bir fonksiyonudur. ‹ki ayr› noktadan al›nan de¤erler, bu noktalar birbirinden uzaklaflt›¤› oranda farkl› olmaktad›r. 148 Co¤rafi Bilgi Sistemleri ‹çin Temel ‹statistik nel olarak külçe varyans› (nugget), eflik de¤er (sill) ve etki mesafesi olmak üzere üç önemli parametresi vard›r. Bu parametrelerin de¤iflken yap›s›n› aç›klamadaki önemi afla¤›da s›ra ile aç›klanm›flt›r. Külçe varyans›, örneklenen de¤iflkenin bölgesel homojenli¤ini gösterir. Yüksek de¤erdeki külçe varyans›, de¤iflkenin çok zay›f flekilde genifl bir alana yay›ld›¤›n› veya örnekleme ve analiz hatalar›n›n yap›ld›¤›n› gösterir. Düflük de¤erdeki külçe varyans› ise de¤iflkenin en k›sa mesafede bile devaml›l›¤a ve süreklili¤e sahip oldu¤unu gösterir. Külçe Varyans› (C0) Teorik olarak semi-variogram fonksiyonunun orijin civar›ndaki de¤eri s›f›r “0” olmal›d›r. Ancak, baz› de¤iflkenler için elde edilen semi-variogram fonksiyonunda orijinde de süreksizlikler görülebilir ve bu durum da, de¤iflkenin de¤ifliminde külçe (nugget) varyans›n›n etkisi gözlemlenir (fiekil 7.1). Semi-variogram›n orjindeki süreksizli¤ini gösteren külçe varyans›, örnekleme ve ölçüm hatalar›ndan veya de¤iflkenin yap›s›ndan kaynaklanmaktad›r. Örne¤in, alt›n madeni yataklar›nda kayalar içerisinde çökelmifl serpinti halinde alt›nlar olabilece¤i gibi, yer yer külçe halinde alt›n oluflumlar›na da rastlanabilmektedir. Eflik De¤er (C0+C) Eflik de¤er, genellikle külçe varyans› (C0) ve yap›sal varyans›n (C) toplam›na eflittir (C0+C). Külçe etkisi görülmeyen de¤iflkenlerin semi-variogram de¤erleri için eflik de¤er sadece yap›sal varyanstan oluflur. Pratikte eflik de¤er, variogram› hesaplamak için kullan›lan tüm bölgesel de¤iflken de¤erlerinin varyans›na eflittir ( C0+C= σ2). Deneysel semi-variogram de¤erlerindeki düzenli flekildeki art›fl›n sona ermesi ve belirli bir tepe noktas›na (eflik de¤ere) ulaflmas›ndan sonra, semi-variogram de¤erleri sabit kal›r. Semi-variogram de¤erlerinin ulaflt›¤› en üst de¤ere, eflik de¤er (sill) denilir. Bu noktadan sonra iki örne¤in de¤erlerinin ortalama varyasyonu aralar›ndaki uzakl›¤a ba¤l› olmamakta, z(x) ve z(x+h) aras›nda hiçbir iliflki kalmamaktad›r. γ* (h)’n›n sabit oldu¤u a uzakl›¤›ndan sonra, jeoistatistikle elde edilen sonuç klasik istatistikle elde edilen sonucun ayn›s› olmaktad›r (fiekil 7.1). Külçe Etki Oran› (ε) Deneysel semi-variogram de¤erlerinden külçe etkisinin (C0), yap›sal varyansa (C) oran›na külçe etki oran› (ε = C0/C) denilir. Jeoistatistiksel yöntemlerle yap›lacak tahminlerde, külçe etki oran› (ε) ile orant›l› olarak tahmin de¤erlerinde düzeltme yap›l›r. Külçe etki oran› (külçe etki), de¤iflekenin rassal de¤ifliminin büyüklü¤ünü gösterir. Etki Mesafesi (a) Bölgesel de¤iflkenin iki örnek de¤eri aras›nda, uzakl›¤a ba¤l› iliflkinin bulundu¤u en büyük mesafeye etki mesafesi denir. Deneysel semi-variogram de¤erlerindeki γ* (h)’daki art›fl, etki uzakl›¤› ad› verilen belirli bir a uzakl›¤›n›n ötesinde genellikle de¤iflmemekte ve sabit kalmaktad›r. Etki mesafesinden daha uzak mesafedeki örnek de¤iflken de¤erleri birbirinden ba¤›ms›z kabul edilir. Etki mesafesine yap›sal uzakl›k da denilmektedir. Yönsel Etki Mesafesi Oran› (Anisotropi Oran›) Deneysel semi-variogram analizlerinde, bölgeselleflmifl de¤iflkenin de¤erlerinde uzakl›¤›a ba¤l› yönsel geliflimler olup olmad›¤› da araflt›r›l›r. Deneysel semi-variogram de¤erlerinin yönsel de¤iflim gösterdi¤i durumlarda, araflt›r›lan her bir yön için etki mesafesi hesaplan›r. Yönsel semi-variogram de¤erleri aras›ndan en büyük etki mesafesinin (amax ), en küçük etki mesafesine (amin ) oran›na, yönsel etki meafesi oran› veya anizotropi oran› denilir. Yönsel etki mesafesi oran›, jeoistatistiksel tahminlerde kullan›lacak elipsoidal etki alan›n› belirlemede kullan›l›r. 149 7. Ünite - Jeoistatistiksel Kavramlar fiekil 7.1 Deneysel variogram γ ∗(h) Semi-Variogram Fonksiyonunun Parametreleri Eflik C0+C Variogram modeli Külçe C0 Etki Uzakl›¤›(a) Semi-Variogram›n Yönsel De¤iflimi (Anizotropi) Deneysel semi-variogram›n inceledi¤i de¤iflken, eflyönlü (izotrop) bir yap› gösteriyorsa, di¤er bir de¤iflle yönsel bir da¤›l›m göstermiyorsa ve do¤rultudan ba¤›ms›z ise bu tür semivariogramlara ortalama semi-variogram ad› verilir. Ortalama semivariogram yönden ba¤›ms›z olarak, olanakl› tüm veri çiftlerini deneysel semi-variogram de¤erleriyle hesaplan›r. Bununla birlikte, semi-variogram fonksiyonunun ayn› eflik (sill) de¤erine, farkl› yönlerde farkl› etki mesafelerinde ulaflmas› halinde, de¤iflkenin uzakl›¤a ba¤l› de¤ifliminin anizotropik oldu¤u söylenebilir. Örne¤in, jeolojik katmansal yap›larda yatay ve düfley yönde görülen etki uzakl›¤›n›n de¤iflmesi, en belirgin anizotropidir. Düfley semivariogram yatay semivariograma k›yasla daha k›sa uzakl›klarda eflik (sill) de¤erine ulafl›r. Dere yataklar›na dik veya paralel tortul (sedimanter) kayaçlarda ise yansal anizotropi göze çarpmaktad›r. Semi-Variogram Fonksiyonunun Orijine Yak›n Davran›fl› Semi-variogram fonksiyonunun orijin civar›ndaki flekli, bölgeselleflmifl de¤iflkenlerin önemli özelliklerini aç›klar. Semi-variogram fonksiyonunun bafllang›ç noktas› ile bölgeselleflme olay›n›n devaml›l›¤› aras›nda önemli bir ba¤lant› vard›r. Semi-variogram›n bafllang›ç noktas› civar›nda gösterdi¤i davran›fl genel olarak üç tip olmaktad›r. • Parabolik davran›fl (devaml› tip): Semi-variogram, bafllang›ç noktas› civar›nda paraboliktir (fiekil 7.2.a). De¤iflkenin tam anlam›yla düzenli oldu¤unu ve devaml›l›¤›n› gösterir. • Do¤rusal davran›fl (do¤rusal tip): Semi-variogram, bafllang›ç noktas› civar›nda do¤rusal bir flekilde sürekli art›yor ya da azal›yorsa, bu durum bölgeselleflmifl de¤iflkenin belirli bir mesafe içinde devaml›l›¤›n› ifade eder (fiekil 7.2.b). • Orijinde süreksizlik (külçe tip): Bafllang›ç noktas› civar›nda devaml›l›¤›n görülmedi¤i bu duruma külçe (nugget) etkisi denilir (fiekil 7.2.c). Bölgeselleflmifl de¤iflkenin devaml›l›¤›n›n çok zay›f oldu¤unu ifade eden bu tip davran›fl, genellikle nadir metal (alt›n, gümüfl, platin vd.) maden yataklar›nda gözlemlenir. γ* (h) fonksiyonunun yönsel geliflimini belirleyebilmek için, de¤iflik yönler boyunca elde edilen örnek çiftleriyle ayr› ayr› semi-variogram hesaplanmal›d›r. Yön de¤ifltikçe hesaplanacak γ* (h)’lardaki de¤iflikliklerin araflt›r›lmas›, mümkün anizotropi durumlar›n›, yani de¤iflken de¤erindeki yönsel de¤iflkenli¤i ortaya ç›karmaktad›r. 150 Co¤rafi Bilgi Sistemleri ‹çin Temel ‹statistik fiekil 7.2 Semi-Variogram Davran›fllar› (Tercan ve Saraç, 1998) ÖRNEK Afla¤›daki fiekil 7.3’de, bir mangan cevheri yata¤›nda 100m aral›klarla yap›lan sondajlardan elde edilen ortalama tenör (%Mn) de¤erleri görülmektedir. Bu sondaj verilerini ele alarak, do¤u-bat› yönünde ve kuzey-güney yönünde deneysel semi-variogram de¤erlerini hesaplay›p, grafiksel olarak gösteriniz. Mangan maden yata¤›n›n tenör (%Mn) de¤iflminde yönsel de¤iflim farkl›l›¤› olup olmad›¤›n› yorumlay›n›z. fiekil 7.3 Deneysel semivariogram›n hesaplanmas› için kullan›lan mangan cevheri yata¤› sondaj sonuçlar› Çözüm: Öncelikle do¤u-bat› yönü ele al›narak, birbirine 100 m uzakl›kl› örnek çiftleri aras› deneysel semi-variogram afla¤›da hesaplanm›flt›r. fiekil 7.4’de örnek çiftleri aras› iliflkiler görülmektedir. c* (h) = 1 z(x) − z(x + h) 2 ∑ 2n 151 7. Ünite - Jeoistatistiksel Kavramlar c∗ (100) = 1 2 2 2 + ( 24 − 25)2 + ( 25 − 27 )2 (35 − 37) + (37 − 35) + (35 − 34) + .......+ 2.36 c∗ (100) = 1 100 2.36 γ* (100) = 1,39 (%)2 Do¤u-bat› yönünde 200 m aral›kl› örnek çiftleri aras› iliflkiler fiekil 7.5’de görüldü¤ü gibi olup, bu durum için, c∗ (200) = 1 2 2 2 2 2 (39 − 35) + (35 − 35) + (35 − 32) + ...... + ( 25 − 24) + ( 24 − 27) 2.33 c∗ (200) = 1 188 = 2, 85 (%)2 2.33 semi-variogram de¤eri hesaplanm›flt›r. fiekil 7.4 Do¤u-bat› yönünde 100 m aral›kl› örnek çiftleri aras› iliflki fiekil 7.5 Do¤u-bat› yönünde 200 m aral›kl› örnek çiftleri aras› iliflki 152 Co¤rafi Bilgi Sistemleri ‹çin Temel ‹statistik Do¤u-bat› yönünde 100 m, 200 m, 300 m ve 400 m aral›klarla, kuzey-güney yönünde 100 m, 200 m ve 300 m aral›klarla örnek çiftleri aras›nda hesaplanm›fl deneysel semi-variogram de¤erleri Çizelge 7.1’de verildi¤i gibidir. Bu semi-variogram de¤erleri, örnekler aras› mesafenin fonksiyonu olarak fiekil 7.6’daki gibi de gösterilebilir. Çizelge 7.1 Mangan cevheri sondaj örnekleri için iki ana yönde hesaplanm›fl deneysel semivariogram de¤erleri Örnekler Aras› Deneysel Semi Örnek Çiftleri Mesafeler (ft) Variogram (%)2 Say›s› Yön Do¤u-Bat› 100 200 300 400 1,39 2,85 3,39 5,17 36 33 27 23 Kuzey-Güney 100 200 300 4,86 8,94 15,07 36 27 21 fiekil 7.6 Mangan cevheri sondaj örnekleri için iki ana yönde hesaplanm›fl deneysel semivariogram de¤erleri grafi¤i Do¤u-Bat› Kuzey-Güney Örnek Çiftleri Aras› Mesafe (m) fiekil 7.6’dan da görüldü¤ü gibi her iki yöndeki yap›da önemli farklar vard›r. Kuzey-güney semi-variogram› do¤u-bat›dan daha dik olarak yükselmektedir. Bu durumda do¤u-bat› yönünde daha büyük bir devaml›l›¤›n oldu¤unu söylemek mümkündür. SIRA S‹ZDE SIRA S‹ZDEbulunan 680 m uzunluklu ana bulvarda, eksoz gaz› yay›l›m›n›n koBir kent merkezinde numsal de¤iflmini belirlemek amac›yla 20 m aral›klarla karbon monoksit ölçümleri yap›lm›fl olup, bulvar bafl›ndan bafllayarak bulvar sonuna kadar yap›lan ölçümlerin sonuçlar› D Ü fi Ü N E L ‹ M afla¤›da verildi¤i gibidir. Bulvar boyunca yap›lan karbonmonoksit ölçümleri için 20 m ve 40 m için semi-variogram de¤erlerini hesaplay›n›z. 1 D Ü fi Ü N E L ‹ M S O R U S O R U Ölçüm Yeri (m) CO (ppm) Ölçüm Yeri (m) CO (ppm) Ölçüm Yeri (m) CO (ppm) Ölçüm Yeri (m) CO (ppm) Ölçüm Yeri (m) CO (ppm) 0 20 140 35 280 44 420 34 560 26 20 22 160 37 300 48 440 37 580 26 40 28 180 42 320 44 460 33 600 28 60 26 200 36 340 46 480 33 620 27 AMAÇLARIMIZ 80 33 220 38 AMAÇLARIMIZ 360 37 500 29 640 29 100 38 240 39 380 39 520 32 660 24 120 33 260 41 400 39 540 27 680 28 D‹KKAT SIRA S‹ZDE N N D‹KKAT SIRA S‹ZDE K ‹ T A P K ‹ T A P TELEV‹ZYON TELEV‹ZYON 153 7. Ünite - Jeoistatistiksel Kavramlar KURAMSAL SEM‹-VAR‹OGRAM MODELLER‹ Bölgeselleflmifl de¤iflkenin özelliklerinin belirlenmesi ve daha sonra örneklenmemifl noktalar›n kestiriminde kullanmak üzere, araziden al›nan örneklerle hesaplanan deneysel semi-variogram de¤erlerinin modellenmesi (uygun e¤ri tipinin bulunmas›) gerekir. Deneysel semi-variogram de¤erlerine model uyarlama konusunda birçok çal›flma yap›lm›fl olup, bu modellerin fonksiyonlar› afla¤›da tan›t›lmaktad›r. Küresel (Spherical) Model Matheron’un önerdi¤i bu küresel modelde, semivariogram fonksiyonu orijine yak›nlaflt›kça do¤rusal özellik göstermektedir (fiekil 7.7). Modelde, orijinden çizilen te¤et etki uzakl›¤›n›n (a) 2/3’ünde eflik de¤er (sill - C) ile kesiflmektedir. Küresel model afla¤›daki gibi tan›mlanmaktad›r. Külçe etkisi görülmeyen küresel modellerde, semivariogram fonksiyonunun yap›sal varyans› (C) ayn› zamanda modelin eflik de¤eri olarak da tan›mlan›r. 3h h3 h ≤ a oldu¤u zaman − 2a 2a 3 c(h) = C γ(h) = C h ≥ a oldu¤u zaman Burada γ(h) = kuramsal semi-variogram fonksiyonunu, h = örnek çiftleri aras› uzakl›¤›, C = semi-variogram fonksiyonunun ulaflt›¤› en büyük yüksekli¤i (yap›sal varyans›), a = örneklerin birbirinden ba¤›ms›z oldu¤u uzakl›¤› (etki mesafesini) göstermektedir. fiekil 7.7 Küresel SemiVariogram Model Baz› semi-variogram fonksiyonlar› külçe (nugget) etki nedeniyle orijinden bafllamayabilir. Bu durumda külçe etkili küresel model için, γ(o) = C0 3h h3 h ≤ a oldu¤u zaman − 2a 2a 3 c(h) = C0 + C γ(h) = C0 + C h ≥ a oldu¤u zaman 154 Co¤rafi Bilgi Sistemleri ‹çin Temel ‹statistik fleklinde bir fonksiyon kullan›labilir (fiekil 7.8). fiekil 7.8 Külçe Etkili Bir Küresel Model ÖRNEK Küresel semi-variogram parametreleri a=100 m, C0=2,5 (%Zn)2 ve C=10,5 (%Zn)2 olan bir maden yata¤›nda, konumsal olarak aralar›nda 50 m mesafe bulunan iki nokta aras›ndaki ortalama semi-variogram› hesaplay›n›z. Çözüm: Örnek verileri inceledi¤imizde, külçe varyans›n›n (C0) varl›¤› nedeniyle, küresel modelin külçe etkili bir model oldu¤unu belirlemekteyiz. ‹ki nokta aras›ndaki mesafe h=50 m oldu¤una göre, ortalama semi-variogram afla¤›daki gibi hesaplar›z. 3h h3 − 2a 2a 3 c(h) = C0 + C 3* 50 (50)3 − 2 *100 2 * (100)3 c(50) = 2, 5 + 10, 5 * γ(50) = 9,72 (%Zn)2 SIRA S‹ZDE D Ü fi Ü N E L ‹ M S O R U D‹KKAT SIRA S‹ZDE AMAÇLARIMIZ K ‹ T A P 2 Bir kömür madeni iflletmesinde sodaj yap›larak elde edilen kal›nl›k verileri ile variogram SIRA S‹ZDE analizi yap›lm›fl ve kal›nl›k de¤ifliminin afla¤›daki küresel semi-variogram modeli parametreleri ile ifade edilebilece¤i belirlenmifltir. Aralar›nda 150 m mesafe bulunan iki nokD Ü fi Ü N E L ‹ M ta aras›ndaki ortalama semi-variogram› hesaplay›n›z. Küresel model parametreleri : a=400 m ve C=90 (m)2 S O R U Üstel (Eksponansiyel) Model Eksponansiyel modelin fonksiyonel flekli de orijinden bafllar, yavafl yavafl yükselir D‹KKAT ve eflik de¤ere (sill’e) tamamen ulaflamaz. Uygulamada eflik de¤erinin (sill -C) %95’ine ulafl›ld›¤›nda etki uzakl›¤› (range -a) de¤eri bulunur. Eksponansiyel modeSIRA afla¤›daki S‹ZDE lin fonksiyonu gibidir. γ(h) = C [1 - exp(-h/a)] N N AMAÇLARIMIZ K ‹ T A P 155 7. Ünite - Jeoistatistiksel Kavramlar Küresel ve eksponansiyel modeller fiekil 7.9’da karfl›laflt›r›lmaktad›r. fiekil 7.9 Küresel ve eksponansiyel semivariogram fonksiyonlar›n›n karfl›laflt›r›lmas› Bir bölgede topraktan al›nan örneklerin arsenik (As) içeri¤i (ppm) için yap›lan variogram analizleri sonucunda, afla¤›da parametreleri verilen üstel (eksponansiyel) semi-variogram modeli elde edilmifltir. Ölçüm yap›lamayan ve aralar›nda 100 m mesafe bulunan iki nokta aras›nda ortalama semi-variogram ne olur? Üstel (eksponansiyel) model parametreleri : a= 250 m ve C=600 (ppm)2 As Çözüm: ‹ki nokta aras› mesafe h=100 m oldu¤una göre, üstel model ile iki nokta aras› ortalama semi-variogram› afla¤›daki gibi hesaplar›z. γ(h) = C [1 - exp(-h/a)] 100 c(100) = 600 * 1- e 250 γ(100) = 197,8 (ppm)2 As Do¤rusal Model Semi-variogram fonksiyonunun orijinden bafllayarak do¤rusal olarak sürekli art›fl gösterdi¤i ve herhangi bir eflik de¤erine ulaflamad›¤› durumlarda, afla¤›daki gibi do¤rusal modeller kullan›labilir (fiekil 7.10). γ(h) = p.hλ Burada, p = do¤runun e¤imini, λ = do¤runun üssel art›fl katsay›s›n› göstermektedir. Semi-variogram fonksiyonunun tam do¤rusal olmas› halinde λ = 0’d›r. Genellikle λ, 0 ile 2 aras›nda de¤erler al›r (2’ye eflit olmamal›d›r). ÖRNEK 156 Co¤rafi Bilgi Sistemleri ‹çin Temel ‹statistik fiekil 7.10 Do¤rusal model ÖRNEK Bir demir madeni yata¤›ndan al›nan örneklerin %Fe tenör içeri¤i için yap›lan variogram analizleri sonucunda, verilerin γ(h) = 0,06.h (%)2 Fe fleklinde do¤rusal semi-variogram modeline uygun davran›fl gösterdikleri belirlenmifltir. Bu durumda, aralar›nda 250 m mesafe bulunan iki nokta aras›nda ortalama semi-variogram de¤eri ne olur? Çözüm : ‹ki nokta aras›ndaki mesafe h=250 m oldu¤una göre, ortalama do¤rusal semivariogram de¤erini afla¤›daki gibi hesaplar›z. γ(h) = 0,06.h γ(250) = 0,06 * 250 = 15 (%)2 Fe SIRA S‹ZDE D Ü fi Ü N E L ‹ M 3 Erozyonla mücadele alan› ilan edilen bir bölgede, erozyon duyarl›l›k faktörü (K faktörü) SIRA S‹ZDE ölçümü amaçl› örneklemeler yap›lm›flt›r. K faktörü için yap›lan variogram analizleri sonucunda, verilerin γ(h) = 2.10-5.h fleklinde do¤rusal semi-variogram modeline uygun davraD Ü fi Ü N E L ‹ M n›fl gösterdikleri belirlenmifltir. Bu durumda, aralar›nda 200 m mesafe bulunan iki nokta aras›nda ortalama semi-variogram de¤eri ne olur? S O R U ÖRNEK D‹KKAT SIRA S‹ZDE AMAÇLARIMIZ S O R U Ortalama tenörü %38 Fe ve standart sapmas› %10 Fe olan bir demir madeni yata¤›nda aç›lanD ‹sondajlardan elde edilen örnek çiftleriyle hesaplanan deneysel semiKKAT variogram de¤erleri afla¤›da verildi¤i gibidir. Deneysel semi-variogram de¤erlerini dikkate alarak kuramsal küresel semi-variogram modeli parametrelerini bulunuz. N N SIRA S‹ZDE AMAÇLARIMIZ K ‹ T A P K ‹ T A P TELEV‹ZYON TELEV‹ZYON ‹NTERNET ‹NTERNET Örnek Çiftleri Aras›Mesafe (m) Deneysel Semi-Var. (%)2 Fe 50 100 150 200 250 300 350 40 60 76 106 94 110 98 157 7. Ünite - Jeoistatistiksel Kavramlar Çözüm : Öncelikle mesafeye ba¤l› olarak deneysel semi-variogram de¤erlerini kartezyen koordinat›nda haz›rlanm›fl grafi¤e afla¤›daki fiekil 7.11’deki gibi aktar›r›z. Küresel modelde külçe etkisi (C0) ve eflik de¤eri (C) toplam› varyansa (σ2) eflit (C0 + C = σ2= 100) oldu¤undan, grafik üzerinde varyans› gösteren bir çizgi çizeriz. Deneysel semi-variogram de¤erlerinin ilk iki veya üçünden geçen bir do¤ru çizerek, varyans çizgisini kestiririz. Bu kesiflim noktas›ndan uzakl›k eksenine inilen bir dikme ise a etki mesafesinin üçte ikisine eflit olacakt›r. fiekil 7.11’de görüldü¤ü gibi, varyans (σ2) çizgisini kesen noktadan inilen dikme h=200 m de uzakl›k eksenini kesmektedir. Bu durumda; 2 a = 200 m 3 oldu¤undan, a=300 m olacakt›r. fiekil 7.11 Demir madeni yata¤› verileri ile elde edilen deneysel semi-variogram modeli ‹lk iki veya üç noktadan çizilen do¤ru, semi-variogram γ* (h) eksenini 20 de¤erinde kesmektedir. Bu durumda, küresel model külçe etkisi (C0) içermektedir ve külçe etkisinin de¤eri C0=20 (%)2 Fe’dir. Külçe etkisi (C0) ve eflik de¤eri (C) toplam› C0 + C = σ2 = 100 oldu¤undan, bu durumda eflik de¤eri; C = σ2 - C0 = 100 - 20 = 80 (%)2 Fe olarak bulunur. Elde edilen parametrelere göre küresel modeli afla¤›daki gibi yazabiliriz. 2 h h3 c ( h) = C0 + C − h≤a 3a 2a3 γ (h) = C0 + C h≥a 158 Co¤rafi Bilgi Sistemleri ‹çin Temel ‹statistik 2h h3 − h ≤ 300 m 3.300 2.3003 c ( h) = 20 + 80 γ (h) = 20 + 80 SIRA S‹ZDE D Ü fi Ü N E L ‹ M 4 SIRA (OM) S‹ZDE içeri¤i ortalamas› %5 ve standart sapmas› %2 olan bir ormanl›k Organik madde alanda, topraktan al›nan örnek çiftleriyle hesaplanan deneysel semi-variogram de¤erleri afla¤›da verildi¤i gibidir. Deneysel semi-variogram de¤erlerini dikkate alarak kuramsal D Ü fi Ü N E L ‹ M küresel semi-variogram modeli parametrelerini bulunuz. S O R U S O R U D‹KKAT D‹KKAT SIRA S‹ZDE AMAÇLARIMIZ K ‹ T A P ÖRNEK TELEV‹ZYON ‹NTERNET h ≥ 300 m N N Örnek Çiftleri Aras› Mesafe (m) Deneysel SemiVar. (%)2 OM 50 1,9 100 2,8 150 3,6 200 3,8 250 4,2 300 3,9 SIRA S‹ZDE AMAÇLARIMIZ K ‹ T A P Bir gümüfl madeni iflletmesinde 10 m aral›klarla basamaklarda aç›lan patlatma deliklerinden T E L E al›nan V ‹ Z Y O N k›r›nt› örneklerinin analizi ile elde edilen verilerle hesaplanan deneysel semi-variogram verileri afla¤›da verildi¤i gibidir. Örnekleme yap›lan basamak patlatma delikleri ortalama tenörü 220 gr/ton ve varyans› 15000 (gr/ton)2 oldu¤una göre, ‹NTERNET a) Ortalama semi-variogram model (küresel) parametrelerini bulunuz. b) Yönsel semi-variogram model parametrelerini bularak, anizotropinin güçlü oldu¤u yönü ve anizotropi oran›n› belirleyiniz. Örnekler Aras›Mesafeh - (m) Deneysel Semi-Variogram De¤erleri γ* (h) (gr/ton)2 Ortalama Kuzey-Güney Do¤u-Bat› 10 5000 2850 7500 20 10300 6250 15000 30 13750 8750 12950 40 13900 10800 15550 50 15350 14200 15900 60 16200 13750 13200 70 14325 16225 15450 80 13800 13800 14650 7. Ünite - Jeoistatistiksel Kavramlar Çözüm : a) Küresel model parametreleri; a = 45 m C = 15000 (gr/ton)2 b) Anizotropi Yönü : Kuzey-güney Anizotropi Oran› : (amax/amin = 2,5) 159 160 Co¤rafi Bilgi Sistemleri ‹çin Temel ‹statistik Özet N A M A Ç 1 N A M A Ç 2 Bölgesel de¤iflkenlerin özelliklerini aç›klamak. Belirli bir bölgeye özgü de¤erler alan ve konumlar› koordinatlarla tan›mlanan örneklenmifl de¤iflkenlere, bölgeselleflmifl de¤iflkenler denilir. Bölgeselleflmifl de¤iflkenlerin belirli bir geometrik alan (veya üç boyutlu olarak hacim) s›n›rlar› içinde birbirine ba¤›ml› de¤iflimler göstermesi yersellik (lokalizasyon) kavram› ile aç›klanmaktad›r. Bölgeselleflmifl de¤iflken örnekleri aras›nda belirli bir mesafe içerisinde devaml›l›k ve devaml›l›kta yönsel farkl›l›klar (anizotropi) görülebilmektedir. Semi-variogram fonksiyonunun özelliklerini aç›klamak. Bölgeselleflmifl de¤iflken için yap›lan örneklemeler sonucunda, aralar›nda uzakl›klara ba¤l› olarak oluflan örnek çiftleri aras› farklar›n kareleri toplam›n›n örnek çifti say›s›na oran›na variogram, variogram›n yar›s›na da semi-variogram denilmektedir. Örneklenen de¤iflken de¤erleri ile elde edilen semi-variogram de¤erlerine, deneysel semi-variogram de¤erleri denilmektedir. Deneysel semi-variogram de¤erlerinin orjindeki süreksizli¤ini külçe varyans› (nugget), ulaflt›¤› en üst de¤ere eflik de¤er (sill) ve ulaflt›¤› en büyük mesafeye etki mesafesi denilmektedir. Yönsel olarak de¤iflen semivariogram de¤erleri analiz edilerek, en büyük etki mesafesinin (amax ) ve en küçük etki mesafesinin (amin ) gözlendi¤i yönlerin bulunmas› ve yönsel etki mesafesi oran›n›n hesaplanmas›, jeoistatistiksel tahminlerde kullan›lacak elipsoidal etki alan›n› belirlemede önemli olmaktad›r. Bölgeselleflmifl de¤iflkenin devaml›l›¤›na ba¤l› olarak semi-variogram fonksiyonu, bafllang›ç noktas› civar›nda devaml›, do¤rusal veya külçe etkili davran›fl gösterebilmektedir. N A M A Ç 3 Kuramsal semi-variogram model (küresel, üstel ve do¤rusal) parametrelerini hesaplamak ve temel uygulamalarda kullanmak. Örneklenen de¤iflken de¤erleri ile hesaplanan deneysel semi-variogram de¤erleri, bafllang›ç noktas› civar›nda do¤rusal ve etki mesafesinden sonra varyansa yak›n bir görünüfle sahipse küresel modeli uyarlayabiliriz. Küresel model külçe etkili veya etkisiz olabilir. Deneysel semi-variogram de¤erlerine üstel (ekponansiyel) veya do¤rusal model de uyarlayabiliriz. Kuramsal semivariogram parametrelerini kullanarak, ölçüm yap›lmam›fl noktalar aras›ndaki ortalama semi-variogram de¤erlerini hesaplayabilmek mümkün olmaktad›r. 7. Ünite - Jeoistatistiksel Kavramlar 161 Kendimizi S›nayal›m 1. Do¤adan elde edilen birbirine yak›n mesafedeki veriler benzer özellikler gösterirken, aralar›ndaki uzakl›k artt›kça bu benzerli¤in azalmas› hangi kavramla aç›klan›r? a. Devaml›l›k b. Yönsellik c. Rassall›k d. Yersellik e. Geçifller 2. Belirli bir bölgeye özgü de¤erler alan ve konumlar› koordinatlarla tan›mlanan örneklenmifl de¤iflkenlere ne ad verilir? a. Ba¤›ml› de¤iflken b. Ba¤›ms›z de¤iflken c. Rassal de¤iflken d. Zaman de¤iflkeni e. Bölgeselleflmifl de¤iflken 3. Semi-variogram fonksiyonunun orijininde süreksizliklerin görülmesi durumunda, de¤iflkenin de¤ifliminde ne tür bir etki görülür? a. Eflik de¤er b. Külçe varyans› c. Yap›sal varyans d. Yönsel de¤iflim e. Etki mesafesi 4. Arazide bir hat boyunca 10 m aral›klarla 8 adet örnek al›nm›flt›r. Örneklerin de¤iflken de¤erleri afla¤›daki gibi oldu¤una göre, h=10 m için semi-variogram›n de¤eri nedir? Örnek Yeri (m) 0 De¤iflken De¤eri 20 22 26 25 29 31 32 32 a. b. c. d. e. 3 5 7 8 14 10 20 30 40 50 60 70 5. Arazide bir hat boyunca 10 m aral›klarla 10 adet örnek al›nm›flt›r. Örneklerin de¤iflken de¤erleri afla¤›daki gibi oldu¤una göre, h=20 m için kaç adet örnek çifti oluflur? Örnek Yeri (m) 0 10 20 30 40 50 60 70 80 90 De¤iflken De¤eri 14 18 16 19 20 21 24 22 27 26 a. b. c. d. e. 6 7 8 9 10 6. Küresel semi-variogram parametreleri a=30 m ve C=10 olan bir de¤iflken için, konumsal olarak aralar›nda 10 m mesafe bulunan iki nokta aras›ndaki ortalama semi-variogram de¤eri ne olur? a. 0,48 b. 4,8 c. 0,5 d. 5,0 e. 8,0 7. Küresel semi-variogram parametreleri a=250 m, C0=10 ve C=40 olan bir de¤iflken için, konumsal olarak aralar›nda 300 m mesafe bulunan iki nokta aras›ndaki ortalama semi-variogram de¤eri ne olur? a. 10 b. 20 c. 30 d. 40 e. 50 8. Bir variogram analizi sonucunda, verilerin γ(h) = 5.10-3.h fleklinde do¤rusal semi-variogram modeline uygun davran›fl gösterdikleri belirlenmifltir. Bu durumda, aralar›nda 100 m mesafe bulunan iki nokta aras›nda ortalama semi-variogram de¤eri ne olur? a. 0,005 b. 0,05 c. 0,5 d. 5,0 e. 50,0 162 Co¤rafi Bilgi Sistemleri ‹çin Temel ‹statistik Kendimizi S›nayal›m Yan›t Anahtar› 9. Bir semi-variogram modeli parametrelerini belirleme çal›flmas›nda, deneysel semi-variogram de¤erlerinin ilk ikisinden geçen do¤ru ile varyans çizgisini kesmifl ve bu kesiflimden inilen bir dikme h=50 m’de uzakl›k eksenini kesmifltir. Bu durumda modelin etki mesafesi kaç m olur? a. 25 b. 50 c. 75 d. 100 e. 150 1. d 10. Bir yönsel variogram analizi çal›flmas›nda, etki mesafesi do¤u-bat› yönünde 200 m ve kuzey-güney yönünde 50 m bulunmufltur. Anizotropi oran› nedir? a. 4,0 b. 3,0 c. 2,0 d. 1,0 e. 0,25 7. e 2. e 3. b 4. a 5. c 6. b 8. c 9. c 10.a Yan›t›n›z yanl›fl ise, “Bölgeselleflmifl De¤iflkenler” konusuna bak›n›z. Yan›t›n›z yanl›fl ise, “Bölgeselleflmifl De¤iflkenler” konusuna bak›n›z. Yan›t›n›z yanl›fl ise, “Deneysel Semi-Variogram Parametreleri” konusuna bak›n›z. Yan›t›n›z yanl›fl ise, “Variogram ve SemiVariogram” konusuna bak›n›z. Yan›t›n›z yanl›fl ise, “Variogram ve SemiVariogram” konusuna bak›n›z. Yan›t›n›z yanl›fl ise, “Küresel Model” konusuna bak›n›z. Yan›t›n›z yanl›fl ise, “Küresel Model” konusuna bak›n›z. Yan›t›n›z yanl›fl ise, “Do¤rusal Model” konusuna bak›n›z. Yan›t›n›z yanl›fl ise, “Kuramsal Semi-Variogram Modelleri” konusuna bak›n›z. Yan›t›n›z yanl›fl ise, “Deneysel Semi-Variogram Parametreleri” konusuna bak›n›z. 163 7. Ünite - Jeoistatistiksel Kavramlar S›ra Sizde Yan›t Anahtar› S›ra Sizde 1 c* (h) = 1 z(x) − z(x + h) 2 ∑ 2n c∗ (20) = 1 2 2 2 2 2 ( 20 − 22) + ( 22 − 28) + ( 28 − 26) + ............... + ( 29 − 24) + ( 24 − 28) 2.34 c∗ (20) = 1 502 = 7, 38 2.34 c∗ (40) = 1 2 2 2 2 2 ( 20 − 28) + (22 − 26) + ( 28 − 33) + ............... + ( 27 − 24) + ( 29 − 28) 2.33 c∗ (20) = 1 658 = 9, 97 2.33 S›ra Sizde 2 Veriler : a=400 m, C=90 (m)2 ve h=150 Küresel model külçe etkisizdir. 3h h3 c(h) = C − 2a 2a 3 3*150 (150)3 c(150) = 90 * − 2 * 400 2 * (400)3 S›ra Sizde 4 σ = 2%⇒ σ2 = 4 (%)2 Örnek Çiftleri Aras› Deneysel SemiVar. Mesafe (m) (%)2 OM 50 1,9 100 2,8 150 3,6 200 3,8 250 4,2 300 3,9 γ (150) = 48,25 (m)2 S›ra Sizde 3 h=200 m oldu¤una göre, ortalama do¤rusal semi-variogram de¤erini afla¤›daki gibi hesaplar›z. γ (h) = 2.10-5.h γ (200) = 2.10-5 * 200 = 0,004 2 a = 166 ⇒ a = 249 m 3 C0=1,0 (%)2 ve C=3,0 (%)2 olarak elde ederiz. 164 Co¤rafi Bilgi Sistemleri ‹çin Temel ‹statistik Yararlan›lan Kaynaklar Clark, I. (1979). Practical Geostatistics. London: Applied Science. Journel, A.G. & Huijbregts, CH.J. (1978). Mining Geostatistics. San Diego: Academic. Konuk, A. & Önder, S. (1999). Maden ‹statisti¤i. Mühendislik Mimarl›k Fakültesi Maden Mühendisli¤i Bölümü. Eskiflehir: Eskiflehir Osmangazi Üniversitesi. Olea, R. A. (1999). Geostatistics for Engineers and Earth Scientists. Boston: Kluwer Academic. Pekin, A. (1999). Aç›k ‹flletme Basamak Tenörlerinin Kriging Tahminlerinde ‹statistiksel Da¤›l›m Modellerinin Etkileri. (Yay›mlanmam›fl doktora tezi). Eskiflehir Osmangazi Üniversitesi/Fen Bilimleri Enstitüsü, Eskiflehir. Tercan, A.E. & Saraç, C. (1998). Maden Yataklar›n›n De¤erlendirilmesinde Jeoistatistiksel Yöntemler. Ankara: Jeoloji Mühendisleri Odas›. Tüysüz, N. & Yaylal›, G. (2005). Jeoistatististik Kavramlar ve Bilgisayarl› Uygulamalar. Trabzon: Karadeniz Teknik Üniversitesi Uyguçgil, H. (2007). Çok De¤iflkenli Maden Yataklar›nda Rezerv Tenör Tahmininde Jeoistatistik ve Co¤rafi Bilgi Sistemleri Tekniklerinin Kullan›m›. (Yay›mlanmam›fl doktora tezi). Eskiflehir Osmangazi Üniversitesi/Fen Bilimleri Enstitüsü, Eskiflehir. CO⁄RAF‹ B‹LG‹ S‹STEMLER‹ ‹Ç‹N TEMEL ‹STAT‹ST‹K 8 Amaçlar›m›z N N N Bu üniteyi tamamlad›ktan sonra; Konumsal tahminde kullan›lan klasik istatistik ve jeoistatistik yöntemler aras›ndaki fark› belirleyebilecek, Konumsal tahminde en yak›n komflu, yüzey trend analizi ve uzakl›¤›n tersiyle a¤›rl›kland›rma yöntemlerini kullanabilecek, Konumsal tahmininde Kriging yöntemini aç›klayabilecek ve farkl› semi-variogram modelleri ile noktasal tahmin uygulamalar› yapabilecek bilgi ve becerilere sahip olacaks›n›z. Anahtar Kavramlar • • • • • • Uzakl›¤›n Tersi En yak›n komflu Yüzey trend analizi Konumsal Tahmin Öklid Uzakl›¤› A¤›rl›k Katsay›lar› • • • • • • Kriging Eflitli¤i Nokta Kriging Arama kapsama alan› Hariç tutma aç›s› Kriging tahmin varyans› ‹nterpolasyon ‹çindekiler Co¤rafi Bilgi Sistemleri ‹çin Temel ‹statistik Konumsal Tahmin (‹nterpolasyon) ve Kriging • UZAKLI⁄A BA⁄LI TAHM‹N YÖNTEMLER‹ • KLAS‹K KONUMSAL TAHM‹N YÖNTEMLER‹ • KR‹G‹NG TAHM‹N YÖNTEM‹ Konumsal Tahmin (‹nterpolasyon) ve Kriging UZAKLI⁄A BA⁄LI TAHM‹N YÖNTEMLER‹ Konumsal örneklemeler sonras›nda, örnek noktalar› de¤erleri yard›m›yla örnek al›nmam›fl noktalar, alanlar veya hacimsel bloklar için tahminler yapmaya çal›fl›r›z. Bu tahminlerde, klasik istatistik yöntemleri kullanan uzakl›¤›n tersiyle a¤›rl›kland›rma, en yak›n komfluluk ve yüzey trend analizi gibi interpolasyon (tahmin) yöntemleri kullan›labilmektedir. Bu yöntemlerden uzakl›¤›n tersiyle a¤›rl›kland›rmada örnek nokta de¤erlerinin a¤›rl›klar› uzakl›¤a ba¤l› olarak de¤iflmekte, en yak›n komfluluk yönteminde sadece en yak›n örnek noktas› dikkate al›nmakta ve yüzey trend analizi yönteminde ise tüm örnek noktalar›n›n a¤›rl›klar› ortalama bir polinom ile ifade edilmektedir. Klasik konumsal tahmin yöntemler, al›nan örneklerin birbirlerini ne flekilde takip ettiklerini, örneklerin etki alanlar›n›n ne oldu¤unu ve bu etki alan›n›n yönsel de¤ifliminin nas›l oldu¤unu dikkate almayan yöntemlerdir. Klasik yöntemler kullanarak yap›lacak konumsal tahminlerde, hata büyüklü¤ü artmakta ve tahminlerin güvenilirli¤i azalmaktad›r. Bu nedenlerle de, co¤rafi anlamda bölgesel farkl›l›klar gösteren, birbirleriyle belirli bir mesafe içerisinde ba¤›ml› olan ve miktarsal ölçülerle al›nan örnekler yard›m›yla tahminde, klasik yöntemler yerine jeoistatistiksel kriging yöntemlerini uygulamam›z gerekmektedir. ‹smini Güney Afrikal› araflt›rmac› D.G. Krige’den alan jeoistatistiksel Kriging yönteminde, örneklerin düzensiz ve süreklili¤in yönsel olarak de¤iflti¤i durumlarda, bir noktan›n veya blo¤un ortalama de¤erini en küçük hata ile yans›z olarak tahmin etmede variogram fonksiyonu kullan›lmaktad›r. Kriging yöntemi, tahmin hatalar›n›n varyans›n› en küçükleyen ve yans›z tahminler yapmam›z› sa¤layan bir yöntemdir. Kriging yönteminde, nokta veya blok çevresindeki örnek de¤erlerinin blok de¤erine etkisini aç›klayan a¤›rl›k katsay›lar›, semi-variogram fonksiyonu yard›m›yla bulunmaya çal›fl›lmaktad›r. Bu a¤›rl›k katsay›lar›, tahmin varyans›n› en küçükleyecek bir kombinasyonu içerir. Bu ünitede, klasik konumsal tahmin yöntemleri karfl›s›nda kriging yönteminin önemi aç›klanacakt›r. Kriging yöntemi oldukça kapsaml› ve farkl› de¤iflken yap›lar› için gelifltirilmifl birçok yöntemi kapsamaktad›r. Ancak bu ünitede, konunun önemini belirtme ve temel kavramlar› ö¤renme amac›yla, sadece nokta tahmininde kullan›lan kriging yöntemi basit örneklerle ele al›nm›flt›r. Jeoistatisti¤in öncüsü olan Güney Afrikal› maden mühendisi Daniel G. Krige, 1951 y›l›nda bölgeselleflmifl de¤iflkenler teorisi ve variogram fonksiyonunu temel alan uygulamalar› alt›n maden yataklar›nda kullanm›flt›r. 1960 y›l›nda da Frans›z mühendis Georges Matheron, D.G Krige’nin çal›flmas›na sayg› gere¤i, maden yataklar›n›n rezerv tahimin için gelifltirdi¤i yönteme Kriging yöntemi ad›n› vermifltir. 168 Co¤rafi Bilgi Sistemleri ‹çin Temel ‹statistik KLAS‹K KONUMSAL TAHM‹N YÖNTEMLER‹ ‹statistik yöntemler temelinde gelifltirilen interpolasyon (ara de¤er bulma) yöntemlerinin ortak noktas›, her yöntemin örnek noktalar›n›n konumsal bilgisini kullan›yor olmas›d›r. Konumsal interpolasyon yöntemleriyle de¤iflken de¤eri bilinmeyen noktalar için tahmin yapabilmede, tamini yap›lacak nokta çevresindeki örnek nokta de¤erlerinin a¤›rl›kland›r›lm›fl do¤rusal bileflenine gereksinim duyulmaktad›r. Örne¤in, de¤iflken de¤eri bilinmeyen x0 noktas› çevresinde bulunan n adet xi noktas›ndan örneklenen Z (xi) de¤iflken de¤erleri ile Z* (x0) de¤iflken de¤erini afla¤›daki eflitlik yard›m›yla tahmin edebiliriz. n Z* ( x0 ) = ∑ Wi .Z ( xi ) i =1 Burada, Z*(x0) : x0 noktas› için tahmin edilen de¤iflken de¤erini, Z(xi) : xi noktas›ndaki örnek noktas› de¤iflken de¤erini, Wi : i inci örnek de¤iflken de¤erlerinin a¤›rl›¤›n›, n : örneklenen nokta say›s›n› ifade etmektedir. Konumsal olarak örneklenen de¤iflken de¤erlerinin a¤›rl›k de¤erleri (Wi), tahmin için kullan›lan klasik istatististik temelli yönteme göre farkl›l›k göstermektedir. Afla¤›daki bölümlerde örneklenen de¤iflken de¤erlerini a¤›rl›kland›rmada kullan›lan uzakl›¤›n tersiyle a¤›rl›kland›rma, en yak›n komfluluk ve yüzey trend analizi interpolasyon yöntemleri tan›t›lacakt›r. Milat’dan önce 330-275 y›llar›nda yaflam›fl olan ‹skenderiyeli (M›s›rl›) bir matematikçi olan Öklid’in geometri alan›nda gelifltirdi¤i aksiyom ve yöntemler 19. yüzy›l›n bafllar›na kadar rakipsiz kalm›flt›r. Elementler isimli 13 ciltlik kitab›nda bafll›ca, düzlem geometrisi, aritmetik, say›lar teorisi, irrasyonel say›lar ve kat› cisim geometrisi konular›n› ele alm›flt›r. En Yak›n Komflu Yöntemi Genellikle s›n›fland›rma ve kümeleme çal›flmalar›nda kullan›lan en yak›n komflu yönteminde, örnekleme yap›lmam›fl herhangi bir noktan›n de¤iflken de¤erini tahmin etmede, örnek noktalar› aras›nda en yak›n olan noktan›n de¤iflken de¤eri belirlenerek, tahmin edilecek noktaya atamas› yap›lmaktad›r. En yak›n komflu yöntemiyle tahminde öncelikle, örnek noktalar› ile tahmin yap›lacak nokta aras›ndaki uzakl›klar›n hesaplanmas› gerekir. Konumsal noktalar aras› uzakl›klar›n hesaplanmas›nda ise genellikle Öklid yöntemi kullan›lmaktad›r. Herhangi iki noktan›n konumu iki boyutlu düzlemde veya üç boyutlu uzayda ifade edilmesine göre, noktalar aras› Öklid uzakl›klar› afla¤›daki gibi hesaplan›r. ‹ki boyutta uzakl›k: ‹ki boyutlu bir düzlemde (x1, y1) koordinatlar›nda yer alan P1 noktas› ile (x2, y2) koordinatlar›nda yer alan P2 noktas› aras›ndaki Öklid uzakl›¤›n› flu flekilde hesaplar›z. d ( P1 , P2 ) = ( x1 − x2 )2 + ( y1 − y2 )2 Üç boyutta uzakl›k: Üç boyutlu uzayda (x1, y1, z1) koordinatlar›nda yer alan P1 noktas› ile (x2, y2, z2) koordinatlar›nda yer alan P2 noktas› aras›ndaki Öklid uzakl›¤›n› flu flekilde hesaplar›z. 8. Ünite - Konumsal Tahmin (‹nterpolasyon) ve Kriging 169 d ( P1 , P2 ) = ( x1 − x2 )2 + ( y1 − y2 )2 + ( z1 − z2 )2 Örnekleme yap›lmam›fl noktan›n de¤iflken de¤erini en yak›n komfluluk yöntemiyle tahmin etmede, öncelikle örnek noktalar› aras›ndan en küçük d(i, j) uzakl›¤›ndaki örnek noktas› veya k say›da örnek noktalar› belirlenmektedir. Bir komflu nokta ile tahmin yap›ld›¤› durumda, en yak›n komflu örnek noktas› de¤iflken de¤erleri, örnekleme yap›lmam›fl noktaya atanmakta ve de¤iflken de¤eri tahmin edilmektedir. Örnekleme yap›lmam›fl SA noktas›na en yak›n k adet komflu Si noktas› de¤iflken de¤erlerinin Z(Si) oldu¤u durumda, uzakl›kla a¤›rl›kland›r›lm›fl ortalama de¤iflken de¤eri Z*(SA) afla¤›daki gibi hesaplan›r. Birden fazla (k adet) en yak›n komflu nokta ile tahmin yap›ld›¤› durumda ise, en yak›n komflu noktalar›n uzakl›kla a¤›rl›kland›r›lm›fl ortalama de¤iflken de¤eri, örnekleme yap›lmam›fl noktaya atanmaktad›r. k Z* ( S A ) = ∑ d ( Si , S A ).Z ( Si ) i =1 k ∑ d ( Si , S A ) i =1 En yak›n komflu yöntemi, sadece en yak›n komflu örnek noktas› veya noktalar›n›n de¤iflken de¤eri ile tahmin yapmakta ve daha uzak noktalardaki di¤er noktalar› dikkate almamaktad›r. Tahminlerde kullan›lacak komflu noktalar›n say›s›n›n (k) kaç adet olaca¤› belirsizdir. Ayr›ca, örnek noktalar› aras›ndaki ba¤›ml›l›¤›, devaml›l›¤› ve yönsel süreklili¤i dikkate almayan bir yöntemdir. En yak›n komflu yöntemi genellikle blok modellemede örnek noktas› olmayan bloklara de¤iflken de¤eri atamada kullan›lmaktad›r. Bir kent merkezinde 5 ayr› istasyonda Ocak ay›nda ölçülen kükürt dioksit (mg /m3) miktarlar› afla¤›daki çizelgedeki gibidir. En yak›n komflu yöntemine göre kent merkezinde (X=4150 , Y=2350) koordinatlar›nda bulunan hastane (SH) civar›nda kükürt dioksit miktar› ne olabilir? ‹stasyon No Si (X) (Y) Z(Si) SO2 (µg / m3) 1 4075 2345 50 2 4160 2370 15 3 4200 2340 65 4 4180 2325 30 5 4150 2310 70 Konumsal Koordinatlar (m) ÖRNEK 170 Co¤rafi Bilgi Sistemleri ‹çin Temel ‹statistik Çözüm: Hava kirlili¤inin ölçüldü¤ü (S1) istasyonu ile hastane (SH) aras› öklid uzakl›¤›n› afla¤›daki gibi hesaplar›z. d ( S1 , S H ) = ( x1 − x H )2 + ( y1 − y H )2 = ( 4075 − 4150 )2 + ( 2345 − 2350 )2 = 75,2 Di¤er istasyonlar ile hastane aras› uzakl›klar afla¤›daki çizelgedeki gibi hesaplan›r. ‹stasyon No Si (X) (Y) H Noktas›na Uzakl›k (m) d(Si , SH) 1 4075 2345 75,2 2 4160 2370 22,4 3 4200 2340 51,0 4 4180 2325 39,1 5 4150 2310 40,0 Konumsal Koordinatlar (m) Çizelgeden de görüldü¤ü gibi, SH hastane noktas›na en yak›n komflu nokta S2 noktas›d›r. Bu durumda SH noktas›n›n kükürt dioksit oran›n›n 15 µg /m3 olarak tahmin ederiz. En yak›n iki komflu nokta (k=2) ile tahmin yapmak istersek, noktalar aras› uzakl›klarla a¤›rl›kland›r›lm›fl tahmini de¤iflken de¤erini afla¤›daki gibi hesaplar›z. k Z* ( S H ) = ∑ d ( Si , S H ).Z ( Si ) i=1 k ∑ d ( Si , S H ) i =1 = ( 39,1* 30 0 ) + ( 22 , 4 * 15 ) = 24,5 µg / m3 ( 39,1 + 22, 4 ) 171 8. Ünite - Konumsal Tahmin (‹nterpolasyon) ve Kriging Bir tar›msal araflt›rma merkezi taraf›ndan bir bölgede ekmeklik bu¤day bitki boylar›n› SIRA S‹ZDE araflt›rmak üzere yap›lan çal›flmada, 5 ayr› tarladan al›nan örneklerin ortalama bitki boylar›n›n afla¤›daki çizelgedeki gibi oldu¤u belirlenmifltir. Tarlalar›n yaklafl›k orta noktas›D Ü fi Ü N E L ‹ M na karfl›l›k gelen noktalar›n koordinatlar› da çizelgede verilmifltir. Ölçüm yap›lamayan A tarlas›n›n konumu X=6400 ve Y=4600 oldu¤una göre, A tarlas›n›n ortalama bitki boyunun S O R U ne olabilece¤ini en yak›n 2 komflu noktay› dikkate alarak tahmin ediniz. Tarla No Si Konumsal Koordinatlar (m) 1 D Ü fi Ü N E L ‹ M S O R U Z(Si) D‹KKAT D ‹ K K Bitki A T Boyu (X) (Y) 1 6100 4700 SIRA S‹ZDE76 2 6400 4800 85 3 6900 4750 107 AMAÇLARIMIZ 4 6600 4500 102 5 6300 4250 SIRA S‹ZDE (mm) N N K ‹ T A P 94 SIRA S‹ZDE AMAÇLARIMIZ K ‹ T A P Yüzey Trend Analizi Yüzey trend analizi yönteminde öncelikle, örnek noktalar›n›n T E Lde¤iflken E V ‹ Z Y O N de¤erleri ile iki boyutlu veya (xi , yi) üç boyutlu (xi , yi , zi) konumsal koordinatlar› dikkate al›narak, en küçük kareler yöntemiyle p’inci dereceden polinom denklemi elde edilmektedir. Elde edilen denklem yard›m›yla da, de¤iflken de¤eri bilinmeyen ‹ N T E R N Egenellikle T noktalar için tahminler yap›lmaktad›r. Yüzey trend analiz yöntemi, topo¤rafik yüzeylerin düzenli grid (kare) a¤lar fleklinde modellenmesinde kullan›lan bir yöntemdir. Yüzey trend analizinde, her bir örnek noktas› polinom denkleminin elde edilmesinde kullan›lmaktad›r. En küçük kareler yöntemiyle polinom denklemi elde edilirken, polinom katsay›lar›n› da anlaml›l›k aç›s›ndan test etmek gerekir. Sonuç olarak da, en küçük hata ile tahminlerde kullanabilece¤imiz polinom denklemine ulaflmak gerekir. De¤iflken de¤eri bilinmeyen (x, y) noktas› için yap›lacak tahminde kullan›labilecek en basit do¤rusal ve ikinci dereceden polinom denklemi afla¤›daki gibi ifade edilebilir. Basit do¤rusal model: Z* ( x , y ) = β0 + β1 x + β2 y ‹kinci dereceden polinom: Z* ( x , y ) = β0 + β1 x + β2 y + β3 x 2 + β4 x 2 + β5 xy Yüzey trend analizi yöntemiyle, örnek al›nmam›fl konumsal noktalara polinom denklemi yard›m›yla ortalama bir tahmin yap›ld›¤›ndan, afl›r› düflük veya yüksek de¤iflken de¤erlerinin tahmininde afl›r› yan›lt›c› sonuçlar verebilmektedir. Tahminlerin güvenilirli¤ini artt›rmak için yüksek dereceli polinomlar elde etmek gerekir. Ancak, polinom derecesini artt›rd›kça, en küçük kareler yöntemiyle elde edilecek normal denklemlerin say›s› da artar ve denklem parametrelerinin elde edilmesinde güçlükler ortaya ç›kabilir. Yüzey trend analiz yöntemi, TELEV‹ZYON maden ve petrol arama çal›flmalar› ile çevre araflt›rmalar›nda efl yükselti veya efl de¤iflken de¤eri haritalama çal›flmalar›nda ‹NTERNET yayg›n bir flekilde kullan›lmaktad›r. 172 Co¤rafi Bilgi Sistemleri ‹çin Temel ‹statistik Uzakl›¤›n Tersi ‹le A¤›rl›kland›rma Yöntemi Uzakl›¤›n tersi ile a¤›rl›kland›rma, yak›n noktalara uzak noktalardan daha yüksek a¤›rl›k de¤eri atayan ve tüm mümkün örnek noktalar›n› dikkate alan bir tahmin (interpolasyon) yöntemidir. Her örnek noktas›, de¤eri tahmin edilecek noktaya olan uzakl›¤›na göre ters oranda a¤›rl›k de¤eri al›r. x0 noktas›ndaki tahmini de¤er afla¤›daki flekilde hesaplan›r. Z* ( x0 ) = ∑ Wi .Z ( xi ) 1 Wi = dip ( xi n ∑ ) 1 p i =1 di ( xi Eflitlikteki p de¤eri azald›kça, örnek noktalar›na atanan a¤›rl›k de¤erleri birbirine yaklafl›r, artt›kça de¤erler farkl›lafl›r. En yüksek a¤›rl›k de¤eri en yak›n örnek noktas› için atan›r. Genellikle p de¤eri 1 veya 2 olarak kullan›lmaktad›r. ) Burada; Z*(x0) : x0 noktas›ndaki tahminin de¤erini, Z(xi) : xi noktas›ndaki örnek noktas›n›n de¤erini, Wi : xi noktas›ndaki örne¤in x0 noktas›na göre ters uzakl›k a¤›rl›¤›n›, d : örnek noktas› ile tahmini yap›lacak nokta aras›ndaki uzakl›¤›, p : üssel de¤eri, n : örnek nokta say›s›n› ifade etmektedir. Uzakl›¤›n tersi ile a¤›rl›kland›rma yönteminde tahmin de¤erlerini önemli ölçüde etkileyen, eflitlikte tan›mlanmayan parametreler bulunmaktad›r. Bu parametrelerin en önemlilerinden biri “etki mesafesi”dir. Etki mesafesi, belirli uzakl›ktaki gözlem de¤erlerinin hesaplamada kullan›labilece¤ini ifade eder. Etki mesafesinden daha uzakta olan noktalar hesaplamalara dahil edilmez. Bu parametrelerin bir di¤eri “hariç tutma aç›s›”d›r. Bu parametre sayesinde hariç tutma aç›s›n›n süpürdü¤ü alanda bulunan gözlem de¤erlerinin sadece en yak›nda olan› hesaplamaya dahil edilmektedir. Böylece tek yönde ortaya ç›kacak fazla a¤›rl›k de¤erinin meydana getirece¤i yan›lt›c› sonuçlardan kaç›n›lm›fl olacakt›r (Uyguçgil, 2007). ÖRNEK Bir gümüfl madeni yata¤›ndan al›nan 5 adet örnek ile A noktas›n›n tenörü (metal olarak gümüfl içeri¤i) uzakl›¤›n tersiyle a¤›rl›kland›rma yöntemiyle tahmin edilmek istenmektedir. Örnek noktalar›n›n konumsal koordinatlar› ve örneklenen de¤iflken de¤erleri (tenör de¤erleri) afla¤›da çizelgede verildi¤i gibidir. Örnek noktalar›n›n ve de¤iflken de¤eri tahmin edilecek A noktas›n›n konumlar› da afla¤›daki flekilde verilmifltir. Konumsal Koordinatlar (m) Örnek No Si (X) (Y) Tenörler Z(Si) (gr/ton Ag) A 4150 2340 - 1 4080 2340 320 2 4160 2370 450 3 4200 2340 380 4 4170 2332 400 5 4150 2310 280 8. Ünite - Konumsal Tahmin (‹nterpolasyon) ve Kriging Çözüm: Örnek noktalar›n›n de¤iflken de¤eri tahmin edilecek blok merkezinde bulunan A noktas›na olan uzakl›klar›, uzakl›klar›n tersleri ve uzakl›k tersleri toplam›na göre a¤›rl›klar› afla¤›da verildi¤i gibi hesaplanm›flt›r. Örnek No Si A Noktas›ndan Uzakl›k (m) Ters Uzakl›k (1/m) A¤›rl›klar Wi 1 70,00 0,0143 0,098 2 31,62 0,0316 0,217 3 50,00 0,0200 0,137 4 21,54 0,0464 0,319 5 30,00 0,0333 0,229 0,1457 1,000 Toplam A noktas›ndan uzakl›klar› Öklid yöntemiyle hesaplar›z. Örne¤in, 1 nolu nokta ile A noktas› aras› uzakl›k afla¤›daki gibi hesaplar›z. d ( S1 , S A ) = ( x1 − x A )2 + ( y1 − y A )2 d ( S1 , S A ) = ( 4080 − 4150 )2 + ( 2340 − 2340 )2 = 70 ,00 m Üs de¤erini p=1 alarak ters uzakl›klar›; 1 1 = = 0,0143 d ( S1 , S A ) 70 ifllemi ile hesaplar›z. Ters uzakl›klar›n toplam› dan, S1 noktas›n›n a¤›rl›¤›n›; 1 ∑ d( S ,S i A ) = 0,1457 oldu¤un- 173 174 Co¤rafi Bilgi Sistemleri ‹çin Temel ‹statistik 1 d ( S1 , S A ) 0,0143 = = 0,098 W1 = 1 0 ,1457 ∑ d( S ,S ) i A ifllemi ile hesaplar›z. Blok merkezi olan SA noktas›n›n tahmini tenörünü (Z*) afla¤›daki gibi hesaplar›z. Z* (SA ) = W1.Z(S1 ) + W2 .Z(S2 ) + W3 .Z(S3 ) + W4 .Z(S4 ) + W5 .Z(S5 ) Z* (SA ) = ( 0 ,098 * 320) + (0, 217 * 450) + ( 0 ,137 * 380) + (0,319 * 400) +(0, 229 * 280) * Z (SA ) = 372,8 gr / ton Ag SIRA S‹ZDE 2 D Ü fi Ü N E L ‹ M Organik tar›m SIRAyap›lmak S‹ZDE istenen bir arazide, afla¤›da konumsal koordinatlar› verilen 4 noktadan toprak örnekleri al›nm›fl ve pH analizleri yap›lm›flt›r. Örnek al›namayan A noktas›n›n pH de¤erini uzakl›¤›n tersiyle a¤›rl›kland›rma yöntemiyle tahmin ediniz. D Ü fi Ü N E L ‹ M Örnek No Si S O R U S O R U D‹KKAT SIRA S‹ZDE AMAÇLARIMIZ N N Konumsal Koordinatlar (m) Z(Si) (pH) (X) (Y) A 5400 3600 - 1 D‹KKAT 5100 3450 4,8 2 5200 3750 5,9 5650 3725 6,4 5550 3500 5,7 3 SIRA S‹ZDE 4 AMAÇLARIMIZ KR‹G‹NG TAHM‹N YÖNTEM‹ Kriging a¤›rl›k K ‹ Työntemiyle A P katsay›lar›n›n hesaplama yöntemi, uzakl›¤›n tersi ile a¤›rl›kland›rma yöntemine Tk›yasla E L E Vdaha ‹ Z Y Okarmafl›kt›r. N Uzakl›¤›n tersi ile a¤›rl›kland›rma yönteminde uzakl›¤a ba¤l› basit algoritmalar kullan›l›rken, kriging yönteminde verinin ‹ N T E R Nyap›s›n› E T ele alan konumsal semivariogram modelleri kullan›lmaktad›r. Kriging yöntemi, K ‹ T Abir P noktan›n veya blo¤un de¤iflken de¤erini, noktan›n veya blo¤un kendi içindeki ve çevresindeki örnek de¤erleri setinin do¤rusal kombinasyonu olarak tahmin etmede kullan›lan tekniktir (Konuk ve Önder, 1999). Kriging yöntemi, do¤rusal T E L E V ‹ Z Y Ove N sistematik sapmas› olmayan (yans›z) en iyi tahminleyici olarak tan›mlanmaktad›r. Bir noktan›n veya blo¤un de¤iflken de¤erini en küçük hata ile tahmin etmeye çal›flan bir yöntem olarak bilinmektedir. Kriging yönteminin amac›, de¤iflken de¤eri bilinmeyen bir nokta veya blok ‹ N Tve E R Niçindeki ET çevresindeki örnek de¤erlerinin a¤›rl›k katsay›lar›n›, semi-variogram model parametreleri yard›m›yla hesaplayarak, tahmin varyans›n› en küçükleyecek flekilde de¤iflken de¤erini tahmin etmektir. Bir nokta veya blo¤un tahmini de¤iflken de¤eri, örneklenen gözlem de¤erlerinin konumsal düzenine ve veri yap›s›n› inceleyen semi-variogram fonksiyonuna dayanmaktad›r. Kriging yönteminin klasik konumsal tahmin yöntemlerine göre en önemli üstünlükleri; • Tahminde kullan›lan örneklerin etki alan›n› ve yönsel de¤iflimini dikkate almas›, • ‹ki veya üç boyutlu blok de¤iflken de¤erlerinin tahmininde, blok boyutlar›n› dikkate almas›, 8. Ünite - Konumsal Tahmin (‹nterpolasyon) ve Kriging 175 • Blok de¤iflken de¤erleri tahmin edilirken, her bir blo¤un tahmin hatas›n›n belirlenmesine olanak sa¤lamas›, • Di¤er yöntemlere göre tahminlerin varyans›n› en küçüklemesidir. Kriging yönteminde, de¤iflken de¤eri bilinmeyen belirli bir nokta, alan veya hacimsel blok için tahminler yap›labilmektedir. Afla¤›da, anlafl›l›rl›¤›n›n kolay olmas› nedeniyle, belirli bir noktan›n bilinmeyen de¤iflken de¤erinin kriging yöntemiyle tahmini tan›t›lacakt›r. Nokta Kriging De¤iflken de¤eri bilinmeyen bir nokta için kriging yöntemiyle tahmin yapabilmek için öncelikle örnek noktalar› dikkate al›narak semi-variogram parametrelerinin belirlenmifl olmas› gerekir. Daha sonra, de¤eri bilinmeyen nokta etraf›ndaki komflu örnek noktalar›ndan hangilerinin tahminde kullan›laca¤›n› belirlemek gerekir. Bunun için de¤eri bilinmeyen nokta etraf›nda, bir arama kapsama alan› belirlenir. Bu kapsama alan›, semi-variogram modelinin etki mesafesine (a) eflit olmal›d›r. Etki mesafesi tüm yönlerde ayn› de¤ere sahipse (izotropik durum varsa), etki mesafesi yar›çapl› dairesel bir alan, kapsama alan› olur. Ancak, etki mesafesinin yönsel de¤iflimi (anizotropik de¤iflim) sözkonusu ise, etki mesafesinin büyük ve küçük oldu¤u yönlere göre belirlenecek elipsoidal bir kapsama alan› olacakt›r. De¤iflken de¤eri tahmin edilecek nokta için arama kapsama alan›ndaki örnek noktalar›n›n belirlenmesinden sonra, tahmin edilecek nokta ile örnek noktalar› aras› ortalama semi-variogram de¤erleri dikkate al›narak her bir noktan›n a¤›rl›k katasay›lar› hesaplan›r. Arama kapsama alan›ndaki örnek noktalar›n›n a¤›rl›klar› kullan›larak da, noktasal de¤iflken de¤eri tahmin edilir. De¤iflken de¤eri ( Z*A ) bilinmeyen A noktas›n›n çevresinde arama kapsama alan› içinde bulunan n adet komflu örnek noktalar›n›n (Si) de¤iflken de¤erleri (Z(Si)) ve örnek noktalar›n a¤›rl›k katsay›lar› (Wi) yard›m›yla, A noktas›n›n de¤iflken de¤eri; n Z*A = ∑ Wi .Z(Si ) i=1 eflitli¤i ile hesaplan›r. Tahmin varyans›n› en küçükleyen katsay›lar›n toplam›, yans›zl›k koflulunu sa¤lamak amac›yla daima bire eflit olmal›d›r. n ∑ Wi = 1 i=1 Tahminlerin varyans›, semi-variogram fonksiyonlar›na ba¤l› olarak afla¤›daki gibi hesaplanabilir. n n n σe2 = 2∑ Wi . γ (Si , A) − ∑ ∑ Wi .Wj . γ (Si ,S j ) i=1 i=1 j=1 2 Burada, σe = tahmin varyans› γ(Si , v) = A noktas› ile Si örnekleri aras› ortalama semi-variogram, Arama kapsama alan› içerisindeki örnek nokta say›s›n›n 15 veya 16 olmas› ideal bir durumdur. Bu alan içindeki örnek nokta say›s› 4’ün alt›nda olursa, kriging yöntemiyle yap›lacak tahminler yan›lt›c› sonuçlar verebilmektedir (Tüysüz ve Yaylal›, 2005). 176 Co¤rafi Bilgi Sistemleri ‹çin Temel ‹statistik γ(Si ,S j ) = Si örne¤indeki bir nokta ile Sj örne¤indeki di¤er bir nokta çiftleri aras›ndaki ortalama semi-variogramd›r. Tahmin varyans›n›n büyüklü¤ü, afla¤›daki hususlara ba¤l› olarak de¤iflir: a) Semi-variogramla aç›klanan bölgeselleflmifl de¤iflkenin karakteristi¤ine, b) Tahmin için kullan›lan toplam örnek say›s›na, c) De¤iflken de¤eri tahmin edilen nokta çevresindeki birbirleriyle ilgili örneklerin birbirlerine göre konumuna, d) Her bir örne¤e atanan a¤›rl›¤a, Tahmin varyans›, onun a¤›rl›¤›na göre diferansiyelinin al›nmas›yla minimize edilebilir ve diferansiyeli s›f›ra eflittir. ∂σe2 ∂Wi = 0 ................. i = 1, 2, .............. n Bu diferansiyel, n eflitlik ve n bilinmeyen (W1,W2, .... Wn) sa¤layacakt›r. Burada bulunacak olan a¤›rl›klar toplam›n› n ∑ Wi = 1 ile s›n›rland›rmak için, di¤er bir i=1 bilinmeyen olarak Lagrangian çarpan› (λ) eflitlik sistemini dengeleyici bir unsur olarak ifllemlere dahil edilir. Bu durumda, n+1 eflitlik ve n+1 bilinmeyen ortaya ç›kar ve W1,W2, .... Wn ile λ saptanabilir (Konuk ve Önder, 1999). Kriging yöntemiyle Si örnek noktalar›n›n a¤›rl›klar›n›n hesaplanmas› için, afla¤›daki eflitlik sisteminin çözümü gereklidir. n ∑ Wj.γ(Si ,S j ) + λ = γ(Si , A) j=1 n ∑ Wi = 1 i=1 Burada, Wj = bilinmeyen a¤›rl›klar ve λ = Lagrangian çarpan›d›r. Bu eflitlik setinin çözümü, en iyi do¤rusal ve yans›z tahminciyi veren a¤›rl›klar setini üretecektir. Bu a¤›rl›klara ve Lagrangian çarpan›na ba¤l› olarak da kriging varyans›, n σ 2k = ∑ Wi .γ(Si , A) + λ i=1 eflitli¤i ile hesaplanabilir. Bu kriging varyans›, en küçük tahmin varyans›n› göstermektedir. Kriging yönteminin, tahmin varyans›n› en küçükleyen ve en iyi do¤rusal ve yans›z tahminciyi (a¤›rl›klar›) veren bir yöntem oldu¤u, afla¤›daki örnekte uygulamal› olarak ispatlanmaya çal›fl›lacakt›r. Burada, öncelikle uzakl›¤›n tersiyle a¤›rl›kland›rarak tahmin, daha sonra ise kriging ile tahmin yöntemleri ele al›nacakt›r. 8. Ünite - Konumsal Tahmin (‹nterpolasyon) ve Kriging Bir gümüfl madeni yata¤›ndan al›nan sondaj örnek tenör (% Metal Gümüfl-Ag) verileri ile yap›lan variorgram analizleri sonras›nda, hesaplanan deneysel semi variogarm de¤erlerinin küresel modele uydu¤u ve model parametrelerinin afla¤›daki gibi oldu¤u belirlenmifltir. Külçe etkisi : C0= 100 (gr/ton)2 Ag Eflik de¤er : C = 700 (gr/ton)2 Ag Etki mesafesi : a= 100 m Maden yata¤›nda A noktas›nda tenör de¤eri bilinmemekte olup, etki mesfesi içerisinde A noktas›na komflu iki adet sondaj (örnek) noktas› bulunmaktad›r. A noktas› ile sondaj noktalar› (S1 ve S2) noktalar› aras› uzakl›klar ve sondaj noktalar›ndan al›nan örneklerin tenör de¤erleri (gr/ton Ag) afla¤›daki çizelgelerde verildi¤i gibidir. Noktalar Noktalar Aras› Uzakl›k (m) S1 ile A 20 S2 ile A 30 S1 ile S2 36 Sondaj N. No Si Tenörler Z(Si) (gr/ton Ag) 1 400 2 500 a) Uzakl›¤›n tersiyle a¤›rl›kland›rma yöntemiyle A noktas›n›n tenör de¤erini tahmin ediniz. b) Kriging yöntemiyle A noktas›n›n tenör de¤erini tahmin ederek, tahminin kriging varyans›n› bulunuz. Çözüm: a) Uzakl›¤›n tersiyle a¤›rl›kland›rma yöntemiyle tahmin: Örnek noktalar›n›n de¤iflken de¤eri tahmin edilecek A noktas›na olan uzakl›klar›, uzakl›klar›n tersleri ve uzakl›k tersleri toplam›na göre a¤›rl›klar› afla¤›da verildi¤i gibi hesaplanm›flt›r. Örnek No Si A Noktas›ndan Uzakl›k (m) Ters Uzakl›k (1/m) A¤›rl›klar Wi 1 20 0,0500 0,6 2 30 Toplam 0,0333 0,4 0,0833 1,000 De¤iflken de¤eri bilinmeyen A noktas›n›n tahmini tenörünü ( Z*A ) afla¤›daki gibi hesaplar›z. n Z*A = ∑ Wi .Z ( Si ) i =1 177 ÖRNEK 178 Co¤rafi Bilgi Sistemleri ‹çin Temel ‹statistik Z*A = W1.Z(S1 ) + W2 .Z(S2 ) Z*A = ( 0 ,6 * 400) + (0, 400 * 500) Z*A = 440 gr / ton Ag b) Kriging yöntemiyle tahmin : Kriging yöntemiyle Si örnek noktalar›n›n a¤›rl›klar›n›n hesaplanmas› için, afla¤›daki eflitlik sistemini kullan›r›z. n ∑ Wj.γ(Si ,S j ) + λ = γ(Si , A) j=1 n ∑ Wi = 1 i=1 ‹ki örnek noktam›z (S1 ve S2) oldu¤undan, afla¤›daki üç adet kriging eflitli¤i sözkonusudur. W1 .γ( S1 , S1 ) + W2 .γ( S1 , S2 ) + λ = γ( S1 , A ) W1 .γ( S2 , S1 ) + W2 .γ( S2 , S2 ) + λ = γ( S2 , A ) W1 + W2 =1 Burada, γ( S1 , S1 ) ve γ( S2 , S2 ) : S1 ve S2 örnek noktalar›n›n kendi içindeki ortalama semi-variogram›, γ( S1 , S2 ) ve γ( S2 , S1 ) : S1 ve S2 noktalar› aras›ndaki ortalama semi-variogram›, γ( S1 , A ) ve γ( S2 , A ) : A noktas› ile S1 ve S2 noktalar› aras›ndaki ortalama semivariogram› ifade etmektedir. Örnek noktalar›n›n kendi içinde herhangi bir mesafe söz konusu olmad›¤›ndan; γ( S1 , S1 ) = 0 ve γ( S2 , S2 ) = 0 olur. Örnek noktalar› aras› ve örnek noktalar› ile A noktas› aras› ortalama semi-variogramlar› afla¤›daki gibi hesaplar›z. Külçe etkili küresel model; 3.h h3 γ( Si , S j ) = C0 + C . − 2.a 2.a3 olup, burada h : Si ve Sj noktalar› aras› uzakl›kt›r. Külçe etkisi C0=100 (gr/ton)2 Ag, eflik de¤er C=700 (gr/ton)2 Ag ve etki mesafesi a=100 m olarak verilmiflti. S1 ve S2 noktalar› aras› uzakl›k h=36 m oldu¤undan, S1 ve S2 noktalar› aras› ortalama semi-variogram; 8. Ünite - Konumsal Tahmin (‹nterpolasyon) ve Kriging 3* 36 ( 36 )3 2 γ( S1 , S2 ) = 100 + 700. − = 461,67 (gr / ton) Ag 2 * 100 2 * ( 100 )3 S1 ve A noktas› aras› uzakl›k h=20 m oldu¤undan, S1 ve SA noktalar› aras› ortalama semi-variogram; 3* 20 ( 20 )3 2 γ( S1 , A ) = 100 + 700. − = 307 , 20 (gr/ton) Ag 2 * 100 2 * ( 100 )3 S2 ve A noktas› aras› uzakl›k h=30 m oldu¤undan, S2 ve SA noktalar› aras› ortalama semi-variogram; 3* 30 ( 30 )3 2 γ( S2 , A ) = 100 + 700. − = 405,55 (gr/ton) Ag 3 2 * 100 2 * ( 100 ) ‹ki örnek noktas› ile A noktas› de¤iflken de¤erini tahmin için kullanaca¤›m›z a¤›rl›k katsay›lar›n› hesaplamak için; W1 .γ( S1 , S1 ) + W2 .γ( S1 , S2 ) + λ = γ( S1 , A ) W1 .γ( S2 , S1 ) + W2 .γ( S2 , S2 ) + λ = γ( S2 , A ) + W2 W1 =1 Kriging eflitlik sistemini elde etmifltik. Bu eflitlik sisteminin bilinenlerini yerine yazarsak; ( W1 * 0 ) + ( W2 * 461,67 ) + λ = 307 , 20 ( W1 * 461,67 ) + ( W2 * 0 ) + λ = 405,55 + W2 W1 =1 üç bilinmeyenli (W1 , W2 ve λ) ve üç adet eflitlik elde ederiz. Bu eflitlik sistemini, W1 =1–W2 yazarak çözdü¤ümüzde, bilinmeyenleri; λ = 125,54 W1 = 0,6065 W2 = 0,3935 olarak hesaplar›z. Hesaplanan a¤›rl›k katsay›lar›n› kullanarak, de¤iflken de¤eri bilinmeyen A noktas›n›n tahmini tenörünü ( Z*A ) afla¤›daki gibi hesaplar›z. n Z*A = ∑ Wi .Z ( Si ) i =1 Z*A = W1.Z(S1 ) + W2 .Z(S2 ) 179 180 Co¤rafi Bilgi Sistemleri ‹çin Temel ‹statistik Z*A = ( 0 ,6065* 400) + (0,3935 * 500) Z*A = 439 ,35 gr / ton Ag Uzakl›¤›n tersiyle a¤›rl›kland›rma yönteminde de¤iflken de¤eri bilinmeyen bir nokta için yap›lan tahminin varyans› belirlenemezken, kriging yönteminde belirlenebilmektedir. Kriging yöntemiyle yap›lan tahminin varyans›n›, afla¤›daki eflitlikle bulabiliriz. n σ 2k = ∑ Wi .γ(Si , A) + λ i=1 σ 2k = (0, 6065 * 307, 20) + (0, 3935 * 405, 55) + 125, 54 σ 2k = 470, 54 ( gr / ton )2 Ag SIRA S‹ZDE D Ü fi Ü N E L ‹ M S O R U D‹KKAT SIRA S‹ZDE AMAÇLARIMIZ K ‹ T A P TELEV‹ZYON ‹NTERNET ÖRNEK 3 Bir kent merkezine kullanma suyu sa¤layan akarsu yata¤›n›n de¤iflik noktalar›ndan al›nan SIRA S‹ZDE örneklerin kurflun içeri¤i de¤iflmleri için yap›lan variorgram analizleri sonras›nda, hesaplanan deneysel semi variogram de¤erlerinin küresel modele uydu¤u ve model parametreD Ü fi Ü N E L ‹ M lerinin afla¤›daki gibi oldu¤u belirlenmifltir. Eflik de¤er : C= 20 (ppm)2 Pb S O R U Etki mesafesi : a= 50 m Akarsu yata¤›nda A noktas›nda bulunan bir sanayi tesisinin akarsuya ne kadar kurflun deD‹KKAT flarj etti¤i tahmin edilmek istenmektedir. Etki mesafesi içerisinde A noktas›na komflu iki adet örnek noktas› bulunmaktad›r. A noktas› ile örnek noktalar› (S1 ve S2) aras› uzakl›kS‹ZDE lar ve örnekSIRA noktalar›ndan elde edilen verilerin kurflun içerikleri (ppm Pb) afla¤›daki çizelgelerde verildi¤i gibidir. Kriging yöntemiyle A noktas›n›n kurflun içeri¤ini tahmin ederek, tahminin kriging varyans›n› bulunuz. N N AMAÇLARIMIZ Noktalar Noktalar Aras› Uzakl›k (m) S ile A 10 S2 ile A 40 S1 ile S2 50 Örnek N. No Si Kurflun ‹çeri¤i Z(Si) (ppm Pb) K ‹ T A 1P TELEV‹ZYON ‹NTERNET 1 5 2 2 Bir sanayi sitesi sahas›nda yap›lan gürültü ölçümleri sonucunda, al›nan örnekler ile yap›lan variorgram analizleri sonras›nda hesaplanan deneysel semi variogram de¤erlerinin do¤rusal modele uydu¤u ve modelin afla¤›daki gibi oldu¤u belirlenmifltir. γ(h) = 140.h−0, 2 Sanayi sitesi sahas›nda A noktas›nda gürültü ölçümü yap›lamad›¤›ndan, bu noktan›n gürültü seviyesi tahmin edilmek istenmektedir. A noktas›na komflu iki adet örnek noktas›nda ölçüm yap›lm›fl olup, A noktas› ile örnek noktalar› (S1 ve 8. Ünite - Konumsal Tahmin (‹nterpolasyon) ve Kriging S2) noktalar› aras› uzakl›klar ve örnek noktalar›nda ölçülen gürültü seviyeleri (dBDesibel) afla¤›daki çizelgelerde verildi¤i gibidir. Kriging yöntemiyle A noktas›n›n gürültü seviyesini tahmin ederek, tahminin kriging varyans›n› bulunuz. Noktalar Noktalar Aras› Uzakl›k (m) S1 ile A 25 S2 ile A 75 S1 ile S2 100 Örnek N. No Si Gürültü Z(Si) (dB) 1 50 2 80 Çözüm: ‹ki örnek noktam›z (S1 ve S2) oldu¤undan, afla¤›daki üç adet kriging eflitli¤i sözkonusudur. W1 .γ( S1 , S1 ) + W2 .γ( S1 , S2 ) + λ = γ( S1 , A ) W1 .γ( S2 , S1 ) + W2 .γ( S2 , S2 ) + λ = γ( S2 , A ) W1 + W2 =1 Örnek noktalar›n›n kendi içinde herhangi bir mesafe söz konusu olmad›¤›ndan; γ( S1 , S1 ) = 0 ve γ( S2 , S2 ) = 0 olur. Örnek noktalar› aras› ve örnek noktalar› ile A noktas› aras› ortalama semi-variogramlar› afla¤›daki gibi hesaplar›z. Do¤rusal model; γ(h) = 140.h−0 ,2 olup, burada h : Si ve Sj noktalar› aras› uzakl›kt›r. S1 ve S2 noktalar› aras› uzakl›k h=100 m oldu¤undan, S1 ve S2 noktalar› aras› ortalama semi-variogram; γ(h) = 140.h−0 ,2 γ( S1 , S2 ) = 140 * ( 100 )−0 ,2 = 55,7 (db)2 S1 ve A noktas› aras› uzakl›k h=25 m oldu¤undan, S1 ve SA noktalar› aras› ortalama semi-variogram; γ( S1 , A ) = 140 * ( 25 )−0 ,2 = 73,5 (dB)2 S2 ve A noktas› aras› uzakl›k h=75 m oldu¤undan, S2 ve SA noktalar› aras› ortalama semi-variogram; 181 182 Co¤rafi Bilgi Sistemleri ‹çin Temel ‹statistik γ( S2 , A ) = 140 * ( 75 )−0 ,2 = 59 ,0 (dB)2 ‹ki örnek noktas› ile A noktas› de¤iflken de¤erini tahmin için kullanaca¤›m›z a¤›rl›k katsay›lar›n› hesaplamak için; W1 .γ( S1 , S1 ) + W2 .γ( S1 , S2 ) + λ = γ( S1 , A ) W1 .γ( S2 , S1 ) + W2 .γ( S2 , S2 ) + λ = γ( S2 , A ) + W2 W1 =1 Kriging eflitlik sistemini elde etmifltik. Bu eflitlik sisteminin bilinenlerini yerine yazarsak; ( W1 * 0 ) + ( W2 * 55,7 ) + λ = 73,5 ( W1 * 55,7 ) + ( W2 * 0 ) + λ = 59,0 + W2 W1 =1 üç bilinmeyenli (W1, W2 ve λ) ve üç adet eflitlik elde ederiz. Bu eflitlik sistemini, W1 = 1–W2 yazarak çözdü¤ümüzde, bilinmeyenleri; λ = 38,4 W1 = 0,37 W2 = 0,63 olarak hesaplar›z. Hesaplanan a¤›rl›k katsay›lar›n› kullanarak, de¤iflken de¤eri bilinmeyen A noktas›n›n tahmini kurflun içeri¤ini ( Z*A ) afla¤›daki gibi hesaplar›z. n Z*A = ∑ Wi .Z ( Si ) i =1 Z*A Z*A Z*A = W1.Z(S1 ) + W2 .Z(S2 ) = ( 0 ,37 * 50) + (0,63* 80) = 68,9 dB Kriging yöntemiyle yap›lan tahminin varyans›n›, afla¤›daki eflitlikle bulabiliriz. n σ 2k = ∑ Wi .γ(Si , A) + λ i=1 σ 2k = ( 0,37 * 73,5 ) + ( 0 ,63* 59 ,0 ) + 38,4 = 102,765 (dB)2 183 8. Ünite - Konumsal Tahmin (‹nterpolasyon) ve Kriging S‹ZDE variorgram Bir sodyum sülfat tuzu kristallefltirme havuzundan al›nan örnekler SIRA ile yap›lan analizleri sonras›nda hesaplanan deneysel semi variogram de¤erlerinin do¤rusal modele uydu¤u ve modelin γ(h) = 0,001.h1,65 oldu¤u belirlenmifltir. Havuzun A noktas›ndan örD Ü fi Ü N E L ‹ M nek al›namamakta olup, bu noktan›n sodyum sülfat içeri¤i (% Na2SO4) tahmin edilmek istenmektedir. A noktas›na komflu iki noktadan al›nan örneklerin analizi yap›lm›fl olup, A S O noktalar›n›n R U noktas› ile örnek noktalar› (S1 ve S2) noktalar› aras› uzakl›klar ve örnek sodyum sülfat içerikleri afla¤›daki çizelgelerde verildi¤i gibidir. Kriging yöntemiyle A noktas›n›n sodyum sülfat içeri¤ini tahmin ederek, tahminin kriging varyans›n› bulunuz. D‹KKAT 4 SIRA S‹ZDE D Ü fi Ü N E L ‹ M S O R U D‹KKAT Noktalar Noktalar Aras› Uzakl›k (m) S1 ile A 100 S2 ile A 300 S1 ile S2 400 Örnek N. No Si Z(Si) (% Na2SO4) 1 38 2 TELEV‹ZYON 46 TELEV‹ZYON ‹NTERNET ‹NTERNET SIRA S‹ZDE AMAÇLARIMIZ K ‹ T A P N N SIRA S‹ZDE AMAÇLARIMIZ K ‹ T A P 184 Co¤rafi Bilgi Sistemleri ‹çin Temel ‹statistik Özet N A M A Ç 1 N A M A Ç 2 Konumsal tahminde kullan›lan klasik istatistik ve jeoistatistik yöntemler hakk›nda aras›ndaki fark› belirlemek. Klasik konumsal tahmin yöntemler, al›nan örneklerin devaml›l›¤›n›, etki alan›n› ve yönsel de¤iflimini dikkate almayan yöntemler oldu¤undan, yap›lacak konumsal tahminlerde hata büyüklü¤ü artmakta ve tahminlerin güvenilirli¤i azalmaktad›r. Bu nedenlerle de, bölgeselleflmifl de¤iflkenler için konumsal tahminlerde, klasik yöntemler yerine jeoistatistiksel kriging yöntemlerini uygulamam›z gerekmektedir. Konumsal tahminde en yak›n komflu, yüzey trend analizi ve uzakl›¤›n tersiyle a¤›rl›kland›rma yöntemlerini kullanmak. En yak›n komflu yönteminde, örnek noktalar› aras›nda en yak›n olan noktan›n de¤iflken de¤eri belirlenerek, tahmin edilecek noktaya atamas› yap›lmaktad›r. En yak›n komflu yöntemiyle tahminde, en yak›n komflu noktay› bulabilmek için konumsal noktalar aras› uzakl›klar›n hesaplanmas›nda Öklid yöntemi kullan›lmaktad›r. Bu yöntem, en yak›n komflu örnek noktas›ndan daha uzak noktalardaki de¤iflken de¤erlerini, örnek noktalar› aras›ndaki ba¤›ml›l›¤›, devaml›l›¤› ve yönsel süreklili¤i dikkate almayan bir yöntemdir. Yüzey trend analizi yönteminde, örnek noktalar›n›n de¤iflken de¤erleri ile konumsal koordinatlar› dikkate al›narak, en küçük kareler yöntemiyle p’inci dereceden polinom denklemi elde edilmekte ve bu denklem yard›m›yla de¤iflken de¤eri bilinmeyen noktalar için tahminler yap›lmaktad›r. Bu yöntemle ortalama bir tahmin yap›ld›¤›ndan, afl›r› düflük veya yüksek de¤iflken de¤erlerinin tahmininde yan›lt›c› sonuçlar ortaya ç›kabilmektedir. Uzakl›¤›n tersi ile a¤›rl›kland›rma yönteminde, her örnek noktas›n›n, de¤eri tahmin edilecek noktaya olan uzakl›¤›na göre ters oranda a¤›rl›¤› belirlenerek tahmin yap›lmaktad›r. Uzakl›¤›n tersi ile a¤›rl›kland›rma yöntemi, belirli bir etki mesafesi içerisindeki örnek noktalar›n› dikkate alan ve etki mesafesi d›fl›ndaki daha uzakta olan noktalar› hesaplamalara dahil etmeyen bir yöntemdir. N A M A Ç 3 Konumsal tahmininde Kriging yöntemini aç›klamak ve farkl› semi-variogram modelleri ile noktasal tahmin uygulamalar› yapmak. Kriging yöntemi, de¤iflken de¤eri bilinmeyen bir nokta veya blok çevresindeki ve içindeki örnek de¤erlerinin a¤›rl›k katsay›lar›n›, semi-variogram model parametreleri yard›m›yla hesaplayan ve tahmin varyans›n› en küçükleyecek flekilde de¤iflken de¤erini tahmin eden bir yöntemdir. Bu yöntemde, de¤iflken de¤eri tahmin edilecek nokta için arama kapsama alan›nda belirlenen örnek noktalar› ile tahmin edilecek nokta aras› ortalama semi-variogram de¤erleri dikkate al›narak her bir noktan›n a¤›rl›k katasay›lar› hesaplanmakta ve bu katsay›lar kullan›larak da noktasal de¤iflken de¤eri tahmin edilmektedir. Kriging yöntemi, tahmin varyans›n› en küçükleyen ve en iyi do¤rusal ve yans›z tahminciyi (a¤›rl›klar›) veren bir yöntemdir. 185 8. Ünite - Konumsal Tahmin (‹nterpolasyon) ve Kriging Kendimizi S›nayal›m 1. De¤iflken de¤eri bilinmeyen bir konumsal noktan›n de¤iflken de¤erini tahminde, afla¤›dakilerin hangisinde örnek nokta de¤erlerinin a¤›rl›klar› semi-variogram fonksiyonuna ba¤l› olarak hesaplan›r? a. En yak›n komflu b. Uzakl›¤›n tersiyle a¤›l›kland›rma c. Yüzey trend analizi d. Kriging e. Regresyon 2. Afla¤›dakilerden hangisi en yak›n komflu yöntemiyle tahminin sak›ncas› de¤ildir? a. Uzak noktalardaki di¤er noktalar› dikkate almamas› b. Tahminde kullan›lacak komflu nokta say›s› belirsizdir c. Tahminde sadece en yak›n komflu nokta veya noktalar› dikkate almas› d. Örnek noktalar aras› ba¤›ml›l›k dikkate al›nmaz e. Örnek noktalar aras› devaml›l›k dikkate al›nmaz 3. Bir de¤iflken de¤eri için 5 noktadan örnek al›nm›fl fakat A noktas›ndan al›namam›flt›r. Örnek noktalar› ile A noktas› aras› mesafeler ve örnek noktalar›n›n de¤iflken de¤erleri afla¤›daki gibidir. En yak›n 2 komflu noktas› dikkate al›nd›¤›nda A noktas›n›n de¤iflken de¤eri ne olur? Si d(Si,SA) A Noktas›na Z(Si) De¤iflken Nokta No Uzakl›¤› (m) De¤eri 1 42 5 2 56 9 3 22 10 4 68 12 5 30 14 a. b. c. d. e. 6,4 8,6 10,3 12,3 24,6 4. Her bir örnek noktas› kullan›larak elde edilen polinom denklemi yard›m›yla tahmin yöntemi afla¤›dakilerden hangisidir? a. En yak›n komflu b. Uzakl›¤›n tersiyle a¤›l›kland›rma c. Yüzey trend analizi d. Kriging e. Regresyon 5. Afla¤›da 2 örnek noktas›n›n A noktas›na uzakl›klar› verilmifltir. Uzakl›¤›n tersi dikkate al›nd›¤›nda, A noktas›n›n de¤iflken de¤erini tahminde S1 örnek noktas›n›n a¤›rl›¤› ne olur? a. b. c. d. e. Örnek No Si A Noktas›ndan Uzakl›k (m) 1 20 2 50 0,240 0,286 0,565 0,714 0,760 6. Afla¤›dakilerden hangisi Kriging yönteminin klasik konumsal tahmin yöntemlerine göre en önemli üstünlü¤ü de¤ildir? a. Örneklerin birbirinden ba¤›ms›z oldu¤unu dikkate al›r. b. Örneklerin etki alan›n› dikkate al›r. c. Örneklerin de¤iflken de¤erlerinin yönsel de¤iflimini dikkate al›r. d. Blok de¤iflken de¤eri tahminlerinde, blok boyutlar›n› dikkate al›r. e. Tahminlerin varyans›n› en küçükler. 7. Arama kapsama alan› içerisindeki örnek nokta say›s› kaç›n alt›nda olursa, Kriging yöntemiyle yap›lacak tahminler yan›lt›c› sonuçlar verir? a. 4 b. 8 c. 10 d. 15 e. 16 186 Co¤rafi Bilgi Sistemleri ‹çin Temel ‹statistik 8. Bir kömür madeninde kal›nl›k örnekleriyle yap›lan variogram analizleri sonras›nda, kal›nl›k de¤eri bilinmeyen A noktas› için etki alan›nda bulunan 4 örnek noktas› ile kriging a¤›rl›k katsay›lar› afla¤›daki gibi hesaplanm›flt›r. A noktas› kal›nl›¤›n›n kriging tahmin de¤eri ( Z*A ) nedir? Nokta No Wi Kriging A¤›rl›k Zi Kömür Kal›nl›¤› Katsay›s› (m) 1 0,15 6,0 2 0,25 8,0 3 0,20 7,0 4 0,40 5,0 a. b. c. d. e. 3,3 6,3 7,4 8,4 9,6 9. Bir alt›n madeninde variogram analizleri yap›ld›ktan sonra, alt›n içeri¤i (gr/ton Au) bilinmeyen A noktas› için komflu iki örnek noktas› ile tahmin yap›lmak istenmektedir. A noktas› ile örnek noktalar aras› ortalama semi-variogram de¤erleri afla¤›daki gibi oldu¤una göre, A noktas›n›n tahmininde kullan›lacak S2 örne¤inin kriging a¤›rl›k katsay›s› de¤eri ne olur? Noktalar Ortalama Semi-Variogram (%)2 Au S1 ile A ( γ( S1 , A ) ) 10 S2 ile A ( γ( S2 , A ) ) 20 S1 ile S2 ( γ( S1 , S2 )) 15 S1 ile S1 ( γ( S1 , S1 )) 0 S2 ile S2 ( γ( S , S )) 2 2 0 a. b. c. d. e. 0,10 0,17 0,33 0,67 0,83 10. Bir arazide topo¤rafik ölçüm cihazlar›yla yap›lan yükselti ölçümleri sonras›nda variogram madellemesi gerçeklefltirilmifltir. Yükseltisi ölçülemeyen A noktas› için etki alan›nda bulunan 4 örnek noktas› ile hesaplanan kriging a¤›rl›k katsay›lar› ve ortalama semi variogram de¤erlerinin afla¤›daki gibi oldu¤u belirlenmifltir. Kriging eflitliklerinin çözümü s›ras›nda lagrange çarpan› de¤eri λ = 12,5 hesapland›¤›na göre, A noktas›n›n kriging tahmin varyans› de¤eri de¤eri ( σ2k ) ne olur? Nokta No Wi Kriging A¤›rl›k Katsay›s› 1 0,05 2 0,25 3 0,30 4 0,40 Noktalar Ortalama Semi-Variogram (M)2 S1 ile A ( γ( S1 , A )) 20 S2 ile A ( γ( S2 , A )) 10 S3 ile A ( γ( S3 , A )) 30 S4 ile A ( γ( S4 , A ) ) 40 a. b. c. d. e. 1,0 3,5 12,5 28,5 41,0 187 8. Ünite - Konumsal Tahmin (‹nterpolasyon) ve Kriging Kendimizi S›nayal›m Yan›t Anahtar› 1. d Yan›t›n›z yanl›fl ise, “Kriging Tahmin Yöntemi” konusuna bak›n›z. Yan›t›n›z yanl›fl ise, “En Yak›n Komflu Yöntemi” konusuna bak›n›z. Yan›t›n›z yanl›fl ise, “En Yak›n Komflu Yöntemi” konusuna bak›n›z. Yan›t›n›z yanl›fl ise, “Yüzey Trend Analizi” konusuna bak›n›z. Yan›t›n›z yanl›fl ise, “Uzakl›¤›n Tersiyle A¤›rl›kland›rma Yöntemi” konusuna bak›n›z. Yan›t›n›z yanl›fl ise, “Kriging Tahmin Yöntemi” konusuna bak›n›z. Yan›t›n›z yanl›fl ise, “Kriging Tahmin Yöntemi” konusuna bak›n›z. Yan›t›n›z yanl›fl ise, “Kriging Tahmin Yöntemi” konusuna bak›n›z. Yan›t›n›z yanl›fl ise, “Kriging Tahmin Yöntemi” konusuna bak›n›z. Yan›t›n›z yanl›fl ise, “Kriging Tahmin Yöntemi” konusuna bak›n›z. 2. c 3. d 4. c 5. d 6. a 7. a 8. b 9. b 10. e S›ra Sizde 2 Örnek noktalar›n›n de¤iflken de¤eri tahmin edilecek blok merkezinde bulunan A noktas›na olan uzakl›klar› Öklid yöntemiyle hesaplanm›flt›r. Uzakl›klar›n tersleri ve uzakl›k tersleri toplam›na göre a¤›rl›klar› afla¤›da verildi¤i gibi hesaplanm›flt›r. A Ters Uzakl›k Örnek No Si Noktas›ndan A¤›rl›klar Wi (1/m) Uzakl›k (m) 1 335,4 0,0030 0,185 2 250 0,0040 0,248 3 279,5 0,0036 0,222 4 180,3 0,0055 0,345 0,0161 1,000 Toplam Blok merkezi olan SA noktas›n›n tahmini tenörünü (Z*) afla¤›daki gibi hesaplar›z. Z* (SA ) = W1.Z(S1 ) + W2 .Z(S2 ) + W3 .Z(S3 ) + W4 .Z(S4 ) Z* (SA ) = (0,185 * 4, 8) + (0,248*5,9) + (0, 222 * 6, 4) + (0,345*5, 7) Z* (SA ) = 5, 7 pH S›ra Sizde Yan›t Anahtar› S›ra Sizde 1 Tarlalar ile A noktas› aras› uzakl›klar afla¤›daki afla¤›daki eflitlikle hesaplan›r. d ( Si , S A ) = ( xi − x A )2 + ( yi − y A )2 W1.γ ( S1 , S1 ) + W2 .γ ( S1 , S2 ) + λ = γ ( S1 , A) Konumsal Koordinatlar (m) A Noktas›na Uzakl›k (m) (X) (Y) d (S‹, SA) Tarla No Si 1 6100 4700 316,2 2 6400 4800 200,0 3 6900 4750 522,0 4 6600 4500 223,6 5 6300 4250 364,0 En yak›n iki komflu nokta S2 ve S4 oldu¤undan, noktalar aras› uzakl›klarla a¤›rl›kland›r›lm›fl tahmini de¤iflken de¤erini afla¤›daki gibi hesaplar›z. k ∑ d ( Si , S A ).Z ( Si ) Z * ( S A ) = i=1 k ∑ d ( Si , S A ) i=1 = ( 200 * 85)) + ( 223, 6 * 102) = 94, 0cm ( 200 + 223, 6) S›ra Sizde 3 ‹ki örnek noktam›z (S1 ve S2) oldu¤undan, afla¤›daki üç adet kriging eflitli¤i sözkonusudur. W1.γ ( S2 , S1 ) + W2 .γ ( S2 , S2 ) + λ = γ ( S2 , A) W1 + W2 =1 Örnek noktalar›n›n kendi içinde herhangi bir mesafe söz konusu olmad›¤›ndan; γ ( S1 , S1 ) = 0 ve γ ( S2 , S2 ) = 0 olur Örnek noktalar› aras› ve örnek noktalar› ile A noktas› aras› ortalama semi-variogramlar› afla¤›daki gibi hesaplar›z. Küresel model; 3.h h3 γ ( Si , S j ) = C . − h≤a 2.a 2.a 3 γ ( Si , S j ) = C h≥a olup, burada h : Si ve Sj noktalar› aras› uzakl›kt›r. Eflik de¤er C=20 (ppm)2 Pb ve etki mesafesi a=50 m olarak verilmiflti. 188 Co¤rafi Bilgi Sistemleri ‹çin Temel ‹statistik S1 ve S2 noktalar› aras› uzakl›k h=50 m etki mesafesine eflit (h=a=50 m) oldu¤undan, S1 ve S2 noktalar› aras› ortalama semi-variogram; γ( S1 , S2 ) = C = 20 ( ppm )2 Pb 3 * 10 (10)3 2 γ( S1 , A) = 20. − = 5, 92 ( ppm ) Pb 2 * 50 2 * (50)3 S2 ve A noktas› aras› uzakl›k h=40 m oldu¤undan, S2 ve SA noktalar› aras› ortalama semi-variogram; 3 * 40 ( 40)3 2 γ( S2 , A) = 20. − = 18, 88 ( ppm ) Pb 2 * 50 2 * (50)3 ‹ki örnek noktas› ile A noktas› de¤iflken de¤erini tahmin için kullanaca¤›m›z a¤›rl›k katsay›lar›n› hesaplamak için; W1.γ ( S1 , S1 ) + W2 .γ ( S1 , S2 ) + λ = γ ( S1 , A) W1.γ ( S2 , S1 ) + W2 .γ ( S2 , S2 ) + λ = γ ( S2 , A) + W2 =1 Kriging eflitlik sistemini elde etmifltik. Bu eflitlik sisteminin bilinenlerini yerine yazarsak; (W1 * 0) + (W2 * 20) + λ = 5, 92 (W1 * 20) + (W2 * 0) + λ = 18, 88 +W2 W1 =1 üç bilinmeyenli (W1,W2, λ) ve üç adet eflitlik elde ederiz. Bu eflitlik sistemini, W1=1-W2 yazarak çözdü¤ümüzde, bilinmeyenleri; λ=2,4 W1=0,824 W2=0,176 olarak hesaplar›z. Hesaplanan a¤›rl›k katsay›lar›n› kullanarak, de¤iflken de¤eri bilinmeyen A noktas›n›n tahmini kurflun içeri¤ini ( Z*A ) afla¤›daki gibi hesaplar›z. n Z *A = ∑ Wi .Z ( Si ) n σk2 = ∑ Wi .γ (Si , A) + λ i=1 S1 ve A noktas› aras› uzakl›k h=10 m oldu¤undan, S1 ve SA noktalar› aras› ortalama semi-variogram; W1 Kriging yöntemiyle yap›lan tahminin varyans›n›, afla¤›daki eflitlikle bulabiliriz. σk2 = (0, 824 * 5, 92) + (0, 176 * 18,, 88) + 2, 4 σk2 = 8, 2 ( ppm )2 Pb S›ra Sizde 4 ‹ki örnek noktam›z (S1 ve S2) oldu¤undan, afla¤›daki üç adet kriging eflitli¤i sözkonusudur. W1.γ ( S1, S1 ) + W2 .γ ( S1 , S2 ) + λ = γ ( S1, A) W1.γ ( S2 , S1 ) + W2 .γ ( S2 , S2 ) + λ = γ ( S2 , A) W1 + W2 =1 Örnek noktalar›n›n kendi içinde herhangi bir mesafe söz konusu olmad›¤›ndan; γ ( S1 , S1 ) = 0 ve γ ( S2 , S2 ) = 0 olur Örnek noktalar› aras› ve örnek noktalar› ile A noktas› aras› ortalama semi-variogramlar› afla¤›daki gibi hesaplar›z. Do¤rusal model; γ(h) = 0, 001.h1,65 olup, burada h : Si ve Sj noktalar› aras› uzakl›kt›r. S1 ve S2 noktalar› aras› uzakl›k h=400 m oldu¤undan, S1 ve S2 noktalar› aras› ortalama semi-variogram; γ (h) = 0, 001.h1,65 γ ( S1 , S2 ) = 0, 001 * ( 400)1,65 = 19, 65 (%)2 Na 2SO4 ) S1 ve A noktas› aras› uzakl›k h=100 m oldu¤undan, S1 ve SA noktalar› aras› ortalama semi-variogram; γ( S1 , S A ) = 0, 001 * (100)1,65 = 2, 00 (%)2 ( Na 2SO 4 ) S2 ve A noktas› aras› uzakl›k h=300 m oldu¤undan, S2 ve SA noktalar› aras› ortalama semi-variogram; γ( S2 , S A ) = 0, 001 * (300)1,65 = 12, 23 (%)2 ( Na 2SO4 ) Kriging eflitlik sisteminin bilinenlerini yerine yazarsak; ( W1 * 0 ) + ( W2 * 19 ,65 ) + λ = 2 ,0 i=1 Z*A = W1.Z(S1 ) + W2 .Z(S2 ) Z*A = (0, 824 * 5) + (0,176 * 2) Z*A = 4, 47 ppm Pb ( W1 * 19 ,65 ) + ( W2 * 0 ) + λ = 12 , 23 W1 + W2 =1 üç bilinmeyenli (W1, W2 ve λ) ve üç adet eflitlik elde ederiz. Bu eflitlik sistemini, W1 =1-W2 yazarak çözdü¤ümüzde, bilinmeyenleri; λ=−2,71 8. Ünite - Konumsal Tahmin (‹nterpolasyon) ve Kriging 189 Yararlan›lan Kaynaklar W1=0,24 W2=0,76 olarak hesaplar›z. Hesaplanan a¤›rl›k katsay›lar›n› kullanarak, de¤iflken de¤eri bilinmeyen A noktas›n›n tahmini kurflun içeri¤ini ( Z*A ) afla¤›daki gibi hesaplar›z. n Z*A = ∑ Wi .Z ( Si ) i =1 Z*A = W1.Z(S1 ) + W2 .Z(S2 ) Z*A = ( 0 , 24 * 38) + (0,76 * 46) Z*A = 44 ,08 % Na 2SO4 Kriging yöntemiyle yap›lan tahminin varyans›n›, afla¤›daki eflitlikle bulabiliriz. n σ2k = ∑ Wi .γ(Si , A) + λ i=1 n σ2k = ∑ (0, 24 * 2,0) + (0,76 *12, 23) - 2,71 i=1 = 7,06 (%)2 Na 2SO4 Baltac›, A.G. (2007). Jeoistatistiksel Kestirimde Lokal Belirsizli¤in De¤erlendirilmesinde Alternatif Yaklafl›mlar. (Yay›mlanmam›fl doktora tezi). Hacettepe Üniversitesi/Fen Bilimleri Enstitüsü, Ankara. Clark, I. (1979). Practical Geostatistics. London: Applied Science. Darakç›, H.Ç. (2010). K-En Yak›n Komflu Yöntemi. http://akademik.maltepe.edu.tr/~ttbilgin/BIL518/presentations/HalilCagdasDARAKCI/Sunum1/K-Nearest%20Neighbor%20Estimation.ppt Gülband›lar, E. (2010). Bellek Tabanl› S›n›fland›rma: En Yak›n K-Komflu Algoritmas›. http://mf.dumlupinar.edu.tr/~eyup/DM/dm5.pdf Journel, A.G. & Huijbregts, CH.J. (1978). Mining Geostatistics. San Diego: Academic. Konuk, A. & Önder, S. (1999). Maden ‹statisti¤i. Mühendislik Mimarl›k Fakültesi Maden Mühendisli¤i Bölümü. Eskiflehir: Eskiflehir Osmangazi Üniversitesi. Olea, R. A. (1999). Geostatistics for Engineers and Earth Scientists. Boston: Kluwer Academic. Özsakarbafl›, F. (2008), Classification of Forest Areas by K Nearest Neighbor Method: Case Study, Antalya. (Yay›mlanmam›fl yüksek lisans tezi). Ortado¤u Teknik Üniversitesi/Fen Bilimleri Enstitüsü, Ankara. Pekin, A. (1999). Aç›k ‹flletme Basamak Tenörlerinin Kriging Tahminlerinde ‹statistiksel Da¤›l›m Modellerinin Etkileri. (Yay›mlanmam›fl doktora tezi). Eskiflehir Osmangazi Üniversitesi/Fen Bilimleri Enstitüsü, Eskiflehir. Tercan, A.E. & Saraç, C. (1998). Maden Yataklar›n›n De¤erlendirilmesinde Jeoistatistiksel Yöntemler. Ankara: Jeoloji Mühendisleri Odas›. Tüysüz, N. & Yaylal›, G. (2005). Jeoistatististik - Kavramlar ve Bilgisayarl› Uygulamalar. Trabzon: Karadeniz Teknik Üniversitesi Uyguçgil, H. (2007). Çok De¤iflkenli Maden Yataklar›nda Rezerv Tenör Tahmininde Jeoistatistik ve Co¤rafi Bilgi Sistemleri Tekniklerinin Kullan›m›. (Yay›mlanmam›fl doktora tezi). Eskiflehir Osmangazi Üniversitesi/Fen Bilimleri Enstitüsü, Eskiflehir 190 Co¤rafi Bilgi Sistemleri ‹çin Temel ‹statistik Ki Kare Tablosu 8. Ünite - Konumsal Tahmin (‹nterpolasyon) ve Kriging T Tablosu 191 192 Co¤rafi Bilgi Sistemleri ‹çin Temel ‹statistik Z Tablosu 0 z