co⁄raf‹ b‹lg‹ s‹stemler‹ ‹ç‹n temel ‹stat‹st‹

advertisement
T.C. ANADOLU ÜN‹VERS‹TES‹ YAYINI NO: 2326
AÇIKÖ⁄RET‹M FAKÜLTES‹ YAYINI NO: 1323
CO⁄RAF‹ B‹LG‹ S‹STEMLER‹ ‹Ç‹N
TEMEL ‹STAT‹ST‹K
Yazar
Prof.Dr. Adnan KONUK (Üniteler 1-8)
Editör
Yrd.Doç.Dr. Hakan UYGUÇG‹L
ANADOLU ÜN‹VERS‹TES‹
Bu kitab›n bas›m, yay›m ve sat›fl haklar› Anadolu Üniversitesine aittir.
“Uzaktan Ö¤retim” tekni¤ine uygun olarak haz›rlanan bu kitab›n bütün haklar› sakl›d›r.
‹lgili kurulufltan izin almadan kitab›n tümü ya da bölümleri mekanik, elektronik, fotokopi, manyetik kay›t
veya baflka flekillerde ço¤alt›lamaz, bas›lamaz ve da¤›t›lamaz.
Copyright © 2011 by Anadolu University
All rights reserved
No part of this book may be reproduced or stored in a retrieval system, or transmitted
in any form or by any means mechanical, electronic, photocopy, magnetic, tape or otherwise, without
permission in writing from the University.
UZAKTAN Ö⁄RET‹M TASARIM B‹R‹M‹
Genel Koordinatör
Prof.Dr. Levend K›l›ç
Genel Koordinatör Yard›mc›s›
Doç.Dr. Müjgan Bozkaya
Ö¤retim Tasar›mc›s›
Arfl.Gör.Dr. Mestan Küçük
Grafik Tasar›m Yönetmenleri
Prof. Tevfik Fikret Uçar
Ö¤r.Gör. Cemalettin Y›ld›z
Ö¤r.Gör. Nilgün Salur
Ölçme De¤erlendirme Sorumlusu
Ö¤r.Gör. H. Reha Akgün
Grafikerler
Ayflegül Dibek, Ufuk Önce,
Hazal Y›ld›r›m, Adnan Çamur
Kitap Koordinasyon Birimi
Yrd.Doç.Dr. Feyyaz Bodur
Uzm. Nermin Özgür
Kapak Düzeni
Prof. Tevfik Fikret Uçar
Dizgi
Aç›kö¤retim Fakültesi Dizgi Ekibi
Co¤rafi Bilgi Sistemleri ‹çin Temel ‹statistik
ISBN
978-975-06-1000-4
1. Bask›
Bu kitap ANADOLU ÜN‹VERS‹TES‹ Web-Ofset Tesislerinde 250 adet bas›lm›flt›r.
ESK‹fiEH‹R, Eylül 2011
iii
‹çindekiler
‹çindekiler
Önsöz ............................................................................................................
vii
Temel ‹statistik Kavramlar.....................................................
2
ÖRNEKLEME KAVRAMLARI ........................................................................
‹statistiksel Kütle Türleri ..............................................................................
Ana Kütle ve Örnek Kütle ............................................................................
Örnekleme Yöntemleri .................................................................................
Rassal Olmayan Örnekleme ...................................................................
Rassal Örnekleme....................................................................................
VER‹LER‹N TOPLANMASI VE SER‹LER HAL‹NDE
DÜZENLENMES‹ ..........................................................................................
Zaman ve Mekan Serileri .............................................................................
Nitel (Kalitatif) Seriler .............................................................................
Nicel Seriler .............................................................................................
VER‹LER‹N SUNULMASI ..............................................................................
Zaman Serilerinin Grafiksel Gösterimi (Kartezyen Grafik).........................
Nitel Serilerin Grafiksel Gösterimi (Pasta Grafi¤i) .....................................
Nicel Serilerin Grafiksel Gösterimi...............................................................
Özet ...............................................................................................................
Kendimizi S›nayal›m .....................................................................................
Kendimizi S›nayal›m Yan›t Anahtar› ............................................................
S›ra Sizde Yan›t Anahtar› ..............................................................................
Yararlan›lan Kaynaklar..................................................................................
3
3
4
4
5
5
8
8
10
10
14
14
15
16
18
19
20
20
20
Merkezi E¤ilim ve Da¤›l›m Ölçüleri....................................... 22
MERKEZ‹ E⁄‹L‹M ÖLÇÜLER‹ ......................................................................
Aritmetik Ortalama ........................................................................................
A¤›rl›kl› Ortalama ..........................................................................................
Geometrik Ortalama......................................................................................
Harmonik Ortalama .....................................................................................
Kareli Ortalama .............................................................................................
Medyan ..........................................................................................................
Mod ................................................................................................................
DA⁄ILIM ÖLÇÜLER‹ ....................................................................................
De¤iflkenlik Aral›¤› ........................................................................................
Varyans ve Standart Sapma ..........................................................................
De¤iflkenlik Katsay›s› ....................................................................................
Özet................................................................................................................
Kendimizi S›nayal›m......................................................................................
Kendimizi S›nayal›m Yan›t Anahtar› ............................................................
S›ra Sizde Yan›t Anahtar› ..............................................................................
Yararlan›lan Kaynaklar..................................................................................
2. ÜN‹TE
23
23
28
29
31
32
33
36
37
37
38
39
41
42
43
44
45
Olas›l›k Da¤›l›m Modelleri ...................................................... 46
OLASILIK DA⁄ILIMLARINA GENEL BAKIfi.................................................
BAZI KES‹KL‹ OLASILIK DA⁄ILIM MODELLER‹ .......................................
Binom Da¤›l›m› ............................................................................................
1. ÜN‹TE
47
47
48
3. ÜN‹TE
iv
‹çindekiler
Poisson Da¤›l›m›............................................................................................
BAZI SÜREKL‹ OLASILIK DA⁄ILIM MODELLER‹ ......................................
Normal Da¤›l›m .............................................................................................
Standart Normal Da¤›l›m ........................................................................
Çarp›kl›k ve Bas›kl›k Katsay›s› ...............................................................
Normal Olas›l›k E¤risinin Alt›nda Kalan Alanlar›n Hesaplanmas›........
Lognormal Da¤›l›m ......................................................................................
Özet ...............................................................................................................
Kendimizi S›nayal›m .....................................................................................
Kendimizi S›nayal›m Yan›t Anahtar› ............................................................
S›ra Sizde Yan›t Anahtar› ..............................................................................
Yararlan›lan Kaynaklar..................................................................................
4. ÜN‹TE
Güven Aral›¤› Tahminleri ....................................................... 68
‹STAT‹ST‹KTE TAHM‹NLEME.......................................................................
Nokta Tahmini...............................................................................................
Güven Aral›¤› ve S›n›rlar› ............................................................................
ANA KÜTLE ORTALAMASI ‹Ç‹N GÜVEN ARALI⁄I ...................................
Ortalaman›n Standart Hatas› .........................................................................
Büyük Örneklemelerde Ana Kütle Ortalamas›n›n Güven Aral›¤› ..............
Küçük Örneklemelerde Ana Kütle Ortalamas›n›n Güven Aral›¤› ..............
ANA KÜTLE ORANI ‹Ç‹N GÜVEN ARALI⁄I ...............................................
Oran Ortalamas›n›n Standart Hatas›.............................................................
Büyük Örneklemelerde Ana Kütle Oran Ortalamas›n›n Güven Aral›¤› ....
Küçük Örneklemelerde Ana Kütle Oran› Ortalamas›n›n Güven Aral›¤› ...
‹K‹ ANA KÜTLE ORTALAMASI ARASINDAK‹ FARKIN GÜVEN
ARALI⁄I .........................................................................................................
‹ki Ana Kütle Ortalamas› Aras› Fark›n Standart Hatas›...............................
Büyük Örneklemelerde ‹ki Ana Kütle Ortalamas› Aras›ndaki
Fark›n Güven Aral›¤›.....................................................................................
Küçük Örneklemelerde ‹ki Ana Kütle Ortalamas› Aras›ndaki
Fark›n Güven Aral›¤›.....................................................................................
‹K‹ ANA KÜTLE ORANI ARASINDAK‹ FARKIN GÜVEN ARALI⁄I ............
‹ki Ana Kütle Oranlar› Aras›ndaki Farklar›n Standart Hatas›......................
Büyük Örneklemelerde ‹ki Ana Kütle Oran› Aras›ndaki Fark›n Güven
Aral›¤›.............................................................................................................
Küçük Örneklemelerde ‹ki Ana Kütle Oran› Farklar›n›n Güven Aral›¤› ...
VARYANS ‹Ç‹N GÜVEN ARALI⁄I ................................................................
Özet ...............................................................................................................
Kendimizi S›nayal›m .....................................................................................
Kendimizi S›nayal›m Yan›t Anahtar› ............................................................
S›ra Sizde Yan›t Anahtar› ..............................................................................
Yararlan›lan Kaynaklar..................................................................................
5. ÜN‹TE
50
52
52
54
55
57
60
63
64
65
65
66
69
69
70
71
72
72
74
75
75
76
77
78
79
79
81
81
81
82
82
83
85
86
87
88
88
‹statistiksel Karar Vermede Hipotez Testleri ...................... 90
H‹POTEZ‹N KURULMASI VE TEST‹.............................................................
Hipotezlerin Kurulmas› .................................................................................
Red Bölgesinin Tan›mlanmas› ................................................................
Test ‹statisti¤ini Hesaplanmas› ve Karar Verme....................................
ANA KÜTLE ORTALAMASINA ‹L‹fiK‹N TESTLER ......................................
91
92
92
93
94
v
‹çindekiler
Büyük Örneklemelerde Ortalamalar›n Testi................................................
Küçük Örneklemelerde Ortalamalar›n Testi................................................
ANA KÜTLE ORANINA ‹L‹fiK‹N TESTLER ..................................................
Büyük Örneklemelerde Oranlar›n Testi ......................................................
Küçük Örneklemelerde Oranlar›n Testi .....................................................
ANA KÜTLE ORTALAMALARI ARASINDAK‹ FARKLARIN TEST‹...............
Büyük Örneklemelerde Ana Kütle Ortalamalar›
Aras›ndaki Farklar›n Testi .............................................................................
Küçük Örneklemelerde Ortalamalar
Aras›ndaki Farklar›n Testi ............................................................................
VARYANSLARIN TEST‹ .................................................................................
Özet................................................................................................................
Kendimizi S›nayal›m......................................................................................
Kendimizi S›nayal›m Yan›t Anahtar› ............................................................
S›ra Sizde Yan›t Anahtar› ..............................................................................
Yararlan›lan Kaynaklar..................................................................................
95
97
99
100
101
102
102
104
105
108
109
110
110
112
Regresyon ve Korelasyon........................................................ 114
DE⁄‹fiKENLER ARASI ‹L‹fiK‹LER ................................................................
Belirleyici ve Deneysel ‹liflkiler ...................................................................
Ba¤›ml› ve Ba¤›ms›z De¤iflkenler.................................................................
De¤iflkenler Aras› ‹liflkinin Yönü ve Derecesi.............................................
BAS‹T DO⁄RUSAL REGRESYON VE KORELASYON ................................
Serpilme Diyagram›.......................................................................................
En Küçük Kareler Yöntemi...........................................................................
Standart Hata ve Tahminlerin Güven Aral›¤› ..............................................
Korelasyon Katsay›s› .....................................................................................
Korelasyon Katsay›s›n›n Test Edilmesi.........................................................
E⁄R‹SEL (ÜSTEL) REGRESYON VE BEL‹RL‹L‹K KATSAYISI ....................
Üstel Regresyon ...........................................................................................
Belirlilik Katsay›s› ve Standart hata..............................................................
Özet ...............................................................................................................
Kendimizi S›nayal›m .....................................................................................
Kendimizi S›nayal›m Yan›t Anahtar› ............................................................
S›ra Sizde Yan›t Anahtar› ..............................................................................
Yararlan›lan Kaynaklar..................................................................................
Jeoistatistiksel Kavramlar ....................................................... 144
BÖLGESELLEfiM‹fi DE⁄‹fiKENLER ..............................................................
Yersellik (Lokalizasyon)................................................................................
Devaml›l›k ....................................................................................................
Yönsel De¤iflim (Anizotropi) .......................................................................
Geçifller .........................................................................................................
VAR‹OGRAM VE SEM‹-VAR‹OGRAM...........................................................
Deneysel Semi-Variogram Parametreleri ....................................................
Külçe Varyans› (C0) ................................................................................
Eflik De¤er (C0+C) .................................................................................
Külçe Etki Oran› (e)................................................................................
Etki Mesafesi (a)......................................................................................
Yönsel Etki Mesafesi Oran› (Anisotropi Oran›) ...................................
6. ÜN‹TE
115
115
116
116
116
117
119
124
126
127
131
131
133
138
139
140
141
143
145
146
146
146
147
147
147
148
148
148
148
148
7. ÜN‹TE
vi
‹çindekiler
Semi-Variogram›n Yönsel De¤iflimi (Anizotropi) ........................................
Semi-Variogram Fonksiyonunun Orijine Yak›n Davran›fl› ........................
KURAMSAL SEM‹-VAR‹OGRAM MODELLER‹..............................................
Küresel (Spherical) Model ............................................................................
Üstel (Eksponansiyel) Model........................................................................
Do¤rusal Model .............................................................................................
Özet ...............................................................................................................
Kendimizi S›nayal›m .....................................................................................
Kendimizi S›nayal›m Yan›t Anahtar› ............................................................
S›ra Sizde Yan›t Anahtar› ..............................................................................
Yararlan›lan Kaynaklar..................................................................................
8. ÜN‹TE
149
149
153
153
154
155
160
161
162
163
164
Konumsal Tahmin (‹nterpolasyon) ve Kriging.......................166
UZAKLI⁄A BA⁄LI TAHM‹N YÖNTEMLER‹ ................................................
KLAS‹K KONUMSAL TAHM‹N YÖNTEMLER‹ .............................................
En Yak›n Komflu Yöntemi ............................................................................
Yüzey Trend Analizi .....................................................................................
Uzakl›¤›n Tersi ‹le A¤›rl›kland›rma Yöntemi ...............................................
KR‹G‹NG TAHM‹N YÖNTEM‹ ....................................................................
Nokta Kriging ...............................................................................................
Özet................................................................................................................
Kendimizi S›nayal›m......................................................................................
Kendimizi S›nayal›m Yan›t Anahtar› ............................................................
S›ra Sizde Yan›t Anahtar› ..............................................................................
Yararlan›lan Kaynaklar..................................................................................
Ki Kare Tablosu.............................................................................................
T Tablosu.......................................................................................................
Z Tablosu.......................................................................................................
167
168
168
171
172
174
175
184
185
187
187
189
190
191
192
Önsöz
Önsöz
Günümüzde sosyal, ekonomik, tar›msal, çevresel vb. sorunlara yönelik konumsal verilerin toplanmas›, saklanmas› ve sunulmas› ifllevlerini gerçeklefltiren
Co¤rafi Bilgi Sistemleri’nin kullan›m› gün geçtikçe yayg›nlaflmaktad›r. Co¤rafi Bilgi Sistemleri (CBS) ile konumsal gözlem veya araflt›rma yapan personelin ise toplanan büyük hacimli verileri istatistik yöntemlerle de¤erlendirerek yorumlanmas›
ve karar verme çal›flmalar›nda istatistik bilgisine sahip olmas› gerekmektedir. Co¤rafi Bilgi Sistemlerinin üretti¤i bilgileri kullanan yöneticilerin de, gözlemlenen veya araflt›r›lan konumsal verilerden sonuç elde ederek süreçleri gelifltirebilmeleri,
tahmin yapabilmeleri ve karar verebilmeleri için istatistik yöntemleri ve modelleri
kullanabilmeleri gerekmektedir.
Co¤rafi Bilgi Sistemleri ‹çin Temel ‹statistik ad› alt›nda haz›rlanm›fl olan bu kitapla, Co¤rafi Bilgi Sistemlerini kullanan personel ve karar verici konumundaki
yöneticilere temel düzeyde ilgili istatistiksel problemleri çözebilecek istatistik bilgisini kazand›rmak amaçlanm›flt›r. Kitap, yayg›n olarak kullan›lan temel konular›n
örnek uygulamalarla ele al›nd›¤› sekiz üniteden oluflmaktad›r. Kitapta birinci
ünitede verilen temel istatistik kavramlar›n ard›ndan, ikinci ünitede merkezi e¤ilim ve da¤›l›m ölçüleri, üçüncü ünitede baz› kesikli ve sürekli olas›l›k da¤›l›m modelleri, dördüncü ünitede güven aral›¤› tahmin yöntemleri, beflinci ünitede istatistiksel karar vermede kullan›lan hipotez testi yöntemleri, alt›nc› ünitede regresyon
ve korelasyon analizleri, yedinci ünitede jeoistatistiksel kavramlar ve sekizinci
ünitede konumsal tahminde kullan›lan klasik istatistik ve jeoistatistik yöntemler
ele al›nm›flt›r. Her ünitede konularla ilgili örneklere yer verilmifl, s›ra sizde sorular› ile ö¤renilen konular›n pekifltirilmesi ve kendimizi s›nayal›m bafll›¤› alt›nda
verilen soru ve yan›tlarla kendinizi s›naman›z hedeflenmifltir.
Temel istatistik bilgilerini kavrad›kça ve uygulamalarda kulland›kça, toplad›¤›n›z verileri daha iyi derledi¤inizi, yorumlad›¤›n›z› ve veriler yard›m›yla tahminler
yap›p karar verebildi¤inizi göreceksiniz. Kitab›n, Co¤rafi Bilgi Sistemleri konusunda çal›flan ö¤renci, araflt›rmac› ve yöneticilere yararl› olmas› dileklerimle…
Editör
Yrd.Doç.Dr. Hakan UYGUÇG‹L
vii
CO⁄RAF‹ B‹LG‹ S‹STEMLER‹ ‹Ç‹N TEMEL
‹STAT‹ST‹K
1
Amaçlar›m›z
N
N
N
Bu üniteyi tamamlad›ktan sonra;
Örnekleme kavramlar›n› ö¤renerek örnekleme yöntemi seçimini yapabilecek,
‹statistiksel verilerin toplanmas› ve düzenlenmesi çal›flmalar›n› temel anlamda gerçeklefltirebilecek,
‹statistiksel verileri sunabilecek bilgi ve becerilere sahip olacaks›n›z.
Anahtar Kavramlar
•
•
•
•
•
Ana kütle
Örnek kütle
Örnekleme
‹statistik Seriler
‹statistik Grafikler
•
•
•
•
•
Rassal Örnekleme
Küme Örnekleme
Tabakal› Örnekleme
Dilim Örnekleme
Kota Örneklemesi
‹çindekiler
Co¤rafi Bilgi
Sistemleri ‹çin Temel
‹statistik
Temel ‹statistik
Kavramlar
• ÖRNEKLEME KAVRAMLARI
• VER‹LER‹N TOPLANMASI VE
SER‹LER HAL‹NDE
• DÜZENLENMES‹
• VER‹LER‹N SUNULMASI
Temel ‹statistik Kavramlar
ÖRNEKLEME KAVRAMLARI
‹statistiksel araflt›rmalarda genellikle belirli bir ana kütle de¤iflken ve parametreleri hakk›nda bilgi üretilmeye çal›fl›l›r. Ana kütle parametre ve de¤iflkenleri hakk›nda tam ve do¤ru bilgi üretebilmek için tüm ana kütlenin ele al›nmas› gerekir. Ancak, tüm ana kütlenin ele al›nmas› süreci hem çok zaman al›c› hem de pahal› oldu¤undan, genellikle ana kütleyi temsil edebilecek say›da örnek alarak, bu örnek
kütle yard›m›yla ana kütle parametreleri hakk›nda bilgi üretilmeye çal›fl›r. Sorun,
ana kütleyi temsil edecek düzeyde örnekleme yapmak ve örnek kütlenin boyutu
hakk›nda karar vermektir.
‹statistiksel Kütle Türleri
‹statistikse anlamda kütleler, oluflum flekline göre gerçek ya da varsay›msal, sonlu
ya da sonsuz ve sürekli ya da süreksiz olufluna göre s›n›fland›r›labilmektedir.
Gerçek birimlerden oluflan kütleye gerçek kütle, gelecekte oluflturulabilecek
birimlerden oluflan kütleye varsay›msal kütle denir. Örne¤in, bir toplu konut projesinde inflaat› tamamlanm›fl konutlar gerçek kütleyi olufltururken, gelecek y›llarda
SIRA S‹ZDE
tamamlanacak konutlar varsay›msal kütleyi oluflturur.
Bir kütledeki birimler tam olarak say›labiliyorsa bu tür kütlelere sonlu kütle,
kütleyi oluflturan birimler say›labiliyor olmakla birlikte tamam›n› sayabilmek mümD Ü fi Ü N E L ‹ M
kün de¤il ise bu tür kütlelere sonsuz kütle denilir. Örne¤in, Çanakkale Bo¤az›ndan bir ayda geçen gemileri sayabilmek mümkün iken, bal›klar› sonlu say›da sayS O R U
mak mümkün de¤ildir.
Baz› kütleler sonlu olmakla birlikte, tam say›m yap›ld›¤›nda zarar görme
D ‹ K K Aveya
T yok olmas› sözkonusu olur. Bu gibi kütleleri de sonsuz kütle olarak kabul etmek gerekir. Örne¤in,
bir binan›n beton sa¤laml›¤›n› test etmek için tüm kolonlar› örnekledi¤imizde,
binan›n
SIRA S‹ZDE
göçmesi sözkonusudur. Bu durumda, bina kolonlar› betonunu sonsuz kütle kabul etmek
gerekir.
AMAÇLARIMIZ
N N
Do¤al birimlerden oluflan, parçaland›klar› ya da birlefltirildiklerinde niteliklerini kaybeden kütlelere süreksiz kütle; do¤al olmayan birimlerden oluflan, parçalanK ‹ Tise
A sürekli
P
d›klar› ve birlefltirildiklerinde niteliklerini kaybetmeyen kütlelere
kütle
denir. Örne¤in, cam bardak ve porselen tabak süreksiz kütleyi oluflturur. Bununla
SIRA S‹ZDE
D Ü fi Ü N E L ‹ M
S O R U
D‹KKAT
SIRA S‹ZDE
AMAÇLARIMIZ
K ‹ T A P
TELEV‹ZYON
TELEV‹ZYON
‹NTERNET
‹NTERNET
4
Co¤rafi Bilgi Sistemleri ‹çin Temel ‹statistik
birlikte, cam bardak yap›m›nda kullan›lan silis kumu veya porselen tabak yap›m›nda kullan›lan kil madeni sürekli kütleyi oluflturur.
SIRA S‹ZDE
1
D Ü fi Ü Nve
E L ‹ MÖrnek Kütle
Ana Kütle
D Ü fi Ü N E L ‹ M
Sonlu veya sonsuz say›da birimden oluflan canl› ya da cans›z toplulu¤un tamam›na ana kütleS denir.
O R U Ana kütlenin ne oldu¤u hakk›nda karar verirken, ana kütleyi
oluflturan birimlerin ayn› nedenlerin etkisi alt›nda kalmas›na, ayn› özelliklere sahip
olmas›na veya baz› ortak özelliklerinin olmas›na dikkat etmemiz gerekmektedir.
D‹KKAT
Ana kütle birim say›s›n›n çok büyük olmad›¤›, mekansal olarak çok genifl bir
alana yay›lmad›¤›, araflt›rma için ayr›lan bütçenin ve sürenin k›s›tl› olmad›¤› ve
SIRA S‹ZDEbirimlerin zarar görme olas›l›¤›n›n olmad›¤› durumlarda ana
araflt›rma s›ras›nda
kütle birimlerinin tamam› hakk›nda bilgi elde edilme yoluna gidilir. Böyle bir çal›flmaya tam say›m denilmektedir (Orhunbilge, 2000). Örne¤in, bir s›n›ftaki ö¤renAMAÇLARIMIZ
cilerin belirli bir dersteki not ortalamas›n› belirlemek için tüm ö¤rencilerin notlar›
ele al›n›r. Ancak, bir binan›n beton kalitesini belirlemek için binaya zarar vermeden tüm kolonlar›n›n
K ‹ T A P beton sa¤laml›¤›n› test etmek mümkün de¤ildir.
S O R U
D‹KKAT
SIRA S‹ZDE
AMAÇLARIMIZ
Bir bölgede SIRA
bulunan
S‹ZDEa¤aç türleri üzerine araflt›rma yap›lmaktad›r. A¤aç türleri kütlesi,
sonlu kütle mi yoksa sonsuz kütle midir?
N N
K ‹ T A P
SIRA S‹ZDE
Türkiye’de otoyol
ar›zalar›n›n trafik kazalar›na etkilerinin araflt›r›ld›¤› bir çal›flmada, tam
SIRA S‹ZDE
say›m yapmak
mümkün
müdür? Nedenlerini aç›klay›n›z.
TELEV‹ZYON
D Ü fi Ü N E L ‹ M
D Ü fi Ü N Esonsuz
L‹M
Ana kütlenin
veya sonlu fakat çok say›da birimden olufltu¤u, tam say›m
için bütçenin yetersiz ve fazla zaman›n olmad›¤› veya birimlerin tamam›n›n say›m›
‹ NST kütlenin
s›ras›nda ana
zarar görme olas›l›¤› oldu¤u durumlarda, ana kütleyi temsil
OE RRNUE T
edecek say›da birim seçilerek araflt›rmalar sürdürülür. Ana kütleyi temsil edecek
say›da birimden oluflan kütleye örnek kütle denilir. Örne¤in, bir akarsuyun kirliliD‹KKAT
¤ini belirlemek için belirli zaman aral›klar›nda al›nan su örnekleriyle, su kirlili¤i
hakk›nda fikir edinilebilir.
SIRAbirimleri
S‹ZDE say›s›n›n tamam›na ana kütle hacmi veya boyutu denilmekAna kütle
te olup, “N” ile simgelenir. N birimlik ana kütleden elde edilen örnek kütlelerin birim say›s›na ise örnek hacmi veya örnek boyutu denilir ve “n” simgesi ile gösteriAMAÇLARIMIZ
lir. Örnek kütle, ana kütleden elde edilen bir alt kütle oldu¤una göre, n<N olur
(Serper, 2000).
‹statistiksel
çal›flmalar›nda, ana kütleden elde edilen örnek kütle ile
K ‹ Taraflt›rma
A P
ana kütle parametrelerini tahmin etmek mümkündür. Ancak, gerçe¤e yak›n ve tam
say›m de¤erlerine yak›n sonuçlar elde edilebilmesi için örnek kütle birim say›s›n›n
mümkün oldu¤unca
büyük (çok say›da) olmas› gerekmektedir. Örnek boyutu (biTELEV‹ZYON
rim say›s›) artt›kça, örnek kütle parametreleriyle ana kütle parametrelerinin tahminindeki hata büyüklü¤ü de o derecede azal›r.
TELEV‹ZYON2
‹ NSTOE RRNUE T
D‹KKAT
SIRA S‹ZDE
AMAÇLARIMIZ
N N
Örnekleme
K ‹ T Aboyutunu,
P
örneklemeden beklenen hata
boyutuna ba¤l› olarak
belirleyebiliriz. Bu kitab›n 4.
ünitesinde, güven aral›¤›
Ttahminleri
E L E V ‹ Z ele
Y O al›n›rken
N
örnekleme boyutu hakk›nda
da bilgi sahibi olaca¤›z.
‹NTERNET
‹ N T E R NYöntemleri
ET
Örnekleme
Ana kütle birimlerinin belirli bir k›sm›n›n gözlemlenmesi anlam›na gelen örneklemenin do¤ru yap›lmas›, ana kütlenin do¤ru tan›mlanmas›na ve amaca uygun olarak seçilen örnekleme yöntemine ba¤l› olarak de¤iflir. Ana kütleyi kapsayan birimlerin s›n›rland›r›lmas› ifllemi çerçevenin belirlenmesi ile gerçeklefltirilir. Örne¤in,
fosil yak›tlar›n çevre kirlili¤i üzerindeki etkilerini araflt›ran bir araflt›rma yap›lacak-
5
1. Ünite - Temel ‹statistik Kavramlar
sa, öncelikle sobalarda yak›lanlar›n m› yoksa termik santralin mi etkilerinin araflt›r›laca¤›na karar vermek gerekir. Ancak, her zaman çerçevenin belirlenmesi kolay
olmaz veya çerçevenin tan›mlanmas› mümkün olmayabilir (Cula ve Muluk, 2006).
Örnekleme yöntemleri, ana kütle birimlerinin yap›s›na ve örnekleme amac›na
göre belirlenebilmektedir. Ana kütledeki birimlerin her birinin örnek kitleye girme
olas›l›¤›na göre örnekleme yöntemlerini afla¤›daki gibi s›n›flamak mümkündür.
Rassal Olmayan Örnekleme
Ana kütleden örnek seçiminin rassal olarak yap›lmad›¤›, araflt›rmac›n›n kendi takdiri veya iradesi ile seçti¤i birimlerden oluflan örnekleme rassal olmayan örneklemedir. Ana kütleden yap›lan bu tür örneklemelerde, araflt›rmac›n›n ana kütle hakk›ndaki bilgisi, uzmanl›¤› ve yans›zl›¤› önemlidir. Araflt›rmac›n›n bilgisinin yetersiz
veya yanl› olmas› durumunda, ana kütleden seçilecek örneklerin afl›r› küçük veya
büyük olmas› ve örnek kütle ile yap›lacak de¤erlendirmelerin büyük hatalar içermesi söz konusu olabilir. Bu sak›ncalar› nedeniyle, rassal olmayan örnekleme istatistiksel çal›flmalarda tercih edilmemektedir.
Bununla birlikte, baz› zorunlu durumlarda rassal olmayan örneklemeye baflvurmak gerekli olabilmektedir. Ana kütleyi oluflturan birimler çok genifl bir alana yay›lm›fl ise, tüm co¤rafik alanlardan örnekleme yapmak zaman ve bütçe aç›s›ndan
mümkün olmayabilir. Bu durumda, ana kütleyi tüm özellikleriyle temsil edebilecek dar bir alandan örnekleme yap›lmas› gerekebilir. Bu tür örneklemelere rassal
olmayan dilim örneklemesi denilmektedir (Cula ve Muluk, 2006). Örne¤in, Türkiye genelinde yap›lacak bir araflt›rmada ‹stanbul’un örnek flehir olarak seçilmesi
yeterli olabilir.
Ana kütlenin s›n›fland›r›lmas› halinde farkl› k›s›mlardan veya bölümlerden olufltu¤u biliniyorsa, örneklemenin tüm k›s›mlar› temsil etmesi amac›yla her bir k›sma
belirli oranlarda kota konularak örnek al›nmas› tercih edilebilir. Bu tür örneklemelere kota örneklemesi denilmektedir (Orhunbilge, 2000). Örne¤in, belirli bir konuda bir üniversitede yap›lacak anket çal›flmas› için fakültelerin toplam ö¤renci say›lar› ile orant›l› ö¤renci say›lar› belirlenerek, anket uygulamas›n›n tüm fakültelerin ö¤rencilerini temsil etmesi sa¤lanabilir.
‹malat sanayinde çal›flan iflçilerin ifl kazas› geçirme olas›l›klar›n›n SIRA
araflt›r›ld›¤›
S‹ZDE bir çal›flmada, imalat sanayi iflletmelerinin makine, otomotiv, kimya, seramik, çimento gibi ayr› ayr› de¤erlendirildi¤i durumda, her ifl kolunda faaliyet gösteren iflletmelerin %10’undan örD Ü fi Ü N E L ‹ M
nekleme yap›l›rsa, bu örnekleme ne tür örnekleme olur?
Rassal Örnekleme
S O R U
AMAÇLARIMIZ
D Ü fi Ü N E L ‹ M
S O R U
Ana kütle birimlerinin her birine belirli ve s›f›rdan büyük bir olas›l›kla örnek kütleye seçilme flans›n›n verildi¤i örneklemelere rassal örnekleme denilir. Rassal örD‹KKAT
neklemenin en önemli özelli¤i, ana kütledeki her birimin örne¤e dahil olma olas›l›¤›n›n ayn› olmas›d›r. Ana kütlenin yap›s›na göre rassal örneklemeler farkl› flekilSIRA S‹ZDE
lerde yap›labilmektedir.
Basit Rassal Örnekleme
3
SIRA S‹ZDE
N N
N birimlik ana kütleden, her birine eflit seçilme flans› verilmesi ile n birimlik örnek
seçilmesi ifllemine basit rassal örnekleme denilir. Bu tür örnekleme genellikle sonlu bir ana kütleden yap›lmakta olup, N birimlik ana kütledekiK ilk
seçilme
‹ T birimin
A P
D‹KKAT
SIRA S‹ZDE
AMAÇLARIMIZ
K ‹ T A P
TELEV‹ZYON
TELEV‹ZYON
‹NTERNET
‹NTERNET
6
Co¤rafi Bilgi Sistemleri ‹çin Temel ‹statistik
Bir çok istatistik kitab›n›n
ekinde rassal (tesadüfi veya
rastgele) say›lar çizelgesi
bulunabilir. Bu çizelgeler,
dört veya befl basamakl›
rassal ifllemlerle elde
edilmifl say›lardan
oluflabilece¤i gibi, s›f›r ile
bir aras› say›lardan da
oluflabilmektedir. Örne¤in,
Neyran Orhunbilge’nin
Tan›msal ‹statistik Olas›l›k
ve Olas›l›k Da¤›mlar› (Avc›ol
Bas›m Yay›n, ‹stanbul,
2000) isimli kitab›n›n ekinde
verilen rassal say›lar
çizelgesi befl basamakl›
say›lardan oluflmaktad›r. Bu
çizelgeyi 100 adet rassal
örnekleme için kullanmak
istersek, verilen befl
basamakl› say›lar›n ilk iki
basama¤›n›, 1000 adet
rassal örnekleme için ise ilk
üç basama¤›n› dikkate
alarak elde edece¤imiz
rassal say›lar› kullanabiliriz.
Bilgisayar programlar›nda
var olan RND fonksiyonu ise
0 ile 1 aras› say›lardan
olufltu¤undan, bu say›lar›
ise rassal örnek say›s› ile
çarparak kullan›r›z.
flans› 1/N’dir. Ancak, i=1’den N’e kadar daha sonraki seçimlerde, daha önceki örne¤in seçilme flans› olmad›¤›ndan, örneklerin seçilme flans› 1/(N-i) olur.
Basit rassal örneklemede, sonlu say›daki N birimlik ana kütleden rassal örnek
seçimi, kura yöntemi, rassal say›lar çizelgesi veya bilgisayar programlar›n›n rassal say› üreteci (RND fonksiyonu) kullan›labilir. Ana kütle birim say›s›n›n çok küçük oldu¤u durumlarda genellikle kura yöntemine baflvurulur (Orhunbilge,
2000). Örne¤in, 100 kifli çal›flan bir iflletmede çal›flan memnuniyetini belirlemek
için yap›lacak anket çal›flmas› için 30 kiflinin seçilmesi gerekmektedir. Bu seçim
iflleminde öncelikle, 100 kifli 1’den 100’e kadar numaraland›r›l›r. Sonra rassal say›lar çizelgesinden 30 adet say› belirlenir ve bu say›lara karfl›l›k gelen çal›flanlara anket uygulan›r.
Basit rassal örnekleme yöntemi kullanman›n yararl› yönleri;
• Ana kütledeki her birimin eflit seçilme flans› vard›r
• Ana kütle çok büyük ve karmafl›k de¤ilse seçme ifllemi kolayd›r
• Örnek kütle ile yap›lan istatistiksel ifllemlerde a¤›rl›kland›rma yapmaya gerek olmaz.
Basit rassal örnekleme yöntemi kullanman›n sak›ncalar› ise;
• Ana kütlenin çok büyük oldu¤u durumlarda, ana kütleyi s›ralamak ve ana
kütleden seçmek güçtür.
• Araflt›r›lan özellik, ana kütle birimlerinde baz› de¤ifliklikler gösterebilir.
• Örnekleme seçilecek birimler mekansal olarak çok genifl bir alana da¤›lm›fl
olabilir.
Sistematik Rassal Örnekleme
Sistematik rassal örnekleme yöntemi, ana kütle birimlerinin seri olarak numaraland›r›labildi¤i ya da kay›t alt›na al›nabildi¤i durumlar için uygulan›r. Bu yöntem, ana
kütle birim say›s›n›n (N) sonlu ve birimlerin belirli bir s›rada dizildi¤i, örnek kütle
say›s›n›n (n) da belirli oldu¤u durumlarda uygulanabilir.
Yöntemin uygulanmas›nda, öncelikle anakütle 1 den N’e kadar numaralan›r.
Daha sonra büyütme faktörü k=N/n ifllemi ile hesaplan›r. Bu ifllemler tamamland›ktan sonra s›ralanm›fl ana kütlenin ilk k tane birimi aras›ndan bir tanesi rassal
olarak seçilir. Rassal olarak bafllang›ç noktas›n›n seçilmesinden sonra, ana kütlenin
her k’›nc› birimi örnek kütleye seçilir. Ana kütleden, sistematik olarak “k” eklenerek seçim ifllemi, örnek kütle birey say›s›na (n) ulafl›ncaya kadar devam edilir.
ÖRNEK 1
SIRA S‹ZDE
D Ü fi Ü N E L ‹ M
4
Bir belediye, 1000 hane bulunan bir mahallede 50 haneyi örnek seçerek baz› uygulamalar› ile ilgili görüfllerini almak istemektedir. Bu durumda, k = 1000 / 50 =
20 olarak hesaplan›r ve her 20 hanede bir örnekleme yap›lmas› gerekecektir. Bafllang›ç say›s› rassal say›lar çizelgesinde 1 ile 20 aras›nda bir say› seçilerek bulunur.
Örne¤in seçilen say› 12 ise önce 12’inci hanenin görüflleri örnek olarak al›n›r, sonra her 20 hanede bir hanenin görüflü al›n›r. Örneklenen n adet hanenin numaralar› 12, 32, 52, 72, ......992 olacakt›r.
Bir sanayi bölgesinde
SIRA S‹ZDEbulunan 100 tekstil fabrikas›ndan 20 tanesi seçilerek verimlilik analizleri yap›lmak istenmektedir. Rassal say›lar çizelgesinden seçilen say›, büyütme faktörü say›s›na eflit oldu¤una göre, hangi nolu fabrikalar› sistematik olarak rassal örnekleyebiliriz?
D Ü fi Ü N E L ‹ M
S O R U
S O R U
D‹KKAT
D‹KKAT
SIRA S‹ZDE
SIRA S‹ZDE
1. Ünite - Temel ‹statistik Kavramlar
7
Mekansal (konumsal) ya da zamansal ana kütle birimlerinden eflit aral›klarla örnekleme yapmada da sistematik örnekleme yöntemi kullan›labilmektedir. Özellikle çevresel de¤iflimlerin ve maden yataklar›nda rezerv-tenör belirleme çal›flmalar›n›n yap›ld›¤› yerlerde sistematik örnekleme oldukça kullan›fll› bir yöntemdir. Ancak, örnekleme yap›lan alan büyüdükçe sistematik örnekleme zorlafl›r ve baz› yönsel sürekli de¤iflimlerin oldu¤u alanlarda, örnekleme rassall›ktan uzaklaflabilir. Örne¤in, ekolojik de¤iflimin araflt›r›ld›¤› bir alanda, belirlenen hatlar boyunca 10 m
aral›klarla sistematik rassal bitki örnekleri al›nabilir. Ancak, bir maden yata¤›nda
tenör de¤iflimini belirlemek amac›yla 100 m aral›klarla örnekler al›nd›¤›nda, örnekleme hatt›na ba¤l› olarak tenör de¤iflimlerinin yönsel farkl›l›klar gösterdi¤i de gözlenebilir.
Küme Örnekleme
Ana kütlenin küme ad› verilen gruplara ayr›ld›¤› ve kümelerden örneklerin al›nd›¤› yönteme küme örnekleme denilmektedir. Bu yöntemde N birimlik ana kütle M
adet kümeye ayr›lmakta ve her kümeden rassal olarak m birimlik rassal örnek kütle seçilmektedir.
Ana kütleyi oluflturan birimlerin listelenemedi¤i durumlarda veya co¤rafi olarak
genifl bir alana yay›lm›fl birimler hakk›nda araflt›rma yap›ld›¤› durumlarda maliyetleri azaltmak amac›yla küme örneklemesinden yararlan›l›r. Küme örneklemeden
yararlanarak ana kütle hakk›nda tahminde bulunurken, küme birimlerinin birbirinin benzeri oldu¤u durumlarda hata ihtimali de artabilmektedir.
Maden iflletmelerinde ifl kazalar›n›n araflt›r›ld›¤› bir durumda, maden iflletmeleri
kömür, metal, endüstriyel hammaddeler ve tafl-kum-m›c›r iflletmeleri olarak kümelere ayr›labilir. Bu durumda, üretim yöntemleri farkl› (örne¤in kömür madencili¤inde yer alt› ocak iflletmecili¤i yayg›nken tafl-kum-m›c›r iflletmelerinin tamam›nda yerüstü ocak iflletmecili¤i uygulan›r) ve çal›flan iflçi say›lar› farkl› olan kümelerden eflit say›larda m birimlik örnek al›n›p ana kütle hakk›nda tahmin yap›lmas›
büyük hatalara neden olacakt›r.
Küme örnekleme kademeli olarak ta yap›labilir. E¤er her bir kümeden m birimlik örnekler al›n›rsa, bu örnekleme türüne tek kademeli basit küme örneklemesi
denilir. Ancak, her kümedeki m adet birimden ayr›ca rassal örnekleme yap›l›rsa,
bu örneklemeye ise ikinci kademe küme örneklemesi denilir.
Tabakal› Örnekleme
Ana kütledeki birimlerin özelliklerinin önemli farkl›l›klar gösterdi¤i durumlarda,
bu birimleri “tabaka” ad› verilen homojen alt gruplara ay›rmak gerekmektedir. Ana
kütlenin tabakalara ayr›lmas› sonras›nda her bir tabakadan rassal örnekleme yap›l›r ve elde edilen sonuçlar birlefltirilirse tabakal› örnekleme yap›lm›fl olur (Serper,
2000). Tabakal› örnekleme, sonlu say›da birime sahip ana kütlelerde alt tabakalar
veya alt birim gruplar›n›n var oldu¤u durumlarda kullan›l›r.
Tabakal› örneklemede, tabakalar›n do¤ru oluflturulmas› gereklidir. Tabakal› örneklemeden iyi sonuç alabilmek için, tabakalar›n kendi içinde homojen olmas› ve
tabakalar aras›nda gerçek bir farkl›l›k bulunmas› gerekir.
Tabakal› örneklemelerde her tabakan›n birim say›s›n›n her zaman eflit olmas›n›
sa¤lamak olanaks›zd›r. Bu durumda, iki farkl› yöntemle örnek seçimi yap›l›r. Birincisinde, tabakalardaki birim say›s› dikkate al›nmadan her tabakadan eflit say›da ör-
ÖRNEK 2
8
Co¤rafi Bilgi Sistemleri ‹çin Temel ‹statistik
nekleme yap›l›r. Orant›s›z seçim denilen bu yöntem sonucunda istatistiksel de¤erlendirmeler yap›l›rken, tabakalar›n birim say›lar› ile a¤›rl›kl› hesaplamalar yapmak gerekir. ‹kincisinde ise, tabakalardaki birim say›lar›yla orant›l› olarak örnekleme yap›l›r. Orant›l› seçim denilen bu yöntem sonucunda istatistiksel de¤erlendirmeler yap›l›rken aritmetik ortalama a¤›rl›ks›z hesaplan›r.
Tabakal› örnekleme kullan›m›n›n yararlar›;
• Tabakalanma iyi yap›l›r ise daha do¤ru bilgi elde etme olana¤› vard›r.
• Her tabakadan al›nan örneklemin kendi tabakas›n› temsil yetene¤i oldu¤undan her tabaka için ayr› sonuç elde etme olana¤› da sa¤lar.
Tabakal› örnekleme kullanman›n sak›ncalar› ise;
• Örnekleme hatas›n› hesaplamak zor olabilir.
• Tabakalar›n birim say›lar› düflük olursa, tabakalara ba¤l› araflt›rma sonucu
elde edilecek bilginin do¤rulu¤u azal›r.
ÖRNEK 3
Bir yerleflim biriminin y›ll›k ortalama hava s›cakl›¤› de¤iflimlerinin ölçülmek istendi¤i bir durumda, s›cakl›¤›n aylara ba¤l› de¤iflimi dikkate al›nmadan örnekleme yap›l›rsa, elde edilecek sonuçlar gerçe¤i yans›tmayabilir. Bunun için
önce aylara göre tabakalama yap›lmal› ve her tabakadan basit rassal örnekleme yöntemiyle belirli say›da örnek ölçümler yap›l›rsa, sonuç daha anlaml› olacakt›r.
VER‹LER‹N TOPLANMASI VE SER‹LER HAL‹NDE
DÜZENLENMES‹
‹statiksel veriler ya haz›r veri kaynaklar›ndan elde edilir ya da araflt›rmac›lar taraf›ndan anket, gözlem veya deney çal›flmalar› ile toplan›rlar. Elde edilen bu veriler
genellikle ham veri fleklindedir. Ham verilerin istatistiksel analize uygun hale getirilmesi için düzenlenmesi gerekir. Veriler, örneklenen birimlerin zaman ve mekan
özelliklerine, nitel ve nicel özellikleriyle da¤›lma flekillerine göre seriler fleklinde
düzenlenebilirler.
Zaman ve Mekan Serileri
Zaman serileri, kullan›c›n›n
veya araflt›rmac›n›n
amac›na göre birden farkl›
zaman birimi ile de
gösterilebilmektedir.
ÖRNEK 4
Örneklenen veya gözlemlenen verilerin çeflitli özelliklerinin saat, gün, ay ve y›l
gibi bir zaman birimine göre s›ralamas› veya da¤›l›m› oluflturulursa, bu seriye zaman serisi denilir. Özellikle ülkelerin sosyal ve ekonomik geliflim göstergeleri,
iflletmelerde verimlilik ve kalite verileri, hava s›cakl›¤› ve ya¤›fllar, trafik yo¤unlu¤u ile baz› deneysel veriler zamana ba¤l› olarak iki sütunlu seriler fleklinde
gösterilirler.
Türkiye ‹statistik Kurumu enflasyon oranlar›n›n de¤iflimini ayl›k ve y›ll›k zaman
birimlerine göre ayr› ayr› zaman serileri fleklinde yay›nlamaktad›r. Tüketici fiyat
endeksi (TÜFE) ile hesaplanan enflasyon oranlar› çizelgesinden de görüldü¤ü gibi, enflasyon oranlar› 2010 y›l› Ocak ay›nda %1,85 ve Haziran ay›nda -%0,56
olarak yay›nlanm›fl olmakla birlikte, 2010 y›l› Ocak-Aral›k aylar› aras› y›ll›k enflasyon oran› %6,4 olarak gerçekleflmifltir.
9
1. Ünite - Temel ‹statistik Kavramlar
Tüketici Fiyat Endeksi (TÜFE) ile Hesaplanan Enflasyon Oranlar›
Y›ll›k TÜFE Enflasyon Oranlar›
Y›llar
Y›ll›k TÜFE Enflasyon Oranlar›
Oran (%)
Aylar
Oran (%)
2002
29,7
Ocak
1,85
2003
18,4
fiubat
1,45
2004
9,3
Mart
0,58
2005
7,7
Nisan
0,60
2006
9,7
May›s
- 0,36
2007
8,4
Haziran
- 0,56
2008
10,1
Temmuz
- 0,48
2009
6,5
A¤ustos
0,40
2010
6,4
Eylül
1,23
Kaynak: TÜ‹K (http://www.hazine.org.tr/ekonomi/enflasyon.php)
Örneklenen veya gözlemlenen verilerin çeflitli özelliklerinin köy, flehir, bölge,
ülke ve k›ta gibi bir mekan (yerleflim) birimine göre s›ralamas› veya da¤›l›m› oluflturulursa, bu seriye mekan serisi veya yerleflim serisi denilir. Genellikle ülkelerin
sosyal ve ekonomik göstergelerinin de¤iflimi, hava s›cakl›¤› ve ya¤›fllar›n de¤iflimi,
çevresel ve ekolojik de¤iflimler, trafik yo¤unlu¤u ile hammadde kaynaklar›n›n da¤›l›mlar› iki sütunlu mekansal seriler fleklinde gösterilirler.
Türkiye ‹statistik Kurumu (TÜ‹K) hava kalitesi veri taban›nda kent merkezlerinin
hava kirlili¤i, havadaki kükürtdioksit miktarlar› (µg/m3) ölçüm sonuçlar›n›n ayl›k ortalamalar› al›narak yay›nlanmaktad›r. Belirli bir kent merkezi için ayl›k veriler dikkate al›nd›¤›nda bu seri zaman serisidir. Ancak, afla¤›daki çizelgede verildi¤i flekliyle sadece 2010 y›l› ocak ay› rakamlar›n›n farkl› kent merkezleri için yay›nlanmas› halinde ise bu seri mekan serisi olmaktad›r.
2010 Y›l› Ocak Ay› Hava Kirlili¤i (Kükürtdioksit) Ortalamalar›
En Fazla Hava Kirlili¤i
Yerleflim Merkezi
En Az Hava Kirlili¤i
Kükürtdioksit
(µg/m3)
Yerleflim Merkezi
Kükürtdioksit
(µg/m3)
fi›rnak
336
Eskiflehir
3
Tekirda¤
229
Adana
4
Bitlis
185
Kahramanmarafl
6
K›r›kkale
185
Osmaniye
7
Hakkari
179
‹stanbul
9
Kaynak: TÜ‹K Hava Kalitesi Veri Taban›
ÖRNEK 5
10
Co¤rafi Bilgi Sistemleri ‹çin Temel ‹statistik
‹ki sütunlu olarak
oluflturulan bu serilerde,
birinci sütunda nitel
özelli¤in s›n›flar›, di¤er
sütunda ise bu s›n›flara
giren birimlerin say›lar›
gösterilmektedir.
Nitel (Kalitatif) Seriler
ÖRNEK 6
Say›sal olarak ifade edilemeyen, özellik bak›m›ndan do¤al olarak s›n›fland›r›lm›fl
ve kesin hatlarla birbirinden ayr›lan serilere nitel seriler denilir. Nitel serilerde s›n›flar do¤al olarak oluflmufl oldu¤undan, araflt›rmac› sadece her s›n›fa düflen gözlem say›lar›n› belirler. Nitel seriler iki sütunlu serilerdir.
Nitel seriler düzenlenirken de¤iflkenin kaç s›n›ftan olufltu¤unun bilinmesi gerekir. Ancak, nitel de¤iflkenin hangi s›n›fta yer ald›¤› belirlenemiyorsa, s›n›f› belirlenemeyen veriler için “bilinmeyen” sat›r› oluflturulabilir (Orhunbilge, 2000). Verilerin bu flekilde seri haline getirilmesi ile nitel özellikler için frekans çizelgeleri oluflturulmufl olmaktad›r. ‹nsanlar›n cinsiyet, sosyal, kültürel ve ekonomik faaliyet durumlar›, bitki ve a¤aç türleri, tar›m ve hayvanc›l›k hakk›nda oluflturulacak seriler
nitel seri türündedir.
TÜ‹K Hayvanc›l›k ‹statistikleri veri taban›ndan 2009 y›l› için elde edilen büyükbafl
hayvan say›lar› iki sütunlu nitel seri olarak afla¤›daki gibi düzenlenebilir. Birinci
sütunda veriler özellikleri bak›m›ndan do¤al olarak s›n›flan›rken, ikinci sütunda
say›sal olarak frekanslar verilmifltir.
2009 Y›l› Büyükbafl Hayvan Say›lar›
Ad›
Say›s›
S›¤›r-Yerli
2.594.334
S›¤›-Kültür
3.723.583
S›¤›r-Melez
4.406.041
Manda
87.207
Deve
1.041
Kaynak: TÜ‹K Hayvanc›l›k ‹statistikler Veri Taban›
SIRA S‹ZDE
D Ü fi Ü N E L ‹ M
S O R U
D‹KKAT
SIRA S‹ZDE
AMAÇLARIMIZ
K ‹ T A P
TELEV‹ZYON
‹NTERNET
5
Köyden kente
göçlerin
SIRA
S‹ZDE ve flehirleflmenin araflt›r›ld›¤› bir çal›flmada, nüfus verileri hangi
özelliklerine göre do¤al s›n›flara ayr›labilir?
D Ü fi Ü N E L ‹ M
Nicel Seriler
Say›sal olarak adet, uzunluk, a¤›rl›k, alan ve hacim gibi çeflitli ölçü birimleriyle ifade edilebilenS Oözelliklere
göre s›ralanm›fl, s›n›fland›r›lm›fl veya grupland›r›lm›fl seriR U
lere nicel seriler denilir. Nicel verilerde s›n›fland›rma veya grupland›rma do¤al olarak oluflmad›¤›ndan, araflt›rmac› her s›n›fa veya gruba düflen gözlem say›s›n› (freD‹KKAT
kans›) kendisi belirler.
Belirli bir ana kütleden rassal olarak yap›lan örneklemeler sonucunda elde
S‹ZDEbasit, s›n›fland›r›lm›fl veya grupland›r›lm›fl seriler olarak olufledilen nicelSIRA
veriler
turulabilirler.
N N
AMAÇLARIMIZ
Basit Seri
Örneklemelerle elde edilen ham verilerin, elde edildikleri ya da gözlendikleri s›ra
ile veya küçükten
ya da büyükten küçü¤e s›ralanmas› ile oluflturulan seriK ‹ T A büyü¤e
P
lerdir. Genellikle örneklenen birim say›s›n›n çok az oldu¤u durumlarda kullan›lan
ve tek sütundan oluflan serilerdir. Basit serilerde, örnekleme boyutu n ile ve örneklenen her Ti’inci
birim Xi ile gösterilir.
ELEV‹ZYON
‹NTERNET
11
1. Ünite - Temel ‹statistik Kavramlar
Bir derse kay›tl› 30 ö¤rencinin derslere devams›zl›k saatlerinin say›lar› belirlenmifl
olup, devams›zl›k saatleri afla¤›daki gibi verilmifltir.
2
6
2
8
14
0
1
12
6
8
8
10
8
5
14
5
1
6
2
12
10
8
6
10
5
5
8
10
12
14
ÖRNEK 7
Ö¤renci numaralar›na göre elde edildi¤i s›ra ile sunulan bu verileri pratik olarak kullanabilmek zordur. Örne¤in, derse 12 saatten fazla devams›zl›¤› olan ö¤rencilerin devams›zl›ktan dolay› dersten baflar›s›z olacaklar›n›n bilindi¤i bir durumda,
kaç ö¤rencinin baflar›s›z oldu¤unu belirlemek istedi¤imizde, seriyi elde edildi¤i
flekliyle kullanamay›z. Seriyi, devams›zl›k say›lar›na göre küçükten büyü¤e s›ralad›¤›m›zda ise, devams›zl›ktan kalacak ö¤renci say›s›n› kolay bir flekilde bulabiliriz.
0
1
1
2
2
2
5
5
5
5
6
6
6
6
8
8
8
8
8
8
10
10
10
10
12
12
12
14
14
14
S›n›fland›r›lm›fl Seri
Ana kütleden örneklenmifl verilerin küçükten büyü¤e ya da büyükten küçü¤e
do¤ru s›ralan›p, tekrarlanan verilerin tekrarlanma say›lar›n›n (frekanslar›n›n) bulunmas› ile elde edilen serilere s›n›fland›r›lm›fl seri veya frekans serisi denilir. Örnek kütle boyutu artt›kça basit seriler çok fazla yer kaplad›¤›ndan ve çal›flma zorluklar› ortaya ç›kt›¤›ndan, çal›flma kolayl›¤› aç›s›ndan s›n›fland›r›lm›fl serilerin kullan›m› daha uygun olmaktad›r.
S›n›fland›r›lm›fl seri iki sütundan oluflur. Birinci sütunda örneklenen de¤iflkenin
ald›¤› farkl› de¤erler (X i ) yer al›rken, ikinci sütunda de¤iflkenin ald›¤› de¤erlerin
frekanslar› (f i ) gösterilir.
Basit seriyi olufltururken ele ald›¤›m›z örnek verileri, tekrarlanma say›lar›n› da
dikkate alarak s›n›fland›rd›¤›m›z da, afla¤›daki frekans serisini elde ederiz. S›n›fland›r›lm›fl seri ile istedi¤imiz de¤erin alt›ndaki veya üstündeki verilerin say›lar›n›, basit serilere göre daha kolay bulabiliriz. Örneklenen veri say›m›z n=30 iken,
yapm›fl oldu¤umuz s›n›fland›rma sonucunda m=9 adet s›n›f elde ederiz.
Devams›zl›k (Saat) Xi
Frekanslar fi
0
1
1
2
2
3
5
4
6
4
8
6
10
4
12
3
14
3
ÖRNEK 8
S›n›fland›r›lm›fl serilerde örnek boyutu,
frekanslar toplam›na eflit (n = ∑fi ) olmak
zorundad›r.
12
Co¤rafi Bilgi Sistemleri ‹çin Temel ‹statistik
Grupland›r›lm›fl Seri
Genel olarak grup say›s›n›n
4’den az olmamas› 15’den
de fazla olmamas› tercih
edilmektedir. Grup say›s›
4’den az oldu¤unda baz›
da¤›l›m testlerini yapmak
mümkün olamamaktad›r.
Örne¤in, da¤›l›m tipinin
normal da¤›l›ma uygun olup
olmad›¤›n› test etmede
kullan›lan Ki-kare testinin
yap›labilmesi için grup
say›s›n›n en az 4 olmas›
gerekir.
SIRA S‹ZDE
D Ü fi Ü N E L ‹ M
K = 1 + 3,3.
Log(n)
S O R U
S O R U
Grup say›s› daima
D ‹ K K Atam
T say› olarak kullan›l›r. Grup say›s› hesaplama sonucu ondal›kl› bir
say› olursa, ondal›k say›n›n alt veya üstünde bulunan tam say›lardan birisi grup say›s› olarak kullan›l›r.
SIRA S‹ZDE
D‹KKAT
SIRA S‹ZDE
SIRA S‹ZDE
AMAÇLARIMIZ
D Ü fi Ü N E L ‹ M
K ‹ T A P
N N
Grup say›s›n›n belirlenmesinden sonra, verilerin en büyük (Xenb) ve en küçük
SIRA S‹ZDE
(Xenk) de¤erleri
aras›ndaki farkla hesaplanan de¤iflim geniflli¤i (DG) dikkate al›naAMAÇLARIMIZ
rak grup aral›¤›n› (GA) hesaplar›z.
GA = DG
S O/RKU
TELEV‹ZYON
D‹KKAT
TELEV‹ZYON
Hesaplanan grup
verilerin tam say›lardan olufltu¤u durumlarda bir üst tam say›ya
D ‹ K K aral›¤›,
AT
veya verilerin 1’den küçük ondal›k de¤erlerden olufltu¤u durumlarda ise ondal›kl› üst de¤ere tamamlan›r.
N N
Baz› örneklemelerde,
örnekleme yönteminin ve
AMAÇLARIMIZ
verilerin özelliklerine uygun
olarak de¤iflik aral›kl›
gruplar›n oluflturulmas› da
gerekebilmektedir. Örne¤in,
K ‹ T A P
parça boyutu elek analizi
verilerinin
grupland›r›lmas›nda, elek
serisi aral›klar›n›n dikkate
Tal›nmas›
E L E V ‹ Zgerekebilmektedir
YON
(Konuk ve Önder, 1999).
‹NTERNET
D Ü fi Ü N E L ‹ M
K ‹ T –A XP
DG = X
enb
enk
S O R U
SIRA S‹ZDE
‹NTERNET
Ana kütleden örneklenen veri say›s›n›n çok fazla olmas› durumunda, verilerin belirli aral›klarla grupland›r›l›p ve her bir gruba düflen frekans de¤erlerinin belirlenmesi ile grupland›r›lm›fl seriler elde edilebilir.
Örneklenen verilerin grupland›r›larak sunulmas› sayesinde serinin yorumlanmas›ndaki karmafla önlenece¤inden, örneklenen kütle kolayca kavranabilir ve ifllemlerde zamandan büyük tasarruf sa¤lan›r. Bununla birlikte, gruplama sonucunda örnekleme ile toplanan bilgilerin bir k›sm› kaybolabilir ve homojen olmayan birimlerin bir araya toplanmas› da söz konusu olabilir.
Grupland›rma iflleminde öncelikle, örneklenen veya gözlemlenen veri say›s›na
ve araflt›rmac›n›n amac›na ba¤l› olarak grup say›s› (K) belirlenir. Grup say›s›n›n
çok fazla olmas›
halinde veriler iyi bir flekilde özetlenmemifl, grup say›s›n›n çok az
SIRA S‹ZDE
olmas› durumunda ise bilgi kay›plar› olabilir.
Grup say›s›n› (K), örneklenen veri say›s›na (n) ba¤l› olarak “Sturges Kural›” ile
D Ü fi Ü N Eyard›m›yla
L‹M
afla¤›daki eflitlik
hesaplayabiliriz (Ohunbilge, 2000; Gürtan, 1982).
‹SIRA
N T E RS‹ZDE
NET
Grup aral›klar›n›n genellikle tüm gruplarda birbirine eflit al›nmas› tercih edilir.
Grupland›r›lm›fl
serilerde grupland›rmalar›n eflit aral›klarla yap›lmas›, seride bir düAMAÇLARIMIZ
zenin sa¤lanmas›, eflit grup aral›klar›na düflen frekanslar aras›nda karfl›laflt›rmalar
yap›labilmesi ve matematiksel ifllemleri kolaylaflt›rmas› aç›s›ndan tercih edilmekle
K ‹ T A P
birlikte, grupland›rmalar›n
eflit aral›kl› yap›lmas› flart de¤ildir.
Grup aral›klar›n›n belirlenmesinden sonra grup s›n›rlar›n› belirleriz. Grup s›n›rlar›n›n belirlenmesi ifllemine öncelikle ilk grubun alt ve üst s›n›rlar›n›n belirlenmesiyle bafllan›r.
alt s›n›r›, gözlemlenen veriler içerisinde yer alan en küT E L E V‹lk
‹ Z Ygrubun
ON
çük (Xenk) de¤erden büyük olmayacak flekilde; ilk grubun üst s›n›r› ise ilk grubun
alt s›n›r›na grup aral›¤›n›n eklenmesiyle belirlenir. Di¤er gruplar›n alt ve üst s›n›rlar›, bir önceki gruplar›n alt ve üst s›n›rlar›na grup aral›¤›n›n eklenmesiyle belirle‹NTERNET
nir. Grupland›r›lm›fl serinin son grubu, mutlaka gözlem de¤erlerinin en büyü¤ünü
(Xenb) içermelidir.
SIRA S‹ZDE
SIRA S‹ZDE
D Ü fi Ü N E L ‹ M
D Ü fi Ü N E L ‹ M
1. Ünite - Temel ‹statistik Kavramlar
S O R U
S O R U
Verilerin grupland›r›lmas› iflleminde önemli olan en küçük de¤erin ilk
D ‹ grupta
K K A T ve en büyük
de¤erin de son gurupta yer almas›d›r.
SIRA S‹ZDE
D‹KKAT
N N
Grup s›n›rlar›n› belirledikten sonra, örneklenen ham verilerin grup aral›klar›na
düflen verilerinin tekrarlanma say›lar›n› (frekanslar›) belirleriz. Frekanslar›n belirlenmesinde, sayma veya tarama yöntemi kullan›labilmektedir.
Herhangi bir i’inci
AMAÇLARIMIZ
grupta yer alan frekans say›s›, fi ile gösterilir. Her bir gruba düflen frekanslar›n toplam›, toplam gözlem say›s›na eflittir (∑fi = n).
K ‹ T afla¤›daki
A P
Örneklenen verilerin grupland›r›lmas›nda uygulanan ifllemler
örnek
temel al›narak gösterilecektir.
E L E V ‹pik
Z Y Oak›m›
N
Bir bölge havzas›nda taflk›n riskini belirleme çal›flmalar› içinTy›ll›k
ve ortalama pik ak›m› miktarlar›n› belirlemek amac›yla, bölge akarsular›na kurulan
istasyonlarda 40 adet ölçüm gerçeklefltirilmifltir. Ölçümler sonucu elde edilen veriler afla¤›daki gibidir.
‹NTERNET
Ölçüm
No
Ak›m
(m3/s)
Ölçüm
No
Ak›m
(m3/s)
Ölçüm
No
Ak›m
(m3/s)
Ölçüm
No
Ak›m
(m3/s)
1
8
11
24
21
26
31
31
2
18
12
44
22
38
32
19
3
16
13
37
23
41
33
37
4
35
14
13
24
39
34
42
5
42
15
56
25
68
35
23
6
27
16
39
26
25
36
27
7
33
17
17
27
48
37
53
8
48
18
52
28
33
38
6
9
36
19
45
29
41
39
9
10
21
20
33
30
38
40
12
Grup say›s› K= 1 + 3,3. Log (n) eflitli¤inden, K= 1 + 3,3. Log (40) = 6,29 olarak
bulunur. Bu durumda, gruplama yapt›¤›m›zda, grup say›s›n›n 6’dan az ve 7’den
fazla olmamas› gerekmektedir.
Örneklenen veriler içerisinde en büyük de¤er Xenb= 68 ve en küçük de¤er
Xenk= 6 oldu¤undan, grup aral›¤› GA = (Xenb – Xenk) / K eflitli¤inden,
GA= ( 68 - 6 ) / 6,29 = 9,86 olarak bulunur. Verilerin tam say› olmas› nedeniyle, GA = 10 alabiliriz.
‹lk grupta en küçük verinin ve son grupta en büyük verinin yer almas›na, grup
say›s›n›n 6’dan az ve 7’den fazla olmamas›na ve grup aral›¤›n›n 10 olmas›na dikkat
ederek grup s›n›rlar›n› farkl› biçimlerde oluflturabiliriz. Afla¤›da, üç farkl› flekilde
oluflturulan grup s›n›rlar› görülmektedir.
13
SIRA S‹ZDE
AMAÇLARIMIZ
K ‹ T A P
Ö TRE NL EEV ‹KZ Y O9N
‹NTERNET
14
Co¤rafi Bilgi Sistemleri ‹çin Temel ‹statistik
Grup S›n›rlar›
Tarama sütunu, ham
verilerin girdi¤i grup
aral›¤›n›n iflaretlenmesi ve
daha sonra say›larak
frekanslar›n belirlenmesi
için kullan›lmaktad›r.
Üst
Alt
Üst
Alt
Üst
6
16
3
13
0
10
16
26
13
23
10
20
26
36
23
33
20
30
36
46
33
43
30
40
46
56
43
53
40
50
56
66
53
63
50
60
66
76
63
73
60
70
Grup s›n›rlar›ndan herhangi birini tercih ederek ve tarama sütunu da oluflturarak, her bir grubun frekans›n› belirleyebiliriz.
Grup S›n›rlar›
D Ü fi Ü N E L ‹ M
S O R U
Tarama Sütunu
Frekanslar fi
Alt
Üst (den az)
0
10
///
3
10
20
///// /
6
20
30
///// //
7
30SIRA S‹ZDE
40
///// ///// //
12
40
50
///// ///
8
D Ü fi Ü N E L ‹ M
50
60
///
3
60
70
/
1
S O R U
Grup frekanslar›n›n
D ‹ K K A T belirlenmesi s›ras›nda, ya alt s›n›rda yada üst s›n›rda yer alan de¤eri
kapsam d›fl›nda b›rak›r›z.
D‹KKAT
AMAÇLARIMIZ
Grup S›n›rlar›
Alt
SIRA S‹ZDE
SIRA S‹ZDE
Grup S›n›rlar›
N N
SIRA S‹ZDE
VER‹LER‹N SUNULMASI
Örneklemeler sonucunda elde edilen zaman serileri, nitel seriler ve nicel serilerden s›n›fland›r›lm›fl
AMAÇLARIMIZve grupland›r›lm›fl seriler çeflitli grafikler halinde sunulurlar.
Zaman Serilerinin Grafiksel Gösterimi (Kartezyen Grafik)
K ‹ T A P
TELEV‹ZYON
ÖRNEK 10
‹NTERNET
K ‹ olan
T A Pzaman serileri genellikle X ekseninde zaman birimi ve Y ekse‹ki de¤iflkenli
ninde örneklenen birim say›lar› olmak üzere kartezyen grafikleri halinde gösterilirler.
TELEV‹ZYON
Türkiye ‹statistik Kurumu’nun (TÜ‹K) 2002-2010 y›llar› için yay›nlad›¤› Tüketici
Fiyat Endeksine dayal› enflasyon oranlar›n›n de¤iflimi afla¤›daki flekildeki gibi gösterilebilir. ‹ N T E R N E T
15
1. Ünite - Temel ‹statistik Kavramlar
fiekil 1.1
Tüketici Fiyat
Endeksleri ile
Hesaplanan
Enflasyon Oranlar›
TÜFE Enflasyon Oranlar›
35
Enflasyon Oran› (%)
30
25
20
15
10
5
0
2000
2002
2004
2006
Y›llar
2008
2010
2012
Kaynak: http://www.hazine.org.tr/ekonomi/enflasyon.php
Nitel Serilerin Grafiksel Gösterimi (Pasta Grafi¤i)
Nitel verilerden elde edilen serilerin sunulmas›nda pasta grafi¤i kullan›l›r. Pasta
grafi¤i, daire fleklindeki bir pastan›n her bir dilimi, nitel de¤iflkenin ilgili s›n›f›n›n
frekans›n› temsil edecek flekilde dilimlere ayr›larak haz›rlanmaktad›r. Pasta grafi¤i,
veriler toplam›n›n s›n›f kategorilerine göre da¤›l›fl›n› ve s›n›flar›n veri say›lar› aras›ndaki ba¤›l farklar› göstermesi aç›s›ndan oldukça kullan›fll›d›r.
Türkiye ‹statistik Kurumu’nun 2009 y›l› için yay›nlam›fl oldu¤u Hayvanc›l›k ‹statistiklerinden elde edilen büyükbafl hayvan say›lar› ve bunlar›n oranlar›, afla¤›daki gibi iki farkl› flekille gösterilebilir.
Pasta grafi¤i üzerinde, nitel
s›n›flar farkl› renklerle ve
birim say›s›na göre dilim
büyüklü¤ü ile
gösterilebilece¤i gibi, nitel
s›n›flardaki birimlerin
yüzdeleri ile de
gösterilebilirler.
ÖRNEK 11
fiekil 1.2
2009 Y›l› Verileri ile Büyükbafl Hayvan Say›lar›n›n Pasta Diyagramla Sunumu
2009 Y›l› Büyükbafl Hayvan Say›lar›
2009 Y›l› Büyükbafl Hayvan Say›lar›
S›¤›r-Yerli
S›¤›-Kültür
S›¤›r-Melez
41%
Manda
10% S›¤›r-Yerli
24%
S›¤›r-Melez
Manda
Deve
Kaynak: TÜ‹K Hayvanc›l›k ‹statistikler Veri Taban›
S›¤›r-Kültür
34%
16
Co¤rafi Bilgi Sistemleri ‹çin Temel ‹statistik
Nicel Serilerin Grafiksel Gösterimi
S›n›fland›r›lm›fl seriler, noktasal veya çizgisel olarak, s›n›f say›lar›n›n ve frekanslar›n de¤erlerini dikkate alacak flekilde koordinat sisteminde gösterilmektedirler. S›n›fland›r›lm›fl serinin de¤erleri ba¤›ms›z de¤iflken olarak X ekseninde, frekanslar
ise ba¤›ml› de¤iflken olarak Y koordinat ekseninde gösterilmektedirler. Bu nedenle s›n›fland›r›lm›fl frekans serisinin grafi¤i koordinat sistemi üzerinde sütun veya
çubuk fleklinde görülürler.
ÖRNEK 12
A dersinden devams›zl›¤› olan ö¤rencilerin devams›zl›k süreleri afla¤›daki sütunçubuk diyagramdaki gibi gösterilebilir. Veri olmayan s›n›flar için çubuk diyagramda boflluk b›rak›labilece¤i gibi, bu de¤erler dikkate al›nmadan da diyagram,
örnekteki gibi çizilebilir.
fiekil 1.3
Ö¤rencilerin A Dersindeki Devams›zl›klar›
Ö¤rencilerin Bir
Dersteki
Devams›zl›klar›n›n
Sütun-Çubuk
Gösterimi.
6
Ö¤renci Say›s›
5
4
3
2
1
0
0
1
2
5
6
8
Devams›zl›k (Saat)
10
12
14
Grupland›r›lm›fl seriler ise genellikle histogram fleklinde veya histogram orta
noktalar›ndan geçen grafikler halinde gösterilebilmektedir. Histogram grafikleri de
sütun-çubuk grafi¤ine benzerler, ancak sütunlar aras›nda boflluk yoktur. Sütun
grafiklerde sütunlar belirli bir de¤erin frekans›n› gösterirken, histogram grafikler
belli aral›ktaki de¤erlerin frekans›n› temsil eder. Histogram grafikleri ço¤unlukla
verilerin da¤›l›m fleklini incelemek için kullan›l›rlar. S›n›fland›r›lm›fl ve grupland›r›lm›fl seriler, kümülatif (toplam) frekanslar halinde de gösterilebilirler.
ÖRNEK 13
Bir bölge havzas›nda taflk›n riskini belirleme çal›flmalar› için bölge akarsular›nda
kurulan istasyonlarda yap›lan 40 adet ak›m (m3/s) ölçüm sonuçlar›n›n grup aral›klar›na giren normal frekanslar› ve toplam frekanslar› gösterir histogramlar› afla¤›daki gibidir.
17
1. Ünite - Temel ‹statistik Kavramlar
fiekil 1.4
Bölge Akasular›n›n Ak›m Ölçüm Sonuçlar›,
a: Normal Frekanslar,
b: Toplam Frekanslar.
0-10 10-20 20-30 30-40 40-50 50-60 60-70
Ak›m (m3/s)
(a)
Toplam Frekanslar
Akarsu Ak›m Ölçüm Sonuçlar›
Frekans
14
12
10
8
6
4
2
0
45
40
35
30
25
20
15
10
5
0
Akarsu Ak›m Ölçüm Sonuçlar›
0-10 10-20 20-30 30-40 40-50 50-60 60-70
Ak›m (m3/s)
(b)
18
Co¤rafi Bilgi Sistemleri ‹çin Temel ‹statistik
Özet
N
A M A Ç
1
Örnekleme kavramlar›n› ö¤renerek örnekleme
yöntemi seçimini yapmak.
‹statistikte kütleler, oluflum flekline göre gerçek
ya da varsay›msal, sonlu ya da sonsuz ve sürekli ya da süreksiz olarak s›n›fland›r›labilmektedir.
Sonlu veya sonsuz say›da birimden oluflan canl›
yada cans›z toplulu¤un tamam›na ana kütle denilmekte olup, tam say›m için bütçenin yetersiz
ve fazla zaman›n olmad›¤› veya birimlerin tamam›n›n say›m› s›ras›nda ana kütlenin zarar görme
olas›l›¤› oldu¤u durumlarda, ana kütleyi temsil
edecek say›da birimden oluflan örnek kütle elde
edilir.
Ana kütleden örnek seçimi, araflt›rmac›n›n kendi
takdiri veya iradesi ile seçti¤i birimlerden olufluyorsa bu tür örneklemelere rassal olmayan örnekleme denilmektedir. Genellikle istatistiksel
çal›flmalarda rassal olmayan örnekleme tercih
edilmemektedir. Dilim örnekleme ve kota örneklemesi rassal olmayan örnekleme yöntemleridir.
Ana kütle birimlerinin her birine belirli ve s›f›rdan büyük bir olas›l›kla örnek kütleye seçilme
flans›n›n verildi¤i örneklemelere rassal örnekleme denilmektedir. Ana kütlenin yap›s›na göre
rassal örnekleme basit, sistematik, küme veya tabakal› yöntemlerle yap›labilmektedir.
N
A M A Ç
2
N
A M A Ç
3
‹statistiksel verilerin toplanmas› ve düzenlenmesi
çal›flmalar›n› temel anlamda gerçeklefltirmek.
‹statistiksel çal›flmalarla toplanan ham verilerin
analize uygun hale getirilmesi için düzenlenmesi gerekir. Veriler, örneklenen birimlerin zaman
ve mekan özelliklerine, nitel ve nicel özellikleriyle da¤›lma flekillerine göre seriler fleklinde düzenlenebilmektedirler.
Verilerin çeflitli özellikleri saat, gün, ay ve y›l gibi bir zaman birimine göre s›ralan›yor veya da¤›l›m› oluflturuyorsa, iki sütunlu bu serilere zaman
serisi denilir. Verilerin çeflitli özelliklerinin köy,
flehir, bölge, ülke ve k›ta gibi bir mekan (yerleflim) birimine göre s›ralan›yor veya da¤›l›m› oluflturuluyorsa, iki sütunlu bu serilere ise mekan serisi denilir. Say›sal olarak ifade edilemeyen ve s›n›flar›n do¤al olarak olufltu¤u serilere de nitel seri denilir. Say›sal olarak adet, uzunluk, a¤›rl›k,
alan ve hacim gibi çeflitli ölçü birimleriyle ifade
edilebilen özelliklere göre ifade edilen nicel veriler ise s›ralanarak, s›n›fland›r›larak veya grupland›r›larak serilere dönüfltürülebilmektedirler.
‹statistiksel verileri sunmak.
Zaman serilerine ait veriler kartezyen grafik, nitel veriler pasta grafi¤i, nicel veriler ise sütun-çubuk veya histogram grafikleri fleklinde sunulabilmektedir.
1. Ünite - Temel ‹statistik Kavramlar
19
Kendimizi S›nayal›m
1. Ana kütleden örneklenmifl verilerin küçükten büyü¤e ya da büyükten küçü¤e do¤ru s›ralan›p, tekrarlanan
verilerin tekrarlanma say›lar›n›n (frekanslar›n›n) bulunmas› ile elde edilen serilere ne ad verilir?
a. Basit seri
b. Grupland›r›lm›fl seri
c. S›n›fland›r›lm›fl seri
d. Bileflik seri
e. Karmafl›k seri
2. Örneklenen verilerin çeflitli özellikleri köy, flehir,
bölge, ülke ve k›ta gibi bir birime göre s›ralanmas›yla
veya da¤›l›m›n›n oluflturulmas›yla elde edilen seriye ne
ad verilir?
a. Zaman serisi
b. Mekân serisi
c. Nitel seri
d. Bileflik seri
e. Basit seri
3. Serilerle ilgili afla¤›daki ifadelerden hangisi do¤rudur?
a. Saat 8 ile 20 aras› her saat bafl›na bir bulvardan
geçen araç say›s›n› gösteren iki sütunlu seriye
basit seri denir.
b. Bir sütunda a¤aç türlerinin ve di¤er sütunda say›lar›n›n verildi¤i seriye mekân serisi denir.
c. Örneklenen birim say›s›n›n çok az oldu¤u durumlarda kullan›lan ve tek sütundan oluflan serilere zaman serisi denir.
d. Bir sütunda yaban hayat›n› gelifltirme bölgesinde yaflayan hayvan türlerinin isimlerinin ve di¤er sütunda say›lar›n›n verildi¤i seriye nitel serisi denir.
e. Bir sütunda bölge ismi ve di¤er sütunda kömür
rezerv miktar›n›n verildi¤i seriye s›n›fland›r›lm›fl
seri denir.
4. Örneklenen veri say›s› 40 oldu¤unda, “Sturges Kural›” ile veriler grupland›r›lmak istendi¤inde, grup say›s›
(K) kaç olabilir? (log40=1,6 d›r)
a. 3
b. 5
c. 7
d. 9
e. 11
5. Hava kirlili¤i üzerine yap›lan bir istatistiksel araflt›rmada, 40 adet ölçüm yap›ld›¤›nda havadaki kükürtdioksit oran›n›n en büyük de¤erinin 49 µg/m3 ve en küçük de¤erinin 5 µg/m3 oldu¤u belirlenmifltir. “Sturges
Kural›” ile bu veriler grupland›r›lmak istendi¤inde, grup
aral›¤› (GA) kaç olabilir? (GA= DG/K DG = Xenb – Xenk
K = 1 + 3,3. Log(n) ve log(40) = 1,6 d›r)
a. 3
b. 5
c. 7
d. 9
e. 11
6. Afla¤›dakilerden hangisi sonsuz kütledir?
a. Bir dersten yap›lan s›navda ö¤rencilerin ald›klar› notlar
b. Metalik paralar›n metal içeri¤i
c. Merkez Bankas›n›n döviz rezervi
d. Bir hafta içerisinde bir banka flubesine gelen
günlük müflteri say›s›
e. Bankalar›n mevduata uygulad›¤› faiz oranlar›
7. N birimlik bir ana kütleden, her birine eflit seçilme
flans› verilmesi ile n birimlik örnek seçilmesi ifllemine
ne ad verilir?
a. Basit rassal örnekleme
b. Sistematik örnekleme
c. Kota örnekleme
d. Dilim örneklemesi
c. Kümeli örnekleme
8. Nitel verilerden elde edilen serilerin sunulmas›nda
kullan›lan ve nitel de¤iflkenin ilgili s›n›f›n›n frekans›n›
temsil edecek flekilde dilimlere ayr›lmas›yla haz›rlanan
grafi¤e ne ad verilir?
a. Kartezyen grafi¤i
b. Çubuk grafi¤i
c. Sütun grafi¤i
d. Pasta grafi¤i
e. Histogram
20
Co¤rafi Bilgi Sistemleri ‹çin Temel ‹statistik
S›ra Sizde Yan›t Anahtar›
9. Belirli aral›klarla grupland›r›lm›fl serilerin sunulmas›nda afla¤›daki grafik yöntemlerinden hangisi kullan›l›r?
a. Kartezyen grafi¤i
b. Çubuk grafi¤i
c. Sütun grafi¤i
d. Pasta grafi¤i
e. Histogram
10. Birinci sütunda örneklenen de¤iflkenin ald›¤› farkl›
de¤erler (X i) yer al›rken, ikinci sütunda de¤iflkenin ald›¤› de¤erlerin frekanslar›n›n (f i) gösterildi¤i serilere ne
ad verilir?
a. Zaman serisi
b. S›n›fland›r›lm›fl seri
c. Nitel seri
d. Grupland›r›lm›fl seri
e. Basit seri
Kendimizi S›nayal›m Yan›t Anahtar›
1. c
2. b
3. d
4. c
5. c
6. d
7. a
8. d
9. e
10. b
Yan›t›n›z yanl›fl ise, “Verilerin Toplanmas› ve
Seriler Halinde Düzenlenmesi” konusunu gözden geçiriniz.
Yan›t›n›z yanl›fl ise, “Verilerin Toplanmas› ve
Seriler Halinde Düzenlenmesi” konusunu gözden geçiriniz.
Yan›t›n›z yanl›fl ise, “Verilerin Toplanmas› ve
Seriler Halinde Düzenlenmesi” konusunu gözden geçiriniz.
Yan›t›n›z yanl›fl ise, “Grupland›r›lm›fl Seriler”
konusunu gözden geçiriniz.
Yan›t›n›z yanl›fl ise, “Grupland›r›lm›fl Seriler”
konusunu gözden geçiriniz.
Yan›t›n›z yanl›fl ise, “‹statistiksel Kütle Türleri”
konusunu gözden geçiriniz.
Yan›t›n›z yanl›fl ise, “Rassal Örnekleme” konusunu gözden geçiriniz.
Yan›t›n›z yanl›fl ise, “Verilerin Sunulmas›” konusunu gözden geçiriniz.
Yan›t›n›z yanl›fl ise, “Verilerin Sunulmas›” konusunu gözden geçiriniz.
Yan›t›n›z yanl›fl ise, “Verilerin Toplanmas› ve
Seriler Halinde Düzenlenmesi” konusunu gözden geçiriniz.
S›ra Sizde 1
A¤aç türleri say›labilir oldu¤undan sonlu kütledir.
S›ra Sizde 2
Türkiye’de tüm otoyollarda ar›zalar›n trafik kazalar›na
etkilerini araflt›rmak için tam say›m yapmak mümkün
de¤ildir. Çünkü, Türkiye otoyollar› çok genifl bir co¤rafyaya yay›lm›fl oldu¤undan, tam say›m yap›lmas› hem
çok büyük maliyetli hem de çok fazla zaman gerektirir.
S›ra Sizde 3
Bu tür örneklemelere kota örneklemesi denilmektedir.
S›ra Sizde 4
Büyütme faktörü k=100/20=5 ve rassal say› da 5 oldu¤undan 5, 10, 15, 20, 25, 30, 35, 40, 45, 50, 55, 60, 65,
70, 75, 80, 85, 90, 95 ve 100’üncü s›radaki iflletmeler örneklenir.
S›ra Sizde 5
Köyden kente göçlerin ve flehirleflmenin araflt›r›ld›¤› bir
çal›flmada, nüfus verileri il, ilçe, belde ve köy olmak
üzere idari özelliklerine göre do¤al s›n›flara ayr›labilir.
Yararlan›lan Kaynaklar
Cula, S. & Muluk, Z. (2006). Temel ‹statistik Yöntemleri.
Ankara: Baflkent Üniversitesi.
Gürtan, K. (1982). ‹statistik ve Araflt›rma Metodlar›.
No:2941. ‹stanbul: ‹stanbul Üniversitesi.
Konuk, A. & Önder, S. (1999). Maden ‹statisti¤i. Mühendislik Mimarl›k Fakültesi Maden Mühendisli¤i Bölümü. Eskiflehir: Eskiflehir Osmangazi Üniversitesi.
Orhunbilge, N. (2000). Tan›msal ‹statistik Olas›l›k ve
Olas›l›k Da¤›l›mlar›. ‹flletme Fakültesi Yay›n No:
279. ‹stanbul: ‹stanbul Üniversitesi
Serper, Ö. (2000). Uygulamal› ‹statistik II. Bursa: Ezgi.
Ünver, Ö. & Gamgam, H. (2006). Uygulamal› Temel ‹statistik Yöntemler. Ankara: Seçkin.
CO⁄RAF‹ B‹LG‹ S‹STEMLER‹ ‹Ç‹N TEMEL
‹STAT‹ST‹K
2
Amaçlar›m›z
N
N
Bu üniteyi tamamlad›ktan sonra;
Merkezi e¤ilim ölçülerini hesaplay›p kullanabilecek,
Da¤›l›m ölçülerini hesaplay›p kullanabilecek bilgi ve becerilere sahip olacaks›n›z.
Anahtar Kavramlar
•
•
•
•
•
•
Ana kütle
Örnek kütle
Örnekleme
‹statistik Seriler
Merkezi e¤ilim ölçüleri
Da¤›l›m ölçüleri
•
•
•
•
•
•
Ortalamalar
Medyan
Mod
Varyans
Standart sapma
De¤iflkenlik katsay›s›
‹çindekiler
Co¤rafi Bilgi
Sistemleri ‹çin Temel
‹statistik
Merkezi E¤ilim ve
Da¤›l›m Ölçüleri
• MERKEZ‹ E⁄‹L‹M ÖLÇÜLER‹
• DA⁄ILIM ÖLÇÜLER‹
Merkezi E¤ilim ve Da¤›l›m
Ölçüleri
MERKEZ‹ E⁄‹L‹M ÖLÇÜLER‹
Ana kütleden örneklenen verilerin düzenlenerek çizelgelerle ve grafiklerle sunulmas› sonras›nda, verileri tan›mlamak, karfl›laflt›rmak, yorumlamak veya ana kütle
parametreleri hakk›nda genellemeler yapabilmek için baz› ölçülere gereksinim duyulur. Merkezi e¤ilim ölçüleri, verileri tan›mlamak için kullan›lan ve verileri özetlemeye yarayan ölçülerdir. Merkezi e¤ilim ölçüleri, verilerin tümünü temsil eden
ve merkez noktas›na yak›n bir de¤er oldu¤undan, ortalamalar olarak da tan›mlanmaktad›r.
Bir örnekleme sonucunda toplanan verilerin hangi de¤er etraf›nda topland›¤›n› gösteren ve verilerin oluflturdu¤u seriyi temsil eden rakama “ortalama” denilir.
Bu nedenle ortalama, serideki en küçük ve en büyük de¤erler aras›nda bulunur.
Ortalama, örneklenen verilerin normal de¤erlerini göstermesi, kolayl›kla ak›lda tutulabilme özelli¤ine sahip olmas› ve örneklenen farkl› serilerin karfl›laflt›r›lmas›nda
kolayl›kla kullan›labilmesi nedenleriyle istatistiksel analizlerde yayg›n bir flekilde
kullan›lmaktad›r.
Örneklenen verilerin herhangi birinde meydana gelecek de¤er de¤iflikli¤i, ortalaman›n de¤erinde de de¤iflikli¤e yol aç›yorsa, ortalaman›n hesaplanmas›nda
tüm örneklenen verileri dikkate alan duyarl› ortalama yöntemlerini kullanmak gerekir. Ancak, örneklenen verilerin baz›lar›nda meydana gelecek de¤iflim ortalaman›n de¤erini etkilemiyorsa, verilerin tümünü dikkate almayan duyars›z ortalama
yöntemleri kullan›labilir.
Bu ünitede, merkezi e¤ilim ölçüleri olarak duyarl› ortalamalardan aritmetik,
a¤›rl›kl›, geometrik, harmonik ve kareli ortalama, duyars›z ortalamalardan ise mod
ve medyan ortalama yöntemlerinin hesaplanmas› ve uygulamada kullan›m koflullar› incelenecektir.
Aritmetik Ortalama
Ana kütleden elde edilen nicel örnekleme verileri toplam›n›n veri say›s›na oran›na
aritmetik ortalama denilmektedir. Aritmetik ortalama, seri türüne göre afla¤›daki
eflitliklerle hesaplanabilmektedir.
Basit serilerde: X =
∑ Xi
n
Duyarl› ortalamalara basit
aritmetik, a¤›rl›kl› aritmetik,
geometrik, harmonik ve
kareli ortalamalar› örnek
olarak verilebiliriz. Duyars›z
ortalamalara ise kartil
ortalamalar ile mod ve
medyan ortalamay› örnek
olarak verebiliriz. Bu
ünitede, kartil ortalamalar
kapsam d›fl›nda
tutulmufltur. Kartil
ortalamalar için ayr›nt›l›
bilgilere Necmi Gürsakal’›n
Bilgisayar Uygulamal›
‹statistik I (Alfa Yay›nlar› No:
1029, ‹stanbul, 2001) isimli
kitaptan ulaflabilirsiniz.
24
Co¤rafi Bilgi Sistemleri ‹çin Temel ‹statistik
S›n›flanm›fl serilerde: X =
Gruplanm›fl serilerde: X =
∑ X i .fi
∑ fi
∑ m i .fi
∑ fi
–
Burada; X = aritmetik ortalama, Xi = i’inci s›n›f›n de¤eri, n = Toplam örnek say›s›, fi = i’inci s›n›f›n veya grubun frekans›, mi = i’inci grubun ortalamas›d›r.
ÖRNEK 1
Afla¤›daki basit serinin aritmetik ortalamas›n› hesaplay›n›z.
X
–––––––––
20
26
28
34
37
–––––––––
145
Çözüm: Örneklenen verilerin toplam›
dan, aritmetik ortalamay›;
X =
∑X
n
=
∑ X = 145
ve veri say›s› n=5 oldu¤un-
145
= 29
5
olarak hesaplar›z.
SIRA S‹ZDE
D Ü fi Ü N E L ‹ M
1
ÖRNEK 2
S O R U
D‹KKAT
SIRA S‹ZDE
AMAÇLARIMIZ
K ‹ T A P
TELEV‹ZYON
‹NTERNET
Örneklenen SIRA
verilerin
S‹ZDEtoplam› 180 ve aritmetik ortalama 9 oldu¤una göre, örneklenen veri say›s› kaçt›r?
D Ü fi Ü Ns›n›fland›r›lm›fl
EL‹M
Afla¤›da verilen
serinin aritmetik ortalamas›n› hesaplay›n›z.
X
f
––––––––
20 S O R U ––––––––
1
26
4
28
8
D‹KKAT
34
5
37
2
–––––––––
SIRA S‹ZDE–––––––––
20
N N
Çözüm: S›n›fland›r›lm›fl serilerde aritmetik ortalamay› hesaplayabilmek için önAMAÇLARIMIZ
celikle seri de¤erleri ile frekanslar› çarp›p toplamlar›n› bulmam›z gerekmektedir.
X
f
X.f
––––––––
–––––––––
––––––––––
20
1
20
K ‹ T A P
26
4
78
28
8
224
34 T E L E V ‹ Z Y O N 5
204
37
2
74
–––––––––
–––––––––
––––––––––
20
600
‹NTERNET
2. Ünite - Merkezi E¤ilim ve Da¤›l›m Ölçüleri
Hesaplad›¤›m›z ∑ X.f = 600 ve frekanslar toplam›
re, aritmetik ortalamay›;
∑ X.f
∑f
X =
=
∑f
25
= 20 oldu¤una gö-
600
= 30
20
olarak hesaplar›z.
Bir bölge havzas›nda taflk›n riskini belirleme çal›flmalar› için y›ll›k pik ak›m› ve ortalama pik ak›m› miktarlar›n› belirlemek amac›yla, bölge akarsular›na kurulan
40 adet istasyonda yap›lan ak›m ölçümü verilerinin grupland›r›lm›fl seri halindeki flekli afla¤›daki gibidir. Bu grupland›r›lm›fl seride, öncelikle grup ortalamalar›n›
bulur ve daha sonra aritmetik ortalamay› hesaplayabiliriz.
Grup S›n›rlar› (m3/s)
Frekanslar
Grup Ortalamalar›
mi
fi x mi
Alt
Üst (den az)
fi
0
10
3
5
15
10
20
6
15
90
20
30
7
25
175
30
40
12
35
420
40
50
8
45
360
50
60
3
55
165
60
70
1
65
65
∑ fi = 40 ve ∑ fi . mi = 1290 olarak hesapland›¤›ndan, grupland›r›lm›fl serinin aritmetik ortalamas›;
X=
∑ m i . fi
∑ fi
=
1290
= 32, 25 m 3 / s
40
–
X = 32,25 m3/s bulunur.
Aritmetik ortalaman›n hesaplanmas›nda, verilerin çok fazla ve büyük de¤erlerden oluflmas› durumunda, verilerin aritmetik ortalamadan sapmalar›n›n cebirsel
toplam›n›n s›f›ra eflit olma özelli¤inden faydalanarak, aritmetik ortalamay› k›sa yoldan hesaplamak mümkün olmaktad›r. Aritmetik ortalaman›n k›sa yoldan hesaplanmas› yöntemi, özellikle grupland›r›lm›fl serilerde kullan›lmaktad›r. Bunun için öncelikle, aritmetik ortalamaya en yak›n oldu¤u düflünülen bir grup ortalamas› (genellikle en büyük frekansa sahip grubun ortalamas›), geçici ortalama olarak seçilir
(m0). Daha sonra, her bir grup ortalamas›ndan geçici ortalaman›n (m0) sapmalar›n›n grup aral›¤›na (A) oran› ile küçültülmüfl de¤erlerden oluflan grup ortalamalar›
(ui ) elde edilir.
ui =
mi - m0
A
Küçültülmüfl de¤erlerden oluflan serisinin aritmetik ortalamas›;
ÖRNEK 3
26
Co¤rafi Bilgi Sistemleri ‹çin Temel ‹statistik
u=
∑ ui .fi
∑ fi
Eflitli¤i ile hesapland›ktan sonra,
–
–
X = m0 + ( u . A)
Eflitli¤i yard›m›yla aritmetik ortalama hesaplan›r.
ÖRNEK 4
Örnek 1’deki verileri kullanarak küçültülmüfl de¤erlerle aritmetik ortalamay› hesaplay›n›z.
Çözüm: Geçici ortalama olarak, en büyük frekansa sahip grubun ortalamas›n›
(m0 = 35) alabiliriz. Grup aral›¤› da A = 10 oldu¤una göre, bu durumda küçültülmüfl grup ortalamalar›n›;
ui =
mi - 35
eflitli¤i ile hesaplar›z.
10
Grup S›n›rlar› (m3/s)
Frekanslar
Grup Ortalamalar› Küçültülmüfl Grup Ort.
Alt
Üst (den az)
fi
mi
ui
0
10
3
5
-3
10
20
6
15
-2
20
30
7
25
-1
30
40
12
35
0
40
50
8
45
1
50
60
3
55
2
60
70
1
65
3
∑ ui . fi = -11
ve
lar›z.
∑ fi = 40
oldu¤undan, u =
−11
= −0, 275 olarak hesap40
–
–
Aritmetik ortalama; X = m0 + ( u . A) = 35 + (-0,275.10) = 32,25 m3/s bulunur.
SIRA S‹ZDE
2
Afla¤›da verilen
serinin aritmetik ortalamas›n› küçültülmüfl de¤erlerle heSIRAgrupland›r›lm›fl
S‹ZDE
saplay›n›z.
D Ü fi Ü N E L ‹ M
D Ü fi Ü N E L ‹ M
Alt
Üst
Frekanslar
fi
S O R U
S O0R U
D‹KKAT
1000
2000
D‹KKAT
3000
4000
1000
2000
3000
4000
5000
3
6
12
9
5
SIRA S‹ZDE
AMAÇLARIMIZ
N N
SIRA S‹ZDE
Grup S›n›rlar›
Aritmetik ortalama baz› matematiksel özelliklere sahip oldu¤undan, birçok istatistiksel analiz yönteminde kullan›labilmektedir. Aritmetik ortalaman›n baz› maAMAÇLARIMIZ
tematiksel özellikleri flunlard›r:
K ‹ T A P
K ‹ T A P
TELEV‹ZYON
TELEV‹ZYON
2. Ünite - Merkezi E¤ilim ve Da¤›l›m Ölçüleri
27
a. Örneklenen verilerin aritmetik ortalamadan sapmalar›n›n cebirsel toplam›
s›f›rd›r.
∑ ( X i - X) = 0
b. Örneklenen verilerin aritmetik ortalamadan sapmalar›n›n kareleri toplam›,
herhangi bir de¤erden farklar›n›n kareleri toplam›na göre en küçüktür.
∑ ( X i - X)
2
= En küçük
c. Bir serinin de¤erleri ayn› s›radaki iki seri de¤erlerinin toplam›na eflitse, aritmetik ortalamas› da bu iki serinin aritmetik ortalamalar› toplam›na eflittir.
– – –
Xi = Yi + Zi ise X = Y + Z dir.
d. Aritmetik ortalama, serideki afl›r› de¤erlerden oldukça fazla etkilenen hassas
bir ortalamad›r.
Afla¤›daki basit seride, verilerin aritmetik ortalamadan sapmalar›n›n toplam›n›
bulunuz.
ÖRNEK 5
X
–––––––––
12
14
18
26
30
–––––––––
100
Çözüm: Aritmetik ortalama: X =
100
= 20
5
–
X
X-X
12
14
18
26
30
-8
-6
-2
6
10
∑ X = 100
∑( X - X ) = 0
Afla¤›da verilen basit seri de¤erlerinden aritmetik ortalama, en küçük de¤er ve en büyük de¤erleri ç›kararak, bulaca¤›n›z farklar›n kareleri toplamlar›n› karfl›laflt›r›n›z.
X
–––––––––
6
7
9
13
15
–––––––––
50
ÖRNEK 6
28
Co¤rafi Bilgi Sistemleri ‹çin Temel ‹statistik
Çözüm: Serinin aritmetik ortalamas›: X =
Örneklenen verilerin
aritmetik ortalamadan
sapmalar›n cebirsel
toplam›n›n s›f›r ve aritmetik
ortalamadan sapmalar›n
kareleri toplam›n›n ek küçük
olma özelli¤i, regresyonkorelasyon analizlerinin
temelini oluflturmaktad›r.
∑ Xi
=
n
50
= 10
5
X
(X - 10)2
(X - 6)2
(X - 15)2
6
16
0
81
7
9
1
64
9
1
9
36
13
9
49
4
15
25
81
0
∑ X = 50
∑ ( X - 10)
2
= 60
∑ ( X - 6)
2
= 140
∑ ( X - 15)
2
= 185
Seri de¤erlerinin aritmetik ortalamadan sapmalar›n›n kareleri toplam›, serinin
en küçük ve en büyük de¤erden farklar›n›n kareleri toplam›na göre en küçüktür.
A¤›rl›kl› Ortalama
Aritmetik ortalama, her verinin a¤›l›klar›n›n (önem derecelerinin) birbirine eflit oldu¤u durumlarda kullan›l›r. Örneklenen verilerin önem derecesinin farkl› oldu¤u
durumlarda ise, bu önem derecelerinin de hesaplamalara dahil edilmesi gerekir.
Seri türlerine göre a¤›rl›kl› ortalaman›n hesaplanmas› afla¤›daki gibi yap›lmaktad›r:
∑ a i .X i
X=
Basit serilerde:
∑ ai
S›n›flanm›fl serilerde: X =
∑ a i .X i .fi
∑ a i .fi
Gruplanm›fl serilerde: X =
∑ a i .m i .fi
∑ a i .fi
Burada, ai = i’inci örne¤in önem veya a¤›rl›¤›d›r.
ÖRNEK 7
Bir maden iflletmecisi, maden yata¤›nda yapm›fl oldu¤u 5 adet sondaj sonucunda,
sondajlar›n kesti¤i maden damar› kal›nl›klar›n›n afla¤›daki gibi oldu¤unu belirlemifltir. Sondajlar›n etki alanlar› farkl› oldu¤una göre, maden yata¤›n›n etki alan›
ile a¤›rl›kl› ortalama damar kal›nl›¤› nedir?
Damar Kal›nl›¤› (m)- Xi
Etki Alan› (m2)- ai
1
12
2
8
3200
2350
Sondaj No
3
6
4600
4
14
5
9
3600
2950
Çözüm: Elde edilen veriler basit seri fleklinde oldu¤undan, etki alan›yla a¤›rl›kl› ortalamay› afla¤›daki gibi hesaplayabiliriz.
∑ ai
= 16700 ve ∑ ai .X i = 161750 olarak hesapland›¤›ndan, basit serinin
a¤›rl›kl› ortalamas›;
29
2. Ünite - Merkezi E¤ilim ve Da¤›l›m Ölçüleri
X=
∑ a i .X i
∑ ai
=
161750
= 9,7m bulunur.
16700
Bir firma flehir içinde çeflitli semtlerde bulunan 5 ma¤azas›nda ayn›SIRA
ürünü
promosyon uyS‹ZDE
gulamas› nedeniyle farkl› fiyatlardan satmaktad›r. Afla¤›da firman›n ma¤azalar›nda sat›lan
ürünlerin miktarlar› ve birim sat›fl fiyatlar› verilmifltir. Firma ürünlerini ortalama hangi fiD Ü fi Ü N E L ‹ M
yattan satm›flt›r?
Ma¤aza Ad›
Birim Sat›fl Fiyat› (TL/adet)
S O RMiktar›
U
Sat›lan Ürün
(Adet)
A
50
300
B
40
D ‹ K350
KAT
C
60
150
D
70
E
55
100
SIRA S‹ZDE
200
AMAÇLARIMIZ
Geometrik Ortalama
3
N N
‹NTERNET
n
D Ü fi Ü N E L ‹ M
S O R U
D‹KKAT
Örneklenen verilerin oranlar ve yüzdelerden olufltu¤u durumlarda aritmetik ortalama uygun bir ortalama de¤ildir. Verilerin ani ve anormal farkl›l›klar
ya
K ‹ T A gösterdi¤i
P
da yüzde ve oranlarla ifade edildi¤i durumlarda geometrik ortalama daha kullan›fll›d›r. Aritmetik ortalama aritmetik dizi, geometrik ortalama ise geometrik dizi fleklindeki serilere uygun ortalama tipidir.
TELEV‹ZYON
Geometrik ortalama iki farkl› flekilde hesaplanabilir.
a. Bir veri setinde bulunan n adet birimin çarp›m›n›n n’inci dereceden kökünün al›nmas›yla elde edilen de¤er geometrik ortalamay› verir.
G=
SIRA S‹ZDE
SIRA S‹ZDE
AMAÇLARIMIZ
K ‹ T A P
TELEV‹ZYON
‹NTERNET
X 1 .X 2 .X 3 .X 4 .......X n
b. Verilerin logaritmalar› al›narak bulunacak logaritmik aritmetik ortalaman›n
eksponansiyeli (anti logaritmas›) hesaplanarak geometrik ortalama elde edilir.
Seri türlerine göre geometrik ortalama afla¤›daki eflitliklerle hesaplanabilir.
Basit serilerde:
In G =
S›n›flanm›fl serilerde: In G =
Gruplanm›fl serilerde: In G =
∑ In X i
n
∑ In X i .fi
∑ fi
∑ In m i .fi
∑ fi
G = exp(InG )
SIRA S‹ZDE
SIRA S‹ZDE
D Ü fi Ü N E L ‹ M
D Ü fi Ü N E L ‹ M
S O R U
S O R U
Veri de¤erlerinin herhangi birinin s›f›r veya s›f›rdan küçük olmas› durumunda
D ‹ K K A T geometrik
ortalaman›n hesaplanmas› mümkün olamamaktad›r.
SIRA S‹ZDE
AMAÇLARIMIZ
K ‹ T A P
N N
D‹KKAT
SIRA S‹ZDE
AMAÇLARIMIZ
K ‹ T A P
30
Co¤rafi Bilgi Sistemleri ‹çin Temel ‹statistik
ÖRNEK 8
Afla¤›daki basit serinin geometrik ortalamas›n› hesaplay›n›z.
X
(%)
–––––––––
20
40
35
45
55
Çözüm: Basit serilerde geometrik ortalamay› iki farkl› yöntemle hesaplayabiliriz.
a. Veri setinde bulunan n adet birimin çarp›m›n›n n’inci dereceden kökünün
al›nmas›:
n=5
G=
n
X 1 .X 2 .X 3 .X 4 .......X n
G = 5 20.40.35.45.55 = 37
b. Verilerin logaritmalar› al›narak aritmetik ortalaman›n hesaplanmas›:
X
(%)
20
40
35
45
55
SIRA S‹ZDE
∑ X = 195
‹NTERNET
18,054
= 3,611
5
Geometrik ortalama
D ‹ K K A T hesaplamada, n’inci dereceden kök alma zorlu¤u nedeniyle genellikle verilerin logaritmalar› al›narak hesaplama yöntemi tercih edilmektedir.
N N
ÖRNEK 9
TELEV‹ZYON
n
=
∑ LnX = 18,054
S O=R37
U
G = e3,611
D‹KKAT
K ‹ T A P
∑
D Ü fi Ü NLnX
EL‹M
Ln G =
S O R U
AMAÇLARIMIZ
2,996
3,689
3,555
3,807
4,007
SIRA S‹ZDE
D Ü fi Ü N E L ‹ M
SIRA S‹ZDE
Ln X
SIRA S‹ZDE
Afla¤›da verilen grupland›r›lm›fl seri için geometrik ortalamay› hesaplay›n›z.
AMAÇLARIMIZ
Grup Aral›klar›
fi
mi
ln mi
14-18
4
16
2,773
18-22
K ‹ T A P
7
20
2,996
22-26
10
24
3,178
26-30
6
28
3,332
30-34
3
32
3,466
TELEV‹ZYON
‹NTERNET
2. Ünite - Merkezi E¤ilim ve Da¤›l›m Ölçüleri
31
Çözüm: Geometrik ortalamay› hesaplayabilmek için öncelikle grup ortalamalar›n›n (mi) logaritmalar›n› (ln mi) buluruz. Logaritmik grup ortalamalar› ile frekanslar› çarparak toplad›¤›m›zda;
∑ In mi .fi = 94, 234
elde ederiz. Bu durumda geometrik ortalamay›;
In G =
∑ In m i .fi
∑ fi
=
94, 234
= 3,141
30
G = 23,13
olarak buluruz.
Harmonik Ortalama
Harmonik ortalama bir serideki gözlem de¤erlerinin terslerinin aritmetik ortalamas›n›n tersine eflittir. Seri türlerine göre harmonik ortalaman›n hesaplanmas› afla¤›daki eflitliklerdeki gibi yap›lmaktad›r.
Basit serilerde:
H=
S›n›flanm›fl serilerde:
H=
n
1
∑X
i
∑ fi
f
∑ Xi
i
Gruplanm›fl serilerde: H =
∑ fi
f
∑ mi
i
Oran, yüzde ve bölme fleklinde ifade edilen seri de¤erlerinin ortalamas›n› hesaplamada aritmetik ortalama uygun bir ortalama olmay›p, bu gibi durumlarda
harmonik ortalaman›n kullan›m› tercih edilir. Örne¤in, belirli bir zamanda al›nan
yol ile hesaplanan h›z, belirli bir zamanda üretilen miktar ile hesaplanan verim ve
belirli bir miktar için ödenen fiyat gibi de¤iflkenlerin ortalamas›n›n hesaplanmas›nda harmonik ortalaman›n kullan›m› daha uygun olmaktad›r.
Borsada ifllem gören bir hisse senedinin bir haftal›k günlük ifllem fiyatlar› afla¤›daki gibi gerçekleflmifltir. Hisse senedinin haftal›k ortalama fiyat›n› aritmetik ortalama ve harmonik ortalama yöntemleriyle hesaplay›n›z.
Günler
Fiyat (TL/Hisse)
Pazartesi
4,64
Sal›
4,97
Çarflamba
5,22
Perflembe
5,92
Cuma
5,40
ÖRNEK 10
32
Co¤rafi Bilgi Sistemleri ‹çin Temel ‹statistik
Çözüm: Aritmetik Ortalama:
X =
Harmonik Ortalama: H =
∑ Xi
n
n
1
∑X
=
26,15
= 5, 23 TL
5
=
5
= 5, 20 TL
0,9624
i
Örne¤in çözümünden de görüldü¤ü gibi, fiyatla ifade edilen hisse senedi serisinin ortalamas›n› aritmetik ortalama ile hesaplasayd›k, hisse bafl›na ortalama 0,03
TL daha yüksek hesaplayacakt›k.
SIRA S‹ZDE
4
D Ü fi Ü N E L ‹ M
Türkiye’de faaliyet
gösteren bir Banka, tafl›t kredilerine uygulad›¤› faiz oranlar›n› y›l içeSIRA S‹ZDE
risinde ekonomik geliflmelere ba¤l› olarak üç ayda bir olmak üzere 4 kez de¤ifltirmifltir.
Y›l içinde uygulanan faiz oranlar› afla¤›daki gibi oldu¤una göre ortalama ayl›k faiz oran›
D Ü fi Ü N E L ‹ M
nedir?
S O RDönemler
U
S O R U
D‹KKAT
SIRA S‹ZDE
AMAÇLARIMIZ
N N
K ‹ T A P
1. Üç ay
1,05
D ‹ K K A 2.
T Üç ay
1,25
3. Üç ay
1,39
4. Üç ay
SIRA S‹ZDE
0,99
Kareli Ortalama
AMAÇLARIMIZ
Serideki de¤erlerin karelerinin aritmetik ortalamas›n›n kareköküne kareli ortalama
denilir. Seri türlerine göre kareli ortalaman›n hesaplanmas› afla¤›daki eflitliklerdeki
gibi yap›lmaktad›r:
K ‹ T A P
Basit serilerde:
TELEV‹ZYON
Bir seri de¤erinden aritmetik
ortalaman›n ç›kar›lmas› ile
elde edilen sapmalar
serisinin
‹ N T E R toplam›
N E T daima
s›f›ra eflittir
(
)
( ∑ X i - X = 0 ). Bu
nedenle, sapmalar serisinin
ortalamas›n›n
hesaplanmas›nda da kareli
ortalama kullan›l›r.
ÖRNEK 11
Ayl›k FaizOran› (%)
K=
∑ X i2
n
TELEV‹ZYON
S›n›flanm›fl serilerde: K =
‹NTERNET
Gruplanm›fl serilerde: K =
∑ fi .X i2
∑ fi
∑ fi .mi2
∑ fi
Bir seride s›f›r ve/veya farkl› iflaretli (negatif veya pozitif) de¤erler varsa geometrik ve harmonik ortalamalar hesaplanamaz. Bu gibi serilerde, aritmetik ortalaman›n
da mant›kl› sonuçlar vermedi¤inden kuflkulan›l›yorsa, kareli ortalaman›n kullan›m›
tercih edilmektedir. Kareli ortalama, genellikle bir seride s›f›rdan küçük terimlerin
bulundu¤u veya terimler toplam› s›f›ra eflit olan serilerde kullan›lmaktad›r.
Bir madencilik flirketinin y›l›n ilk 6 ay›ndaki faaliyet kar/zararlar› afla¤›daki gibidir. fiirketin ayl›k ortalama karl›l›¤› nedir?
33
2. Ünite - Merkezi E¤ilim ve Da¤›l›m Ölçüleri
Aylar
Ocak
fiubat
Mart
Nisan
May›s
Haziran
Faaliyet Kar/Zarar› (TL)
-5000
-7000
2000
4000
7000
9000
Çözüm: Kar/zarar verileri basit seri oldu¤undan, K =
lama karl›l›¤› hesaplayabiliriz.
n=6 ve
K=
∑ X i2
n
eflitli¤i ile orta-
∑ X i2 = 224000000 oldu¤undan ayl›k ortalama karl›l›¤›;
∑ X i2
n
=
224000000
= 6110,1 TL olarak hesaplar›z.
6
Bir kent merkezinde Ocak ay›nda ölçülen günlük en yüksek hava s›cakl›klar›
afla¤›da grupSIRA S‹ZDE
land›r›lm›fl seri olarak verilmifltir. Ocak ay› günlük ortalama hava s›cakl›¤›n› hesaplay›n›z.
D Ü fi Ü N E L ‹ M
Grup Aral›klar›
Alt
Üst
-8
-4
-4
0
0
4
4
8
8
12
12
16
SIRA S‹ZDE
D Ü fi Ü N E L ‹ M
fi
S O R U
3
SIRA S‹ZDE
S O R U
SIRA S‹ZDE
D ‹ K K A 10
T
D Ü fi Ü N E L 6‹ M
D‹KKAT
D Ü fi Ü N E L ‹ M
7
4
SIRA S‹ZDE
S O R U1
AMAÇLARIMIZ
N N
Normal bir seride ortalamalar aras›nda afla¤›daki gibi bir büyüklük iliflkisi
D ‹ K K A vard›r.
T
Kareli > Aritmetik > Geometrik > Harmonik Ortalama
–
K>X >G>H
K ‹ T A P
SIRA S‹ZDE
Medyan
5
N N
Serideki de¤erler küçükten büyü¤e s›raland›¤›nda tam ortaya
düflen ve seriyi iki
AMAÇLARIMIZ
TELEV‹ZYON
eflit parçaya bölen de¤ere medyan (ortanca) denilir. Medyan, veri de¤erleri içindeki afl›r› küçük ve afl›r› büyük de¤erlerden etkilenmedi¤inden, aritmetik ortalamaya
K ‹ T A P
göre daha güvenlidir. Ancak medyan, basit bir s›ralama ile hesapland›¤›ndan
has‹
N
T
E
R
N
E
T
sas bir ortalama de¤ildir.
S›ralanm›fl veri de¤erleri içerisindeki en küçük veya en büyük de¤erlerin, di¤erlerinden çok daha fazla uzaklaflmas› ile simetrik olmayan çarp›k
ortaya
T E L E da¤›l›mlar
V‹ZYON
ç›kmaktad›r. Örneklenen verilerin da¤›l›m›n›n çarp›k oldu¤u veya seride afl›r› küçük/büyük de¤erlerin bulundu¤u durumlarda, merkezi e¤ilim ölçüsü olarak medyan›n kullan›m› tercih edilebilmektedir.
‹NTERNET
Basit serilerde medyan› bulabilmek için öncelikle veriler küçükten büyü¤e
do¤ru s›ralan›rlar. Daha sonra serideki veri say›s›n›n tek veya çift say›da olup olmad›¤›na göre medyan belirlenir.
SIRA S‹ZDE
S O R U
AMAÇLARIMIZ
D‹KKAT
KSIRA
‹ T S‹ZDE
A P
TAMAÇLARIMIZ
ELEV‹ZYON
K ‹ T A P
‹NTERNET
TELEV‹ZYON
‹NTERNET
34
Co¤rafi Bilgi Sistemleri ‹çin Temel ‹statistik
n+1
'inci gözlem de¤eri medyand›r.
2
n
n
– Veri say›s› çift ise; ve + 1'inci gözlem de¤erlerinin aritmetik ortalamas›
2
2
medyand›r.
S›n›flanm›fl serilerde medyan, ((∑ fi ) + 1) / 2'inci frekans› içeren terimdir. Tam
ortaya düflen bu terimi bulabilmek için frekanslar, kümülatif (toplam) frekanslar
haline dönüfltürülür. Kümülasyon ifllemi genellikle küçükten büyü¤e yap›l›r.
Grupland›r›lm›fl serilerde öncelikle medyan grubunun belirlenmesi gerekir.
Medyan grubunun belirlenebilmesi için de öncelikle ayr› bir sütunda toplam frekanslar fi / 2 ifllemi ile medyan grubunun s›ra de¤eri belirlenir. Toplam frekanslar›n yar›s›na karfl›l›k bu de¤eri içeren grup, medyan grubudur. Medyan grubunun
de¤erleri ele al›narak, afla¤›daki eflitlikle medyan hesaplan›r.
– Veri say›s› tek ise;
Burada; Lm = medyan
grubunun alt s›n›r›n›, Sm =
medyan grubunun aral›¤›n›,
(∑ fi / 2) = toplam
frekanslar›n yar›s›n›,
m-1 


∑ fi  = medyan
 i=1 
grubundan bir önceki
grubun toplam frekans›n›,
fm = medyan grubunun
frekans›n› ifade etmektedir.
ÖRNEK 12
Me = Lm



+ Sm




 ∑ f  m-1 

i 

 2  - ∑ fi 

  i=1 
.


fm


Afla¤›daki basit serinin medyan›n› hesaplay›n›z.
Xi
–––––––––
8
12
19
23
28
n+1 5+1
=
= 3'üncü
Çözüm: Basit serinin veri say›s› (n = 5) tek oldu¤undan,
2
2
gözlem de¤eri olan 19 medyand›r. Bu durumda, seriyi tam ortadan ikiye bölen
medyan de¤eri; Me = 19 olmaktad›r.
ÖRNEK 13
Afla¤›daki basit serinin medyan›n› hesaplay›n›z.
Xi
–––––––––
8
12
19
23
28
35
n 6
= = 3 ve
Çözüm: Basit serinin veri say›s› (n=6) çift oldu¤undan,
2 2
n
6
+ 1 = + 1 = 4'üncü gözlem de¤erlerinin aritmetik ortalamas› medyan olacakt›r.
2
2
3’üncü gözlem de¤eri 19 ve 4’üncü gözlem de¤eri 23 oldu¤una göre medyan›;
19 + 23
= 21
2
olarak hesaplar›z.
Me =
2. Ünite - Merkezi E¤ilim ve Da¤›l›m Ölçüleri
Afla¤›da verilen s›n›fland›r›lm›fl serinin medyan›n› hesaplay›n›z.
Xi
fi
––––––––
––––––––
15
2
18
6
24
12
27
7
32
3
35
ÖRNEK 14
Çözüm: S›n›flanm›fl serilerde medyan, ((∑ fi ) + 1) / 2'inci frekans› içeren terim
oldu¤undan, öncelikle her bir grubun kümülatif frekanslar› bulunur.
X
––––––––
15
18
24
27
32
f
–––––––––
2
6
12
7
3
∑ fi
––––––––––
2
8
20
27
30
∑ fi + 1 = 30 + 1 = 15,5'inci kümülatif frekans› içeren de¤er 20 oldu¤undan;
2
2
Me = 24 bulunur.
Mermer iflletmelerinde çal›flan iflçi say›lar› ile ilgili yap›lan bir araflt›rmada afla¤›daki grupland›r›lm›fl seri elde edilmifltir. Buna göre mermer iflletmelerinde çal›flan
iflçi say›s›n›n medyan ortalamas› nedir?
Grup Aral›klar›
(Çal›flan Say›s›)
–––––––––––––
0-30
30-60
60-90
90-120
120-150
fi
(iflletme Say›s›)
––––––––––––––––
8
20
15
6
3
Çözüm: Grupland›r›lm›fl serinin medyan›n› bulabilmek için öncelikle, her bir
grubun kümülatif frekans›n› buluruz.
Grup Aral›klar›
(Çal›flan Say›s›)
–––––––––––––
0-30
30-60
60-90
90-120
120-150
fi
(iflletme Say›s›)
––––––––––––––––
8
20
15
6
3
Medyan grubunun frekans› =
∑ fi
2
=
∑ fi
––––––––––
8
28
43
49
52
52
= 26
2
Medyan grubunun frekans› (26), toplam frekanslar›n 8 ile 28 oldu¤u aral›kta
yer ald›¤›ndan, medyan grubu 30-60 grubudur. Bu durumda;
ÖRNEK 15
36
Co¤rafi Bilgi Sistemleri ‹çin Temel ‹statistik
Lm = 30, Sm = 10,
Me = Lm




+ Sm




 m-1 
(∑ fi / 2) = 26, ∑ fi  = 8
 i=1 
ve fm = 20 oldu¤undan,
 ∑ f  m-1 

i 

 2  - ∑ fi 

  i=1 
.


fm



 26 - 8 



M e = 30 + 
10.
 = 39

20 




Me = 39 kifli olarak hesaplan›r.
SIRA S‹ZDE
6
Bir hastanede
sigara
kullananlar›n büyük tansiyonlar› ölçüldü¤ünde afla¤›daki da¤›l›m elSIRA
S‹ZDE
de edilmifltir. Sigara kullananlar›n büyük tansiyonlar›n›n medyan ortalamas› kaçt›r?
D Ü fi Ü N E L ‹ M
D Ü fi Ü N E L ‹ M Grup Aral›klar›
Alt
S O R U
S O R U
D‹KKAT
SIRA S‹ZDE
AMAÇLARIMIZ
N N
Basit seriler
s›n›fland›r›lmam›fl
olduklar›ndan, en çok
tekrarlanan
bulmak
K ‹ T A de¤eri
P
söz konusu olamaz. Bu
nedenle de, basit seriler için
mod bulunamaz.
TELEV‹ZYON
‹NTERNET
Mod
120
130
D140
‹KKAT
150
160 S‹ZDE
SIRA
Frekanslar
Üst
fi
130
140
150
160
170
5
12
18
16
9
AMAÇLARIMIZ
Bir seride en çok gözlenen (tekrarlanan) de¤ere veya frekans› en büyük olan de¤ere mod denilir. Mod, serideki frekanslar›n önemli bir k›sm›n› içerdi¤inden, ortalamalar aras›nda
en temsili olan›d›r. Ayr›ca mod, anormal afl›r› de¤erlerin etkisi alK ‹ T A P
t›nda kalmaz. Bununla birlikte mod, tüm veri de¤erlerini göz önünde bulundurmad›¤› için tutarl› olmayan bir merkezi e¤ilim ölçüsüdür. S›n›fland›r›lm›fl ve grupland›r›lm›fl seriler için mod hesaplanabilir.
TELEV‹ZYON
S›n›flanm›fl serilerde, frekanslar› içeren sütunda en yüksek frekans saptand›ktan
sonra, buna karfl›l›k gelen de¤er araflt›r›larak mod bulunabilir.
Grupland›r›lm›fl serilerde mod de¤eri hesaplan›rken öncelikle, frekans› en bü‹ N T E grubu
R N E T belirlenir. Mod grubu belirlendikten sonra, bu grup içerisinyük olan mod
de yer alan modun de¤eri, grup frekans› ile bundan bir önceki ve bir sonraki gruplar›n frekanslar› dikkate al›narak hesaplan›r.
Gruplanm›fl serilerde mod, afla¤›daki eflitlikle hesaplan›r.




∆1

M o = L mo + 
Smo .



∆
∆
+

1
2


∆1 = fmo - fmo-1
∆2 = fmo - fmo+1
Burada, Lmo = mod grubunun alt s›n›r›, Smo = mod grubunun aral›¤›, fmo= mod
grubunun frekans›, fmo-1 = mod grubundan önceki grubun frekans› ve fmo+1= mod
grubundan bir sonraki grubun frekans›d›r.
37
2. Ünite - Merkezi E¤ilim ve Da¤›l›m Ölçüleri
Bir kent merkezinde hane halk› büyüklü¤ünün mod ortalamas›n› araflt›rmak üzere çal›flma yap›lm›fl olup, afla¤›daki grupland›r›lm›fl seri elde edilmifltir. Hane halk› büyüklü¤ünün mod ortalamas›n› hesaplay›n›z.
Grup Aral›klar›
(Hane Halk›-Kifli)
–––––––––––––––
0-2
2-4
4-6
6-8
8-10
10-12
ÖRNEK 16
fi
(Hane Say›s›-%)
–––––––––––––––––
12
27
42
13
4
2
Çözüm: En büyük frekans› (42) içeren mod grubu 4-6 grubu oldu¤undan, mod
grubu dikkate al›narak afla¤›daki de¤erler belirlenir.
fmo = 42,
fmo-1 = 27,
fmo+1 = 13,
Lmo = 4,
Smo = 2
∆1 = fmo - fmo-1 = 42 - 27 = 15
∆2 = fmo - fmo+1 = 42 - 13 = 29
M o = L mo




∆1

+
Smo .



+
∆
∆

1
2





15 

Mo = 4 + 
2.
 = 4,7


15
+
29




Mo = 4,7 kifli.
DA⁄ILIM ÖLÇÜLER‹
SIRA göstermekle
S‹ZDE
Ortalamalar, rassal örneklenmifl verilerin merkezi e¤ilim ölçülerini
birlikte, bu de¤er çevresindeki yay›l›m›n büyüklü¤ü hakk›nda bir bilgi vermez. Rassal
örneklenen veri seti için bulunan merkezi e¤ilim ölçüsünü yorumlamak
D Ü fi Ü N E L ‹ M ve birden
fazla veri seti için verilerin da¤›l›mlar› aras›nda karfl›laflt›rmalar yapabilmek amac›yla baz› da¤›l›m ölçüleri kullan›labilmektedir. Da¤›l›m ölçüleri olarak ço¤unlukla deS O R U
¤iflkenlik aral›¤›, varyans, standart sapma ve de¤iflkenlik katsay›s›
kullan›lmaktad›r.
Örneklenen verilerin
da¤›l›mlar›n›n
yay›lmalar›n›n nas›l oldu¤u
da önemlidir. Örne¤in, iki
ayr› kent merkezinin ocak ay›
hava kirlili¤i (kükürt)
aritmetik ortalamas› 40
µg/m3 olarak ölçüldü¤ünde,
her iki kentin hava
kirlili¤inin ayn› oldu¤unu
söylenebilir. Ancak, bir kent
merkezinde hava kirlili¤i bir
ay içerisinde 35-45 µg/m3
aras›nda de¤ifliyor iken
di¤er kent merkezinde
5-75
SIRA S‹ZDE
µg/m3 aras›nda de¤ifliyorsa,
bu durumda her iki kentin
hava kirlili¤i düzeylerinin
farkl› oldu¤u;Daritmetik
Ü fi Ü N E L ‹ M
ortalamalar›n da hava
kirlili¤i düzeyini aç›klamakta
pek yeterli olmad›¤›
S O R U
anlafl›lacakt›r.
Da¤›l›m ölçüsü, seriyi oluflturan verilere sabit bir say› eklendi¤indeD veya
‹ K K A ç›kar›ld›¤›nda
T
de¤eri de¤iflmeyen ölçüdür.
De¤iflkenlik Aral›¤›
SIRA S‹ZDE
N N
Örneklemeler sonucu elde edilen veriler aras›nda var olan en küçük ve en büyük
de¤er aras›ndaki fark de¤iflkenlik aral›¤› (R) olarak tan›mlan›r.
AMAÇLARIMIZ
R = Xenb - Xenk
K ‹ T ölçüt
A P de¤iflkenDa¤›l›m ölçüleri içinde hesaplan›fl› en kolay olan fakat en kaba
lik aral›¤›d›r. De¤iflkenlik aral›¤›, özellikle veri say›s›n›n çok oldu¤u durumlarda
güvenilir de¤ildir.
D‹KKAT
SIRA S‹ZDE
AMAÇLARIMIZ
K ‹ T A P
TELEV‹ZYON
TELEV‹ZYON
‹NTERNET
‹NTERNET
38
Co¤rafi Bilgi Sistemleri ‹çin Temel ‹statistik
Varyans ve Standart Sapma
Verilerin da¤›l›m›n› veya yay›l›m›n›n büyüklü¤ünü ölçmek için en çok kullan›lan
parametre varyanst›r. Varyans, rassal örneklenmifl verilerin aritmetik ortalamaya
göre farklar›n›n karelerinin toplam›n›n ortalamas› olup, verilerin ortalamadan sapmas›n› ve ortalamaya göre yay›lman›n büyüklü¤ünü gösteren bir ölçüdür.
Basit serilerde varyans, afla¤›daki eflitlikle hesaplanabilir.
SIRA S‹ZDE
nSIRA S‹ZDE 2
2
S =
D Ü fi Ü N E L ‹ M
∑ ( X i - X)
i=1
D Ü fi Ü NnE L ‹ M
S O R U
Burada; S2 = da¤›l›m›n varyans›, Xi = i’inci rassal örneklenmifl de¤iflkenin de¤e–
S O R U
ri, X = da¤›l›m›n örnek kütle aritmetik ortalamas›, n = kütlenin örnek say›s›d›r.
D‹KKAT
Basit serilerde
D ‹ Ke¤er
K A Tn<30 ise, varyans hesaplamada payda “n-1” olur.
SIRA S‹ZDE
N N
k
SIRA S‹ZDE
2
S›n›fland›r›lm›fl serilerde ise varyans; S =
AMAÇLARIMIZ
K ‹ T A P
∑ ( X i - X)
2
k
∑ fi
AMAÇLARIMIZ
i=1
eflitli¤i ile
Burada, k = s›n›f say›s›, fi = i’inci s›n›f›n frekans›d›r.
K ‹ hesaplanabilir.
T A P
l
TELEV‹ZYON
.fi
i=1
TELEV‹ZYON
Grupland›r›lm›fl serilerde de varyans; S =
2
∑ ( m i - X)
2
.fi
i=1
l
∑ fi
i=1
‹NTERNET
N T Ehesaplanabilir.
RNET
eflitli¤i ‹ile
Burada, l = grup say›s›n›, mi = i’inci grubun ortalama-
s›n›, fi = i’inci grubun frekans›n› göstermektedir.
Varyans›n büyük olmas›, de¤iflkenin ortalama çevresindeki yay›l›m›n›n büyük
oldu¤unu gösterir. fiekil 2.1.’deki A1 ve A2 de¤iflkenlerinin ortalamalar› ayn› olmakla birlikte A1’in varyans› daha büyüktür. Bu nedenle, A1’in ortalamadan uzak
de¤erler alma olas›l›¤›n›n daha büyük oldu¤unu söylemek mümkündür.
Varyans›n boyutu, rassal de¤iflkenin boyutunun karesi gibidir. Bu nedenle ço¤u zaman, varyans›n karekökü olan “standart sapma” kullan›l›r.
fiekil 2.1
Varyanslar› farkl›
iki de¤iflkenin
frekans da¤›l›fl›
f´(x)
A2
2
σA
1
2
σA
A1
2
2. Ünite - Merkezi E¤ilim ve Da¤›l›m Ölçüleri
39
De¤iflkenlik Katsay›s›
Ortalamalar› birbirinden farkl› olan örnek kütlelerden hangisinin yay›l›m›n›n büyük oldu¤unu anlamak için de, boyutsuz bir katsay› olan “de¤iflkenlik (varyasyon)
katsay›s›”ndan yararlan›l›r. De¤iflkenlik katsay›s› afla¤›daki gibi hesaplan›r.
–
C = σ/ X
De¤iflkenlik katsay›s›, ortalamaya göre yay›l›m›n büyüklü¤ünü gösteren bir katsay›d›r.
‹çme suyu temin edilmesi tasarlanan iki akarsuda (A ve B) su kalitesini belirlemek amac›yla ask›daki at›k maddeler (mg/l) analiz edilmifl olup, elde edilen veriler afla¤›daki gibidir. ‹çme suyunda ask›daki at›k madde miktar›n›n mümkün oldu¤unca az olmas› istendi¤ine göre, aritmetik ortalama, standart sapma ve de¤iflkenlik katsay›lar› dikkate al›nd›¤›nda, hangi akarsu içme suyu temini için tercih
edilmelidir?
A (mg/l)
1,8
3,9
5,5
6,6
9,8
4,7
12,4
7,6
6,7
8,3
7,2
4,9
B (mg/l)
5,6
5,2
4,7
9,4
9,1
4,4
8,2
7,8
6,3
5,8
9,6
6,7
Basit serinin aritmetik ortalamas›na göre;
X=
∑ Xi
n
–
–
X A = 79,4 / 12 = 6,6 mg/l
X B = 82,8 / 12 = 6,9 mg/l
–
–
X A < X B oldu¤undan A akarsuyu tercih edilir.
Standart sapmalar;
∑ ( X i - X)
2
S=
SA =
n-1
86,18
= 2,8 mg / l
12 -1
SB =
38,16
= 1,9 mg / l
12 -1
ÖRNEK 17
40
Co¤rafi Bilgi Sistemleri ‹çin Temel ‹statistik
S B < S A oldu¤undan B akarsuyu tercih edilmelidir. Aritmetik ortalama ve standart sapman›n farkl› seçenekleri en iyiledi¤i durumlarda, mutlaka de¤iflkenlik katsay›s›n› da hesaplayarak karar vermek gerekir.
De¤iflkenlik katsay›lar›;
C=
S
X
CA =
2,8
= 0, 424
6,6
CB =
1,9
= 0, 275
6, 9
CB < CA oldu¤undan B akarsuyu içme suyu temini için tercih edilir. A akarsuyunda ask›daki at›k madde miktar› ortalama olarak daha az olmakla birlikte, de¤iflkenlik daha fazlad›r.
2. Ünite - Merkezi E¤ilim ve Da¤›l›m Ölçüleri
41
Özet
N
A M A Ç
1
Merkezi e¤ilim ölçülerini hesaplay›p kullanmak.
Verileri tan›mlamaya ve özetlemeye yarayan merkezi e¤ilim ölçüleri, verilerin tümünü temsil eden
ve merkez noktas›na yak›n bir de¤er oldu¤undan, ortalamalar olarak da tan›mlanmaktad›r. Her
verinin a¤›l›klar›n›n (önem derecelerinin) birbirine eflit oldu¤u durumlarda basit aritmetik ortalama, farkl› oldu¤u durumlarda ise a¤›rl›k ortalama
kullan›lmaktad›r. Verilerin ani ve anormal farkl›l›klar gösterdi¤i ya da yüzde ve oranlarla ifade
edildi¤i durumlarda geometrik ortalama kullan›lmaktad›r. Oran, yüzde ve bölme fleklinde ifade
edilen seri de¤erlerinin ortalamas›n› hesaplamada harmonik ortalaman›n kullan›m› tercih edilmektedir. Bir seride s›f›r ve/veya farkl› iflaretli
(negatif veya pozitif) de¤erler varsa, kareli ortalaman›n kullan›m› tercih edilmektedir. Merkezi
e¤ilim ölçüleri serinin basit, s›n›fland›r›lm›fl veya
grupland›r›lm›fl olma flekillerine göre farkl› yöntemlerle hesaplanabilmektedir.
Serideki de¤erlerin tam ortas›na düflen ve seriyi
iki eflit parçaya bölen medyan (ortanca), veri de¤erleri içindeki afl›r› küçük ve afl›r› büyük de¤erlerden etkilenmez. Ancak medyan, basit bir s›ralama ile hesapland›¤›ndan hassas bir ortalama
de¤ildir. Bir seride en çok gözlenen (tekrarlanan) de¤ere veya frekans› en büyük olan de¤er
olan mod ise, ortalamalar aras›nda en temsili
olan›d›r.
N
A M A Ç
2
Merkezi e¤ilim ve da¤›l›m ölçülerini hesaplay›p
kullanmak.
Rassal örneklenen veriler için bulunan merkezi
e¤ilim ölçüsünü yorumlamak ve birden fazla veri seti için verilerin da¤›l›mlar› aras› karfl›laflt›rmalar yapabilmek amac›yla de¤iflkenlik aral›¤›, varyans, standart sapma ve de¤iflkenlik katsay›s› kullan›lmaktad›r.
Örneklenen verilerin en küçük ve en büyük de¤eri aras›ndaki farka de¤iflkenlik aral›¤› (R) denilmektedir. Örneklenen verilerin aritmetik ortalamaya göre farklar›n karelerinin toplam›n›n ortalamas›na varyans denilmekte olup, varyans ortalamaya göre yay›lman›n büyüklü¤ünü gösterir.
Varyans›n kareköküne de standart sapma denilir. Standart sapman›n ortalamaya bölünmesiyle
elde edilen ölçüte ise de¤iflkenlik katsay›s› denilmektedir.
42
Co¤rafi Bilgi Sistemleri ‹çin Temel ‹statistik
Kendimizi S›nayal›m
1. Örneklenen 10 adet veri ile oluflturulan seride, gözlem de¤erleri toplam› ∑ X = 80 oldu¤una göre, serinin aritmetik ortalamas› kaçt›r?
a. 2
b. 4
c. 6
d. 8
e. 10
2. Grup Aral›klar›
fi
–––––––––––––––––––––
2-4
2
4-6
6
6-8
10
8-10
8
10-12
4
Yukar›daki grupland›r›lm›fl serinin medyan› kaçt›r?
a. 4,5
b. 5,2
c. 6,4
d. 7,4
e. 10,1
5. Grup Aral›klar›
fi
–––––––––––––––––––––
0-4
3
4-8
7
8-12
10
12-16
7
16-20
3
Yukar›daki grupland›r›lm›fl serinin aritmetik ortalamas› 10 oldu¤una göre, da¤›l›m›n varyans› kaçt›r?
a. 4,5
b. 20,3
c. 10,4
d. 16,8
e. 8,8
6.
X
––––––––
1
2
4
5
10
Yukar›daki basit serinin harmonik ortalamas› kaçt›r?
a. 2,05
b. 2,25
c. 2,44
d. 4,10
e. 4,40
3. Grup Aral›klar›
fi
–––––––––––––––––––––
20-30
10
30-40
30
40-50
40
50-60
25
60-70
5
Yukar›daki grupland›r›lm›fl serinin modu kaçt›r?
a. 34
b. 44
c. 46
d. 48
e. 52
7. Örneklenen veri say›s› n=5 ve verilerin kareleri toplam› ∑ X 2i = 8000 olan, serinin kareli ortalamas› kaçt›r?
a. 10
b. 20
c. 25
d. 35
e. 40
4. Aritmetik ortalamas› 20 ve de¤iflkenlik katsay›s› 0,4
olan bir da¤›l›m›n standart sapmas› kaçt›r?
a. 4
b. 8
c. 16
d. 18
e. 20
8. 5, -4, 2, 0, -6, 8, 12, 15
Yukar›daki basit serinin kareli ortalamas› kaçt›r?
a. 0
b. 4
c. 8
d. 10
e. 12
2. Ünite - Merkezi E¤ilim ve Da¤›l›m Ölçüleri
43
Kendimizi S›nayal›m Yan›t Anahtar›
9. 6, 8, 8, 6, 4, 5, 5, 6, 6, 7, 7, 4, 7, 5, 6
Yukar›daki basit serisinin modu kaçt›r?
a. 4
b. 5
c. 6
d. 7
e. 8
1. d
10.
5. a
X
–––––––––
2
12
8
22
16
Yukar›daki basit serinin de¤iflim aral›¤› kaçt›r?
a. 4
b. 6
c. 10
d. 14
e. 20
2. d
3. b
4. b
6. c
7. e
8. c
9. c
10. e
Yan›t›n›z yanl›fl ise, “Aritmetik Ortalama” konusunu gözden geçiriniz.
Yan›t›n›z yanl›fl ise, “Medyan” konusunu gözden geçiriniz.
Yan›t›n›z yanl›fl ise, “Mod” konusunu gözden
geçiriniz.
Yan›t›n›z yanl›fl ise, “De¤iflkenlik Katsay›s›” konusunu gözden geçiriniz.
Yan›t›n›z yanl›fl ise, “Varyans ve Standart Sapma” konusunu gözden geçiriniz.
Yan›t›n›z yanl›fl ise, “Harmonik Ortalama” konusunu gözden geçiriniz.
Yan›t›n›z yanl›fl ise, “Kareli Ortalama” konusunu gözden geçiriniz.
Yan›t›n›z yanl›fl ise, “Kareli Ortalama” konusunu gözden
Yan›t›n›z yanl›fl ise, “Mod” konusunu gözden
geçiriniz.
Yan›t›n›z yanl›fl ise, “De¤iflkenlik Aral›¤›” konusunu gözden geçiriniz.
44
Co¤rafi Bilgi Sistemleri ‹çin Temel ‹statistik
S›ra Sizde Yan›t Anahtar›
S›ra Sizde 1
–
X = 9 ve
X =
∑ X i = 180 olarak verilmifl olup n = ?
∑ Xi
n
⇒n=
∑ Xi
X
=
180
= 20
9
ui =
eflitli¤i ile hesaplar›z.
1000
Grup S›n›rlar›
Frekanslar Grup
Küçültülmüfl
Ortalamalar› Grup Ort.
Alt
Üst (den az)
fi
mi
ui
0
1000
3
500
-2
1000
2000
6
1500
-1
2000
3000
12
2500
0
3000
4000
9
3500
1
4000
5000
5
4500
2
∑ ui .fi = 7 ve ∑ fi = 35 oldu¤undan, u =
7
= 0, 2
35
olarak hesaplar›z.
–
–
Aritmetik ortalama; X = m0 + (u .A) = 2500 + (0,2.1000)
= 2700 bulunur.
S›ra Sizde 3
Xi
ai
50
300
40
350
60
150
70
100
55
200
∑ ai .X i
X =
∑ ai
∑
1
Xi
=
4
= 1,15 %
3, 482
Grup Aral›klar›
mi
m2i
3
-6
36
7
-2
4
4
10
2
4
4
8
6
6
36
8
12
4
10
100
12
16
1
14
196
Alt
Üst
-8
-4
-4
0
0
fi
∑ fi
= 31 ve ∑ fi .mi2 = 988 oldu¤undan;
K=
∑ fi .mi2
∑ fi
=
988
= 5,65 °C hesaplan›r.
31
S›ra Sizde 6
Grup S›n›rlar›
Frekanslar
Üst
fi
120
130
5
5
130
140
12
17
140
150
18
35
150
160
16
51
160
170
9
60
Medyan grubunun frekans› =
(∑ fi ) = 60 = 30
Xi
Ayl›k Faiz Oran› (%)
1. Üç ay
1,05
2. Üç ay
1,25
3. Üç ay
1,39
4. Üç ay
0,99
2
2
Medyan grubu 140-150 grubudur.
m-1 
(∑ fi / 2) = 30, ∑ fi  = 17

 30 -17 
M e = 140 + 10.
 = 147, 2

18 
S›ra Sizde 4
∑ fi
Alt
Lm = 140, Sm = 10,
= 18 oldu¤undan,
56000
=
= 50,9
1100
Dönemler
n
S›ra Sizde 5
S›ra Sizde 2
m0 = 2500 ve A = 1000 oldu¤una göre, bu durumda
küçültülmüfl grup ortalamalar›n›;
mi - 2500
H=
 i=1 
ve fm
2. Ünite - Merkezi E¤ilim ve Da¤›l›m Ölçüleri
Yararlan›lan Kaynaklar
Çömlekçi, N. (1989). Temel ‹statistik ‹lke ve Teknikleri.
‹stanbul: Bilim Teknik.
Gürsakal, N. (2001). Bilgisayar Uygulamal› ‹statistik I.
No:1029. ‹stanbul: Alfa.
Gürtan, K. (1982). ‹statistik ve Araflt›rma Metodlar›.
No:2941. ‹stanbul: ‹stanbul Üniversitesi.
Konuk, A. & Önder, S. (1999). Maden ‹statisti¤i. Mühendislik Mimarl›k Fakültesi Maden Mühendisli¤i Bölümü. Eskiflehir: Eskiflehir Osmangazi Üniversitesi.
Orhunbilge, N. (2000). Tan›msal ‹statistik Olas›l›k ve
Olas›l›k Da¤›l›mlar›. ‹flletme Fakültesi Yay›n No:
279. ‹stanbul: ‹stanbul Üniversitesi.
Ünver, Ö. & Gamgam, H. (2006). Uygulamal› Temel ‹statistik Yöntemler. Ankara: Seçkin.
Yüzer, A.F. (Ed.) (2009). ‹statistik. Aç›k Ö¤retim Fakültesi Yay›n No: 771. Eskiflehir: Anadolu Üniversitesi.
45
CO⁄RAF‹ B‹LG‹ S‹STEMLER‹ ‹Ç‹N TEMEL
‹STAT‹ST‹K
3
Amaçlar›m›z
N
N
N
Bu üniteyi tamamlad›ktan sonra;
Kesikli ve sürekli rassal de¤iflken kavram›n› ö¤renerek verilerin uygun da¤›l›m modelini seçebilecek,
Kesikli rassal de¤iflkenlerin da¤›l›m modellerinin (Binom ve Poission) parametrelerini hesaplay›p, spesifik uygulamalarda da¤›l›m parametrelerini
kullanabilecek,
Sürekli rassal de¤iflkenlerin da¤›l›m modellerinin (Normal ve Lognormal)
parametrelerini hesaplay›p, spesifik uygulamalarda da¤›l›m parametrelerini
kullanabilecek bilgi ve becerilere sahip olacaks›n›z.
Anahtar Kavramlar
•
•
•
•
•
•
Kesikli Da¤›l›m
Sürekli Da¤›l›m
Binom Da¤›l›m›
Poisson Da¤›l›m›
Normal Da¤›l›m
Lognormal Da¤›l›m
•
•
•
•
•
•
Standart Normal Da¤›l›m
Çarp›kl›k Katsay›s›
Bas›kl›k Katsay›s›
Varyans
Standart Sapma
Ortalama
‹çindekiler
Co¤rafi Bilgi
Sistemleri için Temel
‹statistik
Olas›l›k Da¤›l›m
Modelleri
• OLASILIK DA⁄ILIMLARINA GENEL
BAKIfi
• BAZI KES‹KL‹ (B‹NOM VE POISSON)
OLASILIK DA⁄ILIM MODELLER‹
• BAZI SÜREKL‹ (NORMAL VE
LOGNORMAL) OLASILIK DA⁄ILIM
MODELLER‹
Olas›l›k Da¤›l›m Modelleri
OLASILIK DA⁄ILIMLARINA GENEL BAKIfi
Rassal de¤iflkenlerin tüm mümkün sonuçlar›n›n olas›l›klar›n›n say›sal veya grafiksel sunumuna olas›l›k da¤›l›mlar› denilmektedir. Rassal örneklenen de¤iflkenlerin
ald›¤› de¤erlerin olas›l›k da¤›l›m flekli kesikli veya sürekli olabilmektedir.
Rassal örneklenen verilerin ald›¤› de¤erler bir eksen üzerinde kesintisiz bir
flekilde s›ralanabiliyorsa ve bir aral›ktaki bütün de¤erleri alabiliyorsa, bu de¤iflkenler sürekli de¤iflkenler olarak tan›mlanmaktad›r. Sürekli de¤iflkenlerde, iki
de¤iflken de¤eri aras›na sonsuz say›da de¤er yerlefltirmek mümkündür. Buna
karfl›l›k, rassal örneklenen bir de¤iflken sadece belirli say›da de¤erler alabiliyor
ve yaln›zca say›labilir say›da de¤erler al›yorsa, bu de¤iflken kesikli de¤iflken
olarak tan›mlanmaktad›r. Kesikli de¤iflkenlerde, iki de¤iflken aras›nda sonlu say›da de¤er bulunmaktad›r.
Örne¤in, Üniversite ö¤rencilerinin bir dersten alm›fl olduklar› harf notlar›n›n
katsay›lar›n› s›n›fland›rarak sundu¤umuzda, elde edece¤imiz da¤›l›m kesikli olur.
Ö¤rencilerin bir dersten alaca¤› harf notunun katsay›s› 1, 2, 3 veya 4 olabilir. Buna karfl›l›k, s›n›ftaki ö¤rencilerin genel not ortalamalar›n› grupland›rarak sundu¤umuzda elde edece¤imiz da¤›l›m ise sürekli olur. Ö¤rencilerin tüm derslerden ald›klar› harf notlar›n›n genel ortalamas› 1.2, 2.6, 2.9 veya 3.4 gibi ara de¤erleri de
alabilece¤inden, genel not ortalamalar› da¤›l›m› sürekli olur.
Kesikli de¤iflkenlerde, belirli de¤erlerin noktasal olarak gerçekleflme olas›l›klar› belirlenebilir. Ancak, sürekli rassal de¤iflkenlerde belirli de¤erlere olas›l›klar verilemez. Örne¤in, kesikli bir de¤iflken olarak hava s›cakl›¤›n›n 20 °C olma olas›l›¤›
hesaplanabilir. Ancak, sürekli de¤iflken olarak hava s›cakl›¤›n›n tan›mlanmas› halinde, hava s›cakl›¤›n›n belirli aral›¤› (örne¤in 18-22 °C) için gerçekleflme olas›l›¤›
hesaplanabilir.
Kesikli veya sürekli de¤iflkenlerin olas›l›k da¤›l›m›n›, matematiksel modellerle
ifade etmek mümkündür.
BAZI KES‹KL‹ OLASILIK DA⁄ILIM MODELLER‹
Co¤rafi bilgi sitemleri kapsam›nda örneklenen birçok kesikli da¤›lm›fl de¤iflkenler
için Binom ve Poisson da¤›l›m modeli kullan›labilmektedir. Bu nedenle, bu bölümde kesikli da¤›l›mlardan sadece Binom ve Poisson da¤›l›m modellerinin hesaplanmas›n› ve bu parametrelerin uygulamada kullan›m›n› ele alaca¤›z.
48
Co¤rafi Bilgi Sistemleri ‹çin Temel ‹statistik
Binom Da¤›l›m›
X rassal de¤iflkeninin baflar›
için 1 ve baflar›s›zl›k için 0
de¤erini ald›¤› durumda, X
rassal de¤iflkeninin olas›l›k
fonksiyonunun P(X=1)=p ve
P(X=0)=1-p=q veya
P(X=x)= px(1-p)1-x oldu¤u
da¤›l›mlara Bernoulli
da¤›l›m› denilmektedir.
Binom deneydeki her
tekrara, Bernoulli denemesi
ya da s›namas›
denilmektedir.
Rassal koflullarda gerçeklefltirilen Bernoulli deneyleri sonucunda biri baflar› di¤eri
baflar›s›zl›k olmak üzere iki farkl› sonuç ortaya ç›kar. Örne¤in, bir fabrika üretim
hatt›ndan ç›kan ürünün kusursuz veya kusurlu olmas›, yere at›lan cam barda¤›n k›r›lmas› veya k›r›lmamas›, üzerine bas›nç uygulanan beton örne¤inin k›r›lmas› veya
sa¤lam kalmas› gibi baz› deneylerde iki farkl› sonuç vard›r.
Rassal olarak yap›lan n tekrarl› bir deneyde her tekrarda iki farkl› (kesikli) sonuçtan birinin gelmesi söz konusu ise, istenen sonucun gelme olas›l›klar›n›n bulunmas› amac›yla Binom olas›l›k da¤›l›m› kullan›lmaktad›r. Örne¤in bir seramik
fabrikas›nda üretilen fayanslar›n kusurlu olma olas›l›¤› % 1 ise, üretim band›ndan
rassal olarak örneklenen 10 adet fayans›n içinden bir tanesinin kusurlu olma olas›l›¤›n› Binom olas›l›k da¤›l›m›n› kullanarak belirleyebiliriz.
Bernoulli deneylerinin n kez tekrarlanmas› halinde, bu deneylerdeki baflar›l›
sonuçlar›n toplam› olan X rassal de¤iflkeni için afla¤›daki koflullar gerçeklefliyorsa,
bu rassal de¤iflken Binom rassal de¤iflkeni olarak tan›mlan›r.
• Deneyde, baflar›l› olma olas›l›¤› p ve baflar›s›z olma olas›l›¤› (1-p) olmak
üzere iki sonuç olmal›d›r.
• Deneylerin tümü (n), ayn› koflullar alt›nda gerçeklefltirilmelidir.
• Her deneme sonucunda baflar›l› olma olas›l›¤› p ve baflar›s›zl›k olas›l›¤› q
ayn›d›r.
• Denemeler birbirinden ba¤›ms›z olmal› ve deney süresince n sabit kalmal›d›r.
Bir ana kütlede sonucun baflar›l› olma olas›l›¤› p ve baflar›s›z olma olas›l›¤›
q=1-p ise, bu ana kütleden çekilecek n adet örnek kütle içerisinden rassal ve iadeli olarak x adet birim çekildi¤inde, x adet birimin de baflar›l› gelme olas›l›¤›
afla¤›daki Binom aç›l›m› ile hesaplanabilir.
P( X = x ) =
Faktöriyel, (!) sembolü ile
gösterilir. n!, 1’den n’e
kadar olan say›lar›n›n yan
yana yaz›l›p çarp›m›
demektir. Örne¤in, 5! demek
0’dan 5’e kadar say›lar›n
yan yana yaz›l›p çarp›m›
olup, 5!=120’dir.
ÖRNEK 1
n!
. p x . q n− x , x= 0,1,2,3,....,n
x !( n − x)!
Burada, !: ‹lgili birimin faktöriyelini göstermektedir.
Binom da¤›l›m› eflitli¤i ile belirli bir baflar› say›s›na karfl›l›k gelen olas›l›k de¤eri bulunabildi¤i gibi, belirli bir aral›¤a düflen baflar› say›s›n›n olas›l›¤›n› da bulmak
mümkündür. Belirli bir aral›¤a düflen baflar› say›s›n›n olas›l›¤›, o aral›ktaki bütün
baflar› say›lar› olas›l›klar›n›n toplam›na eflittir.
Bir mermer oca¤›ndan üretilen blok mermerlerin çatlaks›z olarak sat›labilme olas›l›¤›n›n %30 oldu¤u bilinmektedir. Mermer oca¤› üretim sürecinde örnek olarak
al›nacak 5 adet blok içinden hiçbirinin çatlaks›z (hepsinin çatlakl›) ve 1, 2, 3, 4 ve
5’inin çatlaks›z olma olas›l›klar›n› hesaplayarak olas›l›k çizelgesini haz›rlay›n›z.
Çözüm: Ele ald›¤›m›z örnekte;
Çatlaks›z ürün olas›l›¤› : p= 0,3 (%30)
Çatlakl› ürün olas›l›¤› : q= 1- p = 1- 0,3 = 0,7 (%70)
Örnek kütle say›s›
: n= 5
Oldu¤una göre, her bir X için baflar› (çatlaks›z blok) olas›l›klar›n› afla¤›daki gibi hesaplar›z.
3. Ünite - Olas›l›k Da¤›l›m Modelleri
P( X = x ) =
49
n!
p x q n− x
x !( n − x )!
n=5 adet bloktan hiçbirinin çatlaks›z (x=0) olma olas›l›¤›;
P( X = 0) =
5!
. 0, 30.0, 75−0 = 0,1681
0 !.(5 − 0)!
n=5 adet bloktan 1’inin çatlaks›z (x=1) olma olas›l›¤›;
P( X = 1) =
5!
.0, 31.0, 75−1 = 0, 3602
1!.(5 − 1)!
n=5 adet bloktan 2’sinin çatlaks›z (x=2) olma olas›l›¤›;
P( X = 2) =
5!
.0, 32.0, 75−2 = 0, 3087
2 !.(5 − 2)!
n=5 adet bloktan 3’ünün çatlaks›z (x=3) olma olas›l›¤›;
P( X = 3) =
5!
.0, 33.0, 75−3 = 0, 1323
3!.(5 − 3)!
n=5 adet bloktan 4’ünün çatlaks›z (x=4) olma olas›l›¤›;
P( X = 4) =
5!
.0, 34.0, 75−4 = 0, 0284
4 !.(5 − 4)!
n=5 adet bloktan 5’inin (hepsinin) çatlaks›z (x=5) olma olas›l›¤›;
P( X = 5) =
x
P(X=x)
5!
.0, 35.0, 75−5 = 0, 0024
5!.(5 − 5)!
0
1
2
3
4
5
0,1681
0,3602
0,3087
0,1323
0,0284
0,0024
Örnek 1’deki verileri ve olas›l›k çizelgesini ele alarak mermer oca¤› üretim sürecinde örnek olarak al›nacak 5 adet blok içinden;
a) 2 ile 3’ünün çatlaks›z olma olas›l›¤›n›,
b) En çok birinin çatlaks›z olma olas›l›¤›n›,
c) En az birinin çatlaks›z olma olas›l›¤›n› hesaplay›n›z.
Çözüm: a) 2 ile 3’ünün çatlaks›z olma olas›l›¤›;
P(2 ≤ X ≤ 3) = P(X=2) + P(X=3)
= 0,3087 + 0,1323 = 0,441
b) En çok 1’inin çatlaks›z olma olas›l›¤›,
P(X ≤ 1) = P(X=0) + P(X=1)
= 0,1681 + 0,3602 = 0,5283
c) En az 1’inin çatlaks›z olma olas›l›¤›,
P(X ≥ 1) = 1-P(X=0) =1- 0,1681=0,8319
ÖRNEK 2
50
Co¤rafi Bilgi Sistemleri ‹çin Temel ‹statistik
SIRA S‹ZDE
1
D Ü fi Ü N E L ‹ M
Elektronik ürünler
pazarlayan bir ma¤azay› gezen müflterilerin %20’sinin ürün sat›n ald›SIRA S‹ZDE
¤› bilinmektedir. Bir saat içinde ma¤azay› gezen 6 müflterinin 2’sinin ürün sat›n alma olas›l›¤› nedir?
D Ü fi Ü N E L ‹ M
Binom da¤›l›m›n›n ortalamas›;
S O R U
S O R U
X = E(x) =
np
Binom da¤›l›m›n›n varyans› ve standart sapmas›;
D‹KKAT
S x2
SIRA S‹ZDE
K ‹ T A P
= E(x - X ) = npq
N N
SIRA S‹ZDE
S x = npq
ÖRNEK 3
AMAÇLARIMIZ
D‹KKAT
2
Tekstil sektöründe kot tafllama iflinde 5 y›l çal›flan iflçilerin sikoza (tafl tozu hastaAMAÇLARIMIZ
l›¤›na yakalanma ihtimali nedeniyle) yaflama ihtimali %85’tir. Tekstil ürünleri
üreten bir fabrikada kot tafllama iflinde 10 iflçi çal›fl›yorsa, bu iflçilerin yaflama ihtimali ortalamas›,
ve standart sapmas›n› hesaplay›n›z.
K ‹ T A varyans
P
n= 10, p=0,85, q=0,15, x=0,1,2,3,4,5,6,7,8,9,10
TELEV‹ZYON
‹NTERNET
T E L :E V ‹ ZX
Y O=N E(x) = np = 10.0,85 = 8,5 kifli
Ortalama
Varyans :
S x2 = E(x - X )2 = npq = 10.0,85.0,15 = 1, 28 kifli
‹NTERNET
Standart Sapma : S x = npq = 10.0,85.0,15 = 1,13 kifli
Poisson Da¤›l›m›
SIRA S‹ZDE
D Ü fi Ü N E L ‹ M
S O R U
D‹KKAT
SIRA S‹ZDE
AMAÇLARIMIZ
K ‹ T A P
Örnek kütle boyutunun (n’nin) çok büyük ve beklenen bir olay›n meydana gelme
olas›l›¤›n›n (p) s›f›ra çok yak›n oldu¤u nadir meydana gelen olaylarda, hesaplama
SIRA S‹ZDE
zorluklar› nedeniyle
Binom da¤›l›m› kullan›lamaz. Bununla birlikte, belirli bir zaman aral›¤›nda, bir alanda ya da hacimde nadir rastlanan olaylar›n olas›l›k da¤›l›mlar›, Poisson
D Ü fida¤›l›m›
Ü N E L ‹ M ile daha kolay aç›klanabilmektedir. Örne¤in, bir y›l içinde
meydana gelen trafik ve ifl kazalar›, fabrikalarda kusurlu ürün üretme, insanlar›n
az rastlanan hastal›klara yakalanmas›, matbaada bas›lan kitab›n sayfalar›n bask› haS O R U
talar› bulunmas› nadir rastlanan olaylard›r.
Genellikle n>20
D ‹ K Kve
A T p<0,10 oldu¤u durumlarda, Poisson da¤›l›m›n›n kullan›m› tercih
edilmektedir.
N N
SIRA S‹ZDE
X rassal de¤iflkeninin Poisson olas›l›k fonksiyonu,
λ x .e-λ
P(X =AMAÇLARIMIZ
x) =
x!
olarak tan›mlan›r. Burada, e=2,71828, x= birim zaman içinde ilgilenilen olay saK ‹zaman
T A P içinde ilgilenilen olay›n ortalama olufl say›s›d›r.
y›s›, λ=birim
Poisson da¤›l›m›n›n ortalamas›,
E(X)= µ = λ
TELEV‹ZYON
TELEV‹ZYON
‹NTERNET
‹NTERNET
3. Ünite - Olas›l›k Da¤›l›m Modelleri
51
Da¤›l›m›n›n varyans› ve standart sapmas›,
σ2 = λ ⇒ σ = λ
Türkiye’de a¤›r ve tehlikeli ifller s›n›f›nda çal›flan iflletmelerde her y›l ortalama olarak 1000 iflçiden bir tanesi hayat›n› kaybetmektedir. 4000 iflçinin çal›flt›¤› bir iflletmede bir y›l içinde;
a) Hiçbir iflçinin hayat›n› kaybetmemesi,
b) 5 iflçinin hayat›n kaybetmesi,
c) 2’den fazla iflçinin hayat›n kaybetmesi olas›l›klar›n› bulunuz.
ÖRNEK 4
Çözüm: a) n=4000 ve p=1/1000= 0,001 oldu¤undan λ=n.p=4000.0,001=4 olur.
Hiçbir iflçinin hayat›n› kaybetmemesi durumu x=0 oldu¤udan, hiçbir iflçinin hayat›n› kaybetmemesi olas›l›¤›;
P(X = 0 ) =
λ x .e-λ 40 .e-4
=
= 0,0183
x!
0!
Olarak hesaplan›r.
b) ‹flletmede 5 iflçinin hayat›n› kaybetmesi (X=5) olas›l›¤›;
P(X = 5 ) =
λ x .e-λ 45.e-4
=
= 0,1563
x!
5!
c) ‹flletmede 2’den fazla iflçinin hayat›n› kaybetmesi (X>2) olas›l›¤›;
P(X>2) = 1-P(X≤2) = 1-[P(X=0) + P(X=1) + P(X=2)]

41.e-4 42.e-4 
= 1- 0,0183 +
+
= 1- [ 0,0183 + 0,0733 + 0,1465]
1!
2! 

= 0,7619
Bir otobüs dura¤›ndan 30 dakikada ortalama 2 belediye otobüsü geçmektedir.
a) 30 dakika içerisinde 1 belediye otobüsü geçme olas›l›¤›n›,
b) Bir saat içerisinde 2’den fazla otobüs geçme olas›l›¤›n› hesaplay›n›z.
Çözüm: a) 30 dakikada ortalama otobüs geçme say›s› λ=2 oldu¤undan, 1 otobüs geçme olas›l›¤›;
P(X = 1) =
λ x .e-λ 21.e-2
=
= 0, 2707 (%27, 07)
x!
1!
b) 30 dakikada 2 otobüs geçiyorsa, bir saatte 4 otobüs geçer. Bu durumda λ=4
olur. Bir saatte 2’den fazla otobüs geçme olas›l›¤›;
P( X > 2) = 1- P( X ≤ 2) = 1-  P( X = 0) + P( X = 1) + P( X = 2)
 40.e-4 41.e-4 42.e-4 
 = 1- 0,0183 + 0, 0733 + 0,1465 = 0,7619 (%76, 19)
+
+
1- 



0!
1!
2!


ÖRNEK 5
52
Co¤rafi Bilgi Sistemleri ‹çin Temel ‹statistik
SIRA S‹ZDE
2
D Ü fi Ü N E L ‹ M
Bir bölge orman›nda
SIRA S‹ZDEyap›lan gözlemlere göre e¤er yeni dikimler yap›lmazsa y›ll›k ormanl›k alan kayb›n›n 1000 Hektarl›k alana karfl›l›k 1 Hektar oldu¤u bilinmektedir. Toplam orman alan› 3000 Hektar oldu¤una göre, yeni dikim yap›lmad›¤› takdirde bir y›l içerisinde 2
D Ü fi Ü N E Lkayb›
‹M
hektarl›k ormanl›k
olas›l›¤› nedir?
BAZI SÜREKL‹
OLASILIK DA⁄ILIM MODELLER‹
S O R U
S O R U
Co¤rafi bilgi sitemleri kapsam›nda yap›lan bilimsel araflt›rmalarda ço¤u kez karfl›lafl›lan de¤iflkenler, say›lamayacak kadar çok de¤erler alabilen de¤iflkenlerdir. SüD‹KKAT
rekli de¤iflkenler olarak da tan›mlanan bu rassal de¤iflkenlerin büyük ço¤unlu¤unun frekans da¤›l›fl›, normal veya lognormal olas›l›k da¤›l›m› ad› verilen bir fonkSIRA
S‹ZDE
siyonla ifade
edilmektedir.
Bu nedenle, bu bölümde sürekli da¤›l›mlardan sadece
Normal ve Lognormal da¤›l›m modellerinin hesaplanmas›n› ve bu parametrelerin
uygulamada kullan›m›n› ele alaca¤›z.
D‹KKAT
SIRA S‹ZDE
AMAÇLARIMIZ
N N
AMAÇLARIMIZ
Normal Da¤›l›m
Carl Friedrich Gauss (30
K ‹ T A P
Nisan 1777 - 23 fiubat
1855), Alman kökenli
matematikçi ve bilim
adam›d›r. Katk›da
Tbulundu¤u
E L E V ‹ Z Yalanlardan
ON
baz›lar›; say›lar kuram›,
analiz, diferansiyel
geometri, jeodezi, elektrik,
manyetizma, astronomi ve
‹ N T E RAntik
N E Tça¤lardan beri
optiktir.
yaflam›fl en büyük
matematikçi olarak da
bilinen Gauss, 1918 y›l›nda
Hannover’de yapt›¤› yüzey
ölçümleri s›ras›nda, ölçüm
hatalar›n›n istatistiksel
da¤›l›m›n› veren (ve daha
önce astronomi
araflt›rmalar›nda da
kulland›¤›) normal da¤›l›m
fikrini kafas›nda iyice
belirginlefltirmifltir (‹nternet
Kaynak:
http://tr.wikipedia.org/wiki/
Carl_Friedrich_Gauss)
Normal da¤›l›m,
parametreleri aritmetik
ortalama ve standart sapma
olan iki parametreli bir
da¤›l›md›r. Birinci ünitede
de ele ald›¤›m›z gibi,
grupland›r›lm›fl serilerde
aritmetik ortalama ve
standart sapmay› flu flekilde
hesaplayabiliriz.
X =
∑ m .f
i i
∑f
i
σ
2
(
=
)
n
2
∑ m - X .f
i
i
i =1
n
∑ f
i
i =1
σ = σ
2
Sürekli de¤iflkenlerden
frekans da¤›l›m› yaklafl›k olarak çan e¤risi fleklinde olan
K ‹ T A P
da¤›l›mlara normal da¤›l›m denilmektedir. 19. yüzy›l›n bafllar›nda C.F. Gauss isimli araflt›rmac›n›n astronomi alan›nda yapt›¤› çal›flmalar s›ras›nda gelifltirdi¤i normal
da¤›l›m›n Tilk
do¤ada gerçekleflen olaylar›n yorumlanmas›na büyük
E L Euygulamalar›,
V‹ZYON
bir uyum göstermifltir. Bu nedenle, normal da¤›l›m olas›l›k fonksiyonunun flekline
Gauss e¤risi de denilmektedir. Normal da¤›l›m›n yayg›n kullan›m›n›n en önemli
nedeni de sürekli de¤iflkenlere uygulanabilirli¤inin yan›nda baz› kesikli de¤iflken‹ N T E Rda¤›l›fla
NET
lerinde normal
yaklaflabilmesidir.
Günlük hayat›m›zda karfl›lafl›lan birçok de¤iflken normal da¤›l›fl gösterir. Örne¤in, insanlar›n kan bas›nc› (tansiyon) ve kan›ndaki fleker miktar›n›n da¤›l›m›, ö¤rencilerin bir dersten ald›klar› notlar›n da¤›l›m›, ilkö¤retimde okuyan çocuklar›n
boy ve kilolar›, bir fabrikan›n günlük üretim miktarlar› da¤›l›m›, ampul ve pillerin
ömrünün da¤›l›m› genellikle normal kabul edilir.
Sürekli bir X de¤iflkeninin normal da¤›l›m olas›l›k fonksiyonu afla¤›daki eflitlikte verildi¤i gibidir.
fx ( x) =
1
2
σ . 2π
-
(x-X)2
.e
2σ 2
-∞ < x < ∞ için
–
Burada; x =rassal örneklenmifl de¤iflkeni, X= da¤›l›m›n ortalamas›n› ve σ = da¤›l›m›n standart sapmas›n› (σ2 = varyans›) göstermektedir.
Da¤›l›m›n ortalamas› merkezi e¤ilim ölçüsünü verirken, varyans› da ortalaman›n
–
iki yan›ndaki yayvanl›¤›n bir ölçüsüdür. Bu nedenle, X ve σ2 parametrelerinin alaca¤›
de¤erlere göre olas›l›k yo¤unluk fonksiyonunun flekli de de¤iflir. Örne¤in, fiekil 3.1 de
görüldü¤ü gibi A kütlesinin ortalamas› B kütlesininkinden küçük iken, B kütlesinin
varyans› da A kütlesininkinden daha küçüktür. Bu örnekte, A kütlesinin olas›l›k yo¤unluk fonksiyonunun B kütlesininkinden daha yayvan oldu¤unu söyleyebiliriz.
X rassal de¤iflkeninin -∞ ve +∞ aral›¤› de¤erleri için normal da¤›l›m olas›l›k
fonksiyonunun integralini ald›¤›m›zda, normal e¤ri alt›nda kalan toplam alan› 1,0
olarak bulabiliriz.
∞
P(-∞ ≤ x ≤ +∞) = ∫ f(x).dx = 1,0
-∞
53
3. Ünite - Olas›l›k Da¤›l›m Modelleri
Bu nedenle, normal frekans da¤›l›m›n›n e¤risinin (fiekil 3.2) alt›nda kalan alan
olas›l›klar› verdi¤inden, e¤rinin kaplad›¤› toplam alan 1’e eflittir.
fiekil 3.1
Normal da¤›l›m
gösteren iki rassal
de¤iflkenin olas›l›k
yo¤unluk
fonksiyonlar›
fiekil 3.2
Frekans (f)
Normal da¤›l›m
frekans (çan) e¤risi
De¤erler (Xi)
Standart normal e¤rilerde X ekseni üzerinde, aritmetik ortalaman›n her iki yan›nda -σ ile +σ mesafeleri ile normal e¤ri aras›nda kalan alan, tüm e¤ri alan›n›n
%68,3 ‘ünü kapsar (fiekil 3.3). Aritmetik ortalaman›n iki yan›nda -2σ ile +2σ noktalar› aras›nda kalan alan, tüm e¤ri alan›n›n %95,5 ‘ini kapsar. -3σ ile +3σ mesafeleri aras›nda kalan alan ise, bütün alan›n %99,7 ‘sini kapsamaktad›r (fiekil 3.3).
Farkl› uygulamalar için
olas›l›k da¤›l›m fonksiyonu
e¤risi alt›nda kalan
alanlar›n bulunabilmesi için
integral al›nmas› zor
oldu¤undan, normal da¤›l›m
fonksiyonunun standart
normal da¤›l›m
fonksiyonuna
dönüfltürülmesi tercih
edilmektedir.
54
Co¤rafi Bilgi Sistemleri ‹çin Temel ‹statistik
fiekil 3.3
Normal e¤ri
alt›nda kalan
alanlar›n standart
sapmaya ba¤l›
de¤iflimi
-3σ
-2σ
-σ
-σ
+2σ
+3σ
Standart Normal Da¤›l›m
–
Normal da¤›l›m fonksiyonunda, Z= (X- X)/σ dönüfltürmesi yap›larak “standart normal da¤›l›m” elde edilebilir. Bu durumda standart normal da¤›l›m›n fonksiyonu,
f(z) =
1
-
.e
Z2
2
2π
fleklinde olup, aritmetik ortalamas› 0 ve varyans› 1’dir.
Z rassal de¤iflkeninin -∞ ve +∞ aral›¤› için standart normal da¤›l›m fonksiyonunun integralini ald›¤›m›zda da, e¤ri alt›nda kalan toplam alan› 1,0 olarak bulabiliriz (fiekil 3.4.). Ayr›ca simetrik olan standart normal e¤rinin sa¤›nda kalan (-∞ ile 0
aral›¤›ndaki) ve solunda kalan (0 ile +∞ aral›¤›ndaki) yar›m alanlar da 0.5’e eflittir
(fiekil 3.5).
∞
P(-∞ ≤ z ≤ +∞) = ∫ f(z).dz = 1,0
-∞
0
P(-∞ ≤ z ≤ 0) = ∫ f(z).dz = 0,5
-∞
∞
P(0 ≤ z ≤ +∞) = ∫ f(z).dz = 0,5
0
55
3. Ünite - Olas›l›k Da¤›l›m Modelleri
fiekil 3.4
Standart normal
e¤ri alt›nda kalan
alan
∞
-∞
fiekil 3.5
f(z)
f(z)
Standart normal
e¤rinin sa¤›nda ve
solunda kalan
alanlar
0,5
0,5
∞
-∞
∞
-∞
Çarp›kl›k ve Bas›kl›k Katsay›s›
Normal da¤›l›m olas›l›k fonksiyonunun flekli, ortalama ve standart sapman›n alaca¤› de¤erlere göre de¤iflebilmektedir. Normal da¤›l›m fonksiyonu fleklinin sa¤a veya sola çarp›kl›¤›n› belirlemede çarp›kl›k katsay›s›, sivri veya bas›k olup olmad›¤›n›n belirlenmesinde ise bas›kl›k katsay›s› kullan›lmaktad›r.
Standart normal da¤›l›m teorik olarak simetrik bir e¤riye sahiptir. Bu nedenle
normal da¤›l›m›n teorik çarp›kl›k katsay›s›, α3 = 0’d›r. Sa¤a e¤ik serilerde α3 > 0
(fiekil 3.6.a) ve sola e¤ik serilerde α3 < 0’d›r (fiekil 3.6.b). Grupland›r›lm›fl serilerde da¤›l›m›n çarp›kl›k katsay›s› afla¤›daki gibi hesaplan›r.
α3 =
µ3
σ3
µ3 =
Z’nin çeflitli de¤erlerine ait
standart normal e¤ri alt›nda
kalan alanlar› bulabilmek
için integral alma ifllemi
yapmak pratik bir ifllem
olmad›¤›ndan, standart
normal e¤ri alt›nda kalan
alanlar istatistik
kitaplar›n›n ekinde çizelgeler
fleklinde sunulmaktad›r (Bu
kitab›n ekindeki çizelgelere
bak›n›z).
∑ fi .(m i - X)3
∑ fi
fiekil 3.6
fx(x)
3>0
(a) Sa¤a çarp›k e¤ri
fx(x)
3=0
X
3=0
(b) Sola çarp›k e¤ri
3<0
X
Standart normal
da¤›l›mda çarp›kl›k
56
Co¤rafi Bilgi Sistemleri ‹çin Temel ‹statistik
Bir serinin normal olabilmesi için hem simetrik olmas› hem de normal bir yüksekli¤e sahip olmas› gerekir. Bir serinin normal olup olmad›¤›n› ortaya koyan “bas›kl›k ölçüsü (α4)”, normal bir seride α4 = 3, sivri bir seride α4 > 3 (fiekil 3.7.a) ve
bas›k bir seride α4 < 3’dür (fiekil 3.7.b). Grupland›r›lm›fl serilerde da¤›l›m›n bas›kl›k katsay›s› afla¤›daki gibi hesaplan›r.
α4 =
µ4
σ4
µ4 =
∑ fi .(m i - X)4
∑ fi
fiekil 3.7
Standart normal
da¤›l›mda bas›kl›k
fx(x)
fx(x)
4>3
4=3
4=3
4
X
(a) Sivri e¤ri
ÖRNEK 6
3
X
(a) Bas›k e¤ri
Kent merkezinde bulunan bir inflaat flantiyesinde ifl makinelerinin yaratt›¤› gürültü seviyesini belirlemek amac›yla 24 ölçüm yap›lm›fl ve afla¤›daki grupland›r›lm›fl
serideki frekans de¤erleri elde edilmifltir.
a) Aritmetik ortalama ve standart sapmay› hesaplay›n›z.
b) Da¤›l›m›n çarp›kl›k ve bas›kl›k katsay›lar›n› hesaplayarak, da¤›l›m›n fleklini
yorumlay›n›z.
Grup S›n›rlar› (Gürültü-dBA)
Frekanslar
Grup Ortalamalar›
Alt
Üst (den az)
fi
mi
0
20
4
10
20
40
8
30
40
60
6
50
60
80
4
70
80
100
2
90
Çözüm: a) Aritmetik ortalama ve standart sapmay› afla¤›daki eflitliklerle hesaplar›z.
l
∑ m i .f i
X=
∑ fi
2
σ =
∑ ( m i - X)
2
i=1
l
.fi
σ = σ2
∑ fi
i=1
∑ mi . fi = 1040
X=
∑ fi = 24
1040
= 43,3 dBA
24
σ=
∑ ( mi - X )2 . fi = 13333, 4
13333, 4
= 23,6 dBA
24
57
3. Ünite - Olas›l›k Da¤›l›m Modelleri
b) Çarp›kl›k katsay›s›n› afla¤›daki eflitlikle hesaplar›z.
µ3
α3 =
σ3
µ3 =
∑ fi .(m i - X)3
∑ fi
∑ fi .( mi - X )3 = 115111,1 ∑ fi = 24
µ3 =
115111,1
= 4796, 3
24
α3 =
4796,3
(23,6)3
σ = 23,6
= 0,365
α3 = 0,365 > 0oldu¤undan, e¤ri tam simetrik da¤›l›ma göre sa¤a çarp›kt›r.
Bas›kl›k katsay›s›n› da afla¤›daki eflitlikle hesaplayabiliriz.
α4 =
µ4
σ4
µ4 =
∑ fi .(m i - X)4
∑ fi
∑ fi .( mi - X )4 = 16726370
µ4 =
16726370
= 696932,1
24
α4 =
696932,1
(23,6)4
= 2, 25
α4 = 2,25 < 3,0 oldu¤undan, e¤ri tam simetrik da¤›l›ma göre bas›kt›r.
Bir iflyerinde çal›flan 50 personelin yafl gruplar›na göre da¤›l›m› afla¤›daki
gibidir. PersoSIRA S‹ZDE
nelin ortalama yafl›n› ve standart sapmas›n›, da¤›l›m›n çarp›kl›k ve bas›kl›k katsay›lar›n›
hesaplayarak da¤›l›m fleklini yorumlay›n›z.
3
D Ü fi Ü N E L ‹ M
Yafl Gruplar›
Personel Say›s›
20-30
30-40
40-50
50-60
8
18
14
8
S O R U
SIRA S‹ZDE
D Ü fi Ü N E L ‹ M
60-70
2
D‹KKAT
Normal Olas›l›k E¤risinin Alt›nda Kalan Alanlar›n Hesaplanmas›
Belirli bir de¤iflken de¤erlerine karfl›l›k gelen normal olas›l›k e¤risinin alt›nda kaSIRA S‹ZDE
lan alanlar›n hesaplanmas›nda standart normal da¤›l›m›n özelliklerinden
yararlan›labilmektedir. Bunun için X de¤iflken de¤erleri öncelikle standart normal de¤ere dönüfltürülmekte ve daha sonra standart normal da¤›l›m fonksiyonu yard›m›yla
AMAÇLARIMIZ
integral alma ifllemi ile e¤ri alt›nda kalan alan hesaplanmaktad›r. Ancak, integral
alma ifllemleri zaman al›c› olmas› ve pratik olmamas› nedenleriyle genellikle daha
önceden haz›rlanm›fl çizelgelerden yararlan›lmas› tercih edilmektedir.
K ‹ T A P
Standart normal da¤›l›m simetrik bir da¤›l›m oldu¤u için, e¤ri alt›nda kalan toplam alan 1’e, ortalaman›n sa¤›nda ve solunda kalan yar›m alanlar da 0.5’e eflittir. Ortalaman›n solunda kalan alan ile sa¤›ndaki alan birbirine eflittir.
Bu nedenle de,
TELEV‹ZYON
standart normal e¤ri alt›ndaki alanlar› gösteren integral çizelgeleri (Z çizelgesi) yar›m alan çizelgeleridir. Bu yüzden, ortalaman›n solunda kalan ve negatif Z de¤erlerine karfl›l›k gelen alan, Z’lerin pozitifmifl gibi düflünülmesiyle bulunabilmektedir.
‹ N T E R N E Tafla¤›da veStandart normal da¤›l›m çizelgesinin kullan›m› ile ilgili örnekler
rilmifltir.
N N
S O R U
D‹KKAT
SIRA S‹ZDE
AMAÇLARIMIZ
K ‹ T A P
TELEV‹ZYON
‹NTERNET
58
ÖRNEK 7
Co¤rafi Bilgi Sistemleri ‹çin Temel ‹statistik
Bir bölgede GPS (Global Positioning System) ile yap›lan konum belirleme çal›flmalar›nda, ölçüm hatalar› ortalamas›n›n 7,8 m ve standart sapmas›n›n 2 m oldu¤u
hesaplanm›flt›r.
a) Ölçümlerde 5 m’den daha az hata yapma olas›l›¤› nedir?
b) Ölçümlerde 10 m’den daha az hata yapma olas›l›¤› nedir?
c) Ölçümlerde 10 m’den daha fazla hata yapma olas›l›¤› nedir?
d) Ölçümlerde 5 m ile 10 m aras› hata yapma olas›l›¤› nedir?
Çözüm: Örne¤imizde X = 7,8 m ve σ = 2,0 olarak verilmifltir.
a) X=5 m için Z = ( X - X ) / σ = (5,0 - 7,8) / 2,0 = -1, 4 olarak bulunur.
Ölçümlerde 5 m’de daha az hata yapma olas›l›¤› hesaplanmak istendi¤ine göre
P(X<5)=P(Z<-1,4) olas›l›¤›n› bulmam›z gerekmektedir. Bu olas›l›k de¤erini Z çizelgesini kullanarak bulabiliriz.
Z çizelgesinde Z=1,4 de¤erine karfl›l›k gelen de¤er A=0,419 dur. Ayn› de¤er
Z=-1,4 için de geçerlidir. Afla¤›da verilen flekilden de görüldü¤ü gibi, taral› alan
A=0,419 dur. Bu durumda, standart normal e¤rinin sol taraf›ndaki yar›m alan
0,5’e eflit oldu¤undan, ölçümlerde 5 m’den daha az hata yapma olas›l›¤›n›;
P(X<5)=P(Z<-1,4)=0,5-0,419=0,081 olarak buluruz.
f(z)
b) X=10 m için Z = ( X - X ) / σ = (10,0 - 7,8) / 2,0 = 1,1 olarak bulunur.
P(X<10)=P(Z<1.1) olas›l›¤›n› bulmam›z gerekmektedir.
Z çizelgesinden Z=1,1 de¤erine karfl›l›k gelen A=0,364 de¤erini buluruz.
Standart normal e¤rinin sol taraf›ndaki yar›m alan (=0,5) ile A alan›n› toplad›¤›m›zda, ölçümlerde 10 m’den daha az hata yapma olas›l›¤›n›;
P(X<5)=P(Z<-1,4)=0,5+0,364=0,864 olarak buluruz.
0,5
0,364
0
1,1
Z
59
3. Ünite - Olas›l›k Da¤›l›m Modelleri
c) X=10 m için Z=1,1 ve A=0,364 olarak bulunmufltu.
P(X>10)=P(Z>1,1) olas›l›¤›n› bulmam›z gerekmektedir.
Standart normal e¤rinin sa¤ taraf›ndaki yar›m alandan (=0,5) A alan›n› ç›kard›¤›m›zda, ölçümlerde 10 m’den daha fazla hata yapma olas›l›¤›n›;
P(X>10)=P(Z>1,1)=0,5-0,364=0,136 olarak buluruz.
f(x)
0,364
0,136
0
1,1
Z
d) X1=5 m için Z1=-1,4 ve A1=0,419
X2=10 m için Z2=1,1 ve A2=0,364 olarak bulunmufltu.
P(5<X<10)=P(-1,4<Z<1,1) olas›l›¤›n› bulmam›z gerekmektedir.
Standart normal e¤rinin solunda kalan A1 ve sa¤›nda kalan A2 alanlar›n› toplad›¤›m›zda, ölçümlerde 5 m ile 10 m aras› hata yapma olas›l›¤›n›;
P(5<X<10)=P(-1,4<Z<1,1)=0,419+0,364=0,783 olarak buluruz.
f(x)
0,364
0,419
-1,4
0
1,1
Z
Bir otomobil fabrikas›n›n üretti¤i ürünlere talep ortalamas› 800 adet
ve S‹ZDE
standart sapmas›
SIRA
200 adettir. Sat›fllar›n en fazla 1000 adet olma olas›l›¤› nedir?
Ü fi Ü N E L ‹ M
Bir il merkezinde bulunan meteoroloji istasyonunda yap›lanDölçümlerde
ilin Nisan ay› toplam ya¤›fl miktar› ortalamas›n›n 900 mm ve standart sapmas›n›n 200
S O Ren
U düflük ve en
mm oldu¤u hesaplanm›flt›r. %95 olas›l›kla ilin toplam ya¤›fl miktar›
yüksek ne kadar olur?
4
Ü fiEÜ NKE L ‹8M
Ö RD N
D‹KKAT
Çözüm: En düflük ve en yüksek ya¤›fl miktarlar›n› %95 olas›l›kla bulaca¤›m›za
göre, öncelikle standart normal e¤ri alt›nda %95 olas›l›k de¤erine karfl›l›k gelen Z
S‹ZDE bir e¤ri ve
de¤erini bulmam›z gerekmektedir. Standart normal e¤ri, tamSIRA
simetrik
e¤rinin her iki taraf›nda kalan yar›m alanlar birbirine eflit oldu¤undan, Z çizelgesinden P=0,95/2=0,475 de¤erine karfl›l›k gelen de¤erin Z=1,96 oldu¤unu buluruz.
AMAÇLARIMIZ
K ‹ T A P
SIRA S‹ZDE
N N
S O R U
D‹KKAT
SIRA S‹ZDE
AMAÇLARIMIZ
K ‹ T A P
60
Co¤rafi Bilgi Sistemleri ‹çin Temel ‹statistik
En düflük ya¤›fl miktar›n› Z=-1,96 ve en büyük ya¤›fl miktar›n› Z=+1,96 de¤erlerini kullanarak bulabiliriz.
Z=
x- X
ve x = X + ( Z .σ ) oldu¤undan
σ
En düflük ya¤›fl miktar›: x = X + ( Z .σ ) = 900 + (-1,96.200) = 508 mm
En yüksek ya¤›fl miktar›: x = X + ( Z .σ ) = 900 + (-1,96.200) = 1292 mm
olarak bulunur.
Lognormal Da¤›l›m
Negatif de¤erlerin
logaritmas›
tan›mlanmad›¤›ndan
(al›namad›¤›ndan),
lognormal da¤›l›m sadece
rassal örneklenmifl pozitif
de¤erli de¤iflkenler için
kullan›labilir.
Standart normal da¤›l›m›n özelliklerini, afl›r› çarp›k da¤›lm›fl rassal de¤iflkenler için
kulland›¤›m›zda, çok önemli boyutlarda hatalar yapabiliriz. Bununla birlikte normal da¤›l›fl göstermeyen (çarp›k da¤›l›ml›) de¤iflkenler için baz› dönüflümler yaparak normal da¤›l›ma uydurmak mümkündür. Genellikle de çarp›k da¤›l›fl gösteren
de¤iflkenlerin normallefltirilmesinde, ifllem kolayl›¤› nedeniyle e taban›na göre logaritmik dönüflüm (y=lnx) tercih edilmektedir.
Rassal örneklenmifl X verilerinin do¤al logaritmalar› al›nd›¤›nda, logaritmik
(lnX) de¤erlerin da¤›l›m› normal da¤›l›ma uyuyorsa, bu da¤›l›ma lognormal da¤›l›m denilmektedir. Genifl aral›klar için grupland›r›lm›fl de¤iflkenlerin da¤›l›m›, genellikle lognormal da¤›l›ma uymaktad›r.
Lognormal da¤›l›m›n olas›l›k yo¤unluk e¤risi, bu da¤›l›m›n parametreleri olan
logaritmik ortalama (α) ve logaritmik standart sapma (β)’n›n fonksiyonu olup, bu
fonksiyon afla¤›daki eflitlikle ifade edilebilir.
f x (x) =
1
x.β . 2π
-
(ln x - α )2
.e
2β 2
0 < x < +∞ için
Burada; x=rassal örneklenmifl de¤iflkeni, x de¤iflkeninin olas›l›k yo¤unluk fonksiyonunu, α= da¤›l›m›n logaritmik ortalamas›n› ve β= da¤›l›m›n logaritmik standart
sapmas›n› göstermektedir.
Lognormal da¤›l›m›n parametreleri olan logaritmik ortalama ve logaritmik standart sapma iki yöntemle hesaplanabilmektedir. Bu yöntemler afla¤›da s›ra ile verilmektedir.
–
1) Örnek de¤erlerinin normal aritmetik ortalamas› (X) ve standart sapmas› (σ)
hesaplanarak, de¤iflkenlik katsay›s› (C ) belirlenir.
C=
σ
X
2) De¤iflkenlik katsay›s›n›n 1,2’ye eflit ya da küçük olmas› durumunda afla¤›daki eflitlikler kullan›larak logaritmik ortalama (α) ve standart sapma
(β) hesaplan›r.
1
α = lnX - β 2
2
 σ2


β2 = ln 
+ 1
 X 2 
β = β2
3. Ünite - Olas›l›k Da¤›l›m Modelleri
61
3) De¤iflkenlik katsay›s›n›n 1,2’den büyük olmas› durumunda, rassal örneklenmifl X de¤erlerinin logaritmik dönüflümleri (lnX) yap›larak, normal da¤›l›mda oldu¤u gibi aritmetik ortalama (α) ve standart sapma (β) hesaplan›r. Daha sonra, afla¤›daki eflitlikler kullan›larak logaritmik ortalama ve standart
sapma normal de¤erlere dönüfltürülür.
X=e
1
α+ β2
2
(
)
σ = X 2 . eβ - 1
2
Örnekleme de¤erlerinin do¤al logaritmalar› için yap›lan ifllemlerde normal da¤›l›m›n tüm özellikleri geçerlidir. Örne¤in, lognormal da¤›lm›fl X rassal de¤iflkeni
için standart normal de¤erin bulunmas›nda;
Z=
LnX - α
β
eflitli¤i kullan›l›r.
Kent merkezinde bulunan bir inflaat flantiyesinde zemin kaz›k çakma makinelerinin yaratt›¤› kesikli titreflim seviyesini belirlemek amac›yla 20 ölçüm yap›lm›fl ve
afla¤›daki grupland›r›lm›fl serideki frekans de¤erleri elde edilmifltir. Da¤›l›m›n lognormal oldu¤u bilindi¤ine göre;
a) Logaritmik ortalama ve standart sapmay› hesaplay›n›z.
b) Kesikli titreflim seviyesinin 10 mm/s’nin üzerinde olma olas›l›¤›n› bulunuz.
Grup S›n›rlar› (Titreflim:mm/s)
Frekanslar
Grup Ortalamalar›
mi
Alt
Üst (den az)
fi
0
3
3
1,5
3
6
9
4,5
6
9
5
7,5
9
12
2
10,5
12
15
1
13,5
Çözüm:
a) Normal de¤erler için aritmetik ortalama ve standart sapmay› afla¤›daki eflitliklerle hesaplar›z.
n
∑ m i .fi
X=
∑ fi
2
σ =
∑ ( m i - X)
2
.fi
i=1
n
∑ fi
i=1
∑ fi = 20
X=
∑ mi .fi = 117
117
= 5,85 mm / s
20
σ=
∑ ( mi - X )2 .fi = 188, 55
188,55
= 3,07 mm / s
20
Lognormal da¤›lm›fl X rassal
de¤iflkeni için standart
de¤erin bulunmas›nda, e¤er
normal de¤erlerle
hesaplanm›fl ortalama ve
standart sapma kullan›l›rsa,
bu standart normal de¤erle
yap›lacak olas›l›k tahminleri
önemli derecede hata içerir.
ÖRNEK 9
62
Co¤rafi Bilgi Sistemleri ‹çin Temel ‹statistik
σ
3,07
= 0,525 < 1, 2 oldu¤undan, seri de¤erleriX 5,85
nin logaritmalar›n› almaya gerek olmadan logaritmik ortalama ve standart sapma-
De¤iflkenlik katsay›s› C =
=
y› afla¤›daki eflitliklerle hesaplayabiliriz.
 σ2

1

α = lnX - β2
β2 = ln 
+ 1
β = β2
 X 2 
2
β 2 = ln(
3,07 2
5,852
+ 1) = 0, 2433
β = 0, 4933 ln(mm / s)
1
α = ln(5,85) - ( .0, 2433) = 1,6447 ln (mm / s)
2
b) X= 10 mm/s
α= 1,6447 ln(mm/s)
Z=
β= 0,4933 ln(mm/s)
lnX - a Ln(10) -1,6447
=
= 1,33
β
0, 4933
Z çizelgesinden Z=1,33 de¤erine karfl›l›k gelen alan A=0,408
Kesikli titreflim seviyesinin 10 mm/s’nin üzerinde olma olas›l›¤›;
P(Z>1,33)=0,5-0,408=0,092 (%9,2) dir.
E¤er da¤›l›m›n lognormal oldu¤unu göz önüne almadan kesikli titreflim seviyesinin 10 mm/s’nin üzerinde olma olas›l›¤›n› hesaplarsak;
Z=
X - X 10 - 5,85
=
= 1,35 ve A=0,411 oldu¤undan,
σ
3,07
P(Z>1,35)=0,5-0,411=0,089 (%8,9) olarak buluruz.
Görüldü¤ü gibi, lognormal da¤›lma sahip rassal de¤iflkenler için bu da¤›l›fl› göz
ard› edersek hatal› de¤erlendirme yapmam›z söz konusu olmaktad›r. Özellikle,
afl›r› çarp›k da¤›l›mlarda, bu hata oran› daha da artabilmektedir.
SIRA S‹ZDE
D Ü fi Ü N E L ‹ M
S O R U
D‹KKAT
SIRA S‹ZDE
AMAÇLARIMIZ
5
Bir küçük sanayi
bölgesinde bulunan 200 ifl yerinde yap›lan gürültü ölçümleri sonucu yaSIRA S‹ZDE
p›lan grupland›rmada afla¤›daki veriler elde edilmifltir. Da¤›l›m›n lognormal oldu¤unu
varsayarak logaritmik aritmetik ortalamay› ve standart sapmay› hesaplay›p, s›n›r de¤er
D Üüzerinde
fi Ü N E L ‹ M kaç ifl yerinin çal›flt›¤›n› bulunuz.
olan 70 dB’in
Gürültü (dB)
S O R U
0-40
‹flyeri Say›s› D ‹ K K35
AT
N N
SIRA S‹ZDE
AMAÇLARIMIZ
K ‹ T A P
K ‹ T A P
TELEV‹ZYON
TELEV‹ZYON
‹NTERNET
‹NTERNET
40-80
80-120
120-160
160-200
200-240
120
20
15
8
2
3. Ünite - Olas›l›k Da¤›l›m Modelleri
63
Özet
N
A M A Ç
1
N
A M A Ç
2
Kesikli ve sürekli rassal de¤iflken kavram›n› ö¤renerek verilere uygun da¤›l›m modelini
seçmek.
Rassal örneklenen veriler kesintisiz bir flekilde s›ralanabiliyor ve bir aral›ktaki bütün de¤erleri alabiliyorsa, bu de¤iflkenlere sürekli de¤iflkenler denilmektedir. Rassal örneklenen bir de¤iflken sadece belirli say›da de¤erler alabiliyor ve yaln›zca
say›labilir say›da de¤erler al›yorsa da, bu de¤iflkenlere kesikli de¤iflken denilmektedir.
Kesikli de¤iflkenler için belirli de¤erlerin noktasal olarak gerçekleflme olas›l›klar› hesaplanabilirken, sürekli rassal de¤iflkenler de ise belirli
aral›klardaki de¤erler için gerçekleflme olas›l›klar› hesaplanabilmektedir.
Kesikli rassal de¤iflkenlerin da¤›l›m modellerinin
(Binom ve Poission) parametrelerini hesaplay›p,
spesifik uygulamalarda da¤›l›m parametrelerini
kullanmak.
Bir ana kütlede sonucun baflar›l› olma olas›l›¤› p
ve baflar›s›z olma olas›l›¤› q=1-p ise, bu ana kütleden çekilecek n adet örnek kütle içerisinden
rassal ve iadeli olarak x adet birim çekildi¤inde,
x adet birimin de baflar›l› gelme olas›l›¤› Binom
aç›l›m› ile hesaplanabilmektedir. Binom da¤›l›m›
eflitli¤i ile belirli bir baflar› say›s›na karfl›l›k gelen
olas›l›k de¤eri bulunabildi¤i gibi, belirli bir aral›¤a düflen baflar› say›s›n›n olas›l›¤›n› da, bütün baflar› say›lar› olas›l›klar›n›n toplam› ile bulmak
mümkün olabilmektedir.
Örnek kütle boyutunun (n’nin) çok büyük ve
beklenen bir olay›n meydana gelme olas›l›¤›n›n
(p) s›f›ra çok yak›n oldu¤u nadir meydana gelen
olaylarda ise, Poisson da¤›l›m› daha kolay kullan›labilmektedir. Genellikle n>20 ve p<0,10 oldu¤u durumlarda, Poisson da¤›l›m›n›n kullan›m›
tercih edilmektedir.
N
A M A Ç
3
Sürekli rassal de¤iflkenlerin da¤›l›m modellerinin (Normal ve Lognormal) parametrelerini hesaplay›p, spesifik uygulamalarda da¤›l›m parametrelerini kullanmak.
Sürekli de¤iflkenlerden frekans da¤›l›m› yaklafl›k
olarak çan e¤risi fleklinde olan da¤›l›mlara normal da¤›l›m denilmektedir. Normal da¤›l›m iki
parametreli bir da¤›l›m olup, da¤›l›m›n ortalamas› merkezi e¤ilim ölçüsünü verirken, varyans› da
da¤›l›m›n yayvanl›¤›n›n bir ölçüsüdür.
Normal frekans da¤›l›m e¤risinin kaplad›¤› toplam alan 1’e eflittir.
–
Normal da¤›l›m fonksiyonunda, Z= (X- X)/σ dönüfltürmesi yap›ld›¤›nda, aritmetik ortalamas› 0
ve varyans› 1 olan “standart normal da¤›l›m”
elde edilebilmektedir. Belirli bir de¤iflken de¤erlerine karfl›l›k gelen normal olas›l›k e¤risinin alt›nda kalan alanlar›n hesaplanmas›nda
standart normal da¤›l›m çizelgelerinden yararlan›labilmektedir.
Normal da¤›l›m fonksiyonu fleklini aç›klamada
çarp›kl›k katsay›s› ve bas›kl›k katsay›s› kullan›lmaktad›r. Tam simetrik normal da¤›l›m›n teorik
çarp›kl›k katsay›s›, α3 = 0 olup, sa¤a e¤ik serilerde α3 > 0 ve sola e¤ik serilerde α3 < 0’d›r.
Tam simetrik normal da¤›l›mda bas›kl›k katsay›s› α4 = 3 olup, sivri bir e¤ride α4 > 3 ve bas›k
bir e¤ride α4 < 3’dür.
Rassal örneklenmifl X verilerinin do¤al logaritmalar› al›nd›¤›nda, logaritmik (lnX) de¤erlerin
da¤›l›m› normal da¤›l›ma uyuyorsa, bu da¤›l›ma
lognormal da¤›l›m denilmektedir. Genifl aral›klar
için grupland›r›lm›fl de¤iflkenlerin da¤›l›m›, genellikle lognormal da¤›l›ma uymaktad›r.
Lognormal da¤›l›m›n parametreleri logaritmik ortalama (α) ve logaritmik standart sapma (β) d›r.
Lognormal da¤›lm›fl X rassal de¤iflkeni için standart normal de¤erin bulunmas›nda Z= (LnX - α)/β
eflitli¤i kullan›l›r.
64
Co¤rafi Bilgi Sistemleri ‹çin Temel ‹statistik
Kendimizi S›nayal›m
1.
6!
–
6. X, normal da¤›lm›fl sürekli bir de¤iflken, X = 16 ve
σ = 4 oldu¤una göre, P(12<X<20) olas›l›¤› kaçt›r?
a. 0,9500
b. 0,6826
c. 0,4750
d. 0,3413
e. 0,1707
iflleminin sonucu kaçt›r?
4!.(6 - 4)!
a. 3
b. 5
c. 15
d. 20
e. 30
2. Bir hastanede yap›lan kalp ameliyatlar›nda hastan›n
yaflama ihtimalinin %80 oldu¤u bilinmektedir. Hastanede bir günde 4 kalp hastas› ameliyat edildi¤ine göre,
yaln›z 2 hastan›n yaflama ihtimali kaçt›r?
a. 0,0013
b. 0,0256
c. 0,1536
d. 0,4096
e. 1,0000
3. Afla¤›daki çizelgede kusurlu ürün üretme say›lar› ve
olas›l›klar› verilmifltir.
x
0
1
2
3
4
P(X=x)
0,32
0,42
0,21
0,04
0,01
Bu çizelgeye göre, seçilecek bir ürünün kusurlu olmama olas›l›¤› kaçt›r?
a. 0,42
b. 0,32
c. 0,21
d. 0,04
e. 0,01
4. Bir iflletmede çal›flan iflçilerin bir y›l içerisinde ifl kazas› geçirme olas›l›¤› %0,2 (p=0,002) dir. ‹flletmede 2000
iflçi çal›flt›¤›na göre (λ=4), bir y›l içinde 1 ifl kazas› olma
olas›l›¤› kaçt›r? (e-4=0,018)
a. 0,002
b. 0,004
c. 0,018
d. 0,072
e. 0,100
5. Normal da¤›l›ma sahip grupland›r›lm›fl bir serinin
sola çarp›k oldu¤u belirlenmifltir. Buna göre, bu serinin
çarp›kl›k katsay›s› (α3) afla¤›dakilerden hangisi olabilir?
a. -0,4
b. 0
c. 0,4
d. 1
e. 2
7. X, n = 67 ve p = 0,40 olmak üzere binom da¤›lm›fl
bir rassal de¤iflkendir. Buna göre, X’in standart sapmas› kaçt›r?
a. 3
b. 3,42
c. 3,76
d. 4,01
e. 4,88
8. Standart sapmas› 6 olan bir normal da¤›l›mda, X=24
de¤eri Z=-2 standart de¤erine dönüflüyorsa aritmetik
ortalamas› kaçt›r?
a. 6
b. 6,9
c. 12,8
d. 16
e. 36
9. X, ortalamas› 20 ve standart sapmas› 5 olan bir normal da¤›l›m göstermektedir. Buna göre, X=22,5 de¤eri
hangi standart Z de¤erine dönüflür?
a. -1
b. -0,5
c. 0,5
d. 1
e. 1,5
10. X, ortalamas› 6 ve standart sapmas› 4 olan bir lognormal da¤›l›m göstermektedir. Buna göre, da¤›l›m›n
logaritmik varyans› kaçt›r?
a. 1,603
b. 0,967
c. 0,846
d. 0,607
e. 0,368
65
3. Ünite - Olas›l›k Da¤›l›m Modelleri
Kendimizi S›nayal›m Yan›t Anahtar›
1. a
2. c
3. b
4. d
5. a
6. b
7. d
8. e
9. c
10. e
Yan›t›n›z yanl›fl ise, “Binom Da¤›l›m›” konusuna bak›n›z.
Yan›t›n›z yanl›fl ise, “Binom Da¤›l›m›” konusuna bak›n›z.
Yan›t›n›z yanl›fl ise, “Binom Da¤›l›m›” konusuna bak›n›z.
Yan›t›n›z yanl›fl ise, “Poission Da¤›l›m›” konusuna bak›n›z.
Yan›t›n›z yanl›fl ise, “Normal Da¤›l›m” konusuna bak›n›z.
Yan›t›n›z yanl›fl ise, “Normal Da¤›l›m” konusuna bak›n›z.
Yan›t›n›z yanl›fl ise, “Binom Da¤›l›m›” konusuna bak›n›z.
Yan›t›n›z yanl›fl ise, “Normal Da¤›l›m” konusuna bak›n›z.
Yan›t›n›z yanl›fl ise, “Normal Da¤›l›m” konusuna bak›n›z
Yan›t›n›z yanl›fl ise, “Lognormal Da¤›l›m” konusuna bak›n›z
S›ra Sizde Yan›t Anahtar›
S›ra Sizde 1
Ürün sat›n alma olas›l›¤› : p= 0,2 (%20)
Ürün sat›n almama olas›l›¤› : q= 1- p = 1- 0,2 = 0,8 (%80)
Örnek kütle say›s›
: n= 6
Müflterinin 2’sinin (x=2) ürün sat›n alma olas›l›¤›;
P(X = x) =
P(X = 2) =
n!
x!( n - x )!
6!
2!.(6 - 2)!
x!
Frekanslar
Grup Ortalamalar›
Alt
Üst (den az)
fi
mi
20
30
8
25
30
40
18
35
40
50
14
45
50
60
8
55
60
70
2
65
2
∑ mi .fi = 2030 ∑ fi = 50 ∑ ( mi - X ) . fi = 5632
X =
2030
50
= 40, 6
σ=
5632
50
= 10, 6
3
∑ fi .( mi - X ) = 20601, 6
µ3 =
20601, 6
50
= 412
α3 =
412
(10, 6)
3
= 0, 356
α3=0,356>0 oldu¤undan, e¤ri sa¤a çarp›kt›r.
4
∑ fi .( mi − X ) =1549635
1549635
30992, 7
= 2, 455
4
(10, 6 )
µ4 =
2
6-2
.0, 2 .0,8
= 0, 2458
α4 = 2,455<3,0 oldu¤undan, e¤ri bas›kt›r.
2 Hektarl›k (x=2) ormanl›k alan kayb› olasl›¤›;
λ x .e−λ
Grup S›n›rlar›(Yafl)
p x q n- x
S›ra Sizde 2
Bir y›lda ormanl›k alan kayb› 1000 Hektar’da 1 Hektar
(p=1/1000=0,001) d›r. P<0,1 oldu¤undan, bu soruyu
poisson da¤›l›m› yard›m›yla çözebiliriz.
n=3000 Hektar ve p=0,001 oldu¤una göre λ= 3000.0,001=3
dür.
P( X = 2) =
S›ra Sizde 3
=
32.e−3
2!
= 0, 224(%22, 4 )
50
= 30992, 7
α4 =
S›ra Sizde 4
–
X=800 adet ve σ=200 adet .
X=1000 adet için Z = ( X - X ) / σ = (1000 - 800) / 200 = 1, 0
olarak bulunur.
P(X≤1000)=P(Z≤1,0) = 0,5 + 0,3413 = 0,8413
66
Co¤rafi Bilgi Sistemleri ‹çin Temel ‹statistik
Yararlan›lan Kaynaklar
S›ra Sizde 5
Grup S›n›rlar›
Frekanslar
(Gürültü-dB)
Grup
Ortalamalar›
Alt
Üst (den az)
fi
mi
0
40
35
20
40
80
120
60
80
120
20
100
120
160
15
140
160
200
8
180
200
240
2
220
2
∑ fi = 200 ∑ mi .fi = 13880 ∑ ( mi - X ) . fi = 332728
X =
C=
138880
200
σ
=
X
α = lnX -
β 2 = ln(
= 69, 4 dB σ =
40,8
69, 4
332728
200
= 40,8 dB
= 0,59 < 1, 2
 σ2 
1 2 2

β β = ln 
+ 1 β = β 2
 X 2 
2
40,82
+ 1) = 0, 2969 β = 0,545 ln(dB)
2
69, 4
1
α = ln(69, 4) - ( .0, 2969) = 4, 091
2
X = 70 dB
Z=
lnX - α
β
=
Ln(70) - 4, 091
0,545
= 0, 29
Z çizelgesinden Z=0,29 de¤erine karfl›l›k gelen alan
A=0,1141
Gürültü seviyesinin 70 dB’nin üzerinde olma olas›l›¤›;
P(Z>0,29)=0,5-0,1141=0,3859 dir.
‹flyeri say›s› = 200 x 0,3859 = 77
Cula, S. & Muluk, Z. (2006). Temel ‹statistik Yöntemleri.
Ankara: Baflkent Üniversitesi.
Gürsakal, N. (2001). Bilgisayar Uygulamal› ‹statistik I.
No:1029. ‹stanbul: Alfa.
Konuk, A. & Önder, S. (1999). Maden ‹statisti¤i. Mühendislik Mimarl›k Fakültesi Maden Mühendisli¤i
Bölümü. Eskiflehir: Eskiflehir Osmangazi Üniversitesi.
Newbold, P. (2005). ‹flletme ve ‹ktisat ‹çin ‹statsitik. Ümit
fienesen (Çev.). ‹stanbul: Literatür.
Orhunbilge, N. (2000). Tan›msal ‹statistik Olas›l›k ve
Olas›l›k Da¤›l›mlar›. ‹flletme Fakültesi Yay›n No:
279. ‹stanbul: ‹stanbul Üniversitesi.
Ünver, Ö. & Gamgam, H. (2006). Uygulamal› Temel ‹statistik Yöntemler. Ankara: Seçkin.
CO⁄RAF‹ B‹LG‹ S‹STEMLER‹ ‹Ç‹N TEMEL
‹STAT‹ST‹K
4
Amaçlar›m›z
N
N
N
N
Bu üniteyi tamamlad›ktan sonra;
Nokta ve güven aral›¤› tahmini aras›ndaki fark› belirleyebilecek,
Ana kütle ortalamas› ve oran› için güven aral›¤›n› tahmin edebilecek,
‹ki ana kütle ortalamas› ve oran› aras›ndaki farklar›n güven aral›¤›n› tahmin
edebilecek,
Ana kütle varyans› için güven aral›¤›n› tahmin edebilecek bilgi ve becerilere
sahip olacaks›n›z.
Anahtar Kavramlar
•
•
•
•
•
•
Güven Aral›¤›
Büyük Örnekleme
Küçük Örnekleme
Z Da¤›l›fl›
Student t da¤›l›fl›
Khi-kare da¤›l›fl›
•
•
•
•
•
•
Ortalamalar›n Güven Aral›¤›
Oranlar›n Güven Aral›¤›
Varyans›n Güven Aral›¤›
Farklar›n Güven Aral›¤›
Nokta Tahmini
Standart Hata
‹çindekiler
Co¤rafi Bilgi
Sistemleri ‹çin Temel
‹statistik
Güven Aral›¤›
Tahminleri
• ‹STAT‹ST‹KTE TAHM‹NLEME
• ANA KÜTLE ORTALAMASI ‹Ç‹N
GÜVEN ARALI⁄I
• ANA KÜTLE ORANI ‹Ç‹N GÜVEN
ARALI⁄I
• ‹K‹ ANA KÜTLE ORTALAMASI
ARASINDAK‹ FARKIN GÜVEN
ARALI⁄I
• ‹K‹ ANA KÜTLE ORANI
ARASINDAK‹ FARKIN GÜVEN
ARALI⁄I
• VARYANS ‹Ç‹N GÜVEN ARALI⁄I
Güven Aral›¤› Tahminleri
‹STAT‹ST‹KTE TAHM‹NLEME
Araflt›rma çal›flmalar›nda, araflt›rma maliyetlerini azaltmak ve zaman› etkin kullanabilmek amac›yla, örneklemelerle elde edilen verilerle ana kütle hakk›nda bilgiler
edinmeye, tahminlerde bulunmaya veya karar vermeye u¤rafl›r›z. Örneklenen verilerin da¤›l›m parametrelerini hesaplay›p da¤›l›m fleklini belirledikten sonra, ana
kütle parametrelerini tahmin etmeye ve tahminlerin güvenilirli¤i konusunda karar
vermeye çal›fl›r›z.
Örneklemenin amac› ana kütle hakk›nda tahminleme yapmakt›r. Taminleme,
ana kütleden al›nan örnek veriler yard›m›yla ana kütlenin bir veya birkaç parametresini araflt›rmakt›r. Tahmin edilen parametre, ana kütlenin bilinmeyen ortalamas›,
varyans› veya oran› olabilir. Tahminleme ile ana kütlenin tamam›n›n örneklenmesini (tam say›m›n›) gerektiren ifllemlere gerek olmaks›z›n ana kütle hakk›nda yorumlamalar yapabiliriz.
‹statistikte tahminleme nokta veya aral›k tahmini olmak üzere iki yöntemle yap›labilmektedir. Nokta tahmini, ana kütle parametrelerinin bilinmedi¤i hallerde örneklerden elde edilmifl verilerle tek bir tahmin yapmakt›r. Aral›k tahmini ise, ana
kütleye ait herhangi bir bilinmeyen parametrenin, belirli bir hata pay› ile alt ve üst
s›n›r de¤erleri verilerek tahmin edilmesidir.
Nokta Tahmini
Tek bir örnekleme ile hesaplanan parametreler yard›m›yla ana kütle parametrelerini noktasal olarak tahmin etmek, tek bir at›flta hedefe tam isabet ettirmek gibidir.
Örne¤in, bir kent merkezi için Ocak ay›n›n 15’inci günün 30 y›ll›k ya¤an kar kal›nl›¤› verilerini ele alarak ortalama kal›nl›¤› 15 cm buldu¤umuz durumda, noktasal tahmin yaparsak, Ocak ay› 15’inci günü kar kal›nl›¤›n› 15 cm olarak genellememiz gerekir. Böyle bir noktasal tahminin sonucuna ne kadar güvenebilece¤imiz
belirsizdir. Nokta tahminlerinin güvenilir sonuçlar verebilmesi için afla¤›da verilen
baz› özelliklere sahip olmas› gerekir.
a) Sapmas›zl›k: Ana kütleden çekilecek örnek kütlelerin parametrelerinin beklenen de¤erinin ana kütle parametresine eflit olmas›na sapmas›zl›k denilir.
Örne¤in, N birimlik ana kütleden her seferinde tekrarl› olarak n’er birimlik
–
m adet örnekleme yap›p, her seferinde aritmetik ortalamay› (X) belirleyerek
ortalamalar›n da¤›l›m›n›n beklenen de¤erini hesaplad›¤›m›zda, beklenen
de¤erin ana kütle aritmetik ortalamas›na eflit olmas› gerekir.
70
Co¤rafi Bilgi Sistemleri ‹çin Temel ‹statistik
–
E (X ) = µ
Ancak böyle bir durumda, ortalamalar›n da¤›l›m›n›n standart sapmas›n›n
(standart hatan›n) s›f›r olmas› gerekir. Standart hatan›n s›f›rdan büyük oldu¤u durumlarda (ço¤unlukla böyle olur), tahminin sapmas›z veya yans›z oldu¤unu söylemek mümkün de¤ildir.
b) Tutarl›l›k: Nokta tahmin hatas›n›n s›f›r olmas› durumuna tutarl›l›k denilir.
Böyle bir durum ise, örnek kütle boyutunun ana kütle boyutuna yaklaflmas› ve hatta tam say›m yap›lmas› demektir.
c) Etkinlik: Ana kütle parametrelerinin tahmininde, da¤›l›m standart sapmas›
en küçük olan örnekleme parametresi kullan›ld›¤›nda, daha etkin bir tahmin yap›lmas›na etkinlik denilir. Bu durumda, etkinli¤i artt›rmak için ana
kütleden tekrarl› örneklemeler yap›p, standart sapmas› en küçük olan› belirlemeye çal›flmak gerekir.
d) Yeterlilik: Örnek kütledeki bilgilerin tamam›n› ele alan parametrelerin kullan›lmas›yla yap›lacak tahminler yeterli, kullanm›yorsa yetersiz kabul edilmektedir. Örne¤in, ana kütle aritmetik ortalamas›n›n tahmininde, örnek kütle verilerinin ele al›nmas›yla hesaplanan aritmetik ortalaman›n kullan›lmas›
yeterlidir, ancak en çok tekrarlanan frekanslar› dikkate alarak hesaplanan
mod ile yap›lacak tahmin yeterli de¤ildir.
Bir ana kütleden çekilmifl örnek kütle ile yap›lacak nokta tahminlerinin sapmas›z, tutarl› ve etkin olmas›n› beklemek mümkün de¤ildir. Bu arada, nokta tahminlerin hata pay›n› belirlemek ve güvenilir tahminler yapmak da mümkün olamamaktad›r. Bu nedenle, bu ünitede ana kütle ortalamas›, oranlar› ve varyanslar› ile
iki ayr› ana kütle ortalamalar› aras› farklar›n aral›k tahmini konusu genifl bir flekilde örneklerle ele al›nacakt›r. Tahminlerin güvenilirli¤inin belirlenmesinde uygulanan hipotez testi konusu ise 5. ünitede ele al›nacakt›r.
Güven Aral›¤› ve S›n›rlar›
Bilinmeyen bir ana kütle parametresi, bu ana kütleden elde edilen örnek kütle
bilgisine dayanarak belirli bir aral›k dahilinde tahmin edilebilir. Bilinmeyen ana
kütle parametresinin θ, alt güven s›n›r›n›n A ve üst güven s›n›r›n›n B oldu¤u durumda, θ parametresi belirli bir güven seviyesi (1 - α) için A ve B aral›¤›nda tahmin edilebilir.
P( A < θ < B ) = 1 − α
Burada α : güven efli¤i olup, 0 ile 1 aras›nda herhangi bir say›, (1- α): güven
aral›¤› için belirlenen güven seviyesidir. Örne¤in, belirli bir örnek kütle verileriyle
%90 güvenilirlikle (1 - α = 0,90) alt güven s›n›r› a’y› ve üst güven s›n›r› b’yi belirledi¤imizde, a ile b aral›¤›, bilinmeyen parametresinin güven aral›¤› olur. Normal
da¤›l›ma sahip örnek kütleler için ana kütle güven aral›¤› gösterimi fiekil 4.1’de verildi¤i gibidir.
71
4. Ünite - Güven Aral›¤› Tahminleri
fiekil 4.1
Normal da¤›l›m
için güven aral›¤›
ve s›n›rlar›
1−α
α/2
α/2
a
Θ
b
Güven aral›¤›n›n s›n›rlar›, ana kütleden al›nacak n birimlik her örnek kütle için
de¤iflebilir. Ancak, bulunacak her güven aral›¤› s›n›rlar› içerisinde (1- α) olas›l›kla
ana kütle parametresinin (θ) bulunmas› mümkündür. Bununla birlikte, belirli bir α
olas›l›¤›yla da ana kütle parametresinin (θ) güven aral›¤› s›n›rlar› içerisinde bulunmamas› mümkündür.
Güven aral›¤› ne kadar dar olursa, tahmin ana kütle parametresine o kadar yak›n olur. Güven aral›¤›n›n daralmas›, örnek kütle için hesaplanacak standart hatan›n küçük olmas›na veya güven seviyesinin küçük seçilmesine ba¤l›d›r. Standart
hatay› küçültmek için mümkün oldu¤unca örnek kütle boyutunu büyük seçmek
gerekir.
ANA KÜTLE ORTALAMASI ‹Ç‹N GÜVEN ARALI⁄I
Ana kütleden yap›lacak n bireylik örnekleme ile hesaplanacak örnek kütle aritmetik ortalamas›n› kullanarak, ana kütle ortalamas›n› belirli güven s›n›rlar› içerisinde
tahmin edebiliriz. Bu durumda, ana kütle ortalamas› alt ve üst güven s›n›rlar› içerisinde yer alacakt›r.
Bilinmeyen ana kütle ortalamas›n›n güven aral›¤›n›n belirlenmesi, ana kütle
varyans›n›n bilinmesi veya bilinmemesi durumlar› için iki farkl› flekilde yap›lmaktad›r. Burada, ana kütle ortalamas›n›n bilinmedi¤i bir durumda varyans›n nas›l bilinebilece¤i sorusu ak›la gelmektedir. Asl›nda, ana kütle ortalamas›n›n bilinmedi¤i
bir durumda varyans›n bilinmesi bir varsay›md›r. Genellikle büyük örnek kütleleri-büyük örneklemeler (n ≥ 30) için hesaplanan varyans›n (S2), ana kütle varyans›na (σ2) eflit olaca¤› (S2 = σ2) varsay›lmaktad›r. Ancak, küçük örnek kütleleri-küçük örneklemeler (n < 30) için S2 ≠ σ2 oldu¤u kabul edildi¤inden, ana kütle varyans›n›n bilinmedi¤i varsay›l›r.
Ortalamas› µ ve varyans› σ2 bilinmeyen bir ana kütleden her seferinde n birey
içerecek flekilde örneklemeler yaparak, her örnek kütlenin aritmetik ortalamas›n›
hesapland›¤›m›zda ve ortalamalar›n da¤›l›m›n› araflt›r›ld›¤›m›zda, büyük örneklemelerde (n ≥ 30) da¤›l›fl›n normal da¤›l›ma ve küçük örneklemelerde (n < 30) ise
da¤›l›fl›n normal da¤›l›mdan daha yayvan olan Student t da¤›l›m›na uydu¤unu görürüz. Bu nedenle, ana kütle ortalamas› için güven aral›¤› tahmininde, varyans›n
bilindi¤i varsay›lan büyük örneklemeler için normal da¤›l›m›n özelliklerinden ve
varyans›n bilinmedi¤i küçük örneklemeler için Student t da¤›l›m›n›n özelliklerinden yararlanaca¤›z.
Uygulamada birçok
araflt›rmac› güven seviyesi
olarak %99 veya %95
tercihinde bulunmaktad›r.
Güven seviyesi %99’dan
%95’e düfltü¤ünde, güven
aral›¤› daral›r. Özer Serper
Uygulamal› ‹statistik II adl›
kitab›nda bu seçimin
arkas›nda herhangi bir teori
veya mant›k aramamak
gerekti¤ini ve tercihin
al›flkanl›klardan
kaynakland›¤›n›
belirtmektedir(Özer Serper,
Ezgi Kitabevi, Bursa, 2000,
s.36)
Ortalamas› µ olan normal
da¤›lm›fl bir ana kütleden
elde edilmifl n<30 bireyli
–
örnek kütlenin ortalamas› X
ve standart sapmas› S iken
hesaplanacak;
t=
X −µ
S/ n
rassal de¤iflkeni, v=n-1
serbestlik derecesi ile
Student t da¤›l›m›na uyar.
Standart normal da¤›l›mda
(Z da¤›l›m›) oldu¤u gibi,
Student t da¤›l›m›n›n da
ortalamas› 0 ve standart
sapmas› 1’dir. Ancak,
Student t da¤›l›m›n›n
olas›l›k yo¤unluk fonksiyonu,
standart normal da¤›l›mdan
daha yayvand›r. ‹adesiz
yap›lan küçük
örneklemelerde, ilk yap›lan
örneklemelerden sonra sona
kalan örne¤in serbest
olamayaca¤› kabul edilerek,
serbestlik derecesi v=n-1
al›n›r.
72
Co¤rafi Bilgi Sistemleri ‹çin Temel ‹statistik
Ortalaman›n Standart Hatas›
Ortalamas› µ ve varyans› σ2 olan bir ana kütleden her seferinde n birey içerecek
flekilde yap›lan büyük örneklemelerde, örnek kütlelerin aritmetik ortalamalar› da¤›l›m›n›n standart sapmas› hesapland›¤›nda bulunan de¤ere standart hata denir.
Ana kütle aritmetik ortalamalar›n›n standart hatas›;
σX =
σ
.
n
N -n
N -1
Olup, burada, N= ana kütle toplam birey say›s›, n= örnek kütlelerin birey say›s› ve σ = ana kütle standart sapmas›d›r. Genellikle N, n’den çok büyük oldu¤u için
yaklafl›k olarak;
N-n
≅1
N-1
olur. Bu durumda eflitli¤i;
Standart hata
(σ
x
σX =
σ
n
veya S ) örnek
x
kütle boyutundan oldukça
fazla etkilenmektedir. n
–
büyüdükçe, X n›n
tahminlenmek istenen ana
kütle ortalamas›na
yaklaflmas› beklendi¤inden,
standart hata
küçülmektedir.
fleklinde yaz›labilir.
Küçük örneklemelerde (n < 30) S2 ≠ σ2 oldu¤undan, standart hata;
S =
x
S
n
eflitli¤i ile hesaplan›r.
Ana kütle aritmetik ortalamalar›n›n standart hatas› (σ x veya S x ) ana kütle de¤iflkenli¤inin göstergesi olan ana kütle/örnek kütle standart sapmas›na ve örnek
kütlenin büyüklü¤üne (n) ba¤l›d›r. Standart hata, ana kütle/örnek kütle standart
sapmas› ile do¤ru orant›l› iken örnek kütle büyüklü¤ü ile ters orant›l›d›r. Standart
sapma artarken standart hata büyür, azal›rken de standart hata küçülür. Buna karfl›l›k, örnek say›s› küçüldükçe standart hata büyürken, örnek say›s› büyüdükçe
standart hata küçülür.
Standart hatay› küçültebilmenin tek yolu örnek say›s›n› artt›rmakt›r. Bununla
birlikte, standart hata eflitli¤inin paydas›nda örnek büyüklü¤ü n ile de¤iflti¤inden, örnek büyüklü¤ünü artt›rman›n etkisi de az olmaktad›r. Bunun için, örnek
büyüklü¤ü hakk›nda karar verirken, gerçe¤e yak›n tahminlerin sa¤layaca¤› faydalar ile çok say›da örnek alman›n gerektirdi¤i maliyetlerin dikkatli analiz edilmesi
gerekmektedir.
Büyük Örneklemelerde Ana Kütle Ortalamas›n›n Güven
Aral›¤›
Büyük örneklemelerde (n ≥ 30) ana kütle aritmetik ortalamas›n›n (µ) güven aral›–
¤›n›, örnek kütle aritmetik ortalamas› (X) ve standart hata ( σ x) yard›m›yla belirli bir
(1 - α) güven seviyesi için afla¤›daki eflitlikle hesaplayabiliriz.
X ∓ Zα / 2 .
σ
n
4. Ünite - Güven Aral›¤› Tahminleri
73
Bu eflitlikten de, ana kütle ortalamas›n› alt güven s›n›r› (AGS) ve üst güven s›n›r›n› (ÜGS) afla¤›daki eflitliklerle hesaplayabiliriz.
σ
AGS = X − Zα / 2 .
ÜGS = X + Zα / 2 .
n
σ
n
Burada, Zα/2 de¤eri, standart normal olas›l›k da¤›l›m›ndaki P(Z > Zα/2) = α / 2
koflulunu sa¤layan Z de¤eridir. Güven seviyesi (1 - α) için güven aral›¤›n› belirlerken, standart normal da¤›l›m›n her iki ucunda kalan α / 2 kadarl›k k›s›mlar› güven
s›n›rlar› d›fl›nda b›rak›lmaktad›r.
Belirli bir (1 - α) güven seviyesi için standart normal da¤›l›m (Z) çizelgesinden
bulabilmek için öncelikle α / 2 de¤erini belirleriz. Daha sonra,
P(Z > Zα/2) = α / 2
olas›l›¤›na karfl›l›k gelen Zα/2 de¤erini Z çizelgesinden belirleriz.
%95 güven seviyesi için (1 - α) = 0,95, α = 0,05 ve α / 2 =0,025 oldu¤una göre,
ÖRNEK 1
P(Z > Zα/2) = 0,025 olas›l›¤›na karfl›l›k gelen Zα/2 = Z0,025 = 1,96’d›r.
%90 güven seviyesi için (1 - α) = 0,90, α = 0,10 ve α / 2 = 0,05 oldu¤una göre,
P(Z > Zα/2) = 0,05 olas›l›¤›na karfl›l›k gelen Zα/2 = Z0,05 = 1,645’dir.
Katsay›
Zα/2
AGS
0,90
1,645
–
X - 1,645. σ
0,95
0,99
1,960
2,575
–
X - 1,960. σ
–
X - 2,575. σ
ÜGS
x
x
x
–
X + 1,645. σ
–
X + 1,960. σ
–
X + 2,575. σ
x
x
x
Bir araç bak›m servisinde müflteri memnuniyetini belirlemek amac›yla yap›lan
ankette, rassal olarak örneklenen 54 müflteriden, “Servis hizmetinde yap›lan bak›m-onar›mlar hakk›nda tam ve eksiksiz bilgi verildi” görüflünü 1 (kesinlikle kat›lm›yorum) ile 5 (kesinlikle kat›l›yorum) aras› bir ölçekte de¤erlendirmeleri istenmifltir. Yan›tlar›n örneklem ortalamas› 3.81 ve standart sapmas› 1.34 hesaplanm›flt›r. Yan›tlar›n ana kütle ortalamas›n›n %90 güven aral›¤›n› hesaplay›n›z.
Çözüm: Örneklemden elde edilen veriler;
–
X1 = 3,81, S = 1,34 ve n = 54 dür.
Bu de¤erin bulunmas›nda Z
çizelgesini kullan›rken, Z
çizelgesinin yar›m alan
çizelgesi oldu¤unu
unutmadan öncelikle A=0,50,025=0,475 olas›l›k
de¤erine hesaplay›p, daha
sonra bu A alan›na karfl›l›k
gelen Z de¤erini bulmak
gerekir. Bu konu detayl›
olarak 3. ünitede ele
al›nm›flt›. Uygulamada en
çok kullan›lan güven
seviyeleri için alt (AGS) ve
üst (ÜGS) güven s›n›rlar›
yandaki gibidir.
ÖRNEK 2
74
Co¤rafi Bilgi Sistemleri ‹çin Temel ‹statistik
Ana kütle standart sapmas› bilinmemekle birlikte, n = 54 > 30 oldu¤undan,
σ = S = 1,34 al›nabilir.
(1 - α) = 0,90, α = 0,10 ve α / 2 = 0,05 oldu¤undan Zα/2 = Z0,05 = 1,645’dir.
Güven s›n›rlar›n›; X ∓ 1,645.
σ
eflitli¤i ile afla¤›daki gibi hesaplayabiliriz.
n
AGS = 3,81- 1,645.
1,34
= 3,51
54
ÜGS = 3,81 + 1,645.
1,34
= 4,11
54
SIRA S‹ZDE
1
D Ü fi Ü N E L ‹ M
D Ü fi Ü N E L ‹ M
Küçük Örneklemelerde Ana Kütle Ortalamas›n›n Güven
Aral›¤› S O R U
S O R U
D‹KKAT
SIRA S‹ZDE
AMAÇLARIMIZ
SIRA S‹ZDE
Normal da¤›l›ml›
bir ana kütleden rassal olarak elde edilmifl 36 bireyli örnek kütle verileri yard›m›yla oluflturulan ana kütle ortalamas› µ’nün güven aral›¤› 19.33 < µ < 20.27
fleklinde ise örneklem ortalamas› (µ) kaçt›r?
Ana kütle ortalamas›n›n ve varyans›n›n bilinmedi¤i veya di¤er bir tan›mlamayla
küçük örneklemelerde
(n < 30), örneklerin ortalamalar›n›n da¤›l›m› Student t daD‹KKAT
¤›l›m›na uydu¤undan, t da¤›l›m›n›n özelliklerinden yararlan›larak ana kütle ortalamas›n›n güven aral›¤›, belirli bir (1 - α) güven seviyesi ve v = n - 1 serbestlik deSIRA S‹ZDE
recesi için afla¤›daki eflitlikle hesaplan›r.
N N
K ‹ T A P
TELEV‹ZYON
‹NTERNET
X ± tαAMAÇLARIMIZ
/ 2,n .S X
Burada, S K =‹ ST A: Örnek
ortalamalar› da¤›l›m›n›n standart hatas›,
x P
n
tα/2,v : v = n - 1 serbestlik derecesi ile α / 2 güven seviyesi için t de¤eri olup,
Student da¤›l›m›
belirlenmektedir.
T E L E V ‹ ZtY çizelgesinden
ON
Belirli bir (1 - α) güven seviyesi ve v = n - 1 serbestlik seviyesi için Student da¤›l›m (t) çizelgesinden tα/2,v ’yi bulabilmek için öncelikle α / 2 ve V = n - 1 de¤erini belirleriz. Daha sonra,
‹NTERNET
P(t > tα/2,v) = α / 2
olas›l›¤›na karfl›l›k gelen tα/2,v de¤erini t çizelgesinden belirleriz.
ÖRNEK 3
Bir tu¤la fabrikas› üretimi sürecinden rassal olarak al›nan 15 tu¤lan›n a¤›rl›k ortalamas› 4,04 kg ve standart sapmas› 0.12 kg olarak belirlenmifltir. Bugün üretilen
bütün tu¤lalar›n ortalama a¤›rl›¤›n›n güven aral›¤›n›, %95 güven seviyesi için bulunuz.
Çözüm: Örneklemden elde edilen veriler;
–
X1 = 4,04 kg, S = 0,12 kg ve n = 15 dir.
75
4. Ünite - Güven Aral›¤› Tahminleri
Küçük örnekleme (n = 15 < 30) söz konusu oldu¤undan;
X ± tα / 2,v .S
X
eflitli¤i ile güven aral›¤› hesaplan›r.
(1 - α) = 0,95, α = 0,05 ve α / 2 = 0,025 ve serbestlik derecesi v = n - 1 = 15 1 = 14 oldu¤undan Student t çizelgesinden tα/2,v = t0.025,14 = 2,145 elde ederiz.
Ana kütle ortalamas›n›n %95 güven seviyesi için alt (AGS) ve üst (ÜGS) güven
s›n›rlar›n› afla¤›daki gibi hesaplayabiliriz.
AGS = 4,04 - 2,145.
0,12
= 3,97 kg
15
ÜGS = 4,04 + 2,145.
0,12
= 4,11
15
Bir ana kütleden çekilen 15 bireylik örnek kütlenin ortalamas› 40SIRA
ve standart
sapmas›
S‹ZDE
10’dur. Seçilen bu örne¤e göre %90 güvenirlik seviyesi için ortalaman›n alt güven s›n›r›
nedir?
2
D Ü fi Ü N E L ‹ M
SIRA S‹ZDE
D Ü fi Ü N E L ‹ M
ANA KÜTLE ORANI ‹Ç‹N GÜVEN ARALI⁄I
S O R sahip
U
Baz› araflt›rmalarda ana kütle içindeki birimlerin belirli bir özelli¤e
olanlar›n›n oran› ile ilgileniriz. Örne¤in, bir ifl makinesinin performans›n› “fiili olarak çal›flt›¤› süre/toplam çal›flmas› gereken süre” fleklinde ifade ederiz. ‹fl makinesi toplam
D‹KKAT
sürenin tamam›nda çal›flt›¤›nda bu oran 1 iken, çal›flmad›¤›nda 0 olacakt›r. N adet
birimden oluflan ana kütlede belirli özelli¤in gerçekleflme oran›n›n ortalamas› π ise
SIRA S‹ZDE ö¤rencilegerçekleflememe oran› ortalamas› (1 - π) dir. Örne¤in, bir üniversitede
rin derslere devam oran› ortalamas› %80 ise devams›zl›k oran› da %20’dir.
N adet bireyden oluflan ana kütlede belirli bir w özelli¤inin
gerçekleflme oran›
AMAÇLARIMIZ
aritmetik ortalamas› ve standart sapmas›, normal da¤›l›ma benzer flekilde hesaplanmakta olup, hesaplamalar sonucunda afla¤›daki eflitlikler elde edilmektedir.
S O R U
D‹KKAT
N N
Ana kütle oran› ortalamas›
: µw = π
Ana kütle oran› standart sapmas›
: σw = π.(1- π)
Oran Ortalamas›n›n Standart Hatas›
AMAÇLARIMIZ
K ‹ T A P
K ‹ T A P
TELEV‹ZYON
TELEV‹ZYON
Belirli bir özelli¤in gerçekleflme oran› ortalamas› π ve varyans› π (1 - π) olan bir
ana kütleden her seferinde n birey içerecek flekilde yap›lan iadesiz büyük örnek‹NTERNET
lemelerde, örnek kütlelerin oranlar›n›n aritmetik ortalamalar› (P) da¤›l›m›n›n standart sapmas› hesapland›¤›nda bulunan de¤ere standart hata denir. Oranlar›n ortalamas›n›n standart hatas› (σp);
σP =
SIRA S‹ZDE
π .(1- π ) N - n
.
n
N -1
olup, burada, N = ana kütle birey say›s›, n = örnek kütlelerin birey say›s› ve π =
belirli bir özelli¤in gerçekleflme oran› (1 - π) = ve belirli bir özelli¤in gerçekleflmeme oran›d›r.
Genellikle N, n’den çok
büyük oldu¤u için yaklafl›k
olarak;
‹NTERNET
N-n
≅1
N -1
olur. Bu
durumda eflitli¤i;
σP =
π.(1- π )
n
fleklinde yaz›labiliriz.
76
Co¤rafi Bilgi Sistemleri ‹çin Temel ‹statistik
Büyük örneklemelerde (n ≥ 30), örnek kütle ile hesaplanan varyans›n ana kütle varyans›na eflit oldu¤u kabul edildi¤inden, ana kütle varyans›n›n bilinmedi¤i durumlarda da;
σP =
π .(1- π )
=
n
P.(1- P)
n
alabiliriz. Burada P = örnek kütle için belirli bir özelli¤in gerçekleflme oran› ve
(1 - P) = örnek kütle için belirli bir özelli¤in gerçekleflmeme oran›d›r.
Küçük örneklemelerde ise oranlar›n standart hatas›n›;
Sp =
P.(1- P)
n
eflitli¤i ile hesaplar›z.
Büyük Örneklemelerde Ana Kütle Oran Ortalamas›n›n
Güven Aral›¤›
Büyük örneklemelerde (n ≥ 30) ana kütle oran› aritmetik ortalamas›n›n (π) güven
aral›¤›n›, örnek kütle oran› aritmetik ortalamas› (P) ve standart hata (σp) yard›m›yla belirli bir (1 - α) güven seviyesi için afla¤›daki eflitlikle hesaplayabiliriz.
–Z
P+
α/2 . σp
SP =
Ana kütle oran›
ortalamas›n›n alt (AGS) ve
üst (ÜGS) güven s›n›rlar›n›;
AGS = P - Zα/2.σp
ÜGS = P + Zα/2.σp
π.(1- π )
=
n
Burada, Zα/2 de¤eri, standart normal olas›l›k da¤›l›m›ndaki P(Z > Zα/2) = α / 2
koflulunu sa¤layan Z de¤eridir.
Örne¤in, %99 güven düzeyi için ana kütle oran› ortalamas› π’nin güven aral›¤›
afla¤›daki gibi ifade olunacakt›r.
eflitlikleriyle hesaplayabiliriz.
P - 2,58.
ÖRNEK 4
P.(1- P )
n
P.(1- P)
P.(1- P )
< π < P + 2,58.
n
n
Bir havayolu flirketi uçufllarda koltuklar›n doluluk oran›n› araflt›rmak için 60
uçufla ait örnekleme yapm›fl ve doluluk oran› ortalamas›n› %80 olarak bulmufltur.
Hava yolu flirketi uçaklar›n›n doluluk oran› için %95 güvenilirlikle güven aral›¤›
s›n›rlar›n› bulunuz.
Çözüm: Örneklemden elde edilen veriler;
n = 60, P = 0,8 ve (1 - P) = 1- 0, 8 = 0,20’dir.
Ana kütle varyans› bilinmemekle birlikte, n = 60 > 30 oldu¤undan, ana kütle
oran› standart sapmas›n› afla¤›daki gibi hesaplayabiliriz.
σP =
π .(1- π )
=
n
P.(1- P )
0,8.0, 2
=
= 0,052
n
60
(1 - α) = 0,95, α = 0,05 ve α / 2 = 0,025 oldu¤undan Zα/2 = Z0,025 = 1,96’d›r.
77
4. Ünite - Güven Aral›¤› Tahminleri
– 1,96 . σ eflitli¤i ile afla¤›daki gibi hesaplayabiliriz.
Güven s›n›rlar›n›; P +
p
AGS = 0,80 - (1,96.0,052) = 0,698
AGS = 0,80 + (1,96.0,052) = 0,902
Hava yolu flirketi uçaklar›n›n doluluk oran› %95 güvenilirlikle, %69,8 ile %90,2
aral›¤›nda de¤iflecektir.
Bir televizyon flirketi tüm gün izlenme oran›n›n %20’ye ulaflt›¤›n› iddia etmektedir. Bunu kan›tlamak için bir örnekleme yap›lacakt›r. Örnek oran›n›n gerçek ana
kütle oran›ndan ± 0,05 (%5) uzakl›kta olaca¤›ndan (ana kütle oran›n›n tahmininde %5 hata yap›laca¤›ndan), %99 güvenirlikle emin olabilmek için ne büyüklükte örnekleme yapmak gerekecektir?
ÖRNEK 5
Çözüm: Ana kütle oran› π = 0,20 ve tahmin hatas› e = 0,05 olup, tahmin hatas›n› afla¤›daki eflitlikle hesaplayabiliriz.
e = 0,05 = Zα / 2 .σ p = Zα / 2 .
π.(1 - π)
n
%99 güven seviyesi için, (1 - α) = 0,99, α = 0,01 ve α / 2 = 0,005 oldu¤undan
Zα/2 = Z0,005 = 2,58’dir.
Bu durumda, örnek kütle büyüklü¤ünü afla¤›daki gibi hesaplayabiliriz.
0,05 = 2,58.
0,2.(1 - 0,2)
n
n = 20 ⇒ n = 400
Bir banka müflterilerinin %15’inin internet üzerinden bankac›l›k ifllemi
iddia etSIRA yapt›¤›n›
S‹ZDE
mektedir. Bunu kan›tlamak için bir örnekleme yap›lacakt›r. Örnek oran›n›n gerçek ana
kütle oran›ndan ± 0,10 (%10) uzakl›kta olaca¤›ndan (ana kütle oran›n›n tahmininde %10
D Ü fi Ü N E L ‹ M
hata yap›laca¤›ndan), %95 güvenirlikle emin olabilmek için ne büyüklükte
örnekleme yapmak gerekecektir?
3
S O R U
Küçük Örneklemelerde Ana Kütle Oran› Ortalamas›n›n
Güven Aral›¤›
D‹KKAT
Küçük örneklemelerde (n < 30) ana kütle oran› aritmetik ortalamas›n›n (π) güven
aral›¤›n›, örnek kütle oran› aritmetik ortalamas› (P) ve standart hata (Sp) yard›m›ySIRA S‹ZDE
la belirli bir (1 - α) güven seviyesi için afla¤›daki eflitlikle hesaplayabiliriz.
–t
P+
α/2,v . Sp
SP =
P.(1- P )
n
AMAÇLARIMIZ
N N
K ‹ T A P
Bu eflitlikten de, ana kütle oran› ortalamas›n›n alt (AGS) ve üst (ÜGS) güven s›n›rlar›n› afla¤›daki eflitliklerle hesaplayabiliriz.
SIRA S‹ZDE
D Ü fi Ü N E L ‹ M
S O R U
D‹KKAT
SIRA S‹ZDE
AMAÇLARIMIZ
K ‹ T A P
TELEV‹ZYON
TELEV‹ZYON
‹NTERNET
‹NTERNET
78
Co¤rafi Bilgi Sistemleri ‹çin Temel ‹statistik
AGS = P - tα/2,v . Sp
ÜGS = P + tα/2,v . Sp
Buradaki tα/2,v de¤erini, α / 2 güven efli¤i ve v = n - 1 serbestlik derecesi için
Student t da¤›l›m› çizelgesinden belirleriz.
ÖRNEK 6
Bir sektörde faaliyet gösteren flirketlerin karl›l›k oranlar›n› araflt›rmak üzere 10 flirketin y›ll›k kar ve sat›fl gelirleri incelendi¤inde, karl›l›k oran› ortalamas›n›n %10
oldu¤u belirlenmifltir. ‹lgili sektörde faaliyet gösteren flirketlerin;
a) Karl›l›k oranlar› ortalamas›n›n güven aral›¤›n› %90 güven seviyesi için belirleyiniz.
b) Karl›l›k oranlar› ortalamas› %99 güvenilirlikle en fazla ne olabilir?
Çözüm: Veriler n = 10, P = 0,1 ve (1 - P) = 0,9 dur. n < 30 oldu¤undan küçük
örnekleme yap›lm›flt›r.
a) (1 - α) = 0,90, α = 0,10 ve α / 2 = 0,05 ve serbestlik derecesi v = n - 1 = 10 1 = 9 oldu¤undan Student t çizelgesinden tα/2,v = t0.05,9 = 1,833 elde ederiz.
Standart hatay›, S P =
P.(1- P)
0,1.0,9
=
= 0,095 olarak hesaplar›z.
n
10
–t
Güven aral›¤›n› P +
α/2,v . Sp eflitli¤inden;
– (1,833 . 0,095)
0,10 +
– 0,174 ⇒ -0,074 < π < 0,274
0,10 +
Bu örnekte alt güven s›n›r›n›n iflareti negatif (-) oldu¤undan, %90 ihtimalle baz› flirketlerin zarar etmesi beklenebilir.
b) Karl›l›k oranlar› ortalamas›n›n %99 güvenilirlikle en fazla ne oldu¤unu bulmak için, güven aral›¤›n›n üst s›n›r de¤erini bulmam›z yeterlidir.
(1 - α) = 0,99, α = 0,01 ve α / 2 = 0,005ve serbestlik derecesi v = n - 1 = 10
- 1 = 9 oldu¤undan Student t çizelgesinden tα/2,v = t0.005,9 = 3,25 elde ederiz.
Standart hatay›, Sp = 0,095 olarak hesaplam›flt›k.
ÜGS = P + tα/2,v . Sp
Karl›l›k oranlar› ortalamas›n›n %99 güvenilirlikle en fazla;
ÜGS = 0,10 + (3,25 . 0,095) = 0,409 (%40,9) olmas› beklenmektedir.
‹K‹ ANA KÜTLE ORTALAMASI ARASINDAK‹ FARKIN
GÜVEN ARALI⁄I
Baz› araflt›rmalarda normal da¤›l›m gösteren iki ana kütlenin merkezi e¤ilim ölçülerinden ortalamalar›n karfl›laflt›rmas› yap›larak, birbirleri aras›ndaki farklar›n bilinmesi önemli olabilmektedir. Örne¤in, kalibrasyonu yap›lm›fl ve yap›lmam›fl iki ayr›
elektronik terazinin a¤›rl›k ölçüm sonuçlar› aras›nda farklar bulunup bulunmad›¤›n›
araflt›rabiliriz. ‹ki ayr› ana kütlenin birincisinin aritmetik ortalamas› µ1 ve ikincisininki µ2 ise, iki ana kütle ortalamalar› aras›ndaki farklar›n iflaretini dikkate alarak;
4. Ünite - Güven Aral›¤› Tahminleri
• µ1 - µ2 = + ise birinci ana kütlenin ortalamas›n›n ikinciden büyük oldu¤u,
• µ1 - µ2 = - ise birinci ana kütlenin ortalamas›n›n ikinciden küçük oldu¤u,
• µ1 - µ2 = 0 ise birinci ana kütlenin ortalamas› ile ikinci aras›nda fark olmad›¤›,
Yorumlar›n› yapabiliriz. Ancak, ana kütle ortalamalar›n›n bilinmedi¤i ve sadece
iki ayr› ana kütleden yap›lm›fl örneklemelerin oldu¤u durumda ise bu gibi yorumlar›, örnek kütle büyüklü¤üne ba¤l› olarak belirleyebilece¤imiz standart hatalar
yard›m›yla güven aral›¤› ile yapabiliriz.
‹ki Ana Kütle Ortalamas› Aras› Fark›n Standart Hatas›
Ana kütle boyutlar› N1 ve N2, bilinmeyen aritmetik ortalamalar› µ1 ve µ2, standart
sapmalar› σ1 ve σ2 olan iki ayr› ana kütlenin birincisinden n1 ve ikincisinden n2
–
–
bireylik rassal örnek al›n›rsa, bu örneklerden, X1, S1 ve, X2,S2 hesaplanabilir. Her
iki ana kütleden her seferinde n1 ve n2 bireyin bulundu¤u tekrarlamal› örnek al›– –
n›rsa ve her seferinde (X1 - X2) hesaplan›rsa, hesaplanan bu de¤erler için bir ola– –
s›l›k da¤›l›m› elde edilebilir. Büyük örneklemeler (n1 ve n2 ≥ 30) için (X1 - X2) fark–
–
lar›n›n da¤›l›m› yaklafl›k olarak normal da¤›l›fl gösterir. Normal da¤›lan (X1 - X2)
– –
farklar›n›n aritmetik ortalamas› µ(X -X ) ve standart hatas› σ(X -X ) olur. (X1 - X2)
1
2
1
2
farklar› olas›l›k da¤›l›m›n›n standart hatas›;
σ(X - X ) =
1
2
σ12
σ2
+ 2
n1 n2
eflitli¤i ile hesaplanabilir. σ1 ve σ2nin bilinmedi¤i ve (n1 ve n2 ≥ 30) oldu¤u durumlarda σ1 = S1 ve σ2 = S2 al›nabilir.
– –
Küçük örneklemeler (n1 ve n2 <30) için ise (X1 - X2) farklar› olas›l›k da¤›l›m›n›n standart hatas› afla¤›daki eflitlikle hesaplan›r.
S(X - X ) =
1
2
S12
S2
+ 2
n1 n2
Büyük Örneklemelerde ‹ki Ana Kütle Ortalamas›
Aras›ndaki Fark›n Güven Aral›¤›
Büyük örneklemelerde (n1 ve n2 ≥ 30) iki ana kütle ortalamas› aras›ndaki fark›n
– –
(µ1 - µ2) güven aral›¤›n›, örnek kütlelerin ortalama farklar› (X1 - X2) ve standart hata σ
yard›m›yla, belirli bir (1 - α) güven seviyesi için afla¤›daki eflitlikle he( X1 - X2 )
saplayabiliriz.
(X1 - X 2 ) ± Zα / 2 .σ(X
1
-X 2 )
Bu eflitlikten de, iki ana kütle ortalamas› farklar›n›n alt (AGS) ve üst (ÜGS) güven s›n›rlar›n› afla¤›daki eflitliklerle hesaplayabiliriz.
AGS = ( X 1 - X 2 ) - Z a / 2 .σ
( X1-X2 )
ÜGS = ( X 1 - X 2 )+ Zα / 2 .σ
( X1-X2 )
79
80
Co¤rafi Bilgi Sistemleri ‹çin Temel ‹statistik
‹ki ayr› ana kütle ortalamalar› aras›ndaki farklar›n alt ve üst güven s›n›rlar›n›n
iflaretlerini dikkate alarak afla¤›daki yorumlar› yapabiliriz.
• AGS = + ve ÜGS = + ise birinci ana kütlenin ortalamas›n›n ikinciden büyüktür.
• AGS = - ve ÜGS = - ise birinci ana kütlenin ortalamas›n›n ikinciden küçüktür.
• AGS = - ve ÜGS = + ise birinci ana kütlenin ortalamas› ile ikinci aras›nda
önemli bir fark yoktur.
ÖRNEK 7
‹ki ayr› mermer fabrikas›n›n üretti¤i mermer plakalar›ndan al›nan 60’ar adet (n1
= n2 = 60) örnek üzerinde yap›lan afl›nma direnci (cm3/50 cm2) deneyleri sonucunda ortalama ve standart sapmalar afla¤›daki gibi belirlenmifltir. %90 güvenilirlikle ana kütle ortalamas› farklar›n›n güven aral›¤›n› bulunuz. Güven aral›¤›n›
inceleyerek iki fabrikan›n üretti¤i mermer plakalar›n ortalama afl›nma dirençleri
aras› farklar› yorumlay›n›z.
–
–
X1 = 32 cm3/50 cm2
X2 = 29 cm3/50 cm2
S1 = 12 cm3/50 cm2
S2 = 9 cm3/50 cm2
Çözüm: Büyük örnekleme (n1 = n2 = 60 > 30) yap›ld›¤›ndan iki ana kütle ortalamas› farklar›n güven aral›¤›n› (1 - α) güvenirlikle bulmak için afla¤›daki eflitli¤i
kullan›r›z.
(X1 - X 2 ) ± Zα / 2 .σ(X
1
σ(X - X ) =
1
2
-X 2 )
σ12
σ2
+ 2
n1 n2
‹ki mermer fabrikas› plakalar›n›n afl›nma direnci ana kütle standart sapmalar›
bilinmemekle birlikte, büyük örnekleme yap›ld›¤› için σ12 ve σ22 yerine S12 ve S22
kullanabiliriz.
(1 - α) = 0,90, α = 0,10 ve α / 2 = 0,05 oldu¤undan Zα/2 = Z0,05 = 1,645 elde
ederiz.
‹ki ana kütle ortalamas› farklar›n›n %90 güven seviyesi için alt (AGS) ve üst
(ÜGS) güven s›n›rlar›n› afla¤›daki gibi hesaplayabiliriz.
AGS = (X1 - X 2 ) - Zα / 2 .
= (32 - 29) - 1,645.
ÜGS = (X1 - X 2 ) + Zα / 2 .
= (32 - 29) + 1,645.
S12
n1
+
S22
n2
122 92
+
= -0, 2 cm3 / 50 cm 2
60 60
S12
n1
+
S22
n2
122 92
= 6, 2 cm 3 / 50 cm 2
+
60 60
4. Ünite - Güven Aral›¤› Tahminleri
Bu sonuç bize iki mermer fabrikas› plakalar› ortalama afl›nma dirençleri farklar›n›n %90’n›n -0,2 ile 6,2 (cm3/50 cm2) aras›nda olabilece¤ini göstermektedir.
Alt güven s›n›r› negatif ve üst güven s›n›r› pozitif iflaretli oldu¤undan, iki mermer
fabrikas› ürünlerinin afl›nma dirençleri aras›nda önemli bir fark olmad›¤›n› söyleyebiliriz.
Küçük Örneklemelerde ‹ki Ana Kütle Ortalamas›
Aras›ndaki Fark›n Güven Aral›¤›
Küçük örneklemeler (n1 ve n2 < 30) için ise iki ana kütle ortalamas› aras›ndaki fark›n (µ1 - µ2) güven aral›¤›;
( X 1 - X 2 ) ± t α / 2,v .S
( X1 - X 2 )
eflitli¤i ile hesaplanabilmektedir. Bu eflitlikten de, iki ana kütle ortalamas› farklar›n›n alt (AGS) ve üst (ÜGS) güven s›n›rlar›n› afla¤›daki eflitliklerle hesaplayabiliriz.
AGS = ( X 1 - X 2 ) - tα / 2,v .S
( X1 -X2 )
ÜGS = ( X 1 - X 2 )+ tα / 2,v .S
( X1-X2 )
‹K‹ ANA KÜTLE ORANI ARASINDAK‹ FARKIN GÜVEN
ARALI⁄I
Baz› araflt›rmalarda normal da¤›l›m gösteren iki ana kütle oranlar› aras›ndaki farklar›n karfl›laflt›rmas›n›n yap›lmas› gerekebilmektedir. N1 adet birimden oluflan birinci ana kütlede belirli özelli¤in gerçekleflme oran›n›n ortalamas› π1 ve gerçekleflmeme oran› ortalamas› (1 - π1), N2 adet birimden oluflan ikinci ana kütlede belirli
özelli¤in gerçekleflme oran›n›n ortalamas› π2 ve gerçekleflmeme oran› ortalamas›
ise (1 - π2) oldu¤u durumda, iki ayr› ana kütle için belirli özelli¤in gerçekleflme
oran› farklar›n›n (π1 - π2) karfl›laflt›r›lmas›nda güven aral›¤› mant›¤› kullan›labilmektedir.
‹ki Ana Kütle Oranlar› Aras›ndaki Farklar›n Standart
Hatas›
Ana kütle boyutlar› N1 ve N2, belirli özelli¤in gerçekleflme oran› π1 ve π2 olan iki
ayr› ana kütlenin birincisinden n1 ve ikincisinden n2 bireylik rassal örnek al›n›rsa,
bu örneklerden P1 ve P2 hesaplanabilir. Her iki ana kütleden her seferinde n1 ve
n2 bireyin bulundu¤u tekrarlamal› örnek al›n›rsa ve her seferinde (P1 - P2) hesaplan›rsa, hesaplanan bu de¤erler için bir olas›l›k da¤›l›m› elde edilebilir. Büyük örneklemeler (n1 ve n2 ≥ 30) için (P1 - P2) farklar›n›n da¤›l›m› yaklafl›k olarak normal da¤›l›fl gösterir. Normal da¤›lan (P1 - P2) farklar›n›n aritmetik ortalamas› ve
standart hatas› σ(P -P ) olur. (P1 - P2) farklar› olas›l›k da¤›l›m›n›n standart hatas›;
1
P1.(1- P1 )
σ(P - P ) =
1
2
n1
2
+
P2 .(1- P2 )
n2
eflitli¤i ile hesaplanabilir. Küçük örneklemeler (n1 ve n2 <30) için de
S(P - P ) = σ(P - P ) kabul edilerek standart hata hesaplanabilir.
1
2
1
2
81
82
Co¤rafi Bilgi Sistemleri ‹çin Temel ‹statistik
Büyük Örneklemelerde ‹ki Ana Kütle Oran› Aras›ndaki
Fark›n Güven Aral›¤›
Büyük örneklemelerde (n1 ve n2 ≥ 30) iki ana kütle oran› aras›ndaki fark›n (π1 - π2)
güven aral›¤›n›, örnek kütlelerin oran farklar› (P1 - P2) ve standart hata σ(P -P ) yar1
2
d›m›yla, belirli bir (1 - α) güven seviyesi için afla¤›daki eflitlikle hesaplayabiliriz.
(P1 - P2 ) ± Zα / 2 .σ(P - P
1
2
)
Bu eflitlikten de, iki ana kütle oranlar› aras›ndaki farklar›n alt (AGS) ve üst
(ÜGS) güven s›n›rlar›n› afla¤›daki eflitliklerle hesaplayabiliriz.
AGS = (P1 - P2 ) - Zα / 2 .σ(P - P
1
2
ÜGS = (P1 - P2 )+ Zα / 2 .σ(P - P
1
ÖRNEK 8
2
)
)
‹ki ayr› ifl makinesinin günlük fiili çal›flma rand›manlar›n› karfl›laflt›rmak üzere
yap›lan örneklemeler sonucunda afla¤›daki veriler elde edilmifltir.
n1 = 40 gün
P1 = 0,70 (%70)
n2 = 50 gün
P2 = 0,64(%64)
%90 güven seviyesi için iki ifl makinesinin fiili çal›flma rand›man (oran) farklar›n›n güven aral›¤›n› bulunuz.
Çözüm: Büyük örnekleme (n1 ve n2 > 30) yap›ld›¤›ndan iki ana kütle oran farklar›n›n güven aral›¤›n› (1 - α) güvenilirlikle bulmak için afla¤›daki eflitlikleri kullan›r›z.
(P1 - P2 ) ± Zα / 2 .σ(P - P
1
σ(P - P ) =
1
2
2
P1.(1- P1 )
n1
)
+
P2 .(1- P2 )
n2
(1 - α) = 0,90, α = 0,10 ve α / 2 = 0,05 oldu¤undan Zα/2 = Z0,05 = 1,645 elde
ederiz.
‹ki ana kütle oran› farklar›n›n %90 güven seviyesi için güven aral›¤›n› afla¤›daki gibi hesaplayabiliriz.
(0,70 - 0,64) ∓ 1,645 .
0,70.(1- 0,70) 0,64.(1- 0,64)
+
40
50
(0,70 - 0,64) ∓ 0,163 ⇒ AGS = -0,103 ve ÜGS = 0, 223
SIRA S‹ZDE
D Ü fi Ü N E L ‹ M
S O R U
D‹KKAT
SIRA S‹ZDE
AMAÇLARIMIZ
4
‹ki ayr› ifl makinesinin
SIRA S‹ZDE günlük fiili çal›flma rand›manlar› (oranlar›) aras›ndaki fark› %90
güven seviyesi için yorumlay›n›z.
D Ü fi Ü N E L ‹ M
Küçük Örneklemelerde
‹ki Ana Kütle Oran› Farklar›n›n
Güven Aral›¤›
Küçük örneklemelerde
(n1 ve n2 < 30), iki ana kütle oranlar› aras›ndaki farklar›n (π1
S O R U
- π2) güven aral›¤›n›, örnek kütlelerin oran farklar› (P1 - P2) ve standart hata S(P - P )
1
2
yard›m›yla, belirli bir (1 - α) güven seviyesi için afla¤›daki eflitlikle hesaplayabiliriz.
D‹KKAT
N N
SIRA S‹ZDE
AMAÇLARIMIZ
4. Ünite - Güven Aral›¤› Tahminleri
(P1 - P2 ) ± tα / 2,v .S(P - P
1
2
)
Bu eflitlikten de, iki ana kütle oranlar› aras›ndaki farklar›n alt (AGS) ve üst
(ÜGS) güven s›n›rlar›n› afla¤›daki eflitliklerle hesaplayabiliriz.
AGS = (P1 - P2 ) - tα / 2,v .S(P - P )
1
2
ÜGS = (P1 - P2 )+ tα / 2,v .S(P - P )
1
2
VARYANS ‹Ç‹N GÜVEN ARALI⁄I
Ana kütle ortalamas›n›n (µ) ve varyans›n›n (σ2) bilinmemesine ra¤men, ana kütle
varyans›n›n büyüklü¤ünün önemli oldu¤u bir araflt›rmada, bu ana kütleden elde
edilecek n birimlik Xi örnekleri ile örnek kütlenin ortalama ve varyans› hesaplanarak varyans›n büyüklü¤ü hakk›nda yorum yap›labilmektedir.
Büyük örneklemelerde (n ≥ 30), örnek kütle varyans› ile ana kütle varyans› birbirine birbirine eflit (σ2 = S2) kabul edilebildiklerinden, örnek kütle varyans› yard›m›yla ana kütle varyans›n› yorumlamak mümkündür. Ancak küçük örneklemelerde ise, örnek kütle varyans› yard›m›yla ana kütle varyans›n›n büyüklü¤ünü yorumlamak mümkün de¤ildir.
Küçük örneklemelerde varyans›;
S2 =
∑ ( X - X )2 =
n -1
1
∑ ( X - X )2
n -1
eflitli¤i ile hesaplayabilmekteyiz. Varyans eflitli¤ini;
( n - 1).S 2 = ∑ ( X - X )2
fleklinde yazd›ktan sonra, eflitli¤in her iki taraf›n› ana kütle varyans›na (σ2) bölersek;
( n -1).S 2
σ2
=
∑ ( X - X )2
σ2
eflitli¤i ile ifade edilen (n - 1) serbestlik dereceli Khi-kare (χ2) da¤›l›m›n› elde
ederiz. χ2 da¤›l›m›, 0 ile + ∞ aral›¤›nda tan›ml› olup, n < 30 oldu¤u sürece simetrik
bir da¤›l›m de¤ildir.
Serbestlik derecesi v = n - 1 olan Khi-kare da¤›l›m›n›;
χv2 =
( n -1).S 2
σ2
yazabiliriz. Bu eflitlikten de, ana kütle varyans›n›;
σ2 =
( n -1).S 2
χv2
elde ederiz.
83
84
Co¤rafi Bilgi Sistemleri ‹çin Temel ‹statistik
χ2 da¤›l›m›nda, ana kütle varyans›n› (σ2) belirli bir güven düzeyinde (1 - α) içine alacak iki χ2 de¤eri vard›r (Cula ve Muluk, 2006). fiekil 4.2’den de görüldü¤ü
gibi, Khi-kare da¤›l›m›nda alt ve üst s›n›ra karfl›l›k gelen Khi-kare de¤erleri;
2
χ 2A = χ(1α / 2),v
ve χÜ2 = χ(2α / 2),v
olup, χ2 çizelgelerinden elde edilebilmektedir.
Khi-kare da¤›l›m› kullan›larak, v = n - 1 serbestlik derecesi ve belirli bir (1 - α)
güven seviyesi için, örnek kütle varyans› kullan›larak ana kütle varyans›n›n güven
aral›¤›n› belirleyebiliriz.
AGS =
(n - 1).S2
ÜGS =
χ 2A
(n -1).S2
χÜ2
fiekil 4.2
Khi-kare
da¤›l›m›nda alt ve
üst güven s›n›rlar›
1−α
α/2
α/2
2
2
Kα/2,v
K1 α/2,v
ÖRNEK 9
2
K
Bir bakliyat paketleme üretim hatt›ndan rassal örneklenen 10 paketin a¤›rl›klar›n›n standart sapmas› 12 gr ç›km›flt›r. Bu paketleme ana kütlesindeki varyans›n %
90 güven aral›¤› kaçt›r?
Çözüm:
n = 10, S = 12, S2 = 144
(1 - α) = 0,90, α = 0,10, α / 2 = 0,05, n = 10 ⇒ v = n - 1 = 10 - 1 = 9
α / 2 = 0,05 ve v = 9 için Khi-kare çizelgesinden;
2
2
χ 2A = χ(1α / 2),v = χ(1-0,05),9 = 16,92
2
χÜ2 = χ(2α / 2),v = χ(0,05),9
= 3,33
de¤erlerini elde ederiz. Bu de¤erleri kullanarak varyans›n güven aral›¤› s›n›rlar›n› bulabiliriz.
AGS =
ÜGS =
(n - 1).S2
χ 2A
(n -1).S2
χÜ2
=
(10 - 1).144
= 76,6 gr
16,92
=
(10 -1).144
= 389, 2 gr
3,33
85
4. Ünite - Güven Aral›¤› Tahminleri
Özet
N
A M A Ç
1
N
A M A Ç
2
Nokta ve güven aral›¤› tahmini aras›ndaki fark›
belirlemek.
Örneklemenin amac›, ana kütlenin bilinmeyen
parametreleri hakk›nda tahminler yapmakt›r.
Tahminleme ile ana kütlenin tamam›n›n örneklenmesini (tam say›m›n›) gerektiren ifllemlere gerek kalmamaktad›r.
‹statistikte tahminleme nokta veya aral›k tahmini
olmak üzere iki yöntemle yap›labilmektedir.
Nokta tahmini, ana kütle parametrelerinin bilinmedi¤i hallerde örneklerden elde edilmifl verilerle tek bir tahmin yapmakt›r. Nokta tahminleri ile
sapmas›z, tutarl› ve etkin tahminler yap›lamamakta, hata pay› belirlenememekte ve güvenilirlik azalmaktad›r. Aral›k tahmini ile ise, ana kütleye ait herhangi bir bilinmeyen parametrenin belirli bir hata pay› ile alt ve üst s›n›r de¤erleri verilerek tahmin edilmesi mümkün olabilmektedir.
N
A M A Ç
3
• Büyük örneklemelerde (n1 ve n2 ≥ 30), standart
normal de¤iflkeni (Zα/2) kullanarak, örnek kütle–
–
lerin ortalama farklar› (X 1 - X 2) ve standart hata
σ
( X1 - X 2 )
rini (tα/2,v) kullanarak, örnek kütlelerin ortalama
–
–
yard›farklar› (X 1 - X 2) ve standart hata S
( X1- X2 )
m›yla ( X 1 - X 2 ) ± t α / 2,v .S( X 1 - X 2 ) eflitli¤iyle, tahmin
edilebilmektedir.
‹ki ana kütle oran› aras›ndaki fark›n (π1 - π2 ) güven aral›¤›, belirli bir (1 - α) güven seviyesi için;
• Büyük örneklemelerde (n1 ve n2 ≥ 30), standart
normal de¤iflkeni (Zα/2) kullanarak, örnek kütlelerin oran farklar› (P1 -P2) ve standart hata σ(P1 -P2 )
yard›m›yla (P1 - P2 ) ± Zα / 2 .σ(P1 - P2 ) eflitli¤iyle,
• Küçük örneklemelerde (n1 ve n2 < 30), v = n - 1
serbestlik derecesi ile belirlenen Student t de¤e-
x
rini (tα/2,v) kullanarak, örnek kütlelerin oran farklar› (P1 -P2) ve standart hata S(P - P ) yard›m›yla
• Küçük örneklemelerde (n < 30), v = n - 1 ser-
1
2
(P1 - P2 ) ± tα / 2,v .S(P - P ) eflitli¤iyle, tahmin edilebil-
bestlik derecesi ile belirlenen Student t de¤erini
X
-X 2 )
serbestlik derecesi ile belirlenen Student t de¤e-
de¤iflkeni (Zα/2) kullanarak, örnek kütle aritme–
tik ortalamas› (X ) ve standart hata (σ ) yard›-
la X ± tα / 2,n .S eflitli¤iyle, tahmin edilebilmekX
tedir.
Ana kütle oran›n›n (π) güven aral›¤›, belirli bir (1
- α) güven seviyesi için;
• Büyük örneklemelerde (n ≥ 30), standart normal de¤iflkeni (Zα/2) kullanarak, örnek kütle ora– Z .σ
n› (P) ve standart hata (σp)yard›m›yla P +
α/2 p
eflitli¤iyle,
• Küçük örneklemelerde (n < 30), v = n - 1 serbestlik derecesi ile belirlenen Student t de¤erini
(tα/2,v) kullanarak, örnek kütle oran› (P) ve stan– t .S
dart hata (Sp) yard›m›yla eflitli¤iyle, P +
α/2 p
tahmin edilebilmektedir.
eflitli-
1
• Küçük örneklemelerde (n1 ve n2 < 30), v = n - 1
• Büyük örneklemelerde (n ≥ 30), standart normal
(tα/2,v) kullanarak, örnek kütle aritmetik ortala–
mas› (X) ve standart hata (S ) yard›m›y-
yard›m›yla ( X 1 - X 2 ) ± Zα / 2 .σ( X
¤iyle,
Ana kütle ortalamas› ve oran› için güven aral›¤›n› tahmin etmek.
Ana kütle aritmetik ortalamas›n›n (µ) güven aral›¤›, belirli bir (1 - α) güven seviyesi için;
m›yla X ∓ Zα / 2 .σ eflitli¤iyle,
X
‹ki ana kütle ortalamas› ve oran› aras›ndaki farklar›n güven aral›¤›n› tahmin etmek.
‹ki ana kütle ortalamas› aras›ndaki fark›n (µ1 −
µ2) güven aral›¤›, belirli bir (1 - α) güven seviyesi için;
mektedir.
N
A M A Ç
4
1
2
Ana kütle varyans› için güven aral›¤›n› tahmin
etmek.
Ana kütle varyans›n›n (σ2)güven aral›¤›, v = n 1 serbestlik derecesi ve belirli bir (1 - α) güven
seviyesi için, Khi-kare de¤eri (χ2) ve örnek kütle varyans› (S2) yard›m›yla belirlenebilmektedir.
AGS =
(n - 1).S2
χ 2A
ÜGS =
(n - 1).S2
χÜ2
2
2
2
χ 2A = χ(1α / 2),v ve χÜ = χ( α / 2),v
86
Co¤rafi Bilgi Sistemleri ‹çin Temel ‹statistik
Kendimizi S›nayal›m
1. Bir klinikte hastalara zay›flama rejimi uygulanmaktad›r. Rassal olarak örneklenen 30 hasta, rejimin sonunda ortalama olarak 20 kilogram zay›flam›flt›r. Örneklenen kütlenin standart sapmas› 5 kilogram ise ana kütle
ortalamas› için % 90 güven aral›¤› afla¤›dakilerden hangisidir?
a. 19,5 < µ < 20,5
b. 19,1 < µ < 20,9
c. 18,5 < µ < 21,5
d. 18,2 < µ < 21,8
e. 17,3 < µ < 22,7
2. Bir ana kütleden çekilen 25 bireylik örnek kütlenin
ortalamas› 50 ve standart sapmas› 10’dur. Seçilen bu örne¤e göre, %95 güvenirlik seviyesi için ortalaman›n güven aral›¤› afla¤›dakilerden hangisidir?
a. 43,55 < µ < 52,45
b. 44,84 < µ < 55,16
c. 45.87 < µ < 54,13
d. 46.17 < µ < 56,83
e. 48,44 < µ < 54,63
3. Bir GPS ile yap›lan konumsal ölçümlerin hassasiyetini belirlemek amac›yla teodolit ile yap›lan 40 noktal›k
ölçüm sonuçlar› karfl›laflt›r›ld›¤›nda hata oran› ortalamas› %10 olarak bulunmufltur. Buna göre, %90 güven seviyesi için ana kütle oran›n›n alt güven s›n›r› yüzde kaçt›r?
a. 17,8
b. 8,4
c. 4,8
d. 2,2
e. 1,8
4. Son ekonomik krizin seramik fabrikalar›n›n kapasite kullan›m oranlar›n› nas›l etkiledi¤ini belirlemek için
yap›lan çal›flmada 10 farikada kapasite kullan›m oran›n›n %30 azald›¤› tespit edilmifltir. Buna göre, %99 güvenilirlikle ana kütle oran›n› güven aral›¤›n›n üst s›n›r›
yüzde kaçt›r?
a. 77
b. 66
c. 47
d. 27
e. 12
5. ‹ki ayr› demir madeni iflletmesinden al›nan 36’flar
(n1 = n2 = 36) örnekler üzerinde yap›lan tenör (%Fe)
analizleri sonucunda afla¤›daki veriler elde edilmifltir.
–
X 1 = 42 %Fe
–
X 2 = 34 %Fe
S1 = 16 %Fe
S2 = 12 %Fe
Bu bilgilere göre, %90 güvenilirlikle ana kütle ortalamas› farklar› güven aral›¤›n›n alt s›n›r› kaç %Fe’dir?
a.
b.
c.
d.
e.
1,36
2,52
6,42
8,66
13,48
6. Küçük ölçekli bir tekstil iflletmesinde çal›flanlar
aras›nda ücret ödemelerinde cinsiyete göre farkl›l›k
olup olmad›¤›n› belirlemek amac›yla yap›lan araflt›rmada, iflletmede çal›flan 20 erkek çal›flan›n ücretlerinin ortalamas› 1550 TL ve standart sapmas› 250 TL
iken, 20 kad›n çal›flan›n ücretleri ortalamas›n›n 1450
TL ve standart sapmas›n›n 350 TL oldu¤u belirlenmifltir. Erkek ve kad›n çal›flanlar›n ücretleri aras›nda farklar›n güven aral›¤›n› %90 güven seviyesi için afla¤›dakilerden hangisidir?
a. 33 < (µ1 - µ2) < 233
b. 66 < (µ1 - µ2) < 134
c. -66 < (µ1 - µ2) < 266
d. -166 < (µ1 - µ2) < -66
e. -166 < (µ1 - µ2) < -366
7. Normal bir da¤›l›mdan rassal olarak seçilmifl 16 bireyli örnek kütlenin varyans› 49 olarak hesaplanm›flt›r. Buna göre, ana kütle varyans›n›n üst güven s›n›r›
%90 güvenirlikle kaçt›r?
a. 36,4
b. 42,6
c. 69,5
d. 101,2
e. 203,7
4. Ünite - Güven Aral›¤› Tahminleri
87
Kendimizi S›nayal›m Yan›t Anahtar›
8. Standart sapmas› 27 olan normal bir da¤›l›mdan çekilmifl 36 gözlemli rassal bir örneklem verilerinden oluflturulan ana kütle ortalamas› µ’nün (1 - α) güven aral›¤›
43,7 < µ < 56,3 fleklinde ise, µ % kaçt›r?
a. 5
b. 8
c. 12,01
d. 16,16
e. 18,36
1. c
2. c
3. d
4. a
9. Ana kütle ortalamas›n›n güven aral›¤› belirlenirken
örneklem hacmi 17 ise, serbestlik say›s› kaçt›r?
a. 15
b. 16
c. 17
d. 18
e. 19
10. Normal da¤›l›ml› bir ana kütleden rassal olarak çekilmifl 49 bireyden oluflan örneklem verileri ile ana kütle ortalamas› µ’nün % 90 güven aral›¤› 143,42 < µ <
156,58 fleklinde belirlenmifltir. Buna göre ana kütle standart sapmas› µ kaçt›r?
a. 8
b. 18
c. 28
d. 38
e. 44
5. b
6. c
7. d
8. d
9. b
10. c
Yan›t›n›z yanl›fl ise, “Büyük Örneklemelerde
Ana Kütle Ortalamas› Güven Aral›¤›” konusunu
yeniden gözden geçiriniz.
Yan›t›n›z yanl›fl ise, “Küçük Örneklemelerde
Ana Kütle Ortalamas› Güven Aral›¤›” konusunu
yeniden gözden geçiriniz.
Yan›t›n›z yanl›fl ise, “Büyük Örneklemelerde
Ana Kütle Oran Ortalamas›n›n Güven Aral›¤›”
konusunu yeniden gözden geçiriniz.
Yan›t›n›z yanl›fl ise, “Küçük Örneklemelerde
Ana Kütle Oran Ortalamas›n›n Güven Aral›¤›”
konusunu yeniden gözden geçiriniz.
Yan›t›n›z yanl›fl ise, “Büyük Örneklemelerde ‹ki
Ana Kütle Ortalamas› Farklar›n›n Güven Aral›¤›” konusunu yeniden gözden geçiriniz.
Yan›t›n›z yanl›fl ise, “Küçük Örneklemelerde ‹ki
Ana Kütle Ortalamas› Farklar›n›n Güven Aral›¤›” konusunu yeniden gözden geçiriniz.
Yan›t›n›z yanl›fl ise, “Varyans ‹çin Güven Aral›¤›” konusunu yeniden gözden geçiriniz.
Yan›t›n›z yanl›fl ise, “Büyük Örneklemelerde
Ana Kütle Ortalamas› Güven Aral›¤›” konusunu
yeniden gözden geçiriniz.
Yan›t›n›z yanl›fl ise, “Küçük Örneklemelerde
Ana Kütle Ortalamas› Güven Aral›¤›” konusunu
yeniden gözden geçiriniz.
Yan›t›n›z yanl›fl ise, “Büyük Örneklemelerde
Ana Kütle Ortalamas› Güven Aral›¤›” konusunu
yeniden gözden geçiriniz.
88
Co¤rafi Bilgi Sistemleri ‹çin Temel ‹statistik
S›ra Sizde Yan›t Anahtar›
Yararlan›lan Kaynaklar
S›ra Sizde 1
n = 36 oldu¤una göre, büyük örnekleme yap›lm›flt›r.
Güven aral›¤›;
19,33 < µ < 20,27 oldu¤una göre, alt ve üst güven s›n›rlar› aras›ndaki fark;
Cula, S. & Muluk, Z. (2006). Temel ‹statistik Yöntemleri.
Ankara: Baflkent Üniversitesi.
Gürtan, K. (1982). ‹statistik ve Araflt›rma Metodlar›. No:
2941. ‹stanbul: ‹stanbul Üniversitesi.
Konuk, A. & Önder, S. (1999). Maden ‹statisti¤i. Mühendislik Mimarl›k Fakültesi Maden Mühendisli¤i Bölümü. Eskiflehir: Eskiflehir Osmangazi Üniversitesi.
Montgomery, D.C. & Runger G.C. (2003). Applied Statistics and Probability for Engineers. USA: John Wiley & Sons.
Newbold, P. (2005). ‹flletme ve ‹ktisat ‹çin ‹statsitik. Ümit
fienesen (Çev.). ‹stanbul: Literatür.
Püskülcü, H. & ‹kiz, F. (1989). ‹statisti¤e Girifl. ‹zmir:
Bilgehan.
Serper, Ö. (2000). Uygulamal› ‹statistik II. Bursa: Ezgi.
Ünver, Ö. & Gamgam, H. (2006). Uygulamal› Temel ‹statistik Yöntemler. Ankara: Seçkin.
Yüzer, A.F. (Ed.) (2009). ‹statistik. Aç›k Ö¤retim Fakültesi Yay›n No: 771, Eskiflehir: Anadolu Üniversitesi.
ÜGS - AGS = 2.(Zα / 2 .σ )
X
2.( Zα / 2 .σ ) = 20, 27 - 19,33 = 0,94 ⇒ Zα / 2 .σ
X
X
= 0,94 / 2 = 0, 47
AGS = X - (Zα / 2 .σ ) ⇒ 19,33 = X - 0, 47 ⇒ X = 19,8
X
S›ra Sizde 2
n = 16 oldu¤una göre, küçük örnekleme yap›lm›flt›r.
–
X = 40 ve S = 10’dur.
(1 - α) = 0,90, α = 0,10 ve α / 2 = 0,05 serbestlik derecesi v = n - 1 = 16 - 1 = 15 oldu¤undan Student t çizelgesinden tα/2,v. = t0.05,15 = 1,753 elde ederiz.
AGS = X - tα / 2,v .S
X
S
X
=
S
=
n
10
= 2,5
16
AGS = 40 - (1,753 . 2,5) = 35,62
S›ra Sizde 3
Ana kütle oran› π =0,15 ve tahmin hatas› e = 0,10 olup,
tahmin hatas›n› afla¤›daki eflitlikle hesaplayabiliriz.
e = 0,10 = Zα / 2 .σ p = Zα / 2 .
π.(1 - π )
n
%95 güven seviyesi için, (1 - α) = 0,95, α = 0,05 ve α / 2
= 0,025 oldu¤undan Zα/2 = Z0,025 = 1,96’d›r.
Bu durumda, örnek kütle büyüklü¤ünü afla¤›daki gibi
hesaplayabiliriz.
0,10 = 1,96.
0,15.(1- 0,15)
n
n = 7 ⇒ n = 49
S›ra Sizde 4
AGS = -0,103 ve ÜGS = 0,223 oldu¤undan iki ayr› ifl
makinesinin günlük fiili çal›flma rand›manlar› (oranlar›)
aras›nda %90 güvenirlikle önemli bir fark olmad›¤›n›
söyleyebiliriz.
CO⁄RAF‹ B‹LG‹ S‹STEMLER‹ ‹Ç‹N TEMEL
‹STAT‹ST‹K
5
Amaçlar›m›z
N
N
Bu üniteyi tamamlad›ktan sonra;
‹statistiksel hipotez testi kavramlar›n› aç›klayabilecek, test sürecinin aflamalar›n› ve yap›lacak ifllemleri s›ralayabilecek,
Ana kütle ortalamas›, oran› ve varyans› ile iki ana kütle ortalamalar› aras›
farklar›n hipotez testi uygulamalar›n› yapabilecek bilgi ve becerilere sahip
olacaks›n›z.
Anahtar Kavramlar
•
•
•
•
•
•
S›f›r Hipotezi
Karfl›t Hipotez
Red Bölgesi
Tek Tarafl› Test
Çift Tarafl› Test
Test ‹statisti¤i
•
•
•
•
•
•
Büyük Örnekleme
Küçük Örnekleme
Ortalamalar›n Testi
Oranlar›n Testi
Ortalama Farklar›n Testi
Varyanslar›n Testi
‹çindekiler
Co¤rafi Bilgi
Sistemleri ‹çin Temel
‹statistik
‹statistiksel Karar
Vermede Hipotez
Testleri
• H‹POTEZ‹N KURULMASI VE TEST‹
• ANA KÜTLE ORTALAMASINA
‹L‹fiK‹N TESTLER
• ANA KÜTLE ORANINA ‹L‹fiK‹N
TESTLER
• ANA KÜTLE ORTALAMALARI
ARASINDAK‹ FARKLARIN TEST‹
• VARYANSLARIN TEST‹
‹statistiksel Karar Vermede
Hipotez Testleri
H‹POTEZ‹N KURULMASI VE TEST‹
Örnek kütleden elde etti¤imiz parametre bilgilerini kullanarak ana kütle hakk›nda,
belirli bir güven aral›¤›nda tahminler yapabiliriz. Ancak, birçok araflt›rmada örnek
kütleden elde etti¤imiz veriler yard›m›yla ana kütle hakk›nda karar vermek de isteriz.
Örne¤in, yeni bir sulama sisteminin tar›mda ürün verimlili¤ini artt›rd›¤› iddia ediliyorsa, eski ile yeni sistemin verimliliklerini ayn› bitki için ayn› arazi koflullar›nda karfl›laflt›r›p karar vermeye çal›fl›r›z. Bununla birlikte, yeni sulama sisteminin verimi art›rd›¤›
karar›n› verebilmek için, yeni sulama sisteminin eskisine göre verimi önemli oranda
artt›rmas›n› ve verim oranlar› aras›nda önemli farklar›n bulunmas›n› bekleriz.
Yeni cihaz veya yöntemin fark yaratmas›yla birlikte, bu fark›n büyüklü¤ü ve anlaml›l›¤› da önemlidir. Örne¤in, bir fabrikaya sat›n al›nan yeni paketleme makinesinin iflgücü verimlili¤ini artt›r›p artt›rmad›¤›n› belirlemeye yönelik bir araflt›rmada, yeni makinenin iflgücü bafl›na düflen paketleme miktar›n› 10 adet artt›rm›fl oldu¤unu
saptam›fl olal›m. Paketleme veriminin 10 adet artm›fl olmas›, yeni makinenin verim
art›fl› sa¤lad›¤›n› söyleyebilmemiz için yeterlimidir? Acaba aradaki bu art›fl, sat›n al›nan yeni makinenin üretim sürecine girmesinin mi bir sonucu, yoksa tamamen rassal örnekleme hatalar›ndan m› kaynaklanmaktad›r? Rassal örnekleme hatalar›n›n etkilerini devre d›fl› b›rakabilmek için, fark›n ne kadar büyüklükte olmas› gereklidir?
Uygulanacak yeni bir yöntem veya kullan›lacak yeni bir makinenin/cihaz›n eskisine göre süreçte veya üretimde önemli büyüklükte farkl›l›k yaratmas›ndan çok,
bu farkl›l›¤›n istatistiksel aç›dan ne kadar anlaml› oldu¤u önemlidir. Bir baflka deyiflle, bu farklar›n gerçekten mi yoksa rassal örnekleme hatalar›ndan m› meydana
geldi¤inin incelenerek istatistiksel karar›n verilmesi gerekmektedir.
Ana kütle de¤erlerinin bilindi¤i bir durumda, uygulanan teknolojide veya yöntemde yap›lan bir de¤ifliklik sonras›nda elde edilen örnek kütle de¤erlerinin farkl›
olmas›nda, gerçek veya rassal de¤iflimden hangisinin etkili oldu¤una karar vermede, hipotez testleri kullan›labilmektedir.
Bu ünitede, öncelikle istatistiksel hipotezin kurulmas› ve testi sürecinin aflamalar› aç›klanacak, daha sonra ana kütle ortalamas›, oran› ve varyans› ile ana kütle
ortalamalar› aras›ndaki farklar›n testi konular› ele al›nacakt›r.
Ana kütle parametreleri hakk›nda ileri sürülen hipotezin do¤rulu¤unu kan›tlaman›n en kesin yöntemi, ana kütlenin tam say›m›n› yapmakt›r. Ancak, zaman yetersizli¤i, maliyetinin yüksekli¤i ve yok edici etkileri dikkate al›nd›¤›nda, ileri sürü-
Genel olarak hipotezler, bir
durum hakk›nda ileri
sürülen varsay›mlard›r.
‹statistiksel anlamda
hipotezler ise ana kütlenin
durumu hakk›nda ileri
sürülen iddialar›n, örnek
kütle olas›l›k da¤›l›m
modeline göre
araflt›r›lmas›d›r. Hipotez
testinde, örnekten elde
edilen bilgilere ba¤l› olarak
belirli bir güvenirlik
seviyesinde, ileri sürülen
hipotezin do¤ru olup
olmad›¤› test edilir.
92
Co¤rafi Bilgi Sistemleri ‹çin Temel ‹statistik
len hipotezi kan›tlamak için tam say›m yerine örnek kütle parametrelerinden yararlanmak gerekmektedir.
Hipotez testi, ana kütle parametresi hakk›nda yap›lacak araflt›rmaya uygun olarak
hipotezlerin kurulmas›, red veya kabul koflullar›n›n belirlenmesi, olas›l›k da¤›l›m modeline uygun test istatisti¤inin hesaplanmas› ve karar verme aflamalar›ndan oluflur.
Hipotezlerin Kurulmas›
S›f›r hipotezi eskiden beri
bilinen ve geçerli kabul
edilen görüflü yans›t›rken,
karfl›t hipotez yeni bir
görüfltür.
ÖRNEK
S›f›r hipotezi do¤ru oldu¤u
halde test sonucunda
rededilirse, bir hata ifllenir
ve buna I. Tip Hata
denilmektedir. S›f›r hipotezi
yanl›fl oldu¤u halde kabul
ediliyorsa da bir hata
ifllenmifl olur ve bu hataya
da II. Tip Hata
denilmektedir. Birinci tip ve
ikinci tip hatalarla ilgili
olarak Özer SERPER’in
“Uygulamal› ‹statistik II”
(Ezgi Kitapevi, 2000, Bursa)
kitab›ndan daha ayr›nt›l›
bilgi edinebilirsiniz.
Hipotez testinde, örnek kütleden elde edilen parametrelerin ana kütle parametreleriyle uyumlu oldu¤unu iddia eden s›f›r hipotezi (H0 hipotezi) ve uyumlu olmad›¤›n› iddia eden karfl›t hipotez (H1 hipotezi) kurulur. S›f›r hipotezine istatistiksel hipotez, karfl›t hipoteze de araflt›rma hipotezi de denilmektedir.
H0 hipotezi, ana kütlenin bilinen veya varsay›lan parametre de¤eri ile örnek kütleden elde edilen aras›nda önemli (anlaml›) bir fark olmad›¤› kabulü ön flart›n› içerir. Örnek kütleden elde edilen veriler H0 hipotezini çürütmedi¤i sürece, H0 hipotezi geçerlidir. H0 hipotezi geçerli oldu¤u sürece, örnek kütle ile ana kütle parametreleri aras›ndaki farkl›l›¤›n, rassal örnekleme hatalar›ndan (örnekleme yönteminin yanl›fl seçilmesinden veya örneklerin yetersizli¤inden) meydana geldi¤i kabul edilir.
Ana kütlenin bilinen veya varsay›lan parametre de¤eri ile örnek kütleden elde
edilen aras›nda önemli (anlaml›) bir fark oldu¤unu ileri süren hipoteze ise karfl›t
(alternatif) hipotez (H1) denilir. Bu hipotez genellikle, örnek kütle verileriyle hesaplanan parametrenin ana kütle parametresinden farkl› (büyük, küçük veya eflit
de¤il) oldu¤u fleklindedir.
Eskiflehir kent merkezinden geçen Porsuk çay›nda a¤›r metallerden olan kurflun
miktar›n›n 5 mg/kg’›n alt›nda oldu¤u bilinmektedir. Ancak, çevre araflt›rmac›lar›, Eskiflehir kent merkezi giriflinde ve ç›k›fl›nda Porsuk çay›ndaki kurflun miktar›n›n de¤iflti¤ini iddia etmektedirler. Bu durumda, Porsuk nehrinden örnekleme
yapmadan önce, kurflun miktar› ortalamas› ile ilgili hipotezlerin flu flekilde kurulmas› gerekecektir.
Bilinen ana kütle de¤eri ile örnek kütle de¤eri aras›nda fark olmad›¤› varsay›m›na dayanan s›f›r hipotezi afla¤›daki gibi kurulur.
H0 : X = µ = 5 mg/kg
Bilinen ana kütle de¤eri ile örnek kütle de¤eri aras›nda fark oldu¤u iddias›na
dayanan karfl›t hipotez, üç farkl› flekilde kurulabilecektir.
H1 : X > µ = 5 mg/kg
H1 : X < µ = 5 mg/kg
H1 : X ≠ µ = 5 mg/kg
Karfl›t hipotezi kurarken, üç karfl›t hipotezden birine karar vermek gerekir.
Red Bölgesinin Tan›mlanmas›
S›f›r hipotezinin red edilebilece¤i bölgeyi tan›mlamadan önce testin anlaml›l›k düzeyini belirlememiz gerekir. S›f›r hipotezi do¤ru oldu¤u halde red edilebilme hatas›n› (I. Tip Hata) iflleyebilece¤imiz en büyük olas›l›k de¤erine anlaml›l›k düzeyi (α )
93
5. Ünite - ‹statistiksel Karar Vermede Hipotez Testleri
veya anlaml›l›k seviyesi denilmektedir. Araflt›rmalarda hata yapmamak, yanl›fl bir
iddiada bulunmamak ve s›f›r hipotezini korumak için anlaml›l›k düzeyini küçük
tutar›z.
H0 hipotezinin do¤ru oldu¤u halde red edilmesi riskli ise ve örnek say›s›n› artt›rmak pahal›ya mal oluyorsa, α anlaml›l›k düzeyi çok küçük bir de¤er (%0,1 ile
%5 aras›) al›nmal›d›r. Buna karfl›l›k, H0 hipotezinin yanl›fl oldu¤u halde kabul edilmesi tehlikeli olacaksa α anlaml›l›k düzeyi %5 den büyük tutulmal›d›r (Konuk ve
Önder, 1999).
Anlaml›l›k düzeyi dikkate al›narak s›f›r hipotezinin kabulü için tan›mlanan bölgeye kabul bölgesi ve reddi için tan›mlanan bölgeye ise red bölgesi denilmektedir.
Güven düzeyinin belirlenmesinden sonra, örnek kütle da¤›l›m modeline uygun
olarak red ve kabul bölgelerinin tan›mlanmas› gerekir. E¤er hesaplanacak test istatisti¤i de¤eri kabul bölgesinin içinde kal›rsa H0 hipotezi kabul edilir, tersi durumda ise H0 hipotezi red edilir.
H1 hipotezindeki iddiaya göre, red bölgesi tek tarafl› veya çift tarafl› olarak tan›mlanabilmektedir. Örnek kütle parametresinin ana kütle parametresinden küçük veya
büyük oldu¤u iddias› varsa, red bölgesi tek tarafl› olarak belirlenmekte ve bu gibi durumlarda yap›lan testlere tek tarafl› test denilmektedir. Örnek kütle parametresinin
ana kütle parametresine eflit olmad›¤› iddias›n›n bulundu¤u (büyük veya küçük oldu¤unu bilmedi¤imizde) durumda, red bölgesi iki tarafl› olarak belirlenmekte ve çift
tarafl› test denilmektedir. Örne¤in, ortalamalar›n testinde örnek kütle ortalamas›n›n
(X) ana kütle ortalamas›ndan (μ ) büyük (H1 : X > µ ) veya küçük (H1: X < µ ) oldu¤u durumlarda tek tarafl› red bölgesi tan›mlan›rken, birbirine eflit olmad›¤› (H1 :
X ≠ µ ) durum için ise çift tarafl› red bölgesi tan›mlanmaktad›r (fiekil 5.1).
Mühendislik ve e¤itim
bilimlerinde güven seviyesi
genellikle %5 olarak
al›n›rken, sa¤l›k bilimlerinde
%1 ve sosyal bilimlerde
%10 olarak
al›nabilmektedir.
Kabul ve red bölgeleri aras›
s›n›r› tan›mlayan teorik test
istatisti¤i, belirli bir α
anlaml›l›k düzeyi (olas›l›¤›)
ve örnek büyüklü¤üne ba¤l›
olarak, örnek kütle da¤›l›m
modeline göre seçilen
çizelgelerden
belirlenebilmektedir.
fiekil 5.1
Tek ve çift
tarafl› red
bölgeleri
α /2
α
Kabul bölgesi
a) Tek tarafl› red bölgesi
Red bölgesi
α /2
Red
bölgesi
Kabul
bölgesi
Red
bölgesi
b) Çift tarafl› red bölgesi
Test ‹statisti¤ini Hesaplanmas› ve Karar Verme
Örnek kütle ve ana kütle parametreleri aras›ndaki fark›n standart hataya oran›na test istatisti¤i denilmekte olup, örnek kütleden elde edilmifl ortalama, oran, varyans gibi parametrelere ve örnekleme büyüklü¤üne göre hesaplanmaktad›r. Test istatistiklerinin hesaplanmas›,
afla¤›daki bölümlerde ayr›nt›l› olarak ele al›nacakt›r.
Hesaplanan test istatisti¤inin red bölgesinde kalmas› durumunda H0 hipotezi
red edilir ve H1 hipotezinde ileri sürülen iddian›n do¤ru oldu¤u karar› verilir. Test
istatisti¤inin kabul bölgesinde kalmas› durumunda ise, H0 hipotezi kabul edilir ve
H1 hipotezinde ileri sürülen iddian›n yanl›fl oldu¤una karar verilir.
94
Co¤rafi Bilgi Sistemleri ‹çin Temel ‹statistik
ANA KÜTLE ORTALAMASINA ‹L‹fiK‹N TESTLER
Yeni bir teknoloji veya yöntem uygulanmas› sonras› yap›lan örnekleme sonucunda hesaplanan örnek kütle ortalamas› ( X ) ile teorik olarak veya geçmifl gözlemlere göre belirlenen veya bilinen ana kütle kütle ortalamas› (μ ) aras›ndaki farkl›l›¤›n anlaml›l›¤› test edilebilir. Genellikle ana kütle ortalamas› bilinmemekle birlikte, bilindi¤i varsay›larak testler yap›l›r.
Ana kütle ortalamas›n›n test edilmesinde H0 hipotezi;
H0 : X = μ
fleklinde kurulur. Uygulanan yeni teknoloji veya yöntemin ana kütle ortalamas›n›
de¤ifltirmedi¤i kabulüne dayanan H0 hipotezine karfl›t olarak ise H1 hipotezi üç
farkl› flekilde oluflturulabilir.
H1 : X ≠
ÖRNEK
μ
(Çift tarafl› test)
H1 : X > μ
(Tek tarafl› test)
H1 : X < μ
(Tek tarafl› test)
Bir yap› kimyasallar› üretimi yapan firman›n üretti¤i 50 kg’l›k torbalara paketlenen seramik yap›flt›r›c›lar›n›n a¤›rl›klar›n›n 50 kg’dan az oldu¤u iddia ediliyorsa,
H0 ve H1 hipotezleri nas›l kurulur?
Çözüm : Ana kütle ortalamas› μ = 50 kg olarak bilindi¤ine göre H0 hipotezi, iddiay› araflt›ran firma taraf›ndan, iddian›n yanl›fl oldu¤u ve örnek kütle ortalamas›n›n ( X ) ana kütle ortalamas›na eflit olaca¤› fleklinde kurulur.
H0 : X = μ = 50 kg
Buna karfl›l›k, müflterilerin iddias› olan H1 hipotezi ise, iddian›n do¤ru oldu¤u
fleklinde kurulur.
H1 : X < μ = 50 kg
ÖRNEK
Örnek kütledeki veri say›s›
30’dan büyük (n≥ 30)
oldu¤unda (büyük
örnekleme) normal da¤›l›m›n
özelliklerinden yararlanarak,
30’dan küçük (n<30)
oldu¤unda (küçük
örnekleme) ise Student t
da¤›l›m›n›n özelliklerinden
yararlanarak red bölgesi
tan›mlamas› yap›l›r ve test
istatisti¤i hesaplan›r.
Bir madencilik firmas› alt›n oldu¤u iddia edilen bir bölgeden ald›¤› örnekleri analiz ettirdi¤inde, sahada ortalama olarak 1 gr/ton alt›n oldu¤unu tespit etmifltir. Bu
durumda hipotezleri nas›l kurars›n›z?
Çözüm : Daha önceden ana kütle ortalamas› bilinmedi¤ine göre, ana kütle ortalamas›n› μ =0 kabul edebiliriz. Bu durumda H0 hipotezini, örnekleme sonucu bulunan de¤erin rassal olarak bulundu¤u, örneklemeye devam edilirse, asl›nda ortalaman›n s›f›r olaca¤› fleklinde kurar›z.
H0 : X = μ =0
‹ddia ise sahada alt›n oldu¤u ve eskiden bilinenin yanl›fl oldu¤u fleklinde oldu¤undan, H1 hipotezi afla¤›daki gibi kurulur.
H1 : X > μ =0
Hipotezleri oluflturduktan sonra, s›ras›yla anlamal›l›k düzeyinin seçimi, red bölgesinin tan›mlanmas›, test istatisti¤inin hesaplanmas› ve karar verme ifllemleri uygulan›r. Red bölgesinin belirlenmesi ve test istatisti¤inin hesaplanmas›ndan önce
5. Ünite - ‹statistiksel Karar Vermede Hipotez Testleri
95
örnek büyüklü¤ünü dikkate alarak, örneklemenin büyük veya küçük örnekleme
olup olmad›¤›n› incelemek gerekir.
Büyük Örneklemelerde Ortalamalar›n Testi
Örnek kütlede bulunan örnek say›s›n›n 30’dan büyük oldu¤u (n≥ 30) ve örneklerin normal da¤›l›m gösterdi¤i durumlarda red bölgesinin tan›mlanmas›nda ve test
istatisti¤inin hesaplanmas›nda normal da¤›l›m›n özelliklerinden yararlan›l›r.
Red bölgesini tan›mlayabilmek için öncelikle belirli bir α anlaml›l›k düzeyi için
standart normal da¤›l›m (Z) çizelgelerinden, red bölgesi s›n›r›n› ifade eden teorik test
istatisti¤i de¤eri belirlenir. H1 hipotezinin tek tarafl› veya çift tarafl› olmas›na göre ;
• Tek tarafl› test için Z α
• Çift tarafl› test için Z α/2
belirlendikten sonra ise red bölgesi tan›mlan›r.
Ana kütle varyans›n›n ve standart sapmas›n›n bilindi¤i bir durumda, ana kütleden yap›lacak n’er bireylik büyük örneklemeler sonucunda, her seferinde ana kütle ortalamas› ile örnek kütle ortalamalar› aras› farklar› hesaplar ve bu farklar›n da¤›l›m›n› araflt›r›rsak, ortalamalar aras› farklar›n da¤›l›m› normal da¤›l›m gösterir. Bu
nedenle, büyük örneklemeler için ortalamalar›n testinde, test istatisti¤ini afla¤›daki
standart normal de¤er (Zh) eflitli¤i yard›m›yla hesaplayabiliriz.
Zh =
X−µ
σ
X
Burada, σ X : ana kütle ve örnek kütle ortalamalar› aras›ndaki farklar›n da¤›l›m›n›n standart hatas› (standart sapmas›) olup, ana kütle birey say›s›n›n çok büyük
oldu¤u durumlarda;
σX =
σ
n
Ana kütle standart
sapmas›n›n (σ ) bilinmedi¤i,
fakat örnek kütlenin
standart sapmas›n›n (S)
bilindi¤i büyük
örneklemelerde, σ = S
kabul edilebilmektedir.
kabul edilebilmektedir. Bu eflitlikte ise, σ : ana kütlenin standart sapmas› ve n:
örnek kütlenin birey say›s›d›r.
Teorik test istatisti¤inin belirlenmesi ve test istatisti¤inin hesaplanmas› sonras›nda;
• Zh > Zα veya Zα /2 ise, Zh red bölgesinde kalaca¤›ndan H0 hipotezi red edilir.
• Zh < Zα veya Zα /2 ise, Zh kabul bölgesinde kalaca¤›ndan H0 hipotezi kabul
edilir ve H1 red edilir.
Bir yap› kimyasallar› üretimi yapan firman›n üretti¤i seramik yap›flt›r›c› torbalar›n›n üzerinde a¤›rl›¤›n›n 50 kg ve standart sapmas›n› 1 kg oldu¤u yazmaktad›r.
Bir müflteri seramik yap›flt›r›c› torbalar› a¤›rl›klar›n›n 50 kg’dan az oldu¤unu iddia etmektedir. Bu idday› test etmek amac›yla 32 torba örnek tart›lm›fl ve örnek torbalar›n ortalama a¤›rl›¤› 48 kg olarak bulunmufltur. Müflterinin iddias›n› %5 anlaml›l›k düzeyine göre test ediniz. Müflterinin iddias› do¤rumudur?
Çözüm : Veriler; μ =50 kg, σ =1 kg, n=32 ve X = 48 kg
Hipotezler;
H0 : X = μ = 50 kg
H1 : X < μ = 50 kg (Tek tarafl› test)
ÖRNEK
96
Co¤rafi Bilgi Sistemleri ‹çin Temel ‹statistik
Anlaml›l›k düzeyine göre teorik test istatisti¤i;
α =0,05 için Z çizelgesinden 0,45 olas›l›¤›na karfl›l›k gelen Zα = Z0.05 = 1,645
de¤erini buluruz. (Kitab›n sonundaki Z tablosuna bak›n›z).
Red Bölgesini; Zh > Zα ise H0 red edilir, H1 kabul edilir fleklinde tan›mlar›z.
Test istatisti¤i;
Zh =
X−µ
σ
X
σ =
X
SIRA S‹ZDE
D Ü fi Ü N E L ‹ M
S O R U
D‹KKAT
SIRA S‹ZDE
AMAÇLARIMIZ
ÖRNEK
K ‹ T A P
TELEV‹ZYON
‹NTERNET
Zh =
σ
n
=
1
= 0, 177
32
SIRA
S‹ZDE
48
− 50
= 11, 3
0,177
D Ü fi Ü N E L ‹ M
Karar : Zh> Zα oldu¤undan H0 hipotezi reddedilir, H1 hipotezi kabul edilir.
Müflterinin iddias› do¤rudur. Seramik yap›flt›r›c› torbalar›na 50 kg’dan daha az malS O R U
zeme doldurulmaktad›r.
Karar aflamas›nda,
test istatisti¤i teorik istatisti¤in pozitif de¤eri ile karfl›laflt›D ‹ K K A hesaplanan
T
r›ld›¤›ndan, örnek kütle ortalamas›n›n ana kütle ortalamas›ndan küçük oldu¤u durumlarda, test istatisti¤ini hesaplarken bulunan de¤erin mutlak de¤erini almak gerekmektedir.
N N
SIRA S‹ZDE
Bir kent merkezine
kullanma suyu sa¤layan göletin kurflun içeri¤i ortalamas›n›n
AMAÇLARIMIZ
3 mg/kg oldu¤u bilinmektedir. Göletin kurflun içeri¤inde de¤iflim olup olmad›¤›
hususunda yap›lan bir araflt›rma kapsam›nda, göletten al›nan 40 örne¤in analizK ‹ T Akurflun
P
leri yap›ld›¤›nda
içeri ortalamas›n›n 3,4 mg/kg ve standart sapmas›n›n 1,5
mg/kg oldu¤u belirlenmifltir. %5 anlaml›l›k düzeyine göre göletin kurflun içeri¤i ortalamas›nda de¤iflim olmufl mudur?
TELEV‹ZYON
Çözüm : Veriler; μ = 3 mg/kg, n=40, X =5 mg/kg ve S= 1,5 mg/kg d›r. Ana
kütle standart sapmas› (σ ) bilinmemekle birlikte, n>30 oldu¤undan σ =S=1,5 mg/kg
alabiliriz.
‹NTERNET
Hipotezler;
H0 : X = μ = 3 mg/kg
H1 : X ≠ μ = 3 mg/kg (Çift tarafl› test)
Anlaml›l›k düzeyine göre teorik test istatisti¤i;
α =0,05 oldu¤undan α /2=0,025 için Z çizelgesinden 0,475 olas›l›¤›na karfl›l›k
gelen Zα /2 = Z0.025 = 1,96 de¤erini buluruz. Z tablosuna bak›n›z).
Red Bölgesini; Zh > Zα
/2
ise H0 red edilir, H1 kabul edilir fleklinde tan›mlar›z.
97
5. Ünite - ‹statistiksel Karar Vermede Hipotez Testleri
Test istatisti¤i;
X−µ
σ
Zh =
X
σ =
X
Zh =
σ
=
n
1, 5
= 0, 237
40
3, 4 − 3
= 1, 69
0, 237
Karar : Zh< Zα /2 oldu¤undan H0 hipotezi kabul edilir, H1 hipotezi red edilir.
%95 olas›l›kla gölet suyu kurflun kirlili¤i ortalamas›nda de¤iflim olmam›flt›r. Farkl›l›k rassal olarak, örnekleme hatalar›ndan meydana gelmifl olabilir.
Günlük ortalama üretimi 880 ton olan bir kömür iflletmesinde, yeni bir
yöntemin
SIRA
S‹ZDE üretimi artt›rd›¤› ileri sürülmektedir. ‹ddiay› incelemek üzere arda arda 50 günün üretimi ele al›narak yap›lan hesaplamalar sonucunda ortalama üretimin 892 ton ve standart sapman›n 21 ton oldu¤u
D Ü fi Ü N E L ‹ M
bulunmufltur. Üretimin gerçekten art›p artmad›¤›n› %5 anlaml›l›k düzeyine göre test ediniz.
1
SIRA S‹ZDE
D Ü fi Ü N E L ‹ M
Küçük Örneklemelerde Ortalamalar›n Testi S O R U
S O R U
Örnek say›s›n›n 30’dan fazla oldu¤u büyük örneklemelerde, örneklerin istatistiksel
da¤›l›m› normal olabilmektedir. Ancak, araflt›rmaya ayr›lan para,
zaman ve materD‹KKAT
yalin k›s›tl› oldu¤u durumlarda büyük örnekleme (n>30) yapma olana¤› olmayabilmektedir. Örnek say›s›n›n 30’dan küçük oldu¤u durumlarda ise örneklerin daSIRA S‹ZDE
¤›l›fl› normal da¤›l›m göstermez. Ayr›ca, örnek say›s› az oldu¤unda
(n<30), σ yerine S kullan›lamaz. Örnek büyüklü¤ünün 30’dan az oldu¤u küçük örneklerde, red
bölgesinin tan›mlanmas›nda ve test istatisti¤inin hesaplanmas›nda
Student (t) da¤›AMAÇLARIMIZ
l›fl›n›n özelliklerinden yararlan›l›r.
Student t da¤›l›fl› simetrik bir da¤›l›fl olup, ortalamas› s›f›rd›r. Normal da¤›l›fla
göre daha yayvan bir flekil gösterir. Student t da¤›l›fl›n›n serbestlik
(v) deK ‹ T derecesi
A P
nilen bir tane parametresi vard›r ve v=n-1 ile ifade edilir.
Küçük örneklemelerde red bölgesinin tan›mlanmas›nda, öncelikle belirli bir
anlaml›l›k düzeyi ve v = n -1 serbestlik derecesi için StudentT EtL da¤›l›m›
E V ‹ Z Y O N çizelgelerinden, red bölgesi s›n›r›n› ifade eden teorik test istatisti¤i de¤eri belirlenir. H1 hipotezinin tek tarafl› veya çift tarafl› olmas›na göre ;
• Tek tarafl› test için tα ,v
‹NTERNET
• Çift tarafl› test için tα /2,v
belirlendikten sonra ise red bölgesi tan›mlan›r.
Küçük örneklemeler için ortalamalar›n testinde, test istatisti¤ini afla¤›daki eflitlik yard›m›yla hesaplayabiliriz.
t da¤›l›fl›n›n varyans› normal
da¤›l›fl›n varyans›ndan
büyük olup, serbestlik
D‹KKAT
derecesi büyüdükçe aradaki
fark azal›r. Serbestlik
derecesi (n-1)SIRA
> 30 S‹ZDE
oldu¤unda t da¤›l›fl› Z
da¤›l›fla çok yaklafl›r.
Örne¤in, 30 serbestlik
derecesi ile α AMAÇLARIMIZ
= 0,05 için
t o, 05,30 = 1, 697 iken
N N
th =
X −µ
S
X
Burada, SX : ana kütle ve örnek kütle ortalamalar› aras›ndaki farklar›n da¤›l›m›n›n standart hatas› (standart sapmas›) olup, afla¤›daki eflitlikle hesaplan›r.
SX = S
n
Z0.05 = 1, 645
‘dir.
K ‹ T A P
TELEV‹ZYON
‹NTERNET
98
Co¤rafi Bilgi Sistemleri ‹çin Temel ‹statistik
Teorik test istatisti¤inin belirlenmesi ve test istatisti¤inin hesaplanmas› sonras›nda afla¤›daki kararlar› verebiliriz.
• th > tα, v veya tα /2,v ise, th red bölgesinde kalaca¤›ndan H0 hipotezi red edilir ve H1 kabul edilir.
• th < tα /v veya tα /2,v ise, th kabul bölgesinde kalaca¤›ndan H0 hipotezi kabul
edilir ve H1 red edilir.
ÖRNEK
Bir kent merkezinde bulunan bulvarda, araçlar›n h›z s›n›rlamas›na uymamalar›
nedeniyle ortalama her ay 5 trafik kazas› meydana gelmektedir. Bulvar girifllerine
yap›lan h›z kesiciler sonras›nda, 6 ay boyunca meydana gelen ayl›k trafik kazalar› araflt›r›ld›¤›nda, ayl›k trafik kazas› ortalamas›n›n 4,7 ve standart sapmas›n›n
0,7 oldu¤u belirlenmifltir. %5 anlaml›l›k düzeyi için trafik kazalar›nda azalma
meydana gelip gelmedi¤ini test ediniz.
Çözüm : Veriler; μ =5 kaza/ay, n=6, X = 4,7 kaza/ay ve S= 0,7 kaza/ay d›r.
Hipotezler;
H0 : X = μ = 5 kaza/ay
H1 : X < μ = 5 kaza/ay (Tek tarafl› test)
Anlaml›l›k düzeyine göre teorik test istatisti¤i;
α =0,05 ve v=n-1=6-1=5 oldu¤undan, t çizelgesinden tα
,v
= t0.05,5 = 2,015 de¤e
rini buluruz. (Kitab›n sonundaki t tablosuna bak›n›z).
Red Bölgesini; th > tα
,v
ise H0 red edilir, H1 kabul edilir fleklinde tan›mlar›z.
Test istatisti¤i;
th =
X−µ
S
X
SX =
th =
S
n
=
0, 7
= 0, 286
6
4, 7 − 5
= 1, 049
0, 286
Karar : th < tα ,v oldu¤undan H0 hipotezi kabul edilir, H1 hipotezi red edilir.
%95 olas›l›kla h›z kesiciler trafik kazalar›nda azalma sa¤lamam›flt›r. Farkl›l›k rassal
olarak, örnekleme hatalar›ndan meydana gelmifl olabilir.
ÖRNEK
Bir kepçeli yükleyicinin yükleme, kepçeyi doldurma, 20 m tafl›ma, yükü boflaltma
ve geri dönüfl için geçecek süre hakk›nda katalo¤unda verilen ortalama süre 200
saniyedir. ‹fl yerinde çal›flma s›ras›nda yap›lan 12 adet zaman etüdü sonucunda,
süre ortalamas› 260 sn ve standart sapmas› 45 sn olarak bulunmufltur. Bu zaman
etüdü sonucuna göre, katalogda verilen sürelerin her iflletme koflullar› için de kullan›l›p kullan›lmayaca¤›n› %1 anlaml›l›k düzeyi için test ediniz.
99
5. Ünite - ‹statistiksel Karar Vermede Hipotez Testleri
Çözüm : Veriler; μ =200
sn, n=12, X =260 sn ve S= 45 sn dir.
Hipotezler;
H0 : X = μ = 200 sn
H1 : X ≠ μ = 200 sn (Çift tarafl› test)
Anlaml›l›k düzeyine göre teorik test istatisti¤i;
α =0,01 ve α / 2 = 0,005 , v=n-1=12-1=11 oldu¤undan, t çizelgesinden
tα /2.v = t0.005,11 = 3,106 de¤erini buluruz.
Red Bölgesini; th > tα/2,
v
ise H0 red edilir, H1 kabul edilir fleklinde tan›mlar›z.
Test istatisti¤i;
X−µ
S
th =
X
SX = S
n
th =
=
45
= 12, 99
12
260 − 200
= 4, 62
12, 99
Karar : th > tα/2, v oldu¤undan H0 hipotezi red, H1 hipotezi kabul edilir. %99
olas›l›kla katalogdaki de¤erler her iflletme koflulu için uygun de¤ildir.
S‹ZDEakarsuya kaBir bölgede erozyon nedeniyle y›lda 1 km2’lik alandan ortalama 50 tonSIRA
topra¤›n
r›flt›¤› bilinmektedir. Erozyonu önlemek amac›yla yap›lan a¤açland›rma çal›flmalar› sonras›nda 5 y›l boyunca akarsuya kar›flan toprak miktar› araflt›r›lm›fl ve toprak kar›flma miktar› ortaD Ü fi Ü N E L ‹ M
lamas›n›n y›ll›k 35 ton ve standart sapmas›n›n 15 ton oldu¤u belirlenmifltir. %5 anlaml›l›k düzeyine göre a¤açland›rma çal›flmalar›n›n erozyon miktar›n› azalt›p azaltmad›¤›n› test ediniz.
ANA KÜTLE ORANINA ‹L‹fiK‹N TESTLER
2
S O R U
D Ü fi Ü N E L ‹ M
S O R U
Baz› araflt›rmalarda belirli bir olay›n meydana gelme olas›l›¤› veya belirli bir birim
D‹KKAT
içindeki oran› önemli olabilmektedir. Oranlarla ifade edilen bu gibi istatistiksel
olaylarda, ana kütleden çekilecek n birimlik örneklerin oranlar› hesaplanarak, ana
kütle oran› hakk›nda karar vermek mümkün olabilmektedir. SIRA S‹ZDE
Ana kütle oran›n›n (π) bilindi¤i bir durumda, ana kütleden elde edilen n birimlik örnek kütle oran›n›n (P) ana kütle oran› ile ne derecede uyumlu olup olmad›AMAÇLARIMIZ
¤›n› test etmede H0 hipotezini;
N N
H0 : P = π
SIRA S‹ZDE
K ‹ T A P
D‹KKAT
SIRA S‹ZDE
AMAÇLARIMIZ
K ‹ T A P
fleklinde kurar›z. Örnek kütle oran› ile ana kütle oran›n›n birbirine eflit oldu¤u kabulüne dayanan H0 hipotezine karfl›t olarak ise H1 hipotezi üç farkl› flekilde kurabiliriz.
H1 : P ≠ π
(Çift tarafl› test)
H1 : P > π
(Tek tarafl› test)
H1 : P < π
(Tek tarafl› test)
TELEV‹ZYON
TELEV‹ZYON
‹NTERNET
‹NTERNET
100
Co¤rafi Bilgi Sistemleri ‹çin Temel ‹statistik
Büyük Örneklemelerde Oranlar›n Testi
Büyük örneklemelerde oranlar›n testinde de, belirli bir anlaml›l›k düzeyi için red bölgesinin tan›mlanmas› ve teorik test istatisti¤inin belirlenmesi, ortalamalar›n testindekinin benzeri flekilde yap›l›r. Daha sonra ise, test istatisti¤inin hesaplanmas›na geçilir.
Ana kütleden yap›lacak n’er bireylik büyük örneklemeler sonucunda, her seferinde ana kütle oran› (π) ile örnek kütle oranlar› (P) aras› farklar› hesaplar ve bu
farklar›n da¤›l›m›n› araflt›r›rsak, oranlar aras› farklar›n da¤›l›m› normal da¤›l›m gösterir. Bu nedenle, büyük örneklemeler için oranlar›n testinde, test istatisti¤ini afla¤›daki standart normal de¤er (Zh) eflitli¤i yard›m›yla hesaplayabiliriz.
Zh =
P−π
σπ
Burada, σ π : ana kütle ve örnek kütle oranlar› aras›ndaki farklar›n da¤›l›m›n›n
standart hatas› (standart sapmas›) olup, afla¤›daki eflitlikle hesaplan›r.
σπ =
Ana kütle oran› varyans›n›n
bilinmedi¤i, fakat örnek
kütle oran› varyans›n›n
[P.(1-P)] bilindi¤i büyük
örneklemelerde,
π .(1-π )=P.(1-P) kabul
edilebilmektedir.
ÖRNEK
π.(1 − π )
n
Bu eflitlikte ise, π.(1-π) : ana kütle oran›n›n varyans› ve n: örnek kütlenin birey
say›s›d›r.
Teorik test istatisti¤inin belirlenmesi ve test istatisti¤inin hesaplanmas› sonras›nda, hipotezlerin kabulü veya red edilmesi karar› da, ortalamalar›n testi yöntemindekine benzer flekilde yap›l›r.
Bir karayolu ulafl›m flirketi flehirler aras› yolculuklarda koltuklar›n günlük doluluk
oran› ortalamas›n›n %60 oldu¤unu tahmin etmektedir. Ancak, son reklam kampanyas› sonras›nda doluluk oran› ortalamas›n›n art›¤›n› iddia etmektedir. Bu
amaçla 60 günlük verilerin ortalamas›n› hesaplad›¤›nda doluluk oran› ortalamas›n›n %75 oldu¤unu hesaplam›flt›r. Ulafl›m flirketi günlük koltuk doluluk oran› ortalamas›n›n art›p artmad›¤›n› %5 anlaml›l›k düzeyi için test ediniz.
Çözüm : Veriler; π=0,60 , n=60, P=0,75 dir.
Hipotezler;
H0 : P = π = 0,60
H1 : P > π = 0,60 (Tek tarafl› test)
Anlaml›l›k düzeyine göre teorik test istatisti¤i;
α =0,05 oldu¤undan Z çizelgesinden 0,45 olas›l›¤›na karfl›l›k gelen Zα = Z0.05
= 1,645 de¤erini buluruz.
Red Bölgesini; Zh > Zα ise H0 red edilir, H1 kabul edilir fleklinde tan›mlar›z.
Test istatisti¤i;
Zh =
P−π
σπ
101
5. Ünite - ‹statistiksel Karar Vermede Hipotez Testleri
σπ =
Zh =
π.(1 − π )
0, 60.(1 − 0, 60)
=
= 0, 063
n
60
0, 75 − 0, 60
= 2, 38
0, 063
Karar : Zh> Zα oldu¤undan H0 hipotezi red, H1 hipotezi kabul edilir. %95 olas›l›kla reklam kampanyas› ile ulafl›m flirketinin günlük koltuk doluluk oran› artm›flt›r.
Maden iflletmelerinde kullan›lan kaz› makinelerinin fiili çal›flma/ teorik
çal›flma
SIRA
S‹ZDE zaman› oran›n›n %60 oldu¤u bilinmektedir. Bir araflt›rmac› ise kömür iflletmelerinde 200 adet kaz›c› makine çal›flma oranlar›n› araflt›rd›¤›nda %70 oldu¤unu tesbit etmifltir. Acaba kömür iflletmeleÜ fi Ü N E Liçin
‹ M test ediniz.
rinde kaz›c› makine çal›flma oranlar› daha m› yüksektir? %1 anlaml›l›kDdüzeyi
Küçük Örneklemelerde Oranlar›n Testi
3
S O R U
Küçük örneklemeler için oranlar›n testinde, test istatisti¤ini afla¤›daki eflitlik yard›m›yla hesaplayabiliriz.
D‹KKAT
P−π
th =
SP
SIRA S‹ZDE
N N
Burada, Sp : ana kütle ve örnek kütle ortalamalar› aras›ndaki farklar›n da¤›l›m›n›n standart hatas› (standart sapmas›) olup, afla¤›daki eflitlikle hesaplan›r.
AMAÇLARIMIZ
SP =
P.(1 − P)
n
S O R U
D‹KKAT
SIRA S‹ZDE
AMAÇLARIMIZ
K ‹ T A P
TELEV‹ZYON
TELEV‹ZYON
Üniversite s›navlar›na haz›rl›k dershanelerinden birisi, üniversite girifl s›navlar›nda ö¤rencilerinin %70’inden fazlas›n›n dört y›ll›k lisans programlar›na yerleflebildi¤ini iddia etmektedir. 2010 y›l›nda rassal olarak seçilen 16‹ Nö¤rencinin
10’u liTERNET
sans programlar›na yerleflmifltir. %1 anlaml›l›k düzeyine göre iddian›n do¤ru olup
olmad›¤›n› test ediniz.
Çözüm : Veriler; π = 0,70 , n=16, P = 10/16 = 0,625 dir.
Hipotezler;
H0 : P = π = 0,70
H1 : P > π = 0,70 (Tek tarafl› test)
Anlaml›l›k düzeyine göre teorik test istatisti¤i;
α =0,01 ve v=n-1=16-1=15 oldu¤undan, t çizelgesinden tα .v = t0.01,15 = 2,602
de¤erini buluruz.
v
D Ü fi Ü N E L ‹ M
K ‹ T A P
Teorik test istatisti¤inin belirlenmesi ve test istatisti¤inin hesaplanmas› sonras›nda, hipotezlerin kabulü veya red edilmesi karar› da, küçük örneklemeler için ortalamalar›n testi yöntemindekine benzer flekilde yap›l›r.
Red Bölgesini; th >tα,
SIRA S‹ZDE
ise H0 red edilir, H1 kabul edilir fleklinde tan›mlar›z.
ÖRNEK
‹NTERNET
102
Co¤rafi Bilgi Sistemleri ‹çin Temel ‹statistik
Test istatisti¤i;
P−π
SP
th =
SP =
th =
P.(1 − P)
0, 625.(1 − 0, 625)
=
= 0,121
n
16
0, 625 − 0, 7
= 0, 62
0, 121
Karar : th < tα, v oldu¤undan H0 hipotezi kabul, H1 hipotezi red edilir. %99 olas›l›kla dershanenin iddias› yanl›flt›r.
ANA KÜTLE ORTALAMALARI ARASINDAK‹
FARKLARIN TEST‹
Ana kütle ortalamalar› aras›ndaki farklar›n testinde amaç, iki ayr› ana kütle ortalamas› aras›nda fark olup olmad›¤›na hipotez testi yöntemi ile karar vermektir. ‹ki
ana kütle ortalamalar› aras›ndaki farklar› test ederken, her iki ana kütlenin de normal da¤›l›ma sahip olmas› ve örneklem seçimlerinin birbirinden ba¤›ms›z olmas›
gerekir. Ayr›ca, ana kütle birey say›lar›n›n da sonsuz büyüklükte olmas› gerekir.
Ana kütle ortalamalar›n›n μ 1 ve μ 2 oldu¤u bilinen veya tahmin edilen iki ayr› ana kütleden n1 ve n2 birimlik örnekler al›r ve örnek kütlelerin ortalamalar›n› ( X 1 ve X 2) ve standart sapmalar›n› (S1 ve S2) hesaplarsak, bu örnek kütle
ortalamalar› yard›m›yla ana kütle ortalamalar› aras›nda anlaml› bir fark olup olmad›¤›na hipotez testi yöntemiyle karar verebiliriz. Hipotez testinde, ana kütle
ortalamalar› aras›nda fark olmad›¤›n› ifade eden H0 hipotezini afla¤›daki gibi
kurar›z.
H0 : ( X 1- X 2) = (μ 1−μ
2)
=0
Örnek kütle ortalamalar› aras›ndaki farklara göre, ana kütle ortalamalar› aras›nda da fark oldu¤u iddias› ile H1 hipotezini de;
H1 : ( X 1- X 2 ) > (μ 1-μ 2) = 0 (Tek tarafl› test)
H1 : ( X 1- X 2 ) < (μ 1-μ 2) = 0 (Tek tarafl› test)
H1 : ( X 1- X 2 ) ≠ (μ 1-μ 2) = 0 (Çift tarafl› test)
olarak üç farkl› flekilde oluflturabiliriz.
Büyük Örneklemelerde Ana Kütle Ortalamalar› Aras›ndaki
Farklar›n Testi
Büyük örneklemelerde ana kütle ortalamalar› aras›ndaki farklar›n testinde test istatisti¤i (Zh);
Zh =
( X1 − X 2 ) − (µ1 − µ2 )
σ
X1 − X 2
eflitli¤i ile hesaplanmaktad›r. Burada, σX1 −X 2 : ortalama farklar› da¤›l›m›n›n standart hatas› olup, afla¤›daki eflitlikle hesaplanabilir.
5. Ünite - ‹statistiksel Karar Vermede Hipotez Testleri
σX -X =
1
2
σ12
n1
+
σ22
n2
Burada da, σ 1 ve σ 2 : iki ayr› ana kütlenin standart sapmas›d›r.
Teorik test istatisti¤inin belirlenmesi ve test istatisti¤inin hesaplanmas› sonras›nda, hipotezlerin kabulü veya red edilmesi karar› da, ortalamalar›n testi yöntemindekine benzer flekilde yap›l›r.
Bir kömür havzas›nda bulunan iki ayr› kömür madeni oca¤›ndan al›nan örnekler üzerinde yap›lan ›s›l de¤er (kilokalori/kilogram) analizleri sonucunda afla¤›daki veriler elde edilmifltir. Bu analiz sonuçlar›na göre iki kömür madeni oca¤›n›n ortalama ›s›l de¤erleri aras›nda önemli bir fark var m›d›r? %95 güven seviyesine göre test ediniz.
Kömür
Oca¤› No
n
Örnek Büyüklü¤ü
Ortalama (kcal/kg)
S
Std. Sapma (kcal/kg)
1
30
3600
900
2
40
3200
700
X
Çözüm : Veriler; μ 1 - μ 2 = 0 kcal/kg, n1= 30 ve n2= 40, X 1= 3600 kcal/kg ve
X 2=3200 kcal/kg, S1=900 kcal/kg ve S2=700 kcal/kg d›r. Ana kütlelerin standart
sapmalar› (σ 1 ve σ 2) bilinmemekle birlikte, n1 ve n2>30 oldu¤undan σ 1 = S1 ve
σ 2 = S2 kabul edebiliriz.
Hipotezler;
H0 : ( X 1 - X 2) = (μ 1−μ
2)
=0
H1 : ( X 1 - X 2) ≠ (μ 1−μ
2)
= 0 (Çift tarafl› test)
Anlaml›l›k düzeyine göre teorik test istatisti¤i;
α =0,05 oldu¤undan α /2=0,025 için Z tablosundan 0,475 olas›l›¤›na karfl›l›k gelen Zα /2 = Z0.025 = 1,96 de¤erini buluruz.
Red Bölgesini; Zh > Zα
Test istatisti¤i;
Zh =
ise H0 red edilir, H1 kabul edilir fleklinde tan›mlar›z.
(X1 - X2 )- (µ1 - µ2 )
σ
σX -X =
1
2
Zh =
/2
X1 - X 2
σ12
σ2
9002 7002
+ 2 =
+
= 198,1 kcal/kg
n1 n2
30
40
(3600 -3200)-0
= 2,02
198,1
Karar : Zh> Zα /2 oldu¤undan H0 hipotezi red, H1 hipotezi kabul edilir. %95
olas›l›kla iki kömür madeni oca¤›n›n ›s›l de¤er ortalamalar› aras›nda önemli ve anlaml› farklar vard›r.
103
Ana kütlelerin standart
sapmalar›n›n bilinmedi¤i
(σ 1 ve σ 2), fakat örnek
kütlelerin standart
sapmalar›n›n (S1 ve S2)
hesapland›¤› büyük
örneklemelerde
(n1 ve n2>30), σ 1 = S1 ve
σ 2 = S2 kabul
edilebilmektedir.
ÖRNEK
104
Co¤rafi Bilgi Sistemleri ‹çin Temel ‹statistik
Küçük Örneklemelerde Ortalamalar Aras›ndaki Farklar›n
Testi
Küçük örneklemelerde ana kütle ortalamalar› aras›ndaki farklar için test istatisti¤i
(th);
th =
(X1 - X2 ) - (µ1 - µ2 )
S
X1 - X 2
eflitli¤i ile hesaplanmaktad›r. Burada, : iki örnek kütle ortalama farklar› da¤›l›m›n›n
standart hatas› olup, afla¤›daki eflitlikle hesaplanabilir (Serper, 2000).
SIRA S‹ZDE
D Ü fi Ü N E L ‹ M
S O R U
D‹KKAT
SIRA S‹ZDE
ÖRNEK
AMAÇLARIMIZ
K ‹ T A P
TELEV‹ZYON
‹NTERNET
(n1.S12 ) + (n2 .S22 ) 1
1
SX -X SIRA
= S‹ZDE
.
+
1
2
n1 + n2 -2
n1 n2
Burada, S1 ve S2: iki ayr› örnek kütlenin standart sapmas›; n1 ve n2 : iki ayr› örD Ü fi Ü N E L ‹ M
nek kütlenin birey say›lar›d›r.
Küçük örneklemelerde teorik test istatisti¤inin (tα veya tα /2) belirlenmesinde,
S O R U v = n +n - 2 olarak al›n›r (Serper, 2000).
serbestlik derecesi
1 2
Küçük örneklemelerde
D ‹ K K A T her iki ana kütleden al›nan örneklerin toplam› 30’dan küçük olmal›d›r.
N N
SIRA S‹ZDE
‹ki ayr› firma taraf›ndan üretilen dizüstü bilgisayarlar›n›n pillerinin flarj olduktan sonraki dayan›m sürelerinin farkl› oldu¤u iddia edilmektedir. Bu iddiay› kan›tlamak AMAÇLARIMIZ
amac›yla firmalar›n bilgisayarlar›ndan örnekler al›nm›fl ve dayan›m
süreleri test edildi¤inde afla¤›daki veriler elde edilmifltir. Bu analiz sonuçlar›na göre iki bilgisayar firmas› ürünlerinin ortalama pil dayan›m süreleri aras›nda önemK ‹bir
T Afark
P var m›d›r? %1 anlaml›l›k düzeyine göre test ediniz.
li ve anlaml›
Bilgisayar
TELEV‹ZYON
Firma No
n
Örnek Büyüklü¤ü
Ortalama (Saat)
S
Std. Sapma (Saat)
1
5
6,2
0,9
2‹ N T E R N E T
6
5,4
0,7
X
Çözüm : Veriler; μ 1− μ 2 = 0 Saat, n1 = 5 ve n2 = 6 , X 1=6,2 Saat ve X 2=5,4 Saat, S1=0,9 Saat ve S2=0,7 Saat dir.
Hipotezler;
H0 : ( X 1- X 2) = (μ 1− μ 2) = 0
H1 : ( X 1- X 2) ≠ (μ 1μ−
2)
= 0 (Çift tarafl› test)
Anlaml›l›k düzeyine göre teorik test istatisti¤i;
α =0,01 ve α/ 2 = 0,005 , v=n1 + n2 - 2 = 5 + 6 - 2 = 9 oldu¤undan, t tablosundan tα /2.v = t0.005,9 = 3,250 de¤erini buluruz.
Red Bölgesini; th>tα
/2,v
ise H0 red edilir, H1 kabul edilir fleklinde tan›mlar›z.
105
5. Ünite - ‹statistiksel Karar Vermede Hipotez Testleri
Test istatisti¤i;
th =
(X1 - X2 ) - (µ1 - µ2 )
S
SX - X =
1
2
th =
X1 - X 2
(n1.S12 )+ (n2 .S22 )
n1 + n2 -2
.
1
1
(5.6,22 ) + (6.5,42 ) 1 1
. + = 3,87
+
=
5+ 6 -2
5 6
n1 n2
(6,2-5,4)-0
= 0,21
3,87
Karar : th< tα/ 2,v oldu¤undan H0 hipotezi kabul, H1 hipotezi red edilir. %99
olas›l›kla bilgisayar firmalar›n›n ürünlerinin ortalama pil ömürleri aras›nda anlamal› bir fark yoktur.
Bir ilaç firmas› eski A ilac›na göre yeni gelifltirdi¤i B ilac›n›n ayn› hastal›¤a
yakalanm›fl kiSIRA S‹ZDE
flilerin ortalama iyileflme sürelerini daha da k›saltt›¤›n› iddia etmektedir. Bu amaçla ayn›
hastal›¤a yakalanm›fl iki farkl› hasta grubuna ilaçlar verilmifl ve afla¤›daki veriler elde edilD Ü fi Ü N Eazaltm›fl
L‹M
mifltir. %5 anlaml›l›k düzeyine göre yeni gelifltirilen ilaç iyileflme süresini
m›d›r?
4
S O R U
X
‹laç Ad›
n
Örnek Büyüklü¤ü
A
10
48
B
12
38
VARYANSLARIN TEST‹
Ortalama Süre
(Saat)
12
N N
10
AMAÇLARIMIZ
Normal da¤›l›ml› ve varyans› bilinen bir ana kütleden n bireylik örnekleme yaparak bu örnek kütlenin varyans›n› (S2) hesaplarsak, S2’nin anaK kütle
varyans›ndan
‹ T A P
2
(σ ) farkl› oldu¤u konusundaki bir iddiay› hipotez testi yöntemiyle test edebiliriz.
Büyük örneklemelerde (n ≥ 30) , örnek kütle varyans› ile ana kütle varyans› birbirine birbirine eflit (σ 2 = S 2) kabul edilebildiklerinden, örnek kütle varyans› yard›TELEV‹ZYON
m›yla ana kütle varyans› hakk›nda karar vermek mümkündür. Bu nedenle, varyanslar›n testi genellikle küçük örneklemeler için yap›lmaktat›r.
Ana kütle varyans›n›n test edilmesinde H0 hipotezi;
H0 : S 2 = σ
‹NTERNET
2
fleklinde kurulur. Uygulanan yeni teknoloji veya yöntemin ana kütle varyans›n› de¤ifltirmedi¤i kabulüne dayanan H0 hipotezine karfl›t olarak ise H1 hipotezi üç farkl› flekilde oluflturulabilir.
H1 :S 2 ≠ σ
2
(Çift tarafl› test)
H1 :S 2 > σ
2
(Tek tarafl› test)
H1 :S 2 < σ
2
(Tek tarafl› test)
D Ü fi Ü N E L ‹ M
S O R U
S
Std. Sapma
D‹KKAT
(Saat)
SIRA S‹ZDE
SIRA S‹ZDE
D‹KKAT
SIRA S‹ZDE
AMAÇLARIMIZ
K ‹ T A P
TELEV‹ZYON
‹NTERNET
106
Co¤rafi Bilgi Sistemleri ‹çin Temel ‹statistik
H1 hipotezinin tek tarafl› veya
çift tarafl› olmas›na göre red
bölgesini tan›mlamada
kullan›lan teorik test
istatisti¤i de¤eri afla¤›daki
flekilde belirlenir.
2
-Tek tarafl› test için χa,v
Varyanslar›n testinde red bölgesinin tan›mlanmas›nda ve test istatisti¤inin hesaplanmas›nda Khi-kare (χ 2) da¤›l›fl›ndan yararlan›lmaktad›r. Red bölgesinin tan›mlanmas›nda, öncelikle belirli bir α anlaml›l›k düzeyi ve v=n-1 serbestlik derecesi için χ 2 da¤›l›m› çizelgelerinden, red bölgesi s›n›r›n› ifade eden teorik test istatisti¤i de¤eri belirlenir.
Varyanslar›n testinde, test istatisti¤ini afla¤›daki eflitlik yard›m›yla hesaplayabiliriz.
-Çift tarafl› test için
2
χa/2,v
χ2h =
(n -1).S2
σ2
Burada, S2= örnek kütle varyans›n›, σ 2= ana kütle varyans›n› ve n= örnek kütle birey say›s›n› göstermektedir.
Teorik test istatisti¤inin belirlenmesi ve test istatisti¤inin hesaplanmas› sonras›nda afla¤›daki kararlar› verilebiliriz.
2
2
2
2
• χh > χa,v veya χa/ 2,v ise, χh red bölgesinde kalaca¤›ndan H0 hipotezi
red edilir ve H1 kabul edilir.
2
2
2
2
• χh > χa,v veya χa/ 2,v ise, χh kabul bölgesinde kalaca¤›ndan H0 hipotezi
kabul edilir ve H1 red edilir.
ÖRNEK
Bir çelik halat fabrikas›n›n üretti¤i 20 mm çapl› halatlar›n en küçük kopma mukavemetlerinin 225 kN ve standart sapmas›n›n 25 kN oldu¤u bilinmektedir. Ancak
bir asansör imalatç›s› firma, çelik halat fabrikas›ndan sat›n ald›¤› 20 mm çapl› 10
adet halattan ald›¤› numuneler üzerinde yapt›¤› deneyler sonucunda kopma mukavemeti ortalamas›n›n 250 kN ve standart sapmas›n› 35 kN bulmufltur. Bunun
üzerine, çelik halatlar›n kopma mukavemeti standart sapmas›n›n 25 kN’dan fazla oldu¤unu iddia etmeye bafllam›flt›r. %5 anlaml›l›k düzeyi için asansör firmas›n›n iddias›n› test edininiz.
Çözüm : Veriler; σ = 25 kN ve σ
(kN)2 dur.
Hipotezler;
2=
625 (kN)2 , n = 10 , S=35 kN ve S2=1225
H0 : S2 = σ
2
= 625 (kN)2
H1 : S2 > σ
2
= 625 (kN)2 (Tek tarafl› test)
Anlaml›l›k düzeyine göre teorik test istatisti¤i;
2
2
α =0,05 ve v=n-1=10-1=9 oldu¤undan, χ 2 tablosundan χa,v = χ0.05,9 = 16,919
de¤erini buluruz. (Kitab›n sonundaki χ 2 tablosuna bak›n›z).
2
2
Red Bölgesini; χh > χa,v ise H0 red, H1 kabul edilir fleklinde tan›mlar›z.
Test istatisti¤i;
χh2 =
(n -1).S2
σ
2
=
(10-1).1225
=17,64
625
107
5. Ünite - ‹statistiksel Karar Vermede Hipotez Testleri
2
2
Karar : χh > χa,v oldu¤undan H0 hipotezi red, H1 hipotezi kabul edilir. %95
olas›l›kla asansör firmas›n›n iddias› do¤rudur. Çelik halat fabrikas›n›n ürün standartlar›n› iyilefltirmesi gerekmektedir.
Bir çimento fabrikas›n›n üretti¤i çimentodan yap›lan betonlar›n sa¤laml›¤›n›n
SIRA S‹ZDEstandart sapmas›n›n 10 kg/cm2 ‘den fazla oldu¤u iddia edilmektedir. ‹ddiay› test etmek amac› ile 16 beton
–
örne¤i al›nm›fl ve bu örneklerin sa¤laml›klar›n›n ortalamas› X= 320 kg/cm2 ve standart sapD Ü fi Ü N E L ‹ M
mas› S= 14 kg/cm2 olarak bulunmufltur. %5 anlaml›l›k düzeyine göre iddiay› test ediniz.
5
SIRA S‹ZDE
D Ü fi Ü N E L ‹ M
S O R U
S O R U
D‹KKAT
D‹KKAT
SIRA S‹ZDE
AMAÇLARIMIZ
N N
SIRA S‹ZDE
AMAÇLARIMIZ
K ‹ T A P
K ‹ T A P
TELEV‹ZYON
TELEV‹ZYON
‹NTERNET
‹NTERNET
108
Co¤rafi Bilgi Sistemleri ‹çin Temel ‹statistik
Özet
N
A M A Ç
1
‹statistiksel hipotez testi kavramlar›n› aç›klayabilmek, test sürecinin aflamalar›n› ve yap›lacak ifllemleri s›ralamak.
Hipotez testinde öncelikle, örnek kütleden elde
edilen parametrelerin ana kütle parametreleriyle
uyumlu oldu¤unu iddia eden s›f›r hipotezi (Ho
hipotezi) ve uyumlu olmad›¤›n› iddia eden karfl›t hipotez (H1 hipotezi) kurulmaktad›r. Daha sonra, belirli bir güven düzeyi belirlenerek, örnek
kütle da¤›l›m modeline uygun olarak red ve kabul bölgeleri tan›mlanmaktad›r. Örnek kütle parametresinin ana kütle parametresinden küçük
veya büyük oldu¤u iddias› varsa, red bölgesi tek
tarafl› olarak; örnek kütle parametresinin ana kütle parametresine eflit olmad›¤› iddias› varsa da
red bölgesi çift tarafl› olarak belirlenmektedir.
Örnek kütle ve ana kütle parametreleri aras›ndaki fark›n standart hataya oran›na test istatisti¤i
denilmekte olup, örnek kütleden elde edilmifl
ortalama, oran, varyans gibi parametrelere ve örnekleme büyüklü¤üne göre hesaplanmaktad›r.
Hesaplanan test istatisti¤i de¤eri kabul bölgesinin içinde kal›rsa H0 hipotezi kabul edilmekte,
tersi durumda ise H0 hipotezi red edilmektedir.
N
A M A Ç
2
Ana kütle ortalamas›, oran› ve varyans› ile iki
ana kütle ortalamalar› aras› farklar›n hipotez
testi uygulamalar›n› yapmak.
Ana kütle ortalamas›, oran› ve iki ana kütle ortalamalar› aras› farklar›n hipotez testinde, örnek
kütlede bulunan örnek say›s›n›n 30’dan büyük
oldu¤u (n ≥ 30) ve örneklerin normal da¤›l›m
gösterdi¤i durumlarda, belirli bir α anlaml›l›k düzeyinde red bölgesinin s›n›r›n› ifade eden teorik
test istatisti¤i de¤eri standart normal da¤›l›m (Z)
çizelgelerinden belirlenmektedir.
Ana kütle ortalamas›, oran› ve iki ana kütle ortalamalar› aras› farklar›n hipotez testinde, örnek
büyüklü¤ünün 30’dan az oldu¤u küçük örneklerde, belirli bir α anlaml›l›k düzeyinde red bölgesinin s›n›r›n› ifade eden teorik test istatisti¤i de¤eri
Student (t) çizelgelerinden belirlenmektedir.Varyanslar›n testinde ise red bölgesinin tan›mlanmas›nda ve test istatisti¤inin hesaplanmas›nda Khikare (χ 2) da¤›l›fl›ndan yararlan›lmaktad›r.
5. Ünite - ‹statistiksel Karar Vermede Hipotez Testleri
109
Kendimizi S›nayal›m
1. Bir içme suyu dolum tesisinde üretilen suyun ortalama pH’›n›n 7’den büyük oldu¤u iddias›n› test etmek
amac›yla 30 damacanadan örnekleme yap›lm›flt›r. Bu
testte, s›f›r hipotezi nas›l kurulur?
a.
X>µ=7
b.
X=µ=7
c.
X = µ = 30
d.
X > µ = 30
e.
X <µ=7
2. Bir içme suyu dolum tesisinde üretilen suyun ortalama pH’›n›n 7’den büyük oldu¤u iddias›n› test etmek
amac›yla 30 damacanadan örnekleme yap›lm›fl ve örnek kütle ortalamas› 7,5 ve standart sapmas› 0,5 olarak
bulunmufltur. Bu testte, karfl›t hipotez nas›l kurulur?
a.
X > µ = 7,5
b.
X≠µ=7
c.
X>µ=7
d.
X > µ = 30
e.
X < µ = 7,5
3. Ana kütle ortalamas›n›n 50’den büyük olup olmad›¤›n› %5 anlaml›l›k düzeyi için test edilmesi amac›yla 36
bireylik örnek al›nd›¤›nda, örnek kütle ortalamas› 54 ve
standart sapmas› 12 olarak belirlenmifltir. Bu durumda
test istatisti¤inin de¤eri ne olur?
a. 1,05
b. 1,50
c. 1,75
d. 2,00
e. 4,50
4. Ana kütle ortalamas›n›n 36’dan farkl› olup olmad›¤›n› test etmek amac›yla 16 bireylik örnekleme yap›lm›fl
olup, örnek kütlenin ortalamas› 32 ve standart sapmas›
8 olarak bulunmufltur. Bu verilerle, teorik test istatisti¤i
2,131 ve hesaplanan test istatisti¤i 2,0 bulundu¤una göre, ana kütle ortalamas› hakk›nda ne karar verilebilir?
a. Ana kütle ortalamas› 36’dan büyüktür.
b. Ana kütle ortalamas› 36’dan küçüktür.
c. Ana kütle ortalamas› 32’ye eflittir.
d. Ana kütle ortalamas› 32’den küçüktür.
e. Ana kütle ortalamas› 36’ya eflittir.
5. Bir ilaç pazarlama flirketi piyasaya yeni ç›kard›klar›
bir ilac›n 3 günlük dozunun solunum yolu enfeksiyonlar›nda %80 oran›ndan daha fazla etkili oldu¤unu iddia
etmektedir. Bir sa¤l›k kuruluflunda ilgili ilaç 62 hastada
kullan›lm›fl olup %90 oran›nda iyileflme saptanm›flt›r.
%5 anlaml›l›k düzeyinde teorik test istatisti¤i 1,645 oldu¤una göre, yeni ilac›n solunum yolu enfeksiyonlar›nda %80 oran›ndan daha fazla etkili oldu¤u iddias› hakk›nda ne karar verilebilir? (Ana kütle ve örnek kütle
oranlar› aras›ndaki farklar›n da¤›l›m›n›n standart hatas›
σ p=0,05’dir)
a. Yeni ilaç %80 oran›ndan daha fazla etkilidir.
b. Yeni ilaç %80 oran›ndan daha az etkilidir.
c. Yeni ilac›n etkili olup olmad›¤› belirsizdir.
d. Yeni ilaç %90 oran›ndan fazla etkilidir.
e. Yeni ilaç hiç etkili de¤ildir.
6. Bir iflyerinde çal›flan bayan personelin %50’den fazlas›n›n sürücü ehliyeti olmad›¤› iddas›n› test etmek amac›yla, rassal olarak yap›lan örnekleme sonucunda 15
bayan personelin 6’s›n›n ehliyetinin olmad›¤› belirlenmifltir. Ana kütle ve örnek kütle ortalamalar› aras›ndaki
farklar›n da¤›l›m›n›n standart hatas› Sp = 0,125 oldu¤una göre test istatisti¤i (th) kaç olur?
a. 0,5
b. 0,6
c. 0,8
d. 1,2
e. 2,0
7. Ayn› motor gücüne ve a¤›rl›klara sahip iki farkl› model binek arac›n›n 100 km’de tükettikleri yak›t ortalamalar› aras›nda fark olmad›¤› iddia edilmektedir. ‹ddiay› test etmek amac›yla her iki model binek arac›ndan
rassal olarak seçilen 10’ar arac›n yak›t tüketimi ortalamalar› araflt›r›lm›fl ve %5 anlaml›l›k seviyesi için hipotez
testi yap›lm›flt›r. Bu durumda teorik test istataisti¤i olarak afla¤›dakilerden hangisi kullan›l›r?
a. Zα = Z0.05 = 1,645
b.
Zα/2 = Z0.025 = 1, 96
c.
t α,v = t0.05,9 = 1,833
d.
t α/2,v = t0.025,9 = 2,262
e.
t α/2,n = t0.025,10 = 2,228
110
Co¤rafi Bilgi Sistemleri ‹çin Temel ‹statistik
Kendimizi S›nayal›m Yan›t Anahtar›
8. Uygulanan yeni teknoloji veya yöntemin ana kütle
varyans›n› de¤ifltirmedi¤i iddias› çift tarafl› olarak test
edilmek istendi¤inde, belirli bir α anlaml›l›k seviyesi
için hangi teorik test istatisti¤i kullan›l›r?
2
a.
χα,V
b.
2
χα/2,V
e. tα
2. c
3. d
4. e
5. a
c. Zα
d. Zα
1. b
/2
,v
9. Ana kütle standart sapmas› 4 olan bir ana kütleden
rassal olarak 17 örnek al›narak örnek kütle varyans› hesapland›¤›nda 20 oldu¤u belirlenmifltir. Ana kütle varyans›nda de¤iflim olup olmad›¤› hakk›nda karar vermek amac›yla yap›lan hipotez testinde test istatisti¤i ne
olur?
a. 16
b. 17
c. 18
d. 19
e. 20
10. Ana kütle varyans›n›n 25’den büyük oldu¤u iddias›n› test etmek amac›yla 16 bireylik örnekleme yap›lm›fl
olup, örnek kütlenin standart sapmas› 6 olarak bulunmufltur. Bu verilerle, teorik test istatisti¤i 25,0 ve hesaplanan test istatisti¤i 21,6 bulundu¤una göre, ana kütle
varyans› hakk›nda ne karar verilebilir?
a. Ana kütle varyans› 25’den büyük de¤ildir.
b. Ana Kütle varyans› 25’den büyüktür.
c. Ana kütle varyans› 25’den küçüktür.
d. Ana kütle varyans› 6’dan küçüktür.
e. Ana kütle varyans› 6’dan büyük de¤ildir.
6. c
7. d
8. b
9. e
10. a
Yan›t›n›z yanl›fl ise, “Hipotezlerin Kurulmas›”
konusuna bak›n›z.
Yan›t›n›z yanl›fl ise, “Hipotezlerin Kurulmas›”
konusuna bak›n›z.
Yan›t›n›z yanl›fl ise, “Büyük Örneklemelerde Ortalamalar›n Testi” konusuna bak›n›z.
Yan›t›n›z yanl›fl ise, “Küçük Örneklemelerde Ortalamalar›n Testi” konusuna bak›n›z.
Yan›t›n›z yanl›fl ise, “Büyük Örneklemelerde
Oranlar›n Testi” konusuna bak›n›z.
Yan›t›n›z yanl›fl ise, “Küçük Örneklemelerde
Oranlar›n Testi” konusuna bak›n›z.
Yan›t›n›z yanl›fl ise, “Küçük Örneklemelerde Ortalamalar Aras›ndaki Farklar›n Testi” konusuna
bak›n›z.
Yan›t›n›z yanl›fl ise, “Varyanslar›n Testi” konusuna bak›n›z.
Yan›t›n›z yanl›fl ise, “Varyanslar›n Testi” konusuna bak›n›z.
Yan›t›n›z yanl›fl ise, “Varyanslar›n Testi” konusuna bak›n›z.
S›ra Sizde Yan›t Anahtar›
S›ra Sizde 1
Veriler; μ = 880 ton/gün, n=50, X = 892 ton/gün ve
S=21 ton/gün dür. Ana kütle standart sapmas› (σ ) bilinmemekle birlikte, n>30 oldu¤undan σ =S=21 ton/gün
alabiliriz.
Hipotezler;
H0 : X = μ = 880 ton/gün
H1 : X > μ = 880 ton/gün (Tek tarafl› test)
Anlaml›l›k düzeyine göre teorik test istatisti¤i;
α =0,05 oldu¤undan Z çizelgesinden 0,45 olas›l›¤›na
karfl›l›k gelen Zα =Z0.05=1,645 de¤erini buluruz.
Red Bölgesini; Zh > Zα ise H0 red edilir, H1 kabul edilir fleklinde tan›mlar›z.
Test istatisti¤i;
Zh =
σ
X
=
X -µ
σ
X
σ
n
=
21
50
= 2, 97
111
5. Ünite - ‹statistiksel Karar Vermede Hipotez Testleri
Zh =
892 - 880
2, 97
= 4,04
Karar : Zh>Zα /2 oldu¤undan H0 hipotezi red, H1 hipotezi kabul edilir. %95 olas›l›kla uygulanan yeni yöntem
üretimi artt›rm›flt›r.
Zh =
σπ =
Zh =
P-π
σπ
π.(1- π )
n
0, 60.(1- 0, 60)
=
0, 70 - 0, 60
0,035
200
= 0,035
= 2,86
S›ra Sizde 2
Veriler; μ = 50 ton/km2 , n=5, X = 35 ton/km2 ve S=15
ton/km2 d›r.
Hipotezler;
Karar : Zh> Zα oldu¤undan H0 hipotezi red, H1 hipotezi kabul edilir. %95 olas›l›kla kömür iflletmelerinde
kaz›c› makinelerin çal›flma oranlar› daha yüksektir.
H0 : X = μ = 50 ton/km2
S›ra Sizde 4
H1 : X < μ = 50 ton/km2 (Tek tarafl› test)
Anlaml›l›k düzeyine göre teorik test istatisti¤i;
α =0,05 ve v=n-1=5-1=4 oldu¤undan, t çizelgesinden
tα .v = t0.05,4 = 2,132 de¤erini buluruz.
Red Bölgesini; t h > tα ,v ise H0 red edilir, H1 kabul
edilir fleklinde tan›mlar›z.
Test istatisti¤i;
th =
SX =
th =
X -µ
S
X
S
=
15
n
35 - 50
6, 71
= 6, 71
5
= 2,24
Veriler; μ 1 − μ 2 = 0 Saat, n1 = 10 ve n2 = 12 , X 1=48 Saat
ve X 2=38 Saat, S1=12 Saat ve S2=10 Saat dir.
Hipotezler;
H0 : ( X 1 - X 2) = (μ 1− μ 2) = 0
H1 : ( X 1 - X 2) < (μ 1− μ 2) = 0 (Tek tarafl› test)
Anlaml›l›k düzeyine göre teorik test istatisti¤i;
α =0,05 ve v=n1+ n2 - 2 = 10 + 12 - 2 = 20 oldu¤undan,
t çizelgesinden tα .v = t0.05,20= 1,725 de¤erini buluruz.
Red Bölgesini; ise H0 red edilir, H1 kabul edilir fleklinde tan›mlar›z.
Test istatisti¤i;
th =
( X1 - X2 ) - (µ1 - µ2 )
S
Karar : th > tα,v
oldu¤undan H0 hipotezi red, H1 hipotezi kabul edilir. %95 olas›l›kla a¤açland›rma çal›flmalar› erezyonu azaltm›flt›r.
S›ra Sizde 3
Veriler; π = 0,60 , n=200, P = 0,70 dir.
Hipotezler;
SX -X =
1 2
=
Red Bölgesini; Zh > Zα ise H0 red edilir, H1 kabul edilir fleklinde tan›mlar›z.
Test istatisti¤i;
2
2
(n1.S1 ) + (n2 .S2 )
n1 + n2 - 2
2
2
(10.12 ) + (12.10 )
H0 : P = π = 0,60
H1 : P > π = 0,60 (Tek tarafl› test)
Anlaml›l›k düzeyine göre teorik test istatisti¤i;
α =0,01 oldu¤undan Z çizelgesinden 0,49 olas›l›¤›na
karfl›l›k gelen Zα =Z0.01=2,33 de¤erini buluruz.
X1- X2
th =
10 +12 - 2
(48 - 38) - 0
4, 92
.
1
10
+
1
.
n1
1
12
+
1
n2
= 4, 92
= 2,03
Karar : th > tα,v oldu¤undan H0 hipotezi red, H1
hipotezi kabul edilir. %95 olas›l›kla yeni ilaç hastal›k
iyileflme süresinde azalma yaratmaktad›r.
S›ra Sizde 5
Veriler; σ = 10kg/cm2 ve σ 2 = 100 (kg/cm2)2 , n = 16 ,
S=14 kg/cm2 ve S2=196 (kg/cm2)2 dir.
Hipotezler;
112
Co¤rafi Bilgi Sistemleri ‹çin Temel ‹statistik
Yararlan›lan Kaynaklar
=σ
2
= 100
H1 : S2 > σ
2
= 100 (Tek tarafl› test)
H0 :
S2
Anlaml›l›k düzeyine göre teorik test istatisti¤i;
α =0,05 ve v=n-1=16-1=15 oldu¤undan, χ 2 çizelgesin
2
2
den χα,v = χ0.05,15 = 25,0 de¤erini buluruz.
2
2
Red Bölgesini; χh > χα,v
linde tan›mlar›z.
ise H0 red, H1 kabul edilir flek-
Test istatisti¤i;
2
χh =
(n -1).S
σ
2
2
=
(16 -1).196
2
2
Karar : χh > χα,v
100
= 29, 4
oldu¤undan H0 hipotezi red, H1
hipotezi kabul edilir. %95 olas›l›kla çimento fabrikas›n›n üretti¤i çimentodan yap›lan betonlar›n sa¤laml›¤›n›n standart sapmas› 10 kg/cm2 ‘den fazlad›r.
Cula, S. & Muluk, Z. (2006). Temel ‹statistik Yöntemleri.
Ankara: Baflkent Üniversitesi.
Konuk, A. & Önder, S. (1999). Maden ‹statisti¤i. Mühendislik Mimarl›k Fakültesi Maden Mühendisli¤i
Bölümü. Eskiflehir: Eskiflehir Osmangazi Üniversitesi.
Montgomery, D.C. & Runger G.C. (2003). Applied Statistics and Probability for Engineers. USA: John Wiley & Sons.
Newbold, P. (2005). ‹flletme ve ‹ktisat ‹çin ‹statistik. Ümit
fienesen (Çev.). ‹stanbul: Literatür.
Püskülcü, H. & ‹kiz, Fw. (1989). ‹statisti¤e Girifl. ‹zmir:
Bilgehan.
Serper, Ö. (2000). Uygulamal› ‹statistik II. Bursa: Ezgi.
Ünver, Ö. & Gamgam, H. (2006). Uygulamal› Temel ‹statistik Yöntemler. Ankara: Seçkin.
Yüzer, A.F. (Ed.) (2009). ‹statistik. Aç›k Ö¤retim Fakültesi Yay›n No: 771, Eskiflehir: Anadolu Üniversitesi.
CO⁄RAF‹ B‹LG‹ S‹STEMLER‹ ‹Ç‹N TEMEL
‹STAT‹ST‹K
6
Amaçlar›m›z
N
N
N
Bu üniteyi tamamlad›ktan sonra;
De¤iflkenler aras› iliflkilerde ba¤›ml›l›k olmas› durumunda, bu iliflkinin fonksiyonunu, yönünü ve derecesini belirlemede kullan›lan yöntemleri aç›klayabilecek,
De¤iflkenler aras› iliflkilerin do¤rusal oldu¤u durumlar için regresyon modeli parametrelerini hesaplayabilecek, korelasyon katsay›s›n› hesaplay›p test
edebilecek ve regresyon model parametrelerini tahminlerde kullanabilecek,
De¤iflkenler aras› iliflkilerin e¤risel (üstel) oldu¤u durumlar için regresyon
modeli parametrelerini hesaplayabilecek, belirlilik katsay›s›n› hesaplay›p
regresyon modelinin gözlem de¤erlerini ne derecede aç›klayabildi¤ini
yorumlayabilecek bilgi ve becerilere sahip olacaks›n›z.
Anahtar Kavramlar
•
•
•
•
•
•
Deneysel ‹liflki
Ba¤›ml› De¤iflken
Ba¤›ms›z De¤iflken
Regresyon
Korelasyon Katsay›s›
Serpilme Diyagram›
•
•
•
•
•
•
Do¤rusal Regresyon
En Küçük Kareler Yöntemi
Normal Denklemler
Standart Hata
Üstel Regresyon
Belirlilik Katsay›s›
‹çindekiler
Co¤rafi Bilgi
Sistemleri ‹çin Temel
‹statistik
Regresyon ve
Korelasyon
• DE⁄‹fiKENLER ARASI ‹L‹fiK‹LER
• DO⁄RUSAL REGRESYON VE
KORELASYON
• E⁄R‹SEL (ÜSTEL) REGRESYON VE
BEL‹RL‹L‹K KATSAYISI
Regresyon ve Korelasyon
DE⁄‹fiKENLER ARASI ‹L‹fiK‹LER
Günlük hayat›m›zda ve bilimsel çal›flmalarda karfl›laflt›¤›m›z sorunlar›n ço¤unlu¤unun çözümü için, iki veya daha fazla say›da de¤iflken aras›nda bir iliflki olup olmad›¤›n› araflt›r›r›z. De¤iflkenler aras›nda bir iliflki bulunup bulunmad›¤›n› belirlemede ve e¤er varsa bu iliflkinin derecesini saptamada, istatistiksel yöntemlerden regresyon-korelasyon analizlerini kullan›r›z. Regresyon-korelasyon analizleriyle de¤iflkenler aras›nda anlaml› bir fonksiyonel iliflkinin varl›¤›n›n belirlenmesinden
sonra, bu fonksiyon yard›m›yla bir de¤iflken de¤eri için di¤er de¤iflkenin alabilece¤i de¤erin tahminini yap›labiliriz.
‹statistiksel anlamda de¤iflkenler aras›ndaki iliflki, bunlar›n kendi aralar›nda neden-sonuç iliflkisinin bulunmas› ve de¤erlerinin karfl›l›kl› de¤iflimleri aras›nda bir
ba¤l›l›k olmas› fleklinde anlafl›l›r. Örne¤in, kiflilerin geliri ile harcamalar› ve çocuklarda yafl ile boy aras›nda bir neden-sonuç iliflkisi bulunmakta olup, kiflilerin gelirleri de¤ifltikçe harcamalar› ve çocuklar›n yafllar› de¤ifltikçe boylar› da de¤iflmektedir. Bu durumda, kiflilerin geliri ile harcamalar› aras›nda ve çocuklar›n yafllar› ile
boylar› aras›nda bir iliflki bulundu¤u söylenebilir. Neden niteli¤indeki de¤iflken ile
sonuç niteli¤indeki de¤iflken aras›ndaki fonksiyonel iliflkinin belirlenmesinde regresyon, iliflkinin güçlü olup olmad›¤›n› belirlemede ise korelasyon analizlerinden
yararlanabiliriz.
Bununla birlikte, regresyonkorelasyon analizlerinin
hangi tip de¤iflkenler
aras›ndaki fonksiyonel
iliflkinin araflt›r›lmas›nda
kullan›labilece¤ini
belirlemek için de¤iflkenler
aras› iliflki türlerini de
bilmek gerekir.
Belirleyici ve Deneysel ‹liflkiler
Baz› de¤iflkenlerin aras›nda belirli bir teoriye dayanan ve kesin bir matematik bir
fonksiyonla ifade edilen iliflkiler vard›r. Belirleyici (deterministik) iliflkiler olarak da
isimlendirilen bu iliflkilerin günümüzde geçerlili¤i teorik olarak ispatlanm›flt›r. Örne¤in, bir borunun kesit alan› F (m2) ve borudan geçen suyun h›z› V (m/sn) ise,
borunun kesit alan›, suyun h›z› ve borudan bir saniyede geçen su miktar› Q (m3/sn)
aras›nda kesin olarak Q = FV bilinen fonsiyonel iliflkisi vard›r. Bu gibi teorik olarak matematiksel fonksiyonu bilinen de¤iflkenler aras› iliflkiler için tekrar regresyon analizleriyle fonksiyonel iliflki araflt›r›lmas›na gerek yoktur.
Günlük hayatta karfl›lafl›lan baz› olaylar hakk›nda teorik iliflkiler bilinmez. Bu
durumda, de¤iflkenler için gözlemler yap›ld›ktan sonra öncelikle de¤iflkenler aras›
iliflkinin matematiksel modeli belirlenir ve daha sonra bu model parametrelerinin
hesaplanmas›nda da regresyon analizleri kullan›l›r. Deneysel (ampirik) iliflkiler
olarak isimlendirilen bu tür iliflkilerden elde edilebilecek regresyon denklemi ise,
Baz› de¤iflkenler aras›
iliflkiler teorik olarak
bilinmekle birlikte,
matematik eflitli¤in baz›
parametrelerinin deneysel
olarak saptanmas›
gerekebilmektedir. Bu tip
de¤iflkenler aras› iliflkilere
yar› belirleyici iliflkiler
denilmektedir. Örne¤in,
ideal gaz kanununda gaz
hacmi (V) ile gaz bas›nc› (P)
aras›nda P.Vγ = Sabit
fleklinde matematiksel bir
iliflki var olup, buradaki γ
parametresinin deneysel
olarak tahmin edilmesi
gerekmektedir (Püskülcü ve
‹kiz, 1989).
116
Co¤rafi Bilgi Sistemleri ‹çin Temel ‹statistik
daha sonraki tahminlerde kullan›labilir. Örne¤in, ifl kazalar›na ifl yerlerinin fiziksel
faktörlerinin etkileri hakk›nda kesin bilinen bir teorik iliflki olmamakla birlikte,
derlenecek istatistiksel verilerin regresyon analizi ile tahmin amaçl› bir model gelifltirilebilir.
Ba¤›ml› ve Ba¤›ms›z De¤iflkenler
Bir araflt›rmada ba¤›ml›
de¤iflken, güvenilir bir
flekilde ölçülebilir olmal›d›r.
Ayr›ca, ba¤›ml› de¤iflken
olarak ölçülen sonucun basit
ve karmafl›kl›ktan uzak
olmas› tercih edilir.
‹ki adet de¤er aras›nda
ancak bir do¤rusal iliflkinin
var oldu¤u söylenebilirken,
veri say›s› artt›kça ba¤›ml›
ve ba¤›ms›z de¤iflkenler
aras›nda do¤rusal olmayan
iliflkiler de görülebilir.
De¤iflkenler aras›ndaki neden-sonuç iliflkisinde neden ba¤›ms›z, sonuç ise ba¤›ml› de¤iflkendir. Matematiksel olarak ba¤›ml› ve ba¤›ms›z de¤iflken aras›ndaki
iliflki Y= f(x) olarak gösterilir. Burada, X: Ba¤›ms›z de¤iflken ve Y: Ba¤›ml› de¤iflken olarak tan›mlan›r. Ba¤›ms›z de¤iflkenlerin de¤erlerini biz ya arzumuza göre
düzenleriz veya kontrol etmeden ald›klar› de¤erleri gözleriz. Ba¤›ml› de¤iflkenler ise ba¤›ms›z de¤iflkenlerin ald›¤› de¤ere göre de¤er al›rlar.
Ba¤›ms›z de¤iflkenin ayr› de¤erler ya da durumlar almas›, araflt›rmac›n›n yapaca¤› ayarlamalarla sa¤lan›r. Bununla birlikte, ba¤›ms›z de¤iflkenin alaca¤› de¤erler
ya da durumlar gerçek hayatta anlam› olmal› ve aralar›nda yeterince fark olmal›d›r.
Örne¤in, çal›flma süresinin verimlili¤e etkilerinin araflt›r›ld›¤› bir durumda, çal›flma
süresini dakikalarla ifade etmenin bir anlam› yoktur. Ayr›ca, ba¤›m›z de¤iflkenin
alaca¤› de¤er ya da durumlar›n say›s›, iliflkinin fonksiyonel fleklinin belirlenebilmesi için üçten fazla (n>3) olmal›d›r.
De¤iflkenler aras› iliflkinin matematiksel fonksiyonu do¤rusal, üssel, e¤risel veya çoklu bir model olabilmektedir. Afla¤›daki bölümlerde, do¤rusal regresyon modelinin parametrelerinin hesaplanmas› detayl› bir flekilde ele al›nmakta ve daha
sonra üstel model parametrelerini hesaplanma yöntemleri hakk›nda bilgiler verilmektedir.
De¤iflkenler Aras› ‹liflkinin Yönü ve Derecesi
De¤iflkenler aras› iliflkide, de¤iflkenlerin ayn› yönde mi yoksa ters yönlerde mi de¤ifltikleri önemlidir. Örne¤in iki de¤iflken aras› iliflkide, iki de¤iflken ayn› yönde
de¤ifliyorsa yani ba¤›ms›z de¤iflken artarken ba¤›ml› de¤iflken de art›yorsa, bu iliflkinin fonksiyonu artan bir fonksiyondur. Buna karfl›l›k, ba¤›ms›z de¤iflken artarken ba¤›ml› de¤iflken azal›yorsa, bu iliflkinin fonksiyonu ise azalan bir fonksiyonel
e¤riye sahiptir.
‹ki de¤iflken aras›ndaki ba¤l›l›¤›n kuvvetine, iliflkinin derecesi denilmektedir.
Baz› gözlemlenen de¤iflkenler aras›nda çok kuvvetli fonksiyonel iliflkiler elde edilebilirken, baz›lar›nda ise oldukça zay›f bir iliflki elde edilebilmektedir. De¤iflkenler aras›nda hiçbir iliflkinin olmamas› da söz konusu olabilmektedir De¤iflkenler
aras› iliflkinin derecesinin belirlenmesinde korelasyon katsay›s› kullan›lmaktad›r.
BAS‹T DO⁄RUSAL REGRESYON VE KORELASYON
Basit do¤rusal regresyon analizinde, tek bir ba¤›ms›z de¤iflken (X) ile ba¤›ml› de¤iflken (Y) aras›ndaki iliflki do¤rusal fonksiyonla ifade edilir. Basit do¤rusal regresyonda, do¤runun denklemi;
Y = a + bX
fleklindedir (fiekil 6.1). Burada; a do¤runun sabiti olup, X= 0 oldu¤unda do¤runun
Y ekseninde kesti¤i de¤eri gösterir. b ise do¤runun e¤imi olup, X’deki bir birimlik
de¤iflmenin Y’de yapt›¤› de¤iflikli¤i gösterir. a ve b katsay›lar›na regresyon katsay›lar› denilmektedir.
117
6. Ünite - Regresyon ve Korelasyon
fiekil 6.1
Basit do¤rusal
regresyon denklemi
Serpilme Diyagram›
‹ki de¤iflken aras›ndaki iliflkinin do¤rusal fonksiyona uyup uymad›¤›n› belirlemek
için regresyon analizine, serpilme diyagram› çizilerek bafllan›r. Serpilme diyagram›,
kartezyen koordinatl› bir grafik üzerinde X ve Y de¤erlerine sahip verilerin noktasal gösterimidir (fiekil 6.2). Serpilme diyagram›nda noktalar›n oluflturdu¤u flekli inceleyerek, de¤iflkenler aras›nda do¤rusal fonksiyonla ifade edilebilecek iliflki olup
olmad›¤›n›, iliflkinin yönünü ve yaklafl›k derecesini tahmin edebiliriz.
fiekil 6.2
Ba¤›ms›z (X) ve
ba¤›ml› (Y)
de¤iflken verilerinin
serpilme
diyagram›ndaki
görünümü.
De¤iflkenler aras› iliflkide, her iki de¤iflken birlikte art›yor veya azal›yorsa iliflkinin yönü pozitif olup, bu durumda de¤iflkenler aras›nda artan bir iliflki oldu¤unu
söyleyebiliriz (fiekil 6.3.a). Bununla birlikte, de¤iflkenlerden biri artarken di¤eri
azal›yorsa iliflkinin yönü negatif olup, bu durumda da de¤iflkenler aras›nda azalan
bir iliflki oldu¤unu söyleyebiliriz (fiekil 6.3.b).
Serpilme diyagram›nda iflaretlenen noktalar ayn› çizgi üzerinde bulunuyorsa,
de¤iflkenler aras›nda kesin veya güçlü bir iliflki vard›r (fiekil 6.4.a). Serpilme diyag-
Basit do¤rusal regresyonda
do¤runun e¤imi (b
katsay›s›), iliflkinin yönü
hakk›nda bize önemli bilgiler
verir. E¤er, b’nin iflareti
pozitif (+) ise de¤iflkenler
aras›nda aratan, negatif (-)
ise azalan bir iliflki
oldu¤unu anlar›z.
118
Co¤rafi Bilgi Sistemleri ‹çin Temel ‹statistik
ram›nda noktalar›n da¤›l›m› herhangi bir yönde de¤iflim e¤ilimi göstermeyecek flekilde da¤›n›kl›k gösteriyorsa da, de¤iflkenler aras›nda iliflki olmad›¤›n› ya da iliflkinin derecesinin zay›f oldu¤unu söyleyebiliriz (fiekil 6.4.b).
fiekil 6.3
De¤iflkenler
aras›nda
artan ve
azalan
do¤rusal iliflki
fiekil 6.4
De¤iflkenler
aras›nda
güçlü ve zay›f
do¤rusal iliflki
Hata teriminin baz› önemli
özellikleri flunlard›r;
- Hata terimi e rassal bir
de¤iflken olup, hata
terimlerinin ortalamas›
s›f›ra eflittir.
- Hata teriminin varyans›
sabit olup, kendi
ortalamalar› etraf›nda
ayn› de¤iflkenli¤e sahiptir.
- Hata terimleri kendi
ortalamalar› etraf›nda
simetrik bir normal da¤›l›fl
gösterirler.
Ana kütleden yap›lan gözlem de¤erleri genellikle bir do¤ru üzerinde s›ralanmay›p, rassall›¤a ba¤l› olarak do¤rudan sapmalar gösterirler. Bu durumda, de¤iflkenler aras›ndaki do¤rusal iliflkinin denklemi;
Y = a + bX + e
fleklinde, e hata terimini de içerir (fiekil 6.5).
119
6. Ünite - Regresyon ve Korelasyon
fiekil 6.5
Regresyon
do¤rusunun hata
terimleri
En Küçük Kareler Yöntemi
Serpilme diyagram›nda X de¤erleri ile Y de¤erlerinin çak›flt›¤› gözlem noktalar›n›n
görünüflü do¤rusal bir e¤ilim gösteriyorsa, X ile Y aras›ndaki fonksiyonel iliflkinin
yaklafl›k olarak do¤rusal olabilece¤i kanaatine var›r›z. Bununla birlikte, gözlem
noktalar› aras›ndan çok say›da do¤ru geçirebiliriz. Önemli olan, X de¤erlerine karfl›l›k Y de¤erlerini en küçük hata ile tahmin etmeye yarayacak do¤ruyu (Y’) geçirmektir. Serpilme diyagram›nda oluflan n adet nokta aras›ndan en küçük hata ile bir
do¤ru geçirmede en küçük kareler yöntemi kullan›lmaktad›r.
Xi de¤erlerine karfl›l›k Yi gözlem de¤erleri ile do¤rusal regresyon denkleminden tahmin edilen teorik Y’i de¤erler aras› farklarla hata terimlerini afla¤›daki gibi
hesaplayabiliriz (fiekil 6.5).
ei = Yi - Y’i
Y’i = a + bXi
ei = Yi - a - bXi
Hata terimlerinin her iki taraf›n›n karesini al›p, bütün n gözlem için toplarsak;
n
n
i =1
i =1
E = ∑ ei2 = ∑ ( Yi − a − bX i )2
ifadesini elde ederiz. Hata kareleri toplam›n› en küçük yapabilmek için, E eflitli¤inin a ve b katsay›lar›na göre k›smi türevlerini al›p, elde edece¤imiz eflitlikleri s›f›ra eflitlememiz gerekir.
∂E
= ∑ 2.( Yi − a − bX i ).( −1 ) = 0
∂a
∂E
= ∑ 2.( Yi − a − bX i ).( − X i ) = 0
∂b
En küçük kareler
yönteminde, gözlem verileri
aras›ndan geçirilen do¤ru ile
gözlem verileri aras›ndaki
hatalar›n (gözlemlerin
do¤rudan olan
uzakl›klar›n›n) karelerin
toplam› en küçük
olmaktad›r. Bu yöntemde, X
de¤erlerine karfl›l›k gelen
do¤ru üzerindeki Y’ tahmin
de¤eri ile Y gözlem de¤eri
aras›ndaki farklar›n
(hatalar›n) toplam› da s›f›r
olmaktad›r.
120
Co¤rafi Bilgi Sistemleri ‹çin Temel ‹statistik
K›smi türevi al›n›p s›f›ra eflitlenen bu eflitlikleri afla¤›daki gibi sadelefltirebiliriz.
∑ ( −Yi + a + bX i ) = 0
∑ ( − X iYi + aX i + bX i2 ) = 0
Bu eflitliklerde de, negatif iflaretli terimleri eflitli¤in sa¤ taraf›na geçirir ve eflitlikleri yeniden düzenlersek, normal denklemler denilen afla¤›daki eflitlikleri elde
ederiz.
∑ Yi = n.a + b∑ X i
∑ X iYi = a∑ X i + b∑ X i2
Bu iki bilinmeyenli (a ve b) iki eflitlik sisteminde, bilinenler olan ∑ Yi , ∑ X i
∑ X i2 ve ∑ X iYi toplam de¤erleri hesaplanarak yerine konulduktan sonra, eflitlik sisteminin çözümü ile bilinmeyen a ve b katsay›lar› hesaplanabilir.
Seri de¤erlerinin ortalamadan farklar›n›;
xi = X i − X ve yi = Yi − Y
eflitliklerinde oldu¤u gibi hesaplayabiliriz.
Normal denklemleri, seri de¤erlerinin ortalamadan farklar› cinsinden yeniden
küçültülmüfl de¤erlerle yazarsak;
∑ yi = n.a + b∑ xi
∑ xi yi = a∑ xi + b∑ xi2
eflitliklerini elde ederiz.
Seri de¤erlerinin ortalamadan farklar› toplam› s›f›rd›r.
∑ xi = ∑ ( X i − X ) = 0
∑ yi = ∑ ( Yi − Y ) = 0
Bu durumda, küçültülmüfl de¤erlerle yaz›lan ikinci eflitlikten geriye
∑ xi yi = ∑ xi2 eflitli¤i kal›r ve bu eflitlikten de do¤runun e¤imi olan b katsay›s›n› afla¤›daki gibi hesaplayabiliriz.
b=
∑ xi yi
∑ xi2
Birinci normal denklemin her iki taraf›n›n örnek say›s›na (n) bölünmesiyle elde edece¤imiz eflitlik yard›m›yla da;
∑ Yi = n a + b ∑ X i
n
n
Y = a + bX
n
⇒
a = Y − bX
do¤rusal regresyon eflitli¤inin sabiti olan a parametresini hesaplar›z.
121
6. Ünite - Regresyon ve Korelasyon
Do¤rusal regresyon modelinin parametrelerinin grafiksel görünümü fiekil 6.6’da
verildi¤i gibidir. fiekil 6.6’dan da görüldü¤ü gibi, a : do¤runun sabitini ve b : do¤runun e¤imini göstermektedir. Regresyon do¤rusunun e¤imi olan b parametresinin iflareti, de¤iflkenler aras› iliflkinin yönünün bir göstergesidir. E¤er X ba¤›ms›z
de¤iflkeni artarken Y’de art›yorsa b parametresinin iflareti pozitif (+), X ba¤›ms›z
de¤iflkeni artarken Y azal›yorsa b parametresinin iflareti ise negatif (-) olur.
fiekil 6.6
Regresyon
do¤rusunun
grafiksel görünümü
Örnek 6.1:
‹nflaat zemin kaz›s›nda, kaz›lan malzemenin kuvars içeri¤i ile kaz› makinesi
keski ucu afl›nma miktar› aras›ndaki iliflkiyi araflt›rmak üzere yap›lan deneyler sonucunda afla¤›daki veriler elde edilmifltir. Kuvars içeri¤i ile afl›nma miktar› aras›nda do¤rusal iliflki varoldu¤u bilindi¤ine göre, regresyon parametrelerini,
a) Normal denklemleri oluflturarak,
b) Seri de¤erlerinin ortalamadan farklar›n› kullanarak hesaplay›n›z.
Kuvars Oran› (%)
Afl›nma Miktar› (mg)
15
5
30
15
45
40
60
70
75
100
Çözüm:
a) Normal denklemler;
∑ Yi = n.a + b∑ X i
∑ X iYi = a∑ X i + b∑ X i2
oldu¤undan, öncelikle denklemin bilinenlerini hesaplar›z. Ancak, regresyon parametrelerini hesaplamada, ba¤›ml› ve ba¤›ms›z de¤iflkenin belirlenmesi oldukça
önemlidir. Ele ald›¤›m›z örnekte, kuvars oran›n›n afl›nma miktar›n› etkileme ihtimali söz konusu oldu¤undan, bu durumda ba¤›ms›z de¤iflken (X) kuvars oran› ve
ba¤›ml› de¤iflken (Y) afl›nma miktar› olacakt›r.
Veri say›s› n=5 dir.
122
Co¤rafi Bilgi Sistemleri ‹çin Temel ‹statistik
X Kuvars Oran› (%)
Y Afl›nma Miktar›
(mg)
X2
XY
15
5
225
75
30
15
900
450
45
40
2025
1800
60
70
3600
4200
75
100
5625
7500
∑ Y = 230
∑ X 2 = 12375
∑ XY = 14025
∑ X = 225
Hesaplanan bu de¤erler normal denklemlerde yerine konulursa;
∑ Yi = n.a + b∑ X i
∑ X i Yi = a ∑ X i + b∑ X i2
230 = 5.a + 225.b
14025 = 225.a + 12375.b
eflitlik sistemi elde edilir. Bu eflitlik sistemini dengelemek için;
225
225
225
.230 =
.5.a +
.225.b
5
5
5
ifllemi yap›ld›¤›nda, afla¤›daki dengelenmifl eflitlik sistemi elde edilir.
10350 = 225.a + 10125.b
14025 = 225.a + 12375.b
Bu iki eflitli¤i birbirinden ç›kar›rsak ve b parametresini yaln›z b›rak›rsak, b=
1,633 de¤erini elde ederiz. Daha sonra b parametresini herhangi bir normal denklemde yerine koyarak a parametresini a= -27,5 olarak hesaplar›z. Bu hesaplamalar
sonras›nda ise regresyon do¤rusunu elde ederiz.
a = -27,5 ve b = 1,633
Ŷ = -27,5 + 1,633.X (mg)
b) Seri de¤erlerinin ortalamadan farklar›n› al›rsak, afla¤›daki küçültülmüfl de¤erleri elde ederiz.
X Kuvars
Oran› (%)
Y Afl›nma
Miktar› (mg)
x= X−X
y = Y −Y
x2
xy
15
5
-30
-41
900
1230
30
15
-15
-31
225
465
45
40
0
-6
0
0
60
70
15
24
225
360
75
100
30
54
900
1620
∑ X = 225
X=
∑ Y = 230
225
230
= 45 Y =
= 46
5
5
∑x =0
∑ y=0 ∑x
2
= 2250
∑ xy = 3675
123
6. Ünite - Regresyon ve Korelasyon
Regresyon do¤rusunun e¤imi;
b=
∑ xi yi = 3675 = 1, 633
∑ xi2 2250
Regresyon do¤rusunun sabiti;
a = Y − bX = 46 − (1, 633.45) = −27, 5
Regresyon do¤rusu;
Y ' = −27, 5 + 1, 633.X (mg)
Gözlem noktalar› aras›ndan geçen do¤ru afla¤›daki flekildeki gibidir.
fiekil 6.7
S‹ZDE
Bir kimyasal deneyde kar›flt›rma h›z›na ba¤l› olarak afla¤›daki ürünSIRA
verim
de¤erleri elde
edilmifltir. Kar›flt›rma h›z› ile verim aras›ndaki iliflkinin do¤rusal oldu¤unu göz önüne alarak regresyon parametrelerini hesaplay›n›z.
1
D Ü fi Ü N E L ‹ M
Kar›flt›rma H›z› (devir/dakika)
SIRA S‹ZDE
D Ü fi Ü N E L ‹ M
Verim (%)
25
65 S O R U
30
70
35
74 D ‹ K K A T
40
75
45
78SIRA S‹ZDE
50
82
AMAÇLARIMIZ
S O R U
D‹KKAT
N N
SIRA S‹ZDE
AMAÇLARIMIZ
K ‹ T A P
K ‹ T A P
TELEV‹ZYON
TELEV‹ZYON
‹NTERNET
‹NTERNET
124
Co¤rafi Bilgi Sistemleri ‹çin Temel ‹statistik
Standart Hata ve Tahminlerin Güven Aral›¤›
Araflt›rma veya deneysel çal›flmalarda, gözlenen her X de¤erine karfl›l›k gözlenmifl
Y de¤erleri vard›r. Regresyon analizi ile elde edilen do¤ru denklemi yard›m›yla ise
gözlenen her X de¤erine karfl›l›k Y’ tahminlerini yapabiliriz. En küçük kareler yöntemiyle regresyon denklemini elde ederken, gözlem de¤erleri ile tahmin de¤erleri
aras›ndaki farklar›n (hatalar›n) kareleri toplam›n› ∑ (Y − Y ' ) = en küçük yapt›¤›m›zdan, en küçük de olsa bir tahmin hatas› vard›r. Gözlem de¤erler ile tahmin de¤erlerinin toplam› birbirine eflit olmakla birlikte, de¤erler tek tek karfl›laflt›r›ld›¤›nda aralar›nda az ya da çok farklar olabilmektedir. Bu tahmin hatalar›n›n genel ve
ortalama ölçüsüne tahminlerin standart hatas› denilir.
Basit do¤rusal regresyonda tahminlerin standart hatas›, büyük örneklemelerde
(n ≥ 30) ;
∑ (Y − Y ′)
2
Sy =
n
küçük örneklemelerde (n < 30) ise;
∑ (Y − Y ′)
2
Sy =
Basit do¤rusal regresyon
denkleminin a ve b olmak
üzere iki parametresi
oldu¤undan, basit do¤rusal
regresyon için k=2’dir.
Standart hata büyüdükçe
tahminlerin güvenilirli¤i
azal›r, küçüldükçe ise artar.
Standart hatan›n s›f›r (0)
olmas› durumunda, gözlem
noktalar› regresyon do¤rusu
üzerinde yer al›r.
n-k
eflitlikleriyle hesaplan›r. Burada, Sy= tahminlerin standart hatas›, n= gözlem say›s›
ve k= regresyon do¤rusundaki parametre say›s›d›r.
Da¤›lma diyagram›nda noktalar›n regresyon do¤rusu etraf›ndaki da¤›l›mlar›n›n
ortalama bir ölçüsü olan standart hata, yap›lan tahminlerde gerçe¤e nazaran ne kadar sapma (hata pay›) beklenildi¤ini gösterir.
Büyük örneklemelerde, regresyon do¤rusuna göre tahmin hatalar›n›n da¤›l›m›
normal oldu¤undan, herhangi bir X de¤iflken de¤eri için yap›lacak Y’ noktasal tahmininin güven aral›¤›n› da, belirli bir güven düzeyi (α) için standart normal de¤er
(Zα/2) yard›m›yla belirleyebiliriz.
Y ' ∓ Zα / 2 .S y
Küçük örneklemelerde ise regresyon do¤rusuna göre tahmin hatalar›n›n da¤›l›m›, verilerin azl›¤› nedeniyle normal da¤›l›ma göre daha yayvan oldu¤undan,
herhangi bir X de¤iflken de¤eri için yap›lacak Y’ noktasal tahmininin güven aral›¤›n›, belirli bir güven düzeyi (α) ve v=n-2 serbestlik derecesi için Student t da¤›l›fl
de¤eri (ta/2, v) yard›m›yla belirleyebiliriz.
Y ' ∓ tα / 2,V .S y
Örnek 6.2:
Bir tu¤la-kiremit fabrikas›nda kullan›lan kil malzemesinin %Al2O3 içeri¤i ile kusurlu ürün oran› aras›ndaki iliflki araflt›r›ld›¤›nda, afla¤›daki veriler için Y' = 3,84 0,165.X regresyon denklemi elde edilmifltir.
a) Regresyon denklemi ile yap›lacak tahminlerin standart hatas›n› bulunuz.
b) Kil malzemesinin %Al2O3 içeri¤i 15 oldu¤unda, %90 güvenirlikle (α = 0,10)
kusurlu ürün oran› (%) güven aral›¤› ne olur?
6. Ünite - Regresyon ve Korelasyon
Al2O3 içeri¤i (%)
Kusurlu Ürün Oran› (%)
12
1,8
14
1,6
16
1,2
18
0,9
20
0,5
Çözüm:
a) Y’ = 3,84 - 0,165.X regresyon denklemini kullanarak, gözlemlenen her bir X
de¤eri için tahmin de¤erlerini hesaplayabiliriz.
X=12 için Y’ = 3,84 - 0,165, X = 3,84 - 0,165.12 = 1,86
X Al2O3
içeri¤i (%)
Y Kusurlu
Ürün Oran› (%)
12
Y' (%) Y-Y' (%)
(Y-Y' )2
1,8
1,86
-0,06
0,0036
14
1,6
1,53
0,07
0,0049
16
1,2
1,20
0
0
18
0,9
0,87
0,03
0,0009
20
0,5
0,54
-0,04
0,0016
∑ (Y − Y ' )2 = 0, 011
Küçük örnekleme (n<30) yap›ld›¤›ndan tahminlerin standart hatas›n› afla¤›daki
eflitlikle hesaplar›z.
∑ (Y − Y ′)
2
Sy =
n-2
∑ (Y − Y ) = 0, 011 ve n = 5 oldu¤undan standart hatay›
' 2
Sy =
0, 011
= 0, 061
5- 2
olarak hesaplar›z.
b) X=15 %Al2O3 için kusurlu ürün oran›n›n nokta tahmini;
Y ' = 3, 84 − 0,165. X = 3, 84 − 0,165.15 = 1, 36 % olarak buluru
uz.
Serbestlik derecesi v = n - k = 5 - 2 = 3’dür
%90 güvenirlik seviyesinde α = 0,10 ve α/2 = 0,05 dir. n<30 oldu¤undan Student çizelgesinden t α/2,v = t0.05,3 = 2,353 elde ederiz.
'
Güven aral›¤›n› Y ∓ tα / 2,V .S y eflitli¤inden;
1,36 ∓ (2,353.0,061)
AGS= 1,22 ve ÜGS= 1,50 buluruz.
125
126
SIRA S‹ZDE
Co¤rafi Bilgi Sistemleri ‹çin Temel ‹statistik
2
D Ü fi Ü N E L ‹ M
S O R U
Korelasyon katsay›s›n›n (r)
iflareti yard›m›yla
de¤iflkenler
iliflkinin
D ‹ K K A aras›
T
yönünü de belirlemek
mümkündür. Ba¤›ms›z
de¤iflken X artarken ba¤›ml›
SIRA S‹ZDE
de¤iflken
Y de art›yorsa
korelasyon katsay›s›n›n
iflareti pozitif (+), X artarken
Y azal›yorsa korelasyon
AMAÇLARIMIZ
katsay›s›n›n iflareti negatif
(-) olmaktad›r. Ayr›ca,
regresyon do¤rusunun
iflareti ile korelasyon
K ‹ T A iflareti
P
katsay›s›n›n
de ayn›
yönde olmaktad›r.
Bir deneyselSIRA
çal›flmada
S‹ZDE 36 adet gözleme dayanan X ve Y de¤iflkenleri aras›nda Y' = 5 +
0,2.X do¤rusal iliflkisi elde edilmifltir. Regresyon denklemiyle yap›lacak tahminlerin standart hatas› 0,06 oldu¤una göre, X=1,4 de¤eri için %90 güvenirlikle (α = 0,10) tahmin ediÜ fi Ü N Earal›¤›
L‹M
len de¤erin Dgüven
ne olur?
Korelasyon
S O R Katsay›s›
U
Regresyon denkleminden elde edilen tahmin de¤erleri ile gözlem de¤erleri aras›nda fark yoksa ve gözlem de¤erleri regresyon do¤rusu üzerinde yer al›yorsa, regD‹KKAT
resyon denkleminin gözlem de¤erlerini tam olarak aç›klayabildi¤ini ve iki de¤iflken aras›ndaki iliflkinin tam oldu¤unu söyleyebiliriz. Buna karfl›l›k, X de¤erleri için
SIRA S‹ZDE ile yap›lacak tahminlerde belirli bir standart hata hesaplanabiregresyon denklemi
liyorsa, de¤iflkenler aras›ndaki iliflkinin derecesi standart hatan›n büyüklü¤üne göre de¤iflmektedir.
AMAÇLARIMIZ
‹ki de¤iflken aras›ndaki do¤rusal regresyon denkleminin gözlenen de¤erleri ne
derecede aç›klad›¤›n› incelemede ve de¤iflkenler aras› iliflkinin derecesinin belirlenmesinde korelasyon
K ‹ T A P katsay›s› kullan›l›r. Korelasyon katsay›s›, ba¤›ms›z de¤iflken
X’in ba¤›ml› de¤iflken Y üzerindeki do¤rusal etkisinin derecesini göstermektedir.
Korelasyon katsay›s›n›n (r) hesaplanmas›nda afla¤›daki eflitliklerden birisi
kullan›labilir.
TELEV‹ZYON
N N
TELEV‹ZYON
r=
‹NTERNET
r=
Korelasyon katsay›s›na
güvenirli¤in artt›r›lmas› ve
rassal nedenlerin etkilerinin
azalt›labilmesi için gözlem
say›s› mümkün oldu¤unca
artt›r›lmal›d›r. Korelasyon
katsay›s›n›n testi konusunda
da görülece¤i gibi, ana
kütleden yap›lacak
örnekleme boyutu (gözlem
say›s›) artt›kça korelasyon
katsay›s›n›n standart hatas›
azalmaktad›r.
∑ (X - X).(Y - Y)
X)2 .∑ (Y- Y)2
∑‹ N(XTERNET
∑ x.y
∑ x2 .∑ y2
‹ki de¤iflkenin birlikte de¤iflim ölçüsü olarak da tan›mlanan korelasyon katsay›s› -1 ile +1 aras›nda de¤erler alabilmektedir. Korelasyon katsay›s›n›n;
• r = 1 olmas›, de¤iflkenler aras› iliflkinin tam oldu¤unu,
• r = 0 olmas› ise de¤iflkenler aras›nda hiçbir iliflkinin olmad›¤›n› gösterir.
Ayr›ca, korelasyon katsay›s› ∓ 1’e yaklaflt›kça de¤iflkenler aras› iliflkinin güçlendi¤ini ve s›f›ra yaklaflt›kça ise zay›flad›¤›n› söyleyebiliriz. Bununla birlikte, korelasyon katsay›s› büyüklü¤ünün anlaml›l›¤› de¤erlendirilirken, de¤iflken gözlem
say›lar› da dikkate al›nmal›d›r.
Örnek 6.3:
Örnek 6.1’deki verilere kullanarak de¤iflkenler aras› korelasyon katsay›s›n›
hesaplay›n›z.
Çözüm:
Gözlem verilerini kullanarak X ve Y de¤iflkenlerinin ortalamalar›n› afla¤›daki gibi hesaplar›z.
∑ Y = 230
Y=
230
= 46
5
∑ X = 225
X=
225
= 45
5
127
6. Ünite - Regresyon ve Korelasyon
De¤iflkenlerin ortalamalar› yard›m›yla, seri de¤erlerinin ortalamadan farklar›
olan küçültülmüfl x ve y de¤erleri ile bunlara ba¤l› olarak da x2, y2 ve xy de¤erlerini afla¤›daki çizelgede oldu¤u gibi hesaplar›z.
X (%) Y (mg) x = X − X
y = Y −Y
x2
y2
xy
15
5
-30
-41
900
1681
1230
30
15
-15
-31
225
961
465
45
40
0
-6
0
36
0
60
70
15
24
225
576
360
75
100
30
54
900
2916
1620
∑y=0
∑x =0
∑ x 2 = 2250 ∑ y 2 = 6170 ∑ xy = 3675
Korelasyon katsay›s›n›;
r=
∑ x. y =
∑ x 2 .∑ y 2
3675
= 0, 973
2250.6170
olarak hesaplar›z.
S‹ZDE
S›ra Sizde 1 sorusundaki verileri kullanarak korelasyon katsay›s›n› SIRA
hesaplay›n›z.
Korelasyon Katsay›s›n›n Test Edilmesi
D Ü fi Ü N E L ‹ M
Korelasyon katsay›s›n›n test edilmesi de hipotez testleri bölümünde aç›klanan ifllemlerin benzeri bir flekilde gerçeklefltirilmektedir. Korelasyon katsay›s›n›n, ana
S O R U
kütleden örneklenen de¤iflken de¤erleri ile hesapland›¤› göz önüne al›narak hipotezler oluflturulmaktad›r. Daha önceden ana kütle de¤iflkenleri hakk›nda her hangi bir iliflki bilinmedi¤inden, H0 hipotezi ana kütle de¤iflkenleri aras›
D ‹ K K Akorelasyonun
T
s›f›r oldu¤u ve örnek kütleler aras›nda hesaplanan korelasyonun da s›f›ra eflit olmas› gerekti¤i fleklinde oluflturulur. Karfl›t hipotez H1 ise örnek
SIRAkütleler
S‹ZDE aras›nda
hesaplanan korelasyon katsay›s›n›n rassal olarak hesaplanmad›¤›, gerçekte de¤iflkenler aras›nda anlaml› bir iliflki var oldu¤u, dolay›s›yla s›f›ra eflit olmamas› gerekAMAÇLARIMIZ
ti¤i fleklinde oluflturulur.
H0 : r = ρ = 0
H1 : r ≠ ρ = 0
K ‹ T A P
Sv =
r
Sv
1− r 2
n−2
SIRA S‹ZDE
D Ü fi Ü N E L ‹ M
S O R U
D‹KKAT
N N
Korelasyon katsay›s›n›n testinde red bölgesinin tan›mlanmas›nda teorik test istatisti¤i, gözlem say›s› n ≥ 30 ise Z da¤›l›fl›ndan ve n < 30 ise t da¤›l›fl›ndan yararTELEV‹ZYON
lan›larak belirlenir.
Red bölgesi : n ≥ 30 oldu¤unda Zh>Zα/2 ise H0 hipotezi red, H1 kabul edilir.
n<30 oldu¤unda th > tα/2,v ise H0 hipotezi red, H1 kabul edilir.
Test istatisti¤i Zh veya th, ana kütleden örneklemelerle hesaplanacak
‹ N T E R N E T r’lerin da¤›l›m›n›n standart hatas›na (Sv) ba¤l› olarak afla¤›daki eflitlik yard›m›yla hesaplan›r.
Zh = th =
3
SIRA S‹ZDE
Do¤rusal regresyon
eflitli¤inin iki AMAÇLARIMIZ
adet
parametresi (a ve b)
oldu¤undan, t da¤›l›fl›n›n
serbestlik derecesi v = n - 2
olur.
K ‹ T A P
TELEV‹ZYON
‹NTERNET
128
Co¤rafi Bilgi Sistemleri ‹çin Temel ‹statistik
(Zh veya th) > (Zα/2veya tα/2,v) ise H0 red edilir ve iki de¤iflken aras›nda anlaml› bir do¤rusal iliflki vard›r karar›na var›l›r. Bu durumda, X ve Y de¤iflkenleri aras›nda gözlem de¤erleri ile elde edilen regresyon denklemi ile anlaml› ve güvenilir
tahminler yap›labilir.
(Zh veya th) < (Zα/2 veya tα/2,v) ise H0 kabul edilir ve iki de¤iflken aras›nda iliflki yoktur karar›na var›l›r. Bu durumda, X ve Y de¤iflkenleri aras›nda gözlem de¤erleri ile elde edilen regresyon denklemi ile güvenilir tahminler yap›lamaz.
Örnek 6.4 :
Örnek 6.3’de hesaplanan korelasyon katsay›s›n›n anlaml›l›¤›n› ve dolay›s›yla elde edilen regresyon denklemi ile yap›lacak tahminlerin güvenilir olup olmad›¤›n›
α=0,05 güven (anlaml›l›k) düzeyi için test ediniz.
Çözüm :
Veriler; n=5 , r=0,973 ve α=0,05 dir.
Hipotezler;
H0 : r = ρ= 0
H1 : r ≠ ρ= 0 (Çift tarafl› test)
Gözlem say›s› n<30 oldu¤undan küçük örnekleme yap›lm›flt›r. Bu durumda,
teorik test istatisti¤ini;
α/2 =0,025 ve v=n-2=5-2=3 oldu¤undan, t çizelgesinden tα/2.v= t0.025,3 = 3,182
olarak elde ederiz.
Red Bölgesini; th>tα/2,v ise H0 red edilir, H1 kabul edilir fleklinde tan›mlar›z.
Test istatisti¤i;
Sv =
1− r 2
n−2
Sv =
1− (0, 973)2
= 0,133
5− 2
th =
0, 973
r
=
= 7, 316
0,133
Sv
Karar : th= 7,316 > t∝/2,v = 3,182 oldu¤undan H0 hipotezi red, H1 kabul edilir.
Korelasyon katsay›s› anlaml›d›r ve tu¤la-kiremit fabrikas›nda kullan›lan kil malzemesinin %Al2O3 içeri¤i ile kusurlu ürün oran› aras›nda gözlem de¤erleri ile elde
edilen regresyon denklemiyle yap›lacak tahminler %95 olas›l›kla güvenilir olacakt›r.
SIRA S‹ZDE
D Ü fi Ü N E L ‹ M
S O R U
D‹KKAT
SIRA S‹ZDE
AMAÇLARIMIZ
K ‹ T A P
4
Bir araflt›rmaSIRA
çal›flmas›nda
10 adet gözleme dayal› X ve Y de¤iflkenleri aras›ndaki iliflkinin
S‹ZDE
korelasyon katsay›s› r=0,89 elde edilmifltir. %5 güven düzeyi için korelasyon katsay›s›n›n
anlaml›l›¤›n› test ediniz.
D Ü fi Ü N E L ‹ M
Örnek 6.5 :
S O R U
Bir kent merkezinde
›s›nma döneminde (Ekim-Nisan aylar›) ayl›k ortalama hava s›cakl›klar› ve do¤algaz tüketimlerinin afla¤›daki gibi oldu¤u belirlenmifltir. Ayl›k ortalama hava s›cakl›¤› ile do¤algaz tüketimi aras›ndaki iliflkinin do¤rusal olduD‹KKAT
¤u tahmin edilmektedir.
N N
SIRA S‹ZDE
AMAÇLARIMIZ
K ‹ T A P
6. Ünite - Regresyon ve Korelasyon
Ortalama Hava S›cakl›¤› (°C)
Ort. Günlük Tüketim (1000 m3)
20
62
14
93
8
138
5
174
7
132
10
116
16
88
a) Basit do¤rusal regresyon denklemini bulunuz.
b) Korelasyon katsay›s› ve standart hatay› hesaplay›n›z
c) Korelasyon katsay›s›n› test ederek, regresyon denkleminin anlaml› ve güvenilir olup olmad›¤›n› yorumlay›n›z (α=0.05).
d) Hava s›cakl›¤›n›n 12°C olmas› durumunda günlük do¤al gaz tüketiminin güven aral›¤›n› %95 güvenirlikle tahmin ediniz.
Çözüm :
Ele ald›¤›m›z örnekte, ortalama hava s›cakl›¤›n›n günlük do¤algaz tüketimini
etkileme ihtimali söz konusu oldu¤undan, bu durumda ortalama hava s›cakl›¤› ba¤›ms›z de¤iflken (X) ve günlük do¤al gaz tüketim miktar› ba¤›ml› de¤iflken (Y) olacakt›r. Veri say›s› n=7 dir.
a) Regresyon denklemini;
b=
∑ xy
∑ x2
a = Y- bX
eflitliklerinden hesaplayabiliriz.
Y
X
y
x
y2
x2
x.y
62
20
-52
9
2704
81
-468
93
14
-21
2
441
4
-42
138
8
24
-4
576
16
-96
174
5
60
-7
3600
49
-420
132
7
18
-5
324
25
-90
116
10
2
0
4
0
0
88
16
-31
5
961
25
-155
∑Y=798
∑X=77
∑y=0
∑x=0
798
77
= 114 X =
= 11
7
7
∑ xy = −1271 = −6, 355
b=
∑ x 2 200
Y=
a = Y- bX
X =114-(-6,355 . 11) =183,905
Y ′ = 183, 905 − 6, 355.X
∑y2=8610
∑x2=200 ∑x.y= -1271
129
130
Co¤rafi Bilgi Sistemleri ‹çin Temel ‹statistik
Regresyon denkleminden de görüldü¤ü gibi, hava s›cakl›¤› (X) artarken günlük do¤al gaz tüketimi azalmaktad›r. Regresyon denklemi e¤iminin iflareti negatiftir (-).
b) Korelasyon katsay›s›n›;
∑ xy =
∑ x 2 .∑ y2
r=
−1271
= −0, 9686
200 . 8610
olarak hesaplar›z.
Tahminlerin standart hatas›;
∑ (Y − Y ′)
2
Sy =
n−2
eflitli¤inden hesaplan›r. Bunun için öncelikle, regresyon denklemini
(Y ′ = 183, 905 − 6, 355.X) kullanarak her bir X de¤eri için Y' de¤erlerini tahmin ederiz. Daha sonra, gözlem ile tahmin de¤erleri aras› farklar›n karelerinin toplam›n›
buluruz.
X
Y
Y'
Y-Y'
(Y-Y')2
20
62
56,805
5,195
26,988
14
93
94,935
-1,935
3,744
8
138
133,065
4,935
24,354
5
174
152,13
21,87
478,297
7
132
139,42
-7,42
55,056
10
116
120,355
-4,355
18,966
16
88
82,225
5,775
33,351
∑ (Y − Y ′)
2
∑ (Y − Y ′)
= 640, 756
2
Sy =
n−2
=
640, 756
= 11, 32
7−2
c) Korelasyon katsay›s›n›n testi :
Veriler; n=7 , r=-0,9686 ve α=0,05dir.
Hipotezler;
H0 : r = ρ= 0
H1 : r ≠ ρ = 0 (Çift tarafl› test)
Gözlem say›s› n<30 oldu¤undan küçük örnekleme yap›lm›flt›r. Bu durumda,
teorik test istatisti¤ini;
∝/2 =0,025 ve v=n-2=7-2=5 oldu¤undan, t çizelgesinden tα/2.v = t0.025,5 = 2,571
olarak elde ederiz.
Red Bölgesini; th>tα/2,v ise H0 red edilir, H1 kabul edilir fleklinde tan›mlar›z.
6. Ünite - Regresyon ve Korelasyon
Test istatisti¤i;
Sv =
1− r 2
n−2
Sv =
1− (−0, 9686)2
= 0,111
7−2
th =
−0, 9686
r
=
= 8, 726
Sv
0,111
Karar : th= 8,726 > t∝/2,v= 2,571 oldu¤undan H0 hipotezi red, H1 kabul edilir.
Korelasyon katsay›s› anlaml›d›r ve hava s›cakl›¤› ile günlük do¤al gaz tüketim miktar› aras›nda gözlem de¤erleri ile elde edilen regresyon denklemiyle yap›lacak tahminler, %95 olas›l›kla güvenilir olacakt›r.
d) Hava s›cakl›¤›n›n X=12°C olmas› durumunda günlük do¤al gaz tüketiminin
%95 güvenirlikle tahmini;
Y'=183,905-6,355.X
X=12°C için nokta tahmini;
Y'=183,905-(6,355.12)=107,645 (1000 m3)
∝= 0,05 , α/2=0,025 ve v=n-2=7-2=5 oldu¤undan t çizelgesinden;
tα/2,v= t0.025,5=2,571 elde ederiz.
AGS = Y'-tα/2,v.Sy =107,645 - (2,571.11,32)=78,541 (1000 m3)
ÜGS = Y'+tα/2,v.Sy=107,645+(2,571.11,32)=136,749 (1000 m3)
Hava s›cakl›¤›n›n X=12°C olmas› durumunda %95 ihtimalle en az 78541 m3 ve
en fazla da 136749 m3 günlük do¤al gaz tüketiminin olaca¤› tahmin edilmektedir.
E⁄R‹SEL (ÜSTEL) REGRESYON VE BEL‹RL‹L‹K
KATSAYISI
Gözlem verilerinin serpilme diyagram›ndaki flekli do¤rusal olmayan bir e¤ri biçimi
gösteriyorsa, gözlem de¤erleri aras›ndan üstel bir e¤ri geçirilebilece¤i tahmin edilebilir. Üstel fonksiyonlar tek tarafl› veya çift tarafl› logaritmik dönüflümler yap›larak do¤rusallaflt›r›l›p, do¤rusal regresyon kurallar› uygulanarak regresyon parametreleri belirlenebilir.
Üstel regresyon denklemi e¤risel bir flekle sahip oldu¤undan, X ve Y de¤iflkenleri aras›ndaki regresyon denkleminin gözlem de¤erlerini tam olarak aç›klay›p
aç›klayamad›¤›n› ve iki de¤iflken aras›ndaki iliflkinin derecesini belirlemede korelasyon katsay›s› ( r ) kullan›lamaz. Üstel regresyon denkleminin gözlenen de¤erleri ne derece aç›klay›p aç›klamad›¤›n› anlamada belirlilik katsay›s› (R2 ) kullan›l›r.
Üstel Regresyon
Ba¤›ms›z X ile ba¤›ml› Y de¤iflkeni aras›ndaki fonksiyonel iliflkinin fiekil 6.8’deki
gibi e¤risel olmas› durumunda, gözlem de¤erleri aras›ndan y=aXb fleklinde bir üs-
131
132
Co¤rafi Bilgi Sistemleri ‹çin Temel ‹statistik
tel bir e¤ri geçirebiliriz. X ve Y de¤iflkenlerinin her ikisinin de logaritmas›n› al›r ve
serpilme diyagram›n› tekrar çizersek, üstel fleklin do¤rusallaflt›¤›n› gözlemleriz (fiekil 6.9).
fiekil 6.8
Gözlem
de¤erlerinin üstel
görünüflü
fiekil 6.9
1,5
Logaritmik gözlem
de¤erlerinin
do¤rusal görünüflü
1
0,5
LnY
0
-0,5
-1
-1,5
-2
-1,5
-1
-0,5
0
0,5
1
LnX
Üstel fonsiyonun logaritmik dönüflümle do¤rusallaflmas›;
Y=aXb
InY=lna+b.lnX
eflitli¤indeki gibi olur. Logaritmik dönüflüm sonras›nda
Z=lnY, A=lna, B=b ve V=lnX
atamalar› yap›ld›¤›nda;
Z=A+BV
fleklinde do¤rusal regresyon denklemi elde edilebilir. Bu flekilde do¤rusallaflt›r›lan
üssel iliflki için, do¤rusal regresyon yönteminde uygulanan yöntemlerle regresyon
parametreleri hesaplanabilir.
Do¤rusallaflt›r›lan üstel regresyon denklemi için elde edilecek afla¤›daki normal
denklemlerden A ve B parametreleri hesaplanabilir.
6. Ünite - Regresyon ve Korelasyon
133
∑ Zi = n. A + B∑ Vi
∑ Vi Zi = A∑Vi + b∑ Vi2
Z ve V logaritmik de¤iflkenleri için z = Z − Z ve v = V − V küçültme ifllemleri
yapt›¤›m›zda da A ve B parametrelerini;
B=
∑ vz
∑ v2
A = Z − B.V
eflitliklerinden hesaplayabiliriz.
Hesaplanan A parametresi için a=eA ve b=B dönüflümlerini yaparak da üstel
regresyon denklemini elde ederiz.
Y ' = aX b
Belirlilik Katsay›s› ve Standart hata
Do¤rusal regresyonda iki de¤iflken aras›nda iliflki olup olmad›¤›n› veya regresyon
do¤rusunun gözlem de¤erlerini aç›klay›p aç›klamad›¤›n› anlamada korelasyon katsay›s› kullan›lmaktad›r. Korelasyon katsay›s›n›n iflareti, daima do¤runun e¤iminin
iflaretiyle uyumludur. Üstel regresyon denklemi ise e¤risel oldu¤undan, bu e¤rinin
birden fazla e¤imi söz konusudur. Bu durumda, üstel regresyon denklemi için korelasyon katsay›s›n› kullanamay›z. Bu nedenle, üstel regresyon denkleminin gözlem de¤erlerini ne derece aç›klay›p aç›klamad›¤›n› anlamada belirlilik katsay›s›
(R2) kullan›l›r.
Belirlilik katsay›s› afla¤›daki eflitlikle hesaplanabilir.
2
R = 1-
S2y
σy2
Burada, R2 : belirlilik katsay›s›n›, Sy : regresyon denklemiyle yap›lacak tahminlerin standart hatas›n› ve σy : ba¤›ml› de¤iflken Y’nin standart sapmas›n› göstermektedir.
Belirlilik katsay›s› 0 ie 1 aras›nda de¤erler al›r. Belirlilik katsay›s›n›n s›f›r (R2=0)
olmas› durumunda de¤iflkenler aras›nda hiçbir iliflki olmad›¤›, bir (R2=1) olmas›
durumunda ise de¤iflkenler aras›nda tam bir iliflki oldu¤u karar›na var›r›z. R2’nin
de¤eri 1,0’a yaklaflt›kça belirlilik artar ve de¤iflkenler aras› iliflki güçlenir, 0’a yaklaflt›kça ise belirsizlik artar ve de¤iflkenler aras› iliflki zay›flar.
Üstel regresyon denklemi ile yap›lacak tahminlerde de standart hata;
∑ (Y − Y ′)
2
Sy =
n−k
eflitli¤i ile hesaplan›r. Burada, k = üstel regresyon denklemi parametre say›s›d›r
(Üstel regresyon denkleminin a ve b parametresi oldu¤undan k = 2’dir).
Belirlilik katsay›s› R2’nin
0,5’den büyük olmas›
(R2>0,5) durumunda,
regresyon denkleminin
gözlem de¤erlerinin
%50’den fazlas›yla uyumlu
oldu¤u ve %50’den fazlas›n›
aç›klayabildi¤ini
söyleyebiliriz. Ayr›ca, R2>0,5
olmas› durumunda,
de¤iflkenler aras›nda güçlü
bir iliflki oldu¤u söylenebilir.
134
Co¤rafi Bilgi Sistemleri ‹çin Temel ‹statistik
Ba¤›ml› de¤iflken Y’nin standart sapmas› ise afla¤›daki eflitliklerle hesaplan›r.
• n≥30 için σ y =
• n<30 için σ y =
SIRA S‹ZDE
D Ü fi Ü N E L ‹ M
S O R U
D‹KKAT
SIRA S‹ZDE
AMAÇLARIMIZ
K ‹ T A P
TELEV‹ZYON
‹NTERNET
∑ (Y − Y )2
n
∑ (Y − Y )2
n −1
Üstel regresyon e¤risine göre tahmin hatalar›n›n da¤›l›m› normal oldu¤undan,
herhangi bir X de¤iflken de¤eri için yap›lacak Y’ noktasal tahmininin güven aral›¤›n› da, gözlem say›s›na göre belirli bir güven düzeyi (α) için standart normal de¤er (Zα/2) veya Student t istatistik de¤eri (tα/2,v) ile do¤rusal regresyonda oldu¤u
SIRA S‹ZDE
gibi belirleriz.
Korelasyon katsay›s›n›n testinde, red bölgesi tan›mlama ve test istatisti¤i hesaplamada kullan›lan
belirlilik katsay›s›n›n test edilmesinde kullan›lamaz. AnD Ü fi Ü N E L ‹yöntem,
M
cak, X ve Y de¤iflkenlerinin logaritmik gözlem de¤erleriyle hesaplanacak korelasyon katsay›s›n›n testi için, do¤rusal korelasyon katsay›s› testindeki yöntem uygulaS O R U
nabilir.
‹ K Kfazla
A T de¤iflkenli regresyon analizlerinde, regresyon denkleminin gözlem
E¤risel ve ikiDden
de¤erlerini aç›klay›p aç›klamad›¤›nda kullan›lan belirlilik katsay›s›n›n testinde, F testi
(varyans analizi)
uygulanmaktad›r. F testi bu ünitenin kapsam› d›fl›nda tutulmufltur. F tesSIRA S‹ZDE
ti hakk›nda ayr›nt›l› bilgiyi Neyran Orhunbilge’nin “Uygulamal› Regresyon ve Korelasyon
Analizi” (‹stanbul Üniversitesi, ‹flletme Fakültesi Yay›nlar› No:267) kitab›ndan elde edebilirsiniz. AMAÇLARIMIZ
N N
Örnek :
‹ T A P
TürkiyeKMadencilik
Sektöründe son befl y›lda meydana gelen ifl kazalar› ile sabit sermaye yat›r›mlar› aras›nda afla¤›daki veriler elde edilmifltir.
Sabit Sermaye
TELEV‹ZYON
Yat›r›m›
‹fl Kazas› Say›s›
(Milyon TL)
707
15040
‹NTERNET
865
11007
1041
8848
1049
7856
1253
7069
a) Sabit sermaye yat›r›mlar› ile ifl kazalar› aras›ndaki fonksiyonel iliflkiyi serpilme diyagram›nda inceleyerek, iliflkinin do¤rusal veya üstel olup olmad›¤›na karar
veriniz.
b) Regresyon denklemini bulunuz.
c) Regresyon denklemiyle yap›lacak tahminlerin standart hatas›n› ve belirlilik
katsay›s›n› hesaplay›n›z. Belirlilik katsay›s›n› ele alarak, elde edilen regresyon
denkleminin gözlem de¤erlerini ne derecede aç›klayabildi¤ini yorumlay›n›z.
Çözüm :
a) Mant›ksal olarak, sabit sermaye yat›r›mlar› ifl kazalar›n› etkiledi¤inden, sabit
sermaye yat›r›mlar› ba¤›ms›z de¤iflken (X) ve ifl kazalar› say›s› ba¤›ml› de¤iflken
6. Ünite - Regresyon ve Korelasyon
(Y) dir. X ve Y aras›ndaki fonksiyonel iliflkinin serpilme diyagram›ndaki görünüflü
afla¤›daki gibidir.
Serpilme diyagram›ndan da görüldü¤ü gibi, sabit sermaye yat›r›mlar› artt›kça ifl
kazalar› say›s› e¤risel olarak azalmaktad›r. Bu durumda, X ile Y aras›nda üstel bir
regresyon iliflkisi oldu¤unu söyleyebiliriz.
b) Üstel regresyon denklemini elde edebilmek için öncelikle X ve Y de¤iflkenleri de¤erlerine logaritmik dönüflümler uygular›z ve daha sonra regresyon parametrelerini hesaplar›z.
X
Y
V (LnX)
Z (LnY)
707
15040
20,377
9,618
865
11007
20,578
9,306
1041
8848
20,763
9,088
1049
7856
20,771
8,969
1253
7069
20,949
8,863
∑V = 103, 438
V=
∑V = 103, 438 = 20, 688
5
n
Z=
∑ Z = 45, 845 = 9,169
5
n
z = Z −Z
v2
z2
vz
0,449
0,0967
0,2016
-0,1396
-0,109
0,137
0,0119
0,0188
-0,0149
9,088
0,076
-0,081
0,0058
0,0066
-0,0062
8,969
0,083
-0,200
0,0069
0,0400
-0,0166
8,863
0,261
-0,306
0,0681
0,0936
-0,0799
V
Z
v = V −V
20,377
9,618
-0,311
20,578
9,306
20,763
20,771
20,949
v 2 = 0,1894
∑ z 2 = 0, 3606
Do¤rusallaflt›r›lm›fl üstel regresyon parametreleri;
B=
∑ Z = 45, 845
∑ vz = −0, 2572 = −1, 358
∑ v 2 0,1894
∑ vz = −0, 2572
135
136
Co¤rafi Bilgi Sistemleri ‹çin Temel ‹statistik
A = Z − B.V = 9,169 − (−1, 358.20, 688) = 37, 263
Üstel regresyon parametreleri ve denklemi;
b=B=-1,358
a=eA=e37,263=15244,6.1012
Y'=15244,6.1012.X-1,358
c) Tahminlerin standart hatas›n› afla¤›daki eflitlikle hesaplayabilmek için öncelikle her bir X de¤eri ile Y' de¤erlerini tahmin ederiz.
X
(106 TL)
Y
Y'
Y-Y'
(Y-Y')2
707
15040
14642
398
158295
865
11007
11134
-127
16109
1041
8848
8658
190
36097
1049
7856
8568
-712
507603
1253
7069
6731
338
114046
∑ (Y − Y ')2 = 832151
Sy =
∑ (Y − Y ' )2 =
n−2
832151
= 526, 7
5− 2
Belirlilik katsay›s›n›;
S2y
R 2 = 1−
σ y2
eflitli¤inden hesaplar›z. Ancak bunun için öncelikle Y de¤iflkeninin standart sapmas›n› (σy) hesaplamam›z gerekmektedir.
σy =
∑ (Y − Y )2
n −1
Y
Y −Y
(Y − Y )2
15040
5076
25765776
11007
1043
1087849
8848
-1116
1245456
7856
-2108
4443664
7069
-2895
8381025
∑ Y = 49820
Y=
49820
= 9964
5
∑ (Y − Y )2 = 40923770
137
6. Ünite - Regresyon ve Korelasyon
σy =
∑ (Y − Y )2
R 2 = 1−
n −1
S2y
σ y2
= 1−
=
40923770
= 3198, 6
5 −1
(526, 7 )2
(3198, 6)2
= 0, 973
Elde edilen üstel regresyon denklemi, gözlem de¤erlerinin %97,3’ünü aç›klayabilmektedir. R2 = 0, 973 > 0, 5 oldu¤undan, de¤iflkenler aras›nda oldukça güçlü
bir iliflkinin var oldu¤unu söyleyebiliriz.
Ayn› deprem büyüklü¤ünde bir kent merkezindeki dolgu zeminde SIRA
uzakl›¤a
S‹ZDEba¤l› olarak
ölçülen en büyük (maksimum) h›zlar afla¤›daki gibidir.
a) Uzakl›k ile h›z aras›ndaki fonksiyonel iliflkiyi serpilme diyagram›nda inceleyerek, iliflD Ü fi Ü N E L ‹ M
kinin do¤rusal veya üstel olup olmad›¤›na karar veriniz.
b) Regresyon denklemini bulunuz.
5
S O R U
Uzakl›k(km)
SIRA S‹ZDE
D Ü fi Ü N E L ‹ M
S O R U
H›z(cm/sn)
5
40 D ‹ K K A T
10
33
15
20
32SIRA S‹ZDE
29
25
28
AMAÇLARIMIZ
D‹KKAT
N N
SIRA S‹ZDE
AMAÇLARIMIZ
K ‹ T A P
K ‹ T A P
TELEV‹ZYON
TELEV‹ZYON
‹NTERNET
‹NTERNET
138
Co¤rafi Bilgi Sistemleri ‹çin Temel ‹statistik
Özet
N
A M A Ç
1
N
A M A Ç
2
De¤iflkenler aras› iliflkilerde ba¤›ml›l›k olmas› durumunda, bu iliflkinin fonksiyonunu, yönünü ve
derecesini belirlemede kullan›labilecek yöntemleri aç›klamak.
De¤iflkenler aras›ndaki iliflki, bunlar›n kendi aralar›nda neden-sonuç iliflkisinin bulunmas› ve de¤erlerinin karfl›l›kl› de¤iflimleri aras›nda bir ba¤l›l›k olmas› fleklinde anlafl›l›r. De¤iflkenler aras›ndaki neden-sonuç iliflkisinde neden ba¤›ms›z (X),
sonuç ise ba¤›ml› de¤iflkendir (Y). De¤iflkenler
aras›ndaki fonksiyonel iliflkinin belirlenmesinde
regresyon, iliflkinin güçlü olup olmad›¤›n› belirlemede ise korelasyon analizlerinden yararlanabiliriz. De¤iflkenler aras› iliflkinin regresyon modeli parametrelerini belirler ve daha sonraki tahminlerde kullan›labiliriz.
De¤iflkenler aras› iliflkinin fonksiyonu artan veya
azalan olabilir. Baz› gözlemlenen de¤iflkenler
aras›nda çok kuvvetli fonksiyonel iliflkiler elde
edilebilirken, baz›lar›nda ise oldukça zay›f bir
iliflki elde edilebilmektedir. De¤iflkenler aras›nda
hiçbir iliflkinin olmamas› da söz konusu olabilmektedir De¤iflkenler aras› iliflkinin derecesinin
belirlenmesinde korelasyon katsay›s› kullan›lmaktad›r.
De¤iflkenler aras› iliflkilerin do¤rusal oldu¤u durumlar için regresyon modeli parametrelerini
hesaplamak, korelasyon katsay›s›n› hesaplay›p
test etmek, ve regresyon model parametrelerini
tahminlerde kullanmak.
Bir ba¤›ms›z de¤iflken (X) ile ba¤›ml› de¤iflken
(Y) aras›ndaki iliflkinin serpilme diyagram›nda
Y = a + bX fleklinde basit do¤rusal görünüme sahip oldu¤u durumlarda, regresyon denkleminin
parametrelerini en küçük kareler yöntemi ile hesaplayabiliriz. En küçük kareler yöntemiyle elde
etti¤imiz normal denklemler veya küçültülmüfl
de¤erlerden regresyon parametrelerini (a ve b)
hesaplayabilmekteyiz. En küçük kareler yöntemi, gözlem de¤erleri aras›ndan hata kareleri toplam›n› en küçükleyecek do¤ru geçirilmesini garanti etmekle birlikte, elde etti¤imiz basit regresyon modeli ile yap›lacak tahminlerde, tahmin hatalar› da gözlenebilir. Bu tahmin hatalar›n›n genel ve ortalama ölçüsüne tahminlerin standart
hatas› denilmektedir. Regresyon denklemi ile yap›lacak tahminlerin güven aral›¤›n› belirlemede,
tahminlerin standart hatas› kullan›maktad›r.
‹ki de¤iflken aras›ndaki do¤rusal regresyon denkleminin gözlenen de¤erleri ne derecede aç›klad›¤›n› incelemede ve de¤iflkenler aras› iliflkinin derecesinin belirlenmesinde korelasyon katsay›s›
(r) kullan›lmaktad›r. Korelasyon katsay›s› ∓ 1’e
yaklaflt›kça de¤iflkenler aras› iliflkinin güçlendi¤ini ve s›f›ra yaklaflt›kça ise zay›flad›¤›n› söyleyebilmekteyiz. Korelasyon katsay›s›n›n anlaml›l›¤›n›n test edilmesinde, hipotez testleri bölümünde
aç›klanan ifllemlerin benzeri yöntemler uygulanmaktad›r.
N
A M A Ç
3
De¤iflkenler aras› iliflkilerin e¤risel (üstel) oldu¤u
durumlar için regresyon modeli parametrelerini
hesaplamak belirlilik katsay›s›n› hesaplay›p regresyon modelinin gözlem de¤erlerini ne derecede
aç›klayabildi¤ini yorumlamak.
Gözlem verilerinin serpilme diyagram›ndaki flekli üstel bir e¤ri görünümünde ise gözlem de¤erlerine logaritmik dönüflümler yap›larak do¤rusallaflt›r›l›p, do¤rusal regresyon kurallar› uygulanarak regresyon parametreleri hesaplanabilmektedir. Üstel regresyon denkleminin gözlenen de¤erleri ne derece aç›klay›p aç›klamad›¤›n› anlamada belirlilik katsay›s› (R2 ) kullan›lmaktad›r.
6. Ünite - Regresyon ve Korelasyon
139
Kendimizi S›nayal›m
1. Serpilme diyagram›nda basit do¤rusal iliflki gözlenen de¤iflkenler aras›nda normal denklemler 20=5a+40b
ve 240=40a+360b oldu¤una göre do¤runun e¤imi (b)
ne olur?
a. 1
b. 2
c. 3
d. 6
e. 12
2. ‹ki de¤iflken aras›nda azalan bir do¤rusal iliflki varsa, afla¤›dakilerden hangisi regresyon denkleminin e¤imi olabilir?
a. + 0,9
b. + 1,2
c. + 2,5
d. -1,2
e. 0
3. ‹ki de¤iflken aras›nda herhangi bir iliflki yoksa, korelasyon katsay›s› ne olabilir?
a. 1
b. 0,9
c. -0,9
d. 0,8
e. 0
4. Korelasyon katsay›s› hangi de¤erler aras›nda bulunur?
a. -1 ≤ r ≤ +1
b. 0 ≤ r ≤ +1
c. -1 ≤ r ≤ 0
d. -0,5 ≤ r ≤ +0,5
e. -0,1 ≤ r ≤ +0,1
5. Bir araflt›rmada n=36 adet gözlem de¤eri aras›ndan
Y'=32-6.X fleklinde do¤rusal regresyon denklemi geçirilmifltir. Tahminlerin standart hatas› SY =2 hesaplanm›fl
ve α=0,10 güven düzeyi için standart normal de¤erin
Zα/2=1,96 oldu¤u belirlenmifltir. Bu durumda, X=2 için
tahminlerin alt güven s›n›r› (AGS) ne olur?
a. 20
b. 23,92
c. 16,08
d. 12
e. 3,92
6. Eskiflehir’de son befl y›ll›k ya¤›fl miktar› (X) ile bu¤day verimi (Y) aras›ndaki iliflki araflt›r›ld›¤›nda do¤rusal
bir regresyon iliflkisinin var oldu¤u belirlenmifltir. Regresyon denklemi tahminleri ile gözlem de¤erleri farklar›n›n kareleri toplam›
(Y − Y ')2 = 1875 oldu¤una
göre, tahminlerin standart hatas› nedir?
a. 5
b. 25
c. 375
d. 625
e. 1875
∑
7. Eskiflehir’de son befl y›ll›k ya¤›fl miktar› (X) ile bu¤day verimi (Y) aras›nda araflt›r›lan do¤rusal bir regresyon denklemi için korelasy›n katsay›s›n›n r=0,96 ve korelasyon katsay›s›n›n standart hatas›n›n Sv=0,16 oldu¤u
belirlenmifltir. Bu durumda test istatisti¤inin de¤eri ne
olur?
a. Zh=2
b. th=2
c. Zh=6
d. th=6
e. th=12
8. Bir araflt›rmada elde edilen üstel regresyon denklemi ile yap›lan tahminlerin standart hatas› Sy=4 ve ba¤›ml› Y de¤iflkeninin standart sapmas› σy=20 olarak elde edilmifltir. Belirlilik katsay›s› hesaplanarak elde edilen regresyon denkleminin gözlem de¤erleri hakk›nda
ne söylenebilir.
a. %4’ünü aç›klayabilmektedir.
b. %20’sini aç›klayabilmektedir.
c. %56’s›n› aç›klayabilmektedir.
d. %90’›n› aç›klayabilmektedir.
e. %96’s›n› aç›klayabilmektedir.
9. Afla¤›daki belirlilik katsay›s› de¤erlerinden hangisinde, tahminlerin standart hatas› en küçüktür?
a. 0,20
b. 0,50
c. 0,75
d. 0,80
e. 0,95
140
Co¤rafi Bilgi Sistemleri ‹çin Temel ‹statistik
Kendimizi S›nayal›m Yan›t Anahtar›
10. Bir madencilik firmas›n›n y›ll›k üretim kapasitesi
(X) ile karl›l›¤› (Y) aras›nda Y'=1200.X0,5fleklinde üstel
regresyon denklemi elde edilmifltir. Firman›n y›ll›k üretim kapasitesi X=40000 ton oldu¤unda, y›ll›k karl›l›¤› ne
olur?
a. 200.000 TL
b. 240.000 TL
c. 2.400.000 TL
d. 400.000 TL
e. 4.000.000 TL
1. b
2. d
3. e
4. a
5. c
6.b
7. d
8. e
9. e
10. b
Yan›t›n›z yanl›fl ise, “En Küçük Kareler Yöntemi” konusuna bak›n›z.
Yan›t›n›z yanl›fl ise, “Korelasyon Katsay›s›” konusuna bak›n›z.
Yan›t›n›z yanl›fl ise, “Korelasyon Katsay›s›” konusuna bak›n›z.
Yan›t›n›z yanl›fl ise, “Korelasyon Katsay›s›” konusuna bak›n›z.
Yan›t›n›z yanl›fl ise, “Standart Hata ve Tahminlerin Güven Aral›¤›” konusuna bak›n›z.
Yan›t›n›z yanl›fl ise, “Standart Hata ve Tahminlerin Güven Aral›¤›” konusuna bak›n›z.
Yan›t›n›z yanl›fl ise, “Korelasyon Katsay›s›n›n
Test Edilmesi” konusuna bak›n›z.
Yan›t›n›z yanl›fl ise, “Belirlilik Katsay›s› ve Standart Hata” konusuna bak›n›z.
Yan›t›n›z yanl›fl ise, “Belirlilik Katsay›s› ve Standart Hata” konusuna bak›n›z.
Yan›t›n›z yanl›fl ise, “Üstel Regresyon” konusuna bak›n›z.
141
6. Ünite - Regresyon ve Korelasyon
S›ra Sizde Yan›t Anahtar›
S›ra Sizde 1
X Kar›flt›rma H›z›
(devir/dakika)
Y Verim (%)
y = Y −Y
x2
xy
25
65
-12,5
-9
156,25
112,5
30
70
-7,5
-4
56,25
30
35
74
-2,5
0
6,25
0
40
75
2,5
1
6,25
2,5
45
78
7,5
4
56,25
30
50
82
12,5
8
156,25
100
∑x=0
∑y=0
∑ Y = 444
∑ X = 225
X=
x= X−X
225
= 37, 5
6
Y=
∑ x 2 = 437, 5
∑ xy = 275
444
= 74
6
Regresyon do¤rusunun e¤imi;
b=
∑ xi yi = 275 = 0, 63
∑ xi2 437, 5
Regresyon do¤rusunun sabiti;
a = Y − bX = 74 − (0, 63.37, 5) = 50, 4
Regresyon do¤rusu;
Y ' = 50, 4 + 0, 63.X
(%)
S›ra Sizde 2
X=1,4 için nokta tahmini;
'
Y ' = 5 + 0, 2. X = 5 + (0, 2.1, 4) = 5, 28 % olarak buluruz. Y ± Z∝/2 . Sy
%90 güvenirlik seviyesinde α=0,10 ve α/2=0,05 dir. n>30 oldu¤undan Z çizelgesinden Zα/2=Ζ0,05 =1,645 elde ederiz.
Güven aral›¤›n› Y ' ± Z∝/2 . Sy eflitli¤inden; 5, 28 ∓ (1, 645.0, 06) AGS=5,18 ve ÜGS=5,38 buluruz.
S›ra Sizde 3
X
Y
x
y
x2
y2
xy
25
65
-12,5
-9
156,25
81
112,5
30
70
-7,5
-4
56,25
16
30
35
74
-2,5
0
6,25
0
0
40
75
2,5
1
6,25
1
2,5
45
78
7,5
4
56,25
16
30
50
82
12,5
8
156,25
64
100
∑ x 2 = 437,5
∑ y 2 = 178
∑ xy = 275
142
Co¤rafi Bilgi Sistemleri ‹çin Temel ‹statistik
Korelasyon katsay›s›n›;
r=
∑ x. y =
∑ x 2 .∑ y 2
275
= 0, 9854
437, 5.178
olarak hesaplar›z.
S›ra Sizde 4
Veriler; n=10 , r=0,89 ve α=0,05 dir.
Hipotezler;
H0 : r = = 0
H1 : r ≠ ρ = 0 (Çift tarafl› test)
Gözlem say›s› n< 30 oldu¤undan küçük örnekleme yap›lm›flt›r. Bu durumda, teorik test istatisti¤ini;
α/2 =0,025 ve v=n-2=10-2=8 oldu¤undan, t çizelgesinden tα/2.v = t0.025,8 = 2,306 olarak elde ederiz.
Red Bölgesini; th > tα/ 2,v ise H0 red edilir, H1 kabul
edilir fleklinde tan›mlar›z.
Test istatisti¤i;
Sv =
1− r 2
n−2
1− (0, 89)2
= 0,161
10 − 2
r
0, 89
th =
= 5, 53
=
Sv
0,161
Sv =
Üstel regresyon denklemini elde edebilmek için öncelikle X ve Y de¤iflkenleri de¤erlerine logaritmik dönüflümler uygular›z ve daha sonra regresyon parametrelerini hesaplar›z.
X
Y
V (LnX)
Z (LnY)
5
40
1,609
3,689
10
33
2,303
3,497
15
32
2,708
3,466
20
29
2,996
3,367
25
28
3,219
3,332
∑ V = 12, 835 ∑ Z = 17, 351
V=
∑ V = 12, 835 = 2, 567
n
Z=
5
∑ Z = 17, 351 = 3, 470
n
5
z = Z −Z
v2
1,609 3,689 -0,958
0,219
0,917 -0,210
2,303 3,497 -0,264
0,027
0,070 -0,007
2,708 3,466 0,141
-0,004
0,020 -0,001
2,996 3,367 0,429
-0,103
0,184 -0,044
3,219 3,332 0,652
-0,138
0,425 -0,090
V
Z
v = V −V
vz
1,615 -0,351
Karar : th= 5,53 > tα/2,v= 2,306 oldu¤undan H0 hipotezi
red, H1 kabul edilir. Korelasyon katsay›s› anlaml›d›r.
v 2 = 1, 615
∑ vz = −0, 351
Do¤rusallaflt›r›lm›fl üstel regresyon parametreleri;
S›ra Sizde 5
Mant›ksal olarak, uzakl›k deprem dalgas› yay›l›m h›z›n›
etkiledi¤inden, uzakl›k ba¤›ms›z de¤iflken (X) ve h›z
ba¤›ml› de¤iflken (Y) dir. X ve Y aras›ndaki fonksiyonel
iliflkinin serpilme diyagram›ndaki görünüflü incelendi¤inde, X ve Y ara›snda üstel fonksiyonel iliflkinin oldu¤u tahmin edilmektedir.
B=
∑ vz = −0, 351 = −0, 217
∑ v 2 1, 615
A = Z − B.V = 3, 47 − (−0, 217.2, 567 ) = 4, 028
Üstel regresyon parametreleri ve denklemi;
b=B=-0,217
a=eA=e4,028=5 6,15
Y ' = 56,15. X −0,217
6. Ünite - Regresyon ve Korelasyon
Yararlan›lan Kaynaklar
Akdeniz, F. (2007). Olas›l›k ve ‹statistik. Adana: Nobel.
Cula, S. & Muluk, Z. (2006). Temel ‹statistik Yöntemleri.
Ankara: Baflkent Üniversitesi.
Çömlekçi, N. (1989). Temel ‹statistik ‹lke ve Teknikleri.
‹stanbul: Bilim Teknik.
Konuk, A. & Önder, S. (1999). Maden ‹statisti¤i. Mühendislik Mimarl›k Fakültesi Maden Mühendisli¤i
Bölümü. Eskiflehir: Eskiflehir Osmangazi Üniversitesi.
Navidi, W. (2008). Statistics for Engineers and Scientists. New York, NY: McGraw-Hill.
Newbold, P. (2005). ‹flletme ve ‹ktisat ‹çin ‹statistik. Ümit
fienesen (Çev.). ‹stanbul: Literatür.
Orhunbilge, N. (1996). Uygulamal› Regresyon ve Korelasyon Analizi. ‹flletme Fakültesi Yay›n No: 267. ‹stanbul: ‹stanbul Üniversitesi.
Püskülcü, H. & ‹kiz, F. (1989). ‹statisti¤e Girifl. ‹zmir:
Bilgehan.
Serper, Ö. (2000). Uygulamal› ‹statistik II. Bursa: Ezgi.
Ünver, Ö. & Gamgam, H. (2006). Uygulamal› Temel ‹statistik Yöntemler. Ankara: Seçkin.
Yüzer, A.F. (Ed.) (2009). ‹statistik. Aç›k Ö¤retim Fakültesi Yay›n No: 771, Eskiflehir: Anadolu Üniversitesi.
143
CO⁄RAF‹ B‹LG‹ S‹STEMLER‹ ‹Ç‹N TEMEL
‹STAT‹ST‹K
7
Amaçlar›m›z
N
N
N
Bu üniteyi tamamlad›ktan sonra;
Bölgesel de¤iflkenlerin özelliklerini aç›klayabilecek,
Semi-variogram fonksiyonunun özelliklerini aç›klayabilecek,
Kuramsal semi-variogram model (küresel, üstel ve do¤rusal) parametrelerini
hesaplayabilecek ve temel uygulamalarda kullanabilecek bilgi ve becerilere
sahip olacaks›n›z.
Anahtar Kavramlar
•
•
•
•
•
•
Jeoistatistik
Bölgeselleflmifl de¤iflken
Yönsel de¤iflim (anizotropi)
Variogram
Semi-variogram
Külçe varyans› (nugget)
•
•
•
•
•
•
Eflik de¤er (sill)
Etki mesafesi
Külçe etki oran›
Anizotropi oran›
Örnek çiftleri
Küresel model
‹çindekiler
Co¤rafi Bilgi
Sistemleri ‹çinTemel
‹statistik
Jeoistatistiksel
Kavramlar
• BÖLGESELLEfiM‹fi DE⁄‹fiKENLER
• VAR‹OGRAM VE SEM‹-VAR‹OGRAM
• KURAMSAL SEM‹-VAR‹OGRAM
MODELLER‹
Jeoistatistiksel Kavramlar
BÖLGESELLEfiM‹fi DE⁄‹fiKENLER
Klasik istatistikte, örneklerin birbirinden ba¤›ms›z ve say›sal bir de¤ere sahip bireyler olduklar› kabul edilir. Buna karfl›l›k, konumsal veya mekansal örnekler ise
belirli bir co¤rafi bölge içerisinde birbirleri aras›nda ba¤›ml›l›¤› ve alansal, hacimsel veya a¤›rl›ksal de¤erleri olan örneklerdir. Bu gibi örneklerin klasik istatistiksel yöntemlerle analizinin yap›lmas›, önemli belirsizliklere ve hatalara yol açabilmektedir. Örne¤in, çevre, ya¤›fl, bitki örtüsü, toprak, jeolojik yap› ve madenlerin de¤iflkenli¤i bölgesel olarak farkl›l›klar içerebilmekte ve al›nan örnekler,
al›nd›¤› konum koordinatlar›yla ve al›nd›¤› miktarla (hacimsel ve a¤›rl›ksal) ifade edilebilmektedir.
Klasik istatistik yöntemler, al›nan örneklerin yerlerini (konumlar›n›), birbirlerini ne flekilde takip ettiklerini, örneklerin etki alanlar›n›n ne oldu¤unu ve bu etki
alan›n›n yönsel de¤ifliminin nas›l oldu¤unu dikkate almayan yöntemlerdir. Bu nedenle, klasik istatistik yöntemleri kullanan enterpolasyon yöntemleriyle yap›lacak
tahminlerde, hata büyüklü¤ü artmakta ve tahminlerin güvenilirli¤i azalmaktad›r.
George Matheron taraf›ndan 1963 y›l›ndan itibaren gelifltirilmeye bafllanm›fl
olan jeoistatistik, farkl› nicelikte ve duyarl›l›ktaki veri örneklerinin birbiri aras›ndaki konumsal iliflkisini göz önünde bulunduran uygulamal› istatistik bilim dal›d›r.
Jeoistatistik yöntemler, bölgeselleflmifl de¤iflkenler olarak bilinen, bulunduklar› yerlere göre konumsal farkl›l›k gösteren ve birçok özelli¤in tan›mlanmas›nda kullan›lan yöntemlerin genel ad›d›r. Jeoistatisti¤in ilk uygulamalar›, maden yataklar›ndan
al›nan bölgesel de¤iflkenlik gösteren tenör, kalori ve kal›nl›k gibi örnek de¤erleri
ile örneklenmemifl noktalar›n de¤erlerinin kestirilmesi ve maden yataklar›nda rezerv tahmini yap›lmas› çal›flmalar›ndan oluflmufltur. Ancak, daha sonra güçlü matematiksel temelleri olmas› nedeniyle jeoistatistik, demografik de¤iflimler, çevre ve
iklim de¤iflimlerinin izlenmesi, ya¤›fllar›n tahmini, tar›msal hasat tahmini, bitki, orman, zemin ve toprak alanlar›ndaki de¤iflimlerin izlenmesi ve haritalanmas› çal›flmalar›nda kullan›lmaya bafllanm›flt›r.
Belirli bir bölgeye özgü de¤erler alan ve konumlar› koordinatlarla tan›mlanan
örneklenmifl de¤iflkenlere, bölgeselleflmifl de¤iflkenler denilir. Bölgeselleflmifl de¤iflkenler, rassal örneklenmifl de¤iflkenler olmad›klar›ndan, örnekleme yap›lmam›fl
noktalar›n bilinmeyen de¤erlerinin tahmininde, rassal örnekleme kurallar›n› kullanamay›z. Matematiksel bir bak›fl aç›s›yla incelendi¤imizde, bölgeselleflmifl de¤iflkenin de¤erini bulundu¤u konumun bir fonksiyonu olarak ifade edebiliriz.
Co¤rafi anlamda bölgesel
farkl›l›klar gösteren,
birbirleriyle belirli bir
mesafe içerisinde ba¤›ml›
olan ve miktarsal ölçülerle
al›nan örnekler yard›m›yla
tahminde, klasik istatistik
yöntemler yerine
jeoistatistiksel yöntemler
uygulamam›z gerekmektedir.
Rassal olarak seçilen ölçme
noktalar›ndaki de¤iflken
de¤erleri yersel olarak
ba¤›ms›zken, seçildikleri
alan bir bölge oluflturuyorsa
bölgesel anlamda birbirleri
ile iliflkilidir.
146
Co¤rafi Bilgi Sistemleri ‹çin Temel ‹statistik
De¤iflkenin konumsal ba¤›ml›l›¤›n› ifade etmek için, x bir noktan›n koordinat›n› ifade edecek flekilde, Z(x) gösterimi kullan›lmaktad›r. x noktas›nda ölçülmüfl z
örnek de¤erini Z(x) rassal de¤iflkeni fleklinde ifade edebiliriz. Böylece Z(x) rassal
de¤iflkeni farkl› olas›l›ksal da¤›l›mla her x örnek noktas›nda farkl› z ölçüm de¤erine sahip olabilmektedir. Asl›nda bu karars›z ve düzensiz yap›n›n ard›nda, birbirine yak›n olanlar, birbirine uzak olanlardan daha fazla benzerlik e¤ilimi göstermektedir. Bu karakteristik davran›fl veya yap›, bölgeselleflmifl de¤iflkenin konumsal tutarl›l›¤›n› göstermektedir. Bu durum bölgeselleflmifl de¤iflkenin iki karakteristik yap›s›n› vurgulamaktad›r;
• Do¤al bir oluflumun rassal veya karars›z de¤erleri yersel özellikler gösterebilir.
• Do¤al bir oluflumun yap›s› bölgesel anlamda genel da¤›l›m› ile iliflkili olabilir.
Olas›l›ksal yorumlama bu iki karakteristik yap›y›, rassal fonksiyonlar›n içinde
göz önünde bulundurmaktad›r (Journel and Huijbregts, 1978).
x noktas›nda Z(x) yersel olarak bir rassal de¤iflkendir. Bölgesel olarak incelendi¤inde Z(x) ve Z(x+h), h uzakl›¤›na ba¤l› olarak her ölçüm noktas›nda ba¤›ms›z
de¤ildir ve konumsal otokorelasyonla birbirleri aras›nda bir iliflki söz konusudur
(Journel and Huijbregts, 1978).
Bölgeselleflmifl de¤iflkenlerin özelliklerini afla¤›daki gibi özetleyebiliriz.
Yersellik (Lokalizasyon)
Bölgesel de¤iflkenlerin de¤erleri, belirli bir geometrik alan (veya üç boyutlu olarak hacim) s›n›rlar› içinde birbirine ba¤›ml› de¤iflimler gösterir. Do¤adan elde edilen birbirine yak›n mesafedeki veriler benzer özellikler gösterirken, aralar›ndaki
uzakl›k artt›kça bu benzerlik azalmaktad›r. Bu durum yersellik (lokalizasyon)
kavram› ile aç›klanmaktad›r. Yersellik, belirli konumsal noktalardan al›nan örnek
de¤erlerinin, konumlar›na ba¤l› olarak sistematik bir iliflki içinde olmas›n› ifade
etmektedir.
Belirli bir bölgenin herhangi bir noktas›ndaki de¤iflken de¤eri, o noktadan al›nacak örne¤in flekli, boyutlar› ve do¤rultusu ile de aç›klan›r. Bunlardan herhangi birinde yap›lacak de¤ifliklikle, yeni bir bölgeselleflmifl de¤iflken elde edilir. Örne¤in, ayn› yerden 1 kg’l›k ve 10 kg’l›k iki örnek al›nd›¤›m›zda, iki örne¤ide ayn› yerden almam›za ra¤men, iki ayr› bölgeselleflmifl de¤iflken elde ederiz. Örnek
büyüklükleri birbirinden farkl› oldu¤undan, örneklerin ortalama de¤erleri de
farkl›laflacakt›r.
Devaml›l›k
Konumsal olarak al›nan baz› örnekler aras›nda belirli bir mesafe içerisinde sürekli
veya devaml› bir iliflki gözlenirken, belirli bir mesafeden sonra ise gözlenmez. Birbirine komflu baz› konumsal örnekler aras›nda ise hiçbir devaml›l›k gözlenmez.
Örne¤in, sedimanter orijinli cevherler hidrotermal orijinli cevherlerden, genellikle
çok daha iyi devaml›l›k gösterirler. Bununla birlikte, baz› nadir metalik maden (alt›n, platin gibi) yataklar›nda ise belirli bir devaml›l›k görülmez ve maden yata¤›ndaki cevher da¤›l›m› rassald›r.
Yönsel De¤iflim (Anizotropi)
Bir bölgeselleflmifl de¤iflken için al›nan konumsal örne¤in etki alan› bütün yönlerde ayn› uzan›m› göstermeyebilmektedir. Belirli bir yönde, belirli bir mesafe içerisinde süreklilik gözlenmesine karfl›l›k, bir baflka yönde süreksiz ve düzensiz de¤i-
7. Ünite - Jeoistatistiksel Kavramlar
147
fliklikler görülebilmektedir. Bölgeselleflmifl bir de¤iflken örnekleri aras›nda belirli
bir mesafe içerisinde devaml›l›¤›n yönsel farkl›l›klar göstermesi, ilgili de¤iflkenin
anizotropik bir de¤iflken oldu¤unu ifade eder.
Geçifller
Konumsal olarak al›nan baz› örnekler aras›nda belirli aral›klarla devaml›l›k gözlenirken, baz› mesafe aral›klar›nda ise devaml›l›k gözlenmeyebilir. Bu olay geçifller
halinde devam eder.
VAR‹OGRAM VE SEM‹-VAR‹OGRAM
Jeoistatistiksel yöntemlerde, konumsal de¤iflkenler aras›nda belirli bir uzakl›¤a ve
yöne ba¤l› bir bölgeselleflmifl iliflkinin var oldu¤u ve bu iliflkinin variogram fonksiyonu ile ifade edilebilece¤i aç›klanmaktad›r. Variogram fonksiyonu yard›m›yla de¤iflkenlerin yap›sal özellikleri belirlenebilmekte ve bilinmeyen noktalar›n de¤erlerinin tahmininde, bu özellikler kullan›labilmektedir.
Bölgeselleflmifl de¤iflkenin de¤erleri aras›ndaki farklar [z(x1)-z(x2)] de¤iflkenin
benzerlik derecesini ortaya koydu¤undan, uzakl›¤a ba¤l› iliflkiyi incelemede önemlidir. Bölgeselleflmifl de¤iflkenlerden al›nan iki örnek de¤eri aras›ndaki fark, bu örneklerin hacmine ve aralar›ndaki uzakl›¤a ba¤l› olarak de¤iflir. Bölgeselleflmifl ana
kütleden düzenli aral›klarla yap›lan örneklemeler sonucunda, aralar›nda uzakl›klara ba¤l› olarak oluflan örnek çiftleri aras› farklar›n kareleri toplam›n›n örnek çifti
say›s›na oran›na variogram denilmekte olup, bu fonksiyon afla¤›daki gibidir.
2c* (h) =
Variogram
hesaplamalar›nda, örnek
çiftlerinin say›s›n›n 30’dan
az olmamas› tercih edilir.
Örnek çiftlerinin say›s›
azald›kça, semi-variogram
de¤erlerinde afl›r› sapmalar
görülmeye bafllamaktad›r.
2
1
∑  z(x) - z(x + h)
n
Burada, 2γ* (h) = h uzakl›k fark›na göre hesaplanan deneysel variogram, n =
örnek çiftlerinin say›s›, z(x) = x noktas›ndan al›nan örne¤in de¤iflken de¤eri,
z(x+h) = x noktas›ndan h uzakl›kta al›nan örne¤in de¤eridir.
Variogram›n yar›s› semi-variogram› verir ve afla¤›daki fonksiyonla ifade edilir.
c* (h) =
2
1
∑  z(x) - z(x + h)
2n
Örneklenen de¤iflken de¤erleri ile elde edilen semi-variogram de¤erlerine, deneysel semi-variogram de¤erleri denilmektedir. Deneysel semi-variogram de¤erlerini hesaplamaya bafllamadan önce, örneklenen de¤iflken de¤erlerinin da¤›l›m modelinin belirlenmesi gerekmektedir. Konumsal de¤iflkenlerin da¤›l›m›, normal, lognormal veya üstel (eksponansiyel olabilmektedir. E¤er, da¤›l›m modeli araflt›r›lmadan deneysel semi-variogram hesaplamalar› yap›l›rsa, elde edilen de¤erlere model
uyarlamak mümkün olamayabilir. Örne¤in, lognormal da¤›l›ma sahip bir de¤iflken
için deneysel semi-variogram hesaplamalar›n›, de¤iflkenin logaritmik de¤erleri ile
yapmazsak, elde edilen de¤erlere uyan model ya hatal› olacakt›r, ya da uygun bir
model bulmak mümkün olamayacakt›r.
Deneysel Semi-Variogram Parametreleri
Örneklenen veri çiftleri de¤iflken de¤erleri aras›ndaki aras›ndaki farklar›n kareleri
toplam›n›n uzakl›¤a ba¤l› de¤iflimi ile elde edilen deneysel semi-variogram›n ge-
Semi-variogram, genel
anlamda h’n›n artan bir
fonksiyonudur. ‹ki ayr›
noktadan al›nan de¤erler,
bu noktalar birbirinden
uzaklaflt›¤› oranda farkl›
olmaktad›r.
148
Co¤rafi Bilgi Sistemleri ‹çin Temel ‹statistik
nel olarak külçe varyans› (nugget), eflik de¤er (sill) ve etki mesafesi olmak üzere
üç önemli parametresi vard›r. Bu parametrelerin de¤iflken yap›s›n› aç›klamadaki
önemi afla¤›da s›ra ile aç›klanm›flt›r.
Külçe varyans›, örneklenen
de¤iflkenin bölgesel
homojenli¤ini gösterir.
Yüksek de¤erdeki külçe
varyans›, de¤iflkenin çok
zay›f flekilde genifl bir alana
yay›ld›¤›n› veya örnekleme
ve analiz hatalar›n›n
yap›ld›¤›n› gösterir. Düflük
de¤erdeki külçe varyans› ise
de¤iflkenin en k›sa
mesafede bile devaml›l›¤a
ve süreklili¤e sahip
oldu¤unu gösterir.
Külçe Varyans› (C0)
Teorik olarak semi-variogram fonksiyonunun orijin civar›ndaki de¤eri s›f›r “0” olmal›d›r. Ancak, baz› de¤iflkenler için elde edilen semi-variogram fonksiyonunda
orijinde de süreksizlikler görülebilir ve bu durum da, de¤iflkenin de¤ifliminde külçe (nugget) varyans›n›n etkisi gözlemlenir (fiekil 7.1). Semi-variogram›n orjindeki
süreksizli¤ini gösteren külçe varyans›, örnekleme ve ölçüm hatalar›ndan veya de¤iflkenin yap›s›ndan kaynaklanmaktad›r. Örne¤in, alt›n madeni yataklar›nda kayalar içerisinde çökelmifl serpinti halinde alt›nlar olabilece¤i gibi, yer yer külçe halinde alt›n oluflumlar›na da rastlanabilmektedir.
Eflik De¤er (C0+C)
Eflik de¤er, genellikle külçe
varyans› (C0) ve yap›sal
varyans›n (C) toplam›na
eflittir (C0+C). Külçe etkisi
görülmeyen de¤iflkenlerin
semi-variogram de¤erleri
için eflik de¤er sadece
yap›sal varyanstan oluflur.
Pratikte eflik de¤er,
variogram› hesaplamak için
kullan›lan tüm bölgesel
de¤iflken de¤erlerinin
varyans›na eflittir
( C0+C= σ2).
Deneysel semi-variogram de¤erlerindeki düzenli flekildeki art›fl›n sona ermesi ve
belirli bir tepe noktas›na (eflik de¤ere) ulaflmas›ndan sonra, semi-variogram de¤erleri sabit kal›r. Semi-variogram de¤erlerinin ulaflt›¤› en üst de¤ere, eflik de¤er (sill)
denilir. Bu noktadan sonra iki örne¤in de¤erlerinin ortalama varyasyonu aralar›ndaki uzakl›¤a ba¤l› olmamakta, z(x) ve z(x+h) aras›nda hiçbir iliflki kalmamaktad›r. γ* (h)’n›n sabit oldu¤u a uzakl›¤›ndan sonra, jeoistatistikle elde edilen sonuç
klasik istatistikle elde edilen sonucun ayn›s› olmaktad›r (fiekil 7.1).
Külçe Etki Oran› (ε)
Deneysel semi-variogram de¤erlerinden külçe etkisinin (C0), yap›sal varyansa (C)
oran›na külçe etki oran› (ε = C0/C) denilir. Jeoistatistiksel yöntemlerle yap›lacak
tahminlerde, külçe etki oran› (ε) ile orant›l› olarak tahmin de¤erlerinde düzeltme
yap›l›r. Külçe etki oran› (külçe etki), de¤iflekenin rassal de¤ifliminin büyüklü¤ünü
gösterir.
Etki Mesafesi (a)
Bölgesel de¤iflkenin iki örnek de¤eri aras›nda, uzakl›¤a ba¤l› iliflkinin bulundu¤u
en büyük mesafeye etki mesafesi denir. Deneysel semi-variogram de¤erlerindeki
γ* (h)’daki art›fl, etki uzakl›¤› ad› verilen belirli bir a uzakl›¤›n›n ötesinde genellikle de¤iflmemekte ve sabit kalmaktad›r. Etki mesafesinden daha uzak mesafedeki
örnek de¤iflken de¤erleri birbirinden ba¤›ms›z kabul edilir. Etki mesafesine yap›sal uzakl›k da denilmektedir.
Yönsel Etki Mesafesi Oran› (Anisotropi Oran›)
Deneysel semi-variogram analizlerinde, bölgeselleflmifl de¤iflkenin de¤erlerinde
uzakl›¤›a ba¤l› yönsel geliflimler olup olmad›¤› da araflt›r›l›r. Deneysel semi-variogram de¤erlerinin yönsel de¤iflim gösterdi¤i durumlarda, araflt›r›lan her bir yön için
etki mesafesi hesaplan›r. Yönsel semi-variogram de¤erleri aras›ndan en büyük etki mesafesinin (amax ), en küçük etki mesafesine (amin ) oran›na, yönsel etki meafesi oran› veya anizotropi oran› denilir. Yönsel etki mesafesi oran›, jeoistatistiksel
tahminlerde kullan›lacak elipsoidal etki alan›n› belirlemede kullan›l›r.
149
7. Ünite - Jeoistatistiksel Kavramlar
fiekil 7.1
Deneysel
variogram
γ ∗(h)
Semi-Variogram
Fonksiyonunun
Parametreleri
Eflik
C0+C
Variogram
modeli
Külçe
C0
Etki Uzakl›¤›(a)
Semi-Variogram›n Yönsel De¤iflimi (Anizotropi)
Deneysel semi-variogram›n inceledi¤i de¤iflken, eflyönlü (izotrop) bir yap› gösteriyorsa, di¤er bir de¤iflle yönsel bir da¤›l›m göstermiyorsa ve do¤rultudan ba¤›ms›z
ise bu tür semivariogramlara ortalama semi-variogram ad› verilir. Ortalama semivariogram yönden ba¤›ms›z olarak, olanakl› tüm veri çiftlerini deneysel semi-variogram de¤erleriyle hesaplan›r.
Bununla birlikte, semi-variogram fonksiyonunun ayn› eflik (sill) de¤erine, farkl› yönlerde farkl› etki mesafelerinde ulaflmas› halinde, de¤iflkenin uzakl›¤a ba¤l›
de¤ifliminin anizotropik oldu¤u söylenebilir. Örne¤in, jeolojik katmansal yap›larda
yatay ve düfley yönde görülen etki uzakl›¤›n›n de¤iflmesi, en belirgin anizotropidir. Düfley semivariogram yatay semivariograma k›yasla daha k›sa uzakl›klarda
eflik (sill) de¤erine ulafl›r. Dere yataklar›na dik veya paralel tortul (sedimanter) kayaçlarda ise yansal anizotropi göze çarpmaktad›r.
Semi-Variogram Fonksiyonunun Orijine Yak›n Davran›fl›
Semi-variogram fonksiyonunun orijin civar›ndaki flekli, bölgeselleflmifl de¤iflkenlerin önemli özelliklerini aç›klar. Semi-variogram fonksiyonunun bafllang›ç noktas› ile bölgeselleflme olay›n›n devaml›l›¤› aras›nda önemli bir ba¤lant› vard›r. Semi-variogram›n bafllang›ç noktas› civar›nda gösterdi¤i davran›fl genel olarak üç
tip olmaktad›r.
• Parabolik davran›fl (devaml› tip): Semi-variogram, bafllang›ç noktas› civar›nda paraboliktir (fiekil 7.2.a). De¤iflkenin tam anlam›yla düzenli oldu¤unu
ve devaml›l›¤›n› gösterir.
• Do¤rusal davran›fl (do¤rusal tip): Semi-variogram, bafllang›ç noktas› civar›nda do¤rusal bir flekilde sürekli art›yor ya da azal›yorsa, bu durum bölgeselleflmifl de¤iflkenin belirli bir mesafe içinde devaml›l›¤›n› ifade eder (fiekil 7.2.b).
• Orijinde süreksizlik (külçe tip): Bafllang›ç noktas› civar›nda devaml›l›¤›n görülmedi¤i bu duruma külçe (nugget) etkisi denilir (fiekil 7.2.c). Bölgeselleflmifl de¤iflkenin devaml›l›¤›n›n çok zay›f oldu¤unu ifade eden bu tip davran›fl, genellikle nadir metal (alt›n, gümüfl, platin vd.) maden yataklar›nda
gözlemlenir.
γ* (h) fonksiyonunun yönsel
geliflimini belirleyebilmek
için, de¤iflik yönler boyunca
elde edilen örnek çiftleriyle
ayr› ayr› semi-variogram
hesaplanmal›d›r. Yön
de¤ifltikçe hesaplanacak
γ* (h)’lardaki de¤iflikliklerin
araflt›r›lmas›, mümkün
anizotropi durumlar›n›, yani
de¤iflken de¤erindeki yönsel
de¤iflkenli¤i ortaya
ç›karmaktad›r.
150
Co¤rafi Bilgi Sistemleri ‹çin Temel ‹statistik
fiekil 7.2
Semi-Variogram
Davran›fllar›
(Tercan ve Saraç,
1998)
ÖRNEK
Afla¤›daki fiekil 7.3’de, bir mangan cevheri yata¤›nda 100m aral›klarla yap›lan
sondajlardan elde edilen ortalama tenör (%Mn) de¤erleri görülmektedir. Bu sondaj verilerini ele alarak, do¤u-bat› yönünde ve kuzey-güney yönünde deneysel
semi-variogram de¤erlerini hesaplay›p, grafiksel olarak gösteriniz. Mangan maden yata¤›n›n tenör (%Mn) de¤iflminde yönsel de¤iflim farkl›l›¤› olup olmad›¤›n›
yorumlay›n›z.
fiekil 7.3
Deneysel semivariogram›n
hesaplanmas› için
kullan›lan
mangan cevheri
yata¤› sondaj
sonuçlar›
Çözüm:
Öncelikle do¤u-bat› yönü ele al›narak, birbirine 100 m uzakl›kl› örnek çiftleri
aras› deneysel semi-variogram afla¤›da hesaplanm›flt›r. fiekil 7.4’de örnek çiftleri
aras› iliflkiler görülmektedir.
c* (h) =
1
 z(x) − z(x + h) 2
∑


2n
151
7. Ünite - Jeoistatistiksel Kavramlar
c∗ (100) =
1 
2
2
2
+ ( 24 − 25)2 + ( 25 − 27 )2 
(35 − 37) + (37 − 35) + (35 − 34) + .......+


2.36
c∗ (100) =
1  
100
2.36  
γ* (100) = 1,39 (%)2
Do¤u-bat› yönünde 200 m aral›kl› örnek çiftleri aras› iliflkiler fiekil 7.5’de görüldü¤ü gibi olup, bu durum için,
c∗ (200) =
1 
2
2
2
2
2
(39 − 35) + (35 − 35) + (35 − 32) + ...... + ( 25 − 24) + ( 24 − 27) 

2.33 
c∗ (200) =
1  
188 = 2, 85 (%)2
2.33  
semi-variogram de¤eri hesaplanm›flt›r.
fiekil 7.4
Do¤u-bat› yönünde
100 m aral›kl›
örnek çiftleri aras›
iliflki
fiekil 7.5
Do¤u-bat› yönünde
200 m aral›kl›
örnek çiftleri aras›
iliflki
152
Co¤rafi Bilgi Sistemleri ‹çin Temel ‹statistik
Do¤u-bat› yönünde 100 m, 200 m, 300 m ve 400 m aral›klarla, kuzey-güney yönünde 100 m, 200 m ve 300 m aral›klarla örnek çiftleri aras›nda hesaplanm›fl deneysel semi-variogram de¤erleri Çizelge 7.1’de verildi¤i gibidir. Bu semi-variogram de¤erleri, örnekler aras› mesafenin fonksiyonu olarak fiekil 7.6’daki gibi de gösterilebilir.
Çizelge 7.1
Mangan cevheri
sondaj örnekleri için
iki ana yönde
hesaplanm›fl
deneysel semivariogram de¤erleri
Örnekler Aras› Deneysel Semi Örnek Çiftleri
Mesafeler (ft)
Variogram (%)2 Say›s›
Yön
Do¤u-Bat›
100
200
300
400
1,39
2,85
3,39
5,17
36
33
27
23
Kuzey-Güney
100
200
300
4,86
8,94
15,07
36
27
21
fiekil 7.6
Mangan cevheri
sondaj örnekleri
için iki ana yönde
hesaplanm›fl
deneysel semivariogram
de¤erleri grafi¤i
Do¤u-Bat›
Kuzey-Güney
Örnek Çiftleri Aras› Mesafe (m)
fiekil 7.6’dan da görüldü¤ü gibi her iki yöndeki yap›da önemli farklar vard›r. Kuzey-güney semi-variogram› do¤u-bat›dan daha dik olarak yükselmektedir. Bu durumda do¤u-bat› yönünde daha büyük bir devaml›l›¤›n oldu¤unu söylemek mümkündür.
SIRA S‹ZDE
SIRA S‹ZDEbulunan 680 m uzunluklu ana bulvarda, eksoz gaz› yay›l›m›n›n koBir kent merkezinde
numsal de¤iflmini belirlemek amac›yla 20 m aral›klarla karbon monoksit ölçümleri yap›lm›fl olup, bulvar bafl›ndan bafllayarak bulvar sonuna kadar yap›lan ölçümlerin sonuçlar›
D Ü fi Ü N E L ‹ M
afla¤›da verildi¤i gibidir. Bulvar boyunca yap›lan karbonmonoksit ölçümleri için 20 m ve
40 m için semi-variogram de¤erlerini hesaplay›n›z.
1
D Ü fi Ü N E L ‹ M
S O R U
S O R U
Ölçüm
Yeri (m)
CO
(ppm)
Ölçüm
Yeri (m)
CO
(ppm)
Ölçüm
Yeri (m)
CO
(ppm)
Ölçüm
Yeri (m)
CO
(ppm)
Ölçüm
Yeri (m)
CO
(ppm)
0
20
140
35
280
44
420
34
560
26
20
22
160
37
300
48
440
37
580
26
40
28
180
42
320
44
460
33
600
28
60
26
200
36
340
46
480
33
620
27
AMAÇLARIMIZ 80
33
220
38
AMAÇLARIMIZ
360
37
500
29
640
29
100
38
240
39
380
39
520
32
660
24
120
33
260
41
400
39
540
27
680
28
D‹KKAT
SIRA S‹ZDE
N N
D‹KKAT
SIRA S‹ZDE
K ‹ T A P
K ‹ T A P
TELEV‹ZYON
TELEV‹ZYON
153
7. Ünite - Jeoistatistiksel Kavramlar
KURAMSAL SEM‹-VAR‹OGRAM MODELLER‹
Bölgeselleflmifl de¤iflkenin özelliklerinin belirlenmesi ve daha sonra örneklenmemifl noktalar›n kestiriminde kullanmak üzere, araziden al›nan örneklerle hesaplanan deneysel semi-variogram de¤erlerinin modellenmesi (uygun e¤ri tipinin bulunmas›) gerekir. Deneysel semi-variogram de¤erlerine model uyarlama konusunda
birçok çal›flma yap›lm›fl olup, bu modellerin fonksiyonlar› afla¤›da tan›t›lmaktad›r.
Küresel (Spherical) Model
Matheron’un önerdi¤i bu küresel modelde, semivariogram fonksiyonu orijine yak›nlaflt›kça do¤rusal özellik göstermektedir (fiekil 7.7). Modelde, orijinden çizilen
te¤et etki uzakl›¤›n›n (a) 2/3’ünde eflik de¤er (sill - C) ile kesiflmektedir. Küresel
model afla¤›daki gibi tan›mlanmaktad›r.
Külçe etkisi görülmeyen
küresel modellerde, semivariogram fonksiyonunun
yap›sal varyans› (C) ayn›
zamanda modelin eflik
de¤eri olarak da tan›mlan›r.
 3h h3 

 h ≤ a oldu¤u zaman
−
 2a 2a 3 
c(h) = C 
γ(h) = C
h ≥ a oldu¤u zaman
Burada γ(h) = kuramsal semi-variogram fonksiyonunu, h = örnek çiftleri aras›
uzakl›¤›, C = semi-variogram fonksiyonunun ulaflt›¤› en büyük yüksekli¤i (yap›sal
varyans›), a = örneklerin birbirinden ba¤›ms›z oldu¤u uzakl›¤› (etki mesafesini)
göstermektedir.
fiekil 7.7
Küresel SemiVariogram Model
Baz› semi-variogram fonksiyonlar› külçe (nugget) etki nedeniyle orijinden bafllamayabilir. Bu durumda külçe etkili küresel model için,
γ(o) = C0
 3h h3 

 h ≤ a oldu¤u zaman
−
 2a 2a 3 
c(h) = C0 + C 
γ(h) = C0 + C
h ≥ a oldu¤u zaman
154
Co¤rafi Bilgi Sistemleri ‹çin Temel ‹statistik
fleklinde bir fonksiyon kullan›labilir (fiekil 7.8).
fiekil 7.8
Külçe Etkili Bir
Küresel Model
ÖRNEK
Küresel semi-variogram parametreleri a=100 m, C0=2,5 (%Zn)2 ve C=10,5 (%Zn)2
olan bir maden yata¤›nda, konumsal olarak aralar›nda 50 m mesafe bulunan iki
nokta aras›ndaki ortalama semi-variogram› hesaplay›n›z.
Çözüm:
Örnek verileri inceledi¤imizde, külçe varyans›n›n (C0) varl›¤› nedeniyle, küresel modelin külçe etkili bir model oldu¤unu belirlemekteyiz. ‹ki nokta aras›ndaki
mesafe h=50 m oldu¤una göre, ortalama semi-variogram afla¤›daki gibi hesaplar›z.
 3h h3 


−
 2a 2a 3 
c(h) = C0 + C 
 3* 50
(50)3 

−

 2 *100 2 * (100)3 
c(50) = 2, 5 + 10, 5 * 
γ(50) = 9,72 (%Zn)2
SIRA S‹ZDE
D Ü fi Ü N E L ‹ M
S O R U
D‹KKAT
SIRA S‹ZDE
AMAÇLARIMIZ
K ‹ T A P
2
Bir kömür madeni
iflletmesinde sodaj yap›larak elde edilen kal›nl›k verileri ile variogram
SIRA S‹ZDE
analizi yap›lm›fl ve kal›nl›k de¤ifliminin afla¤›daki küresel semi-variogram modeli parametreleri ile ifade edilebilece¤i belirlenmifltir. Aralar›nda 150 m mesafe bulunan iki nokD Ü fi Ü N E L ‹ M
ta aras›ndaki
ortalama semi-variogram› hesaplay›n›z.
Küresel model parametreleri : a=400 m ve C=90 (m)2
S O R U
Üstel (Eksponansiyel) Model
Eksponansiyel modelin fonksiyonel flekli de orijinden bafllar, yavafl yavafl yükselir
D‹KKAT
ve eflik de¤ere (sill’e) tamamen ulaflamaz. Uygulamada eflik de¤erinin (sill -C)
%95’ine ulafl›ld›¤›nda etki uzakl›¤› (range -a) de¤eri bulunur. Eksponansiyel modeSIRA afla¤›daki
S‹ZDE
lin fonksiyonu
gibidir.
γ(h) = C [1 - exp(-h/a)]
N N
AMAÇLARIMIZ
K ‹ T A P
155
7. Ünite - Jeoistatistiksel Kavramlar
Küresel ve eksponansiyel modeller fiekil 7.9’da karfl›laflt›r›lmaktad›r.
fiekil 7.9
Küresel ve
eksponansiyel semivariogram
fonksiyonlar›n›n
karfl›laflt›r›lmas›
Bir bölgede topraktan al›nan örneklerin arsenik (As) içeri¤i (ppm) için yap›lan variogram analizleri sonucunda, afla¤›da parametreleri verilen üstel (eksponansiyel)
semi-variogram modeli elde edilmifltir. Ölçüm yap›lamayan ve aralar›nda 100 m
mesafe bulunan iki nokta aras›nda ortalama semi-variogram ne olur?
Üstel (eksponansiyel) model parametreleri : a= 250 m ve C=600 (ppm)2 As
Çözüm:
‹ki nokta aras› mesafe h=100 m oldu¤una göre, üstel model ile iki nokta aras›
ortalama semi-variogram› afla¤›daki gibi hesaplar›z.
γ(h) = C [1 - exp(-h/a)]

100 


c(100) = 600 * 1- e 250 




γ(100) = 197,8 (ppm)2 As
Do¤rusal Model
Semi-variogram fonksiyonunun orijinden bafllayarak do¤rusal olarak sürekli art›fl
gösterdi¤i ve herhangi bir eflik de¤erine ulaflamad›¤› durumlarda, afla¤›daki gibi
do¤rusal modeller kullan›labilir (fiekil 7.10).
γ(h) = p.hλ
Burada, p = do¤runun e¤imini, λ = do¤runun üssel art›fl katsay›s›n› göstermektedir. Semi-variogram fonksiyonunun tam do¤rusal olmas› halinde λ = 0’d›r. Genellikle λ, 0 ile 2 aras›nda de¤erler al›r (2’ye eflit olmamal›d›r).
ÖRNEK
156
Co¤rafi Bilgi Sistemleri ‹çin Temel ‹statistik
fiekil 7.10
Do¤rusal model
ÖRNEK
Bir demir madeni yata¤›ndan al›nan örneklerin %Fe tenör içeri¤i için yap›lan variogram analizleri sonucunda, verilerin γ(h) = 0,06.h (%)2 Fe fleklinde do¤rusal semi-variogram modeline uygun davran›fl gösterdikleri belirlenmifltir. Bu durumda,
aralar›nda 250 m mesafe bulunan iki nokta aras›nda ortalama semi-variogram
de¤eri ne olur?
Çözüm :
‹ki nokta aras›ndaki mesafe h=250 m oldu¤una göre, ortalama do¤rusal semivariogram de¤erini afla¤›daki gibi hesaplar›z.
γ(h) = 0,06.h
γ(250) = 0,06 * 250 = 15 (%)2 Fe
SIRA S‹ZDE
D Ü fi Ü N E L ‹ M
3
Erozyonla mücadele
alan› ilan edilen bir bölgede, erozyon duyarl›l›k faktörü (K faktörü)
SIRA S‹ZDE
ölçümü amaçl› örneklemeler yap›lm›flt›r. K faktörü için yap›lan variogram analizleri sonucunda, verilerin γ(h) = 2.10-5.h fleklinde do¤rusal semi-variogram modeline uygun davraD Ü fi Ü N E L ‹ M
n›fl gösterdikleri
belirlenmifltir. Bu durumda, aralar›nda 200 m mesafe bulunan iki nokta
aras›nda ortalama semi-variogram de¤eri ne olur?
S O R U
ÖRNEK
D‹KKAT
SIRA S‹ZDE
AMAÇLARIMIZ
S O R U
Ortalama tenörü %38 Fe ve standart sapmas› %10 Fe olan bir demir madeni yata¤›nda aç›lanD ‹sondajlardan
elde edilen örnek çiftleriyle hesaplanan deneysel semiKKAT
variogram de¤erleri afla¤›da verildi¤i gibidir. Deneysel semi-variogram de¤erlerini
dikkate alarak kuramsal küresel semi-variogram modeli parametrelerini bulunuz.
N N
SIRA S‹ZDE
AMAÇLARIMIZ
K ‹ T A P
K ‹ T A P
TELEV‹ZYON
TELEV‹ZYON
‹NTERNET
‹NTERNET
Örnek Çiftleri
Aras›Mesafe (m)
Deneysel Semi-Var.
(%)2 Fe
50
100
150
200
250
300
350
40
60
76
106
94
110
98
157
7. Ünite - Jeoistatistiksel Kavramlar
Çözüm :
Öncelikle mesafeye ba¤l› olarak deneysel semi-variogram de¤erlerini kartezyen koordinat›nda haz›rlanm›fl grafi¤e afla¤›daki fiekil 7.11’deki gibi aktar›r›z. Küresel modelde külçe etkisi (C0) ve eflik de¤eri (C) toplam› varyansa (σ2) eflit (C0 +
C = σ2= 100) oldu¤undan, grafik üzerinde varyans› gösteren bir çizgi çizeriz. Deneysel semi-variogram de¤erlerinin ilk iki veya üçünden geçen bir do¤ru çizerek,
varyans çizgisini kestiririz. Bu kesiflim noktas›ndan uzakl›k eksenine inilen bir dikme ise a etki mesafesinin üçte ikisine eflit olacakt›r. fiekil 7.11’de görüldü¤ü gibi,
varyans (σ2) çizgisini kesen noktadan inilen dikme h=200 m de uzakl›k eksenini
kesmektedir. Bu durumda;
2
a = 200 m
3
oldu¤undan, a=300 m olacakt›r.
fiekil 7.11
Demir madeni
yata¤› verileri ile
elde edilen deneysel
semi-variogram
modeli
‹lk iki veya üç noktadan çizilen do¤ru, semi-variogram γ* (h) eksenini 20 de¤erinde kesmektedir. Bu durumda, küresel model külçe etkisi (C0) içermektedir ve
külçe etkisinin de¤eri C0=20 (%)2 Fe’dir.
Külçe etkisi (C0) ve eflik de¤eri (C) toplam› C0 + C = σ2 = 100 oldu¤undan, bu
durumda eflik de¤eri;
C = σ2 - C0 = 100 - 20 = 80 (%)2 Fe
olarak bulunur.
Elde edilen parametrelere göre küresel modeli afla¤›daki gibi yazabiliriz.
 2 h h3 

c ( h) = C0 + C  −
 h≤a
 3a 2a3 
γ (h) = C0 + C
h≥a
158
Co¤rafi Bilgi Sistemleri ‹çin Temel ‹statistik
 2h
h3 
−
 h ≤ 300 m
 3.300 2.3003 
c ( h) = 20 + 80 
γ (h) = 20 + 80
SIRA S‹ZDE
D Ü fi Ü N E L ‹ M
4
SIRA (OM)
S‹ZDE içeri¤i ortalamas› %5 ve standart sapmas› %2 olan bir ormanl›k
Organik madde
alanda, topraktan al›nan örnek çiftleriyle hesaplanan deneysel semi-variogram de¤erleri
afla¤›da verildi¤i gibidir. Deneysel semi-variogram de¤erlerini dikkate alarak kuramsal
D Ü fi Ü N E L ‹ M
küresel semi-variogram modeli parametrelerini bulunuz.
S O R U
S O R U
D‹KKAT
D‹KKAT
SIRA S‹ZDE
AMAÇLARIMIZ
K ‹ T A P
ÖRNEK
TELEV‹ZYON
‹NTERNET
h ≥ 300 m
N N
Örnek Çiftleri
Aras› Mesafe (m)
Deneysel SemiVar. (%)2 OM
50
1,9
100
2,8
150
3,6
200
3,8
250
4,2
300
3,9
SIRA S‹ZDE
AMAÇLARIMIZ
K ‹ T A P
Bir gümüfl madeni iflletmesinde 10 m aral›klarla basamaklarda aç›lan patlatma
deliklerinden
T E L E al›nan
V ‹ Z Y O N k›r›nt› örneklerinin analizi ile elde edilen verilerle hesaplanan deneysel semi-variogram verileri afla¤›da verildi¤i gibidir. Örnekleme yap›lan
basamak patlatma delikleri ortalama tenörü 220 gr/ton ve varyans› 15000 (gr/ton)2
oldu¤una göre,
‹NTERNET
a) Ortalama semi-variogram model (küresel) parametrelerini bulunuz.
b) Yönsel semi-variogram model parametrelerini bularak, anizotropinin güçlü
oldu¤u yönü ve anizotropi oran›n› belirleyiniz.
Örnekler Aras›Mesafeh - (m)
Deneysel Semi-Variogram De¤erleri
γ* (h) (gr/ton)2
Ortalama
Kuzey-Güney
Do¤u-Bat›
10
5000
2850
7500
20
10300
6250
15000
30
13750
8750
12950
40
13900
10800
15550
50
15350
14200
15900
60
16200
13750
13200
70
14325
16225
15450
80
13800
13800
14650
7. Ünite - Jeoistatistiksel Kavramlar
Çözüm :
a)
Küresel model parametreleri;
a = 45 m C = 15000 (gr/ton)2
b)
Anizotropi Yönü : Kuzey-güney
Anizotropi Oran› : (amax/amin = 2,5)
159
160
Co¤rafi Bilgi Sistemleri ‹çin Temel ‹statistik
Özet
N
A M A Ç
1
N
A M A Ç
2
Bölgesel de¤iflkenlerin özelliklerini aç›klamak.
Belirli bir bölgeye özgü de¤erler alan ve konumlar› koordinatlarla tan›mlanan örneklenmifl de¤iflkenlere, bölgeselleflmifl de¤iflkenler denilir. Bölgeselleflmifl de¤iflkenlerin belirli bir geometrik alan
(veya üç boyutlu olarak hacim) s›n›rlar› içinde
birbirine ba¤›ml› de¤iflimler göstermesi yersellik
(lokalizasyon) kavram› ile aç›klanmaktad›r. Bölgeselleflmifl de¤iflken örnekleri aras›nda belirli bir
mesafe içerisinde devaml›l›k ve devaml›l›kta yönsel farkl›l›klar (anizotropi) görülebilmektedir.
Semi-variogram fonksiyonunun özelliklerini
aç›klamak.
Bölgeselleflmifl de¤iflken için yap›lan örneklemeler sonucunda, aralar›nda uzakl›klara ba¤l›
olarak oluflan örnek çiftleri aras› farklar›n kareleri toplam›n›n örnek çifti say›s›na oran›na variogram, variogram›n yar›s›na da semi-variogram
denilmektedir.
Örneklenen de¤iflken de¤erleri ile elde edilen semi-variogram de¤erlerine, deneysel semi-variogram de¤erleri denilmektedir. Deneysel semi-variogram de¤erlerinin orjindeki süreksizli¤ini külçe
varyans› (nugget), ulaflt›¤› en üst de¤ere eflik de¤er (sill) ve ulaflt›¤› en büyük mesafeye etki mesafesi denilmektedir. Yönsel olarak de¤iflen semivariogram de¤erleri analiz edilerek, en büyük etki mesafesinin (amax ) ve en küçük etki mesafesinin (amin ) gözlendi¤i yönlerin bulunmas› ve yönsel etki mesafesi oran›n›n hesaplanmas›, jeoistatistiksel tahminlerde kullan›lacak elipsoidal etki
alan›n› belirlemede önemli olmaktad›r.
Bölgeselleflmifl de¤iflkenin devaml›l›¤›na ba¤l›
olarak semi-variogram fonksiyonu, bafllangݍ
noktas› civar›nda devaml›, do¤rusal veya külçe
etkili davran›fl gösterebilmektedir.
N
A M A Ç
3
Kuramsal semi-variogram model (küresel, üstel
ve do¤rusal) parametrelerini hesaplamak ve temel uygulamalarda kullanmak.
Örneklenen de¤iflken de¤erleri ile hesaplanan
deneysel semi-variogram de¤erleri, bafllang›ç
noktas› civar›nda do¤rusal ve etki mesafesinden
sonra varyansa yak›n bir görünüfle sahipse küresel modeli uyarlayabiliriz. Küresel model külçe
etkili veya etkisiz olabilir. Deneysel semi-variogram de¤erlerine üstel (ekponansiyel) veya do¤rusal model de uyarlayabiliriz. Kuramsal semivariogram parametrelerini kullanarak, ölçüm yap›lmam›fl noktalar aras›ndaki ortalama semi-variogram de¤erlerini hesaplayabilmek mümkün
olmaktad›r.
7. Ünite - Jeoistatistiksel Kavramlar
161
Kendimizi S›nayal›m
1. Do¤adan elde edilen birbirine yak›n mesafedeki
veriler benzer özellikler gösterirken, aralar›ndaki uzakl›k artt›kça bu benzerli¤in azalmas› hangi kavramla
aç›klan›r?
a. Devaml›l›k
b. Yönsellik
c. Rassall›k
d. Yersellik
e. Geçifller
2. Belirli bir bölgeye özgü de¤erler alan ve konumlar›
koordinatlarla tan›mlanan örneklenmifl de¤iflkenlere ne
ad verilir?
a. Ba¤›ml› de¤iflken
b. Ba¤›ms›z de¤iflken
c. Rassal de¤iflken
d. Zaman de¤iflkeni
e. Bölgeselleflmifl de¤iflken
3. Semi-variogram fonksiyonunun orijininde süreksizliklerin görülmesi durumunda, de¤iflkenin de¤ifliminde
ne tür bir etki görülür?
a. Eflik de¤er
b. Külçe varyans›
c. Yap›sal varyans
d. Yönsel de¤iflim
e. Etki mesafesi
4. Arazide bir hat boyunca 10 m aral›klarla 8 adet örnek al›nm›flt›r. Örneklerin de¤iflken de¤erleri afla¤›daki gibi oldu¤una göre, h=10 m için semi-variogram›n
de¤eri nedir?
Örnek Yeri (m)
0
De¤iflken De¤eri
20 22 26 25 29 31 32 32
a.
b.
c.
d.
e.
3
5
7
8
14
10 20 30 40 50 60 70
5. Arazide bir hat boyunca 10 m aral›klarla 10 adet örnek al›nm›flt›r. Örneklerin de¤iflken de¤erleri afla¤›daki
gibi oldu¤una göre, h=20 m için kaç adet örnek çifti
oluflur?
Örnek Yeri (m)
0
10 20 30 40 50 60 70 80 90
De¤iflken De¤eri 14 18 16 19 20 21 24 22 27 26
a.
b.
c.
d.
e.
6
7
8
9
10
6. Küresel semi-variogram parametreleri a=30 m ve
C=10 olan bir de¤iflken için, konumsal olarak aralar›nda 10 m mesafe bulunan iki nokta aras›ndaki ortalama
semi-variogram de¤eri ne olur?
a. 0,48
b. 4,8
c. 0,5
d. 5,0
e. 8,0
7. Küresel semi-variogram parametreleri a=250 m,
C0=10 ve C=40 olan bir de¤iflken için, konumsal olarak
aralar›nda 300 m mesafe bulunan iki nokta aras›ndaki
ortalama semi-variogram de¤eri ne olur?
a. 10
b. 20
c. 30
d. 40
e. 50
8. Bir variogram analizi sonucunda, verilerin γ(h) =
5.10-3.h fleklinde do¤rusal semi-variogram modeline uygun davran›fl gösterdikleri belirlenmifltir. Bu durumda,
aralar›nda 100 m mesafe bulunan iki nokta aras›nda ortalama semi-variogram de¤eri ne olur?
a. 0,005
b. 0,05
c. 0,5
d. 5,0
e. 50,0
162
Co¤rafi Bilgi Sistemleri ‹çin Temel ‹statistik
Kendimizi S›nayal›m Yan›t Anahtar›
9. Bir semi-variogram modeli parametrelerini belirleme çal›flmas›nda, deneysel semi-variogram de¤erlerinin
ilk ikisinden geçen do¤ru ile varyans çizgisini kesmifl
ve bu kesiflimden inilen bir dikme h=50 m’de uzakl›k
eksenini kesmifltir. Bu durumda modelin etki mesafesi
kaç m olur?
a. 25
b. 50
c. 75
d. 100
e. 150
1. d
10. Bir yönsel variogram analizi çal›flmas›nda, etki mesafesi do¤u-bat› yönünde 200 m ve kuzey-güney yönünde 50 m bulunmufltur. Anizotropi oran› nedir?
a. 4,0
b. 3,0
c. 2,0
d. 1,0
e. 0,25
7. e
2. e
3. b
4. a
5. c
6. b
8. c
9. c
10.a
Yan›t›n›z yanl›fl ise, “Bölgeselleflmifl De¤iflkenler”
konusuna bak›n›z.
Yan›t›n›z yanl›fl ise, “Bölgeselleflmifl De¤iflkenler”
konusuna bak›n›z.
Yan›t›n›z yanl›fl ise, “Deneysel Semi-Variogram
Parametreleri” konusuna bak›n›z.
Yan›t›n›z yanl›fl ise, “Variogram ve SemiVariogram” konusuna bak›n›z.
Yan›t›n›z yanl›fl ise, “Variogram ve SemiVariogram” konusuna bak›n›z.
Yan›t›n›z yanl›fl ise, “Küresel Model” konusuna
bak›n›z.
Yan›t›n›z yanl›fl ise, “Küresel Model” konusuna
bak›n›z.
Yan›t›n›z yanl›fl ise, “Do¤rusal Model” konusuna
bak›n›z.
Yan›t›n›z yanl›fl ise, “Kuramsal Semi-Variogram
Modelleri” konusuna bak›n›z.
Yan›t›n›z yanl›fl ise, “Deneysel Semi-Variogram
Parametreleri” konusuna bak›n›z.
163
7. Ünite - Jeoistatistiksel Kavramlar
S›ra Sizde Yan›t Anahtar›
S›ra Sizde 1
c* (h) =
1
 z(x) − z(x + h) 2
∑


2n
c∗ (20) =
1 
2
2
2
2
2
( 20 − 22) + ( 22 − 28) + ( 28 − 26) + ............... + ( 29 − 24) + ( 24 − 28) 

2.34 
c∗ (20) =
1 
502 = 7, 38
2.34 
c∗ (40) =
1 
2
2
2
2
2
( 20 − 28) + (22 − 26) + ( 28 − 33) + ............... + ( 27 − 24) + ( 29 − 28) 

2.33 
c∗ (20) =
1 
658 = 9, 97
2.33 
S›ra Sizde 2
Veriler : a=400 m, C=90 (m)2 ve h=150
Küresel model külçe etkisizdir.
 3h h3 


c(h) = C  −
 2a 2a 3 
 3*150
(150)3 

c(150) = 90 * 
−

 2 * 400 2 * (400)3 
S›ra Sizde 4
σ = 2%⇒ σ2 = 4 (%)2
Örnek Çiftleri Aras›
Deneysel SemiVar.
Mesafe (m)
(%)2 OM
50
1,9
100
2,8
150
3,6
200
3,8
250
4,2
300
3,9
γ (150) = 48,25 (m)2
S›ra Sizde 3
h=200 m oldu¤una göre, ortalama do¤rusal semi-variogram de¤erini afla¤›daki gibi hesaplar›z.
γ (h) = 2.10-5.h
γ (200) = 2.10-5 * 200 = 0,004
2
a = 166 ⇒ a = 249 m
3
C0=1,0 (%)2 ve C=3,0 (%)2
olarak elde ederiz.
164
Co¤rafi Bilgi Sistemleri ‹çin Temel ‹statistik
Yararlan›lan Kaynaklar
Clark, I. (1979). Practical Geostatistics. London: Applied
Science.
Journel, A.G. & Huijbregts, CH.J. (1978). Mining
Geostatistics. San Diego: Academic.
Konuk, A. & Önder, S. (1999). Maden ‹statisti¤i.
Mühendislik Mimarl›k Fakültesi Maden Mühendisli¤i
Bölümü.
Eskiflehir:
Eskiflehir
Osmangazi
Üniversitesi.
Olea, R. A. (1999). Geostatistics for Engineers and Earth
Scientists. Boston: Kluwer Academic.
Pekin, A. (1999). Aç›k ‹flletme Basamak Tenörlerinin
Kriging Tahminlerinde ‹statistiksel Da¤›l›m
Modellerinin Etkileri. (Yay›mlanmam›fl doktora tezi).
Eskiflehir Osmangazi Üniversitesi/Fen Bilimleri
Enstitüsü, Eskiflehir.
Tercan, A.E. & Saraç, C. (1998). Maden Yataklar›n›n
De¤erlendirilmesinde Jeoistatistiksel Yöntemler.
Ankara: Jeoloji Mühendisleri Odas›.
Tüysüz, N. & Yaylal›, G. (2005). Jeoistatististik Kavramlar ve Bilgisayarl› Uygulamalar. Trabzon:
Karadeniz Teknik Üniversitesi
Uyguçgil, H. (2007). Çok De¤iflkenli Maden
Yataklar›nda Rezerv Tenör Tahmininde Jeoistatistik
ve Co¤rafi Bilgi Sistemleri Tekniklerinin Kullan›m›.
(Yay›mlanmam›fl doktora tezi). Eskiflehir Osmangazi
Üniversitesi/Fen Bilimleri Enstitüsü, Eskiflehir.
CO⁄RAF‹ B‹LG‹ S‹STEMLER‹ ‹Ç‹N TEMEL
‹STAT‹ST‹K
8
Amaçlar›m›z
N
N
N
Bu üniteyi tamamlad›ktan sonra;
Konumsal tahminde kullan›lan klasik istatistik ve jeoistatistik yöntemler aras›ndaki fark› belirleyebilecek,
Konumsal tahminde en yak›n komflu, yüzey trend analizi ve uzakl›¤›n tersiyle a¤›rl›kland›rma yöntemlerini kullanabilecek,
Konumsal tahmininde Kriging yöntemini aç›klayabilecek ve farkl› semi-variogram modelleri ile noktasal tahmin uygulamalar› yapabilecek bilgi ve becerilere sahip olacaks›n›z.
Anahtar Kavramlar
•
•
•
•
•
•
Uzakl›¤›n Tersi
En yak›n komflu
Yüzey trend analizi
Konumsal Tahmin
Öklid Uzakl›¤›
A¤›rl›k Katsay›lar›
•
•
•
•
•
•
Kriging Eflitli¤i
Nokta Kriging
Arama kapsama alan›
Hariç tutma aç›s›
Kriging tahmin varyans›
‹nterpolasyon
‹çindekiler
Co¤rafi Bilgi
Sistemleri ‹çin Temel
‹statistik
Konumsal Tahmin
(‹nterpolasyon) ve
Kriging
• UZAKLI⁄A BA⁄LI TAHM‹N
YÖNTEMLER‹
• KLAS‹K KONUMSAL TAHM‹N
YÖNTEMLER‹
• KR‹G‹NG TAHM‹N YÖNTEM‹
Konumsal Tahmin
(‹nterpolasyon) ve Kriging
UZAKLI⁄A BA⁄LI TAHM‹N YÖNTEMLER‹
Konumsal örneklemeler sonras›nda, örnek noktalar› de¤erleri yard›m›yla örnek
al›nmam›fl noktalar, alanlar veya hacimsel bloklar için tahminler yapmaya çal›fl›r›z.
Bu tahminlerde, klasik istatistik yöntemleri kullanan uzakl›¤›n tersiyle a¤›rl›kland›rma, en yak›n komfluluk ve yüzey trend analizi gibi interpolasyon (tahmin) yöntemleri kullan›labilmektedir. Bu yöntemlerden uzakl›¤›n tersiyle a¤›rl›kland›rmada
örnek nokta de¤erlerinin a¤›rl›klar› uzakl›¤a ba¤l› olarak de¤iflmekte, en yak›n
komfluluk yönteminde sadece en yak›n örnek noktas› dikkate al›nmakta ve yüzey
trend analizi yönteminde ise tüm örnek noktalar›n›n a¤›rl›klar› ortalama bir polinom ile ifade edilmektedir.
Klasik konumsal tahmin yöntemler, al›nan örneklerin birbirlerini ne flekilde takip ettiklerini, örneklerin etki alanlar›n›n ne oldu¤unu ve bu etki alan›n›n yönsel
de¤ifliminin nas›l oldu¤unu dikkate almayan yöntemlerdir. Klasik yöntemler kullanarak yap›lacak konumsal tahminlerde, hata büyüklü¤ü artmakta ve tahminlerin
güvenilirli¤i azalmaktad›r. Bu nedenlerle de, co¤rafi anlamda bölgesel farkl›l›klar
gösteren, birbirleriyle belirli bir mesafe içerisinde ba¤›ml› olan ve miktarsal ölçülerle al›nan örnekler yard›m›yla tahminde, klasik yöntemler yerine jeoistatistiksel
kriging yöntemlerini uygulamam›z gerekmektedir.
‹smini Güney Afrikal› araflt›rmac› D.G. Krige’den alan jeoistatistiksel Kriging
yönteminde, örneklerin düzensiz ve süreklili¤in yönsel olarak de¤iflti¤i durumlarda, bir noktan›n veya blo¤un ortalama de¤erini en küçük hata ile yans›z olarak
tahmin etmede variogram fonksiyonu kullan›lmaktad›r. Kriging yöntemi, tahmin
hatalar›n›n varyans›n› en küçükleyen ve yans›z tahminler yapmam›z› sa¤layan bir
yöntemdir. Kriging yönteminde, nokta veya blok çevresindeki örnek de¤erlerinin
blok de¤erine etkisini aç›klayan a¤›rl›k katsay›lar›, semi-variogram fonksiyonu yard›m›yla bulunmaya çal›fl›lmaktad›r. Bu a¤›rl›k katsay›lar›, tahmin varyans›n› en küçükleyecek bir kombinasyonu içerir.
Bu ünitede, klasik konumsal tahmin yöntemleri karfl›s›nda kriging yönteminin
önemi aç›klanacakt›r. Kriging yöntemi oldukça kapsaml› ve farkl› de¤iflken yap›lar› için gelifltirilmifl birçok yöntemi kapsamaktad›r. Ancak bu ünitede, konunun
önemini belirtme ve temel kavramlar› ö¤renme amac›yla, sadece nokta tahmininde kullan›lan kriging yöntemi basit örneklerle ele al›nm›flt›r.
Jeoistatisti¤in öncüsü olan
Güney Afrikal› maden
mühendisi Daniel G. Krige,
1951 y›l›nda bölgeselleflmifl
de¤iflkenler teorisi ve
variogram fonksiyonunu
temel alan uygulamalar›
alt›n maden yataklar›nda
kullanm›flt›r. 1960 y›l›nda
da Frans›z mühendis
Georges Matheron, D.G
Krige’nin çal›flmas›na sayg›
gere¤i, maden yataklar›n›n
rezerv tahimin için
gelifltirdi¤i yönteme Kriging
yöntemi ad›n› vermifltir.
168
Co¤rafi Bilgi Sistemleri ‹çin Temel ‹statistik
KLAS‹K KONUMSAL TAHM‹N YÖNTEMLER‹
‹statistik yöntemler temelinde gelifltirilen interpolasyon (ara de¤er bulma) yöntemlerinin ortak noktas›, her yöntemin örnek noktalar›n›n konumsal bilgisini kullan›yor olmas›d›r. Konumsal interpolasyon yöntemleriyle de¤iflken de¤eri bilinmeyen
noktalar için tahmin yapabilmede, tamini yap›lacak nokta çevresindeki örnek nokta de¤erlerinin a¤›rl›kland›r›lm›fl do¤rusal bileflenine gereksinim duyulmaktad›r.
Örne¤in, de¤iflken de¤eri bilinmeyen x0 noktas› çevresinde bulunan n adet xi noktas›ndan örneklenen Z (xi) de¤iflken de¤erleri ile Z* (x0) de¤iflken de¤erini afla¤›daki eflitlik yard›m›yla tahmin edebiliriz.
n
Z* ( x0 ) = ∑ Wi .Z ( xi )
i =1
Burada, Z*(x0) : x0 noktas› için tahmin edilen de¤iflken de¤erini,
Z(xi) : xi noktas›ndaki örnek noktas› de¤iflken de¤erini,
Wi : i inci örnek de¤iflken de¤erlerinin a¤›rl›¤›n›,
n : örneklenen nokta say›s›n› ifade etmektedir.
Konumsal olarak örneklenen de¤iflken de¤erlerinin a¤›rl›k de¤erleri (Wi), tahmin için kullan›lan klasik istatististik temelli yönteme göre farkl›l›k göstermektedir.
Afla¤›daki bölümlerde örneklenen de¤iflken de¤erlerini a¤›rl›kland›rmada kullan›lan uzakl›¤›n tersiyle a¤›rl›kland›rma, en yak›n komfluluk ve yüzey trend analizi interpolasyon yöntemleri tan›t›lacakt›r.
Milat’dan önce 330-275
y›llar›nda yaflam›fl olan
‹skenderiyeli (M›s›rl›) bir
matematikçi olan Öklid’in
geometri alan›nda
gelifltirdi¤i aksiyom ve
yöntemler 19. yüzy›l›n
bafllar›na kadar rakipsiz
kalm›flt›r. Elementler isimli
13 ciltlik kitab›nda bafll›ca,
düzlem geometrisi,
aritmetik, say›lar teorisi,
irrasyonel say›lar ve kat›
cisim geometrisi konular›n›
ele alm›flt›r.
En Yak›n Komflu Yöntemi
Genellikle s›n›fland›rma ve kümeleme çal›flmalar›nda kullan›lan en yak›n komflu
yönteminde, örnekleme yap›lmam›fl herhangi bir noktan›n de¤iflken de¤erini tahmin etmede, örnek noktalar› aras›nda en yak›n olan noktan›n de¤iflken de¤eri belirlenerek, tahmin edilecek noktaya atamas› yap›lmaktad›r.
En yak›n komflu yöntemiyle tahminde öncelikle, örnek noktalar› ile tahmin yap›lacak nokta aras›ndaki uzakl›klar›n hesaplanmas› gerekir. Konumsal noktalar
aras› uzakl›klar›n hesaplanmas›nda ise genellikle Öklid yöntemi kullan›lmaktad›r.
Herhangi iki noktan›n konumu iki boyutlu düzlemde veya üç boyutlu uzayda ifade edilmesine göre, noktalar aras› Öklid uzakl›klar› afla¤›daki gibi hesaplan›r.
‹ki boyutta uzakl›k:
‹ki boyutlu bir düzlemde (x1, y1) koordinatlar›nda yer alan P1 noktas› ile (x2,
y2) koordinatlar›nda yer alan P2 noktas› aras›ndaki Öklid uzakl›¤›n› flu flekilde
hesaplar›z.
d ( P1 , P2 ) = ( x1 − x2 )2 + ( y1 − y2 )2
Üç boyutta uzakl›k:
Üç boyutlu uzayda (x1, y1, z1) koordinatlar›nda yer alan P1 noktas› ile (x2,
y2, z2) koordinatlar›nda yer alan P2 noktas› aras›ndaki Öklid uzakl›¤›n› flu flekilde hesaplar›z.
8. Ünite - Konumsal Tahmin (‹nterpolasyon) ve Kriging
169
d ( P1 , P2 ) = ( x1 − x2 )2 + ( y1 − y2 )2 + ( z1 − z2 )2
Örnekleme yap›lmam›fl noktan›n de¤iflken de¤erini en yak›n komfluluk yöntemiyle tahmin etmede, öncelikle örnek noktalar› aras›ndan en küçük d(i, j) uzakl›¤›ndaki örnek noktas› veya k say›da örnek noktalar› belirlenmektedir. Bir komflu
nokta ile tahmin yap›ld›¤› durumda, en yak›n komflu örnek noktas› de¤iflken de¤erleri, örnekleme yap›lmam›fl noktaya atanmakta ve de¤iflken de¤eri tahmin edilmektedir.
Örnekleme yap›lmam›fl SA noktas›na en yak›n k adet komflu Si noktas› de¤iflken de¤erlerinin Z(Si) oldu¤u durumda, uzakl›kla a¤›rl›kland›r›lm›fl ortalama de¤iflken de¤eri Z*(SA) afla¤›daki gibi hesaplan›r.
Birden fazla (k adet) en
yak›n komflu nokta ile
tahmin yap›ld›¤› durumda
ise, en yak›n komflu
noktalar›n uzakl›kla
a¤›rl›kland›r›lm›fl ortalama
de¤iflken de¤eri, örnekleme
yap›lmam›fl noktaya
atanmaktad›r.
k
Z* ( S A ) =
∑ d ( Si , S A ).Z ( Si )
i =1
k
∑ d ( Si , S A )
i =1
En yak›n komflu yöntemi, sadece en yak›n komflu örnek noktas› veya noktalar›n›n de¤iflken de¤eri ile tahmin yapmakta ve daha uzak noktalardaki di¤er noktalar› dikkate almamaktad›r. Tahminlerde kullan›lacak komflu noktalar›n say›s›n›n
(k) kaç adet olaca¤› belirsizdir. Ayr›ca, örnek noktalar› aras›ndaki ba¤›ml›l›¤›, devaml›l›¤› ve yönsel süreklili¤i dikkate almayan bir yöntemdir. En yak›n komflu yöntemi genellikle blok modellemede örnek noktas› olmayan bloklara de¤iflken de¤eri atamada kullan›lmaktad›r.
Bir kent merkezinde 5 ayr› istasyonda Ocak ay›nda ölçülen kükürt dioksit (mg
/m3) miktarlar› afla¤›daki çizelgedeki gibidir. En yak›n komflu yöntemine göre
kent merkezinde (X=4150 , Y=2350) koordinatlar›nda bulunan hastane (SH) civar›nda kükürt dioksit miktar› ne olabilir?
‹stasyon No
Si
(X)
(Y)
Z(Si)
SO2 (µg / m3)
1
4075
2345
50
2
4160
2370
15
3
4200
2340
65
4
4180
2325
30
5
4150
2310
70
Konumsal Koordinatlar (m)
ÖRNEK
170
Co¤rafi Bilgi Sistemleri ‹çin Temel ‹statistik
Çözüm:
Hava kirlili¤inin ölçüldü¤ü (S1) istasyonu ile hastane (SH) aras› öklid uzakl›¤›n›
afla¤›daki gibi hesaplar›z.
d ( S1 , S H ) = ( x1 − x H )2 + ( y1 − y H )2
= ( 4075 − 4150 )2 + ( 2345 − 2350 )2 = 75,2
Di¤er istasyonlar ile hastane aras› uzakl›klar afla¤›daki çizelgedeki gibi hesaplan›r.
‹stasyon No
Si
(X)
(Y)
H Noktas›na
Uzakl›k (m)
d(Si , SH)
1
4075
2345
75,2
2
4160
2370
22,4
3
4200
2340
51,0
4
4180
2325
39,1
5
4150
2310
40,0
Konumsal Koordinatlar (m)
Çizelgeden de görüldü¤ü gibi, SH hastane noktas›na en yak›n komflu nokta S2
noktas›d›r. Bu durumda SH noktas›n›n kükürt dioksit oran›n›n 15 µg /m3 olarak
tahmin ederiz.
En yak›n iki komflu nokta (k=2) ile tahmin yapmak istersek, noktalar aras›
uzakl›klarla a¤›rl›kland›r›lm›fl tahmini de¤iflken de¤erini afla¤›daki gibi hesaplar›z.
k
Z* ( S H ) =
∑ d ( Si , S H ).Z ( Si )
i=1
k
∑ d ( Si , S H )
i =1
=
( 39,1* 30
0 ) + ( 22 , 4 * 15 )
= 24,5 µg / m3
( 39,1 + 22, 4 )
171
8. Ünite - Konumsal Tahmin (‹nterpolasyon) ve Kriging
Bir tar›msal araflt›rma merkezi taraf›ndan bir bölgede ekmeklik bu¤day
bitki boylar›n›
SIRA S‹ZDE
araflt›rmak üzere yap›lan çal›flmada, 5 ayr› tarladan al›nan örneklerin ortalama bitki boylar›n›n afla¤›daki çizelgedeki gibi oldu¤u belirlenmifltir. Tarlalar›n yaklafl›k orta noktas›D Ü fi Ü N E L ‹ M
na karfl›l›k gelen noktalar›n koordinatlar› da çizelgede verilmifltir. Ölçüm yap›lamayan A
tarlas›n›n konumu X=6400 ve Y=4600 oldu¤una göre, A tarlas›n›n ortalama bitki boyunun
S O R U
ne olabilece¤ini en yak›n 2 komflu noktay› dikkate alarak tahmin ediniz.
Tarla No
Si
Konumsal Koordinatlar (m)
1
D Ü fi Ü N E L ‹ M
S O R U
Z(Si)
D‹KKAT
D ‹ K K Bitki
A T Boyu
(X)
(Y)
1
6100
4700
SIRA S‹ZDE76
2
6400
4800
85
3
6900
4750
107
AMAÇLARIMIZ
4
6600
4500
102
5
6300
4250
SIRA S‹ZDE
(mm)
N N
K ‹ T A P
94
SIRA S‹ZDE
AMAÇLARIMIZ
K ‹ T A P
Yüzey Trend Analizi
Yüzey trend analizi yönteminde öncelikle, örnek noktalar›n›n
T E Lde¤iflken
E V ‹ Z Y O N de¤erleri
ile iki boyutlu veya (xi , yi) üç boyutlu (xi , yi , zi) konumsal koordinatlar› dikkate
al›narak, en küçük kareler yöntemiyle p’inci dereceden polinom denklemi elde
edilmektedir. Elde edilen denklem yard›m›yla da, de¤iflken de¤eri bilinmeyen
‹ N T E R N Egenellikle
T
noktalar için tahminler yap›lmaktad›r. Yüzey trend analiz yöntemi,
topo¤rafik yüzeylerin düzenli grid (kare) a¤lar fleklinde modellenmesinde kullan›lan
bir yöntemdir.
Yüzey trend analizinde, her bir örnek noktas› polinom denkleminin elde edilmesinde kullan›lmaktad›r. En küçük kareler yöntemiyle polinom denklemi elde
edilirken, polinom katsay›lar›n› da anlaml›l›k aç›s›ndan test etmek gerekir. Sonuç
olarak da, en küçük hata ile tahminlerde kullanabilece¤imiz polinom denklemine
ulaflmak gerekir.
De¤iflken de¤eri bilinmeyen (x, y) noktas› için yap›lacak tahminde kullan›labilecek en basit do¤rusal ve ikinci dereceden polinom denklemi afla¤›daki gibi ifade edilebilir.
Basit do¤rusal model: Z* ( x , y ) = β0 + β1 x + β2 y
‹kinci dereceden polinom: Z* ( x , y ) = β0 + β1 x + β2 y + β3 x 2 + β4 x 2 + β5 xy
Yüzey trend analizi yöntemiyle, örnek al›nmam›fl konumsal noktalara polinom
denklemi yard›m›yla ortalama bir tahmin yap›ld›¤›ndan, afl›r› düflük veya yüksek
de¤iflken de¤erlerinin tahmininde afl›r› yan›lt›c› sonuçlar verebilmektedir. Tahminlerin güvenilirli¤ini artt›rmak için yüksek dereceli polinomlar elde etmek gerekir.
Ancak, polinom derecesini artt›rd›kça, en küçük kareler yöntemiyle elde edilecek
normal denklemlerin say›s› da artar ve denklem parametrelerinin elde edilmesinde güçlükler ortaya ç›kabilir.
Yüzey trend analiz yöntemi,
TELEV‹ZYON
maden ve petrol arama
çal›flmalar› ile çevre
araflt›rmalar›nda efl yükselti
veya efl de¤iflken de¤eri
haritalama çal›flmalar›nda
‹NTERNET
yayg›n bir flekilde
kullan›lmaktad›r.
172
Co¤rafi Bilgi Sistemleri ‹çin Temel ‹statistik
Uzakl›¤›n Tersi ‹le A¤›rl›kland›rma Yöntemi
Uzakl›¤›n tersi ile a¤›rl›kland›rma, yak›n noktalara uzak noktalardan daha yüksek
a¤›rl›k de¤eri atayan ve tüm mümkün örnek noktalar›n› dikkate alan bir tahmin
(interpolasyon) yöntemidir. Her örnek noktas›, de¤eri tahmin edilecek noktaya
olan uzakl›¤›na göre ters oranda a¤›rl›k de¤eri al›r. x0 noktas›ndaki tahmini de¤er
afla¤›daki flekilde hesaplan›r.
Z* ( x0 ) = ∑ Wi .Z ( xi )
1
Wi =
dip ( xi
n
∑
)
1
p
i =1 di ( xi
Eflitlikteki p de¤eri
azald›kça, örnek noktalar›na
atanan a¤›rl›k de¤erleri
birbirine yaklafl›r, artt›kça
de¤erler farkl›lafl›r. En
yüksek a¤›rl›k de¤eri en
yak›n örnek noktas› için
atan›r. Genellikle p de¤eri 1
veya 2 olarak
kullan›lmaktad›r.
)
Burada; Z*(x0) : x0 noktas›ndaki tahminin de¤erini,
Z(xi) : xi noktas›ndaki örnek noktas›n›n de¤erini,
Wi : xi noktas›ndaki örne¤in x0 noktas›na göre ters uzakl›k a¤›rl›¤›n›,
d : örnek noktas› ile tahmini yap›lacak nokta aras›ndaki uzakl›¤›,
p : üssel de¤eri,
n : örnek nokta say›s›n› ifade etmektedir.
Uzakl›¤›n tersi ile a¤›rl›kland›rma yönteminde tahmin de¤erlerini önemli ölçüde etkileyen, eflitlikte tan›mlanmayan parametreler bulunmaktad›r. Bu parametrelerin en önemlilerinden biri “etki mesafesi”dir. Etki mesafesi, belirli uzakl›ktaki
gözlem de¤erlerinin hesaplamada kullan›labilece¤ini ifade eder. Etki mesafesinden daha uzakta olan noktalar hesaplamalara dahil edilmez. Bu parametrelerin bir
di¤eri “hariç tutma aç›s›”d›r. Bu parametre sayesinde hariç tutma aç›s›n›n süpürdü¤ü alanda bulunan gözlem de¤erlerinin sadece en yak›nda olan› hesaplamaya
dahil edilmektedir. Böylece tek yönde ortaya ç›kacak fazla a¤›rl›k de¤erinin meydana getirece¤i yan›lt›c› sonuçlardan kaç›n›lm›fl olacakt›r (Uyguçgil, 2007).
ÖRNEK
Bir gümüfl madeni yata¤›ndan al›nan 5 adet örnek ile A noktas›n›n tenörü (metal
olarak gümüfl içeri¤i) uzakl›¤›n tersiyle a¤›rl›kland›rma yöntemiyle tahmin edilmek istenmektedir. Örnek noktalar›n›n konumsal koordinatlar› ve örneklenen de¤iflken de¤erleri (tenör de¤erleri) afla¤›da çizelgede verildi¤i gibidir. Örnek noktalar›n›n ve de¤iflken de¤eri tahmin edilecek A noktas›n›n konumlar› da afla¤›daki
flekilde verilmifltir.
Konumsal Koordinatlar (m)
Örnek No
Si
(X)
(Y)
Tenörler Z(Si)
(gr/ton Ag)
A
4150
2340
-
1
4080
2340
320
2
4160
2370
450
3
4200
2340
380
4
4170
2332
400
5
4150
2310
280
8. Ünite - Konumsal Tahmin (‹nterpolasyon) ve Kriging
Çözüm:
Örnek noktalar›n›n de¤iflken de¤eri tahmin edilecek blok merkezinde bulunan
A noktas›na olan uzakl›klar›, uzakl›klar›n tersleri ve uzakl›k tersleri toplam›na göre a¤›rl›klar› afla¤›da verildi¤i gibi hesaplanm›flt›r.
Örnek No
Si
A Noktas›ndan
Uzakl›k (m)
Ters
Uzakl›k (1/m)
A¤›rl›klar Wi
1
70,00
0,0143
0,098
2
31,62
0,0316
0,217
3
50,00
0,0200
0,137
4
21,54
0,0464
0,319
5
30,00
0,0333
0,229
0,1457
1,000
Toplam
A noktas›ndan uzakl›klar› Öklid yöntemiyle hesaplar›z. Örne¤in, 1 nolu nokta
ile A noktas› aras› uzakl›k afla¤›daki gibi hesaplar›z.
d ( S1 , S A ) = ( x1 − x A )2 + ( y1 − y A )2
d ( S1 , S A ) = ( 4080 − 4150 )2 + ( 2340 − 2340 )2 = 70 ,00 m
Üs de¤erini p=1 alarak ters uzakl›klar›;
1
1
=
= 0,0143
d ( S1 , S A ) 70
ifllemi ile hesaplar›z. Ters uzakl›klar›n toplam›
dan, S1 noktas›n›n a¤›rl›¤›n›;
1
∑ d( S ,S
i
A
)
= 0,1457 oldu¤un-
173
174
Co¤rafi Bilgi Sistemleri ‹çin Temel ‹statistik
1
d ( S1 , S A )
0,0143
=
= 0,098
W1 =
1
0 ,1457
∑ d( S ,S )
i A
ifllemi ile hesaplar›z.
Blok merkezi olan SA noktas›n›n tahmini tenörünü (Z*) afla¤›daki gibi hesaplar›z.
Z* (SA ) = W1.Z(S1 ) + W2 .Z(S2 ) + W3 .Z(S3 ) + W4 .Z(S4 ) + W5 .Z(S5 )
Z* (SA ) = ( 0 ,098 * 320) + (0, 217 * 450) + ( 0 ,137 * 380) + (0,319 * 400)
+(0, 229 * 280)
*
Z (SA ) = 372,8 gr / ton Ag
SIRA S‹ZDE
2
D Ü fi Ü N E L ‹ M
Organik tar›m
SIRAyap›lmak
S‹ZDE istenen bir arazide, afla¤›da konumsal koordinatlar› verilen 4
noktadan toprak örnekleri al›nm›fl ve pH analizleri yap›lm›flt›r. Örnek al›namayan A noktas›n›n pH de¤erini uzakl›¤›n tersiyle a¤›rl›kland›rma yöntemiyle tahmin ediniz.
D Ü fi Ü N E L ‹ M
Örnek No
Si S O R U
S O R U
D‹KKAT
SIRA S‹ZDE
AMAÇLARIMIZ
N N
Konumsal Koordinatlar (m)
Z(Si)
(pH)
(X)
(Y)
A
5400
3600
-
1 D‹KKAT
5100
3450
4,8
2
5200
3750
5,9
5650
3725
6,4
5550
3500
5,7
3
SIRA S‹ZDE
4
AMAÇLARIMIZ
KR‹G‹NG TAHM‹N YÖNTEM‹
Kriging
a¤›rl›k
K ‹ Työntemiyle
A P
katsay›lar›n›n hesaplama
yöntemi, uzakl›¤›n tersi ile
a¤›rl›kland›rma yöntemine
Tk›yasla
E L E Vdaha
‹ Z Y Okarmafl›kt›r.
N
Uzakl›¤›n tersi ile
a¤›rl›kland›rma yönteminde
uzakl›¤a ba¤l› basit
algoritmalar kullan›l›rken,
kriging yönteminde verinin
‹ N T E R Nyap›s›n›
E T ele alan
konumsal
semivariogram modelleri
kullan›lmaktad›r.
Kriging yöntemi,
K ‹ T Abir
P noktan›n veya blo¤un de¤iflken de¤erini, noktan›n veya blo¤un kendi içindeki ve çevresindeki örnek de¤erleri setinin do¤rusal kombinasyonu olarak tahmin etmede kullan›lan tekniktir (Konuk ve Önder, 1999). Kriging
yöntemi, do¤rusal
T E L E V ‹ Z Y Ove
N sistematik sapmas› olmayan (yans›z) en iyi tahminleyici olarak tan›mlanmaktad›r. Bir noktan›n veya blo¤un de¤iflken de¤erini en küçük hata
ile tahmin etmeye çal›flan bir yöntem olarak bilinmektedir.
Kriging yönteminin amac›, de¤iflken de¤eri bilinmeyen bir nokta veya blok
‹ N Tve
E R Niçindeki
ET
çevresindeki
örnek de¤erlerinin a¤›rl›k katsay›lar›n›, semi-variogram
model parametreleri yard›m›yla hesaplayarak, tahmin varyans›n› en küçükleyecek
flekilde de¤iflken de¤erini tahmin etmektir. Bir nokta veya blo¤un tahmini de¤iflken de¤eri, örneklenen gözlem de¤erlerinin konumsal düzenine ve veri yap›s›n›
inceleyen semi-variogram fonksiyonuna dayanmaktad›r.
Kriging yönteminin klasik konumsal tahmin yöntemlerine göre en önemli üstünlükleri;
• Tahminde kullan›lan örneklerin etki alan›n› ve yönsel de¤iflimini dikkate almas›,
• ‹ki veya üç boyutlu blok de¤iflken de¤erlerinin tahmininde, blok boyutlar›n› dikkate almas›,
8. Ünite - Konumsal Tahmin (‹nterpolasyon) ve Kriging
175
• Blok de¤iflken de¤erleri tahmin edilirken, her bir blo¤un tahmin hatas›n›n
belirlenmesine olanak sa¤lamas›,
• Di¤er yöntemlere göre tahminlerin varyans›n› en küçüklemesidir.
Kriging yönteminde, de¤iflken de¤eri bilinmeyen belirli bir nokta, alan veya hacimsel blok için tahminler yap›labilmektedir. Afla¤›da, anlafl›l›rl›¤›n›n kolay olmas›
nedeniyle, belirli bir noktan›n bilinmeyen de¤iflken de¤erinin kriging yöntemiyle
tahmini tan›t›lacakt›r.
Nokta Kriging
De¤iflken de¤eri bilinmeyen bir nokta için kriging yöntemiyle tahmin yapabilmek
için öncelikle örnek noktalar› dikkate al›narak semi-variogram parametrelerinin
belirlenmifl olmas› gerekir. Daha sonra, de¤eri bilinmeyen nokta etraf›ndaki komflu örnek noktalar›ndan hangilerinin tahminde kullan›laca¤›n› belirlemek gerekir.
Bunun için de¤eri bilinmeyen nokta etraf›nda, bir arama kapsama alan› belirlenir.
Bu kapsama alan›, semi-variogram modelinin etki mesafesine (a) eflit olmal›d›r. Etki mesafesi tüm yönlerde ayn› de¤ere sahipse (izotropik durum varsa), etki mesafesi yar›çapl› dairesel bir alan, kapsama alan› olur. Ancak, etki mesafesinin yönsel
de¤iflimi (anizotropik de¤iflim) sözkonusu ise, etki mesafesinin büyük ve küçük
oldu¤u yönlere göre belirlenecek elipsoidal bir kapsama alan› olacakt›r.
De¤iflken de¤eri tahmin edilecek nokta için arama kapsama alan›ndaki örnek
noktalar›n›n belirlenmesinden sonra, tahmin edilecek nokta ile örnek noktalar›
aras› ortalama semi-variogram de¤erleri dikkate al›narak her bir noktan›n a¤›rl›k
katasay›lar› hesaplan›r. Arama kapsama alan›ndaki örnek noktalar›n›n a¤›rl›klar›
kullan›larak da, noktasal de¤iflken de¤eri tahmin edilir.
De¤iflken de¤eri ( Z*A ) bilinmeyen A noktas›n›n çevresinde arama kapsama
alan› içinde bulunan n adet komflu örnek noktalar›n›n (Si) de¤iflken de¤erleri
(Z(Si)) ve örnek noktalar›n a¤›rl›k katsay›lar› (Wi) yard›m›yla, A noktas›n›n de¤iflken de¤eri;
n
Z*A = ∑ Wi .Z(Si )
i=1
eflitli¤i ile hesaplan›r.
Tahmin varyans›n› en küçükleyen katsay›lar›n toplam›, yans›zl›k koflulunu sa¤lamak amac›yla daima bire eflit olmal›d›r.
n
∑ Wi = 1
i=1
Tahminlerin varyans›, semi-variogram fonksiyonlar›na ba¤l› olarak afla¤›daki
gibi hesaplanabilir.
n
n
n
σe2 = 2∑ Wi . γ (Si , A) − ∑ ∑ Wi .Wj . γ (Si ,S j )
i=1
i=1 j=1
2
Burada, σe = tahmin varyans›
γ(Si , v) = A noktas› ile Si örnekleri aras› ortalama semi-variogram,
Arama kapsama alan›
içerisindeki örnek nokta
say›s›n›n 15 veya 16 olmas›
ideal bir durumdur. Bu alan
içindeki örnek nokta say›s›
4’ün alt›nda olursa, kriging
yöntemiyle yap›lacak
tahminler yan›lt›c› sonuçlar
verebilmektedir (Tüysüz ve
Yaylal›, 2005).
176
Co¤rafi Bilgi Sistemleri ‹çin Temel ‹statistik
γ(Si ,S j ) = Si örne¤indeki bir nokta ile Sj örne¤indeki di¤er bir nokta çiftleri aras›ndaki ortalama semi-variogramd›r.
Tahmin varyans›n›n büyüklü¤ü, afla¤›daki hususlara ba¤l› olarak de¤iflir:
a) Semi-variogramla aç›klanan bölgeselleflmifl de¤iflkenin karakteristi¤ine,
b) Tahmin için kullan›lan toplam örnek say›s›na,
c) De¤iflken de¤eri tahmin edilen nokta çevresindeki birbirleriyle ilgili örneklerin birbirlerine göre konumuna,
d) Her bir örne¤e atanan a¤›rl›¤a,
Tahmin varyans›, onun a¤›rl›¤›na göre diferansiyelinin al›nmas›yla minimize
edilebilir ve diferansiyeli s›f›ra eflittir.
∂σe2
∂Wi
= 0 ................. i = 1, 2, .............. n
Bu diferansiyel, n eflitlik ve n bilinmeyen (W1,W2, .... Wn) sa¤layacakt›r. Burada bulunacak olan a¤›rl›klar toplam›n›
n
∑ Wi = 1
ile s›n›rland›rmak için, di¤er bir
i=1
bilinmeyen olarak Lagrangian çarpan› (λ) eflitlik sistemini dengeleyici bir unsur
olarak ifllemlere dahil edilir. Bu durumda, n+1 eflitlik ve n+1 bilinmeyen ortaya ç›kar ve W1,W2, .... Wn ile λ saptanabilir (Konuk ve Önder, 1999).
Kriging yöntemiyle Si örnek noktalar›n›n a¤›rl›klar›n›n hesaplanmas› için, afla¤›daki eflitlik sisteminin çözümü gereklidir.
n
∑ Wj.γ(Si ,S j ) + λ = γ(Si , A)
j=1
n
∑ Wi = 1
i=1
Burada, Wj = bilinmeyen a¤›rl›klar ve λ = Lagrangian çarpan›d›r.
Bu eflitlik setinin çözümü, en iyi do¤rusal ve yans›z tahminciyi veren a¤›rl›klar
setini üretecektir. Bu a¤›rl›klara ve Lagrangian çarpan›na ba¤l› olarak da kriging
varyans›,
n
σ 2k = ∑ Wi .γ(Si , A) + λ
i=1
eflitli¤i ile hesaplanabilir. Bu kriging varyans›, en küçük tahmin varyans›n› göstermektedir.
Kriging yönteminin, tahmin varyans›n› en küçükleyen ve en iyi do¤rusal ve
yans›z tahminciyi (a¤›rl›klar›) veren bir yöntem oldu¤u, afla¤›daki örnekte uygulamal› olarak ispatlanmaya çal›fl›lacakt›r. Burada, öncelikle uzakl›¤›n tersiyle a¤›rl›kland›rarak tahmin, daha sonra ise kriging ile tahmin yöntemleri ele al›nacakt›r.
8. Ünite - Konumsal Tahmin (‹nterpolasyon) ve Kriging
Bir gümüfl madeni yata¤›ndan al›nan sondaj örnek tenör (% Metal Gümüfl-Ag) verileri ile yap›lan variorgram analizleri sonras›nda, hesaplanan deneysel semi variogarm de¤erlerinin küresel modele uydu¤u ve model parametrelerinin afla¤›daki
gibi oldu¤u belirlenmifltir.
Külçe etkisi : C0= 100 (gr/ton)2 Ag
Eflik de¤er : C = 700 (gr/ton)2 Ag
Etki mesafesi : a= 100 m
Maden yata¤›nda A noktas›nda tenör de¤eri bilinmemekte olup, etki mesfesi
içerisinde A noktas›na komflu iki adet sondaj (örnek) noktas› bulunmaktad›r. A
noktas› ile sondaj noktalar› (S1 ve S2) noktalar› aras› uzakl›klar ve sondaj noktalar›ndan al›nan örneklerin tenör de¤erleri (gr/ton Ag) afla¤›daki çizelgelerde verildi¤i gibidir.
Noktalar
Noktalar Aras› Uzakl›k (m)
S1 ile A
20
S2 ile A
30
S1 ile S2
36
Sondaj N. No Si
Tenörler Z(Si) (gr/ton Ag)
1
400
2
500
a) Uzakl›¤›n tersiyle a¤›rl›kland›rma yöntemiyle A noktas›n›n tenör de¤erini
tahmin ediniz.
b) Kriging yöntemiyle A noktas›n›n tenör de¤erini tahmin ederek, tahminin kriging varyans›n› bulunuz.
Çözüm:
a) Uzakl›¤›n tersiyle a¤›rl›kland›rma yöntemiyle tahmin:
Örnek noktalar›n›n de¤iflken de¤eri tahmin edilecek A noktas›na olan uzakl›klar›, uzakl›klar›n tersleri ve uzakl›k tersleri toplam›na göre a¤›rl›klar› afla¤›da verildi¤i gibi hesaplanm›flt›r.
Örnek No
Si
A
Noktas›ndan Uzakl›k (m)
Ters
Uzakl›k (1/m)
A¤›rl›klar Wi
1
20
0,0500
0,6
2
30
Toplam
0,0333
0,4
0,0833
1,000
De¤iflken de¤eri bilinmeyen A noktas›n›n tahmini tenörünü ( Z*A ) afla¤›daki gibi hesaplar›z.
n
Z*A = ∑ Wi .Z ( Si )
i =1
177
ÖRNEK
178
Co¤rafi Bilgi Sistemleri ‹çin Temel ‹statistik
Z*A = W1.Z(S1 ) + W2 .Z(S2 )
Z*A = ( 0 ,6 * 400) + (0, 400 * 500)
Z*A = 440 gr / ton Ag
b) Kriging yöntemiyle tahmin :
Kriging yöntemiyle Si örnek noktalar›n›n a¤›rl›klar›n›n hesaplanmas› için, afla¤›daki eflitlik sistemini kullan›r›z.
n
∑ Wj.γ(Si ,S j ) + λ = γ(Si , A)
j=1
n
∑ Wi = 1
i=1
‹ki örnek noktam›z (S1 ve S2) oldu¤undan, afla¤›daki üç adet kriging eflitli¤i
sözkonusudur.
W1 .γ( S1 , S1 ) + W2 .γ( S1 , S2 ) + λ = γ( S1 , A )
W1 .γ( S2 , S1 ) + W2 .γ( S2 , S2 ) + λ = γ( S2 , A )
W1
+ W2
=1
Burada, γ( S1 , S1 ) ve γ( S2 , S2 ) : S1 ve S2 örnek noktalar›n›n kendi içindeki ortalama semi-variogram›,
γ( S1 , S2 ) ve γ( S2 , S1 ) : S1 ve S2 noktalar› aras›ndaki ortalama semi-variogram›,
γ( S1 , A ) ve γ( S2 , A ) : A noktas› ile S1 ve S2 noktalar› aras›ndaki ortalama semivariogram› ifade etmektedir.
Örnek noktalar›n›n kendi içinde herhangi bir mesafe söz konusu olmad›¤›ndan; γ( S1 , S1 ) = 0 ve γ( S2 , S2 ) = 0 olur.
Örnek noktalar› aras› ve örnek noktalar› ile A noktas› aras› ortalama semi-variogramlar› afla¤›daki gibi hesaplar›z.
Külçe etkili küresel model;
 3.h
h3 
γ( Si , S j ) = C0 + C . 
−

 2.a 2.a3 
olup, burada h : Si ve Sj noktalar› aras› uzakl›kt›r.
Külçe etkisi C0=100 (gr/ton)2 Ag, eflik de¤er C=700 (gr/ton)2 Ag ve etki mesafesi a=100 m olarak verilmiflti.
S1 ve S2 noktalar› aras› uzakl›k h=36 m oldu¤undan, S1 ve S2 noktalar› aras› ortalama semi-variogram;
8. Ünite - Konumsal Tahmin (‹nterpolasyon) ve Kriging
 3* 36
( 36 )3 
2
γ( S1 , S2 ) = 100 + 700. 
−
 = 461,67 (gr / ton) Ag
 2 * 100 2 * ( 100 )3 
S1 ve A noktas› aras› uzakl›k h=20 m oldu¤undan, S1 ve SA noktalar› aras› ortalama semi-variogram;
 3* 20
( 20 )3 
2
γ( S1 , A ) = 100 + 700. 
−
 = 307 , 20 (gr/ton) Ag
 2 * 100 2 * ( 100 )3 
S2 ve A noktas› aras› uzakl›k h=30 m oldu¤undan, S2 ve SA noktalar› aras› ortalama semi-variogram;
 3* 30
( 30 )3 
2
γ( S2 , A ) = 100 + 700. 
−
 = 405,55 (gr/ton) Ag
3
2
*
100

2 * ( 100 ) 
‹ki örnek noktas› ile A noktas› de¤iflken de¤erini tahmin için kullanaca¤›m›z
a¤›rl›k katsay›lar›n› hesaplamak için;
W1 .γ( S1 , S1 ) + W2 .γ( S1 , S2 ) + λ = γ( S1 , A )
W1 .γ( S2 , S1 ) + W2 .γ( S2 , S2 ) + λ = γ( S2 , A )
+ W2
W1
=1
Kriging eflitlik sistemini elde etmifltik. Bu eflitlik sisteminin bilinenlerini yerine
yazarsak;
( W1 * 0 ) + ( W2 * 461,67 ) + λ = 307 , 20
( W1 * 461,67 ) + ( W2 * 0 ) + λ = 405,55
+ W2
W1
=1
üç bilinmeyenli (W1 , W2 ve λ) ve üç adet eflitlik elde ederiz. Bu eflitlik sistemini, W1 =1–W2 yazarak çözdü¤ümüzde, bilinmeyenleri;
λ = 125,54
W1 = 0,6065
W2 = 0,3935
olarak hesaplar›z.
Hesaplanan a¤›rl›k katsay›lar›n› kullanarak, de¤iflken de¤eri bilinmeyen A noktas›n›n tahmini tenörünü ( Z*A ) afla¤›daki gibi hesaplar›z.
n
Z*A = ∑ Wi .Z ( Si )
i =1
Z*A = W1.Z(S1 ) + W2 .Z(S2 )
179
180
Co¤rafi Bilgi Sistemleri ‹çin Temel ‹statistik
Z*A = ( 0 ,6065* 400) + (0,3935 * 500)
Z*A = 439 ,35 gr / ton Ag
Uzakl›¤›n tersiyle
a¤›rl›kland›rma yönteminde
de¤iflken de¤eri bilinmeyen
bir nokta için yap›lan
tahminin varyans›
belirlenemezken, kriging
yönteminde
belirlenebilmektedir.
Kriging yöntemiyle yap›lan tahminin varyans›n›, afla¤›daki eflitlikle bulabiliriz.
n
σ 2k = ∑ Wi .γ(Si , A) + λ
i=1
σ 2k = (0, 6065 * 307, 20) + (0, 3935 * 405, 55) + 125, 54
σ 2k = 470, 54 ( gr / ton )2 Ag
SIRA S‹ZDE
D Ü fi Ü N E L ‹ M
S O R U
D‹KKAT
SIRA S‹ZDE
AMAÇLARIMIZ
K ‹ T A P
TELEV‹ZYON
‹NTERNET
ÖRNEK
3
Bir kent merkezine
kullanma suyu sa¤layan akarsu yata¤›n›n de¤iflik noktalar›ndan al›nan
SIRA S‹ZDE
örneklerin kurflun içeri¤i de¤iflmleri için yap›lan variorgram analizleri sonras›nda, hesaplanan deneysel semi variogram de¤erlerinin küresel modele uydu¤u ve model parametreD Ü fi Ü N E L ‹ M
lerinin afla¤›daki
gibi oldu¤u belirlenmifltir.
Eflik de¤er
: C= 20 (ppm)2 Pb
S O R U
Etki mesafesi : a= 50 m
Akarsu yata¤›nda A noktas›nda bulunan bir sanayi tesisinin akarsuya ne kadar kurflun deD‹KKAT
flarj etti¤i tahmin edilmek istenmektedir. Etki mesafesi içerisinde A noktas›na komflu iki
adet örnek noktas› bulunmaktad›r. A noktas› ile örnek noktalar› (S1 ve S2) aras› uzakl›kS‹ZDE
lar ve örnekSIRA
noktalar›ndan
elde edilen verilerin kurflun içerikleri (ppm Pb) afla¤›daki çizelgelerde verildi¤i gibidir. Kriging yöntemiyle A noktas›n›n kurflun içeri¤ini tahmin ederek, tahminin kriging varyans›n› bulunuz.
N N
AMAÇLARIMIZ
Noktalar
Noktalar Aras› Uzakl›k (m)
S ile A
10
S2 ile A
40
S1 ile S2
50
Örnek N. No Si
Kurflun ‹çeri¤i Z(Si) (ppm Pb)
K ‹ T A 1P
TELEV‹ZYON
‹NTERNET 1
5
2
2
Bir sanayi sitesi sahas›nda yap›lan gürültü ölçümleri sonucunda, al›nan örnekler ile yap›lan variorgram analizleri sonras›nda hesaplanan deneysel semi variogram de¤erlerinin do¤rusal modele uydu¤u ve modelin afla¤›daki gibi oldu¤u
belirlenmifltir.
γ(h) = 140.h−0, 2
Sanayi sitesi sahas›nda A noktas›nda gürültü ölçümü yap›lamad›¤›ndan, bu
noktan›n gürültü seviyesi tahmin edilmek istenmektedir. A noktas›na komflu iki
adet örnek noktas›nda ölçüm yap›lm›fl olup, A noktas› ile örnek noktalar› (S1 ve
8. Ünite - Konumsal Tahmin (‹nterpolasyon) ve Kriging
S2) noktalar› aras› uzakl›klar ve örnek noktalar›nda ölçülen gürültü seviyeleri (dBDesibel) afla¤›daki çizelgelerde verildi¤i gibidir. Kriging yöntemiyle A noktas›n›n
gürültü seviyesini tahmin ederek, tahminin kriging varyans›n› bulunuz.
Noktalar
Noktalar Aras› Uzakl›k (m)
S1 ile A
25
S2 ile A
75
S1 ile S2
100
Örnek N. No Si
Gürültü Z(Si) (dB)
1
50
2
80
Çözüm:
‹ki örnek noktam›z (S1 ve S2) oldu¤undan, afla¤›daki üç adet kriging eflitli¤i
sözkonusudur.
W1 .γ( S1 , S1 ) + W2 .γ( S1 , S2 ) + λ = γ( S1 , A )
W1 .γ( S2 , S1 ) + W2 .γ( S2 , S2 ) + λ = γ( S2 , A )
W1
+ W2
=1
Örnek noktalar›n›n kendi içinde herhangi bir mesafe söz konusu olmad›¤›ndan; γ( S1 , S1 ) = 0 ve γ( S2 , S2 ) = 0 olur.
Örnek noktalar› aras› ve örnek noktalar› ile A noktas› aras› ortalama semi-variogramlar› afla¤›daki gibi hesaplar›z.
Do¤rusal model;
γ(h) = 140.h−0 ,2
olup, burada h : Si ve Sj noktalar› aras› uzakl›kt›r.
S1 ve S2 noktalar› aras› uzakl›k h=100 m oldu¤undan, S1 ve S2 noktalar› aras›
ortalama semi-variogram;
γ(h) = 140.h−0 ,2
γ( S1 , S2 ) = 140 * ( 100 )−0 ,2 = 55,7 (db)2
S1 ve A noktas› aras› uzakl›k h=25 m oldu¤undan, S1 ve SA noktalar› aras› ortalama semi-variogram;
γ( S1 , A ) = 140 * ( 25 )−0 ,2 = 73,5 (dB)2
S2 ve A noktas› aras› uzakl›k h=75 m oldu¤undan, S2 ve SA noktalar› aras› ortalama semi-variogram;
181
182
Co¤rafi Bilgi Sistemleri ‹çin Temel ‹statistik
γ( S2 , A ) = 140 * ( 75 )−0 ,2 = 59 ,0 (dB)2
‹ki örnek noktas› ile A noktas› de¤iflken de¤erini tahmin için kullanaca¤›m›z
a¤›rl›k katsay›lar›n› hesaplamak için;
W1 .γ( S1 , S1 ) + W2 .γ( S1 , S2 ) + λ = γ( S1 , A )
W1 .γ( S2 , S1 ) + W2 .γ( S2 , S2 ) + λ = γ( S2 , A )
+ W2
W1
=1
Kriging eflitlik sistemini elde etmifltik. Bu eflitlik sisteminin bilinenlerini yerine
yazarsak;
( W1 * 0 ) + ( W2 * 55,7 ) + λ = 73,5
( W1 * 55,7 ) + ( W2 * 0 ) + λ = 59,0
+ W2
W1
=1
üç bilinmeyenli (W1, W2 ve λ) ve üç adet eflitlik elde ederiz. Bu eflitlik sistemini,
W1 = 1–W2 yazarak çözdü¤ümüzde, bilinmeyenleri;
λ = 38,4
W1 = 0,37
W2 = 0,63
olarak hesaplar›z.
Hesaplanan a¤›rl›k katsay›lar›n› kullanarak, de¤iflken de¤eri bilinmeyen A noktas›n›n tahmini kurflun içeri¤ini ( Z*A ) afla¤›daki gibi hesaplar›z.
n
Z*A = ∑ Wi .Z ( Si )
i =1
Z*A
Z*A
Z*A
= W1.Z(S1 ) + W2 .Z(S2 )
= ( 0 ,37 * 50) + (0,63* 80)
= 68,9 dB
Kriging yöntemiyle yap›lan tahminin varyans›n›, afla¤›daki eflitlikle bulabiliriz.
n
σ 2k = ∑ Wi .γ(Si , A) + λ
i=1
σ 2k
= ( 0,37 * 73,5 ) + ( 0 ,63* 59 ,0 ) + 38,4 = 102,765 (dB)2
183
8. Ünite - Konumsal Tahmin (‹nterpolasyon) ve Kriging
S‹ZDE variorgram
Bir sodyum sülfat tuzu kristallefltirme havuzundan al›nan örnekler SIRA
ile yap›lan
analizleri sonras›nda hesaplanan deneysel semi variogram de¤erlerinin do¤rusal modele
uydu¤u ve modelin γ(h) = 0,001.h1,65 oldu¤u belirlenmifltir. Havuzun A noktas›ndan örD Ü fi Ü N E L ‹ M
nek al›namamakta olup, bu noktan›n sodyum sülfat içeri¤i (% Na2SO4) tahmin edilmek istenmektedir. A noktas›na komflu iki noktadan al›nan örneklerin analizi yap›lm›fl olup, A
S O noktalar›n›n
R U
noktas› ile örnek noktalar› (S1 ve S2) noktalar› aras› uzakl›klar ve örnek
sodyum sülfat içerikleri afla¤›daki çizelgelerde verildi¤i gibidir. Kriging yöntemiyle A noktas›n›n sodyum sülfat içeri¤ini tahmin ederek, tahminin kriging varyans›n›
bulunuz.
D‹KKAT
4
SIRA S‹ZDE
D Ü fi Ü N E L ‹ M
S O R U
D‹KKAT
Noktalar
Noktalar Aras› Uzakl›k (m)
S1 ile A
100
S2 ile A
300
S1 ile S2
400
Örnek N. No Si
Z(Si) (% Na2SO4)
1
38
2
TELEV‹ZYON
46
TELEV‹ZYON
‹NTERNET
‹NTERNET
SIRA S‹ZDE
AMAÇLARIMIZ
K ‹ T A P
N N
SIRA S‹ZDE
AMAÇLARIMIZ
K ‹ T A P
184
Co¤rafi Bilgi Sistemleri ‹çin Temel ‹statistik
Özet
N
A M A Ç
1
N
A M A Ç
2
Konumsal tahminde kullan›lan klasik istatistik
ve jeoistatistik yöntemler hakk›nda aras›ndaki
fark› belirlemek.
Klasik konumsal tahmin yöntemler, al›nan örneklerin devaml›l›¤›n›, etki alan›n› ve yönsel de¤iflimini dikkate almayan yöntemler oldu¤undan,
yap›lacak konumsal tahminlerde hata büyüklü¤ü
artmakta ve tahminlerin güvenilirli¤i azalmaktad›r. Bu nedenlerle de, bölgeselleflmifl de¤iflkenler için konumsal tahminlerde, klasik yöntemler
yerine jeoistatistiksel kriging yöntemlerini uygulamam›z gerekmektedir.
Konumsal tahminde en yak›n komflu, yüzey
trend analizi ve uzakl›¤›n tersiyle a¤›rl›kland›rma yöntemlerini kullanmak.
En yak›n komflu yönteminde, örnek noktalar›
aras›nda en yak›n olan noktan›n de¤iflken de¤eri belirlenerek, tahmin edilecek noktaya atamas›
yap›lmaktad›r. En yak›n komflu yöntemiyle tahminde, en yak›n komflu noktay› bulabilmek için
konumsal noktalar aras› uzakl›klar›n hesaplanmas›nda Öklid yöntemi kullan›lmaktad›r. Bu yöntem, en yak›n komflu örnek noktas›ndan daha
uzak noktalardaki de¤iflken de¤erlerini, örnek
noktalar› aras›ndaki ba¤›ml›l›¤›, devaml›l›¤› ve
yönsel süreklili¤i dikkate almayan bir yöntemdir.
Yüzey trend analizi yönteminde, örnek noktalar›n›n de¤iflken de¤erleri ile konumsal koordinatlar› dikkate al›narak, en küçük kareler yöntemiyle p’inci dereceden polinom denklemi elde edilmekte ve bu denklem yard›m›yla de¤iflken de¤eri bilinmeyen noktalar için tahminler yap›lmaktad›r. Bu yöntemle ortalama bir tahmin yap›ld›¤›ndan, afl›r› düflük veya yüksek de¤iflken de¤erlerinin tahmininde yan›lt›c› sonuçlar ortaya ç›kabilmektedir.
Uzakl›¤›n tersi ile a¤›rl›kland›rma yönteminde,
her örnek noktas›n›n, de¤eri tahmin edilecek noktaya olan uzakl›¤›na göre ters oranda a¤›rl›¤› belirlenerek tahmin yap›lmaktad›r. Uzakl›¤›n tersi
ile a¤›rl›kland›rma yöntemi, belirli bir etki mesafesi içerisindeki örnek noktalar›n› dikkate alan ve
etki mesafesi d›fl›ndaki daha uzakta olan noktalar› hesaplamalara dahil etmeyen bir yöntemdir.
N
A M A Ç
3
Konumsal tahmininde Kriging yöntemini
aç›klamak ve farkl› semi-variogram modelleri ile
noktasal tahmin uygulamalar› yapmak.
Kriging yöntemi, de¤iflken de¤eri bilinmeyen bir
nokta veya blok çevresindeki ve içindeki örnek
de¤erlerinin a¤›rl›k katsay›lar›n›, semi-variogram
model parametreleri yard›m›yla hesaplayan ve
tahmin varyans›n› en küçükleyecek flekilde de¤iflken de¤erini tahmin eden bir yöntemdir. Bu
yöntemde, de¤iflken de¤eri tahmin edilecek nokta için arama kapsama alan›nda belirlenen örnek
noktalar› ile tahmin edilecek nokta aras› ortalama semi-variogram de¤erleri dikkate al›narak her
bir noktan›n a¤›rl›k katasay›lar› hesaplanmakta
ve bu katsay›lar kullan›larak da noktasal de¤iflken de¤eri tahmin edilmektedir. Kriging yöntemi, tahmin varyans›n› en küçükleyen ve en iyi
do¤rusal ve yans›z tahminciyi (a¤›rl›klar›) veren
bir yöntemdir.
185
8. Ünite - Konumsal Tahmin (‹nterpolasyon) ve Kriging
Kendimizi S›nayal›m
1. De¤iflken de¤eri bilinmeyen bir konumsal noktan›n
de¤iflken de¤erini tahminde, afla¤›dakilerin hangisinde
örnek nokta de¤erlerinin a¤›rl›klar› semi-variogram
fonksiyonuna ba¤l› olarak hesaplan›r?
a. En yak›n komflu
b. Uzakl›¤›n tersiyle a¤›l›kland›rma
c. Yüzey trend analizi
d. Kriging
e. Regresyon
2. Afla¤›dakilerden hangisi en yak›n komflu yöntemiyle tahminin sak›ncas› de¤ildir?
a. Uzak noktalardaki di¤er noktalar› dikkate almamas›
b. Tahminde kullan›lacak komflu nokta say›s› belirsizdir
c. Tahminde sadece en yak›n komflu nokta veya
noktalar› dikkate almas›
d. Örnek noktalar aras› ba¤›ml›l›k dikkate al›nmaz
e. Örnek noktalar aras› devaml›l›k dikkate al›nmaz
3. Bir de¤iflken de¤eri için 5 noktadan örnek al›nm›fl
fakat A noktas›ndan al›namam›flt›r. Örnek noktalar› ile
A noktas› aras› mesafeler ve örnek noktalar›n›n de¤iflken de¤erleri afla¤›daki gibidir. En yak›n 2 komflu noktas› dikkate al›nd›¤›nda A noktas›n›n de¤iflken de¤eri
ne olur?
Si
d(Si,SA) A Noktas›na
Z(Si) De¤iflken
Nokta No
Uzakl›¤› (m)
De¤eri
1
42
5
2
56
9
3
22
10
4
68
12
5
30
14
a.
b.
c.
d.
e.
6,4
8,6
10,3
12,3
24,6
4. Her bir örnek noktas› kullan›larak elde edilen polinom denklemi yard›m›yla tahmin yöntemi afla¤›dakilerden hangisidir?
a. En yak›n komflu
b. Uzakl›¤›n tersiyle a¤›l›kland›rma
c. Yüzey trend analizi
d. Kriging
e. Regresyon
5. Afla¤›da 2 örnek noktas›n›n A noktas›na uzakl›klar›
verilmifltir. Uzakl›¤›n tersi dikkate al›nd›¤›nda, A noktas›n›n de¤iflken de¤erini tahminde S1 örnek noktas›n›n
a¤›rl›¤› ne olur?
a.
b.
c.
d.
e.
Örnek No Si
A Noktas›ndan Uzakl›k (m)
1
20
2
50
0,240
0,286
0,565
0,714
0,760
6. Afla¤›dakilerden hangisi Kriging yönteminin klasik
konumsal tahmin yöntemlerine göre en önemli üstünlü¤ü de¤ildir?
a. Örneklerin birbirinden ba¤›ms›z oldu¤unu dikkate al›r.
b. Örneklerin etki alan›n› dikkate al›r.
c. Örneklerin de¤iflken de¤erlerinin yönsel de¤iflimini dikkate al›r.
d. Blok de¤iflken de¤eri tahminlerinde, blok boyutlar›n› dikkate al›r.
e. Tahminlerin varyans›n› en küçükler.
7. Arama kapsama alan› içerisindeki örnek nokta say›s› kaç›n alt›nda olursa, Kriging yöntemiyle yap›lacak
tahminler yan›lt›c› sonuçlar verir?
a. 4
b. 8
c. 10
d. 15
e. 16
186
Co¤rafi Bilgi Sistemleri ‹çin Temel ‹statistik
8. Bir kömür madeninde kal›nl›k örnekleriyle yap›lan
variogram analizleri sonras›nda, kal›nl›k de¤eri bilinmeyen A noktas› için etki alan›nda bulunan 4 örnek
noktas› ile kriging a¤›rl›k katsay›lar› afla¤›daki gibi hesaplanm›flt›r. A noktas› kal›nl›¤›n›n kriging tahmin de¤eri ( Z*A ) nedir?
Nokta No
Wi Kriging A¤›rl›k
Zi Kömür Kal›nl›¤›
Katsay›s›
(m)
1
0,15
6,0
2
0,25
8,0
3
0,20
7,0
4
0,40
5,0
a.
b.
c.
d.
e.
3,3
6,3
7,4
8,4
9,6
9. Bir alt›n madeninde variogram analizleri yap›ld›ktan
sonra, alt›n içeri¤i (gr/ton Au) bilinmeyen A noktas›
için komflu iki örnek noktas› ile tahmin yap›lmak istenmektedir. A noktas› ile örnek noktalar aras› ortalama
semi-variogram de¤erleri afla¤›daki gibi oldu¤una göre,
A noktas›n›n tahmininde kullan›lacak S2 örne¤inin kriging a¤›rl›k katsay›s› de¤eri ne olur?
Noktalar
Ortalama Semi-Variogram
(%)2 Au
S1 ile A ( γ( S1 , A ) )
10
S2 ile A ( γ( S2 , A ) )
20
S1 ile S2 ( γ( S1 , S2 ))
15
S1 ile S1 ( γ( S1 , S1 ))
0
S2 ile S2 ( γ( S , S ))
2 2
0
a.
b.
c.
d.
e.
0,10
0,17
0,33
0,67
0,83
10. Bir arazide topo¤rafik ölçüm cihazlar›yla yap›lan
yükselti ölçümleri sonras›nda variogram madellemesi
gerçeklefltirilmifltir. Yükseltisi ölçülemeyen A noktas›
için etki alan›nda bulunan 4 örnek noktas› ile hesaplanan kriging a¤›rl›k katsay›lar› ve ortalama semi variogram de¤erlerinin afla¤›daki gibi oldu¤u belirlenmifltir.
Kriging eflitliklerinin çözümü s›ras›nda lagrange çarpan› de¤eri λ = 12,5 hesapland›¤›na göre, A noktas›n›n
kriging tahmin varyans› de¤eri de¤eri ( σ2k ) ne olur?
Nokta No
Wi Kriging A¤›rl›k Katsay›s›
1
0,05
2
0,25
3
0,30
4
0,40
Noktalar
Ortalama Semi-Variogram
(M)2
S1 ile A ( γ( S1 , A ))
20
S2 ile A ( γ( S2 , A ))
10
S3 ile A ( γ( S3 , A ))
30
S4 ile A ( γ( S4 , A ) )
40
a.
b.
c.
d.
e.
1,0
3,5
12,5
28,5
41,0
187
8. Ünite - Konumsal Tahmin (‹nterpolasyon) ve Kriging
Kendimizi S›nayal›m Yan›t Anahtar›
1. d
Yan›t›n›z yanl›fl ise, “Kriging Tahmin Yöntemi”
konusuna bak›n›z.
Yan›t›n›z yanl›fl ise, “En Yak›n Komflu Yöntemi”
konusuna bak›n›z.
Yan›t›n›z yanl›fl ise, “En Yak›n Komflu Yöntemi”
konusuna bak›n›z.
Yan›t›n›z yanl›fl ise, “Yüzey Trend Analizi” konusuna bak›n›z.
Yan›t›n›z yanl›fl ise, “Uzakl›¤›n Tersiyle A¤›rl›kland›rma Yöntemi” konusuna bak›n›z.
Yan›t›n›z yanl›fl ise, “Kriging Tahmin Yöntemi”
konusuna bak›n›z.
Yan›t›n›z yanl›fl ise, “Kriging Tahmin Yöntemi”
konusuna bak›n›z.
Yan›t›n›z yanl›fl ise, “Kriging Tahmin Yöntemi”
konusuna bak›n›z.
Yan›t›n›z yanl›fl ise, “Kriging Tahmin Yöntemi”
konusuna bak›n›z.
Yan›t›n›z yanl›fl ise, “Kriging Tahmin Yöntemi”
konusuna bak›n›z.
2. c
3. d
4. c
5. d
6. a
7. a
8. b
9. b
10. e
S›ra Sizde 2
Örnek noktalar›n›n de¤iflken de¤eri tahmin edilecek
blok merkezinde bulunan A noktas›na olan uzakl›klar›
Öklid yöntemiyle hesaplanm›flt›r. Uzakl›klar›n tersleri
ve uzakl›k tersleri toplam›na göre a¤›rl›klar› afla¤›da verildi¤i gibi hesaplanm›flt›r.
A
Ters Uzakl›k
Örnek No Si Noktas›ndan
A¤›rl›klar Wi
(1/m)
Uzakl›k (m)
1
335,4
0,0030
0,185
2
250
0,0040
0,248
3
279,5
0,0036
0,222
4
180,3
0,0055
0,345
0,0161
1,000
Toplam
Blok merkezi olan SA noktas›n›n tahmini tenörünü (Z*)
afla¤›daki gibi hesaplar›z.
Z* (SA ) = W1.Z(S1 ) + W2 .Z(S2 ) + W3 .Z(S3 ) + W4 .Z(S4 )
Z* (SA ) = (0,185 * 4, 8) + (0,248*5,9) + (0, 222 * 6, 4) + (0,345*5, 7)
Z* (SA ) = 5, 7 pH
S›ra Sizde Yan›t Anahtar›
S›ra Sizde 1
Tarlalar ile A noktas› aras› uzakl›klar afla¤›daki afla¤›daki eflitlikle hesaplan›r.
d ( Si , S A ) = ( xi − x A )2 + ( yi − y A )2
W1.γ ( S1 , S1 ) + W2 .γ ( S1 , S2 ) + λ = γ ( S1 , A)
Konumsal Koordinatlar (m) A Noktas›na
Uzakl›k (m)
(X)
(Y)
d (S‹, SA)
Tarla No Si
1
6100
4700
316,2
2
6400
4800
200,0
3
6900
4750
522,0
4
6600
4500
223,6
5
6300
4250
364,0
En yak›n iki komflu nokta S2 ve S4 oldu¤undan, noktalar aras› uzakl›klarla a¤›rl›kland›r›lm›fl tahmini de¤iflken
de¤erini afla¤›daki gibi hesaplar›z.
k
∑ d ( Si , S A ).Z ( Si )
Z * ( S A ) = i=1
k
∑ d ( Si , S A )
i=1
=
( 200 * 85)) + ( 223, 6 * 102)
= 94, 0cm
( 200 + 223, 6)
S›ra Sizde 3
‹ki örnek noktam›z (S1 ve S2) oldu¤undan, afla¤›daki üç
adet kriging eflitli¤i sözkonusudur.
W1.γ ( S2 , S1 ) + W2 .γ ( S2 , S2 ) + λ = γ ( S2 , A)
W1
+ W2
=1
Örnek noktalar›n›n kendi içinde herhangi bir mesafe
söz konusu olmad›¤›ndan;
γ ( S1 , S1 ) = 0 ve γ ( S2 , S2 ) = 0 olur
Örnek noktalar› aras› ve örnek noktalar› ile A noktas›
aras› ortalama semi-variogramlar› afla¤›daki gibi hesaplar›z.
Küresel model;
 3.h
h3 
γ ( Si , S j ) = C . 
−
h≤a

 2.a 2.a 3 
γ ( Si , S j ) = C
h≥a
olup, burada h : Si ve Sj noktalar› aras› uzakl›kt›r.
Eflik de¤er C=20 (ppm)2 Pb ve etki mesafesi a=50 m
olarak verilmiflti.
188
Co¤rafi Bilgi Sistemleri ‹çin Temel ‹statistik
S1 ve S2 noktalar› aras› uzakl›k h=50 m etki mesafesine
eflit (h=a=50 m) oldu¤undan, S1 ve S2 noktalar› aras› ortalama semi-variogram;
γ( S1 , S2 ) = C = 20 ( ppm )2 Pb
 3 * 10
(10)3 
2
γ( S1 , A) = 20. 
−
 = 5, 92 ( ppm ) Pb
 2 * 50 2 * (50)3 
S2 ve A noktas› aras› uzakl›k h=40 m oldu¤undan, S2 ve
SA noktalar› aras› ortalama semi-variogram;
 3 * 40
( 40)3 
2
γ( S2 , A) = 20. 
−
 = 18, 88 ( ppm ) Pb
 2 * 50 2 * (50)3 
‹ki örnek noktas› ile A noktas› de¤iflken de¤erini tahmin için kullanaca¤›m›z a¤›rl›k katsay›lar›n› hesaplamak için;
W1.γ ( S1 , S1 ) + W2 .γ ( S1 , S2 ) + λ = γ ( S1 , A)
W1.γ ( S2 , S1 ) + W2 .γ ( S2 , S2 ) + λ = γ ( S2 , A)
+ W2
=1
Kriging eflitlik sistemini elde etmifltik. Bu eflitlik sisteminin bilinenlerini yerine yazarsak;
(W1 * 0) + (W2 * 20) + λ = 5, 92
(W1 * 20) + (W2 * 0) + λ = 18, 88
+W2
W1
=1
üç bilinmeyenli (W1,W2, λ) ve üç adet eflitlik elde ederiz. Bu eflitlik sistemini, W1=1-W2 yazarak çözdü¤ümüzde, bilinmeyenleri;
λ=2,4
W1=0,824
W2=0,176
olarak hesaplar›z.
Hesaplanan a¤›rl›k katsay›lar›n› kullanarak, de¤iflken
de¤eri bilinmeyen A noktas›n›n tahmini kurflun içeri¤ini ( Z*A ) afla¤›daki gibi hesaplar›z.
n
Z *A = ∑ Wi .Z ( Si )
n
σk2 = ∑ Wi .γ (Si , A) + λ
i=1
S1 ve A noktas› aras› uzakl›k h=10 m oldu¤undan, S1 ve
SA noktalar› aras› ortalama semi-variogram;
W1
Kriging yöntemiyle yap›lan tahminin varyans›n›, afla¤›daki eflitlikle bulabiliriz.
σk2 = (0, 824 * 5, 92) + (0, 176 * 18,, 88) + 2, 4
σk2 = 8, 2 ( ppm )2 Pb
S›ra Sizde 4
‹ki örnek noktam›z (S1 ve S2) oldu¤undan, afla¤›daki üç
adet kriging eflitli¤i sözkonusudur.
W1.γ ( S1, S1 ) + W2 .γ ( S1 , S2 ) + λ = γ ( S1, A)
W1.γ ( S2 , S1 ) + W2 .γ ( S2 , S2 ) + λ = γ ( S2 , A)
W1
+ W2
=1
Örnek noktalar›n›n kendi içinde herhangi bir mesafe
söz konusu olmad›¤›ndan;
γ ( S1 , S1 ) = 0 ve γ ( S2 , S2 ) = 0 olur
Örnek noktalar› aras› ve örnek noktalar› ile A noktas›
aras› ortalama semi-variogramlar› afla¤›daki gibi hesaplar›z.
Do¤rusal model;
γ(h) = 0, 001.h1,65
olup, burada h : Si ve Sj noktalar› aras› uzakl›kt›r.
S1 ve S2 noktalar› aras› uzakl›k h=400 m oldu¤undan,
S1 ve S2 noktalar› aras› ortalama semi-variogram;
γ (h) = 0, 001.h1,65
γ ( S1 , S2 ) = 0, 001 * ( 400)1,65 = 19, 65 (%)2 Na 2SO4 )
S1 ve A noktas› aras› uzakl›k h=100 m oldu¤undan,
S1 ve SA noktalar› aras› ortalama semi-variogram;
γ( S1 , S A ) = 0, 001 * (100)1,65 = 2, 00 (%)2 ( Na 2SO 4 )
S2 ve A noktas› aras› uzakl›k h=300 m oldu¤undan,
S2 ve SA noktalar› aras› ortalama semi-variogram;
γ( S2 , S A ) = 0, 001 * (300)1,65 = 12, 23 (%)2 ( Na 2SO4 )
Kriging eflitlik sisteminin bilinenlerini yerine yazarsak;
( W1 * 0 ) + ( W2 * 19 ,65 ) + λ = 2 ,0
i=1
Z*A
= W1.Z(S1 ) + W2 .Z(S2 )
Z*A = (0, 824 * 5) + (0,176 * 2)
Z*A
= 4, 47 ppm Pb
( W1 * 19 ,65 ) + ( W2 * 0 ) + λ = 12 , 23
W1
+ W2
=1
üç bilinmeyenli (W1, W2 ve λ) ve üç adet eflitlik elde
ederiz. Bu eflitlik sistemini, W1 =1-W2 yazarak çözdü¤ümüzde, bilinmeyenleri;
λ=−2,71
8. Ünite - Konumsal Tahmin (‹nterpolasyon) ve Kriging
189
Yararlan›lan Kaynaklar
W1=0,24
W2=0,76
olarak hesaplar›z.
Hesaplanan a¤›rl›k katsay›lar›n› kullanarak, de¤iflken
de¤eri bilinmeyen A noktas›n›n tahmini kurflun içeri¤ini ( Z*A ) afla¤›daki gibi hesaplar›z.
n
Z*A = ∑ Wi .Z ( Si )
i =1
Z*A = W1.Z(S1 ) + W2 .Z(S2 )
Z*A = ( 0 , 24 * 38) + (0,76 * 46)
Z*A = 44 ,08 % Na 2SO4
Kriging yöntemiyle yap›lan tahminin varyans›n›, afla¤›daki eflitlikle bulabiliriz.
n
σ2k = ∑ Wi .γ(Si , A) + λ
i=1
n
σ2k = ∑ (0, 24 * 2,0) + (0,76 *12, 23) - 2,71
i=1
= 7,06 (%)2 Na 2SO4
Baltac›, A.G. (2007). Jeoistatistiksel Kestirimde Lokal Belirsizli¤in De¤erlendirilmesinde Alternatif Yaklafl›mlar. (Yay›mlanmam›fl doktora tezi). Hacettepe
Üniversitesi/Fen Bilimleri Enstitüsü, Ankara.
Clark, I. (1979). Practical Geostatistics. London: Applied Science.
Darakç›, H.Ç. (2010). K-En Yak›n Komflu Yöntemi.
http://akademik.maltepe.edu.tr/~ttbilgin/BIL518/presentations/HalilCagdasDARAKCI/Sunum1/K-Nearest%20Neighbor%20Estimation.ppt
Gülband›lar, E. (2010). Bellek Tabanl› S›n›fland›rma:
En Yak›n K-Komflu Algoritmas›. http://mf.dumlupinar.edu.tr/~eyup/DM/dm5.pdf
Journel, A.G. & Huijbregts, CH.J. (1978). Mining Geostatistics. San Diego: Academic.
Konuk, A. & Önder, S. (1999). Maden ‹statisti¤i. Mühendislik Mimarl›k Fakültesi Maden Mühendisli¤i Bölümü. Eskiflehir: Eskiflehir Osmangazi Üniversitesi.
Olea, R. A. (1999). Geostatistics for Engineers and Earth
Scientists. Boston: Kluwer Academic.
Özsakarbafl›, F. (2008), Classification of Forest Areas by
K Nearest Neighbor Method: Case Study, Antalya.
(Yay›mlanmam›fl yüksek lisans tezi). Ortado¤u Teknik Üniversitesi/Fen Bilimleri Enstitüsü, Ankara.
Pekin, A. (1999). Aç›k ‹flletme Basamak Tenörlerinin
Kriging Tahminlerinde ‹statistiksel Da¤›l›m Modellerinin Etkileri. (Yay›mlanmam›fl doktora tezi). Eskiflehir Osmangazi Üniversitesi/Fen Bilimleri Enstitüsü, Eskiflehir.
Tercan, A.E. & Saraç, C. (1998). Maden Yataklar›n›n
De¤erlendirilmesinde Jeoistatistiksel Yöntemler. Ankara: Jeoloji Mühendisleri Odas›.
Tüysüz, N. & Yaylal›, G. (2005). Jeoistatististik - Kavramlar ve Bilgisayarl› Uygulamalar. Trabzon: Karadeniz Teknik Üniversitesi
Uyguçgil, H. (2007). Çok De¤iflkenli Maden Yataklar›nda Rezerv Tenör Tahmininde Jeoistatistik ve Co¤rafi
Bilgi Sistemleri Tekniklerinin Kullan›m›. (Yay›mlanmam›fl doktora tezi). Eskiflehir Osmangazi Üniversitesi/Fen Bilimleri Enstitüsü, Eskiflehir
190
Co¤rafi Bilgi Sistemleri ‹çin Temel ‹statistik
Ki Kare Tablosu
8. Ünite - Konumsal Tahmin (‹nterpolasyon) ve Kriging
T Tablosu
191
192
Co¤rafi Bilgi Sistemleri ‹çin Temel ‹statistik
Z Tablosu
0
z
Download