6. bölüm - SABİS - Sakarya Üniversitesi

advertisement
SAÜ
6. BÖLÜM
DEĞİŞKENLİK (YAYIKLIK) ÖLÇÜLERİ
PROF. DR. MUSTAFA AKAL
İÇİNDEKİLER
1. DEĞİŞKENLİĞİN TANIMI VE ÇEŞİTLERİ
2. ANALATİK OLMAYAN DEĞİŞKENLİK ÖLÇÜLERİ
3. ORTALAMA MUTLAK SAPMA
4.
5.
6.
7.
3.1. Basit Seride Ortalama Mutlak Sapma
3.2. Tasnif Edilmiş Seride Ortalama Mutlak Sapma
3.3. Gruplanmış Seride Ortalama Mutlak Sapma
STANDART SAPMA VE VARYANS
4.1. Basit Seride Standart Sapma ve Varyans
4.2. Tasnif Edilmiş Seride Standart Sapma ve Varyans
4.3. Gruplanmış Seride Standart Sapma ve Varyans
DEĞİŞİM KATSAYISI
ÖRNEKLEMİN
VARYANS
VE
STANDART
HESAPLANMASI
STANDART SAPMANIN ÖZELLİKLERİ VE FAYDALARI
SAPMASININ
8. TOPLANMA ORANI
HEDEFLER
Değişkenliğin ve çeşitlerinin tanıtılması, değişim aralığı, OMS, standart sapma,
varyans, değişim katsayısı ve toplanma oranı kavramlarının tanıtılması ve
yorumu.
1.
DEĞİŞKENLİĞİN TANIMI VE ÇEŞİTLERİ
Seriler için hesaplanan ve tek bir rakamla gösterilen merkezi eğilim ölçüleri, o serinin
merkezi hakkında bazı faydalı bilgiler verse de tek başına o serinin dağılımı ve diğer
serilerle karşılaştırılması için ayrıntılı bilgi vermez. Bundan dolayı serinin
değişkenliğini belirlemek ve diğer serilerle karşılaştırmak için ilave bilgilere ihtiyaç
vardır. Araştırmacı serinin dağılımı (yayıklığı) yani serideki değerlerin ortalamadan ne
ölçüde uzak ya da yakın olduğunu ölçmeye ve serileri karşılaştırmaya da ihtiyaç duyar.
Bunun için de serilerin merkezi eğilim ölçülerine ilave olarak “DEĞİŞİM” ölçülerinin
de hesaplanması gerekir. Değişim ölçülerinin önemini bir örnekle açıklayabiliriz.
ÖRNEK: Aşağıdaki seriler İktisat ve Kamu Yönetimi bölümündeki öğrencilerin
istatistik final notlarını vermektedir.
İktisat Bölümü (Xi)
Kamu Yönetimi Bölümü (Yi)
30
5
35
10
40
20
45
25
50
50
55
75
60
80
65
90
70
95
İki sınıfında aritmetik ortalaması ve medyanı hesaplandığında, sınıfların aynı aritmetik
ortalamaya ve medyana sahip olduğu görülmektedir.
ve Medyan = 50
Merkezi eğilim ölçülerine baktığımızda iki sınıf arasında bir fark gözükmüyor olsa da
verilerin yayılımında farklılık olduğu dikkatlerden kaçmamaktadır. İktisat bölümündeki
öğrencilerin notları göreceli olarak Kamu Yönetimi bölümündeki öğrencilerin
notlarından birbirine daha yakındır. Diğer bir ifadeyle, İktisat bölümündeki öğrencilerin
notları Kamu Yönetimi bölümündeki öğrencilerin notlarıyla karşılaştırıldığında
1
ortalama değer etrafında daha yakın dağılmıştır. Bu nedenle serilerin diğer özelliklerini
de ortaya koyacak merkezi eğilim ölçüleri dışında değişim ölçülerine ihtiyaç vardır.
Değişim ölçüleri genel olarak Değişim Aralığı (Range), Ortalama Sapma, Standart
Sapma, Varyans ve Değişim (değişkenlik) Katsayısı olarak bilinir.
Değişkenlik, seri terimlerinin değerce birbirlerinden farklılıkları ve değerce nasıl
dağıldıklarını ifade eder.
Dağılma, grafik üzerinde, özellikle apsiste kapladığı kısmın eninde kendini gösterir. Bir
serinin değişkenliği arttıkça ölçek sabit kalmak şartıyla, o kısım genişler. Değişkenlik
azaldığı oranda ortalamanın temsil kabiliyeti azalmakta, değişkenlik azaldığı oranda
ortalama temsili olmak vasfını kazanmaktadır.
Bir serinin bölünmesi o serinin grafikte “y” ekseninde kapladığı bölümde ortaya
çıkmaktadır. Seriyi tam olarak tanımlayabilmek için ortalama yanında değişkenlik ve
bölünme şeklinden yararlanılır. Değişkenlik ölçülerinin hesaplanmasında serinin bütün
terimleri dikkate alınmasına analatik değişkenlik ölçüleri, serinin tüm terimlerinin
hesaplanmaya katılmadığı değişkenlik ölçüsüne analitik olmayan değişkenlik ölçüleri
denir.
ANALATİK OLMAYAN DEĞİŞKENLİK ÖLÇÜLERİ
2.
Analitik olmayan değişkenlik ölçüleri; Değişim Aralığı ve Kartiller Arası Farktır.
2.1. Değişim Aralığı
Serideki en büyük gözlem değeri ile en küçük gözlem değeri arasındaki farka
“DEĞİŞİM ARALIĞI” denir. Formülü aşağıdaki gibi yazılır.
DA = Xmax - Xmin
Yukarıdaki örnekte İktisat bölümü için DA = 70 - 30 = 40 ve
Kamu yönetimi bölümü için DA = 95 - 5 = 90 olarak hesaplanır.
Tüm gözlem değerlerinin birbirinden ya da ortalamadan farklarını ortaya koymaması
açısından serinin dağılımı hakkında fazla bir bilgi içermez. Değişim Aralığı katsayısı
yukarıdaki örnekten de görüldüğü gibi özellikle serideki uç değerlerden aşırı
etkilenmektedir.
Özellikleri:
i. D.A.’nın hesabı kolaydır.
ii. Aykırı ve uç değerlerden hemen etkilenir.
iii. Açık uçlu dağılımlar için hesaplanamaz.
2.2.
Kartiller Arası Fark
Değişim aralığının serinin iki ucunda yer alan anormal terimlerden hemen etkilenmesi
sakıncasını gidermek üzere kartiller arası fark (KAF) adı verilen ölçü kullanılır. Bu ölçü
KAF= Q3  Q1 ’e eşittir.
2
ÖRNEK: Aşağıdaki A ve B serilerinin değişkenliklerini DA ve KAF ile karşılaştırınız?
A
B
2
2
5
3
8
5
9
6
15
9
11
A serisi: D.A = Xmax- Xmin = 15 -2 =3’tür, K.A.F. = Q3  Q1 =9–5=4’dir.
B serisi: D.A = Xmax- Xmin = 11 -2 =9’tür, K.A.F. = Q3  Q1 =9-3=6’dır.
B için kartiller;
N 2
Q1 
.terim olduğundan 2.terim = Q1=3.
4
3N  2
.terim olduğundan 5.terim=Q3=9.
4
Benzer olarak A serisinin kartilleri bulunur ve KAF hesaplanır.
Q3 
Değişim aralığının serinin iki ucunda yer alan anormal terimlerden hemen etkilenmesi
sakıncasını gidermek üzere kartiller arası fark adı verilen ölçü kullanılır.
Kartiller arası farkı büyük olan serinin değişkenliği kartiller arası farkı küçük olan
seriye nazaran değişkenliği daha fazladır. Dağılma özelliği yüksektir. Örneğin A
serisinin kartiller arası farkı 4 ve B serisinin KAF’ ı 6 ise;
B serisinin değişkenliği  A serisinin değişkenliği  Çünkü 6  4’tür. Bütün
serilerde bu özellik aynıdır. Oysa Değişim aralığı kriterine bakılacak olsaydı A serisinin
değişkenliği B serisininkinden daha büyük olarak kabul edilecekti.
ÖRNEK: Sınıflanmış Serilerde KAF’ın hesabı.
A
B
Xi
Ni
Xi
Ni
1
2
2
7
5
7
4
4
7
9
5
6
12
2
6
3
A; Q1  5; Q3  7
Q1 
N 2
.terim
4
Q3 
3N  2
.terim
4
Q2 
2N  2
.terim
4
B; Q1  2; Q3  5
3
KAFA=7-5=2 < KAFB =5-2=3, B serisi daha değişkendir.
KAF’ın Özellikleri:
i. Hesabı D.A. dan biraz daha kolaydır.
ii. Aykırı ve uç değerlerden etkilenmez.
iii. Açık uçlu dağılımlar için hesaplanabilir.
2.3. Kartiller Arası Değişim Katsayısı
Kartiller Arası Değişim Katsayısı (KADK) kartillere dayanan diğer bir değişkenlik
1
ölçüsüdür. Q1 ve Q3 bir seri için verilsin.  Q1  Q3  bize serinin merkezi eğilimini
2
verir veya ortalamasını verir.
1
 Q3  Q1  bize kartiller arası farkın yarısını verir. Bu bize veri dağılımının
2
asimetrisi hakkında bilgi verir. Mutlak değeri ne kadar büyük ise serinin değişkenliği ve
asimetrisi o kadar yüksektir.
Q
1
 Q3  Q1  formülü kullanılarak Kartiller Arası Değişim Katsayısı hesaplanarak
2
asimetrik dağılımın nispi değeri de belirlenebilir. Nispi asimetri ölçüsü ve değişkenliği
ise şöyledir; Kartiller Arası Değişim Katsayısı;
Q
1
(Q3  Q1 ) (Q  Q )
1
2
VQ 
 3
1
(
Q

Q
3
1)
(Q3  Q1 )
2
ÖRNEK: Bir serinin Q3 =69.61, Q1 =65.64 ise KADK nedir?
VQ 
69.61  65.64
3.97

 0.0293  %2.9
69.61  65.64 135.25
Değeri sıfırdan büyük olduğu için seri sağa eğiktir. İki kartil arası farkın değişkenliği
%2’dir.
ÖRNEK: İki seriye ait olarak seri A: Q1 =2.29, Q2  3.43, Q3 =5 ve Seri B: Q1 =4.25,
Q2  5.25, Q3 =6.40 kartil değerlerini kullanarak iki serinin çarpıklığını ve
değişkenliğini karşılaştırınız?
Pearson Asimetri ölçüsünü kullanarak
ASPA  0.159  0 ve ASPB  0.070  0 her iki seri asimetrisi hafif sağa eğik serilerdir.
K.A.D.K.’nı kullanarak;
4
VQ A 
5  2.29 2.71

 0.3717  %37
5  2.29 7.29
VQ B 
6.4  4.25 2.15

 0.2018  %20
6.4  4.25 10.65
olduğu bulunur.
VQ A  %37 > VQ B =%20 olduğundan A serisi değişkenliğinin daha yüksek olduğu
görülür;
Dolayısıyla A serisi daha asimetrik ve değişkenliği daha yüksektir.
3. ANALİTİK DEĞİŞKENLİK ÖLÇÜLERİ
3.1.
ORTALAMA MUTLAK SAPMA (OMS)
Değişim aralığı hesaplanırken serideki tüm değerler kullanılmadığı için bilgi kaybı
olabilir ve bu bir eksikliktir. Bundan dolayı serideki değişimi ölçmek için daha ileri ve
tüm değerleri hesaba katan değişim ölçülerine ihtiyaç vardır.
Bir serideki gözlem değerlerinin o serinin aritmetik ortalamasından farklarının
(sapmalarının) mutlak değerinin ortalamasına “ORTALAMA MUTLAK SAPMA”
denir. Bu değişim ölçüsü gözlem değerlerinin aritmetik ortalamadan ne kadar saptığını
göstermesi açısından değişkenlik hakkında bilgi içerir.
Ortalama Mutlak Sapma, terimlerin aritmetik ortalamadan mutlak sapmalarının
aritmetik ortalamasıdır. OMS Medyana göre de hesaplanabilir.
Ortalama mutlak sapma basit seriler, tasnif edilmiş seriler ve gruplanmış seriler için
hesaplanabilir.
ORTALAMA MUTLAK SAPMASI (ANAKÜTLE)
Basit serilerde
N
 X i -X
OMS  i 1
N
Sınıflanmış serilerde
k
 Ni X i -X
OMS  i 1
k
 Ni
i 1
Gruplanmış serilerde
k
 Ni mi -X
OMS  i 1
k
 Ni
i 1
Ortalama mutlak sapmanın medyana göre hesaplanmasında ise X = Me formülde yerine
konur.
Ortalama mutlak sapması büyük olan seri daha değişkendir.
3.1.1. Basit Seride Ortalama Mutlak Sapma
Basit seride Ortalama Mutlak Sapma aşağıdaki formül yardımıyla hesaplanır.
5
ÖRNEK: İstatistik dersi sınavına giren 5 öğrencinin aldığı notlar aşağıdaki tabloda
verilmiştir. Öğrencilerin aldığı notların ortalama mutlak sapmasını hesaplayınız.
İstatistik Notları (Xi)
Ortalama Sapmalar
Ortalama Mutlak Sapmalar
40
40 - 66 = -26
26
50
50 – 66 = -16
16
70
70 - 66 = 4
4
80
80 - 66 = 14
14
90
90 - 66 = 24
24
0
Beş öğrencinin notlarının ortalamadan sapması mutlak değer olarak 16.8 bulunmuştur.
3.1.2. Sınıflanmış Serilerde Ortalama Mutlak Sapma
Tasnif edilmiş seride Ortalama Mutlak Sapma aşağıdaki formül yardımıyla hesaplanır.
ÖRNEK: Maliye bölümü öğrencilerinin İstatistik final sınavı notları tasnif edilmiş seri
olarak aşağıda verilmiştir. Bu dağılımın ortalama mutlak sapmasını hesaplayınız.
Öğrencilerin
Notları (Xi)
fi
fiXi
40
1
40
30
30
50
2
100
20
40
60
4
240
10
40
70
6
420
0
0
6
80
4
320
10
40
90
2
180
20
40
100
1
100
30
30
Toplam
İlk aşamada aritmetik ortalama hesaplanır.
Aritmetik ortalamadan mutlak sapmalar (
) bulunduktan sonra her bir gözlemin
aritmetik ortalamadan mutlak sapması frekansı ile çarpılır (
). Bulunan
değerler formülde yerine konulduğunda tasnif edilmiş serinin OMS bulunur.
olarak bulunur.
3.1.3. Gruplanmış Seride Ortalama Mutlak Sapma
Gruplanmış seride Ortalama Mutlak Sapma aşağıdaki formül yardımıyla hesaplanır.
ÖRNEK: Sakarya Üniversitesi İİBF öğrencilerinin istatistik yılsonu notları gruplanmış
seri olarak aşağıda verilmiştir. Bu dağılımın ortalama mutlak sapmasını hesaplayınız.
Not
Sınıfları m
i
(Gruplar)
fi
mifi
90-100
95
50
4750
28
1400
85-89
87
60
5220
20
1200
80-84
82
40
3280
15
600
75-79
77
50
3850
10
500
70-74
72
100
7200
5
500
7
60-69
64,5
50
3225
2.5
125
50-59
54,5
60
3270
12.5
750
40-49
44,5
40
1780
22.5
900
0-39
19,5
50
975
47.5
2375
İlk aşamada aritmetik ortalama hesaplanır.
İkinci aşamada sınıf orta değerleri (mi) bulunur. Aritmetik ortalamadan mutlak sapmalar
(
) bulunduktan sonra her bir gözlemin aritmetik ortalamadan mutlak sapması
frekansı ile çarpılır ve toplamları alını; ∑
konulduğunda gruplanmış serinin OMS bulunur.
. Bulunan değerler formülde yerine
olarak bulunur.
Ancak aşağıdaki yaklaşım O.M.S. değerini daha doğru verir:
3.1.4. Gruplanmış Seride Ortalama Mutlak Sapma Hesabında Eğilim
Gruplanmış serilerde formülü uygulamadan önce aritmetik ortalamayı ihtiva eden sınıfı
ortalamaya kadar ve ortalamadan sonra olmak üzere ikiye bölmek gerekir. X’ler yerine
sınıf ortaları yani (mi)’ler dikkate alınır.
Gruplar
2-4’den az
4-6’dan az
6-8’den az
8-10’dan az
Ni
2
3
7
4
ΣNi=16
mi
3
5
7
9
Nimi
6
15
49
36
ΣNimi=106
k
N m
i
ΣNi=16, ΣNimi =106 ise X =
i
i=1
k
N
=
106
=6.625
16
i
i=1
8
Sınıflar
Ni
mi
mi - X
mi -X
2-4’den az
4-6’dan az
2
3
3
5
-3.625
-1.625
3.625
1.625
Ni mi -X
7.25
4.875
6-6.625’den az 2.1875 6.3125 0.3125
0.3125 0.6835
6.625-8’den az 4.8125 7.3125 0.6875
0.6875 3.3085
8-10’dan az
2.375
4
9
2.375
9.50
Sonra aşağıdaki seri üzerinden OMS oluşturulur.
Σ Ni mi -X =25.617
6.625 frekansı 6-8’den az sınıfında bulunur. 6-8’den az sınıfını (6-6.625’den az) ve
(6.625-8’den az) şeklinde ikiye böleriz ve bu bölme esnasında 6-8’den az sınıfının
frekansı bu bölünmüş sınıfa sınıf aralıkları ile orantılı olarak dağıtılır.
Sınıflar
6-6.625’den az
Sınıf aralıkları
0.625
Frekanslar
Na
frekans
2.1875
6.625-8’den az 1.375
Nt
4.8125
6-8’den az
7
2.000
Ni si 7*0.625

 2.1875 , yani frekansların % kaçının 0.626 sınıf aralığına karşılık
s
2
geldiğini buluruz.
Na 
Na+Nt=7  2.1875+Nt=7 
Nt=4.8125
5
Ortalama Mutlak Sapma OMS 
N
i 1
i
mi -X
5
N
i 1

25.617
 1.601 dır.
16
i
3.1.5. Ortalama Mutlak Sapmanın Özellikleri
i. Her gözlem sapmasına eşit ağırlık verir.
ii. Ortalamadan sapmalar biçiminde olduğu gibi Medyandan sapmalar şeklinde de
hesaplanabilir.
iii. Hesabı ve anlaşılması standart sapmaya göre daha kolaydır.
iv. OMS, standart sapma kadar olmasa da serideki aşırı değerlerin etkisi altında kalır.
9
v. Açık gruplu serilerde OMS hesaplanamaz. Hesaplamak içinse grup üst veya alt sınır
için bir tahmin yapılır.
vi. OMS matematiksel işlemlere uygun değildir.
vii. Öngörü doğruluk kıyaslaması ve öngörü modeli seçiminde kullanılabilmektedir.
3.2.
STANDART SAPMA VE VARYANS
Gözlem değerlerinin aritmetik ortalamadan farklarının toplamı sıfır olacağından, bu
farkların mutlak değerini alarak ortalama mutlak sapmaları hesaplandı. Ortalama
Mutlak sapmaya alternatif olarak bir değişkenlik ölçüsü olarak standart sapma
kullanılabilir. Bir serideki gözlem değerlerinin o serinin aritmetik ortalamasından
farklarının (sapmalarının) karesinin toplamının ortalamasına “VARYANS” ve karekökü
alınan varyansa “STANDART SAPMA” denir.
Standart sapma, terimlerin aritmetik ortalamadan farklarının kareli ortalamasından
ibarettir. Standart sapması küçük olan seri daha değişkendir.
Ana kütlenin varyansı
ve standart sapması σ (sigma) simgesi ile gösterilirken,
örneklemin varyansı
ve standart sapması s simgesi ile gösterilir. Serilerdeki varyans
ve dolayısıyla standart sapma arttıkça serinin yayganlığı artmaktadır. Ana kütlenin
aritmetik ortalaması μ ve örneklemin aritmetik ortalaması simgesi ile gösterilir. Bu
bölümde ana kütle üzerinde çalışacağımız varsayımı altında aritmetik ortalama μ ile
gösterilecektir.
ANAKÜTLENİN STANDART SAPMASI
Basit Serilerde
  X i -  2
Sınıflanmış Serilerde
N

i 1
N

k
 Ni  X i -  2
i 1
k
 Ni
Gruplanmış Serilerde

k
 Ni  mi -  2
i 1
k
 Ni
i 1
i 1
Örneklem standart sapması ile ilgilenildiğinde, σ yerine s, μ yerine X simgesi ve N
yerine n simgesi tercih edilir ve toplam örneklemin frekans (gözlem) sayısının bir eksiği
ile bölünür. Burada k seride bulunan farklı terim ya da grup sayısıdır.
Gruplanmış serilere Sheppard düzeltmesi uygulanır;  1   2 
s2
12
s= Ortak sınıf aralığı
 1 =Düzeltilmiş 
Sheppard düzeltilmesinin yapılabilmesi için serinin bölünmesinin normal veya normale
yakın, ayrıca frekanslarının büyük ve serinin iki ucunda asimptotik olarak sıfıra
yaklaşma eğiliminde olması gerekir. J, ters J ve U serilerinde ve çok asimetrik serilerde
10
düzeltmenin yararı yoktur. Bu düzeltme sınıf sayısının yeterince çok olmaması halinde
anlam taşımaz.
Not: 1)  > ortalama sapma (Standart Sapma > Ortalama Mutlak Sapma)
2) K > A ( Kareli Ortalama>Aritmetik Ortalama)
3)  >0.
3.2.1. Basit Seride Standart Sapma ve Varyans
Basit serilerde Varyans ve Standart Sapma aşağıdaki formül yardımıyla hesaplanır.
  X i -  2
N
 2  i 1
N
  X i -  2
N

i 1
N
ÖRNEK: İstatistik dersi sınavına giren 5 öğrencinin aldığı notlar aşağıdaki tabloda
verilmiştir. Öğrencilerin aldığı notların (basit serinin) varyansını ve standart sapmasını
hesaplayınız?
İstatistik Notları (Xi)
Ortalama Sapmalar
Ortalama Mutlak Sapmalar
40
40 - 66 = -26
676
50
50 – 66 = -16
256
70
70 - 66 = 4
16
80
80 - 66 = 14
196
90
90 - 66 = 24
576
0
11
Yorum: Her bir öğrencinin notu aritmetik ortalamadan (66) ortalama olarak 18.5
standart sapma farklılık göstermektedir.
3.2.2. Tasnif Edilmiş Seride Standart Sapma ve Varyans
Tasnif edilmiş serilerde Varyans ve Standart Sapma aşağıdaki formül yardımıyla
hesaplanır.
k
 Ni  X i -  2
 2  i 1
k
 Ni
i 1

k
 Ni  X i -  2
i 1
k
 Ni
i 1
ÖRNEK: Maliye bölümü öğrencilerinin İstatistik final sınavı notlarının tasnif edilmiş
seri olarak aşağıda verilmiştir. Bu dağılımın (tasnif edilmiş serinin) varyansını ve
standart sapmasını hesaplayınız?
Öğrencilerin Ni
 X i - 
 X i -  2
Ni  X i -  2
Notları (Xi)
40
1
-30
900
900
50
2
-20
400
800
60
4
-10
100
400
70
6
0
0
0
80
4
10
100
400
90
2
20
400
800
100
1
30
900
900
Toplam
k
 N i =20
i 1
k
 Ni  X i -  2 =4200
i 1
12
k
 Ni X i
1400
İlk aşamada aritmetik ortalama hesaplanır.   i 1

 70.
k
20
 Ni
i 1
k
 Ni  X i -  2
 2  i 1

k
 Ni
4200
 210
20
i 1

k
 Ni  X i -  2
i 1
k
 Ni

4200
 14.5 .
20
i 1
Yorum: Her bir öğrencinin notu aritmetik ortalamadan (70) ortalama olarak 14.5
standart sapma farklılık göstermektedir.
3.2.3. Gruplanmış Seride Standart Sapma ve Varyans
Gruplanmış serilerde Varyans ve Standart Sapma aşağıdaki formül yardımıyla
hesaplanır.
k
 Ni  mi -  2
 2  i 1
k
 Ni
,
i 1
k
 Ni  mi -  2
i 1
k
 Ni
i 1
Gruplanmış serilerde
Sınıflar
Ni
mi
Nimi
 mi   
 mi   
2-6’dan az
2
4
8
-7.6
57.76
115.52
6-10’dan az
1
8
8
-3.6
12.96
12.96
10-14’ten az
3
12
36
0.4
0.16
0.48
14-18’den az 4
16
64
4.4
19.36
77.44
Σ
10

Nimi
N
i

116
2
Ni  mi   
2
206.4
116
 11, 6
10
13
n
 N m   
N

i
i
i 1
2
,
i
206.4
 20.64  4.54
10
Gruplanmış seri olduğu için düzeltme gerekir.
s2
42
   
 20.64 
 19.14  4.375
12
12
1
2
Yorum: Her bir terimin değeri aritmetik ortalamadan (11.6) ortalama olarak 4.375
standart sapma farklılık göstermektedir.
3.2.4. Standart sapma kareli ve aritmetik ortalama yardımıyla şu şekilde
hesaplanır.
  K 2   2 . Bunun için önce kareli ortalamanın ve aritmetik ortalamanın kareleri
hesaplanır. Bir önceki örneğe uygulayalım:
K2 
Nm
N
i
2
i

i
1552
2
 155.2 , X 2  11.6   134.56
10
  155.2 134.56  20.64  4.54
Gruplanmış seri olduğu için düzeltme gerekir.
1   2 
s2
42
 20.64 
 19.14  4.375 .
12
12
ÖRNEK: Tabloda verilen gruplanmış serinin varyansını bunuz?
Sınıflar
Ni
mi
Ni mi
Nimi 2
2-4’den az
2
3
6
18
4-6’dan az
3
5
15
75
6-8’den az
7
7
49
343
8-10’dan az 4
9
36
324
106
760
Σ
X
16
Nm
N
i
i
i

106
 Nimi 2  47.5
 6.625 , K 2 
16
 Ni
 2  47.5   6.625  3.61
2
14
 
2 1
 3.61 
4
 3.27  3.61.
12
Alternatif olarak aşağıdaki şekilde de standart sapma hesaplanabilir.
Sınıflar
Ni
mi
N i  mi  X 
N i  mi  X  2
2-4’den az
2
3
2(3.625)=7.25
26.28125
4-6’dan az
2
5
2(1.625)=3.25
5.28125
6-6.625’den az
2.1875
6.3125
2.1875(0.3125)=0.6836 0.2136
6.625-8’den az
4.8125
7.3125
4.8125(0.6875)=3.3086 2.2746
8-10’dan az
4
9
4(2.375)=9.5
22.5625
Toplam
16
23.9922
56.6132
2 
56.6132
 3.54
16
3.2.5. Standart Sapma ve Varyansın Özellikleri
1. Bir serinin bütün terimlerine aynı sayı eklenir veya toplanırsa serinin varyansı
değişmez.
  X  k    X  k 
2
i
a)
N
2
i
N
  X  k    X  k 
i
b)
 X  X 

N
2
 X  X 

i
N

V  X  k V X 

V  X  k V X 
2
Bir seriye k sayısı çıkartılır veya toplanırsa aritmetik ortalama k kadar artar veya azalır
ancak serinin standart sapması değişmez.
2. Bir serinin bütün terimlerini aynı sayıyla çarptığımızda ya da böldüğümüzde, varyans
çarpılan sayının karesi ile orantılı olarak büyür ya da bölümün karesiyle orantılı olarak
küçülür.
Yine burada terimler bir sayı ile çarpılırsa aritmetik ortalama o sayı kadar büyür ve
bölünürse küçülür özelliğinden hareketle;
a)
  LX  LX 
i
N
2
 X  X 
L.
2
i
N
2
V  LX   L2V  X 
15
2
 Xi X 
  L  L  1   Xi  X 2
b)
 2.
N
L
N
X
V
L
 1
  2 V X 
 L
3. Birbiriyle ilişkili iki serinin terimlerinin karşılıklı toplanması (veya çıkarılması)
sonucu elde edilen serinin varyansı, bu serilerin varyansları toplamı (çıkarımı)
kovaryansının 2 katının toplamına (farkına) eşittir.
Yine iki serinin terimlerinin karşılıklı olarak aritmetik ortalaması bu serilerin aritmetik
ortalamalarının toplamına eşittir; aritmetik ortalama özelliğinden yararlanarak;
  X  Y    X  Y 
i
a)
i
N
2
  X  X   Y  Y 

i
2
i
N
  X  X    Y  Y 
=
2
i
2
i
=
 2  Xi  X Yi  Y 
N
V  X  Y   V  X   V Y   2Cov  XY 
  X  Y    X  Y 
i
b)
i
N
2
  X  X   Y  Y 

i
N
  X  X    Y  Y 

i
2
i
2
2
i
 2  Xi  X Yi  Y 
N
V  X  Y   V  X   V Y   2Cov  XY 
Kovaryans seriler arası ilişkinin varlığını ve yönünü belirleyen bir özelliğe sahiptir.
4. Birbirinden bağımsız iki serinin terimlerinin karşılıklı olarak toplanması
(çıkartılması) suretiyle elde edilen serinin varyansı, bu serilerinin varyansları
toplamına (çıkarımına) eşittir.
Çünkü X ve Y bağımsız iki seri ise; Cov(X,Y)=0’dır. Ve
V  X Y   V  X   V Y 
5.  > OMS’dır.
3.3.
DEĞİŞİM KATSAYISI (DK)
Ölçüm birimleri aynı olan iki serinin dağılımının değişkenliğini karşılaştırmak mümkün
iken farklı ölçü birimleri kullanan iki serinin dağılımının değişimlerini gösteren standart
sapmalarını karşılaştırılarak serilerin değişkenliğini kıyaslamak mümkün değildir. Bu
nedenle serilerin standart sapmasının ortalamasına göre yüzdesi alınarak “DEĞİŞİM
KATSAYISI” hesaplanır. Farklı ölçü birimlerine sahip serilerin değişim katsayıları
yardımıyla değişkenlikleri karşılaştırılabilir. Değişim katsayısının formülü aşağıda
verilmiştir.
16
Bu formül yardımıyla hesaplanan değişim katsayılarında ölçü birimleri ortadan kalkarak
farklı ölçümlü serilerin değişkenliği bu oranlar karşılaştırılarak yapılabilir.
ÖRNEK: Tabloda 5 kişiye ait yaş ve ağırlıklardan vermektedir. Bu kişilerin yaş ve
ağırlıklarından oluşan bu iki serinin değişkenliklerini karşılaştırınız.
2
2
Yaş (Yıl)
(Xi - µyaş)
Ağırlık (Kilogram)
(Xi - µağırlık)
20
400
52
576
30
100
70
36
40
0
75
1
50
100
85
81
60
400
98
484
Yaş ve ağırlık farklı ölçü birimleri ile ölçüldüğünden standart sapmalarına bakarak
serilerin değişimlerini karşılaştırmak sağlıklı olmaz. Değişim katsayılarını
hesaplamamız gerekir.
µyaş =
, µağırlık =
kg
1000
 14.14 yıl.
σyaş =
5
1178
 15.35 kğ.
σağırlık =
5
Yaş ve ağırlıklardan oluşan iki serinin standart sapmalarını karşılaştırdığımızda ağırlık
serisindeki değişimin daha fazla olduğu sonucu ortaya çıkmaktadır ki bu sonuç bizi
yanıltır. İki serinin ölçü birimleri farklı olduğundan standart sapmalarını karşılaştırarak
böyle bir sonuca varmak yanıltıcı olacaktır. Doğru yöntem her iki serinin değişim
katsayılarını karşılaştırmaktır.
17
DKyaş =
14.14
100  35.35
40
DKağırlık =
15.35
100  20.2
76
Ağırlık serisinin standart sapması daha yüksek olmasına rağmen, yaş serisinin değişim
katsayısı daha yüksektir. Dolasıyla yaş serisinin değişkenliği ağırlık serisinden daha
yüksektir.
Gruplanmış serilerde düzeltilmiş standart sapma uygulanır.
4. ÖRNEKLEMİN VARYANS VE STANDART SAPMASININ HESABI
Örneklemin varyansı basit serilerde aşağıdaki formül yardımıyla hesaplanır.
S2 = Örneklemin varyansı.
= Örneklemin aritmetik ortalaması.
n = Örneklemin gözlem sayısı, örneklem hacmi.
n-1 = Serbestlik derecesi. Örnekten bir değer hesaplanırken parametre yerine kullanılan
her istatistik için gözlem sayısından bir eksiltilir. Burada μ yerine X hesaplanmıştır.
Bundan dolayı hesaplamada örneklem gözlem sayısından bir çıkartılmıştır.
Örneklemin standart sapması aşağıdaki formül yardımıyla hesaplanır.
S= Örneklemin standart sapması.
ÖRNEKLEMİN STANDART SAPMASI
Basit Serilerde
Sınıflanmış Serilerde
Gruplanmış Serilerde

k
 ni X i - X

k
 ni mi -X
n
s
 Xi -X
i 1
n-1

2
s
i 1

2
k
 ni -1
i 1
5.
s
i 1


2
k
 ni -1
i 1
STANDART SAPMANIN FAYDALARI
1. Terimlerin ortalamadan sapmalarının kareleri toplamı dolayısıyla varyans
minimumdur.
18
2. Standart sapma serinin yayganlığı hakkında bilgi veriri. Standart sapma büyüdükçe
(küçüldükçe) serinin grafiğinin yayganlığı artar (azalır).
3. Gözlem değerlerini aritmetik ortalamadan sapmalarını standart sapma cinsinden
ifade edebiliriz. Diğer bir ifade ile z normal değişkenini oluştururken standart
sapmadan yararlanırız.
Örneğin istatistik sınavının ortalaması 60 ve standart sapması 10 olsun. Bir öğrenci bu
sınavdan 90 almıştır. Bu öğrenci ortalamadan 30 puan fazla almıştır. Standart sapma
cinsinden ise ortalamadan 3 standart sapma daha yüksek almıştır.
4. Seri terimlerinin cebirsel sapmalarını standart sapmanın katları cinsinden
ölçülmesinde kullanılır. Aynı ölçü birimini kullanan farklı serilerdeki gözlem
değerlerini standart sapma cinsinden karşılaştırabiliriz.
Örneğin bir öğrenci istatistik dersi birinci vizesinden 40 (
) ve ikinci
vizesinden 80 (
) almıştır. Bu öğrenci ilk vizede sınıf ortalamasından
10 puan ikinci sınavda ise 20 puan yüksek not almıştır. Standart sapma cinsinden
hesapladığımızda, bu öğrenci ilk vizede sınıf ortalamasından 2 standart sapma ve ikinci
sınavda ise sınıf ortalamasından 1 standart sapma daha yüksek not almıştır. Dolayısıyla
öğrenci birinci vizede daha başarılıdır.
6. TOPLANMA ORANI
Günlük hayatımızda gelirlerin eşit dağılmadığı görülür. T.O. iktisadi faktörlerin az
sayıda büyük ellerde toplanıp toplanmadığını; eşit dağılıp dağılmadığını veya dağılımın
eşitsizlik seviyesini belirlemek için kullanılır.
Nicel bölünme serilerinden sınıflanmış serilerle gruplanmış serilerde belirli seviyelerin
altında kalan kümülatif oransal frekanslarla bunlara tekabül eden kümülatif oransal
toplam kıymetler arasında bir kıyaslama yapmayı sağlamak üzere toplanma serisi
oluşturulur.
Sonra şu formül yardımıyla toplanma oranı oluşturulur.
k 1
 p  q 
i
T .O. 
i 1
i
k 1
p
100
i
i 1
pi= Nispi kümülatif frekans değerleri.
qi= “(frekans)x(terim)” değerlerinin nispi kümülatif frekans değerleri.
k= sınıf sayısı,
pi-qi  (-) olamaz, pi-qi > 0.
0  T .O.  1' dir.
19
Grafikteki 45 derecelik çizgi pi=qi olduğunu gösterir.
T .O. 
Taralı Alan


A O C A


T.O.=0 ise birimlerin tam eşit dağılımını, T.O.=1 ise birimlerin tek bir yerde veya tek
bir elde toplandığını gösterir. 0 < T.O.< 0.5 terimlerin sınıflar arasında eşit dağıldığını
gösterir.
Toplanma oranının 1’e yaklaşması dağılımda eşitsizliğin arttığını gösterir.
Toplanma oranının 0’a yaklaşması dağılımda eşitliğin arttığını gösterir.
Eşit dağılma 450 ’lik bir açı yapar. 450 ’lik açılı doğru ile eğri arasında kalan gölgeli
alana “toplanma alanı” adı verilir. Seri eşit dağılmadan uzaklaştıkça bu alan genişler.
k
pi 
k
 Ni
i 1
N
NX
q 
NX
ve
i
i
i
i
i
i
i 1
k 1
k 1
 pi  qi 

i 1
T .O. 
;

k 1
i 1
pi
 p  q 
i
T .O. 
i 1
i
k 1
p
i
i 1
Basit Serilerde T aralı Alan değeri sıfırdır ve T.O.=0 olup tam eşit dağılımı ifade eder.
6.1.
Sınıflanmış Serilerde Toplanma Oranının Hesabı
20
ÖRNEK: X serisinin değerleri ve frekansları aşağıdaki gibi verilmiş olsun. Buna göre
toplanma oranını bulalım.
Xi
Ni
Ni.Xi
ΣNi
ΣNiXi
%pi
%qi
%(pi-qi)
20
40
800
40
800
40
19
21
40
25
1000
65
1800
65
42.8
22.2
60
20
1200
85
3000
85
71.4
13.6
80
15
1200
100
4200
100
100
0
Toplam ΣNi=100
ΣNiXi=4200
k 1
 p =190
Σ(pi-qi)=56.8
i
i
k
% pi 
 Ni
i 1
k
N
k
NX
i
.100 %qi 
i
NX
i
i 1
i
i 1
k
.100
i
i 1
%pi’lerin ΣNi’lerin en sonuncusu %100 kabul edilmek suretiyle pi’ler bulunur;
40
.100  40
100
65
.100  65
100
85
.100  85
100
100
.100  100
100
%qi’lerin ΣNiXi’lerin en sonuncusu %100 kabul edilerek qi’ler bulunur.
800
.100  19
4200
1800
.100  42.8
4200
3000
.100  71.4
4200
4200
.100  100
4200
Şimdi toplanma oranını hesaplayalım. Seride 4 sınıf mevcuttur. Bundan dolayı pi, ve
(pi-qi) farklarının ilk üçü toplanması gerekmektedir.
%pi’lerin ilk üçü sırasıyla; 40+65+85=190’dır.
Ve %(pi-qi) farklarının ilk üç toplamı ise 56.8’dir.
k 1
 p  q 
i
T .O. 
i =1
i
k 1
p
i
x100 
 0.40-0.19  +  0.65-0.428 +  0.85-0.714  x100
0.40+0.65+0.85
i =1
T.O.=
6.2.
56.8
 0.3<0.5 olduğundan adildir
190
Gruplanmış Serilerde Toplanma Oranının Hesabı
21
ÖRNEK: X serisinin grupları ve frekansları aşağıdaki gibi verilmiş olsun. Buna göre
toplanma oranını bulalım.
Sınıflar
Ni
mi Nimi
ΣN i
ΣNi mi %pi
%qi
%(pi-qi)
8-12’den az
8
10
80
8
80
16
10.05
5.95
12-16’dan az
20
14
280
28
360
56
45.23
10.77
16-20’den az
12
18
216
40
576
80
72.30
7,64
20-24’den az
10
22
220
50
796
100
100
-
Toplam
ΣNi=50
ΣN i mi=796
k 1
k 1
 pi =152
 ( p -q ) =24.36
i
i
%pi’ler için;
8
.100  16
50
28
.100  56
50
80
.100  10.05
796
%qi’ler için;
40
.100  80
50
360
.100  45.23
796
i
i =1
50
.100  100
50
576
.100  72.36
796
k 1
 p  q 
i
T .O. 
i =1
i
k 1
p
x100 
 0.1600-0.1005 +  0.5600-0.4523 +  0.800-0.723 x100
0.16+0.56+0.80
i
i =1
T .O. 
5.95+10.77+7.64 24.36

 0.16 < 0.5 adildir.
16+56+80
152
ÖRNEK: Aşağıda şehir büyüklükleri ve sayıları verilen tabloda nüfusun şehirlere ne
derece eşit dağıldığını belirleyiniz?
Şehir büyüklükleri
Ni
NiXi
ΣN i
ΣN i X i
0-10000’den az
2
4000
2
4000
10- 20000’den az
3
31500
5
20000-30000’den az 4
87000
30000-40000’den az
377500
11
%pi
%qi
%(pi-qi)
10
0.8
9.2
35500
25
7.1
17.9
9
122500
45
24.5
19.5
20
500000
100
100
-
22
ΣN i=20
Toplam
ΣN iXi=500000
k 1
 p =80
i
46.6
i
%pi’ler için;
%qi’ler için;
2
.100  10
20
5
.100  25
20
4000
.100  0.8
500000
9
.100  45
20
35500
.100  7.1
500000
20
.100  100
20
122500
.100  24.5
500000
9.2  17.9  19.5 46.6

 0.5825 > 0.5 adil değildir. Nüfus eşit olarak şehirlere
10  25  45
80
dağılmamıştır.
T .O. 
KAYNAKLAR:
Yılmaz Özkan, Uygulamalı İstatistik 1, Sakarya Kitapevi, 2008.
Özer Serper, Uygulamalı İstatistik 1, Filiz Kitapevi, 1996.
Meriç Öztürkcan, İstatistik Ders notları, YTÜ.
Andım Oben Balce ve Serdar Demir, İstatistik Ders Notları, Pamukkale Üniversitesi,
2007.
5. Ayşe Canan Yazıcı, Biyoistatistik Ders Notları, Başkent Üniversitesi.
6. Zehra Muluk ve Yavuz Eren Ataman, Biyoistatistik ve Araştırma Teknikleri Ders
Notları, Başkent Üniversitesi.
1.
2.
3.
4.
23
Download