İstatistik ve Olasılık

advertisement
Merkezi eğilim ve dağılma ölçüleri
İstatistik ve Olasılık
Ders 3: MERKEZİ EĞİLİM VE
DAĞILMA ÖLÇÜLERİ
Prof. Dr. İrfan KAYMAZ
Atatürk Üniversitesi
Tanım
Merkezi eğilim ve dağılma ölçüleri
Araştırma sonuçlarının açıklanmasında frekans tablosu ve poligonu istenilen
bilgiyi her zaman sağlamayabilir.
Verilerin merkezileştiği noktanın değeri nedir?
Dağılımın değişkenlik durumu ne ölçüdedir?
soruların cevaplanabilmesi için dağılımı karakterize eden bazı değerlerin
hesaplanması gerekir. Bu amaçla veri grubuna ilişkin yer ve dağılma ölçülerinden
yararlanılır.
Merkezi Eğilim Ölçüleri
Dağılım (Değişim) Ölçüleri
Aritmetik Ortalama
Değişim Genişliği
 Ağırlıklı (Tartılı) Ortalama
Varyans
Geometrik Ortalama
Standart Sapma
Harmonik Ortalama
Varyasyon Katsayısı
Medyan (Ortanca)
Mod (Tepe Değeri)
Atatürk Üniversitesi
Aritmetik Ortalama
Merkezi eğilim ve dağılma ölçüleri
Dağılımın yerinin belirlenmesinde kullanılır. Tek başına ortalama teriminden
aritmetik ortalama anlaşılır.
Basit aritmetik ortalama herhangi bir konu ile ilgili gözlemlerin toplamının
toplam gözlem sayısına bölümü ile bulunur.
X1, X2, X3,......, Xn gözlenen örnek değerlerini göstermek üzere aritmetik
ortalama:
n
Xi
X1  X 2  X 3  ........ X n 
X
 i1
n
n
Atatürk Üniversitesi
Merkezi eğilim ve dağılma ölçüleri
Aritmetik Ortalama
Aritmetik ortalamanın iki önemli özelliği vardır:
1. Verilerin, aritmetik ortalamadan sapmalarının toplamı sıfıra eşittir.
n
n
n
n
n
n X i
i1
i1
i1
i1
n
 ( X i  X)  0   X i   X  0   X i 
i1
0
2. Verilerin, aritmetik ortalamadan sapmalarının kareleri toplamı
minimumdur. Herhangi bir değeri a ile gösterirsek ifade aşağıdaki gibi
yazılabilir.
n
n
i1
i1
 ( X i  X) 2   ( X i  a )
2
Atatürk Üniversitesi
Ağırlıklı Ortalama
Merkezi eğilim ve dağılma ölçüleri
Bazı durumlarda verilerin aritmetik ortalaması sonuç hakkında pek fazla
açıklayıcı bilgi taşımaz.
Örneğin farklı krediye sahip dersler almış olan bir öğrencinin başarı ortalaması
hesaplanırken aritmetik ortalama ile anlamsız sonuçlar bulunur.
Böylesi durumlarda verilerin gözlenen frekansları ile çarpılıp toplanması ve elde
edilen değerin toplam frekansa bölünmesi ile bulunan değer kullanılır.
Bu işleme ağırlıklı ortalama denir.
Xi gözlenen i. veri, Wi i. verinin gözlenen ağırlığı (frekansı) olmak üzere ağırlıklı
ortalama:
n
X
 Wi X i
i1
n
 Wi
i1
Atatürk Üniversitesi
Ağırlıklı Ortalama
Merkezi eğilim ve dağılma ölçüleri
Örnek 1:
Bir öğrencinin almış olduğu derslere ilişkin krediler ve notlar aşağıda verilmiştir.
Ders
Kredi
Not
Matematik
6
54
Kimya
4
50
Makina Bilgisi
2
54
Teknik Resim
5
51
Ölçme Tekniği
3
67
Öğrencinin başarı notunu;
a) Aritmetik ortalama yöntemiyle hesaplayınız.
b) Ağırlıklı ortalama yöntemiyle hesaplayınız.
c) Hangi yöntemin sonucu kullanılmalıdır? Neden?
Atatürk Üniversitesi
Ağırlıklı Ortalama
Merkezi eğilim ve dağılma ölçüleri
Çözüm 1:
a) X  54  50  54  51  67  276  55.2
5
b) X 
5
6 * 54  4 * 50  2 * 54  5 * 51  3 * 67 1088

 54.4
6 4 2 5 3
20
c) Gözlenen değerlerin (öğrencinin notlarının) frekansları (kredileri)
farklı olduğundan ağırlıklı ortalama kullanılmalıdır.
Atatürk Üniversitesi
Geometrik Ortalama
Merkezi eğilim ve dağılma ölçüleri
Özellikle eşit zaman aralığı ile değişen oranların ortalamasının hesaplanmasında
(örneğin, nüfus artışı, faiz gibi olaylarda ortalama artış hızını hesaplayabilmek
için) geometrik ortalama kullanılır. Geometrik ortalama:
GO  n X1 * X 2 * X 3 *.......*Xn
Örnek 2:
Akaryakıt fiyatlarında ardışık 3 yıldaki fiyat artışı %15, %20 ve %24 olarak
gerçekleşmiştir. Ortalama artış oranını hesaplayınız.
Çözüm 2:
GO  3 15 * 20 * 24  %19.309
Atatürk Üniversitesi
Harmonik Ortalama
Merkezi eğilim ve dağılma ölçüleri
Verilerin terslerinin ortalamasının tersi harmonik ortalamayı verir.
HO 
n
1
1
1

 ........
X1 X 2
Xn

1
1 n 1

n i1 X i
Oran şeklinde türetilmiş verilerde, oran elde edilirken, d/t, eğer pay (d) sabit
payda (t) değişken ise oranların ortalaması harmonik ortalama ile hesaplanır.
Bunun tersi durumda ise aritmetik ortalama kullanılır.
Örneğin, hız=yol/zaman veya fiyat=para/mal şeklinde ifade edilen olaylarda;
zamanın değişken gidilen yolun sabit, alınan mal miktarının değişken paranın
sabit olması halinde harmonik ortalama kullanılır.
Atatürk Üniversitesi
Merkezi eğilim ve dağılma ölçüleri
Harmonik Ortalama
Örnek 3:
Bir sürücü 200 km’lik yolu 2 saatte gitmiş ve 4 saatte dönmüştür. Bu yolculukta
sürücünün ortalama hızını hesaplayınız.
Çözüm 3:
Hız=yol/zaman Gidiş hızı=200/2=100km/s Dönüş hızı=200/4=50km/s
HO 
1
1 1
1

2  100 50 

2
1
1

100 50
 66.67km / s
Üç ortalama arasında:
AO  GO  HO
ilişkisi vardır.
Bütün değerlerin aynı olması halinde ilişki eşitlik halinde gerçekleşir.
Atatürk Üniversitesi
Medyan (Ortanca)
Merkezi eğilim ve dağılma ölçüleri
Verilerin küçükten büyüğe veya büyükten küçüğe sıralanması halinde ortaya
düşen değer (veri sayısı tek ise) veya ortaya düşen iki değer çiftinin ortalaması
(veri sayısı çift ise) medyan olarak adlandırılır. n veri sayısını göstermek üzere;
Gruplandırılmış verilerde (frekans tablosunda) medyan hesabı:
L: Medyan sınıfının alt sınırı
N
N: Toplam gözlem sayısı
 Fb
Medyan  L  2
* c c: Sınıf aralığı (genişliği)
Fmed
Fmed: Medyan sınıfının frekansı
Fb: Medyan sınıfından önceki sınıfların frekans toplamı
Medyan ortalamaya nazaran uç değerlerden etkilenmez veya çok az etkilenir ve
daha az işlem yükü getirir. Sayılan bu yararlarına karşın ortalama gibi analitik bir
değere sahip değildir. Medyanın standart sapması ortalamanınkinden büyüktür
Atatürk Üniversitesi
Mod (Tepe Değeri)
Merkezi eğilim ve dağılma ölçüleri
Verilerin içinde en çok tekrarlanan (frekansı en büyük olan) değer mod olarak
adlandırılır.
Gruplandırılmış verilerde (frekans tablosunda) mod hesabı aşağıdaki formül
yardımıyla yapılmaktadır.
L: Mod sınıfının alt sınırı
d1
d1: Mod sınıfı frekansı ile bir önceki sınıf frekansı
Mod  L 
*c
arasındaki fark
d1  d 2
d2: Mod sınıfı frekansı ile bir sonraki sınıfın frekansı
arasındaki fark
c: Sınıf aralığı (genişliği)
Frekansı en yüksek olduğu sınıf mod sınıfı olarak adlandırılır.
Mod değerinin anlamlı olabilmesi için gözlem sayısının çok fazla olması gerekir.
Bazen veri gurubunun birden fazla modu olabilir. Bu durum, ilgili anakütlenin
birkaç alt gruptan meydan geldiğini gösterir.
mod veri grubundaki uç değerlerden etkilenmez.
Atatürk Üniversitesi
Merkezi eğilim ve dağılma ölçüleri
Mod (Tepe Değeri)
Örnek 4:
Aşağıdaki verilerin modunu ve medyanını belirleyiniz.
120
100
130
100
160
130
86
100
94
90
Çözüm 3:
Verileri küçükten büyüğe sıralayalım.
1.değer
2.değer
3.değer
4.değer
5.değer
6.değer
7.değer
8.değer
9.değer
10.değer
86
90
94
100
100
100
120
130
130
160
Veri grubunda en çok tekrarlanan değer 100 olduğu için Mod=100
Veri sayısı n=10  çift
Atatürk Üniversitesi
Merkezi eğilim ve dağılma ölçüleri
Örnek
Malzeme testinde elde edilen veriler aşağıdaki gibi sınıflandırılmıştır.
Sınıf Sınırları Sınıf Değeri
1 200-220
210
2 220-240
230
3 240-260
250
4 260-280
270
5 280-300
290
Frekans
7
9
7
4
3
Mod ve Medyanı hesaplayınız.
Atatürk Üniversitesi
Dağılım Ölçüleri
Merkezi eğilim ve dağılma ölçüleri
Yer (merkezi eğilim) ölçüleri tek başına dağılımı karakterize etmez.
Verilerin yer ölçülerinden uzaklık durumlarını, yani değişkenliklerini belirtmek
için diğer bazı ölçülerin kullanılması gerekir.
Verilerin değişkenlik durumunu ve dağılım şeklini belirlemek için kullanılan
ölçülere dağılım ölçüleri denir.
İki veri grubu ortalamasının eşit olması dağılımlarının aynı olmasını
gerektirmez. Dağılım şeklinin ve değişkenliğinin karşılaştırılması dağılım ölçüleri
ile belirlenir.
Dağılım (Değişim) Ölçüleri
Değişim Genişliği
Varyans
Standart Sapma
Varyasyon Katsayısı
Atatürk Üniversitesi
Değişim Genişliği
Merkezi eğilim ve dağılma ölçüleri
Değişkenliğin en basit ölçüsüdür.
Atatürk Üniversitesi
Varyans
Merkezi eğilim ve dağılma ölçüleri
Verilerin ortalamasından sapmalarının büyüklüğü dağılımın değişkenliğini
gösteren iyi bir ölçüdür. Yaygın olarak kullanılan bu değişkenlik ölçüsü
varyanstır.
Varyansın büyüklüğü veri grubundaki değişkenliğin fazlalığını ve veri grubunun
dağılımının yayvanlığını gösterir.
Varyans, değişim genişliğinden daha hassas bir ölçüdür. Öte yandan, varyansın
birimi olmadığından bazı durumlarda verilerin elde edildiği birime sahip bir ölçü
kullanılması daha uygun olmaktadır. Böyle bir ölçü varyansın karekökü olan
standart sapmadır.
Atatürk Üniversitesi
Standart Sapma
Merkezi eğilim ve dağılma ölçüleri
Dağılım ölçüsünü fiziksel anlamı olan bir büyüklük şeklinde ifade etmek için
varyansın karekökü alınır ve buna standart sapma denir.
Örnek standart sapmasının ve varyansının paydasında bulunan n-1
ifadesi serbestlik derecesi olarak adlandırılır.
Atatürk Üniversitesi
Varyasyon Katsayısı
Merkezi eğilim ve dağılma ölçüleri
Verilerin değişkenliğini kendi ortalamalarına oranla ifade etmek için kullanılan bir
ölçüdür. Değişim Katsayısı olarak da adlandırılır.
Ortalamaları birbirinden farklı olan anakütlelerin değişkenliklerinin
karşılaştırılmasında değişim katsayısı ölçüsü kullanılmalıdır.
Değişim katsayısının büyüklüğü arttıkça istenilen değerden uzaklaşıldığı
söylenebilir
Atatürk Üniversitesi
Örnek
Merkezi eğilim ve dağılma ölçüleri
Örnek 5:
Bir üretim hattından kg olarak alınan ağırlık ölçümleri
35
40
45
30
40
50
35
38
42
olarak belirlendiğine göre verilerin değişim genişliğini, varyansını, standart
sapmasını ve değişim katsayısını hesaplayınız.
44
Çözüm 5: DG=50-30=20
_
X
35  40  45  30  40  50  35  38  42  44
 39.9
10
2
2
2
(
35

39
.
9
)

(
40

39
.
9
)

..............

(
42

39
.
9
)
S2 
 33.21
10  1
S  33.21  5.76
5.76
DK 
* 100  %14.44
39.9
Atatürk Üniversitesi
Çarpıklık ve Basıklık
Merkezi eğilim ve dağılma ölçüleri
Çarpıklık
Normal dağılımda simetrikliğin bozulma derecesi çarpıklık olarak ifade edilir.
Dağılım sağa doğru uzun kuyruklu ise sağa çarpık, sola doğru uzun kuyruklu ise
sola çarpık olarak adlandırılır. Çarpıklık katsayısı :
n
3
(
X


)
 i
i 1
3 
n
3
m3
 3

Hesap sonunda bulunan katsayıya göre dağılımın yorumu aşağıdaki gibi yapılır:
Atatürk Üniversitesi
Merkezi eğilim ve dağılma ölçüleri
Çarpıklık ve Basıklık
Basıklık
Normal dağılım eğrisinin sivrilik ya da basıklık derecesi
n
 ( Xi   ) 4
i 1
4 
n
4
m4
 4

Hesap sonunda bulunan katsayıya göre dağılımın yorumu aşağıdaki gibi yapılır:
Atatürk Üniversitesi
Kartiller
Merkezi eğilim ve dağılma ölçüleri
 Bir seriyi küçükten büyüğe sıralandığında 4 eşit parçaya bölen
değere kartil denir.
– Dataların 25%’i Q1’den az
– Dataların 50%’si Q2’den az: Medyan
– Dataların 75%’i Q3’den az
Atatürk Üniversitesi
Merkezi eğilim ve dağılma ölçüleri
Kartiller
SINIFLANDIRILMIŞ VERİLER İÇİN:
𝑓
− 𝑓𝑖
4
𝑄1 = 𝐿𝑄1 +
×𝑐
𝑓𝑄1
𝑄3 = 𝐿𝑄3 +
𝑓
− 𝑓𝑖
2
𝑄2 = 𝐿𝑄2 +
×𝑐
𝑓𝑄2
3
4
𝑓
−
𝑓𝑄3
𝑓𝑖
×𝑐
Atatürk Üniversitesi
Merkezi eğilim ve dağılma ölçüleri
Kartiller:Örnek
Aluminyum-Lityum alaşımının bası dayanımı ile ilgili yapılan 80 deneyin sonuçları
aşağıda verilmiştir.
105
97
245
163
207
134
218
199
160
196
221
154
228
131
180
178
157
151
175
201
183
153
174
154
190
76
101
142
149
200
186
174
199
115
193
167
171
163
87
176
121
120
181
160
194
184
165
145
160
150
181
168
158
208
133
135
172
171
237
170
180
167
176
158
156
229
158
148
150
118
143
141
110
133
123
146
169
158
135
149
Verileri sınıflandırıp kartilleri hesaplayınız.
Atatürk Üniversitesi
Box ve Whisker Grafiği
Merkezi eğilim ve dağılma ölçüleri
Kutu Grafiği verilerin merkezi, yayılımı şeklini ve üç değerlerini
gösterir.
Bu grafikte;
• Minimum değeri
• First kartili,
• Medyanı
• 3.Kartili
• Maksimum değeri gösterir.
Atatürk Üniversitesi
Box ve Whisker Grafiği
Merkezi eğilim ve dağılma ölçüleri
Atatürk Üniversitesi
Comparative Box Plots
Descriptive Statistics
 Comparative box plots of a quality index at three manufacturing
plants.
 Comment: Plant 2 has too much variability. Plants 2 & 3 need
to raise their quality index performance.
Atatürk University
Gelecek dersin konusu
Merkezi eğilim ve dağılma ölçüleri
Olasılık…..
Atatürk Üniversitesi
Download