Merkezi eğilim ve dağılma ölçüleri İstatistik ve Olasılık Ders 3: MERKEZİ EĞİLİM VE DAĞILMA ÖLÇÜLERİ Prof. Dr. İrfan KAYMAZ Atatürk Üniversitesi Tanım Merkezi eğilim ve dağılma ölçüleri Araştırma sonuçlarının açıklanmasında frekans tablosu ve poligonu istenilen bilgiyi her zaman sağlamayabilir. Verilerin merkezileştiği noktanın değeri nedir? Dağılımın değişkenlik durumu ne ölçüdedir? soruların cevaplanabilmesi için dağılımı karakterize eden bazı değerlerin hesaplanması gerekir. Bu amaçla veri grubuna ilişkin yer ve dağılma ölçülerinden yararlanılır. Merkezi Eğilim Ölçüleri Dağılım (Değişim) Ölçüleri Aritmetik Ortalama Değişim Genişliği Ağırlıklı (Tartılı) Ortalama Varyans Geometrik Ortalama Standart Sapma Harmonik Ortalama Varyasyon Katsayısı Medyan (Ortanca) Mod (Tepe Değeri) Atatürk Üniversitesi Aritmetik Ortalama Merkezi eğilim ve dağılma ölçüleri Dağılımın yerinin belirlenmesinde kullanılır. Tek başına ortalama teriminden aritmetik ortalama anlaşılır. Basit aritmetik ortalama herhangi bir konu ile ilgili gözlemlerin toplamının toplam gözlem sayısına bölümü ile bulunur. X1, X2, X3,......, Xn gözlenen örnek değerlerini göstermek üzere aritmetik ortalama: n Xi X1 X 2 X 3 ........ X n X i1 n n Atatürk Üniversitesi Merkezi eğilim ve dağılma ölçüleri Aritmetik Ortalama Aritmetik ortalamanın iki önemli özelliği vardır: 1. Verilerin, aritmetik ortalamadan sapmalarının toplamı sıfıra eşittir. n n n n n n X i i1 i1 i1 i1 n ( X i X) 0 X i X 0 X i i1 0 2. Verilerin, aritmetik ortalamadan sapmalarının kareleri toplamı minimumdur. Herhangi bir değeri a ile gösterirsek ifade aşağıdaki gibi yazılabilir. n n i1 i1 ( X i X) 2 ( X i a ) 2 Atatürk Üniversitesi Ağırlıklı Ortalama Merkezi eğilim ve dağılma ölçüleri Bazı durumlarda verilerin aritmetik ortalaması sonuç hakkında pek fazla açıklayıcı bilgi taşımaz. Örneğin farklı krediye sahip dersler almış olan bir öğrencinin başarı ortalaması hesaplanırken aritmetik ortalama ile anlamsız sonuçlar bulunur. Böylesi durumlarda verilerin gözlenen frekansları ile çarpılıp toplanması ve elde edilen değerin toplam frekansa bölünmesi ile bulunan değer kullanılır. Bu işleme ağırlıklı ortalama denir. Xi gözlenen i. veri, Wi i. verinin gözlenen ağırlığı (frekansı) olmak üzere ağırlıklı ortalama: n X Wi X i i1 n Wi i1 Atatürk Üniversitesi Ağırlıklı Ortalama Merkezi eğilim ve dağılma ölçüleri Örnek 1: Bir öğrencinin almış olduğu derslere ilişkin krediler ve notlar aşağıda verilmiştir. Ders Kredi Not Matematik 6 54 Kimya 4 50 Makina Bilgisi 2 54 Teknik Resim 5 51 Ölçme Tekniği 3 67 Öğrencinin başarı notunu; a) Aritmetik ortalama yöntemiyle hesaplayınız. b) Ağırlıklı ortalama yöntemiyle hesaplayınız. c) Hangi yöntemin sonucu kullanılmalıdır? Neden? Atatürk Üniversitesi Ağırlıklı Ortalama Merkezi eğilim ve dağılma ölçüleri Çözüm 1: a) X 54 50 54 51 67 276 55.2 5 b) X 5 6 * 54 4 * 50 2 * 54 5 * 51 3 * 67 1088 54.4 6 4 2 5 3 20 c) Gözlenen değerlerin (öğrencinin notlarının) frekansları (kredileri) farklı olduğundan ağırlıklı ortalama kullanılmalıdır. Atatürk Üniversitesi Geometrik Ortalama Merkezi eğilim ve dağılma ölçüleri Özellikle eşit zaman aralığı ile değişen oranların ortalamasının hesaplanmasında (örneğin, nüfus artışı, faiz gibi olaylarda ortalama artış hızını hesaplayabilmek için) geometrik ortalama kullanılır. Geometrik ortalama: GO n X1 * X 2 * X 3 *.......*Xn Örnek 2: Akaryakıt fiyatlarında ardışık 3 yıldaki fiyat artışı %15, %20 ve %24 olarak gerçekleşmiştir. Ortalama artış oranını hesaplayınız. Çözüm 2: GO 3 15 * 20 * 24 %19.309 Atatürk Üniversitesi Harmonik Ortalama Merkezi eğilim ve dağılma ölçüleri Verilerin terslerinin ortalamasının tersi harmonik ortalamayı verir. HO n 1 1 1 ........ X1 X 2 Xn 1 1 n 1 n i1 X i Oran şeklinde türetilmiş verilerde, oran elde edilirken, d/t, eğer pay (d) sabit payda (t) değişken ise oranların ortalaması harmonik ortalama ile hesaplanır. Bunun tersi durumda ise aritmetik ortalama kullanılır. Örneğin, hız=yol/zaman veya fiyat=para/mal şeklinde ifade edilen olaylarda; zamanın değişken gidilen yolun sabit, alınan mal miktarının değişken paranın sabit olması halinde harmonik ortalama kullanılır. Atatürk Üniversitesi Merkezi eğilim ve dağılma ölçüleri Harmonik Ortalama Örnek 3: Bir sürücü 200 km’lik yolu 2 saatte gitmiş ve 4 saatte dönmüştür. Bu yolculukta sürücünün ortalama hızını hesaplayınız. Çözüm 3: Hız=yol/zaman Gidiş hızı=200/2=100km/s Dönüş hızı=200/4=50km/s HO 1 1 1 1 2 100 50 2 1 1 100 50 66.67km / s Üç ortalama arasında: AO GO HO ilişkisi vardır. Bütün değerlerin aynı olması halinde ilişki eşitlik halinde gerçekleşir. Atatürk Üniversitesi Medyan (Ortanca) Merkezi eğilim ve dağılma ölçüleri Verilerin küçükten büyüğe veya büyükten küçüğe sıralanması halinde ortaya düşen değer (veri sayısı tek ise) veya ortaya düşen iki değer çiftinin ortalaması (veri sayısı çift ise) medyan olarak adlandırılır. n veri sayısını göstermek üzere; Gruplandırılmış verilerde (frekans tablosunda) medyan hesabı: L: Medyan sınıfının alt sınırı N N: Toplam gözlem sayısı Fb Medyan L 2 * c c: Sınıf aralığı (genişliği) Fmed Fmed: Medyan sınıfının frekansı Fb: Medyan sınıfından önceki sınıfların frekans toplamı Medyan ortalamaya nazaran uç değerlerden etkilenmez veya çok az etkilenir ve daha az işlem yükü getirir. Sayılan bu yararlarına karşın ortalama gibi analitik bir değere sahip değildir. Medyanın standart sapması ortalamanınkinden büyüktür Atatürk Üniversitesi Mod (Tepe Değeri) Merkezi eğilim ve dağılma ölçüleri Verilerin içinde en çok tekrarlanan (frekansı en büyük olan) değer mod olarak adlandırılır. Gruplandırılmış verilerde (frekans tablosunda) mod hesabı aşağıdaki formül yardımıyla yapılmaktadır. L: Mod sınıfının alt sınırı d1 d1: Mod sınıfı frekansı ile bir önceki sınıf frekansı Mod L *c arasındaki fark d1 d 2 d2: Mod sınıfı frekansı ile bir sonraki sınıfın frekansı arasındaki fark c: Sınıf aralığı (genişliği) Frekansı en yüksek olduğu sınıf mod sınıfı olarak adlandırılır. Mod değerinin anlamlı olabilmesi için gözlem sayısının çok fazla olması gerekir. Bazen veri gurubunun birden fazla modu olabilir. Bu durum, ilgili anakütlenin birkaç alt gruptan meydan geldiğini gösterir. mod veri grubundaki uç değerlerden etkilenmez. Atatürk Üniversitesi Merkezi eğilim ve dağılma ölçüleri Mod (Tepe Değeri) Örnek 4: Aşağıdaki verilerin modunu ve medyanını belirleyiniz. 120 100 130 100 160 130 86 100 94 90 Çözüm 3: Verileri küçükten büyüğe sıralayalım. 1.değer 2.değer 3.değer 4.değer 5.değer 6.değer 7.değer 8.değer 9.değer 10.değer 86 90 94 100 100 100 120 130 130 160 Veri grubunda en çok tekrarlanan değer 100 olduğu için Mod=100 Veri sayısı n=10 çift Atatürk Üniversitesi Merkezi eğilim ve dağılma ölçüleri Örnek Malzeme testinde elde edilen veriler aşağıdaki gibi sınıflandırılmıştır. Sınıf Sınırları Sınıf Değeri 1 200-220 210 2 220-240 230 3 240-260 250 4 260-280 270 5 280-300 290 Frekans 7 9 7 4 3 Mod ve Medyanı hesaplayınız. Atatürk Üniversitesi Dağılım Ölçüleri Merkezi eğilim ve dağılma ölçüleri Yer (merkezi eğilim) ölçüleri tek başına dağılımı karakterize etmez. Verilerin yer ölçülerinden uzaklık durumlarını, yani değişkenliklerini belirtmek için diğer bazı ölçülerin kullanılması gerekir. Verilerin değişkenlik durumunu ve dağılım şeklini belirlemek için kullanılan ölçülere dağılım ölçüleri denir. İki veri grubu ortalamasının eşit olması dağılımlarının aynı olmasını gerektirmez. Dağılım şeklinin ve değişkenliğinin karşılaştırılması dağılım ölçüleri ile belirlenir. Dağılım (Değişim) Ölçüleri Değişim Genişliği Varyans Standart Sapma Varyasyon Katsayısı Atatürk Üniversitesi Değişim Genişliği Merkezi eğilim ve dağılma ölçüleri Değişkenliğin en basit ölçüsüdür. Atatürk Üniversitesi Varyans Merkezi eğilim ve dağılma ölçüleri Verilerin ortalamasından sapmalarının büyüklüğü dağılımın değişkenliğini gösteren iyi bir ölçüdür. Yaygın olarak kullanılan bu değişkenlik ölçüsü varyanstır. Varyansın büyüklüğü veri grubundaki değişkenliğin fazlalığını ve veri grubunun dağılımının yayvanlığını gösterir. Varyans, değişim genişliğinden daha hassas bir ölçüdür. Öte yandan, varyansın birimi olmadığından bazı durumlarda verilerin elde edildiği birime sahip bir ölçü kullanılması daha uygun olmaktadır. Böyle bir ölçü varyansın karekökü olan standart sapmadır. Atatürk Üniversitesi Standart Sapma Merkezi eğilim ve dağılma ölçüleri Dağılım ölçüsünü fiziksel anlamı olan bir büyüklük şeklinde ifade etmek için varyansın karekökü alınır ve buna standart sapma denir. Örnek standart sapmasının ve varyansının paydasında bulunan n-1 ifadesi serbestlik derecesi olarak adlandırılır. Atatürk Üniversitesi Varyasyon Katsayısı Merkezi eğilim ve dağılma ölçüleri Verilerin değişkenliğini kendi ortalamalarına oranla ifade etmek için kullanılan bir ölçüdür. Değişim Katsayısı olarak da adlandırılır. Ortalamaları birbirinden farklı olan anakütlelerin değişkenliklerinin karşılaştırılmasında değişim katsayısı ölçüsü kullanılmalıdır. Değişim katsayısının büyüklüğü arttıkça istenilen değerden uzaklaşıldığı söylenebilir Atatürk Üniversitesi Örnek Merkezi eğilim ve dağılma ölçüleri Örnek 5: Bir üretim hattından kg olarak alınan ağırlık ölçümleri 35 40 45 30 40 50 35 38 42 olarak belirlendiğine göre verilerin değişim genişliğini, varyansını, standart sapmasını ve değişim katsayısını hesaplayınız. 44 Çözüm 5: DG=50-30=20 _ X 35 40 45 30 40 50 35 38 42 44 39.9 10 2 2 2 ( 35 39 . 9 ) ( 40 39 . 9 ) .............. ( 42 39 . 9 ) S2 33.21 10 1 S 33.21 5.76 5.76 DK * 100 %14.44 39.9 Atatürk Üniversitesi Çarpıklık ve Basıklık Merkezi eğilim ve dağılma ölçüleri Çarpıklık Normal dağılımda simetrikliğin bozulma derecesi çarpıklık olarak ifade edilir. Dağılım sağa doğru uzun kuyruklu ise sağa çarpık, sola doğru uzun kuyruklu ise sola çarpık olarak adlandırılır. Çarpıklık katsayısı : n 3 ( X ) i i 1 3 n 3 m3 3 Hesap sonunda bulunan katsayıya göre dağılımın yorumu aşağıdaki gibi yapılır: Atatürk Üniversitesi Merkezi eğilim ve dağılma ölçüleri Çarpıklık ve Basıklık Basıklık Normal dağılım eğrisinin sivrilik ya da basıklık derecesi n ( Xi ) 4 i 1 4 n 4 m4 4 Hesap sonunda bulunan katsayıya göre dağılımın yorumu aşağıdaki gibi yapılır: Atatürk Üniversitesi Kartiller Merkezi eğilim ve dağılma ölçüleri Bir seriyi küçükten büyüğe sıralandığında 4 eşit parçaya bölen değere kartil denir. – Dataların 25%’i Q1’den az – Dataların 50%’si Q2’den az: Medyan – Dataların 75%’i Q3’den az Atatürk Üniversitesi Merkezi eğilim ve dağılma ölçüleri Kartiller SINIFLANDIRILMIŞ VERİLER İÇİN: 𝑓 − 𝑓𝑖 4 𝑄1 = 𝐿𝑄1 + ×𝑐 𝑓𝑄1 𝑄3 = 𝐿𝑄3 + 𝑓 − 𝑓𝑖 2 𝑄2 = 𝐿𝑄2 + ×𝑐 𝑓𝑄2 3 4 𝑓 − 𝑓𝑄3 𝑓𝑖 ×𝑐 Atatürk Üniversitesi Merkezi eğilim ve dağılma ölçüleri Kartiller:Örnek Aluminyum-Lityum alaşımının bası dayanımı ile ilgili yapılan 80 deneyin sonuçları aşağıda verilmiştir. 105 97 245 163 207 134 218 199 160 196 221 154 228 131 180 178 157 151 175 201 183 153 174 154 190 76 101 142 149 200 186 174 199 115 193 167 171 163 87 176 121 120 181 160 194 184 165 145 160 150 181 168 158 208 133 135 172 171 237 170 180 167 176 158 156 229 158 148 150 118 143 141 110 133 123 146 169 158 135 149 Verileri sınıflandırıp kartilleri hesaplayınız. Atatürk Üniversitesi Box ve Whisker Grafiği Merkezi eğilim ve dağılma ölçüleri Kutu Grafiği verilerin merkezi, yayılımı şeklini ve üç değerlerini gösterir. Bu grafikte; • Minimum değeri • First kartili, • Medyanı • 3.Kartili • Maksimum değeri gösterir. Atatürk Üniversitesi Box ve Whisker Grafiği Merkezi eğilim ve dağılma ölçüleri Atatürk Üniversitesi Comparative Box Plots Descriptive Statistics Comparative box plots of a quality index at three manufacturing plants. Comment: Plant 2 has too much variability. Plants 2 & 3 need to raise their quality index performance. Atatürk University Gelecek dersin konusu Merkezi eğilim ve dağılma ölçüleri Olasılık….. Atatürk Üniversitesi