3 FREKANS VERİLERİ 3.1. Frekans Tablolarının Düzenlenmesi 3.2. Frekans poligonu 3.3. Frekans tablosu hazırlama 3.4. Frekans Histogramı 3.5. Frekans eğrisi tipleri 3.6. Diğer İstatistiksel Grafik Gösterimler Prof.Dr. Levent ŞENYAY III - 1 İstatistik I Verilerin özetlenmesi aşamasında, her özetleme işleminde olduğu gibi doğal olarak bir bilgi kaybı da olacaktır. Burada amaç elde edilen özet bilginin kulam kolaylığına değecek bir kaybın oluşmasını sağlayacak dengeyi sağlamaktır. Diğer bir deyişle elde edilmek istenilen özetin kaybedilen detaydan daha önemli olacak şekilde özetin planlanmasıdır. Notasyon n hacimli gözlem seti x1,x2………,xn n x 1. i 1 xi ’lerin toplamı (i=1,2, … ,n) i = x1+x2+………+xn n 2. x y i i 1 n 3. x1 y1 x2 y 2 ............ xn y n n n x y x y i 1 i n 4. i ax i i 1 i i 1 i i 1 i ax1 ax2 ........ axn ( a : sabit) ax1 x2 ........ xn n a xi i 1 ax by a x b y 5. 6. Oran : p=x/n q=(n-x)/n (q:başarısızlık oranı) x : örnekte belli özelliğe sahip eleman sayısı, n : örnek hacmi Oran, örnekte belli özelliğe sahip eleman sayısının örnek hacmine bölümüdür. 3.1. Frekans Tablolarının Düzenlenmesi İstatistik veriler toplandıktan sonra, birbirine yakın gözlem değerleri, benzer özellikli sınıflar oluşturulabilecek hale getirilir. Ancak bu sınıflama yapılırken sınıfların alt ve üst limitleri, analiz amacına uygun olarak seçilmelidir. Örneğin; gelir gruplarına göre bir sınıflama yapmak gerektiğinde grubun alt limiti ile üst limiti arasındaki fark aynı gelir gurubunu ifade etmeyecek kadar geniş olmamalıdır veya bir önceki sınıf ile bir sonraki sınıf arasındaki fark ayrı gelir gruplarını ifade edecek şekilde belirlenmelidir. İstatistiksel veri analizinde hesaplama şekilleri genellikle iki ana grupta toplanmaktadır. 1. Basit veriler : Eğer veriler orijinal halleri ile kullanıldığı verilerin sıralanış şeklidir. 2. Frekans verileri : Frekans verileri ise basit serilerin belli şekilde benzer olanlarının bir araya getirilerek gösterimidir. Bu tür seriler de iki şekilde olur, a. Gruplanmış veriler : Basit verilerin aynı olanlarının bir araya getirildiği verilerdir. Sıraya dizilmiş durumda veri olmayan grupların frekansı sıfır kabul edilerek bir düzen içerisinde gösterilir. b. Sınıflandırılmış veriler : Birden çok basit verinin birlikte gösterildiği veriler. Bu tür veriler genellikle araştırma amacı açısından benzer özellikte alt ve üst sınırları belirlenen Prof.Dr. Levent ŞENYAY III - 2 İstatistik I basit verilerin bir araya getirilmesi ile oluşturulur. Bu sınıflar eşit ya da benzer arallıklarda olabileceği gibi, eşit aralıklı olmayabilirler. Örnek : 1. Basit seri (veri) 38 36 43 38 43 33 43 39 43 38 39 44 38 47 36 41 44 45 36 47 44 41 36 42 39 n=25 min=33 max=47 değişim aralığı=47-33=14 2. Frekans verileri a. Gruplandırılmış veri Gruplar Frekans 33 34 35 36 37 38 39 40 41 42 43 44 45 46 47 1 0 0 4 0 4 3 0 2 1 4 3 1 0 2 b. Sınıflandırılmış veri Sınıflar Frekanslar 32,5 – 34,5 dan az 1 34,5 - 36,5 dan az 5 36,5 – 38,5 dan az 4 38,5 – 40,5 dan az 3 40,5 – 42,5 dan az 3 42,5 - 44,5 dan az 7 44,5 – 46,5 dan az 1 46,5 – 48,5 dan az 1 veya Sınıflar Frekanslar 32.5 dan çok - 35.5 2 35.5 dan çok - 38.5 8 38.5 dan çok - 41.5 5 41.5 dan çok - 44.5 8 44.5 dan çok - 47.5 2 Sınıflandırma sayısı ve sınıf büyüklükleri araştırma konusuna göre değişkenlik gösterebilir. Her sınıf hacmi eşit olmak zorunda değildir. sınıf orta noktası=(Lü+La)/2=x (x değişekyerine m sembolü de kullanılır) Lü: sınıf üst limiti La: sınıf alt limiti (nispi veya eklemeli veya yığmalı veya kümülatif, aynı anlamda kullanılmıştır) Sınıflar La Lü f nispi fr=fi/Σf f Eklemeli nispi fr f 33.0 34.9 35.0 36.9 37.0 38.9 39.0 40.9 41.0 42.9 43.0 44.9 45.0 46.9 47.0 48.9 Toplam 1 4 4 3 3 7 1 2 25 0.04 0.16 0.16 0.12 0.12 0.28 0.04 0.08 100 1 5 9 12 15 22 23 25 0.04 0.20 0.36 0.48 0.60 0.88 0.92 1.00 25 24 20 16 13 10 3 2 Prof.Dr. Levent ŞENYAY III - 3 Tersten La Lü Eklemeli x 2 nispi fr 1.00 33.95 0.84 35.95 0.80 37.95 0.64 39.95 0.52 41.95 0.40 43.95 0.12 45.95 0.08 47.95 İstatistik I 3.2. Frekans tablosu hazırlama 1. 2. 3. 4. Ham sayısal veriler artan veya azalan düzende sıralanır. En büyük ve en küçük veriler arasındaki ölçüm farkı alınır ve değişim aralığı (range) bulunur Ölçüm aralığı istenilen uygun sınıf sayısına bölünür. Her sınıf aralığına düşen veri sayısını belirlenir ve sınıf frekansı bulunur. Frekans poligonu : Histogram dikdörtgenlerinin tepelerinin orta noktalarını birleştiren çizgi Gruplandırılmış verilerde frekans poligonu ve Histogram Sınıflandırılmış verilerde frekans poligonu ve histogram …den daha az eğrisi - Gruplandırılmış verilerde frekans poligonu ve Histogram Prof.Dr. Levent ŞENYAY III - 4 İstatistik I Den daha az eğrisi - Sınıflandırılmış verilerde frekans poligonu ve bhistogram …den daha çok eğrisi - Sınıflandırılmış verilerde frekans poligonu ve Den daha az eğrisi - Sınıflandırılmış verilerde frekans poligonu ve bhistogram Frekans tablosu düzenlenirken dikkat edilmesi gereken noktalar: 1. Ardışık sınıflarda ortak noktalar bulunmamalıdır. 2. İlk sınıf en küçük veriyi, son sınıf en büyük veriyi içermelidir. 3. Hiçbir ölçüm ardışık iki sınıf arasını ayıran nokta üzerine düşmemelidir 4. Alt-üst sınırlarda olmayan değerlere gidilmemelidir. 5. Bir frekans tablosunda aksi gerekli olmadıkça enaz 5 ençok 20 sınıf olmalıdır. Prof.Dr. Levent ŞENYAY III - 5 İstatistik I Koordinat sisteminde yer alan dikdörtgenler setidir. İzmir ili sınırları içerisinde yapılan bir anket sonucunda sahip olunan çocuk sayısına göre aile sayısının dağılımı aşağıda verilmiştir. Çocuk Sayısı Aile Sayısı 0 1 2 3 4 5 6 94 65 87 71 34 12 5 Frekans Tablosu frekans poligonu Bar Chart 0.30 0.26 0.24 0.25 0.20 0.19 0.18 0.15 0.09 0.10 0.05 0.03 0.01 0.00 0 1 2 3 4 5 6 Relatif Frekans Tablosu Prof.Dr. Levent ŞENYAY III - 6 İstatistik I 3.5. Frekans eğrisi tipleri Çan Eğrisi veya Simetrik Sağa Çarpık ( + asimetri) J Eğrisi Sola Çarpık (- asimetri) U Eğrisi Birden Çok Modlu Dağılımlar Prof.Dr. Levent ŞENYAY III - 7 İstatistik I 3.6. Diğer İstatistiksel Grafik Gösterimler 1. Gövde Ve Yaprak Gösterimi İstek No 1 2 3 4 5 6 7 8 9 10 11 12 Proses Zamanı 2,3 5,7 6,6 10 5,1 1,8 2,5 2,0 4,6 1,9 6,7 3,9 İstek No 13 14 15 16 17 18 19 20 21 22 23 24 Proses Zamanı 3,4 2,6 3,6 3,4 9,4 4,9 7,4 20,2 3,9 1,7 16,2 5,8 25 26 27 28 29 30 31 32 33 34 35 36 37 1,4 3,3 6,0 5,9 7,2 1,2 4,0 7,8 13,4 3,2 2,3 14,0 5,1 38 39 40 41 42 43 44 45 46 47 48 49 50 6,4 7,7 4,4 5,4 7,5 6,1 8,2 4,3 2,9 9,9 4,4 14,3 9,0 Gövde ve Yaprak Grafiği Depth 5 11 18 24 (5) 21 16 11 9 6 5 5 5 4 High Stem 1| 2| 3| 4| 5| 6| 7| 8| 9| 10| 11| 12| 13| 14| | Leaves 24789 033569 2344699 034469 11789 01467 24578 24 049 0 bu gruba giren 5 adet sayı var, bunlar (5.1 5.4 5.7 5.8 5.9) 4 03 16.2, 20.2 2. Pareto Diyagramı Pareto diyagramı çeşitli kusurlu frekanslarını gösterir. Bu diyagram kusurların ana kaynaklarını tanımladığından dolayı, endüstride değerli bir araç olarak kullanılmaktadır. Örnek İzmir ili sınırları içerisinde yapılan bir anket sonucunda sahip olunan çocuk sayısına göre aile sayısının dağılımı aşağıda verilmiştir. Çocuk Sayısı Aile Sayısı 0 1 2 3 4 5 6 94 65 87 71 34 12 5 Prof.Dr. Levent ŞENYAY III - 8 İstatistik I 25 94 87 80 71 65 60 40 AILESAYI 34 20 12 5 0 0 2 3 1 4 5 0 6 COCUKSA Pareto diyagramı değişken kusurların frekanslarını gösteren bir çubuk diyagramdır. Frekansların azalan düzende çubuklarını gösterilir; en yüksek frekans solda en alçak frekans sağda gösterilmektedir. Pareto diyagramları genellikle %75 üzerinde kayıpları içeren iki veya üç kusurluyu gösterir. Pareto diyagramları bazı kalite geliştirme programlarının önemli bir aracıdır, çünkü bir veya daha fazla kusurlara yol gösteren bir veya daha fazla kategori üzerine herkesin dikkatini odaklar. Böylelikle yüksek frekanslı olan kusurluları daha rahatlıkla görebilir ve düzeltebiliriz. 3. Ishikawa (sebep-sonuç veya balık kılçığı) diyagramı Sayısal olmayan verileri toplayıp frekans tablosu oluşturmak amacıyla kullanılan bir analiz türü ve gösterim diyagramıdır. Kalite çalışmalarında kusurların nedenlerinin teşhisi amacıyla kullanılan etkili bir istatistiksel araçtır. Men %30 Machine %15 Ana sebep ve Alt sebepler Problem (sonuç) Method %25 Material %30 Bu diyagram tipi genellikle kalite çalışmalarında problem kaynakları veya kusurların nedenlerinin teşhisi amacıyla kullanılır. Kalite kontrolünün ana amacı kaliteyi arttırmaktır, bu daha iyi ürün sağlayan faaliyetleri uygulamakla gerçekleştirilir. Ölçümler düşük kalitenin nedenlerini düzeltmek için yapılmalıdır. Kauru Ishikawa isimli bir Japon kontrol mühendisi, yanıtlara etki eden değişkenleri gösteren bir kesin neden ve etki diyagramlarını geliştirmiştir. Bu diyagramlar balık kılçığı diyagramları olarak isimlendirilir çünkü bir balığın iskeletine benzerler. Bilginin organizasyonu ve hazırlanmasına bağlı olarak bir çok farklı neden ve etki diyagramları kurma metotları vardır. Burada ana faktörleri ve bunlara bağlı alt faktörler göstermektedir. Histogramlar gözlemlerin değişkenliğinin gösteriminde çok değerli araçlardır ve analizciye veri setinin anlaşılmasının geliştirilmesinde yardımcı olur. Ancak histogramların bir dezavantajı vardır bu da bağımsız veri noktalarının ayırt edilemez bir aralığı düştüğünden dolayı tanımlanamamasıdır. Histogram yerine kök ve yaprak gösterimiyle daha fazlasını yapabilir ve ayrıca orijinal verileri de kaybetmeyiz Burada orijinal sayılar kaybolmaz ve çeteleye işaretlenmiştir. Prof.Dr. Levent ŞENYAY III - 9 İstatistik I Percent 100 Verilerin çeşitlerine dayalı tablolama ve grafikleme Veri tipi Tablolama Şekli Grafik Gösterimi Niteliksel (kategorik) veri Gruplandırılmış frekans dağılımı Sayısal veri Sınıflandırılmış/basit frekans dağılımı çubuk diyagramı Alan(daire) diyagramı histogram frekans poligonu gövde yaprak diyagram Kesikli Sayısal veri Basit gözlem serisi aralıklandırılabilir(yaş) Gruplandırılmış Frekans serisi aralıklandırılamaz(tel no) Kısmi frekans çubuk diyagramı Alan(daire) diyagramı Sürekli Sayısal veri histogram frekans poligonu gövde yaprak diyagram Basit gözlem serisi Sınıflandırılmış Frekans serisi Kısmi frekans Kümülatif kısmi fr . Prof.Dr. Levent ŞENYAY III - 10 İstatistik I