3. Frekans Verileri

advertisement
3
FREKANS VERİLERİ
3.1. Frekans Tablolarının Düzenlenmesi
3.2. Frekans poligonu
3.3. Frekans tablosu hazırlama
3.4. Frekans Histogramı
3.5. Frekans eğrisi tipleri
3.6. Diğer İstatistiksel Grafik Gösterimler
Prof.Dr. Levent ŞENYAY
III - 1
İstatistik I
Verilerin özetlenmesi aşamasında, her özetleme işleminde olduğu gibi doğal olarak bir bilgi kaybı da
olacaktır. Burada amaç elde edilen özet bilginin kulam kolaylığına değecek bir kaybın oluşmasını sağlayacak
dengeyi sağlamaktır. Diğer bir deyişle elde edilmek istenilen özetin kaybedilen detaydan daha önemli
olacak şekilde özetin planlanmasıdır.
Notasyon
n hacimli gözlem seti x1,x2………,xn
n
x
1.
i 1
 xi ’lerin toplamı (i=1,2, … ,n)
i
= x1+x2+………+xn
n
2.
x y
i
i 1
n
3.
 x1 y1  x2 y 2  ............  xn y n
n
n
 x y  x  y
i 1
i
n
4.
i
 ax
i
i 1
i
i 1
i
i 1
i
 ax1  ax2  ........  axn
( a : sabit)
 ax1  x2  ........  xn 
n
 a  xi
i 1
ax  by   a x  b y
5.
6. Oran : p=x/n
q=(n-x)/n (q:başarısızlık oranı)
x : örnekte belli özelliğe sahip eleman sayısı,
n : örnek hacmi



Oran, örnekte belli özelliğe sahip eleman sayısının örnek hacmine bölümüdür.
3.1. Frekans Tablolarının Düzenlenmesi
İstatistik veriler toplandıktan sonra, birbirine yakın gözlem değerleri, benzer özellikli sınıflar
oluşturulabilecek hale getirilir. Ancak bu sınıflama yapılırken sınıfların alt ve üst limitleri, analiz amacına
uygun olarak seçilmelidir. Örneğin; gelir gruplarına göre bir sınıflama yapmak gerektiğinde grubun alt limiti
ile üst limiti arasındaki fark aynı gelir gurubunu ifade etmeyecek kadar geniş olmamalıdır veya bir önceki
sınıf ile bir sonraki sınıf arasındaki fark ayrı gelir gruplarını ifade edecek şekilde belirlenmelidir.
İstatistiksel veri analizinde hesaplama şekilleri genellikle iki ana grupta toplanmaktadır.
1. Basit veriler : Eğer veriler orijinal halleri ile kullanıldığı verilerin sıralanış şeklidir.
2. Frekans verileri : Frekans verileri ise basit serilerin belli şekilde benzer olanlarının bir araya
getirilerek gösterimidir. Bu tür seriler de iki şekilde olur,
a.
Gruplanmış veriler : Basit verilerin aynı olanlarının bir araya getirildiği verilerdir. Sıraya
dizilmiş durumda veri olmayan grupların frekansı sıfır kabul edilerek bir düzen içerisinde
gösterilir.
b. Sınıflandırılmış veriler : Birden çok basit verinin birlikte gösterildiği veriler. Bu tür
veriler genellikle araştırma amacı açısından benzer özellikte alt ve üst sınırları belirlenen
Prof.Dr. Levent ŞENYAY
III - 2
İstatistik I
basit verilerin bir araya getirilmesi ile oluşturulur. Bu sınıflar eşit ya da benzer arallıklarda
olabileceği gibi, eşit aralıklı olmayabilirler.
Örnek :
1. Basit seri (veri)
38 36 43 38 43 33 43 39 43 38 39 44 38 47 36 41 44 45 36 47 44 41 36 42 39
n=25 min=33 max=47
değişim aralığı=47-33=14
2. Frekans verileri
a. Gruplandırılmış veri
Gruplar
Frekans
33 34 35 36 37 38 39 40 41 42 43 44 45 46 47
1 0 0 4 0 4 3 0 2 1 4 3 1 0 2
b. Sınıflandırılmış veri
Sınıflar
Frekanslar
32,5 – 34,5 dan az 1
34,5 - 36,5 dan az 5
36,5 – 38,5 dan az 4
38,5 – 40,5 dan az 3
40,5 – 42,5 dan az 3
42,5 - 44,5 dan az 7
44,5 – 46,5 dan az 1
46,5 – 48,5 dan az 1
veya
Sınıflar
Frekanslar
32.5 dan çok - 35.5
2
35.5 dan çok - 38.5
8
38.5 dan çok - 41.5
5
41.5 dan çok - 44.5
8
44.5 dan çok - 47.5
2
Sınıflandırma sayısı ve sınıf büyüklükleri araştırma konusuna göre değişkenlik gösterebilir. Her sınıf hacmi
eşit olmak zorunda değildir.
sınıf orta noktası=(Lü+La)/2=x (x değişekyerine m sembolü de kullanılır)
Lü: sınıf üst limiti
La: sınıf alt limiti
(nispi veya eklemeli veya yığmalı veya kümülatif, aynı anlamda kullanılmıştır)
Sınıflar
La Lü
f
nispi
fr=fi/Σf
f
Eklemeli
nispi fr
f
33.0 34.9
35.0 36.9
37.0 38.9
39.0 40.9
41.0 42.9
43.0 44.9
45.0 46.9
47.0 48.9
Toplam
1
4
4
3
3
7
1
2
25
0.04
0.16
0.16
0.12
0.12
0.28
0.04
0.08
100
1
5
9
12
15
22
23
25
0.04
0.20
0.36
0.48
0.60
0.88
0.92
1.00
25
24
20
16
13
10
3
2
Prof.Dr. Levent ŞENYAY
III - 3
Tersten
La  Lü
Eklemeli x 
2
nispi fr
1.00
33.95
0.84
35.95
0.80
37.95
0.64
39.95
0.52
41.95
0.40
43.95
0.12
45.95
0.08
47.95
İstatistik I
3.2. Frekans tablosu hazırlama
1.
2.
3.
4.
Ham sayısal veriler artan veya azalan düzende sıralanır.
En büyük ve en küçük veriler arasındaki ölçüm farkı alınır ve değişim aralığı (range) bulunur
Ölçüm aralığı istenilen uygun sınıf sayısına bölünür.
Her sınıf aralığına düşen veri sayısını belirlenir ve sınıf frekansı bulunur.
Frekans poligonu : Histogram dikdörtgenlerinin tepelerinin orta noktalarını birleştiren çizgi
Gruplandırılmış verilerde frekans poligonu ve Histogram
Sınıflandırılmış verilerde frekans poligonu ve histogram
…den daha az eğrisi - Gruplandırılmış verilerde frekans poligonu ve Histogram
Prof.Dr. Levent ŞENYAY
III - 4
İstatistik I
Den daha az eğrisi - Sınıflandırılmış verilerde frekans poligonu ve bhistogram
…den daha çok eğrisi - Sınıflandırılmış verilerde frekans poligonu ve
Den daha az eğrisi - Sınıflandırılmış verilerde frekans poligonu ve bhistogram
Frekans tablosu düzenlenirken dikkat edilmesi gereken noktalar:
1. Ardışık sınıflarda ortak noktalar bulunmamalıdır.
2. İlk sınıf en küçük veriyi, son sınıf en büyük veriyi içermelidir.
3. Hiçbir ölçüm ardışık iki sınıf arasını ayıran nokta üzerine düşmemelidir
4. Alt-üst sınırlarda olmayan değerlere gidilmemelidir.
5. Bir frekans tablosunda aksi gerekli olmadıkça enaz 5 ençok 20 sınıf olmalıdır.
Prof.Dr. Levent ŞENYAY
III - 5
İstatistik I
Koordinat sisteminde yer alan dikdörtgenler setidir. İzmir ili sınırları içerisinde yapılan bir anket
sonucunda sahip olunan çocuk sayısına göre aile sayısının dağılımı aşağıda verilmiştir.
Çocuk
Sayısı
Aile Sayısı
0
1
2
3
4
5
6
94
65
87
71
34
12
5
Frekans Tablosu
frekans
poligonu
Bar Chart
0.30
0.26
0.24
0.25
0.20
0.19
0.18
0.15
0.09
0.10
0.05
0.03
0.01
0.00
0
1
2
3
4
5
6
Relatif Frekans Tablosu
Prof.Dr. Levent ŞENYAY
III - 6
İstatistik I
3.5. Frekans eğrisi tipleri
Çan Eğrisi veya Simetrik
Sağa Çarpık ( + asimetri)
J Eğrisi
Sola Çarpık (- asimetri)
U Eğrisi
Birden Çok Modlu Dağılımlar
Prof.Dr. Levent ŞENYAY
III - 7
İstatistik I
3.6. Diğer İstatistiksel Grafik Gösterimler
1. Gövde Ve Yaprak Gösterimi
İstek No
1
2
3
4
5
6
7
8
9
10
11
12
Proses
Zamanı
2,3
5,7
6,6
10
5,1
1,8
2,5
2,0
4,6
1,9
6,7
3,9
İstek No
13
14
15
16
17
18
19
20
21
22
23
24
Proses
Zamanı
3,4
2,6
3,6
3,4
9,4
4,9
7,4
20,2
3,9
1,7
16,2
5,8
25
26
27
28
29
30
31
32
33
34
35
36
37
1,4
3,3
6,0
5,9
7,2
1,2
4,0
7,8
13,4
3,2
2,3
14,0
5,1
38
39
40
41
42
43
44
45
46
47
48
49
50
6,4
7,7
4,4
5,4
7,5
6,1
8,2
4,3
2,9
9,9
4,4
14,3
9,0
Gövde ve Yaprak Grafiği
Depth
5
11
18
24
(5)
21
16
11
9
6
5
5
5
4
High
Stem
1|
2|
3|
4|
5|
6|
7|
8|
9|
10|
11|
12|
13|
14|
|
Leaves
24789
033569
2344699
034469
11789
01467
24578
24
049
0
bu gruba giren 5 adet sayı var, bunlar (5.1 5.4 5.7 5.8 5.9)
4
03
16.2, 20.2
2. Pareto Diyagramı
Pareto diyagramı çeşitli kusurlu frekanslarını gösterir. Bu diyagram kusurların ana kaynaklarını
tanımladığından dolayı, endüstride değerli bir araç olarak kullanılmaktadır.
Örnek
İzmir ili sınırları içerisinde yapılan bir anket sonucunda sahip olunan çocuk sayısına göre aile sayısının
dağılımı aşağıda verilmiştir.
Çocuk
Sayısı
Aile Sayısı
0
1
2
3
4
5
6
94
65
87
71
34
12
5
Prof.Dr. Levent ŞENYAY
III - 8
İstatistik I
25
94
87
80
71
65
60
40
AILESAYI
34
20
12
5
0
0
2
3
1
4
5
0
6
COCUKSA
Pareto diyagramı değişken kusurların frekanslarını gösteren bir çubuk diyagramdır. Frekansların
azalan düzende çubuklarını gösterilir; en yüksek frekans solda en alçak frekans sağda gösterilmektedir.
Pareto diyagramları genellikle %75 üzerinde kayıpları içeren iki veya üç kusurluyu gösterir. Pareto
diyagramları bazı kalite geliştirme programlarının önemli bir aracıdır, çünkü bir veya daha fazla kusurlara
yol gösteren bir veya daha fazla kategori üzerine herkesin dikkatini odaklar. Böylelikle yüksek frekanslı
olan kusurluları daha rahatlıkla görebilir ve düzeltebiliriz.
3. Ishikawa (sebep-sonuç veya balık kılçığı) diyagramı
Sayısal olmayan verileri toplayıp frekans tablosu oluşturmak amacıyla kullanılan bir analiz türü ve
gösterim diyagramıdır. Kalite çalışmalarında kusurların nedenlerinin teşhisi amacıyla kullanılan etkili bir
istatistiksel araçtır.
Men %30
Machine %15
Ana sebep ve
Alt sebepler
Problem (sonuç)
Method %25
Material %30
Bu diyagram tipi genellikle kalite çalışmalarında problem kaynakları veya kusurların nedenlerinin teşhisi
amacıyla kullanılır. Kalite kontrolünün ana amacı kaliteyi arttırmaktır, bu daha iyi ürün sağlayan faaliyetleri
uygulamakla gerçekleştirilir. Ölçümler düşük kalitenin nedenlerini düzeltmek için yapılmalıdır. Kauru
Ishikawa isimli bir Japon kontrol mühendisi, yanıtlara etki eden değişkenleri gösteren bir kesin neden ve
etki diyagramlarını geliştirmiştir. Bu diyagramlar balık kılçığı diyagramları olarak isimlendirilir çünkü bir
balığın iskeletine benzerler. Bilginin organizasyonu ve hazırlanmasına bağlı olarak bir çok farklı neden ve
etki diyagramları kurma metotları vardır. Burada ana faktörleri ve bunlara bağlı alt faktörler
göstermektedir.
Histogramlar gözlemlerin değişkenliğinin gösteriminde çok değerli araçlardır ve analizciye veri setinin
anlaşılmasının geliştirilmesinde yardımcı olur. Ancak histogramların bir dezavantajı vardır bu da bağımsız
veri noktalarının ayırt edilemez bir aralığı düştüğünden dolayı tanımlanamamasıdır. Histogram yerine kök
ve yaprak gösterimiyle daha fazlasını yapabilir ve ayrıca orijinal verileri de kaybetmeyiz Burada orijinal
sayılar kaybolmaz ve çeteleye işaretlenmiştir.
Prof.Dr. Levent ŞENYAY
III - 9
İstatistik I
Percent
100
Verilerin çeşitlerine dayalı tablolama ve grafikleme
Veri tipi
Tablolama Şekli
Grafik Gösterimi
Niteliksel (kategorik) veri
Gruplandırılmış frekans dağılımı
Sayısal veri
Sınıflandırılmış/basit frekans dağılımı
çubuk diyagramı
Alan(daire) diyagramı
histogram
frekans poligonu
gövde yaprak diyagram
Kesikli Sayısal veri
Basit gözlem serisi
aralıklandırılabilir(yaş)
Gruplandırılmış Frekans serisi
aralıklandırılamaz(tel no) Kısmi frekans
çubuk diyagramı
Alan(daire) diyagramı
Sürekli Sayısal veri
histogram
frekans poligonu
gövde yaprak diyagram
Basit gözlem serisi
Sınıflandırılmış Frekans serisi
Kısmi frekans
Kümülatif kısmi fr
.
Prof.Dr. Levent ŞENYAY
III - 10
İstatistik I
Download