ıstat*st*kı

advertisement
ISTATİSTİK I
FIRAT EMİR
DERS II
S
S VERİ: Değişkenlere karşılık gelen denek ya da gözlem
değerlerine de “Veri” denir.
S Veri Toplama Yöntemleri (Veri Kaynakları)
S Tutulan eski kayıtlar, yayınlanan raporlar ve yıllıklar
S Anket veya saha araştırması
S Deney veya gözlem yaparak veri toplama
S Önceden çeşitli kurumlar tarafından ya da çeşitli
araştırmalar için hazırlanmış veri bankalarından hazır
verilerin kullanılması.
VERİ TASNİFİ
(DÜZENLENMESİ)
S Verilerin Basit Seri Şeklinde Düzenlenmesi
Aşağıdaki sayılar saat 24 ile 7 arasında bir telefon santraline gelen
toplam 911 çağrının 36 günlük dağılımını göstermektedir.
22
31
30
48
17
22
63
44
11
63
76
6
23
54
27
35
19
30
48
28
41
26
37
35
41
64
65
52
71
105
S
Dağılım Sınırları: Veri kümesinde (Dağılımda) verilerin aldığı en büyük ve en küçük
gözlem değerleridir.
S
En büyük değer (Xmax=Maksimum): Veri kümesinin aldığı en büyük değerdir buna
dağılımın üst sınırı da denir.
Örneğimizde istatistik dersi final sınavından alınan en yüksek not olan 100 değeridir.
S
En küçük değer (Xmin=Minimum): Veri kümesinin aldığı en küçük değerdir buna
dağılımın alt sınırı da denir.
Örneğimizde istatistik dersi final sınavından alınan en düşük not olan 40 değeridir.
S
Dağılım Genişliği (Aralığı) : Dağılımın en büyük (üst sınır) değeri ile en küçük (alt
sınır) değeri arasındaki farktır. Örneğimizde,
S
Dağılım genişliği (DG) = En büyük değer - En küçük değer = 100 - 40 = 60
S Frekans: Değişkene ait aynı değere sahip bir verinin kaç kez
tekrarlandığını gösterir. Değişkene ait verinin frekansı
(sıklığı) fi ile gösterilir.
Verilerin Gruplanmış
(Sınıflanmış) Seri Şeklinde
Düzenlenmesi
S Bir değişkene ait çok sayıda ve birbirinden farklı veri
mevcut ise bu verileri tasnif edilmiş seri (küme) şeklinde
düzenlemek zordur. Bu gibi durumlarda değişkenlerin
birbirine yakın değere sahip verileri bir arada toplanarak
gruplanmış seri olarak sunulabilir.
S Sınıf: Eşit ya da birbirine yakın değere sahip verilerin
(gözlemlerin, deneklerin) bir arada gösterilerek oluşturulan
her bir gruba sınıf denir. Sınıf sayısı, k ile ifade edilir.
S Sınıfın Alt Sınırı (AS): Bir sınıfta yer alan en küçük değerdir.
Örneğimizde AA (birinci) grubun alt sınırı 90 ve BA (ikinci)
grubun alt sınırı 85 vb. gibidir.
S Sınıfın Üst Sınırı (ÜS): Bir sınıfta yer alan en büyük değerdir.
Örneğimizde AA (birinci) grubun üst sınırı 100 ve BA (ikinci)
grubun üst sınırı 89 vb. gibidir.
S Sınıf Aralığı: Ard arda gelen iki sınıfın üst sınır (en büyük değer) ile
alt sınır (en küçük değer) arasındaki farktır. Sınıf aralığı, ss ile ifade
edilir. Örneğimizde AA (birinci) grubun sınıf aralığı 11 ve BA (ikinci)
grubun sınıf aralığı 5 vb. gibidir
S Sınıf Sıklığı (Sınıf Frekansı): Bir sınıfta yer alan gözlem ya da denek
sayısıdır. Örneğimizde AA (birinci) grubun sınıf sıklığı 50 ve BA
(ikinci) grubun sınıf sıklığı 60 vb. gibidir.
S Kümülatif Sıklık (Frekans): Sınıf sıklıklarının üst üste eklenmesi ile
oluşan sıklıklara denir.
S Sınıf Orta Değeri (mi): Bir sınıfın alt ve üst sınır değerlerinin
ortalaması o sınıfın orta değerini verir.
S Nisbi Frekans: Bir sınıfın frekansının toplam verı sayısına
bölünmesi ile elde edilir.
S Kümülatif Nisbi Sıklık (Frekans): Sınıf nisbi sıklıklarının üst üste
eklenmesi ile oluşan sıklıklara denir.
Seriler
S Sayısal veriler yıl, ay, hafta vb. gibi zamana bağlı olarak
sıralanmışsa zaman serisi oluşturulmuş olur. Zaman serileri
araştırılan konunun özelliğine göre artan, azalan ya da
dalgalı zaman serisi olabilir
Tablo 3.1.1. İstanbul’daki Araç Sayısı
Yıllar
2000
2001
2002
2003
2004
2005
2006
2007
Kaynak: Kurgusal veri, yalnızca örnek amaçlıdır
Araç
Sayısı
200.000
230.000
270.000
330.000
380.000
450.000
490.000
550.000
S Veriler toplandıkları ülke, bölge, şehir, ilçe vb. gibi bir
mekâna göre düzenlenip sıralanmışsa mekânsal seriler
oluşturulmuş olur.
Tablo 3.1.7. Türkiye Bölgelere Göre Kişi Başına Milli Gelir Dağılımı
(2000 yılı, TL)
Bölgeler
Milli
Gelir
Marmara
24.000
Ege
18.000
İç Anadolu
1.2000
Akdeniz
9000
Batı Karadeniz
7000
Doğu Karadeniz
6000
Güney Doğu Anadolu
5500
Doğu Anadolu
4000
Kaynak: Kurgusal veri, yalnızca örnek amaçlıdır
Grafiksel Sunumlar
S Grafikler toplanan verilerin tasnif ve gruplama işleminden
geçirildikten sonra rakamlar yerine kolayca görsel olarak
algılanabilecek şekiller yardımıyla sunulmasıdır.
S Daire Grafikleri Yardımıyla Verilerin Sunumu
S Sütun (Çubuk) Grafikleri Yardımıyla Verilerin Sunumu
S Zaman Serisi Grafikleri Yardımıyla Verilerin Sunumu
(Kartezyen Grafikler)
S Histogram Yardımıyla Verilerin Sunumu (Gruplanmış Verilerin
Grafikleri)
S Frekans Poligonu Yardımıyla Verilerin Sunumu
Daire Grafiği
Tatil ve
Eğlence
6%
Diğerleri
4%
Harcama Oranları
Ulaşım
8%
Kira
32%
Giyecek
12%
Eğitim
13%
Gıda
25%
Sütun (Çubuk) Grafikleri
Halka Arz Edilen Şirket Sayısı
35
35
25
25
14
16
29
27
29
20
19
12
10
1
4
2
11
11
3
19
90
19
91
19
92
19
93
19
94
19
95
19
96
19
97
19
98
19
99
20
00
20
01
20
02
20
03
20
04
20
05
20
06
20
07
20
08
20
09
40
35
30
25
20
15
10
5
0
Halka Arz Edilen Şirket Sayısı
2
Zaman Serisi Grafikleri
Yardımıyla Verilerin Sunumu
(Kartezyen Grafikler)
Grafik 3.2.7. İMKB 100 Değeri
İMKB 100 Değeri
800
700
600
500
400
300
200
100
0
706
319 292
282
88
382
229
126
229 190 258
436
315
203
273
240
158
295
513
415
391
225
19
86
19
87
19
88
19
89
19
90
19
91
19
92
19
93
19
94
19
95
19
96
19
97
19
98
19
99
20
00
20
01
20
02
20
03
20
04
20
05
20
06
20
07
20
08
20
09
100
459
Histogram
Poligon
Download