Slayt 1 - Anadolu Üniversitesi Eczacılık Fakültesi

advertisement
Biyoistatistiğin Tanımı
Biyoistatistikte Kullanılan Terimler
Değişken Tipleri
Parametre ve İstatistik
Tanımlayıcı İstatistikler
Doç. Dr. Ertuğrul ÇOLAK
Eskişehir Osmangazi Üniversitesi
Tıp Fakültesi
Biyoistatistik Anabilim Dalı
Biyoistatistiğin Tanımı
İstatistik,
toplumdan
kurallara
uygun
olarak,
rastgele bir mekanizma içerisinde, doğru ve yeterli
sayıda veri toplama, veri işleme ve verilerden
topluma ilişkin çıkarsamalar yapmaya yönelik
yöntemler içeren ve geliştiren bir bilim dalıdır.
Biyoistatistiğin Tanımı
İstatistik bilimi iki ana bölüme ayrılır:
• Matematiksel İstatistik
• Uygulamalı İstatistik
Biyoistatistiğin Tanımı
Matematiksel istatistik,
istatistik teorisini kuran, istatistiksel çıkarsamalar
için yeni yöntemler geliştiren ve soyut matematik
bilgisi gerektiren bir bilim dalıdır.
Biyoistatistiğin Tanımı
Uygulamalı istatistik,
matematiksel istatistiğin geliştirdiği teknikleri çeşitli
alanlara uygulayan (örneğin biyoloji, ekonomi,
eğitim, sağlık eczacılık vb.), işleyişlerini kontrol
eden ve uygulama alanlarına özgü yeni teknikler
geliştiren bir istatistik bilim dalıdır.
Biyoistatistiğin Tanımı
Biyoistatistik,
uygulamalı bir istatistik dalı olup, istatistiksel
tekniklerin tıp ve sağlık bilimlerinde uygulamalarını
ve bu alanlara özgü olarak geliştirilen yöntemleri
içeren ve aynı zamanda da bu alanlara has yeni
teknikler geliştiren bir bilim dalıdır.
Biyoistatistiğin Tanımı
Genel olarak istatistik iki şekilde tanımlanır.
• Tanımlayıcı (Descriptive) istatistik
• Çıkarsamalı (Inferential) istatistik
Biyoistatistiğin Tanımı
Tanımlayıcı istatistik,
çalışma yapılan toplumu tanıtan, örnek birimlerden
elde edilen verileri özetleyen, değişkenler hakkında
tanımlayıcı bilgiler veren istatistiksel yöntemleri
içerir. Kesinlikle toplum hakkında herhangi bir
karara ya da genellemeye gitmemizi sağlamaz.
Biyoistatistiğin Tanımı
Çıkarsamalı istatistik,
topluma ilişkin tahminlerde bulunulması, uygun
kararların alınması ve topluma ilişkin genellemelere
gidilmesi ile ilgilidir. Çıkarsamalı istatistik yöntemler
genel olarak parametrelere ilişkin tahminleme
yöntemleri ile istatistiksel hipotez testleridir.
Biyoistatistikte Kullanılan
Terimler
Olay: Toplumdaki birimlerde ortaya çıkan ve
üzerinde
çalışmalar
oluşumlara olay denir.
yapmak
gereği
duyulan
Biyoistatistikte Kullanılan
Terimler
İstatistiksel Olay: Araştırmaya, incelemeye konu
teşkil eden, gözlenebilen, deneysel olarak varlığı
kanıtlanabilen
ve
sayılarak,
ölçülerek
sayısal
biçimde ifade edilebilen olaya istatistiksel olay
denir.
Biyoistatistikte Kullanılan
Terimler
Toplum (Popülasyon, Anakütle, Evren): İstatistiksel
olayın
gözlendiği,
gözlenebildiği
birimler
topluluğuna toplum denir. Toplumdaki birim sayısı
büyük “N” harfi ile gösterilir.
Biyoistatistikte Kullanılan
Terimler
Birim: İncelenen olayın gözlendiği en küçük toplum
parçasına, toplum ögesine birim denir.
Gözlem:
Birimlerin
gözlemlenmesi
sonucunda
incelenen özelliklerinin sayısal değerine gözlem
denir.
Biyoistatistikte Kullanılan
Terimler
Örnek: Toplumu temsil edebilecek özellikte ve
sayıda olan, örnekleme yöntemleri ile elde edilmiş
toplumun bir parçasına örnek denir. Örnekteki
birim sayısı küçük “n” harfi ile gösterilir.
Değişken ve Değişken Tipleri
Değişken: Birimlerin incelenen ve gözlenebilen
özelliklerine değişken denir. Birimden birime farklı
değerler alır.
Örneğin boy uzunluğu bir değişkendir. Sağlıklı 20
erkek birey içeren bir örnekte tüm birimlerin boy
uzunluğunun aynı olması beklenemez.
Değişken ve Değişken Tipleri
Değişkenler özelliklerine göre çeşitli biçimlerde
sınıflandırılırlar.
Gözlenme
biçimlerine
göre
nitel
ve
nicel,
ölçümleme tekniklerine göre isimsel, sıralı, aralıklı
ve
oransal,
ölçülen
değerlerin
matematiksel
durumuna göre ise kesikli ve sürekli olarak
sınıflandırılırlar.
Değişken ve Değişken Tipleri
Nitel Değişkenler: Birimlerin kategorik ya da isimsel
olarak
belirtilebilen
durumlarını
ve
karakteristik
pozisyonlarını
özelliklerini,
belirten
değişkenlerdir.
Örneğin, birimlerin cinsiyeti, kan grubu, eğitim
durumu, geçirmiş olduğu hastalıkların türleri,
hastalık şiddeti, tedavi sonuçları vb.
Değişken ve Değişken Tipleri
Nicel
Değişkenler:
saptanan,
sayısal
Değerleri
olarak
ölçüm
sonucu
gözlenebilen
değişkenlerdir.
Örneğin birimlerin, boy uzunluğu, vücut ağırlıkları,
kan basınçları, kolesterol düzeyleri gibi özellikleri
nicel değişkenlerdir.
Değişken ve Değişken Tipleri
İsimsel Değişkenler: İncelenen değişkenin değeri
isimsel olarak seçenekler halinde saptanıyorsa bu
değişkene isimsel ölçekli değişken, elde edilen
veriye ise isimsel veri denir. Örneğin birimlerin
cinsiyeti, medeni durumu, geçirdiği hastalıklar vb.
Değişken ve Değişken Tipleri
Sıralı Değişkenler: Değişkenin değerleri isimsel ve
birbirlerini ardışık olarak artan biçimde izleyen
değerler içeriyorsa bu değişkene sıralı ölçekli
değişken, elde edilen veriye ise sıralı veri denir.
İsimsel kategoriler arasında bir hiyerarşi söz
konusudur. Örneğin hastalığın düzeyi evre I, evre II,
evre III ve evre IV, ağrı şiddeti yok, az, orta, çok gibi.
Değişken ve Değişken Tipleri
Aralıklı Değişkenler: Dünyaca kabul edilmiş bir
başlangıç noktası olmayan, ölçüm sonucu değeri
sayısal olarak gözlemlenen ve kat ya da oran hesabı
yapılamayan
nicel
değişkene
aralıklı
ölçekli
değişken, elde edilen veriye ise aralıklı veri denir.
Değişken ve Değişken Tipleri
Örneğin sıcaklık birimi santigrat derece bir aralıklı
ölçektir. Örneğin bir odanın sıcaklığını ölçelim.
Sıcaklığı santigrat ile ölçelim ve 25 santigrat derece
olsun. Aynı odayı Fahrenhayt ile ölçtüğümüzde 77
Fahrenhayt olarak belirleriz.
Değişken ve Değişken Tipleri
Odayı ısıtalım ve sıcaklığı 50 santigrat dereceye
yükseltelim.
Bu
defa
bu
odanın
sıcaklığını
Fahrenhayt ile ölçtüğümüzde 122 Fahrenhayt
olarak belirleriz. Halbuki sıcaklığı santigrat olarak 2
katına çıkardığımızda Fahrenhayt olarak 2 kat bir
sıcaklık ölçemedik.
Değişken ve Değişken Tipleri
Oransal Değişken: Değişkenin değeri uluslararası
ölçü
birimlerinden
ediliyorsa,
dünyaca
(başlangıç)
noktası
uygun
kabul
varsa
bir
ölçekle
edilmiş
ve
elde
bir
sayısal
sıfır
olarak
gözlemleniyorsa bu değişkene oransal ölçekli
değişken denir ve elde edilen veriye ise oransal veri
denir. Kat ve oran hesabı yapılabilen bir ölçektir.
Değişken ve Değişken Tipleri
Kesikli Değişken: Değerler seti içinde sadece
tamsayı değerler alabilen değişkenlerdir. Çocuk
sayısı, dakikada nabız atım sayısı vb.
Sürekli Değişken: Değerler seti içinde her türlü
değeri alabilen (tamsayı ve kesirli) değişkenlerdir.
Boy uzunluğu, ağırlık, yaş, sistolik kan basıncı,
kreatinin değeri vb.
Değişken ve Değişken Tipleri
Bağımlı Değişken: İncelenen bir olayda değeri
başka
değişkenlerce
belirlenebilen
ve
dışsal
faktörlerden etkilenerek değer alan değişkenlerdir.
Bağımsız Değişken: İncelenen bir olayda değeri
rasgele oluşan, başka değişkenlerin üzerinde etkili
olan değişkendir.
Değişken ve Değişken Tipleri
Bağımlı
ve
bağımsız
değişken
tanımlarında
“incelenen bir olayda” ifadesini vurgulamak gerekir
çünkü bir değişken incelenen olayın özelliklerine
göre bağımlı ya da bağımsız değişken olabilir.
Değişken ve Değişken Tipleri
Veri: İki ya da daha fazla birimden elde edilmiş ve
kaydedilmiş bir ya da daha fazla değişkenin
değerlerinin rakamlar setine veri denir.
Frekans (sıklık): Bir değişkenin belli bir değerinin ya
da belli bir değer aralığının gözlendiği birim
sayısıdır.
Parametre ve İstatistik
Parametre: İncelenen değişkenin toplumdaki tipik
değeridir. Parametre hesaplanan sayısal değerdir.
İstatistik: n sayıda birimden oluşan örnekten elde
edilen verilerden hesaplanmış değerdir. İstatistik
parametrenin bir tahmincisidir.
Parametre ve İstatistik
Parametre
İstatistik

x


S
r
Tanımlayıcı İstatistikler
Elde edilen veri seti ile ilgili olarak yapılacak ilk
adım veri setini tanımlamak ve özetlemektir. Küçük
veri setlerinde bu adım, tüm veri seti içindeki
değişkenler
ve
değişkenlere
ait
ölçümler
listelenerek gerçekleştirebilir. Genelde bu işlem
uzun sürer ve etkili bir yaklaşım değildir. Ayrıca
büyük veri setleri içinde bu işlem imkansız olabilir.
Tanımlayıcı İstatistikler
Çeşitli değişkenlere ait verileri özetleyen, birimlerin
yığıldıkları tipik değerleri ve bu değerler etrafındaki
yayılımlarını, dağılımlarını gösteren, birimlere ait
değişkenler hakkında genel olarak bilgi veren ve bu
değişkenleri tanımlayan istatistiklere tanımlayıcı
istatistikler (descriptive statistics) denir.
Tanımlayıcı İstatistikler
Özetle,
eldeki
mevcut
veri
setini
nümerik
yöntemler ile özetleyen, tanımlayan istatistiklere
tanımlayıcı istatistikler denir.
iki kategoride yer alır.
• Merkezi eğilim ölçüleri
• Dağılım ölçüleri
Merkezi Eğilim Ölçüleri
Verilerin hangi değerlerde yığıldığını, toplandığını
gösteren, birimlerin genel eğilimlerinin hangi
değerlere doğru olduğunu belirten, veri setinin
merkezi noktalarının neler olduğunu bildiren
istatistiklerdir.
Merkezi Eğilim Ölçüleri
Ortalama
Nicel veri setlerinde birimlerin toplandığı kabul
edilen merkezi tipik değere ortalama denir. Veri
setindeki değerler kümesinin ağırlık noktasını
gösterir.
Hesaplamada
değerlerin
kullanım
biçimlerine göre en sık kullanılan üç farklı tipi
vardır.
Merkezi Eğilim Ölçüleri
Aritmetik Ortalama
En sık kullanılan ortalama türüdür. Tüm gözlem
değerlerinin
toplamının
birim
sayısına
bölünmesiyle elde edilir. Genel olarak değişken ismi
üzeri çizgi ile gösterilir.
X, Y, Z
X
n
X
i 1
n
i
X 1  X 2  ...  X n

n
Merkezi Eğilim Ölçüleri
Aritmetik Ortalama
Örnek: 40 yaşında 165 cm. boyunda 10 sağlıklı
kadına ait FEV1 (Forced Expiratory Volume in One
Second) (litre) değerleri ölçülmüş ve 2.82 2.78 2.88
2.70 2.91 2.76 2.80 2.86 2.80 2.87 değerleri elde
edilmiştir. FEV1 değeri aşağıdaki gibi hesaplanır.
Merkezi Eğilim Ölçüleri
Aritmetik Ortalama
FEV1 değerlerinin aritmetik ortalaması aşağıdaki
gibi hesaplanır.
X FEV1
2.82  2.78  2.88  2.70  2.91  2.76  2.80  2.86  2.80  2.87

10
X FEV1
28.18

 2.818
10
Merkezi Eğilim Ölçüleri
Aritmetik Ortalama
Aritmetik Ortalamanın Özellikleri:
•

•
 x  x   0
•
i1 xi  a 
n
x

n
x
i
i 1
n
i 1
n
i
2
İfadesi a= x
küçük olur.
olduğunda en
Merkezi Eğilim Ölçüleri
Aritmetik Ortalama
Aritmetik Ortalamanın Özellikleri:
Aritmetik ortalamanın zayıf yönü aşırı uç değerlere
oldukça duyarlıdır. Örneğin aşağıda yer alan verileri
düşünelim.
1 1 2 4 5 7 8 9 12 12 13 130
Merkezi Eğilim Ölçüleri
Aritmetik Ortalama
Aritmetik Ortalamanın Özellikleri:
1 1 2 4 5 7 8 9 12 12 13 130
aritmetik ortalama 17 olarak elde edilmiştir. Ancak
12 veriden 11 tanesi hesaplanan
ortalama
değerinden
küçüktür.
aritmetik
Buda
bize
hesaplanan değerin eldeki mevcut verilerin merkezi
olmadığını göstermektedir.
Merkezi Eğilim Ölçüleri
Geometrik Ortalama
Veri setindeki değerler artan ya da azalan bir diziyi
izliyorsa ya da değişim oranlarının (yüzde, oran gibi)
değerler
içeriyorsa
ortalama hesaplanır.
bu
durumda
geometrik
Merkezi Eğilim Ölçüleri
Geometrik Ortalama
Veri setindeki değerlerin çarpımlarının birim sayısı
cinsinden kökünün alınması ile ya da verilerin
logaritmalarının
toplamının
birim
sayısına
bölünmesi ve hesaplanan logaritmik ortalamanın
anti logaritmasının alınması ile hesaplanır.
Merkezi Eğilim Ölçüleri
Geometrik Ortalama
XG  n
n
n X  X  ...  X
X

 i
1
2
n
i 1
 n

  log( X i ) 

X G  anti log i 1


n




Merkezi Eğilim Ölçüleri
Geometrik Ortalama
Örnek: Bir bölgede son 10 yıla ait hava kirliliği
ölçümünde kullanılan SO2 (kükürtdioksit) (µg/m3)
değerleri 3, 7, 8, 10, 12, 14, 16, 18, 22, 24 olarak
ölçülmüştür. Son 10 yılın ortalama SO2 değeri
nedir?
Merkezi Eğilim Ölçüleri
Geometrik Ortalama
Veri
seti
incelendiğinde
artan
bir
eğilim
gözlenmektedir. Bu durumda geometrik ortalama
hesaplamak daha uygun olacaktır.
X G ( SO2 )  3  7  ... 24  11.5682
10
Merkezi Eğilim Ölçüleri
Geometrik Ortalama
Geometrik Ortalamanın Özellikleri:
Geometrik ortalama sürekli artan ya da azalan
yapıda çarpık dağılıma sahip verilerde kullanılır
çünkü aritmetik ortalama çarpık dağılımlarda
merkezden
uzaklaşmakta
etkilenmektedir.
ve
aşırı
uçlardan
Merkezi Eğilim Ölçüleri
Geometrik Ortalama
Geometrik Ortalamanın Özellikleri:
Gözlem sonuçları arasındaki oransal (nisbi) farkların
mutlak farklardan daha önemli olduğu durumlarda
kullanılır. Gözlem sonuçlarının her biri bir önceki
gözlem sonucuna bağlı olarak değişiyorsa ve bu
değişimin hızı saptanmak isteniyorsa geometrik
ortalama sağlıklı sonuçlar verir.
Merkezi Eğilim Ölçüleri
Geometrik Ortalama
Geometrik Ortalamanın Özellikleri:
Geometrik ortalama pozitif değer içeren veri
setlerinde kullanılır çünkü sıfırın ve negatif sayıların
logaritması tanımsızdır.
Merkezi Eğilim Ölçüleri
Harmonik Ortalama
Zamana bağlı hız, verimlilik gibi oransal değişimleri
gösteren verilere ait ortalama hesaplanmasında
kullanılır. Veri setindeki değerler bir zaman serisi,
eşit şartlarda yapılmış k sayıda deneyin sonuçları
gibi değerler içeriyor ise harmonik ortalama sağlıklı
sonuçlar verir.
Merkezi Eğilim Ölçüleri
Harmonik Ortalama
Harmonik ortalama değerlerin çarpmaya göre
terslerinin ortalamasının tersidir. Aşağıdaki şekilde
hesaplanır.
XH 
n

n
i 1
1
Xi

n
1
1
1

 ... 
X1 X 2
Xn
Merkezi Eğilim Ölçüleri
Harmonik Ortalama
Örnek: Bir bölgede son bir yıl içerisinde üst
solunum
yolu
enfeksiyonundan
dolayı
sağlık
ocağına başvuran hasta sayısı aylara göre aşağıda
verilmiştir. Aylık verilere göre ortalama hasta sayısı
nedir?
Ocak
Şubat
Mart
Nisan
Mayıs
Haziran
125
158
103
95
74
30
Temmuz Ağustos
13
14
Eylül
Ekim
Kasım
Aralık
38
156
208
205
Merkezi Eğilim Ölçüleri
Harmonik Ortalama
Ocak
Şubat
Mart
Nisan
Mayıs
Haziran
125
158
103
95
74
30
XH 
Temmuz Ağustos
13
14
12
1
1
1

 ... 
125 158
205
Eylül
Ekim
Kasım
Aralık
38
156
208
205
 44.0894
Merkezi Eğilim Ölçüleri
Harmonik Ortalama
Harmonik Ortalamanın Özellikleri:
Zamana bağlı hız, verimlilik gibi oransal değişimleri
gösteren verilere ait ortalama hesaplanmasında
kullanılır.
Harmonik ortalama sıfır içermeyen veri setlerinde
kullanılır çünkü sıfırın tersi tanımsızdır.
Merkezi Eğilim Ölçüleri
Medyan
Aritmetik ortalamadan sonra en yaygın kullanılan
merkezi eğilim ölçüsü medyandır. Ortanca değer
olarak da adlandırılmaktadır.
Veri setini tam olarak iki eşit parçaya bölen
değerdir.
Merkezi Eğilim Ölçüleri
Medyan
n birimlik bir örnekte veriler küçükten büyüğe
doğru sıralanmış olsun. Eğer n tek sayı ise medyan
[(n+1)/2]’inci sırada yer alan değerdir. Eğer n çift
sayı ise medyan [n/2]’ci ve [(n/2)+1]’ci değerlerin
ortalamasıdır.
Merkezi Eğilim Ölçüleri
Medyan
Örnek: 7 yeni doğanın doğum ağırlıkları
3200,
3500, 3400, 3460, 3100, 7800, 2900 gram olarak
ölçülmüştür.
Bu ölçümlerin ortanca değeri kaçtır?
Merkezi Eğilim Ölçüleri
Medyan
Öncelikle veriler küçükten büyüğe doğru sıralanır.
X[1]=2900,
X[2]=3100,
X[3]=3200,
X[5]=3460, X[6]=3500 ve X[7]=7800.
n=7 sayısı tek olduğundan
Medyan = X[(7+1)/2] = X[4] = 3400
şeklinde elde edilir.
X[4]=3400,
Merkezi Eğilim Ölçüleri
Medyan
Örnek: 6 yeni doğanın doğum ağırlıkları
3200,
3500, 3400, 3100, 7800, 2900 gram olarak
ölçülmüştür.
Bu ölçümlerin ortanca değeri kaçtır?
Merkezi Eğilim Ölçüleri
Medyan
Öncelikle veriler küçükten büyüğe doğru sıralanır.
X[1]=2900,
X[2]=3100,
X[3]=3200,
X[4]=3400,
X[5]=3500, ve X[6]=7800.
n=6 sayısı çift olduğundan
Medyan = (X[3]+X[4])/2 = (3200+3400)/2 = 3300
şeklinde elde edilir.
Merkezi Eğilim Ölçüleri
Medyan
Medyanın Özellikleri:
Aşırı derecede tekrar etmeyen ölçümleri içeren
büyük veri setlerinde veri setinin yarısı medyan
değerinden
küçük,
diğer
yarısı
da
medyan
değerinden büyük ölçümlere sahiptir. Ancak veri
seti aşırı derecede tekrar eden verileri içeriyorsa
yukarıdaki sonuç doğru olmaz.
Merkezi Eğilim Ölçüleri
Medyan
Medyanın Özellikleri:
Örneğin 100 aileyi içeren bir örnekte 20 aile 2
kişiden, 40 aile 3 kişiden ve 40 ailede 4 kişiden
oluşuyorsa bu veri setine ait medyan değerini
hesaplayalım.
Gözlem 2 . . .
2
3
.
.
.
3
3
.
.
.
3
4
.
.
.
4
Sıra No 1 . . .
20 21
.
.
.
50 51
.
.
.
60 61
.
.
. 100
Merkezi Eğilim Ölçüleri
Medyan
Medyanın Özellikleri:
Örnek büyüklüğü n=100 olduğundan medyan
değeri 50’ci ve 51’ci sırada yer alan değerlerin
ortalamasıdır. Bu durumda medyan değeri 3 olarak
hesaplanır. Ancak 3’den küçük veri sayısı sadece
20’dir. Bu durumda yukarıdaki sonuç yanlış olur.
Gözlem 2 . . .
2
3
.
.
.
3
3
.
.
.
3
4
.
.
.
4
Sıra No 1 . . .
20 21
.
.
.
50 51
.
.
.
60 61
.
.
. 100
Merkezi Eğilim Ölçüleri
Medyan
Medyanın Özellikleri:
Medyan aşırı uç değerlerden etkilenmez. Bu özelliği
nedeniyle sapan değer içeren veri setlerinde
aritmetik ortalamaya göre tercih edilen bir merkezi
eğilim ölçüsüdür.
Merkezi Eğilim Ölçüleri
Mod
Bir veri setinde en çok gözlemlenen, en çok tekrar
eden değere mod ya da tepe değeri denir. Bir
seride benzer sayıda tekrarlanan birden fazla değer
varsa o seriye çok tepeli seri denir.
Merkezi Eğilim Ölçüleri
Mod
Örnek: 15 bireye ait hemoglobin değerleri 11, 12,
14, 11, 15, 16, 15, 12, 11, 10, 9, 11, 13, 14, 15 ise
bu veri setinin Mod=11 olarak elde edilir.
Merkezi Eğilim Ölçüleri
Dörttebirlikler ve Yüzdebirlikler
Dörttebirlikler: Büyüklük sırasına dizilmiş bir veri
setini
dört
eşit
parçaya
bölen
istatistiklere
dörttebirlik denir. Dörttebirliklerin hesaplanması
ortanca değer hesaplanmasına benzer.
Merkezi Eğilim Ölçüleri
Dörttebirlikler ve Yüzdebirlikler
Birinci dörttebirlik Q1 ile gösterilir ve veri setinin ilk
çeyreğini yani %25. değerini belirtir. Q1=x[n/4] olarak
hesaplanır. İkinci dörttebirlik Q2 ile gösterilir yani
bu aynı zamanda ortanca değerdir ve veri setinin
%50. değerini gösterir. Üçüncü dörttebirilik Q3 ile
gösterilir ve veri setinin %75. değerini belirtir.
Q3=x[3n/4] olarak hesaplanır.
Merkezi Eğilim Ölçüleri
Dörttebirlikler ve Yüzdebirlikler
Yüzdebirlikler: Büyüklük sırasına dizilmiş bir veri
setini yüzdelik bölümlere ayıran istatistiklerdir. P(%)
olarak gösterilirler. Örneğin P(5) veri setinin %5.
değerini gösterir. Örneğin,
P(5)=x[5n/100], P(90)=x[90n/100], P(80)=x[80n/100] olarak
hesaplanır.
Merkezi Eğilim Ölçüleri
Dörttebirlikler ve Yüzdebirlikler
Dörttebirliklerin
ve
yüzdebirliklerin
hesaplanmasında farklı hesaplama yöntemleri
kullanılmaktadır.
Merkezi Eğilim Ölçüleri
Dörttebirlikler ve Yüzdebirlikler
En yaygın kullanılan hesaplama yöntemi aşağıdaki
gibidir. Hesaplanacak yüzdelik değeri p olsun. Bu
durumda pn/100=k değeri tam sayı ise p. yüzdelik
değeri (k). ve (k+1). sırada yer alan gözlemlerin
ortalamasıdır. Eğer pn/100=k değeri tam sayı değil
ise p. yüzdelik değeri [[k]]+1’inci sırada yer alan
gözlem değeridir.
Dağılım Ölçüleri
Bir değişkenin dağılımını, değerler aralığındaki
serpilmesini ve ortalama etrafında yayılışlarını,
belirli değerlerde yığılma eğilimlerini belirlemeye
yarayan belirtici istatistiklere dağılım ölçüleri adı
verilir.
Dağılım Ölçüleri
Dağılım
ölçüleri,
merkezi
eğilim
ölçülerini
destekleyen ve verilerin merkezi eğilim ölçüleri
etrafında yayılışlarını, dağılımlarını ve serpilmelerini
gösteren ölçülerdir.
Dağılım Ölçüleri
Dağılım Aralığı
Dizideki en büyük ve en küçük değer arasındaki
farka dağılım aralığı denir. R ile gösterilir.
R = Xmax - Xmin şeklinde hesaplanır.
Dizideki değerlerin kabaca kaç birimlik yayılış
gösterdiğini belirtir.
Dağılım Ölçüleri
Dağılım Aralığı
Örnek: 15 bireye ait hemoglobin değerleri 11, 12,
14, 11, 15, 16, 15, 12, 11, 10, 9, 11, 13, 14, 15 ise
bu veri setinin dağılım aralığı,R aşağıdaki gibi
hesaplanır.
R = Xmax – Xmin = 16 – 9 = 7
Dağılım Ölçüleri
Dağılım Aralığı
Dağılım Aralığının Özellikleri:
Dağılım aralığı sadece en küçük ve en büyük değeri
hesaplamaya katar. Dolayısıyla sapan değerlerden
etkilenir. Örneğin veri setinde yer alan ölçümlerin
çoğu birbirine yakın değerler içeriyor ancak çok
büyük sadece bir ölçüm bile olsa dağılım aralığı
büyük çıkacak ve genel dağılımı yansıtmayacaktır.
Dağılım Ölçüleri
Dağılım Aralığı
Dağılım Aralığının Özellikleri:
Dağılım aralığı veri setinin örnek büyüklüğünden
etkilenmektedir. Örnek büyüklüğü arttıkça dağılım
aralığı da artma eğilimi göstermektedir.
Dağılım Ölçüleri
Çeyrekler Aralığı
Dağılım aralığı en küçük ve en büyük değerlere
bağlı olduğundan dolayı, modifiye edilmiş bir diğer
dağılım aralığı olan çeyrekler aralığı kullanılır.
Çeyrekler
aralığı
orta
nokta
olan
medyan
etrafındaki dağılımı özetler. Q3 ile Q1 arasındaki
farkı verir.
𝐼𝑄𝑅 = 𝑄3 − 𝑄1
Dağılım Ölçüleri
Ortalama Mutlak Sapma
Ortalama mutlak sapma her bir gözlem değerinin
kendi ortalamasından mutlak farklarının ortalaması
olarak tanımlanır. Gözlem değerlerinin kendi
ortalamasından farklarının toplamı sıfır olduğundan
mutlak sapma kullanılmıştır.
𝑂𝑀𝑆 =
𝑛
𝑖=1
𝑥𝑖 − 𝑥
𝑛
Dağılım Ölçüleri
Ortalama Mutlak Sapma
Ortalama mutlak sapma bir dağılım ölçüsü olarak
kullanılır ancak incelenen değişkenin dağılımı
normal dağılım gösteriyorsa standart sapma ya da
varyans daha uygun bir dağılım ölçüsü olur çünkü
normal dağılımın bir parametresi de standart
sapmadır ve dağılımı karakterize eder.
Dağılım Ölçüleri
Varyans
Verilerin kendi ortalaması etrafında nasıl bir dağılım
gösterdiğini, yayılış ve serpilmenin durumunu
değişkenin ölçü biriminin karesi olarak belirten
dağılım ölçüdür. S2 ya da değişken adına göre V(X),
V(Y)... ile gösterilir.
𝑆2 =
𝑛
𝑖=1
𝑥𝑖 − 𝑥
𝑛−1
2
=
𝑛
2
𝑥
𝑖=1 𝑖
−
𝑛−1
𝑛
2
𝑥
𝑖=1 𝑖
𝑛
Dağılım Ölçüleri
Standart Sapma
Varyans
ölçü
biriminin
karesi
olarak
ifade
edilmektedir. Örneğin gözlem değerleri metre ise
hesaplanan varyans, metrekare olarak karşımıza
çıkar.
Çoğunlukla kullanılan ölçü biriminde dağılım
ölçüsünün ifade edilmesi istenir.
Dağılım Ölçüleri
Standart Sapma
Dolayısıyla varyasın karekökü orijinal ölçü birimine
tekrar dönüş olacaktır. Varyansın karekökü standart
sapma olarak isimlendirilir ve ortalama ile birlikte
(aynı ölçü birimde olduklarından) kullanılır. S harfi
ile gösterilir.
𝑆=
𝑆2
Dağılım Ölçüleri
Standart Sapma
Örnek: 40 yaşında 165 cm. boyunda 10 sağlıklı
kadına ait FEV1 (litre) değerleri ölçülmüş ve 2.82
2.78 2.88 2.70 2.91 2.76 2.80 2.86 2.80 2.87
değerleri elde edilmiştir. FEV1 ölçümlerine ait
standart sapma değeri aşağıdaki gibi hesaplanır.
Dağılım Ölçüleri
Değişim Katsayısı
Birim sayıları ve ölçü birimleri birbirlerinden farklı
olan değişkenlerin ortalamaya göre yayılışlarını
karşılaştırmak için yararlanılan ve değişkenin
ortalama ve standart sapmasından yararlanılarak
hesaplanan bir dağılım ölçüsüdür. DK ile gösterilir.
𝑆
𝐷𝐾 = 100
𝑥
Dağılım Ölçüleri
Değişim Katsayısı
Örnek: 15 bireye ait hemoglobin değerleri 11, 12,
14, 11, 15, 16, 15, 12, 11, 10, 9, 11, 13, 14, 15
olarak belirlenmiştir.
40 yaşında 165 cm. boyunda 10 sağlıklı kadına ait
FEV1 (litre) değerleri ölçülmüş ve 2.82 2.78 2.88
2.70 2.91 2.76 2.80 2.86 2.80 2.87 değerleri elde
edilmiştir.
Dağılım Ölçüleri
Değişim Katsayısı
Acaba bu iki değişkeninden hangisi daha fazla
dağılım göstermektedir?
Bu soruyu cevaplamak için her iki değişkene ait
değişim
katsayısı
değişkenlerin
standart
hesaplanmalıdır.
sapmalarını
Eğer
doğrudan
karşılaştıracak olursak hata yapmış oluruz çünkü
değişkenlerin ölçü birimleri birbirinden farklıdır.
Dağılım Ölçüleri
Değişim Katsayısı
Acaba bu iki değişkeninden hangisi daha fazla
dağılım göstermektedir?
Bu soruyu cevaplamak için her iki değişkene ait
değişim
katsayısı
değişkenlerin
standart
hesaplanmalıdır.
sapmalarını
Eğer
doğrudan
karşılaştıracak olursak hata yapmış oluruz çünkü
değişkenlerin ölçü birimleri birbirinden farklıdır.
Dağılım Ölçüleri
Değişim Katsayısı
FEV1
değişkenine
ait
değişim
katsayısı
DK(FEV1)=(0.063/2.818) x 100 = % 2.235
Hemoglobin değişkenine ait değişim katsayısı
DK(HG)= (2.131/12.6) x 100 = %16.9 olarak
hesaplanır.
Bu
sonuçlara
göre
Hemoglobin
değişkeni FEV1 değişkenine göre daha fazla dağılım
göstermektedir.
Download