Olasılık, Örneklem Alma Yanılgıları

advertisement
T.C
ANKARA ÜNİVERSİTESİ
EĞİTİM BİLİMLERİ ENSTİTÜSÜ
EĞİTİM BİLİMLERİ ANABİLİM DALI
EĞİTİM YÖNETİMİ, TEFTİŞİ, EKONOMİSİ VE PLANLAMASI
TEZSİZ YÜKSEK LİSANS PROGRAMI
ÖRNEKLEM BÜYÜKLÜĞÜ VE OLASI
YANILGILAR
Birgül HAMİOĞLU
EĞİTİMDE ARAŞTIRMA YÖNTEMLERİ
Yrd. Doç. Dr. H. Hüseyin AKSOY
Ankara,
Mayıs, 2006
1
EVREN
Evren, belirli bir özelliği taşıyan bireylerin tümünün oluşturduğu topluluk
olarak tanımlanmaktadır. Örneğin; okul öncesi çağı çocukları, 15-49 yaş grubu evli
kadınlar, Ankara liselerinin son sınıfında okuyan öğrenciler birer evren olabilir
(Sümbüloğlu, 2004).
ÖRNEKLEM
Örneklem, ilgili evrenden belirli kurallara uyarak seçilen ve o evreni temsil
gücüne sahip, görece evrenden daha az sayıda bireyden (birimden) oluşan ve
üzerinden çalışma yürütülecek gruptur. Bu bakımdan, örneklem, evrene göre küçük
bir gruptur. Örnekleme yapılacak evrendeki herhangi bir birim örnekleme birimi
olarak adlandırılır (Erkuş, 2005).
ÖRNEKLEM BÜYÜKLÜĞÜ
Örneklemdeki birey sayısını ifade etmektedir. Araştırıcının örneklemede en
büyük
sorunu,
örneklem
büyüklüğüne
nasıl
karar
vereceğidir.
Örneklem
büyüklüğüne karar verebilmek için formüller geliştirilmiştir (Sümbüloğlu, 2004).
Bu konuda kesin yargılara varılamaz. Ancak yaklaşık hesaplamalarla,
durumu sayılaştırma
olanağı vardır. Amaç temsil yeterliğini zedelemeyecek en
küçük sayıyı bulmaktır (Karasar, 2005).
Örneklem alınmasında asıl olan örneklemin, alındığı-çekildiği evreni temsil
etmesidir. Temel kural evren ne denli büyükse örneklemin de o denli büyük
olmasıdır. Evrenin heterojenliği ne denli yüksekse, örneklem başka aynı
büyüklükteki evrene göre daha çok sayıda kişiden oluşmalıdır (Balcı,2005).
Örneklemdeki birim sayısı arttıkça evreni temsil niteliği de artar. Ancak birim
sayısının artması maliyet, zaman ve personelin artmasına neden olur. Bu bakımdan,
yapılan araştırma için uygun örnekleme yöntemi seçilmelidir(Sümbüloğlu, 2004).
Örneklem büyüklüğünü etkileyen değişik etkenler vardır. Bunlar aşağıdaki
gibi sıralanabilir (Karasar, 2005):
1. Evrenin Benzeşikliği: Örneklemede önemli olan, evreni temsil edecek
“tipik” birimleri bulabilmektir. Örneğin; vücuttaki kan, nehirdeki su, vb. şeyleri
temsil edecek örneklerin sayısı ya da miktarı çok az olabilmekle birlikte, alınacak
2
tipik parça ya da birimlerden çıkacak sonuçları benzerlerine genellemek kolaydır.
Toplum bilimlerde bunu yapmak sınırlı ya da olanaksızdır. Birden çok sayıda birey
incelenerek ortalama bir değer bulunur ve evren değerin kestirisi olarak kullanılır.
2. Değişkenlerin Kontrolü Tarama-Deneme: Bir araştırmada, kontrol
edilemeyen önemli değişkenlerin sayısı arttıkça, evreni temsil edebilecek örneklemin
büyüklüğü de artar. Benzer bir ilişki aranmasında, laboratuvarda yapılan bir deneme
için 5-10 denek yeterli olabilirken, tarama türünde bir araştırmada 100-200 kişi
gereklidir.
3. Çözümlemedeki Gözenek Sayısı: Örneklem büyüklüğü, karşılaştırılmak
ya da betimlenmek istenen her bir gözenek için ayrı ayrı hesaplanmak zorundadır.
Dolayısıyla gözenek sayısı arttıkça, örneklemin büyüklüğü de artar. Örneğin; bir
bakanlık örgütünde yöneticilerin, herhangi bir “reform tasarısı” ile ilgili görüşleri
öğrenilmek istensin. Yaş ve cinsiyet değişkenleri ele alınabilir, bunlar da bir çok alt
bölüme ayrılabilir. Alt bölümler arttıkça daha fazla örnekleme gerek duyulmaktadır.
4. Aranan Temsil Düzeyi: Temsil düzeyi, “sapma” ve “güven düzeyi” ile
ilişkilidir. Sapma miktarı, çoğaldıkça, kestiri daha az duyarlı olur, buna karın
örneklem büyüklüğü de küçülür.
Güven düzeyini, araştırmacı kendi seçer. Bu düzey, pratikte %99 ile %95
arasındadır. Güven düzeyini tam’a (1’e) tamamlayan oran ise yanılma olasılığı()
dır. %95’in yanılma olasılığı 0.05, %99’un ise 0.01 dir. Bu yanılma olasılıklarından
hareket edilerek, karşılıkları olan 0.05 için 1.96 ve 0.01 için 2.59 değeri kullanılır.
Sapma ve güven düzeyi, kendi aralarında ilişkilidir. Güven düzeyi yükselince,
güven aracılığı ve sapma da artar. Bu da daha az duyarlı kestirim olanağı verir.
Bunun ayarlanması içinde örneklem büyüklüğünün ayarlanması gerekir.
5. Kestirilen Evrendeğer Türü: Örneklem büyüklüğünü saptayabilmek için,
hangi evrendeğer türünün kestirilmek istendiği ve bunun standart hata formülünün
nasıl
olduğu
bilinmek
zorundadır.
Hangi
formül
kullanılırsa
kullanılsın
araştırmacının sazı kestirimlerde bulunması gerekir. Özellikte standart sapma ile
ilgili kestirim çok güçlü bir karar sürecini zorunlu kılar. Bu da önceki çalışmalardan
küçük bir pilot gruptan, evrenin özellikleri ve önceki deneyimlerden yardım alınarak
kestirilebilir.
3
6. Olanaklar: Araştırmacı çalışmaya başlarken insangücü, varolan para ve
teknik olanakları dikkate alarak, kestirilmek istenen evrendeğer türü, örneklem türü,
güven düzeyi ve sapma sınırları ile olanakların birleştirilmesi ile örneklem
büyüklüğünü
belirlemelidir.
Örneğin,
“Türkiye’deki
bütün
öğretmenlerin”
görüşlerini almak yerine, “belli bir okul türündeki öğretmenlerin” görüşü alınabilir
(Karasar, 2005).
7. Örnekleme Türü: Örnekleme türü de örneklem büyüklüğünü etkiler.
ÖRNEKLEM BÜYÜKLÜĞÜNÜ BELİRLEME
Örneklem büyüklüğünü belirlemede standart hata ya da ortalamaların standart
hatası önemli bir yere sahiptir. Standart hata, aritmetik ortalamaya ve standart
sapmaya bağlıdır (Erkuş, 2005).
Aritmetik Ortalama: “Ortalama” olarakta bilinir. Genelde, x ile gösterilir
Örneğin; 8,7,6,5,4 ve 3 üyesi bulunan 6 ülkenin ortalama aile büyüklüğü 5.5
kişidir. Ortalama= (8+7+6+5+4+3) / 6 biçiminde hesaplanır (Goode ve Halt, 1964).
Standart
Sapma:
Gözlemlerin
ortalamalar
etrafında
ne
uzaklıkta
toplandığını ve ondan ne kadar uzaklaştıklarını gösteren bir dağılım ölçüsüdür.
Genelde,  veya S ile gösterilir (Goode ve Hatt, 1964).
Örnek: Seçme Bir Güney Amerika Örneğinde Aile Büyüklüğü
Aile
Büyüklüğü
(1)
1-2
3-4
5-6
7-8
9-10
Toplam
Orta
Aile
Nokta (2) Sayısı
(3)
1,5
6
3,5
25
5,5
42
7,5
22
9,5
5
100
(2x3) Ortalamadan
Sapmalar (4)
9
87,5
231,0
165,0
47,5
540,0
Kare (5)
(4)2
1,5-5,4=-3,9
3,5-5,4=-1,9
0,1
2,1
4,1
15,21
3,61
0,01
4,41
16,81
Ortalama
Çarpım (3x5)
15,21x6=91,26
3,61x25=90,25
0,42
97,02
74,05
354,000
Ortalama = 5,4
 =
bulunacağı
354
 0,65556 = 0,81 veya 4,59 ile aile başına 6,21 kişi arasında
540
söylenebilir.
Ortalama,
5.4+0.81
gösterilmektedir.
4
veya
5.4-0.81
biçiminde
Standart Hata: Rastlantısal örneklemle seçilen herhangi bir örneğin yeterli
olup olmadığını anlamak, toplanan verilerin çözümlenmesiyle belirlenir. Bunun için
toplanan verilere ilişkin standart hataya ihtiyaç vardır. Genelde,
x veya
Sx
biçiminde gösterilir. Standart hata, varsayılan bir dağılıma ilişkin bir ölçümdür
(Gökçe, 1992).
x=
σ
n
formülü ile ifade edilmektedir. Burada “n” örneklem büyüklüğünü
göstermektedir. n’i çekecek olursak:
n=
σ2
olur.
σx 2
Standart hata küçüldükçe, örneklemin n sayısı artar; dolayısıyla örneklemin
evreni temsil gücü artar (Erkuş, 2005).
Pratikte ve özellikle bizim ülkemizde evrenin standart sapmasının bilinmesi
çok zordur; bunu gidermek için pilot bir çalışmayla bir örneklem üzerinde bulunan
örneklem standart sapması yardımıyla ve diğer kestirim yöntemleriyle bu sorun
çözülmeye çalışılır. Ayrıca örneklem büyüklüğünü belirlemek için, temel alınan
belirli bir güven aralığına ve  düzeyine gereksinim vardır.
Evren parametreleri bilinemediği için örneklem istatistiklerinden kestirilirler.
Birim normal dağlımda  1.96 tam dağılımın %95’ini, 2.59 ise tüm
dağılımın %99’unu kapsar (Erkuş, 2005).
Varyans (Değişim) Katsayısı: Standart sapma için bulunan değerin
büyüklüğü ya da küçüklüğü hakkında karar verebilmek için varyans katsayısının
hesaplanması gerekir. Varyans katsayısı, standart sapma dağılımının yaygınlığını
gösteren bir ölçümdür. Varyans katsayısı standart sapmanın ortalamaya göre yüzde
olarak ifade edilmesidir (Gökçe, 1992). Ayrıca varyans, standart sapmanın karesi
olarakda tanımlanmaktadır (Baloğlu, 2006).
Burada amaç, standart hatanın
minimum olduğu örneklem seçmektir.
ÖRNEKLEM BÜYÜKLÜĞÜNÜ SAPTAMAK İÇİN FORMÜLLER
*N: Evrendeki birey sayısı,
*n: Örnekleme alınacak birey sayısı,
5
*t: Belirli serbestlik derecesinde ve saptanan yanılma düzeyinde t
tablosundan bulunan teorik değer. z olarak da gösterilir.
I. Veriler Süreksiz ve Görünüş Sıklığı İncelecekse:
p: İncelenen olayın görüş sıklığı (olasılığı),
q: İncelenen olayın görülmeyiş sıklığı (p+q=1),
d: Olayın görülüş sıklığına göre yapılmak istenen  sapma.
1. Evrendeki birey sayısı (N) bilinmiyorsa:
t 2 .p.q
ifadesi kullanılmaktadır.
n
d2
Örnek 1: Bir bölgede 40 yaşın üzerindeki kişilerde hipertansiyon görülme
sıklığını incelemek istediğimizi varsayalım. Daha önce yapılan çalışmalarda
hipertansiyon görülme sıklığının %25 olduğu bilinmektedir. %95 olasılıkla (güvenle)
yani =0,05 için d=0,05 sapma ile kaç kişiyi örnekleme seçmeliyiz?
p= 0,25 ve q=0,75
t=1,96 dır. (=0,05 için  serbestlik derecesinde teorik t tablodan
bulunmaktadır. N bilinmediği için serbestlik derecesi ’ dur).
n
t 2 .p.q (1,96) 2 .(0,25x 0,75)
=
=288 birey
(0,05) 2
d2
Değer, %95 olasılıkla %20-%30 arasında olacaktır.
b)  %3 sapma (d=0,03) alınırsa,
t 2 .p.q (1,96) 2 .(0,25x 0,75)
=
=800 birey
n
(0,03) 2
d2
Değer, %95 olasılıkla %22-%28 arasında olacaktır.
c) =0,01 düzeyi seçilir ve d=0,03 alınırsa, t=2,59 dur. Burada %99 güven
söz konusudur.
n
t 2 .p.q (2,59) 2 .(0,25x 0,75)
=
=1398 birey
(0,03) 2
d2
(Sümbüloğlu, 2004)
6
Örnek 2: Şizofreninin evrende görülme olasılığı 0,08 olarak bulunmuş olsun.
O kadarlık oranda sapma d=  0,2 olsun. %95 güvenle kaç kişilik bir şizofren
örneğinde çalışmak gerekir?
n
t 2 .p.q (1,96) 2 .(0,08x 0,92)
=
= 7 birey
(0,2) 2
d2
(Erkuş, 2005)
2. Evrendeki birey sayısı (N) biliniyorsa:
n
N.t 2 .p.q
ifadesi kullanılmaktadır.
d 2 .( N  1)  t 2 .p.q
Örnek 3: 1. örnekte, birey sayısının 500 olduğu kabul edilirse (N=500),
n
N.t 2 .p.q
500.(1,96) 2 .(0,25x 0,75)
=
=183 birey
d 2 .( N  1)  t 2 .p.q (0,05) 2 .(500  1)  (1,96) 2 .(0,25x 0,75)
Değer %95 olasılıkla, %20-%30 arasında olacaktır.
II. Veriler Sürekli ve Ortalamalar İncelenecekse:
: Evren standart sapması. Çoğunlukla bilinmediği için örneklem standart
sapması “S” kullanılır.
d: Ortalamaya göre yapılmak istenen  sapma (T ile de gösterilir, örnek
ortalaması ile evren ortalaması arasındaki fark olarak da bilinir).
1. Evrendeki birey sayısı (N) bilinmiyorsa:
n
t 2 .σ 2
ifadesi kullanılmaktadır.
d2
Örnek 4: Bireylerin bir zeka testinden aldıkları puanların (evren) standart
sapması 10 olsun. Ortalamaya göre göze alınan sapma miktarı d  3 olsun. 0,05 hata
ile (%95 güvenle) kaç kişilik örneklem üzerinde çalışmak gerekir?
n
t 2 .σ 2 (1,96 2.10 2
=
=12 birey
32
d2
(Erkuş, 2005)
7
Örnek 5: Büyük bir hastanenin başhekiminin bir yıl önce yaptığı bir
araştırmada taburcu olan tüm hastaların ortalama yatış süresini 15 gün, standart
sapmasını 4 gün bulmuş olduğunu varsayalım. Başhekim tüm taburcu olan hastaları
incelediği için elde ettiği standart sapma evren standart sapmasıdır. Başhekim bu
araştırmayı maliyet ve zaman yönünden ekonomik olması için örnekleme ile yapmak
istemektedir. Bulacağı ortalamanın  0,5 birim sapma yapmasını ve yanılma düzeyin
() 0,05 olmasını istemektedir. Kaç hasta dosyası incelenmelidir?
n
t 2 .σ 2 (1,96) 2 .4 2
=
=246 birey
(0,5) 2
d2
Ortalama, %95 olasılıkla  0,5 birim sapma yapacaktır
(Sümbüloğlu, 2004)
2. Evrendeki birey sayısı (N) biliniyorsa:
n
Nt 2 .σ 2
ifadesi kullanılmaktadır.
d 2 .( N  1)  t 2 .σ 2
Örnek 6: 4. örnekteki birey sayısı, 1000 ise kaç kişilik bir örneklem üzerinde
çalışmak gerekir?
n=
Nt 2 .σ 2
1000.(1,96) 2 .(10) 2
=
=  41 birey
d 2 .( N  1)  t 2 .σ 2
(3) 2 (1000  1)  (1,96) 2 .(10) 2
Örnek 7: 10.000 birimlik bir ana kitlenin (evren) varyansı 900’dür. Bu ana
kitleden çekilecek bir örnek yardımıyla, ana kitle ortalaması tahmin edilmek
isteniyor. Örnek ortalaması ile ana kitle ortalaması arasıdaki farkın %95 güven
aralığında 5’den büyük olmaması için örneklem büyüklüğü ne olmalıdır?
2: Varyans, yani istenen standart hatanın karesidir.
d= 5 ve t= 1,96’dır.
no 
t 2 .σ 2 (1,96) 2 .900

 139 birey
25
d2
Bunun için
no
<0,05 olmalıdır.
N
8
139
<0,05 için
10.000
0,0139  0,01 < 0,05 doğrudur (İslamoğlu, 2002; Baloğlu, 2006).
Bütün bu hesaplarda evrenin varyansı bilindiği varsayılıyor, oysa çoğu kez
bilinmiyor.
Aynı örnek için varyans bilinmiyorsa çözüm:
a) Önce ana kitle varyansı hakkında kaba bir tahminde bulunularak; varyans
600 kabul ediliyor.
no 
t 2 .σ 2 (1,96) 2 .600

 92 birey
d2
52
Bu sonuç için:
no
92
 0,05 doğrudur.
=
N 10.000
b) 50 kişilik bir örneklem kabul edilsin ve bu örneğin varyansı 450 bulunmuş
olsun.
σ2 
450
 9 ise =3
50
t.  <d için (1,96).3<5 ise 5,88 < 5 olur.
Bu sonuç doğru olmadığından, örnek sayısını örnekten elde edilen varyansa
göre yeniden hesaplamak gerekmektedir.
Örneklem Büyüklüğünü, evren içinde belirli bir özelliğe sahip olanların
üzerinden hesaplanabilir:
Örnek 8: 10.000 birimlik bir ana kitlede belirli bir özelliğe sahip olanların
nispeti %62’dir. Bu nispet içindekilerden çekilecek bir örnek yardımıyla, yapılacak
tahmin standart hatasının 0,02 den büyük olmaması için çekilecek örnek büyüklüğü
ne olmalıdır?
p: ana kitlede (evrende) belirli özelliğe sahip olanların nispeti
no 
p.q (0,62) x (0,38)

 589 birey
σ2
(0,02) 2
9
Bu sayı:
no
589
 0,05 koşuluna bağlıdır.
=
N 10.000
0,058 < 0,05 ifadesi doğru değildir. Bunun düzeltmesi aşağıdaki gibi
yapılmaktadır:
n
no
589
589


 556 kişi seçilmelidir.
no
589
1,0598
1
1
10.000
N
(İslamoğlu, 2002).
Standart hatanın belirli bir değerden büyük olmaması hali:
Örnek 10: Varyansı 900 olan bir ana kitleden çekilecek örnek yardımıyla, bu
ana kitlenin ortalaması edilmek isteniyor. Tahminin standart hatasının 5’den büyük
olmaması için örnek büyüklüğü ne olmalıdır?
σ2
900
no  2 
 36 birey
25
σx
Bu çözümün geçerliliği,
no
< 0,05 oranına bağlıdır.
N
Eğer ana kitle 500 birim olsaydı;
n o 36
 0,072  0,05 doğru olmayacaktı.
=
N 500
O halde;
n
no
36

 34 örnek seçmek gerekecektir.
no
36
1
1
500
N
OLASI YANILGILAR
Örneklem ne kadar iyi olursa olsun, evren, bütünü ile incelenmediğinden
örneklemdeğerler ile evrendeğerler arasında belli sapmaların bulunması mümkündür.
2 tür yanılgı olasılığı vardır. Bunlar (Karasar, 2005):
1.
Örnekleme
Yanılgısı:
Örneklemin
kaynaklanmaktadır.
10
kendi
sınırlılıklarından
2. Örnekleme Dışı Yanılgılar: Teknik sınırlılıklardan kaynaklanmaktadır.
Bu yanılgılar iki şekilde bulunabilir:
a) Yansız yanılgılar: Evrendeğerlerden her iki yönlü sapmaların yer alabildiği
yanılgılardır. Bunların birbirini dengelemesi beklenir. Araştırma için çok büyük
tehlike oluşturmazlar.
b) Yanlı (sistemli) yanılgılar: Belli bir yöndeki sapmaların yer aldığı
yanılgılardır. Araştırma için tehlikelidir.
Bir örneklemede aşağıdaki yanılgılara rastlanabilir (Balcı, 2005, İslamoğlu,
2002; Karasar, 2005):
1. Örneklem büyüklüğünün doğru hesaplanmayışı.
2. Örneklemde yansızlık kuralına yeterince uyulmaması: Örneğin; cinsiyetin
etkili olduğu bir çalışmada örneklemede, evrendeki kız ve erkek oranları dengesinin
bulunmaması.
3. Evrenin listelenmesinde eksiklik ve yanlışlıklar.
4. Örnekleme hatasız olmakla birlikte, örneklem birimlerindeki ölçümler
hatalı yapılmışsa.
Yanılgılar ister yanlı olsun, ister yansız, örneklemede, belli bir oranı
geçmeyen yanılgılar örneklemin değerinden fazla bir şey kaybettirmez.
KAYNAKÇA
Balcı A. (2005). Sosyal Bilimlerde Araştırma Yöntem Teknik ve İlkeler.
5. Baskı. Ankara: Pegema Yayıncılık.
Baloğlu B. (2006). Sosyal Bilimlerde Araştırma Yöntemi. 3.Basım.
İstanbul: Der Yayınları.
Erkuç A. (2005). Bilimsel Araştırma Sarmalı. 1. Baskı. Ankara: Seçkin
Yayıncılık.
Goode W. J. ve Hatt P.K. (1964). Sosyal Bilimlerde Araştırma
Metodları. Çeviren: R.Y.Keleş. Ankara: Gürsoy Basımevi.
Gökçe B. (1992). Toplumsal Bilimlerde Araştırma. Ankara: Savaş
Yayınları.
11
İslamoğlu A.H. (2002). Bilimsel Araştırma Yöntemleri. 1. Baskı.
İstanbul: Beta Basım Yayım Dağıtım.
Karasar N. (2005). Bilimsel Araştırma Yöntemi. 15. Baskı. Ankara:
Nobel Yayın Dağıtım.
Sümbüloğlu V. ve Sümbüloğlu K. (2004). Sağlık Bilimlerinde Araştırma
Yöntemleri. 5. Baskı, Ankara: Hatiboğlu Basım ve Yayım.
12
Download