T.C ANKARA ÜNİVERSİTESİ EĞİTİM BİLİMLERİ ENSTİTÜSÜ EĞİTİM BİLİMLERİ ANABİLİM DALI EĞİTİM YÖNETİMİ, TEFTİŞİ, EKONOMİSİ VE PLANLAMASI TEZSİZ YÜKSEK LİSANS PROGRAMI ÖRNEKLEM BÜYÜKLÜĞÜ VE OLASI YANILGILAR Birgül HAMİOĞLU EĞİTİMDE ARAŞTIRMA YÖNTEMLERİ Yrd. Doç. Dr. H. Hüseyin AKSOY Ankara, Mayıs, 2006 1 EVREN Evren, belirli bir özelliği taşıyan bireylerin tümünün oluşturduğu topluluk olarak tanımlanmaktadır. Örneğin; okul öncesi çağı çocukları, 15-49 yaş grubu evli kadınlar, Ankara liselerinin son sınıfında okuyan öğrenciler birer evren olabilir (Sümbüloğlu, 2004). ÖRNEKLEM Örneklem, ilgili evrenden belirli kurallara uyarak seçilen ve o evreni temsil gücüne sahip, görece evrenden daha az sayıda bireyden (birimden) oluşan ve üzerinden çalışma yürütülecek gruptur. Bu bakımdan, örneklem, evrene göre küçük bir gruptur. Örnekleme yapılacak evrendeki herhangi bir birim örnekleme birimi olarak adlandırılır (Erkuş, 2005). ÖRNEKLEM BÜYÜKLÜĞÜ Örneklemdeki birey sayısını ifade etmektedir. Araştırıcının örneklemede en büyük sorunu, örneklem büyüklüğüne nasıl karar vereceğidir. Örneklem büyüklüğüne karar verebilmek için formüller geliştirilmiştir (Sümbüloğlu, 2004). Bu konuda kesin yargılara varılamaz. Ancak yaklaşık hesaplamalarla, durumu sayılaştırma olanağı vardır. Amaç temsil yeterliğini zedelemeyecek en küçük sayıyı bulmaktır (Karasar, 2005). Örneklem alınmasında asıl olan örneklemin, alındığı-çekildiği evreni temsil etmesidir. Temel kural evren ne denli büyükse örneklemin de o denli büyük olmasıdır. Evrenin heterojenliği ne denli yüksekse, örneklem başka aynı büyüklükteki evrene göre daha çok sayıda kişiden oluşmalıdır (Balcı,2005). Örneklemdeki birim sayısı arttıkça evreni temsil niteliği de artar. Ancak birim sayısının artması maliyet, zaman ve personelin artmasına neden olur. Bu bakımdan, yapılan araştırma için uygun örnekleme yöntemi seçilmelidir(Sümbüloğlu, 2004). Örneklem büyüklüğünü etkileyen değişik etkenler vardır. Bunlar aşağıdaki gibi sıralanabilir (Karasar, 2005): 1. Evrenin Benzeşikliği: Örneklemede önemli olan, evreni temsil edecek “tipik” birimleri bulabilmektir. Örneğin; vücuttaki kan, nehirdeki su, vb. şeyleri temsil edecek örneklerin sayısı ya da miktarı çok az olabilmekle birlikte, alınacak 2 tipik parça ya da birimlerden çıkacak sonuçları benzerlerine genellemek kolaydır. Toplum bilimlerde bunu yapmak sınırlı ya da olanaksızdır. Birden çok sayıda birey incelenerek ortalama bir değer bulunur ve evren değerin kestirisi olarak kullanılır. 2. Değişkenlerin Kontrolü Tarama-Deneme: Bir araştırmada, kontrol edilemeyen önemli değişkenlerin sayısı arttıkça, evreni temsil edebilecek örneklemin büyüklüğü de artar. Benzer bir ilişki aranmasında, laboratuvarda yapılan bir deneme için 5-10 denek yeterli olabilirken, tarama türünde bir araştırmada 100-200 kişi gereklidir. 3. Çözümlemedeki Gözenek Sayısı: Örneklem büyüklüğü, karşılaştırılmak ya da betimlenmek istenen her bir gözenek için ayrı ayrı hesaplanmak zorundadır. Dolayısıyla gözenek sayısı arttıkça, örneklemin büyüklüğü de artar. Örneğin; bir bakanlık örgütünde yöneticilerin, herhangi bir “reform tasarısı” ile ilgili görüşleri öğrenilmek istensin. Yaş ve cinsiyet değişkenleri ele alınabilir, bunlar da bir çok alt bölüme ayrılabilir. Alt bölümler arttıkça daha fazla örnekleme gerek duyulmaktadır. 4. Aranan Temsil Düzeyi: Temsil düzeyi, “sapma” ve “güven düzeyi” ile ilişkilidir. Sapma miktarı, çoğaldıkça, kestiri daha az duyarlı olur, buna karın örneklem büyüklüğü de küçülür. Güven düzeyini, araştırmacı kendi seçer. Bu düzey, pratikte %99 ile %95 arasındadır. Güven düzeyini tam’a (1’e) tamamlayan oran ise yanılma olasılığı() dır. %95’in yanılma olasılığı 0.05, %99’un ise 0.01 dir. Bu yanılma olasılıklarından hareket edilerek, karşılıkları olan 0.05 için 1.96 ve 0.01 için 2.59 değeri kullanılır. Sapma ve güven düzeyi, kendi aralarında ilişkilidir. Güven düzeyi yükselince, güven aracılığı ve sapma da artar. Bu da daha az duyarlı kestirim olanağı verir. Bunun ayarlanması içinde örneklem büyüklüğünün ayarlanması gerekir. 5. Kestirilen Evrendeğer Türü: Örneklem büyüklüğünü saptayabilmek için, hangi evrendeğer türünün kestirilmek istendiği ve bunun standart hata formülünün nasıl olduğu bilinmek zorundadır. Hangi formül kullanılırsa kullanılsın araştırmacının sazı kestirimlerde bulunması gerekir. Özellikte standart sapma ile ilgili kestirim çok güçlü bir karar sürecini zorunlu kılar. Bu da önceki çalışmalardan küçük bir pilot gruptan, evrenin özellikleri ve önceki deneyimlerden yardım alınarak kestirilebilir. 3 6. Olanaklar: Araştırmacı çalışmaya başlarken insangücü, varolan para ve teknik olanakları dikkate alarak, kestirilmek istenen evrendeğer türü, örneklem türü, güven düzeyi ve sapma sınırları ile olanakların birleştirilmesi ile örneklem büyüklüğünü belirlemelidir. Örneğin, “Türkiye’deki bütün öğretmenlerin” görüşlerini almak yerine, “belli bir okul türündeki öğretmenlerin” görüşü alınabilir (Karasar, 2005). 7. Örnekleme Türü: Örnekleme türü de örneklem büyüklüğünü etkiler. ÖRNEKLEM BÜYÜKLÜĞÜNÜ BELİRLEME Örneklem büyüklüğünü belirlemede standart hata ya da ortalamaların standart hatası önemli bir yere sahiptir. Standart hata, aritmetik ortalamaya ve standart sapmaya bağlıdır (Erkuş, 2005). Aritmetik Ortalama: “Ortalama” olarakta bilinir. Genelde, x ile gösterilir Örneğin; 8,7,6,5,4 ve 3 üyesi bulunan 6 ülkenin ortalama aile büyüklüğü 5.5 kişidir. Ortalama= (8+7+6+5+4+3) / 6 biçiminde hesaplanır (Goode ve Halt, 1964). Standart Sapma: Gözlemlerin ortalamalar etrafında ne uzaklıkta toplandığını ve ondan ne kadar uzaklaştıklarını gösteren bir dağılım ölçüsüdür. Genelde, veya S ile gösterilir (Goode ve Hatt, 1964). Örnek: Seçme Bir Güney Amerika Örneğinde Aile Büyüklüğü Aile Büyüklüğü (1) 1-2 3-4 5-6 7-8 9-10 Toplam Orta Aile Nokta (2) Sayısı (3) 1,5 6 3,5 25 5,5 42 7,5 22 9,5 5 100 (2x3) Ortalamadan Sapmalar (4) 9 87,5 231,0 165,0 47,5 540,0 Kare (5) (4)2 1,5-5,4=-3,9 3,5-5,4=-1,9 0,1 2,1 4,1 15,21 3,61 0,01 4,41 16,81 Ortalama Çarpım (3x5) 15,21x6=91,26 3,61x25=90,25 0,42 97,02 74,05 354,000 Ortalama = 5,4 = bulunacağı 354 0,65556 = 0,81 veya 4,59 ile aile başına 6,21 kişi arasında 540 söylenebilir. Ortalama, 5.4+0.81 gösterilmektedir. 4 veya 5.4-0.81 biçiminde Standart Hata: Rastlantısal örneklemle seçilen herhangi bir örneğin yeterli olup olmadığını anlamak, toplanan verilerin çözümlenmesiyle belirlenir. Bunun için toplanan verilere ilişkin standart hataya ihtiyaç vardır. Genelde, x veya Sx biçiminde gösterilir. Standart hata, varsayılan bir dağılıma ilişkin bir ölçümdür (Gökçe, 1992). x= σ n formülü ile ifade edilmektedir. Burada “n” örneklem büyüklüğünü göstermektedir. n’i çekecek olursak: n= σ2 olur. σx 2 Standart hata küçüldükçe, örneklemin n sayısı artar; dolayısıyla örneklemin evreni temsil gücü artar (Erkuş, 2005). Pratikte ve özellikle bizim ülkemizde evrenin standart sapmasının bilinmesi çok zordur; bunu gidermek için pilot bir çalışmayla bir örneklem üzerinde bulunan örneklem standart sapması yardımıyla ve diğer kestirim yöntemleriyle bu sorun çözülmeye çalışılır. Ayrıca örneklem büyüklüğünü belirlemek için, temel alınan belirli bir güven aralığına ve düzeyine gereksinim vardır. Evren parametreleri bilinemediği için örneklem istatistiklerinden kestirilirler. Birim normal dağlımda 1.96 tam dağılımın %95’ini, 2.59 ise tüm dağılımın %99’unu kapsar (Erkuş, 2005). Varyans (Değişim) Katsayısı: Standart sapma için bulunan değerin büyüklüğü ya da küçüklüğü hakkında karar verebilmek için varyans katsayısının hesaplanması gerekir. Varyans katsayısı, standart sapma dağılımının yaygınlığını gösteren bir ölçümdür. Varyans katsayısı standart sapmanın ortalamaya göre yüzde olarak ifade edilmesidir (Gökçe, 1992). Ayrıca varyans, standart sapmanın karesi olarakda tanımlanmaktadır (Baloğlu, 2006). Burada amaç, standart hatanın minimum olduğu örneklem seçmektir. ÖRNEKLEM BÜYÜKLÜĞÜNÜ SAPTAMAK İÇİN FORMÜLLER *N: Evrendeki birey sayısı, *n: Örnekleme alınacak birey sayısı, 5 *t: Belirli serbestlik derecesinde ve saptanan yanılma düzeyinde t tablosundan bulunan teorik değer. z olarak da gösterilir. I. Veriler Süreksiz ve Görünüş Sıklığı İncelecekse: p: İncelenen olayın görüş sıklığı (olasılığı), q: İncelenen olayın görülmeyiş sıklığı (p+q=1), d: Olayın görülüş sıklığına göre yapılmak istenen sapma. 1. Evrendeki birey sayısı (N) bilinmiyorsa: t 2 .p.q ifadesi kullanılmaktadır. n d2 Örnek 1: Bir bölgede 40 yaşın üzerindeki kişilerde hipertansiyon görülme sıklığını incelemek istediğimizi varsayalım. Daha önce yapılan çalışmalarda hipertansiyon görülme sıklığının %25 olduğu bilinmektedir. %95 olasılıkla (güvenle) yani =0,05 için d=0,05 sapma ile kaç kişiyi örnekleme seçmeliyiz? p= 0,25 ve q=0,75 t=1,96 dır. (=0,05 için serbestlik derecesinde teorik t tablodan bulunmaktadır. N bilinmediği için serbestlik derecesi ’ dur). n t 2 .p.q (1,96) 2 .(0,25x 0,75) = =288 birey (0,05) 2 d2 Değer, %95 olasılıkla %20-%30 arasında olacaktır. b) %3 sapma (d=0,03) alınırsa, t 2 .p.q (1,96) 2 .(0,25x 0,75) = =800 birey n (0,03) 2 d2 Değer, %95 olasılıkla %22-%28 arasında olacaktır. c) =0,01 düzeyi seçilir ve d=0,03 alınırsa, t=2,59 dur. Burada %99 güven söz konusudur. n t 2 .p.q (2,59) 2 .(0,25x 0,75) = =1398 birey (0,03) 2 d2 (Sümbüloğlu, 2004) 6 Örnek 2: Şizofreninin evrende görülme olasılığı 0,08 olarak bulunmuş olsun. O kadarlık oranda sapma d= 0,2 olsun. %95 güvenle kaç kişilik bir şizofren örneğinde çalışmak gerekir? n t 2 .p.q (1,96) 2 .(0,08x 0,92) = = 7 birey (0,2) 2 d2 (Erkuş, 2005) 2. Evrendeki birey sayısı (N) biliniyorsa: n N.t 2 .p.q ifadesi kullanılmaktadır. d 2 .( N 1) t 2 .p.q Örnek 3: 1. örnekte, birey sayısının 500 olduğu kabul edilirse (N=500), n N.t 2 .p.q 500.(1,96) 2 .(0,25x 0,75) = =183 birey d 2 .( N 1) t 2 .p.q (0,05) 2 .(500 1) (1,96) 2 .(0,25x 0,75) Değer %95 olasılıkla, %20-%30 arasında olacaktır. II. Veriler Sürekli ve Ortalamalar İncelenecekse: : Evren standart sapması. Çoğunlukla bilinmediği için örneklem standart sapması “S” kullanılır. d: Ortalamaya göre yapılmak istenen sapma (T ile de gösterilir, örnek ortalaması ile evren ortalaması arasındaki fark olarak da bilinir). 1. Evrendeki birey sayısı (N) bilinmiyorsa: n t 2 .σ 2 ifadesi kullanılmaktadır. d2 Örnek 4: Bireylerin bir zeka testinden aldıkları puanların (evren) standart sapması 10 olsun. Ortalamaya göre göze alınan sapma miktarı d 3 olsun. 0,05 hata ile (%95 güvenle) kaç kişilik örneklem üzerinde çalışmak gerekir? n t 2 .σ 2 (1,96 2.10 2 = =12 birey 32 d2 (Erkuş, 2005) 7 Örnek 5: Büyük bir hastanenin başhekiminin bir yıl önce yaptığı bir araştırmada taburcu olan tüm hastaların ortalama yatış süresini 15 gün, standart sapmasını 4 gün bulmuş olduğunu varsayalım. Başhekim tüm taburcu olan hastaları incelediği için elde ettiği standart sapma evren standart sapmasıdır. Başhekim bu araştırmayı maliyet ve zaman yönünden ekonomik olması için örnekleme ile yapmak istemektedir. Bulacağı ortalamanın 0,5 birim sapma yapmasını ve yanılma düzeyin () 0,05 olmasını istemektedir. Kaç hasta dosyası incelenmelidir? n t 2 .σ 2 (1,96) 2 .4 2 = =246 birey (0,5) 2 d2 Ortalama, %95 olasılıkla 0,5 birim sapma yapacaktır (Sümbüloğlu, 2004) 2. Evrendeki birey sayısı (N) biliniyorsa: n Nt 2 .σ 2 ifadesi kullanılmaktadır. d 2 .( N 1) t 2 .σ 2 Örnek 6: 4. örnekteki birey sayısı, 1000 ise kaç kişilik bir örneklem üzerinde çalışmak gerekir? n= Nt 2 .σ 2 1000.(1,96) 2 .(10) 2 = = 41 birey d 2 .( N 1) t 2 .σ 2 (3) 2 (1000 1) (1,96) 2 .(10) 2 Örnek 7: 10.000 birimlik bir ana kitlenin (evren) varyansı 900’dür. Bu ana kitleden çekilecek bir örnek yardımıyla, ana kitle ortalaması tahmin edilmek isteniyor. Örnek ortalaması ile ana kitle ortalaması arasıdaki farkın %95 güven aralığında 5’den büyük olmaması için örneklem büyüklüğü ne olmalıdır? 2: Varyans, yani istenen standart hatanın karesidir. d= 5 ve t= 1,96’dır. no t 2 .σ 2 (1,96) 2 .900 139 birey 25 d2 Bunun için no <0,05 olmalıdır. N 8 139 <0,05 için 10.000 0,0139 0,01 < 0,05 doğrudur (İslamoğlu, 2002; Baloğlu, 2006). Bütün bu hesaplarda evrenin varyansı bilindiği varsayılıyor, oysa çoğu kez bilinmiyor. Aynı örnek için varyans bilinmiyorsa çözüm: a) Önce ana kitle varyansı hakkında kaba bir tahminde bulunularak; varyans 600 kabul ediliyor. no t 2 .σ 2 (1,96) 2 .600 92 birey d2 52 Bu sonuç için: no 92 0,05 doğrudur. = N 10.000 b) 50 kişilik bir örneklem kabul edilsin ve bu örneğin varyansı 450 bulunmuş olsun. σ2 450 9 ise =3 50 t. <d için (1,96).3<5 ise 5,88 < 5 olur. Bu sonuç doğru olmadığından, örnek sayısını örnekten elde edilen varyansa göre yeniden hesaplamak gerekmektedir. Örneklem Büyüklüğünü, evren içinde belirli bir özelliğe sahip olanların üzerinden hesaplanabilir: Örnek 8: 10.000 birimlik bir ana kitlede belirli bir özelliğe sahip olanların nispeti %62’dir. Bu nispet içindekilerden çekilecek bir örnek yardımıyla, yapılacak tahmin standart hatasının 0,02 den büyük olmaması için çekilecek örnek büyüklüğü ne olmalıdır? p: ana kitlede (evrende) belirli özelliğe sahip olanların nispeti no p.q (0,62) x (0,38) 589 birey σ2 (0,02) 2 9 Bu sayı: no 589 0,05 koşuluna bağlıdır. = N 10.000 0,058 < 0,05 ifadesi doğru değildir. Bunun düzeltmesi aşağıdaki gibi yapılmaktadır: n no 589 589 556 kişi seçilmelidir. no 589 1,0598 1 1 10.000 N (İslamoğlu, 2002). Standart hatanın belirli bir değerden büyük olmaması hali: Örnek 10: Varyansı 900 olan bir ana kitleden çekilecek örnek yardımıyla, bu ana kitlenin ortalaması edilmek isteniyor. Tahminin standart hatasının 5’den büyük olmaması için örnek büyüklüğü ne olmalıdır? σ2 900 no 2 36 birey 25 σx Bu çözümün geçerliliği, no < 0,05 oranına bağlıdır. N Eğer ana kitle 500 birim olsaydı; n o 36 0,072 0,05 doğru olmayacaktı. = N 500 O halde; n no 36 34 örnek seçmek gerekecektir. no 36 1 1 500 N OLASI YANILGILAR Örneklem ne kadar iyi olursa olsun, evren, bütünü ile incelenmediğinden örneklemdeğerler ile evrendeğerler arasında belli sapmaların bulunması mümkündür. 2 tür yanılgı olasılığı vardır. Bunlar (Karasar, 2005): 1. Örnekleme Yanılgısı: Örneklemin kaynaklanmaktadır. 10 kendi sınırlılıklarından 2. Örnekleme Dışı Yanılgılar: Teknik sınırlılıklardan kaynaklanmaktadır. Bu yanılgılar iki şekilde bulunabilir: a) Yansız yanılgılar: Evrendeğerlerden her iki yönlü sapmaların yer alabildiği yanılgılardır. Bunların birbirini dengelemesi beklenir. Araştırma için çok büyük tehlike oluşturmazlar. b) Yanlı (sistemli) yanılgılar: Belli bir yöndeki sapmaların yer aldığı yanılgılardır. Araştırma için tehlikelidir. Bir örneklemede aşağıdaki yanılgılara rastlanabilir (Balcı, 2005, İslamoğlu, 2002; Karasar, 2005): 1. Örneklem büyüklüğünün doğru hesaplanmayışı. 2. Örneklemde yansızlık kuralına yeterince uyulmaması: Örneğin; cinsiyetin etkili olduğu bir çalışmada örneklemede, evrendeki kız ve erkek oranları dengesinin bulunmaması. 3. Evrenin listelenmesinde eksiklik ve yanlışlıklar. 4. Örnekleme hatasız olmakla birlikte, örneklem birimlerindeki ölçümler hatalı yapılmışsa. Yanılgılar ister yanlı olsun, ister yansız, örneklemede, belli bir oranı geçmeyen yanılgılar örneklemin değerinden fazla bir şey kaybettirmez. KAYNAKÇA Balcı A. (2005). Sosyal Bilimlerde Araştırma Yöntem Teknik ve İlkeler. 5. Baskı. Ankara: Pegema Yayıncılık. Baloğlu B. (2006). Sosyal Bilimlerde Araştırma Yöntemi. 3.Basım. İstanbul: Der Yayınları. Erkuç A. (2005). Bilimsel Araştırma Sarmalı. 1. Baskı. Ankara: Seçkin Yayıncılık. Goode W. J. ve Hatt P.K. (1964). Sosyal Bilimlerde Araştırma Metodları. Çeviren: R.Y.Keleş. Ankara: Gürsoy Basımevi. Gökçe B. (1992). Toplumsal Bilimlerde Araştırma. Ankara: Savaş Yayınları. 11 İslamoğlu A.H. (2002). Bilimsel Araştırma Yöntemleri. 1. Baskı. İstanbul: Beta Basım Yayım Dağıtım. Karasar N. (2005). Bilimsel Araştırma Yöntemi. 15. Baskı. Ankara: Nobel Yayın Dağıtım. Sümbüloğlu V. ve Sümbüloğlu K. (2004). Sağlık Bilimlerinde Araştırma Yöntemleri. 5. Baskı, Ankara: Hatiboğlu Basım ve Yayım. 12