13.11.2010 Amaçlar NİCEL (Quantitative) VERİ TOPLAMA ARAÇLARI Bilişsel Olmayan (Noncognitive) Ölçümler Yazılı Testler (Kalem-Kağıt Testleri) Geçerlik ve Güvenirlik Nicel Veri Toplama Teknikleri Bu bölümde ölçümlerin geçerlilik ve güvenilirliği ile veri toplama teknikleri üzerinde durulacaktır. Araştırmanın amacına göre her bir aracın nasıl uygulanacağı ve güçlü yönleri ile zayıf yönleri anlatılacaktır. Test Geçerliği (Test Validity) Ölçme aracının kullanılma amacına hizmet etme derecesidir. Anketler, Mülakatlar ve Gözlemler Alternatif Değerlendirme Türleri Test Geçerliği Bir testin geçerliği incelenirken; Araştırmanın amacı Araştırmanın evreni ve Verilerin toplandığı çevrenin özellikleri bilinmelidir. Test geçerliği duruma özgüdür. Bir durumda geçerli olan bir test başka bir durum için geçerli olmayabilir Geçerlik, test puanlarından elde edilen sonuçların ne kadar doğru, anlamlı ve kullanılışlı olduğunun ifadesidir. Başka bir ifadeyle geçerlik, spesifik bir konu ile ilgili araştırma sonuçlarına ulaşmak için yapılan ölçümlerin doğruluğu ve bu ölçümlerin genellenebilirliğidir. Test Geçerliği Türleri İçerik Geçerliği İçerikle (Content) ilgili Yapı Geçerliği Soyut Yapılarla (Construct) İlgili. Soyut Yapının yeterince temsil edilmemesi (Construct underrepresentation) Soyut Yapıyla ilgili olmayan şeylerin teste katılması (Construct irrelevant variance) Ölçüt ve Yordama Geçerliği test sonuçlarının gelecek hakkında yorum yapmayla (Criterionrelated Validity) ilgili. 1 13.11.2010 Test Geçerliği Bileşenleri 1. İçerikle ilgili bileşenler (evidence based on content): Uzman görüşü, belirtke tablosu ve aynı kapsamı ölçtüğü bilinen bir testten elde edilen puanlar ile geçerliğini belirlemek istediğiniz testten aynı grup öğrencilerin aldığı puanlar arasındaki korelasyona bakılır. Görünüş (face) geçerliği ile içerik geçerliği birbirine benzerdir. Fakat görünüş geçerliği daha çok bir ölçme aracının ilk bakıldığında şekilsel olarak ilgili konuyla alakalı olup olmadığı hakkında fikir edinmeye yararken, içerik geçerliği daha somut veriye dayalı olarak ölçme aracının gerçekten ölçülmek istenen şeyleri içerip içermediğini gösterir. Güvenirlik (Reliability) 2. 3. 4. 5. Zıt gruplara ilişkin bileşenler (evidence based on contrasted groups):Birbirine ters olduğu bilinen gruplara aynı ölçek uygulandığında alınan cevaplarında durumu yansıtacak şekilde zıt olmasıyla anlaşılabilir. Cevaplama Süreciyle ilgili bileşenler (evidence based on response processes): Bir ölçeğin cevaplanması sürecinde ölçülmek istenen niteliklerin kullanılarak cevaplanabileceği tipte sorular içermesi gerekir. Örneğin, muhakeme yeteneğininin ezber sorularıyla ölçülmemesi gerekir. İçsel yapılarla (İç tutarlılık) ilgili bileşenler (evidence based on internal structure): Faktör analiziyle yapılır. Diğer değişkenlere ilişkileri inceleyen bileşenler (evidence based on relations to other variables): Güvenirlik (Reliability) Nicel araştırmalarda güvenirlik araştırmanın benzer gruplara uygulandığında benzer sonuçları vermesi olarak tanımlanabilir. Testin Kendinden veya Uygulamadan Kaynaklanan Hatalar: Zaman sınırlamasındaki değişiklikler Farklı puanlandırma Testin uygulamasındaki kesintiler Test uygulayıcısının cinsiyeti ve ırkı Testin uygulandığı zaman Test maddelerinin seçimi Testteki yazım hataları ve net olmayan ifadeler • Direktifleri yanlış anlama • Uygulama ortamının fiziksel durumu • Gözlemcilerdeki farklılıklar Testin Uygulandığı Bireylerden Kaynaklanan Hatalar: • Testteki bazı maddelere karşı cevap verenlerin tepkileri • Sağlık • Motivasyon • Ruh hali • Yorgunluk, bitkinlik • Şans • Dikkat ve hafıza bozukluğu • Tutum • Test becerisi • Açıklamaları anlama yeteneği • Heyecan Güvenirlik yapılan hataya göre değerlendirilir. Başka bir deyişle güvenirlik ölçümlerin hatadan ne kadar arındırıldığının göstergesidir. Ölçümlerde Hata Kaynakları • • • • • • • Test Geçerliği Bileşenleri Hata ne kadar fazla ise güvenirlik az; Hata ne kadar az ise güvenirlik fazladır. Hata oranı (güvenirlik katsayısı) 0,00 ile 0,99 arasında bir değerdir. Çoğu araştırmalarda kabul gören değer ise 0,70 ile 0,90 arasındadır. Kabul gören değerler araştırma türüne göre değişebilir. Özellikle insan davranışlarını konu alan nicel araştırmalarda kabul gören değer alt sınırı 0,50’ye kadar düşebilir. Güvenirlik Hesaplama Yolları Adı Tanımı Uygulama Örnek Kararlılık (testretest) Belli bir süre içerisinde sonuçların değişmeden kalması Aynı test aynı gruba belli aralıklarla uygulanır Yetenek testleri, IQ testleri TestiYarılama Aynı gruba aynı konu ile ilgili özdeş testlerin aynı zamanda uygulanmasından elde edilen iki ölçümün karşılaştırılması Aynı testin özdeş olan değişik formları aynı bireylere aynı zamanda uygulanır Başarı testleri TestiYarılama ve Kararlılık Aynı gruba aynı konu ile ilgili özdeş testlerin farklı zaman dilimlerinde uygulanmasından elde edilen ölçümlerin karşılaştırılması Aynı konu ile ilgili özdeş testler aynı kişilere farklı zaman dilimlerinde uygulanır Kişilik testleri ve uzun süreli ölçümler 2 13.11.2010 Güvenirlik Hesaplama Yolları Güvenirlik Hesaplama Yolları Adı Tanımı Uygulama Örnek İç Tutarlılık (Split-half; K-R; Cronbach Alpha) Tek bir seferde yapılan ölçüm sonuçlarının ikiye bölünerek her iki yarının karşılaştırılması Test bir kez uygulanır ve testteki her bir madde diğeriyle korelasyonuna bakılır. Tutum testleri ve diğer birçok ölçüm türü Verilen puanların veya gözlem sonuçlarının tutarlılığıdır İki veya daha fazla kişi aynı Gözlem ve olayı gözler veya mülakatlar puanlandırır Uzlaşma/ Anlaşma Grup ne kadar heterojense güvenirlik katsayısı da o kadar yüksektir. Anket veya test ne kadar çok maddeden oluşuyorsa güvenirlik katsayısı da o kadar yüksektir. Ranj ne kadar büyükse güvenirlik katsayısı da o kadar yüksektir. Başarı testlerinde ne kadar çok orta seviyede soru varsa güvenirlik katsayısı da o kadar yüksektir. Konuya aşina olan kişilere uygulanırsa güvenirlik katsayısı da o kadar yüksek olur. Testte bilenlerle bilmeyenleri ayırt edecek ne kadar çok soru varsa güvenirlik katsayısı da o kadar yüksektir. Geçerlik ve Güvenirlik Zaman 1 Zaman 2 A A Kararlılık (test-retest) Güvenirlik katsayısını etkileyen faktörler Adı Bir testin geçerli olabilmesi için önce güvenilir olması gerekir. Yani güvenirlik geçerlik için bir ön şarttır. Fakat güvenilir olan her test geçerli olmayabilir. Geçerli olan testler güvenilirdir. Çünkü geçerli olabilmesi için güvenilir olması gerekir. Testi-Yarılama A B Testi-Yarılama ve Kararlılık A İç Tutarlılık (Split-half; KR; Cronbach Alpha) A Uzlaşma/ Anlaşma R1 B R2 A ve B aynı testin değişik formlarını temsil etmektedir. R1 ve R2 ise farklı gözlemci veya puanlayıcıları temsil etmektedir. Güvenirliğin Araştırmaya Etkileri Test güvenirliği araştırmanın da ne kadar güvenilir olduğunun göstergesidir. Bu sebepten güvenirliğin mutlaka hesaplanması gerekir. Daha önce kullanılmış bir doküman kullanılsa bile güvenirliğin yeniden hesaplanması gerekir. Yaş, cinsiyet, gelir, iş ve çalışma süresi gibi demografik verilerle ilgili sorularda güvenirlik hesaplamasına gerek yoktur. Güvenirlik katsayısının kullandığımız veri toplama tekniklerinin tipine göre kabul aralıkları değişebilir. Kişiler hakkında sonuca ulaşılacak araştırmalarda, gruplar hakkında sonuca ulaşılacak araştırmalardan daha yüksek güvenirliğe ihtiyaç duyulur. Yazılı Testler (Kalem-Kağıt Testleri) Değişik konularda bireylere yazılı olarak (kağıt üzerinde veya bilgisayar ortamında) sunulan ve bilişsel yapıları belirlemeye yönelik sorulardan oluşurlar. Testler bireyin başarısını, öğrenme yeteneğini, ilgilerini, tutumlarını, değerlerini belirlemeye yönelik olabilir. 3 13.11.2010 Yazılı Testler Bilişsel Olmayan (Noncognitive) Ölçümler (Envanterler) 1. Standardize Testler Tutum envanterleri 2. Bağıl yada Mutlak Değerlendirmeye Dayalı Testler Değerler envanterleri 3. Yetenek Testleri İlgi envanterleri 4. Başarı testleri Kişilik envanterleri Alternatif Değerlendirme Şekilleri Anketler 1. Performans-Esaslı Değerlendirme 2. Portfolio Değerlendirmesi Anket deneklerden genişçe bilgi elde etmek için kullanılır. Anketler ekonomiktir. Tüm deneklere aynı sorular ve ismini yazmadan cevaplama imkanı sunulur. Anketi Oluşturma Süreci 1. 2. 3. 4. 5. 6. 7. Gerekliliğini ve haklılığını anlama Amaçları belirleme Anket sorularının yazılması Soruların gözden geçirilmesi Genel formatı oluşturmak Ön test yapmak Revizyon Soruların- Maddelerin Yazılması Maddeler açık olmalıdır, Maddeler birden fazla fikri içermemelidir, Cevap verenler konu hakkında yetenekli, bilgili olmalı Sorular konu ile ilgili olmalı Kısa ve basit maddeler en iyisidir Olumsuz ifadelerden kaçının Önyargılı ve taraflı ifadelerden kaçının 4 13.11.2010 Mülakat (Interview) Nicel araştırmada mülakat aslında anketlerin sesli olarak uygulanmasıdır. Anket hazırlama ile aynı süreçler uygulanır. Anketten temel ayrım noktası araştırmacının veri toplanan kişiler ile direkt iletişim kurmasıdır. Mülakatı Etkileyen Etmenler Mülakat yapan kişinin yaşı Mülakat yapan kişinin branşı Mülakat yapan kişinin eğitim seviyesi Mülakat yapan kişinin mülakat deneyimi Irka dayalı faktörler Mülakat yapan kişinin cinsiyeti Sosyal ekonomik seviye Dini farklılıklar Mülakat Türleri 1. 2. 3. Yapılandırılmış (Structured) Mülakatlar Yarı-Yapılandırılmış (Semi-Structured) Mülakatlar Yapılandırılmamış (Unstructured) Mülakatlar Gözlem Araştırmacının olay veya olgu ve davranışları gerçekleştiği ortamda gözlemleyerek verilerin toplandığı tekniktir. Gözlem de kayıt tutma şekilleri Davranışların gerçekleşme sürelerini gözleme Davranışların sıklığını gözleme Belli bir süreyle tek bir bireyi gözleme Belli bir davranışı uzun bir zaman dilimde gözleme Belli zaman dilimleri seçerek bu durumlarda belli bir davranışı gözleme 5