Ölçme nedir?

advertisement
ÖLÇME DEĞERLENDİRME
İLE İLGİLİ TEMEL
KAVRAMLAR
Ölçme nedir?
Ölçme: “Bir niteliğin (özelliğin) gözlenip
gözlem sonuçlarının sayı ve sembollerle
ifade edilmesidir”.
 Ölçme işleminin aşamaları:




Ölçülecek özellikler tanımlanır: Masanın boyu,
Ayşe’nin zekası, Öğrencilerin derse karşı
tutumu
Ölçülecek niteliğe uygun araç seçimi ya da
hazırlanması: Cetvel, zeka testi, tutum ölçeği.
Ölçülecek nitelik ve aracın eşleştirilerek, sayı
ya da başka bir sembolle ifade edilmesi:
Masanın boyu 85 cm. Ayşe’nin IQ’sü 95
puandır. Veli sınavdan 60 puan aldı.
Ölçme nedir?

Ölçme Kuralı: Ölçülen özellik ile sayıların
eşleşme yollarıdır. Yapılan bir sınavda her
sorunun 3 puan olması bir ölçme kuralıdır.
DEĞİŞKEN
Değişken: Bir durumdan diğerine farklı
değerler alabilen özelliklere değişken
denir.
Örnek: İnsanların boy uzunlukları, zeka
düzeyleri,
tutumları,
başarıları,
cinsiyetleri, milliyetleri, dilleri, ekonomik
gelirleri.
Değişken olmayan özelliklere sabit denir.
Örnek: pi sayısı.
DEĞİŞKEN TÜRLERİ
Nicel Değişken: Sayılarla ifade edilebilen
değişkenlerdir.
Bu
değişkenler
bir
büyüklük gösterir.
Örnek: Boy uzunluğu, ağırlık, zeka düzeyi
 Nitel
Değişken: Sembollerle ya da
sıfatlarla ifade edilebilen değişkenlerdir.
Sayılarla ifade edilse dahi bu sayılar bir
büyüklük ifade etmez.
Örnek: Cinsiyet, milliyet, din.

DEĞİŞKEN TÜRLERİ
Sürekli Değişken: İki değer arasında
başka bir değeri bulunabilen değişkenler
süreklidir.
Örnek: Ağırlık, uzunluk, zeka düzeyi, yaş.

Süreksiz Değişken: İki değer arasında
sınırlı sayıda değer alan değişkenler
süreksizdir. Bunlar listelenebilir.
Örnek: Cinsiyet (kadın, erkek), Okul türleri
(Meslek lisesi, Anadolu lisesi…)

DEĞİŞKEN TÜRLERİ
Bağımsız Değişken: Bir duruma etki
eden değişkendir.
 Bağımlı değişken: Bir başka değişkene
bağlı olan, yani etkilenen değişkendir.
Örnek:
Sigara
Kanser

(Bağımsız Değişken)
Kanser
(Bağımsız Değişken)
(Bağımlı Değişken)
Depresyon Düzeyi
(Bağımlı Değişken)
Değerlendirme

Değerlendirme: Ölçme sonuçlarının bir
ölçütle karşılaştırılarak değer yargısına
varılma sürecidir. Bu sürecin üç ögesi
vardır:



Ölçme sonucu: Veli, sınavdan 60 puan aldı.
Ölçüt: Sınavdan en az 60 puan alan geçer
Karar: Veli 60 puan aldığı için geçti.
Değerlendirme Ölçüte Göre
Kaça Ayrılır?

Mutlak
değerlendirme
(kriter
dayanaklı): Örnek: “60 puan alan sınıfı
geçer”. Ölçüte diğer öğrencilerin etkisi
yoktur. Ölçüt sınavdan önce belirlenir.
Programın hedeflerine dönük, öğrenme
eksikliğini ve ön koşul öğrenmeleri
belirlemede kullanılır.
Değerlendirme Ölçüte Göre
Kaça Ayrılır?

Bağıl değerlendirme (norm dayanaklı):
Çan eğrisi buna örnektir. Ölçüt, gruptaki
diğer kişilerden etkilenir. Ör: “Ortalamanın
15 puan üstünde puan alanlar başarılı
olur.” Ölçütün kaç olduğu, sınavdan sonra
belirlenir. Alınacak kişi sayısının az,
başvurunun
çok
olduğu
sınavlarda
kullanılır. Ör: KPSS, ÖSS sınavları
Ölçme kaça ayrılır?
Doğrudan ölçme: Ölçülmek istenen
özellik,
başka
bir
özelliğe
ihtiyaç
duyulmadan gözlenerek ölçülmesi..
 Ör:
Masanın boyu, öğrencilerin boy
uzunluğu, iki şehir arasındaki mesafe, bir
kitabın sayfa sayısı, sınıftaki öğrenci
sayısı.

Ölçme kaça ayrılır?

Dolaylı ölçme: Ölçülmek istenen özellik,
başka bir özellikle ilişkilendirilerek yapılır.
Ölçmeye konu olan özelliklerin doğrudan
gözlenememesi ancak, kendileri ile ilgili
olduğu bilinen başka özellikler aracılığı ile
ölçülmesidir.
Ör:
Öğrencilerin
zeka
seviyelerinin,
bir
dersteki
bilgi
düzeylerinin, ilgi ve yeteneklerinin, derse
karşı tutumlarının ölçülmesi. Sıcaklığın
ölçülmesi.
Ölçme kaça ayrılır?

Türetilmiş ölçme: Ölçülmek istenen
özellik, bir araç yardımıyla ölçülemez,
başka ölçme işlemlerine ihtiyaç duyulur.
Ör: Üçgenin alanı, nüfus yoğunluğu, kişi
başına düşen gelir.
Ölçmede birim nedir?
Birim: Bir ölçme aracını oluşturan en küçük parça,
o ölçme aracının birimi olarak kabul edilir.
Herhangi bir ölçme işlemi sayı ya da sembollerin
yanında bir birimle ifade edilir ve böylelikle
anlaşılır olur. Ör: Veli sınavdan 60 puan aldı.
Bugünkü sıcaklık 3 C˚ vs.
Birimler; “doğal” ve “tanımlanmış” olarak ikiye
ayrılır. Doğal olanlar: Ör. Sınıftaki öğrenci
sayısındaki birim “bir öğrenci”. Tanımlanmış
olanlar: Ör. Uzunluk, ağırlık, öğrenci başarısı,
zeka.
Ölçmede birim nedir?

Birimlerde üç özellik bulunmalıdır:



Eşitlik: Birimin her zaman aynı büyüklükte
olmasıdır.
Genellik: Birimin insanlar tarafından aynı
anlama gelmesidir.
Kullanışlılık: Birimin ölçülecek büyüklüğe
uygun olmasıdır.
Ölçmede sıfır nedir?

Ölçmede sıfır (0) ikiye ayrılır:


Doğal (gerçek, mutlak) sıfır: Sıfır, yokluk
manasına
gelir.
Sınıftaki
öğrencilerin
mevcudunu saydığımızda, bir masanın boyunu
ölçtüğümüzde kullanılan sıfır mutlaktır.
Bağıl (göreli, tanımlanmış) sıfır: Sıfır,
yokluk manasına gelmez. Bir öğrencinin
sınavdan sıfır alması, hava sıcaklığının 0
derece
ölçülmesi.
Takvimin
“0”
yılını
göstermesi,
Dağların
deniz
seviyesindeki
yüksekliği
Ölçek Nedir?
Nesnelere verilen sayıların anlamlarını ya da
nesnelere sayılar vermede ve nesnelere verilen
sayıların kullanılmasında uyulması gereken kurallar ile
kısaltmaları belirtmek için kullanılır.
Başlıca ölçek türleri: sınıflama, sıralama, eşit
aralıklı ve oran ölçekleridir. Eğitimde kullanılan ölçek
türleri sıralama ve eşit aralıklı ölçeklerdir.
ÖLÇEK TÜRLERİ VE TEMEL ÖZELLİKLERİ
SINIFLAMA
ÖLÇEĞİ
•Nesneleri
belirli
yönlerden
benzeyip,
benzemediklerine göre sınıflamaktır.
•Nesnelerin farklılık ve benzerlikleri belirlenir.
•Nesneler sınıf, tip ve kategorilerine göre
sınıflanır.
•İllere plaka numarası vermek, kız erkek
öğrencileri ayırma, kısa uzun boylu öğrencileri
ayırma.
•Basit istatistik işlemler yapılır.
SIRALAMA
ÖLÇEĞİ
•Nesneleri belli özelliğe sahip oluş miktarı
bakımından sıralamaktır.
•Öğrencileri boy sırasına, sınav notlarına göre
sıralama.
•Ortanca ve yüzdelikler hesaplanabilir.
ÖLÇEK TÜRLERİ VE TEMEL ÖZELLİKLERİ
EŞİT
ARALIKLI
ÖLÇEK
•Nesnelerin belli bir başlangıç
noktasına göre ve belli bir özelliğe
sahip oluş derecesi bakımından eşit
aralıklarla sıralanmasıdır.
•Başlangıç noktası sıfır noktası
tanımlanmıştır. 0 noktası keyfidir ve
eşit aralıklarla bölmelenmiştir.
•Termometre,
takvim,
saat
,
sınavlar.
•Aritmetik
ortalama
standart
sapma hesaplanır.
ÖLÇEK TÜRLERİ VE TEMEL ÖZELLİKLERİ
EŞİT
ARALIKLI
ÖLÇEK
•Türkçe dersinin sınavından 90 alan
öğrencinin zekası 45 alan öğrencinin
zekasından iki kat fazladır anlamı
çıkmaz.
•Hava sıcaklığının 18 0C belirlenmesi.
•Öğrencinin matematik başarısı.
•Öğrencinin fen bilgisine olan tutumu.
•Matematik notu 90 olan bireyin notu
matematik dersi 45 olan bireyin
notunun tam iki katıdır anlamı çıkmaz.
Çünkü 0 noktası görecelidir.
ÖLÇEK TÜRLERİ VE TEMEL ÖZELLİKLERİ
ORANLI
ÖLÇEK
•Nesnelerin belli bir başlangıç
noktasına göre ve belli bir özelliğe
sahip oluş derecesi bakımından
eşit aralıklarla sıralanmasıdır.
•Başlangıç noktası olan 0 noktası
gerçek sıfır noktasıdır.
•Sıfır noktası ölçülen özelliğin
hiçliğini , yokluğunu gösterir.
ÖLÇEK TÜRLERİ VE TEMEL ÖZELLİKLERİ
ORANLI
ÖLÇEK
•Uzunluğun yada ağırlığın ölçülmesi.
•Sınıftaki öğrenci sayısının belirlenmesi.
•Basketbol takımına girecekler için boy
uzunluğu sınırı belirlenmesi.
•Boyu 90 cm olan bireyin boyu 45 cm
olan başka bir bireyin boyunun tam 2
katıdır anlamı çıkar.
•Her türlü istatistik işlemi yapılır.
Sorular:
1) Sembollerle ya da sıfatlarla ifade edilebilen
değişkenler nitel değişkenlerdir.
Aşağıdakilerden hangisi nitel değişkenlere örnek
olarak verilebilir?
A) Zeka
B) Boy uzunluğu
C) Ağırlık
D) Cinsiyet
E) Yoğunluk
23
2) Bir özelliğin gözlenip gözlem sonuçlarının sayı
ve sembollerle ifade edilmesine ne denir?
A) Ölçüt
B) Ölçek
C) Ölçme
D) Değerlendirme
E) Karar
3) Ölçme sonuçlarının bir ölçütle karşılaştırılarak
değer yargısına varılma sürecine ne denir?
A) Ölçme
B) Değerlendirme
C) Ölçek
D) Karar
24
E) Ölçüm
4) ’’60 puan alan sınıfı geçer.“ ifadesi hangi
değerlendirme türüne örnektir?
A) Norm dayanıklı
B) Çan eğrisi değerlendirme
C) Kriter dayanaklı değerlendirme
D) Bağıl değerlendirme
E) Birim değerlendirme
5) Aşağıdakilerden hangisinde tanımlanmış sıfır
kullanılır?
A) Sınıf mevcudu
B) Masanın boyu
C) Kitabın ağırlığı
D) Hava sıcaklığı
25
E) Sıvının yoğunluğu
6) Aşağıdakilerden hangisi ölçek türlerinden
değildir?
A) Sınıflama ölçeği
B) Sıralama ölçeği
C) Eşit aralıklı ölçek
D) Oranlı ölçek
E) Orantılı ölçek
26
Ölçme Aracının Yapısal
Nitelikleri
Ölçme araçlarının nitelikleri üç başlık
altında ele alınmaktadır.
Geçerlilik
Güvenirlilik
Kullanışlılık
27
Geçerlilik
Bir ölçme aracının her şeyden önce,
ölçülecek özellik ya da özellikleri tam ve
doğru olarak ölçmesi ve ölçülmesi söz
konusu olmayan başka özelliklerle
karıştırılmadan ölçülebilmesidir. İçerik
ön
plandadır.
Geçerliliği
kestirme,
genellikle korelasyon tekniğine dayanır.
“-1” ile “+1” arasında değerler alır. +1’e
yaklaşması
yükselmesi,
+1’den
uzaklaşması ise düşmesi anlamına gelir.
28
Geçerlilik türleri
1) Kapsam geçerliliği: Bir ölçme
aracının yoklanması gereken konu,
ünite ya da tüm davranışları kapsayıp
kapsamadığı ile ilgilidir. Bir testin hangi
davranışları
kapsayacağı;
“belirtke
tablosu”
ile
belirlenir.
Bu
tablo,
davranışların
konulara
ne
kadar
ağırlıkta dağıldığını gösteren iki boyutlu
bir çizelgedir.
29
Geçerlilik türleri
Kapsam geçerliliğini belirleme yolları:
 Uzman kanısı alma.
 Aynı kapsamı
ölçen başka bir testle
korelasyon.
30
Geçerlilik türleri
2) Bir ölçüte dayalı Geçerlilik: İki türü vardır:
Yordama
Geçerliliği:
Puanların
ileri
performanslara ilişkin tahminlerde dayanak
olarak kullanıldığı durumlarda kullanılır.
Yordayıcı puanlar, ölçüt puanlardan önce
elde edilir.
korelasyon
ÖSS
Akademik başarı
(yordayıcı)
(ölçüt)
31
Geçerlilik türleri
Uygunluk (uyum) Geçerliliği: Ölçüt
puanlar, yordayıcı puanlardan önce elde
edilir.
Deneme sınavı
(ölçüt)
korelasyon
ÖSS
(yordayıcı)
32
Geçerlilik türleri
3) Yapı Geçerliliği: Bir testin yapı
geçerliliği, testle ölçülmek istenen yapının
ortaya konulması derecesidir. Bir ölçme
aracının yapı geçerliliğine sahip olup
olmadığının
anlaşılması;
maddelerin
tamamıyla aynı yapıyı ölçmesine bağlıdır.
33
Geçerlilik türleri
4) Görünüş geçerliği: Testin hangi
davranışları ölçtüğünün görülmesi ile
ilgilidir. Bu daha çok testlerin kapağında
yazılır. Matematik testi, Tarih testi gibi.
Testin içindeki sorular, kapağındaki başlık
ile örtüşmesi gerekir.
34
Geçerliliği Etkileyen Faktörler
Güvenilirlik, geçerlilik için bir ön koşuldur.
Güvenilirliğin sağlanmış olması; geçerliliğin de
sağlandığı anlamına gelmez.
Soru sayısının artması,
Sabit ve sistematik hatalar geçerliliği düşürür
Maddelerin, ölçmek istenen değişkeni ölçmesi
geçerliliği arttırır.
Soruların, bilenle bilmeyeni ayırt etmesi geçerliliği
attırır.
Sınavın uygulanma koşulları (gürültülü, karanlık,
soğuk ya da sıcak, verilen süre) geçerliliği
düşürür.
Güvenilirlik
Ölçümlerin hatasızlık derecesi ya da gerçeği
yansıtma derecesi olarak algılayabiliriz.
0 ile 1 arasında değerler alan bir korelasyon
katsayısıdır
Belli bir özellik, bir ölçme aracı ile değişik
zamanlarda ölçüldüğü zaman aynı ya da hiç
olmazsa yaklaşık olarak aynı ölçümleri
vermelidir. Yani güvenilirlik, aracın ölçtüğü
şeyi tutarlı bir biçimde ölçmesidir.
Güvenilirliğin üç özelliği:
Duyarlılık: Hatası az olan ölçmedir. Hata
azaldıkça ölçme daha duyarlı (hassas) olur.
Ör: 25 soruluk bir test; 10 soruluk bir testten
daha duyarlı sonuçlar verir. Soru sayısı arttıkça
duyarlık artar.
Ör: Bir cetvelin en küçük birimi, cm. yerine mm.
olursa; daha hassas bir ölçme yapılır.
Duyarlık; birimlerin büyüklüğü ile ilgilidir.
Birimleri küçük olan ölçme aracı, büyük olandan
daha duyarlıdır.
Güvenilirliğin üç özelliği:
Tutarlılık: Aynı özelliğin farklı araçlarla ya da farklı
kişiler
tarafından
ölçülmesi
durumunda
ölçme
sonuçlarının benzer olmasına denir.
Örnek: Bir masanın boyunun iki farklı metre ile
ölçülmesi durumunda, iki ölçme sonucunun birbirine
yakın olması, metrelerin birbirleriyle tutarlı ölçmeler
yaptığını gösterir.
Ayrıca,
Madde
puanlarının
(cevapların),
testin
bütününden elde edilen puan ile korelasyonunun bir
göstergesidir. Korelasyonun yüksek olması, maddelerin
ölçülmek istenen özellik bakımından homojen (tutarlı)
olduğunu
gösterir.
Düşük
olması,
maddelerin
birbirleriyle ve bütünle tutarlı olmadığını, testin
heterojen bir yapıda olduğunu gösterir
Güvenilirliğin üç özelliği:
Kararlılık: Bir nitelik aynı araçla birden fazla
ölçüldüğünde, birbirinden farklı olmayan sonuçlar
çıkarsa, ölçme aracı kararlıdır.
Örnek:Bir metre ile bir masanın uzunluğunu
birden çok ölçtüğümüzde ölçme sonuçlarının
birbirine yakın çıkması metrenin kararlı ölçmeler
yaptığını gösterir.
39
Korelasyon Katsayısı
Korelasyon; İki değişken arasındaki ilişkinin
miktarını ve yönünü tanımlayan istatistiksel bir
tekniktir. “r” ile gösterilir. +1.00 ile -1.00
arasında bir değer alır. İki değişken arasındaki
ilişkinin gücü; katsayı değerinin, +1 ya da -1’e
yaklaşması ölçüsünde artar. Katsayı değerinin (0)
olması; değişkenler arasında ilişkinin olmadığını
gösterir.
40
Korelasyon Katsayısı
Korelasyon katsayısının pozitif olması; iki
değişkenin aynı yönde, birlikte arttığını gösterir.
Doğru orantıya benzer.
Ör: Zeka ve başarı arasındaki ilişki için hesaplanan
r =0.85 olsun. Bu katsayı, zeka arttıkça başarının
da arttığını gösterir.
41
Korelasyon Katsayısı
Korelasyon
katsayısının
negatif
olması;
Değişkenlerden
birinin
artarken
diğerinin
azaldığını ya da birinin azalırken diğerinin attığını
gösterir. Ters orantıya benzer.
Ör: Sigara içme ile sağlık arasındaki ilişkide
r = -0.75 bulunsun. Bu durum; sigara içme
davranışı arttıkça sağlık düzeyinin düştüğünü
göstermektedir.
42
Korelasyon Katsayısı
Korelasyon katsayısının sıfıra yakın olması;
eksi ya da artı olsun r nin sıfıra yakın olması;
ilişkinin olmadığını ya da çok zayıf olduğunu
gösterir.
Ör: Boy uzunluğu ile akademik başarı arasındaki
ilişki katsayısı 0.05 olsun. Bu durum; boy ile
akademik başarı arasında neredeyse hiç ilişki
olmadığını gösterir.
43
Güvenilirliği sağlama
yöntemleri
Test-tekrar test yöntemi: Test aynı gruba
belirli bir aralıkla iki kez uygulanır. Birinci
uygulama
ile
ikinci
uygulama
puanları
arasındaki ilişki/korelasyon hesaplanır. Bu
yöntemde iki uygulama arasındaki tutarlılığa
bakılır. Güvenirlik için katsayının +1.00’a
yaklaşması gerekir. Testin tekrarı için üç
haftalık süre yeterlidir. Elde edilen katsayı;
“kararlılık katsayısı” olarak da bilinir.
44
Güvenilirliği sağlama
yöntemleri
Eşdeğer (Paralel) formlar yöntemi: Testin
iki
kez
uygulanmasından
kaynaklanan
olumsuzlukları gidermek için eşdeğer formlar
geliştirip uygulanır. Geliştirilen iki form aynı
gruba aynı anda ya da kısa bir zaman
aralığında uygulanır. İki testten elde edilen
puanlar
arasındaki
korelasyon
katsayısı
hesaplanır. Elde edilen katsayı; “tutarlılık ve
eşdeğerlik” olarak ifade edilir.
45
Güvenilirliği sağlama
yöntemleri
Testi yarılama (eşdeğer yarılar) yöntemi:
Testin iki yarısı arasındaki tutarlılık araştırılır.
Tek numaralı sorular bir yarı, çift numaralı
sorular bir yarı oluşturur. Elde edilen iki yarı;
iki ayrı testmiş gibi kabul edilip aralarındaki
korelasyon hesaplanır. Bu yöntem, testin bir
kez
uygulanmasına
dayandığından
kullanışlıdır.
46
Güvenilirliği sağlama
yöntemleri
Kuder-Richardson yöntemi (KR-20, KR-21
formülleri: Her iki katsayı, testin iç tutarlılık
katsayısıdır. Eşdeğer yarılar yönteminde testin iki
yarısı arasındaki ilişki miktarı hesaplanırken, iç
tutarlılık katsayılarında testin bütün sorularının
birbirleri ile uyumu incelenir. Bu yöntemin
kullanılması; testin homojen bir yapıya, yani aynı
özelliği ölçüyor olması sayıltısına dayanır. Bu
yöntem,
cevapların
“1”
ve
“0”
olarak
puanlanabildiği testlerde kullanılır.
47
Güvenilirliği sağlama
yöntemleri
KR-20: Her bir maddenin güçlük indekslerinin
belirlenebildiği durumlarda kullanılır. Güçlük
indekslerinin hesaplanamadığı durumlarda
KR-21 kullanılır. KR-21 formülü, madde güçlük
indekslerinin eşit olduğu varsayımına dayalıdır.
Eğer maddeler güçlük indeksleri bakımından
birbirinden farklı, yani heterojen bir dağılım
gösteriyorsa KR-21 ile hesaplanan katsayı, KR-20
ile hesaplanandan daha düşük çıkar.
48
Güvenilirliği sağlama
yöntemleri
Cronbach Alpha (α) Katsayısı: Cevapların “1”
ve “0” şeklinde puanlanamadığı araçlarda
kullanılır. İç tutarlılık katsayısıdır. Duyuşsal
özelliklerin ölçülmesinde kullanılır. Örneğin tutum
ölçeklerinde doğru cevap yoktur ve cevaplar
kategoriktir. Alpha değerinin +1.00’e yaklaşması
testin kendi içinde tutarlılığının arttığını gösterir.
49
Güvenilirliği sağlama
yöntemleri
Puanlayıcı güvenilirliği: Yazılı, sözlü sınav gibi
puanlaması subjektif olan araçlarda kullanılır.
Cevap kağıtları birden çok puanlayıcı tarafından
puanlanarak, arasındaki korelasyon hesaplanır.
50
Güvenilirlik sağlama
yöntemleri ve anlamları
Uygulama
Sayısı
Güvenirlik
Test-tekrar test
2
Kararlılık
Paralel (Eşdeğer)
Formlar
2
Tutarlılık
Eşdeğer Yarılar
1
İç tutarlılık
KR-20 ve KR-21
1
İç tutarlılık
Cronbach Alpha
1
İç tutarlılık
Puanlayıcı
Güvenirliği
1
Tutarlılık
51
Güvenirliği Etkileyen
Faktörler
Testin uzunluğu: Soru sayısı arttıkça güvenirlik
artar
Ölçülen niteliğin genişliği (Ranj): Gruptaki
değişiklik ne kadar fazla ise güvenirlik o kadar
yüksek olur. Bu nedenle birkaç sınıfta uygulanan
testin güvenirliği bir sınıfta uygulanan testin
güvenirliğinden daha yüksektir
Test
uygulama
şartları:
Sınav
süresi,
öğrencileri güdülenme düzeyleri, dikkatsizlik,
gürültü, ölçmeyi yapan kişinin sınav anındaki
davranışları
52
GÜVENİLİRLİĞİ ARTTIRMAK İÇİN;
Bir testteki soru sayısını arttırmak,
Açık anlaşılır ve kesin cevaplı sorular sormak,
Öğrencilerin seviyelerine uygun sorular sormak.
Sınav süresinin gereğinden kısa veya uzun olmamasına
dikkat etmek.
Öğrencilerin sınav öncesi motivasyonunu sağlamak.
Ölçmenin hatalardan arındırılması.
Puanlamanın objektifliği.
Şans başarısının azaltılması
Soru sayısı, süre, puanlamanın nasıl olacağı gibi
özelliklerin yönerge ile belirtilmesi
Yapısal Nitelikler
53
Güvenilirlik ve Geçerlilik
arasındaki ilişki
Bir test eğer geçerliyse zaten
güvenilirdir
Test istenen özelliği ölçüyorsa,
hatalardan arınık ölçüyor
demektir.
Güvenilir bir test geçerli
olmayabilir
Güvenilirliği yüksek bir
matematik testi, fen bilgisini
ölçmek için geçerli değildir.
Testin güvenilirliği, geçerliliğini
sınırlar
Güvenilirliği 0.90 olan bir test,
0.10 kadar tesadüfi hata
barındırır. Bu hatadan dolayı
geçerlilik sınırlı olur.
Güvenilirlik ve Geçerlilik bir
derecedir, varlık ya da yokluk
durumu değildir
Bir testin güvenilirliği ve
geçerliliği yok/var yerine,
düşüktür/yüksektir denir.
54
Kullanışlılık
Ekonomiklik
Hazırlama süresi
Uygulama süresi
Hazırlayıcı ve uygulayıcının nitelikleri
Cevaplayıcının nitelikleri
Uygulama kolaylığı
Puanlama kolaylığı
Puanların yorumlama kolaylığı
55
Ölçmede Hata
Ölçme Hatası: Ölçülen özelliğin gerçek
değeri ile, ölçme sonuçlarında elde edilen
değer
arasındaki
farktır.
Ör:
Gerçek
uzunluğu 94x52 cm. olan bir sehpanın uzun
kenarı ölçüldüğünde 92 cm. bulunur ise, bu
ölçümde 2 cm. ölçme hatası vardır.
56
Ölçme Hatalarının
Kaynakları
1.
2.
3.
Ölçen kişiden gelen hatalar
Ölçülen özellikten gelen hatalar
Ölçme aracından gelen hatalar
57
Ölçen Kişiden Gelen
Hatalar
Yaş
Öğrenme durumu
Herhangi bir bedensel özür
Ruh hali
O anki durumu
58
Ölçülen Özellikten Gelen
Hatalar
Ölçülen özelliğin tam olarak tanımının
yapılmamış olması
Ölçülecek özelliğin tümünün ölçülemeyişi
gibi özellikler ölçmede hataya neden olabilir
59
Ölçme Aracından Gelen
Hatalar
Kullanılan aracının basımından doğabilecek
hatalar da ölçme hatalarına neden olabilir.
Örneğin 100 cm değil de 98 cm olan bir
metre ile yapılan ölçüm haliyle bize hatalı
sonuçlar verecektir.
60
Hata Türleri
Sabit hata
 Sistematik hata
 Tesadüfi hata

61
Hata Türleri

Sabit Hatalar: Bir ölçmeden diğerine
miktarı değişmeyen hatalara denir. Her
ölçmede hata payı aynıdır. Kontrol
edilebilir. Geçerliliği etkiler.

Örnek: Bir sınavda herkese 10 puan fazla
verilmesi, bir sorunun tüm sınıf tarafından
cevapsız bırakılması, bir cetvelin 1 cm eksik
ölçmesi
62
Hata Türleri

Sistematik
Hatalar:
Ölçülen
büyüklüğe,
ölçmeciye veya ölçme koşullarına bağlı olarak
miktarı değişen hatalardır. Yanlılık adı da verilir.
Kontrol edilebilir. Hatanın kaynağı bellidir.
Geçerliliği etkiler.
 Örnek: Yazısı güzel olana fazla puan verilmesi,
kızların fazla puan alması, ilk okunan kağıtlara
az, daha sonra okunanlara gittikçe fazla puan
verilmesi gibi.
63
Hata Türleri

Tesadüfi Hatalar: Bu tür hatalarda, hataların
hangi yönde geleceği belli olmaz.
Böyle
hatalar genellikle kaynakları iyi bilinmeyen
hatalar olup ölçme sonuçlarına gelişi güzel
karışırlar. Kontrol edilemezler. Güvenilirliği
etkiler
 Örnek: Dikkatsizce okunup puanlanan ya da
doğru okunduğu halde yanlış kayıt edilen
notlar. Öğrenci kayıtlarına rastgele puan
verilmesi. Öğrencinin sınavda hastalanması,
motivasyonun düşmesi.
64
Sorular:
1) Ölçme aracının; ölçülecek özellikleri, ölçülmesi
söz
konusu
olmayan
başka
özelliklerle
karıştırmadan tam ve doğru olarak ölçmesine ne
denir?
A) Güvenirlik
B) Geçerlilik
C) Kullanışlık
D) Kararlılık
E) Duyarlılık
2) Aynı özelliğin farklı araçlar ya da farklı kişiler
tarafından ölçülmesi durumunda ölçme sonuçlarının
benzer olmasına ne denir?
A) Tutarlılık
B) Kararlılık
C) Duyarlılık
D) Geçerlik
E) Kullanışlık
3) Aşağıdaki ilişkilerin hangisinde korelasyon katsayısı
pozitiftir?
A) Zeka - Başarı
B) Sigara içme - Sağlık
C) Boy uzunluğu - Akademik başarı
D) Yorulma – Öğrenme hızı
E) Doğum yılı – Doğum tarihi
4)
Aşağıdakilerden hangisi güvenirliği
yollarından biri değildir?
A) Şans başarısını azaltmak
B) Puanlamanın objektifliği
C) Soru sayısını azaltmak
D) Ölçmenin hatalardan arındırılması
E) Seviyeye uygun soru sormak
artırma
5) Aşağıdakilerden hangisi sabit hatalara örnektir?
A) Yazısı güzel olana fazla puan verilmesi
B) Sınavda herkese 10 puan fazla verilmesi
C) Kızlara fazla puan verilmesi
D) İlk okunan kağıda daha az puan verilmesi
E) Dikkatsizce okunup puanlama yapılması
Eğitimde Kullanılan Ölçme
Araç ve Yöntemleri
A. Geleneksel Ölçme Araç ve Yöntemleri
1. Yazılı Yoklamalar
2. Kısa Cevaplı Testler
3. Ödev ve Projeler
4. Sözlü Sınavlar
5. Çoktan Seçmeli Testler
6. Doğru-Yanlış Testleri
Geleneksel Ölçme Araç
ve Yöntemleri
1. Yazılı Yoklamalar
Yazılı olarak verilen birkaç sorunun yine yazılı
olarak cevaplandırılması istenilen sınavlara
yazılı yoklamalar adı verilmektedir.
Geleneksel Ölçme Araç
ve Yöntemleri
2. Kısa Cevaplı Testler :
Cevaplayıcının bir rakam, bir kelime ya da en
çok bir cümle ile cevaplandırdığı sorulardan
oluşan sınavlara kısa cevaplı testler adı
verilmektedir.
Geleneksel Ölçme Araç
ve Yöntemleri
4. Sözlü Sınavlar ve Mülakatlar:
Sözlü sınavlar, soruların ve cevapların sözlü
olarak
verildiği
sınavlar
olarak
tanımlanmaktadır.
Sözel
iletişim
becerilerinin
ölçülmesinde
kullanılabilen tek ölçme yöntemidir.
Geleneksel Ölçme Araç ve
Yöntemleri
5. Çoktan Seçmeli Testler:
Sorulan bir sorunun cevabını, verilen cevaplar
arasından seçme gerektiren maddelerden
oluşan testlere çoktan seçmeli, ya da seçme
gerektiren testler denilmektedir.
Yeni Ölçme Araç ve Yöntemleri
B. Yeni Ölçme Araç ve Yöntemleri
1)
2)
3)
4)
5)
6)
Portfolyolar (gelişim dosyaları)
Performans değerlendirme ve gözlem
Tartışma
Görüşme (Mülâkat)
Projeler
Kavram haritaları
Portfolyo (Öğrenci Gelişim
Dosyası)
Bireyin gelişim ve öğrenme sürecini bir bütün
olarak gösteren ve bunların değerlendirilmesini
sağlayan
sistemli
ve
amaçlı
olarak
oluşturulmuş gelişim dosyalarıdır.
Ödevler ve Projeler
Bir konunun sınıf ortamı dışında araştırma
yaparak
derinlemesine
incelenmesi
ve
raporlaştırılması ile yapılan çalışmalardır.
Projeler,
‘proje
değerlendirme
formu’
kullanılarak puanlamada nesnellik sağlanabilir.
Öz Değerlendirme
Belli bir konuda bireyin kendi kendisini
değerlendirmesine öz değerlendirme denir.
Öz değerlendirmede subjektiflik olması nedeniyle
daha çok öğrenme eksikliklerin belirlenmesinde
kullanılmalıdır.
• Yazılı
yoklamalar:
Kısaca
açıklama
ve
örneklendirme yaptırılması istenildiğinde uygun
olur.
• Kısa cevaplı testler: Boşluk doldurmalı ve soru
şeklinde sorulabilir.
Ancak soruda derste ve kitapta geçen
ifadenin
dışında bir cevap olmalı.
• Çoktan seçmeli testler: Sorular çevirme, yorum
yapma ve öteleme içerdiğinde kavramaya uygun
olur.
• Doğru-yanlış
testler:
Bilgi
farklı
formatta
verildiğinde öğrencinin bunu görebilmesi kavradığını
gösterir.
• Eşleştirmeli testler: Farklı içerikte olanların
eşleştirilmesi kavramaya uygun olduğunu gösterir
Sorular:
1) Aşağıdakilerden hangisi geleneksel ölçme
araçlarından değildir?
A) Yazılı yoklamalar
B) Sözlü sınavlar
C) Doğru yanlış testleri
D) Performans değerlendirme
E) Çoktan seçmeli testler
2) Bireyin gelişim ve öğrenme sürecini bir bütün
olarak gösteren ve bunların değerlendirilmesini
sağlayan sistemli ve amaçlı olarak oluşturulmuş
gelişim dosyalarına ne denir?
A) Performans değerlendirme
B) Kavram haritaları
C) Projeler
D) Portfolyolar
E) Görüşme (mülakat)
3) Kısaca açıklama ve örneklendirme yaptırılması
istendiğinde kullanılması uygun olan ölçme araç
ve yöntemi nedir?
A) Çoktan seçmeli testler
B) Yazılı yoklamalar
C) Kısa cevaplı testler
D) Doğru yanlış testler
E) Eşleştirmeli testler
Merkezi Eğilim ve
Merkezi Dağılım
Ölçüleri
TANIMLAYICI İSTATİSTİK
.
Tanımlayıcı istatistikler verilerin sayısal ya da
grafiksel olarak özetlenmesidir. Çalışmada veriler
toplandıktan sonra, bunların merkezi eğilimleri,
yayılımları, çarpıklıkları araştırılır.
MERKEZİ EĞİLİM ÖLÇÜLERİ
.
Merkezi eğilim ölçüleri ,puan dağılımında verilerin
hangi puan etrafında toplandığı hakkında bilgi
veren ve veri grubunu özetleyen değerlerdir.
.
Merkezi eğilim ölçüsü olarak Mod, aritmetik
ortalama, medyan gibi istatistiksel tanımlar
kullanılmaktadır.
Aritmetik Ortalama
.
Aritmetik ortalama, değerler toplamının değer
sayısına bölümü şeklinde tanımlanır. Bu tanıma
göre aritmetik ortalama şöyle formüle edilir.
n
X1  X 2  X 3  .......  Xn
X

n
.
X
i 1
i
n
Frekanslar söz konusu olduğunda, sınıflandırılmış
seriler için,
f1 X1  f2 X 2  ........  fn Xn
X
f1  f2  ..........  fn
n

fX
i 1
n
i
f
i 1
i
i
.
Örnek olarak, bir sınava giren toplam öğrenci
sayısı 7 olsun. Bu 7 öğrencinin sınavdan aldıkları
notlar ise 100 üzerinden 60, 35, 28, 77, 81, 72
ve 74 olsun. O halde yukarıdaki formülü
kullanarak bu sınav sonucundaki aritmetik
ortalamayı hesaplayabiliriz:
Aritmetik
ortalama
(60+35+28+77+81+72+74) / 7 = 61’dir.
=
Frekans serisi aritmetik ortalama
örneği
Xi
fi
fi.Xi
10
2
20
11
3
33
12
5
60
13
8
104
14
14
196
15
18
270
16
15
240
17
12
204
18
10
180
19
6
114
20
4
80
21
3
63
100
1564
fX

X
f
i
i
i

1564
 15,64
100
.
Toplam puanların puan sayısına (öğrenci sayısına)
bölünmesi
ile
aritmetik
ortalama
bulunur.Aritmetik ortalamanın hesaplanmasında,
puan dağılımındaki her puan hesaplamaya dahil
edildiğinden, diğer merkezi eğilim ölçülerine göre
aritmetik ortalama daha çok tercih edilen bir
istatistiktir.
.
Dağılışların yerinin belirlenmesinde en çok
kullanılan yer ölçüsü aritmetik ortalamadır; ve
tek başına ortalama sözcüğünden aritmetik
ortalama anlaşılır.
.
Aritmetik ortalama bütün değerlerin ağırlığını eşit
kabul ettiğinden dağılımı her zaman en iyi şekilde
temsil etmeyebilir. Ayrıca aritmetik ortalama, veri
kümesindeki aşırı değerlerden çok kolay etkilenir.
.
Not:Aritmetik ortalama hesaplanırken her bir
puanın ortalamaya katkı oranı aynıdır.
.
Puanlar farklı olduğunda katılım miktarları
farklıdır, fakat katılım oranları(yüzde olarak)
aynıdır.
Ağırlıklı Ortalama
.
Puanların ortalamaya katkı oranlarının farklı
olması gerektiği durumlarda aritmetik ortalama
yerine ağırlıklı ortalama hesaplanabilir.
.
Sınavların farklı kapsama sahip olmaları ya da
farklı
önem
dereceleri
ağırlıklı
ortalama
kullanmalarını gerektirir.
.
Ağırlıklı ortalama; veri kümesindeki bütün
değerlerin aynı ağırlığa (öneme) sahip olmadıkları
durumlarda kullanılır.
.
1’den n’e kadar olan bir veri kümesinde X’ler veri
değerleri ve W’lar her bir X için bir ağırlık
fonksiyonu olarak kabul edilirse; ağırlıklı ortalama
formülü şöyle oluşur:
90
.
Ağırlıklı ortalama eğitimde yaygın
olarak
kredili
ders
sistemindeki
ortalamaların
hesaplanmasında
kullanılmaktadır.
Örnek:
İktisat,
İşletme, Hukuk ve İngilizce derslerini
alan bir öğrencinin ders kredisi / ders
notu çizelgesi şöyledir:
Ders
Kredisi
Ders
Notu
İktisat
4
75
İşletme
3
70
Hukuk
2
60
İngilizce
2
90
O halde ağırlıklı ortalaması;
(4x75)+(3x70)+(2x60)+(2x90)=73.63
11
91
Örnek
Ders
Kred
i
Not
Ağ. Not
Fiz 101
4
AA (4.0)
16.0
Kim 101
4
BB (3.0)
12.0
Müh 100
2
BA (3.5)
7.0
Mat 101
4
CB (2.5)
10.0
Türk 101
2
CC (2.0)
4.0
İng 101
2
DD (1.0)
2.0
MAK 101
3
DC (1.5)
4.5
Toplam
21
55.5
• Yandaki
tabloda
verilen ders ve notlar
için ağırlıklı ortalama:
55.5
A.O. 
 2.64
21
Medyan(Ortanca)
.
Büyüklük sırasına göre düzenlenmiş
dizisinin tam ortasına düşen puandır.
.
Ortanca hesaplanırken mutlaka verilerin sıraya
konulmuş olması gerekmektedir.
puanlar
. Ölçülen değerler küçükten büyüğe ya da büyükten
küçüğe doğru dizildiği zaman grubun, dizinin tam
ortasındaki ,yani yüzde ellinci puan veya
ölçümüdür.
.
Denek sayısı çiftse,
ortalamaları alınır.
ortadaki
. Aşırı değerlerden etkilenmez.
. Verilerde sapan değerler var
ortalamadan daha iyi betimler.
iki
deneğin
ise ortanca verileri
.
Seri birimlerinin tek sayıda olması durumunda serinin
n  1 ‘inci biriminin değeri medyan olacaktır.
2
(tek sayıda gözlem var ise ortanca orta değerdir)
.
.
Seri birimlerinin çift sayıda olması durumunda ise, serinin
n
2
n
 1 ‘inci birimlerinin değerlerinin ortalaması
‘inci ve
2
olarak kabul edilmektedir.
( çift sayıda gözlem var ise ortanca iki orta değerin
ortalamasıdır)
Örnek:
Aşağıda
hesaplayınız
verilen
Xi :2; 4; 7; 11; 13; 13; 17
n 1
 7 1  4
2
serilerin
medyanlarını
Yi:3; 9; 13; 17; 19; 19; 23; 2
Xi serisi, 7 birimli bir seri medyanı 4. birimin değeri olan 11 dir.
Yi serisi 8 birimli bir seri olduğundan
n 8
 4
2 2
n
8
1 
1  5
2
2
serinin medyanı 4’üncü ve 5’inci birimlerin değerlerinin ortalamasına
eşittir.
17  19 36
Me 
  18
2
2
Medyanın avantajları:
. Hesaplanması ve anlaşılması kolaydır.
. Uç değerlerden etkilenmez
. Her dağılımda bir tane ortanca vardır.
Medyanın Dezavantajları:
. Standart sapması ortalamanın standart
sapmasından büyüktür.
. Büyük veri yığınlarında bilgisayar
kullanmadan hesaplanması zordur.
. Ortanca, ölçüm sayısına eklenecek
herhangi bir değerden hemen etkilenir ve
değişir.
Mod(Tepe değeri)
. Bir veri grubunda en çok tekrarlanan,yani
.
.
.
.
frekansı en yüksek olan puandır.
Tepe değer verilerin en çok hangi değer
etrafında toplandığı hakkında bilgi verir.
Mod en kararsız ölçüdür.
Eğer puan dizisinde her puan aynı frekansa
sahipse o puan dizisinin Modu yoktur.
Bir seride birden fazla Mod olabilir. Bu
durumda değişken çok Modlu olarak
nitelendirilir.
.
Mod pratik olarak ,bir seride en çok rastlanan, en
çok tekrarlanan terim olarak tanımlanabilir. Eğer
serinin histogramı çizilirse, en yüksek sütunun
değeri serinin modudur.Bu sebepten Mod’a tepe
değeri de denir.
TEPE DEĞERİNİN
ÖZELLİKLERİ
. Hesaplanması ve anlaşılması kolaydır
. Dağılımdaki aşırı değerlerden etkilenmez
. Grafik üzerinde hiç işlem yapmadan, gözlenebilen
tek ölçüdür.
.
Bazı dağılışlarda tepe değeri bulunmayabilir,
bazılarında
da
birden
fazla
tepe
değeri
bulunabilir. İki tepe değeri bulunan dağılışlara
bimodal dağılış adı verilir.
. Bazı dizilerde “tek mod” vardır.
20,30,40,50,50,50,60
Dizidenin modu:50
.
Bazı dizilerde mod olabilecek değerler ard arda
geldiğinde bunların ortalaması alınarak moda
ulaşılır.
20,30,40,40,50,50,60
Dizinin modu:45
. Bazı dizilerde birden fazla mod vardır.
20,20,30,40,40,40,50,60,60,60,70,70
Dizinin modları:40 ve 60
20,30,30,40,50,50,60,60
Dizinin modları:30 ve 55
. Bazı dizilerde mod yoktur.
20,20,20,30,30,30
20,30,40,50,60,70
20,20,20,20,30,30,30,30
0,0,0,100,100,100
. Puanlar frekans sayıları açısından farklılaşma
göstermediklerinden dizide mod bulunamaz.
.
Puanlar farklılaşma göstermediğinde de mod
aranmaz.
20,20,20,20,20,20
Merkezi Dağılım
(Değişim )Ölçüleri
.
Farklı grupların merkezi eğilim ölçütleri aynı
olduğu halde, gruplar birbirlerinden çok farklı
olabilir. Bu nedenle merkezi eğilim ölçütleri
yanında, yayılma ölçütleri de çok önemlidir.
.
Merkezi dağılım ölçüleri, verilerin yığılma
gösterilen noktadan ne kadar uzakta olduklarını,
nasıl bir dağılım gösterdiklerini belirleyen
istatistiklerdir.
.
Başlıca dağılım ölçüleri puan
standart sapma ve varyansdır.
genişliği(ranj),
Yayılım Ölçüleri
.
Puanlar
arasındaki
farklılaşma
gösterir.(homojen-heterojen)
.
.
Standart sapma en hassas yayılım ölçüsüdür.
.
Herhangi birinin 0 olması
yayılım ölçüleri de 0 olur.
miktarını
durumunda diğer
Bütün notlar aynı olduğunda, bütün yayılım
ölçüleri 0 olur.
Dağılım Aralığı (Ranj, DA)
.
Bir dizideki en büyük değer (Xmax) ile en küçük
değer (Xmin) arasındaki farktır.
DA= (Xmax) - (Xmin) biçiminde hesaplanır.
71-68-75-44-75-81-75-94-56-75-69
veri setinin dağılım aralığı nedir?
DA=94-44=50’dir.
108
Örnek: A üniversitesinin B bölümünün tavan
puanı 361 ve taban puanı 349 ise.
En düşük (Minimum) = 349 puan
En yüksek (Maksimum) = 361 puan
Değişim aralığı = 361-349 = 12 puan
. Ranj bir veri grubunun hangi aralıkta
değişkenlik gösterdiğini belirten
istatistiktir.
. Ranj, puan dağılımları hakkında yüzeysel
bilgi verir.
. En basit yaygınlık ölçüsüdür.
. Ortalama gibi uç değerlerden çok etkilenir.
. En uçtaki iki değer arasında kalan değerler
hakkında bilgi vermez.
. Ranj yeterince güvenilir değil, en basit
yayılım ölçüsüdür.
. 20,60,80,70,90,80 Ranj:90-20=70
. 20,20,20,90,20,20,20 Ranj:90-20=70
. 2 grup hiç benzemiyor ama ranjları
aynıdır.
Standart Sapma
.
Bir veri grubunda verilerin aritmetik
ortalamadan
ne
kadar
uzaklaştığının
ölçüsüdür.
.
Puanların ortalamadan
kareleri
toplamının
kareköküne eşittir.
S
(X  X )
n 1
Örnek: 78,89,56,36,48,92,59,60
S=19.8
olan farklarının,
ortalamasının,
2
.
Bir örnek vermek gerekirse; 2, 4, 4, 4, 5, 5, 7, 9
değerlerine sahip bir örneklemi ele alalım.
.
Ortalamamız
olacaktır.
{(2+4+4+4+5+5+7+9)/8} = 5
. Her bir
değerin ortalamadan farkını bulup karesini
alırız, ve bu kareleri toplayıp toplam gözlem
sayısına böler, sonucun kare kökünü alarak
standart sapmaya ulaşırız.
.
(9+1+1+1+0+0+4+16)/8 = 4 ve 4’ün de kare
kökü 2’dir.
113
•
Standart sapma ve varyans :
.
Tüm değerlerin dağılımı ile bilgi verirler. Tüm
değerler eşitse, her ikisi de sıfıra eşittir.
.
Değerler arasında farklar arttıkça standart
sapma (Ss) ve varyans büyür.
.
Standart
sapma
değişken
değerlerinin
ortalamanın etrafındaki yayılmasını temsil eden
bir yayılma ölçütüdür. Yani, denekler arasında ne
kadar yaygınlık olduğunu ifade eder.
.
Ss’ nın karesine varyans adı verilir.
.
Merkezi
eğilim
ölçütü
olarak
ortalama
kullanıldığında, yayılma ölçütü olarak da standart
sapma kullanılır.
.
Bir dizi puanın varyansı o dizideki değişkenliğin
bir ölçüsüdür. Puanların varyansı denildiğinde,
puanların değişkenliğinin ölçüsü ifade edilmiş
olur. Varyansın karekökü alınırsa standart sapma
elde edilir. Varyans standart sapmanın karesi
olduğundan , bu istatistiklerden birisi bilindiğinde
diğerinin hesaplanması kolaydır.
. Standart sapma, bir merkezi dağılım ölçüsü olarak
puanların
merkezi
yığılma
ölçüsünden
uzaklıklarının bir ortalama değeri anlamını
taşımaktadır.
.
Bir dizideki ölçümlerin birbirinden farkı arttıkça
standart sapma büyür; ölçümler birbirine
yaklaştıkça da küçülür.
.
Başka bir deyişle, dizideki ölçümlerin dağıldığı
alan genişledikçe standart sapma büyür, dağılım
alanı küçülüp daraldıkça da küçülür.
.
Standart sapma küçüldükçe
homojenlik(benzerlik) artar.
dizi
grubundaki
.
Dağılımın yaygınlığını gösteren ölçümlerin en
önemlisi varyansdır. Eğer varyans küçükse sayılar
birbirine yakın, büyükse daha uzaktır.
.
Standart sapma büyüdükçe dağılım yaygınlaşır.
.
Aritmetik ortalamaları aynı olan iki dağılım aynı
yaygınlıkta olmayabilir.
Örneğin; 10,22,34 değerlerini alan 3 kişilik bir
dağılımda aritmetik ortalama 66/3=22’dir.21,23,22
değerlerini alan başka bir 3 kişilik dağılımda
aritmetik ortalama yine 66/3=22’dir.
.
İki dağılımın aritmetik ortalaması 22 olduğu halde
birinci dağılımda değerler (1 ve 3’üncü değerler)
aritmetik ortalamadan çok uzakta iken ikinci
dağılımdaki değerler ortalamaya çok yakındır.
.
Bir dağılımda değerler aritmetik
uzaklaştıkça dağılımın yaygınlığı artar.
.
Genel olarak, standart sapmanın küçük olması;
ortalamadan sapmaların ve riskin az olduğunun,
büyük olması ise; ortalamadan sapmaların, riskin
çok olduğunun ve oynaklığın göstergesidir.
ortalamadan
Aritmetik ortalamaya bağlı
olarak verilen kararlar
 Grubun başarı düzeyi nedir?
 Grubun mutlak başarı düzeyi
nedir?
 Öğrencilerin ortalama başarı
düzeyi nedir?
 Öğrencilerin öğrenme düzeyi
nedir?
Standart sapmaya bağlı
olarak verilen kararlar
 Başarılı ve başarısız sınıf
(grup) hangisidir?
 Öğrencileri arasında
farklılaşma var mı? ya da
öğrencilerin öğrenme
düzeyleri benzer mi?
 Grup ya da dağılım homojen
mi, heterojen mi?
 Grup aritmetik ortalamaya ne
kadar uzaktır? Ya da
yakındır?
VARYASYON KATSAYISI
(DEĞİŞİM KATSAYISI)
.
Standart sapma dağılımın yaygınlığını gösteren bir
ölçüdür.
.
Ancak standart sapma ile dağılım hakkında çok fazla
bir şey söylemek olanaksızdır.
Örneğin; bir dağılımın standart sapması 6 ise bu
değer büyük müdür, yoksa küçük müdür?
.
Bir karar verebilmek için VARYASYON KATSAYISINI
hesaplamak gerekir.
.
Varyasyon katsayısı; standart sapmanın ortalamaya
göre yüzde kaçlık bir değişim gösterdiğini belirtir.
S
V = --------- x 100
X
Örnek : Ortalaması 31.7 ve standart sapması 8.37
olan bir dağılımın varyasyon katsayısı,
V = (8.37 / 31.7) x 100
= % 26.4
Bu dağılımdaki değerler ortalamaya göre %26.4’lük
bir değişim göstermektedir.
.
Standart sapma, eğitimde başarıyı belirlemede
ortalamalar ile birlikte yaygın bir şekilde
kullanılmaktadır.
Eğer
bir
sınavda
grup
ortalamaları eşit ise standart sapması daha küçük
olan grup daha başarılıdır. Standart sapması
küçük olan gruplarda öğrencilerin öğrenme
düzeyleri daha birbirine yakın iken, standart
sapması büyük olan gruplarda öğrenme düzeyleri
arasında daha belirgin farklar mevcuttur.
.
Bir dağılımda değerler aritmetik ortalamadan
uzaklaştıkça dağılımın yaygınlığı artar.
.
Standart sapmanın küçüklüğü; ortalamaya
yakınlığı, büyüklüğü ise; ortalamaya uzaklığı ifade
eder.
126
Standart Sapma ve Aritmetik Ortalama Arasındaki İlişki
Aritmetik ortalama ile standart Heterojen yapı oluşur ve grup
sapmanın arası büyürse,
başarısı düşer.
Aritmetik ortalama ile standart Homojen yapı oluşur ve grup
sapmanın arası küçülürse,
başarısı artar.
Bir puan dağılımında puanlar
Standart sapmada büyür.
arası fark (ranj) büyüdükçe,
Bir
testten
elde
edilen Testin
güvenirliği
artar
puanların standart sapması
(Standart hata formülünü
büyüdükçe,
inceleyiniz)

1

Se S x rx
Se= Ölçmenin standart hatası
Sx= Test puanlarının standart sapması
rx = Testin güvenirliği
Çarpıklık ve Basıklık Ölçüleri
Çarpıklık(Skewness)
.
Çarpıklık, normal dağılışta simetrikliğin bozulma
derecesidir. Dağılış sağa uzun kuyruklu ise pozitif
çarpık veya sağa çarpık, dağılış sola uzun
kuyruklu ise negatif çarpık vaya sola çarpık
olarak adlandırılır.
Basıklık(Kurtosis)
.
Normal dağılış eğrisinin sivrilik veya yayvanlık
derecesi basıklık olarak adlandırılır.
Dağılım şekli ölçütleri
.
Ortalama=ortanca=mod
dağılımdır.
.
Çarpıklık (skewness): Mod<ortanca<ortalama ise
dağılım sağdan çarpık; ortalama<ortanca<mod
ise dağılım soldan çarpıktır.
.
Sivrilik-basıklık (kurtosis): Eğrinin tepesi sivriyse
dağılım leptokurtik; tepesi basıksa dağılım
platikurtiktir.
ise
dağılım
normal
Grafiklerin Yorumlanması(Aritmetik
ortalama,mod,medyan ilişkisi)
.
Uygulanan bir testin aritmetik ortalaması, modu,
medyanı ve standart sapması bulunduktan sonra
bunun nasıl bir dağılım gösterdiğini ortaya
koymak gerekir. Grafiklerin yorumlanması ile
grubun başarı durumu hakkında bilgi edinilebilir.
Normal(simetrik)Dağılım
.
Başarı açısından normal düzeyde olan bir sınıfın
grafiğidir.Normal dağılım eğrisi genelde çan
biçiminde olur.
.
Aritmetik ortalama, mod ve medyan değerleri
aynıysa bu dağılım simetriklik gösterir.
1. Simetrik dağılışlarda bu üç değer birbirine eşittir.
(A.O. = Medyan = Mod)
0
Ortanca
A.Ortalama
MERKEZİ EĞİLİM ÖLÇÜLERİ
50
Normal dağılım
100
2. Sola çarpık dağılışlarda aritmetik ortalama
ortancadan, ortanca ise tepe değerinden daha
küçüktür.
(A.O.  Medyan  Mod)
0
50
Sola çarpık dağılım
Ortanca
A.Ortalama
MERKEZİ EĞİLİM ÖLÇÜLERİ
100
Sola Çarpık(kayışlı)dağılım





Başarı yüksektir.
Öğretim yeterlidir.
Sorular ve test kolaydır.
Puanların çoğu dağılımın sağında toplanmıştır.
Öğrenciler hedef davranışları kazanmışlardır.
3.Sağa çarpık dağılışlarda aritmetik ortalama
ortancadan, ortanca ise tepe değerinden daha
büyüktür.
(A.O. Medyan  Mod)
0
A.Ortalama
Ortanca
MERKEZİ EĞİLİM ÖLÇÜLERİ
50
Sağa çarpık dağılım
100
Sağa Çarpık(Kayışlı) dağılım






Başarı düşüktür.
Öğretme yetersizdir.
Test zordur.
Puanların çoğu sol tarafa yığılmıştır.
Öğrenme düzeyi düşüktür.
Öğrenciler hedef-davranışları kazamamışlardır.
Sorular:
1) Toplam puanların puan sayısına bölünmesi neyi
ifade eder?
A) Mod
B) Medyan
C) Aritmetik ortalama
D) Standart sapma
E) Varyans
2) Bir veri grubunda en çok tekrarlanan yani frekansı
en yüksek olan puan nedir?
A) Medyan
B) Mod
C) Ortanca
D) Ranj
E) Varyans
3) Puanların ortalamaya katkı oranlarının farklı olması
gerektiği durumlarda hesaplanan, eğitimde yaygın
olarak kredili ders siteminde kullanılan yöntem
hangisidir?
A) Mod
B) Medyan
C) Standart sapma
D) Aritmetik ortalama
E) Ağırlı ortalama
4) Bir dizideki en büyük değer ile en küçük değer
arasındaki fark nedir?
A) Ranj
B) Varyans
C) Ortanca
D) Mod
E) Medyan
5) Aşağıdakilerden hangisi standart sapmaya bağlı
olarak verilebilecek bir karardır?
A) Grubun başarı düzeyi
B) Grubun mutlak başarı düzeyi
C) Öğrenciler arasında farklılaşma
D) Öğrencilerin ortalama başarı düzeyi
E) Öğrencilerin öğrenme düzeyi
6) Aşağıdakilerden hangisi simetrik dağılımı ifade eder?
A) A.O.<Medyan<Mod
B) Mod<Medyan<A.O.
C) A.O.<Medyan<Mod
D) A.O.=Medyan=Mod
E) Mod<Medyan=A.O.
Download