E*itimde Program De*erlendirme

advertisement
B
Bilişim Teknolojileri için İşletme İstatistiği
Yrd. Doç. Dr. Halil İbrahim CEBECİ
NİTEL VERİ ANALİZİ
• En önemli nitel veri analizi testi Ki-Kare testidir.
Kİ-KARE BAĞIMSIZLIK TESTLERİ
• Ki-Kare bağımsızlık testleri iki farklı nitel değişkenin
arasındaki farklılığın istatistiksel açıdan anlamlı olup
olmadığının incelendiği hipotez testleridir.
• Bu hipotez testleri verilerin kontenjans tablosu
şeklinde gösterilmesi ile başlar, daha sonra eşitlik ve
farklılık (sıfır ve alternatif) hipotezleri kurulur ve test
istatistiği hesaplanıp, kabul olasılığı incelenir.
Kİ-KARE BAĞIMSIZLIK TESTLERİ
• Bir mağaza gün içerisinde alış veriş gerçekleştiren
kadın ve erkek müşterilerin harcama düzeylerinin
farklı olduklarını düşünmektedir. Bu bağlamda
aşağıdaki kontenjans tablosunu hazırlamıştır.
Düşük
Orta
Yüksek
Erkek
Bayan
11
18
10
6
13
21
• Yukarıdaki tabloyu dikkate alarak müşteri cinsiyeti ile
harcama düzeyler arasındaki ilişkiyi sorgulayınız.
Kİ-KARE BAĞIMSIZLIK TESTLERİ
Gözlenen Frekanslar
Düşük
Orta
Yüksek
Erkek
Bayan
11
18
10
6
13
21
Beklenen Frekanslar
Erkek
Düşük
Orta
Yüksek
Bayan
8,392405 8,607595
15,3038 15,6962
15,3038 15,6962
• Kabul olasılığı 0,04576 çıkmıştır. Yani iki veri seti
(Kadın ve Erkek) farklı sonuç üretmiştir. Bu durumda
iki grup harcama düzeyi açısından farklılık
göstermektedir. Yani cinsiyet ve harcama düzeyi
birbiri ile ilişkilidir.
Kİ-KARE HOMOJENLİK TESTLERİ
• Homojenlik testleri bağımsızlık testinin farlı bir bakış
açısı ile değerlendirilmesidir.
• Bağımsızlık testlerinde iki farlı bölümlemenin aynı
olup olmadığına, yani bölümlerin bağımsızlığına
odaklanır. (Kadın – Erkek ayrımı istatistiksel açıdan
uygun mu)
• Homojenlik testi ise direkt olarak farklı zamanlarda
çekilen iki örneğin aynı ana kütleye ait olup
olmadıklarının sorgulanmasıdır. (Örneklem 1 ile
Örneklem 2 Kadın ve Erkek oranları dikkate
alındığında aynı ana kütleden çekilmiş olabilir mi)
Kİ-KARE HOMOJENLİK TESTLERİ
• Bir alış veriş merkezi hafta içi gelen ziyaretçilerin akıllı
telefon sayıları ile hafta sonu gelen ziyaretçilerin akıllı
telefon sayılarını inceleyerek, farklı profil gösterip
göstermediklerini incelemek istemektedir. Bu
farklılığı istatistiksel açıdan aşağıda verilen frekansları
dikkate alarak sorgulayınız.
Android
Iphone
Windows M
Örneklem1
Örneklem2
101
257
142
88
176
103
Kİ-KARE HOMOJENLİK TESTLERİ
• Gözlenen frekanslardan beklenen
aşağıdaki gibi hesaplanmıştır.
Örneklem1
Android
Iphone
Windows M
frekanslar
Örneklem2
108,9965398 80,00346021
249,7116494 183,2883506
141,2918108 103,7081892
• Kabul olasılığı 0,38735 çıkmıştır. Yani bu iki
örneklemin aynı ana kütleden geldiğini öngören sıfır
hipotezi kabul edilmiştir. Yani hafta içi müşterisi ile
hafta
sonu
müşterisi
profilleri
farklılık
göstermemektedir.
Kİ-KARE UYUMLULUK TESTLERİ
• Uyumluluk testleri ise ana kütle dağılımı ile örneklem
dağılımının benzeşmesinin istatistiksel açıdan
uygunluğunun testi şeklindedir.
• Burada amaç ana kütle dağılımı ile örneklem
dağılımının örtüştürülmesidir.
• Ana kütle dağılımı kesikli olarak verilebileceği gibi,
herhangi bir dağılıma uygunluğu da özellikle
belirtilebilir. (Normal dağılıma uygun gibi)
Kİ-KARE UYUMLULUK TESTLERİ
• Bir firma web sitesini ziyaret eden kişilerin ortalama
50 saniye, 10 saniye standart sapma ile ziyaretlerini
gerçekleştirdiklerini düşünmektedir. Bu durumu
ispatlamak adına rastgele bir saatte ziyaretçilerin
sitede kalma sürelerini dikkate alarak aşağıdaki
frekans tablosunu oluşturmuştur. Acaba firma
sahipleri haklı mıdır?
Süre
Kişi
(Saniye)
<30
30-40
40-50
50-60
60-70
>70
(Adet)
2
17
59
67
27
9
Kİ-KARE UYUMLULUK TESTLERİ
Süre
(Saniye)
<30
30-40
40-50
50-60
60-70
>70
Gözlenen
Frekanslar
2
17
59
67
27
9
Olasılık
Değeri
0,0228
0,1359
0,3413
0,3413
0,1359
0,0228
Beklenen
Frekanslar
4,1178
24,5988
61,7834
61,7834
24,5988
4,1178
• Kabul olasılığı değeri incelendiğinde veri setinin,
,incelenen dağılım ile aynı şekilde dağıldığını öngören
sıfır hipotezi kabul edilmiştir. Yani veriler normal
dağılmıştır.
AMAN DİKKAT
• Bağımsızlık testleri ile homojenlik testlerinin kullanım yerlerini
karıştırmayın. Farklı kullanım farklı yorum sonucunu doğurur.
(Her ne kadar aynı şekilde bulunuyor olsalar bile)
• Uygunluk testlerinde illa ki bilinen bir olasılık dağılımına
uygunluğun araştırılması gerekmez. Eğer ana kütlenin
dağılımını kesikli bir olasılık dağılımı ile yazabiliyorsak, bu
dağılıma uygunluğu da test edebiliriz.
Download