B Bilişim Teknolojileri için İşletme İstatistiği Yrd. Doç. Dr. Halil İbrahim CEBECİ NİTEL VERİ ANALİZİ • En önemli nitel veri analizi testi Ki-Kare testidir. Kİ-KARE BAĞIMSIZLIK TESTLERİ • Ki-Kare bağımsızlık testleri iki farklı nitel değişkenin arasındaki farklılığın istatistiksel açıdan anlamlı olup olmadığının incelendiği hipotez testleridir. • Bu hipotez testleri verilerin kontenjans tablosu şeklinde gösterilmesi ile başlar, daha sonra eşitlik ve farklılık (sıfır ve alternatif) hipotezleri kurulur ve test istatistiği hesaplanıp, kabul olasılığı incelenir. Kİ-KARE BAĞIMSIZLIK TESTLERİ • Bir mağaza gün içerisinde alış veriş gerçekleştiren kadın ve erkek müşterilerin harcama düzeylerinin farklı olduklarını düşünmektedir. Bu bağlamda aşağıdaki kontenjans tablosunu hazırlamıştır. Düşük Orta Yüksek Erkek Bayan 11 18 10 6 13 21 • Yukarıdaki tabloyu dikkate alarak müşteri cinsiyeti ile harcama düzeyler arasındaki ilişkiyi sorgulayınız. Kİ-KARE BAĞIMSIZLIK TESTLERİ Gözlenen Frekanslar Düşük Orta Yüksek Erkek Bayan 11 18 10 6 13 21 Beklenen Frekanslar Erkek Düşük Orta Yüksek Bayan 8,392405 8,607595 15,3038 15,6962 15,3038 15,6962 • Kabul olasılığı 0,04576 çıkmıştır. Yani iki veri seti (Kadın ve Erkek) farklı sonuç üretmiştir. Bu durumda iki grup harcama düzeyi açısından farklılık göstermektedir. Yani cinsiyet ve harcama düzeyi birbiri ile ilişkilidir. Kİ-KARE HOMOJENLİK TESTLERİ • Homojenlik testleri bağımsızlık testinin farlı bir bakış açısı ile değerlendirilmesidir. • Bağımsızlık testlerinde iki farlı bölümlemenin aynı olup olmadığına, yani bölümlerin bağımsızlığına odaklanır. (Kadın – Erkek ayrımı istatistiksel açıdan uygun mu) • Homojenlik testi ise direkt olarak farklı zamanlarda çekilen iki örneğin aynı ana kütleye ait olup olmadıklarının sorgulanmasıdır. (Örneklem 1 ile Örneklem 2 Kadın ve Erkek oranları dikkate alındığında aynı ana kütleden çekilmiş olabilir mi) Kİ-KARE HOMOJENLİK TESTLERİ • Bir alış veriş merkezi hafta içi gelen ziyaretçilerin akıllı telefon sayıları ile hafta sonu gelen ziyaretçilerin akıllı telefon sayılarını inceleyerek, farklı profil gösterip göstermediklerini incelemek istemektedir. Bu farklılığı istatistiksel açıdan aşağıda verilen frekansları dikkate alarak sorgulayınız. Android Iphone Windows M Örneklem1 Örneklem2 101 257 142 88 176 103 Kİ-KARE HOMOJENLİK TESTLERİ • Gözlenen frekanslardan beklenen aşağıdaki gibi hesaplanmıştır. Örneklem1 Android Iphone Windows M frekanslar Örneklem2 108,9965398 80,00346021 249,7116494 183,2883506 141,2918108 103,7081892 • Kabul olasılığı 0,38735 çıkmıştır. Yani bu iki örneklemin aynı ana kütleden geldiğini öngören sıfır hipotezi kabul edilmiştir. Yani hafta içi müşterisi ile hafta sonu müşterisi profilleri farklılık göstermemektedir. Kİ-KARE UYUMLULUK TESTLERİ • Uyumluluk testleri ise ana kütle dağılımı ile örneklem dağılımının benzeşmesinin istatistiksel açıdan uygunluğunun testi şeklindedir. • Burada amaç ana kütle dağılımı ile örneklem dağılımının örtüştürülmesidir. • Ana kütle dağılımı kesikli olarak verilebileceği gibi, herhangi bir dağılıma uygunluğu da özellikle belirtilebilir. (Normal dağılıma uygun gibi) Kİ-KARE UYUMLULUK TESTLERİ • Bir firma web sitesini ziyaret eden kişilerin ortalama 50 saniye, 10 saniye standart sapma ile ziyaretlerini gerçekleştirdiklerini düşünmektedir. Bu durumu ispatlamak adına rastgele bir saatte ziyaretçilerin sitede kalma sürelerini dikkate alarak aşağıdaki frekans tablosunu oluşturmuştur. Acaba firma sahipleri haklı mıdır? Süre Kişi (Saniye) <30 30-40 40-50 50-60 60-70 >70 (Adet) 2 17 59 67 27 9 Kİ-KARE UYUMLULUK TESTLERİ Süre (Saniye) <30 30-40 40-50 50-60 60-70 >70 Gözlenen Frekanslar 2 17 59 67 27 9 Olasılık Değeri 0,0228 0,1359 0,3413 0,3413 0,1359 0,0228 Beklenen Frekanslar 4,1178 24,5988 61,7834 61,7834 24,5988 4,1178 • Kabul olasılığı değeri incelendiğinde veri setinin, ,incelenen dağılım ile aynı şekilde dağıldığını öngören sıfır hipotezi kabul edilmiştir. Yani veriler normal dağılmıştır. AMAN DİKKAT • Bağımsızlık testleri ile homojenlik testlerinin kullanım yerlerini karıştırmayın. Farklı kullanım farklı yorum sonucunu doğurur. (Her ne kadar aynı şekilde bulunuyor olsalar bile) • Uygunluk testlerinde illa ki bilinen bir olasılık dağılımına uygunluğun araştırılması gerekmez. Eğer ana kütlenin dağılımını kesikli bir olasılık dağılımı ile yazabiliyorsak, bu dağılıma uygunluğu da test edebiliriz.