bilişim teknolojileri için işletme istatistiği - SABİS

advertisement
SAKARYAÜNİVERSİTESİ
BİLİŞİMTEKNOLOJİLERİ
İÇİNİŞLETME
İSTATİSTİĞİ
Hafta13
Yrd. Doç. Dr. Halil İbrahim CEBECİ Bu ders içeriğinin basım, yayım ve satış hakları Sakarya Üniversitesi’ne aittir. "Uzaktan Öğretim" tekniğine uygun olarak
hazırlanan bu ders içeriğinin bütün hakları saklıdır. İlgili kuruluştan izin almadan ders içeriğinin tümü ya da bölümleri
mekanik, elektronik, fotokopi, manyetik kayıt veya başka şekillerde çoğaltılamaz, basılamaz ve dağıtılamaz.
Her hakkı saklıdır © 2013 Sakarya Üniversitesi
0
BÖLÜM 7 NİTEL VERİ ANALİZİ (Kİ KARE TESTLERİ) BÖLÜMÜN AMACI Bu bölümün amacı nitel veri ile analiz yapılabilmesini sağlayan en önemli analizlerden Ki‐Kare analizini öğretilmesi ve sonuçların öğrenciler tarafından yorumlanmasının sağlanmasıdır. Şimdiye kadar anlatına bütün testler nümerik (sayılabilir, nicel, kantitatif) veriler üzerinde yapılmıştır. Fakat nitel (kategorik, kalitatif) verilerin de analiz edilmesi ihtiyacı söz konusudur. Bu durumda kullanılan en önemli analiz olan Ki‐Kare analizi, hem nicel hem de nitel verilerle çalışabildiğinden ayrıca önem arz etmektedir. Ki‐Kare Analizi
Bağımsızlık Testleri
Homojenlik Testleri
Uyumluluk Testleri
7.1. Ki‐Kare Bağımsızlık Testleri Ki‐Kare bağımsızlık testleri iki farklı nitel değişkenin arasındaki farklılığın istatistiksel açıdan anlamlı olup olmadığının incelendiği hipotez testleridir. Bu hipotez testleri verilerin kontenjans tablosu şeklinde gösterilmesi ile başlar, daha sonra eşitlik ve farklılık (sıfır ve alternatif) hipotezleri kurulur ve test istatistiği hesaplanıp, kabul olasılığı incelenir. Aşağıdaki örnekle bu durumu daha iyi anlayabiliriz. 1
ÖRNEK Bir mağaza gün içerisinde alış veriş gerçekleştiren kadın ve erkek müşterilerin harcama düzeylerinin farklı olduklarını düşünmektedir. Bu bağlamda aşağıdaki kontenjans tablosunu hazırlamıştır. Erkek Bayan Düşük Orta Yüksek 11 18 10 6 13 21 Yukarıdaki tabloyu dikkate alarak müşteri cinsiyeti ile harcama düzeyler arasındaki ilişkiyi sorgulayınız. EXCEL Ki‐Kare değerini Excel yardımıyla hesaplayabilmek için gözlenen frekans değerlerinden beklenen frekans değerleri hesaplanmalıdır. Erkek Bayan Düşük Orta Yüksek 11 18 10 6 13 21 Yukarıdaki gözlenen frekanslar beklenen frekanslara çevrilmesi için öncelikle satır ve sütun toplamları hesaplanmalıdır. Erkek Bayan Düşük Orta Yüksek 11 18 10 39 6 13 21 40 17 31 31 Örneğin 79 kişinin (17+31+31) 17 tanesi düşük harcama yaptı ise, bu durumda %21,52 (17/79) oranında düşük harcamalı müşteri olmalıdır. Eğer kadın veya erkek durumunun eşitliğinin araştırıldığı hipotez dikkate alınırsa, erkek müşterilerin (39 kişinin) %21,52 si de (8,39) düşük harcama yapmalıdır. Bu durum gerçekleşirse kadın ve erkeklerin farklı harcamalar yaptığı söylenemez. Benzer şekilde beklenen frekanslar aşağıdaki gibi hesaplanır. Erkek Bayan Düşük 8,392405 8,607595 Orta 15,3038 15,6962 Yüksek 15,3038 15,6962 Yukarıdaki iki tablo hesaplandıktan sonra aşağıdaki formülle Ki‐Kare kabul olasılığı hesaplanır. =KİKARE.TEST(B3:C5;B9:C11) 2
Formülde yer alan B3:C5 kısmı gözlenen frekansları, B9:C11 kısmı ise beklenen frekansları vermektedir. Formül sonucunda kabul olasılığı 0,04576 çıkmıştır. Yani iki veri seti (Kadın ve Erkek) farklı sonuç üretmiştir. Bu durumda iki grup harcama düzeyi açısından farklılık göstermektedir. Yani cinsiyet ve harcama düzeyi birbiri ile ilişkilidir. Eğer aynı sonuçları üretip sıfır hipotezi kabul edilse idi, ilişkinin varlığından bahsedemezdik. Ki‐Kare bağımsızlık testleri iki farklı örneğin aynı gruptan gelip gelmediği ile ilgilidir. Eğer aynı ana gruptan geldi ise farklılık çıkmaz. Bu şekilde gruplama ölçütünün incelenen değişken düzeyinde farklılık göstermediği kabul edilir. 7.2. Ki‐Kare Homojenlik Testleri Homojenlik testleri bağımsızlık testinin farlı bir bakış açısı ile değerlendirilmesidir. Bağımsızlık testlerinde iki farlı bölümlemenin aynı olup olmadığına, yani bölümlerin bağımsızlığına odaklanır. (Kadın – Erkek ayrımı istatistiksel açıdan uygun mu) Homojenlik testi ise direkt olarak farklı zamanlarda çekilen iki örneğin aynı ana kütleye ait olup olmadıklarının sorgulanmasıdır. (Örneklem 1 ile Örneklem 2 Kadın ve Erkek oranları dikkate alındığında aynı ana kütleden çekilmiş olabilir mi) ÖRNEK Bir alış veriş merkezi hafta içi gelen ziyaretçilerin akıllı telefon sayıları ile hafta sonu gelen ziyaretçilerin akıllı telefon sayılarını inceleyerek, farklı profil gösterip göstermediklerini incelemek istemektedir. Bu farklılığı istatistiksel açıdan aşağıda verilen frekansları dikkate alarak sorgulayınız. Örneklem1 Örneklem2 Android Iphone Windows M 101 257 142 88 176 103 EXCEL Gözlenen frekanslardan beklenen frekanslar aşağıdaki gibi hesaplanmıştır. Örneklem1 Örneklem2 Android 108,9965398 80,00346021
Iphone 249,7116494 183,2883506
Windows M 141,2918108 103,7081892
Yukarıdaki tablo hesaplandıktan sonra aşağıdaki formülle Ki‐Kare kabul olasılığı hesaplanır. =KİKARE.TEST(B3:C5;B9:C11) Formülde yer alan B3:C5 kısmı gözlenen frekansları, B9:C11 kısmı ise beklenen frekansları 3
vermektedir. Formül sonucunda kabul olasılığı 0,38735 çıkmıştır. Yani bu iki örneklemin aynı ana kütleden geldiğini öngören sıfır hipotezi kabul edilmiştir. Yani hafta içi müşterisi ile hafta sonu müşterisi profilleri farklılık göstermemektedir. 7.3. Ki‐Kare Uyumluluk Testleri Uyumluluk testleri ise ana kütle dağılımı ile örneklem dağılımının benzeşmesinin istatistiksel açıdan uygunluğunun testi şeklindedir. Burada amaç ana kütle dağılımı ile örneklem dağılımının örtüştürülmesidir. Ana kütle dağılımı kesikli olarak verilebileceği gibi, herhangi bir dağılıma uygunluğu da özellikle belirtilebilir. (Normal dağılıma uygun gibi) Ki‐Kare uyumluluk testlerinin en önemli kullanım alanı veri setinin bir istatistiksel dağılıma uygunluğunun testidir. ÖRNEK Bir firma web sitesini ziyaret eden kişilerin ortalama 50 saniye, 10 saniye standart sapma ile ziyaretlerini gerçekleştirdiklerini düşünmektedir. Bu durumu ispatlamak adına rastgele bir saatte ziyaretçilerin sitede kalma sürelerini dikkate alarak aşağıdaki frekans tablosunu oluşturmuştur. Acaba firma sahipleri haklı mıdır? Süre (Saniye) <30 30‐40 40‐50 50‐60 60‐70 >70 Kişi (Adet) 2 17 59 67 27 9 EXCEL Diğer Ki‐Kare testlerine benzer şekilde beklenen frekanslar hesaplanmalıdır. Ana kütle normal dağılıyorsa o zaman sınıf aralıklarını dikkate alarak, bu aralıklar arasında normal dağılma durumunda kaç kişi olması gerektiğini (beklenen frekansları) hesaplamalıyız. Ortalama 50, Standart sapma 10 iken, bir müşterinin 30 saniyeden az sitede kalma ihtimali aşağıdaki formülle hesaplanır. = NORM.DAĞ(30;50;10;DOĞRU) = 0,0228 4
40 saniyeden az kalma durumu da aşağıdaki formülle rahatça belirlenebilir. = NORM.DAĞ(40;50;10;DOĞRU) = 0,1587 30 ile 40 dakika arasında kalma ihtimali ise bu iki olasılığın farkıdır. = 0,1587‐0,0228=0,1359 Benzer şekilde bütün olasılıklar aşağıdaki gibi hesaplanabilir. Süre (Saniye) <30 30‐40 40‐50 50‐60 60‐70 >70 Olasılık Değeri 0,0228 0,1359 0,3413 0,3413 0,1359 0,0228 Bu olasılık değerlerinin beklenen frekanslara dönüştürülmesi ise sadece toplam kişi sayısı (189) ile çarpılması ile elde edilir. Süre (Saniye) <30 30‐40 40‐50 50‐60 60‐70 >70 Gözlenen Frekanslar 2 17 59 67 27 9 Olasılık Değeri 0,0228 0,1359 0,3413 0,3413 0,1359 0,0228 Beklenen Frekanslar 4,1178 24,5988 61,7834 61,7834 24,5988 4,1178 Daha sonra ise aşağıdaki formülle Ki‐Kare kabul olasılığı hesaplanır. =KİKARE.TEST(B2:B7;E2:E7) = 0,0745 Kabul olasılığı değeri incelendiğinde veri setinin, ,incelenen dağılım ile aynı şekilde dağıldığını öngören sıfır hipotezi kabul edilmiştir. Yani veriler normal dağılmıştır. 5
ÖZET Ki‐Kare testleri nitel verilerin analizinde kullanılan bir yöntemdir. Üç farklı durumda tercih edilirler. Verilerin incelen değişken açısından farklılıklarının olup, olmadığının incelendiği “Bağımsızlık Testleri”, incelenen iki farklı örneğin aynı ana kütleden gelip gelmediklerinin incelendiği “Homojenlik Testleri” ve bir veri setinin belli bir dağılıma uygunluğunun incelendiği “Uygunluk Testleri” nitel verilerin analizinde önemlidir. SON NOT  Bağımsızlık testleri ile homojenlik testlerinin kullanım yerlerini karıştırmayın. Farklı kullanım farklı yorum sonucunu doğurur. (Her ne kadar aynı şekilde bulunuyor olsalar bile)  Uygunluk testlerinde illa ki bilinen bir olasılık dağılımına uygunluğun araştırılması gerekmez. Eğer ana kütlenin dağılımını kesikli bir olasılık dağılımı ile yazabiliyorsak, bu dağılıma uygunluğu da test edebiliriz. ÇALIŞMA SORULARI KAYNAKLAR 1. Keller, Gerald; Statistics for Management and Economics, 9e, 2012 2. McClave, J.T, Benson, P.G, Sincich, T.; Statistics for Business and Economics, 11e, 2011 3. Sharpe N.R., De Veaux R.D., Velleman P.F.; Business Statistics 2e, 2012 6
Download