İSTATİSTİK I Doç. Dr. Selami ÖZCAN BİRİNCİ BÖLÜM İSTATİSTİKLE İLGİLİ TEMEL KAVRAMLAR 2 23.7.2017 Selami ÖZCAN İstatistik 1. Bölüm: Sunum Planı 3 İstatistiğin Doğuşu, Gelişimi İstatistik nedir? Ve kaça ayrılır? Anakütle ve örnek; istatistik ve parametre nedir? İstatistiksel örnekleme yöntemleri kaça ayrılır? Değişken nedir ve kaça ayrılır? Veri toplama yöntemleri Veri Derleme:Verilerin düzenlenmesi Ölçme nedir? Kaç çeşit ölçek vardır? 23.7.2017 Selami ÖZCAN İstatistik İstatistiğin Doğuşu 4 İstatistik başlangıçta teknik bir disiplin olarak ele alınırken günümüzde bir bilim dalı olarak kendini kabul ettirmiş, ulusal ve uluslararası boyutta gelişmelerin temelini oluşturmuştur. Son 30 yıla damgasını vuran ve çağımızda bilgi çağı olarak adlandırılan gelişmeler istatistiği evrensel bir konuşma dili haline getirmiştir. Günümüzde ulusal ve uluslararası sosyal ve ekonomik gelişme hedeflerinin belirlenmesi ve bu hedeflerin başarısı güncel, güvenilir istatistiklerle sağlanmaktadır. Doğru bilgi, doğru yorum ve doğru karar sürecinde araştırmacılar, politikacılar, karar alıcılar ve tüm bireyler çalışmalarında istatistiki bilgileri etkin olarak kullanmaktadırlar. İlk çağda bile insanlar bazı toplu olayları belirleme ihtiyacı duymuşlardır. Devletlerin kurulması ile birlikte insanlar sınır belirleme, vergi toplama, toprak dağılımına yönelik amaçlarla ayrıca dil, din farkı olan toplulukların nüfus büyüklüğünü belirleme, askere alma amaçlı bilgiler toplamaya ve bunların kayıtlarını tutmaya başlamışlardır. Orta çağda devletler güçlerini yitirmiş, istatistik konusu gerilemiş ve kent düzeyinde bazı bilgilerin toplandığı değerlendirmelerle sınırlı kalmıştır. Devletlerin güçlenmesi ile birlikte istatistik uygulamaları gelişmiş ve nüfus sayımları yanında; dış ticaret, milli gelir hesabına yönelik fiyat, ücret vb. temel verilerin toplanmasına başlanmıştır. İstatistik metodolojisine yönelik çalışmalar 17. yüzyılda Alman Üniversitesinde "Devletlerin Durumu" adlı bir derste bilimsel olarak gündeme gelmiştir. Derste ülkelerin tarihi, mali, askeri yönetim örgütleri, nüfusları sayılarla ifade edilerek ele alınmış ve bu konu sonradan istatistik olarak adlandırılmıştır. Aynı dönemde sigorta matematikçileri nüfus konusu ile ilgilenmeye başlamışlardır. 23.7.2017 Selami ÖZCAN İstatistik İstatistiğin Gelişimi 5 17. yüzyılda Pascal, Bernouilli, Moivne, Laplace, Poisson ve Gauss tarafından yapılan çalışmalar ile ihtimal teorisi, talih oyunları ve tesadüfi olayların çan eğrisi şeklinde dağılım gösterdiği belirlenmiştir. Aynı yüzyılda Belçikalı matematikçi ve astronom Quatelet istatistik sorunlarına eğilmiş, çeşitli eserler yazmıştır. İstatistik Genel Müdürü olan Quatelet istatistiğin kullanım alanını genişleterek kültür, ahlak, doğal olaylar ve özellikle antropometriye yönelik bilgileri değerlendirmiştir. Orta Asya da büyük uygarlıklar kuran Türk toplumları Hindistan'da, Çin'de, İran'da bilgiye önem vermişler, İlhanlılar ve Selçuklular nüfus sayımı çalışmaları yapmışlardır. İstatistikleri tarihi perspektifte değerlendirmek, geçmişi daha iyi anlamak, günümüzü en etkin yapıda kavramak ve geleceğimizi en iyi şekilde planlamamız açısından da çok büyük önem taşımaktadır 17. Yüzyıla kadar sadece bilgi kaydetme şeklinde gerçekleşen istatistiki çalışmalar, 18. ve 19. Yüzyıllarda J. Bernoulli (1645-1705) ve K.Gauss'un (1777-1855) katkılarıyla matematik temelleri üzerine oturtulmuş, ihtimal teorisi geliştirilmiştir. Sosyal ve antropolojik olaylara istatistiği kapsamlı bir şekilde uygulayan ilk matematikçi olan Adolphe Quételet (1796-1874) ise modern istatistiğin kurucusu olarak kabul edilmiştir. 20. Yüzyılın başında R. A. Fisher, K. Pearson ve W. S. Gosset'in katkılarıyla tahmin yapma ve karar verme konuları ön plana çıkarak istatistik artık sayısal verilerin yorum ve değerlendirmesini yapan bir bilimsel metodlar topluluğu haline gelmiştir. 23.7.2017 Selami ÖZCAN İstatistik İSTATİSTİK BİLİMİ NEDİR? İstatistik kelimesi ilk olarak Almanya’da devlet anlamına gelen status kelimesine dayanılarak kullanılmaya başlanmıştır. Günlük dilde istatistik veya istatistikler; belirli bir olaya ilişkin derlenmiş sayısal bilgiler demektir.İthalat, ihracat, turizm ve inşaat vb. istatistikler bazen sayı ve rakam karşılığında da istatistik kullanılır 6 İstatistik sözcüğü, ele alınan olayların gözlemlenerek ilgili verilerin derlenmesi, işlenmesi, analizi ve yorumlanmasında kullanılan tekniklerin tümünü ifade eder. Dar manada İstatistik: geçmiş ve şimdiki durumla ilgili toplanmış sayısal verileri, geliştirilmiş olan bazı tekniklerle analiz ederek gelecek hakkında karar vermemizi kolaylaştıran bir bilim dalıdır. Geniş Manada İstatistik: belirli amaçlar için verilerin toplanması, düzenlenmesi, uygun yöntemlerle analiz edilmesine denir. Bu analizler vasıtasıyla elde edilen sonuçların YORUMLANMASI ve Bir KARARA bağlanması istatistikle ilgilidir. İSTATİSTİK: Belirlenen amaç/lar doğrultusunda gözlenen yığın olaylardan derlenen sayısal verilerin işlenerek , ilgili olayların oluşturduğu yığınların bilimsel olarak incelenmesinde kullanılan teknik ve yöntemler bilimidir. Rakamlar yalan söylemez, yalancılar rakam söyler. Rakamsal Bilgileri Anlamlandırmak , Üç türlü yalan vardır. Belirsizlik ile İlgilenmek, İlişkileri analiz etmek Yalan, Tahmin , kuyruklu yalan, 23.7.2017 Selami ÖZCAN İstatistik Belirsiz Ortamda Karar Verme İstatistiki yalan (konuları açısından) İstatistik ikiye ayrılır 1. Deskriptif (tasvir edici-tanımlayıcı) istatistik 2. İndaktif (tahlil edici-çıkarımcı) istatistik genel dağılımı ortaya çıkarma, durumu olduğu gibi tasvir etme, kollektif Çıkarımlar mutlak doğru olmadığı için ihtimal olayların eğilimini araştırır, verilerin özetlenmesi ve tasvir edilmesi kelimesi ile ifade edilir, ileri seviye istatistik ile ilgilidir. bilgisi gerektirir, tümevarım yöntemi kullanılır. Hipotez testlerini içerir. 1. Frekans dağılımları 1. Örnekleme teorisi 2. Merkezi Eğilim (Yer) ölçüleri 1. 1. 2. 3. 4. 2. 2. 3. 4. 2. 2. 4. 5. Değişim aralığı Kartil aralığı Desil aralığı 2. 7. 9. 10. Kesikli ihtimal dağılıları 1. 2. 3. 2. 8. Tek yönlü Çift yönlü Varyans Analizi Regresyon analizi 1. 6. Oran Ortalama Hipotez testleri 1. Ortalama sapma Standart sapma Standart hata Varyans Çarpıklık ve Basıklık İhtimal (toplama, çarpma) İhtimal dağılımları 1. Basit Çoklu Zaman serileri Korelasyon Non parametrik testler İndeksler Kalite Kontrol Binom dağılımı Poisson dağılımı Hipergeometrik dağılım Sürekli ihtimal dağılımları 1. 7 2. 3. Ortalama Oranlama Tahmin teorisi (güven sınırları) 1. Parametrik olmayan dağılım Ölçüleri 1. 2. 3. 6. 2. Parametrik dağılım ölçüleri 1. 5. Mod Medyan kantiller Dağılım ölçüleri 1. 4. 2. Aritmetik ortalama Geometrik ortalama Harmonik ortalama Kareli ortalama Parametrik olmayan MEÖ 1. 2. 3. 3. 1. Parametrik MEÖ Normal dağılım 1. Standart normal dağılım 2. Normalin Binoma yaklaşım 23.7.2017 Selami ÖZCAN İstatistik Tipik Olay ve Yığın Olay İstatistik ve Parametre 8 Yığın Olay: bir olaylar kümesinde tek bir olay kümedeki diğerlerini veya ait olduğu kümeyi tam olarak temsil edemeyen olaylardır. İstatistik yığın olaylarla ilgilenir. Trafik kazaları, evlenmeler, boşanmalar, doğum ve ölüm oranları, yıllık satışlar, ciro vb. Tipik Olay: bir olaylar kümesinde tek bir olayın tüm olaylar kümesini temsil ettiği olaylara denir. Laboratuarda suyun elde edilmesi, Parametre: ana kütledeki bütün birimler üzerinden hesaplanan ölçülere denir. İstatistik: ana kütleyi temsil etme gücüne sahip bir örnekteki verilerden hesaplanan ölçülere denir. 23.7.2017 Selami ÖZCAN İstatistik 1. Birim (Örnek), birim türleri 1. Birim (Örnek/örneklem): yığın olay niteliğindeki her olaya denir. Ana kütleden tesadüfi yöntemlerle seçilerek oluşturulan yeni oluşuma denir. Birim olması için bir nesne/olayın ölçülmesi veya sayılması yeterlidir. Mesela elle tutulamayan ve gözle görülemeyen, ölçülemeyen ve sayı ile ifade edilemeyen soyut (sevinç, korku, aşk, üzüntü, melek gibi) olaylar birim oluşturmaz. Fakat doğum, ölüm, trafik kazası, insan, hayvan, bina gibi sayılabilen ve ölçülebilen canlı ve cansız varlıklar ile olaylar, sayılarla ifade edildiği için birim oluşturlar. Birim (örnek) Türleri: 9 1. Maddi birim ve Gayri maddi birim: okul, insan, buzdolabı, araçlar (uzunluk, genişlik ve yükseklik) gibi bir boyuta/varlığa sahip olan, elle tutulup gözle görülebilen somut varlıklar (insan, araba)-Maddesel varlığı (boyutları) olmayan fakat gerçekte olan birimlerdir. Mesela Boşanma, evlenme, doğum, ölüm, trafik kazası gibi 2. Sürekli birim ve Ani birim: belirli bir zaman aralığı (herhangi bir anı) içinde gözlemlenen birimler sürekli: (insan, ticari kuruluş, konut, araçlar sürekli birimlerdir ) bir olay bir fiil biçiminde çıkan oldukça kısa süren(zaman içine dağılmış) birimler ani: Belirli bir anda çıkan ve ancak ortaya çıktıkları anda incelenebilen, maddesel varlığa sahip olmayan birimlerdir. Evlenme, boşanma, trafik kazası, ölüm ani birimlerdir 3. Doğal birim ve Yapay birim: bir bütün oluşturan, parçalanmaları/birleştirilmeleri halinde özelliklerini kaybeden birimlere doğal: (tek parça olarak incelenen olaylar, Örneğin masa, araba, insan, kalem doğal birimlerdir), bir bütün olma özelliği göstermeyen fakat nitelikleri değişmeyen birimlere yapay birim denir. (arsanın parçalara ayrılması, kumaş parçalara ayrılırsa özelliğini kaybetmez ) 4. Gerçek birim ve Gerçek farz edilen (varsayılan) birim: maddesel olarak veya fiil biçiminde var olan birimler gerçek, ortaya çıkmış olması yeterli: Ev, araba, bina, masa maddesel varlığa sahip gerçekte var olan birimleri oluştururken, ölüm, evlenme, doğum, trafik kazası gibi maddesel bir varlığa sahip olmayan ama gerçekte var olan birimler gerçek birimleri oluşturur, gerçekte olmayan varsayılarak oluşturulan birimler. 10 öğrenciden 3 lü grup oluşturmak gibi 23.7.2017 Selami ÖZCAN İstatistik 2. Ana kütle, Ana kütle türleri 2. Ana kütle (istatistik kütlesi): yığın olay niteliğindeki aynı cins birimlerin oluşturduğu topluluğa denir. Veya bir istatistiki araştırmada araştırmaya konu olan bütün birimler aynı nedenlerin etkisinde olması gerekir. Anakütle, istatistik birimleri toplamından farklı bir yapıya sahip olmamalıdır. Üniversite öğrenci ve hoca toplamından farklı bir tüzel kişiliğe sahiptir. Ana kütle türleri: 1. Gerçek anakütle, farazi (varsayılan) anakütle, gerçek birimlerin oluşturduğu anakütle, henüz oluşmamış fakat oluşturulması mümkün olan anakütle varsayılandır. 30 kişilik bir sınıfta rastgele seçilecek 5 kişilik bir grup c(30:5)=142.4 farklı şekilde olur. 2. Sonlu veya Sonsuz anakütle: sayılabiliyorsa sonlu, sayılamıyorsa sonsuz, Türkiye’de yaşayan kişiler sonlu, Marmara’daki canlı sayısı sonsuz. 3. Sürekli veya Kesikli anakütle: parçalandıklarında ve birleştirildiklerinde özelliğini kaybediyorsa kesikli(doğal birimlerden oluşur), kaybetmiyorsa sürekli anakütle(zaman ve mekan birimleri doğal değildir.) Mesela: bir üniversite öğrencileri üzerinde bir araştırma yapılacaksa Üniversitenin bütün öğrencileri ANAKÜTLE, bu öğrenciler arasından seçilen 100 kişilik şans grubuna ÖRNEK denir. Şayet araştırma İİBF bütün öğrencilerine yönelik bir araştırma yapılıyorsa okulun toplam öğrenci sayısı ana kütleyi oluşturur, içinden tesadüfi olarak seçilen 30 öğrenci örnek kütleyi oluşturur. Not: bir istatistiksel araştırma planlanırken araştırmanın nerede yapılacağı, kimlerle/kimler tarafından yapılacağı, ne kadar zamanda yapılacağı, araştırma için ayrılan kaynaklar, toplanacak veriler çok önemlidir. 10 23.7.2017 Selami ÖZCAN İstatistik VERİ DERLEME (düzenleme) VERİ DERLEME: belirlenen amaçlar doğrultusunda gözlemlenecek birimlerin ölçülmesi, sayılması sonra da bunların ilgilenilen değişkenlere göre hangi şıklara sahip olduğunun belirlenmesi ve kaydedilmesi işlemlerini içerir. A. Birim Seçimi: belirlenen amaç/lar doğrultusunda ilgilenilen yığın olayın tanımlanmasıyla seçme işlemi gerçekleşir yani ilk önce kimlerin veya nelerin gözleneceği belirlenir. B. Değişken ve Şıkların Belirlenmesi 1. Değişkenin Belirlenmesi: Veri derlenirken sadece belirlenen amaçlar doğrultusunda değişkenler göz önünde tutulur. Ayrıntı sorunlara neden olabilir. Gözlem sayısı sonlu bir sayı olmalıdır. 2. Şıkların Belirlenmesi: şık, belirli bir özelliğin ortaya çıkış şekillerine denir. Gözlemlerde kullanılan ölçü biriminin araştırmaya uygun olması gerekir. Tabi ki şıkların alacakları değerler de (ilgilenilen değişken sürekli veya kesikli olsun fark etmez) sonlu olmalıdır. Şıkların aldığı ölçü birimleri de ilgilenilen olaya uygun olmalıdır. Kilo, şişe, teneke, gram vb C. Anakütlenin Sınıflandırılması Veriler hangi yöntemle toplanırsa toplansın, elde edilen veriler genellikle istatistiksel analize hazır değildir (bu veriler ham veri olarak adlandırılır) Bu verilerin analize uygun hale getirilmesi için düzenlenmeleri gerekir. Veri Derleme Türleri: 1. 2. 3. 4. 5. Ani ve sürekli veri derleme: sürekli birimlerin belli bir andaki durumlarını gözlemlemek için yapılan derlemelere ani derleme; ör: nüfus ve işyeri, tarım ve sanayi sayımları sayılabilir. Sürekli veri derleme,olayların aynı anda ve bir arada meydana gelemedikleri durumda sürekli olarak incelenmesidir. Anlık birimlerin belirli bir zaman aralığında gözlemlenmesidir. belirli bir bölge ve zamanda evlenme, boşanma, trafik kazası oranları Direkt ve Endirekt veri derleme: doğrudan ana kütle birimlerinin gözlemlenmesi durumunda direkt;söz konusu anakütle ile birlikte diğer anakütle birimlerinin gözlemlenmesi durumu ise endirekt veri derlemedir. Doğrudan nufus sayımı ile ülkede yaşayan sayısı tespit edilebileceği gibi bunun yanında konut sayımı ile de nufus tespiti yapılabilir. Birincil ve İkincil veri derleme: bilgi edinmek için yapılan derlemelere birincil (anlık), idari ve mali amaçlarla yapılan derlemelere ikincil (sürekli) veri derleme denir. Asıl ve yardımcı şeklinde veri derleme: anakütleyi oluşturan birimlerin özelliklerinin belirlenmesi amacıyla yapılan derlemeye asıl, asıl derlemeye yardımcı olmak için yapılan derlemeye yardımdı denir. Genel ve kısmi veri derleme: bilgi edinilmek istenen kütlenin tamamının gözlenmesine genel veri derleme, genel nüfus sayımları vb.; bilgi edinmek istenen kütleyi oluşturan birimler arasından belirlenen amaçlar doğrultusunda yanlızca bir kısmının seçilip gözlenmesine kısmı veri derleme denir. Pahalı oluşu, zaman alışı, gözlem birimlerinin fiziksel zarara uğraması vb nedenlerle kısmi veri toplanır. 11 Kısmi veri derleme: ÖRNEKLEM (örneği oluşturmak için anakütleden seçilen birimlerin oluşturduğu topluluktur. Topluluğu oluştururken seçilen teknikler şunlardır: – – Rassal (tesadüfi)örneklem : anakütledeki her bir birimin örneğe girme şansı eşit ise rassal örnekleme İradi (isteyerek) örneklem: girmesi mümkünler arasında eşit şans gözetilmez/ fark gözetilirse olur. (7.bölümde ayrıntılı anlatılacaktır.) 23.7.2017 Selami ÖZCAN İstatistik Değişken nedir? Kaça ayrılır? Değişken (Özellik): gözlemden gözleme değişik değerler alabilen objelere, özelliklere veya durumlara denir. İstatistik birimlerin sahip oldukları özellikler değişken,değişkenlerin aldıkları değerlere ise şık tır Doğum yerleri, yaş, ağırlık, uzunluk vb. özellikler değişkendir. Aldıkları değerlere de şık denir. Değişken Türleri: 1.Mekan değişkeni:değişkenin şıklarının mekana göre oluştuğu değişkenlerdir. Doğum yeri, Üniversitenin kurulduğu şehir vb., 2.Zaman değişkeni:değişkenin şıklarının zamana göre oluştuğu değişkenlerdir. Doğum yılı, Üniversitenin kuruluş yılı vb. 3.Maddi değişkeni:mekan ve zaman değişkenin dışındaki değişkenler. İnsanların medeni hali, birim değişken maliyetler, istatistikten alınan notlar vb. 12 1. KALİTATİF (Sayısal olmayan) değişkenler 2. KANTİTATİF (Sayısal) değişkenler Değişik derecelerde az veya çok değerler alan Gözlemden gözleme farklılık gösterirler fakat bu değişkenlerdir. farklılık derece yönünden değil kalite, miktar ve çeşit yönündendir. Ör: doğum yeri, göz rengi, ırk, nüfus, cinsiyet, medeni durum, din vb. Ör: yaş, ağırlık, zeka seviyesi, hava sıcaklığı, Hesabınızdaki bakiye, sınıftaki öğrenci sayısı vb. 23.7.2017 Selami ÖZCAN İstatistik DEĞİŞKENLERİN SINIFLANDIRILMASI VERİ KALİTATİF KANTİTATİF KESİKLİ • bir ailedeki çocuk sayısı SÜREKLİ • bir kişinin kilosu • bir yılda satılan bilgisayar sayısı • bir kişinin boyu 13 23.7.2017 Selami ÖZCAN İstatistik KANTİTATİF (SAYISAL) DEĞİŞKENLER 1. Kesikli değişkenler (yalnız belirli tamsayı değerleri alabilen) Sayılabilen değişkenler Ör: cinsiyet, medeni durum 14 23.7.2017 2. Sürekli değişkenler (belirli aralıkta sonsuz sayıda değer alabilen değişkenlere denir) Ölçülen ve tartılan değişkenler Ör: yaş, uzunluk ve ağırlık vb Selami ÖZCAN İstatistik Veri kaynakları, Veri toplama araçları ve yöntemleri Veri Kaynakları Birincil Veriler Veri toplama yöntemleri Anket (yazılı iletişim) – Geleneksel cevaplayıcının yönettiği, – – – – – Telefonla anket Biçimsel olmayan mülakat – – e posta anketi İnternet anketi Mesajlaşma Dokümantasyon (yazılı) Çok kaynaklı (alan çalışması, zaman serileri) Anket (sayımlar ve anketler) Veri Toplama Araçları – inceleme tekniğidir) – Katılımlı gözlem – Dışarıdan gözlem Anket Gözlem (örnek olay) Mülakat İkincil Veriler Gözlem (olayların ortaya çıktığı sırada sistematik biçimde – Modern – Posta Faks Elden bırakıp alma araştırmacının yönettiği – – – Soru kağıdı (anket formu) – Anketör (gözlemci) Doğal gözlem Simülasyon gözlemi(kişi/grup oyun) Açık uçlu sorular (size göre…) Kapalı uçlu sorular (evet, hayır) Ücretli, gönüllü zorunlu Devamlı, geçici Görüşme: tek tek veya grup ile sözlü veya hareketli iletişim yoluyla veri toplama yöntemidir. 15 Deney 23.7.2017 Selami ÖZCAN İstatistik Ölçme ve Ölçekler Ölçme: nesne veya fertlere belirli bir özelliğe sahip oluş derecelerini belirtmek için belirli kurallara uyarak sembolik değerler verme işlemine denir. İstatistiki bir araştırmaya konu olan verileri ölçmeye yarayan ölçekler 4’e ayrılır. 1. 2. 3. 4. 16 Nominal(sınıflama) ölçek: istenen özelliğin olması(1) olmaması(0) hatalı-hatasız, kız-erkek, Ordinal (sıralama) ölçek: yarışmacıların sıralanması 1., 2., 3., veya 1. tercih, 2. tercih, likert tipi sıralama, hiç beğenmedim(1) beğenmedim(2) biraz beğendim(3), beğendim(4), çok beğendim(5) Aralık ölçeği: belirli iki değer arasında sonsuz değer alır. Bu durum için aralıklar belirlenir. 500 altı, 500-1000 ytl, 1001-1500 ytl, 1501-2000 ytl, 2001 ve üzeri Oran ölçeği: ağırlık ve boy ölçüleri , metre, kg gibi 23.7.2017 Selami ÖZCAN İstatistik Ölçeklerde Uygulanabilecek İstatistikler 17 Ölçekler Mukayese Ortalama Örnekler Nominal Kimlik Ordinal Sıralama İnternal Aralık Mod Medyan Aritmetik Cinsiyet, göz, saç rengi, meslekler, araba plakaları, forma no vb. Rasyo Tüm işlemler Satış miktarı, müşteri sayısı, ağırlık, zaman, mutlak değer olan herşey Oran 23.7.2017 Marka tercihi, sosyal sınıflar, bölüm tercihi, ilk 500 firma vb. Sıcaklık ölçeği, başarı puanı, markaya karşı tutum, vb. Selami ÖZCAN İstatistik ANALİZ TEKNİKLERİ 1. DEĞİŞKEN SAYISINA GÖRE – Tek değişkenli (değişken üzerinde değişik grupların veya cevapların dağılımı) – – Farklılıkların tespitine yönelik – t testi, ki kare testi, z testi, anova testi İlişkilerin şiddetini ölçmeye yönelik Bağımlılık ölçümü Çok değişkenli (bağımlı ve bağımsız değişken) 18 t testi, z testi, ki kare, one way anova testi, mann whitney u testi 2. AMAÇLARA GÖRE korelasyon, regresyon, faktör, ayrım ve kümeleme analizi 23.7.2017 Selami ÖZCAN İstatistik ANALİZ TEKNİKLERİ 3.Veri Özelliklerine Göre Parametrik analiz teknikleri ve ön şartları – – – – – – – – – Ön şartları – – – – 19 z testi: örnek büyüklüğü n>=30 t testi: örnek büyüklüğü n<30 F testi: varyans analizi Ki kare testi Anova testi One way anova Korelasyon Regresyon Çok değişkenli analiz teknikleri Parametrik olmayan analiz teknikleri – Tek örnek durumu için – Eşlenik çift örnek durumu için – 23.7.2017 – İşaret testi Wilcoxun eşlenik testi İki bağımsız örnek durumu için Verilerin aralık/oran ölçeğinde ölçülmüş olması gerekir Veriler normal dağılım göstermeli Hedef kitlede yer alan bütün gruplar aynı varyans değerine sahip olmalı Hata değerleri tesadufi olmalıdır İşaret testi K S testi Run testi Mann Witney U testi (t testi ile aynı) Wilcoxin sıra toplam testi Wilcor sıra sayıları testi K S testi İkiden fazla örnek durumu için Kuruskev Walls testi Frigman testi Selami ÖZCAN İstatistik İKİNCİ BÖLÜM İSTATİSTİK SERİLERİ (FREKANS DAĞILIMLARI) Niçin frekans dağılımı yapılır? – – 20 Veriyi gruplara ayırarak anlaşılabilir hale getirmek için Gözlenme sıklıklarını ve ihtimallerini belirlemek için 23.7.2017 Selami ÖZCAN İstatistik 2.Bölüm: Sunum Planı Seri türleri Kantitatif seriler – – – – 21 Zaman ve mekan serileri Frekans dağılımları Kümülatif seriler Birleşik seriler Kalitatif seriler Serilerin grafikle gösterimi 23.7.2017 Selami ÖZCAN İstatistik İstatistik serileri 22 İstatistik serileri : gözlem değerlerini (ham verileri) anlamlı kılma (büyüklüklerine göre sıralama) yollarından biridir. Seriyi oluşturan gözlem değerlerinin her birine terim denir. Kütleyi oluşturan kollektif olayların her birine birimdir. Terim ise birimleri oluşturan gözlem değerlerinden her biridir. Terim sayısı ile birim sayısı birbirine eşit olur. Seri türleri 1. Kantitatif seriler – Zaman ve mekan serileri: gözlem sonuçlarının (yıl,ay, gün, saat vb) zaman değişkeninin şıklarına göre sıralanarak oluşturuluyorsa zaman; yer değişkeninin (ülke, bölge, şehir, köy vb) şıklarına göre sıralanarak oluşturuluyorsa mekan serisidir. – Frekans Serileri: bu serilere bölünme, dağılma serileri de denir. Ham verilerin basit seri, frekans serisi ve sınıflandırılmış/gruplandırılmış seri şekline dönüştürülmesidir. – Kümülatif (birikimli) seriler: – Bileşik seriler: gözlem değerlerini iki veya daha fazla değişkene göre hir araya getiren serilere denir. Aylık gelir ve gider arasındaki ilişkinin ölçülmesi 2. Kalitatif seriler (dikey eksende frekanslar, yatay eksende sınıf veya grup değerlerinin yazıldığı grafik şeklidir. Simetrik:normal dik ve basık seriler), asimetrik(sağa ve sola eğik) seriler; çok tepeli ve J/ters J şeklinde seriler ve U şeklinde seriler vardır. Verilerin grafikle gösterilmesi – Basit serinin grafikle gösterilmesi: Çubuk grafiği – Sınıflandırılmış serinin grafikle gösterilmesi: Histogram, Frekans poligonu, – Birikimli (kümülatif)serilerin grafikle gösterilmesi – Bileşik serilerin grafikle gösterilmesi 23.7.2017 Selami ÖZCAN İstatistik Zaman ve mekan serileri 23 ZAMAN SERİSİ: gözlem sonuçlarının (yıl, ay, gün, saat vb) zaman değişkeninin şıklarına göre sıralanarak oluşturuluyorsa zaman serisi Yıllar Satışlar MEKAN SERİSİ: gözlem sonuçlarının yer değişkeninin (ülke, bölge, şehir, köy vb) şıklarına göre sıralanarak oluşturuluyorsa mekan serisidir. 1990 2000 2010 İstanbul Ankara İzmir 2500 3200 4800 23.7.2017 İller Satışlar 8500 3200 4800 Selami ÖZCAN İstatistik Frekans Dağılımları Ham veri: gözlem ya da kayıt yoluyla elde edilen ve işlenmemiş, anlamlı hale getirilmemiş sayılar yığınıdır. 1. BASİT SERİ: elde edilenen ham verilerin büyükten küçüğe veya tersi alt alta veya yan yana sıralanmasına denir. ÖRNEK1: Bir işletmede 25 çalışana verilecek çocuk yardımı ile ilgili bir araştırma yapılmaktadır. çalışanların çocuk sayıları aşağıda verilmiştir. Ham veri: 0 , 1 , 3 , 3 , 2 , 1 , 0 , 8 , 4 , 2 , 3 , 2 , 5 , 0 , 6 , 3 , 5 , 4 , 1 , 3 , 2 , 2 , 3 , 1,4 Basit seri: 8 , 6 , 5 , 5 , 4 , 4 , 4 , 3 , 3 , 3 , 3 , 3 , 3 , 2 , 2 , 2 , 2 , 2 , 1 , 1 , 1 , 1 , 0, 0, 0 Örnek 2.Ham veriler 2. FREKANS SERİSİ: basit seriyi özetlemek veya daha anlaşılır hale getirmek için yapılır. Frekans:tekrarlanma sayısıdır. Frekans serisi ise:gözlem değerlerinin yanına kaç kez tekrarlandığı yazılarak oluşturulan seridir. f harfi ile ifade edilir. ÖRNEK1: Daha önce basit seri olarak düzenlenen seriyi frekans serisi olarak düzenleyiniz . X f 0 3 1 4 2 5 3 6 4 3 5 2 6 1 8 1 Toplam 25 Basit seri 24 23.7.2017 Selami ÖZCAN İstatistik 25 23.7.2017 Selami ÖZCAN İstatistik 3. SINIF/GRUPLANDIRILMIŞ SERİ Hesaplama kolaylığı için eşit büyüklükte sınıf/gruplandırılır. Grup aralığını gösteren “aralık katsayısı”nın bulunması için en yüksek ve en düşük puanlar arasındaki fark (RANJ) belirlenir. Bu değer tahmini/istenen grup sayısına bölünür. Az sayıda grup veri kaybına, çok sayıda grup işlemlerin zorlaşmasına neden olur. 26 İlgili kavramlar Sınıf Değeri/orta noktası: Her grub veya sınıf bir sayı ile temsil edilir. Bu sayı her grubun orta noktasıdır. Buna sınıf değeri denir. Bu sınıf değeri frekans serisindeki X değeri gibi işlem görür. alt ve üst sınıf uçlarının veya alt ve üst sınıf sınırlarının toplanıp ikiye bölünmesiyle elde edilir. Sınıf büyüklüğü veya aralığı: alt ve üst sınırlar arasındaki farka denir. h ile gösterilir. Başlangıç ve bitiş sınırları belirtilmeyen sınıflara açık sınıflar denir. Sınıf aralığı dar tutulursa sınıf sayısı artar frekans dağılımının anlaşılması zorlaşır. Geniş tutulursa sınıf sayısı azalır sonuçta dağılıma ait bazı değerler gizli kalır. Uygulamada sınıf sayısı: 7-20 yada 10-30 arasında olmalıdır. Sürekli gruplandırılmış seri: sınıf uçları sınıf sayısına eşitse yani bir sınıfın alt ucunun kaldığı yerden bir önceki sınıfın üst ucu başlıyorsa sürekli gruplandırılmıs seri demektir. Sınıf sınırları: sürekli gruplandırılmış bir seride her sınıfın alt ve üst değerlerine denir. Sınıf uçları: Her sınıfın ilk rakamı alt sınıf ucu, son rakamı ise üst sınıf ucudur. Sınıf uçları sınıf sınırlarına eşittir. Kesikli gruplandırılmış seri: bir sınıfın alt ucunun kaldığı yerden bir önceki sınıfın üst ucu başlamıyorsa kesikli gruplandırılmıs seri denir. sınıf sınırları: kesikli gruplandırılmış bir seride bir üst sınıfın alt ucundan bir alt sınıfın üst ucu çıkarılıp ikiye bölünerek elde edilir. Bu değer bütün alt sınıf uçlarından çıkarılır ve bütün üst sınıf uçlarına eklenir. 23.7.2017 Selami ÖZCAN İstatistik 3. Sınıf/ Gruplandırılmış seriye Örnekler Sınıf /Grup Aralık Katsayı formülü: (en yüksek – en düşük) / istenen sınıf/grup sayısı Sınıf /Grup Sayısı formülü: eşitsizliği dikkate alınır. k sınıf sayısı n: toplam veri sayısı . ÖRNEK: Daha önce frekans serisi olarak . düzenlenen örneği 2 eşit aralıklı gruplandırılmış seri olarak düzenleyiniz. Frekans SınıflGruplandırılmış X f 0 3 1 4 2 5 3 6 4 3 5 2 6 1 8 1 Top:25 Sınıflar 0-2 2-4 4-6 6-8 8-10 toplam: frekans 7 11 5 1 1 25 10 sınıf olacak şekilde (94-28)/10=6,2yaklaşık 7 aralık katsayısı olur;28 dahil 7 sayarsak ilk sınıf 28-34 olur. 27 23.7.2017 Selami ÖZCAN İstatistik Örnek1: 100 öğrencinin istatistik dersinden aldığı notlar aşağıdaki gibidir. a. b. c. d. e. f. g. h. i. 28 89, 57, 57, 93, 97, 65, 33, 71, 42, 85, 47, 63, 76, 49, 88, 82, 50, 62, 93, 39, 76, 84, 54, 87, 56, 39, 49, 70, 74, 77, 81, 99, 73, 48, 57, 89, 55, 73, 86, 35, 66, 79, 85, 72, 91, 39, 49, 84, 66, 58, 65, 81, 84, 43, 62, 95, 58, 64, 77, 93, 74, 68, 76, 65, 61, 81, 37, 45, 89, 22, 50, 68, 87, 51, 45, 89, 95, 87, 91, 43, 71, 93, 67, 49, 65, 96, 84, 79, 77, 80, 93, 65, 89, 99, 64, 53, 62, 86, 69 Bu verilere göre Notların değişim aralığını bulunuz. Bu verileri basit seri haline getiriniz. Bu verileri sınıf büyüklüğü 10 olacak şekilde gruplandırarak bir frekans dağılımı teşkil ediniz. İlk sınıf 20-29 olsun 50 den az puan alan öğrenci sayısını bulunuz. 70 veya daha yukarı puan alan öğrenci sayısını bulunuz. C şıkkındaki sınıflandırmaya göre her sınıfa ait sınıf değerini ve sınıf sınırlarını bulunuz C şıkkındaki sınıflandırmaya göre bir histogram ve frekans poligonu çiziniz. “..den az kümülatif frekans değerlerini” bulunuz. Bu dağılıma ait frekans histogramı ve ojiv eğrinisini elde ediniz. “..den çok kümülatif frekans değerlerini” bulunuz. Bu dağılıma ait frekans histogramını ve ojiv eğrisini elde ediniz. 23.7.2017 Selami ÖZCAN İstatistik Çözüm1: a. b. 99-22=77 . 22 33 35 37 39 39 39 42 43 43 29 45 45 47 48 49 49 49 49 50 50 51 53 54 55 56 57 57 57 58 58 61 62 62 62 63 64 64 65 65 65 c. Sınıf frekanslar 20-29 1 30-39 6 40-49 11 50-59 12 60-69 18 70-79 16 80-89 22 90-99 14 65 65 66 66 67 68 68 69 70 71 71 72 73 73 74 74 76 76 76 77 77 77 79 79 80 81 81 81 82 84 84 84 84 85 85 86 86 87 87 87 88 89 89 89 89 89 91 91 93 93 93 93 93 95 95 95 96 97 99 99 d. 50 den az denildiği için 1+6+11=18 dir e. 70 ve daha fazla denildiği için 16+22+14=52 f. Sınıflar alt sınır üst sınır sınıf değeri/orta noktası 20-29 19,5 29,5 24,5 30-39 29,5 39,5 34,5 g. Frekans 20 15 10 0 19,5 29,5 39,5 49,5 59,5 69,5 79,5 89,5 99,5 h . “..den az küm.frekans 1, 7, 18, 30, 48, 64, 86, 100 “.. den çok küm.frekans 100, 99, 93, 82, 70, 52, 36, 14 den az den çok 100 75 50 25 0 23.7.2017 Selami ÖZCAN İstatistik Örnek 2: Yalova Termal otele 75 ay boyunca aylık gelen turistlerin sayısı aşağıdaki gibidir. Sınıf sayısı en az 8, en çok 15 olacak şekilde çetele tablosunu ve sınıflandırmayı ve sınıf orta noktasını bulunuz? 115 94 110 103 101 99 103 111 105 92 104 114 106 100 102 100 93 107 99 102 98 96 113 110 108 102 114 97 93 91 95 97 113 98 90 100 103 114 99 114 108 103 100 98 101 104 110 114 113 109 108 106 115 103 111 109 112 104 104 102 107 106 109 105 30 96 94 96 101 101 106 107 105 113 112 23.7.2017 Selami ÖZCAN İstatistik 99 Sınıflar Çetele Frekans Sınıf Orta Noktası 90-92 /// 3 (90+92)/2=91 93-95 ///// 5 =94 96-98 ///// /// 8 =97 99-101 ///// ///// // 12 =100 102-104 ///// ///// //// 14 =103 105-107 ///// ///// / 11 =106 108-110 ///// //// 9 =109 111-113 ///// /// 8 =112 114-116 ///// 5 =115 Toplam 75 ÇÖZÜM2: Sınıflar 90-92 93-95 96-98 99-101 102-104 105-107 108-110 111-113 114-116 31 1. adım: Dağılımdaki en büyük ve en küçük değer bulunur. Örneğimizdeki en büyük değer 115, en küçük değer 90 2. adım: En büyük değerden en küçük değer çıkarılarak dağılım aralığı bulunur. Değişim aralığı = En büyük değer- En küçük değer Dağılım aralığı= 115-90=25 3. adım: Dağılım aralığı bir kez 8'e bir kez 15'e bölünerek(sınıf sayısının en az 8, en çok 15 olmasını önerildiği için) sınıf aralığı saptanmaya çalışılır. 25÷8=3.1, 25÷15=1.6'dır. 1.6 ile 3.1 arasında herhangi bir değer sınıf aralığı olarak seçilebilir. Eğer sınıf aralığını 3 olarak alırsak yaklaşık 8-9 sınıf elde ederiz, sınıf aralığını 2 alırsak sınıf sayımız 12-13 arasında olur. Burada sınıf aralığı 3 olarak alınmıştır. Sınıflar şu şekilde En küçük değer 90 olduğundan ilk sınıfın alt sınırı 90 ile başlatılmıştır. Tüm sınıf sayımız ise 9'dur. Bütün değerler sınıflamaya dahil edilmiştir. 4. Adım: Sınıflar saptandıktan sonra her bir değerin hangi sınıfa gireceğine bakılır. Örneğimizdeki ilk değer 115'dir. Bu değer 114-116 sınıfına gireceği için bu sınıfın karşısına bir çizgi çizilir. Sonra geri kalan değerler teker teker ait oldukları sınıfın karşısına işaretlenir. Buna "Çeteleme" denir. Sonra çeteleler sayılır ve her sınıfın karşısına yazılır. Örnek dağılımımızın çetele ve sayı ile gösterilmesi 23.7.2017 Selami ÖZCAN İstatistik Frekans serisi ve gruplandırılmış seriye örnek (4 sınıflı gruplar oluşturulacak) Frekans serisi X frekans 5 2 7 4 8 12 10 8 11 6 12 5 16 3 32 Top 40 Gruplandırılmış seri Gruplar frekans 5.00-7.75 6 7.75-10.50 20 10.50-13.25 11 13.25-16.00 3 Toplam 40 23.7.2017 Selami ÖZCAN İstatistik Frekans serisinin gruplandırılmış seriye dönüşümü 1.adım: En yüksek X değerinden en düşük X değeri çıkarılır sınıf sayısına bölünür. (16-5)/4= 2,75 (sınıf büyüklüğü) bu değer serideki en küçük değer (5)e kümülatif olarak eklenir. 2. adım: örnekteki frekans seriyi eşit aralıklı 4 sınıflı sürekli gruplandırılmış bir seri haline getirelim. 5+2,75=7,75 olur. Sürekli gruplandırılmış seri kesikli gruplandırılmış seri (aralık 3) grup f grup frekans nisbi frekans ilk aralık 5-7,75 6 4, 50-7,50 6 6/40 7,75-10,50 20 7,75-10,75 20 20/40 10,50-13,25 11 11,00-14,00 11 11/40 13,25-16,00 3 14,25-17,25 3 3/40 top 40 top 40 40/40 Sınıf sınırları: 5-7,75;7,75-10,50;10,50-13,25;13,25-16,00 Sınıf büyüklüğü: 7-75-5,00=2,75 Sınıf değeri: (5,00+7,75)/2=6,375 33 23.7.2017 Selami ÖZCAN İstatistik Kümülatif (Birikimli) Frekanslar 34 Bazı istatistiksel çalışmalarda bir frekans serisinde veya gruplandırılmış seride belirli bir değerden daha küçük veya daha büyük değer alan birim sayısının belirlenmesi gerekebilir. Bu durumlarda kümülatif frekanslar hesaplanır Her sınıfın frekansına bir önceki sınıfın frekansı eklenerek oluşturulan seriye KF denir. ..den az: küçükten büyüğe doğru oluşturulur. ..den çok: büyükten küçüğe doğru oluşturulur. 23.7.2017 Selami ÖZCAN İstatistik Kümülatif Frekans Dağılımları 1. 2. 3. 4. 35 Sınıflar 5-7,75 ..den az kümülatif 7,75-10,50 Frekans dağılımları 10,50-13,25 ..den çok kümülatif 13,25-16,00 Frekans dağılımları ..den az küm.nisbi Sınıflar frekans dağılımları 5-7,75 ..den çok küm.nisbi frekans dağılımları 7,75-10,50 10,50-13,25 13,25-16,00 f 6 20 11 3 40 f 6 20 11 3 40 23.7.2017 ..den az küm.f. 7,75 den az 6 10,50 den az 6+20=26 13,25 den az 26+11=37 16,00 den az 37+ 3=40 ..den az ..den çok küm.f. 5,00 den çok 40 7,75 den çok 40- 6=34 10,50 den çok 34-20=14 13,25 den çok 14-11= 3 küm.nisbi f. ..den çok küm.nisbi f. 7,75 den az 6/40=15 5,00 den çok 40/40=100 10,50 den az 26/40=65 7,75 den çok 34/40= 85 13,25 den az 37/40=92,5 10,50 den çok 14/40= 35 16,00 den az 40/40=100 13,25 den çok 3/40= 0,75 Selami ÖZCAN İstatistik SORU 2015 verileri ile dünyadaki 30 büyük şehir nüfuslarına göre gruplandırılarak frekans dağılımları gösterilmektedir. Nüfus grupları(*1000 kişi) şehir sayısı(frekans) 3000 - 4000 den az 6 4000 - 5000 den az 6 5000 - 6000 den az 4 6000 - 7000 den az 6 7000 - 8000 den az 2 8000 - 9000 den az 4 9000 ve üzeri 2 Yukarıdaki tabloyu kullanarak ; a. .. den az küm. frekans ve .. den çok küm. frekansları bulunuz? b. ..den az küm.nisbi ve ..den çok küm. nisbi frekansları bulunuz? c. Şehir nüfusu 6000 den az olan şehir sayısı kaçtır? d. Şehir nüfusu 8000 ve üzeri olan şehir sayısı kaçtır? e. Şehir nüfusu en az 5000 ve 8000 den az olan şehir nüfusu kaçtır? f. Histogram, frekans poligonu ve ojiv eğrilerini çiziniz? 36 23.7.2017 Selami ÖZCAN İstatistik Çözüm a ve b şıkları Nüfus grupları(*1000 kişi) 3000 - 4000 den az 4000 - 5000 5000 - 6000 6000 - 7000 7000 - 8000 8000 - 9000 9000 ve üzeri f 6 6 4 6 2 4 2 ...den az ...den çok ...den az ...den çok küm. frekans küm.frekans küm.nisbi frekans küm.nisbi frekans 6 30 6/30= 30/30= 12 24 12/30= 24/30= 16 18 16/30= 18/30= 22 14 22/30= 14/30= 24 8 24/30= 8/30= 28 6 28/30= 6/30= 30 2 30/30=1.00 2/30= c. Nüfusu 6000 den az şehir sayısı 16 dır. d. Nüfusu 8000 ve üzeri olan şehir sayısı 6 dır. e. Nüfusu 5000 ile 8000 den az olan şehir sayısı 18- 8=10 dur. f. 37 23.7.2017 Selami ÖZCAN İstatistik BİLEŞİK SERİLER (Bağımlı/bağımsız) Birimlerin birden fazla değişkene göre dağılımlarını bir arada gösteren serilerdir. Bir bileşik serinin ilk sütunu değişkenin gözlem değerleri, diğer sütunda ise ilgili değişkenlerin ilk değerleri yer alır. Birim seçimi (öğrenci) Değişken (uzunluk ve ağırlık) Örnek: Öğrenci gözlem no 38 Uzunluk(m) X Ağırlık (kg) Y 1 1.72 68 2 1.68 70 3 1.80 76 4 1.74 73 5 1.76 71 23.7.2017 Selami ÖZCAN İstatistik SERİLERİN GRAFİKLE GÖSTERİLMESİ 39 HİSTOGRAM FREKANS POLİGONU 23.7.2017 Selami ÖZCAN İstatistik Frekans dağılımların grafikle gösterilmesi 1.DİYAGRAMLAR (Çubuk ve alan grafikleri) Çubuk grafiği, gözlem değerleri x=2, 4, 6, 8, 10 yatay eksen Dikey eksende frekans değerleri: 2, 4, 7, 3, 1 – – – 8 8 7 7 6 6 5 5 4 4 3 3 2 2 YATAY EKSEN DİKEY EKSEN BU KOORDİNAT SİSTEMİNE GÖRE OLUŞAN ŞEKİL 1 1 0 0 2 40 2.FREKANS POLİGONU 4 6 8 10 23.7.2017 2 4 6 8 10 Selami ÖZCAN İstatistik Histogram ve frekans poligonu, 41 Histogram: dikdörtgenler dizisidir. frekanslar Tabaları her bir sınıfın sınıf 20 büyüklüğünü, yüksekliği ise frekansları gösterir 15 Frekans Poligonu: dikdörtgenlerin 10 üst kenarlarının orta noktaları birleştirilmek suretiyle elde edilen grafiğe denir. Başlangıç noktası ilk 5 sınıftan bir önceki farazi sınıfın orta noktasıdır.bitiş ise son sınıftan 5,00sonraki farazi sınıfın orta noktasıdır. Her ikisinin kapsadığı alan 23.7.2017 birbirine eşittir. histogram Frekans poligonu 7,75 10,50 13,25 16,00 gruplar Selami ÖZCAN İstatistik HİSTOGRAMA ve FREKANS POLİGONUNA ÖRNEK Sınıflar Frekanslar (f) Sınıf aralıkları (h) Ayarlanmış frekanslar (f/h) 0-4 12 4 12/4=3 4-8 16 4 16/4=4 6 8-12 20 4 20/4=5 5 12-16 24 4 24/4=6 4 16-20 20 4 20/4=5 3 20-24 8 4 8/4=2 2 Ayarlanmış frekanslar 0 42 23.7.2017 4 Frekans poligonu 8 12 16 20 24 sınıflar Selami ÖZCAN İstatistik 43 23.7.2017 Selami ÖZCAN İstatistik VERİ ANALİZİ HİSTOGRAM: F R E K A N S F R E K A N S DEĞİŞKEN SİMETRİK HİSTOGRAM F R E K A N S DEĞİŞKEN SAĞA ASİMETRİK HİSTOGRAM DEĞİŞKEN SOLA ASİMETRİK HİSTOGRAM Histogramlar; spesifikasyon ve sonuç arasındaki ilişkilerin araştırılmasında, normal olmayan verilerin belirlenmesinde, malzeme ve değişik verileri sınıflandırarak bir operasyonelfinansal sürecin içerisinde değişikliklere neden olan faktörlerin gözden geçirilmesinde kullanılmaktadır. 33 KÜMÜLATİF SERİLERİN GRAFİKLE GÖSTERİMİ Sınıflar : 0-10, 10-20, 20-30, 30-40, 40-50, 50-60, 60-70, Frekanslar: 3, 12 25 30 15 10 5 = 100 den az ve den çok serileri oluşturunuz? Sınıflar yatay, frekanslar dikey ekseni gösterir. den az = 3, 15, 40, 70, 85, 95, 100 ..den az den çok=100, 97, 85, 60, 30, 15, 5 100 ..den çok 0 45 23.7.2017 80 Selami ÖZCAN İstatistik Bileşik serilerin grafikle gösterimi 8 Y 7 6 5 4 3 2 1 0 X 2 46 4 6 23.7.2017 8 10 Selami ÖZCAN İstatistik GRAFİKLER 47 Araştırma sonucunda elde edilen ve düzenlenen verilerin daha kolay anlaşılabilmesi için gösterildiği şekillere grafik denir. Grafikler göze hitap ettikleri için, toplanan verilerin daha açık bir şekilde görülmesine ve yorumlanmasına yardımcı olur. Buradaki en önemli nokta grafiklerin açık ve anlaşılır biçimde çizilmeleridir. 23.7.2017 Selami ÖZCAN İstatistik Verilerin grafikle gösterilmesi Sütun/Bar grafiği Pasta grafiği Çubuk Çizgi Alan XY dağılımı Silindir Örnekler verilecek 48 23.7.2017 Radar grafiği Halka grafiği Hisse senedi Kabarçık Yüzey Koni grafiği Pramit grafiği Selami ÖZCAN İstatistik BAR GRAFİK İstatistiksel verileri açıklamak için en çok kullanılan grafik türüdür. birbirini izleyen barların bir serisini gösterir. Barlar küçükten büyüğe ya da tersi biçimde sıralanır. 49 23.7.2017 Selami ÖZCAN İstatistik Diğer soru örnekleri Soru 1: Aşağıda 50 öğrencinin istatistik I dersinden aldığı notlar verilmiştir. Sınıf/Grup sayısı 10 olacak şekilde frekans tablosunu oluşturunuz? 50 23.7.2017 Selami ÖZCAN İstatistik Soru 2: Aşağıdaki sayılar saat 24 ile 7 arasında bir telefon santraline gelen toplam 911 çağrının 36 günlük dağılımını göstermektedir 22 30 17 63 11 8 51 76 27 30 41 41 34 6 35 48 26 64 38 23 19 28 37 65 32 23.7.2017 54 71 105 35 52 43 31 48 22 44 63 30 Selami ÖZCAN İstatistik Soru 3: Aşağıdaki 60 adet veriyi önce basit seriye sonra frekans serisine dönüştürünüz? 52 5,9 7,7 8,9 5,2 7,3 7,7 6,3 7,3 5,7 5,6 5,6 6,7 6,9 7 7,3 6,2 6,5 6,5 9,2 7,1 4,1 4,9 7,5 7,5 9,6 7,9 5,3 5,5 6,1 6,1 8,3 8,1 8,1 4,5 7,3 9,4 5,8 6,7 6,7 6,9 6,9 7,1 6,9 7,7 7,7 8,1 8,7 6,5 6,7 9,1 7,1 6,3 5,1 7,3 8,3 8,9 9,3 5,7 6 5,9 23.7.2017 Selami ÖZCAN İstatistik Soru 4: Bir fabrikada çalışan işçilerin aylık ücretleri ve bu ücreti alan işçilerin yüzde dağılımları şöyledir. 53 Aylık Ücret (*100 tl) İşçi Yüzdesi 1000 den az 17,2 1000 - 1999 11,7 2000 - 2999 12,1 3000 - 3999 14,8 4000 - 4999 15,9 5000 - 5999 11,9 6000 – 6999 12,7 7000 ve üzeri 3,6 Yukarıdaki tabloyu kullanarak ; a. 1.sınıf ne şekilde yazılmalıdır ki büyüklüğü 2.sınıfınkine eşit olsun? b. Aylık 4000 tl ve üzeri ücret alan işçilerin yüzdesi kaçtır? c. En az 3000 tl fakat 5000 tl den de az alan işçilerin yüzdesi kaçtır? d. Aylık ücreti 6000 den az olan işçilerin yüzdesi kaçtır? e. Yüzdeler toplamı neden %100 çıkmamıştır.? 23.7.2017 Selami ÖZCAN İstatistik SORU 5 X yılı verilerine göre çalışanların çalışma statüleri aşağıda gösterilmiştir. Sütun/bar ve pasta grafiklerini çiziniz? 54 Ücretli çalışanlar 6.283.355 Mevsimlik/Yevmiyeli çalışanlar 1.347.728 İşverenler 1.118.950 Kendi hesabına çalışanlar 4.905.037 Ücretsiz/aile işçisi 6.129.021 Toplam 19.784.091 23.7.2017 Selami ÖZCAN İstatistik Soru 6: 30 adet borunun et kalınlıkları mm olarak ölçülmüş sırasıyla aşağıdaki değerler bulunmuştur 55 4,45 5,05 5,25 5,55 6,15 4,65 5,05 5,35 5,55 6,25 4,84 5,24 5,44 5,55 4,85 5,25 5,44 5,65 4,95 5,25 5,44 5,65 4,95 5,25 5,44 5,75 5,05 5,25 5,55 5,85 a. Sınıf sayısı 10 olacak şekilde sınıf aralığını bularak sınıfları oluşturunuz. b. Sınıf alt ve üst sınır uçları ile sınıf değerlerini bulunuz. c. Histogram ve frekans poligonunu çiziniz. 23.7.2017 Selami ÖZCAN İstatistik Soru 7: İŞL 243 dersi ara sınav notları (n = 38) 15 34 47 51 62 54 50 23 36 47 63 58 60 52 24 41 65 73 71 75 63 54 32 41 55 64 74 82 59 33 56 45 74 34 82 26 95 46 a. Frekans tablosunu oluşturunuz. b. Sınıf sayısını (2k > n 2k > 38 k = 6 (64 > 38) ve sınıf aralığını (max-min/ k) bulunuz c. Sınıf sınırlarını ve sınıf orta noktasını bulunuz. d. Histogram ve frekans poligonunu çiziniz. e. Kümülatif frekans (ojiv) eğrisini çiziniz. 56 23.7.2017 Selami ÖZCAN İstatistik Soru 8: İktisat 2. sınıfların yaşları aşağıdaki gibidir.(n=26) 17 21 20 25 25 18 23 24 22 19 25 19 22 24 21 25 26 19 22 18 27 19 26 20 23 22 a. Frekans tablosunu oluşturunuz. b. Sınıf sayısını ve sınıf aralığını (max-min/ istenen sınıf sayısı) bulunuz c. Sınıf sınırlarını ve sınıf orta noktasını bulunuz. d. Histogram ve frekans poligonunu çiziniz. e. Kümülatif frekans (ojiv) eğrisini çiziniz. 57 23.7.2017 Selami ÖZCAN İstatistik ÜÇÜNCÜ BÖLÜM MERKEZİ EĞİLİM (YER) ve DEĞİŞKENLİK 58 23.7.2017 ÖLÇÜLERİ Selami ÖZCAN İstatistik 3. BÖLÜM: Sunum planı 1. Merkezi eğilim ölçüleri 2. Dağılım / değişim ölçüleri Parametrik Merkezi eğilim Parametrik dağılım/değişim ölçüleri ölçüleri (Duyarlı) 1. Değişim aralığı (Ranj) 1. Aritmetik ortalama X 2. Kartil aralığı 2. Geometrik ortalama G 3. Desil aralığı 3. Harmonik ortalama H Parametrik olmayan dağılım/değişim ölçüleri 4. Kareli ortalama K – Ortalama sapma Parametrik olmayan merkezi – Varyans eğilim ölçüleri (Duyarsız) – Standart sapma 1. 2. 3. 59 Mod Medyan Kantiller (kartiller, desiller, pörsentiller) 23.7.2017 – Değişim katsayısı Selami ÖZCAN İstatistik 1. Merkezi Eğilim Ölçüleri bir veri kümesinin ortasını belirleme eğiliminde olan sayısal değerdir. Gözlem değerlerinin etrafında toplanma eğilimi gösterdiği değerdir. Parametrik Merkezi eğilim ölçüleri Parametrik olmayan merkezi eğilim ölçüleri (Duyarsız Ortalamalar) (Duyarlı ortalamalar: serideki tüm gözlem değerlerinden etkilenen ortalamalardır.) 1. 2. 3. 4. 1. Aritmetik ortalama X:Deneklerin aldıkları değerlerin toplanıp denek sayısına bölünmesiyle elde edilen değerdir Geometrik ortalama G= Harmonik ortalama H= Kareli ortalama K= 2. 3. 4. Medyan (ortanca):Bir ölçek üzerinde orta noktanın yerini gösteren bu ölçü tüm değerleri ortadan ikiye bölen değerdir Mod:Ölçümlerde en fazla tekrar edilen değere mod denir Kantiller (kartil desil pörsentil) Ortalama kartil •Parametrik merkezi eğilim ölçülerindeki ortalamaların değeri, serinin herhangi bir biriminin değeri değiştiğinde değişir. Yani değişikliklere duyarlı olan ortalamalar. •Parametrik olmayan merkezi eğilim ölçülerindeki ortalamaların değerinin değişmesi için bu ortalamaların hesabında kullanılan birimlerin değerinin değişmesi gerekir. 60 23.7.2017 Selami ÖZCAN İstatistik k Aritmetik Ortalama ͞x X f i Xm i 1 n Serideki bütün rakamlardan etkilenen ve en çok kullanılan ortalamadır. Özellikleri: • Duyarlı bir ortalamadır, aşırı değerlerden etkilenir. • Gözlem değerlerinin aritmetik ortalamadan sapmaların toplamı sıfırdır. (x-x)=0 • Gözlem değerlerinin aritmetik ortalamadan sapmaların kareleri toplamı minimumdur.(x-x)²=min 61 23.7.2017 Selami ÖZCAN İstatistik Basit Serilerde Aritmetik Ortalama: ͞x= Σx/n Puan toplamlarının veri sayısına bölümüdür. Örnek1 X Örnek 2: X 10 95 12 88 18 73 20 67 Top.60 59 X=60/4=15 46 X X 1 X 2 X 3 n 35 26 23 Top: 23.7.2017 512 X=512/9=56,88 62 Frekans Serisinde Aritmetik Ortalama X f fx ͞x=Σfx/Σf X=69/10=6,9 4 1 4 5 2 10 7 4 28 9 3 27 Σf=10 Σfx=69 63 23.7.2017 Selami ÖZCAN İstatistik Gruplandırılmış Seride Aritmetik Ortalama Gruplar Frekans Ort değ.(x) fx 2-4 2 [(2+4)/4] 3 6 5-7 13 6 78 8-10 4 9 36 11-13 1 12 12 Σf=20 Σfx=132 X=132/20=6,6 64 23.7.2017 Selami ÖZCAN İstatistik Tartılı Aritmetik Ortalama bir serideki değerler arasında önem derecesi farklı oluyorsa bu tür serilerin aritmetik ortalaması tartılı olarak hesaplanır. Bunun için önem düzeyini gösteren katsayılar (tartılar) kullanılır. Basit seride: Xt= Σtx/Σt frekans serisinde: Xt=Σtfx / Σtf Gruplandırılmış seride: Xt=Σtfm/Σtf Örnek: aşağıda öğrencinin almış olduğu dersler ve kredileri verilmiştir. Tartılı ortalamasını hesaplayınız. Dersler Not(X) Kredi(t) t X Üretim Yönetimi 85 3 255 İstatistik 89 3 267 İktisat 55 4 220 Matematik 60 2 120 Pazarlama 100 3 300 Toplam Σt=15 Σtx=1162 tX=1162/15=77,47 66 23.7.2017 Selami ÖZCAN İstatistik Geometrik ortalama (G) Serideki n tane birimin çarpımının n inci dereceden kökü alınarak hesaplanır. G=n√ x1.x2.x3…..xn (basit) logG=1/n(logx1+logx2+.logxn) Örnek (basit) X=10,12,18,20 G=4√10x12x18x20=4√43200≈14.42 LogG=1/4 (log10+log12+log18+log20) LogG=1/4(1.0000+1.0792+1.2553+1.3010=4.6355) Log G=1/4 (ΣlogX)=4,6355/4=1.1589 x10 G=11.589 (Açıklama: Log G yi G ye çevirmek için logG yi 10 ile çarparız. Yani G=10 log G) G= Σf√X1f1 . X2f2. …X fn(frekans n ve grup ) Log G=1/ Σf . [f1logX1 + f2logX2+ ….+log Xn] 67 23.7.2017 Örnek (frekans) X=4,5,7,9 f=1, 2, 4, 3=10 Log X=0.6021, 0.6990, 0.8451, 0.9542 f. logX=(1x0.6021)+(2x0.6990)+(4x0.8451)+(3x0.9542) =8.2431 LogG=1/ Σf .(fxlogX)= 8.2431/10=0,8243 Log G=1/10. (0.6021+1.398+3.3804+2.8626)=8.2431 Log G= (1/Σf ). (fxLog X)=8.2431/10=0.8243 G=10 x 0.8243=8.2431 Örnek (grup)2-4, 5-7, 8-10, 11-13 Sadece grupların orta noktası bulunarak yapılır. Selami ÖZCAN İstatistik HARMONİK ORTALAMA (H) Serideki birimlerin çarpmaya göre terslerinin aritmetik ortalamaya göre tersleridir. Seride 0 veya negatif bulunması durumunda H hesaplanamaz H=n/Σ(1/x) basit seri için H= Σf/ Σ(f/x) frekans ve gruplandırılmış seri için Örnek: x=10, 12, 18, 20 basit seride harmonik ortalamayı bulunuz? 1/X=1/10+1/12+1/18+1/20= 0,1000+0,0833+0,0556+0,0500=0,2889 H=n/Σ(1/x) =4/0,2889= 13,85 Örnek: frekans serisinin harmonik ortalamasını bulunuz? X=4, 5, 7, 9 f=1, 2, 4, 3=10 H= Σf/ Σ(f/x)=10/(1/4+2/5+4/7+3/9)= H=10/(02500+0,4000+0,5714+0,3333)=10/1,5547=6,43 Örnek: gruplandırılmış serinin harmonik ortalaması nedir? X=2-4, 5-7, 8-10, 11-13 f=2, 13, 4, 1=20 önce ortalamalar bulunur. X= 3, 6, 9, 12 sonra f/x ler yani 2/3,13/6,4/9,1/12 H= Σf/ Σ(f/x)=20/(0,6667+2,1667+0,4444+0,0833)=5,95 68 23.7.2017 Selami ÖZCAN İstatistik KARELİ ORTALAMA (K) Seriyi oluşturan gözlem değerlerinin karelerinin toplamının gözlem sayısına oranının kare köküdür. K= K= √∑X²/n √∑fX²/ ∑f basit seriler için frekans ve grup serileri için Örnek: x=10, 12, 18, 20 basit serinin kareli ortalamasını bulunuz? X²=100 +144+324+400=968 K= Örnek: X=4, 5, 7, 9 f=1, 2, 4, 3=10 frekans serisinin kareli ortalamasını hesaplayınız? K= X²= 16+25+49+81= f X²=1x16+2x25+4x49+3x81=505 K= √∑fX²/ ∑f=√505/10=7.11 Örnek: √∑X²/n=√968/4=15.56 Grup=2-4, 5-7, 8-10, 11-13 f=2, 13, 4, 1=20 gruplandırılmış serinin kareli ortalamasını bulunuz? Önce orta nokta bulunur. X= 3, 6, 9, 12 sonra X² = 9, 36, 81, 144 f=2, 13, 4, 1=20 fx ² =2x9+13x36+81x4+144x1=954 K= 69 √∑fX²/ ∑f frekans serisi ve gruplandırılmış seri için 23.7.2017 √∑fX²/ ∑f= √954/20=6.91 Selami ÖZCAN İstatistik Parametrik olmayan merkezi eğilim ölçüleri (Duyarsız Ortalamalar) Duyarlı olmayan ortalamalar: seriyi oluşturan tüm gözlem değerlerinin büyüklüklerinden etkilenmeyen ortalamalardır. 70 Medyan Mod Kantiller – Kartiller – Desiller – Pörsentiller 23.7.2017 Selami ÖZCAN İstatistik MEDYAN (Orta Değer, Ortanca) Büyükten küçüğe, küçükten büyüğe doğru sıraladığımızda tam ortaya düşen değer (iki değerin ortalaması) seriyi iki eşit parçaya bölen gözlem değeridir. N=toplam frekans, basit ve frekans serilerinde (N+1)/2 medyandır. Gruplandırılmış seride kaçıncı değerin medyan olduğunu bulmak için “.. den az kümülatif frekanslar bulunur. (N+1)/2 değerinin içerisinde yeraldığı kümülatif frekans gruplandırılmış seride medyan sınıfını ifade eder. Frekans ve gruplandırılmış serilerde çok sayıda değer olacağı için 1 dikkate alınmayabilir. Yani N/2 olur. N/2=medyanı gösteren değer N L=medyan sınıfının alt sınırı f m 1 N=toplam frekans (∑f) 2 Medyan L xhm 1 fm-1=medyan sınıfına kadar sınıfların frekansları toplamı fm fm=medyan sınıfının frekansı hm=medyan sınıfının büyüklüğü Medyan sıralamalı ölçeklerle elde edilen veriler için uygun bir merkezi eğilim ölçüsüdür. Medyanda ölçümlerin her birinin puan değerinden çok dağılım içindeki sırası önemlidir. 71 23.7.2017 Selami ÖZCAN İstatistik Basit seride medyana örnek 72 Basit seri: – tek sayı ise: ham veri: 2,2,3,7,4,5,6 basit seri: 2,2,3,4,5,6,7 (4 medyan) – çift: 10, 12, 8, 4, 9, 3 sırala 3, 4, 8, 9, 10, 12 (8+9)2=8,5 medyan Örnek (çift) X N=(4+1)/2=2,5 yani 2. ve 3. değerlerin ortalaması 12+18/2=15 medyan 10 12 18 20 23.7.2017 Selami ÖZCAN İstatistik Frekans serisinde Medyana Örnek Örnek 1: tek ise: x=2,4,6,8,10 f=2,4,3,5,1=15 15/2= 7.5 frekansa karşılık gelen X değeri medyandır. küm.f=2, 6, 9,14, 15= 7,5 değeri 6’dan büyük olduğu için frekansı 9 olan x değeri 6 medyandır. Örnek 3: çift ise X=4,5,7,9 f=1,2,4,3 küm.f=1,3,7,10 N+1/2 yani 10+1/2=5,5 değer medyandır. 5,5 değer 5 ten büyük olduğu için bir sonraki değer olan 7 nin içinde yer alır. Küm.frekansı 7 olan 7 değeri medyandır. Örnek 3: 73 23.7.2017 Selami ÖZCAN İstatistik Gruplandırılmış seride medyan formülü ve notasyonları N Formuldeki notasyonlar f m 1 xhm N/2=medyanı gösteren değer Medyan L1 2 fm L=medyan sınıfının alt sınırı N=toplam frekans (∑f) fm-1=medyan sınıfına kadar sınıfların frekansları toplamı fm=medyan sınıfının frekansı hm=medyan sınıfının büyüklüğü Çok sayıda değer olacağı için sınıflama/gruplama yüzünden yaklaşık medyan değeri bulunur. 74 23.7.2017 Selami ÖZCAN İstatistik N f m 1 2 Medyan L1 xhm fm Örnek 1: Aşağıdaki sınıflandırılmış serinin medyanını bulunuz? X 2-4 5-7 8-10 11-13 f küm.f. ..den az küm.f. .den çok küm.f. 2 2 2 20 13 15 15 18 4 19 19 5 1 20 20 1 =20 20/2=10 Küm.Frekans 20 15 10 5 Çözüm 1: 10. Değer 15 frekansın içindedir. Çözüm 2: Grafik 0 metodu: ”..den az Küm frekans=15 5-7 sınıfı göstermektedir. ve ..den çok” değerleri aynı Alt sınır:4,5 Üst sınır:7,5 büyüklüğü 3 tür. grafikte gösterilirse Medyan sınıfının bir önceki küm.frekansı 2, x eksenindeki Medyan sınıfının frekansı:13 tür. kesişim noktası medyandır. Medyan:4,5+[(10-2)/13 ]x3=6,35 75 23.7.2017 3 6 9 6,35 Selami ÖZCAN İstatistik 12 15 Gruplar Örnek 2: Aşağıdaki sınıflandırılmış serinin medyanını bulunuz? X 10-14 14-18 18-22 22-26 26-30 76 f 3 4 8 6 1 =22 küm.frekans 3 7 15 21 22 22/2=11 ..den az serisinin 11. gözlem değeri 18-22 sınıfı medyan sınıfıdır. L=18, N/2=11 fm-1=7 fm=8 hm:4 Medyan: 18+ [(11-7)/8] x 4=20 medyan sınıfının içinde yer alıyor. 23.7.2017 Selami ÖZCAN İstatistik Örnek3: Aşağıdaki dağılımın ortalama ve medyan değerini hesaplayın. Sınıf 15-27 28-40 41-53 54-66 67-79 80-92 93-105 Küm f 4 9 18 30 35 37 38 f 4 5 9 12 5 2 1 k X f i 1 i Xm n Rel f .11 .13 .24 .32 .13 .05 .02 Küm Rel f .11 .24 .48 .80 .93 .98 1.00 2033 53.5 38 Sınırlar 14.5-27.5 27.5-40.5 40.5-53.5 53.5-66.5 66.5-79.5 79.5-92.5 92.5-105.5 Orta Nokta 21 34 47 60 73 86 99 n 2 Cf L Md x L i f i 38 2 18 M d 53.5 13 54.58 12 Örnek 4: işletme 2. sınıf öğrencilerinin yaşlarının oluşturduğu sınıf ve frekansları aşağıdaki gibidir. Dağılımın ortalama ve medyan değerini bulunuz? Sınıf 17-18 19-20 21-22 23-24 25-26 27-28 Çetele /// //// / //// / //// //// / / k X 78 f i 1 i Xm n f 3 6 6 4 6 1 Küm f Rel f Küm Rel f Sınırlar 3 .12 .12 16.5-18.5 9 .23 .35 18.5-20.5 15 .23 .58 20.5-22.5 19 .15 .73 22.5-24.5 25 .23 .96 24.5-26.5 26 .04 1.00 26.5-28.5 Orta Nokta 17.5 19.5 21.5 23.5 25.5 27.5 26 / 2 9 573 M 20 . 5 2 21.80 d 22.04 6 26 23.7.2017 Selami ÖZCAN İstatistik Diğer örnekler 79 (35+1/2=18. 20 nin içinde grup 55-57 medyan sınıfı) 54.5+{[(35/2)-14] /6}x3=56,25 medyan 23.7.2017 Selami ÖZCAN İstatistik Sınıflandırılmış/Gruplandırılmış serinin grafikle gösterimi k.f. 20 Grafik Metodu ile Medyan “..den az kümülatif frekans eğrisinin kesiştiği noktasındaki X değeridir. Medyan değeri: 6.15 15 10 5 Gruplar 0 80 3 6 9 23.7.2017 12 15 Selami ÖZCAN İstatistik Mod (Tepe Değer) Mod ya da tepe değer, bir seride (puan dağılımında) en çok tekrar eden, yani frekansı en fazla olan puan ya da ölçümdür. Tepe Değer (Mod) ile ilgili bazı önemli noktalar 1) Bir puan dağılımında puanların frekansı aynı ise dağılımın modu hesaplanamaz (mod yoktur). Örneğin; 1,1,1,5,5,5,7,7,7 puan dağılımının modu yoktur. 2) Bir dizi puan dağılımında ardı ardına gelen iki puanın frekansı birbirine eşitse bu durumda mod frekansı eşit olan puanların ortalamasıdır. Örneğin; 2,2,3,3,3,5,5,5,9,9 puan dağılımında 3 ve 5 puanlarının frekansları birbirine eşittir. Bu durumda mod (3+5)/2=4 olarak bulunur.Dizinin modu 4 3) Bir dizi puan dağılımında frekansı eşit fakat ardı ardına gelmeyen puanlar varsa, bu durumda dizinin iki modu olur. Örneğin; 2,3,3,3,4,5,6,6,6,7 puan dağılımının 3 ve 6 olmak üzere iki modu bulunmaktadır. Bir sayı setinde elemanların hepsi birbirinden farklı ise bu basit serinin modu yoktur. Basit seriye Örnek1: 60,72,82,72,61,81,72 ise Mod=72’dir. Örnek 2: x=1,1,2,1,3,2,2,1,1,3,5,4,1,1,2 en çok tekrar edilen 1 modtur. Örnek 3: 5, 7, 12, 28, 40, 35 mod yoktur Örnek 4:10,12,18,20 mod yoktur. Frekans seriye Örnek 1: X=2,3,4,5 f=2,4,7,1 en büyük frekans 7, mod değeri ise 4 Örnek 2: x=4,5,7,9 f=1,2,4,3 frekansı (4) en yüksek x değeri 7 modtur. Güvenirliğinin düşük olması nedeniyle nadiren kullanılır. Çünkü bazı durumlarda dağılımın çarpık olması nedeniyle birden fazla mod bulunabilir. 81 23.7.2017 Mod:en büyük frekans bir gözlem değerine değil, bir sınıfa karşılık gelmektedir. Bu sınıfa mod sınıfı denir Sınıf/Gruplandırılmış Serinin Modu Örnek 1 Örnek 1: Gruplar=2-4, 5-7, 8-10, 11-13 frekans: 2, 13, 4, 1 =20, L=4,5 (alt sınır), önceki fark:13-2=11 sonraki fark:13-4:9 sınıf büyüklüğü:7,5-4,5:3 L = mod sınıfının alt sınırı Mod: 4,5+11/(11+9) x 3= 6,15 Örnek 2: 1 ∆1= mod sınıfı frekansı ile Mod L1 xhm ondan bir önceki sınıfın 1 2 frekansları arasındaki mutlak fark ∆2= mod sınıfının frekansı ile ondan bir sonraki sınıfın frekansları arasındaki fark hm= sınıf aralığı, mod sınıfının sınıf büyüklüğü 82 23.7.2017 Selami ÖZCAN İstatistik Örnek 1’in Grafik Metodu ile Çözümü Gruplar=2-4, 5-7, 8-10, 11-13 frekans: 2, 13, 4, 1 =20, L=4,5 (alt sınır), önceki fark:13-2=11 sonraki fark:13-4:9 sınıf büyüklüğü:7,5-4,5:3 Mod: 4,5+11/(11+9) x 3= 6,15 Frekans 15 10 5 1,5 83 4,5 7,5 10,5 13,5 Gruplar Mod:6,15 23.7.2017 Selami ÖZCAN İstatistik Örnek 3 ve 4 Mod değerinin mod sınıfı içinde kaldığına dikkat ediniz. Birden fazla aynı değerde frekans varsa iki yada daha çok gözlem değeri veya sınıf bulunabilir. İlgili frekans serisi sınıflandırılarak , sınıflandırılmış seri ise farklı bir sınıf aralığında yeniden sınıflandırılmalıdır. Örnek 4: frekans Yeniden sınıflandırılır. 10-20 4 10-30 11 20-30 7 30-50 40 30-40 22 50-70 37 40-50 18 70-90 12 50-60 22 Toplam 100 60-70 15 Mod:30+(29/(29+3)) x 20=48,125 L=18, ∆1= 7-4=3 , ∆2= 7-5=2 hm=4 70-80 7 80-90 5 Toplam 100 Örnek 3: Sınıflar Frekans Küm.frekans 10-14 2 2 14-18 4 6 18-22 7 13 22-26 5 18 26-30 3 21 Toplam 21 3 Mod 18 x 4 20,4 3 2 84 23.7.2017 Selami ÖZCAN İstatistik Mod < Medyan < Ortalama Mod Medyan Ortalama Ortalamalar arasındaki ilişki Simetrik Ortalama < Medyan < Mod 0 Sağa çarpık dağılım Sağa eğik X Mod Medyan X 100 0 Sola çarpık dağılım Sola eğik X Mod Medyan Mod Medyan Mod=Medyan= X 85 X > Medyan > Mod 23.7.2017 100 Mod > Medyan > X Selami ÖZCAN İstatistik 23.7.2017 86 Dağılımda Çarpıklık: Negatif Çarpık Dağılım Puanların çoğu dağılımın sağ tarafına yığılmıştır. Sola çarpık: Sınıf başarısı yüksek. Ortalama<Medyan<Mod. Sorular ve test kolaydır. 23.7.2017 87 Dağılımda Çarpıklık: Pozitif Çarpık Dağılım Puanların çoğu dağılımın sol tarafına yığılmıştır. Sağa çarpık: Sınıf başarısı düşük. Mod<Medyan<Ortalama. Sorular ve test zordur. 23.7.2017 88 23.7.2017 89 KANTİLLER KARTİLLER, DESİLLER, PÖRSENTİLLER 90 1. Kartiller: büyüklük sırasına konulmuş bir seriyi 4 eşit parçaya böler.Bir seride 3 kartil bulunur. 2. kartil medyandır. Q1, Q2, Q3 ile gösterilir. Basit ve frekans serisinde kartil: Q3=3x(N+1)/4 Q1=N+1/4 Q2=2x(N+1)/4 Sınıf/gruplandırılmış serilerde kartil: Q1=L+[(N/4)-∑f/fQ1 ] x hm Q2=L+[(2.N/4)-∑f/fQ2 ] x hm Q3=L+[(3.N/4)-∑f/fQ3 ] x hm 2. Desiller =D9, D1 dir. (seriyi 10 eşit parçaya böler) Basit ve frekans serisinde desiller: D3=3x(N+1)/10 D1=N+1/10 D2=2x(N+1)/10 Grup serilerde desiller: D1=L+[(N/10)-∑f/fD1 x hm D2=L+[(2.N/10)-∑f/fD2 x hm D3=L+[(3.N/10)-∑f/fD3 x hm 3. Pörsentiller =D99-D1 dir. (seriyi 100 eşit parçaya böler) Basit ve frekans seride Pörsentiller: P3=3x(N+1)/100 P1=N+1/100 P2=2x(N+1)/100 Grup serilerde pörsentiller: D1=L+[(N/100)-∑f/fP1 x hm P2=L+[(2.N/10)-∑f/fP2 x hm P3=L+[(3.N/100)-∑f/fP3 ] x hm 23.7.2017 Selami ÖZCAN İstatistik 2. Dağılım/Değişkenlik Ölçüleri Dağılım / değişim ölçüleri Parametrik dağılım/değişim ölçüleri 1. Değişim aralığı (Ranj) 2. Kartil aralığı 3. Desil aralığı Parametrik olmayan dağılım/değişim ölçüleri – – – – 91 Ortalama sapma Varyans Standart sapma Değişim katsayısı 23.7.2017 Selami ÖZCAN İstatistik Parametrik olmayan dağılım/değişim ölçüleri 1. 2. 3. 92 Değişim aralığı (Ranj) Kartil aralığı, yarı kartil aralığı Desil aralığı, yarı desil aralığı 23.7.2017 Selami ÖZCAN İstatistik Değişim Aralığı (Ranj):DA En büyük ölçümle en küçük ölçüm arasındaki farktır. gruplandırılmış serilerde en yüksek sayıdan en küçük sayının çıkarılması ile bulunur. DA serinin değişkenliği hakkında zaman kaybetmeden genel bilgi verir. Dezavantajı:serideki bütün birimlerin hesaplamaya girmemesi sadece iki değerle hesaplamanın yapılması, aşırı değerlerin direkt etkisindedir. DA= Xmax-Xmin Örnek: basit seri: X=30,32,35,36,37 y=2,14,20,44,90 DA(x)=37-30=7 DA (y)=90-2=88 Örnek: Frekans serisi x:4,5,7,9 f:1,2,4,3 DA=9-4:5 Örnek: sınıflandırılmış seri: sınırlar:1-3,3-5,5-7,7-9 f=1,2,4,3 DA:9-1:8 93 23.7.2017 Selami ÖZCAN İstatistik Ranj (Değişim Aralığı) Örnek Birinci Dağılım: 59, 59, 59, 60, 61, 61, 61 ise Ranj=? Ranj (DA)= 61-59=2 İkinci Dağılım: 30, 40, 50, 60, 70, 80, 90 ise Ranj=? Ranj (DA)= 90-30=60 Bu iki dağılımda aritmetik ortalama ve medyanlar eşit olmasına karşın ranjları farklıdır. Dağılımın ranjı azaldıkça dağılımdaki puanlar birbirine yaklaşır ya da benzeşir, ranj arttıkça puanlar birbirinden uzaklaşır ya da puanlar arası fark artar. 23.7.2017 94 Kartil (çeyrek sapma) Aralığı Desil (onda bir sapma) Aralığı Pörsentil (yüzde 1 sapma)Aralığı 95 Kartil aralığı 3. kartilden 1. kartil çıkarılarak bulunur. En büyük ve en küçük %25 dikkate alınmadığı için Değişim Aralığına göre uç değerlerden daha az etkilenir. Dezavantajı hesaplamaya bütün değerlerin katılmaması Kartil Aralığı= Q3-Q1 dir. Yarı Kartil Aralığı=(Q3-Q1)/2 (seriyi 4 eşit parçaya böler) Desil Aralığı=D9-D1 dir. Yarı Desil Aralığı=(D9-D1)/2 (seriyi 10 eşit parçaya böler) Pörsentil Aralığı=D99-D1 dir. Yarı Pörsentil Aralığı=(D99-D1)/2 (seriyi 100 eşit parçaya böler) 23.7.2017 Selami ÖZCAN İstatistik Kartil: Çeyrek Sapma Çeyrek sapma, bir dağılımdaki üçüncü çeyrek (75.yüzdelik) ile birinci çeyrek (25.yüzdelik) arasındaki farkın yarısına eşittir. Aritmetik ortalama yerine medyanın kullanıldığı durumlarda kullanılması uygundur. 23.7.2017 96 Aşağıda 20 öğrencinin İngilizce sınavından aldığı notlar küçükten büyüğe doğru sıralanarak verilmiştir. Çeyrek sapmayı hesaplayalım: 15,17,20,21,25,30,33,40,43,47,50,55,57,60,65,70,73,77,80,84 25. yüzdelik için (Y25)= 20(25/100) = 5. puan (25) 75. yüzdelik için (Y75)= 20(75/100) = 15. puan (65) Bu durumda çeyrek sapma (65-25)/2=20 olur. 23.7.2017 97 Baştan % 25. not 25 ve sondan % 75. not 65 olduğuna göre bu notların aritmetik ortalamadan ne kadar saptığını çeyrek sapma yaklaşık olarak vermektedir. 46,05 25 21 ve 65 - 46,05 19 23.7.2017 98 Örnek: Çeyrek Sapma 23.7.2017 Puan Aralığı f Toplamalı Frekans Aralığın Gerçek Sınırı 21,00-25,00 1 1 20,50-25,50 26,00-30,00 1 2 25,50-30,50 31,00-35,00 2 4 30,50-35,50 36,00-40,00 6 10 35,50-40,50 41,00-45,00 6 16 40,50-45,50 46,00-50,00 7 23 45,50-50,50 51,00-55,00 1 24 50,50-55,50 99 100 23.7.2017 100 101 23.7.2017 101 Parametrik dağılım/değişim ölçüleri Paremetrik olmayan dağılım ölçüleri serideki bütün değişkenleri dikkate alarak ölçmesi, fakat paremetrik dağılım ölçülerinde ise serideki rakamların aritmetik ortalamadan sapmalarını dikkate alır. – Ortalama sapma – Varyans – Standart sapma – Değişim katsayısı 102 23.7.2017 Selami ÖZCAN İstatistik Ortalama Sapma 103 Serideki rakamların aritmetik ortalamadan farklarının toplamı sıfırdır. Ortalamadan farkların bir kısmı negatif bir kısmı pozitiftir. Toplarsan sıfır olur. Hesaplama mutlak değerlerin toplamı rakam sayısına bölündüğünde os bulunur. Formül yandaki gibidir. Medyan etrafındaki ortalama sapmanın minimum olmasıdır. Basit seride Frekans serisinde Sınıflandırılmış/gruplandırılmış seride 23.7.2017 xx OS basit n f xx OS f frekans f xx OS f grup Selami ÖZCAN İstatistik Varyans Aritmetik ortalamanın ( x x )2 2 basit seride büyük örnekler icin var yans özeliklerinden biri ∑(xn ͞x)²=minimum olmasıdır. x2 x 2 2 Fark karelerin toplamını ( ) yukarideki nin acilimi n n serideki rakam sayısına böldüğümüzde varyans elde f ( x x) frekans/gr up seride büyük örnekler icin varya ns f edilir. Örnek sayısı büyüdükçe n 2 2 fx fx ile n-1 arasında fark kalmaz. 2 yukarıukarnin acıcılı 2 2 f 104 23.7.2017 f Selami ÖZCAN İstatistik Standart Sapma 2 ( X X ) S n 1 Örnek2: 78,89,56,36,48,92,59,60=S=19.8 Standart Sapma: Ölçümlerin ortalamadan olan farklarının karelerinin ortalamasının kareköküdür. Standart sapma varyansın pozitif kareköküdür. Standart hata: Aritmetik ortalamada oluşan hatanın belirlenmesi için bulunur. Örnek1: basit seri x=1,4,5,7,9,10 ͞x=36/6=6 ( xi x) 2 56 (x-͞x)=1-6,4-6,5-6,7-6,9-6,10-6 = -5,-2,-1,1,3,4= 3,055 n 6 (x-͞x)²=25,4,1,1,9,16=56 ( xi x) 2 n 1 ( xi x ) 2 basitseri n f ( xi x) 2 frekans ve sin iflandiril mis serilerde s tan dart sapma f fx 2 fx fu 2 fu sin if sayisi tek ve kodlanmis serilerde c. f f f f 23.7.2017 Selami ÖZCAN İstatistik x2 x n n 2 2 105 2 Frekans Serilerde Standart Sapma X f x.f x-͞x (x-͞x)² (x-͞x)². f 4 1 4 -3,25 10,5625 10,5625 6 3 18 -1,25 1,5625 4,6825 7 6 42 -0,25 0,0625 0,375 8 4 32 0,75 0,5625 2,25 10 2 16 20 116 2,75 7,5625 15,125 33 Frekans serisinin ortalaması 2 x x . f X=∑x.f / ∑f=116/16=7,25 33 2,0625 1,436140 Frekans serisinin standart sapması f 106 23.7.2017 16 Selami ÖZCAN İstatistik Gruplandırılmış seri(orta noktalar bulunur veya (kodlama metodu) Gruplar f u=kod f. u u² f.u 10-14 6 -2 -12 4 24 15-19 6 -1 -6 1 6 20-24 10 0 0 0 0 25-29 9 1 9 1 9 30-34 Toplam 9 40 2 0 18 9 4 10 36 75 2 fu fu 75 9 5. c 6,75 f 40 40 f 2 107 23.7.2017 2 Selami ÖZCAN İstatistik Standart sapma Bir veri dizisinde standart sapmayı hesaplamak için önce aritmetik ortalama bulunur ve her veriyle aritmetik ortalamanın farkının karesi şeklinde hesaplanarak aşağıdaki formülle dizinin standart sapması hesaplanır. N Sx (X i 1 i X) N 2 21,9 ÇEYREK SAPMA değişim hakkında kaba bir sonuç verir. SS verilerin oluşturduğu dizinin homojenliğiyle ilgili bilgi verir. 23.7.2017 108 23.7.2017 Gruplandırılmış Frekans tablosuyla verilen dizinin standart sapması, aşağıdaki formül ile hesaplanır: N 2 f ( X X ) i i S x i 1 N -1 109 Standart Sapmanın Özellikleri SS, bir veri grubunun ortalaması etrafındaki dağılımını belirlemek amacıyla kullanılır. Negatif değerler almaz. Veri grubundaki tüm değerler aynı ise SS sıfırdır. SS veri grubundaki uç değerlere karşı duyarlı olup tek bir uç değer dahi değerini artırabilir. Yani, dağılımı çarpık hale getirir. 23.7.2017 112 Standart Sapma ve Aritmetik Ortalama Arasındaki İlişki Aritmetik ortalama ile standart Heterojen yapı oluşur ve grup sapmanın arası büyürse, başarısı düşer. Aritmetik ortalama ile standart Homojen yapı oluşur ve grup sapmanın arası küçülürse, başarısı artar. Bir puan dağılımında puanlar arası fark (ranj) büyüdükçe, Standart sapmada büyür. Bir testten elde edilen puanların standart sapması büyüdükçe, Testin güvenirliği artar. 23.7.2017 113 Standart Hata Standart sapmayla ilgili bir kavram da ortalamanın standart hatasıdır. Bir dağılımda standart hata, standart sapmanın örneklem sayısının kareköküne bölünmesiyle hesaplanır. SH 23.7.2017 Sx N 114 Değişim Katsayısı: DK Aynı seri farklı ölçü birimleriyle farklı standart sapmaya sahip olabilir, farklı ölçü birimleriyle hesaplanan iki ayrı serinin mukayesesi de doğru değildir. Bu olumsuzlukları gidermek için değişim katsayısı geliştirilmiştir. Mutlak değişkenlik ölçüleri,seriyi oluşturan gözlem değerlerinin büyüklüklerinin de etkisi altındadır. Mutlak değişkenlik yerine nispi değişim/dağılım esas alınmıştır. Standart sapma aritmetik ortalamanın yüzdesi olarak ifade edilmiştir. DK=(s/ ͞X) x 100 Ortalaması 15, standart sapması 4,76 olan serinin DK ne olur? DK:(4,76/15) x 100=%31,73 x=10,11,13,14,17/65 (͞x=13, ss=2,7386) y=43,48,58,63,73/285 (y=57 ss=11,9373) ssx küçük ssy. DKx=2,7386/13 x 100=%21,066 DKy=11,9373/57 x100=%20,9426 X serisindeki değişkenlik y serisine göre daha fazladır. 115 23.7.2017 Selami ÖZCAN İstatistik BÖLÜNMENİN ŞEKLİNE GÖRE OLUŞAN ÖLÇÜLER Şu ana kadar serilerdeki ortalama ve değişkenliği inceledik, bu yetmez. Bölünme şeklini ortaya koyan ölçülere de ihtiyaç vardır. Seriler: simetrik (X=Med=Mod) veya asimetrik (X>Med>Mod sağa çarpık seri ve X<Med<Mod sola çarpık seri) bölünür. Aritmetik ortalama ile mod veya medyan arasındaki fark pozitif ise sağa çarpık, negatif ise sola çarpık denir. Seriler: normal, sivri ve basık serilerden birine göre de bölünebilir. Bölünme şekline göre oluşan ölçüler, – – – Momentler, Çarpıklık ve Basıklık Bölünme şekline göre oluşan ölçüler, – Momentler, – Çarpıklık ve – Basıklık 117 23.7.2017 Selami ÖZCAN İstatistik MOMENTLER Ortalamalara (kantillere) dayanan asimetri ölçüsü yaklaşık bir değerdir. Asimetriyi daha duyarlı ölçmek için momente dayanan ölçüm yapılması gerekir. Sıfıra (x-0=x ) veya aritmetik ortalamaya (x-x ) göre sapmaların tamamına moment denir. Bir seride sıfır (aritmetik ortalama) etrafındaki r. Momente (µr.) Momenti denir. Mr=£Xʽ/n (0 için basit serinin momenti) Mr=£(X-X )ʽ/n (X için basit serinin momenti) µr=£fxʽ/£f (0 için frekans ve gruplandırılmış serinin momenti) µr= £f(x-xort)ʽ/£f (X için frekans ve gruplandırılmış serinin momenti) Sıfır etrafındaki 1.Moment aritmetik ortalamaya eşit, 2.momentin karekökü kareli ortalamaya eşittir. M1=0, M2=S²(varyans) µ2=M2-M²1 µ 3= M3-3M1M2+2M³1 µ 4= M4-4M1M3+6M²1M2-3M‘1 i ort ort ort ort Örnek: x=10,12,18,20 serinin(0 ve xort göre) 2. ve 3. momentini ve iki moment türü arasındaki ilişkiyi bulunuz? Çözüm: X=10, 12, 18, 20 =60/4=15 X²=100,144,324,400=968 M2=968/4=242 X3=1000,1728,5832,8000=16560 M3=16560/4=4140 X-Xort=10-15,12-15,18-15,20-15=-5,3,3,5 (X-Xort)²=25, 9, 9, 25=68 M2=68/4=17 (X-Xort)3=-125, -27, 27, 125=0 M3=0/4=0 µ2=M2-M²1 =242-15²=17 µ 3= M3-3M1M2+2M³1 =41403(15).(242)+2.(15)³=0 µ 4= M4-4M1M3+6M²1M2-3M‘1 Gruplandırılmış Serinin Moment hesabı Örnek: Gruplar=1-3, 3-5, 5-7, 7-9 f=1, 2, 4, 3=10 serinin (0 ve xort göre) 2. ve 3. momentini ve iki moment türü arasındaki ilişkiyi bulunuz? Çözüm: önce sınıf orta noktaları bulunur. X=2, 4, 6, 8 f=1, 2, 4, 3 =10 Xort=58/10=5,8 X²=4,16,36,64= X³=8,64,216,512 f.X=2,8,24,24=58 f.X²=4,32,144,192=372 f.X³=8,128,864,1536=2536 (X-Xort)=(2-5,8)=-3,8 (4-5,8)=-1,8 (6-5,8)=0,2 (85,8)=2,2 (X-Xort)²=14,44 3,24 0,04 4,84 (X-Xort)³= -54,872 -5,832 0,008 10,648 f.(X-Xort)²=14,44 6,48 0,16 14,52 =35,60 f.(X-Xort)³=-54,872 -11,664 0,032 31,944 = - 34,560 µ2=M2-M²1 =37,2-(5,8)²=3,56 µ3= M3-3M1M2+2M³1 =253,6-3(5,8).(37,2)+2.(5,8)³=-3,456 ÇARPIKLIK (Asimetri) Bir serinin simetriden ayrılmasıdır. Rakamların dağılımı her zaman simetrik olmaz. Dağılım sağa ve sola çarpık olabilir. Serideki asimetriyi çarpıklık katsayısı ile ölçeriz. Çarpıklık katsayısı 0’a eşit olduğunda dağılım simetriktir. Çarpıklık katsayısı negatif olduğunda sola çarpık, pozitif olduğunda sağa çarpık olur. Çarpıklık katsayıları 3 e ayrılır. Pearson Çarpıklık Katsayısı Kartil Çarpklık Katsayısı Moment Çarpıklık Katsayısı Pearson Çarpıklık Katsayısı Pearson ortalamalar arasındaki şu ilişkiyi fark etmiştir. X -Mod≈3(X Medyan) ort ort Her iki tarafı standart sapmaya bölerek bu ifadeleri ölçü biriminden bağımsız hale getirmiştir. Çarpıklık=3(Xort-Medyan) / standart sapma Çarpıklık=(Xort-Mod) / standart sapma Not: bu katsayı sıfıra eşit ise dağılım simetrik, büyükse sağa çarpık, küçükse sola çarpıktır. X=1-3, 3-5, 5-7, 7-9 f=1, 2, 4, 3 kf=1, 3, 7, 10 Medyana dayalı çarpıklık için aritmetik ortalama ve standart sapmayı bilmek gerekir. Aritmetik ortalama:5,8 2.Moment ise 3,56 (varyanstır) Standart sapma=√3,56≈1,89 N=10 10/2=5. değer medyandır. Medyan 5-7 sınıfı Yaklaşık medyan değeri=5+[(5-3)/4].2=6 dır. Medyana dayalı çarpıklık= 3(xort-medyan)/standart sapma Medyana dayalı çarpıklık= 3(5,8-6)/1,89 ≈-0,32 Mod=L1+[∆1/ (∆1+ ∆2)].c =5+[2/(2+1)]2=6,33 Moda dayalı çarpıklık= =(Xort-Mod) / standart sapma= Moda dayalı çarpıklık 5,8-6,33 / 1,89= -0,28 Seri sola çarpıktır. Kartil Çarpıklık Katsayısı Herhangi bir dağılıma ait kartil değerleriyle de asimetrik dağılım olup olmadığına karar verilebilir. Kç=(K3-K2)-(K2-K1) / K3-K1 Kç=(K3-2K2)+K1 / K3-K1 Örnek: (pearsen örneğinin devamı) medyan 6, medyan 2. kartile eşittir.1. ve 3. kartili tespit etmek gerekir. Sonra çarpıklığa bakılır. K1 için N/4 10/4=2,5 değer 1.kartildir. Kümülatif frekansı 3 olan 3-5 sınıfı 1.kartil sınıfıdır. K3 için 3N/4=3x10/4=7,5 değerdir. Sınıfı 7-9 sınıfıdır. K1=3+ [(2,5-1)/2].2=4,5 K3=7+[(7,5-7)/3].2=7,33 Buna göre Kartil çarpıklık katsayısı şu şekilde bulunur. Kç=(K3-2K2)+K1 / K3-K1 Kç=(7,33-2x6+4,5) / (7,33-4,5) =0,06 Negatif çıktığı için seri sola çarpık demektir. Moment Çarpıklık Katsayısı Örnek1: 2.moment 17 ve 3. moment 0 dır. Ortalama etrafındaki 3. momentin standart sapmanın 3. kuvvetine bölünmesiyle elde edilir. α3=µ3 /s³ Simetrik dağılımlarda moment çarpıklık katsayısı 0 dır. α3>0 ise sağa çarpık, α3<0 ise sola çarpıktır. Aritmetik ortalama etrafındaki 2. moment, varyans ve bunun karekökü de standart sapmaya eşittir. Standart sapma=4,12 Bu dağılıma ait moment çarpıklık katsayısı=0/(4,12)³=0 Sonuç, katsayı 0 olduğu için dağılım simetriktir. Örnek 2= aritmetik ortalama etrafındaki 2. moment 3,56 (varyans)(standart sapma varyansın karekökü yani 1,89) ve 3.moment -3,456 ise moment çarpıklık katsayısı nedir? α3=µ3 /s³=-3,456/(1,89)³=-0,51 (sola çarpıktır.) BASIKLIK 4 4 s 4 (momente dayanan basıklık ölçüsü) Bir dağılımın diklik derecesinin ölçüsüdür. Moment basıklık katsayısı:ortalama etrafındaki 4. momentin standart sapmanın 4.kuvvetine bölünmesiyle elde edilir. ά =3 olursa yükseklik normal ά ≥3 dağılım dik (serideki rakamların merkezi eğilimin yüksek olduğunu gösterir) ά ≤3 dağılım basıktır(dağılımda değişkenlik fazla). S4=(µ2)² Ör: bir önceki örnekte aritmetik ortalama etrafındaki 2. moment µ2=17 ve µ2=3,56 olarak hesaplanmıştı önce aritmetik ortalama etrafındaki 4. momenti bulunuz. Sonra moment basıklık katsayısını bulunuz. Örnek1: X=10,12,18,20 =60/4=15 (basit) Çözüm: (X-Xort)=-5, -3, 3, 5 (X-Xort)4=625, 81, 81, 625=1412 ά = µ4/S4 =>µ4 =1412/4=353 S4=(17)²=144 ά =353/144=1,22 < 3 ten küçük olduğu için dağılım 4 4 normale göre basıktır. 4 4 4 Örnek2: X=2,4,6,8 f=1,2,4,3 =10 (frekans) Çözüm: (X-Xort)= -3,8 -1,8 0,2 2,2 (X-Xort)4=208,5136 10,4976 0,0016 23,4256 f . (X-Xort)4=208,5136 20,9952 0,0064 70,2768 =299,7920 µ4 =299,792/10=29,9792 S4=(3,56)²=12,6736 ά =29,9792/12,6736=2,37 < 3 olduğundan seri 4 normale göre basıktır. Yani dağılımın değişkenliği normal dağılımın değişkenliğine göre fazladır. 4 BASIKLIK 4 s 4 Bir dağılımın diklik derecesinin ölçüsüdür. Moment basıklık katsayısı:ortalama etrafındaki 4. momentin standart sapmanın 4.kuvvetine bölünmesiyle elde edilir.ά =3 olursa yükseklik normal ά ≥3 dağılım dik (serideki rakamların merkezi eğilimin yüksek olduğunu gösterir) ά ≤3 dağılım basıktır(dağılımda değişkenlik fazla). Ör: 4 4 4 125 23.7.2017 Selami ÖZCAN İstatistik Çarpıklık Katsayısı Çarpıklık katsayısının sıfırdan küçük olması çarpıklığın negatif (sola), sıfırdan büyük olması ise pozitif (sağa) olduğunu gösterir. Çarpıklık katsayısının sıfıra eşit olması, dağılımın simetrik olduğunu gösterir. 23.7.2017 126 Dağılımın Basıklığı DÖRDÜNCÜ BÖLÜM 128 İHTİMAL HESABI 23.7.2017 Selami ÖZCAN İstatistik 4. BÖLÜM: Sunum planı 129 Deney, sonuç ve örneklem uzay Olasılık (ihtimal) Olasılık(ihtimal) Hesaplama Sayma ve Ayrılık olayları Çarpma Kuralı Toplama Kuralı 23.7.2017 Beklenen değer (matematik ümit) Bazı kurallar Selami ÖZCAN İstatistik GİRİŞ 130 Meteroroloji uzmanı: %80 ihtimalle yağmur yağacağını Sağlık uzmanı sigara içenlerin içmeyenlere oranla daha çabuk kansere yakalanacağını İhtimal tahlil edici, çıkarımsal istatistiktir. Satış tahminleri 23.7.2017 Selami ÖZCAN İstatistik DENEY, SONUÇ VE ÖRENLEM UZAY 131 Deney: pek çok gözlemden sadece bir tanesinin gerçekleşmesi sürecine deney denir. Deneyin sonuçları: bu gözlemlere deneyin sonuçları denir. Örneklem uzay: bu sonuçların tümüne ise deneyin örneklem uzayı denir. Örneklem uzay S ile gösterilir. s= (hatalı, hatasız) Örneklem noktaları: örneklem uzayın elemanlarına örneklem noktaları denir. Deney Sonuç Örneklem uzay Vida inceleme Hatalı / hatasız S=(hatalı, hatasız) Paranın bir kez atılması Yazı tura S=(yazı, tura) Paranın iki kez atılması YY,YT,TT, TY S=(YY,YT,TT,TY) Zarın bir kez atılması 1,2,3,4,5,6 S=(1,2,3,4,5,6) Doğacak bebeğin cinsiyeti Erkek, kız S=(kız, erkek) Öğrencinin yarıyıl sonuçu Başarılı, başarısız S=(başarılı, başarısız) 23.7.2017 Selami ÖZCAN İstatistik Örneklem Uzay/ örnek uzayı s=(Y,T) Venn Şeması: bir deneyin tüm muhtemel sonuçlarının kare, dikdörtgen veya daire ile gösterilmesine denir. Örnek: paranın bir kez atılması deneyi s=(Y., T.,) venn şeması ile gösterilmesi Ağaç diyagramı: her bir sonucun ağacın bir dalı ile ifade edilmesidir. Örnek: paranın bir kez atılması deneyi s=(Y., T.,) ağaç diyagramı ile gösterilmesi Nihai Sonuçlar Yazı Y Y. Tura T. 132 23.7.2017 T Selami ÖZCAN İstatistik BASİT VE BİLEŞİK OLAY Olay: bir deneyin bir veya daha çok sonucundan Örnek1: bir işyerinde çalışan personel arasında oluşur. rastgele iki tanesinin seçildiği ve cinsiyetlerinin(erkek, kadın) kaydedildiği Olay basit (elementer) ve bileşik (katışık) olay düşünülsün bu A olayının en çok bir erkeğin şeklinde gerçekleşmektedir. seçilmiş olduğunu venn şemasında gösteriniz? Basit olay: herhangi bir deneyin nihai sonuçlarına Bileşik olay: iki durum: istenen en çok bir erkek denir. Basit olay sadece ve sadece bir tane olması: EK, KE, KK, ikinci durum istenmeyen: EE sonuç içermekte Ei biçiminde gösterilir. Örnek2: bir grup insan kainatın yaratıcısına inanıyor Örnek: bir işyerinde çalışan personel arasında ve yaratıcıyı kabul ediyor, geri kalanı rastgele iki tanesinin seçildiği ve inanmamakta ve karşı çıkmaktadır. Bu gruptan cinsiyetlerinin(erkek, kadın) kaydedildiği rastgele iki kişi seçilmiş ve kainatın yaratıcısı düşünülsün bu deneyin tüm sonuçları: E1(EE), hakkında görüşleri sorulmuş. Kaç farklı sonuç söz E2(KE), E3(EK), E4(KK) bu dört durumdan konusudur. En çok bir kişinin inanmıyor olma her biri basit olaydır. durumu nedir. Yarın yağmur yağması ihtimali, tek sonuç Sınıfta gözlüklü öğrenci olması ihtimali tek sonuç İ:inanıyor, K:karşı çıkıyor/inanmıyor Bileşik (katışık) olay: iki veya daha fazla sonucun İİ: her ikisi de inanıyor. KK: her ikisi de inanmıyor. İK: biri inanıyor, biri inanmıyor.Kİ:biri inanmıyor, biri yani birden çok sonuçtan oluşmaktadır. A1, inanıyor. 4 farklı durum söz konusudur, birden çok A2, A3,… veya B1, B2, B3, B4, B5,….Bn sonuç var. Bileşik olaydır. şeklinde gösterilir. Birarada meydana gelen,birbirini engelleyen olaylr İİ, İK, Kİ üç durum söz konusudur. 133 23.7.2017 Selami ÖZCAN İstatistik Basit ve bileşik olay örneklerinin Venn şeması ve Ağaç diyagramı gösterimi A EE. EK. İİ İ KE. KK. İ K İK İ Kİ K KK K İİ. Kİ. İK. A KK. A∩B B AUB 134 23.7.2017 Selami ÖZCAN İstatistik İhtimal Hesaplama İhtimal/Olasılık (Probability): bir olayın meydana gelme sansının sayısal ölçüsüdür. N birim ihtiva eden ana kütleden belli bir x özelliğini taşıyan n tane birim varsa bu ana kütleden rastgele bir birim alındığında bu birimin x özelliğini taşıması durumudur. P(x)=n/N şeklinde hesaplanır. Ei ile basit olayın ihtimali (P(Ei)dir. A ile bileşik olayı ihtimalı P(A) ile gösterilir. İhtimal (Olasılık) İki Temel Özelliği 1. Bir olayı meydana gelmesi ihtimali 0 ile 1 arasında değişir. Olay ister basit, ister bileşik olsun ihtimali sıfırdan küçük birden büyük olamaz. 0≤P(Ei) ≤1 0≤P(A) ≤1 P(x)=n/N=0 ise söz konusu olayın meydana gelmesi (imkansız=olanaksız) mümkün değildir. 1 olması olayın kesinlikle (yani %100) (mümkün=kesin) meydana geleceğini ifade eder.P(İ)=0 imkansız P(M)=1 mümkün olay içindir. Sıfıra yakın ihtimal zayıf bire yakın ihtimal kuvvetli 2. Bir olayın mümkün bütün hallerinin ihtimal toplamı 1 e eşittir. ∑P(Ei)= p(E1)+p(E2)+p(E3)+p(E4) ….=1 Bir olayın meydana gelme (p) ve gelmeme(q) ihtimalleri toplamı1 dir. p+q=1 bu tür ihtimallere birbirini tamamlayan ihtimaller denir. 1-p=q Paranın bir kez atlılması: P(Y)+P(T)=1 (belki dik gelebilir) iki kez atılması: P(YY)+P(YT)+P(TY)+P(TT)=1 Bir maç sonucu: P1(galibiyet)+P2(mağlubiyet)+P3(beraberlik)=1 135 23.7.2017 Selami ÖZCAN İstatistik İhtimale 3 yaklaşım (klasik, nispi, öznel) Sonuçların ortaya çıkma ihtimalleri eşit ise klasik yaklaşım Bir deneydeki basit olayın ihtimali 1 in tüm sonuç sayısına bölünmesine eşittir. P(Ei)=1/toplam sonuç sayısı P(A)= A olayında içerilen sonuç sayısı / toplam sonuç sayısı Paranın bir kez atılmasında yazı ihtimali P(Y):1/2=0,5 tura ihtimali P(T):1/2:0,5 Zarın bir kez atılmasında çift sayı gelmesi ihtimali P(A)= 2,4,6/1,2,3,4,5,6=3/6=0,5 Bir derneğin 100 üyesi(60 erkek, 40 kadın) var. Dernek başkanının kadın olma ihtimali nedir? 40/100=0,4 Öznel yaklaşım: ne sonuçlar eşit, ne de veri üretmek için tekrarlanabilen deneylerle karşılaşılabilir. Bir olay için sübjektif değer yargısına, tecrübe, bilgi ve düşünceye dayalı ihtimaldir. 13 6 23.7.2017 Göreli (Nispi) sıklık yaklaşımı: ortaya çıkma ihtimalleri eşit değil, mesela; rastgele seçilen bir ailenin yıllık geliri 10.000 TL den büyük olma ihtimali, civalı bir zarın atılması durumu, hileli paranın atılması durumu, 80 yaşındaki birinin bir sene sonra ölme ihtimali Yaklaşık ihtimal için göreli sıklık: bir deney n kez tekrarlanmış ve f kez bir A olayı gözlenmiş ise P(A)=f/n dir. Ör: rastgele 500 ürün seçilmiş bunlardan 10 tanesinin hatalı olma ihtimali nedir? 10/500=0,02 ilk üretilen ürünün hatalı olması, hatasız olma ihtimali ise:0,98 yaklaşık ihtimal söz konusu, gerçek ihtimal değil. Deney sonsuz(çok) kez tekrarlanırsa gerçek ihtimale yaklaşır.Buna Büyük sayılar Yasası denir. Ör: Ankara’dan rastgele seçilmiş bir ailenin ev sahibi olma ihtimali nedir? Ankara’da ikamet edenlerin ne kadarı ev sahibi bilinmiyor. Eşit değil Rastgele 1000 aile seçiliyor, 670 ev sahibi 330 değil P(A)=f/n 670/1000=0,670 Selami ÖZCAN İstatistik Sayma Kuralı 137 Sonuç sayısı az iken listelemekte sorun yok idi, fakat çok sayıda sonucu listelemek zor. Çok sayıda sonuç için sayma kuralı geçerlidir. Aynı anda vuku bulmaları imkansız olan birbirinden farklı k adet olay n defa tekrarlanırsa kn örnek: bir para 10 kez atılıyor sonuç: 2x2x2x2x2x2x2x2x2x2= 210 =1024 İlk denemede k1, 2. denemede k2, n. Denmede kn dir. k1 x k2 x k3x..kn ör. 4 çeşit salata, 10 çeşit çorba, 3 çeşit meşrubat ve 6 çeşit tatlı var. Mümkün sonuç:4x10x3x6=720 Ör. bir deneyde ilk aşamada r tane, 2. aşamada n tane, 3. aşamada k tane sonuç olmak üzere 3 aşama bulunuyorsa bu deneyin toplam sonuç sayısı: r.n.k dır. Sonuç sayısının 3 ten az veya çok olması sayma kuralı için fark etmez. Bir para üç kez atılıyor. Her atılmada 2 durum(Y,T) vardır. 2x2x2=8 sonuç var. yyy, yyt, yty, ytt, tyy, tyt, tty, ttt Bir otomobil fabrikası 2 durum (sabit ve değişken faiz oranları) ile 36, 48 ve 60 ay vade yapmaktadır. Kaç farklı satış olur?2x3=6 sonuç Süper ligte 16 maç yapılmakta her maçın 3 durumu (galibiyet, mağlubiyet, beraberlik) söz konusu her takım için toplam sonuç sayısı nedir? 3x3x3x3x3x3x3x3x3x3x3x3x3x3x3x3= 316 = 43.046.721 23.7.2017 Selami ÖZCAN İstatistik Bileşen (Marjinal) ve Şartlı (bileşik) İhtimaller Onaylıyor (A) Onaylamıyor (B) Toplam Erkek (E) 15 45 60 Kadın (K) 4 36 40 Toplam 19 81 100 Cinsiyet Herhangi bir başka olay dikkate alınmaksızın sadece bir olaya ilişkin ihtimale Bileşen (basit) ihtimal denir Bir olayın oluştuğunun bilinmesi durumunda diğer olayın meydana gelme ihtimaline şartlı (bileşik) ihtimal denir. Örnek: Çalışanların cevaplarına ilişkin iki yönlü sınıflama: 100 kişiye üst seviye yöneticilere çok yüksek ücret ödenmesi sorulmuş erkek (60) 15 onaylıyor 45 onaylamıyor; kadın (40) 4 onaylıyor, 36 onaylamıyor. P(E)=erkeklerin sayısı/tüm çalışanların sayısı=60/100=0,6 P(K)=kadınların sayısı/tüm çalışanların sayısı=40/100=0,4 P(A)=19/100=0,19 P(B)=81/100=0,81 Şartlı (Bileşik) ihtimalli iki yönlü sınıflama P(EA)=ihtimali hesaplanacak olay/gerçekleşmiş olay 15/60=0,25 (seçilen kişinin yüksek ücreti onaylayan ve erkek olma ihtimali 0,25 tir. Erkek onaylıyor Onaylıyor Verilen olay Onaylamıyor 138 Kadın onaylıyor 15/19 4/19 Erkek onaylamıyor 45/81 Kadın onaylamıyor 36/81 23.7.2017 Selami ÖZCAN İstatistik Ayrık Olay, Ayrık Olmayan Olay Birlikte ortaya çıkmayan olaylara denir. Birlikte olamayan olaylara karşılıklı ayrık olaylar denir. Bu tür olayların ortak sonuçları bulunmamaktadır. Şayet iki ve daha fazla olay ayrık ise deneyin her tekrarında bu olaylardan en çok bir tanesi ortaya çıkmaktadır. Bir olayın ortaya çıkması, diğer olay ya da olayların ortaya çıkmasını dışta tutma. İki ayrık olayların ihtimalleri veya varsa olayların ihtimali toplanır. Deneyin herhangi bir tekrarında ortaya çıkacak sadece bir sonuç olduğu için nihai sonuçlar her zaman ayrıktır. Örnek:Zarın bir kez atılmasında a=çift b=tek c=5 ten küçük olması ihtimali=1,2,3,4 sayı 4/6= 0, 66 a ve b olayları ayrık fakat a ve c ayrık olmayan P(a, b)= 3/6 +3/6 =1(ayrık) P (a, c)=2,4 yani 2/6 ayrık değil Ör: hilesiz bir zar atıldığında 1 veya 5 gelme ihtimali P (1 veya 5)=1/6 +1/6=2/6=1/3 Ör: 8 kırmızı,5 sarı, 4 beyaz, 2 yeşil çekilen topun sarı veya beyaz olma ihtimali? İlk çekilen geri konuyor. 5/19+4/19=9/19=0,47 b 1 3 5 139 a 2 a 1. 2. 6. c 4 6 5. 3. 4. 23.7.2017 Selami ÖZCAN İstatistik Bağımlı/Bağımsız Olay Bağımsız Olay: şayet bir olayın ortaya çıkması öteki olayın ortaya çıkma ihtimalini etkilemiyorsa bu iki olaya bağımsız olaylar denir. P(A/B)=P(A) veya P(B/A)=P(B) şartı yerine getirilmelidir. Bağımlı olaylar: bir olayın ortaya çıkması, diğer olayın ortaya çıkma ihtimalini etkiliyorsa bu olaya bağımsız olmayan veya bağımlı olay P(A/B) ≠ P(A) veya P(B/A) ≠ P(B) Örnek: 100 kaset (15 i bozuk), 60 ı 1.makinede (9 u bozuk), 40 ı 2.makinede (6 sı bozuk) üretilmiştir. Rastgele seçilen bir kasetin bozuk olma ihtimali nedir? D:rastgele seçilen kasetin bozuk olma iht. A:bu kasetin 1. makinede üretilmiş olma iht. P(D)=15/100=0,15 P(D/A)=9/60= 0,15 eşit çıktı bu iki olay (D ve A) bağımsız olaydır. Ayrık olaylar her zaman bağımlıdır. Bağımlı olaylar her zaman ayrık olmayabilir. 140 23.7.2017 Selami ÖZCAN İstatistik S A ͞A TAMAMLAYICI OLAY İki ayrık olayın bir deneyin tüm sonuçlarını içeriyorsa bu iki olay birbirinin tamamlayıcısıdır. Tamamlayıcı olaylar her zaman ayrık olaylardır. P(A) + P(͞A) =1 dir. Örnek: 5 makinenin 2si bozuk,rastgele seçilenin bozuk olma ihtimali nedir? A:seçilen makine bozuk, ͞A:seçilen makine sağlam P(A)=2/5:0,40 P(͞A):3/5:0,60 Örnek: zarın bir kez atılması olayında 4’ten büyük çıkma (5,6) ihtimali nedir? P(A)=2/6=0,33P(͞A)=4/6=0,67 veya 1-0,33=0,67 141 23.7.2017 Selami ÖZCAN İstatistik A B OLAYLARIN ARA KESİTİ ve ÇARPMA KURALI Çarpma kuralı: bileşik ihtimal AnB veya AB P(A ve B)=P(A) x P(B) İki olay – – 142 1.olayın 2.olayın Tamam Red Toplam Erkek 7 20 27 Kadın 4 9 13 Toplam 11 29 40 P(E) ve P(T) P(EveT)=P(E) x P(T/E) (27/40)x(7/27)=7/40=0,175 Erkek ve tamam bileşen ihtimali Ör: 20 kaset 4 ü bozuk, 2 tane seçiliyor seçilen 2 şartlı ihtimali kasetinde bozuk olma ihtimali (iadesiz çekiliş) S1: ilk seçilen kasetin sağlam olma iht.16/20 B1: ilk seçilen kasetin bozuk olma iht. 4/20 S2: ikinci seçilen kasetin sağlam olma iht.15/19 B2: ikinci seçilen kasetin bozuk olma iht.3/19 P(B1 ve B2)=P(B1) x P(B2/B1)=4/20 x 3/19=0,032 23.7.2017 Selami ÖZCAN İstatistik BAĞIMSIZ OLAYLAR ÇARPMA KURALI 143 A ve B gibi bağımsız 2 olayın bileşik ihtimali P(A ve B)= P(A) x P(B) Örnek. 2 adet yangın tüpü var herhangi birinin çalışmama ihtimali 0,02 yangın anında her ikisinin de çalışmama ihtimali nedir? P(1 ve 2)= P(1) x P(2) = 0,02x0,02=0,004 23.7.2017 Ayrık olayların bileşik ihtimali İki ayrık olayın bileşik ihtimali her zaman 0 dır.P(A ve B)=0 Örnek: iş başvurusu kabul ve red, kabul ve reddin bileşik ihtimali 0 dır. Selami ÖZCAN İstatistik A B AuB P(A veya B)=P(A)+P(B)-P(AveB) OLAYLARIN BİLEŞİMİ VE TOPLAMA KURALI Örnek: Erkek 45 kabul, 15 Ayrık olaylarda toplama kuralı red, 10 çekimser; Kadın 80 P(A veya B)=P(A) + P(B) kabul 110 red, 30 Toplama kuralı (yandaki çekimserdir. Erkek ve red örneğe göre) olma ihtimali: 70/300:0,233 P (red veya çekimser) olma 125/300:0,416 P(E/R)= ihtimali nedir? 0,233x0,214=0,04499 P(E ve R):P(E)+P(R)-P(E/R) 125/300+40/300=0,416+0,133 0,233 + 0,416 – 0,04499=0,6 =0,563 144 23.7.2017 Selami ÖZCAN İstatistik 5. BÖLÜM: Kesikli Rassal Değişkenler Kesikli İhtimal Dağılımları Rassal Değişken: bir deney/gözlemin şansa bağlı sonucunda bir değişkenin aldığı değere (ihtimal ve istatistikte) rassal değişken adı verilir. Kesikli Rassal Değişken: yalnız belirli tamsayı değerleri alabilen, birbirini izleyen değerler arasında belirli boşluklar (sayımla elde edilen değerler) varsa kesikli rassal değişken sayılabilir. Ör.Satılan otomobil sayısı, bilet sayısı, izleyici sayısı, elbise sayısı, çocuk sayısı vb. Sürekli Rassal Değişken: ölçüm/tartımla elde edilen değerler, iki değer arasına sonsuz sayıda değer sıkıştırılabilen değişken sürekli rassal değişkendir. Ör. Boy uzunluğu, bir sorunun çözülme süresi, ağırlık, bir evin değeri(fiyatı) vb. Kesikli rassal değişkenin ihtimal dağılımına örnek Oto sayısı:0,1,2,3,4 Frekans(sıklık):30,470,850,490,160=2000 Nisbi frekans: 0,015;0,235;0,425;0,245;0,080=1 Kümülatif nisbi frekans:0,015;0,25;0,675;0,92;1 İhtimal dağılımı P(X):0,015;0,235;0,425;0,245;0,080=1 P(x) değerleri , X değerlerinin ihtimal dağılımını oluşturur P(2)=0,425 tir. 0≤P(X)≤1 ve ∑P(X)=1 0, 425 0,5 0,4 0,3 0,2 0,1 0,0 23.7.2017 0,080 0,015 0 145 0,245 0,235 1 2 3 Selami ÖZCAN İstatistik 4 X Kesikli bir Değişkenin Ortalaması ve Standart Sapması Kesikli Değişkenin Ortalaması Kesikli Değişkenin Standart Sapması Beklenen Değer (Matematik Ümit) Ó=Standart sapma ss’nın büyük olması x değerlerinin E(x)=µ=∑x P(X)= n x P(X) ortalama etrafında geniş bir aralıkta değerler aldığını, SS küçük olması dar aralıkta dağıldığını gösterir. X kesikli değişken, n adet denemede X1 olayı P1 ihtimalle, Xn olayı Pn Gözlenen değerlerin ortalamaya yakın dağıldığını ihtimalle meydana geliyorsa X1 in gösterir beklenen değeri E(x=1)=n.P1 İstatistiksel değerlendirmelerde standart sapmanın karesi Ör:3 er birimlik 1000 paket mal satın alınarak bulunan ve sigma kare ile varyans değeri alınmakta kusur sayılarına ilişkin hesaplanır ihtimal tablosu aşağıda beklenen değeri bulunuz Ör: x arızalı parça, 400 parça sevkiyatın ihtimal dağılımı E(x=0)=n.P0=0x0,512=0 tabloda var. Ortalama ve standart sapmayı bulunuz? E(x=1)=n.P1=1x0,384=0,384 Yorum: 400 parça sevkiyatın 1,2 standart sapma değeri ile E(x=2)=n.P2=2x0,096=0,192 2,5 tanesi arızalıdır. E(x=3)=n.P3=3x0,008=0,024 µ=∑x P(X)=0,6 X P(X) X 0 1 2 3 Top 0,512 0,384 0,096 0,008 1 0 1 2 3 4 5 Top. P(X) 0,02 0,20 0,30 0,30 0,10 0,08 1 X P(X)=µ 0,00 0,20 0,60 0,90 0,40 0,40 2,50 0 1 4 9 16 25 55 0,00 0,20 1,20 2,70 1,60 2,00 7,70 X2 X 2 P(X)=sigma 146 23.7.2017 x P( x) 2 2 (7,70) (2,5) 2 1,20 Selami ÖZCAN İstatistik Kesikli Dağılımın Beklenen Ümit ve Varyansı Var ( x) E ( x 2 ) [ E ( x)]2 Var ( x ) x 2 i tüm x Örnek:Bir zar atılıyor. Anlaşmaya göre Ali P ( xi ) x P ( x ) i i tüm x Örnek: Bir kitaptaki bir sayfadaki yanlış sayısı ile ilgili X’in olasılık fonksiyonu şöyledir: X= x f(x) 1 1/6 P(x=0)=0.81 hiç yanlış olmaması 2 1/6 P(x=1)=0.17 bir yanlış olması 3 1/6 P(x=2)=0.02 iki yanlış olması 4 1/6 5 1/6 6 1/6 Sayfa başına ortalama yanlış sayısını bulunuz. E( x) xi .Pi 0.(0.81) 1.(0.17) 2.(0.02) 0.21 Sayfa başı ortalama 0.21 yanlış bulunur. 147 babasından her atışta kaç gelirse o kadar TL para alacaktır. Atış başına Ali nin beklediği parayı bulunuz. 2 23.7.2017 E ( x) 1.1/ 6 2.1/ 6 ... 6.1/ 6 3.50 Ali’nin atış başına ortalama kazancı 1 Selami ÖZCAN İstatistik n x veya Cn şeklinde gösterilir . x Faktöriyeller ve Kombinasyonlar Faktöriyeller ! 1’e kadar tüm pozitif sayıların çarpımından oluşur. Kural 1!=1, 0!=1 Sıra önemli olduğunda n adet olay n!=n(n-1) ör.6 kitap 6!=6x5x4x3x2x1=720 Sıra önemli olduğunda n adet olaydan x adeti n!/(n-x)! (permutasyon) 6 kitap 4lü şekilde kaç farklı şekilde dizilir. 6!/(6-4)! =360 148 23.7.2017 Kombinasyonlar (C) Sıra önemli olmadığında n adet olaydan x adedinin seçilme yollarının sayısını vermektedir. n=toplam eleman sayısını x= her seferinde seçilecek eleman sayısı Not:n değeri x ten büyük en fazla eşit olmalı n! n x x!(n x)! Örnek. 6!/4! (6-4)! =15 Ör. 20 öğretim üyesinden 5 tanesi rastgele proje için seçilecek, kaç farklı seçim olur 20!/5! (20-5)! =15.504 Selami ÖZCAN İstatistik ÖNEMLİ BAZI KESİKLİ DAĞILIMLAR 149 Üniform Dağılımı Bernoulli Dağılımı Binom Dağılımı-Poisson a Yaklaşımı Poisson Dağılımı-Binom a yaklaşımı Geometrik Dağılım Hipergeometrik Dağılım Pascal (Negatif Binom) Dağılımı 23.7.2017 Selami ÖZCAN İstatistik 1. Üniform Dağılımı Kesikli bir şans değişkeni tanımlı olduğu tüm noktalarda eşit olasılık değerine sahip ise bir başka ifadeyle tanımlı olduğu değerlerin hepsinde olasılık fonksiyonun aldığı değer sabit ise bu kesikli şans değişkeni üniform dağılımına uygundur. Üniform dağılımı gösteren bir şans değişkeni k farklı noktada tanımlı ise olasılık dağılımı; 1 P(X x ) k 0 şeklinde ifade edilir. 150 x 1,2,3...., k d.d Üniform Dağılımının Beklenen Değer ve Varyansı 1 1 k (k 1) k 1 E ( x) x P( x ) x k k 2 2 k x 1 k i i i x 1 Ex = Var ( x ) E x 1 k 1 x k 2 x 1 n 2 151 2 2 2 (k 1)(k 1) Var ( x) 12 1 k (k 1)( 2k 1) (k 1) 2 k 6 4 Örnek: Hilesiz bir zar atıldığında X şans değişkeni ortaya çıkabilecek farklı durum sayısını ifade ettiğine göre X’in olasılık dağılımını oluşturarak beklenen değerini ve varyansını bulunuz. Çözüm S = { x / 1,2,3,4,5,6 } Ortaya çıkan olaylar eşit olasılıklı olaylar x şans değişkeninin dağılımı k = 6 olan kesikli üniform dağılımına uygundur. 1 P( X x) 6 0 x 1,2,3,4,5,6 d .d (6 1)(6 1) 35 6 1 E ( x) 3,5 Var ( x) 12 12 2 152 2. BERNOULLİ DAĞILIMI Bir şans değişkeninin bernoulli dağılımı göstermesi için ilgilenilen süreçte bernoulli deneyinin varsayımlarının sağlanması gereklidir. Bernoulli Deneyinin Varsayımları: - Deneyler aynı koşullarda tekrarlanabilirlik özelliğine sahip olmalıdır. - Deneylerin yalnız iki mümkün sonucu olması gereklidir. - Başarı olasılığı (p),deneyden deneye değişmemektedir (Başarısızlık olasılığı q = 1-p ile gösterilir) - Denemeler birbirinden bağımsız olmalıdır. 153 23.7.2017 İki sonucu olan durum Başarılı başarısız Başarı 1 ve başarısızlık 0 Başarılı ihtimali p(x) Başarısızlık ihtimali q(x) veya 1-p p(X=x)= p(x=1) ve 1-p (x=0) P(X=x)= p² x (1-p)ª-³, x=0,1 beklenen değer: µ=E(x)=P dir Standart sapma (σ)=√p.(1-p) Ortalaması µ=∑x . P(x) Selami ÖZCAN İstatistik ÖRNEKLER 154 1: Hilesiz bir para atılıyor. X=tura A=(T) S=(T,Y) T gelmesi başarı yani 1 dir. nA=1 ve n=2 p=P(X=1)=P(A)=nA/n = ½ 1-p=P(x=0)=1-p(x=1)=1/2 Benoulli dağılımı ½ dir. 0,5 tir. X rassal değişkenin ihtimal dağılımı P(X=x)= ½ x=0 ve ½ x=1 P(X=x)=(½)x (½)1-x x=0,1 olarak elde edilir. 2:Hilesiz iki zar atılıyor.Başarı ikisininde 6,6 gelmesi x=1 Başarısızlık ikisininde 6,6 gelmemesi x=0 A=(6,6) ve nA=1 p=P(x=1)= P(A)= nA/n=1/6 iki tane olunca 1/6x1/6=1/36 1-p=P(x=0)= 1-P(x=1)= 35/36 dır. P(X=x) (1/36)x . (35/36)1-x x=0,1 23.7.2017 3: 100 kalemden 97 kusursuz. Rastgele seçilen bir kalemin kusursuz olma başarı (x=1) ihtimali Kusurlu olma başarısız (x=0) ihtimali nA=97 n=100 97/100=0,97 kusursuz iht. 1-0,97=0,03 kusurlu olma ihtimali P(X=x)=(0,97)x . (0,03)1-x x=0,1 Selami ÖZCAN İstatistik Örnek: Bir deste iskambilden çekilen bir kağıdın as olup olmaması ile ilgileniyor. As gelmesi başarı olarak ifade edildiği durum için olasılık fonksiyonunu oluşturunuz. x = 0 (as gelmemesi) S = { x / 0,1 } P( X = 0 ) = 48 / 52 x = 1 ( as gelmesi) P( X = 1 ) = 4 / 52 4 x 48 1 x P( X x) 52 52 0 155 x 0,1 d .d n P ( x) p x (1 p ) n x x n! n x x!(n x)! 3. BİNOM (İKİ DURUM) İHTİMAL DAĞILIMI n:tekrarlı bir deneyde (toplam deneme sayısı), x kez istenen (başarı) sonuç gelmesi durumunda ihtimallerin bulunması için P(X) başarılı sonuç elde etme ihtimali X değişkeninin iki sonuçlu (kesikli) bir değişken olması gerek. Deneyin her tekrarından sonra bu iki sonuçtan birinin ortaya çıkması gerekir. Kız,erkek; yazı tura; başarılı, başarısız; hatalı hatasız; iki sonuçlu olaylar binom dağılımı ile çözülür. p=1-q X değerleri 0,1,2,3 … gibi kesikli değerler ve bu değerler için nokta ihtimalleri hesaplandığından binom dağılımı kesikli ihtimal dağılımıdır. P=0,5 binom dağılımı simetriktir. P<0,5 sağa; 0,5<p ise sola çarpık Ortalama=n.p varyans=np(1-p) standart sapma=√np(1-p)=√npq Moment çarpıklıkά3=(1-p) / √npq, moment basıklıkά4=3+(1-6p)q / npq Binom Dağılımının Özellikleri Deney n kez aynı şartlarda tekrarlanmalı Sadece iki sonucu olmalı İki sonucun ihtimali her deneme için aynı ve bire eşittir. Denemeler bağımsız, bir denemenin sonucu diğer denemenin sonucunu etkilememektedir. 156 23.7.2017 Selami ÖZCAN İstatistik 0!=1 Bir sayının 0. kuvveti 1 dir. Binom Dağılımına Örnek %15 kusurlu şansa bağlı alınan 3 örneğin en az iki mamulün kusurlu olma ihtimali nedir? Çözüm: P(x≥2)= P(x=2) + p(x=3) (3/2)0,15x0,15x0,85+(3/3)0,15x0,15x0,15x0,85.sıfırıncı kuvveti =0,0574+0,0034=0,0608 %6,08 Örnek: %10 hatalı, 4 birimlik mamulun en çok 2 sinin hatalı olma ihtimali nedir? Çözüm: n=4 P(x≤2)=P(x=0)+P(x=1)+p(x=2) =0,6561+0,2916+0,0486=0,9963=%99,63 n P ( x) p x (1 p ) n x x n! n x x!(n x)! 3 P( x 1) 0,051 (1 0,05) 31 1 3! 3 1 1!(3 1)! Binom Dağılımının Ortalama(np) ve Standart Sapması(√npq) Ör. Bir fabrikada üretilen tv lerin arızalı olma ihtimali %5 tir. 3 tv seçtiğimizde Ör:Bir şehirde yaşayanların oyların %58 i 1.nin arızalı olma ihtimali (binom) nedir? A partisi almış, bu şehirden 25 kişi seçildiğinde X’in(A partisine oy verenlerin) Çözüm: 0,1354=%13,54 yanda çözümü ihtimal dağılımının ortalaması ve standart Örnek:Kargo şirketi paketlerinden %2 si zamanında ulaşmıyor. Bir müşteri 10 sapması nedir? paket veriyor. Ortalama:25x0,58=14,5 1 tanesinin zamanında ulaşmama ihtimali? (10/1) Standart sapma:√25x0,58x0,42:2,47 10x(0,02)1x(0,98)9=0,1667 Yorum: seçilen 25 kişiden 2,47 standart En çok 1 tanesinin zamanında ulaşmama ihtimali?p(x=0)+p(x=1)=0,9838 sapmayla ortalama 14,5 kişinin A partisine oy vermesi beklenmektedir. 157 23.7.2017 Selami ÖZCAN İstatistik BİNOM DAĞILIMINA ÖRNEK Bir fabrikada üretim yapan makinalardan birinin ürettiği ürünlerin 0,09’u kusurlu olarak üretilmiş bulunmaktadır. Bu ürünlerden 4 adedi rastgele seçilmiştir. Hiç özürlü ürün seçilmemiş olma olasılığı nedir? n! P(k;n;p) = --------- p k.q n-k k!(n-k)! 4! P(0;4;0,09) =--------- 0,09 0 . 0,91 4-0 = 0,6857 0!(4-0)! e x P( x) x! 3. POİSSON DAĞILIMI Poisson, binom gibi kesikli bir ihtimal dağılımıdır. Verilen bir aralıkta (zaman, hacim aralığı vb) tekrar sayısının ortalaması biliniyorsa poisson kullanılır. X ile gösterilen tekrar sayısına ilişkin herhangi bir değerin ihtimali hesaplanabilir. Üzerinde durulan olayın meydana gelme ihtimali çok küçüktür. n in büyümesi P nin küçülmesi halinde binom yerine poisson formülü kullanılır. Yani np değeri 5 ten küçük olduğunda ʎ: poisson dağılımının ortalaması, bu dağılımın varyansı da ʎ eşittir. Matematik sabiti e ise yaklaşık olarak 2,71828 dir. µ ortalama= ʎ= σ ² varyans, standart sapma σ =√ ʎ Moment çarpıklık ölçüsğ ά3=1/ ʎ moment basıklık ölçüsü:3+1/ ʎ Not: poisson dağılımı normalden daha dik ve sağa çarpıktır. ʎ büyüdükçe dağılım simetrikleşir. Örnek: bir hastanenin acil servisine bir günde gelen hasta sayısı; bir makinede üretilecek 100 parçadan hatalı parça sayısı; bir mağazadan 1 haftada satılan buzdolabı sayısı (randevulu gelen hasta rassal olmadığı için poisson uygulanamaz) Örnek: bir çamaşır makinesi ayda ortalama 3 kez arızalanmakta, poissona göre gelecek ay iki kez arızalanması ihtimali ve en çok bir kez arızalanması ihtimali nedir? 3 2 ( 2 , 71828 ) x 3 Çözüm: a) P(x=2)= P( x) 0,224 2! (2,71828) 3 x30 (2,71828) 3 x31 b)P(x≤1)=p(X=0)+p(X=1) P( x 0, x 1) 0! 1! p( x 1)0,049787 0,149361 0,199148 0,2 159 23.7.2017 Selami ÖZCAN İstatistik Poisson Dağılımının İhtimal Fonksiyonu l x : belirlenen periyotta ortaya çıkan olay sayısı : ortaya çıkma olasılığı araştırılan olay sayısı S = { x / 0,1, 2, 3, ….., } e x P( X x) x! 0 160 x 0,1,2,... diger durumlarda Poisson Dağılımının Beklenen Değer ve Varyansı Beklenen Değer Varyans E (x) Var (x) Beklenen değeri ve varyansı birbirine eşit olan tek dağılıştır. 161 Örnek: Bir mağazaya Cumartesi günleri 5 dakikada ortalama olarak 4 müşteri gelmektedir. Bir Cumartesi günü bu mağazaya, a) 5 dakika içinde 1 müşteri gelmesi olasılığını, b)Yarım saate 2’den fazla müşteri gelmesi olasılığını, a) 4 P ( x = 1 ) = ? e 4 41 P( X 1) 4e 4 1! b) 5 dk’da 4 müşteri gelirse, 30 dk’da 24 müşteri gelir. 24 P ( x > 2 ) = ? P( x > 2 ) = 1 – [P(x=0)+P(x=1)+P(x=2)] e 24 240 e 24 241 e 24 242 1 313e 24 1 1! 2! 0! ÖDEV: 1 saatte en çok 1 müşteri gelmesinin ihtimalini hesaplayınız. 162 Poisson Dağılımına Örnek Örnek1: A bankasında günde 2 hesap açılıyor, herhangi bir günde 6 yeni hesap açılması ihtimali, en çok 3 yeni hesap açılması ihtimali, en az 7 hesap açılması ihtimali nedir? a) p(x=6)= ortalama(ʎ)=2, x=6 formülde yerine koyarsak: 0,0120 b) P(X≤3)=P(X=0)+P(x=1)+p(x=2)+p(x=3)=0,8571 c)p(x≥7)=1-p(x<7):1-[p(x=0)+p(x=1)+p(x=2)+p(x=3)+p(x=4)+p(x=5)+p(x=7)]=0,0045 Örnek2: ortalaması x=2,6 poisson dağılışı gösteren bir değişkenin standart sapması nedir? Çözüm: ortalama (µ)=landa (ʎ)=varyans (ó)=2,6 dır. Standart sapması√2,6=1,61 dir. Ör:Bir otomobil satış yerine ayda ortalama 150 müşteri gelmektedir.Herhangi bir günde satış yerini açmayan galeri sahibi %kaç ihtimalle en az 3 müşteriyi kaçırmıştır.(ay=30) Günlük ortalama:150/30=5 tir. 3 veya daha fazla müşteriyi kaçırma ihtimali (iki durum ya 3 ten sonsuza kadar olan ihtimaller hesaplanacak veya 3 ten küçük olanlar (x=0,1,2) hesaplanıp 1 den çıkarılacaktır. P(x≥3)=1-p(x=0)+p(x=1)+p(x=2)=0,8754 %87,54 Örnek: bir havaalanından her 100 uçaktan biri mecburi iniş yapmaktadır. Herhangi bir ayda 4000 uçaktan en çok 2 sinin mecburi iniş yapması ihtimali nedir?0,2381 163 23.7.2017 Selami ÖZCAN İstatistik POİSSON DAĞILIMINA ÖRNEK Bir fabrikada üretilen ürünler 0,001 olaslıkla bozuktur. Rastgele örnekleme ile 2000 adet alınmıştır. 4 adet ürünün bozuk olma olasılığı nedir? = 2000. 0,001 = 2 = n. p = E(x)= V(X) = -2 2 4 k P(x=4) = e -------- = 0,09 - 4! P(x=k) = e -------k! BİNOM’UN POİSSONA YAKLAŞIMI 165 POİSSON DAĞILIMININ p PARAMETRESİNİN SIFIRA VEYA 1 YAKIN OLMASI DURMUNDA POİSSON DAĞILIMININ BİNOM DAĞILIMINA YAKINSAMASI UYGUN OLMAKTADIR. ÖRNEĞİN p < 0,05 VE n >20 İSE BU YAKLAŞIKLIK KALİTE KONTROL UYGULAMALARI AÇISINDAN TATMİNKAR SAYILMAKTADIR. 23.7.2017 Selami ÖZCAN İstatistik POİSSON’UN BİNOMA YAKLAŞIMI POİSSON DAĞILIMININ p PARAMETRESİNİN SIFIRA VEYA 1 YAKIN OLMASI DURMUNDA POİSSON DAĞILIMININ BİNOM DAĞILIMINA YAKINSAMASI UYGUN OLMAKTADIR. ÖRNEĞİN p < 0,05 VE n >20 İSE BU YAKLAŞIKLIK KALİTE KONTROL UYGULAMALARI AÇISINDAN TATMİNKAR SAYILMAKTADIR. BİNOM POİSSON 0 0,328 0,359 =np=1 0,368 1 0,410 0,377 0,368 2 0,205 0,189 0,184 3 0,051 0,060 0,061 X n= 5, p= 0,2 n= 20 , p=0,05 5. HİPERGEOMETRİK DAĞILIM 167 Binom ve hipergeometrik dağılım aynı tür olaylara uygulanır. Örnekleminin şekli önemli, binomda sınırsız anakütleden iadesiz çekilişler veya sınırlı anaküteleden iadeli çekilişler (çekilişler birbirinden bağımsız), bu yüzden binomdaki p değeri çekilişten çekilişe değişiklik göstermez. Hipergeometrikte ise; sınırlı anakütleden iadesiz çekiliş veya bir sonraki çekiliş bir önekine bağımlıdır. Örnek:2 istatistik, 3 bilgisayar, 4 yöneylem hocasından 3 kişilik sayısal yöntemler jürisi oluşturulacaktır. Jüride en az bir istatistik hocasının bulunması ihtimali nedir? Çözüm: P(x≥1)=p(x=1)+P(x=2) P(x≥1)=(2/1).[(9-2)/(3-1)]/9/3 + (2/2).[(9-2)/(3-2)]/9/3 P(x≥1)=42/84+7/84=49/84=05833 Örnek:not ortalaması 85 in üzerinde olan 4 iktisat, 7 işletme öğrencisinden 3 kişilik grup oluşturulacak, grupta bir iktisatçı bulunması ihtimali?N=11 n=3 A=4 Formulde x yerlerine 0 ve 1 konacak P(x≤1)=p(x=0)+p(x=1)=0,7212 23.7.2017 A N A x nx P ( X x / n, N , A) N n A! ( N A)! x!( A x)! n x !( N A) (n x)! P ( X x / n, N , A) N! n!( N n)! n : örnekte ki birim sayisi N : anakutledeki birim sayisi x : örnekte uzerinde durulan birim sayisi A : anakutlede uzerinde durulan birim sayisi hiç bir sekilde x deg eri A dan buyuk olamaz A (dagi lim in parametresi ) p 0,5ise dagilim simetrik N Ortalama np P Varyans 2 np (1 p ) N n N 1 S tan dart sapma np (1 p ) N n N 1 Selami ÖZCAN İstatistik HİPERGEOMETRİK DAĞILIMA ÖRNEK İçinde 10 sağlam ve 4 arızalı mal bulunan bir topluluktan 5 mal alınmıştır. Bunlardan üçünün sağlam çıkma olasılığı nedir? N=14 A=10 n= 5 x= 3 c c A x . N-A n-x P(X=x) = -------------------------N n c c c 10 3 . 14-10 5-3 P(X=3) = -------------------------= 0,3596 14 5 c 6. PASCAL(NEGATİF BİNOM) DAĞILIMI- ÖRNEK Bir imalat hattında kusurlu parça oranı 0,6 olarak bilinmektedir. 5. Parça üretildiğinde 3. Kusurlu parçanın ortaya çıkma olasılığı nedir? P(x)= X=5 K=3 k Ck-1 . p . q x-k X-1 P(5)= 3 C3-1 . 0,6 . 0,4 5-1 5-3 = 0,2074 Sorular 1. 2. 3. 170 İstatistik birimlerinin sahip oldukları özelliklere ne ad verilir? a) Veri b) Şık c) Parametre d) Sabit e) değişken 1,1,2,3,5,8,11,13 basit serisinin medyanı kaçtır? a) 4 b) 4,5 c) 5 d) 5,5 e) 6 Bir zar 3 kez atıldığında kaç olası sonucu vardır. a) 112 b) 143 c) 165 d) 210 e) 216 23.7.2017 4. 5. 6. Sınıflar:10-20, 20-30, 30-40, 40-50, 50-60, 60-70, 70-80 Frekans:1,5,7,12,20,24,25 den çok:25,24,20,18,13,5,1 50 den büyük gözlem sayısı kaçtır. a) 8 b) 12 c) 13 d) 18 e) 20 Anakütleden uygun tekniklerle çekilen birimlerin oluşturduğu alt topluluğa ne ad verilir? a) Sınıf b) Örneklem c) Evren d) Grup e) istatistik X=1,3,5,6,8,9 kareli ortalaması nedir? a) b) c) d) e) 4,31 5 5,33 5,5 6 Selami ÖZCAN İstatistik 7. 8. 9. 171 X=12,23,34,45,56 Değişim aralığı nedir? a) 12 b) 17 c) 34 d) 44 e) 56 X=3,4,6,8,9 standart sapması nedir? a) 12,28 b) 5,2 c) 5,53 d) 5 e) 6 Bir örneklemin gözlem değeri için hesaplanan karakteristik değere ne ad verilir? a) Ortalama b) Frekans c) İstaitik d) Anlam frekansı e) parametre 23.7.2017 10. 1 den 10 kadar sayılar arasından seçilen bir sayının 2 ve 3 e bölünebilen bir sayı olma ihtimali kaçtır? a) b) c) d) e) 11. Xi ortalama (µ) standart sapma (sigma)=10 normal dağılım göstermektedir. X=55 değerinin standart normal değeri (z) kaçtır? a) b) c) d) e) 12. 1/10 1/5 3/10 1/2 1/8 0,5 1 1,5 2 5 Kusursuz bir madeni para 2 kez atılmış, 1. atış yazı iken 2.ninde yazı gelme ihtimali kaçtır? a) b) c) d) e) ¼ 1/3 ½ 2/3 3/4 Selami ÖZCAN İstatistik 13. 14. 15. 172 Histogramın temel noktalarının birleştirilmesi ile elde edilen grafik türünün adı nedir? a) Pasta grafiği b) Frekans poligonu c) Sütun grafiği d) Alan kodu e) Serpilme diyagramı 10 gözlem değerinden oluşan basit bir serinin aritmetik ortalaması 50 ise bu serideki gözlem değerleri toplam kaçtır? a) 0,5 b) 5 c) 40 d) 60 e) 500 Sınıflar: 10-15, 15-20, 20-25, 30-35 Frekans: 40, 27, 18, 10, 5 /100 serinin frekans eğrisi aşağıdakilerden hangisidir? a) Sola eğik b) J biçiminde c) Sağa eğik d) Ters J e) U biçiminde 16. 17. 18. 19. 20. 23.7.2017 Ortalamalarla ilgili ifadelerden hangisi yanlıştır? a) v Birimle ilgili ifadelerden hangisi yanlıştır? a) q Aşağıdakilerden hangisi tam sayımı engelleyen nedenlerden biri değildir? a) Maliyetli olması b) Ölçülen birimde tahrip yapması c) Anakütle hacminin küçük olması d) Zaman sınırlaması e) Anakütle hacminin sonsuz sayıda olması X=1,2,3,4 f(x)=1/10, 2/10, 3/10, 4/10 ortalaması kaça eşittir? a) 1 b) 1,6 c) 2,7 d) 3 e) 3,8 X=1,2,3,4 f(x)=1/10, 2/10, 3/10, 4/10 standart sapması kaça eşit? a) 1 b) 3 c) 7 d) 9 Selami ÖZCAN İstatistik e) 10 21. 22. 23. 173 Serilere ilişkin ifadelerin hangisi doğrudur? a) c Aşağıdaki serinin modu nedir? X=3,5,8,13,21,34 Frekans=1,7,2,9,6,4 a) 7 b) 9 c) 11,5 d) 13 e) 14,93 50 birimlik örneklem 3. tabakadan seçilen birim sayısı nedir? a) 4 b) 15 c) 20 d) 35 e) 40 23.7.2017 24. 25. 26. Standart normal dağılmış (z) bir değişken P(0,52)<z<2,14 ihtimali nedir? a) 0,1772 b) 0,1985 c) 0,2054 d) 0,2854 e) 0,4838 Başarı ihtimali p=0,2 q=0,8 (başarısızlık) binomyal dağılmış değişkenin varyansı=4/5, deney sayısı n kaçtır? a) 2 b) 4 c) 5 d) 8 e) 10 X=72 standart sapması=15 bu imtihandan 90 alan bir öğrencinin Z (standart normal puanı) nedir? a) 1,2 b) 0,7 c) 0,3 d) -1,0 e) -1,2 Selami ÖZCAN İstatistik 6.BÖLÜM: Sürekli İhtimal Dağılımları En çok bilinen sürekli ihtimal dağılımları Üstel Dağılım Gama Dağılımı Weibull Dağılımı Normal Dağılım 174 23.7.2017 Selami ÖZCAN İstatistik 1. ÜSTEL DAĞILIM Elektronik cihazların ömür ve güvenirlik (reliability) hesaplamalarında çok kullanılan bu dağılımın olasılık yoğunluk fonksiyonunun grafiğinin şekli aşağıdadır. Bu dağılımı tanımlayan en önemli özellik arıza oranıdır(). 0,2 = 5 0,16 = 10 0,12 = 15 f(x) 0,08 0,04 0 0 20 40 X 60 80 100 ÜSTEL DAĞILIM ÜSTEL DAĞILIM OLASILIK FONKSİYONU: - x f(x) = e : SİSTEMDEKİ ARIZA ORANI ( >0) X>0 ÜSTEL DAĞILIM ORTALAMASI: 1 = : SİSTEMDEKİ ARIZA ZAMANI ORTALAMASI ÜSTEL DAĞILIM VARYANSI: ZAMANA BAĞLI ALET GÜVENİRLİĞİ: 1 2 = 2 -t R(t) = e BİRİKİMLİ ÜSTEL DAĞILIM FONKSİYONU: F(a) = P(x<a) = 1- ea a>0 ÜSTEL DAĞILIM-ÖRNEK Seri üretim yapan bir fabrikadaki kusurlu mamullerin saat başına =1/4 parametreli bir poisson sürecine uygun olduğu belirlenmiştir. İç denetçinin saha çalışması için üretim sisteminin başına saat 10:00’ da geldiği varsayıldığında; A. İlk kusurlu ürünün ortaya çıkmasının beklenen zamanını, B.İlk kusurlu ürünün en erken sat 11:00’de üretilmesi olasılığını, C.İlk kusurlu ürünün en geç saat 14:00’de üretilmesi olasılığını bulunuz. a. E(X) = = 1 1 = = 4 saat 1/4 - 0.25(1) -t - 0.25t b. P(X1) = R(t) = e = e = e = 0.2212 -t c. P(X=4) = 1-e =1-e -0.25(4) -1 = 1-e =1- 0.36788 = 0.63212 2. GAMA DAĞILIMI 0,2 0,16 = 1; r=1 = 1; r=2 0,12 = 1; r=3 f(x) 0,08 0,04 0 0 20 40 X 60 80 100 GAMA DAĞILIMI GAMA DAĞILIMI OLASILIK FONKSİYONU: f(x) = -x e r-1 (x) r(r) X>0 ; r >O ; >O GAMA DAĞILIMI ORTALAMASI: = r GAMA DAĞILIMI VARYANSI: r 2 = 2 BİRİKİMLİ GAMA DAĞILIMI FONKSİYONU: 00 F(a) = 1- 0 r(r) (t)r-1 e - t dt r-1 F(a) =1- k=0 - a ( a) e k! k 3. WEIBULL DAĞILIMI Olasılık Kuramı ve İstatistik bilim dallarında Weibull dağılımı (Waloodi Weibull anısına isimlendirilmiş) bir sürekli olasılık dağılımı olup olasılık yoğunluk fonksiyonu ise : Burada x ≥ 0 ve x < 0 için f(x; k, λ) = 0. k > 0 şekil parametresi ve λ > 0 Ölçek parametresi olurlar. Weibull dağılımı için Yığmalı(Cumulative) olasılık Fonksiyonu bir gerlmiş üstel (stretched) fonksiyondur. Yaşama, hayatta kalım ve yetmezlikle yıkım süreçlerini inceleyen verilerin analizi alanında Weibull dağılımı çok elastik olup kolayca değiştirilebildiği için çok kullanılmaktadır. Değişik parametre değerleri kullanılarak normal dağılım, üstel dağılım gibi çok popüler diğer istatistiksel dağılımların davranışların Weibull dağılımı kullanarak aynen taklid etme imkânı bulunmaktadır. Eğer k = 3.4 ise, Weibull dağılımı Normal Dağılım’ına benzerlik gösterir. Eğer k = 1 ise o zaman Weibull dağılımı Üstel Dağılımı’na dönüşür. 4. NORMAL DAĞILIM – – – – – – – – İstatistik analiz yapılırken, dağılımın özelliği çok önemlidir. Çünkü farklı dağılım gösteren verilere uygulanacak tanımlayıcı ve analitik istatistik yöntemleri de farklıdır. Parametrik testlerin uygulanabilmesi için, dağılımın normal ya da normale yakın olması gerekir. Standart sapması, frekans eğrisi çan şeklinde olan simetrik dağılımdır. Normal dağılım simetrik olduğu için, normal dağılım gösteren değişkenlerin ortalama, medyan ve modları eşittir. Normal dağılımı meydana getiren birimler ölçme veya tartma yoluyla elde edilen verilerdir. ±∞ sayıda değer alır. Moment çarpıklık katsayısı: ά4=3 Normal dağılım fonksiyonu f(x) = 1/σx√2 e½(x-µx/σx)² e:2,71828 :3,14159 µ: anakütle ortalaması σ:anakütle standart sapması, x:herhangi bir sürekli değişkendir. 181 23.7.2017 Selami ÖZCAN İstatistik Dağılım özelliğinin önemi nedir Parametrik testlerin tümünün uygulanabilmesi için gereken varsayımların başında verilerin dağılımının normal olması gelir. Normal dağılımdan gelmeyen ölçümler kullanıldığında, gerçekte olduğundan daha küçük bir p değeri ya da daha dar bir güven aralığı hesaplanır. Bu durumda, doğru bir hipotezi reddetme olasılığı artar. Yani, iki grup arasında fark olmadığı halde fark varmış gibi sonuç elde edilebilir NORMAL DAĞILIMIN KRİTERLERİ Dağılımın normal olup olmadığı grafik ve istatistik analiz yöntemleri ile anlaşılır. Histogram, dal ve yaprak grafiği ve normal olasılık grafiği çizilerek dağılımın normal olup olmadığı hakkında fikir edinilebilir. Normal eğri altında kalan alan 1 e eşittir. Normal dağılımda nokta tahmini yapılamaz bu sebeple aralık tahmini (x1 ve x2 arası) yapılır. STANDART NORMAL EĞRİ ALANLARI X-µX σX %68,27 ==>±1σx %95,54 ==>±2σx %99,73 ==>±3σx X değerlerinin standart z değerlerine dönüştürülmesi gerekir. Z tablosundaki Z değerleri 0 ile 3,99 arasındadır. Z=2,14 ün normal eğri alanı nedir? Z tablosundaki normal eğri alanlarını bulmak için; İlk sütundaki 2,1 ve ilk satırdaki 0,04 2,14 ün normal eğri alanı 0,4838 dir. Örnek1: Z1=-1,44 ile Z2=2,06 arasındaki alan kaçtır? P(-1,44≤z≤2,06)=0,4251+0,4803=0,9054 Örnek 2: Z1=-1,44 ile Z2=-0,51 arasındaki alan kaçtır? P(-1,44≤z≤-0,51)=0,4251-0,1950=0,2301 Örnek 3: P(z ≤-1,44) değerini bulunuz? P(z ≤-1,44)=0,5-0,4251=0,0749 Örnek 4: P(z ≥-1,44) değerini bulunuz? 18 0,4251+0,5=0,9251 5 23.7.2017 Selami ÖZCAN İstatistik Örnek 5: ortalaması 5 kg, standart sapması 0,15 kg olan bir prosesten tesadüfi bir malın ağırlığı 5,05 kg dan fazla olma ihtimali nedir? X=5,05 standart z değerine dönüştürelim X-µX σX Z=(5,05-5,00)/0,15=0,33 tür. P(x≥5,05) P(z ≥0,33)=0,5-0,1293=0,3707 olur. 18 6 23.7.2017 Selami ÖZCAN İstatistik Verilerin normal dağılmadığı durumlarda iki işlem yapılabilir : 1. Verilere dönüşüm uygulayarak, onların normal dağılıma uymalarını sağlamak. 2. Varolan verilere parametrik olmayan bir test uygulamak KESİKLİ DAĞILIMLAR NORMALE YAKLAŞTIRILIR. (BİNOM, POİSSON VE HİPERGEOMETRİK DAĞILIM) BİNOM DAĞILIMININ NORMAL’E YAKLAŞIMI n yeteri kadar büyük olması durumunda binom kesikli değişkeni yaklaşık olarak ortalaması np, varyansı npq olan bir normal dağılıma yaklaşır. Ayrıca p ihtimal değerinin 0.5’e yaklaştığı bütün durumlarda binom dağılımı yerine normal dağılım kullanılabilir. Binom dağılımı kesikli standart z normal dağılımı süreklidir. Dönüştürmek için; n 30 , np 5 ve p=0.50 E(X)= = np z= X- = ve (X+0,5) - np npq Bu durumda; Varyans z= X- = npq = X - np npq Örnek 1: Büyük bir şirkettte çalışan personelin % 40’ bayandır. Çalışanlar arasından rastgele olarak 150 kişi seçilmiştir. Seçilen kişiler içinde kadınların sayısının 56-70 arasında olma ihtimali nedir? n = 150 30 p = 0,40 ~0,50 np = 60 5 BU ŞARTLARDA BİNOM NORMAL DAĞILIMA YAKLAŞIR. =np=(150)(0,40)=60 Dağılımın ortalaması =nxp =150x0,40=60 Standart sapması √nxpxq . √(N-n).(N-1) √150x0,40x0,60=6 X - np z= npq (56-0,5) - 60 Z1= 6 = - 0,75 TABLODAN 0,2734 = 1,75 TABLODAN 0,4599 (70+0,5) -60 Z2= 6 + 0,7333 Seçilen kişiler arasında bayanların sayısının 56-70 arasında olma ihtimali %73.33’tür. Örnek 2: Bir fabrikada üretilen mamullerin %10 hatalı, 150 birim alınıyor, 10 mamulun hatalı olma ihtimali kaçtır? 19 0 Dağılımın ortalaması =nxp =150x0,10=15 Standart sapması √nxpxq . √(N-n).(N-1) √150x0,10x0,90=3,67 X= 10 değerine ±0,5 ilave edilirse; X1=10,5 X2=9,5 Z1=10,5-15/3,67=-1,23 Z2=9,5-15/3,67=-1,50 P(x=10)=P(-1,5<z<-1,23) P(z)=0,4332-0,3907=0,0425 23.7.2017 Örnek 3: bir önceki örneğe göre 10 dan az olma ihtimali kaçtır? (10 hariçtir) X=9,5 standart z değeri=-1,5 P(x<10)=P(z<-1,5)= 0,5-0,4332=0,0668 Selami ÖZCAN İstatistik POİSSON DAĞILIMININ NORMAL’E YAKLAŞIMI Poisson dağılımında Parametresi, =np≥5 eşitliğine uygun olması durumunda Poisson dağılımı normal dağılıma yaklaşır. Bu Durumda ihtimallerin Hesaplanmasında; - k P(x=k) = e -------k! Formülü yerine = 2 = =nxp eşitliğinden istifade ederek z= X- = X- √ Örnek 1: Bir hastalığın iyileştirilmesi için geliştirilen yeni bir ilaç 20000 hasta üzerinde uygulanmıştır. İlacın yan etkisinin olması ihtimali 0,002 dir. Buna göre ilacın verildiği hastalarda yan etkisi görülenlerin sayısının 3660 arasında olma ihtimali nedir? n= 20000 p= 0,002 = =np=20000(0,002)=40 5 olduğundan poisson dağılımı normale yaklaşır. V(X)= = 40 z1 = = z2= X- X- = = 36 - 40 40 60 - 40 40 = - 0,1 0,0398 = 0,5 0,1915 + 0,2313 Örnek 2: fabrika malzeme yokluğu sebebiyle günde 12 kez durmaktadır. Rastgele seçilen bir günde malzeme yokluğu sebebiyle günde 15 ve daha az durma ihtimali kaçtır? =12 ise z=15,5-12/√12=1,01 P(x≤15)=P(z≤1,01)=0,5+0,3438=0,8438 Örnek 3: bir önceki örneğe göre günde 12 kez durma ihtimali kaçtır? X1=11,5 X2=12,5 Z1 =11,5-12/√12=-0,14 Z2=12,5-12/√12=0,14 P(x=12)=P(-0,14<z<0,14)=0,0557+0,0557=0,1114 %11,14 19 3 23.7.2017 Selami ÖZCAN İstatistik HİPERGEOMETRİK DAĞILIMIN NORMALE YAKLAŞIMI 194 Nxp≥5 olduğunda hipergeometrik dağılım normale yaklaşır. Sınırlı anakütleden iadesiz çekilişler yapıldığı için standart sapma düzeltme faktörü ile çarpılır. Standart z formülündeki anakütle ortalaması ve standart sapma yerine hipergeometrik dağılımın ortalama ve standart sapması yazılarak ihtimal dağılımı hesaplanır. Z= (x-np)/ √npq . √(N-n/N-1) x değişkeni süreklilik düzeltmesine tabi tutulur. 23.7.2017 Selami ÖZCAN İstatistik Hipergeometrik dağılımın normale yaklaşımına Örnekler Örnek 1: 1000 mamulun %10 hatalı, iadesiz alınan 150 adetin ise 8 den az olma ihtimali kaçtır. Dağılımın ortalaması =nxp =150x0,10=15 Standart sapması √nxpxq . √(N-n).(N-1) Örnek 2: 1.Örneğe göre 10 ve daha fazla olma ihtimali kaçtır? (10 ve yukarısı başlangıç 9,5) Z= 9,5-15/3,39= -1,62 P(x≥10)= P(z ≥-1,62)=0,4474+0,5= =0,9474 %94,74 σ=√150x0,10x0,90 x √(1000-150)/(1000-1) σ=3,39 8 den az dendiği için 7,5 Z=7,5-15/3,39=-2,21 P (x<8) =P(Z<-2,21)=0,5-0,4864=0,0136 %1,36 195 23.7.2017 Selami ÖZCAN İstatistik