istatistik - Doç.Dr. Selami ÖZCAN

advertisement
İSTATİSTİK
I
Doç. Dr. Selami
ÖZCAN
BİRİNCİ BÖLÜM
 İSTATİSTİKLE
İLGİLİ
TEMEL KAVRAMLAR
2
23.7.2017
Selami ÖZCAN İstatistik
1. Bölüm: Sunum Planı








3
İstatistiğin Doğuşu, Gelişimi
İstatistik nedir? Ve kaça ayrılır?
Anakütle ve örnek; istatistik ve parametre nedir?
İstatistiksel örnekleme yöntemleri kaça ayrılır?
Değişken nedir ve kaça ayrılır?
Veri toplama yöntemleri
Veri Derleme:Verilerin düzenlenmesi
Ölçme nedir? Kaç çeşit ölçek vardır?
23.7.2017
Selami ÖZCAN İstatistik
İstatistiğin Doğuşu





4
İstatistik başlangıçta teknik bir disiplin olarak ele alınırken günümüzde bir bilim dalı olarak kendini kabul
ettirmiş, ulusal ve uluslararası boyutta gelişmelerin temelini oluşturmuştur. Son 30 yıla damgasını vuran ve
çağımızda bilgi çağı olarak adlandırılan gelişmeler istatistiği evrensel bir konuşma dili haline getirmiştir.
Günümüzde ulusal ve uluslararası sosyal ve ekonomik gelişme hedeflerinin belirlenmesi ve bu hedeflerin
başarısı güncel, güvenilir istatistiklerle sağlanmaktadır. Doğru bilgi, doğru yorum ve doğru karar sürecinde
araştırmacılar, politikacılar, karar alıcılar ve tüm bireyler çalışmalarında istatistiki bilgileri etkin olarak
kullanmaktadırlar.
İlk çağda bile insanlar bazı toplu olayları belirleme ihtiyacı duymuşlardır. Devletlerin kurulması ile birlikte
insanlar sınır belirleme, vergi toplama, toprak dağılımına yönelik amaçlarla ayrıca dil, din farkı olan
toplulukların nüfus büyüklüğünü belirleme, askere alma amaçlı bilgiler toplamaya ve bunların kayıtlarını
tutmaya başlamışlardır.
Orta çağda devletler güçlerini yitirmiş, istatistik konusu gerilemiş ve kent düzeyinde bazı bilgilerin
toplandığı değerlendirmelerle sınırlı kalmıştır. Devletlerin güçlenmesi ile birlikte istatistik uygulamaları
gelişmiş ve nüfus sayımları yanında; dış ticaret, milli gelir hesabına yönelik fiyat, ücret vb. temel verilerin
toplanmasına başlanmıştır.
İstatistik metodolojisine yönelik çalışmalar 17. yüzyılda Alman Üniversitesinde "Devletlerin Durumu" adlı
bir derste bilimsel olarak gündeme gelmiştir. Derste ülkelerin tarihi, mali, askeri yönetim örgütleri, nüfusları
sayılarla ifade edilerek ele alınmış ve bu konu sonradan istatistik olarak adlandırılmıştır. Aynı dönemde
sigorta matematikçileri nüfus konusu ile ilgilenmeye başlamışlardır.
23.7.2017
Selami ÖZCAN İstatistik
İstatistiğin Gelişimi





5
17. yüzyılda Pascal, Bernouilli, Moivne, Laplace, Poisson ve Gauss tarafından yapılan
çalışmalar ile ihtimal teorisi, talih oyunları ve tesadüfi olayların çan eğrisi şeklinde
dağılım gösterdiği belirlenmiştir. Aynı yüzyılda Belçikalı matematikçi ve astronom
Quatelet istatistik sorunlarına eğilmiş, çeşitli eserler yazmıştır. İstatistik Genel Müdürü
olan Quatelet istatistiğin kullanım alanını genişleterek kültür, ahlak, doğal olaylar ve
özellikle antropometriye yönelik bilgileri değerlendirmiştir.
Orta Asya da büyük uygarlıklar kuran Türk toplumları Hindistan'da, Çin'de, İran'da
bilgiye önem vermişler, İlhanlılar ve Selçuklular nüfus sayımı çalışmaları yapmışlardır.
İstatistikleri tarihi perspektifte değerlendirmek, geçmişi daha iyi anlamak, günümüzü en
etkin yapıda kavramak ve geleceğimizi en iyi şekilde planlamamız açısından da çok
büyük önem taşımaktadır
17. Yüzyıla kadar sadece bilgi kaydetme şeklinde gerçekleşen istatistiki çalışmalar,
18. ve 19. Yüzyıllarda J. Bernoulli (1645-1705) ve K.Gauss'un (1777-1855) katkılarıyla
matematik temelleri üzerine oturtulmuş, ihtimal teorisi geliştirilmiştir. Sosyal ve
antropolojik olaylara istatistiği kapsamlı bir şekilde uygulayan ilk matematikçi olan
Adolphe Quételet (1796-1874) ise modern istatistiğin kurucusu olarak kabul edilmiştir.
20. Yüzyılın başında R. A. Fisher, K. Pearson ve W. S. Gosset'in katkılarıyla tahmin
yapma ve karar verme konuları ön plana çıkarak istatistik artık sayısal verilerin yorum
ve değerlendirmesini yapan bir bilimsel metodlar topluluğu haline gelmiştir.
23.7.2017
Selami ÖZCAN İstatistik
İSTATİSTİK BİLİMİ NEDİR?
İstatistik kelimesi ilk olarak Almanya’da devlet anlamına gelen status kelimesine dayanılarak kullanılmaya
başlanmıştır. Günlük dilde istatistik veya istatistikler; belirli bir olaya ilişkin derlenmiş sayısal bilgiler
demektir.İthalat, ihracat, turizm ve inşaat vb. istatistikler bazen sayı ve rakam karşılığında da istatistik kullanılır
6
İstatistik sözcüğü, ele alınan olayların gözlemlenerek ilgili verilerin derlenmesi, işlenmesi, analizi ve
yorumlanmasında kullanılan tekniklerin tümünü ifade eder.
Dar manada İstatistik: geçmiş ve şimdiki durumla ilgili toplanmış sayısal verileri, geliştirilmiş olan
bazı tekniklerle analiz ederek gelecek hakkında karar vermemizi kolaylaştıran bir bilim dalıdır.
Geniş Manada İstatistik: belirli amaçlar için verilerin toplanması, düzenlenmesi, uygun yöntemlerle
analiz edilmesine denir. Bu analizler vasıtasıyla elde edilen sonuçların YORUMLANMASI ve Bir
KARARA bağlanması istatistikle ilgilidir.
İSTATİSTİK: Belirlenen amaç/lar doğrultusunda gözlenen yığın olaylardan derlenen sayısal verilerin
işlenerek , ilgili olayların oluşturduğu yığınların bilimsel olarak incelenmesinde kullanılan teknik
ve yöntemler bilimidir.
Rakamlar yalan söylemez, yalancılar rakam söyler.  Rakamsal Bilgileri Anlamlandırmak ,
Üç türlü yalan vardır.

Belirsizlik ile İlgilenmek,

İlişkileri analiz etmek
 Yalan,

Tahmin ,
 kuyruklu yalan,
23.7.2017
Selami ÖZCAN İstatistik

Belirsiz
Ortamda
Karar Verme
 İstatistiki yalan
(konuları açısından)
İstatistik ikiye ayrılır
1.
Deskriptif (tasvir edici-tanımlayıcı) istatistik
2. İndaktif (tahlil edici-çıkarımcı) istatistik
genel dağılımı ortaya çıkarma, durumu olduğu gibi tasvir etme, kollektif Çıkarımlar mutlak doğru olmadığı için ihtimal
olayların eğilimini araştırır, verilerin özetlenmesi ve tasvir edilmesi
kelimesi ile ifade edilir, ileri seviye istatistik
ile ilgilidir.
bilgisi gerektirir, tümevarım yöntemi
kullanılır. Hipotez testlerini içerir.
1.
Frekans dağılımları
1.
Örnekleme teorisi
2.
Merkezi Eğilim (Yer) ölçüleri
1.
1.
2.
3.
4.
2.
2.
3.
4.
2.
2.
4.
5.
Değişim aralığı
Kartil aralığı
Desil aralığı
2.
7.
9.
10.
Kesikli ihtimal dağılıları
1.
2.
3.
2.
8.
Tek yönlü
Çift yönlü
Varyans Analizi
Regresyon analizi
1.
6.
Oran
Ortalama
Hipotez testleri
1.
Ortalama sapma
Standart sapma
Standart hata
Varyans
Çarpıklık ve Basıklık
İhtimal (toplama, çarpma)
İhtimal dağılımları
1.
Basit
Çoklu
Zaman serileri
Korelasyon
Non parametrik testler
İndeksler
Kalite Kontrol
Binom dağılımı
Poisson dağılımı
Hipergeometrik dağılım
Sürekli ihtimal dağılımları
1.
7
2.
3.
Ortalama
Oranlama
Tahmin teorisi (güven sınırları)
1.
Parametrik olmayan dağılım Ölçüleri
1.
2.
3.
6.
2.
Parametrik dağılım ölçüleri
1.
5.
Mod
Medyan
kantiller
Dağılım ölçüleri
1.
4.
2.
Aritmetik ortalama
Geometrik ortalama
Harmonik ortalama
Kareli ortalama
Parametrik olmayan MEÖ
1.
2.
3.
3.
1.
Parametrik MEÖ
Normal dağılım
1.
Standart normal dağılım
2.
Normalin Binoma yaklaşım
23.7.2017
Selami ÖZCAN İstatistik
Tipik Olay ve Yığın Olay
İstatistik ve Parametre





8
Yığın Olay: bir olaylar kümesinde tek bir olay kümedeki diğerlerini
veya ait olduğu kümeyi tam olarak temsil edemeyen olaylardır.
İstatistik yığın olaylarla ilgilenir. Trafik kazaları, evlenmeler,
boşanmalar, doğum ve ölüm oranları, yıllık satışlar, ciro vb.
Tipik Olay: bir olaylar kümesinde tek bir olayın tüm olaylar kümesini
temsil ettiği olaylara denir. Laboratuarda suyun elde edilmesi,
Parametre: ana kütledeki bütün birimler üzerinden hesaplanan
ölçülere denir.
İstatistik: ana kütleyi temsil etme gücüne sahip bir örnekteki
verilerden hesaplanan ölçülere denir.
23.7.2017
Selami ÖZCAN İstatistik
1. Birim (Örnek), birim türleri
1. Birim (Örnek/örneklem): yığın olay niteliğindeki her olaya denir. Ana kütleden tesadüfi yöntemlerle
seçilerek oluşturulan yeni oluşuma denir. Birim olması için bir nesne/olayın ölçülmesi veya sayılması
yeterlidir.

Mesela elle tutulamayan ve gözle görülemeyen, ölçülemeyen ve sayı ile ifade edilemeyen soyut
(sevinç, korku, aşk, üzüntü, melek gibi) olaylar birim oluşturmaz.

Fakat doğum, ölüm, trafik kazası, insan, hayvan, bina gibi sayılabilen ve ölçülebilen canlı ve
cansız varlıklar ile olaylar, sayılarla ifade edildiği için birim oluşturlar.
Birim (örnek) Türleri:
9
1. Maddi birim ve Gayri maddi birim: okul, insan, buzdolabı, araçlar (uzunluk, genişlik ve yükseklik) gibi bir
boyuta/varlığa sahip olan, elle tutulup gözle görülebilen somut varlıklar (insan, araba)-Maddesel varlığı
(boyutları) olmayan fakat gerçekte olan birimlerdir. Mesela Boşanma, evlenme, doğum, ölüm, trafik kazası
gibi
2. Sürekli birim ve Ani birim: belirli bir zaman aralığı (herhangi bir anı) içinde gözlemlenen birimler sürekli: (insan,
ticari kuruluş, konut, araçlar sürekli birimlerdir ) bir olay bir fiil biçiminde çıkan oldukça kısa süren(zaman içine
dağılmış) birimler ani: Belirli bir anda çıkan ve ancak ortaya çıktıkları anda incelenebilen, maddesel varlığa sahip
olmayan birimlerdir. Evlenme, boşanma, trafik kazası, ölüm ani birimlerdir
3. Doğal birim ve Yapay birim: bir bütün oluşturan, parçalanmaları/birleştirilmeleri halinde özelliklerini kaybeden
birimlere doğal: (tek parça olarak incelenen olaylar, Örneğin masa, araba, insan, kalem doğal birimlerdir), bir
bütün olma özelliği göstermeyen fakat nitelikleri değişmeyen birimlere yapay birim denir. (arsanın parçalara
ayrılması, kumaş parçalara ayrılırsa özelliğini kaybetmez )
4. Gerçek birim ve Gerçek farz edilen (varsayılan) birim: maddesel olarak veya fiil biçiminde var olan birimler
gerçek, ortaya çıkmış olması yeterli: Ev, araba, bina, masa maddesel varlığa sahip gerçekte var olan birimleri
oluştururken, ölüm, evlenme, doğum, trafik kazası gibi maddesel bir varlığa sahip olmayan ama gerçekte var olan
birimler gerçek birimleri oluşturur, gerçekte olmayan varsayılarak oluşturulan birimler. 10 öğrenciden 3 lü grup
oluşturmak gibi
23.7.2017
Selami ÖZCAN İstatistik
2. Ana kütle, Ana kütle türleri
2. Ana kütle (istatistik kütlesi): yığın olay niteliğindeki aynı cins birimlerin oluşturduğu topluluğa denir.
Veya bir istatistiki araştırmada araştırmaya konu olan bütün birimler aynı nedenlerin etkisinde
olması gerekir. Anakütle, istatistik birimleri toplamından farklı bir yapıya sahip olmamalıdır.
Üniversite öğrenci ve hoca toplamından farklı bir tüzel kişiliğe sahiptir.
Ana kütle türleri:
1. Gerçek anakütle, farazi (varsayılan) anakütle, gerçek birimlerin oluşturduğu anakütle, henüz
oluşmamış fakat oluşturulması mümkün olan anakütle varsayılandır. 30 kişilik bir sınıfta rastgele
seçilecek 5 kişilik bir grup c(30:5)=142.4 farklı şekilde olur.
2. Sonlu veya Sonsuz anakütle: sayılabiliyorsa sonlu, sayılamıyorsa sonsuz, Türkiye’de yaşayan
kişiler sonlu, Marmara’daki canlı sayısı sonsuz.
3. Sürekli veya Kesikli anakütle: parçalandıklarında ve birleştirildiklerinde özelliğini kaybediyorsa
kesikli(doğal birimlerden oluşur), kaybetmiyorsa sürekli anakütle(zaman ve mekan birimleri doğal
değildir.)
Mesela: bir üniversite öğrencileri üzerinde bir araştırma yapılacaksa Üniversitenin bütün öğrencileri
ANAKÜTLE, bu öğrenciler arasından seçilen 100 kişilik şans grubuna ÖRNEK denir. Şayet
araştırma İİBF bütün öğrencilerine yönelik bir araştırma yapılıyorsa okulun toplam öğrenci sayısı
ana kütleyi oluşturur, içinden tesadüfi olarak seçilen 30 öğrenci örnek kütleyi oluşturur.
Not: bir istatistiksel araştırma planlanırken araştırmanın nerede yapılacağı, kimlerle/kimler tarafından
yapılacağı, ne kadar zamanda yapılacağı, araştırma için ayrılan kaynaklar, toplanacak veriler çok
önemlidir.
10
23.7.2017
Selami ÖZCAN İstatistik
VERİ DERLEME (düzenleme)
VERİ DERLEME: belirlenen amaçlar doğrultusunda gözlemlenecek birimlerin ölçülmesi, sayılması sonra da bunların ilgilenilen değişkenlere göre
hangi şıklara sahip olduğunun belirlenmesi ve kaydedilmesi işlemlerini içerir.
A. Birim Seçimi: belirlenen amaç/lar doğrultusunda ilgilenilen yığın olayın tanımlanmasıyla seçme işlemi gerçekleşir yani ilk önce kimlerin veya
nelerin gözleneceği belirlenir.
B. Değişken ve Şıkların Belirlenmesi
1.
Değişkenin Belirlenmesi: Veri derlenirken sadece belirlenen amaçlar doğrultusunda değişkenler göz önünde tutulur. Ayrıntı sorunlara neden
olabilir. Gözlem sayısı sonlu bir sayı olmalıdır.
2.
Şıkların Belirlenmesi: şık, belirli bir özelliğin ortaya çıkış şekillerine denir. Gözlemlerde kullanılan ölçü biriminin araştırmaya uygun olması
gerekir. Tabi ki şıkların alacakları değerler de (ilgilenilen değişken sürekli veya kesikli olsun fark etmez) sonlu olmalıdır. Şıkların aldığı ölçü
birimleri de ilgilenilen olaya uygun olmalıdır. Kilo, şişe, teneke, gram vb
C. Anakütlenin Sınıflandırılması

Veriler hangi yöntemle toplanırsa toplansın, elde edilen veriler genellikle istatistiksel analize hazır değildir (bu veriler ham veri olarak
adlandırılır)

Bu verilerin analize uygun hale getirilmesi için düzenlenmeleri gerekir.

Veri Derleme Türleri:
1.
2.
3.
4.
5.
Ani ve sürekli veri derleme: sürekli birimlerin belli bir andaki durumlarını gözlemlemek için yapılan derlemelere ani derleme; ör: nüfus ve işyeri, tarım
ve sanayi sayımları sayılabilir. Sürekli veri derleme,olayların aynı anda ve bir arada meydana gelemedikleri durumda sürekli olarak incelenmesidir.
Anlık birimlerin belirli bir zaman aralığında gözlemlenmesidir. belirli bir bölge ve zamanda evlenme, boşanma, trafik kazası oranları
Direkt ve Endirekt veri derleme: doğrudan ana kütle birimlerinin gözlemlenmesi durumunda direkt;söz konusu anakütle ile birlikte diğer anakütle
birimlerinin gözlemlenmesi durumu ise endirekt veri derlemedir. Doğrudan nufus sayımı ile ülkede yaşayan sayısı tespit edilebileceği gibi bunun
yanında konut sayımı ile de nufus tespiti yapılabilir.
Birincil ve İkincil veri derleme: bilgi edinmek için yapılan derlemelere birincil (anlık), idari ve mali amaçlarla yapılan derlemelere ikincil (sürekli) veri
derleme denir.
Asıl ve yardımcı şeklinde veri derleme: anakütleyi oluşturan birimlerin özelliklerinin belirlenmesi amacıyla yapılan derlemeye asıl, asıl derlemeye
yardımcı olmak için yapılan derlemeye yardımdı denir.
Genel ve kısmi veri derleme: bilgi edinilmek istenen kütlenin tamamının gözlenmesine genel veri derleme, genel nüfus sayımları vb.; bilgi edinmek
istenen kütleyi oluşturan birimler arasından belirlenen amaçlar doğrultusunda yanlızca bir kısmının seçilip gözlenmesine kısmı veri derleme denir.
Pahalı oluşu, zaman alışı, gözlem birimlerinin fiziksel zarara uğraması vb nedenlerle kısmi veri toplanır.

11
Kısmi veri derleme: ÖRNEKLEM (örneği oluşturmak için anakütleden seçilen birimlerin oluşturduğu topluluktur. Topluluğu oluştururken seçilen
teknikler şunlardır:
–
–
Rassal (tesadüfi)örneklem : anakütledeki her bir birimin örneğe girme şansı eşit ise rassal örnekleme
İradi (isteyerek) örneklem: girmesi mümkünler arasında eşit şans gözetilmez/ fark gözetilirse olur. (7.bölümde ayrıntılı
anlatılacaktır.)
23.7.2017
Selami ÖZCAN İstatistik
Değişken nedir? Kaça ayrılır?
Değişken (Özellik): gözlemden gözleme değişik değerler alabilen objelere, özelliklere veya
durumlara denir.
İstatistik birimlerin sahip oldukları özellikler değişken,değişkenlerin aldıkları değerlere ise şık tır
Doğum yerleri, yaş, ağırlık, uzunluk vb. özellikler değişkendir. Aldıkları değerlere de şık denir.
Değişken Türleri:
1.Mekan değişkeni:değişkenin şıklarının mekana göre oluştuğu değişkenlerdir. Doğum yeri,
Üniversitenin kurulduğu şehir vb.,
2.Zaman değişkeni:değişkenin şıklarının zamana göre oluştuğu değişkenlerdir. Doğum yılı,
Üniversitenin kuruluş yılı vb.
3.Maddi değişkeni:mekan ve zaman değişkenin dışındaki değişkenler. İnsanların medeni hali, birim
değişken maliyetler, istatistikten alınan notlar vb.
12
1. KALİTATİF (Sayısal olmayan) değişkenler 2. KANTİTATİF (Sayısal) değişkenler
Değişik derecelerde az veya çok değerler alan Gözlemden gözleme farklılık gösterirler fakat bu
değişkenlerdir.
farklılık derece yönünden değil kalite, miktar ve
çeşit yönündendir.
Ör: doğum yeri, göz rengi, ırk, nüfus, cinsiyet,
medeni durum, din vb.
Ör: yaş, ağırlık, zeka seviyesi, hava sıcaklığı,
Hesabınızdaki bakiye, sınıftaki öğrenci sayısı vb.
23.7.2017
Selami ÖZCAN İstatistik
DEĞİŞKENLERİN SINIFLANDIRILMASI
VERİ
KALİTATİF
KANTİTATİF
KESİKLİ
• bir ailedeki çocuk sayısı
SÜREKLİ
• bir kişinin kilosu
• bir yılda satılan bilgisayar sayısı • bir kişinin boyu
13
23.7.2017
Selami ÖZCAN İstatistik
KANTİTATİF (SAYISAL) DEĞİŞKENLER
1. Kesikli değişkenler
(yalnız belirli tamsayı
değerleri alabilen)
 Sayılabilen değişkenler
 Ör: cinsiyet, medeni
durum
14
23.7.2017
2. Sürekli değişkenler
(belirli aralıkta sonsuz
sayıda değer alabilen
değişkenlere denir)
 Ölçülen ve tartılan
değişkenler
 Ör: yaş, uzunluk ve
ağırlık vb
Selami ÖZCAN İstatistik
Veri kaynakları,
Veri toplama araçları ve yöntemleri
Veri Kaynakları

Birincil Veriler
Veri toplama yöntemleri

Anket (yazılı iletişim)
–
Geleneksel

cevaplayıcının yönettiği,
–
–
–

–



–
Telefonla anket
Biçimsel olmayan mülakat
–
–
e posta anketi
İnternet anketi
Mesajlaşma


Dokümantasyon (yazılı)
Çok kaynaklı (alan çalışması, zaman
serileri)
Anket (sayımlar ve anketler)
Veri Toplama Araçları
–
inceleme tekniğidir)
–
Katılımlı gözlem
–
Dışarıdan gözlem
Anket
Gözlem (örnek olay)
Mülakat
İkincil Veriler
Gözlem (olayların ortaya çıktığı sırada sistematik biçimde


–
Modern


–
Posta
Faks
Elden bırakıp alma
araştırmacının yönettiği
–
–
–
Soru kağıdı (anket formu)


–
Anketör (gözlemci)

Doğal gözlem
Simülasyon gözlemi(kişi/grup oyun)
Açık uçlu sorular (size göre…)
Kapalı uçlu sorular (evet, hayır)

Ücretli, gönüllü zorunlu
Devamlı, geçici
Görüşme: tek tek veya grup ile sözlü veya hareketli iletişim
yoluyla veri toplama yöntemidir.

15
Deney
23.7.2017
Selami ÖZCAN İstatistik
Ölçme ve Ölçekler
Ölçme: nesne veya fertlere belirli bir özelliğe sahip oluş derecelerini belirtmek
için belirli kurallara uyarak sembolik değerler verme işlemine denir.
İstatistiki bir araştırmaya konu olan verileri ölçmeye yarayan ölçekler 4’e
ayrılır.
1.
2.
3.
4.
16
Nominal(sınıflama) ölçek: istenen özelliğin olması(1) olmaması(0) hatalı-hatasız,
kız-erkek,
Ordinal (sıralama) ölçek: yarışmacıların sıralanması 1., 2., 3., veya 1. tercih, 2.
tercih, likert tipi sıralama, hiç beğenmedim(1) beğenmedim(2) biraz beğendim(3),
beğendim(4), çok beğendim(5)
Aralık ölçeği: belirli iki değer arasında sonsuz değer alır. Bu durum için aralıklar
belirlenir. 500 altı, 500-1000 ytl, 1001-1500 ytl, 1501-2000 ytl, 2001 ve üzeri
Oran ölçeği: ağırlık ve boy ölçüleri , metre, kg gibi
23.7.2017
Selami ÖZCAN İstatistik
Ölçeklerde Uygulanabilecek İstatistikler
17
Ölçekler Mukayese Ortalama
Örnekler
Nominal Kimlik
Ordinal Sıralama
İnternal Aralık
Mod
Medyan
Aritmetik
Cinsiyet, göz, saç rengi, meslekler,
araba plakaları, forma no vb.
Rasyo
Tüm işlemler
Satış miktarı, müşteri sayısı, ağırlık,
zaman, mutlak değer olan herşey
Oran
23.7.2017
Marka tercihi, sosyal sınıflar, bölüm
tercihi, ilk 500 firma vb.
Sıcaklık ölçeği, başarı puanı, markaya
karşı tutum, vb.
Selami ÖZCAN İstatistik
ANALİZ TEKNİKLERİ
1. DEĞİŞKEN SAYISINA
GÖRE
–
Tek değişkenli (değişken
üzerinde değişik grupların
veya cevapların dağılımı)

–
–
Farklılıkların tespitine yönelik

–
t testi, ki kare testi, z testi, anova
testi
İlişkilerin şiddetini ölçmeye
yönelik

Bağımlılık ölçümü
Çok değişkenli (bağımlı ve
bağımsız değişken)

18
t testi, z testi, ki kare, one
way anova testi, mann
whitney u testi
2. AMAÇLARA GÖRE
korelasyon, regresyon,
faktör, ayrım ve kümeleme
analizi
23.7.2017
Selami ÖZCAN İstatistik
ANALİZ TEKNİKLERİ
3.Veri Özelliklerine Göre

Parametrik analiz teknikleri ve ön
şartları
–
–
–
–
–
–
–
–
–

Ön şartları
–
–
–
–
19
z testi: örnek büyüklüğü n>=30
t testi: örnek büyüklüğü n<30
F testi: varyans analizi
Ki kare testi
Anova testi
One way anova
Korelasyon
Regresyon
Çok değişkenli analiz teknikleri

Parametrik olmayan analiz teknikleri
–
Tek örnek durumu için



–
Eşlenik çift örnek durumu için


–



23.7.2017
–
İşaret testi
Wilcoxun eşlenik testi
İki bağımsız örnek durumu için

Verilerin aralık/oran ölçeğinde
ölçülmüş olması gerekir
Veriler normal dağılım göstermeli
Hedef kitlede yer alan bütün gruplar
aynı varyans değerine sahip olmalı
Hata değerleri tesadufi olmalıdır
İşaret testi
K S testi
Run testi
Mann Witney U testi (t testi ile aynı)
Wilcoxin sıra toplam testi
Wilcor sıra sayıları testi
K S testi
İkiden fazla örnek durumu için


Kuruskev Walls testi
Frigman testi
Selami ÖZCAN İstatistik
İKİNCİ BÖLÜM
 İSTATİSTİK
SERİLERİ
(FREKANS DAĞILIMLARI)
 Niçin frekans dağılımı yapılır?
–
–
20
Veriyi gruplara ayırarak anlaşılabilir hale getirmek için
Gözlenme sıklıklarını ve ihtimallerini belirlemek için
23.7.2017
Selami ÖZCAN İstatistik
2.Bölüm: Sunum Planı


Seri türleri
Kantitatif seriler
–
–
–
–


21
Zaman ve mekan serileri
Frekans dağılımları
Kümülatif seriler
Birleşik seriler
Kalitatif seriler
Serilerin grafikle gösterimi
23.7.2017
Selami ÖZCAN İstatistik
İstatistik serileri





22
İstatistik serileri : gözlem değerlerini (ham verileri) anlamlı kılma (büyüklüklerine göre sıralama) yollarından biridir. Seriyi
oluşturan gözlem değerlerinin her birine terim denir. Kütleyi oluşturan kollektif olayların her birine birimdir. Terim ise birimleri
oluşturan gözlem değerlerinden her biridir. Terim sayısı ile birim sayısı birbirine eşit olur.
Seri türleri
1. Kantitatif seriler
–
Zaman ve mekan serileri: gözlem sonuçlarının (yıl,ay, gün, saat vb) zaman değişkeninin şıklarına göre sıralanarak
oluşturuluyorsa zaman; yer değişkeninin (ülke, bölge, şehir, köy vb) şıklarına göre sıralanarak oluşturuluyorsa mekan
serisidir.
–
Frekans Serileri: bu serilere bölünme, dağılma serileri de denir. Ham verilerin basit seri, frekans serisi ve
sınıflandırılmış/gruplandırılmış seri şekline dönüştürülmesidir.
–
Kümülatif (birikimli) seriler:
–
Bileşik seriler: gözlem değerlerini iki veya daha fazla değişkene göre hir araya getiren serilere denir. Aylık gelir ve gider
arasındaki ilişkinin ölçülmesi
2. Kalitatif seriler (dikey eksende frekanslar, yatay eksende sınıf veya grup değerlerinin yazıldığı grafik şeklidir. Simetrik:normal
dik ve basık seriler), asimetrik(sağa ve sola eğik) seriler; çok tepeli ve J/ters J şeklinde seriler ve U şeklinde seriler vardır.
Verilerin grafikle gösterilmesi
–
Basit serinin grafikle gösterilmesi: Çubuk grafiği
–
Sınıflandırılmış serinin grafikle gösterilmesi: Histogram, Frekans poligonu,
–
Birikimli (kümülatif)serilerin grafikle gösterilmesi
–
Bileşik serilerin grafikle gösterilmesi
23.7.2017
Selami ÖZCAN İstatistik
Zaman ve mekan serileri
23
ZAMAN SERİSİ: gözlem sonuçlarının
(yıl, ay, gün, saat vb) zaman
değişkeninin şıklarına göre
sıralanarak oluşturuluyorsa zaman
serisi
Yıllar
Satışlar
MEKAN SERİSİ: gözlem sonuçlarının
yer değişkeninin (ülke, bölge, şehir, köy
vb) şıklarına göre sıralanarak
oluşturuluyorsa mekan serisidir.
1990
2000
2010
İstanbul
Ankara
İzmir
2500
3200
4800
23.7.2017
İller
Satışlar
8500
3200
4800
Selami ÖZCAN İstatistik
Frekans Dağılımları
Ham veri: gözlem ya da kayıt yoluyla elde
edilen ve işlenmemiş, anlamlı hale
getirilmemiş sayılar yığınıdır.
1. BASİT SERİ: elde edilenen ham verilerin
büyükten küçüğe veya tersi alt alta
veya yan yana sıralanmasına denir.
ÖRNEK1: Bir işletmede 25 çalışana verilecek
çocuk yardımı ile ilgili bir araştırma
yapılmaktadır. çalışanların çocuk
sayıları aşağıda verilmiştir.
Ham veri: 0 , 1 , 3 , 3 , 2 , 1 , 0 , 8 , 4 , 2 , 3 , 2
, 5 , 0 , 6 , 3 , 5 , 4 , 1 , 3 , 2 , 2 , 3 , 1,4
Basit seri: 8 , 6 , 5 , 5 , 4 , 4 , 4 , 3 , 3 , 3 , 3 , 3
, 3 , 2 , 2 , 2 , 2 , 2 , 1 , 1 , 1 , 1 , 0, 0, 0
Örnek 2.Ham veriler
2. FREKANS SERİSİ: basit seriyi özetlemek veya daha anlaşılır
hale getirmek için yapılır. Frekans:tekrarlanma sayısıdır.
Frekans serisi ise:gözlem değerlerinin yanına kaç kez
tekrarlandığı yazılarak oluşturulan seridir. f harfi ile ifade
edilir.
ÖRNEK1: Daha önce basit seri olarak düzenlenen seriyi frekans serisi olarak düzenleyiniz
.
X
f
0
3
1
4
2
5
3
6
4
3
5
2
6
1
8
1
Toplam 25
Basit seri
24
23.7.2017
Selami ÖZCAN İstatistik
25
23.7.2017
Selami ÖZCAN İstatistik
3. SINIF/GRUPLANDIRILMIŞ SERİ
Hesaplama kolaylığı için eşit büyüklükte sınıf/gruplandırılır. Grup aralığını gösteren “aralık katsayısı”nın bulunması için en
yüksek ve en düşük puanlar arasındaki fark (RANJ) belirlenir. Bu değer tahmini/istenen grup sayısına bölünür. Az sayıda grup
veri kaybına, çok sayıda grup işlemlerin zorlaşmasına neden olur.
26
İlgili kavramlar
Sınıf Değeri/orta noktası: Her grub veya sınıf bir sayı ile temsil edilir. Bu sayı her grubun orta noktasıdır. Buna
sınıf değeri denir. Bu sınıf değeri frekans serisindeki X değeri gibi işlem görür. alt ve üst sınıf uçlarının veya
alt ve üst sınıf sınırlarının toplanıp ikiye bölünmesiyle elde edilir.
Sınıf büyüklüğü veya aralığı: alt ve üst sınırlar arasındaki farka denir. h ile gösterilir.
Başlangıç ve bitiş sınırları belirtilmeyen sınıflara açık sınıflar denir.
Sınıf aralığı dar tutulursa sınıf sayısı artar frekans dağılımının anlaşılması zorlaşır. Geniş tutulursa sınıf sayısı
azalır sonuçta dağılıma ait bazı değerler gizli kalır.
Uygulamada sınıf sayısı: 7-20 yada 10-30 arasında olmalıdır.
Sürekli gruplandırılmış seri: sınıf uçları sınıf sayısına eşitse yani bir sınıfın alt ucunun kaldığı yerden bir önceki
sınıfın üst ucu başlıyorsa sürekli gruplandırılmıs seri demektir. Sınıf sınırları: sürekli gruplandırılmış bir
seride her sınıfın alt ve üst değerlerine denir. Sınıf uçları: Her sınıfın ilk rakamı alt sınıf ucu, son rakamı ise
üst sınıf ucudur. Sınıf uçları sınıf sınırlarına eşittir.
Kesikli gruplandırılmış seri: bir sınıfın alt ucunun kaldığı yerden bir önceki sınıfın üst ucu başlamıyorsa kesikli
gruplandırılmıs seri denir. sınıf sınırları: kesikli gruplandırılmış bir seride bir üst sınıfın alt ucundan bir alt
sınıfın üst ucu çıkarılıp ikiye bölünerek elde edilir. Bu değer bütün alt sınıf uçlarından çıkarılır ve bütün
üst sınıf uçlarına eklenir.
23.7.2017
Selami ÖZCAN İstatistik
3. Sınıf/ Gruplandırılmış seriye Örnekler
Sınıf /Grup Aralık Katsayı formülü: (en yüksek – en düşük) / istenen sınıf/grup sayısı
Sınıf /Grup Sayısı formülü:
eşitsizliği dikkate alınır. k sınıf sayısı n: toplam veri sayısı
.
ÖRNEK: Daha önce frekans serisi olarak
.
düzenlenen örneği 2 eşit aralıklı
gruplandırılmış seri olarak düzenleyiniz.
Frekans SınıflGruplandırılmış
X f
0 3
1 4
2 5
3 6
4 3
5 2
6 1
8 1
Top:25
Sınıflar
0-2
2-4
4-6
6-8
8-10
toplam:
frekans
7
11
5
1
1
25
10 sınıf olacak şekilde (94-28)/10=6,2yaklaşık 7 aralık
katsayısı olur;28 dahil 7 sayarsak ilk sınıf 28-34 olur.
27
23.7.2017
Selami ÖZCAN İstatistik
Örnek1: 100 öğrencinin istatistik dersinden
aldığı notlar aşağıdaki gibidir.

a.
b.
c.
d.
e.
f.
g.
h.
i.
28
89, 57, 57, 93, 97, 65, 33, 71, 42, 85, 47, 63, 76, 49, 88, 82, 50, 62, 93, 39, 76, 84, 54, 87, 56, 39, 49,
70, 74, 77, 81, 99, 73, 48, 57, 89, 55, 73, 86, 35, 66, 79, 85, 72, 91, 39, 49, 84, 66, 58, 65, 81, 84, 43,
62, 95, 58, 64, 77, 93, 74, 68, 76, 65, 61, 81, 37, 45, 89, 22, 50, 68, 87, 51, 45, 89, 95, 87, 91, 43, 71,
93, 67, 49, 65, 96, 84, 79, 77, 80, 93, 65, 89, 99, 64, 53, 62, 86, 69 Bu verilere göre
Notların değişim aralığını bulunuz.
Bu verileri basit seri haline getiriniz.
Bu verileri sınıf büyüklüğü 10 olacak şekilde gruplandırarak bir frekans dağılımı teşkil
ediniz. İlk sınıf 20-29 olsun
50 den az puan alan öğrenci sayısını bulunuz.
70 veya daha yukarı puan alan öğrenci sayısını bulunuz.
C şıkkındaki sınıflandırmaya göre her sınıfa ait sınıf değerini ve sınıf sınırlarını bulunuz
C şıkkındaki sınıflandırmaya göre bir histogram ve frekans poligonu çiziniz.
“..den az kümülatif frekans değerlerini” bulunuz. Bu dağılıma ait frekans histogramı ve ojiv
eğrinisini elde ediniz.
“..den çok kümülatif frekans değerlerini” bulunuz. Bu dağılıma ait frekans histogramını ve
ojiv eğrisini elde ediniz.
23.7.2017
Selami ÖZCAN İstatistik
Çözüm1:
a.
b.
99-22=77
.
22
33
35
37
39
39
39
42
43
43
29
45
45
47
48
49
49
49
49
50
50
51
53
54
55
56
57
57
57
58
58
61
62
62
62
63
64
64
65
65
65
c. Sınıf frekanslar
20-29
1
30-39
6
40-49
11
50-59
12
60-69
18
70-79
16
80-89
22
90-99
14
65
65
66
66
67
68
68
69
70
71
71
72
73
73
74
74
76
76
76
77
77
77
79
79
80
81
81
81
82
84
84
84
84
85
85
86
86
87
87
87
88
89
89
89
89
89
91
91
93
93
93
93
93
95
95
95
96
97
99
99
d. 50 den az denildiği için 1+6+11=18 dir
e. 70 ve daha fazla denildiği için 16+22+14=52
f. Sınıflar
alt sınır üst sınır sınıf değeri/orta noktası
20-29
19,5
29,5
24,5
30-39
29,5
39,5
34,5
g.
Frekans
20
15
10
0
19,5 29,5 39,5 49,5 59,5
69,5
79,5
89,5
99,5
h . “..den az küm.frekans 1, 7, 18, 30, 48, 64, 86, 100
“.. den çok küm.frekans 100, 99, 93, 82, 70, 52, 36, 14
den az
den çok
100
75
50
25
0
23.7.2017
Selami ÖZCAN İstatistik
Örnek 2: Yalova Termal otele 75 ay boyunca aylık gelen turistlerin sayısı
aşağıdaki gibidir. Sınıf sayısı en az 8, en çok 15 olacak şekilde çetele
tablosunu ve sınıflandırmayı ve sınıf orta noktasını bulunuz?
115
94 110 103
101
99 103
111 105
92 104 114 106 100 102 100
93 107
99 102
98
96 113 110 108 102 114
97
93
91
95
97 113
98
90 100 103 114
99 114 108 103 100
98 101
104 110 114 113 109 108 106 115 103 111 109 112 104 104 102
107 106 109 105
30
96
94
96 101 101 106 107 105 113 112
23.7.2017
Selami ÖZCAN İstatistik
99
Sınıflar Çetele Frekans Sınıf Orta Noktası
90-92
///
3
(90+92)/2=91
93-95
/////
5
=94
96-98
///// ///
8
=97
99-101
///// ///// //
12
=100
102-104 ///// ///// //// 14
=103
105-107 ///// ///// /
11
=106
108-110 ///// ////
9
=109
111-113 ///// ///
8
=112
114-116 /////
5
=115
Toplam
75
ÇÖZÜM2:
Sınıflar
90-92
93-95
96-98
99-101
102-104
105-107
108-110
111-113
114-116
31
1. adım: Dağılımdaki en büyük ve en küçük değer bulunur. Örneğimizdeki en büyük
değer 115, en küçük değer 90
2. adım: En büyük değerden en küçük değer çıkarılarak dağılım aralığı bulunur.
Değişim aralığı = En büyük değer- En küçük değer Dağılım aralığı= 115-90=25
3. adım: Dağılım aralığı bir kez 8'e bir kez 15'e bölünerek(sınıf sayısının en az 8, en çok
15 olmasını önerildiği için) sınıf aralığı saptanmaya çalışılır. 25÷8=3.1,
25÷15=1.6'dır. 1.6 ile 3.1 arasında herhangi bir değer sınıf aralığı olarak seçilebilir.
Eğer sınıf aralığını 3 olarak alırsak yaklaşık 8-9 sınıf elde ederiz, sınıf aralığını 2
alırsak sınıf sayımız
12-13 arasında olur. Burada sınıf aralığı 3 olarak alınmıştır. Sınıflar şu şekilde En küçük
değer 90 olduğundan ilk sınıfın alt sınırı 90 ile başlatılmıştır. Tüm sınıf sayımız ise
9'dur. Bütün değerler sınıflamaya dahil edilmiştir.
4. Adım: Sınıflar saptandıktan sonra her bir değerin hangi sınıfa gireceğine bakılır.
Örneğimizdeki ilk değer 115'dir. Bu değer 114-116 sınıfına gireceği için bu sınıfın
karşısına bir çizgi çizilir. Sonra geri kalan değerler teker teker ait oldukları sınıfın
karşısına işaretlenir. Buna "Çeteleme" denir. Sonra çeteleler sayılır ve her sınıfın
karşısına yazılır. Örnek dağılımımızın çetele ve sayı ile gösterilmesi
23.7.2017
Selami ÖZCAN İstatistik
Frekans serisi ve gruplandırılmış seriye
örnek (4 sınıflı gruplar oluşturulacak)
Frekans serisi
X
frekans
5
2
7
4
8
12
10
8
11
6
12
5
16
3
32 Top 40
Gruplandırılmış seri
Gruplar
frekans
5.00-7.75
6
7.75-10.50
20
10.50-13.25
11
13.25-16.00
3
Toplam
40
23.7.2017
Selami ÖZCAN İstatistik
Frekans serisinin gruplandırılmış
seriye dönüşümü
1.adım: En yüksek X değerinden en düşük X değeri çıkarılır sınıf sayısına bölünür.
(16-5)/4= 2,75 (sınıf büyüklüğü) bu değer serideki en küçük değer (5)e kümülatif olarak
eklenir.
2. adım: örnekteki frekans seriyi eşit aralıklı 4 sınıflı sürekli gruplandırılmış bir seri haline
getirelim. 5+2,75=7,75 olur.
Sürekli gruplandırılmış seri
kesikli gruplandırılmış seri (aralık 3)
grup
f
grup
frekans nisbi frekans
ilk aralık 5-7,75
6
4, 50-7,50
6
6/40
7,75-10,50
20
7,75-10,75
20
20/40
10,50-13,25
11
11,00-14,00
11
11/40
13,25-16,00
3
14,25-17,25
3
3/40
top
40
top 40
40/40
Sınıf sınırları: 5-7,75;7,75-10,50;10,50-13,25;13,25-16,00
Sınıf büyüklüğü: 7-75-5,00=2,75 Sınıf değeri: (5,00+7,75)/2=6,375
33
23.7.2017
Selami ÖZCAN İstatistik
Kümülatif (Birikimli) Frekanslar




34

Bazı istatistiksel çalışmalarda bir frekans
serisinde veya gruplandırılmış seride belirli bir
değerden daha küçük veya daha büyük değer
alan birim sayısının belirlenmesi gerekebilir.
Bu durumlarda kümülatif frekanslar hesaplanır
Her sınıfın frekansına bir önceki sınıfın frekansı
eklenerek oluşturulan seriye KF denir.
..den az: küçükten büyüğe doğru oluşturulur.
..den çok: büyükten küçüğe doğru oluşturulur.
23.7.2017
Selami ÖZCAN İstatistik
Kümülatif Frekans Dağılımları
1.
2.
3.
4.
35
Sınıflar
5-7,75
..den az kümülatif
7,75-10,50
Frekans
dağılımları
10,50-13,25
..den çok kümülatif 13,25-16,00
Frekans
dağılımları
..den az küm.nisbi Sınıflar
frekans dağılımları
5-7,75
..den çok küm.nisbi
frekans dağılımları 7,75-10,50
10,50-13,25
13,25-16,00
f
6
20
11
3
40
f
6
20
11
3
40
23.7.2017
..den az
küm.f.
7,75 den az
6
10,50 den az 6+20=26
13,25 den az 26+11=37
16,00 den az 37+ 3=40
..den az
..den çok küm.f.
5,00 den çok
40
7,75 den çok 40- 6=34
10,50 den çok 34-20=14
13,25 den çok 14-11= 3
küm.nisbi f. ..den çok küm.nisbi f.
7,75 den az 6/40=15 5,00 den çok 40/40=100
10,50 den az 26/40=65 7,75 den çok 34/40= 85
13,25 den az 37/40=92,5 10,50 den çok 14/40= 35
16,00 den az 40/40=100 13,25 den çok 3/40= 0,75
Selami ÖZCAN İstatistik
SORU 2015 verileri ile dünyadaki 30 büyük şehir nüfuslarına göre
gruplandırılarak frekans dağılımları gösterilmektedir.
Nüfus grupları(*1000 kişi)
şehir sayısı(frekans)
3000 - 4000 den az
6
4000 - 5000 den az
6
5000 - 6000 den az
4
6000 - 7000 den az
6
7000 - 8000 den az
2
8000 - 9000 den az
4
9000 ve üzeri
2
Yukarıdaki tabloyu kullanarak ;
a. .. den az küm. frekans ve .. den çok küm. frekansları bulunuz?
b. ..den az küm.nisbi ve ..den çok küm. nisbi frekansları bulunuz?
c. Şehir nüfusu 6000 den az olan şehir sayısı kaçtır?
d. Şehir nüfusu 8000 ve üzeri olan şehir sayısı kaçtır?
e. Şehir nüfusu en az 5000 ve 8000 den az olan şehir nüfusu kaçtır?
f. Histogram, frekans poligonu ve ojiv eğrilerini çiziniz?
36
23.7.2017
Selami ÖZCAN İstatistik
Çözüm
a ve b şıkları
Nüfus grupları(*1000 kişi)
3000 - 4000 den az
4000 - 5000
5000 - 6000
6000 - 7000
7000 - 8000
8000 - 9000
9000 ve üzeri
f
6
6
4
6
2
4
2
...den az
...den çok
...den az
...den çok
küm. frekans küm.frekans küm.nisbi frekans küm.nisbi frekans
6
30
6/30=
30/30=
12
24
12/30=
24/30=
16
18
16/30=
18/30=
22
14
22/30=
14/30=
24
8
24/30=
8/30=
28
6
28/30=
6/30=
30
2
30/30=1.00
2/30=
c. Nüfusu 6000 den az şehir sayısı 16 dır.
d. Nüfusu 8000 ve üzeri olan şehir sayısı 6 dır.
e. Nüfusu 5000 ile 8000 den az olan şehir sayısı 18- 8=10 dur.
f.
37
23.7.2017
Selami ÖZCAN İstatistik
BİLEŞİK SERİLER (Bağımlı/bağımsız)
Birimlerin birden fazla değişkene göre dağılımlarını bir arada gösteren serilerdir. Bir bileşik serinin
ilk sütunu değişkenin gözlem değerleri, diğer sütunda ise ilgili değişkenlerin ilk değerleri yer alır.

Birim seçimi (öğrenci)

Değişken (uzunluk ve ağırlık)
Örnek:

Öğrenci gözlem no
38
Uzunluk(m)
X
Ağırlık (kg)
Y
1
1.72
68
2
1.68
70
3
1.80
76
4
1.74
73
5
1.76
71
23.7.2017
Selami ÖZCAN İstatistik
SERİLERİN GRAFİKLE GÖSTERİLMESİ


39
HİSTOGRAM
FREKANS POLİGONU
23.7.2017
Selami ÖZCAN İstatistik
Frekans dağılımların grafikle
gösterilmesi



1.DİYAGRAMLAR (Çubuk ve alan grafikleri)
Çubuk grafiği, gözlem değerleri x=2, 4, 6, 8, 10
yatay eksen
Dikey eksende frekans değerleri: 2, 4, 7, 3, 1
–
–
–
8
8
7
7
6
6
5
5
4
4
3
3
2
2
YATAY EKSEN
DİKEY EKSEN
BU KOORDİNAT SİSTEMİNE GÖRE
OLUŞAN ŞEKİL
1
1
0
0
2
40
2.FREKANS POLİGONU

4
6
8
10
23.7.2017
2
4
6
8
10
Selami ÖZCAN İstatistik
Histogram ve frekans poligonu,


41

Histogram: dikdörtgenler dizisidir. frekanslar
Tabaları her bir sınıfın sınıf
20
büyüklüğünü, yüksekliği ise
frekansları gösterir
15
Frekans Poligonu: dikdörtgenlerin
10
üst kenarlarının orta noktaları
birleştirilmek suretiyle elde edilen
grafiğe denir. Başlangıç noktası ilk
5
sınıftan bir önceki farazi sınıfın
orta noktasıdır.bitiş ise son sınıftan
5,00sonraki farazi sınıfın orta
noktasıdır.
Her ikisinin kapsadığı alan
23.7.2017
birbirine eşittir.
histogram
Frekans
poligonu
7,75
10,50
13,25
16,00
gruplar
Selami ÖZCAN İstatistik
HİSTOGRAMA ve FREKANS
POLİGONUNA ÖRNEK
Sınıflar
Frekanslar
(f)
Sınıf aralıkları
(h)
Ayarlanmış
frekanslar (f/h)
0-4
12
4
12/4=3
4-8
16
4
16/4=4
6
8-12
20
4
20/4=5
5
12-16
24
4
24/4=6
4
16-20
20
4
20/4=5
3
20-24
8
4
8/4=2
2
Ayarlanmış
frekanslar
0
42
23.7.2017
4
Frekans
poligonu
8
12
16
20
24
sınıflar
Selami ÖZCAN İstatistik
43
23.7.2017
Selami ÖZCAN İstatistik
VERİ ANALİZİ
HİSTOGRAM:
F
R
E
K
A
N
S
F
R
E
K
A
N
S
DEĞİŞKEN
SİMETRİK HİSTOGRAM
F
R
E
K
A
N
S
DEĞİŞKEN
SAĞA ASİMETRİK
HİSTOGRAM
DEĞİŞKEN
SOLA ASİMETRİK
HİSTOGRAM
Histogramlar; spesifikasyon ve sonuç arasındaki ilişkilerin
araştırılmasında, normal olmayan verilerin belirlenmesinde,
malzeme ve değişik verileri sınıflandırarak bir operasyonelfinansal sürecin içerisinde değişikliklere neden olan faktörlerin
gözden geçirilmesinde kullanılmaktadır.
33
KÜMÜLATİF SERİLERİN GRAFİKLE
GÖSTERİMİ
Sınıflar
: 0-10, 10-20, 20-30, 30-40, 40-50, 50-60, 60-70,
Frekanslar: 3,
12
25
30
15
10
5 = 100
den az ve den çok serileri oluşturunuz? Sınıflar yatay, frekanslar dikey ekseni gösterir.
den az = 3, 15, 40, 70, 85, 95, 100
..den az
den çok=100, 97, 85, 60, 30, 15, 5
100
..den çok
0
45
23.7.2017
80
Selami ÖZCAN İstatistik
Bileşik serilerin grafikle gösterimi
8
Y
7
6
5
4
3
2
1
0
X
2
46
4
6
23.7.2017
8
10
Selami ÖZCAN İstatistik
GRAFİKLER


47
Araştırma sonucunda elde edilen ve
düzenlenen verilerin daha kolay anlaşılabilmesi
için gösterildiği şekillere grafik denir.
Grafikler göze hitap ettikleri için, toplanan
verilerin daha açık bir şekilde görülmesine ve
yorumlanmasına yardımcı olur. Buradaki en
önemli nokta grafiklerin açık ve anlaşılır
biçimde çizilmeleridir.
23.7.2017
Selami ÖZCAN İstatistik
Verilerin grafikle gösterilmesi
Sütun/Bar grafiği
 Pasta grafiği
 Çubuk
 Çizgi
 Alan
 XY dağılımı
 Silindir
Örnekler verilecek

48







23.7.2017
Radar grafiği
Halka grafiği
Hisse senedi
Kabarçık
Yüzey
Koni grafiği
Pramit grafiği
Selami ÖZCAN İstatistik
BAR GRAFİK
İstatistiksel verileri açıklamak için en çok
kullanılan grafik türüdür. birbirini izleyen
barların bir serisini gösterir. Barlar
küçükten büyüğe ya da tersi biçimde
sıralanır.
49
23.7.2017
Selami ÖZCAN İstatistik
Diğer soru örnekleri
Soru 1: Aşağıda 50 öğrencinin istatistik I dersinden aldığı notlar verilmiştir. Sınıf/Grup
sayısı 10 olacak şekilde frekans tablosunu oluşturunuz?
50
23.7.2017
Selami ÖZCAN İstatistik
Soru 2: Aşağıdaki sayılar saat 24 ile 7 arasında bir telefon santraline
gelen toplam 911 çağrının 36 günlük dağılımını göstermektedir
22
30
17
63
11
8
51
76
27
30
41
41
34
6
35
48
26
64
38
23
19
28
37
65
32
23.7.2017
54
71
105
35
52
43
31
48
22
44
63
30
Selami ÖZCAN İstatistik
Soru 3: Aşağıdaki 60 adet veriyi önce basit
seriye sonra frekans serisine dönüştürünüz?
52
5,9
7,7
8,9
5,2
7,3
7,7
6,3
7,3
5,7
5,6
5,6
6,7
6,9
7
7,3
6,2
6,5
6,5
9,2
7,1
4,1
4,9
7,5
7,5
9,6
7,9
5,3
5,5
6,1
6,1
8,3
8,1
8,1
4,5
7,3
9,4
5,8
6,7
6,7
6,9
6,9
7,1
6,9
7,7
7,7
8,1
8,7
6,5
6,7
9,1
7,1
6,3
5,1
7,3
8,3
8,9
9,3
5,7
6
5,9
23.7.2017
Selami ÖZCAN İstatistik
Soru 4: Bir fabrikada çalışan işçilerin aylık ücretleri ve bu
ücreti alan işçilerin yüzde dağılımları şöyledir.

53
Aylık Ücret (*100 tl)
İşçi Yüzdesi
1000 den az
17,2
1000 - 1999
11,7
2000 - 2999
12,1
3000 - 3999
14,8
4000 - 4999
15,9
5000 - 5999
11,9
6000 – 6999
12,7
7000 ve üzeri
3,6
Yukarıdaki tabloyu kullanarak ;
a. 1.sınıf ne şekilde yazılmalıdır ki büyüklüğü 2.sınıfınkine eşit olsun?
b. Aylık 4000 tl ve üzeri ücret alan işçilerin yüzdesi kaçtır?
c. En az 3000 tl fakat 5000 tl den de az alan işçilerin yüzdesi kaçtır?
d. Aylık ücreti 6000 den az olan işçilerin yüzdesi kaçtır?
e. Yüzdeler toplamı neden %100 çıkmamıştır.?
23.7.2017
Selami ÖZCAN İstatistik
SORU 5 X yılı verilerine göre çalışanların çalışma
statüleri aşağıda gösterilmiştir. Sütun/bar ve pasta
grafiklerini çiziniz?






54
Ücretli çalışanlar 6.283.355
Mevsimlik/Yevmiyeli çalışanlar 1.347.728
İşverenler 1.118.950
Kendi hesabına çalışanlar 4.905.037
Ücretsiz/aile işçisi 6.129.021
Toplam 19.784.091
23.7.2017
Selami ÖZCAN İstatistik
Soru 6: 30 adet borunun et kalınlıkları mm olarak
ölçülmüş sırasıyla aşağıdaki değerler bulunmuştur

55
4,45
5,05
5,25
5,55
6,15
4,65
5,05
5,35
5,55
6,25
4,84
5,24
5,44
5,55
4,85
5,25
5,44
5,65
4,95
5,25
5,44
5,65
4,95
5,25
5,44
5,75
5,05
5,25
5,55
5,85

a. Sınıf sayısı 10 olacak şekilde sınıf aralığını bularak sınıfları oluşturunuz.

b. Sınıf alt ve üst sınır uçları ile sınıf değerlerini bulunuz.

c. Histogram ve frekans poligonunu çiziniz.
23.7.2017
Selami ÖZCAN İstatistik
Soru 7: İŞL 243 dersi ara sınav notları (n = 38)
15
34
47
51
62
54
50
23
36
47
63
58
60
52
24
41
65
73
71
75
63
54
32
41
55
64
74
82
59
33
56 45
74 34
82
26
95
46
a. Frekans tablosunu oluşturunuz.
b. Sınıf sayısını (2k > n  2k > 38  k = 6 (64 > 38) ve sınıf aralığını (max-min/ k) bulunuz
c. Sınıf sınırlarını ve sınıf orta noktasını bulunuz.
d. Histogram ve frekans poligonunu çiziniz.
e. Kümülatif frekans (ojiv) eğrisini çiziniz.
56
23.7.2017
Selami ÖZCAN İstatistik
Soru 8: İktisat 2. sınıfların yaşları aşağıdaki gibidir.(n=26)
17
21
20
25
25
18
23
24
22
19
25
19
22
24
21
25
26
19
22
18
27 19
26 20
23
22
a. Frekans tablosunu oluşturunuz.
b. Sınıf sayısını ve sınıf aralığını (max-min/ istenen sınıf sayısı) bulunuz
c. Sınıf sınırlarını ve sınıf orta noktasını bulunuz.
d. Histogram ve frekans poligonunu çiziniz.
e. Kümülatif frekans (ojiv) eğrisini çiziniz.
57
23.7.2017
Selami ÖZCAN İstatistik
ÜÇÜNCÜ BÖLÜM
 MERKEZİ
EĞİLİM (YER)
 ve
 DEĞİŞKENLİK
58
23.7.2017
ÖLÇÜLERİ
Selami ÖZCAN İstatistik
3. BÖLÜM: Sunum planı
1. Merkezi eğilim ölçüleri 2. Dağılım / değişim ölçüleri

Parametrik Merkezi eğilim
 Parametrik dağılım/değişim ölçüleri
ölçüleri (Duyarlı)
1. Değişim aralığı (Ranj)
1.
Aritmetik ortalama X
2. Kartil aralığı
2.
Geometrik ortalama G
3. Desil aralığı
3.
Harmonik ortalama H
 Parametrik olmayan dağılım/değişim ölçüleri
4.
Kareli ortalama K
– Ortalama sapma

Parametrik olmayan merkezi
– Varyans
eğilim ölçüleri (Duyarsız)
– Standart sapma
1.
2.
3.
59
Mod
Medyan
Kantiller (kartiller, desiller,
pörsentiller)
23.7.2017
–
Değişim katsayısı
Selami ÖZCAN İstatistik
1. Merkezi Eğilim Ölçüleri
bir veri kümesinin ortasını belirleme eğiliminde olan sayısal değerdir.
Gözlem değerlerinin etrafında toplanma eğilimi gösterdiği değerdir.
Parametrik Merkezi eğilim ölçüleri Parametrik olmayan merkezi eğilim ölçüleri
(Duyarsız Ortalamalar)
(Duyarlı ortalamalar: serideki
tüm gözlem değerlerinden etkilenen
ortalamalardır.)
1.
2.
3.
4.
1.
Aritmetik ortalama X:Deneklerin
aldıkları değerlerin toplanıp denek
sayısına bölünmesiyle elde edilen
değerdir
Geometrik ortalama G=
Harmonik ortalama H=
Kareli ortalama K=
2.
3.
4.
Medyan (ortanca):Bir ölçek üzerinde
orta noktanın yerini gösteren bu
ölçü tüm değerleri ortadan ikiye
bölen değerdir
Mod:Ölçümlerde en fazla tekrar
edilen değere mod denir
Kantiller (kartil desil pörsentil)
Ortalama kartil
•Parametrik merkezi eğilim ölçülerindeki ortalamaların değeri, serinin herhangi bir biriminin
değeri değiştiğinde değişir. Yani değişikliklere duyarlı olan ortalamalar.
•Parametrik olmayan merkezi eğilim ölçülerindeki ortalamaların değerinin değişmesi için bu
ortalamaların hesabında kullanılan birimlerin değerinin değişmesi gerekir.
60
23.7.2017
Selami ÖZCAN İstatistik
k
Aritmetik Ortalama ͞x
X
f
i
 Xm
i 1
n
Serideki bütün rakamlardan etkilenen ve en çok kullanılan
ortalamadır.
Özellikleri:
• Duyarlı bir ortalamadır, aşırı değerlerden etkilenir.
• Gözlem değerlerinin aritmetik ortalamadan sapmaların
toplamı sıfırdır. (x-x)=0
• Gözlem değerlerinin aritmetik ortalamadan sapmaların
kareleri toplamı minimumdur.(x-x)²=min
61
23.7.2017
Selami ÖZCAN İstatistik
Basit Serilerde Aritmetik Ortalama: ͞x= Σx/n
Puan toplamlarının veri sayısına bölümüdür.
Örnek1
X
Örnek 2:
X
10
95
12
88
18
73
20
67
Top.60
59
X=60/4=15
46
X 
X
1

X
2

X
3
n
35
26
23
Top:
23.7.2017
512
X=512/9=56,88
62
Frekans Serisinde Aritmetik Ortalama
X f fx
͞x=Σfx/Σf X=69/10=6,9
4 1 4
5 2 10
7 4 28
9 3 27
Σf=10 Σfx=69
63
23.7.2017
Selami ÖZCAN İstatistik
Gruplandırılmış Seride Aritmetik Ortalama
Gruplar Frekans
Ort değ.(x)
fx
2-4
2 [(2+4)/4] 3
6
5-7
13
6
78
8-10
4
9
36
11-13
1
12
12
Σf=20
Σfx=132
X=132/20=6,6
64
23.7.2017
Selami ÖZCAN İstatistik
Tartılı Aritmetik Ortalama
bir serideki değerler arasında önem derecesi farklı oluyorsa bu tür
serilerin aritmetik ortalaması tartılı olarak hesaplanır. Bunun için
önem düzeyini gösteren katsayılar (tartılar) kullanılır.
Basit seride:
Xt= Σtx/Σt
frekans serisinde:
Xt=Σtfx / Σtf
Gruplandırılmış seride:
Xt=Σtfm/Σtf
Örnek: aşağıda öğrencinin almış olduğu
dersler ve kredileri verilmiştir. Tartılı
ortalamasını hesaplayınız.
Dersler
Not(X) Kredi(t) t X
Üretim Yönetimi 85
3
255
İstatistik
89
3
267
İktisat
55
4
220
Matematik
60
2
120
Pazarlama
100
3
300
Toplam
Σt=15 Σtx=1162
tX=1162/15=77,47
66
23.7.2017
Selami ÖZCAN İstatistik
Geometrik ortalama (G)
Serideki n tane birimin çarpımının n inci
dereceden kökü alınarak hesaplanır.
G=n√ x1.x2.x3…..xn (basit)
logG=1/n(logx1+logx2+.logxn)
Örnek (basit) X=10,12,18,20
G=4√10x12x18x20=4√43200≈14.42
LogG=1/4 (log10+log12+log18+log20)
LogG=1/4(1.0000+1.0792+1.2553+1.3010=4.6355)
Log G=1/4 (ΣlogX)=4,6355/4=1.1589 x10 G=11.589
(Açıklama: Log G yi G ye çevirmek için logG yi 10 ile çarparız. Yani G=10 log G)
G= Σf√X1f1 . X2f2.
…X fn(frekans
n
ve grup )
Log G=1/ Σf . [f1logX1 + f2logX2+
….+log Xn]
67
23.7.2017
Örnek (frekans) X=4,5,7,9
f=1, 2, 4, 3=10
Log X=0.6021, 0.6990, 0.8451, 0.9542
f. logX=(1x0.6021)+(2x0.6990)+(4x0.8451)+(3x0.9542)
=8.2431
LogG=1/ Σf .(fxlogX)= 8.2431/10=0,8243
Log G=1/10. (0.6021+1.398+3.3804+2.8626)=8.2431
Log G= (1/Σf ). (fxLog X)=8.2431/10=0.8243
G=10 x 0.8243=8.2431
Örnek (grup)2-4, 5-7, 8-10, 11-13
Sadece grupların orta noktası bulunarak yapılır.
Selami ÖZCAN İstatistik
HARMONİK ORTALAMA (H)
Serideki birimlerin çarpmaya göre
terslerinin aritmetik ortalamaya göre
tersleridir. Seride 0 veya negatif
bulunması durumunda H
hesaplanamaz
H=n/Σ(1/x) basit seri için
H= Σf/ Σ(f/x) frekans ve gruplandırılmış
seri için

Örnek: x=10, 12, 18, 20 basit seride harmonik ortalamayı
bulunuz?


1/X=1/10+1/12+1/18+1/20=
0,1000+0,0833+0,0556+0,0500=0,2889
H=n/Σ(1/x) =4/0,2889= 13,85
Örnek: frekans serisinin harmonik ortalamasını bulunuz?
X=4, 5, 7, 9 f=1, 2, 4, 3=10
H= Σf/ Σ(f/x)=10/(1/4+2/5+4/7+3/9)=
H=10/(02500+0,4000+0,5714+0,3333)=10/1,5547=6,43
Örnek: gruplandırılmış serinin harmonik ortalaması nedir?
X=2-4, 5-7, 8-10, 11-13 f=2, 13, 4, 1=20

önce ortalamalar bulunur. X= 3, 6, 9, 12 sonra f/x ler yani 2/3,13/6,4/9,1/12
H= Σf/ Σ(f/x)=20/(0,6667+2,1667+0,4444+0,0833)=5,95
68
23.7.2017
Selami ÖZCAN İstatistik
KARELİ ORTALAMA (K)

Seriyi oluşturan gözlem değerlerinin karelerinin
toplamının gözlem sayısına oranının kare köküdür.

K=
K=
√∑X²/n
√∑fX²/ ∑f
basit seriler için
frekans ve grup serileri için
Örnek: x=10, 12, 18, 20 basit serinin kareli
ortalamasını bulunuz?
X²=100 +144+324+400=968
K=
Örnek: X=4, 5, 7, 9 f=1, 2, 4, 3=10 frekans serisinin
kareli ortalamasını hesaplayınız?
K=


X²= 16+25+49+81=
f X²=1x16+2x25+4x49+3x81=505

K=
√∑fX²/ ∑f=√505/10=7.11
Örnek:
√∑X²/n=√968/4=15.56

Grup=2-4, 5-7, 8-10, 11-13 f=2, 13, 4, 1=20 gruplandırılmış
serinin kareli ortalamasını bulunuz? Önce orta nokta bulunur.
X= 3, 6, 9, 12 sonra X² = 9, 36, 81, 144 f=2, 13, 4, 1=20
fx ² =2x9+13x36+81x4+144x1=954

K=


69
√∑fX²/ ∑f frekans serisi ve gruplandırılmış seri için

23.7.2017
√∑fX²/ ∑f= √954/20=6.91
Selami ÖZCAN İstatistik
Parametrik olmayan merkezi eğilim
ölçüleri (Duyarsız Ortalamalar)
Duyarlı olmayan ortalamalar: seriyi oluşturan tüm
gözlem değerlerinin büyüklüklerinden etkilenmeyen
ortalamalardır.



70
Medyan
Mod
Kantiller
– Kartiller
– Desiller
– Pörsentiller
23.7.2017
Selami ÖZCAN İstatistik
MEDYAN (Orta Değer, Ortanca)
Büyükten küçüğe, küçükten büyüğe doğru sıraladığımızda tam ortaya düşen değer (iki değerin
ortalaması) seriyi iki eşit parçaya bölen gözlem değeridir. N=toplam frekans, basit ve frekans
serilerinde (N+1)/2 medyandır. Gruplandırılmış seride kaçıncı değerin medyan olduğunu bulmak
için “.. den az kümülatif frekanslar bulunur. (N+1)/2 değerinin içerisinde yeraldığı kümülatif
frekans gruplandırılmış seride medyan sınıfını ifade eder. Frekans ve gruplandırılmış serilerde
çok sayıda değer olacağı için 1 dikkate alınmayabilir. Yani N/2 olur.
N/2=medyanı gösteren değer
N
L=medyan sınıfının alt sınırı

f m 1
N=toplam frekans (∑f)
2
Medyan

L

xhm
1
fm-1=medyan sınıfına kadar sınıfların frekansları toplamı
fm
fm=medyan sınıfının frekansı
hm=medyan sınıfının büyüklüğü

Medyan sıralamalı ölçeklerle elde edilen veriler için uygun bir merkezi eğilim ölçüsüdür.

Medyanda ölçümlerin her birinin puan değerinden çok dağılım içindeki sırası önemlidir.

71
23.7.2017
Selami ÖZCAN İstatistik
Basit seride medyana örnek

72
Basit seri:
– tek sayı ise: ham veri: 2,2,3,7,4,5,6
basit seri: 2,2,3,4,5,6,7 (4 medyan)
– çift: 10, 12, 8, 4, 9, 3
sırala 3, 4, 8, 9, 10, 12
(8+9)2=8,5 medyan
Örnek (çift)
X
N=(4+1)/2=2,5 yani 2. ve 3. değerlerin ortalaması 12+18/2=15 medyan
10
12
18
20
23.7.2017
Selami ÖZCAN İstatistik
Frekans serisinde Medyana Örnek
Örnek 1: tek ise: x=2,4,6,8,10
f=2,4,3,5,1=15
15/2= 7.5 frekansa karşılık gelen X değeri medyandır.
küm.f=2, 6, 9,14, 15= 7,5 değeri 6’dan büyük olduğu için frekansı 9 olan x değeri 6 medyandır.
Örnek 3: çift ise X=4,5,7,9 f=1,2,4,3 küm.f=1,3,7,10 N+1/2 yani 10+1/2=5,5 değer medyandır.
5,5 değer 5 ten büyük olduğu için bir sonraki değer olan 7 nin içinde yer alır. Küm.frekansı 7 olan 7
değeri medyandır. Örnek 3:
73
23.7.2017
Selami ÖZCAN İstatistik
Gruplandırılmış seride medyan formülü
ve notasyonları
N
Formuldeki notasyonlar
  f m 1
xhm
N/2=medyanı gösteren değer Medyan  L1  2
fm
L=medyan sınıfının alt sınırı
N=toplam frekans (∑f)
fm-1=medyan sınıfına kadar sınıfların frekansları toplamı
fm=medyan sınıfının frekansı
hm=medyan sınıfının büyüklüğü
Çok sayıda değer olacağı için sınıflama/gruplama
yüzünden yaklaşık medyan değeri bulunur.
74
23.7.2017
Selami ÖZCAN İstatistik
N
  f m 1
2
Medyan  L1 
xhm
fm
Örnek 1: Aşağıdaki sınıflandırılmış serinin
medyanını bulunuz?
X
2-4
5-7
8-10
11-13
f
küm.f. ..den az küm.f. .den çok küm.f.
2
2
2
20
13
15
15
18
4
19
19
5
1
20
20
1
=20
20/2=10
Küm.Frekans
20
15
10
5
Çözüm 1: 10. Değer 15 frekansın içindedir. Çözüm 2: Grafik
0
metodu: ”..den az
Küm frekans=15 5-7 sınıfı göstermektedir.
ve ..den çok”
değerleri aynı
Alt sınır:4,5 Üst sınır:7,5 büyüklüğü 3 tür.
grafikte gösterilirse
Medyan sınıfının bir önceki küm.frekansı 2,
x eksenindeki
Medyan sınıfının frekansı:13 tür.
kesişim noktası
medyandır.
Medyan:4,5+[(10-2)/13 ]x3=6,35
75
23.7.2017
3
6
9
6,35
Selami ÖZCAN İstatistik
12
15
Gruplar
Örnek 2: Aşağıdaki sınıflandırılmış serinin
medyanını bulunuz?
X
10-14
14-18
18-22
22-26
26-30
76
f
3
4
8
6
1
=22
küm.frekans
3
7
15
21
22
22/2=11
..den az serisinin 11. gözlem değeri
18-22 sınıfı medyan sınıfıdır.
L=18,
N/2=11
fm-1=7
fm=8
hm:4
Medyan: 18+ [(11-7)/8] x 4=20 medyan
sınıfının içinde yer alıyor.
23.7.2017
Selami ÖZCAN İstatistik
Örnek3: Aşağıdaki dağılımın ortalama ve medyan değerini
hesaplayın.
Sınıf
15-27
28-40
41-53
54-66
67-79
80-92
93-105
Küm f
4
9
18
30
35
37
38
f
4
5
9
12
5
2
1
k
X 
f
i 1
i
 Xm
n
Rel f
.11
.13
.24
.32
.13
.05
.02
Küm Rel f
.11
.24
.48
.80
.93
.98
1.00
2033

 53.5
38
Sınırlar
14.5-27.5
27.5-40.5
40.5-53.5
53.5-66.5
66.5-79.5
79.5-92.5
92.5-105.5
Orta Nokta
21
34
47
60
73
86
99
 n 2  Cf L 
Md  x L  i 

f
i


 38 2  18 
M d  53.5  13
 54.58

 12

Örnek 4: işletme 2. sınıf öğrencilerinin yaşlarının oluşturduğu sınıf ve
frekansları aşağıdaki gibidir. Dağılımın ortalama ve medyan değerini
bulunuz?
Sınıf
17-18
19-20
21-22
23-24
25-26
27-28
Çetele
///
//// /
//// /
////
//// /
/
k
X 
78
f
i 1
i
 Xm
n
f
3
6
6
4
6
1
Küm f Rel f Küm Rel f Sınırlar
3
.12
.12 16.5-18.5
9
.23
.35 18.5-20.5
15
.23
.58 20.5-22.5
19
.15
.73 22.5-24.5
25
.23
.96 24.5-26.5
26
.04
1.00 26.5-28.5
Orta Nokta
17.5
19.5
21.5
23.5
25.5
27.5
 26 / 2   9 
573
M

20
.
5

2
 21.80
d

 22.04


6


26
23.7.2017
Selami ÖZCAN İstatistik
Diğer örnekler
79
(35+1/2=18. 20 nin içinde grup 55-57 medyan sınıfı)
54.5+{[(35/2)-14] /6}x3=56,25 medyan
23.7.2017
Selami ÖZCAN İstatistik
Sınıflandırılmış/Gruplandırılmış serinin
grafikle gösterimi
k.f.
20
Grafik Metodu ile
Medyan
 “..den az kümülatif
frekans eğrisinin
kesiştiği
noktasındaki X
değeridir.
Medyan
değeri: 6.15
15
10
5
Gruplar
0
80
3
6
9
23.7.2017
12
15
Selami ÖZCAN İstatistik
Mod (Tepe Değer)
Mod ya da tepe değer, bir seride (puan dağılımında) en çok tekrar eden, yani
frekansı en fazla olan puan ya da ölçümdür.
Tepe Değer (Mod) ile ilgili bazı önemli noktalar
1)
Bir puan dağılımında puanların frekansı aynı ise dağılımın modu hesaplanamaz (mod yoktur).
Örneğin; 1,1,1,5,5,5,7,7,7 puan dağılımının modu yoktur.
2)
Bir dizi puan dağılımında ardı ardına gelen iki puanın frekansı birbirine eşitse bu durumda mod
frekansı eşit olan puanların ortalamasıdır. Örneğin; 2,2,3,3,3,5,5,5,9,9 puan dağılımında 3 ve 5
puanlarının frekansları birbirine eşittir. Bu durumda mod (3+5)/2=4 olarak bulunur.Dizinin modu 4
3) Bir dizi puan dağılımında frekansı eşit fakat ardı ardına gelmeyen puanlar varsa, bu durumda dizinin iki
modu olur. Örneğin; 2,3,3,3,4,5,6,6,6,7 puan dağılımının 3 ve 6 olmak üzere iki modu bulunmaktadır.
Bir sayı setinde elemanların hepsi birbirinden farklı ise bu basit serinin modu yoktur.
Basit seriye Örnek1: 60,72,82,72,61,81,72 ise Mod=72’dir.
Örnek 2: x=1,1,2,1,3,2,2,1,1,3,5,4,1,1,2 en çok tekrar edilen 1 modtur.
Örnek 3: 5, 7, 12, 28, 40, 35 mod yoktur
Örnek 4:10,12,18,20 mod yoktur.
Frekans seriye Örnek 1: X=2,3,4,5 f=2,4,7,1 en büyük frekans 7, mod değeri ise 4
Örnek 2: x=4,5,7,9 f=1,2,4,3 frekansı (4) en yüksek x değeri 7 modtur.
Güvenirliğinin düşük olması nedeniyle nadiren kullanılır. Çünkü bazı durumlarda dağılımın çarpık olması nedeniyle birden
fazla mod bulunabilir.
81
23.7.2017
Mod:en büyük frekans bir gözlem değerine değil, bir sınıfa karşılık
gelmektedir. Bu sınıfa mod sınıfı denir
Sınıf/Gruplandırılmış Serinin Modu Örnek 1
Örnek 1: Gruplar=2-4, 5-7, 8-10, 11-13 frekans: 2, 13, 4, 1 =20, L=4,5 (alt sınır), önceki fark:13-2=11
sonraki fark:13-4:9 sınıf büyüklüğü:7,5-4,5:3
L = mod sınıfının alt sınırı
Mod: 4,5+11/(11+9) x 3= 6,15
Örnek 2:
1
∆1= mod sınıfı frekansı ile
Mod  L1 
xhm ondan bir önceki sınıfın
1   2
frekansları arasındaki
mutlak fark
∆2= mod sınıfının frekansı
ile ondan bir sonraki sınıfın
frekansları arasındaki fark
hm= sınıf aralığı, mod
sınıfının sınıf büyüklüğü
82
23.7.2017
Selami ÖZCAN İstatistik
Örnek 1’in Grafik Metodu ile Çözümü
Gruplar=2-4, 5-7, 8-10, 11-13 frekans: 2, 13, 4, 1 =20, L=4,5 (alt sınır), önceki fark:13-2=11
sonraki fark:13-4:9 sınıf büyüklüğü:7,5-4,5:3
Mod: 4,5+11/(11+9) x 3= 6,15
Frekans
15
10
5
1,5
83
4,5
7,5
10,5
13,5 Gruplar
Mod:6,15
23.7.2017
Selami ÖZCAN İstatistik
Örnek 3 ve 4
Mod değerinin mod sınıfı içinde kaldığına dikkat ediniz.
Birden fazla aynı değerde frekans varsa iki yada daha çok
gözlem değeri veya sınıf bulunabilir.
İlgili frekans serisi sınıflandırılarak , sınıflandırılmış seri ise
farklı bir sınıf aralığında yeniden sınıflandırılmalıdır.
Örnek 4: frekans Yeniden sınıflandırılır.
10-20
4
10-30
11
20-30
7
30-50
40
30-40
22
50-70
37
40-50
18
70-90
12
50-60
22
Toplam 100
60-70
15
Mod:30+(29/(29+3)) x 20=48,125
L=18, ∆1= 7-4=3 , ∆2= 7-5=2 hm=4
70-80
7
80-90
5
Toplam
100
Örnek 3:
Sınıflar Frekans Küm.frekans
10-14
2
2
14-18
4
6
18-22
7
13
22-26
5
18
26-30
3
21
Toplam 21
3
Mod  18 
x 4  20,4
3 2
84
23.7.2017
Selami ÖZCAN İstatistik
Mod < Medyan < Ortalama
Mod
Medyan
Ortalama
Ortalamalar
arasındaki ilişki
Simetrik
Ortalama < Medyan < Mod
0
Sağa çarpık dağılım
Sağa eğik
X
Mod Medyan X
100
0
Sola çarpık dağılım
Sola eğik
X Mod Medyan
Mod
Medyan
Mod=Medyan= X
85
X > Medyan > Mod
23.7.2017
100
Mod > Medyan > X
Selami ÖZCAN İstatistik
23.7.2017
86
Dağılımda Çarpıklık: Negatif Çarpık
Dağılım
Puanların çoğu dağılımın sağ tarafına yığılmıştır.
Sola çarpık: Sınıf başarısı yüksek.
Ortalama<Medyan<Mod. Sorular ve test kolaydır.
23.7.2017
87
Dağılımda Çarpıklık: Pozitif Çarpık
Dağılım
Puanların çoğu dağılımın sol tarafına yığılmıştır.
Sağa çarpık: Sınıf başarısı düşük.
Mod<Medyan<Ortalama. Sorular ve test zordur.
23.7.2017
88
23.7.2017
89
KANTİLLER
KARTİLLER, DESİLLER, PÖRSENTİLLER
90
1. Kartiller: büyüklük sırasına konulmuş bir seriyi 4 eşit parçaya böler.Bir
seride 3 kartil bulunur. 2. kartil medyandır. Q1, Q2, Q3 ile gösterilir.
Basit ve frekans serisinde kartil: Q3=3x(N+1)/4 Q1=N+1/4 Q2=2x(N+1)/4
Sınıf/gruplandırılmış serilerde kartil:
Q1=L+[(N/4)-∑f/fQ1 ] x hm
Q2=L+[(2.N/4)-∑f/fQ2 ] x hm
Q3=L+[(3.N/4)-∑f/fQ3 ] x hm
2. Desiller =D9, D1 dir. (seriyi 10 eşit parçaya böler)
Basit ve frekans serisinde desiller: D3=3x(N+1)/10 D1=N+1/10 D2=2x(N+1)/10
Grup serilerde desiller: D1=L+[(N/10)-∑f/fD1 x hm D2=L+[(2.N/10)-∑f/fD2 x hm
D3=L+[(3.N/10)-∑f/fD3 x hm
3. Pörsentiller =D99-D1 dir. (seriyi 100 eşit parçaya böler)
Basit ve frekans seride Pörsentiller: P3=3x(N+1)/100 P1=N+1/100
P2=2x(N+1)/100
Grup serilerde pörsentiller: D1=L+[(N/100)-∑f/fP1 x hm P2=L+[(2.N/10)-∑f/fP2 x hm
P3=L+[(3.N/100)-∑f/fP3 ] x hm
23.7.2017
Selami ÖZCAN İstatistik
2. Dağılım/Değişkenlik Ölçüleri
Dağılım / değişim ölçüleri
 Parametrik dağılım/değişim ölçüleri
1. Değişim aralığı (Ranj)
2. Kartil aralığı
3. Desil aralığı
 Parametrik olmayan dağılım/değişim ölçüleri
–
–
–
–
91
Ortalama sapma
Varyans
Standart sapma
Değişim katsayısı
23.7.2017
Selami ÖZCAN İstatistik
Parametrik olmayan dağılım/değişim ölçüleri
1.
2.
3.
92
Değişim aralığı (Ranj)
Kartil aralığı, yarı kartil aralığı
Desil aralığı, yarı desil aralığı
23.7.2017
Selami ÖZCAN İstatistik
Değişim Aralığı (Ranj):DA
En büyük ölçümle en küçük ölçüm arasındaki farktır. gruplandırılmış
serilerde en yüksek sayıdan en küçük sayının çıkarılması ile bulunur.
 DA serinin değişkenliği hakkında zaman kaybetmeden genel bilgi verir.
 Dezavantajı:serideki bütün birimlerin hesaplamaya girmemesi sadece iki
değerle hesaplamanın yapılması, aşırı değerlerin direkt etkisindedir.
 DA= Xmax-Xmin
 Örnek: basit seri: X=30,32,35,36,37 y=2,14,20,44,90
DA(x)=37-30=7 DA (y)=90-2=88
 Örnek: Frekans serisi x:4,5,7,9 f:1,2,4,3 DA=9-4:5
 Örnek: sınıflandırılmış seri: sınırlar:1-3,3-5,5-7,7-9 f=1,2,4,3 DA:9-1:8

93
23.7.2017
Selami ÖZCAN İstatistik
Ranj (Değişim Aralığı) Örnek
Birinci Dağılım: 59, 59, 59, 60, 61, 61, 61 ise Ranj=?
Ranj (DA)= 61-59=2
İkinci Dağılım: 30, 40, 50, 60, 70, 80, 90 ise Ranj=?
Ranj (DA)= 90-30=60
Bu iki dağılımda aritmetik ortalama ve medyanlar eşit
olmasına karşın ranjları farklıdır.
Dağılımın ranjı azaldıkça dağılımdaki puanlar birbirine
yaklaşır ya da benzeşir, ranj arttıkça puanlar birbirinden
uzaklaşır ya da puanlar arası fark artar.
23.7.2017
94
Kartil (çeyrek sapma) Aralığı
Desil (onda bir sapma) Aralığı
Pörsentil (yüzde 1 sapma)Aralığı








95
Kartil aralığı 3. kartilden 1. kartil çıkarılarak bulunur.
En büyük ve en küçük %25 dikkate alınmadığı için Değişim
Aralığına göre uç değerlerden daha az etkilenir. Dezavantajı
hesaplamaya bütün değerlerin katılmaması
Kartil Aralığı= Q3-Q1 dir.
Yarı Kartil Aralığı=(Q3-Q1)/2 (seriyi 4 eşit parçaya böler)
Desil Aralığı=D9-D1 dir.
Yarı Desil Aralığı=(D9-D1)/2 (seriyi 10 eşit parçaya böler)
Pörsentil Aralığı=D99-D1 dir.
Yarı Pörsentil Aralığı=(D99-D1)/2 (seriyi 100 eşit parçaya böler)
23.7.2017
Selami ÖZCAN İstatistik
Kartil: Çeyrek Sapma
Çeyrek sapma, bir dağılımdaki üçüncü çeyrek (75.yüzdelik) ile birinci
çeyrek (25.yüzdelik) arasındaki farkın yarısına eşittir. Aritmetik ortalama
yerine medyanın kullanıldığı durumlarda kullanılması uygundur.
23.7.2017
96
Aşağıda 20 öğrencinin İngilizce sınavından aldığı notlar küçükten
büyüğe doğru sıralanarak verilmiştir. Çeyrek sapmayı
hesaplayalım:
15,17,20,21,25,30,33,40,43,47,50,55,57,60,65,70,73,77,80,84
25. yüzdelik için (Y25)= 20(25/100) = 5. puan (25)
75. yüzdelik için (Y75)= 20(75/100) = 15. puan (65)
Bu durumda çeyrek sapma  (65-25)/2=20 olur.
23.7.2017
97
Baştan % 25. not 25 ve sondan % 75. not 65
olduğuna göre bu notların aritmetik ortalamadan
ne kadar saptığını çeyrek sapma yaklaşık olarak
vermektedir.
46,05  25  21 ve 65 - 46,05  19
23.7.2017
98
Örnek: Çeyrek Sapma
23.7.2017
Puan Aralığı
f
Toplamalı
Frekans
Aralığın Gerçek
Sınırı
21,00-25,00
1
1
20,50-25,50
26,00-30,00
1
2
25,50-30,50
31,00-35,00
2
4
30,50-35,50
36,00-40,00
6
10
35,50-40,50
41,00-45,00
6
16
40,50-45,50
46,00-50,00
7
23
45,50-50,50
51,00-55,00
1
24
50,50-55,50
99
100
23.7.2017
100
101
23.7.2017
101
Parametrik dağılım/değişim ölçüleri
Paremetrik olmayan dağılım ölçüleri serideki bütün değişkenleri dikkate
alarak ölçmesi, fakat paremetrik dağılım ölçülerinde ise serideki
rakamların aritmetik ortalamadan sapmalarını dikkate alır.
– Ortalama sapma
– Varyans
– Standart sapma
– Değişim katsayısı
102
23.7.2017
Selami ÖZCAN İstatistik
Ortalama Sapma





103
Serideki rakamların aritmetik
ortalamadan farklarının toplamı sıfırdır.
Ortalamadan farkların bir kısmı negatif
bir kısmı pozitiftir. Toplarsan sıfır olur.
Hesaplama mutlak değerlerin toplamı
rakam sayısına bölündüğünde os
bulunur. Formül yandaki gibidir.
Medyan etrafındaki ortalama sapmanın
minimum olmasıdır.
Basit seride
Frekans serisinde
Sınıflandırılmış/gruplandırılmış seride
23.7.2017

xx
OS 
basit
n

 f xx
OS 
f
frekans

 f xx
OS 
f
grup
Selami ÖZCAN İstatistik
Varyans



Aritmetik ortalamanın

(
x

x
)2
2
 
basit seride büyük örnekler icin var yans
özeliklerinden biri ∑(xn
͞x)²=minimum olmasıdır.
 x2  x 2
2
Fark karelerin toplamını
 
(
) yukarideki nin acilimi
n
n
serideki rakam sayısına
böldüğümüzde varyans elde    f ( x  x) frekans/gr up seride büyük örnekler icin varya ns
f
edilir.
Örnek sayısı büyüdükçe n
2
2



fx

fx
ile n-1 arasında fark kalmaz.  2 
 yukarıukarnin acıcılı
 

2
2

f
104
23.7.2017
f 
Selami ÖZCAN İstatistik
Standart Sapma
2
(
X

X
)

S
n 1
Örnek2: 78,89,56,36,48,92,59,60=S=19.8
Standart Sapma: Ölçümlerin ortalamadan olan farklarının karelerinin ortalamasının
kareköküdür.

Standart sapma varyansın pozitif kareköküdür.

Standart hata: Aritmetik ortalamada oluşan hatanın belirlenmesi için bulunur.


Örnek1: basit seri x=1,4,5,7,9,10 ͞x=36/6=6
( xi  x) 2
56
(x-͞x)=1-6,4-6,5-6,7-6,9-6,10-6 = -5,-2,-1,1,3,4=
 

 3,055
n
6
(x-͞x)²=25,4,1,1,9,16=56



 
( xi  x) 2
 
n 1
( xi  x ) 2
basitseri  
n
 
 f ( xi  x) 2
frekans ve sin iflandiril mis serilerde s tan dart sapma
f
 
 fx 2   fx 
 fu 2   fu 
 sin if sayisi tek ve kodlanmis serilerde   c.

 
 
f

f

f

f



23.7.2017
Selami ÖZCAN İstatistik
 x2   x 


n
 n 
2

2
105
2
Frekans Serilerde Standart Sapma
X
f
x.f
x-͞x
(x-͞x)²
(x-͞x)². f
4
1
4
-3,25
10,5625
10,5625
6
3
18
-1,25
1,5625
4,6825
7
6
42
-0,25
0,0625
0,375
8
4
32
0,75
0,5625
2,25
10
2
16
20
116
2,75
7,5625
15,125
33
Frekans serisinin ortalaması
 2


 x  x  . f
X=∑x.f / ∑f=116/16=7,25

  33  2,0625  1,436140


Frekans serisinin standart sapması
f
106
23.7.2017
16
Selami ÖZCAN İstatistik
Gruplandırılmış seri(orta noktalar bulunur veya
(kodlama metodu)
Gruplar
f
u=kod
f. u
u²
f.u
10-14
6
-2
-12
4
24
15-19
6
-1
-6
1
6
20-24
10
0
0
0
0
25-29
9
1
9
1
9
30-34
Toplam
9
40
2
0
18
9
4
10
36
75
2
 fu   fu 
75  9 
  5.
 c
 
    6,75
f
40  40 
f 
2
107
23.7.2017
2
Selami ÖZCAN İstatistik
Standart sapma

Bir veri dizisinde standart sapmayı hesaplamak için önce aritmetik ortalama bulunur ve her
veriyle aritmetik ortalamanın farkının karesi şeklinde hesaplanarak aşağıdaki formülle dizinin
standart sapması hesaplanır.
N
Sx 
 (X
i 1
i
 X)
N
2
 21,9
 ÇEYREK SAPMA değişim hakkında kaba bir sonuç
verir.
 SS verilerin oluşturduğu dizinin homojenliğiyle ilgili
bilgi verir.
23.7.2017
108

23.7.2017
Gruplandırılmış Frekans tablosuyla verilen
dizinin standart sapması, aşağıdaki formül ile
hesaplanır:
N
2
f
(
X

X
)

i
i
S x  i 1
N -1
109
Standart Sapmanın Özellikleri




SS, bir veri grubunun ortalaması etrafındaki
dağılımını belirlemek amacıyla kullanılır.
Negatif değerler almaz.
Veri grubundaki tüm değerler aynı ise SS
sıfırdır.
SS veri grubundaki uç değerlere karşı duyarlı
olup tek bir uç değer dahi değerini artırabilir.
Yani, dağılımı çarpık hale getirir.
23.7.2017
112
Standart Sapma ve Aritmetik Ortalama
Arasındaki İlişki
Aritmetik ortalama ile standart Heterojen yapı oluşur ve grup
sapmanın arası büyürse,
başarısı düşer.
Aritmetik ortalama ile standart Homojen yapı oluşur ve grup
sapmanın arası küçülürse,
başarısı artar.
Bir puan dağılımında puanlar
arası fark (ranj) büyüdükçe,
Standart sapmada büyür.
Bir testten elde edilen
puanların standart sapması
büyüdükçe,
Testin güvenirliği artar.
23.7.2017
113
Standart Hata

Standart sapmayla ilgili bir kavram da ortalamanın standart
hatasıdır. Bir dağılımda standart hata, standart sapmanın örneklem
sayısının kareköküne bölünmesiyle hesaplanır.
SH 
23.7.2017
Sx
N
114
Değişim Katsayısı: DK
Aynı seri farklı ölçü birimleriyle farklı standart sapmaya sahip olabilir, farklı
ölçü birimleriyle hesaplanan iki ayrı serinin mukayesesi de doğru değildir. Bu
olumsuzlukları gidermek için değişim katsayısı geliştirilmiştir. Mutlak
değişkenlik ölçüleri,seriyi oluşturan gözlem değerlerinin büyüklüklerinin de
etkisi altındadır. Mutlak değişkenlik yerine nispi değişim/dağılım esas
alınmıştır. Standart sapma aritmetik ortalamanın yüzdesi olarak ifade
edilmiştir.
 DK=(s/ ͞X) x 100 Ortalaması 15, standart sapması 4,76 olan serinin DK ne
olur? DK:(4,76/15) x 100=%31,73
x=10,11,13,14,17/65 (͞x=13, ss=2,7386) y=43,48,58,63,73/285 (y=57 ss=11,9373)
ssx küçük ssy. DKx=2,7386/13 x 100=%21,066 DKy=11,9373/57 x100=%20,9426
X serisindeki değişkenlik y serisine göre daha fazladır.

115
23.7.2017
Selami ÖZCAN İstatistik
BÖLÜNMENİN ŞEKLİNE GÖRE OLUŞAN
ÖLÇÜLER




Şu ana kadar serilerdeki ortalama ve değişkenliği inceledik,
bu yetmez. Bölünme şeklini ortaya koyan ölçülere de ihtiyaç
vardır.
Seriler: simetrik (X=Med=Mod) veya asimetrik (X>Med>Mod
sağa çarpık seri ve X<Med<Mod sola çarpık seri) bölünür.
Aritmetik ortalama ile mod veya medyan arasındaki fark
pozitif ise sağa çarpık, negatif ise sola çarpık denir.
Seriler: normal, sivri ve basık serilerden birine göre de
bölünebilir.
Bölünme şekline göre oluşan ölçüler,
–
–
–
Momentler,
Çarpıklık ve
Basıklık
Bölünme şekline göre
oluşan ölçüler,
– Momentler,
– Çarpıklık
ve
– Basıklık
117
23.7.2017
Selami ÖZCAN İstatistik
MOMENTLER
Ortalamalara (kantillere) dayanan asimetri ölçüsü
yaklaşık bir değerdir. Asimetriyi daha duyarlı
ölçmek için momente dayanan ölçüm yapılması
gerekir.
Sıfıra (x-0=x ) veya aritmetik ortalamaya (x-x ) göre
sapmaların tamamına moment denir.
Bir seride sıfır (aritmetik ortalama) etrafındaki r.
Momente (µr.) Momenti denir.
Mr=£Xʽ/n (0 için basit serinin momenti)
Mr=£(X-X )ʽ/n (X için basit serinin momenti)
µr=£fxʽ/£f (0 için frekans ve gruplandırılmış serinin
momenti)
µr= £f(x-xort)ʽ/£f (X için frekans ve gruplandırılmış
serinin momenti)
Sıfır etrafındaki 1.Moment aritmetik ortalamaya eşit,
2.momentin karekökü kareli ortalamaya eşittir.
M1=0, M2=S²(varyans)
µ2=M2-M²1
µ 3= M3-3M1M2+2M³1
µ 4= M4-4M1M3+6M²1M2-3M‘1
i
ort
ort
ort
ort
Örnek: x=10,12,18,20 serinin(0 ve xort
göre) 2. ve 3. momentini ve iki
moment türü arasındaki ilişkiyi
bulunuz?
Çözüm: X=10, 12, 18, 20 =60/4=15
X²=100,144,324,400=968
M2=968/4=242
X3=1000,1728,5832,8000=16560
M3=16560/4=4140
X-Xort=10-15,12-15,18-15,20-15=-5,3,3,5
(X-Xort)²=25, 9, 9, 25=68 M2=68/4=17
(X-Xort)3=-125, -27, 27, 125=0
M3=0/4=0
µ2=M2-M²1 =242-15²=17
µ 3= M3-3M1M2+2M³1 =41403(15).(242)+2.(15)³=0
µ 4= M4-4M1M3+6M²1M2-3M‘1
Gruplandırılmış Serinin
Moment hesabı
Örnek: Gruplar=1-3, 3-5, 5-7, 7-9
f=1, 2, 4, 3=10
serinin (0 ve xort göre) 2. ve 3.
momentini ve iki moment türü
arasındaki ilişkiyi bulunuz?
Çözüm: önce sınıf orta noktaları
bulunur.
X=2, 4, 6, 8
f=1, 2, 4, 3 =10
Xort=58/10=5,8
X²=4,16,36,64=
X³=8,64,216,512
f.X=2,8,24,24=58
f.X²=4,32,144,192=372
f.X³=8,128,864,1536=2536
(X-Xort)=(2-5,8)=-3,8 (4-5,8)=-1,8 (6-5,8)=0,2 (85,8)=2,2
(X-Xort)²=14,44 3,24 0,04 4,84
(X-Xort)³= -54,872 -5,832 0,008 10,648
f.(X-Xort)²=14,44 6,48 0,16 14,52 =35,60
f.(X-Xort)³=-54,872 -11,664 0,032 31,944 = - 34,560
µ2=M2-M²1 =37,2-(5,8)²=3,56
µ3= M3-3M1M2+2M³1 =253,6-3(5,8).(37,2)+2.(5,8)³=-3,456
ÇARPIKLIK (Asimetri)
Bir serinin simetriden ayrılmasıdır. Rakamların dağılımı
her zaman simetrik olmaz. Dağılım sağa ve sola
çarpık olabilir. Serideki asimetriyi çarpıklık katsayısı
ile ölçeriz. Çarpıklık katsayısı 0’a eşit olduğunda
dağılım simetriktir. Çarpıklık katsayısı negatif
olduğunda sola çarpık, pozitif olduğunda sağa çarpık
olur. Çarpıklık katsayıları 3 e ayrılır.
 Pearson Çarpıklık Katsayısı
 Kartil Çarpklık Katsayısı
 Moment Çarpıklık Katsayısı
Pearson Çarpıklık Katsayısı
Pearson ortalamalar
arasındaki şu ilişkiyi
fark etmiştir.
X -Mod≈3(X Medyan)
ort
ort
Her iki tarafı standart
sapmaya bölerek bu
ifadeleri ölçü biriminden
bağımsız hale getirmiştir.
Çarpıklık=3(Xort-Medyan) /
standart sapma
Çarpıklık=(Xort-Mod) / standart
sapma
Not: bu katsayı sıfıra eşit ise
dağılım simetrik, büyükse
sağa çarpık, küçükse sola
çarpıktır.

X=1-3, 3-5, 5-7, 7-9

f=1, 2, 4, 3 kf=1, 3, 7, 10
Medyana dayalı çarpıklık için aritmetik ortalama ve
standart sapmayı bilmek gerekir.
Aritmetik ortalama:5,8
2.Moment ise 3,56 (varyanstır)
Standart sapma=√3,56≈1,89
N=10 10/2=5. değer medyandır. Medyan 5-7 sınıfı
Yaklaşık medyan değeri=5+[(5-3)/4].2=6 dır.
Medyana dayalı çarpıklık= 3(xort-medyan)/standart
sapma
Medyana dayalı çarpıklık= 3(5,8-6)/1,89 ≈-0,32
Mod=L1+[∆1/ (∆1+ ∆2)].c =5+[2/(2+1)]2=6,33
Moda dayalı çarpıklık= =(Xort-Mod) / standart sapma=
Moda dayalı çarpıklık 5,8-6,33 / 1,89= -0,28

Seri sola çarpıktır.






Kartil Çarpıklık Katsayısı
Herhangi bir dağılıma ait kartil
değerleriyle de asimetrik dağılım
olup olmadığına karar verilebilir.
Kç=(K3-K2)-(K2-K1) / K3-K1
Kç=(K3-2K2)+K1 / K3-K1
Örnek: (pearsen örneğinin
devamı) medyan 6, medyan 2.
kartile eşittir.1. ve 3. kartili tespit
etmek gerekir. Sonra çarpıklığa
bakılır.
K1 için N/4 10/4=2,5 değer
1.kartildir. Kümülatif frekansı 3
olan 3-5 sınıfı 1.kartil sınıfıdır.
K3 için 3N/4=3x10/4=7,5 değerdir.
Sınıfı 7-9 sınıfıdır.
K1=3+ [(2,5-1)/2].2=4,5
 K3=7+[(7,5-7)/3].2=7,33
Buna göre
Kartil çarpıklık katsayısı şu şekilde
bulunur.
 Kç=(K3-2K2)+K1 / K3-K1
 Kç=(7,33-2x6+4,5) / (7,33-4,5) =0,06
 Negatif çıktığı için seri sola çarpık
demektir.

Moment
Çarpıklık
Katsayısı
Örnek1:
2.moment
17 ve 3. moment 0 dır.
Ortalama etrafındaki 3.
momentin standart
sapmanın 3. kuvvetine
bölünmesiyle elde
edilir. α3=µ3 /s³
Simetrik dağılımlarda
moment çarpıklık
katsayısı 0 dır.
α3>0 ise sağa çarpık, α3<0
ise sola çarpıktır.
Aritmetik ortalama etrafındaki 2. moment,
varyans ve bunun karekökü de standart
sapmaya eşittir. Standart sapma=4,12
Bu dağılıma ait
moment çarpıklık katsayısı=0/(4,12)³=0
Sonuç, katsayı 0 olduğu için dağılım
simetriktir.
Örnek 2= aritmetik ortalama etrafındaki 2.
moment 3,56 (varyans)(standart sapma
varyansın karekökü yani 1,89) ve
3.moment -3,456 ise moment çarpıklık
katsayısı nedir?
α3=µ3 /s³=-3,456/(1,89)³=-0,51 (sola çarpıktır.)
BASIKLIK
4 
4
s
4
(momente dayanan basıklık ölçüsü)
Bir dağılımın diklik derecesinin
ölçüsüdür.
Moment basıklık katsayısı:ortalama
etrafındaki 4. momentin standart
sapmanın 4.kuvvetine bölünmesiyle
elde edilir. ά =3 olursa yükseklik
normal ά ≥3 dağılım dik (serideki
rakamların merkezi eğilimin yüksek
olduğunu gösterir) ά ≤3 dağılım
basıktır(dağılımda değişkenlik
fazla).
S4=(µ2)²
Ör: bir önceki örnekte aritmetik
ortalama etrafındaki 2. moment
µ2=17 ve µ2=3,56 olarak
hesaplanmıştı önce aritmetik
ortalama etrafındaki 4. momenti
bulunuz. Sonra moment basıklık
katsayısını bulunuz.
Örnek1: X=10,12,18,20 =60/4=15 (basit)
Çözüm: (X-Xort)=-5, -3, 3, 5
(X-Xort)4=625, 81, 81, 625=1412
ά = µ4/S4 =>µ4 =1412/4=353 S4=(17)²=144
ά =353/144=1,22 < 3 ten küçük olduğu için dağılım
4
4
normale göre basıktır.
4
4
4
Örnek2: X=2,4,6,8
f=1,2,4,3 =10 (frekans)
Çözüm:
(X-Xort)= -3,8 -1,8 0,2 2,2
(X-Xort)4=208,5136 10,4976 0,0016 23,4256
f . (X-Xort)4=208,5136 20,9952 0,0064
70,2768
=299,7920
µ4 =299,792/10=29,9792 S4=(3,56)²=12,6736
ά =29,9792/12,6736=2,37 < 3 olduğundan seri
4
normale göre basıktır. Yani dağılımın değişkenliği
normal dağılımın değişkenliğine göre fazladır.
4 
BASIKLIK


4
s
4
Bir dağılımın diklik derecesinin ölçüsüdür.
Moment basıklık katsayısı:ortalama etrafındaki 4. momentin
standart sapmanın 4.kuvvetine bölünmesiyle elde edilir.ά =3
olursa yükseklik normal ά ≥3 dağılım dik (serideki
rakamların merkezi eğilimin yüksek olduğunu gösterir) ά ≤3
dağılım basıktır(dağılımda değişkenlik fazla).
Ör:
4
4
4

125
23.7.2017
Selami ÖZCAN İstatistik
Çarpıklık Katsayısı


Çarpıklık katsayısının sıfırdan küçük olması çarpıklığın negatif (sola),
sıfırdan büyük olması ise pozitif (sağa) olduğunu gösterir.
Çarpıklık katsayısının sıfıra eşit olması, dağılımın simetrik olduğunu
gösterir.
23.7.2017
126
Dağılımın Basıklığı
DÖRDÜNCÜ BÖLÜM

128
İHTİMAL HESABI
23.7.2017
Selami ÖZCAN İstatistik
4. BÖLÜM: Sunum planı






129
Deney, sonuç ve
örneklem uzay
Olasılık (ihtimal)
Olasılık(ihtimal)
Hesaplama
Sayma ve Ayrılık
olayları
Çarpma Kuralı
Toplama Kuralı
23.7.2017
Beklenen değer
(matematik ümit)
Bazı kurallar
Selami ÖZCAN İstatistik
GİRİŞ




130
Meteroroloji uzmanı: %80 ihtimalle yağmur
yağacağını
Sağlık uzmanı sigara içenlerin içmeyenlere
oranla daha çabuk kansere yakalanacağını
İhtimal tahlil edici, çıkarımsal istatistiktir.
Satış tahminleri
23.7.2017
Selami ÖZCAN İstatistik
DENEY, SONUÇ VE ÖRENLEM
UZAY





131
Deney: pek çok gözlemden sadece bir tanesinin gerçekleşmesi sürecine
deney denir.
Deneyin sonuçları: bu gözlemlere deneyin sonuçları denir.
Örneklem uzay: bu sonuçların tümüne ise deneyin örneklem uzayı denir.
Örneklem uzay S ile gösterilir. s= (hatalı, hatasız)
Örneklem noktaları: örneklem uzayın elemanlarına örneklem noktaları denir.
Deney
Sonuç
Örneklem uzay
Vida inceleme
Hatalı / hatasız
S=(hatalı, hatasız)
Paranın bir kez atılması
Yazı tura
S=(yazı, tura)
Paranın iki kez atılması
YY,YT,TT, TY
S=(YY,YT,TT,TY)
Zarın bir kez atılması
1,2,3,4,5,6
S=(1,2,3,4,5,6)
Doğacak bebeğin cinsiyeti
Erkek, kız
S=(kız, erkek)
Öğrencinin yarıyıl sonuçu
Başarılı, başarısız
S=(başarılı, başarısız)
23.7.2017
Selami ÖZCAN İstatistik
Örneklem Uzay/ örnek uzayı s=(Y,T)


Venn Şeması: bir deneyin
tüm muhtemel sonuçlarının
kare, dikdörtgen veya daire
ile gösterilmesine denir.
Örnek: paranın bir kez
atılması deneyi s=(Y., T.,)
venn şeması ile gösterilmesi


Ağaç diyagramı: her bir sonucun
ağacın bir dalı ile ifade
edilmesidir.
Örnek: paranın bir kez atılması
deneyi s=(Y., T.,) ağaç
diyagramı ile gösterilmesi
Nihai Sonuçlar
Yazı
Y
Y.
Tura
T.
132
23.7.2017
T
Selami ÖZCAN İstatistik
BASİT VE BİLEŞİK OLAY
Olay: bir deneyin bir veya daha çok sonucundan Örnek1: bir işyerinde çalışan personel arasında
oluşur.
rastgele iki tanesinin seçildiği ve
cinsiyetlerinin(erkek, kadın) kaydedildiği
Olay basit (elementer) ve bileşik (katışık) olay
düşünülsün bu A olayının en çok bir erkeğin
şeklinde gerçekleşmektedir.
seçilmiş olduğunu venn şemasında gösteriniz?
Basit olay: herhangi bir deneyin nihai sonuçlarına
Bileşik olay: iki durum: istenen en çok bir erkek
denir. Basit olay sadece ve sadece bir tane
olması: EK, KE, KK, ikinci durum istenmeyen: EE
sonuç içermekte Ei biçiminde gösterilir.
Örnek2: bir grup insan kainatın yaratıcısına inanıyor
Örnek: bir işyerinde çalışan personel arasında
ve yaratıcıyı kabul ediyor, geri kalanı
rastgele iki tanesinin seçildiği ve
inanmamakta ve karşı çıkmaktadır. Bu gruptan
cinsiyetlerinin(erkek, kadın) kaydedildiği
rastgele iki kişi seçilmiş ve kainatın yaratıcısı
düşünülsün bu deneyin tüm sonuçları: E1(EE),
hakkında görüşleri sorulmuş. Kaç farklı sonuç söz
E2(KE), E3(EK), E4(KK) bu dört durumdan
konusudur. En çok bir kişinin inanmıyor olma
her biri basit olaydır.
durumu nedir.
Yarın yağmur yağması ihtimali, tek sonuç
Sınıfta gözlüklü öğrenci olması ihtimali tek sonuç İ:inanıyor, K:karşı çıkıyor/inanmıyor
Bileşik (katışık) olay: iki veya daha fazla sonucun İİ: her ikisi de inanıyor. KK: her ikisi de inanmıyor.
İK: biri inanıyor, biri inanmıyor.Kİ:biri inanmıyor, biri
yani birden çok sonuçtan oluşmaktadır. A1,
inanıyor. 4 farklı durum söz konusudur, birden çok
A2, A3,… veya B1, B2, B3, B4, B5,….Bn
sonuç var. Bileşik olaydır.
şeklinde gösterilir.
Birarada meydana gelen,birbirini engelleyen olaylr İİ, İK, Kİ üç durum söz konusudur.
133
23.7.2017
Selami ÖZCAN İstatistik
Basit ve bileşik olay örneklerinin Venn
şeması ve Ağaç diyagramı gösterimi
A
EE.
EK.
İİ
İ
KE.
KK.
İ
K
İK
İ
Kİ
K
KK
K
İİ.
Kİ.
İK.
A
KK.
A∩B
B
AUB
134
23.7.2017
Selami ÖZCAN İstatistik
İhtimal Hesaplama
İhtimal/Olasılık (Probability): bir olayın meydana gelme sansının sayısal ölçüsüdür.
N birim ihtiva eden ana kütleden belli bir x özelliğini taşıyan n tane birim varsa bu ana
kütleden rastgele bir birim alındığında bu birimin x özelliğini taşıması durumudur.
P(x)=n/N şeklinde hesaplanır. Ei ile basit olayın ihtimali (P(Ei)dir. A ile bileşik olayı ihtimalı
P(A) ile gösterilir.
İhtimal (Olasılık) İki Temel Özelliği
1. Bir olayı meydana gelmesi ihtimali 0 ile 1 arasında değişir. Olay ister basit, ister bileşik
olsun ihtimali sıfırdan küçük birden büyük olamaz. 0≤P(Ei) ≤1
0≤P(A) ≤1
P(x)=n/N=0 ise söz konusu olayın meydana gelmesi (imkansız=olanaksız) mümkün değildir.
1 olması olayın kesinlikle (yani %100) (mümkün=kesin) meydana geleceğini ifade
eder.P(İ)=0 imkansız P(M)=1 mümkün olay içindir. Sıfıra yakın ihtimal zayıf bire yakın
ihtimal kuvvetli
2. Bir olayın mümkün bütün hallerinin ihtimal toplamı 1 e eşittir. ∑P(Ei)=
p(E1)+p(E2)+p(E3)+p(E4) ….=1
Bir olayın meydana gelme (p) ve gelmeme(q) ihtimalleri toplamı1 dir. p+q=1 bu tür
ihtimallere birbirini tamamlayan ihtimaller denir. 1-p=q
Paranın bir kez atlılması: P(Y)+P(T)=1 (belki dik gelebilir) iki kez atılması:
P(YY)+P(YT)+P(TY)+P(TT)=1
Bir maç sonucu: P1(galibiyet)+P2(mağlubiyet)+P3(beraberlik)=1
135
23.7.2017
Selami ÖZCAN İstatistik
İhtimale 3 yaklaşım (klasik, nispi, öznel)
Sonuçların ortaya çıkma ihtimalleri eşit ise
klasik yaklaşım
Bir deneydeki basit olayın ihtimali 1 in tüm
sonuç sayısına bölünmesine eşittir.
P(Ei)=1/toplam sonuç sayısı
P(A)= A olayında içerilen sonuç sayısı / toplam
sonuç sayısı
Paranın bir kez atılmasında yazı ihtimali
P(Y):1/2=0,5 tura ihtimali P(T):1/2:0,5
Zarın bir kez atılmasında çift sayı gelmesi
ihtimali P(A)= 2,4,6/1,2,3,4,5,6=3/6=0,5
Bir derneğin 100 üyesi(60 erkek, 40 kadın) var.
Dernek başkanının kadın olma ihtimali
nedir? 40/100=0,4
Öznel yaklaşım: ne sonuçlar eşit, ne de veri
üretmek için tekrarlanabilen deneylerle
karşılaşılabilir.
Bir olay için sübjektif değer yargısına, tecrübe,
bilgi ve düşünceye dayalı ihtimaldir.
13
6
23.7.2017
Göreli (Nispi) sıklık yaklaşımı: ortaya çıkma
ihtimalleri eşit değil, mesela; rastgele seçilen bir
ailenin yıllık geliri 10.000 TL den büyük olma
ihtimali, civalı bir zarın atılması durumu, hileli
paranın atılması durumu, 80 yaşındaki birinin bir
sene sonra ölme ihtimali
Yaklaşık ihtimal için göreli sıklık: bir deney n kez
tekrarlanmış ve f kez bir A olayı gözlenmiş ise
P(A)=f/n dir.
Ör: rastgele 500 ürün seçilmiş bunlardan 10 tanesinin
hatalı olma ihtimali nedir?
10/500=0,02 ilk üretilen ürünün hatalı olması,
hatasız olma ihtimali ise:0,98 yaklaşık ihtimal söz
konusu, gerçek ihtimal değil. Deney sonsuz(çok)
kez tekrarlanırsa gerçek ihtimale yaklaşır.Buna
Büyük sayılar Yasası denir.
Ör: Ankara’dan rastgele seçilmiş bir ailenin ev sahibi
olma ihtimali nedir? Ankara’da ikamet edenlerin ne
kadarı ev sahibi bilinmiyor. Eşit değil
Rastgele 1000 aile seçiliyor, 670 ev sahibi 330 değil
P(A)=f/n 670/1000=0,670
Selami ÖZCAN İstatistik
Sayma Kuralı







137
Sonuç sayısı az iken listelemekte sorun yok idi, fakat çok sayıda sonucu listelemek zor.
Çok sayıda sonuç için sayma kuralı geçerlidir.
Aynı anda vuku bulmaları imkansız olan birbirinden farklı k adet olay n defa tekrarlanırsa kn
örnek: bir para 10 kez atılıyor sonuç: 2x2x2x2x2x2x2x2x2x2= 210
=1024
İlk denemede k1, 2. denemede k2, n. Denmede kn dir. k1 x k2 x k3x..kn ör. 4 çeşit salata, 10 çeşit
çorba, 3 çeşit meşrubat ve 6 çeşit tatlı var. Mümkün sonuç:4x10x3x6=720
Ör. bir deneyde ilk aşamada r tane, 2. aşamada n tane, 3. aşamada k tane sonuç olmak
üzere 3 aşama bulunuyorsa bu deneyin toplam sonuç sayısı: r.n.k dır. Sonuç sayısının 3
ten az veya çok olması sayma kuralı için fark etmez.
Bir para üç kez atılıyor. Her atılmada 2 durum(Y,T) vardır. 2x2x2=8 sonuç var. yyy,
yyt, yty, ytt, tyy, tyt, tty, ttt
Bir otomobil fabrikası 2 durum (sabit ve değişken faiz oranları) ile 36, 48 ve 60 ay
vade yapmaktadır. Kaç farklı satış olur?2x3=6 sonuç
Süper ligte 16 maç yapılmakta her maçın 3 durumu (galibiyet, mağlubiyet, beraberlik)
söz konusu her takım için toplam sonuç sayısı nedir?
3x3x3x3x3x3x3x3x3x3x3x3x3x3x3x3= 316
= 43.046.721
23.7.2017
Selami ÖZCAN İstatistik
Bileşen (Marjinal) ve Şartlı (bileşik) İhtimaller
Onaylıyor (A)
Onaylamıyor (B)
Toplam
Erkek (E)
15
45
60
Kadın (K)
4
36
40
Toplam
19
81
100
Cinsiyet
Herhangi bir başka olay dikkate alınmaksızın sadece bir olaya ilişkin ihtimale Bileşen (basit) ihtimal denir

Bir olayın oluştuğunun bilinmesi durumunda diğer olayın meydana gelme ihtimaline şartlı (bileşik) ihtimal denir.
Örnek: Çalışanların cevaplarına ilişkin iki yönlü sınıflama: 100 kişiye üst seviye yöneticilere çok yüksek ücret ödenmesi
sorulmuş erkek (60) 15 onaylıyor 45 onaylamıyor; kadın (40) 4 onaylıyor, 36 onaylamıyor.
P(E)=erkeklerin sayısı/tüm çalışanların sayısı=60/100=0,6
P(K)=kadınların sayısı/tüm çalışanların sayısı=40/100=0,4
P(A)=19/100=0,19 P(B)=81/100=0,81
Şartlı (Bileşik) ihtimalli iki yönlü sınıflama P(EA)=ihtimali hesaplanacak olay/gerçekleşmiş olay 15/60=0,25 (seçilen kişinin
yüksek ücreti onaylayan ve erkek olma ihtimali 0,25 tir.

Erkek onaylıyor
Onaylıyor
Verilen olay
Onaylamıyor
138
Kadın onaylıyor
15/19
4/19
Erkek onaylamıyor 45/81
Kadın onaylamıyor 36/81
23.7.2017
Selami ÖZCAN İstatistik
Ayrık Olay, Ayrık Olmayan Olay
Birlikte ortaya çıkmayan olaylara denir. Birlikte olamayan olaylara karşılıklı ayrık olaylar denir. Bu
tür olayların ortak sonuçları bulunmamaktadır. Şayet iki ve daha fazla olay ayrık ise deneyin her
tekrarında bu olaylardan en çok bir tanesi ortaya çıkmaktadır.
Bir olayın ortaya çıkması, diğer olay ya da olayların ortaya çıkmasını dışta tutma. İki
ayrık olayların ihtimalleri veya varsa olayların ihtimali toplanır.
 Deneyin herhangi bir tekrarında ortaya çıkacak sadece bir sonuç olduğu için nihai
sonuçlar her zaman ayrıktır.
Örnek:Zarın bir kez atılmasında a=çift b=tek c=5 ten küçük olması ihtimali=1,2,3,4 sayı
4/6= 0, 66
a ve b olayları ayrık fakat a ve c ayrık olmayan P(a, b)= 3/6 +3/6 =1(ayrık) P (a, c)=2,4
yani 2/6 ayrık değil
Ör: hilesiz bir zar atıldığında 1 veya 5 gelme ihtimali
P (1 veya 5)=1/6 +1/6=2/6=1/3
Ör: 8 kırmızı,5 sarı, 4 beyaz, 2 yeşil çekilen topun sarı veya beyaz olma ihtimali? İlk
çekilen geri konuyor. 5/19+4/19=9/19=0,47

b
1 3
5
139
a
2
a
1. 2. 6.
c
4
6
5.
3.
4.
23.7.2017
Selami ÖZCAN İstatistik
Bağımlı/Bağımsız Olay
Bağımsız Olay: şayet bir olayın ortaya çıkması öteki olayın ortaya çıkma
ihtimalini etkilemiyorsa bu iki olaya bağımsız olaylar denir.
P(A/B)=P(A) veya P(B/A)=P(B) şartı yerine getirilmelidir.
Bağımlı olaylar: bir olayın ortaya çıkması, diğer olayın ortaya çıkma ihtimalini
etkiliyorsa bu olaya bağımsız olmayan veya bağımlı olay P(A/B) ≠ P(A) veya
P(B/A) ≠ P(B)
Örnek: 100 kaset (15 i bozuk), 60 ı 1.makinede (9 u bozuk), 40 ı 2.makinede (6
sı bozuk) üretilmiştir. Rastgele seçilen bir kasetin bozuk olma ihtimali nedir?
D:rastgele seçilen kasetin bozuk olma iht.
A:bu kasetin 1. makinede üretilmiş olma iht. P(D)=15/100=0,15
P(D/A)=9/60= 0,15 eşit çıktı bu iki olay (D ve A) bağımsız olaydır.
Ayrık olaylar her zaman bağımlıdır. Bağımlı olaylar her zaman ayrık olmayabilir.
140
23.7.2017
Selami ÖZCAN İstatistik
S
A
͞A
TAMAMLAYICI OLAY
İki ayrık olayın bir deneyin tüm sonuçlarını içeriyorsa bu iki
olay birbirinin tamamlayıcısıdır. Tamamlayıcı olaylar her
zaman ayrık olaylardır. P(A) + P(͞A) =1 dir.
Örnek: 5 makinenin 2si bozuk,rastgele seçilenin bozuk olma
ihtimali nedir?
A:seçilen makine bozuk, ͞A:seçilen makine sağlam
P(A)=2/5:0,40 P(͞A):3/5:0,60
Örnek: zarın bir kez atılması olayında 4’ten büyük çıkma (5,6)
ihtimali nedir?
P(A)=2/6=0,33P(͞A)=4/6=0,67 veya 1-0,33=0,67

141
23.7.2017
Selami ÖZCAN İstatistik
A
B
OLAYLARIN ARA KESİTİ ve ÇARPMA KURALI

Çarpma kuralı: bileşik
ihtimal AnB veya AB

P(A ve B)=P(A) x P(B)

İki olay
–
–
142
1.olayın
2.olayın
Tamam
Red
Toplam
Erkek
7
20
27
Kadın
4
9
13
Toplam
11
29
40
P(E) ve P(T) P(EveT)=P(E) x P(T/E)
(27/40)x(7/27)=7/40=0,175 Erkek ve tamam
bileşen ihtimali
Ör: 20 kaset 4 ü bozuk, 2 tane seçiliyor seçilen 2
şartlı ihtimali
kasetinde bozuk olma ihtimali (iadesiz çekiliş)
S1: ilk seçilen kasetin sağlam olma iht.16/20
B1: ilk seçilen kasetin bozuk olma iht. 4/20
S2: ikinci seçilen kasetin sağlam olma iht.15/19
B2: ikinci seçilen kasetin bozuk olma iht.3/19
P(B1 ve B2)=P(B1) x P(B2/B1)=4/20 x 3/19=0,032
23.7.2017
Selami ÖZCAN İstatistik
BAĞIMSIZ OLAYLAR ÇARPMA
KURALI



143
A ve B gibi bağımsız 2
olayın bileşik ihtimali P(A ve
B)= P(A) x P(B)
Örnek. 2 adet yangın tüpü
var herhangi birinin
çalışmama ihtimali 0,02
yangın anında her ikisinin de
çalışmama ihtimali nedir?
P(1 ve 2)= P(1) x P(2) =
0,02x0,02=0,004
23.7.2017
Ayrık olayların bileşik ihtimali
 İki ayrık olayın bileşik ihtimali her
zaman 0 dır.P(A ve B)=0
 Örnek: iş başvurusu kabul ve
red, kabul ve reddin bileşik
ihtimali 0 dır.
Selami ÖZCAN İstatistik
A
B
AuB
P(A veya B)=P(A)+P(B)-P(AveB)
OLAYLARIN BİLEŞİMİ VE TOPLAMA KURALI
Örnek: Erkek 45 kabul, 15 Ayrık olaylarda toplama kuralı
red, 10 çekimser; Kadın 80  P(A veya B)=P(A) + P(B)
kabul 110 red, 30
 Toplama kuralı (yandaki
çekimserdir. Erkek ve red
örneğe göre)
olma ihtimali: 70/300:0,233
 P (red veya çekimser) olma
125/300:0,416 P(E/R)=
ihtimali nedir?
0,233x0,214=0,04499
P(E ve R):P(E)+P(R)-P(E/R) 125/300+40/300=0,416+0,133
0,233 + 0,416 – 0,04499=0,6 =0,563

144
23.7.2017
Selami ÖZCAN İstatistik
5. BÖLÜM: Kesikli Rassal Değişkenler
Kesikli İhtimal Dağılımları
Rassal Değişken: bir deney/gözlemin şansa bağlı
sonucunda bir değişkenin aldığı değere
(ihtimal ve istatistikte) rassal değişken adı
verilir.
Kesikli Rassal Değişken: yalnız belirli tamsayı
değerleri alabilen, birbirini izleyen değerler
arasında belirli boşluklar (sayımla elde edilen
değerler) varsa kesikli rassal değişken
sayılabilir.
Ör.Satılan otomobil sayısı, bilet sayısı, izleyici
sayısı, elbise sayısı, çocuk sayısı vb.
Sürekli Rassal Değişken: ölçüm/tartımla elde
edilen değerler, iki değer arasına sonsuz
sayıda değer sıkıştırılabilen değişken sürekli
rassal değişkendir.
Ör. Boy uzunluğu, bir sorunun çözülme süresi,
ağırlık, bir evin değeri(fiyatı) vb.
Kesikli rassal değişkenin ihtimal dağılımına örnek
Oto sayısı:0,1,2,3,4
Frekans(sıklık):30,470,850,490,160=2000
Nisbi frekans: 0,015;0,235;0,425;0,245;0,080=1
Kümülatif nisbi frekans:0,015;0,25;0,675;0,92;1
İhtimal dağılımı P(X):0,015;0,235;0,425;0,245;0,080=1
P(x) değerleri , X değerlerinin ihtimal dağılımını oluşturur
P(2)=0,425 tir.
0≤P(X)≤1 ve ∑P(X)=1
0, 425
0,5
0,4
0,3
0,2
0,1
0,0
23.7.2017
0,080
0,015
0
145
0,245
0,235
1
2
3
Selami ÖZCAN İstatistik
4
X
Kesikli bir Değişkenin
Ortalaması ve Standart Sapması
Kesikli Değişkenin Ortalaması
Kesikli Değişkenin Standart Sapması
Beklenen Değer (Matematik Ümit)
Ó=Standart sapma ss’nın büyük olması x değerlerinin
E(x)=µ=∑x P(X)= n x P(X)
ortalama etrafında geniş bir aralıkta değerler aldığını,
SS küçük olması dar aralıkta dağıldığını gösterir.
X kesikli değişken, n adet denemede
X1 olayı P1 ihtimalle, Xn olayı Pn
Gözlenen değerlerin ortalamaya yakın dağıldığını
ihtimalle meydana geliyorsa X1 in
gösterir
beklenen değeri E(x=1)=n.P1
İstatistiksel değerlendirmelerde standart sapmanın karesi
Ör:3 er birimlik 1000 paket mal satın
alınarak bulunan ve sigma kare ile varyans değeri
alınmakta kusur sayılarına ilişkin
hesaplanır
ihtimal tablosu aşağıda beklenen
değeri bulunuz
Ör: x arızalı parça, 400 parça sevkiyatın ihtimal dağılımı
E(x=0)=n.P0=0x0,512=0
tabloda var. Ortalama ve standart sapmayı bulunuz?
E(x=1)=n.P1=1x0,384=0,384
Yorum: 400 parça sevkiyatın 1,2 standart sapma değeri ile
E(x=2)=n.P2=2x0,096=0,192
2,5 tanesi arızalıdır.
E(x=3)=n.P3=3x0,008=0,024
µ=∑x P(X)=0,6
X
P(X)
X
0
1
2
3
Top
0,512
0,384
0,096
0,008
1
0
1
2
3
4
5
Top.
P(X)
0,02
0,20
0,30
0,30
0,10
0,08
1
X P(X)=µ
0,00
0,20
0,60
0,90
0,40
0,40
2,50
0
1
4
9
16
25
55
0,00
0,20
1,20
2,70
1,60
2,00
7,70
X2
X 2 P(X)=sigma

146
23.7.2017
 x P( x)  
2
2
 (7,70)  (2,5) 2  1,20
Selami ÖZCAN İstatistik
Kesikli Dağılımın Beklenen Ümit ve
Varyansı
Var ( x)  E ( x 2 )  [ E ( x)]2
Var ( x ) 
x
2
i
tüm x
Örnek:Bir zar atılıyor. Anlaşmaya göre Ali



P ( xi )  
x
P
(
x
)

i
i


tüm
x


Örnek: Bir kitaptaki bir sayfadaki yanlış
sayısı ile ilgili X’in olasılık fonksiyonu
şöyledir:
X=
x f(x)
1
1/6
P(x=0)=0.81 hiç yanlış olmaması
2
1/6
P(x=1)=0.17 bir yanlış olması
3
1/6
P(x=2)=0.02 iki yanlış olması
4
1/6
5
1/6
6
1/6
Sayfa başına ortalama yanlış sayısını bulunuz.
E( x)   xi .Pi  0.(0.81) 1.(0.17)  2.(0.02)  0.21
Sayfa başı ortalama 0.21 yanlış bulunur.
147
babasından her atışta kaç gelirse o
kadar TL para alacaktır. Atış başına Ali
nin beklediği parayı bulunuz.
2
23.7.2017
E ( x)  1.1/ 6  2.1/ 6  ...  6.1/ 6  3.50
Ali’nin atış başına ortalama kazancı
1
Selami ÖZCAN İstatistik
n
x
  veya Cn şeklinde gösterilir .
 x
Faktöriyeller ve Kombinasyonlar
Faktöriyeller ! 1’e kadar tüm
pozitif sayıların çarpımından
oluşur.
Kural 1!=1, 0!=1
Sıra önemli olduğunda n adet olay
n!=n(n-1)
ör.6 kitap 6!=6x5x4x3x2x1=720
Sıra önemli olduğunda n adet
olaydan x adeti n!/(n-x)!
(permutasyon)
6 kitap 4lü şekilde kaç farklı şekilde
dizilir. 6!/(6-4)! =360

148
23.7.2017
Kombinasyonlar (C)
Sıra önemli olmadığında
n adet olaydan x adedinin seçilme yollarının
sayısını vermektedir.
n=toplam eleman sayısını
x= her seferinde seçilecek eleman sayısı
Not:n değeri x ten büyük en fazla eşit olmalı

n!
n
 
 x  x!(n  x)!
Örnek. 6!/4! (6-4)! =15
Ör. 20 öğretim üyesinden 5 tanesi rastgele
proje için seçilecek, kaç farklı seçim olur
20!/5! (20-5)! =15.504
Selami ÖZCAN İstatistik
ÖNEMLİ BAZI KESİKLİ DAĞILIMLAR







149
Üniform Dağılımı
Bernoulli Dağılımı
Binom Dağılımı-Poisson a Yaklaşımı
Poisson Dağılımı-Binom a yaklaşımı
Geometrik Dağılım
Hipergeometrik Dağılım
Pascal (Negatif Binom) Dağılımı
23.7.2017
Selami ÖZCAN İstatistik
1. Üniform Dağılımı
Kesikli bir şans değişkeni tanımlı olduğu tüm noktalarda eşit olasılık
değerine sahip ise bir başka ifadeyle tanımlı olduğu değerlerin hepsinde
olasılık fonksiyonun aldığı değer sabit ise bu kesikli şans değişkeni
üniform dağılımına uygundur.
 Üniform dağılımı gösteren bir şans değişkeni k farklı noktada tanımlı
ise olasılık dağılımı;

1

P(X  x )   k
0
şeklinde ifade edilir.
150
x  1,2,3...., k
d.d
Üniform Dağılımının Beklenen
Değer ve Varyansı
1
1 k (k  1) k  1
E ( x)   x P( x )   x 

k
k
2
2
k
x 1
k
i
i
i
x 1
   Ex 
=
Var ( x )  E x
1  k  1
x


k  2 
x 1
n
2
151
2
2
2
(k  1)(k  1)
Var ( x) 
12
1  k (k  1)( 2k  1)  (k  1) 2
 


k
6
4

Örnek: Hilesiz bir zar atıldığında X şans değişkeni ortaya
çıkabilecek farklı durum sayısını ifade ettiğine göre X’in olasılık
dağılımını oluşturarak beklenen değerini ve varyansını bulunuz.
Çözüm
S = { x / 1,2,3,4,5,6 }
Ortaya çıkan olaylar eşit olasılıklı olaylar x şans değişkeninin dağılımı k = 6 olan kesikli
üniform dağılımına uygundur.
1

P( X  x)   6
0
x  1,2,3,4,5,6
d .d
(6  1)(6  1) 35
6 1

E ( x) 
 3,5 Var ( x) 
12
12
2
152
2. BERNOULLİ DAĞILIMI
Bir şans değişkeninin bernoulli dağılımı
göstermesi için ilgilenilen süreçte bernoulli
deneyinin
varsayımlarının
sağlanması
gereklidir.
Bernoulli Deneyinin Varsayımları:
- Deneyler aynı koşullarda tekrarlanabilirlik
özelliğine sahip olmalıdır.
- Deneylerin yalnız iki mümkün sonucu olması
gereklidir.
- Başarı olasılığı (p),deneyden deneye
değişmemektedir (Başarısızlık olasılığı q = 1-p
ile gösterilir)
- Denemeler birbirinden bağımsız olmalıdır.










153
23.7.2017
İki sonucu olan durum
Başarılı başarısız
Başarı 1 ve başarısızlık 0
Başarılı ihtimali p(x)
Başarısızlık ihtimali q(x) veya 1-p
p(X=x)= p(x=1) ve 1-p (x=0)
P(X=x)= p² x (1-p)ª-³, x=0,1
beklenen değer: µ=E(x)=P dir
Standart sapma (σ)=√p.(1-p)
Ortalaması µ=∑x . P(x)
Selami ÖZCAN İstatistik
ÖRNEKLER
154
1: Hilesiz bir para atılıyor. X=tura A=(T) S=(T,Y)
T gelmesi başarı yani 1 dir. nA=1 ve n=2
p=P(X=1)=P(A)=nA/n = ½
1-p=P(x=0)=1-p(x=1)=1/2
Benoulli dağılımı ½ dir. 0,5 tir. X rassal değişkenin
ihtimal dağılımı
P(X=x)= ½ x=0 ve ½ x=1
P(X=x)=(½)x (½)1-x x=0,1 olarak elde edilir.
2:Hilesiz iki zar atılıyor.Başarı ikisininde 6,6 gelmesi
x=1
Başarısızlık ikisininde 6,6 gelmemesi x=0
A=(6,6) ve nA=1 p=P(x=1)= P(A)= nA/n=1/6
iki tane olunca 1/6x1/6=1/36
1-p=P(x=0)= 1-P(x=1)= 35/36 dır.
P(X=x) (1/36)x . (35/36)1-x
x=0,1
23.7.2017
3: 100 kalemden 97 kusursuz.
Rastgele seçilen bir kalemin
kusursuz olma başarı (x=1)
ihtimali
Kusurlu olma başarısız (x=0)
ihtimali
nA=97 n=100 97/100=0,97
kusursuz iht.
1-0,97=0,03 kusurlu olma
ihtimali
P(X=x)=(0,97)x . (0,03)1-x
x=0,1
Selami ÖZCAN İstatistik
Örnek: Bir deste iskambilden çekilen bir kağıdın as olup olmaması ile
ilgileniyor. As gelmesi başarı olarak ifade edildiği durum için olasılık
fonksiyonunu oluşturunuz.
x = 0 (as gelmemesi)
S = { x / 0,1 }
P( X = 0 ) = 48 / 52
x = 1 ( as gelmesi)
P( X = 1 ) = 4 / 52
 4  x  48 1 x
   
P( X  x)   52   52 

0

155
x  0,1
d .d
n
P ( x)    p x (1  p ) n  x
 x
n!
n

 
 x  x!(n  x)!
3. BİNOM (İKİ DURUM) İHTİMAL
DAĞILIMI
n:tekrarlı bir deneyde (toplam deneme sayısı), x kez istenen (başarı) sonuç gelmesi durumunda
ihtimallerin bulunması için P(X) başarılı sonuç elde etme ihtimali

X değişkeninin iki sonuçlu (kesikli) bir değişken olması gerek. Deneyin her tekrarından sonra bu iki
sonuçtan birinin ortaya çıkması gerekir. Kız,erkek; yazı tura; başarılı, başarısız; hatalı hatasız; iki
sonuçlu olaylar binom dağılımı ile çözülür. p=1-q
X değerleri 0,1,2,3 … gibi kesikli değerler ve bu değerler için nokta ihtimalleri hesaplandığından binom
dağılımı kesikli ihtimal dağılımıdır. P=0,5 binom dağılımı simetriktir. P<0,5 sağa; 0,5<p ise sola çarpık
Ortalama=n.p varyans=np(1-p) standart sapma=√np(1-p)=√npq
Moment çarpıklıkά3=(1-p) / √npq, moment basıklıkά4=3+(1-6p)q / npq
Binom Dağılımının Özellikleri

Deney n kez aynı şartlarda tekrarlanmalı

Sadece iki sonucu olmalı

İki sonucun ihtimali her deneme için aynı ve bire eşittir.

Denemeler bağımsız, bir denemenin sonucu diğer denemenin sonucunu etkilememektedir.
156
23.7.2017
Selami ÖZCAN İstatistik
0!=1
Bir sayının 0. kuvveti 1 dir.
Binom Dağılımına Örnek
%15 kusurlu şansa bağlı alınan 3 örneğin en az iki mamulün kusurlu
olma ihtimali nedir?
Çözüm: P(x≥2)= P(x=2) + p(x=3)
(3/2)0,15x0,15x0,85+(3/3)0,15x0,15x0,15x0,85.sıfırıncı kuvveti
=0,0574+0,0034=0,0608 %6,08
Örnek: %10 hatalı, 4 birimlik mamulun en çok 2 sinin hatalı olma ihtimali
nedir?
Çözüm: n=4 P(x≤2)=P(x=0)+P(x=1)+p(x=2)
=0,6561+0,2916+0,0486=0,9963=%99,63

n
P ( x)    p x (1  p ) n  x
 x
n!
n
 
 x  x!(n  x)!
3
P( x  1)   0,051 (1  0,05) 31
1
3!
3
 
 1  1!(3  1)!
Binom Dağılımının Ortalama(np) ve
Standart Sapması(√npq)
Ör. Bir fabrikada üretilen tv lerin arızalı olma ihtimali %5 tir. 3 tv seçtiğimizde Ör:Bir şehirde yaşayanların oyların %58 i
1.nin arızalı olma ihtimali (binom) nedir?
A partisi almış, bu şehirden 25 kişi
seçildiğinde X’in(A partisine oy verenlerin)
Çözüm: 0,1354=%13,54 yanda çözümü
ihtimal dağılımının ortalaması ve standart
Örnek:Kargo şirketi paketlerinden %2 si zamanında ulaşmıyor. Bir müşteri 10
sapması nedir?
paket veriyor.
Ortalama:25x0,58=14,5

1 tanesinin zamanında ulaşmama ihtimali? (10/1)
Standart sapma:√25x0,58x0,42:2,47
10x(0,02)1x(0,98)9=0,1667
Yorum: seçilen 25 kişiden 2,47 standart
En çok 1 tanesinin zamanında ulaşmama ihtimali?p(x=0)+p(x=1)=0,9838
sapmayla ortalama 14,5 kişinin A partisine
oy vermesi beklenmektedir.
157
23.7.2017
Selami ÖZCAN İstatistik
BİNOM DAĞILIMINA ÖRNEK
Bir fabrikada üretim yapan makinalardan birinin ürettiği ürünlerin 0,09’u
kusurlu olarak üretilmiş bulunmaktadır. Bu ürünlerden 4 adedi rastgele
seçilmiştir. Hiç özürlü ürün seçilmemiş olma olasılığı nedir?
n!
P(k;n;p) = --------- p k.q n-k
k!(n-k)!
4!
P(0;4;0,09) =--------- 0,09 0 . 0,91 4-0 = 0,6857
0!(4-0)!
e  x
P( x) 
x!
3. POİSSON DAĞILIMI
Poisson, binom gibi kesikli bir ihtimal dağılımıdır. Verilen bir aralıkta (zaman, hacim aralığı vb)
tekrar sayısının ortalaması biliniyorsa poisson kullanılır. X ile gösterilen tekrar sayısına ilişkin
herhangi bir değerin ihtimali hesaplanabilir. Üzerinde durulan olayın meydana gelme ihtimali çok
küçüktür. n in büyümesi P nin küçülmesi halinde binom yerine poisson formülü kullanılır. Yani np
değeri 5 ten küçük olduğunda ʎ: poisson dağılımının ortalaması, bu dağılımın varyansı da ʎ eşittir.
Matematik sabiti e ise yaklaşık olarak 2,71828 dir.
µ ortalama= ʎ= σ ² varyans, standart sapma σ =√ ʎ Moment çarpıklık ölçüsğ ά3=1/ ʎ moment basıklık
ölçüsü:3+1/ ʎ
Not: poisson dağılımı normalden daha dik ve sağa çarpıktır. ʎ büyüdükçe dağılım simetrikleşir.
Örnek: bir hastanenin acil servisine bir günde gelen hasta sayısı; bir makinede üretilecek 100 parçadan
hatalı parça sayısı; bir mağazadan 1 haftada satılan buzdolabı sayısı (randevulu gelen hasta rassal
olmadığı için poisson uygulanamaz)
Örnek: bir çamaşır makinesi ayda ortalama 3 kez arızalanmakta, poissona göre gelecek ay iki kez
arızalanması ihtimali ve en çok bir
kez
arızalanması ihtimali nedir?
3
2
(
2
,
71828
)
x
3
Çözüm: a) P(x=2)= P( x) 
 0,224
2!
(2,71828) 3 x30 (2,71828) 3 x31

b)P(x≤1)=p(X=0)+p(X=1) P( x  0, x  1) 
0!
1!
p( x  1)0,049787  0,149361  0,199148  0,2

159
23.7.2017
Selami ÖZCAN İstatistik
Poisson Dağılımının İhtimal
Fonksiyonu
l
x
: belirlenen periyotta ortaya çıkan olay sayısı
: ortaya çıkma olasılığı araştırılan olay sayısı
S = { x / 0,1, 2, 3, ….., }
 e   x

P( X  x)   x!
 0

160
x  0,1,2,...
diger durumlarda
Poisson Dağılımının Beklenen Değer ve
Varyansı
Beklenen Değer
Varyans
E (x)    
Var (x)  
Beklenen değeri ve varyansı birbirine eşit olan tek dağılıştır.
161
Örnek: Bir mağazaya Cumartesi günleri 5 dakikada ortalama olarak 4 müşteri
gelmektedir. Bir Cumartesi günü bu mağazaya,
a) 5 dakika içinde 1 müşteri gelmesi olasılığını,
b)Yarım saate 2’den fazla müşteri gelmesi olasılığını,
a)   4 P ( x = 1 ) = ?
e 4 41
P( X  1) 
 4e 4
1!
b) 5 dk’da 4 müşteri gelirse, 30 dk’da 24 müşteri gelir.
  24 P ( x > 2 ) = ?
P( x > 2 ) = 1 – [P(x=0)+P(x=1)+P(x=2)]
 e 24 240 e 24 241 e 24 242 
  1  313e 24
1  


1!
2! 
 0!
ÖDEV: 1 saatte en çok 1 müşteri gelmesinin ihtimalini hesaplayınız.
162
Poisson Dağılımına Örnek
Örnek1: A bankasında günde 2 hesap açılıyor, herhangi bir günde 6 yeni hesap açılması ihtimali, en çok
3 yeni hesap açılması ihtimali, en az 7 hesap açılması ihtimali nedir?
a) p(x=6)= ortalama(ʎ)=2, x=6 formülde yerine koyarsak: 0,0120
b) P(X≤3)=P(X=0)+P(x=1)+p(x=2)+p(x=3)=0,8571
c)p(x≥7)=1-p(x<7):1-[p(x=0)+p(x=1)+p(x=2)+p(x=3)+p(x=4)+p(x=5)+p(x=7)]=0,0045
Örnek2: ortalaması x=2,6 poisson dağılışı gösteren bir değişkenin standart sapması nedir?
Çözüm: ortalama (µ)=landa (ʎ)=varyans (ó)=2,6 dır. Standart sapması√2,6=1,61 dir.
Ör:Bir otomobil satış yerine ayda ortalama 150 müşteri gelmektedir.Herhangi bir günde satış yerini
açmayan galeri sahibi %kaç ihtimalle en az 3 müşteriyi kaçırmıştır.(ay=30)
Günlük ortalama:150/30=5 tir. 3 veya daha fazla müşteriyi kaçırma ihtimali (iki durum ya 3 ten sonsuza
kadar olan ihtimaller hesaplanacak veya 3 ten küçük olanlar (x=0,1,2) hesaplanıp 1 den
çıkarılacaktır.
P(x≥3)=1-p(x=0)+p(x=1)+p(x=2)=0,8754 %87,54
Örnek: bir havaalanından her 100 uçaktan biri mecburi iniş yapmaktadır. Herhangi bir ayda 4000 uçaktan
en çok 2 sinin mecburi iniş yapması ihtimali nedir?0,2381
163
23.7.2017
Selami ÖZCAN İstatistik
POİSSON DAĞILIMINA ÖRNEK
Bir fabrikada üretilen ürünler 0,001 olaslıkla bozuktur. Rastgele
örnekleme ile 2000 adet alınmıştır. 4 adet ürünün bozuk olma olasılığı
nedir?
 = 2000. 0,001 = 2
 = n. p = E(x)= V(X) =
-2 2 4
k
P(x=4) = e -------- = 0,09
- 
4!
P(x=k) = e -------k!
BİNOM’UN POİSSONA YAKLAŞIMI

165
POİSSON DAĞILIMININ p PARAMETRESİNİN SIFIRA
VEYA 1 YAKIN OLMASI DURMUNDA POİSSON
DAĞILIMININ BİNOM DAĞILIMINA YAKINSAMASI UYGUN
OLMAKTADIR. ÖRNEĞİN p < 0,05 VE n >20 İSE BU
YAKLAŞIKLIK KALİTE KONTROL UYGULAMALARI
AÇISINDAN TATMİNKAR SAYILMAKTADIR.
23.7.2017
Selami ÖZCAN İstatistik
POİSSON’UN BİNOMA YAKLAŞIMI
POİSSON DAĞILIMININ p PARAMETRESİNİN SIFIRA VEYA 1 YAKIN OLMASI DURMUNDA
POİSSON DAĞILIMININ BİNOM DAĞILIMINA YAKINSAMASI UYGUN OLMAKTADIR. ÖRNEĞİN p
< 0,05 VE n >20 İSE BU YAKLAŞIKLIK KALİTE KONTROL UYGULAMALARI AÇISINDAN
TATMİNKAR SAYILMAKTADIR.
BİNOM
POİSSON
0
0,328
0,359
=np=1
0,368
1
0,410
0,377
0,368
2
0,205
0,189
0,184
3
0,051
0,060
0,061
X
n= 5, p= 0,2
n= 20 , p=0,05
5. HİPERGEOMETRİK DAĞILIM








167
Binom ve hipergeometrik dağılım aynı tür olaylara
uygulanır. Örnekleminin şekli önemli, binomda
sınırsız anakütleden iadesiz çekilişler veya sınırlı
anaküteleden iadeli çekilişler (çekilişler birbirinden
bağımsız), bu yüzden binomdaki p değeri
çekilişten çekilişe değişiklik göstermez.
Hipergeometrikte ise; sınırlı anakütleden iadesiz
çekiliş veya bir sonraki çekiliş bir önekine
bağımlıdır.
Örnek:2 istatistik, 3 bilgisayar, 4 yöneylem
hocasından 3 kişilik sayısal yöntemler jürisi
oluşturulacaktır. Jüride en az bir istatistik
hocasının bulunması ihtimali nedir?
Çözüm: P(x≥1)=p(x=1)+P(x=2)
P(x≥1)=(2/1).[(9-2)/(3-1)]/9/3 + (2/2).[(9-2)/(3-2)]/9/3
P(x≥1)=42/84+7/84=49/84=05833
Örnek:not ortalaması 85 in üzerinde olan 4 iktisat, 7
işletme öğrencisinden 3 kişilik grup oluşturulacak,
grupta bir iktisatçı bulunması ihtimali?N=11 n=3 A=4
Formulde x yerlerine 0 ve 1 konacak
P(x≤1)=p(x=0)+p(x=1)=0,7212
23.7.2017
 A  N  A 
 

x nx 
P ( X  x / n, N , A)   
N
n


A!
( N  A)!


x!( A  x)!  n  x !( N  A)  (n  x)! 
P ( X  x / n, N , A) 
N!
n!( N  n)!
n : örnekte ki birim sayisi
N : anakutledeki birim sayisi
x : örnekte uzerinde durulan birim sayisi
A : anakutlede uzerinde durulan birim sayisi
hiç bir sekilde x deg eri A dan buyuk olamaz
A
(dagi lim in parametresi ) p  0,5ise dagilim simetrik
N
Ortalama  np
P
Varyans 2  np (1  p )
N n
N 1
S tan dart sapma   np (1  p )
N n
N 1
Selami ÖZCAN İstatistik
HİPERGEOMETRİK DAĞILIMA ÖRNEK
İçinde 10 sağlam ve 4 arızalı mal bulunan bir topluluktan 5 mal
alınmıştır. Bunlardan üçünün sağlam çıkma olasılığı nedir?
N=14
A=10
n= 5
x= 3
c
c
A x . N-A n-x
P(X=x) = -------------------------N n
c
c
c
10 3 . 14-10 5-3
P(X=3) = -------------------------= 0,3596
14 5
c
6. PASCAL(NEGATİF BİNOM)
DAĞILIMI- ÖRNEK
Bir imalat hattında kusurlu parça oranı 0,6 olarak bilinmektedir. 5. Parça
üretildiğinde 3. Kusurlu parçanın ortaya çıkma olasılığı nedir?
P(x)=
X=5
K=3
k
Ck-1 . p . q
x-k
X-1
P(5)=
3
C3-1 . 0,6 . 0,4
5-1
5-3
= 0,2074
Sorular
1.
2.
3.
170
İstatistik birimlerinin sahip oldukları özelliklere ne
ad verilir?
a)
Veri
b)
Şık
c)
Parametre
d)
Sabit
e)
değişken
1,1,2,3,5,8,11,13 basit serisinin medyanı kaçtır?
a)
4
b)
4,5
c)
5
d)
5,5
e)
6
Bir zar 3 kez atıldığında kaç olası sonucu vardır.
a)
112
b)
143
c)
165
d)
210
e)
216
23.7.2017
4.
5.
6.
Sınıflar:10-20, 20-30, 30-40, 40-50, 50-60, 60-70, 70-80
Frekans:1,5,7,12,20,24,25 den çok:25,24,20,18,13,5,1
50 den büyük gözlem sayısı kaçtır.
a)
8
b)
12
c)
13
d)
18
e)
20
Anakütleden uygun tekniklerle çekilen birimlerin
oluşturduğu alt topluluğa ne ad verilir?
a)
Sınıf
b)
Örneklem
c)
Evren
d)
Grup
e)
istatistik
X=1,3,5,6,8,9 kareli ortalaması nedir?
a)
b)
c)
d)
e)
4,31
5
5,33
5,5
6
Selami ÖZCAN İstatistik
7.
8.
9.
171
X=12,23,34,45,56 Değişim aralığı nedir?
a)
12
b)
17
c)
34
d)
44
e)
56
X=3,4,6,8,9 standart sapması nedir?
a)
12,28
b)
5,2
c)
5,53
d)
5
e)
6
Bir örneklemin gözlem değeri için hesaplanan
karakteristik değere ne ad verilir?
a)
Ortalama
b)
Frekans
c)
İstaitik
d)
Anlam frekansı
e)
parametre
23.7.2017
10.
1 den 10 kadar sayılar arasından seçilen bir sayının 2 ve
3 e bölünebilen bir sayı olma ihtimali kaçtır?
a)
b)
c)
d)
e)
11.
Xi ortalama (µ) standart sapma (sigma)=10 normal
dağılım göstermektedir. X=55 değerinin standart normal
değeri (z) kaçtır?
a)
b)
c)
d)
e)
12.
1/10
1/5
3/10
1/2
1/8
0,5
1
1,5
2
5
Kusursuz bir madeni para 2 kez atılmış, 1. atış yazı iken
2.ninde yazı gelme ihtimali kaçtır?
a)
b)
c)
d)
e)
¼
1/3
½
2/3
3/4
Selami ÖZCAN İstatistik
13.
14.
15.
172
Histogramın temel noktalarının birleştirilmesi ile
elde edilen grafik türünün adı nedir?
a)
Pasta grafiği
b)
Frekans poligonu
c)
Sütun grafiği
d)
Alan kodu
e)
Serpilme diyagramı
10 gözlem değerinden oluşan basit bir serinin
aritmetik ortalaması 50 ise bu serideki gözlem
değerleri toplam kaçtır?
a)
0,5
b)
5
c)
40
d)
60
e)
500
Sınıflar: 10-15, 15-20, 20-25, 30-35
Frekans: 40, 27, 18, 10, 5 /100 serinin frekans
eğrisi aşağıdakilerden hangisidir?
a)
Sola eğik
b)
J biçiminde
c)
Sağa eğik
d)
Ters J
e)
U biçiminde
16.
17.
18.
19.
20.
23.7.2017
Ortalamalarla ilgili ifadelerden hangisi yanlıştır?
a)
v
Birimle ilgili ifadelerden hangisi yanlıştır?
a)
q
Aşağıdakilerden hangisi tam sayımı engelleyen
nedenlerden biri değildir?
a)
Maliyetli olması
b)
Ölçülen birimde tahrip yapması
c)
Anakütle hacminin küçük olması
d)
Zaman sınırlaması
e)
Anakütle hacminin sonsuz sayıda olması
X=1,2,3,4 f(x)=1/10, 2/10, 3/10, 4/10 ortalaması kaça eşittir?
a)
1
b)
1,6
c)
2,7
d)
3
e)
3,8
X=1,2,3,4 f(x)=1/10, 2/10, 3/10, 4/10 standart sapması kaça
eşit?
a)
1
b)
3
c)
7
d)
9
Selami ÖZCAN İstatistik
e)
10
21.
22.
23.
173
Serilere ilişkin ifadelerin hangisi doğrudur?
a)
c
Aşağıdaki serinin modu nedir? X=3,5,8,13,21,34
Frekans=1,7,2,9,6,4
a)
7
b)
9
c)
11,5
d)
13
e)
14,93
50 birimlik örneklem 3. tabakadan seçilen birim
sayısı nedir?
a)
4
b)
15
c)
20
d)
35
e)
40
23.7.2017
24.
25.
26.
Standart normal dağılmış (z) bir değişken
P(0,52)<z<2,14 ihtimali nedir?
a)
0,1772
b)
0,1985
c)
0,2054
d)
0,2854
e)
0,4838
Başarı ihtimali p=0,2 q=0,8 (başarısızlık) binomyal
dağılmış değişkenin varyansı=4/5, deney sayısı n
kaçtır?
a)
2
b)
4
c)
5
d)
8
e)
10
X=72 standart sapması=15 bu imtihandan 90 alan
bir öğrencinin Z (standart normal puanı) nedir?
a)
1,2
b)
0,7
c)
0,3
d)
-1,0
e)
-1,2
Selami ÖZCAN İstatistik
6.BÖLÜM: Sürekli İhtimal Dağılımları
En çok bilinen sürekli ihtimal dağılımları
 Üstel Dağılım
 Gama Dağılımı
 Weibull Dağılımı
 Normal Dağılım
174
23.7.2017
Selami ÖZCAN İstatistik
1. ÜSTEL DAĞILIM
Elektronik cihazların ömür ve güvenirlik (reliability) hesaplamalarında
çok kullanılan bu dağılımın olasılık yoğunluk fonksiyonunun grafiğinin
şekli aşağıdadır. Bu dağılımı tanımlayan en önemli özellik arıza
oranıdır().
0,2
= 5
0,16
= 10
0,12
= 15
f(x) 0,08
0,04
0
0
20
40
X
60
80
100
ÜSTEL DAĞILIM
ÜSTEL DAĞILIM OLASILIK FONKSİYONU:
- x
f(x) =  e
 : SİSTEMDEKİ ARIZA ORANI ( >0)
X>0
ÜSTEL DAĞILIM ORTALAMASI:
1
=
 : SİSTEMDEKİ ARIZA ZAMANI ORTALAMASI

ÜSTEL DAĞILIM VARYANSI:
ZAMANA BAĞLI ALET GÜVENİRLİĞİ:
1
2
 =

2
-t
R(t) = e
BİRİKİMLİ ÜSTEL DAĞILIM FONKSİYONU:
F(a) = P(x<a) = 1- ea
a>0
ÜSTEL DAĞILIM-ÖRNEK
Seri üretim yapan bir fabrikadaki kusurlu mamullerin saat başına  =1/4 parametreli bir
poisson sürecine uygun olduğu belirlenmiştir. İç denetçinin saha çalışması için üretim
sisteminin başına saat 10:00’ da geldiği varsayıldığında;
A. İlk kusurlu ürünün ortaya çıkmasının beklenen zamanını,
B.İlk kusurlu ürünün en erken sat 11:00’de üretilmesi olasılığını,
C.İlk kusurlu ürünün en geç saat 14:00’de üretilmesi olasılığını bulunuz.
a. E(X) =  =
1

1
=
= 4 saat
1/4
- 0.25(1)
-t - 0.25t
b. P(X1) = R(t) = e = e
= e
= 0.2212
-t
c. P(X=4) = 1-e =1-e
-0.25(4)
-1
= 1-e
=1- 0.36788 = 0.63212
2. GAMA DAĞILIMI
0,2
0,16
= 1;
r=1
= 1; r=2
0,12
= 1; r=3
f(x) 0,08
0,04
0
0
20
40
X
60
80
100
GAMA DAĞILIMI
GAMA DAĞILIMI OLASILIK FONKSİYONU:

f(x) =
-x
e
r-1
(x)
r(r)
X>0 ;
r >O ;  >O
GAMA DAĞILIMI ORTALAMASI:
=
r

GAMA DAĞILIMI VARYANSI:
r
2
 =

2
BİRİKİMLİ GAMA DAĞILIMI FONKSİYONU:
00
F(a) = 1- 0

r(r)
(t)r-1 e - t dt
r-1
F(a) =1- 
k=0
- a ( a)
e
k!
k
3. WEIBULL DAĞILIMI
Olasılık Kuramı ve İstatistik bilim dallarında Weibull dağılımı (Waloodi Weibull anısına isimlendirilmiş)
bir sürekli olasılık dağılımı olup olasılık yoğunluk fonksiyonu ise :
Burada x ≥ 0 ve x < 0 için f(x; k, λ) = 0. k > 0 şekil parametresi ve λ > 0 Ölçek parametresi olurlar.
Weibull dağılımı için Yığmalı(Cumulative) olasılık Fonksiyonu bir gerlmiş üstel (stretched) fonksiyondur.
Yaşama, hayatta kalım ve yetmezlikle yıkım süreçlerini inceleyen verilerin analizi alanında Weibull
dağılımı çok elastik olup kolayca değiştirilebildiği için çok kullanılmaktadır. Değişik parametre değerleri
kullanılarak normal dağılım, üstel dağılım gibi çok popüler diğer istatistiksel dağılımların davranışların
Weibull dağılımı kullanarak aynen taklid etme imkânı bulunmaktadır.
Eğer k = 3.4 ise, Weibull dağılımı Normal Dağılım’ına benzerlik gösterir. Eğer k = 1 ise o zaman Weibull
dağılımı Üstel Dağılımı’na dönüşür.
4. NORMAL DAĞILIM
–
–
–
–
–
–
–
–
İstatistik analiz yapılırken, dağılımın özelliği çok önemlidir.
Çünkü farklı dağılım gösteren verilere uygulanacak tanımlayıcı ve analitik
istatistik yöntemleri de farklıdır.
Parametrik testlerin uygulanabilmesi için, dağılımın normal ya da normale yakın
olması gerekir.
Standart sapması, frekans eğrisi çan şeklinde olan simetrik dağılımdır.
Normal dağılım simetrik olduğu için, normal dağılım gösteren değişkenlerin
ortalama, medyan ve modları eşittir.
Normal dağılımı meydana getiren birimler ölçme veya tartma yoluyla elde edilen
verilerdir.
±∞ sayıda değer alır.
Moment çarpıklık katsayısı: ά4=3
Normal dağılım fonksiyonu
f(x) = 1/σx√2 e½(x-µx/σx)²
e:2,71828 :3,14159 µ: anakütle ortalaması σ:anakütle standart sapması, x:herhangi bir sürekli değişkendir.
181
23.7.2017
Selami ÖZCAN İstatistik
Dağılım özelliğinin önemi nedir



Parametrik testlerin tümünün uygulanabilmesi
için gereken varsayımların başında verilerin
dağılımının normal olması gelir.
Normal dağılımdan gelmeyen ölçümler
kullanıldığında, gerçekte olduğundan daha
küçük bir p değeri ya da daha dar bir güven
aralığı hesaplanır.
Bu durumda, doğru bir hipotezi reddetme
olasılığı artar. Yani, iki grup arasında fark
olmadığı halde fark varmış gibi sonuç elde
edilebilir
NORMAL DAĞILIMIN KRİTERLERİ




Dağılımın normal olup olmadığı grafik ve istatistik analiz
yöntemleri ile anlaşılır.
Histogram, dal ve yaprak grafiği ve normal olasılık grafiği
çizilerek dağılımın normal olup olmadığı hakkında fikir
edinilebilir.
Normal eğri altında kalan alan 1 e eşittir.
Normal dağılımda nokta tahmini yapılamaz bu sebeple
aralık tahmini (x1 ve x2 arası) yapılır.
STANDART NORMAL EĞRİ ALANLARI
X-µX
σX
%68,27 ==>±1σx %95,54 ==>±2σx %99,73 ==>±3σx
X değerlerinin standart z değerlerine dönüştürülmesi gerekir.
Z tablosundaki Z değerleri 0 ile 3,99 arasındadır.
Z=2,14 ün normal eğri alanı nedir?
Z tablosundaki normal eğri alanlarını bulmak için;
İlk sütundaki 2,1 ve ilk satırdaki 0,04
2,14 ün normal eğri alanı 0,4838 dir.
Örnek1: Z1=-1,44 ile Z2=2,06
arasındaki alan kaçtır?
P(-1,44≤z≤2,06)=0,4251+0,4803=0,9054
Örnek 2: Z1=-1,44 ile Z2=-0,51 arasındaki alan
kaçtır?
 P(-1,44≤z≤-0,51)=0,4251-0,1950=0,2301
Örnek 3: P(z ≤-1,44) değerini bulunuz?
 P(z ≤-1,44)=0,5-0,4251=0,0749
Örnek 4: P(z ≥-1,44) değerini bulunuz?
18 0,4251+0,5=0,9251

5
23.7.2017
Selami ÖZCAN İstatistik
Örnek 5: ortalaması 5 kg, standart sapması 0,15 kg olan bir prosesten
tesadüfi bir malın ağırlığı 5,05 kg dan fazla olma ihtimali nedir?
X=5,05 standart z değerine dönüştürelim
X-µX
σX
 Z=(5,05-5,00)/0,15=0,33 tür.
 P(x≥5,05) P(z ≥0,33)=0,5-0,1293=0,3707
olur.

18
6
23.7.2017
Selami ÖZCAN İstatistik
Verilerin normal dağılmadığı durumlarda iki işlem yapılabilir :
1.
Verilere dönüşüm uygulayarak, onların normal dağılıma
uymalarını sağlamak.
2.
Varolan verilere parametrik olmayan bir test uygulamak
KESİKLİ DAĞILIMLAR NORMALE YAKLAŞTIRILIR.
(BİNOM, POİSSON VE HİPERGEOMETRİK DAĞILIM)
BİNOM DAĞILIMININ
NORMAL’E YAKLAŞIMI
n yeteri kadar büyük olması durumunda binom kesikli değişkeni yaklaşık
olarak ortalaması np, varyansı npq olan bir normal dağılıma yaklaşır. Ayrıca
p ihtimal değerinin 0.5’e yaklaştığı bütün durumlarda binom dağılımı yerine
normal dağılım kullanılabilir. Binom dağılımı kesikli standart z normal
dağılımı süreklidir. Dönüştürmek için;
n 30 , np 5 ve p=0.50
E(X)=  = np
z=
X-

=
ve
(X+0,5) - np
npq
Bu durumda;
Varyans
z=

X-

= npq
=
X - np
npq
Örnek 1: Büyük bir şirkettte çalışan personelin % 40’ bayandır.
Çalışanlar arasından rastgele olarak 150 kişi seçilmiştir. Seçilen kişiler
içinde kadınların sayısının 56-70 arasında olma ihtimali nedir?
n = 150 30
p = 0,40 ~0,50
np = 60 5
BU ŞARTLARDA BİNOM NORMAL DAĞILIMA YAKLAŞIR.
=np=(150)(0,40)=60
Dağılımın ortalaması
=nxp =150x0,40=60
Standart sapması
√nxpxq . √(N-n).(N-1)
√150x0,40x0,60=6
X - np
z=
npq
(56-0,5) - 60
Z1=
6
= - 0,75
TABLODAN
0,2734
= 1,75
TABLODAN
0,4599
(70+0,5) -60
Z2=
6
+
0,7333
Seçilen kişiler arasında bayanların sayısının 56-70 arasında olma ihtimali %73.33’tür.
Örnek 2: Bir fabrikada üretilen mamullerin %10 hatalı, 150
birim alınıyor, 10 mamulun hatalı olma ihtimali kaçtır?










19
0
Dağılımın ortalaması
=nxp =150x0,10=15
Standart sapması
√nxpxq . √(N-n).(N-1)
√150x0,10x0,90=3,67
X= 10 değerine ±0,5 ilave edilirse;
X1=10,5 X2=9,5
Z1=10,5-15/3,67=-1,23
Z2=9,5-15/3,67=-1,50
P(x=10)=P(-1,5<z<-1,23)
P(z)=0,4332-0,3907=0,0425
23.7.2017
Örnek 3: bir önceki örneğe göre 10
dan az olma ihtimali kaçtır? (10
hariçtir)
 X=9,5 standart z değeri=-1,5
 P(x<10)=P(z<-1,5)=
 0,5-0,4332=0,0668
Selami ÖZCAN İstatistik
POİSSON DAĞILIMININ
NORMAL’E YAKLAŞIMI
Poisson dağılımında  Parametresi, =np≥5 eşitliğine uygun olması durumunda
Poisson dağılımı normal dağılıma yaklaşır. Bu Durumda ihtimallerin Hesaplanmasında;
-  k
P(x=k) = e -------k!
Formülü yerine = 2 =  =nxp eşitliğinden
istifade ederek
z=
X-

= X-
√

Örnek 1: Bir hastalığın iyileştirilmesi için geliştirilen yeni bir ilaç 20000
hasta üzerinde uygulanmıştır. İlacın yan etkisinin olması ihtimali 0,002 dir.
Buna göre ilacın verildiği hastalarda yan etkisi görülenlerin sayısının 3660 arasında olma ihtimali nedir?
n= 20000
p= 0,002
= =np=20000(0,002)=40 5 olduğundan poisson dağılımı normale yaklaşır.
V(X)=  = 40
z1 = =
z2=
X-

X-

=
=
36 - 40
40
60 - 40
40
= - 0,1
0,0398
= 0,5
0,1915
+
0,2313
Örnek 2: fabrika malzeme yokluğu sebebiyle günde 12 kez
durmaktadır. Rastgele seçilen bir günde malzeme yokluğu
sebebiyle günde 15 ve daha az durma ihtimali kaçtır?
=12 ise z=15,5-12/√12=1,01
 P(x≤15)=P(z≤1,01)=0,5+0,3438=0,8438
Örnek 3: bir önceki örneğe göre günde 12 kez durma
ihtimali kaçtır?
 X1=11,5 X2=12,5
 Z1 =11,5-12/√12=-0,14 Z2=12,5-12/√12=0,14
 P(x=12)=P(-0,14<z<0,14)=0,0557+0,0557=0,1114 %11,14

19
3
23.7.2017
Selami ÖZCAN İstatistik
HİPERGEOMETRİK DAĞILIMIN
NORMALE YAKLAŞIMI




194
Nxp≥5 olduğunda hipergeometrik dağılım normale yaklaşır.
Sınırlı anakütleden iadesiz çekilişler yapıldığı için standart
sapma düzeltme faktörü ile çarpılır.
Standart z formülündeki anakütle ortalaması ve standart
sapma yerine hipergeometrik dağılımın ortalama ve
standart sapması yazılarak ihtimal dağılımı hesaplanır.
Z= (x-np)/ √npq . √(N-n/N-1)
x değişkeni süreklilik düzeltmesine tabi tutulur.
23.7.2017
Selami ÖZCAN İstatistik
Hipergeometrik dağılımın normale
yaklaşımına Örnekler
Örnek 1: 1000 mamulun %10 hatalı, iadesiz
alınan 150 adetin ise 8 den az olma ihtimali
kaçtır.
 Dağılımın ortalaması
 =nxp =150x0,10=15
 Standart sapması
 √nxpxq . √(N-n).(N-1)
Örnek 2: 1.Örneğe göre 10 ve daha
fazla olma ihtimali kaçtır? (10 ve
yukarısı başlangıç 9,5)
Z= 9,5-15/3,39= -1,62
P(x≥10)= P(z ≥-1,62)=0,4474+0,5=
=0,9474 %94,74
σ=√150x0,10x0,90 x √(1000-150)/(1000-1)
σ=3,39
8 den az dendiği için 7,5
Z=7,5-15/3,39=-2,21
P (x<8) =P(Z<-2,21)=0,5-0,4864=0,0136
%1,36
195
23.7.2017
Selami ÖZCAN İstatistik
Download