P. 1
İstatistik ve Olasılık Ders Notları

İstatistik ve Olasılık Ders Notları

|Views: 1,972|Likes:
Yayınlayan: Ender Büken

More info:

Published by: Ender Büken on Nov 30, 2011
Telif Hakkı:Attribution Non-commercial

Availability:

Read on Scribd mobile: iPhone, iPad and Android.
download as PDF, TXT or read online from Scribd
See more
See less

06/10/2013

pdf

text

original

I.

İSTATİSTİK VE OLASILIK
Doç. Dr. İrfan Yolcubal Kocaeli Üniversitesi Jeoloji Müh. Bölümü

Ders Kitabı
Statistical analysis of Geological data (Koch G. S., ve Link, R. F., 1980. Dover Publications) A data-based approach to statistics (Iman, R. L., 1994) Basic statistics for Business and Economics (Lind, D. A., and Mason, R. D., 1997) İstatistik Analiz Metotları (Prof. Dr. Bilge Aloba)

1

DEĞERLENDİRME
Devam zorunlu (% 70) 2 Sınav (Ara vize + Final) Ödev Grup çalışması OK Ödev kopyalamak yasak

DERS PROGRAMI
Data toplama ve sunum şekilleri
• Örnek vs. Popülasyon kavramları • Data toplama teknikleri • Data sunum şekilleri
• • • • • Pasta diyagramlar Histogramlar Bar grafikler Kümülatif rölatif sıklık grafikleri Dağılım grafikleri (X-Y)

Dataların Değerlendirilmesi
Tarifsel istatistik
• Analitik ve analitik olmayan ortalamalar • standart sapma, varyans, standart hata, güvenilirlik aralığı vb…

2

DERS PROGRAMI devam
Olasılık ve Olasılık dağılımları (Probability density functions)
• • • • Binom Logaritmik Normal Poisson

Tahmin ve Hipotez testi
• t-test • z-testi • Varyans analizi (ANOVA)

Korelasyon ve Regresyon Linear regresyon Jeolojide örnekleme ve jeolojik datalardaki değişkenlik

İSTATİSTİK NEDİR?
İstatistik kısaca, data analizini kapsayan matematik biliminin alt bir dalıdır.
• Dataların toplanması, derlenmesi, özetlenmesi,sunumu, analizi ve aynı zamanda verilerden geçerli bir sonuç çıkarılması istatistik dalının başlıca ilgi alanlarıdır.

3

İSTATİSTİĞİN UYGULAMA ALANI İstatistiksel metotlar. ve özetlemek için kullanılan prosedürler Tümevarımsal (Inferential) istatistik: örneklemeye dayanarak bir popülasyon hakkında bilgi elde etmek için kullanılan metotlar 4 . Jeoloji’de olduğu gibi. Japon ürünlerini dünyada popüler yapan kalite-kontrol tekniklerinin uygulanmasında Ozon tabakasındaki incelmenin tahmininde Nüfus sayımında TOP 40 hit listesinin belirlenmesinde Hava tahminlerinde TV reytinglerin belirlenmesinde Kişisel bilgisayarınızdaki parçaların performanslarının geliştirilmesinde Seçim tahminlerinde Risk analizinde Ve daha bir çok alanda……… İSTATİSTİK TÜRLERİ Tarifsel (Descriptive) istatistik: nümerik verileri derlemek. düzenlemek. dataların değerlendirilmesinde ve analizinde yaygın bir şekilde kullanılmaktadır. modern yaşamın büyük bir alanında da.

nesneler. göz rengi. sınıftaki öğrencilerin sayısı vb. gibi) toplamını oluşturmakta. ırk. Kualitatif (Qualitative)Değişken : Nümerik olmayan değişkenlerdir. Miktar hakkında bilgi verir. Değişken Türleri Kantitatif (Quantitative) Değişken: Sayısal ölçekte ifade edilir. vb… 5 . deneysel sonuçlar. pilin ömrü. vb.DATALARIN TOPLANMASI: Kavramlar Örnek (Sample) : İnceleme yapılan popülasyonun bir bölümü Popülasyon: Hakkında bilgi edinilmeye çalışılan birimlerin ( kişiler. Doğum yeri. Hesabınızdaki bakiye.

6 . Uygun örnekleme tekniği ve protokolü: Toplanan örneklerin incelenen popülasyonu tam anlamıyla yansıtması gerekmektedir.Değişkenlerin Sınıflandırılması DATA TOPLANMASI Örneklemeye geçmeden önce inceleme yapılan popülasyonun iyi bir şekilde belirlenmesi gerekmektedir.

Bazı durumlarda imkansız olabilir.DATA TOPLANMASI Tüm popülasyonu incelemek (Sayım) yerine neden örneklemeyi kullanıyoruz? Düşük maliyet Zaman Dikkatlice alınmış örnekler bazı durumlarda bir sayım’dan daha doğru bilgi verebilir. Ürünlerin yok edilerek test edilişinden örnekleme tek başına yeterli olabilir. ÖRNEKLEME PLANININ AMAÇI Yüksek kalite: Toplanan verilerin doğruluk derecesi Savunabilirlik: Planın geçerliliği ile ilgili dokümantasyonun mevcut olması Tekrarlanabilirlik: Örnekleme planını takip ederek verilerin tekrar üretilebilmesi Temsil edici olması: İncelenen popülasyonu tamamıyla temsil etmesi Faydalı olması: Toplanan veriler planın amacına ulaşmasında kullanılabilir olması 7 .

Bunu sağlamak için uygun bir örnekleme stratejisi belirlemek gerekmektedir. lokasyonu. Örneklerin sayısı. ve zamanı örnekleme bütçesini aşmadan istatistiksel olarak geçerli bir örnek almaya yeterli olmalıdır.ÖRNEKLEME PLANI Örnekleme planının hazırlanışında örneklerin nerede ve ne zaman alınacağına karar vermek gerekmektedir. ÖRNEKLEME ŞEKİLLERİ Rasgele (Random): Her örneğin aynı sayıdaki gözlemde eşit olasılıkla olarak seçilebilmesi Sistematik: Karara dayalı (Judgemental): 8 .

ÖRNEKLEME ŞEKİLLERİNE BİR ÖRNEK Karara dayalı Rasgele Sistematik Örnekleme Hatası (Sampling Error) İstatistiksel anlamda hatadan ziyade örneklerin birbirlerinden olan doğal değişkenliklerini temsil etmektedir. örneklemeye dayalı tahminler ile popülasyonun gerçek karakteristiği arasında daima farklılık olacaktır. 9 . Tüm toplanan örneklerde bir tane ortak özellik bulunmakta: örneklerin hiçbirisinin tamamıyla tüm popülasyonu temsil etmemesi Dolayısıyla.

VERİ GRAFİKLEME TÜRLERİ Pasta diyagramlar (Pie Charts) Bar grafikler Histogramlar Kartezyen (X-Y) grafikleri Frekans Dağılım grafikleri Pasta Diyagramlar Farklı yada kantitatif dataların oran yada yüzde şekilde sunulmasında kullanılır. 10 .

BAR GRAFİKLERİ Düşey bar grafikleri:Üniversite mezunu erkek ve bayanların yaş gruplarına göre gelir dağılımını gösteren bar grafiklerine bir örnek 11 .

X-Y GRAFİKLERİ II. VERİLERİN ORGANİZE EDİLMESİ VE SUNULMASI 12 .

Veri sayısının sınırlı olduğu durumlarda uygulanabilir.Tasnif Bir kitlenin veya grubun özelliklerine göre yapısını ortaya çıkarabilmek amacıyla. Tasnif’e örnek: 100 kişilik bir sınıftaki öğrencileri yaş vasfına göre tasnif edersek 13 . elde edilen bilgileri bir vasıf veya vasıflar bakımından çeşitli şıklara ayırarak aynı şıkkı ait birimleri kümeler halinde bir araya getirme işlemine denir.

Böyle durumlarda bir vasfın birbirine yakın olan şıklarını gruplar halinde toplamaya. yani gruplamaya başvurulabilir. 14 . Gruplamaya örnek: Dünyadaki 29 en büyük şehir nüfus itibariyle gruplanarak bir frekans dağılımı veya bölünmesi şeklinde ifade edilebilir.Gruplama Eğer tasnif edilecek veri sayısı çok fazla ise bunları tasnif yoluyla kümelere ayırmak mümkün olsa bile anlamlı ve işlemlere elverişli olmayabilir.

15 .Gruplamaya örnek:(Hatalı) Bir endüstri dalında faaliyet gösteren işletmelerde çalıştırılan işçi sayısına göre gruplamak istersek FREKANS DAĞILIMLARI YADA BÖLÜNMELERİ (Frequency Distributions) Verilerin her bir sınıf aralığına düşen gözlem sayısını(frekans) gösterecek şekilde gruplandırılması işlemi.

sınıf orta noktası kavramları Sınıf aralığı: Sınıfın alt ve üst sınırları arasındaki fark Sınıf sınırları:Sınıfa ait minimum ve maksimum sınır değerleri Sınıf orta noktası veya noktası: Sınıfın alt ve üst sınırların ortalaması Frekans Dağılımının oluşturulması Örnek: Bir taşıtın yıl içindeki satış fiyatlarının organize edilmemiş hali: Ham data 16 . Sınıf sınırları.Sınıf aralığı.

Sınıf Sayısının Belirlenmesi Sınıf Aralığının Belirlenmesi 17 .

FREKANS DAĞILIM TABLOSU: FREKANS DAĞILIM GRAFİGİ (HİSTOGRAM) 18 .

verinin frekans dağılımı hakkında faydalı bilgiler sunmayabilir. Uygun olarak seçilmemiş sınıf sayısına göre oluşturulmuş frekans dağılımları. Örnek: 19 .FREKANS DAĞILIMLARININ OLUŞTURULMASINDA DİKKAT EDİLEÇEK HUSUSLAR Frekans dağılımlarının oluşturulmasında mümkün olduğu kadar eşit sınıf aralıkları seçilmeli Eşit olmayan sınıf aralıkları frekans dağılımları grafik edilirken sorun yaratabilirler. Fakat bazı durumlarda (çok sayıda boş sınıf oluşturmaktan kaçınmak için) eşit olmayan sınıf aralıklı frekans dağılımlarının oluşturulmasında kullanılabilir.

o sınıfın frekansının toplam frekansa oranıdır. Sınıfın nispi frekansı.Nispi frekans dağılımları (relative frequency distributions) Bir çok durumda bir sınıfın mutlak frekansından çok toplam içindeki nispi frekansını bilmek gerekmektedir. 20 .

Nispi frekans dağılımı 21 .

Kümülatif frekans dağılımları sınıf aralıkları farklı serilerin kıyaslanmasını kolaylaştırır. Kümülatif frekans dağılımlarının oluşturulması: Örnek:Bir sınıftaki öğrencilerin boy uzunluklarının frekans dağılımları 22 . Kıyaslamanın sağlıklı olabilmesi için önceden mutlak frekansların nispi frekanslara çevrilmesi gerekir.KÜMÜLATİF FREKANS DAĞILIMLARI Kümülatif frekans dağılımlarının en önemli özellikleri belirli bir düzeyin altında veya üstünde bulunan birimlerin frekansını gösterebilmeleridir.

Kümülatif Frekans Dağılımları 23 .

FREKANS POLİGONLARI Bu grafiklerde sınıf aralığı yerine sınıf orta noktasının sınıf frekansına göre dağılımı çizgisel olarak grafiklenir. Frekans poligonlarının histogramlara göre bir avantajı 2 veya daha fazla frekans dağılım grafiğinin kolaylıkla birbirleri ile karşılaştırılmasına imkan tanımasıdır ( Frekans dağılımlarının sınıf sayısı ve aralığı aynı olmak koşulu ile) 24 .

Analitik Ortalamalar Bir örneklemede tüm veri değerlerini dikkate alan merkezi eğilim ölçüleridir. Jeoloji Müh. Böl. Aritmetik ortalama Ağırlıklı ortalama Geometrik ortalama Harmonik ortalama 1 . Merkezi Eğilim Ölçüleri Doç. Dr. İrfan Yolcubal Kocaeli Üniv.II.

9.. 20 kişilik bir sınıfta istatistik dersinden geçen öğrencilerin notu şu şekilde sıralanmaktadır: 5. X = ∑X i =1 n İ N = X 1 + X 2 + X 3 + . 5. 6.gözlem değeri n=toplam veri sayısı X = ( 5 * 5 ) + ( 3 * 6 ) + ( 2 * 7 ) + ( 3 * 8 ) + ( 3 * 9 ) + ( 4 * 10 ) = 7 . 10. 5. 7.. X n N X : Aritmetik ortalama N: Toplam veri sayısı X: veri değeri Tekrarlanan gözlemlerin veri değerlerinin hesabı Bir örnekte gözlem değerleri bir çok kez tekrarlanabilir.. 8. 8. 10 Bu sınıfın istatistik dersinin aritmetik ortalaması nedir? X = n = 1 n ∑ fi k i =1 fi X i ∑ k i =1 fi: bir örnekteki Xi`nin frekansı k: örnekteki gözlem sayısı Xi: i. 5. Örneğin... 5..Aritmetik Ortalama (Aritmetic mean) Gruplanmamış yani ham veriler için aritmetik ortalama. tüm veri değerlerinin toplamının toplam veri sayısına oranıdır. 6. 9. 6. 8. 10. 10. 7. 9.4 20 2 .

aritmetik ortalama. veri setindeki aşırı değerlerden kolay etkilenmesidir. Aritmetik ortalama 76 olacaktır. 70. ∑( X − X ) = (3 − 5) + (8 − 5) + (4 − 5) = −2 + 3 −1 = 0 •Aritmetik ortalamanın hesaplanışında veri setindeki tüm veri değerleri kullanılır. Açık sınıf aralıklı frekans dağılım tablolarında aritmetik ortalama uygun değildir. Bir veri setindeki verilerden bir kaçı çok yüksek yada düşük değerler içeriyor ise. Aritmetik Ortalamanın Dezavantajı Aritmetik ortalamanın dezavantajı. Bu aritmetik ortalama veri setinin iyi bir şekilde temsil etmemektedir. ve 100`dir. 8. 70.Aritmetik Ortalamanın Özellikleri Bir serideki her bir veri değerinin aritmetik ortalamadan olan sapmalarının toplamı daima sıfırdır. 70. veri setinin merkezi eğilim ölçümünü temsil etmek için uygun olmayabilir. •Bir veri setinin yalnızca bir aritmetik ortalaması vardır. ∑( X − X ) = 0 Örnek: 3. 3 . • Örnek: 5 öğrencinin bir sınavda almış olduğu notlar 70. ve 4 değerlerin aritmetik ortalaması 5`dir.

X W = X 1W 1 + X 2W 2 + X 3W 3 + . Bu öğrencinin ders ortalamasını hesaplayalım.. her bir veri değerinin öneminin eşit olduğu varsayılmaktadır... + W n X = ∑W i =1 n i =1 n i X İ i W ∑W W: Her bir veri değerinin ağırlığını yani önemini ifade etmektir.. + X n W n W 1 + W 2 + W 3 + . müzik dersinden 10 ve İngilizce dersinden 9 almıştır.. X W : Ağırlıklı ortalama Ağırlıklı Ortalama`ya Örnek Bir öğrenci matematik dersinden 6. edebiyat: 2...Ağırlıklı Ortalama(Weighted Mean) Aritmetik ortalamada... edebiyat dersinden 7.. Ders kredileri: Matematik:3.3 3 + 2 +1+1 7 X= 6 + 7 + 9 + 10 =8 4 4 .. Fakat bazı değerlerin önemi diğerlerinden farklı olabilir. İngilizce: 1 XW = (6 * 3) + (7 * 2) + (9 *1) + (10 *1) 51 = = 7.... Bu durumlarda ağırlıklı ortalama kullanılır... müzik:1.

Sarar takım elbisesinin ağırlıklı ortalama fiyatı nedir? Sarar her bir takım elbiseye birim fiyatı olarak $200 ödemiştir. Bahar indiriminde aynı takım elbiseyi 200 dolara indirerek 126 adet.Ağırlıklı Ortalama: Örnek 2 Sarar normal perakende satış fiyatı üzerinden ($400) 95 adet Kığılı marka takım elbiseyi satmıştır. Sararın bu satıştaki toplam kazancı ne kadardır? Örnek 2 X X W = W ( 95 * 400 ) + ( 126 * 200 ) + ( 79 * 100 ) 95 + 126 + 79 71100 = = $ 237 300 = $ 37 = $ 12100 Birim Kazanç : 237 − 200 Toplam Kazanç : 37 * 300 5 . en son indirimde de 100 dolara 79 adet takım elbise satmıştır.

= 1 n ∑ log X i Veri sayısı çok olduğu durumlarda hesapları kolaylaştırmak amacıyla logaritmalardan yararlanılmaktadır.. 4. G .) ortalamasının hesaplanmasında 2) bir zaman aralığı içerisindeki bir üretimin yada satışın artış miktarının ortalamasının belirlenmesinde yaygın olarak kullanılmaktadır. 6 . Bu nedenle geometrik ortalama ya aritmetik ortalamaya eşit olacaktır yada küçük olacaktır. Geometrik ortalama özellikle 1) değişim oranlarının (yüzde.46 X = 3+ 2+ 4+6 = % 3 .( X n ) Not: Eğer veri değerlerinden bir 0 yada negatif değerlikli ise Geometrik ortalama hesaplanamaz. vb. Bu şirketin ortalama kârı nedir? G . Ve 6`dır. Çünkü aşırı değerlerden aritmetik ortalamaya göre o kadar fazla etkilenmemektedir. Geometrik Ortalama: Örnek 1 Bir inşaat şirketinin dört projedeki ortalama kâr yüzdeleri 3.. = 4 3 * 2 * 4 * 6 = 4 144 = % 3 .O ....Geometrik Ortalama (Geometric Mean) Geometrik ortalama iktisat ve işletme alanlarında yaygın olarak kullanılan bir ortalama türüdür.O . 2.. log G .O . oran. = n ( X 1 )( X 2 )( X 3 ).75 4 Geometrik ortalama daha tutucu bir kar değeri vermektedir.

H = N = 1 1 1 1 + + + . 7 4 1 . = n −1 bir periyotun sonundaki deger −1 bir periyotun baslangicindeki deger n : periyot araligi G .. •Veri değerlerinde sıfır bulunması yada veri değerlerinin farklı işaret taşımaları durumunda harmonik ortalama kullanılmaz.5 milyona yükselmiştir. = 5 −1 56 . fiyat. + X1 X2 X3 Xn N ∑ 1 Xi •Değişkenlerden birinin sabit.O . Bu 5 yıl içinde nüfusun ortalama artış hızı ne olmuştur? G.7 milyondan 1995 yılında 56. verimlilik gibi oransal olarak belirtilebilen bazı değişken değerlerin ortalamalarının hesaplanışında kullanılır.Geometrik Ortalama: Örnek 2 Türkiye'nin nüfusu 1990 yılında 50.. diğerinin ise değişken olduğu durumlarda başvurulan bir ortalamadır.O.. 5 −1 = 50 . 47 Harmonik Ortalama(Harmonic mean) Bazı özel durumlarda başvurulan bir ortalama olup hız. 7 . 11 − 1 = % 2 .

5km 2 ANALİTİK OLMAYAN MERKEZİ EĞİLİM ÖLÇÜLERİ Bir örnekteki bütün veri değerlerini dikkate almayan merkezi eğilim ölçüleridir. • Medyan (Median) • Mod (Mode) 8 . hızla. dönüş için ise 150/50: 3 saat Burada mesafe unsuru sabit fakat zaman unsuru ise sabit olmadığından harmonik ortalama kullanılmıştır. dönüşte ise 50 km hızla kat edilmektedir. Bu durumda ortalama hız nedir? İki kasaba arasındaki mesafe 150 km varsayılır ise gidiş için gerekli süre 150/75: 2 saat.Harmonik Ortalama: Örnek •İki kasaba arasındaki mesafe gidişte saatte 75 km. H = 2 1 1 + 75 50 = 60 km X= 75 + 50 = 62.

32 35 65 9 . Düzenlenmemiş verilerde medyan`ın yerini kolaylıkla tespit etmek için aşağıdaki formülden yararlanılabilir. Medyan fiyat nedir? 25 29 30 Medyan : (30+32)/2= 31 TL. tam ortadaki yani veri dizisini 2 eşit frekansa ayıran değerdir. Bu gibi durumlarda aritmetik ortalama örneğin merkezi eğilimini yansıtmaz.Medyan (Ortanca) Bazı durumlarda örneğin bir yada iki tane çok yüksek yada düşük değerler içerebileceğinden bahsetmiştik. Veri değerleri büyükten küçüğe yada küçükten büyüğe sıralandıktan sonra. 25. 29. 35 TL. 30. Böyle problemlerde medyan değeri kullanılarak örneğin merkezi eğilimi ölçülebilir. medyan degerinin yeri = n = toplam veri sayisi n +1 2 Medyan: Örnek1 Bir klinikte pansuman için ödenen miktarlar aşağıdaki gibi sıralanmaktadır: 65. 32.

100. 70 TL. 115. 105. Ortalama kira fiyatı nedir. 110. Medyan: Örnek 2 70 100 105 110 115 120 125 Medyan 10 . 125.Medyan: Örnek 2 Yuvacık Kalıcı konutlarındaki kira fiyatları aşağıdaki gibi sıralanmaktadır: 120.

Medyanın Özellikleri Her bir veri setinin tek bir medyanı vardır. Veri setindeki aşırı değerlerden etkilenmediği için verilerin merkezi eğiliminin belirlenmesinde aritmetik ortalamaya nazaran daha doğru bir bilgi sunar. Mod Bir veri setindeki bütün değerleri dikkate almayan (hassas olmayan) bir başka merkezi eğilim ölçümüdür. Aritmetik ortalamanın aksine açık sınıf aralıklı frekans dağılımlarının merkezi eğiliminin ölçümünde kullanılabilirler. 11 . bir data setinde en sık olarak gözlenen veri değeridir. Mod.

4. 7. 5. 7.5. 6.Mod: Örnekler 4. 4. 4. 4. 5. 8. 5 Mod ? Gruplanmış Verilerde Aritmetik Ortalama. 5. 11 Mod ? 4. 8. 12 .5. 6. Medyan. frekans dağılımları oluşturulmuş olabilir ve ham veriler mevcut bulunmayabilir. 5. medyan ve mod frekans dağılım tablolarından hesaplanabilir. 6. 5. 4 Mod ? 4. 6. 6. 6. 10. 6. 5. 7. 4. 4. 6. 5. 6. 5. Bu değerler gerçek ham verilerden hesaplanan değerlerden farklı olabilir. Mod Bazı durumlarda veri değerleri gruplandırılıp. 9. Bu gibi durumlarda aritmetik ortalama.

Aritmetik Ortalamanın Frekans Dağılımından Hesaplanışı X= ∑ fX N X: her bir sınıfın orta noktası f: her bir sınıf frekansı N: Toplam veri sayısı yada frekansların toplam değeri Örnek Net geliri (milyon $) 2-5 5-8 8-11 11-14 14-17 İthalatçı sayısı 1 4 10 3 2 Net gelirin aritmetik ortalamasını hesaplayınız? 13 .

5 26 95 37.5 6.Net geliri (milyon $) 2-5 5-8 8-11 11-14 14-17 Toplam İthalatçı sayısı (f) 1 4 10 3 2 20 Sınıf orta noktası (X) 3.5 12.65 20 Frekans Dağılımından Medyanın Hesaplanışı N − CF Medyan = L + 2 (i ) f L: Medyan sınıfın alt sınırı N: Toplam frekans değeri CF: Medyan sınıfından önceki sınıfların frekanslarının toplamı f: medyan sınıfının frekansı i: medyan sınıfının aralığı 14 .5 31 193 X= ∑ fX N = 193 = 9.5 15.5 9.5 fX 3.

frekans sayısı en fazla olan sınıfın orta noktası değeridir.5 12.5 CF 1 5 15 18 20 20 −5 medyan = 8000000+ 2 (3000000) 10 medyan = 9500000 Frekans Dağılımından Modun Hesaplanışı Frekans dağılımı şeklinde gruplanmış veriler için mod.5 9. 15 . Eğer frekans dağılımında 2 sınıf maksimum frekansa sahip ise bu tür dağılımlara bimodal dağılımlar denilmektedir.Net geliri (milyon $) 2-5 5-8 8-11 11-14 14-17 Toplam İthalatçı sayısı (f) 1 4 10 3 2 20 Sınıf orta noktası (X) 3.5 15.5 6.

Bir Frekans Dağılımı Grafiğinde Aritmetik ortalama.Bir ürünün satış fiyatın gruplandırılmış şekli. medyan. Net satış ($ dolar) 1-4 4-7 7-10 10-13 13 ve daha fazlası Toplam yüzdesi 13 14 40 23 10 Net satışın medyan ve modu hesaplayınız? Bu tür tablolara ne ad verilmektedir. mod arasındaki ilişki Aritmetik ortalama= mod=medyan Simetrik frekans dağılım eğrileri 16 .

medyan.Bir Frekans Dağılımı Grafiğinde Aritmetik ortalama. Aritmetik ortalama-Mod= 3(Aritmetik Ort-Medyan) 17 . mod arasındaki ilişki Mod X Med Asimetrisi negatif olan Frekans dağılımları(sola çarpık) X Med Asimetrisi pozitif olan frekans Dağılımları(sağa çarpık) Mod Tek modlu ve asimetrileri çok fazla olmayan veriler için Aşağıdaki ilişki kullanılabilir.

Böl. DAĞILMA YADA DEĞİŞKENLİK ÖLÇÜLERİ (MEASURE OF DISPERSION) Doç.III. Dr. İrfan Yolcubal Kocaeli Üniv. Dağılma (değişkenlik) ölçülerinin analizinin nedeni Bir veri setinin merkezi eğilim ölçüsünün değerlendirilmesi 2 veya daha fazla veri setinin dağılımının karşılaştırılması 1 . Jeoloji Müh.

Dağılma yada değişkenlik ölçüleri Değişkenlik aralığı (Range) Ortalama sapma (mean deviation) Varyans (Variance) Standard sapma (Standard deviation) Gruplanmamış verilerde dağılımın ölçümü Değişkenlik aralığı (Range): Bir veri serisindeki en yüksek değer ile en düşük değer arasındaki farka eşittir.Minimum değer 2 . R= Maksimum değer.

Değişkenlik aralığı (Range) Seri 1 2 3 6 7 8 10 Seri 2 5 5 5 6 7 8 X=6 R=10-2=8 X=6 R=8-5=3 Gruplanmış verilerde değişkenlik aralığının(Range) belirlenmesi Saatlik Ücret(lira) Frekans 5-10 10-15 15-20 20-25 10 21 9 5 R= 25-5=20 TL 3 .

S . 21. 18.S . Veriler 15 16 18 21 25 X− X X− X ⎢15-19 ⎢ ⎢16-19 ⎢ ⎢18-19 ⎢ ⎢21-19 ⎢ ⎢25-19 ⎢ TOPLAM 4 3 1 2 6 16 O.Ortalama yada Mutlak Ortalama Sapma (Mean Deviation or Mean Absolute Deviation) Bir popülasyondaki tüm veri değerlerinin popülasyonun aritmetik ortalamasından olan mutlak sapmalarının aritmetik ortalamasıdır. O. 25 değerlerinden meydana gelmiş serinin ortalama sapmasını hesaplayalım.2 5 4 . = ΣX −X N X − X = mutlak sapma Ortalama Sapma (Gruplanmamış Verilerde) 15. 16. = 16 = 3.

8 21.2 8. = ∑f X − X 486.2 N 51 O.2 1. S .53 51 N Varyans (Variance) ve Standart sapma (Standard deviation) Varyans. σ 2 Σ X − X = N Popülasyona ait ( ) 2 σ2 = Σ X −X N −1 ( ) 2 Örneklemeye ait 5 . bir veri setindeki tüm veri değerlerinin.2⎪ X− X f X− X 18.2⎪ ⎢35-33.2 109 486.2⎪ ⎢25-33.8 28.4 114.2⎪ ⎢55-33.2 10-20 20-30 30-40 40-50 50-60 Toplam X= ∑ fX = 1695 = 33.8 11.8 127. ortalamadan olan sapmaların karesinin aritmetik ortalamasıdır.Ortalama sapma (Gruplanmış Verilerde) Sınıf frekans (f) 7 14 16 9 5 51 Sınıf orta noktası (X) 15 25 35 45 55 fx 105 350 560 405 275 1695 X− X ⎢15-33.2 = = 9.2⎪ ⎢45-33.8 106.

σ= Σ X −X N ( ) 2 Σ X −X σ= N −1 ( ) 2 Popülasyona ait Örneklemeye ait Standart sapma ve varyansın özellikleri Bir serideki değerlere bir sabitin (a’nın) eklenmesi veya bu değerlerden bir sabitin çıkarılması ile serinin varyans ve standart sapması değişmez. orijinal serinin standart sapmasının sabitin kendisi ile çarpımına eşit olmaktadır. Ancak standart sapması. orijinal serinin varyansının sabitin karesi ile çarpımına eşittir. σ 2 ( X − a) = σ 2 ( X ) σ 2 ( X + a) = σ 2 ( X ) Bir serideki değerlerin her birinin belirli bir sabit ( c ) ile çarpılması sonucu meydana çıkan serinin varyansı.Standart Sapma Bir veri setinin varyansının kareköküne eşittir. σ 2 (cX ) = c 2σ 2 ( X ) σ ( cX ) = cσ ( X ) 6 .

2 X ) 2 = 98 Standard Sapma ve Varyans Hesabı (Gruplanmış verilerde). 7 . X 22 25 28 30 35 (X − X) ( X − X )2 X= -6 -3 0 2 7 X) = 0 36 9 0 4 49 140 = 28 5 ∑ X = 140 ∑ ( X − ∑(X − 98 σ = = 196 . ve 35 değerlerinden oluşan popülasyonun varyans ve standart sapmasını hesaplayalım.Standart Sapma ve Varyans (Gruplanmamış verilerde) • 22. 28. .Popülasyon örneği sınıflar frekans (f) Sınıf orta noktası (X) fX 2 (X − X) (X − X) f ( X − X )2 0-200 200-400 400-600 600-800 Toplam 32 8 11 7 6 100 300 500 700 800 3300 3500 4200 11800 -270 -70 130 330 72900 4900 16900 108900 583200 53900 118300 653400 1408800 X= 11800 1408800 = 370 σ 2 = = 44025 32 32 σ = 44025 = 20982 . 30. 25. 5 σ = 196 = 443 .

Sh=c2/12 c=sınıf aralığı Sh=sheppard düzeltmesi Düzeltilmiş varyans = σ2-Sh Varyans Tek bir veri seti için varyans değerinin yorumlanması zordur.Gruplanmış verilerin varyansı ve standart sapması Sınıflandırılmış verilerde. 2 veya daha fazla data setindeki verilerin değişkinlik derecelerin karşılaştırılmasında kullanılır. ham verilere göre gruplandırılmış değerlerde daha yüksek varyans değeri bulunur. 8 . Değişkenlik aralığı ve ortalama sapmada olduğu gibi varyans. sınıf orta noktası her zaman bu kısmın ağırlıklı orta noktası olmayacağından. Bunu önlemek için Sheppard düzeltmesi yapılır.

TL) Birimleri aynı fakat ortalamaları birbirinden çok farklı olan data setlerin kıyaslanmasında değişim katsayısı kullanılır.7% 12000 Degisim katsayisi = 9 . σ = 50000 X = 12000. Bir data setinin standart sapmasının aritmetik ortalamasına oranıdır.7 X ± 1σ X ± 2σ X ± 3σ Nisbi Dağılma(Relative Dispersion) Değişim katsayısı (Coefficient of variation): % olarak ifade edilir. X = 500000.Simetrik frekans dağılım grafiklerinde standart sapma ve aritmetik ortalama arasındaki ilişki -3σ -2σ -1σ X 1σ 2σ 3σ %68 %95 %99. σ = 2000 50000 * 100 = 10% 500000 2000 Degisim katsayisi = * 100 = 16. Degisim Katsayisi(%) = σ X *100 Birimleri farklı olan farklı 2 data setinin kıyaslanmasında (cm.

10 .Gruplanmamış verilerde Çarpıklık Frekans dağılım grafiklerinin çarpıklık derecesini tarif etmektedir. Simetrik çarpıklık=0 Pozitif çarpıklık Negatif çarpıklık Gruplanmış verilerde Çarpıklık Çk = ∑ fi xi − x ∑ fσ i 3 ( ) 3 Carpiklik = 3(X − medyan) σ Şeklinde de hesaplanabilir. ∑(x − x) Çk = i 3 nσ 3 Çarpılık genellikle –3 ile +3 değerleri arasında değişmektedir.

sivri-orta kısımlar uç kısımlara göre daha İyi boylanmış yada sivrileşmiş can eğrisi Kur<3 (Platykurtik. yada normal dağılım) Kur>3 (Leptokurtik. ∑ (x − x) Kur = i 4 Ham verilerde Gruplanmış verilerde nσ i 4 ∑ f (x − x) Kur = ∑ fσ i 4 i 4 Kur=3 (mesokurtik.Gruplanmamış verilerde Kurtosis (Basıklık-Sivrilik) Frekans dağılım eğrisinin yüksekliğini belirten bir parametre.basık uç kısımlar daha iyi boylanmış yada basık Çan eğrisi 11 .

1/2) 0 olasılık olayın kesinlikle olmayacağını. 1 . Irfan Yolcubal Kocaeli Üniversitesi Olasılık Kavramı Olasılık (Probability): Belirli bir olayın olma ihtimalinin yada şansının ölçümü. OLASILIK YADA İHTİMAL TEORİSİ Dr. Oran olarakta ifade edilebilir (Örneğin. 20/100.IV. 1 olasılık ise olayın kesinlikle meydana geleceğini ifade etmektedir. 0 ≤ P(A) ≤ 1. 7/10.

Sonuç (Outcome). ve Olay (Event) Deney Zar atma Sonuç 1. 5. 2 . vb.Terminaloji: Deney (Experiment). 6 Olay Çift bir sayının gelmesi 4`den büyük sayının gelmesi. 4. 3. Objektif Olasılık (Tekrarlanabilen rastgele bir deneye bağlı). Subjektif Olasılık (Tekrar edilemeyen bir deneye bağlı). Deney: Bir aktivitenin gözlemlenmesi yada ölçüm alma şekli Sonuç: Bir deneyin belli bir sonuçu Olay: Bir deneyin bir yada daha fazla sonuçlarının toplamı Olasılık Sınıflandırılması Olasılık 2 şekilde sınıflandırılabilir. zar atılması Klasik Olasılık Nisbi frekans olarak 2 kısma ayrılabilir. Örnek: Rus ruletinin döndürülmesi. Örnek: Geçmis meteoroloji verilerine dayanarak yarın yağmur yağma ihtimalinin tahmini subjektif olasılık değerleri sunan bir deneydir. 2.

mümkün olan ve ortaya çıkma şansı eşit olan bütün hallerden (n) sadece (a) kadar halde ortaya çıkıyor ise.167 Klasik Olasılık Kavramı Olayın çıkışını elverişli hal(a).833 3 . P=1/6 = 0. n= a+b Elverişsiz bir halin ortaya çıkma olasılığı [P(~E). yada P (E ) ] P( E ) = b n−a a = 1 − = 1 − P( E ) = n n n Örnek: Bir zar atıldığında 2 gelmeme olasılığı nedir? P(~E)=1-P(E)= 1-1/6 =0. o olayın ihtimali P( E ) = a elverisli hal sayisi = n toplam mumkun haller sayisi Örnek: Bir zar atıldığında 2 gelme olasılığı. çıkmayışınıda elverişsiz hal (b) olarak ifade edersek.Klasik Olasılık Tanımı Eğer bir olay E.

o olayı meydana getiren olayların olasılıkların toplamına eşittir. Yani bileşik olayların birbirlerini engelleyen türden olması gerekmektedir [P(AB)=0]. Bir kere zar atıldığında 2 yada 6 gelme olasılığı nedir? P(2 yada 6) = 1/6 +1/6 =0. Örneğin A veya B olayının meydana gelme olasılığı P (A veya B) = P(A) + P(B) Bu kuralın uygulanabilmesi için bir olay meydana gelirken aynı anda diğerlerinin meydana gelmemesi gerekmemektedir. 250 kez para atıldığında yazı gelme olaylarının nisbi frekansını hesaplarsanız m/n P (Yazı)=m/n n ∞ m: yazı sayısı n: toplam atış 50 100 150 200 250 0.5 n OLASILIK HESAPLAMARINDA TEMEL KURALLAR Olasıkların toplanması: Bileşik bir olayın ortaya çıkma olasılığı.33 4 . Örnek.Olasılığın nisbi frekans olarak belirlenmesi Bir olayın meydana gelme olasılığı= geçmişte benzer olayın tekrarlanma sayısının toplam gözlem sayısına oranıdır.

Olasılıkların toplanması Eğer bir deneyde A. B. maça çekme olayı: B P(A veya B)=P(A)+P(B)-P(AB) = 4/52 + 13/52 –1/52 = 4/13 5 . P (A veya B veya C)= P(A) + P(B).P(AB)P(AC)-P(BC)+P(ABC) Örnek 1 Bir deste iskambil kağıtı arasından 1 vale veya 1 maça çekme olasılığı nedir? Vale çekme olayı: A. ve C olayları birbirlerini engellemeyen türden olaylar ise A ve B olaylarının ortaya çıkış olasılığı P(A veya B)= P(A) +P(B)-P(AB) P(AB): Birleşik olasılık (Joint probabilit):hem A hemde B olayının aynı anda meydana gelme olasılığı A veya B veya C’nin ortaya çıkış olasılığı.

Venn(1834-1888) bir deneyin sonuçlarını grafiksel olarak ifade edebilmek için diyagramlar geliştirdi. efesi ziyaret etme olayı:B P(A veya B)=P(A) + P(B).8 Olasılıklarınının Toplanmasının Küme Teorisi ile açıklanması J. Bir turistin Ayasofya veya efesi ziyaret etme olasılığı nedir? Ayasofyayı ziyaret etme olayı: A.P(AB) =120/200 +100/200 –60/200= 0. B.Örnek 2 Ülkemizi ziyaret eden 200 turist üzerinde yapılan ankette sadece Ayasofyayı ziyaret eden turist sayısı 120. Bu diyagramlara Venn diyagramları denir. A B C A. 60’ ise her ikisinide ziyaret etmiştir. C olayları birbirlerini engeleyen olaylar P(A)+P(B)+P(C) =1 A ~A P(A)+P(~A)=1 6 . Efesi ziyaret eden turist sayısı ise 100’dür.

P( AB) P( A| B) = P( B) Ave B olayları birbine bağlı ise yani B olayının ortaya çıkışı A olayının olasılığını etkiliyorsa hem A hemde B olayının aynı anda meydana gelme olasılığı P( AB) = P( A).Olasılıklarınının Toplanmasının Küme Teorisi ile açıklanması A B P(A veya B)= P(A)+P(B) ~(A veya B) A A∩B B P(A veya B)=P(A)+P(B)-P(AB) Olasılıkların çarpımı kuralı Şartlı olasılık(Conditional Probabilility): Şayet A olayı B olayından sonra ortaya çıkıyorsa. P(A|B): Eğer B olayı meydana geldiyse A olayının olasılığını ifade etmekte. P( A| B) 7 . P( B| A) P( AB) = P( B). A olayının olasılığına şartlı olasılık denir ve P(A|B) şeklinde ifade edilir.

Eğer sırasıyla birer adet toplam 2 film çekersek.P(B|A) =3/10 . 2/9 =0. Bunlardan 3’ünün bozuk olduğu biliniyor.Örnek Bir kutuda 10 adet film var.0667 Olasılıkların çarpımı kuralı Eğer A ve B olayları birbirinden bağımsız ise yani birinin ortaya çıkışı diğerinin olasılığını etkilemiyor ise Hem A hemde B’nin aynı anda ortaya çıkma olasılığı P(AB)=P(A)P(B) 8 . seçilmiş filimlerin her ikisininde bozuk olma olasılığı nedir? P(A): birinci çekimde filmin bozuk çıkma olasılığı P(B): ikinci çekimde filmin bozuk çıkma olasılığı P(A ve B)= P(A).

+ P( An ) P( B| An ) 9 . ve C olayları birbirine bağlı ise A. o olayı yaratmış olması ihtimalini hesaplayabilmektir.. B.. Kuralın amaçı bir olayın ortaya çıkmasında birden fazla bağımsız nedenin etkili olması halinde bu nedenlerden herhangi birinin.B.ve C’nin aynı anda ortaya çıkma olasılığını nasıl hesaplarız? Bayes Kuralı Şartlı olasılıkların hesaplanmasında kullanılan bir tekniktir.Ödev Eğer A. P ( A'i | B) = P( Ai ) P( B| Ai ) P ( A1 ) P( B| A1 ) + .

Doç. • Örnek: – Bir parayı 5 kez atalım ve tura gelme sayısını hesaplayılım (0. sonra vazgeçen kişi sayısı Sürekli (Continuous) Random Değişken: Random değişken belirli bir aralıkta her değeri alabilir. | 2 | 3 | 4 | 5 | 6 | 7 | 8 X 1 . yada 5) – Bir haftada yapılan satış sayısı – 5 dakika içerisinde Türk petrole gelen araç sayısı – 200 kişi içerisinden uçak rezervasyonu yaptırıp. 3. 2.Dr.SÜREKSİZ(DISCRETE) OLASILIK DAĞILIMLARI Yrd. İrfan Yolcubal Kocaeli Üni. • Random değişkenin değeri sayarak elde edilir. 1. • Random Değişken: Nümerik olarak ifade edilen bir deneyin sonuçları • Süreksiz(Discrete) Random Değişken: • Random değişken belirli bir aralıkta sadece kesin değerler alabilir. Jeoloji Müh. 4.

• Deneyin sonuçları birbirlerini engellemeli 2 . 2 parayı aynı anda atarsak 3/4 – 2/4 – 1/4 – – yazı gelme olasılığı Olasılık 0 1 2 x = Yazı gelme sayısı Süreksiz(Discrete) Olasılık Dağılımları • Tüm olası [xi . bir deneyin olası sonuçlarını ve her bir sonuça karşılık gelen olasılıkları sunan dağılımlardır.Süreksiz Random Değişkenlerin Olasılık Dağılımları • Olasılık dağılımı. p(xi)] çiftleri • x= random değişkeninin değeri • P(x)= random değişkenin meydana gelme olasılığı 0 ≤ p(xi) ≤ 1 • Σ P(xi) = 1 • Deneyin sonuçlarına ait olasılıkların toplamı 1’e eşittir.

1)2(.50 Süreksiz Olasılık Dağılım Modelleri Süreksiz Olasılık Dağılımları Binom Hipergeometrik Poisson 3 .50) + (2 .25) = .Süreksiz Olasılık Dağılımlarının ortalaması ve varyansı µ = E(X) = ∑xi p(xi) σ2 = Σ (xi .1)2(.25 + 1 ×. Ortalama değeri ve varyansı hespalay µ = 0 × .50 + 2 × .25 = 1 σ2 = (0 .25) + (1 .µ )2p(xi) Örnek: 2 parayı aynı anda atalım ve yazı gelme sayısını belirleyelim.1)2(.

bir deneyin sonuçu diğerlerinkini etkilemez yani bağımsızdır. • Örnek: Bir paranın 15 kez yazı/tura için atılması. BİNOM OLASILIK DAĞILIMLARI P( x ) = n! p x q n− x x !(n − x )! n: deney sayısı x: elverişli halin sayısı p: her bir deneydeki elverişli halin olasılığı q: elverişsiz halin olasılığı. • Deneyin her bir sonuçun olasılığı bir deneyden diğerine değişmez.BİNOM OLASILIK DAĞILIMLARI • Binom olasılık dağılımları n adet deneyde kesin olarak x adet elverişli halin meydana gelme olasılığını tarif eden dağiılımlardır. • Tekrarlanan deneylerde.25 2/4 = . bir nalburdan 10 adet lamba alınması vb. • Deneyin her bir sonuçu sadece 2 olaydan biri olabilir: Bunlar genelde elverişli(success) ve elverişsiz (failure) olaylar olarak sınıflandırılır. • Binom dağılımlarında n adet tekrarlanan benzer deney vardır.50 1/4 = . q=1-p Bir para 2 kere atıldığında tura gelme olasılığı X 0 1 2 P(X) 1/4 = .25 Her x değeri için µ = E(x) = np σ2 = E[(x – µ)2] = np (1 –p) 4 ..

5) 4 − 1 = 0.5) 4 − 0 = 0.6 .4 .5 Standard Sapma .5) 0 (1 − 0.5 X 0 1 2 3 4 5 Örnek: Binom Dağılımları • 4 D/Y sorusundan 0. P (0) = 4! (0.4 0.4 .25 1!(4 − 1)! Binom olasılık dağılımı P=0.1 X 0 P(X) 1 2 3 4 5 σ = 1 np ( − p ) e.1 0.35 Elverişli halin olasılığı 0.5.25 0.118 .2 0 P(X) n = 5 p = 0.Binom Olasılık Dağılımları ortalama değer ve varyans Ortalama µ = E ( X ) = np e.2 0..g.5) = 1.05 0 P (1) = 0 1 2 Doğru cevap sayısı 3 4 5 . 1 doğru çevap bulma olasılığı nedir? Not: Ögrenciler konu hakkında önceden bir bilgiye sahip değildirler.g.6 . n=4 0.15 0.5)(1 . σ = 5(.1) = .0625 0!(4 − 0)! 4! (0.2 0 n = 5 p = 0.5)1 (1 − 0.3 0. µ = 5 (.

Binom Dağılımlarının Şekli .2 – .2) c (n = 20.2 – Olasılık x .3 – . p = . p = .8) b Olasılık .1 – .1 – 0 1 2 3 4 5 6 7 8 9 10 0 1 2 3 4 5 6 7 8 9 10 x (n = 10. hipergeometrik dağılımlarında denemeler birbirinden bağımsız değil 6 .3 – (n = 10.2 – Olasılık x . p = .3 – .3 – Olasılık . p = .1 – 0 1 2 3 4 5 6 7 8 9 10 0 1 2 3 4 5 6 7 8 9 10 20 x (n = 10.1 – .2) d Hipergeometrik Olasılk Dağılımları Hipergeometrik dağılımlar binom dağılımlarına büyük bir benzerlik göstermekte Deney n adet denemeden oluşmakta Deneyin olası 2 sonuçu var Hipergeometrik ve binom olasılık dağılmları arasındaki temel fark.2 – .5) a .

Hipergeometrik Olasılık Dağılımları • Elverişli halin olasılığı bir deneyden diğerine değişiyorsa. binom olasılık dağılımları kullanılmaz. P( x ) = ( s Cx )( N − S Cn − x ) N Cn N: popülasyonun büyüklüğü S: Popülasyondaki elverişli hallerin sayısı x: örnekteki ilgili elverişli hallerin sayısı n: örnek yada deney sayısı n! C = x !( n − x )! C: Kombinasyon sembolü n x x adet nesne n sayida bir gruptan seciliyorsa Hipergeometrik Olasılık Dağılımlarının Ortalması ve Varyansı nS N µ = ∑xP(x) = σ2 = ∑x2P(x) µ2 S(N .1) N-n N-1 = n S S 1N N 7 .n) = N2(N . – Eğer örnek sınırlı bir popülasyondan yerine konmadan seçiliyorsa – Eğer örnek sayısı toplam popülasyonun % 5’inden fazla ise belli bir elverişli yada elverişsiz halin olasılık dağılımını belirlemek için hipergeometik olasılık dağılımları kullanılır. Bunun yerine hipergeometrik olasılık dağılımları uygulanılır.S)n(N .

Çekilen örnekler yerine tekrar konulmamaktadır. bunlardan 4’ünün problemsiz çalışma olasılığı nedir. 5 örnek rastgele çekilirse. 8 . ve örnek sayısı popülasyonun %5’inden az ise binom olasılık dağılımları hipergeometrik olasılık dağılımları yerine kullanılabilir.Örnek: Hipergeometrik olasılık dağılımları • Bir haftada 50 adet cep telefonu üretildiğini varsayalım. Bunlardan 40 tanesi mükemmel şekilde çalışırken. 10 tanesinde en az 1 bozuk ürün vardır.431 Hipergeometrik Olasılık Dağılımları • Seçilen örnek popülasyona geri konulmuyorsa. ( 40 C4 )( 50− 40 C5− 4 ) P ( 4) = = C5 50 ( 40! 10! ) )( 4!36! 1!9! 50! 5!45! = 0.

Poisson Olasılık Dağılımları • Poisson dağılımları belirli bir bölgede yada belirli bir zaman aralığında bir olayın kaç defa meydana geldiğini belirlemek açısından faydalıdır. – Bir zaman aralığındaki elverişli bir halin olasılığı.Herhangi bir µ değerinin dağılımı pozitif bir çarpıklığa sahiptir. 9 . µ artıkça dağılım normal dağılıma yaklaşır.µ2 =µ Poisson dağılımının ortalaması µ.2…) µ = ∑xi p(xi) σ2 = ∑x2P(x) . • Poisson dağılımlarının uygulanması için gerekli şartlar – Herhangi bir zaman aralığında meydana gelen elverişli hallerin sayısı diğer zaman aralıklarında meydana gelen elverişli hal sayısından bağımsızdır.7183 x= belli bir zaman aralığındaki elverişli hallerin sayısı (0. – Olaylar ölçüm aralığında kesinlikle aynı noktada meydana gelemez.1. • Örnek: • şirketin faks makinasına günlük gelen faks sayısı • İstanbulda aylık işlenen araba hırsızlığı vakası sayısı • Numune hastanesi acil servisine saatlik gelen hasta sayısı Poisson Olasılık Dağılımları P( x ) = µ xe− µ x! µ= ortalama elverişli hal sayısı e=sabit sayı=2. standard sapaması ise µ’nün karaköküdür. zaman aralığının büyüklüğü ile orantılıdır.

224 2! Poisson dağılımları elverişli hal olasılığı küçük.15 0.1 0.3 0. 32 (2.Poisson Olasılık Dağılımları Poisson olasılık dağılımı µ =2 0.05 0 2 3 4 5 10 11 12 13 01 1 2 3 4 56 67 78 89 9 10 11 12 14 14 15 13 15 16 Örnek: Poisson Dağılımları • Shell benzin istasyonuna her 15 dakikada bir ortalama 3 araç gelmektedir. 10 . Geleçek 15 dakika içinde 2 araçın gelme olasılığı nedir.05 0 1 0 2 1 32 43 54 6 7 7 8 10 11 5 6 8 9 9 10 0.7183) −3 P(2) = = 0.25 0.2 0.2 2 3 4 5 6 7 1 2 3 4 5 6 8 9 10 11 Poisson olasılık dağılımı µ =5 0.1 0.05 0 1 0 0.15 0. ve deney sayısı(n>100)büyük olduğu durumlarda binom olasılık dağılımı yerine kullanılabilir.2 Poisson olasılık dağılımı µ =7 0.15 0. np<5.1 0.

0613 3! 6 11 .4 0.Poisson Olasılık Dağılımları 0.1839 2! 2 e −113 e −1 P ( X = 3) = p( 3) = = = .3678 0! e −111 P( X = 1) = p(1) = = e −1 = .1 0 1 2 0 1 3 2 4 5 3 4 6 5 7 8 9 10 11 P ( X = 0) = p( 0) = e −110 = e −1 = .2 0.3 0.3678 1! P ( X = 2) = p( 2) = e −112 e −1 = = .

Sürekli Olasılık Dağılımları Uniform Olasılık Dağılımı Normal Olasılık Dağılımı Exponent Olasılık Dağılımı f(x) µ x Uniform Olasılık Dağılımı Bir random değişken olasılığı nezaman random değişkenin değer aralığı ile orantılı ise o random değişken uniform bir dağılım sergiler denir. a < x < b = 0 başka yerde E(x) = (a + b)/2 Var(x) = (b .a)2/12 a = bir değişkenin varsayacağı en küçük değer b = bir değişkenin varsayacağı en büyük değer 1 . • Uniform Olasılık fonksiyonu f(x) = 1/(b .a) .

Uniform Olasılık Dağılımları Taralı alan = 3 • 0.6 3 P(x ) 0. a-b aralığında olasılık dağılım fonksiyonu eğrisi altında kalan alan olarak tanımlanır.2 P( x > 1º ) = 0.6 P( 1º < x < 4º ) = 0. f(x) ≥ 0 x = +∞ x = −∞ ∫ f ( x ) dx = 1 x =b P ( a < X < b) = x=a ∫ f ( x)dx 2 .2 = 0.8 0 0 1 2 3 4 5 x Sıcaklık (C) 0 0 1 2 3 4 5 x Sıcaklık (C) Şekil 1 Şekil 2 Sürekli Olasılık Dağılımları • Sürekli bir random değişkenin(X) olasılığı (değişkenin değerinin a-b aralığında bir değer aldığını varsayarsak).2 P(x ) 0.

+∞ E(X ) = −∞ ∫ f ( x ) dx Varyansı Var( X ) = ∫ ( x − E ( X ))2 f ( x)dx −∞ +∞ Normal Olasılık Dağılımı • Doğadaki. Ortalama. Normal olasılık dağılım eğrisinin fonksiyonu aşağıdaki şekilde tanımlanır. f (x) = 1 e σ 2π − ( x− µ )2 2σ 2 µ = A. endüstrideki bir çok olay normal veya normala yakın bir dağılım göstermektedir.Ortalama ve Varyans Sürekli bir random değişkenin aritmetik ortalaması.71828 µ−3 µ−2σ σ µ−σ µ µ+σ µ+2σ µ+3 σ 3 .14159. σ = standart sapma π = 3. e = 2.

Normal Olasılık Dağılım
Özellikleri Çan eğrisi şekilli bir dağılım -∞ < x < +∞ Normal olasılık dağılım eğrisinin altında kalan alan 1’e eşittir.
∞ −∞

∫ f ( x ) dx = 1

Normal dağılımlar µ etrafında simetriktir. µ Normal dağılımının yerini belirlemektedir ve grafikteki en yüksek noktadır. Normal dağılımlarda aritmetik ortalama, mod ve medyan birbirine eşittir. σ yayılma miktarını belirlemektedir.

Normal Olasılık Dağılımı
Normal dağılımlarlarda µ + 1σ altında kalan alan tüm dağılımın % 68 ini µ + 2σ altında kalan alan tüm dağılımın % 95 ini µ + 3σ altında kalan alan tüm dağılımın % 99.7 ini kapsamaktadır.

-4

-3

-2

-1

0

1

2

3

4

-4

-3

-2

-1

0

1

2

3

4

-4

-3

-2

-1

0

1

2

3

4

µ + 1σ 68%

µ + 2σ 95%

µ + 3σ 99.7%

4

Normal bir olasılık dağılımında olasılıklarının gösterimi

P ( a ≤ x ≤ b) = ∫ f ( x ) dx
a

b

P(x)

a

b

x

Normal Dağılım

σ

σ µ 0

σ

σ

-4

-3

-2

-1

1

2

3

4

5

Sonsuz sayıda normal olasılık dağılımları vardır.
Şekil 1. Farklı A. ortalamalı, aynı standart sapmalı normal olasılık dağ.

30

35

40

45

50

55

60

65

70

Şekil 2. Aynı A. ortalamalı farklı standart sapmalı normal olasılık dağ.

35

40

45

50

55

60

65

70

75

Standart Normal Dağılım
• Normal dağılımlarının tümü standart normal dağılımla ilişkilidir. • Standart normal değişken z’nin sergilediği A. ortalaması 0, varyansı 1’e eşit olan normal dağılıma standart normal dağılım denir.

f(x)

-4

-3

-2

-1

0

z

1

2

3

4

6

z = (x – µ)/σ • Standard normal dağılım tablo halin. eğriyi iki eşit parcaya (0. aşağıdaki formül yardımıyla standart normal değişkene (z) dönüştürülür. Standart Normal Dağılımın Özellikleri •Normal eğrinin altında kalan alan 1’e eşittir.5) bölmektedir. • Aritmetik ortalama 0. •Dağılım A. 0 z 7 . ortalama etrafında simetriktir ve her iki yönde yatay eksene yaklalarak fakat dokunmadan devam etmektedir.00 ve z = 3.Normal Dağılım • Her bir normal random değişken (x).00 değerleri arasındadır. • Hemen hemen tüm alan • z = -3.

4131 .024 0.0 2.2 0.3686 .4984 .4983 .4984 .4854 .4948 .4812 .4920 .4964 .4975 .0239 .2734 .3051 .7 1.4846 .4951 .0398 .0517 .1844 .4686 .4987 .4641 .1 1.8 0.4904 .3 1.4772 .4898 .4956 .4929 .3264 .1700 .4927 .0080 .4756 .1141 .8 1.4986 .4864 .4884 .4115 .1772 .4850 .4960 .4941 .3340 .4838 .0279 .340 0.2019 .4049 .0199 .0948 .3643 .7 2.4988 .4940 .4656 .4251 .4890 .4484 .4973 .4699 .4633 .4861 .5 0.4963 .3078 .4990 .3577 .1 0.4842 .4649 .4738 .6 1.01 .4082 .4826 .0987 .4463 .4357 .4979 .4099 .4977 .3962 .4957 .4909 .7 % si ortalamın 3 σ si içerisinde 95% 2σ 68% 1σ 0.4345 .4525 .2549 .1985 .4292 .2673 .3531 .4693 .3389 .4808 .0 0.0478 .2764 .08 .3 2.4 2.4918 .4982 .0 1.0714 .4887 .3869 .4616 .4911 .3315 .2357 .0636 .3106 .02 .1915 .4032 .4726 .4706 .0793 .2190 .2794 .4332 .4306 .4177 .4966 .4949 .4664 .09 .2939 .2454 .8 2.4953 .3365 .4982 .4988 .4505 .4906 .3810 .4932 .135 –3 –2 –1 0 1 2 3 Standard Normal (z) Dağılım Tablosu z 0.2 1.4922 .2123 .1950 .3770 .4192 .0557 .4979 .1103 .3554 .3997 .4972 .4788 .0871 .4761 .4868 .3508 .2580 .4778 .2611 .0675 .3485 .3238 .1808 .4162 .4719 .2704 .3438 .4554 .0596 .4015 .4968 .4599 .4817 .3289 .4821 .4535 .1179 .4222 .4406 .4893 .0910 .1026 .4878 .3830 .0832 .2088 .0753 .2910 .04 .4901 .4678 .1664 .2422 .4989 .05 .4962 .2881 .1554 .4959 .4955 .1736 .4969 .4591 .4934 .4965 .3133 .1217 .0319 .1331 .6 0.07 .3925 .4881 .3849 .4961 .4370 .4265 .0359 .4989 .1628 .4279 .1591 .4981 .4236 .2291 .3023 .3729 .2852 .4750 .4989 .2517 .3413 .2642 .4767 .3708 .1517 .4564 .4981 .4 0.4987 .1879 .1443 .Standard Normal Dağılım : µ = 0 ve σ = 1 Verilerin 99.2324 .1480 .4978 .024 0.4830 .4429 .4207 .4977 .4985 .4871 .0438 .1406 .3461 .001 0.4783 .9 1.2 2.4545 .001 0.2224 .6 2.3907 .4971 .4985 .7 0.5 2.3980 .4798 .4066 .4744 .3665 .1368 .2995 .4896 .2389 .4913 .4834 .0040 .4803 .4943 .5 1.4952 .4936 .3159 .3599 .4515 .2157 .4976 .4931 .4990 8 .4608 .135 0.06 .4875 .3212 .4946 .3888 .9 3.2967 .1 2.3790 .1255 .3749 .4974 .3186 .0160 .4382 .0 .9 2.2257 .4945 .4857 .4916 .4441 .2054 .0000 .2486 .03 .4319 .00 .4147 .4495 .340 0.4793 .4967 .4713 .4925 .4987 .4986 .4938 .4452 .4418 .1064 .4582 .3944 .4573 .4625 .4974 .3621 .4671 .4980 .4 1.0120 .4732 .4474 .2823 .3 0.1293 .4394 .4970 .

2033 Alan = 0.3023 .0359 .1950 .1293 .2291 .2852 .3106 .06 .1808 .6 .08 .2995 .2324 .7 .2967 .0000 .2357 .1103 .1772 .3264 .1736 .0 .2549 .2389 .2734 .83 z Standart Normal Dağılım Tablosunun Kullanımı z .3078 .3212 .2123 .2823 .1 .1985 .1331 .0714 .2190 .2967 Alan = 0.Standart Normal Olasılık Dağılımı P(z<0) P(0<z<0.1664 .03 .0239 .1517 .04 .0478 .1915 .2939 .3340 .2642 .0675 .1591 .3238 .3051 .1480 .3289 .2454 .5 0 0.9 .2486 .3365 .2673 .02 .1879 .2764 .2518 .2422 .2 .0160 .05 .3389 9 .00 .0753 .3159 .1844 .5 .01 .2088 .3186 .2910 .1141 .2054 .0080 .4 .3133 .83) P(z>0.0596 .0398 .09 .2157 .2224 .0832 .0040 .1700 .3315 .0319 .0517 .2881 .0871 .07 .0636 .2019 .1217 .0948 .1026 .2612 .3 .1554 .0279 .1179 .0557 .0438 .1406 .1443 .1368 .2580 .2794 .0120 .2257 .0199 .0910 .1064 .2704 .0987 .1628 .83) Alan = 0.8 .1255 .0793 .

45) = 0.4265 0 1. z P(z > 145) = 05000 − 04265 = 00735 .9265 Örnek 3 • P(z > 1.45)=? 0.4265 Aranan alan 0 145 .Örnek 2 (Tablo methodu) 0. 10 .5000 0. .5000 + 0. . .45 z P ( z < 1.4265 = 0.

Örnek 4 • P(-1.3962 Sorulan alan Tablodan hesaplanan alan = 0.1635 11 .3962 − 1.3365 = 0.98 0 0.98)=? Aranan alan Tablodan hesaplanan alan =0.98 P ( z < −0.26) • = 0.3365 -0.26 z Örnek 5 • P(z < -0.5000 − 0.98) = 0.26 < z < 0) =? • = P(0 < z < 1.26 0 1.

.Örnek 6 • P(-2.4641 − 2.5 P(−1. Örnek 7 • P(-1.5)=? Aranan alan − 1 . .3<z<1.5) = P(0 < z < 1. .4192 − 0.2277 12 .4<z<-0.4 < z < −0. = 04893+ 04641 = 09534 . P(−23 < z < 18) = P(−23 < z < 0) + P(0 < z < 18) .8)=? 0.1915 = 0. 4 -0.4) − P(0 < z < 0.5) = 0.4893 0. .3 0 18 . .

35 P85 z 1.4500 0.02 0.3485 0.6 M 0. % 15 0.01 0.05 M 0.• Eğer eğrinin altında kalan alan biliniyor ise. standart normal dağılım tabloları z değerini belirlemek için kullanabilir.45 0 z 0.03 0 0.3500 0.05 M 1. 0.02 0.04 z 0.4505 13 .00 z 0.01 0.00 0.04 0 z 0.0 0.03 0.3508 M • Aşağıdaki standart normal eğride % 90’lık alana karşılık gelen z değeri bulalım.4495 0.

•Dolum miktarının normal bir dağılım gösterdiğini varsayarsak.02 x = 32.02 = P ( 0 < z < 1. rastgele seçtiğimiz bir şişenin 3232.025− µ 32.02  .025 ml arasında soda içerme olasılığı nedir? Çözüm 8 Aranan alan x = 32. z = 32. z = 32 − µ 32 − 32 = =0 σ .02 .025− 32 = = 1.25) = 0.025) = P    .025 − 32  < < P (32 < x < 32.25 σ .3944 14 .02 ml standart sapmayla doldurucak şekilde ayarlanmıştır.02 32 32.Örnek 8 •Bir şişeleme makinası ortalama olarak 32 ml sodayı 0.025 1.25 x z 0 32 − 32 x − 32 32.025.

5000 + 0.4700 0. .4332 = 0.02  = 0. 62 72 1.   = 003  σ  72−62 . − 15 32 0 x z Örnek 9 •Bir polis radarı akşam trafiğinde E-5de araçlarının hızları denetlemektir.   = P ( z > −15)  . =188 σ (188)(σ) =10 .02 . . Araçlarının hızları aritmetik ortalması 62 km/saat olan normal bir dağılım göstermektedir.9332 31. 0.97 .03 x −62 72−62 > P .   = 003  σ σ  72−62 Pz > . Araçlarının %3 ü 72 km/saat ‘in üzerinde seyahat ediyorsa tüm araçlarının hızlarının standart sapmasını hesaplayınız? P(x > 72) = 003 .88 0 z x 15 .•Rastgele seçtiğimiz bir şişenin 31.97 − 32  > P ( x > 3197) = P . σ =10/188 =532 P(z >188) = 003 . . .97 ml den fazla soda içerme olasılığı nedir? x − 32 31.

9495 (c) P(z > k) = 0.1464 16 .8186 (d) P(z > k) = 0.90 < z < k) = 0.1806 (f) P( k < z < 1.02) = 0.0073 (e) P( 0.Binom Olasılık Dağılımlarının Normal Dağılıma yaklaşmas Kural • Normal dağılım tablolarının binom dağılım yerine kullanabilmesi için Standart Normal Dağılım Bir standart normal dağılımda aşağıdaki koşulları sağlayan k değerlerini bulalım.1271 (b) P(z < k) = 0. (a) P(z < k) = 0.

ortalama e = 2.71828 17 .Exponent Olasılık Dağılımı • Exponent Olasılık Fonksiyonu f ( x) = 1 − x /µ e µ x > 0. µ > 0 µ = A.

Popülasyon parametresi ile örnekleme istatistiği arasındaki arasındaki fark örnekleme hatası olarak tanımlanır. 1. Eğer popülasyon normal dağılım sergilemiyorsa örneklemelerinin aritmetik ortalamalarının dağılımı örnek sayısı artıkça normale yakın bir dağılım gösterir. Popülasyonun tüm üyeleriyle bağlantı kurmanın çok zaman alması 2 türlü örnekleme vardır: Rastgele ve karara dayalı yani iradi örnekleme Rastgele örneklemenin bir kaç türü vardır: 1. Karara dayalı yani iradi örneklemede örnek şeçimi tamamiyle örneklemeyi yapan kişinin kararına dayalıdır. Popülasyonun parametrelerinin belirlenmesinde 2 türlü tahminden yararlanılır: . Basit rastgele örneklemede popülasyonun her bir üyesi aynı şeçilme şansına yada olasılığına sahiptir. Popülasyonun tümünü örneklemenin maliyetinin yüksek olması 4. 3. Cluster örneklemede popülasyon gruplara ayrılır ve bu gruplardan rastgele örnekleme yapılır.1 ÖRNEKLEME TEORİSİ Bir popülasyonun istatistiksel parametrelerini belirlemede örneklemenin tercih edilmesinin bir çok sebebi vardır. Bir örneklemeden tahmin edilen ortalamadaki standart hata miktarı : σX = s n s: örneklemedeki gözlemlerin standart sapması n: örneklemedeki gözlemlerin sayısı Merkezi limit teoremine göre eğer bir popülasyon normal bir dağılım gösteriyorsa örneklemelerinin aritmetik ortalamalarının dağılımıda ayrıça normal bir dağılım gösterir. Bunlar şu şekilde özetlenebilir. 2. Çok sıkca. Popülasyonun tümüne ulaşmanın örneklemede mümkün olmayabilmesi 3. Sistematik rastgele örneklemede rastgele bir başlangıç noktası seçilir ve ondan sonra her n’inci popülasyon üyesi örneklemede seçilir. örneklerinin popülasyona geri katılamaması 2. Dolayısıyla bu tür örneklemede popülasyon parametrelerinin tahmininde hataya sebeb olabilir. seçilen örneklerin üyelerinin yok edilmesi durumunda. Doğru seçilmiş bir örneklemenin popülasyonun parametrelerini uygun bir şekilde tahmin edebilmesi ve bunun sonuçunda maliyet ve zaman kaybının azaltılması 5.

58 s n 1. Bir popülasyonun ortalamasının güven aralığı örneklemedeki gözlem sayısına (n). örneğin standard sapmasına. Bir ortalamanın güven aralığı şu şekilde genel olarak ifade edilebilir: X ± zσ x s X±z n s: örneklemenin standard sapması z: standard değer n: örneklemedeki gözlem sayısı %95 ve % 99 güven aralığı istatiksel tahminlerden en yaygın olarak kullanılmaktadır. Örneğin Bu tablo yarım normal dağılıma göre . Enterval yada aralık tahmini (interval estimate): popülasyon parametresinin hangi değerler arasında bulunacağının belirlenmesidir. ve güven aralığının derecesine bağlıdır.2 Nokta tahmini( point estimate): popülasyon parametresinin tahmininmde tek bir değer kullanılır.96 s n %99 güven aralığı: X ± 2. n ≥ 30 için %95 güven aralığı: X ± 1. Aralık tahmininde popülasyon parametersinin güven aralığının hesaplanması gerekmektedir.96 ve 2. Bu güven aralıklarına karşılık gelen değerler standart normal dağılım tablolarından hesaplanır.58 değerleri gözlemlerinin sırasıyla %95 ve %99 una karşılık gelen standard değerlerdir.

seçilecek güven aralığına(z). ve verilerin standard sapmasına(s) bağlıdır. Bir örneklemede popülasyonun ortalamanın belirlenmesi için belirlenecek gözlem sayısı(n).96 olarak kolaylıkla okunabilir. X ±z s N −n ( ) N −1 n Örneklemedeki gözlem sayısının popülasyonun tümüne oranı % 5 den az ise düzeltme katsayısının standart hataya katkı payı çok küçüktür o nedenle önemsenmeyebilir.475 .95/2 =0. . izin verilebilir maksimum hata oranına(E). Bu değere karşılık gelen standart değer normal dağılım tablosundan 1. N −n N −1 Popülasyon ortalaması için standart hataya uygulanaçak düzeltme (n/N > 0.3 hazırlandığından 0.05 ise hem popülasyon ortalamasının hemde oranının standard hata miktarına bir düzeltme uygulamak gerekmektedir. Bu düzeltme katsayısı şu şekilde ifade edilir. Buda doğaldır çünkü örnek sayısı artıkça ortalamın standart hatasıda doğal olarak azalma göstereçektir.  z.05) σX = s N −n ( ) n N −1 aynı düzeltmeyi ortalamanın güven aralığı için yazarsak.s  n=   E  2 Eger örneklemediki veri sayısı(n) tüm popülasyonun (N) %5 inden büyük ise yani n/N > 0. Aksi durumda (n/N >%5) düzeltme miktarı standart hatayı azaltaçağından popülasyon ortalamasının aralığı daralaçaktır.

3. İrfan Yolcubal Kocaeli Üniversitesi Jeoloji Müh. 1 . 2.İstatistik Vize sınıvanın ortalaması 50’nin altındadır. Firestone ve Lassa tatafından üretilen lastiklerinin ömrü aynıdır.Hipotez Testleri Dr. Hipotez Örneklemeye dayalı bir popülasyon parametesinin değeri hakkında ileri sunulan iddia Örnekler: 1. Televizyon izleyicilerin %70 i günlük haber programlarını izlemektedir.

Null ve alternatif hipotezin belirlenmesi Null hipotezi: Bir popülasyon parametresi hakkında ileri sürülen varsayım. Önem veya Risk Derecesinin Belirlenmesi(α): Aslında doğru olan Null hipotezinin rededilme olasılığı: Risk derecesinin seçimi tercihe dayalı Genelde 0. 5 aşamadan oluşur.Hipotez Testleri Bir popülasyon hakkında ileri sunulan hipotezinin kabul edilip edilmeyeceğini belirlemek için örneklemeye dayalı sistematik izlenen bir seri işlemler. H0= null hipotezi yada sıfır hipotez Alternatif hipotez: Örneklemeye ait veriler null hipotezonin yanlış olduğuna ait deliller sunduğu durumlarda kabul edilen hipotezdir HA = alternatif hipotez Hipotez Testinin Aşamaları 2. Genellikle bu varsayımda popülasyon parametresinin belli bir değeri olduğu varsayılır.05 yani % 5 ve % 1 risk dereceleri araştırmalarda kullanılmakta 2 . 1.

Bu ihtimalleri risk derecesini belirleyerek azaltmak isteriz. II. I. tip hata OK 3 . tip hata: Null hipotezi doğru iken reddedilir. Daima bu hatalardan birini yapma ihtimali vardır. Tip hata yapma olasılığı α olarak bilinmektedir. Hipotez Testlerinde Hatalar Karar Null hipotezi Kabul etme Null hipotezi redetme Null Hipotezi doğru Doğru Karar II. tip hata Null Hipotezi Yanlış I. tip hata: Null hipotezi yanlış iken rededilmez. II.Hata Tipleri I. Tip hata yapma olasılığı β olarak bilinmektedir.

Hipotez Testinin Aşamaları
3. Istatistiksel test metodunun belirlenmesi: Null hipotezin rededilip edilmeyeceğinin belirlenmesinde kullanılan ve popülasyon örneklemesinden elde edilen değer
örnek: t, F,ve ki kare istatistik testleri

4. Null hipotezinin hangi koşullarda kabul ve hangi koşullarda rededileceğinin belirlenmesi 5. Karar verilmesi: Null hipotezinin alınan risk derecesi doğrultusunda reddi yada kabülü.

1: Null ve Alternatif hipotezleri ileri sürmek
Farzedelim ögrençilerin ders geçmek için 60 almaları gerekmekte. Rastgele 40 ögrenci secelim ve onların ortalamalarının 64 olduğunu varsayalım Araştırma sorusu: Popülasyonun gerçek ortalaması 60 ın üzerinde midir?
H0: µ ≤ 60 HA: µ >60

4

2: Önem Derecesini(α) belirlemek
Önem derecesi, null hipotezi gerçekten doğru iken, null hipotezini redetme olasılığıdır Örnek: α = 0.05 seçelim

1-α Kabul alanı

α=0.05
Red Alanı Kritik değer

3: Hipotez testinin 1 veya 2 yönlü olup olmadığının belirlenmesi
Eğer alternatif hipotez ortalamanın belli bir değere eşit yada ondan büyük olduğunu ifade ediyor ise hipotez tek yönlüdür. Örnek: HA: µ ≥ 60
1-α Kabul alanı α=0.05

Kritik değer

5

3: (Devam)
Eğer alternatif hipotez ortalamanın belli bir değere eşit yada ondan küçük olduğunu ifade ediyorsa, hipotez tek yönlüdür. Örnek: HA: µ ≤ 60
α= 0.05 1-α Kabul Alanı

Kritik değer

3: (Devam)
Eğer Alternatif hipotez ortalamanın belli bir değere eşit olmadığını ifade ediyor ise bu hipotez çift yönlüdür. HA: µ ≠ 60
α/2= 0.025 1-α Kabul Alanı

α/2= 0.025

6

45 değerine karşılık Gelen z değeri bulunur.645 5: Test istatistiğini belirlemek ve kritik değerle karşılaştırmak Popülasyonun standart sapması bilniyor ise z= kritik değer sağdaki formül vasıtasıyla hesaplanır. Eğer popülasyonun stadart sapması (σ) biliniyor ise yada σ bilinmiyor fakat n≥30 ise standart normal tabloları kullanılarak risk derecesine karşılık gelen z kritik değeri belirlenir.645 z = 1. örneklemenin standart sapması (s) popülasyonun standart sapması yerine kullanılabilir. z= X− µ σ n X = orneklemenin ortalamasi µ = populasyon ortalamasi σ = populasyonun standart sapmasi Popülasyonun standart sapması bilinmiyorsa ve n ≥ 30. 0.05=0. Populasyon normal dağılım sergilemekte Hipotez testinde kullanıcak değer: z= X−µ s n 7 .45 1-α Kabul Alanı α= 0.4: Kritik değeri veya değeleri belirlemek Bilinmek istenilen – Null hipotezi doğru varsayarsak dağılımın 1-α yüzdesine karşılık gelen kritik değer.05 z = 1.5-0. z=1.645 Standart normal tablolarından 0.05 α= 0.

Ha Önem yada Risk Derecesini Belirlemek: α Hipotezin tek mi çift mi yönlü olduğunu belirlemek Kritik değerleri belirlemek Test istatistik değerlerini hesaplamak ve kritik değerle karşılaştırmak Örnek 1 H0 : µ = 50 H1: µ ≠ 50 Örnek ortalaması 49.Hipotez Test Aşamalarını Özetlersek 1. 2. 3. 8 . örneklemedeki veri sayısı da 36dır. 4. Hipotez testinde % 5 risk alırsak a) Hipotez testi tek mi yoksa çift mi yönlüdür b) Null hipotezi hakkındaki kararınız nedir c) Bu kararı almaktda nekadar kendinize güveniyorsunuz yani p değeri nedir. Null ve Alternatif Hipotezleri Belirlemek: H0. Popülasyonun standart sapması ise 5 dir. 5.

025 olasılık z=-1.96 9 . b) %5 riskle taralı alanlar hipotezin rededildiği alanları ifade etmektedir.96 0. 5 36 Hesaplanan z değeri bu taralı alanlar dışında kalan bölgeye düştüğüne göre Null hipotezini kabul edebiliriz 0. p değeri popülasyonun ortalmasının 50 nin üzerinde veya altında olma olasılığının %11.1151di r.51 olduğunu ifade eder.3849).96 Örnek 1.2 den az ve 1. z= 49 − 50 = − 12 . 0 z=-1.025 olasılık z=1.025 olasılık z=1.2 den fazla olma ihtimalini hesaplamamız gerekmektedir çünkü hipotez iki taraflı olup iki farklı red bölgesi içermektedir.5-0. Popülasyon ortalaması 50 den farklı olabilir ifadesi büyükte olabilir ve küçükte olabilir gibi 2 ihtimal içermektedir.95 olasılık 0 0. p değerini hesaplayabilmek için z değerinin –1.1151dir (0. p değeri risk derecesinden 0.Örnek 1. Bu nedenle hipoteze 2 taraflı hipotez denilmektedir. Çözüm a) Hipotez testi iki taraflı bir hipotezdir çünkü alternatif hipotezin yönü yoktur yada belli değildir.2 ve altında bir değer olma olasılığı 0. Bu nedenle p değeri 2 x 0.05 büyük olduğundan null hipotezi kabul edilir.96 0. –1. Çözüm (Devam) c) Null hipotezini kabul etmede ne kadar eminiz ? Bunu belirleye bilmek için hesaplanan z değerinin o değerinin üzerinde bulunma olasılığını yani p değerini hesaplamamız gerekecektir.

05 25 n n = 25. Üretiçi firma ürün miktarı için standart sapmayı σ 15 gram olarak belirlemiştir. σ bilinmekte Karar: Kritik değerler Null hipotez α = 0. Tek yönlü hipotez test çözümü H0: µ ≤ 368 X − µ 3725 − 368 .645 z Sonuç: Ortalamanın 368 gr üzerinde olduğuna ait yeterli delil yoktur.05 önem derecesi ile test edelim. Hipotezi 0.5 gr.05 0 1.Örnek 2: Tek yönlü z testi Bir kutu mısır gevreği 368 gramın üzerinde midir? Ratgele seçilen 25 kutunun ortalamasıX = 372.05 ile Red alanı Test İstatistiği: rededilmez 0. 10 .50 z= HA: µ > 368 σ 15 α = 0. = = +1.

Hipotez testinde % 2 risk alırsak a) Hipotez testi tek mi yoksa çift mi yönlüdür b) Null hipotezi hakkındaki kararınız nedir c) Bu kararı almaktda ne kadar kendinize güveniyorsunuz? 11 .Çift yönlü z Testi Çözümü H0: µ = 368 X − µ 3725 − 368 . örneklemedeki veri sayısı da 36dır. σ bilinmekte Karar: Kritik değerler Null hipotezi α = 0.025 edilmez Sonuç: Ortalama miktarın 368 olduğu hakkında yeterli bir delil yoktur 0 1. Popülasyonun standart sapması ise 3 dir. z= = = +1.05 n 25 n = 25.96 Test İstatistiği: Red Alan 0.025 -1.05 ile red Red Alan 0.50 HA: µ ≠ 368 15 σ α = 0.96 z ÖDEV H0 : µ ≤ 10 H1: µ > 10 Örnek ortalaması 12.

5 dak 5.4 dak 0. Sadece fark z değerinin hesaplanışıdır. sigorta hastanesinin acil servisinden daha mı hızlı hastalara ilk müdaheleyi yapmaktadır? Hastane numune sigorta Ortalama süre 5.HİPOTEZ TESTİ:İKİ POPÜLASYONUN ORTALAMALARININ KARŞILAŞTIRILMASI Amaç:2 örnek ortalamasının aynı ortalamalı 2 popülasyondan gelip gelmediğini test etmek z= X1 − X2 s12 s2 2 + n1 n2 Hipotez test edilirken daha önceki kısımlarda bahsettiğimiz hipotezıin 5 aşamasıda aynı şekilde uygulanır. Bu araştırmaya göre %1 riskle numune hastanin acil servisi.33 0. Örnek: 2 popülasyonun ortalamalarının karşılaştırılması 2 farklı hastanenin acil servisine gelen hastalara müdahele süresi aşağıda sunulmaktadır.01 olasılık 12 .3 dak Örnek standart sapması 0.3 dak Örnek sayısı 50 100 Null hipotezinin(H0) Rededildiği bölgesi Null ve alternatif hipotez: H0 : µ1 = µ2 H1: µ1 〉 µ2 0 0.99 olasılık 2.

3 0.33 null hipotezi red edilir.09 değerine karşılık gelen olasılık esas alınmıştır.5 − 5. Buna göre 3.5-0.001 Bu değer 0. alternatif hipotez %1 riskle kabul edilir. p değeri bu büyüklükte yada onun üzerinde bir değer bulma olasılığıdır. z-testi and t-testi karşılaştırılması z-test istatistiği Normal dağılıma dayalı Popülasyonun varyansı bilindiğinde yada örneklemedeki veri sayısı büyük olduğunda örneklerin ortalamaları hakkındaki hipotezleri test etmek için kullanılır t-test istatistiği t dağılımına dayalı t dağılımının şekli örneklemedeki veri sayısına bağlı olarak değişmektedir Serbestlik derecesine bağlıdır df :n-1 Örneklemedeki veri sayısı artıkca t dağılımı normal dağılıma yaklaşır Popülasyonun varyansı yada standart sapması bilinmediğinde ve örneklemedeki veri sayısı küçük olduğunda (n<30) örneklerin ortalamaları hakkındaki hipotezleri test etmek için kullanılır 13 .01 risk derecesinden küçük olduğundan null hipotezinin doğru olmama ihtimali çok yüksektir.12 ve üzerinde bir z değeri alma olasılığı 0.Örnek: Devam z= X1 − X2 s s + 2 n1 n2 2 1 2 = 5.499(Tabloda 3.32 + 50 100 = 312 . 3. z = 312 > 2.12 değeri olmadığından en yakın 3.4 2 0. .499=0.12 ve üzeri bir değer olma olasılığı: 0.

t dağılımını kullanırız t-testinin ortalaması t= X = örnek ortalaması s = örnek standart sapması X −µ s n µ = test edilen popülasyonun ortalaması n = örneklemedeki veri sayisi 14 .t dağılımıları Standart normal (z) t (n = 13) t (n = 5) Ortalamadan olan Standart sapma 0 t-testleri Varyans hakkında kesin bir bilgiye sahip olmadığımız için (sadece tahmin).

6 ögrencinin notları 62. 83. 68. 75.Hipotez testi: σ bilinmemekte Yüksek lisans dersindeki ögrencilerin araştırma metodları hakkında iyi bir bilgiye sahip olup olmadıklarını ögrenmek istiyorum 6 ögrenci sınıftan rastgele seçilir ve sınava tabii tutulur Sınıfın test den en az 70 alabilmesini istiyorum. 1 & 2: Hipotezleri belirle. önem derecesini α belirle Sınıfın ortalama notu 70 ve üstüdür: H0: µ ≤ 70 HA: µ > 70 α = 0.05 15 . 92. and 95.

3: Tek veya çift yönlü bir hipotez mi? 4: Kritik değerleri belirle
Tek yönlü Kritik değerleri t tablosundan belirlenir
1-α Kabul Alanı α=0 .05

t= 2.015 [serbestlik derecesi d.f. =5] için

5: Test istatistklerini hesapla & değerlendir
t değeri kritik değerinden küçüktür. Null Hipotezi kabul edilir

475 = 79.17 6 s = 13.17 79.17 − 70 t= = 1.71 13.17 6 x=

16

Örnek hakkında Sorular
Önem derecesini 0.1 olarak seçersek ne olur? Kritik değer= 1.476 Null hipotezini red et! Eğer α =0 .05 fakat test çift yönlü ise ne olur ? Bu hipotez testini örneğin büyüklüğü nasıl etkilemiştir.

Örnek: 2 yönlü t testi
Kuzey Kıbrıstaki seçim noktalarının her birinde az yada çok 368 seçmen oy kullanmışmıdır? 36 rastgele seçim noktasındaki ortalama seçmen sayısı 372.5 ve standart sapma 12 seçmendir. Hipotezi 0.05 önem derecesi ile test edelim

17

Çift yönlü t Testi: Çözüm
H0: µ = 368 X − µ 372.5 − 368 = +2.25 H1: µ ≠ 368 t = S = 12 α = .05 n 36 df = 36 - 1 = 35 Karar: Kritik değerler
Red alan
0.025

Test İstatistiği:

Red alan
0.025

Null hıpotezi α = 0.05 ile red edilir

Sonuç:

-2.0301 0 2.0301

t

Popülasyonun ortalamasının 368 olmadığına ait delil vardır

Örnek: Tek yönlü t testi
Kuzey Kıbrıstaki seçim noktalarının her birinde 368 den fazla seçmen oy kullanmış mıdır? 36 rastgele seçim noktasındaki ortalama seçmen sayısı 372.5 ve standart sapma 12 seçmendir. Hipotezi 0.05 önem derecesi ile test edelim

18

ve populasyonların standart sapmalari benzer olmalı Bir veri çiftinin karşılaştırılması 19 .Çözüm H0: µ ≤368 H1: µ > 368 α = .Tek yönlü t testi .68 t Test İstatistiği: t= X − µ 372.05 1.25 S 12 n 36 Null hıpotezi α = 0.5 − 368 = = +2.05 df = 36 .05 red edilir Karar: Sonuç: 368 den fazla seçmenin ortalama oy sandıklarında oy kullandığına ait delil vardır t testi Popülasyon ortalamasının testi:bir önceki slaytlarda bahsettik 2 birbirinden bağımsız popülasyonun ortalamalarının karşılaştırılması Şartlar: popülasyonlar normal yada normale yakın bir dağılım serğilemeli Popülasyonlar birbirinden bağımsız olmalı.1 = 35 Kritik değerler Red 0.

ornegin varyansi 2 2 (n1 − 1) s1 + (n2 − 1) s2 s = n1 + n2 − 1 2 p df = serbeslik derecesi = n1 + n2 − 2 t dağılımlarında bir veri çiftinin karşılaştırlması Örnek: bir fiziksel zayıflama kursuna katılmış kişilerinin kurs öncesi ve kursu sonrası kilolarının karşılaştırılması Amaç: kursun etkinliğini test etmek t = d sd n df = n − 1  ∑d ∑d2 −  n   n− 1 ( ) 2 sd =     d = bir cift gozlemler arasindaki farkin ortalamasi n:cift gozlem sayisi sd = bir cift gozlemlerin degerleri arasimdaki farkin standart sapmasi 20 .ornekteki veri sayisi s2 = populasyon varyansinin birlestirilmis tahmini p 2 s1 = 1.t dağılımlarında 2 birbirinden bağımsız popülasyonun ortalamalarının karşılaştırılması t= X1 − X 2  1 1 s2  +  p  n1 n2  n1:1.

Kategorisel veri analizi ki-kare ki kare testi .

Ki-kare testi (χ2) İki değişken arasında bir ilişki olup olmadığının testi Örnek: Kişiliğin deprosyonla bir ilişkisi var mıdır. yoksa bu iki değişken birbirinden bağımsızmıdır. Depresif mi? evet Kişilik dışadönük içedönük 10 20 hayır 20 10 “hücreler” Not: Değişkenler kategorik Her katılımcı sadece bir hücrede gözükür g .

VERİ TÜRLERİ Veri Kantitatif Kualitatif Süreksiz Sü k i Sürekli Sü kli .

3 Nominal yada Ordinal ölçek . Kualitatif random değişkenler sınıflanabilen yanıtlar vermektedir.  Örnek: cinsiyet (Erkek Kız) (Erkek. Ölçüm kategorideki veri sayısını ç g y yansıtır 3. 2.Kualitatif Veri 1.

≥2 pop. Bağımsız Z Testi Z Testi 2 Testi 2 Testi . Oran 2 pop.Hipotez testleri Kualitatif V i K li if Veri Kualitatif Veri 1 pop.

Ki-kare (2) Testi k oranları için ç .

≥2 pop. Oran 2 pop. Bağımsız Z Testi Z Testi 2 Testi 2 Testi .Hipotez testleri Kualitatif V i K li if Veri Kualitatif Veri 1 pop.

3.5 2.2.Ki-kare (2) Testi kO Oranları için l i i 1. Bir kaç seviyeli bir değişken ç y ğş 3. Varsayımlar  Multinomial Deney  Beklenen sayı  5 4. Bir yönlü olasılık tablasunu kullanmakta . p3 = 0 5 0. Oranların sadece eşitliklerini test eder. 03 0.  Örnek: Ö k p1 = 0 2 p2=0.

2 3. 100 (n) kişiye 3(k) adaydan hangisine oy vereceklerini sormak . 2.Multinomial Deneyler 1. 6 n sayıda benzer deneme Her bir denemede k sayıda sonuç H bi d d d Sabit sonuç oranları. 5. 6. pk Bağımsız denemeler Random değişken sayıdır. 4. nk Örnek.

k sayıda bağımsız grup içindeki (sonuçlar veya değişken seviyeleri) gözlem sayılarını gösterir .Tek yönlü olasılık tablosu bl 1.

Tek yönlü olasılık tablosu bl 1. k sayıda bağımsız grup içindeki (sonuçlar veya değişken seviyeleri) gözlem sayılarını gösterir Sonuçlar (k = 3) ADAY Ali 35 Veli 20 Yanıt sayısı Aycan 45 Toplam 100 .

0..k sayıda oran için Hipotezler ve i Hi l istatistik i ik 1. pk = pk. .0 Ha: pi lar birbirine eşit değildir. Hipotezler   H0: p1 = p1.2 Testi. p2 = p2... Hipotez edilen olasılık .0.

..0.k sayıda oran için Hipotezler ve i Hi l istatistik i ik 1...0 Ha: pi lar birbirine eşit değildiler Hipotez edilen olasılık 2. Test istatistiği Gözlemlenen sayı   2  ni  E ni E ni af af 2 Beklenen sayı .2 Testi.0. Hipotezler   H0: p1 = p1. p2 = p2. pk = pk.

df= k-1 k.k sayıda oran için Hipotezler ve i Hi l istatistik i ik 1. Hipotezler   H0: p1 = p1. p2 = p2.0 Ha: pi lar birbirine eşit değildiler Hipotez edilen olasılık 2.. .0. Serbestlik derecesi.0. Test istatistiği Gözlemlenen sayı   2  ni  E ni E ni af af 2 Beklenen sayı 3.2 Testi.. k veri sayısı i . pk = pk..

2. Null hipotezi doğru ise gözlemlenen sayıyla beklenen sayıyı karşılaştırır karşılaştırır. Gözlemlenen sayı nekadar beklenen sayıya yaklaşırsa null hipotezinin doğru olma olasılığı o kadar fazladır  Beklenen sayıyla arasındaki farkın karesi ile ölçülür. il öl ülü  Büyük değerler reddedilir.2 Testi Ana fikiri 1. .

ve  =0.05 için kritik 2 değeri nedir .Kritik değerin bulunması Örnek Ö k k = 3.

Kritik değerin bulunması Örnek Ö k k = 3.995 ..95 … 0.103 5.991 df 1 2 0.05 için kritik 2 değeri nedir? 0 2 Tablo 2 Üst Kuyruk Alanı … 0.841 … 0 103 … 5 991 0.05 … 0.010 0 010 .004 … 3. ve  =0. 0..

004 … 3..Kritik değerin bulunması Örnek Ö k k = 3. ve α =0.. 2 = 0 H0 reddedilmez dd dil Red R d  = 0 05 0.103 5.991 df 1 2 0.05 için kritik x2 değeri nedir? Eğer ni = E(ni).841 … 0 103 … 5 991 0.995 .05 … 0.95 … 0.010 0 010 . 0.05 0 2 Tablo 2 Üst kuyruk alanı … 0.

Finding Critical Value Example E l k = 3.010 0 010 5.05 0 0.05 … 0. 0. ve α =0.991 .95 … 0.05 için kritik x2 değeri nedir? Eğerni = E(ni). 2 = 0..103 5. H0 reddedilmez dd dil df = k .991 5 991 2 df 1 2 Üst kuyruk alanı … 0.995 .841 … 0 103 … 5 991 0.004 … 3..1 = 2 2 Tablo Red R d  = 0 05 0.

0.05 risk derecesinde. Methodu dürüst olarak. Methodu dürüst olarak. çalışanların metodların dürüstlük derecesini algılamada bir farklılık varmıdır? . 72 si ise 3. k oranları içn Örnek Ö k İnsan kaynakları müdürü olarak 3 olarak. 1. farklı performans değerlendirme metodunun dürüstlük anlayışını test etmek istemetedir. 45 i 2. Methodu dürüst olarak değerlendirmiştir. 180 tane çalışan arasından 63 ü arasından.2  Testi .

2 

Testi , k oranları içn Örnek Ö k
Test istattiği:

H0: Ha: = n1 = n2 = n3 = Kritik değer(ler):
Red

Karar: Sonuç:

0

2

2 

Testi , k oranları içn Örnek Ö k
Test istatistiği:

H0: p1 = p2 = p3 = 1/3 Ha: en az biri farklıdır  = 0.05 n1 = 63 n2 = 45 n3 = 72 Kritik değer(ler):
Red  = .05 0 5.991

Karar: Sonuç:

2

2 

Testi , k oranları için Çözüm
3

af E af E a f E a f 180a3f 60 n  n  n  1  n  E af n    E af n
1 2 2 2 i i i

E ni  npi ,0

 60 2 n2  60 2 n3  60 2 n1    60 60 60 2 2 2 63  60 45  60 72  60     6.3 60 60 60

3 63 H0: p1 = p2 = p3 = 1/3 Ha: en az biri farklıdır  = 0.05 n1 = 63 n2 = 45 n3 = 72 Kritik değer(ler): Red  = . k oranları için Çözüm Test istatistiği: 2 = 6.991 Karar: Null hipotezi reddedilir.05 2 Sonuç: Oranlar arasında bir farklılık olduğu delili mevcuttur.  = .2  Testi . .05 0 5.

bağımsız .2 Testi.

Çift yönlü olasılık tablosu kullanır . Varsayımlar   3.2 Testi. İ kualitatif değişken arasında bir İki ş p ğ gösterir ilişkinin mevcut olup olmadığını g   Bir örnek seçilir Sebeb sonuç ilişkisi göstermez Multinomial deney tüm sayılar  5 2. bağımsız 1.

değiken derecesi . değişken derecesi Ev stili st Apartman Çiflik Toplam Ev lokasyonu Şe Şehir Kırsal sa 63 49 15 33 78 82 Toplam op a 112 48 160 1.2 Test Bir örnekten müşterek iki kualitatif değişkene ait gözlem sayısını gösterir 2.

1)(c .2 Testi. Hipotezler   H0: D ği k l b ğ Değişkenler bağımsız Ha: Değişkenler birbiriyle ilişkili (Bağımlı) 2. bağımsız Hipotezler & İ Hi l İstatistik i ik 1. Test İstatistiği   2 n ij ˆ  E nij  ˆ E n  ij Gözlenen sayı  2 Beklenen sayı Satırlar Sütünlar Serbestlik derecesi: (r .1) .

2 Testi. . bağımsız beklenen sayılar b kl l 1. birleşik olasığın marjinal olasılıklarının çarpımına eşit olduğu analamına gelmektedir. İstatiksel olarak bağımsız demek. gelmektedir 2. Beklenen sayı= veri sayısı x birleşik olasılığa eşittir. Marjinal olasılıklar hesaplanır ve birleşik l l k h bi l ik olasılık hesabı için çarpılır b i i l 3.

Beklenen sayıhesaplaması h l Beklenen sayı = Satır toplam * Sütün toplam Veri sayısı y a f .

Gö l Gözl.5 .2 Testi. bağımsız Örnek Ö k Birleşik olasılık = 116 286 116 132 286 286 Diet Kola Di t K l Hayır Evet Toplam 132 286 Marjinal M ji l olasılık Diet P Di t Pepsi i Hayır Evet Gözl. 32 84 48 132 122 154 Beklenen sayı Toplam T l 116 170 286 116 132 = 286 286· 286 286 =53.

α=0.Rastgele seçtiğiniz 286 müşteri üzerinde yapacağınız araştırmada.05 risk soruyorsunuz α=0 05 derecesinde. bağımsız Örnek Ö k Pazarlama araştırması yapan bir analistsiniz.ikisi arasında bir ilişki olduğuna dair delil varmıdır? Diet Kola Hayır H Evet Toplam T l Diet P Di t Pepsi i Evet Hayır 84 32 48 122 132 154 Toplam 116 170 286 .2 Testi. müşterilere diet pepsi mi yada diet kola mı satın alıdıklarını soruyorsunuz.

2 Testi. bağımsız Çözüm H0: ilişki yok Ha: ilişkili  = 0.05 df = (2 .05  0 3.1)(2 .841 2 .1) = 1 Kritik değer(ler): Red = .

5 91. Bekl.5 132 32 122 154 62. Toplam Gö l B kl Gö l B kl T l 84 48 132 170·132 286 53.2 Testi.5 154 116 170 286 170·154 286 .5 78. Gözl. bağımsız Çözüm  E(nij)  5 tüm hücrelerde 116·132 286 Diet Kola Di t K l Hayır Evet Toplam Diet P Di t Pepsi i 154·132 286 Hayır Evet Gözl. Bekl.

5 53.5 91.29 . bağımsız Çözüm 2  n11   ch   n Ec h  n  n  n  Ea f n  Ea f n  Ea f    n  n  n Ea f Ea f Ea f ij 2 2 2 11 12 12 22 22 11 12 22 2  nij  E nij 2 84  53.5 62.5  32  62.5 2  122  91.5 2  54.2 Testi.

29 54 29 Karar: Null hipotezi reddedilir  =0 .1) = 1 Kritik değer(ler): Red  = .05 0 3.841 Test istatistiği: 2 = 54.05 df = (2 .2 Testi.05 Sonuç: Bir ilişki olduğuna 2 dair delil var .1)(2 . bağımsız Çözüm H0: ilişki yok Ha: ilişki var  = 0.

KORELASYON VE REGRESYON ANALİZİ Dr. Bölümü Korelasyon Analizi • İki değişken arasındaki ilişkinin yada korelasyonunun derecesini belirlemek için kullanılan istatistiksel yöntem. • Bağımlı Değişken: Tahmin edilen yada hesaplanan değişken • Bağımsız Değişken: Tahmin için kullanılan değişken • Dağılım grafikleri: 2 değişken arasındaki ilişkiyi gösteren grafikler 1 . İrfan Yolcubal Kocaeli Üniversitesi Jeoloji Müh.

30 40 2 . bağımsız değişkende x ekseninde yeralır.Korelasyon Analizi: Örnek Satış elemanı Ali Veli Ayşe Gül Hüsnü Necati Zehra Fatma Zeynep Ahmet Telofonla yapılan arama sayısı 14 35 22 29 6 15 17 20 12 29 Satış yapılan ürün adeti 28 66 38 70 22 27 28 47 14 68 Dağılım Grafikleri Satılan ürün a deti 80 60 40 20 0 0 10 20 Arama sayısı • Genellikle. bağımlı değişken: y ekseninde .

Korelasyon Katsayısı (r) • 1900 yılında Karl Pearson tarafından tanımlandı. •İki değişken arasındaki dogruasal korelasyonunun derecesini −1 ≤ r ≤ 1 belirleyen bir katsayısı. • r = -1 yada +1. Mükemmel negatif korelasyon 6 4 2 0 0 1 2 3 4 5 Mükemmel pozitif korelasyon 5 4 3 2 1 0 0 1 2 Y Y X r= -1 X 3 4 5 r =1 Korelasyon Katsayısı (r) 6 r= 0. x ve y arasında doğusal bir korelasyon yok Y ıllık g e lir 5 4 3 2 1 0 0 1 2 Cocuk3 sayısı 4 5 6 3 . iki değişken arasındaki korelasyonun mükemmel olduğunu ifade etmektedir.

Korelasyon katsayısı (r) x ve y arasında pozitif doğrusal bir korelasyon var 15 not 10 5 0 0 2 4 6 8 10 ders çalışma süresi(saat) Korelasyonun derecesi 2 değişken arasındaki ilişkinin yönüne( + yada -) bağlı değildir. Korelasyon katsayısının hesaplanması (r) n (∑ XY ) − (∑ X )(∑ Y ) 2 2 r= [n(∑ X 2 ) − (∑ X ) ][(n(∑ Y )− (∑ Y ) ] 2 n : gozlem sayisi 4 .

835 0.306 2. Gerçekte popülasyonun korelasyonu sıfır olabilir mi bilmiyoruz. Fakat bu korelasyon sadece 10 örneğe dayanılarak çıkan bir sonuç. Bu nedenle korelasyon katsayısının güvenirliliğini test etmemiz gerekmektedir.924 ) 2 = 6 .Korelasyon Katsayısının Hesaplanması: Örnek Satış elemanı Telofonla yapılan arama sayısı(X) 14 35 22 29 6 15 17 20 12 29 199 Satış yapılan ürün adeti (Y) 28 66 38 70 22 27 28 47 14 68 408 X2 XY Y2 Ali Veli Ayşe Gül Hüsnü Necati Zehra Fatma Zeynep Ahmet TOPLAM 196 1225 484 841 36 225 289 400 144 841 4681 392 2310 836 2030 132 405 476 940 168 1972 9661 784 4356 1444 4900 484 729 784 2209 196 4624 20510 r= [10(4681) − (199) ][10(20510) − (408) ] 2 2 10(9661) − (199)(408) = 0. Hipotez: H0: ρ= 0 H1: ρ# 0 ρ= popülasyonun korelasyonu t= r n−2 1− r 2 = 0 .306 5 .924 Korelasyon Katsayısının Öneminin Test edilmesi Küçük örneklemelerde (n<30) Örnek: Önceki örnekte satılan ürün sayısı ile telofonla yapılan arama sayısı arasında güçlü bir korelasyonun olduğuna değindik.924 10 − 2 1 − ( 0 .95 olasılık 0 (H0) Rededildiği bölgesi df = n − 2 = 10 − 2 = 8 % 5 risk ile p<0.001 -2.

Regresyon denklemi genel ifadesi: Y` = a + bX X: seçilen bağımsız değişkenin değeri Y`: seçilmiş X değerine için tahmin edilen Y değeri a: dogrunun Y ekseni kestiği noktanın değeri b: doğrunun eğimi a ve b: regresyon katsayıları Y a X Regresyon Analizi Regresyon denklemini tespit etmek için minimum kare (least square principle) prensibini kullanıyoruz. Minumum Kare Prensibi: Gerçek Y değerleri ile tahmin edilen Y değerleri arasındaki düşey uzaklıkların karelerinin toplamını minumuma çekerek regresyon denklemini belirleme işlemi.Regresyon Analizi İki değişken arasındaki korelasyonun matematiksel ifadesini tespit etmek için yapılan analiz. ∑ (Y − Y `) 2 = minimum * Tahmin edilen değer Y * * X Gerçek değer 6 . Bu matematiksel ifadeye de regresyon denklemi diyoruz.

Regresyon Katsayılarının (a ve b) Belirlenmesi a= ∑Y − b ∑ X n n n(∑ XY ) − (∑ X )(∑ Y ) n ∑ X 2 − (∑ X ) b= ( ) 2 X: Bağımsız değişkenin değeri Y: Bağımlı değişkenin değeri n: Örnekteki veri sayısı Örnek: Regresyon Katsayılarının (a ve b) Belirlenmesi Satış elemanı Telofonla yapılan arama sayısı(X) 14 35 22 29 6 15 17 20 12 29 199 Satış yapılan ürün adeti (Y) 28 66 38 70 22 27 28 47 14 68 408 X2 XY Y2 Ali Veli Ayşe Gül Hüsnü Necati Zehra Fatma Zeynep Ahmet TOPLAM 196 1225 484 841 36 225 289 400 144 841 4681 392 2310 836 2030 132 405 476 940 168 1972 9661 784 4356 1444 4900 484 729 784 2209 196 4624 20510 7 .

Regresyon doğrusu daima X ve Y değerlerinden geçmektedir.1387X .1387 10 ( 4681 ) − (199 ) ) − (∑ X ) 2 2 a= ∑Y n ∑X n = 408 199 − 2 .7604 Regreson doğrusunun özelliği: ∑ (Y − Y `) 2 = minimum 2. 7601 + 2 . 706 10 10 Y ` = − 1.1387 = − 1. 8 .1387 Örnek: Regresyon Doğrusunun grafiği Regresyon Denklemi Satış yapılan ürün sayısı 80 60 40 20 0 0 10 20 30 40 Telefonla yapılan arama sayısı Y` = 2.1.Örnek: Regresyon Katsayılarının (a ve b) Belirlenmesi b= n (∑ XY ) − (∑ X n (∑ X −b 2 )(∑ Y ) = 10 (9661 ) − (199 )( 408 ) = 2 .

x = ∑ (Y − Y `) n−2 = 566.x = ∑Y 2 − a (∑ Y ) − B (∑ XY ) n−2 Örnek: Regresyon Katsayılarının Tahmininde Standart Hatanın(S y.9861 -9.99043 7.1631 94.0251 43.8334 98.1817 -7.7378 10. x = ∑ (Y − Y `) 2 S y.1285 Y ` = −1.3204 -6.9279 -3.412 10 − 2 9 .8735 566.7378 0 2 0.0944 -7.Regresyon Katsayılarının Tahmininde Standart Hatanın(S y.1817 73.x) Belirlenmesi Standart Hata:Regresyon doğrusunun etrafında gözlenen değerlerin dağılımının yada yayılımınım ölçülmesi n−2 Sy.2913 9.2622 -0.1387 S y.3305 53.x) Belirlenmesi Satış elemanı Telofonla yapılan arama sayısı(X) Satış yapılan ürün adeti (Y) 28 66 38 70 22 27 28 47 14 68 408 Tahmini satılan ürün adeti (Y`) (Y-Y`) (Y-Y`)2 Ali Veli Ayşe Gül Hüsnü Necati Zehra Fatma Zeynep Ahmet TOPLAM 14 35 22 29 6 15 17 20 12 29 199 28.5978 -5.5978 41.4190 11.0944 45.2913 60.8247 119.5310 35.x= 0 ise tüm noktalar regresyon doğrusu üzerine düşmektedir.7601 + 2.033 50.1287 = 8.0952 59.0721 30.2622 11.9043 60. •Gözlem sayısının büyük olduğu durumlarda regresyon katsayılarının Tahmininde kullanılan daha pratik bir formül S y.x= Tahminin standart hatası y.3204 34.0139 23.x= x bağlı y değeri S y.

3. Bu Y değerlerinin ortalamaları daima doğrusal regresyon çizgileri üzerinde yeralır. Y değerleri istatiksel olarak birbirine bağlı değildir. Bu normal dağılımların standart sapmaları birbirine eşittir. Bu Y değerleri normal dağılım göstermektedirler. 4. 2.Doğrusal (linear) regresyon analiz uygulamak için varsayılan şartlar 1. x ) n (X − X ) ∑X 2 2 2 ( X) − ∑ n X: seçilmiş X değeri t: df=n-2 özgürlük derecisi için belli bir risk derecesine göre t dağılım tablolarından belirlenen t değeri 10 . GÜVEN ARALIĞININ HESAPLANMASI Güven aralığı tüm X değerlerine dayanan bir aralık olup seçilmiş bir X değeri için hesaplanan ortalama bir değerdir. 1 + Y `±t ( s y . Herbir X değeri için birden çokY değeri vardır.

7074 ± 2.7074 %95 güven araligi df = n .412) 1 + 10 (25 − 19.7074 ± 7.Güven aralığını: %95 seçin Satış elemanı Telofonla yapılan arama sayısı(X) 14 35 22 29 6 15 17 20 12 29 199 Satış yapılan ürün adeti (Y) 28 66 38 70 22 27 28 47 14 68 408 X2 XY Y2 Ali Veli Ayşe Gül Hüsnü Necati Zehra Fatma Zeynep Ahmet TOPLAM 196 1225 484 841 36 225 289 400 144 841 4681 392 2310 836 2030 132 405 476 940 168 1972 9661 784 4356 1444 4900 484 729 784 2209 196 4624 20510 ÖRNEK: GÜVEN ARALIĞININ HESAPLANMASI X = 25 Y `= 2.306(8.1387 X − 1.x = 8.2 = 8 t = 2.306( t dagilim tablolarindan) s y.2 = 10 .9)2 4681 − (199) 2 10 51.412 1 Y `±t ( s y. x ) + n (X − X ) ∑X 2 2 2 ( X) − ∑ n = 51.7601 Y `= 51.1558 11 .ÖRNEK: GÜVEN ARALIĞININ HESAPLANMASI Örnek: 25 kez telefonla arama yapan satış uzmanlarının sattığı ürün sayısının güven aralığını hesaplayalım.

TAHMİN ARALIĞININ HESAPLANMASI Tahmim aralığı belli bir X değeri için olup o X değerine karşılık gelen değerlerin aralığını verir. x ) 1 + + n (X − X ) ∑X 2 2 2 ( X) − ∑ n Örnek: 25 kez arama yapan Zekinin %95 güven aralıkla satış yapacağı ürün adetinin tahmini aralığının belirlenmesi 12 . 1 Y `±t ( s y .

You're Reading a Free Preview

İndirme
scribd
/*********** DO NOT ALTER ANYTHING BELOW THIS LINE ! ************/ var s_code=s.t();if(s_code)document.write(s_code)//-->