Professional Documents
Culture Documents
STATSTK VE OLASILIK
Do. Dr. rfan Yolcubal Kocaeli niversitesi Jeoloji Mh. Blm
Ders Kitab
Statistical analysis of Geological data (Koch G. S., ve Link, R. F., 1980. Dover Publications) A data-based approach to statistics (Iman, R. L., 1994) Basic statistics for Business and Economics (Lind, D. A., and Mason, R. D., 1997) statistik Analiz Metotlar (Prof. Dr. Bilge Aloba)
DEERLENDRME
Devam zorunlu (% 70) 2 Snav (Ara vize + Final) dev Grup almas OK dev kopyalamak yasak
DERS PROGRAMI
Data toplama ve sunum ekilleri
rnek vs. Poplasyon kavramlar Data toplama teknikleri Data sunum ekilleri
Pasta diyagramlar Histogramlar Bar grafikler Kmlatif rlatif sklk grafikleri Dalm grafikleri (X-Y)
Datalarn Deerlendirilmesi
Tarifsel istatistik
Analitik ve analitik olmayan ortalamalar standart sapma, varyans, standart hata, gvenilirlik aral vb
STATSTK NEDR?
statistik ksaca, data analizini kapsayan matematik biliminin alt bir daldr.
Datalarn toplanmas, derlenmesi, zetlenmesi,sunumu, analizi ve ayn zamanda verilerden geerli bir sonu karlmas istatistik dalnn balca ilgi alanlardr.
STATSTK TRLER
Tarifsel (Descriptive) istatistik: nmerik verileri derlemek, dzenlemek, ve zetlemek iin kullanlan prosedrler Tmevarmsal (Inferential) istatistik: rneklemeye dayanarak bir poplasyon hakknda bilgi elde etmek iin kullanlan metotlar
Deiken Trleri
Kantitatif (Quantitative) Deiken:
Saysal lekte ifade edilir. Miktar hakknda bilgi verir. Hesabnzdaki bakiye, pilin mr, snftaki rencilerin says vb.
Kualitatif (Qualitative)Deiken :
Nmerik olmayan deikenlerdir. Doum yeri, gz rengi, rk, vb
Deikenlerin Snflandrlmas
DATA TOPLANMASI
rneklemeye gemeden nce inceleme yaplan poplasyonun iyi bir ekilde belirlenmesi gerekmektedir. Uygun rnekleme teknii ve protokol: Toplanan rneklerin incelenen poplasyonu tam anlamyla yanstmas gerekmektedir.
DATA TOPLANMASI
Tm poplasyonu incelemek (Saym) yerine neden rneklemeyi kullanyoruz?
Dk maliyet Zaman Dikkatlice alnm rnekler baz durumlarda bir saymdan daha doru bilgi verebilir. Baz durumlarda imkansz olabilir. rnlerin yok edilerek test ediliinden rnekleme tek bana yeterli olabilir.
RNEKLEME PLANI
rnekleme plannn hazrlannda rneklerin nerede ve ne zaman alnacana karar vermek gerekmektedir. rneklerin says, lokasyonu, ve zaman rnekleme btesini amadan istatistiksel olarak geerli bir rnek almaya yeterli olmaldr. Bunu salamak iin uygun bir rnekleme stratejisi belirlemek gerekmektedir.
RNEKLEME EKLLER
Rasgele (Random): Her rnein ayn saydaki gzlemde eit olaslkla olarak seilebilmesi Sistematik: Karara dayal (Judgemental):
Karara dayal
Rasgele
Sistematik
Pasta Diyagramlar
Farkl yada kantitatif datalarn oran yada yzde ekilde sunulmasnda kullanlr.
10
BAR GRAFKLER
Dey bar grafikleri:niversite mezunu erkek ve bayanlarn ya gruplarna gre gelir dalmn gsteren bar grafiklerine bir rnek
11
X-Y GRAFKLER
12
Tasnif
Bir kitlenin veya grubun zelliklerine gre yapsn ortaya karabilmek amacyla, elde edilen bilgileri bir vasf veya vasflar bakmndan eitli klara ayrarak ayn kk ait birimleri kmeler halinde bir araya getirme ilemine denir. Veri saysnn snrl olduu durumlarda uygulanabilir.
Tasnife rnek: 100 kiilik bir snftaki rencileri ya vasfna gre tasnif edersek
13
Gruplama
Eer tasnif edilecek veri says ok fazla ise bunlar tasnif yoluyla kmelere ayrmak mmkn olsa bile anlaml ve ilemlere elverili olmayabilir. Byle durumlarda bir vasfn birbirine yakn olan klarn gruplar halinde toplamaya, yani gruplamaya bavurulabilir.
Gruplamaya rnek: Dnyadaki 29 en byk ehir nfus itibariyle gruplanarak bir frekans dalm veya blnmesi eklinde ifade edilebilir.
14
Gruplamaya rnek:(Hatal) Bir endstri dalnda faaliyet gsteren iletmelerde altrlan ii saysna gre gruplamak istersek
FREKANS DAILIMLARI YADA BLNMELER (Frequency Distributions) Verilerin her bir snf aralna den gzlem saysn(frekans) gsterecek ekilde gruplandrlmas ilemi.
15
Frekans Dalmnn oluturulmas rnek: Bir tatn yl iindeki sat fiyatlarnn organize edilmemi hali: Ham data
16
17
18
Uygun olarak seilmemi snf saysna gre oluturulmu frekans dalmlar, verinin frekans dalm hakknda faydal bilgiler sunmayabilir. rnek:
19
20
21
Kmlatif frekans dalmlarnn oluturulmas: rnek:Bir snftaki rencilerin boy uzunluklarnn frekans dalmlar
22
23
FREKANS POLGONLARI
Bu grafiklerde snf aral yerine snf orta noktasnn snf frekansna gre dalm izgisel olarak grafiklenir. Frekans poligonlarnn histogramlara gre bir avantaj 2 veya daha fazla frekans dalm grafiinin kolaylkla birbirleri ile karlatrlmasna imkan tanmasdr ( Frekans dalmlarnn snf says ve aral ayn olmak koulu ile)
24
Analitik Ortalamalar
Bir rneklemede tm veri deerlerini dikkate alan merkezi eilim lleridir.
Aritmetik ortalama Arlkl ortalama Geometrik ortalama Harmonik ortalama
X =
X
i =1
X 1 + X 2 + X 3 + ....... X n N
X : Aritmetik ortalama
N: Toplam veri says X: veri deeri
X = n =
1 n
fi
i =1
fi X
i =1
fi: bir rnekteki Xi`nin frekans k: rnekteki gzlem says Xi: i.gzlem deeri n=toplam veri says
X =
( 5 * 5 ) + ( 3 * 6 ) + ( 2 * 7 ) + ( 3 * 8 ) + ( 3 * 9 ) + ( 4 * 10 ) = 7 .4 20
( X X ) = 0
rnek: 3, 8, ve 4 deerlerin aritmetik ortalamas 5`dir.
( X X ) = (3 5) + (8 5) + (4 5) = 2 + 3 1 = 0
Aritmetik ortalamann hesaplannda veri setindeki tm veri deerleri kullanlr. Bir veri setinin yalnzca bir aritmetik ortalamas vardr.
X 1W 1 + X 2W 2 + X 3W 3 + ........ + X n W n W 1 + W 2 + W 3 + .......... + W n X =
W
i =1 n i =1
W: Her bir veri deerinin arln yani nemini ifade etmektir. X W : Arlkl ortalama
XW =
X=
6 + 7 + 9 + 10 =8 4
rnek 2
X X
Geometrik Ortalama (Geometric Mean) Geometrik ortalama iktisat ve iletme alanlarnda yaygn olarak kullanlan bir ortalama trdr. Geometrik ortalama zellikle 1) deiim oranlarnn (yzde, oran, vb.) ortalamasnn hesaplanmasnda 2) bir zaman aral ierisindeki bir retimin yada satn art miktarnn ortalamasnn belirlenmesinde yaygn olarak kullanlmaktadr.
G .O . =
( X 1 )( X 2 )( X 3 ).......( X n )
Not: Eer veri deerlerinden bir 0 yada negatif deerlikli ise Geometrik ortalama hesaplanamaz.
log G .O . =
1 n
log X
Geometrik ortalama daha tutucu bir kar deeri vermektedir. nk ar deerlerden aritmetik ortalamaya gre o kadar fazla etkilenmemektedir. Bu nedenle geometrik ortalama ya aritmetik ortalamaya eit olacaktr yada kk olacaktr.
G.O. = n 1
n : periyot araligi
G .O . =
5 1
56 . 5 1 = 50 . 7
1 . 11 1 = % 2 . 47
Baz zel durumlarda bavurulan bir ortalama olup hz, fiyat, verimlilik gibi oransal olarak belirtilebilen baz deiken deerlerin ortalamalarnn hesaplannda kullanlr.
H = N = 1 1 1 1 + + + .... + X1 X2 X3 Xn N
1 Xi
Deikenlerden birinin sabit, dierinin ise deiken olduu durumlarda bavurulan bir ortalamadr. Veri deerlerinde sfr bulunmas yada veri deerlerinin farkl iaret tamalar durumunda harmonik ortalama kullanlmaz.
H =
2 1 1 + 75 50
= 60 km
X=
75 + 50 = 62.5km 2
Bir rnekteki btn veri deerlerini dikkate almayan merkezi eilim lleridir.
Medyan (Median) Mod (Mode)
Medyan (Ortanca)
Baz durumlarda rnein bir yada iki tane ok yksek yada dk deerler ierebileceinden bahsetmitik. Bu gibi durumlarda aritmetik ortalama rnein merkezi eilimini yanstmaz. Byle problemlerde medyan deeri kullanlarak rnein merkezi eilimi llebilir.
Veri deerleri bykten ke yada kkten bye sralandktan sonra, tam ortadaki yani veri dizisini 2 eit frekansa ayran deerdir. Dzenlenmemi verilerde medyan`n yerini kolaylkla tespit etmek iin aadaki formlden yararlanlabilir.
n +1 2
Medyan: rnek1
Bir klinikte pansuman iin denen miktarlar aadaki gibi sralanmaktadr: 65, 29, 30, 25, 32, 35 TL. Medyan fiyat nedir? 25 29 30 Medyan : (30+32)/2= 31 TL. 32 35 65
Medyan: rnek 2
Yuvack Kalc konutlarndaki kira fiyatlar aadaki gibi sralanmaktadr: 120,100, 110, 115, 125, 105, 70 TL. Ortalama kira fiyat nedir.
Medyan: rnek 2
Medyan
10
Medyann zellikleri
Her bir veri setinin tek bir medyan vardr. Veri setindeki ar deerlerden etkilenmedii iin verilerin merkezi eiliminin belirlenmesinde aritmetik ortalamaya nazaran daha doru bir bilgi sunar. Aritmetik ortalamann aksine ak snf aralkl frekans dalmlarnn merkezi eiliminin lmnde kullanlabilirler.
Mod
Bir veri setindeki btn deerleri dikkate almayan (hassas olmayan) bir baka merkezi eilim lmdr. Mod, bir data setinde en sk olarak gzlenen veri deeridir.
11
Mod: rnekler
4, 6. 5, 8, 7, 10, 9, 11
Mod ?
Baz durumlarda veri deerleri gruplandrlp, frekans dalmlar oluturulmu olabilir ve ham veriler mevcut bulunmayabilir. Bu gibi durumlarda aritmetik ortalama, medyan ve mod frekans dalm tablolarndan hesaplanabilir. Bu deerler gerek ham verilerden hesaplanan deerlerden farkl olabilir.
12
X=
fX
N
X: her bir snfn orta noktas f: her bir snf frekans N: Toplam veri says yada frekanslarn toplam deeri
rnek
Net geliri (milyon $) 2-5 5-8 8-11 11-14 14-17 thalat says 1 4 10 3 2
13
X=
fX
N
193 = 9.65 20
N CF Medyan = L + 2 (i ) f
L: Medyan snfn alt snr N: Toplam frekans deeri CF: Medyan snfndan nceki snflarn frekanslarnn toplam f: medyan snfnn frekans i: medyan snfnn aral
14
CF 1 5 15 18 20
Frekans dalm eklinde gruplanm veriler iin mod, frekans says en fazla olan snfn orta noktas deeridir. Eer frekans dalmnda 2 snf maksimum frekansa sahip ise bu tr dalmlara bimodal dalmlar denilmektedir.
15
Toplam yzdesi 13 14 40 23 10
Bir Frekans Dalm Grafiinde Aritmetik ortalama, medyan, mod arasndaki iliki
16
Bir Frekans Dalm Grafiinde Aritmetik ortalama, medyan, mod arasndaki iliki
Mod
Tek modlu ve asimetrileri ok fazla olmayan veriler iin Aadaki iliki kullanlabilir. Aritmetik ortalama-Mod= 3(Aritmetik Ort-Medyan)
17
X=6
R=10-2=8
X=6
R=8-5=3
10 21 9 5
R= 25-5=20 TL
Ortalama yada Mutlak Ortalama Sapma (Mean Deviation or Mean Absolute Deviation)
Bir poplasyondaki tm veri deerlerinin poplasyonun aritmetik ortalamasndan olan mutlak sapmalarnn aritmetik ortalamasdr.
O.S . =
X X N
X X = mutlak sapma
4 3 1 2 6 16
O. S . =
16 = 3.2 5
fx
105 350 560 405 275 1695
X X
15-33.2 25-33.2 35-33.2 45-33.2 55-33.2
X X f X X
18.2 8.2 1.8 11.8 21.8 127.4 114.8 28.8 106.2 109 486.2
X=
fX = 1695 = 33.2
N 51
O. S . =
X X 486.2 = = 9.53 51 N
X X = N
Poplasyona ait
2 =
X X N 1
rneklemeye ait
Standart Sapma
Bir veri setinin varyansnn karekkne eittir.
X X N
X X = N 1
Poplasyona ait
rneklemeye ait
2 ( X a) = 2 ( X ) 2 ( X + a) = 2 ( X )
Bir serideki deerlerin her birinin belirli bir sabit ( c ) ile arplmas sonucu meydana kan serinin varyans, orijinal serinin varyansnn sabitin karesi ile arpmna eittir. Ancak standart sapmas, orijinal serinin standart sapmasnn sabitin kendisi ile arpmna eit olmaktadr.
2 (cX ) = c 2 2 ( X ) ( cX ) = c ( X )
X 22 25 28 30 35
(X X)
( X X )2
X=
-6 -3 0 2 7
X) = 0
36 9 0 4 49
140 = 28 5
X = 140 ( X
(X
X ) 2 = 98
f ( X X )2
8 11 7 6
X=
= 44025 = 20982 .
7
Varyans
Tek bir veri seti iin varyans deerinin yorumlanmas zordur. Deikenlik aral ve ortalama sapmada olduu gibi varyans, 2 veya daha fazla data setindeki verilerin deikinlik derecelerin karlatrlmasnda kullanlr.
Simetrik frekans dalm grafiklerinde standart sapma ve aritmetik ortalama arasndaki iliki
X 1
X 2
X 3
Degisim Katsayisi(%) =
*100
Birimleri farkl olan farkl 2 data setinin kyaslanmasnda (cm, TL) Birimleri ayn fakat ortalamalar birbirinden ok farkl olan data setlerin kyaslanmasnda deiim katsays kullanlr.
50000 * 100 = 10% 500000 2000 Degisim katsayisi = * 100 = 16.7% 12000 Degisim katsayisi =
(x x) k =
i
n 3
Simetrik arpklk=0
Pozitif arpklk
Negatif arpklk
k =
fi xi x f
i 3
Carpiklik =
3(X medyan)
eklinde de hesaplanabilir.
10
(x x) Kur =
i
n
i
f (x x) Kur = f
i 4 i
Kur=3 (mesokurtik, yada normal dalm) Kur>3 (Leptokurtik, sivri-orta ksmlar u ksmlara gre daha yi boylanm yada sivrilemi can erisi Kur<3 (Platykurtik,bask u ksmlar daha iyi boylanm yada bask an erisi
11
Olaslk Kavram
Olaslk (Probability): Belirli bir olayn olma ihtimalinin yada ansnn lm.
0 P(A) 1. Oran olarakta ifade edilebilir (rnein, 7/10; 20/100; 1/2) 0 olaslk olayn kesinlikle olmayacan; 1 olaslk ise olayn kesinlikle meydana geleceini ifade etmektedir.
Sonu
1, 2, 3, 4, 5, 6
Olay
ift bir saynn gelmesi 4`den byk saynn gelmesi, vb.
Deney: Bir aktivitenin gzlemlenmesi yada lm alma ekli Sonu: Bir deneyin belli bir sonuu Olay: Bir deneyin bir yada daha fazla sonularnn toplam
Olaslk Snflandrlmas
Olaslk 2 ekilde snflandrlabilir. Objektif Olaslk (Tekrarlanabilen rastgele bir deneye bal). rnek: Rus ruletinin dndrlmesi, zar atlmas
Klasik Olaslk Nisbi frekans olarak 2 ksma ayrlabilir.
Subjektif Olaslk (Tekrar edilemeyen bir deneye bal). rnek: Gemis meteoroloji verilerine dayanarak yarn yamur yama ihtimalinin tahmini subjektif olaslk deerleri sunan bir deneydir.
P( E ) =
P( E ) =
b na a = 1 = 1 P( E ) = n n n
rnek: Bir zar atldnda 2 gelmeme olasl nedir? P(~E)=1-P(E)= 1-1/6 =0.833
0.5
Olaslklarn toplanmas
Eer bir deneyde A, B, ve C olaylar birbirlerini engellemeyen trden olaylar ise A ve B olaylarnn ortaya k olasl P(A veya B)= P(A) +P(B)-P(AB)
P(AB): Birleik olaslk (Joint probabilit):hem A hemde B olaynn ayn anda meydana gelme olasl
A veya B veya Cnin ortaya k olasl; P (A veya B veya C)= P(A) + P(B)- P(AB)P(AC)-P(BC)+P(ABC)
rnek 1
Bir deste iskambil kat arasndan 1 vale veya 1 maa ekme olasl nedir? Vale ekme olay: A; maa ekme olay: B P(A veya B)=P(A)+P(B)-P(AB) = 4/52 + 13/52 1/52 = 4/13
rnek 2
lkemizi ziyaret eden 200 turist zerinde yaplan ankette sadece Ayasofyay ziyaret eden turist says 120, Efesi ziyaret eden turist says ise 100dr. 60 ise her ikisinide ziyaret etmitir. Bir turistin Ayasofya veya efesi ziyaret etme olasl nedir? Ayasofyay ziyaret etme olay: A; efesi ziyaret etme olay:B P(A veya B)=P(A) + P(B)- P(AB) =120/200 +100/200 60/200= 0.8
P(A)+P(B)+P(C) =1 A ~A
P(A)+P(~A)=1
~(A veya B)
A AB
P( A| B) =
P( B)
Ave B olaylar birbine bal ise yani B olaynn ortaya k A olaynn olasln etkiliyorsa hem A hemde B olaynn ayn anda meydana gelme olasl
rnek
Bir kutuda 10 adet film var. Bunlardan 3nn bozuk olduu biliniyor. Eer srasyla birer adet toplam 2 film ekersek, seilmi filimlerin her ikisininde bozuk olma olasl nedir? P(A): birinci ekimde filmin bozuk kma olasl P(B): ikinci ekimde filmin bozuk kma olasl P(A ve B)= P(A).P(B|A) =3/10 . 2/9 =0.0667
dev
Eer A, B, ve C olaylar birbirine bal ise A,B,ve Cnin ayn anda ortaya kma olasln nasl hesaplarz?
Bayes Kural
artl olaslklarn hesaplanmasnda kullanlan bir tekniktir. Kuraln ama bir olayn ortaya kmasnda birden fazla bamsz nedenin etkili olmas halinde bu nedenlerden herhangi birinin, o olay yaratm olmas ihtimalini hesaplayabilmektir.
P ( A'i | B) =
P( Ai ) P( B| Ai ) P ( A1 ) P( B| A1 ) + ...+ P( An ) P( B| An )
rnek:
Bir paray 5 kez atalm ve tura gelme saysn hesaplaylm (0, 1, 2, 3, 4, yada 5) Bir haftada yaplan sat says 5 dakika ierisinde Trk petrole gelen ara says 200 kii ierisinden uak rezervasyonu yaptrp, sonra vazgeen kii says
Srekli (Continuous) Random Deiken: Random deiken belirli bir aralkta her deeri alabilir. | 2 | 3 | 4 | 5 | 6 | 7 | 8
X
Olaslk
rnek: 2 paray ayn anda atalm ve yaz gelme saysn belirleyelim. Ortalama deeri ve varyans hespalay = 0 .25 + 1 .50 + 2 .25 = 1
Binom
Hipergeometrik
Poisson
n: deney says x: elverili halin says p: her bir deneydeki elverili halin olasl q: elverisiz halin olasl, q=1-p
Bir para 2 kere atldnda tura gelme olasl X 0 1 2 P(X) 1/4 = .25 2/4 = .50 1/4 = .25
= E ( X ) = np
e.g. = 5 (.1) = .5 Standard Sapma
.6 .4 .2 0
P(X)
n = 5 p = 0.1
X
0 P(X)
1 np ( p )
.6 .4 .2 0
n = 5 p = 0.5
X
P (1) =
Olaslk
.2
Olaslk x
.2
.1
.1
9 10
9 10
(n = 10, p = .5) a
.3 .3
(n = 10, p = .8) b
Olaslk
.2
Olaslk x
.2
.1
.1
9 10
9 10
20
(n = 10, p = .2) c
(n = 20, p = .2) d
P( x ) =
( s Cx )( N S Cn x ) N Cn
N: poplasyonun bykl S: Poplasyondaki elverili hallerin says x: rnekteki ilgili elverili hallerin says n: rnek yada deney says n! C = x !( n x )! C: Kombinasyon sembol
n x
= xP(x) = 2 = x2P(x) 2
= n
S S 1N N
( 40 C4 )( 50 40 C5 4 ) P ( 4) = = C5 50
= 0.431
rnek: irketin faks makinasna gnlk gelen faks says stanbulda aylk ilenen araba hrszl vakas says Numune hastanesi acil servisine saatlik gelen hasta says
xe
x!
= ortalama elverili hal says e=sabit say=2.7183 x= belli bir zaman aralndaki elverili hallerin says (0,1,2)
= xi p(xi)
2 = x2P(x) - 2 =
Poisson dalmnn ortalamas , standard sapamas ise nn karakkdr.Herhangi bir deerinin dalm pozitif bir arpkla sahiptir. artka dalm normal dalma yaklar.
2 3 4 5 6 7 1 2 3 4 5 6
10
11
1 32 43 54 6 7 7 8 10 11 5 6 8 9 9 10
0.2
10
P ( X = 0) = p( 0) =
P ( X = 2) = p( 2) =
11
E(x) = (a + b)/2 Var(x) = (b - a)2/12 a = bir deikenin varsayaca en kk deer b = bir deikenin varsayaca en byk deer
P(x )
0.2
P(x )
0.2
P( x > 1 ) = 0.8
0 0 1 2 3 4 5
x
Scaklk (C)
0 0 1 2 3 4 5
x
Scaklk (C)
ekil 1
ekil 2
f(x) 0
x = +
x =
f ( x ) dx = 1
x =b
P ( a < X < b) =
x=a
f ( x)dx
Ortalama ve Varyans
Srekli bir random deikenin aritmetik ortalamas,
+
E(X ) =
f ( x ) dx
Varyans
Var( X ) = ( x E ( X ))2 f ( x)dx
+
f (x) =
1 e 2
( x )2 2
2
+2
+3
f ( x ) dx = 1
Normal dalmlar etrafnda simetriktir. Normal dalmnn yerini belirlemektedir ve grafikteki en yksek noktadr. Normal dalmlarda aritmetik ortalama, mod ve medyan birbirine eittir. yaylma miktarn belirlemektedir.
-4
-3
-2
-1
-4
-3
-2
-1
-4
-3
-2
-1
+ 1 68%
+ 2 95%
+ 3 99.7%
P ( a x b) = f ( x ) dx
a
P(x)
Normal Dalm
-4
-3
-2
-1
30
35
40
45
50
55
60
65
70
35
40
45
50
55
60
65
70
75
f(x)
-4
-3
-2
-1
Normal Dalm
Her bir normal random deiken (x), aadaki forml yardmyla standart normal deikene (z) dntrlr. z = (x )/ Standard normal dalm tablo halin.
z
0.0 0.1 0.2 0.3 0.4 0.5 0.6 0.7 0.8 0.9 1.0 1.1 1.2 1.3 1.4 1.5 1.6 1.7 1.8 1.9 2.0 2.1 2.2 2.3 2.4 2.5 2.6 2.7 2.8 2.9 3.0
.00
.0000 .0398 .0793 .1179 .1554 .1915 .2257 .2580 .2881 .3159 .3413 .3643 .3849 .4032 .4192 .4332 .4452 .4554 .4641 .4713 .4772 .4821 .4861 .4893 .4918 .4938 .4953 .4965 .4974 .4981 .4987
.01
.0040 .0438 .0832 .1217 .1591 .1950 .2291 .2611 .2910 .3186 .3438 .3665 .3869 .4049 .4207 .4345 .4463 .4564 .4649 .4719 .4778 .4826 .4864 .4896 .4920 .4940 .4955 .4966 .4975 .4982 .4987
.02
.0080 .0478 .0871 .1255 .1628 .1985 .2324 .2642 .2939 .3212 .3461 .3686 .3888 .4066 .4222 .4357 .4474 .4573 .4656 .4726 .4783 .4830 .4868 .4898 .4922 .4941 .4956 .4967 .4976 .4982 .4987
.03
.0120 .0517 .0910 .1293 .1664 .2019 .2357 .2673 .2967 .3238 .3485 .3708 .3907 .4082 .4236 .4370 .4484 .4582 .4664 .4732 .4788 .4834 .4871 .4901 .4925 .4943 .4957 .4968 .4977 .4983 .4988
.04
.0160 .0557 .0948 .1331 .1700 .2054 .2389 .2704 .2995 .3264 .3508 .3729 .3925 .4099 .4251 .4382 .4495 .4591 .4671 .4738 .4793 .4838 .4875 .4904 .4927 .4945 .4959 .4969 .4977 .4984 .4988
.05
.0199 .0596 .0987 .1368 .1736 .2088 .2422 .2734 .3023 .3289 .3531 .3749 .3944 .4115 .4265 .4394 .4505 .4599 .4678 .4744 .4798 .4842 .4878 .4906 .4929 .4946 .4960 .4970 .4978 .4984 .4989
.06
.0239 .0636 .1026 .1406 .1772 .2123 .2454 .2764 .3051 .3315 .3554 .3770 .3962 .4131 .4279 .4406 .4515 .4608 .4686 .4750 .4803 .4846 .4881 .4909 .4931 .4948 .4961 .4971 .4979 .4985 .4989
.07
.0279 .0675 .1064 .1443 .1808 .2157 .2486 .2794 .3078 .3340 .3577 .3790 .3980 .4147 .4292 .4418 .4525 .4616 .4693 .4756 .4808 .4850 .4884 .4911 .4932 .4949 .4962 .4972 .4979 .4985 .4989
.08
.0319 .0714 .1103 .1480 .1844 .2190 .2517 .2823 .3106 .3365 .3599 .3810 .3997 .4162 .4306 .4429 .4535 .4625 .4699 .4761 .4812 .4854 .4887 .4913 .4934 .4951 .4963 .4973 .4980 .4986 .4990
.09
.0359 .0753 .1141 .1517 .1879 .2224 .2549 .2852 .3133 .3389 .3621 .3830 .4015 .4177 .4319 .4441 .4545 .4633 .4706 .4767 .4817 .4857 .4890 .4916 .4936 .4952 .4964 .4974 .4981 .4986 .4990
0.5000
0.4265
1.45
rnek 3
P(z > 1.45)=?
0.4265
Aranan alan
145 .
10
rnek 4
P(-1.26 < z < 0) =? = P(0 < z < 1.26) = 0.3962
Sorulan alan Tablodan hesaplanan alan = 0.3962
1.26
1.26
rnek 5
P(z < -0.98)=?
Aranan alan Tablodan hesaplanan alan =0.3365
-0.98
0.98
11
rnek 6
P(-2.3<z<1.8)=?
0.4893
0.4641
2.3
18 .
P(23 < z < 18) = P(23 < z < 0) + P(0 < z < 18) . . . . = 04893+ 04641 = 09534 . . .
rnek 7
P(-1.4<z<-0.5)=?
Aranan alan
1 . 4 -0.5
P(1.4 < z < 0.5) = P(0 < z < 1.4) P(0 < z < 0.5) = 0.4192 0.1915 = 0.2277
12
Eer erinin altnda kalan alan biliniyor ise, standart normal dalm tablolar z deerini belirlemek iin kullanabilir.
% 15
0.35
P85
z 1.0 0.00 0.01 0.02 0.03
0
0.04
z
0.05
Aadaki standart normal eride % 90lk alana karlk gelen z deeri bulalm.
0.45
0
z 0.00
z
0.01 0.02 0.03 0.04
z
0.05
M 1.6 M
13
rnek 8
Bir ieleme makinas ortalama olarak 32 ml soday 0.02 ml standart sapmayla doldurucak ekilde ayarlanmtr. Dolum miktarnn normal bir dalm gsterdiini varsayarsak, rastgele setiimiz bir ienin 3232.025 ml arasnda soda ierme olasl nedir?
zm 8
Aranan alan
x = 32; z =
32 32 32 = =0 .02
x = 32.025; z =
32
32.025
1.25
x
z
32 32 x 32 32.025 32 < < P (32 < x < 32.025) = P .02 .02 .02 = P ( 0 < z < 1.25) = 0.3944
14
Rastgele setiimiz bir ienin 31.97 ml den fazla soda ierme olasl nedir?
x 32 31.97 32 > P ( x > 3197) = P . . = P ( z > 15) .02 .02 = 0.5000 + 0.4332 = 0.9332
31.97 . 15
32 0
x z
rnek 9
Bir polis radar akam trafiinde E-5de aralarnn hzlar denetlemektir. Aralarnn hzlar aritmetik ortalmas 62 km/saat olan normal bir dalm gstermektedir. Aralarnn %3 72 km/saat in zerinde seyahat ediyorsa tm aralarnn hzlarnn standart sapmasn hesaplaynz?
0.4700
0.03
x 62 7262 > P . = 003 7262 Pz > . = 003 7262 . =188 (188)() =10 . . . =10/188 =532 P(z >188) = 003 . .
62
72
1.88
15
16
f ( x) =
1 x / e
x > 0, > 0
= A. ortalama e = 2.71828
17
1 RNEKLEME TEORS Bir poplasyonun istatistiksel parametrelerini belirlemede rneklemenin tercih edilmesinin bir ok sebebi vardr. Bunlar u ekilde zetlenebilir. 1. ok skca, seilen rneklerin yelerinin yok edilmesi durumunda, rneklerinin poplasyona geri katlamamas 2. Poplasyonun tmne ulamann rneklemede mmkn olmayabilmesi 3. Poplasyonun tmn rneklemenin maliyetinin yksek olmas 4. Doru seilmi bir rneklemenin poplasyonun parametrelerini uygun bir ekilde tahmin edebilmesi ve bunun sonuunda maliyet ve zaman kaybnn azaltlmas 5. Poplasyonun tm yeleriyle balant kurmann ok zaman almas 2 trl rnekleme vardr: Rastgele ve karara dayal yani iradi rnekleme Rastgele rneklemenin bir ka tr vardr: 1. Basit rastgele rneklemede poplasyonun her bir yesi ayn eilme ansna yada olaslna sahiptir. 2. Sistematik rastgele rneklemede rastgele bir balang noktas seilir ve ondan sonra her ninci poplasyon yesi rneklemede seilir. 3. Cluster rneklemede poplasyon gruplara ayrlr ve bu gruplardan rastgele rnekleme yaplr. Karara dayal yani iradi rneklemede rnek eimi tamamiyle rneklemeyi yapan kiinin kararna dayaldr. Dolaysyla bu tr rneklemede poplasyon parametrelerinin tahmininde hataya sebeb olabilir. Poplasyon parametresi ile rnekleme istatistii arasndaki arasndaki fark rnekleme hatas olarak tanmlanr. Bir rneklemeden tahmin edilen ortalamadaki standart hata miktar :
X =
s n
Merkezi limit teoremine gre eer bir poplasyon normal bir dalm gsteriyorsa rneklemelerinin aritmetik ortalamalarnn dalmda ayra normal bir dalm gsterir. Eer poplasyon normal dalm sergilemiyorsa rneklemelerinin aritmetik ortalamalarnn dalm rnek says artka normale yakn bir dalm gsterir. Poplasyonun parametrelerinin belirlenmesinde 2 trl tahminden yararlanlr:
2 Nokta tahmini( point estimate): poplasyon parametresinin tahmininmde tek bir deer kullanlr. Enterval yada aralk tahmini (interval estimate): poplasyon parametresinin hangi deerler arasnda bulunacann belirlenmesidir. Aralk tahmininde poplasyon parametersinin gven aralnn hesaplanmas gerekmektedir. Bir poplasyonun ortalamasnn gven aral rneklemedeki gzlem saysna (n), rnein standard sapmasna, ve gven aralnn derecesine baldr. Bir ortalamann gven aral u ekilde genel olarak ifade edilebilir:
X z x s Xz n
s: rneklemenin standard sapmas z: standard deer n: rneklemedeki gzlem says
%95 ve % 99 gven aral istatiksel tahminlerden en yaygn olarak kullanlmaktadr. n 30 iin %95 gven aral:
X 1,96
s n
X 2,58
s n
1,96 ve 2,58 deerleri gzlemlerinin srasyla %95 ve %99 una karlk gelen standard deerlerdir. Bu gven aralklarna karlk gelen deerler standart normal dalm tablolarndan hesaplanr. rnein Bu tablo yarm normal dalma gre
3 hazrlandndan 0,95/2 =0,475 . Bu deere karlk gelen standart deer normal dalm tablosundan 1,96 olarak kolaylkla okunabilir. Bir rneklemede poplasyonun ortalamann belirlenmesi iin belirlenecek gzlem says(n), seilecek gven aralna(z), izin verilebilir maksimum hata oranna(E), ve verilerin standard sapmasna(s) baldr.
z.s n= E
Eger rneklemediki veri says(n) tm poplasyonun (N) %5 inden byk ise yani n/N > 0.05 ise hem poplasyon ortalamasnn hemde orannn standard hata miktarna bir dzeltme uygulamak gerekmektedir. Bu dzeltme katsays u ekilde ifade edilir.
N n N 1
Poplasyon ortalamas iin standart hataya uygulanaak dzeltme (n/N > 0.05)
X =
s N n ( ) n N 1
X z
s N n ( ) N 1 n
rneklemedeki gzlem saysnn poplasyonun tmne oran % 5 den az ise dzeltme katsaysnn standart hataya katk pay ok kktr o nedenle nemsenmeyebilir. Aksi durumda (n/N >%5) dzeltme miktar standart hatay azaltaandan poplasyon ortalamasnn aral daralaaktr. Buda doaldr nk rnek says artka ortalamn standart hatasda doal olarak azalma gstereektir.
Hipotez Testleri
Dr. rfan Yolcubal Kocaeli niversitesi Jeoloji Mh.
Hipotez
rneklemeye dayal bir poplasyon parametesinin deeri hakknda ileri sunulan iddia
rnekler: 1.statistik Vize snvann ortalamas 50nin altndadr. 2. Televizyon izleyicilerin %70 i gnlk haber programlarn izlemektedir. 3. Firestone ve Lassa tatafndan retilen lastiklerinin mr ayndr.
Hipotez Testleri
Bir poplasyon hakknda ileri sunulan hipotezinin kabul edilip edilmeyeceini belirlemek iin rneklemeye dayal sistematik izlenen bir seri ilemler. 5 aamadan oluur. 1. Null ve alternatif hipotezin belirlenmesi Null hipotezi: Bir poplasyon parametresi hakknda ileri srlen varsaym. Genellikle bu varsaymda poplasyon parametresinin belli bir deeri olduu varsaylr. H0= null hipotezi yada sfr hipotez Alternatif hipotez: rneklemeye ait veriler null hipotezonin yanl olduuna ait deliller sunduu durumlarda kabul edilen hipotezdir HA = alternatif hipotez
Hata Tipleri
I. tip hata: Null hipotezi doru iken reddedilir. I. Tip hata yapma olasl olarak
bilinmektedir.
II. tip hata: Null hipotezi yanl iken rededilmez. II. Tip hata yapma olasl olarak bilinmektedir. Daima bu hatalardan birini yapma ihtimali vardr. Bu ihtimalleri risk derecesini belirleyerek azaltmak isteriz.
4. Null hipotezinin hangi koullarda kabul ve hangi koullarda rededileceinin belirlenmesi 5. Karar verilmesi: Null hipotezinin alnan risk derecesi dorultusunda reddi yada kabl.
1- Kabul alan
=0.05
Red Alan Kritik deer
Kritik deer
3: (Devam)
Eer alternatif hipotez ortalamann belli bir deere eit yada ondan kk olduunu ifade ediyorsa, hipotez tek ynldr. rnek: HA: 60
= 0.05 1- Kabul Alan
Kritik deer
3: (Devam)
Eer Alternatif hipotez ortalamann belli bir deere eit olmadn ifade ediyor ise bu hipotez ift ynldr. HA: 60
/2= 0.025 1- Kabul Alan
/2= 0.025
1- Kabul Alan
= 0.05 = 0.05
z = 1.645
Standart normal tablolarndan 0.45 deerine karlk Gelen z deeri bulunur. z=1.645
z = 1.645
z=
X n
Poplasyonun standart sapmas bilinmiyorsa ve n 30, rneklemenin standart sapmas (s) poplasyonun standart sapmas yerine kullanlabilir. Populasyon normal dalm sergilemekte Hipotez testinde kullancak deer:
z=
X s n
rnek 1
H0 : = 50 H1: 50
rnek ortalamas 49, rneklemedeki veri says da 36dr. Poplasyonun standart sapmas ise 5 dir. Hipotez testinde % 5 risk alrsak a) Hipotez testi tek mi yoksa ift mi ynldr b) Null hipotezi hakkndaki kararnz nedir c) Bu karar almaktda nekadar kendinize gveniyorsunuz yani p deeri nedir.
rnek 1. zm
a) Hipotez testi iki tarafl bir hipotezdir nk alternatif hipotezin yn yoktur yada belli deildir. Poplasyon ortalamas 50 den farkl olabilir ifadesi bykte olabilir ve kkte olabilir gibi 2 ihtimal iermektedir. Bu nedenle hipoteze 2 tarafl hipotez denilmektedir. b) %5 riskle taral alanlar hipotezin rededildii alanlar ifade etmektedir.
z= 49 50 = 12 . 5 36
Hesaplanan z deeri bu taral alanlar dnda kalan blgeye dtne gre Null hipotezini kabul edebiliriz
0.025 olaslk
z=-1.96
rnek 1. zm (Devam)
c) Null hipotezini kabul etmede ne kadar eminiz ? Bunu belirleye bilmek iin hesaplanan z deerinin o deerinin zerinde bulunma olasln yani p deerini hesaplamamz gerekecektir.
1.2 ve altnda bir deer olma olasl 0,1151dir (0.5-0.3849). p deerini hesaplayabilmek iin z deerinin 1.2 den az ve 1.2 den fazla olma ihtimalini hesaplamamz gerekmektedir nk hipotez iki tarafl olup iki farkl red blgesi iermektedir. Bu nedenle p deeri 2 x 0,1151di r. p deeri risk derecesinden 0.05 byk olduundan null hipotezi kabul edilir. p deeri poplasyonun ortalmasnn 50 nin zerinde veya altnda olma olaslnn %11.51 olduunu ifade eder.
Test statistii:
rededilmez
0.05 0 1.645 z
Sonu:
10
Test statistii:
Red Alan
0.025
edilmez
Sonu:
Ortalama miktarn 368 olduu hakknda yeterli bir delil yoktur
0 1.96
DEV
H0 : 10 H1: > 10
rnek ortalamas 12, rneklemedeki veri says da 36dr. Poplasyonun standart sapmas ise 3 dir. Hipotez testinde % 2 risk alrsak a) Hipotez testi tek mi yoksa ift mi ynldr b) Null hipotezi hakkndaki kararnz nedir c) Bu karar almaktda ne kadar kendinize gveniyorsunuz?
11
HPOTEZ TEST:K POPLASYONUN ORTALAMALARININ KARILATIRILMASI Ama:2 rnek ortalamasnn ayn ortalamal 2 poplasyondan gelip gelmediini test etmek
z=
X1 X2 s12 s2 2 + n1 n2
Hipotez test edilirken daha nceki ksmlarda bahsettiimiz hipotezin 5 aamasda ayn ekilde uygulanr. Sadece fark z deerinin hesaplandr.
0.01 olaslk
12
rnek: Devam
z= X1 X2 s s + 2 n1 n2
2 1 2
= 312 .
. z = 312 > 2.33 null hipotezi red edilir, alternatif hipotez %1 riskle kabul edilir.
p deeri bu byklkte yada onun zerinde bir deer bulma olasldr. 3.12 ve zerinde bir z deeri alma olasl 0.499(Tabloda 3.12 deeri olmadndan en yakn 3.09 deerine karlk gelen olaslk esas alnmtr. Buna gre 3.12 ve zeri bir deer olma olasl: 0.5-0.499=0.001 Bu deer 0.01 risk derecesinden kk olduundan null hipotezinin doru olmama ihtimali ok yksektir.
t-test istatistii
t dalmna dayal
t dalmnn ekli rneklemedeki veri saysna bal olarak deimektedir Serbestlik derecesine baldr df :n-1 rneklemedeki veri says artkca t dalm normal dalma yaklar
Poplasyonun varyans yada standart sapmas bilinmediinde ve rneklemedeki veri says kk olduunda (n<30) rneklerin ortalamalar hakkndaki hipotezleri test etmek iin kullanlr
13
t dalmlar
Standart normal (z) t (n = 13) t (n = 5)
Ortalamadan olan Standart sapma
t-testleri
Varyans hakknda kesin bir bilgiye sahip olmadmz iin (sadece tahmin), t dalmn kullanrz
t-testinin ortalamas
t=
X s n
14
= 0.05
15
3: Tek veya ift ynl bir hipotez mi? 4: Kritik deerleri belirle
Tek ynl Kritik deerleri t tablosundan belirlenir
1- Kabul Alan =0 .05
16
17
Test statistii:
Red alan
0.025
Sonu:
-2.0301 0 2.0301
18
Test statistii:
t=
Karar:
Sonu:
368 den fazla semenin ortalama oy sandklarnda oy kullandna ait delil vardr
t testi
Poplasyon ortalamasnn testi:bir nceki slaytlarda bahsettik 2 birbirinden bamsz poplasyonun ortalamalarnn karlatrlmas
artlar: poplasyonlar normal yada normale yakn bir dalm serilemeli Poplasyonlar birbirinden bamsz olmal, ve populasyonlarn standart sapmalari benzer olmal
19
t=
X1 X 2 1 1 s2 + p n1 n2
df = serbeslik derecesi = n1 + n2 2
sd =
d = bir cift gozlemler arasindaki farkin ortalamasi n:cift gozlem sayisi sd = bir cift gozlemlerin degerleri arasimdaki farkin standart sapmasi
20
VER TRLER
Veri
Kantitatif
Kualitatif
Sreksiz S k i
Srekli S kli
Kualitatif Veri
1. Kualitatif random deikenler snflanabilen yantlar vermektedir.
Oran 2 pop.
Bamsz
Z Testi
Z Testi
2 Testi
2 Testi
Oran 2 pop.
Bamsz
Z Testi
Z Testi
2 Testi
2 Testi
Multinomial Deney
Beklenen say 5
Multinomial Deneyler
1. 2. 2 3. 4. 5. 6. 6 n sayda benzer deneme Her bir denemede k sayda sonu H bi d d d Sabit sonu oranlar, pk Bamsz denemeler Random deiken saydr, nk rnek; 100 (n) kiiye 3(k) adaydan hangisine oy vereceklerini sormak
Sonular (k = 3)
Aycan 45
Toplam 100
H0: p1 = p1,0, p2 = p2,0, ..., pk = pk,0 Ha: pi lar birbirine eit deildir.
H0: p1 = p1,0, p2 = p2,0, ..., pk = pk,0 Ha: pi lar birbirine eit deildiler
2. Test istatistii
Gzlemlenen say
ni E ni E ni
af af
Beklenen say
H0: p1 = p1,0, p2 = p2,0, ..., pk = pk,0 Ha: pi lar birbirine eit deildiler
2. Test istatistii
Gzlemlenen say
ni E ni E ni
af af
Beklenen say
0
2 Tablo
2
st Kuyruk Alan 0.95 0.05 0.004 3.841 0 103 5 991 0.103 5.991
df 1 2
Red R d
= 0 05 0.05
0
2 Tablo
2
st kuyruk alan 0.95 0.05 0.004 3.841 0 103 5 991 0.103 5.991
df 1 2
Red R d
= 0 05 0.05
0
0.995 ... 0.010 0 010
5.991 5 991
df 1 2
st kuyruk alan 0.95 0.05 0.004 3.841 0 103 5 991 0.103 5.991
nsan kaynaklar mdr olarak 3 olarak, farkl performans deerlendirme metodunun drstlk anlayn test etmek istemetedir. 180 tane alan arasndan 63 arasndan, 1. Methodu drst olarak; 45 i 2. Methodu drst olarak; 72 si ise 3. Methodu drst olarak deerlendirmitir. 0.05 risk derecesinde, alanlarn metodlarn drstlk derecesini alglamada bir farkllk varmdr?
Karar: Sonu:
Karar: Sonu:
af E af E a f E a f 180a3f 60 n n n 1 n E af n E af n
1 2 2 2 i i i
E ni npi ,0
60 2 n2 60 2 n3 60 2 n1 60 60 60 2 2 2 63 60 45 60 72 60 6.3 60 60 60
Karar:
2 Testi, bamsz
2 Testi, bamsz
1. kualitatif deiken arasnda bir ki p gsterir ilikinin mevcut olup olmadn g
Bir rnek seilir Sebeb sonu ilikisi gstermez Multinomial deney tm saylar 5
2. Varsaymlar
2 Test
Bir rnekten mterek iki kualitatif deikene ait gzlem saysn gsterir
2. deiken derecesi
1. deiken derecesi
2. Test statistii
ij
E nij E n
ij
Gzlenen say
Beklenen sayhesaplamas h l
Beklenen say = Satr toplam * Stn toplam Veri says y
Toplam
2 Testi, bamsz zm
H0: iliki yok Ha: ilikili = 0.05 df = (2 - 1)(2 - 1) = 1 Kritik deer(ler):
Red = .05
3.841
2 Testi, bamsz zm
Diet P Di t Pepsi i 154132 286 Hayr Evet Gzl. Bekl. Gzl. Bekl. Toplam G l B kl G l B kl T l 84 48 132
170132 286
32 122 154
170154 286
2 Testi, bamsz zm
2
n11
ch n Ec h n n n Ea f n Ea f n Ea f n n n Ea f Ea f Ea f
ij 2 2 2 11 12 12 22 22 11 12 22 2
nij E nij
84 53.5 53.5
32 62.5 62.5
54.29
2 Testi, bamsz zm
H0: iliki yok Ha: iliki var = 0.05 df = (2 - 1)(2 - 1) = 1 Kritik deer(ler):
Red = .05 0 3.841
Test istatistii: 2 = 54.29 54 29 Karar: Null hipotezi reddedilir =0 .05 Sonu: Bir iliki olduuna
Korelasyon Analizi
ki deiken arasndaki ilikinin yada korelasyonunun derecesini belirlemek iin kullanlan istatistiksel yntem. Baml Deiken: Tahmin edilen yada hesaplanan deiken Bamsz Deiken: Tahmin iin kullanlan deiken Dalm grafikleri: 2 deiken arasndaki ilikiyi gsteren grafikler
Dalm Grafikleri
Satlan rn a deti 80 60 40 20 0 0 10 20 Arama says
Genellikle, baml deiken: y ekseninde , bamsz deikende x ekseninde yeralr.
30
40
X
r= -1
r =1
Y llk g e lir
5 4 3 2 1 0 0 1 2
Cocuk3 says 4
15 not 10 5 0
10
r=
[n( X
) ( X ) ][(n( Y
) ( Y ) ]
2
n : gozlem sayisi
Ali Veli Aye Gl Hsn Necati Zehra Fatma Zeynep Ahmet TOPLAM
196 1225 484 841 36 225 289 400 144 841 4681
392 2310 836 2030 132 405 476 940 168 1972 9661
784 4356 1444 4900 484 729 784 2209 196 4624 20510
r=
10(9661) (199)(408)
= 0,924
0 .924 10 2 1 ( 0 .924 ) 2
= 6 .835
0.95 olaslk 0
df = n 2 = 10 2 = 8
2.306
Regresyon Analizi
ki deiken arasndaki korelasyonun matematiksel ifadesini tespit etmek iin yaplan analiz. Bu matematiksel ifadeye de regresyon denklemi diyoruz. Regresyon denklemi genel ifadesi: Y` = a + bX X: seilen bamsz deikenin deeri Y`: seilmi X deerine iin tahmin edilen Y deeri a: dogrunun Y ekseni kestii noktann deeri b: dorunun eimi a ve b: regresyon katsaylar Y
a X
Regresyon Analizi
Regresyon denklemini tespit etmek iin minimum kare (least square principle) prensibini kullanyoruz. Minumum Kare Prensibi: Gerek Y deerleri ile tahmin edilen Y deerleri arasndaki dey uzaklklarn karelerinin toplamn minumuma ekerek regresyon denklemini belirleme ilemi.
(Y Y `)
= minimum
*
Y * * X
Gerek deer
Y b X
n n n( XY ) ( X )( Y ) n X 2 ( X )
b=
Ali Veli Aye Gl Hsn Necati Zehra Fatma Zeynep Ahmet TOPLAM
196 1225 484 841 36 225 289 400 144 841 4681
392 2310 836 2030 132 405 476 940 168 1972 9661
784 4356 1444 4900 484 729 784 2209 196 4624 20510
( X
b
a=
Y
n
X
n
Y ` = 1, 7601 + 2 ,1387
(Y Y `)
= minimum
(Y Y `)
S y.x= 0 ise tm noktalar regresyon dorusu zerine dmektedir. Gzlem saysnn byk olduu durumlarda regresyon katsaylarnn Tahmininde kullanlan daha pratik bir forml
S y.x =
a ( Y ) B ( XY ) n2
Ali Veli Aye Gl Hsn Necati Zehra Fatma Zeynep Ahmet TOPLAM
14 35 22 29 6 15 17 20 12 29 199
28,1817 73,0944 45,2913 60,2622 11,0721 30,3204 34,5978 41,0139 23,9043 60,2622
-0,1817 -7,0944 -7,2913 9,7378 10,9279 -3,3204 -6.5978 -5,9861 -9,99043 7,7378 0
2
0,033 50,3305 53,1631 94,8247 119,4190 11,0251 43,5310 35,8334 98,0952 59,8735 566,1285
Y ` = 1,7601 + 2,1387
S y. x =
(Y Y `)
n2
566,1287 = 8.412 10 2
1 + Y `t ( s y . x ) n
(X X )
X
2
2 2
( X)
n
X: seilmi X deeri t: df=n-2 zgrlk derecisi iin belli bir risk derecesine gre t dalm tablolarndan belirlenen t deeri
10
RNEK: GVEN ARALIININ HESAPLANMASI rnek: 25 kez telefonla arama yapan sat uzmanlarnn satt rn saysnn gven araln hesaplayalm.Gven araln: %95 sein
Sat eleman Telofonla yaplan arama says(X) 14 35 22 29 6 15 17 20 12 29 199 Sat yaplan rn adeti (Y) 28 66 38 70 22 27 28 47 14 68 408 X2 XY Y2
Ali Veli Aye Gl Hsn Necati Zehra Fatma Zeynep Ahmet TOPLAM
196 1225 484 841 36 225 289 400 144 841 4681
392 2310 836 2030 132 405 476 940 168 1972 9661
784 4356 1444 4900 484 729 784 2209 196 4624 20510
(X X )
X
2
2 2
( X)
n
= 51,7074 2,306(8,412)
1 + 10
(25 19,9)2
4681 (199) 2 10
51,7074 7,1558
11
1 Y `t ( s y . x ) 1 + + n
(X X )
X
2
2 2
( X)
n
rnek: 25 kez arama yapan Zekinin %95 gven aralkla sat yapaca rn adetinin tahmini aralnn belirlenmesi
12