You are on page 1of 249

Olaslk ve statistik Ders Notlar 1

om

Konrad Menzel
3 ubat 2009

.c

1. Giri ve Genel Bak

tla

ri

Bu ders size Olaslk Teorisine girii ve statistiin temel aralarn verecektir. Olaslk,
ilgili belirleyicilerini tam olarak bilmediimiz durumlar aklayan ve analiz eden bir
matematiksel yapdr. Modern hayatta, hepimiz, tptan sosyolojiye kadar btn alanlarda
yaplan istatistiksel almalarn dzenli mterileriyiz ve olaslk muhakemesi ekonomi
ve finans alannda son dnemde yaplan bir ok tartmann takip edilmesinde olduka
nemlidir.

de
rs
no

Bu dersin ilk yarsnda, olaylarda bulunan gerek riski - veya kiisel bilgi yetersizliimiziaklamann bir yolu olarak olaslk zerinde konuacaz.

rnek 1. Kredibilitesi dk mterilere verilen kredi de (Subprime lending), bankalar


normal mterilerine gre geri deme olaslklar daha dk olan mterilere yeni nesil
ev kredisi ( mortgage) verirlerdi. Teminat olarak gsterebilecekleri fazla eyleri olmayan
olas ev sahiplerine bor verme riskini idare etmek iin, bu ekilde verilen binlerce kredi
bir demet haline getirilip mortgage destekli deerli kat olarak yeniden satlrd, yani
krediyi ilk veren bankaya ne kadar geri deme yaplrsa yaplsn, banka deerli kad
elinde tutanlara sz verdii miktar demeyi taahht ederdi. Sonunda, deerli ktlar
havuzunun bir ka eit tahvile dnt ok karmak finansal dzenlemeler ortaya
kt. Burada ilk tahvili elinde tutanlara demede ncelik verilirdi. Yani, diyelim ki, tahvilin
nominal deeri 10 milyon dolardr, geri demeler toplam ne zaman 10 milyon dolar
aarsa nce bu gruba deme yaplyordu. Bu durumda, ne zaman ncelii olanlardan
para artarsa ancak o zaman nominal deeri dk gruba demeler yaplabiliyordu.

ee

Nasl olur da, belirtilen herhangi bir yeni nesil ev kredisi gvenli deilken, bir ok risk
barndran bir havuzdan oluan ilk grup gvende olabiliyordu? Daha dk ncelii
olanlar daha riskli oluyorlard. Niye? Geriye doru bakldnda, niye piyasann
beklediinin aksine daha gvenli olan deerli katlar piyasadaki herkesin beklediinden
daha riskli oldular? Byk Saylar Kanunu hakknda konuurken, ve hangi koullarda
alp hangi koularda almadn belirtikten sonra, bu konuya geri dneceiz.

om

Genellikle, bu tr sorular cevaplandrmak iin, sonularn dalm (nispi


olabilirlik gibi) hakknda ok ey bilmeniz gerekir, fakat baz durumlarda daha az ile de
idare edersiniz: Baz durumlarda bir sonucun sadece beklenen deeri veya bir dalmn
dier momentleri gibi tipik deerleri ile ilgilenirsiniz. Dier durumlarda sadece rasgele
bir deneyin ok saydaki tekrarnn ortalamas ile ilgileniyor olabilirsiniz ve byle
durumlarda her bir deneyin farkl sonularnn olabilirlii konusunda ok ey bilmeden
byk rakamlar kanunu veya merkezi limit teoremi bazen size iyi bir tahmin verebilir.

tla

ri

.c

Dersin ikinci yars, veriden kitle ve olaslk dalmlar hakknda nasl bilgi
edinilecei sorusuyla ilgili olacaktr. Herhangi bir ampirik bilimde, tmevarm problemi ile
karlaabilirsiniz. Tmevarm birka (belki biraz daha ok) gzlemden genel sonular
karmaktr. Politik yoklamalarda (sonraki bakanlk seiminde kimin iin oy
kullanacaksnz?), bir anket firmas tipik olarak yzbinlerce potansiyel semen
arasndan en fazla birka bin kiiye anket uygular. Tbbi deneylerde, bir ilacn etkinlii
konusunda birka dzine katlmcdan elde edilen sonulardan btn kitle iin
genellemeler elde etmeye alrz.

de
rs
no

Eer ilgilendiimiz bir kitlenin (rnein bir genel seimde oy kullanabilecek btn
semenler gibi) yalnzca bir alt-grubundaki kiileri (rnein semenlerin rasgele bir
rneklemi gibi) gzlemlersek, cevaplandrmak istediimiz soru asndan (rnein belli
bir adayn oy oran gibi) bu rneklemin gerekten btn kitleyi temsil edip etmedii
konusunda bir eit belirsizlik olacaktr. Bu belirsizlii formle edip kullanmn pratik
hale getirmek olaslk teorisinin youn kullanmn gerektirir.

ee

rnek 2. Mart 2003 ylndaki igalden buuk yl sonra, Irak savanda len siviller
zerinde yaplan tartmal ilk Lancet almasnda lke genelinde1849 hane halkndan
oluan (toplam olarak 12801 kii) bir rasgele rnekleme anket uygulanmtr ve hane
halklar tarafndan beyan edilen lm saylar, 29 Milyonluk, tm lkedeki l saysnn
tahmini iin kullanlmtr. almann yazarlar, igalden sonraki ilk 18 ay iin 112 000
"fazla" lm tahminine ulatlar ve "%95'lik gvenirlikle" gerek rakamn 69000 ile
155000 arasnda olduunu ifade ettiler. Bu ifadenin ne anlama geldiini daha sonra
derste greceiz. Tahminin etrafndaki gven aralnn genilii, ufak bir alt-kitleden
btn lke iin hesaplamalar yapmann kendi iindeki var olan belirsizliinin lsdr.
Bu politik ve duygusal etkileri olan bir konu olduu iin, alma bilimsel yaynlarda ve
bloglarda youn bir tartma balatmtr- tartmalar okumak uygulamada istatistiin
gerekten nasl yapld konusunda size ok ey retecektir.

2. Kme Teorisi ve Olaylar


2.1 Rasgele Deneyler

Tanm 1. Bir rasgele deney en azndan teorik olarak- (a) sk sk ve ayn koullarda
keyfi olarak tekrarlanabilir (b) ok iyi tanmlanm olas sonular kmesine sahiptir.

ri

.c

om

Bunun standart rnei yaz (T) ve tura (H) gibi iki sonucu olabilen madeni para
atmadr (parann dik bir ekilde durma olasln grmezlikten geliyoruz). statistik
alannn bir dier nemli deney tr bir seim srasnda yaplan yoklamadr. Diyelim ki
oylama yaplan yerden kanlar arasndan rasgele olarak seilen 2000 kiiye kime oy
verdiklerini sorduk. Kural olarak, seim gn oy kullanacak kitleden keyfi olarak ok
sayda 2000 kiilik rneklem seebiliriz. Dolaysyla koul (a)y gerekletirmi oluruz.
Bu deneyin sonu kmesi, seimde hangi aday iin oy kullandn beyan eden semen
saysdr.

Tanm 2. Bir rneklem uzay olan S, bir deneyin btn olas sonularnn toplamdr.

de
rs
no

tla

Birok amatan tr, esas itibariyle olaylarn tek sonucuyla deil, olaylarn
btn sonular grubu ile ilgileniyoruz. Bu nedenle, izleyen blmde deneyi kmeler
cinsinden tanmlayacaz.

Tanm 3. A olay herhangi bir sonular toplam olabilir (bu, tekli sonucu, bo kmeyi
veya rnek uzayn tmn ierir).
Eer gerekleen sonu A olaynn bir eleman ise, o zaman Ann gerekletiini
syleyebiliriz.
Bir rnek olarak, imdi geen seneki bakanlk yarn ele alalm. En basit
ekliyle, rnek uzayn (S) mantksal bir olabilirlii dndmzde- Kasm aynda
bakan olarak seilebilecek kiiler olarak tanmlayabilirdik (rnein, ilk deneme olarak
n seimlerin balca adaylarna bakabilirdik).
S = {Clinton, Huckabee, McCain, Obama, Paul, Romney, Schwarzenegger }

ee

Bu iyi bir tanmlama m? Muhtemelen deil: Her ne kadar bunlar gereklemesi


en olas sonular olsa da, mantken baka adaylarn (bamsz olarak veya bir partiye
bal olarak) sonradan yara katlmasn grmezlikten gelmeyiz. Dolaysyla daha
hatasz, rasgele deneyin tanm rneklem uzayn bytecektir.
= {Clinton, Huckabee, McCain, Obama, Paul, Romney, Schwarzenegger, Dier
Demokrat Aday, Dier Cumhuriyeti Aday, Dier Bamsz Aday }

Ancak olay basit tutmak iin, imdilik bu olasl grmezlikten gelelim.

lgilenilen baz olaylar unlar olabilir:

om

44nc Amerikan Bakan bir cumhuriyeti olacaktr = {Huckabee, McCain, Paul,


Schwarzenegger, Dier Cumhuriyeti Aday}
44nc bakan 42nci bakan ile evli olacaktr = {Clinton}

2.2 Kme ve Olaylar Hakknda Daha Fazla Bilgi

.c

2.2.1 Kme Kapsam

ri

Eer Bnin btn sonular Aya ait ise, olay B Ann iindedir. Sembolik olarak,

tla

Kesinlikle, herhangi bir C olay rneklem uzay Sde yer alr, yani
Herhangi bir C olay iin

de
rs
no

ve her olay imkansz olay ierir.

Herhangi bir C olay iin

Kaynak: MIT OpenCourseWare

B Ay gerektirir

ekil 1.

ee

Eer A ve B bir birini ierirse, eittirler.

Ve kme kapsam geilidir, yani

Bakanlk seimi rneimizde (eer Wikipediaya gvenebilirsek, McCain Panama


Kanal kuanda bulunan bir Amerikan hava ssnde domu)

44nc bakan Panamada dodu = {McCain}


dodu = {McCain, Schwarzenegger}

44nc bakan yabanc bir lkede

{McCain, Schwarzenegger}

44nc bakan cumhuriyetidir.

Sonu olarak, aadaki karm yapabiliriz:

44nc bakan cumhuriyetidir

.c

44nc bakan Panamada dodu

om

ve

ri

2.2.2 Kme Birleimleri

Kaynak: MIT OpenCourseWare

ekil 2. A ve Bnin Birleimi A veya B

ee

de
rs
no

Kme birleimi simetriktir.

tla

A ve Bnin birleimi, A veya Bnin (veya her ikisinin, U mantksal veya sembol olan
Vnin karldr) elemanlarnn btn sonularnn toplamdr

A B=B A

Buna ilaveten,
Herhangi A, B

S olaylar iin

om

zellikle,

.c

Ayrca kme/olay birleimini hangi srada yaptmzn da bir nemi yoktur (birleim
zellii).

ri

2.2.3. Kmelerin Kesiimi

tla

A ve Bnin kesiimi (bo olabilir) A ve Bnin ikisinde birden olan sonular toplamdr.
Aadaki gibi yazlr,

de
rs
no

Burada mantksal veyi ifade eder. Baz metinlerde alternatif iaretleme kullanlr,

Kaynak: MIT OpenCourseWare

ekil 3. A ve Bnin Kesiimi A ve B

ee

Kmelerin birleimi gibi kesiimi de simetriktir.

Keza,
Herhangi A, B

S olaylar iin

om

Buradan hareketle,

.c

Ayrca, kme birleiminde olduu gibi, kmelerin kesiimi birleme zeliine sahiptir.

ri

laveten, kme kesiimi ve birleimi dalma zeliine sahiptir.

de
rs
no

rnek olarak, aadaki olaylar iin

tla

ve

A = Bakan 44 bir kadndr = {Clinton}

B = Bakan 44 Midwestte dodu = {Clinton, Romney}


C = Bakan 44 bir Cumhuriyetidir = {Huckabee, McCain, Paul, Romney,
Schwarzenegger}

birinci dalm zeliine gre olmas gerektii gibi, unlar grebiliriz:


= {Clinton} {Clinton, Huckabee, McCain, Paul, Romney, Schwarzenegger}
= {Clinton}

= {Clinton}

ee

= {Clinton}

2.2.4. Kme Tmleyeni, AC

Ann tmleyeni AC, Sdeki Aya ait olmayan sonular kmesidir. Yani,
AC =

om
.c
ri

Kaynak: MIT OpenCourseWare

tla

ekil 4. Ann Tmleyeni A deil

de
rs
no

Tanmdan, tmleyenlerin aadaki zeliklere sahip olduunu kolayca grebilirsiniz.

En son ifadeden, aadakine ulaabiliriz

lk zelikle beraber aadakine ulalr

ee

Kesiim ve birleim arasndaki bir grup yararl iliki aadaki gibidir.

om
.c
ri

nin gsterimi- Ayn ekilden


grebilirsiniz

de
rs
no

ekil 5.

tla

Kaynak: MIT OpenCourseWare

kuraln da

2.2.5 Olaylarn Blntlenmesi

A ve Bnin ortak sonular yoksa ayrktrlar (ya da karlkl dlayandr). Yani

A1, A2 . olaylar grubunun birleimleri Sye eitse, eksiksiz olduu sylenir.

ee

A1, A2, olay grubu, eer aadaki iki koulu salyorsa rneklem uzaynn blnts
olarak adlandrlr. Koullar: (1) Ai, Aj (i j) herhangi iki farkl olay olsun. Ai ve Aj ayrk
ve (2) A1, A2, grubu eksiksiz ise. Ayn ekilde, B olaynn blntlerini,
birleimi Bye eit olan karlkl dlayan alt-olaylar olarak tanmlayabiliriz.

om
.c

Kaynak: MIT OpenCourseWare

ee

de
rs
no

tla

ri

ekil 6. Snin A1, A2, ASye blntlenmesi

Olaslk ve statistik Ders Notlar 2

om

Konrad Menzel
5 ubat 2009

1. Olaylarn Olasl

Biimsel olarak, P olasl S1deki


giden bir fonksiyon olarak tanmlanr.

= {A1, A2, } olaylar ynndan reel saylara

de
rs
no

tla

ri

.c

imdiye kadar, olaylarn sadece tanmlarna ve zeliklerine baktk baz


olaylarn gerekleme olasl ok dkken (rnein Schwarzeneggerin 44nc
bakan olarak seilmesi gibi) bazlarnn gereklemesi nispeten kesindir- ancak
olaylarn olaslklar, yani olaylarn rneklem uzaynn kalanna gre gerekleme
ihtimali, hakknda hibir ey sylemedik.

Kullanl bir olaslk tanm yapabilmek iin, her hangi bir olaslk fonksiyonu Pnin
aadaki aksiyomlar salamasn bekleriz:
(P1) Herhangi bir A

iin P(A)

(P2) P(S) = 1, - yani kesinlikle bir ey olacak

(P3) Ayrk A1, A2, , kmelerinin herhangi bir dizisi iin

ee

Matematiksel bir not olarak, bu aksiyomlarn (ve sonraki derste P(A)nn zelliklerinin
tretimlerinin) bir anlam ifade edebilmesi iin
yn Syi ve onun elemanlarnn
tmleyenleri ile birleimlerini iermek zorundadr. Bu, bir nceki sayfada dipnotta
1

Olasln tutarl bir tanm iin, olaylar grubu aadaki zelikler sahip olmak zorundadr
(S1) S
C
(S2) Eer A
ise, o zaman onun tmleyeni A
(S3) Herhangi saylabilir A1, A2. olaylarn birleimi dir, yani A1 A2
Bu olaylar ynna Snin sigma-cebiri olarak adlandrlr. Bu dersin amac iin, bu nemli deildir, ve
eldeki sorunun bu tr aksiyomlara uygunu olduu gereini veri olarak kabul edeceiz.

akladmz sigma-cebirdir. Bu ders iin, bu zellikleri daha fazla zerinde tartmadan


verilmi kabul edeceiz.

om

Tanm 1. Bir rneklem uzay S zerinden tanmlanan bir olaslk dalm (P1) (P3)
aksiyomlarn salayan P(A) ile gsterilen bir saylar yndr.

tla

ri

.c

P(1)-P(3) aksiyomlarnn olaylara bir tek olaslk atamadna dikkat ediniz. Onun
yerine, bu aksiyomlar sadece olasln ne olmas gerektii konusunda sezgilerle tutarl
bir ekilde herhangi bir olaslk dalmnn salamas gereken minimum koullar
verirler(gerekte bunu aada kontrol edeceiz). Prensipte, bu zelikleri salayan
herhangi bir P(.) fonksiyonu geerli bir olaslk oluturur, fakat bunun eldeki rasgele
deneyin iyi bir aklamas olup olmadn anlamak iin zelikleri ayr ayr grmek
zorundayz. Bu her zaman zor bir sorudur. Bu dersin 5. blmnde (zel Dalmlar),
belli standart durumlar iin baz popler P(.) seimlerini tartacaz.

2.Olasln Baz zelikleri

de
rs
no

imdi, P(1)-P(3) aksiyomlarnn gerekten de olaslk fonksiyonumuzun sezgisel


olarak beklediimiz zeliklere sahip olmasn saladndan emin olmak iin yeterli
olduu konusunda kendimizi ikna etmemiz gerekiyor. Sezgisel olarak fonksiyonun u
zeliklere sahip olmasn bekleriz: (1) Bir olayn olma olasl ile olmama olaslnn
toplam bir olmal, (2) imknsz olayn, , gerekleme olasl sfr olmal, (3) Eer A
olay B olayn ieriyorsa, B olaynn olasl P(A)dan byk olamamal, ve (4) herhangi
bir olayn olasl [0,1] aralnda yer almal. imdi, temel aksiyomlar kullanarak bu
zelikleri ispatlayalm.
nerme 1.

P(AC) = 1 P(A)

ISPAT: Tmleyen AC tanmna gre,

ee

burada son admda A AC =


yeniden dzenlediimizde,

kullanlmaktadr, yani A ve onun tmleyeni ayrktr. Bunu


P(AC) = 1- P(A)

elde ederiz. Zaten gstermeye altmz da budur.

nerme 2
P( ) = 0
C

= S olduu iin, nceki nermeyi kullanarak

om

ISPAT:

nerme 3. Eer B

A ise, o zaman P(B)

P(A)dr.

.c

olduunu gsterebiliriz.

ri

Dipnot olarak, bu kural sezgisel grnmesine ramen, bilisel psikologlar


insanlarn gnlk olaslk muhakemesi iinde bu kural sk sk bozduklarn kefettiler2.

tla

SPAT: Olaslk aksiyomlarn kullanabilmek iin, A olayn birleim ve kesiim

zelliklerini kullanarak blntlere ayrmak yararl olacaktr.

A ise
kullanlmtr. (P3) aksiyomunu
nin ayrk olduuna dikkat etmek gerekir.

de
rs
no

Burada, son admda B


kullanabilmek iin B ile

Dolaysyla, aksiyom P(1)i kullanarak


sonucuna ularz.

nerme 4: Herhangi, bir A olay iin 0

P(A) aksiyom (P1)dir. kinci eitlik iin, (P1) ayn zamanda P(

0i

SPAT: 0
salar.

P(A)

ee

Dolaysyla nerme 1e gre

rnein, Daniel Kahneman ve Amos Tversky tarafndan yaplan bir almada birka kii Lindann
tarifini aadaki gibi veriyorlard:
Linda 31 yandadr, bekardr, gevezedir, ve ok zekidir. Felsefe eitimi ald. renci iken, ayrmclk ve
sosyal adalet konularyla ok derinden ilgilenirdi ve ayn zamanda nkleer kart gsterilere de katlrd.
Lindann bir gie memuru olma olasl sorulan kiiler, onun feminist bir gie memuru olma olasl
sorulan kiilere gre daha dk deerler verme eilimindeydiler.

P(A) = 1- P(

om

nerme 5

.c

SPAT: nerme 3te olduu gibi Olay A ve Byi blmlere ayrabiliriz.

ri

Ayn ekilde,

tla

Bunlarn blnt olduu kolayca kontrol edilebilir. Yani kmelerin her bir ifti ayrktr.
Dolaysyla aksiyom (P3) kullanlarak grlecei gibi
(

de
rs
no

ve

Dolaysyla,
,
ile
nin blnts olduu iin (P3)
kullanlarak (ekil 1 sz konusu fikrin grafiksel gsterimini vermektedir)
[

ee

Son denklemin yeniden dzenlenmesi istenen sonucu verir.

om
.c

nin ayrk olaylara blntlenmesi

tla

ekil 1.

ri

Kaynak: MIT OpenCourseWare

3 rnek: Basit Olaslk

de
rs
no

Sonularn olay gereklemeden nce simetrik olduu, yani bir olayn olma
olaslnn dierinden fazla olmas iin bir sebebin olmad sonlu bir rneklem
uzaymzn olduunu varsayalm. Eer n(C) bir C olayndaki sonularn saysn ifade
ederse, olaslk
P(A) :=

olarak tanmlanr. Yani, olaslk, A olaynda yer alan Sdeki btn olas sonularn
oranna eittir. Bu dalm, basit olaslk dalm veya mantksal dalm olarak
adlandrlr. Para veya zar gibi her bir sonucun olasl eit olan aralar iin adil
olduklar sylenir. imdi aksiyomun da salanp salanmadna bakalm.

(P1): P(A) 0 n(.)nin sadece (zayf ihtimalle de olsa) pozitif deerler almasnn
dorudan sonucudur
=1

ee

(P2): P(S) =

(P3) Ayrk iki A ve B olay iin

kiden fazla kme iin, argmanlar esas itibariyle zdetir.

Olay A = {5, 6} olduu iin, n(A) = n({5,6}) = 2. Buradan P(A) =

om

rnek 1. Kusursuz bir zarn bir kere atldn varsayalm. Bu durumda rneklem uzay
S = {1,2,,6}a eittir, dolaysyla n(S) = 6. Gelen saynn kesinlikle 4ten byk olma
olasl nedir?

.c

Eer bir zar iki kere atlrsa, iki rakamn toplamnn 4 veya daha dk olma olasl
nedir?
Bu durumda: S = {(1, 1),(1, 2), , (2, 1),(2, 2), , (6, 6)} olduu iin n(S) = 62 = 36.

tla

Dolaysyla P(B) =

4 = {(1, 1),(1, 2),(1, 3),(2, 1), (2, 2),(3, 1)}

ri

Olay B = Rakamlarn toplam

de
rs
no

Biraz sonra, belli olaylar sonucunda oluan sonular saymak iin daha sofistike
teknikleri greceiz.

4 Sayma Kurallar

imdiye kadar baktmz rnekler, srasyla, A ve S deki sonular saymann


kolay olduu nispeten basit rneklerdi. Eer S birok elemana sahipse ve A yeterince
karmak olursa, o zaman n(A) ve n(S)yi elde etmek iin btn sonular listesine
bakmak hem skc olur hem de pratik olmaz. Bu derste, kombinasyonlarn ve
permtasyonlarn farkl olaylar sonucunda ortaya kan saylabilir objeler (sonular) iin
basit kurallar veren kombinatorik lere bakyoruz.

ee

rnek 2. nl satran oyuncusu Bobby Fischer (3 hafta nce ld) sonunda klasik
satranc oynamaktan sklr ve sadece 8+8 piyonun allageldii gibi yerletirildii
ancak, ilk srada, dier talarn (1 ah, 1 vezir, 2 fil, 2 at ve 2 kale) her bir beyazn ayn
cins siyaha karlk gelecei ekilde rasgele yerletirildii bir varyant nerir. Dier
kstlamalar ise (1) bir fil siyah karede iken dieri beyaz karede olmak zorunda, (2) ah
ilk seferde iki kale arasndan hareket etmek zorundadr (rok yapmaya izin vermek iin).
Bunun arkasndaki dnce, satran oyuncularnn sadece standart balama
pozisyonu ile iyi ileyen standart oyun amay kullanma eilimde olduklar iin, yeni
varyant, oyunun ezberlenmeyi imknszlatracak kadar yeterli sayda oluturulmas

durumunda, oyuncular yaratc bir ekilde oynamaya zorlamaktr. Fakat ka tane farkl
muhtemel balama pozisyonu vardr?

om

Biz aslnda bu gn derste bu snfta tantlan baz sayma tekniklerini kullanarak


bu hesaplamalar yapacaz. Eer skldysanz, soruna saldrmann (tercihen zarif
ekilde) bir yolunu bulmaya balayabilirsiniz. .

ri

4.1 Oluturulmu Deneyler

.c

imdilik, dorudan rasgele deneyler veya olaslklar hakknda konumayacaz


fakat konu dna karak daha sonra derste kullanacamz sonular hesaplama ve
sayma yntemlerini ele alacaz.

tla

Kural 1 (arpm Kural): Eer bir deney birincisi m olas sonuca ve ikincisi birincisinin
sonucu ne olursa olsun n olas sonuca sahip 2 blmden oluuyorsa, o zaman deney
mxn sonuca sahiptir.

de
rs
no

rnek 3. Eer bir ifrenin 8 karakterli (harf ve rakam) olmas gerekiyorsa, o zaman sz
konusu deney her birisi 2x26 + 10 = 62 sonucu olan 8 paraya sahiptir (ifrenin byk
ve kk harfe duyarl olduu varsaymna gre). O halde, toplam olarak 628 (kabaca
218 trilyon) kadar farkl ifre elde ederiz. Aka sylemek gerekirse, onlarn tmn el
ile saymaya almak iyi bir fikir olmazd.
rnek 4. Bilgisayar sistemlerinin ounda kullanlan standart ASCII karakter seti 127
karakter ierir (boluk hari). Hafza iin her karaktere 1 byte = 8 bit isnat edilir.
Gemiten gelen sebeplerden tr, aktarma veya koddaki kopyalama hatalarn tespit
etmek iin 8nci bit tutarllk kontrolnde parite olarak kullanlrd. Bundan tr, her
birisi {0,1}den oluan sonuca sahip 7 paral bir deneyimiz ve bu nedenle de toplam 2 7
= 128 sayda farkl karakterimiz var.

ee

rnek 5. Bir kart destesinde 52 kart vardr, dolaysyla eer mavi ve krmz destelerden
birer kart ekersek 52x52=2704 olas kart kombinasyonu elde ederiz (eer ekiliten
sonra hangi desteden hangi kartn geldiini bilemezsek, o zaman daha az sayda ayrt
edilebilir sonular elde ederiz). Dier taraftan, eer ayn desteden geri koymadan iki kart
ekersek, hangi kart nce ektiimizden bamsz olarak, ikinci kart ekmek iin
destede sadece 51 kart kalm olur. Elbette hangi 51 kartn kald hangi ilk kartn
ekildiine bal olacaktr, ancak bunun arpm kural iin nemli olmadna dikkat
edilmelidir. Bu nedenle, eer ayn desteden iki kart ekersek, 52*51 = 2652 olas
kombinasyonumuz olacaktr.

Son rnek genel ekilde aklamaya altmz iki tr deneyi gstermektedir: her biri
farkl sayma kuralarna sahip geri koymal rneklem ile geri koymasz rneklem.
N byklndeki bir gruptan geri koyma ile n tanesi ekilmitir.

om

N.N.N = Nn
n tane

mmkn sonu.

tla

mmkn sonu

n)

.c

N byklndeki bir gruptan geri koymadan n tanesi ekilmitir (N

ri

k! := 1.2(k-1)k (k faktryel olarak okunur) ve 0! = 1 olarak tanmlanr.

de
rs
no

Gerekte, bu iki sayma kural arpm kuralndan elde edilir, fakat bunlar istatistikte ok
nemli olduklar iin onlar ayr deerlendirdik.

4.2 Permtasyonlar

rnek 6. Kartrlm bir deste, sralanm bir destenin permtasyonudur: Her ne


kadar sralama ou durumda farkl olsa da, her bir kart tam olarak bir kere destede yer
almaktadr.
Tanm 2. Objelerin sral herhangi bir yeniden dzenlenmesi permtasyon olarak
adlandrlr.

Permtasyon oluturmann, yerine koymadan, N yeli bir gruptan N tane ekili yapma
olduunu not ediniz.

ee

rnek 7. 12 ton teknii modern klasik mzikte bir besteleme tertibidir. Bu tertip iinde
her para bir tona dayanr. Her yarm tonlu lein (kromatik gam) on iki notas (C, C
keskin, D, D keskin, vs.Bye kadar) tam olarak bir kere grlr. Bu nedenle, her bir
tonun dizisi yarm tonlu lein bir permtasyonudur ve prensipte farkl olan her olas
melodiyi sayabiliriz (yaklak olarak 479 milyon).
rnek 8. Mehur gezgin satc problemi. Diyelim ki ihtiyari olarak sralanm, aradaki
mesafesi belli 15 kasabadan gemek zorunda olan bir satcy ele alp ve her
kasabadan (en azndan) bir kere geen en ksa yolu bulacamz varsayalm. 15lik

gruptan 15 tane ekme formlmz kullanarak 15! sonucuna varabiliriz. Bu 1.3 trilyon
farkl yol demektir. Bu karmak bir problemdir, bu nedenle zmeyeceiz.

ri

5!5!.5! 15! = (5!)1515!

.c

om

Satcnn her bir kasabada 5 mteriyi ziyaret ettiini hayal edebiliriz. Eer
mteriden mteriye mmkn olan btn yollar dnecek olursak, (15x5)!
permtasyon elde ederiz (bu ok fazla!). Ancak, aratrmamz satcnn kasabada iken
5 mteriyle ayn anda (tanmlanabilir bir sra ile) grme eklindeki yolculuk plan ile
snrlandrmak mantkl gibi grnyor. Her kasabadaki mteriyi grebilmesi iin 5!
olas sralama vardr ve ziyaret edebilecei kasabalar iinse 15! olas sralama vardr.
Dolaysyla, arpm kuraln kullanarak sz konusu ilave snrlamay salayacak
permtasyon saysnn hesaplayabiliriz:

15 tane

de
rs
no

4.3 Kombinasyonlar

tla

Bu hala arpc bir ekilde yksek bir rakamdr, fakat snrlandrlmam (15.5)!
permtasyonundan kesinlikle ok daha dktr3.

rnek 9. Eer bir tek desteden ka farkl poker eli ekeceimizi saymak istersek, yani
bir tek desteden yerine koymadan 5 kart ekmek gibi, kartlarn ekilme srasyla deil
ancak her hangi bir kartn ekilip ekilmediiyle ilgileniriz.
Tanm 3. Herhangi sralanmam eler toplamna kombinasyon denilir.

Bir kombinasyon bir gruptan yerine koymadan gerekletirilen ekililerle oluturulur.


Fakat imdi elerin ekili srasyla ilgilenmediimiz iin, sadece sralamas farkl ama
ayn elerden oluan ekilileri iki kere saymak istemiyoruz. n elemanl bir yndan
ekili yapabileceimiz n!
kadar farkl sralama vardr (yani n tane elemann
permtasyon says). Dolaysyla, N objeden n tane farkl obje kombinasyonu:
3

ee

k! kye gre ok hzl byd iin ok az kii faktriyelin lei hakknda sezgiye sahiptir. Byk k
deerleri iin olduka iyi i gren Strlingsin tahmin

( )

Popler bilimde olduka yksek rakamlar karlatrmak iin yaygn olarak kullanlan bir hesaplama
80
gzlemlenen kinatn toplam atom saysn tahmin etmektir.Bu deer aa yukar 10 (dorusu, bu
18
rakam alglamak da bile gl ekiyorum). Faktriyle cinsinde 10
59!dur. 75! says kabaca 2.5 x
30
10 (iki buuk milyon trilyon trilyon) arp kainattaki atom says olarak ifade edilebilir.
Bu ekilde karmak hesaplamalardan kanmak isteyeceimiz iin, sadece faktriyellerin oranlar ile
ilgileniriz, bu nedenle de nce hangi terimin birbirini gtreceini grmek gerekir. rnein
.

Bu ayn zamanda binom katsays olarak bilinir ve genellikle


( )

olarak ifade edilir.

om

.c

Not: Her ne kadar faktriyellerin oranlarna bakyorsak da, binom katsays daima
tamsaydr (kombinasyon saysnn anlaml olabilmesi iin gereklidir).

ri

rnek 10. Poker iin, bu forml kullanarak ( ) = 2598960 olas el olduunu


hesaplayabiliriz.

de
rs
no

tla

rnek 11. levsel bir alma grubu, diyelim ki, 5 kiiden fazla olmamal (bu say iin
pedagojik bir gereke yoktur, sadece matematiksel ilemlerim gereinden fazla
karmaklamasn nlemek istiyorum). Bu derse u anda 28 renci kaydn
yaptrmtr. Ka tane uygun alma grubu mmkndr (kendi bana alan
renciler dhil)? Her bir 1, 2, 3, 4, 5 grup byklkleri iin alma gruplarnn saysn
hesaplamak ve toplamn almak zorundayz. Bu durumda (eer herhangi bir hata
yapmadysam)

kadar mmkn alma grubu vardr.

imdi dersin bandaki zor problemimize geri dnelim:

ee

rnek 12: Fischerin Rassal Satrancna Geri Dn: lk olarak kale ve filler hakkndaki
(1) ve (2) nci snrlamalar grmezlikten gelelim, yani satran tahtasnn alt srasnda
talarn herhangi bir ekildeki yerleimine izin verelim. 8 beyaz ta (siyahta olabilir, bu
nemli deil) tahtann alt srasndaki 8 kareye datmak zorundayz. Dikkat ederseniz
bu bir permtasyondur, bu nedenle 8! kadar olas sralamamz var. Ancak, sadaki ve
soldaki talarn eit olas kuralndan tr kale, vezir ve filler ifterdir. Dolaysyla,
srasyla iki kale/fil/veziri birbiriyle deitirerek 2x2x2 olas bir balang pozisyonu
oluturma yolu vardr. Bundan tr, farkl oyun says

Oyun Says =

= 7! = 5040

kadardr.

tane vezir yerletirme yolu vardr. ah ve kaleler

.c

kombinasyondur, yani ( )

om

Daha nce sylediimiz gibi, gerek kurallar Fischerin Rasgele Satrancna ilaveten
unlar empoze eder: (1) bir fil siyah karede ise dieri beyaz karededir, (2) ah iki kale
arasnda ilk hareketini yapabilir. Bu varyant iin, eer sralar doldurma sralamas
konusunda biraz zekiysek, arpm kuraln kullanabiliriz. ncelikle iki fili, tesadfen
seilen bir siyah kare ile tesadfen seilen bir beyaz kareye yerletirmeyi neriyorum.
Bylece 4x4 olanamz vardr. Sonra, at geri kalan 6 kareden birine yerletirilir (6
olanak). ki veziri, geriye kalan 5 kareden herhangi birine yerletiririz. Bu bir

ri

iin bir snrlama olduundan, geriye kalan ta bo olan alana yerletirmek iin
her zaman bir tek yol vardr. Toplam olarak, elimizde
Oyun Says = 4x4x6x10x1 = 960

tla

kadar oynanacak potansiyel oyun vardr.

de
rs
no

Talar yerletirme konusunda kritik nokta, arpm kuraln uygulayabileceimizden emin


olmaktr, yani ilk ta yerletirme eklimiz geriye kalan talarn yerletirilme olanaklarnn
saysn etkilememelidir. Grebildiim kadaryla, bu sadece filler iin nemlidir: dnn,
nce kale ile ah ve sonra filleri yerletirmiiz. O zaman (a) her ta ayn renk
alanlara (o durumda filleri 1x4 = 4 sayda olas farkl renkli yerlere koymu olacaktk)
veya (b) talardan birisinin dier iki tatan farkl renkli bir alana (bu bize fil iin 2x3 = 6
farkl seenekle ba baa brakacakt) konulup konulmadn ayrt etmek zorunda
kalacaktk. nce filleri, sonra ah kalelerden nce yerletirdiimiz srece, daha sonra
nasl devam ettiimiz nemsiz gibi grnyor.

5. Bakann lm Tarihi Paradoksu (alma Sorusu)

ee

Yaayan veya l bakanlar ile ilgili komplo teorileri tipik olarak sra d
tesadfler zerine kurulur. rnein, suikaste urayan iki Amerikan bakan iin, yani
Lincoln ve Kennedy, bir kii az ok dikkate deer ortak noktalarla alakal ok uzun bir
liste oluturabilir. rnein, Lincolnun vurulduu tiyatroya gitmemesi konusunda uyaran
Kennedy adnda bir sekreteri varken, Kennedynin de suikastten nce Dallasa
gitmemesi konusunda uyaran Evelyn Lincoln adnda bir sekreteri varm (Ho! En
azndan Wikipedia yle diyor).
Bir dier belirgin tesadf ise 39 bakandan lm olan bazlarnn ayn lm
tarihine sahip olmalardr: Filmore ve Taftn ikisi de, 8 Martta, lmlerdir. John Adams
ve Thomas Jeffersonun ikisi de 4 Temmuz 1826 tarihinde, bamszlk bildirgesinin

imzalanmasndan tam olarak 50 yl sonra, ldler. Ve James Monroe tam olarak 5 yl


sonra, 4 Temmuz 1831 de ld. Bunlar arlmas gereken eyler mi?

om

lgili olaya ait sonularn oranlarnn olaslklara eit olduu varsaym altnda,
imdi iki belirlenmi bakann belli bir gnde, ubat 6 diyelim, lmesinin basit
olaslna bakalm. Bu durumda, iki bakann lm gnlerinin 6 ubata denk
gelmesinin sadece bir tek kombinasyonu olduunu buluruz. Fakat saymann arpm
kuralna gre toplam olarak 3652 kadar olas lm gn kombinasyonu vardr. Buna
gre, sz konusu olayn olasl son derece dk bir rakam olan 1/3652dir.

de
rs
no

tla

ri

.c

Ancak, duble lmn potansiyel aday olarak bir ylda ok sayda bakan ve gn
elemesi vardr. imdi, 39 bakandan en az 2sinin ayn gnde lmesi olay olan Ann
olasl, prensip olarak bir ift, iki ift, ifti vb bakann ayn lm tarihine sahip
olmasnn btn olas kombinasyonlarn oran olarak hesaplanr. Bu sorunu zmenin
en zarif ekli ise A AC = S ve A AC = olduu iin aksiyom (P2) ve P(3)ten P(A) =
P(S) P(AC= 1 P(AC) elde ederiz. Olay AC 39 bakann tm farkl lm gnne
sahiptir olarak formle edilebilir. Eer sadece iki l bakan varsa, ilkinin lmnden
sonra ikinci bakann farkl bir gnde lmesi iin 364 farkl yol vardr. imdi her bir n
bakana farkl bir lm gn tayin etme olanaklarnn saysn belirlemenin yerine
koymadan 365ten n tane ekilie tekabl ettiini farketmemiz gerekir, bu nedenle
olanaklarn says

dir.

Bakanlara mmkn olan tm farkl lm gnlerini atama says yerine koyarak


ekili yntemine tekabl eder, dolaysyla bu say 365ndir.
Buna gre ayn lm tarihli en az bir ift bakann olma olasl
P(A) = 1 P(AC) = 1-

ee

burada, n = 39 iin aa yukar %87.82e eittir. Bu forml kullanarak, farkl saydaki


bakan iin de bu olaslklar hesaplayabiliriz:

Son satrdan grlebilen, olasln bire ykselmesinin sezgisel olarak nedeni


lm gnlerinden daha fazla bakan lmlerinin gereklemesinden tr, potansiyel
farkl lm gnnn kalmamasdr.

.c

om

Bu nedenle, bu paradoksu zmek iin, iki belirlenmi bakann ayn gnde


lmesi aslnda byk bir tesadf iken (nk bu olay ok dk bir olasla sahiptir),
artan bakan saysyla beraber, byle bir olay iin farkl kombinasyon says ok hzl
artar. Baka bir ifadeyle, her bir bireysel sonucun gerekleme olasl ok dkken,
potansiyel tesadf says ok hzl bir ykseli gsterir, bundan tr byk bir
olaslkla en aznda baz tesadfler gereklemek zorundadr.

ee

de
rs
no

tla

ri

Dier komplo teorilerinin arkasndaki hikaye muhtemelen ayndr: nsanlar son


derece fazla detay tarayarak Kennedy ile Lincoln arasnda nispeten daha az saydaki
ilgin paralellikleri bulmaya alyorlar. statistikte, bu tr aratrma stratejisine data
mining ad verilir ve bu balamda gerekte yanl bulu olarak meydana gelen bu
ender tesadflere deiniriz. Bu tesadfler sistematik bir ilikinin sonucunda deil, fakat
ayn anda aratrabileceimiz veya test edebileceimiz ok saydaki potansiyel ilikinin
sonucunda ortaya kmaktadr.

Olaslk ve statistik Ders Notlar 3

om

Konrad Menzel
10 ubat 2009

.c

1 Sayma Kurallar ve Olaslk

tla

ri

Hatrlanaca gibi, basit olaslk ile sonularn eit olarak mmkn olduu ve sonlu bir
rneklem uzay iin, A olaynn olasl

ile ifade edilir.

de
rs
no

imdi, bu olaslklar hesaplamak iin sayma kurallarn nasl kullanacamz greceiz.


rnek 1. Her bir kartn ekilme olaslnn eit olduunu varsayarak, yerine koyma
yntemiyle 52lik bir desteden iki kart ekin. ki farkl kart ekmenin olasl nedir?
S = {(

)(

n(S) = 522

iki farkl kart olay

ee

ierir. Bylece

Alternatif olarak, olasln birinci nermesini kullanabilirdik:


P(A) = 1 P(AC) = 1- P(ayn iki kart) = 1 P(ikinci kart birincinin ayns) = 1

om

Baz baka rneklerde, bir olayn olasln, tmleyeni araclyla hesaplamak ilemleri
ok basitletirebilir.

.c

rnek 2. Varsayalm ki Ocenia lkesi Eurasiann bakentine 8 tanesi nkleer balk


tayan 16 fzeyle saldrd1. Yine varsayalm ki, Eurasia ordusu 16 fzeyi de izleyebilir
ve hangi fzenin konvansiyonel balk tadn ayrt edemeyen ancak her birisi gelen
fzelerin nn kesin olarak kesebilecek 12 rokete sahip olsun. Euarasiann felaketi
nleyememesi ve en az bir nkleer balkl fzenin hedefine ulama olasl nedir?
Sezgisel tahmininiz ne olurdu?

tla

ri

Her durumda, tam olarak 4 fze hedefine ulaaca iin, S rneklem uzay 16da 4
fzenin btn kombinasyonlarn ierir. Dolaysyla, Snin elemanlarnn says binom
katsays ile verilir.

de
rs
no

Olasl deerlendirebilmek iin, bir yaklam tmleyen kuraln kullanmaktr. Olay A =


en az bir nkleer balk hedefi vurur un tmleyeni AC = hedefi vuran btn fzeler
konvansiyoneldir dir ve ACnin sonular 8den 4 fzenin (konvansiyonel olanlar) btn
kombinasyonlar eklinde hesaplanr. Bylece

Bu nedenle,

yleyse bu olaslk bire olduka yakn bunu bekleyip beklemediinizden emin deilim,
fakat politik olarak doru olmasa da, bu rnek ok sayda olanan olduu kombinasyon
problemlerinde sezgilerin ok kolay yanlabileceini gstermektedir.

ee

rnek 3. Mehur doumu gn paradoksu (bir zamanlar) popler bir parti oyunu ile
ilgilidir: n kiilik bir arkada grubunuz olsun, onlardan en az bir iftin ayn doum gnne
sahip olma olasl nedir? (btn doum gnlerinin eit olaslkl olduunu varsayalm.
Bu gerekte, sadece kabaca ampirik olarak dorudur. ) Yine, her bir n arkadanzn
1

Buradaki isimler Orwellin roman 1984 ten alnmtr, dolaysyla bunun bir gerek dnya rnei olmas
gerekmiyor.

om

farkl doum gnne sahip olduu AC tmleyen olayna bakalm: Bu, yerine koymadan
365ten n tane ekilie tekabl ettii iin, ilgili forml kullanabiliriz:

.c

Bylece en az iki arkadanzn ayn doum gnne sahip olma olasln, P(A),
hesaplayabiliriz:

de
rs
no

tla

ri

Bu forml bilhassa kolay okunmaz, bu nedenle imdi nnin birka deeri iin olaslklar
ondalk olarak aaya yazalm:

Birok kii bu olaslklar ok yksek bulabilir, fakat bu genellikle kiinin n


arkadanzdan herhangi birinin sizinle ayn doum gnne sahip olma olasln
hesaplayarak dnmeye balama eilimi yzndendir. Siz kendinizi, listemizin farkl
olduu, olasln

ee

olduuna ikna edersiniz. Bu farklln nedeni, nceki durumda, Ann ayn zamanda n
arkadanz arasndaki btn elemeleri kapsamasdr ki bu da sayy hzl bir ekilde
yukar doru ekmitir.

om
.c

2. Bamsz Olaylar

tla

ri

Sezgisel olarak, iki farkl olay olan A ve B iin Ann gereklemesinin Bnin
gerekleme olasln etkilemedii bir kavram tanmlamak istiyoruz. rnein eer bir
madeni paray iki kere frlatrsak, ikinci atn sonucu herhangi bir ekilde birinci atn
sonucundan etkilenmemelidir. Notasyonu basit tutmak iin bundan sonra
P(A B) = P(AB)

de
rs
no

olarak ifade edilecektir.

Tanm 1. A ve B olaylar, eer aadaki koulu salarlarsa bamszlardr


P(A B) = P(A)P(B)

Buradaki bamszln, olaylarn fiziksel doasnn deil, sadece olaslk dalmn bir
zelii olduunu grebilirsiniz. Bu yzden baz olaylarda bamszlk hakknda iyi
sezgiye sahip iken (bir dizi yaz-tura atma gibi), ou durumda bu formal koulu kontrol
etmekten baka seeneimiz yoktur.
rnek 4. Diyelim ki adil bir zar iki kere frlattk, aadaki olaylarn ve kesiimlerinin
olasl nedir?

A = {2, 4, 6}

ee

Sonular sayarak P(A) =


kesiim olasl

B = {1, 2, 3, 4}
( )
( )

dir ve ayn ekilde, P(B) =

tr. Olaylarn

Bylece olaylar ayn attan elde edilmesine ramen bamszdr.

.c

om

Bamszln belirtilen olaslk dalmna ne denli nemli bir ekilde bal olduunu
grmek iin, imdi varsayalm ki, zar maniple edildi ve bylece P(6)=3/8, dier btn
saylar iin n = 1, , 5, P(n) = 1/8 olsun. O zaman, ayrk olaylarn olaslklarnn
toplam zerine olan (P3) aksiyomuna gre,

ri

ve

de
rs
no

tla

Bamszln bir yorumu da yledir: Varsayalm ki Bnin meydana geldiini biliyoruz,


bu bilgi bizim Anin gerekleme ihtimali konusundaki inancmz deitirir mi (ya da
tersi)? Bunu sonraki blmde formle edeceiz ve greceiz ki eer A ve B
bamszsa, Bnin olumas bilgisinden A olay hakknda reneceimiz hibir ey
yoktur.

nerme 1. Eer A ve B bamsz ise, o zaman A ve BC de bamszdr.


SPAT: Ay AB ve ABC gibi iki ayrk olaya blebileceimiz iin, aadaki ekilde
bamszl ispatlayabiliriz:

imdi bamszln tanmn iki olaydan daha teye tayabiliriz.

ee

Tanm 2. Bir grup A1, A2,. olaylarnn bamsz olmas iin, bu olaylarn herhangi bir
alt grubu Ai1, Ai2, iin (btn indeksler farklyken), aadaki koul salanmaldr:

rnein, A, B, C olaylar iin,

ve

om

rnek 5.
rneklem uzay S = {s1, s2,s3,s4} ve btn sonular iin P(si) = 1/4 olsun, o zaman her
bir olay

ri
tla

(A B) olaynn olasl

.c

1/2 olaslkla gerekleir.

de
rs
no

ve bu durum herhangi iki olay iin de dorudur, bylece olaylar ikili olarak bamszdr.
Ancak, hepsi beraber ele alndnda toplam yn bamsz deildir. nk

Sezgisel olarak, A ve Bnin gerekletiini bilirsek, Cnin gerekletiini kesin biliriz.

3. Koullu Olaslk

Ann gereklemesinin Bnin gereklemesini (ya da gereklememesini)etkilediini ve


tersini varsayalm. A hakknda bilgi verilmiken, Bnin gerekleme olasln nasl
tanmlarz? Eer iki olay bamsz ise, Ann B hakknda hibir bilgi vermeyeceini zaten
sezgisel olarak tartmtk. Ancak eer bilgi verirse ne olur? Sonu olarak olaslklar
nasl deitiririz?

ee

rnek 6. Eer adil bir zar atarsak ve gerekte sonucun ift bir say olduunu sylersek,
yani B = {2, 4, 6} olmusa, zarn 6 gelmi olma olasl nedir? Bde sadece 3 tane eit
olaslkl sonu olduu iin, ki 6 onlardan biridir, biz sezgisel olarak cevabn 1/3 olmasn
bekleriz. Burada rneklem uzayn = B = {2, 4, 6}ye indirgedik ve yeniden
tanmlanm probleme gre basit olasl hesapladk.
Tanm 3. Varsayalm ki, P(B) > 0 iken, A ve B, Sde tanmlanm olaylar olsun. Bnin
gereklemesi durumunda Ann koullu olasl

om

ile verilir.

de
rs
no

tla

ri

.c

Sezgisel olarak, pay, Bnin gerekletiinin bilinmesi durumunda Adaki hangi


sonularn olas olduunu ifade eder. Payda tm rneklem uzay iin ayn eyi yapar.

Kaynak: MIT OpenCourseWare

ekil 2. Bye koullanm olarak A olay

Aklama 1. Koullu olaslk ve bamszlk: Eer A ve B bamsz ise,

yleyse Bnin gereklemesi bize A hakknda hibir ey sylemediinden koullu


olaslk, koulu olmayan olasln aynsdr.

ee

rnek 7. Bu rnek Greg Mankiwin web gnlnden (blog)2 uyarlanmtr. Intrade gibi
platformlarda, eer bir olay gerekleirse (rnein, Yankeelerin dnya ampiyonasn
kazanmas) 1 dolar deyen deerli katlar alp satabilirsiniz . Eer piyasa gerektii gibi
alrsa, bu tip deerli katlarn belirli bir t zamanndaki fiyat, alp satanlarn bu t
zamanndaki bilgisine bal olan olaslk eklinde yorumlanabilir. Intradedeki politik
piyasada, aadaki olaylar iin deerli kt alp satabilirsin:

Ai aday aday i bakanlk seimini kazanr (adaylk kouluna baklmakszn)


Bi aday aday i partisinin adayln kazanr

Ck k partisinin aday seimi kazanr

om

imdi, ilgili olaylarn deerli katlarnn fiyatlar kullanlarak belirlenen olaslklar


kullanarak piyasann, partinin aday gstermesine bal olarak aday aday olmas
halinde, P(Ai|Bi), her partinin hangi aday adaynn bakanlk seimini kazanma
olaslnn en yksek olduunu dnd sorusunu cevaplandrabiliriz. Yani hangi
adayn nerilmesi partiye bakanlk seimini kazanmada en yksek ans salard.

ri
tla

Bylece,

.c

Parti tarafndan aday gsterilmeyen adayn seimi kazanma ansnn olmadn


rahatlkla (nispeten) varsayabiliriz, bundan tr

de
rs
no

Bylece, ilgili deerli kadn fiyatn sadece formlde yerine koymamz yeterlidir. 6
ubattaki Intrade politik piyasasndaki deerli kat fiyatlarna dayanarak, aadaki
rakamlar elde ederiz (son stunda, Mankiwun Kasm 2006daki orijinal web
gnlnde yer alan deerleri kullandm).

P(A)y P(A|Bi) koullu olaslndan ayrt etmek iin, P(A), Ann marjinal olasl olarak
da adlandrlr. Marjinal ile koullu olaslk arasndaki iliki Toplam Olaslk Kanunu ile
verilir.

ee

Teorem 1. (Toplam Olaslk Kanunu) Varsayalm ki B1, , Bn rneklem uzay Snin bir
blnts ve her i = 1, , n iin P(Bi) > 0 olsun. O zaman herhangi bir B olay iin,

om

SPAT: Koullu olaslk tanmndan herhangi bir Bi olay iin P(A|Bi)P(Bi) = P(A Bi). B1,
, Bn rneklem uzay Snin blntleri olduundan, (A B1) (A Bn), ayrk ve A iin
karlkldr, yani A iin blnt olutururlar. Bu nedenle, ayrk kmelerin birleiminin
olasl zerine olan aksiyom (P3)e gre
.
rnek 8.

de
rs
no

tla

ri

.c

Tbbi veride, sklkla daha yal ve tecrbeli kalp cerrahlar tarafndan tedavi edilen
hastalarn aslnda daha gen olanlar tarafndan tedavi edilenlere gre daha yksek
ameliyat sonras lm oranna sahip olduklar grlmektedir. Tecrbeli cerrahlar iin %
6lk, daha gen olanlar iin sadece %5.5lik lm oranlarn gzlemlediimizi
varsayalm. Bu durum, cerrahlarn yeteneklerinin ya ilerledike azald anlamna gelir
mi? Muhtemelen deil Burada bir cerrahn uygulamak zorunda olabilecei drt eit
prosedr olduunu varsayalm tekli, ikili, l ve drtl bypass (terminoloji bypass
edilmesi gereken koroner arter saysn gstermektedir). Prosedrn karmakl ve
hastalarn riski baypas saysyla artar ve genellikle daha hasta olan hastalar daha
komplike prosedrlere ihtiya duyabilirler. Varsayalm ki, her bir prosedr iin, tecrbeli
cerrahlarn hastalarnn bariz bir ekilde ok daha dk lm oranna sahip olduklar,
fakat tecrbesiz cerrahlarn hasta lmlerinin orannn genel olarak daha dk olduu
bize sylendi. Toplam olaslk kanunun nda, bu iki durum nasl bir arada
gerekleebilir? imdi bir rnee bakalm (Bu rakamlar elbette uydurmadr)
Prosedr

Tekli Baypas
kili Baypas
l Baypas
Drtl Baypas
Toplam

Tecrbesiz
lm Oran
Vaka Yzdesi
% 4.0
% 50.0
% 6.0
% 40.0
% 10.0
% 9.0
% 20.0
% 1.0
% 5.5
% 100.0

Tecrbeli
lm Oran
Vaka Yzdesi
% 2.0
% 25.0
% 4.0
% 25.0
% 6.0
% 25.0
% 12.0
% 25.0
% 6.0
% 100.0

Toplam Olaslk Kanunun ifadesi erevesinde, tecrbeli cerrahlar iin genel lm


oranlar P(A), Bi prosedrne koullu lm oranlarndan, P(A|Bi) ve baz oran / vakalarn
birbirlerine gre oranlar P(Bi) ile hesaplanabilir.

ee

Tecrbeli cerrahlar her prosedre karlk gelen orantsz bir ekilde yksek oranlarda
riskli vakalarda grevlendirildikleri iin (varsaymsal olarak bu gibi durumlarda daha
fazla tecrbeye ihtiya olduu iin), her bir tedavi kategorisini daha iyi uyguladklar
halde, ortalama (marjinal demek daha doru) lm oranlarnn tecrbesiz
cerrahlarnkinden daha yksek olduunu grebiliyoruz. Bu durum sklkla kompozisyon
etkisi olarak anlr.

Marjinal lm oranlar iin iyi bir kullanm alan bulmak daha zor.

om

O halde her bir olaslk trnn pratik nemi nedir? Eer baypas iin cerrahlar
arasndan birini semek durumunda olsaydnz, prosedrn tipi yalnzca salk
durumunuza bal olmalyd, cerrahn tecrbeli olup olmamasna deil, dolaysyla bu
durumda sadece koullu olasl nemsemeliydiniz.

ri

.c

Bir ok istatistiki analizde, gerekte koullu lm oranlaryla ilgilenirsiniz (rnein, eer


siz tecrbenin lmler zerindeki etkisiyle ilgileniyorsanz) ve prosedr tipi deikeni
istatistikilerin adlandrd zere karkla neden olan faktr olarak ele alnr.
statistik ve Ekonometrideki klasik sorun, sklkla birok ilgili karkla neden olan
faktr n gzlemlenmemesidir ve siz bu problemin stesinde gelme yollarn
reneceksiniz.

tla

Aklama 2. Dier bir yakn ilikili kavram da ekonometride ok nemli olan koulu
bamszlktr. Aadaki koulun salanmas durumunda, A ve Bnin Cye koullanm
iki bamsz olay olduu sylenebilir.

de
rs
no

Aadakilere dikkat ekmekte fayda vardr

Koulsuz bamszlk koullu bamszl salamaz


Koullu bamszlk koulsuz bamszl salamaz

Yani A ve Bnin bamsz olup olmamas ciddi bir ekilde neye koulladmza baldr.
Sonraki problem setinde bir kar- rnek ieren bir uygulama olacaktr.

4. Koullu Bamszlk (derste ilenmedi)


Bamszln tanmn koullu olaslklara uygulayabiliriz:

ee

Tanm 4. A ve B olaylarnn C olayna bal olarak bamsz olmalar iin koullu


olaslklar aadaki art salamas gerekir:

Bu tanm daha nce ele aldmz koulsuz bamszlk ile tam uyumludur. Biz sadece
kendimizi yeni rnekle S = C ile snrlyoruz. Koullu bamszlk daha sonra
ekonometride ok nemli bir rol oynayacak. Bu nedenle zel olarak zerinde durulmay
hak ediyor. Teknik olarak, koullu bamszln koulsuz bamszl salamadn
(ya da tersini) not etmek nemlidir. Baka bir ifade ile, iki olayn bamsz olup

om

olmamas ciddi bir ekilde baka neye koulladmza baldr. Bunu nceki derste
belirtmitim, imdi ise baka bir rnek vererek aklayacam.

rnek 9. Her bir sonucun 1/6 olaslkla gerekletii, zar atma rneine tekrar bakalm,
yani S = {1, 2, 3, 4, 5, 6} .

.c

(1) ki bamsz olay baml yapma: A = {1, 2, 3, 4} ve B = {2, 4, 6} olaylarn


dnn. Daha nceki rnekte bu iki olayn bamsz olduunu zaten grmtk.

tla

de
rs
no

Ancak,

ri

imdi olay C = {3, 6} olsun. O zaman

Yani, onlarn kesiimi C ile ayrk olduu iin, A ve B, Cye bal olarak bamsz
deillerdir.
(2) ki baml olay bamsz yapma: D = {2, 3, 4} ve E = {2, 4, 6} olsun. D ile Enin
baml olduunu kontrol edebiliriz: P(D) = P(E) = 1/2 olduunu grebiliriz.
Ancak,

ee

Fakat eer F = {3, 4, 5, 6} zerine koullarsak

Halbuki

ee

de
rs
no

tla

ri

.c

om

Bylece F zerine koullannca, D ve E bamsz oldu.

Olaslk ve statistik Ders Notlar 4

om

Konrad Menzel
12 ubat 2009

.c

1. Bayes Teoremi

tla

ri

Son derste koullu olasl akladk ve Toplam Olaslk Kanunun A olayn


koulsuz olasln P(A) koulu olasla (P(A|Bi) balayan bir yol olduunu grdk.
Koulu olaslklar arasndaki bir dier nemli iliki P(A|B) koullu olasln P(B|A)
koulu olaslkla ilikilendiren Bayes kanunudur, yani koul srasn tersine evirme
yoludur. Bu sonu, istatistiin ve olasln birok alannda nemli bir rol oynar, en
nemlisi de B verisini gzlemlerken dnya hali Ay renme durumlarnda
oynad roldr.

de
rs
no

rnek 1. Antik Yunanllar (belli ki henz istatistik hakknda ok ey bilmiyorlard) her bir
gemi batndan sonra, kurtulan btn deniz adamlarnn deniz tanrs Poseidana dua
ettiklerini fark ederler. Bu gzlemden hareketle, onlarn gerekten kurtulmasnn nedeni
dua etmi olmalar olduu yorumu yaplr. Bu rnek gerekte 16nc yzyl ngiliz filozofu
Francsi Bacon tarafndan gndeme getirilmitir. statistiki terimlerle, kurtulanlar olay A
ve dua etmeyi olay B olarak tanmlayalm. Bylece, soru dua etmenin kurtulma
olasln ykseltip ykselmedii olur, yani (P(A|B) > P(A)
p ilikisi doru mu, deil
mi? Btn kurtulan denizcilerin dua etmi olduu gzlemi P(B|A) = 1e dnr. Bu bilgi
gerekten de dua etmenin kurtulma ansn nemli lde artrp artmad sorusunu
cevaplandrmak iin yeterli midir? P(B|A) ile ilgili bilgiyi kullanarak P(A|B) hakkndaki
bilgiyi nasl reniriz?

Koullu olasln tanmdan aadaki ilikiyi elde ederiz,

ee

kinci denklii yeniden dzenleyince

ilikisini elde ederiz. Aadaki olay blntleyebileceimizi daha nce grmtk,

om

Bylece u sonuca varrz:

zleyen teoremde zetlendii gibi bu sonucu Snin herhangi bir blntsne


genelletirebiliriz.

P(Ai) olay Ainn nceki olasldr (yani deneyden nceki olaslktr)


P(Ai|B) Ai nin sonraki olasldr (yani deneyden ve B hakknda Bayes
teorimden elde edildii gibi- bilgi elde edildikten sonraki olaslktr)

tla

ri

.c

Teorem 1. (Bayes Teoremi) Eer A1, A2, , Snin bir blnts ise, P(B) > 0l
herhangi bir B olay iin aadakini yazabiliriz

de
rs
no

Optimal karar vermenin istatistiksel teorisinin tm bu basit fikir zerine kuruludur:


Bayes Karar Teorisi

rnek 2. nceki, batan gemiden kurtulan deniz adamlar rnei iin, P(B|A) = 1i ve
(koulsuz) deniz adamlarnn kurtulma orann P(A) gzlemleyebiliyorduk. Ancak,
P(B|AC)yi (boulanlar arasnda dua edenlerin oran) gzlemleyemediimiz iin, dua
etmenin kesinlikle kurtulma ansn artrp artrmad ile ilgili soruyu cevaplandrmak
iin yeterli bilgiye sahip olmadmz da grebiliyoruz. Onlarn da lm korkusundan
dua ettiini rahatlkla varsayabiliriz (yani P(B|AC) = 1). Bylece aadaki ilikiyi elde
edebiliriz,

ee

Antik Yunanllarn muhakemesi, bir bakma, kurtulan sapma sna bir rnektir (ho! en
gereki ifadesiyle): Bayes teoremi bize, eer sadece kurtulanlar gzlemlersek,
kurtulamayanlar hakknda ok ey bilmedike kurtulan alt-nfusun neden kurtulduu
konusunda bir yargya varmayacamz gsterir.

rnek 3. Bayes kuralnn nemli bir uygulamas da tbbi testlerin nasl yorumlanaca
ile ilgilidir. Bir doktorun ok naho bir hastalk iin bir hastaya test uyguladn
varsayalm ve hastann gerekte hasta olduu olayna A diyelim. Test pozitif bir sonu
verebilir, ki biz buna B olay diyeceiz, veya negatif sonu verebilir, bu da BCdir.

Hastann hastalkl olup olmadn belirleme konusunda test tam olarak gvenli deildir,
fakat pozitif test sonucunun olasl,

om

P(B|A) = % 99 , P(B|AC) = %5

.c

Sonu olarak, hastaln nispetten ender grldn ve hastalarn ya, cinsiyeti ve


dier zelliklerine bal olarak nfusun %5ni etkilediin biliyoruz. Diyelim ki test pozitif
sonu verdi. Hastann gerekten hastalkl olmasnn (koullu) olasl nedir? Bayes
kural aadaki ilikiyi verir

ri

Hastaln genel yaygnl, P(A), olduka dk olduu iin, pozitif test sonucu bile
hastaln nispeten zayf kant oluyor.

de
rs
no

tla

rnek 4. Romeo ile Juliet bir sredir gryorlar ve bir gn sevgililer gn (hatrlatmak
iin: bu Cumartesidir) gelir. Romeo Juliete ya mcevher hediye edebilir, J, ya da ona
bir serenat yapabilir, S. Juliet mcevher ister. Eer Romeo onu gerekten sevdiyse,
onun isteini gzlerinden okuyabilirdi. Dorusu, Juliet ona bu isteini iki hafta nce,
Amerikan futbol ligi finalinin son yarm saatinde sylemiti. Juliet ayn zamanda
Romeonun kendisini hala sevip sevmedii konusunda ilk kez pheye der. Buna L
olay diyelim. Spesifik olmak gerekirse,
P(L) = 0.95

Juliet, Rome kendisini seviyorsa, ona P(J|L) = 0.80 olaslkla mcevher vereceini veya
P(S|L) = 0.20

olaslkla serenat yapacan da biliyor (Bu sadece Julietin dnddr, unutmayn


ki Romeo Amerikan futbolunu da ok seviyor). Eer Romeo onu artk sevmiyorsa,
P(S|LC) = 0.80

ee

olaslyla Julietin ne sevdii konusunda bir fikri olmayacak ya da ona bir serenat
yapacaktr (veya daha gereki bir ekilde, nceki sene Julietin istedii glleri verebilir
ya da sevgililer gnn tamamen unutabilir). (Not: Serenat yapmak Romeo iin ok
utan verici olabilir ama ayn zamanda daha da ucuzdur). Sonuta Romeo Juliete
serenat yapar. Juliet onu hemen terk etmeli mi? Bayes teoremine gre, Julietin
Romeonun eilimi hakknda sonraki inanc aadaki iliki ile verilir

Bunun Juliet iin iyi olup olmayacana kendisinin karar vermesini bekleyeceiz.

om

Gerek hayatta, bir ok insann bu tr yarglar ok iyi deildir ve, son iki rnekte olduu
gibi, testlerin gvenirliini gereinden fazla nemseme eilimindedirler. Bilisel psikoloji
literatrnde, bu durum Temel-Oran Yanlgs olarak bilinir. rneimizde temel-oran
etkilenen veya salkl insanlarn, srasyla, P(A) ve P(AC) oranlar ile Romeonun Julieti
sevip, P(L), veya sevmeme, P(LC), n bilgisidir. Eer bu olaslklar ok farkl ise,
sezgilerdeki muhakemenin yanlgs ok fena olabilir.

tla

ri

.c

rnek 5. Monty Hall paradoksu1: Bir zamanlar TVde bir yarmacdan A, B, ve C gibi
kapdan birisini semesi istenilen bir program vard. Kaplarn birinin arkasnda bir
dl (son model bir amar makinesi gibi) ve dier iki kapnn arkasnda ise birer kei
olurdu. Eer yarmac arkasnda dl olan kapy seerse, dl kendisinin olurdu. Eer
arkasnda kei olan bir kapy aarsa, hibir ey kazanmazd. Oyunu biraz daha ilgin
hale getirmek iin, yarmac ilk seimini yaptktan sonra sunucu her zaman dier iki
kapdan arkasnda kei olan birini aard. Bu durumda, yarmacnn istemesi halinde
setii kapy dier kapal kapyla deitirmesine izin verilirdi. Kapy deitirmek iyi bir
fikir olur muydu?

de
rs
no

Genelletirmeyi bozmadan, varsayalm ki ben A kapsn setim. dln A kapsnn


arkasnda olmasnn koulsuz olasl 1/3tr. Eer dl gerekten A kapsnn
arkasnda olsayd, sunucu, eit olaslkla her ikisinin arkasnda kei olan B kapsn ya
da C kapsn aacakt. Eer ilk tahmin yanl olsayd, hem yarmac tarafndan
seilmeyen hem de arkasnda dl olmayan bir tane kap kalm olacakt. O halde,
Benim Ay semem durumunda, sunucunun o esnada Cyi ama olasl
(

P(dl Ann arkasnda|C ald) =

(
(

Dier taraftan

P(dl Bnn arkasnda|C ald) =

(
(

Bu durumda, kaplar deitirerek dl kazanma ansm ykseltirdim.

ee

Sezgisel olarak, yeni alan kap dln A kapsnn arkasnda olma ihtimali konusunda
hi bilgi iermemektedir, nk sunucu onu hibir ekilde amayacaktr. Gerekte Ay
sememiz halinde, Ada dl var ile C ald olaylar bamszdr. Ancak, sunucunun
B kapsn amamas iki nedenden kaynaklanabilirdi: (1) dl A kapsnn arkasndayd,
sunucu Cyi tamamen rasgele at, (2) dl B kapsnn arkasndayd, sunucu baka
1

Bu konudaki tartmay u adreste okuyabilirsiniz:

om

seenei olmad iin Cyi at. Dolaysyla, C olasln ortadan kaldrmak sadece Bye
avantaj salar.

2. zet Blm 1: Olaslk

Dersin ikinci nitesine gemeden nce imdiye kadar yaptklarmz, aina olduklarnz
ve kendinizi rahata hissedeceklerinizi zetleyelim:

N arasndan ni yere koyarak ekmek: Nn olanak

N arasndan ni yere koymadan ekmek: (

Permutasyonlar: N! olanak
Nden n kombinasyonu: ( ) olanak

ri

kadar olanak

tla

2.2 Olaslklar

.c

2.1 Sayma Kurallar

Bamszlk: P(AB) = P(A)P(B)

Koullu olaslk: Eer P(B) > 0 ise, P(A|B) =

Sadece ve sadece A ve B bamsz ise P(A|B) = P(A),


Toplam Olaslk Kanunu: P(Bi) > 0 iin Snin B1, , Bn blnts aadaki
gibidir

Bayes Teoremi

de
rs
no

(
(

Olaslk muhakemesi iin grdmz birka genel ey daha var

ee

maniplasyonlar kullanarak ilgilenilen olay yeniden formle ederek olaslklar


kolay hesaplanabilir bir eye dntrme (rnein tmleyen, blntler vs.)
temel orann koullu olasl marjinal/koulsuz olasla dntrme nemi
(rnein Bayes Teoreminde olduu gibi veya kalp cerrah rneindeki
kompozisyon etkisi gibi).

bazen A ve B baml olaylarn Cye koullayarak bamszlatrabilme (veya


bamsz olaylar baml yapmak).

om

3 Rasgele Deikenler
imdi dersimizin ikinci byk konusu olan rasgele deikenler ile devam edelim.

rnek 6. Yaz Tura atma, versiyon I: Tura, H, geldiinde 1, yaz, T, geldiinde 0


deerini alan bir X deikeni tanmlayalm. Bu rasgele deney iin rneklem uzay S =
{H, T} ve rasgele deikenin genilii {0, 1}dir.

tla

ri

.c

Tanm 1. Reel-deerli bir rasgele X deikeni bir deneyin sonularn reel saylar ile
eletiren aadaki gibi herhangi bir fonksiyondur.

de
rs
no

Tarihsel olarak, 1800 yllarda rasgele deiken fikri gelitirildii zaman matematikiler ile
dier bilim adamlarnn dncesinde hakiki rassaln ilevi yoktu. Onun yerine, ans,
analiz ettiimiz durumun btn parametreleri hakknda tam bilgi sahibi olmaymz ve
bir deneyin sonucunu tahmin etmede doann kanunlarndan (gya tam belirleyici)
faydalanma konusundaki yeteneksizliimizin bir sonucu olarak grlyordu. Bunlarn
tmn yapabilmek Laplace eytan olarak bilinir ve nl matematiki Pierre Simon de
Laplace aadaki gibi aklar:
Zamann herhangi bir annda bir akl doaya canllk veren btn gleri
ve onu oluturan btn varlklarn karlkl duruunu bilmi olsayd, eer bu akl
verisini analiz etmek iin verecek kadar engin olsayd, kinatn byk
bedenlerinin ve en hafif atomlarn hareketini bir tek forml ile zetleyebilseydi:
byle bir akl iin hibir ey belirsiz olmazd ve gelecek tpk gemi gibi
gzlerinin nnde olurdu.2

ee

Ardndan gelen Fizikteki (rnein quantum fiziindeki gerek belirsizlik) veya hesap
teorisindeki (rnein Gdel teoremi: Bir akl kendisinden daha karmak olmal nk
tahminleri tahmin etmeye alt kinatn bir parasdr) gelimeler bu dnya grn
korumad ama hala bizim olaslk kavramnn temel altyapsn oluturmaya devam
etmektedir: etrafmzdaki dnyann rassal esas itibariyle onun hakkndaki yetersiz
bilgimizi yanstmaktr.

Laplace, P. (1814): A Philosophical Essay on Probabilities.

{0, 1} ,

ee

de
rs
no

X: {

12

tla

X:=

ri

.c

om

rnek 7. Bir rnek olarak, Yaz Tura atmann kinci Versiyonu: Laplacenin fikrini
gstermek iin, rneklem uzaynn yukarda ilk yaplanlardan daha karmak tanmn
dnebiliriz: Klasik mekanikte herhangi bir zaman noktasnda parann durumunun (kat
cisim) tam bir aklamasn verebiliriz (en azndan prensipte). Ve o zaman klasik
mekaniin kanunlarn kullanarak onun tam ynn ve zelike Tura (H) veya Yaz (T) ile
sonulanp sonulanmayacan tahmin ederiz. Daha spesifik olarak, parann havaya
atld andaki mekanik sistemin durumunu rneklem uzay olarak aklayabilirdik. Bir
sistemin durumunun tam aklamas (ok ideal!) (1) konumu, (2) parann ktlesinin
merkezinin ivmesi ile (3) yn ve (4) belli bir t0 zamanndaki asal momenti ile verilir.
Bunlarn her birisinin koordinat vardr, yani S = 12. Her nokta s
S aka iki
olaydan {H, T} birine aittir. Turann gelmesi olay, H S, iin X = 1 ve yaz iin X = 0
deerlerini verirsek, bu eletirme aadaki gibi ifade edilen rasgele deikendir.

ekil 1: Metalik para atmann stroboskopik resmi (Andrew Davidhazy ve


Rozhester Institute of Technology, School of Photo Arts and Sciencesin
msaadesiyle. zin alnarak kullanlmtr. Andrew Davidhazy, 2007)

Problem neredeyse tam olarak- ok belirsiz olduu iin (knife-edged), sonu,


balang durumundaki s Sdeki ufack deiikliklere kar ok duyarldr (rnein,
diyelim ki, yandan geen bir arabann yaratt ekim gibi dsal etkilemeler hesaba bile

om

katlmadan). Paray nasl frlattmza bakmadan, istenilen sonucu kesin olarak verecek
balang durumunu, ivmeyi vs. kontrol altnda tutmak tamamen imknszdr. Ayrca,
tipik olarak bir sistemi aklayan diferansiyel denklemleri kesin dorulukla zmek te
imknszdr. Bu nedenle, sadece Snin bir paras olma olaslklarn verebiliriz, ki bu H
ve T sonularnn olaslklarn eletirir. Dolaysyla, bu durumda hakiki bir rassalla
ihtiya olmazsa bile, bu pratikte bizim iin nasl altn gsterir.

.c

Bu tanm rasgele deiken ve olaslk hakknda ne dndmz konusunda felsefi


noktay ne karrken (belli ki ok kullanl deil), uygulama amacyla, problemin ilk
aklama ekline bal kalmay tercih edeceiz.

tla

ri

Aklama 1. X geniliindeki herhangi bir A


olay iin, rneklem uzay Snin olaslk
fonksiyonu aadaki ifade araclyla X iin bir olaslk dalm fonksiyonu meydana
getirir.

de
rs
no

X biimsel olarak rneklem uzayn reel saylara dntren bir fonksiyon olmasna
ramen, genellikle onu deiken olarak ele alrz. Yani argmanlar belirtmeden onun
olaslkla ilintili eitli deerler aldn syleriz. Baka bir ifadeyle, uygulamalarn ou
iin, ilgili herhangi bir rneklem uzay S ve Snin olaslklarn referans gstermeden,
sadece P(X A)i belirtiriz. rnein yaz tura rneinde yukarda akland gibiSdeki koordinatlar(metal parann balang durumu, ivme, yn gibi) arasndaki doru
ilikiyi, sonularn (saysal olarak imkanszdr) ve koordinatlarn bir olaslk dalmn
anlamaya almayacaz, sadece (P(X = 1) = P(X = 0) = yi bilmemiz yeterlidir.
rnek 8. Eer 10 tane metalik paray birbirinden bamsz olarak atarsak, Bir rasgele
deiken tanmlayabiliriz, X = (Toplam Yaz Says). Bu tr rasgele deikenlerin
dalmlarn aada detayl bir ekilde analiz edeceiz.

ee

rnek 9. Bir seimin sonular ile ilgileniyor olabiliriz. Diyelim ki 100 milyon semen ve
iki aday var. Her semen adaylardan sadece birisi iin oy kullanabilir, hangi semenin
hangi aday iin oy kullandna bal olarak 2100 000 000 kadar farkl sonu vardr. imdi,
Aday A iin (ve esas ilgilendiimiz seim iin) kullanlan toplam oylar ile ilgili olarak bir
rasgele X deikeni tanmlayabiliriz. Oylarn saysnn her bir deeri iin, esas
sonularla ilintili bir say vardr, yani aday Ann btn sonular almasnn tek bir yolu
vardr. Her bir sonucun olasln basit olaslk cinsinden formle edebiliriz ve oradan
hareketle benzer deerler zerinde toplulatrma yaparak verilen toplam oy saysnn
olasln elde edebiliriz.
Aklama 2. Rasgele olaylarn tm, ilgilendiimiz gibi, saysal bir zelie sahip deildir
(rnein, eer olay yarn yamur yaacak ise, ne kadar yaaca ile ilgilenmeyebiliriz).

ee

de
rs
no

tla

ri

.c

om

O zaman rasgele deikene ilimemek gerekir, sadece olaylarla daha nceki gibi
ilgilenebiliriz. Baka bir seenek olarak ta, olayn geeklemesi halinde 1 dier
durumlarda 0 alan bir rasgele deiken tanmlayabiliriz (gelecekte bazen hile ye
bavuracaz).

Olaslk ve statistik Ders Notlar 5

om

Konrad Menzel
19 ubat 2009

.c

1. Kesikli Rasgele Deikenler

ri

Tanm 1. Eer bir rasgele deiken olan X sadece sonlu sayda deerler (ya da
saylabilir sonsuz) alrsa (x1, x2, ), Xin kesikli bir dalm vardr.

tla

Tanm 2. Eer rasgele deiken Xin kesikli bir dalm varsa, Xin olaslk younluk
fonksiyonu (p.d.f.) aadaki gibi tanmlanr:
fX(x) = P(X = x)

de
rs
no

Eer { x1, x2, } Xin muhtemel btn deerlerinin kmesi ise, o zaman herhangi bir x
{ x1, x2, } iin, fX(x) = 0dr. Ayn zamanda,

iin, X

Ann olasl,

ee

rnek 1. Eer X frlattmz zarn yzndeki say ise, btn tam saylar 1, 2, , 6 eit
ansldr. Daha genel olarak, kesikli uniform dalmn x1, x2, , xk saylarnn
zerinden dalmn p.d.fsiyle tanmlayabiliriz.
fX(x) = {

Bu S = {x1, x2 ,, xk} rneklem uzayl bir deneyin basit olaslyla ilintilidir.


rnek 2. Varsayalm ki adil bir madeni paray birbirinden bamsz olarak 5 kere frlattk
ve Xi gzlemlenen turalar iin bir rasgele deiken olarak tanmladk. O zaman, sayma
kuralarmza gre n(S) = 25 = 32 ve kombinasyon kuralnn kullanarak (k sayda tura) =
( ) elde edilir. Dolaysyla,

om
.c
ri
tla

Kaynak: MIT OpenCourseWare

de
rs
no

Bu olaslklarn toplamnn 1e eit olduuna not ediniz.

ee

Zar atma rneinde, her tek sonu tam olarak rasgele deikenin bir deeri ile ilintiliydi.
Dier yandan, be madeni para atma durumunda, diyelim ki, X = 2, X = 0 ile
karlatrldnda, sonularn saylar arasnda ok byk farklar vard. Sonularn
rasgele bir deikenin gerekleen deerleri ile eletirilmesi, rasgele deneyin sonular
eit olasla sahip olsa bile, ok arpk bir dalma yol aabilir.

1.1. Binom Dalm

om

nceki rnei genelletirmek iin, her birisi baarl ve baarsz olarak sonulanacak
(olaslklar eit olmak zorunda olmayan) ardk (dizi) n tane bamsz ve benzer
denemeyi gzlemlediimizi ve toplam baarl X saysyla ilgilendiimiz varsayalm.

ri

.c

rnek 3. Kalite kontrol iin, bir retim fabrikasnda araba paralar ynndan 100
paralk bir rneklem setiimizi varsayalm. Kalite kontroln geen para baarl
olarak belirlenirken, bir veya iki kritere uymayan para ise baarsz olacaktr.
rneklemden hareketle paralarn %1nden fazlasnn standartlara uymadna inanmak
iin iyi bir nedenimizin olmad sonucuna varmak istiyoruz. Bunun iin de toplam
iindeki bozuk paralarn toplam paynn bir fonksiyonu olarak baarszln dalmyla
ilgileniyoruz.

tla

Varsayalm ki baarnn olasl pye eit olsun, dolaysyla baarszln olasl q = 1


pdir. Denemeler varsaymsal olarak bamsz olduu iin, herhangi bir verili x baar
ve n x baarsz dizisinin sabit sral olasl aadaki gibidir:
px(1 p)n x

de
rs
no

Ancak, sadece baarl X says ile ilgilendiimiz iin, ( ) sayda baar xli farkl dizi
olduunu hesaba katmak zorundayz.

P(X = x) = ( ) px(1 p)n x

Tanm 3. Aadaki gibi bir olaslk younluk fonksiyonu olan X rasgele deikenin X
B(n, p) eklinde yazlan p ve n parametreli bir binom dalml olduu sylenebilir.

Daha nce her bir rasgele deney iin ayr ayr olarak olaslk dalm trettiimize, olas
sonularn, her olayn sonularn vs. yazdmza dikkat etmelisiniz. Binom dalm
rasgele deneylerin tmne hizmet eden bir modeldir. Bu kategoriye den herhangi bir
rnek iin, verilen bir (n, p) parametre setinin sadece olaslklara bakarz.

ee

rnek 4. Bir snf arkadanzdan biraz para koparmak iin, tura gelme olasl pL =
olan yamuk bir 1 madeni paray temin ettiinizi dnn. Maalesef, o para sizin dier
normal paralarnzla kart ve ancak 9 lirann 8 lirasn kola makinesine attnzda fark
ettiniz. Aceleyle hemen paray 10 kere frlatnz ve toplam olarak 8 tanesi tura geldi.
Bilinen eski bir madeni para hilesiyle arkadanz soymaya devam etmeye almak iyi

bir fikir olur muydu? Yoksa pF =

olaslkl sradan (adil) oyuna bal m kalrdnz? A =

om

kalan madeni para yamuktur ve B = 10da 8 Tura iin P(A|B) katr? Eer madeni
para adil ise,

ri

tla

imdi Bayes Teoremin ne syleyeceine bakalm:

.c

Eer yamuk ise

de
rs
no

Dolaysyla, geri kalan madeni parann gerekte daha ok sradan bir madeni para olma
olasl yksektir - ki toplam yle demiyor, nk tura olasl hala

ee

Ancak, elbette paray birka kere daha atmaktr daha iyi bir fikir olurdu. Eer deneyi
keyfi olarak sk sk tekrarlarsanz, o zaman en sonunda iki para arasndaki fark ihtiyari
bir doruluk derecesiyle tespit edebilecek duruma gelirsiniz. Bir parantez amak
gerekirse, bu uygulamay basit hipotez testi iin bir rnek olarak grebilirsiniz. Diyelim
ki, turann orann daha nce ki gibi tutmak artyla, dier bir 10 denemede yine 8 tura
elde ettiniz (buna olay C diyelim). O zaman, nceki admlarn aynsn takip ederek, bu
sefer evvelki P(B) yerine sonraki P(H|B)ye dayanarak koulu olaslk yle olur:

Dier bir seenek olarak, eer iki seriyi 16 tura ve 20 deneme olarak toplulatrrsak,

elde deriz.

om

Bylece, gncellemeyi ayn anda veya farkl zamanda yapm olmamz fark
etmeyecektir. Bu genel olarak arzulanan Bayesyen gncellemenin zeliidir: nihai
sonu kullandmz genel bilgiye baldr, gncelleme srasna deil.

2. Srekli Rasgele Deiken

tla

ri

.c

Verinin birok tr bir eit lmn sonucudur: en azndan kavramsal olarak, bir reel
say aralndaki herhangi bir deeri (bazen tmn) alabilen arlk, uzunluk, gelir vs.
gibi. Bu durumda, bir kesikli deikenin olaslk younluk fonksiyonun tanm kullanl
deildir, nk (a) olas sonularn miktar saylabilir deildir, bu nedenle de sadece tek
tek saylarn olaslklarnn toplamn alamayz ve (b) blnmez bir btnn belirli bir
deerinin olasl sfrdr. Bu yzden, kesikli durumdan ayr olarak, bu tr rasgele
deikenler ile ilgilenmek zorundayz.

de
rs
no

Tanm 4. Eer X bir say dorusundaki bir araln (snrlandrlm veya


snrlandrlmam) herhangi bir deerini alrsa, rasgele deiken Xin srekli bir dalm
vardr.

ee

Kesikli rasgele deikenler iin olaslk younluk fonksiyonu tanmlamak nispetten daha
basitti nk snrl sayda deeri vard. Srekli bir rasgele deiken saylabilir
rakamlardan daha fazla deer alr, bu yzden de elde etmek fazlaca aba gerektirir.
yle ki: rasgele deikenin alabilecei muhtemel deerleri bir grupa koyarak dalm
kesikletiriyoruz, yani P(X = x) olaslna bakmak yerine P(x1
X
x2) gibi bir
araln olaslna bakyoruz. Bunun grafiksel gsterimi histogramdr: say dorusu
zerinde bir grup sayy, x0 < x1 < < xn, sabitletiriyoruz ve X deerinin gruplara
dme olasln hesaplyoruz. Grup birbirinin devam iki say aralndr, yani P(xi-1 X
xi). Ondan sonra [x0, x1] aralndaki deerler iin aadaki fonksiyonu tanmlyoruz:

[xi-1, xi) aralnn uzunluuyla blmek, verili bir aralkta grafiin altnda kalan alann
rasgele deiken Xin aralktaki bir deeri alma olaslna eit olmasn garantiler. Yani
unu hesaplayabiliriz:

om
.c
ri
tla

de
rs
no

Sekil 1: Ayn Dalmn, srasyla, 10 ve 30 Gruplu Histogram

ekil 2: 60 Gruplu Histogram ve Srekli Younluk

ee

Bu henz tam tatmin edici deil, nk bu sadece bize x0 < x1 < < xn
saylarnn iki noktas arasna den Xin olasln hesaplamamza yarar, yoksa [xj, xk]
gibi bir alt araln iine deni deil. Bu sorunu, x1, x2, silsilesini klterek ve
bylece aral daraltarak zebiliriz. Bir birine komu iki nokta, xi-1, xi, arasn ihtiyari bir
kk dx deeri kadar daraltrsak, Xin a ve b gibi iki nokta arasna dmesini adan
bye
integrali olarak veren
fonksiyonunu elde ederiz. Bu limit bir srekli
rasgele fonksiyonun olaslk younluk fonksiyonu olarak adlandrlr.

de
rs
no

tla

ri

.c

om

Tanm 5. Eer rasgele deiken X srekli bir dalma sahip ise, Xin olaslk younluk
fonksiyonu (p.d.f.) pozitif bir fx(x) fonksiyonu olarak tanmlanr yani A
gibi herhangi
bir aralk iin

Kaynak: MIT OpenCourseWare

ekil 3. Srekli Rasgele bir Deikenin P.D.F.si

Olaslk fonksiyonun aksiyomlarndan, herhangi bir srekli p.d.f.nin aadaki ilikiyi


salamak zorunda olduunu grebiliriz.

ve

ee

Bylece, Eer A = [a, b]


hesaplayabiliriz:

iin P(X

A)yi bilmek istersek, aadakini

Aklama 1. Eer X srekli bir dalma sahip ise, herhangi bir x

iin

P(X = x) = 0

.c

om

Bu, ksmi olarak sezgilere aykr gibi grnebilir nk biz gerekte kesikli olan eyleri
(gelir, isizlik sresi gibi) tahmin etmek iin srekli dalm kullanyoruz. imdiye kadar,
hesapladmz herhangi bir olaslk iin herhangi bir srekli rasgele deiken rnei
grmedik.

3. rnekler

tla

ri

Bir rasgele deikenin, reel eksen zerindeki baz [a, b] aralklarnda yer aldn
varsayalm, Xin baz [a,b] (burada a a b b) alt gruplarna ait olma olasl, alt
araln uzunluu ile orantldr. .
Tanm 6. Eer aadaki gibi bir olaslk younluk fonksiyonuna sahip ise, X rasgele
deikeni [a, b], a < b, aralnda uniform dalr.

de
rs
no

fX(x) = {

ee

Sembolik olarak yle yazarz:

Kaynak: MIT OpenCourseWare

ekil 4. Uniform Rasgele Deiken iin p.d.f., X

[a, b]

U[0, 10] ise, o zaman

om

rnein, eer X

P(3 X 4) nedir? Olaslk P(X = 3) = 0 = P(X = 4) olduu iin, bu P(3 < X < 4)n
aynsdr.

.c

rnek 5. Varsayalm ki Xin p.d.f.si yledir:

) = 1 olduu iin, younluk 1e entegre olmal, bylece

de
rs
no

olmak zorundadr. Bylece a = .

tla

a ne olmak zorundadr? P(X


a

ri

fX(x) = {

P(1 < X < 2) nedir? Aadaki integrali hesaplayalm

ee

P(1 < X) nedir?

Olaslk ve statistik Ders Notlar 6

om

Konrad Menzel
24 ubat 2009

1. rnekler

ri

.c

Bir rasgele deikenin, reel eksen zerindeki baz [a, b] aralklarnda yer aldn
varsayalm, Xin baz [a,b] (burada a a b b) alt gruplarna ait olma olasl, alt
araln uzunluu ile orantldr. .

fX(x) = {

ee

de
rs
no

Sembolik olarak yle yazarz:

tla

Tanm 1. Eer aadaki gibi bir olaslk younluk fonksiyonuna sahip ise, X rasgele
deikeni [a, b], a < b, aralnda uniform dalr.

rnein, eer X

Kaynak: MIT OpenCourseWare

ekil 4. Uniform Rasgele Deiken iin p.d.f., X

U[0, 10] ise, o zaman

[a, b]

om

P(3 X 4) nedir? Olaslk P(X = 3) = 0 = P(X = 4) olduu iin, bu P(3 < X < 4)n
aynsdr.

rnek 1. Varsayalm ki Xin p.d.f.si yledir:

olmak zorundadr. Bylece a = .

ri

) = 1 olduu iin, younluk 1e entegre olmal, bylece

tla

a ne olmak zorundadr? P(X


a

.c

fX(x) = {

de
rs
no

P(1 < X < 2) nedir? Aadaki integrali hesaplayalm

P(1 < X) nedir?

1.1. Kark Rasgele Deikenler/Dalmlar

ee

Esas itibariyle iki farkl sebepten tr birok gerek-dnya verisi baz deerler iin
nokta etrafnda ylma gsterir:

baz sonular mekanik olarak baz deerler ile snrlandrlmtr, bylece bir ok
olaslk yn rasgele deikenin geniliinin tam kelerinde birikir, rnein
gnlk ya miktar herhangi bir reel pozitif deer alr, fakat ya miktarnn sfr
olduu bir ok gn vardr.

ekonomik kararlar alan kiiler kendilerini krlganlklar ve kesintilere gre


konumlandrarak belli kurumsal kuralara tepki gsterirler. rnein sosyal
gvenlik kurumlarna ve gelirler genel mdrlne rapor edilen gelirlere
baktmzda, vergi aralklarnn st snrlarnda ylma olduunu grrz (sz
konusu kiiler iin, gelirdeki en ufak art vergi orannda byk art anlamna
gelir).

om

.c

Ak konumak gerekirse, ilgili dalmlar srekli deildir, nk gerekleme her ne


kadar reel-deerli bir say olsa da, daha nceki blmde yaptmz gibi bir olaslk
younluk fonksiyonunu tanmlayamayz. Ancak nokta etrafnda ylma ile ayrca
ilgileneceiz. Bunun bir ksm ekonometri dersinizde karnza kacak, bu nedenle
bunun zerinde imdi ok fazla durmayacaz ve sadece bir rnee bakacaz.

ri

rnek 2. zleyen grafik 1979 ylna ait Current Population Survey (CPS) verisi
kullanlarak oluturulmutur1.

ee

de
rs
no

tla

Yazar, grafik iin geliri ok dk bir alt grup semitir, bylece asgari cretin
snrlandrmasnn aksine rneklem nispeten daha byk olmutur. 1979 ylnn asgari
cret deerinin solunda kalan baz kiiler var. Bu, muhtemelen ksm olarak asgari cret
kanunu kapsam dnda kalan sektrleri yanstmaktadr (rnein, iftilik, gen iiler
gibi).

Kaynak: MIT OpenCourseWare

ekil 2. 1979da Liseden Terk Kadnlarn Logaritmik cretleri

DiNardo, J., N. Fortin ve T. Lemieux. Labor Market Institutions and the Distribution of Wages, 19731992: A Semiparametric Approach. Econometrica 64, no. 5 (1996): 1001- 1044teki ekil 3b.

2. Birikimli Dalm Fonksiyonu (c.d.f)

FX(x) = P(X

om

Tanm 2. Bir rasgele deiken Xin Birikimli Dalm Fonksiyonu (c.d.f.) FX her bir reel
say iin aadaki gibi tanmlanr.
x)

.c

Dikkat edilecek olursa, bu tanm kesikli, srekli ve kark rasgele deikenler iin
ayndr. zelikle, Xin kesikli olmasna olanak verdiimizden ve P(X
x)in P(X < x)
den farkl olduunu aklda tutmak kouluyla, ilintili olaylar birbirinden ayrt etmek nemli
olmaktadr. C.d.f.nin tanmnda, Xi her zaman xten kk veya eittir eklinde
kullanacaz.

ri

C.d.f. bir olaslk olduu iin, olaslk fonksiyonunun btn zeliklerini iinde barndrr.
zelikle,

Btn x
x1 olay X

iin 0

FX(x)

x2nin iinde yer aldndan zelik 2yi elde ederiz.

de
rs
no

Ayrca, x1 < x2 iin X

tla

zelik 1. C.d.f sadece 0 ile 1 arasndaki deerleri alr.

zelik 2. Fx xin azalmayan bir deeridir, yani

x1 < x2 iin Fx(x1)

Fx(x2)

Eer x
ise, olasln gereklemesi bakmnda (X
x) olay imknsz olaya
yakn olur (burada bunun ne anlama geldii konusunda emin deilim), halbuki eer x
ise (X x) olay neredeyse kesindir ve bylece zelik 3 elde edilir.

zelik 3.

ee

Burada una dikkat etmek gerekiyor, eer sol limiti

olarak ve sa limiti de

olarak tanmlarsak, C.d.f. her zaman srekli olmak zorunda deildir.


xte srekli olabilmek iin, F(x), F(x-) = F(x+)i salamak zorundadr. Aadaki rnekte
grld gibi, genel olarak bu doru deildir.

de
rs
no

tla

ri

Burada 1, 2, , 6 saylarnda sreksiz atlamalar vardr.

.c

om

rnek 3. Rasgele deiken Xin zar atma says ile ilikilendirildii, zar atma rneini
tekrar dnn. O durumda Xin c.d.f.si aadaki gibi verilir.

Kaynak: MIT OpenCourseWare

ekil 3: Zar atmann c.d.f.si

Ancak, reel analizlerin bir sonucu olarak, bir monoton fonksiyon (burada zelikle c.d.f
FX) sadece saylabilir sreksiz birok noktaya sahip olabilir.

Daha da iler gitmek gerekirse, her zaman zelik 4e sahibiz.

ee

zelik 4. Herhangi bir c.d.f. sa-sreklidir, yani


F(x) = F(x+)

C.d.fnin daha fazla zeliini gsterebilmek iin imdi olaslkla ilgili bilgimizi
kullanabiliriz.

nerme 1. Verilen herhangi bir x iin,

P(X > x) = 1 - FX(x)

om

SPAT: Olasln zeliklerinden hareketle,

Ayn ekilde,

.c

nerme 2. ki reel say iin x1 < x2

tla

nerme 4. Herhangi bir x iin,

ri

nerme 3. Herhangi bir x iin,

de
rs
no

Bu son sonular srekli deikenler iin btn x deerleri iin zelikle (P(X = x) = 0
anlamna gelir.

rnek 4. Aadaki grafikte Gx(x) fonksiyonun bir c.d.f. olup olmadn kontrol edelim.

Kaynak: MIT OpenCourseWare

ee

Fonksiyon 0 ile 1 arasndadr, monotonik artmaktadr ve sa-sreklidir. imdi son 4


nermeyi bu rnee uygulayalm(sadece grafikten dorudan rakamlar elde edilecektir):

om

de
rs
no

tla

ri

.c

rnek 5. P.d.f ve c.d.fyi bir birine balayan tek-doru formlmzn olduu srekli
rasgele deiken durumundan farkl olarak, kesikli durumda daha yeni tarttmz
c.d.fden elde edilen olaslk sonularn kullanmak zorundayz. imdi ilikiye baka bir
grafik rneiyle bakalm:

Kaynak: MIT OpenCourseWare

ekil 4: Kesikli bir rasgele deiken iin c.d.f ve p.d.f

2.1 Srekli Rasgele Deikenler iin p.d.f ve c.d.f

ee

Eer X p.d.f f(x)li ve F(x)li srekli bir dalma sahip ise (karklk olmad srece
bundan sonra X iin altsimgeyi kullanmayacam), o zaman

Kalklsn temel teoreminden hareketle, c.d.f ve p.d.f. arasndaki ilikiyi bu durumda


aadaki gibi yazabiliriz:

om

rnek 6. Aadaki gibi bir fonksiyonumuz olsun,

tla

p.d.f. f(x) nedir?

ri

.c

F(x) bir c.d.f mi? - imdi temel zelikleri kontrol edelim:

de
rs
no

f(x) bir p.d.f. mi? -Dorusu, biz zaten temelde F(X)in bir c.d.f. olduunu gstermitik.
Aadaki ifadeleri hemen grebiliriz
btn x deerleri iin, f(x)

ve ayn zamanda,

ee

rnek 7. Eer X

U[0, 1] ise, o zaman c.d.f. aadaki gibidir:

om
.c
ri
tla

de
rs
no

Kaynak: MIT OpenCourseWare

ekil 5: X

U[a, b] iin p.d.f. ve c.d.f

3. X, Y gibi 2 Rasgele Deikenin Birleik Dalm


Birok durumda, sadece bir tek rasgele deiken ile deil, bir veya daha fazla deiken
arasndaki ilikiyle ilgileniriz, mesela bir srecin sonucunun bir dierinin sonucunu
etkileyip etkilemedii gibi.
rnein aadaki ilikilere bakabiliriz:

Tek yumurta ikizlerin IQs - yani X ocuklardan birisinin, Y ise dierinin IQs
olabilir.

ee

Eitime katlm X ile gelir Y: Eitim ile gelirin dalmna ayr ayr bakabileceimiz
gibi, bir veri tabanndan elde edilen verileri kullanarak iki deikeni bir grafikte de
gsterebiliriz. Dorusu, grafikte iki deiken arasnda phesiz bir iliki varm
gibi grnyor.

om
.c

ri

Kaynak: MIT OpenCourseWare

Relaps (nks) sresi: Kanseri ameliyat ile yok etmek her zaman mmkn
olmad iin, tbbi prosedrlerin etkinliini deerlendirmek isteyebiliriz. Bunu (a)
yeni bir ameliyatn gerekli olduunun anlalmas iin ne kadar zaman getiine
(X) ve (b) ne kadar sre sonra hastann ldne (Y) bakarak yaparz. Her ne
kadar iki sonula ilgilensek de, her iki olay da bamszdr: eer yeni bir
ameliyattan nce hasta lrse, onun lmemesi durumunda ne zaman yeniden
ameliyat olmak zorunda kalacan gzlemleyemeyiz.

de
rs
no

tla

ekil 6. Okullama ve Gelir

Dersin bu blmnde, iki (veya daha fazla) rasgele deikenin, aralarndaki iliki dahil,
ayn anda zeliklerini ele alacaz. Ayn zamanda bamszlk ve koullu olaslk
olaylar ile benzeen kavramlar da tantacaz. (X, Y) (ortaklaa) ayn deerleri (x, y)
alan iki rasgele deiken olsun. Her iki deiken srekli, kesikli veya kark olabilir.

3.1. Kesikli Rasgele Deiken

Kesikli durumda, herhangi bir (X, y)

iin birleik p.d.f. aadaki gibidir:

ee

Eer {(x1, y2), , (xn, yn)} (X,Y)nin mmkn olan btn deerlerini ierirse, o zaman

Herhangi bir alt kme A

iin,

tla

ri

.c

om

rnek 8. Bir spermarkette, X sradan bir kasa srasnda bulunan mterilerin says,
Yde ekspres kasada bulunan mterilerin says olsun. Bu durumda X ile Ynin ortak
p.d.fsi aadaki gibi grnebilir: Bu yapdaki bir tablo, (X, Y)nin birleik p.d.flerinden
elde edilen hcre-olaslklarn zetleyen ve marjinal olaslklarn yanda gsteren,
ihtimal tablosu olarak adlandrlr. Daha ncede tartld gibi, tablodaki olaslklarn
toplam 1 olmal ve nitekim yleler.

Tablo deerlerinden, iki deiken arasnda bir eit iliki varm gibi grndn
grebiliyoruz: Sradan kasada deme yapan kii says yksek olduu zaman, ekspres
kasadaki kii says da yksek olma eilimdedir.

ee

de
rs
no

Tabloda verilen p.d.f. lere dayanarak farkl olaylar iin de olaslklar hesaplayabiliriz:

Olaslk ve statistik Ders Notlar 7

om

Konrad Menzel
26 ubat 2009

ri

.c

1. X,Y gibi 2 Rasgele Deikenin Birleik Dalm


(devam)

tla

X ve Y ayn S rneklem uzaynda tanmlanm iki srekli rasgele deikendir. (X,Y)nin


bileik p.d.f.si, fXY(x,y), (x,y) dzleminin herhangi bir alt kmesi olan A iin aadaki
ifadeyi salayan bir fonksiyondur.

de
rs
no

Tek-deikenli durumda olduu gibi, bu younluk aadaki koullar salamak


zorundadr:
her bir (x, y)

iin fXY(x,y)

ve

Bylece,

herhangi bir nokta sfr olaslkldr


dzlemdeki herhangi bir tek-boyutlu eri sfr olaslkldr

ee

rnek 1. Wyoming zerinde rasgele bir yerde bir UFO grlr. Dnyann eimini
grmezlikten gelirsek, Wyoming gereki bir ekilde 276 x 375 millik bir dikdrtgen
olarak tarif edilebilir. UFOnun konumu btn eyalet zerinde uniform olarak dalmtr
ve rasgele boylam deeri X (111-104 derece aras) ve rasgele enlem deeri Y ( 41-45
aras) olarak ifade edilsin.
Bu, koordinatlarn birleik younluunun aadaki ifade ile verildii anlamna gelir.

om

Eer bir UFO 40 millik bir uzaklktan grlebilirse, eyaletin aa yukar tam ortasnda
yer alan Casperdan grlme olasl nedir?

de
rs
no

tla

ri

.c

imdi soruna grafik yardmyla ile bakalm: Casperdan UFOnun grlebilecei yerlerin
kmesi, Casper etrafnda 40 Mil yarapl bir daire ile ifade edilebilir. Ayn zamanda,
uniform younlua gre, UFOnun eyaletin A yerinden grlebilme olasl (yani A
zerinden sabit younluun integrali) Ann kaplad alan ile orantldr. Dolaysyla,
herhangi bir integral almak zorunda deiliz, nk olasl bulmak tamamen geometrik
bir uygulamaya indirgenebilir.

Kaynak: MIT OpenCourseWare

ekil 1. Casper, WYde grlebilen (x, y)deki UFO

Olasl yle hesaplayabiliriz:

ee

)
(

Uniform dalm iin genellikle karmak integral almaya ihtiya duyulmadna dikkat
etmelisiniz, nk her eyi salt geometrik olarak ileyebilirsiniz.

om

Son rnektekinden farkl olarak, olaslklar elde etmek iin younluk fonksiyonun
integralini almann yolu yoktur, nk herhangi bir sabit olmayan younluk, olaslk
ylmas asndan farkl blgeleri yeniden arlklandrr. Bunu, ak ve sistematik bir
ekilde izleyen rnekte greceiz:

.c

rnek 2. im bime makinenizde 2 buji olduunu varsayalm, ve X 1nci bujinin mrn


Yde 2nci bujinin mrn temsil etsin. Varsayalm ki dalm aadaki gibi ifade
edebiliyoruz.

de
rs
no

tla

ri

Sayfa 4teki ekil 2 birleik younluun nasl grneceini gstermektedir.

Kaynak: MIT OpenCourseWare

ekil 2: 1. ile 2. Bujinin X ve Y mrlerinin Birleik Younluu

Dorusu, bu younluk bujilerin birbirinden bamsz olarak zaman ierisinde


deimeyen sabit bir orannda bozulduu varsaymndan tretilebilir.

ee

Eer her iki buji alt srece im bime makinesi de alacaksa, im bime
makinesinin 1000 saat ierisinde bozulma olasl nedir?

om
.c

ri

Kaynak: MIT OpenCourseWare

de
rs
no

tla

ekil 3. im Bime Makinesi 1000 Saatten nce Bozulur Olaynn lk Durumu

ee

Sz konusu olaslk, birinci bujinin bozulmas halinde sadece ikinci bujinin kullanlmas
durumunda nedir? Yani P( X + Y
1000)i nasl hesaplarz? Bunun sadece
ilgilendiimiz olay deitirdiine dikkat ediniz, yani integralini hesapladmz 2 alan
deiti, halbuki hala ayn younluun integralini alyoruz.

om
.c
ri
tla
de
rs
no

Kaynak: MIT OpenCourseWare

ekil 4: im Bime Makinesi 1000 Saatten nce Bozulur Olaynn kinci Durumu

Tekrar etmek gerekirse, srekli iki-deikenli rasgele deikenler ile alakal olaylar
dzlemdeki alanlara tekabl eder. Ve bu alanlar zerinden younluun integralini alarak
olasl buluruz.

ee

2. X,Y gibi 2 Rasgele Deikenin Birleik c.d.f.si


Sadece tanmlar vereceim. Bu derste bunu ok fazla kullanmayacaz, fakat bunu
grmeniz gerekiyor.
Tanm 1. Rasgele deikenler (X, Y) iin birleik c.d.f., (x, y)
fonksiyonu olarak tanmlanr.

iin, FXY(x,y)

Son terimi eklemek zorundayz nk daha nce iki kere karld.

om

Birleik c.d.f.den olaslklar aadaki gibi hesaplarz.

de
rs
no

3. Marjinal p.d.f.ler

tla

Kesikli durumda,

ri

.c

Birleik c.d.f.ler p.d.fler ile aadaki ekilde ilikilidir: srekli rasgele deikenler iin

Eer birleik dalmlarmz varsa, tek deiken Xin dalmn yeniden elde etmek
isteyebiliriz. Eer X ve Y bileik p.d.f.si fXY olan kesikli rasgele deikenler ise, o zaman

Eer X ve Y srekli ise, esas itibariyle toplam integral ile deitirmemiz gerekir, bylece

ee

rnek 3. Bu rnek 1977de1 Redbook dergisi tarafndan toplanan gerek evlilik-d


ilikiler verisine dayanmaktadr. Ankette, kiilerden evliliklerini 1den (mutsuz) 5e
(mutlu) leklemeleri ve evlilik-d ilikilerinin says bl yllar itibariyle evlilik sresini
belirtmeleri istenmi. imdilik nce evlilik kalitesi X ile yllar itibariyle evlilik sresi Ynin
1

Verinin mevcut olduu adres: http://pages.stern.nyu.edu/wgreene/Text/Edition6/tablelist6.htm

bileik dalmna bakalm. P.d.f.den elde edilen hcre olaslklarndan balayabiliriz,


ve daha sonra tablonun solunda ve altnda bulunan marjinal p.d.f.leri doldurabiliriz:

tla

ri

.c

om

lgin bir ekilde, her ne kadar marjinal dalmlar eit dalmsa da, birleik dalmlar
tablonun alt sol ve st sa kelerinde, birleik p.d.f.lerde daha dk deerler alarak
st sol ve alt sa kelerinde younlam gibi grnyor.

de
rs
no

rnek 4. Geen seferki iki bujili rneini hatrlaynz. Birleik p.d.f aadaki gibiydi:

Xin marjinal younluu yle olur:

ee

Benzer ekilde,

4. Bamszlk
Eer P(AB) = P(A)P(B) ise, A ve B olaylarnn bamsz olduunu sylemitik. imdi
benzer bir kavram rasgele deikenler iin tanmlayacaz.

om

Tanm 2. Eer herhangi bir A, B


blgesi iin aadaki iliki salanrsa rasgele
deikenler olan X ile Ynin bamsz olduunu syleyebiliriz,

Bu gereklilik koulunun kat olduuna dikkat ediniz: X


A ve Y
bakyoruz ve o iftlerin tmnn karlkl bamsz olmasn istiyoruz.

B tr olaylara

.c

Bu tanm kendi bana pratik deildir nk kontrol etmek zordur, ancak eer X ile Y
bamsz ise, tanmdan hareketle u ifadeyi elde ederiz:

ri

Buradan, genellikle dorulanmas daha kolay olan aadaki koulu elde edebiliriz.

tla

nerme 1. X ve Y bamszdr eer sadece ve sadece bunlarn birleik ve marjinal


p.d.f.leri aadaki ilikiyi salarsa,

de
rs
no

SPAT: Kesikli rasgele deikenler iin, bu dorudan A = {x} ve B = {y} tanmlar


uygulanarak elde edilebilir. Srekli deikenler iin, eer X ile Y bamsz ise

denkleminin her iki tarafnn da trevini alarak aadakine ularz:

o zaman

Bunun aksine, eer marjinal p.d.f.lerin arpm birleik p.d.flere eit ise,
integralini alrz

ee

Dolaysyla marjinal zerindeki koul bamszl salar ve eitliin her iki ynn de
ispatlam oluruz.

rnek 5. Evlilik D ilikiler rneine geri dnecek olursak, evlilik kalitesi X ile yllar
itibariyle evlilik sresi Ynin marjinal p.d.f.lerini rapor ettiimizi hatrlaynz, yani

om

ve

.c

Eer iki rasgele deiken gerekten de bamsz ise birleik dalm nasl grnmelidir?
Burada unu elde ederiz.

de
rs
no

tla

ri

Birleik p.d.f.nin o noktadaki gerek deeri 13.48di ve aka grld gibi iki
deiken bamsz deildir. imdi bamszlk varsaym altnda tablonun geri kalann
doldurabiliriz: Bunu son tablomuzla karlatrnca baz sistematik elikiler olduunu
grebiliriz, zelikle oluturulan birleik p.d.f.
belirgin bir ekilde diyagonalde
younlamamaktadrlar, halbuki bu gerek birleik p.d.f.lerin zerinde durmaya deer
zelliiydi.

Fakat gerekten bu X ile Ynin bamsz olmad anlamna m gelir? Dikkat edilmesi
gereken bir husus, olaslklar, belirtilen dalmdan ekilen rneklemden edindiimiz
birleik p.d.flerden hesapladk, bu nedenle gerek hcre olaslklarn doru bir ekilde
lebilme konusunda baz belirsizlikler var. Dersin son blmnde, oluturulan ve
gerek p.d.f.ler arasndaki farkn X ile Ynin bamsz olmadn gsterecek kadar
byk olup olmadn formal olarak neren bir yntem greceiz.

ee

rnek 6. Daha nceki iki bujili rneini hatrlaynz. Birleik p.d.f. aadaki gibiydi

ve bir nceki blmde de marjinal p.d.f.leri elde etmitik

om

Dolaysyla, bunlarn arpm yledir:

Bylece 1nci ve 2nci bujinin yaam sreleri bamszdr.

ri

.c

Aklama 1: Srekli rasgele deikenler iin, bileik ve marjinal younluklarn


bamszlnn koulu aadaki gibi yeniden belirtilebilir: Her ne zaman bileik p.d.fnin
faktrn alrsak, yani,

tla

o zaman X ile Y bamszdr. Burada g(.) sadece xe ve h(.) sadece yye baldr.
zelikle belirtmek gerekirse, marjinal younluklar dorudan hesaplamak zorunda
deiliz.

de
rs
no

rnek 7. Diyelim ki, aadaki gibi bir birleik p.d.fmiz var

O zaman, rnein g(x) = ce-x ve h(y) = e-2y dir diyebiliriz. Her ne kadar bunlar uygun
younluklar deilse de, X ile Ynin bamsz olduunu gstermek iin yeterlidir.
rnek 8. Varsayalm ki aadaki gibi bir birleik p.d.f.miz var.

X ve Y bamsz olabilir mi?

ee

Her iki durumda (yani x2 y 1 salanr m yoksa salanmaz m?) p.d.f. x ve ynin
fonksiyonlarna ayrtrlrsa (faktr, N) (sfr blm iin doruluu phelidir) bile, Xin
desteinin Yye baml olduunu grebiliriz ve dolaysyla X ve Y bamsz olamazrnein eer X 1/2 ise, Y 1/4 olmak zorundadr. Bylece

ee

de
rs
no

tla

ri

.c

om

X ve Ynin bamsz olabilmesi iin iki rasgele deikenin bileik desteinin dikdrtgen
(byk ihtimalle btn 2) olmak zorunda olduuna dikkat ediniz. Eer deilse,
gerekleen baz X deerleri iin, belli Y deerleri gerekleebilecekken,
gerekleemez. Fakat eer doruysa, yani Xin Y hakknda bilgi verdiini bilirsek, o
zaman onlar bamsz olamaz. Destek iin bu koul tek bana bamszl salar.

Olaslk ve statistik Ders Notlar 8

om

Konrad Menzel
3 Mart 2009

.c

1. Koullu p.d.f.ler

de
rs
no

Eer X ile Y kesikli ise,

tla

ri

Tanm 1. X verilmiken Ynin koullu p.d.f.si

Bu, sadece iki hafta nce tanmlanan ve Y = y verilmiken X = x durumuyla ilintili olayn
koullu olaslyla ilintisidir.
Unutmamak gerekir ki,

Koullu deikenin belirli bir deeri iin, koullu p.d.f normal p.d.f.nin btn
zeliklerini tar(yani pozitiftir, integrali 1dir gibi),
Tanm her iki taraftan herhangi bir saydaki rasgele deikene genelletirilebilir.

ee

rnek 1. Evlilik d ilikiler verisine geri dnelim ve gerekte en ok ilgilendiimiz


deikenlere bakalm: son yldaki iliki says, Z, ve kendi kendine rapor edilen evlilik
kalitesi, X. Anketi dolduranlarn 4te 3 herhangi bir ilikilerinin olmadn belirtikleri
iin, evlilik kalitesine koullanm iliki says Znin p.d.f. sine bakmak ok daha yol
gsterici olabilir.

Dk deere, X = 1, koullanrsa olursa,

om

Bileik p.d.f bu ekilde elde edilecektir.


aadakini elde ederiz.

tla

ri

.c

X = 1, 2, 3, deerleri iin koullu c.d.f.lerini beraber bir tabloya koyarsak, unu elde
ederiz.

de
rs
no

Bu uygulama neden ilgi ekicidir? Tabloda birleik p.d.f.lerle genel resim ok ak


olmad halde, evlilik kalitesinin dk deerleri iin, koullu p.d.f.lerin yksek iliki
saysna fazla olaslk yklediini grebiliyoruz.
Bu evlilikteki tatminsizliin, evlilik-d ilikiye neden olduu anlamna gelir mi? Kesinlikle
hayr: rnein, uygulamay tamamen ters yapabilirdik ve iliki says Z verilmiken, rapor
edilen evlilik tatmini Xin koullu p.d.f.lerine bakabilirdik. Yani

ee

Ya da koullu p.d.f.leri bir tabloda zetleyebilirdik.

Yksek deerli iliki says Z veriyken, Xin koullu p.d.f. leri dk deerli evlilik
tatminine daha yksek olaslk vermektedir. Bylece rakamlar, evlilik-d ilikinin
evlilie zarar verdii eklinde de okuyabilirdik. Bu genellikle ters nedensellik olarak
atfedilir: Ann Bye neden olduuna inansak bile, B ayn zamanda Aya neden olabilir.

om

Dolaysyla, koullu olaslk her iki hikyeyle tutarl olacak ekilde hareket etse bile,
ilikiyi iki ynl nedensellik olarak yorumlayamayz, nk her iki hikaye de eit
derecede kabul edilebilirdir ve varsaymsal olarak gerek yaamda her ikisinde de
gereklik pay vardr.

2. Tekrar

.c

Snfta yaptmz hi rnei ezberlemenizi beklemiyorum, ancak zelikle metin


problemleri zel durumlarn/problemlerin modelleri olarak olduka yararl olabilirler.
Dersler srasnda tarttmz rnekler ile benzerlik kurarak belli bir soru iin bir zm
stratejisi gelitirebilirsiniz.

ri

1. Olaslk
Bunu tartmayacaz.
Olasln tanm
S iin P(A)

de
rs
no

(P1) btn A

tla

rneklem Uzay, Kme Teorisi ve Temel Operasyonlar

(P2) P(S) = 1

(P3) Eer A1, A2, , ayrk kmelerinin bir dizisi ise

zel Durum: Basit olaslk


S sonlu

P(A) =

burada n(B) B kmesindeki sonu saysn ifade etmektedir.

ee

Olaslk Fonksiyonun zelikleri

Olasln Hesaplanmas
Sorunlara u sraya gre yklenin

om

(i) sonular itibariyle rneklem uzayn ve ilgilenilen olay tanmlaynz

(ii) basit olaslklar iin, her bir sonucun olumasn eit derecede mmkn
klacak ekilde bir rnek uzay tanmladnzdan emin olunuz,

.c

(iii) eer iin iinden kmazsanz, rneklem uzayndaki sonular dorudan


yazmaya aln.
Sayma Kurallar

ri

de
rs
no

Temel kurulum: Nnin X1, , XN saydaki objesini elde et


arpma Kural: Bir deneyi her birisinin mi saydaki sonucu dier blmlerin
sonularna bal olmayan k sayda blm kadar faktre ayrabilmek gerekir. Bu
bazen yanltcdr (rnein satran gibi).
Kmeden birka farkl yoldan k kadar obje ekme (snav iin onlar
hatrlamalsnz):
1. k yerine koyma ile ekilir, sralama nemlidir: Nk sayda ihtimal
2. k yerine koymadan ekilir, sralama nemlidir (zel durum: permtasyon k

tla

= N):

3. k

yerine

( ) =

koymadan

ekilir,

sralama

nemsizdir

saysn verecek olan btn farkl ardk baarlar saynz).


blntler: N objeyi k gruba yerletirme yollarnn saysdr. Objenin tanm
nemli deildir (rnein 4 torbaya be benzer mavi topu farkl ekillerde
yerletirme says gibi): genel olarak (
) kadar ihtimal vardr. Bunu aada
tartacaz.
Btn bu sayma kurallarnn yle veya byle arpma kuralndan elde edildiini
grdk. Bazen ayn olay elde etmek iin bir sayy farkl saydaki ihtimale blmek
zorunda kaldk (rnein ayn kombinasyonun farkl srada elde edilmesi gibi)

Bamszlk, koullu olaslk, Bayes Teoremi

eer P(AB) = P(A)P(B) ise A ve B bamszdr,

eer P(B) > 0 ise koullu olaslk P(A|B) =

P(A|B) = P(A)dir eer sadece ve sadece A ve B bamsz ise,


Toplam olaslk kanunu: eer B1,, Bn Snin blntleri ise.

ee

(kombinasyon):

sayda ihtimal (rnein binom dalmda, genel baar

sayda ihtimal

Bayes Teoremi(basit formlasyon): Eer P(B) > 0, o zaman aadaki ifadeyi


elde ederiz:

.c

om

Toplam olaslk kanunu koullu olasl marjinal olasla balar, yani P(A)nn nasl
P(A|B1) P(A|Bn)ye balanaca gibi. Klasik uygulama: alt-nfus/alt-vaka zerinden
toplulatrma, rnein farkl baypas ameliyatlarna gre lm oranlar gibi.

ri

Bayes teorisi bize koullama srasnn nasl deitirileceini syler, yani nasl
P(B|A)dan P(A|B)ye gidilir gibi. Klasik uygulama: B verisi verildiinde A ile ilgili inancn
gncellenmesi gibi, rnein tbbi testler rnei gibi.

tla

Snav iin bunlar tamamen kavrayarak bilmeniz gerekir.

de
rs
no

2. Rasgele Deikenler ve Dalm Fonksiyonlar


rasgele deikenler rasgele olaylarn saysal zelliklerini verir
rasgele deiken X rneklem uzay Sden reel saylar ye giden bir fonksiyondur
Snin olaslk fonksiyonu Xin ile tanmlanm olaslk dalmn ortaya karr.

Olaslk younluk fonksiyonu (PDF) fX(x) aadaki gibi tanmlanr

ee

Birikimli younluk fonksiyonu (CDF) FX(x) aadaki gibi tanmlanr

Kesikli bir rasgele deiken iin nemli bir rnek olarak, ardk N bamsz
denemedeki X sayda baar y aklayan Binom dalm iin biraz zaman harcadk.
Her denemedeki baarnn olasl pye eittir. Binom dalm iin p.d.f. aadaki
gibiydi (bunu snav iin bilmelisiniz):

om

CDF ve PDF arasndaki iliki

eer X kesikliyse toplamn al.

eer X srekliyse integralini al.

CDFden PDF yle elde edilir:


eer X kesikliyse

de
rs
no

tla

ri

.c

PDFden CDF yle elde edilir:

eer X srekliyse

Ayn ekilde, CDFnin zeliklerini hatrlaynz

btn x
iin 0 FX(x) 1,
Fx(x) xte azalan deildir
Fx(x) sadan sreklidir
Fx(x) her yerde sreklidir, Sadece ve sadece X srekliyse.

Birleik Dalm

ee

Aadakiler bakmtk

X ve Ynin birleik dalm (kesikli veya srekli)


PDFli Xin marjinal dalm

3. Rasgele Problemler

.c

X verilmiken Ynin koullu olasl

ri

om

Rasgele deikenlerin bamszl, en nemlisi sadece ve sadece X ve Y


bamsz ise btn (x, y)
iin

Genel olarak, bulunan ve kendisine gnderilen resimlerin sadece %1i orijinal


kyor, buna G olay diyeceiz.
Bulunan resimler orijinal Monetin yaptndan farkl olarak belli pigmentlerin
farkl kulanm frekansna sahiptir.
o Bulunan resimlerin %20sinde sar kadmiyum Y grlmtr, halbuki
orijinallerin sadece %10u yledir..
o Bulunan resimlerin %80ninde ham toprak rengi boya U grlmtr,
halbuki orijinallerin sadece %40 yledir.
o Bulunan resimlerin %40nda yank sienna rengi S grlmtr, halbuki
orijinallerin %60 yledir.
Gelen resim yank sienna kullanmaktadr, ancak sar kadmiyum ve ham toprak
rengi deil.

de
rs
no

tla

rnek 2 (Bahar 2003 Snav). Bir Monet uzmanna szde kaybolan bir Monet resmi
verilir. Resmin orijinal olma olaslklarn deerlendirmesi istenir. Uzman aadaki
bilgiye sahiptir:

Bu resmin orijinal olma olasl nedir? Soruyu cevaplandrmak iin herhangi bir ilave
varsaymda bulunmak zorunda myz?

ee

Bu problem yle bir yapya sahiptir:


Problem bize resmin orijinal olmas (dnyann hali G) durumunda hangi rengin (veri
SYCUC) ne olaslkla grneceini sylyor gibi grnyor, P(B|A). Ancak, biz gerekte
iinde kullanlan renklere gre resmin orijinal olma olasln bilmek istiyoruz, yani
P(A|B). Bu nedenle koulun srasn deitiriyoruz, onun iin Bayes teoremi
kullanacaz. ncelikle problemde yer alan bilgiyi toparlayalm:

om
.c

ve

tla

ri

Bayes teoremini uygulamak iin neye ihtiyacmz var? Teorem bize unu syler:

Ancak, her rengin marjinal olasl biliniyor, bize birleik olaslk gereklidir (hem G
koullu hem de koulsuz)

de
rs
no

Bu nedenle, bu noktada ilave bir varsaymda bulunmak zorundayz. Soruna


yklenmenin en kolay yolu, koullsuz ve Gye koullanm olarak, pigmentin renk
arasnda kullanmnn bamsz olduunu varsaymaktr, yani

ve

Bamszlk varsaym altnda Bayes Teoremini kullanarak u sonuca varrz:

ee

Bu varsaymn ne derece nemli olduunu grmek iin, farkl pigment trleri arasnda
farkl bir baml yap kefedin: varsayalm ki orijinal Monet iin her sienna S kullanlan
resimde, ayn zamanda kesin olarak ham toprak rengi U da kullanlmaktadr. O zaman,
koullu olaslk tanmna gre unu elde ederiz:

Bylece gerek bir Monet iin, sienna Syi bulmak imknszdr fakat ham toprak rengi U
deil, bu nedenle kesinlikle biliyoruz ki sz konusu resim Monet olamaz ( resmimiz bu

kombinasyona sahip olduundan, genel olarak bulunan btn resimler iin yle olmak
zorundadr).

om

Toparlayacak olursak, bu problem bize soruyu cevaplandrmak iin yeterli bilgi vermedi.

.c

rnek 3(Gz 2003 Snav). Benim evimde geri dnm 10 a.m. ile le saati arasnda
bir ara toplanr. pn topland aralkta herhangi bir dakika herhangi bir dieri kadar
olasdr. p ise saat 8:30 a.m. ile 11.00 a.m. arasnda bir ara toplanr ve yine
tekrarlamak gerekirse herhangi bir an herhangi dier bir an kadar olasdr. ki toplama
zaman birbirinden bamszdr.

ri

(a) ki toplama zamannn, R ve G, birleik p.d.f. si nedir?


(b) Geri dnmn pten nce toplanma olasl nedir?

tla

Rnin marjinal dalm uniformdur (srekli), younluu ise aadaki gibidir:

de
rs
no

Gnin marjinal dalm kesiklidir, p.d.f. si ise aadaki gibidir:

Bamszla gre, birleik p.d.f. yledir:

G olaynn olasl aadaki gibi hesaplanr:

ee

rnek 4. Snfnzdaki arkadalarnzdan birisi aadaki problemin nasl zleceini


sordu: N sayda birbirinden farksz karatahtay k saydaki farkl snfa datmak iin ka
farkl yol vardr?
Bu, k snf iin bir karatahta blnts seme ile ilintilidir.
Hesaplamalar aadaki gibi yapabiliriz:
o B1, B2, , BN karatahtalaryla kartrlacak, k-1 kadar ayrtrc, Z1, Z2, ,
Zk-1, tanmla
o snflara her yerletirilen karatahtay B1, B2, , BN , Z1, Z2, , Zk-1nin yeniden
sralanmas olarak tarif et. Sralamada ilk Zden nce grnecek olanlar ilk snfa,
ikinci ayrtrcya kadar olanlar ikinci snfa koyacamz v.b. tahtalardr. Eer

om

sralama, rnein Z5, B7, B2, B5, Z4, B9, , ise, o zaman birinci snfta karatahta
olmayacak, tahta 7, 2, ve 5 2nci snfa gider, v.b.
o dizinin farkl saydaki sralamas (N + (k - 1)! kadardr.
o karatahtalar ve ayrtrclar eit olduu iin (snflar deil), her bir karatahtann
permtasyonu (N! permtasyon) ve ayrtrcs (k - 1)! permtasyon) ile blmek
zorundayz.

ee

de
rs
no

tla

ri

.c

Btn paralar bir araya getirince aadaki gibi btn olas yerletirmeleri elde
ederiz.

Olaslk ve statistik Ders Notlar 9

om

Konrad Menzel

.c

10 Mart 2009

ri

1. Rasgele deikenlerin Fonksiyonlar

olduundan , u ve Xin bileimi de ayn zamanda Sden reel saylara bir

de
rs
no

ve u :
elemedir:

tla

Dersin bu blmnde rasgele deikenlerin fonksiyonlarna bakacaz, Y = u(X). Ynin


yine bir rasgele deiken olduunu not ediniz: X rneklem uzay Sden reel saylara bir
eleme (mapping) olduu iin

rnek 1. Eer X im bime makinasndaki birinci bujinin ve Y ikincinin mr ise, o


zaman ikisinin mrnn toplamyla ilgilenmi olabiliriz, Z = X + Y.
rnek 2. MITye gelmeden nce, birka Alman aratrma bursuna bavurdum, bylece
alacam bursa bal olarak aylk X Euro kadar cret alacaktm. Dviz kuru, diyelim ki,
Eyll 2005te Y dolar/Euro olsun. Bavurduum dnemde her iki miktarda belirsizdi,
fakat paray ABDde harcayacaktm, dolaysyla alacam Z = X*Y miktar esas
ilgilendiim miktard (en azndan dolar deiiminden sonra ikyet etmeyeceim kadar).

ee

imdi dntrlm rasgele deiken u(X) iin younluk ve c.d.fyi nasl elde
edeceimizi bilmek istiyoruz, bylece p.d.f. si bilinen bir rasgele deikenin sadece
kendisini ieren bir soruda olduu gibi, bir rasgele deikenin fonksiyonunu da ieren
her bir problemi ele alabilelim.
durumu dneceiz
1. lgili deiken kesiklidir
2. lgili deiken sreklidir
3. X sreklidir ve u(X) kesin artandr

Son durum elbette ikincinin zel durumudur, fakat greceimiz gibi allmas en
kolay olandr.

om

1.1 Kesikli Durum 2-Adm Yntemi

.c

Eer X p.d.f.si fX(x) olan bir kesikli rasgele deiken ise ve u(.) deterministtik bir
fonksiyon iken Y = u(X) ise,

de
rs
no

O zaman eer Y = g(X) = |X| ise,

tla

ri

rnek 3.

Eer X kesikli ise Ynin de kesikli olduunu not ediniz.

1.2. Srekli Durum 2-Adm Yntemi

Eer X p.d.f.si fX(x) olan bir srekli rasgele deiken, ve Y = u(X) ise, o zaman Ynin
c.d.f.si aadaki ifade ile verilir:

ee

Eer Y de ayn zamanda srekli ise, o zaman

Eer X srekli ise, Ynin srekli olmasnn gerekmediin not ediniz.

rnek 4. Xten kk en byk tamsay Y = [X], Xin srekli veya kesikli olup
olmamasna bal olmadan, kesiklidir.

om

rnek 5.

imdi una bakalm,

.c

Y = X2

[0, 1] iin, c.d.f

de
rs
no

Toparlarsak,

tla

ri

X [-1, 1]den Y = [0, 1] olur. Ynin younluunu nasl elde ederiz? y


aadaki gibidir.

ee

Y srekli olduu iin, younluu yle hesaplarz,

1.3. Bire-Bir Dnm iin Deiken Deitirme Forml

om

Genel olarak Ynin younluunu, zelikle bir integral ve bir trev ierdii iin, c.d.fler
araclyla Xin fx(x) younluundan elde etmek uygun deildir. Bu durumda, p.d.f.ler
arasnda daha direkt bir balant olup olmad merak edilebilir.

ri

.c

Daha genel duruma gemeden nce, varsayalm ki baz sabit deerler a > 0 iin u(x) =
axtir. O zaman Y = u(X) = aXin c.d.f si aadaki ile elde edilir.

tla

Zincir kuraln kullanarak, Ynin p.d.f.sini yle tretebiliriz:

de
rs
no

Bunun iin en iyi sezgisel deerlendirme nedir? Eer a > 1 ise, dnm, rasgele
deikenin zerine dt ekseni germe olarak dnebiliriz. Bu durum, eksen
zerindeki herhangi bir iki noktaya ann arpm kadar yer deitirtir, fakat deikenin iki
nokta arasna dme olasln sabit tutar. Dolaysyla, Xin dalm ile
karlatrldnda Ynin dalm 1/a arpm kadar seyreklemi olur. Bunu iinde bir
miktar zm olan hamur ile hayal edebiliriz. Hamuru ne kadara yayarsak, hamur
iindeki zmlerin hamur tahtasnn yzeyine gre dalm o kadar seyrek olacaktr.
Xin u(.)sunun trevlenebilir monoton dnm iin aadaki sonucu elde ederiz.

nerme 1. X fX(x) younluu bilinen rasgele srekli bir deiken olsun, ayrca P(a
X
b) = 1 ve Y = u(X)dir. Eer u(.) |a,b| gibi bir aralkta kesin artan ve trevlenebilir ise
ters yer deiim s(y) = u-1(y)ye sahipse, o zaman Tnin younluu aadaki ifade ile
verilir.

ee

Benzer sonucun, u(x)in |a, b|de kesin azalan olma durumunda da doru olduuna
dikkat ediniz.
rnek 6. X [0, 1] aralnda uniform, bylece p.d.f.si de aadaki gibi olsun

om

.c

Y = X2nin p.d.f.si nedir? Xi desteklemek iin, u(x) = x2nin kesin artan ve trevlenebilir
olduunu dnyoruz ve bylece Ynin p.d.f.sini elde etmek iin u(.)nun tersi olan s(y)
= yi kullanarak aadaki ilikiyi elde ederiz.

ri

Bu, yukarda yaptmz bir rnee benzemektedir. ncekinden farkl olarak, Xin
destei [-1, 1] idi ve bylece u(x) = x2 Xi desteklemek iin monoton deildi.

tla

Bu formlln sadece bire-bir trevlenebilir dnmler- yani monoton - iin altn


not etmek ok nemlidir. Dier durumlarda, kesikli ve srekli durumlar iin hantal 2adml yntemlere bal kalmak zorundayz.

de
rs
no

1.4 Olaslk ntegrali / Quantile Dnm

Srekli rasgele deikenler iin, ilgin- ayn zamanda ok yararl- bir sonu vardr:
aadaki manada c.d.fnin c.d.f.si uniform bir deikendir:
nerme 2. X, c.d.f.si Fx(X) olan srekli bir rasgele deiken olsun. O zaman, c.d.f. Xin
rasgele ekiliiyle llrken, Fx(X) uniform dalmldr. Yani

Rasgele bir deikenin fonksiyonun kendisinin de rasgele bir deiken olduuna dikkat
ediniz (bunu daha sonra detayl bir ekilde tartacaz).

ee

SPAT: C.d.f. sadece sfr ile 1 arasnda deerler ald iin, F(X)in c.d.f.si olan G(.)nin
hali hazrda u koular saladn grebiliyoruz:

Genelletirmeyi ortadan kaldrmadan (sadece birka ilgin olmayan ekstra tanm veya
durum farkllndan kanarak), varsayalm ki F(.) kesin monotondur- unutmayn ki
btn c.d.f.ler azalmayandr. Bunun anlam, F-1(.) gibi ters bir fonksiyonun olduudur,
yani , F-1(F(x)) = x gibi bir fonksiyondur.

om
.c
ri
x

1 iin rasgele

tla

Ters fonksiyonda kesin olarak monoton olacaktr, bylece 0


deiken FX(X)in c.d.f.si aadaki gibidir

de
rs
no

(birinci eitlik F-1n monotonluunu, ve c.d.fnin nc tanmn kullanr).


zetlersek, rasgele deiken F(X)in c.d.f.si olan G(.) yledir

Bunun, [0, 1] aralnda uniform rasgele bir deikenin c.d.f.si olduunu da kolaylkla
kontrol edebiliriz, bylece F(X) U[0, 1] ile ayn olaslk dalmna sahiptir.

Bu sonu ne ie yarar? Bir rnek olmas bakmndan, bilgisayar ile uniform rasgele
rakamlar elde etmenin ok etkin yollar vardr. C.d.f.si FX(.) olan bir rasgele
deikenden n ekilili bir rneklem elde etmek istiyorsanz, unlar yapabilirsiniz:

ee

U1,Un U[0, 1] ekiliini yapnz,


her bir uniform ekiliini una gre dntrnz:

Daha nceki argmanmza gre, X1, ..Xn c.d.f. si FX(.) olan bir rasgele deiken gibi
davranr. Bu yntem integral (ya da quantile) dntrme olarak bilinir.

om

rnek 7. Uniform dalmndan bir rasgele deiken Uyu ekmemize izin veren bir
bilgisayar programmzn olduunu varsayalm, fakat biz gerekte rasgele ekilen ve
p.d.f.si aadaki gibi olan bir X elde etmek istiyoruz

ri
tla

Bylece c.d.f.nin tersi yledir:

.c

Integral ile Xin c.d.f.sini elde edebiliriz:

de
rs
no

Eer bunu bir istatistik yazlm veya Excel kullanarak denersek, ekiliin histogram
yle grnecektir:

ekil 1. Bir uniformdan (Soldaki) 5000lik ekiliin histogram ve Xi = -2log(1-Ui)in


dnm (Sadaki)

ee

Eer Excelde kendi banza birka rnek denemek istiyorsanz, RAND() fonksiyonunu
kullanarak birka uniform rasgele ekili yaratabilirsiniz. Sonra, menlere tklayarak
histogram oluturabilirsiniz( Aralar> Veri Analizi > Analiz aralar > Histogram)

Olaslk ve statistik Ders Notlar 10

12 Mart 2009

ri

.c

1. 2 veya Daha Fazla Rasgele Deikenin


Fonksiyonlar

om

Konrad Menzel

tla

2 veya daha fazla rasgele deikenin birleik dalm hakknda hlihazrda


rendiklerimizi tekrarlayalm. Diyelim ki X1, X2, ,Xn var,
Eer X1, ,Xn kesikli ise, onlarn birleik p.d.f.si

de
rs
no

ile verilir.

Eer X1, ,Xn srekli ise, onlarn birleik p.d.f.si pozitif bir fonksiyondur,
n
f X1, ,Xn(x1, ,xn), bu nedenle herhangi bir D
iin

X1, ,Xn bamszdr eer aadaki salanrsa

Bunun aadakine eit olduunu hatrlaynz,

ee

imdi yukarda tartlan tek deikenli durumdan nasl 2 veya daha fazla boyuta
geneleme yapacamza bakalm.
Tek boyutlu durumda olduu gibi yine durumu ayrt edeceiz:
1. lgili deiken X1, ,Xn kesiklidir
2. lgili deiken X1, ,Xn sreklidir
3. X sreklidir ve u(X1, ,Xn) n-boyutlu bire-bir bir fonksiyondur.

1.1. Kesikli Durum

om

Varsayalm ki X1, , Xn birleik younluu p.d.f. f X1, ,Xn(x1, ,xn) ile kesiklidir ve Y1,
,Ym m tane fonksiyon ile veriliyor

.c

Ayn zamanda,

tla

ri

Bu durumda ve Y1, ,Ymin birleik p.d.f.si aadaki ile verilir.

de
rs
no

rnek 1(Binom Rasgele Deikenlerin Toplamas). Varsayalm ki X


B(m, p) ve Y
B(n, p) p.d.f.si aadaki gibi olan bamsz binom rasgele deikenler olsun.

ee

Eer Z = X + Y olarak tanmlarsak, p.d.f. fz(z) nedir? X ardk m bamsz deneydeki ve


Y ise n deneydeki baar says olduu iin (her ikisi de ayn baar olaslna sahiptir),
o zaman Znin de m+n denemendeki p olaslkl baarlarn toplam olmas gerektii bir
ilk tahmin olarak sylenebilir. Yani Z
B(m + n, p). Bu doru olacakm gibi grnyor,
ancak biimsel olarak bunu kontrol etmemiz gerekiyor:

om

pz(1 p)n -z terimi kye bal deildir, bu nedenle onu toplamdan ekebiliriz. Dier
taraftan, aadakini iddia ediyorum,

B(m + n, p).

de
rs
no

Bylece gerekten Z

tla

Btn paralar bir araya getirecek olursak,

ri

.c

Gerekten de,
sayma kuraln kullanarak bunu gsterebiliriz: arpm kural ve
kombinasyon forml ile, ( )( ) terimi m sayl bir gruptan ekilen k eleman ieren bir
kme ile n sayl baka bir gruptan ekilen z-k eleman ieren farkl kme saysna
karlk gelir. Btn k deerleri zerinden toplayarak, birletirilmi iki kmeden (yani, m
+ n elemanl bir kme) bir z kmesinin elemanlarn ekmenin toplam yollarnn saysn
elde ederiz. Kombinasyon formlne gre bu kme (
)ye eittir, bu da ispatlamaya
altmz eitliin sa tarafdr

Bir tedbir notu olarak, genel olarak ayn dalm ailesinden bu durumda binom gelen
iki bamsz rasgele deiken X ile Ynin toplam olan Z ayn aileye ait olmayacaktr. Bu
balamda, binom dalm ok zel bir durumdur ve ayn zelie sahip sadece birka
tane daha yaygn olarak kullanlan dalm vardr. rnein, Eer X
B(m, pX) iken Y
B(m, pY) ve pX pY ise, yukarda elde edilenler hibir ie yaramayacaktr.

1.2 Srekli Durum

Varsayalm ki X1, , Xn birleik younluu yani f X1, ,Xn(x1, ,xn) p.d.f.si ile sreklidir
ve Y (kavram basit tutmak iin sadece bir deiken kullanalm) aadaki fonksiyon ile
verilmektedir.

ee

Eer

ise, o zaman Ynin p.d.f.si aadaki ile verilir:

2. Bire-Bir Dnm iin Deiken Deitirme


Forml

om

Bu da yine sadece srekli deikenler ile alan zel bir durumdur: A X 1, ,Xnnin
destekleyeni olsun, yani

.c

ve Bde Y1, ,Yn indirgenmi destekleyeni olsun, yani

tla

ri

Varsayalm ki Y1, ,Yn trevlenebilir bire-bir dnmnden elde edilen X1, ,Xnden
elde edilsin,

de
rs
no

Yani (x1, , xn) Ann her deeri (y1, , yn) Bnin birer elamanyla elemektedir. Bu
durumda [s1(x1, , xn), , sn(x1, , xn)]nin tersini tanmlayabiliriz, bylece

Eer s1(.), , sn(.) B zerinden trevlenebilirse aadaki matrisini tanmlarz.

ee

Ksm trevin bu matrisi ayn zamanda Jacobiann ters dnm olarak adlandrlr.
Dorusal Cebiri almayanlarn, 2ye 2 durumlarn almalar yeterlidir. kiye iki
durumlarnda Matris Ann determinantnn aadaki gibi hesaplandn bilmeniz
gerekiyor:

om

nerme 1. X1, , Xn yukarda vurguland gibi Y1, , Yn ile elemesi bire-bir ve tersi
olan s1(.), , sn(.) trevlenebilir ise, o zaman Y1, , Ynnin birleik p.d.f.si aadaki ile
verilir.

2.1 Dorusal Dntrme

0 olan bir nxn matris A iin,

de
rs
no

tla

ve

ri

.c

X rasgele deikenlerin bir vektr olsun, yani det(A)

Bu durumda dorusal eletirme (mapping) Y = AX bire-birdir (matrisin tersi olduu iin)


ve deiken deitirme formln kullanarak Ynin birleik dalmn bulabiliriz.

rnek 2. Bunun ekonomideki nemini grmek iin, varsayalm ki Bostondaki portakal


suyu piyasas iin basit (ksm denge) bir modelimiz var. Firmalar fiyat pnin bir dorusal
fonksiyonu(s ve s katsayl) olan miktar qsi arz etmek niyetindedirler.
qs = s + sp + us

Burada us rasgele bir deikendir (diyelim ki Floridadaki gneli saatler gibi). Tketiciler
baka bir tesadfi ok ud veriyken (diyelim ki gelir) miktar qdyi talep ederler.
qd = d - dp + ud

ee

Denge durumunda, arz talebe eittir, yani fiyatlar yledir ki qs = qd = qdir ve fiyatlar ile
miktarlar beraber aadaki iliki tarafndan belirlenir.

om

Fiyat ve miktarlarn birleik dalmn elde edeceimiz oklarn (ud, us) birleik p.d.f.si
fU(us, ud)yi biliyor olabiliriz ya da varsayabiliriz. Bu birleik p.d.f. kesin ekilde
Jacobiana (sol taraftaki matris) bal olacaktr. Bu durumda det(J) = d + sdir, bu
nedenle eer arz veya talep nemli (nontrivial) bir eime sahip ise, oklardan fiyata ve
miktara dnm bire-birdir ve sonuta ortaya kan birleik p.d.f. aadaki gibidir:

ri

.c

Bu durum, bu derste ileyeceklerimizden biraz uzak gibidir ancak Jacobian terimi |d +


s| piyasa dengesi araclyla fiyat ve miktarn karlkl bamlln yakalar. Bunun,
14.32 dersinde piyasa sonularndan arz ve talebin ayr ayr tahmin edilmesini
zorlatran eanllk problemi olarak adlandrlan durumun kayna olduu ortaya
kmtr. Bu Ekonometrinin temel problemlerinden biridir.

tla

2.2. X +Ynin Dalm (Bklme)

Varsayalm ki X ve Y bamsz srekli rasgele deikenlerdir ve p.d.f.leri, srasyla, fX(x)


ve fY(y)dir ve bylece rasgele deikenlerin birleik p.d.f.leri fXY(x, y) = fX(x)fY(y)dir.
Z = X + Ynin p.d.f.si nedir?

de
rs
no

rnek 3. Bunun gibi bir rnei snfta yaptmz hatrlaynz: im bime makinesindeki
iki bujini mrne bakmtk, ve P(X + Y z) olasl {(x, y) : y z x} ile tanmlanm
gen zerinden fXY(x, y) birleik younluun integrali olduu ortaya kmt. Bu
durumda Znin c.d.f.si aadaki gibidir:

Buradan, Znin younluunu elde edebiliriz,

Rasgele deiken Z = X + Y, X ve Ynin bklm olarak ta adlandrlr. Son formln


sadece bamsz rasgele deikenlerin toplanmas halinde geerli olduunu not ediniz.

ee

rnek 4. nceki rnekteki tartma 2-adm ynteminin izgisiyle aynyd ve


deikenlerin dnm formln kestirme bir yol olarak kullanmann mmkn olup
olmayaca merak edilebilir.
(X, Y)den Zye eleme aka bire-bir deildir, bu nedenle deikenlerin dnm
formln dorudan kullanamayz. Ancak, aadaki hileyi yapabiliriz: aadakiler
tanmlayalm.

om

O zaman, ters dnm yle tanmlanr:

ri
tla

Bundan tr,

.c

Bu durumda

de
rs
no

Birleik p.d.f.yi w zerinden integralini alarak Znin marjinal p.d.f.sini elde edebiliriz
artk.

Bu bir nceki tretmeden elde edilen formln aynsdr.

rnek 5. imdiye kadar stel dalmn birka rneini grdk (im bime makinesi
rneindeki gibi). X ve Y bamsz stel rasgele deikenlerdir ve marjinal p.d.f.leri
yle olsun:

ee

Son forml ile , Z = X + Ynin p.d.f.si aadaki gibidir:

ee

de
rs
no

tla

ri

.c

om

Burada, ikinci admdaki integralin limiti X ve Ynin desteinin pozitif reel saylar ile snrl
olmas gereinden gelmektedir. Yani z < 0 iin fX(z) sfrdr, halbuki z > w iin fY(z - w)
sfr olur.

Olaslk ve statistik Ders Notlar 10

om

Konrad Menzel
12 Mart 2009

tla

Z = X/Ynin p.d.f.si nedir?

ri

.c

1. ntegralin Limitinin Dnm Formlnn rnei

1.1. Yaklam 1. 2-adm yntemi, ok karmak


x/y 2 olan (x, y)yi bul.
(x, y)ler zerinden fXY(x,y)nin integralini alarak c.d.f. FZ(z)yi elde et.
FZ(z)nin trevini alarak p.d.f. fZ(z)yi elde et.

de
rs
no

bunu yapmayacaz nk daha kolay bir yaklam var.

1.2. Yaklam 2: Deikenin-deiimi forml


Problem: z = u1(x, y) = x/y bir boyutlu, u(.) bire-bir olamaz.

zm: yeni bir deiken tanmla, w = u2(x, y) = XY

ee

(x, ynin 1 olaslkla pozitif olduunu not ediniz.)


Ters fonksiyon

Jacobian

[ ]=[

]nin tersini al.

.c

(W, Z)nin birleik p.d.f.sini elde etmek iin forml kullan

de
rs
no

Koul (*) aadakinden gelir

tla

ri

om

det (J)

ve

Aadakini nasl elde ederiz?

ee

o W 0 iin fWZ(w, z) sfrdr


o W > min(Z, 1/Z) iin FWZ(w, z) sfrdr
o Bundan tr,

ri

tla

de
rs
no

ee

om

.c

Olaslk ve statistik Ders Notlar 11

om

Konrad Menzel
17 Mart 2009

.c

1. Sra statistikleri

tla

ri

X1, , Xn p.d.f.leri fx1(x) = = fxn(x) benzer olan bamsz rasgele deikenler olsun
genellikle byle bir sral ifadeyi bamsz ve ayn(benzer) dalml olarak adlandrrz
ve i.i.d. olarak ksaltrz. Aadaki fonksiyon ile ilgileniyoruz.

yani Yn rneklemin en byk deeridir.

de
rs
no

Bamszl kullanarak Ynnin c.d.f.sini tretebiliriz.

Zincir kuraln kullanarak, maksimumun p.d.f.sini elde edebiliriz.

ee

rnek 1. Eski bir resim bir ak arttrmada satlr. n kii ak artrmada bamsz olarak
B1,, Bn tekliflerini sunarlar ve tekliflerin marjinal c.d.f.si FB(b)dir. En yksek teklifi
veren potansiyel alc resmi alacak olan kiidir ve teklif miktarn demek zorundadr (bu
tr ak artrmalar Dutch, ya da birinci fiyat ak artrmas olarak bilinir). Bu durumda
resim satcsnn haslasnn p.d.f.si aadaki ile verilir:

imdi bunu rneklemdeki dier sralamalara genelletirebiliriz. rnein,

Yn-1 = X1, , Xnnin en yksek ikinci deeri

om

Bu rasgele deiken X1, , Xnnin (n-1)nci sral istatistii olarak adlandrlr ve onun
p.d.f.sini belirleyebiliriz.

.c

nerme 1. X1, , Xn p.d.f.si fX(f) ve c.d.f.si FX(x) bir i.i.d. rasgele deikenler silsilesi
olsun. Bu durumda knci sral istatistik Yknn p.d.f.si yledir:

ri

SPAT: Deneyi iki blme ayrabiliriz, (a) Xlerden biri younluk fX(y)e gre y deerini
almak zorunda olsun, ve (b) y deeri veriyken, dier ekililer dizisi ynin etrafnda y
rneklemin en kk knci deer olacak ekilde gruplandrlsn.

de
rs
no

tla

Blm (b) n deneyin X1, , Xnin n ekiliine karlk gelen bir binom deneydir ve inci
turdaki baar olay (X1
y) olarak tanmlanr. ekililer bamsz ve ayn p.d.f. ile
ilintili olduklar iin, binom dalmdaki p parametresi FX(y)e eittir. ynin daha kk
olmas veya en kk knci deere eit olmas binom dalmdaki en az k kadar baar
ile ilgilidir ve bu nedenle ilgili c.d.f aadaki gibidir.

imdi c.d.f.nin yye gre trevini arpm ve zincir kural ile alarak p.d.f.yi elde edebiliriz.

ee

Bu ifade karmak grnyor, fakat bunun esasnda teleskopik bir toplam olduu
anlalabilir, bunda tr toplaml terimlerin (summand) ou decektir. kinci terimdeki
l = n ile ilgili toplam deerin sfr olduuna dikkat ediniz. Onu yeniden yazabiliriz

burada mevcut l endeksi l-1 ile yer deitirmitir. Birinci terim iin aadaki sz
konusudur:

om

Bu durumda birinci terim aadaki gibi olur

bu ispat yaplan sonutur.

tla

ri

.c

Bylece younluk T1i tanmlayan l = k terimin toplamna eittir nk T2yi


kardmzda yok olmayan tek terimdir. Bu nedenle,

de
rs
no

rnek 2. Alcnn en yksek fiyat teklifini verip resmi ald birinci ak artrmadan farkl
bir ak artrmay imdi dnebiliriz. Buna gre en yksek fiyat teklif eden yine resmi
alr ancak bu durumda ikinci en byk fiyat teklifi kadar demek yapmak zorundadr (bu
ak artrma ekli ilkine gre daha yaygndr ve ngiliz yada ikinci-fiyat ak artrmas
olarak bilinir). Eer teklif edilen fiyat rasgele deikenler, C1, , Cn, ise, satcnn geliri
Y imdi aadaki p.d.f.ye sahiptir.

Ayn fiyat teklifini veren kiinin iki farkl ak artrma formatna farkl fiyat teklifi vermesi
gerektiini ekonomi teorisinden bildiimiz iin, fiyat teklifleri iin farkl harf kullandma
dikkat ediniz.

ee

2. Bir parantez amak: Herhangi bir saynn ilk


basamann dalm (derste ilenmedi).

Burada, kendisi iin daha nce grdmz yntemleri kullanmayacamz, ho ama


standart olmayan bir problem var. Bu kesinlikle problem seti veya snava hazrlk iin
zerinde durmayacanz bir ey, ama ben yine de deinmek istiyorum.

om

Hakknda hibir ey bilmediimiz saylarn birinci basamaklarnn dalm nedir? Daha


ak olmak gerekirse, Xin neyi temsil ettiini veya ne tr birim (1/Y) kullandn
bilmediimiz herhangi bir eyin ls olsun. rnein bir gazeteyi inceleyip herhangi bir
eyi (gelir, borsa endeksleri, nfus vs.) len rakamlar toplayabiliriz. Nereden geldii
hakknda baka hibir ey bilmediimiz bu rakamlarn birinci basamaklarnn p.d.f.si
nedir? Yani X ve Ynin pozitif olma dnda herhangi bir deer olabilecekleri bildiimiz
tek ey ise, Z = X.Y rasgele deikenin ilk ondalnn p.d.f.sini nasl tretebiliriz?

tla

ri

.c

Sezgisel olarak, uniform dalm sanki rakamlar ve birimleri hakknda ok fazla bilgi
iermedii iin, ilk tahminimiz, ilk basaman uniform (kesikli) dalml olmas olabilir.
Ancak, eer uniform dalm alrsak ve birimleri deitirirsek (rnein varsaylan
dalmda btn rakamlar ikiye ve drde katlarsak), birinci basamaklarn dalm
uniform olarak kalmaz. rnein, eer gerek rakamlar X U[1, 10] , 4X U[0, 40] ise,
4Xin birinci basama Y aadaki p.d.f.ye sahiptir.

de
rs
no

Ya da, grld gibi, birinci basamaklarn dalm hakknda minimal dzeyde gerekli
olan bilgi, lm birimini deitirdiimizde dalmn deiemeyeceidir.
Gerekte aradmz, lek deiimine bal olarak dalm deimeyen bir rasgele
deiken Xtir, yani a > X iin aX. Eer Z = log(X) U[log(1), log(10)] varsayarsak bu
dorudur, nk bir lek kaymas iin aadaki elde edilir:

ee

O zaman Znin ilk basama Y aadaki p.d.f.ye sahiptir.

om
.c
ri
tla

ekil 1: Uniform zerinde lm Birimi Deiikliinin Etkisi

ee

de
rs
no

Bu deimeyen fikir bir dalm elde etmenin ok yapay bir yolu gibi grnebilir, nk
dalmn X lm veya lme birimi ile ok belirgin bir ba yoktur. Ancak, ortaya
kan p.d.f. kategoriye den gerek-dnya verisi hakknda ok iyi bir tahmin veriyor
gibi grnyor. rnein New York Timesta grnen rakamlarn bir eyi lmesini temsil
etmeleri gibi. Aadaki ekil, Economistin Rakamlarla Dnya 2007 cep kitabnda yer
alan 77 lkenin ulusal para birimi cinsinden (Japonya iin Yen, Kanada iin C$ gibi)
GSYHlarn birinci basamaklarnn histogram ile beraber teorik younluklarn
gstermektedir. zetleyecek olursak, bu rnek verilen iki rasgele deikenin dalmn
belirlemede deiik radikal bir yaklam ortaya koymaktadr: burada X ile Ynin
p.d.f.lerini bilmeden baladk, fakat her nasl bir dalm ortaya kacaksa, birim
deiikliklerinden etkilenmemek zorunda olduunu belirttik, yani Ynin gereklemesi
gibi. Deimeyen (invariance) illeri istatistikte ok nemli yeri olan bir kavramdr, fakat
bu dersin amac nedeniyle, bu rnekten teye gitmeyeceiz.

om
.c
ri
tla

de
rs
no

ekil 2: Yerel Para Cinsinden GSYHlarn ilk Rakamlarnn Dalm ve Teorik


Younluklar (rakamlar The Economist, Pocket World in Figure 2007den alnmadr)

3. Beklenen Deer ve Medyan

P.d.f.si fx(x) olan bir rasgele deiken X verilmiken, tm younluk dalmn vermek
zorunda kalmadan tm dalmn en nemli zeliklerini zetlemek istiyoruz. Beklenen
deer esas itibariyle bize Xin dalmnn nerede merkezlendiini syler.
3.1 Tanmlar

Tanm 1. Eer X kesikli rasgele bir deiken ise, toplam sonluysa, Xin E|X| ile belirtilen
beklenen deeri aadaki gibidir.

ee

Eer X srekli ise, integrali sonluysa, beklenen deer aadaki gibi tanmlanr

rnek 3. Binom rasgele deikenin, X

B(n, p), beklenen deeri nedir?

om
.c
ri

tla

burada ikinci srada, x = 0 ile ilintili toplam deeri grmezlikten gelebiliriz nk sfra
eittir. nc srada nyi binom katsaysndan attk ve izleyen admda, toplam
endeksini xten x-1e dntrdk. Sonu olarak, eer npyi ekersek, toplamlar
B(n-1, p)in binom olaslklar olur ve bu nedenle toplamlar birdir.

de
rs
no

Sonsuz sayda deer alabilen bir rasgele deikenin sonlu bir beklenen deere sahip
olamayabileceine dikkat ediniz. Bu durumda beklenen deer tanmlanmamtr. Her ne
kadar beklenen deer dalmn konumu hakknda bilgi verse de, genel olarak onun
rasgele bir deiken iin tipik bir deer olmadna da dikkat ediniz: rnein zar
atmann beklenen deeri (1+2+3+4+5+6) =

dir ki bu mmkn olan bir sonu

deildir.

Dalmn konumunu hesaplamann dier bir seenei de medyandr.


Tanm 2. Rasgele bir X deikenin medyan m(X)i reel bir saydr yani
P(X < m) = 1/2

Eer rasgele deiken Xin dalm m(X) etrafnda simetrik ise Xin medyan ve
beklenen deeri akr, yani fx(m(X) x) = fx(m(X) + x)dir, fakat bu durum genelde ayn
deildir.

ee

rnek 4. Diyelim ki Xin p.d.f.si yledir:

Beklenen deeri ise,

om

Medyan elde etmek iin, nce Xin c.d.f.sini hesaplayalm

ri

.c

Dolaysyla, m iin FX (m) = 1/2i zmek aadakini verir

tla

Bundan tr, bu dalmn medyan ortalamasndan byktr.


Medyann tek olmayabileceine dikkat ediniz.

de
rs
no

rnek 5. X adil bir zarn atlarnn sonucu olsun. Herhangi bir say iin m (3, 4], P(X
< m) = P(X 3) = 1/2dir. Dolaysyla, o aralktaki herhangi bir say medyandr.

3.2 Beklenen Deerin zelikleri

zelik 1. Eer X = c ve c sabit bir deer ise, o zaman


E|X| = c

zelik 2. Eer Y = aX + b, ise, o zaman

E|Y| = aE|X| + b

ee

SPAT: Sadece srekli duruma bakalm: Eer X p.d.f.si fX(x) olan bir srekli rasgele
deiken ise, o zaman Ynin beklenen deeri yledir:

Bylece grld gibi,


dorusallna dnr.

integralin

dorusall

zelik 3.
iin

dorudan

beklenen

deerin

om

Bu dorusal beklentilerin en genel durumudur ve bu zellii bundan sonraki derslerde


tekrar tekrar kullanacaz.

ri

.c

rnek 6. Yukarda, X
B(n, p)nin beklenen deerini, [X] = np, Xin olas btn
sonularnn zerinden toplam yaparak hesapladk. Fakat son sonutan, ayn sonucu
elde etmenin baka daha kolay bir yolu olduunu grebiliriz: X ardk n denemenin
baar sonucu olduu iin, her bir deneyin sonucunu Z1, Z2, , Zn olarak kodlayabiliriz.
Burada eer inci deney baar ise Zi = 1dir, dier durumlarda Zi = 0dr.

de
rs
no

tla

ve dolaysyla

zelik 4. Eer X ile Y bamsz ise, o zaman

Eer X ile Y bamsz deil ise, bu genel olarak doru deildir.

3.3 Rasgele Deikenlerin Fonksiyonlarnn Beklenen Deeri

Y = r(X) olsun. Geen hafta, eer f x(x)i biliyorsak, Ynin p.d.f.sini nasl tretebileceimizi
grmtk. Beklenen deer iin bu sorun daha kolaydr nk biz dalmn sadece bir
tek zeliine bakyoruz.

ee

Y = r(X) beklenen deeri aadaki gibidir

rnek 7. Varsayalm ki, Y = X1/2 ve Xin p.d.f.si aadaki gibidir

om

Ayn kurallar 2 veya daha fazla rasgele deiken iinde ie yarar.

de
rs
no

tla

O zaman

ri

.c

rnek 8. Varsayalm ki birleik p.d.f.si, aada verilen X ve Y gibi iki rasgele


deikenin Z = X2 + Y2 fonksiyonu ile ilgileniyoruz.

ee

Rasgele deiken Xin Y = aX + b trnden dorusal fonksiyonlar iin, yukarda [aX +


b] = a [X] + b olduunu grmtk. Bu dorusal olmayan rasgele deikenlerin
fonksiyonlar iin almaz. Bunun en tipik sonucu Jensenin Eitsizliidir:

om
.c
ri
tla

Kaynak: MIT OpenCourseWare

de
rs
no

ekil 3. {x1, x2} iin Bir Kesikli Dalm rnei

nerme 2 (Jensenin Eitsizlii). X rasgele bir deiken ve u(x) konveks bir fonksiyon
olsun. O zaman,

Eer u(.) kesin konvex ve X pozitif olaslkla en az iki farkl deer alr ise eitsizlik
kesindir(strict).

SPAT: ( [X], u( [X])) noktasndan geen ve u(x)e teet bir dorusal fonksiyon
tanmlayabiliriz:

ee

u(.) konveks olduu iin, btn xler iin aadaki ilikiyi elde ederiz:

zellikle,

om

r(x) dorusal olarak oluturulduu iin, a = u( [X]) ve b = u( [X]) u( [X]) [X]li dorusal
fonksiyonun beklenen deeri ile ilgili zellik 2yi, aadakini elde etmek iin
kullanabiliriz.

Bunu daha nce tretilen eitsizlikle bir araya getirecek olursak ispat tamamlanm olur:

de
rs
no

tla

ri

.c

Bir konkav fonksiyon v(x)in negatifi v(x) konveks olduundan, Jensenin Eitsizlii de
bir konkav v(.) iin aadakini salar:

Kaynak: MIT OpenCourseWare

ekil 4. r(x) her zaman u(x)ten kktr.

ee

rnek 9 (riskten kanma): Varsayalm ki ilk senesi iin snrl garantiyle gelen 1200
dolarlk bir dizst bilgisayar aldnz. O ilk yl sresince, p = %10 olaslkla bir bardak
kahveyi dizst bilgisayarn zerine dkme (ya da sizin hatanz olan baka bir kaza) ve
1100 dolara mal olacak anakart deitirme ihtimaliniz var. Bu tamirat snrl garanti
kapsamna girmez ama siz 115 dolara uzatlm bir garanti (servis) alabilirsiniz. Bu ilave
sigortay almal msnz?
lave sigorta olmadan, 1-p olaslkla, dizst bilgisayarn toplam maliyetini rasgele bir
deiken olarak X = 120 dolar, p olaslkla, X = 1200 + 1100 = 2300 dolar olacak gibi

dnebiliriz (bu problemi farkl ekillerde oluturmak mmkndr, ancak imdilik her
eyi basit tutalm). Uzatlm servis planyla dizst bilgisayarnz size X = 1200 + 115 =
1315 dolara mal olacaktr.

ri

.c

om

Eer siz sadece dizst bilgisayarn beklenen deeriyle ilgileniyorsanz, o zaman [X]) =
2300p + 1200(1 p) = 1200 + 1100p. Bu, eer p
%10.45 ise, [Y]) = 1315ten daha
byktr. Fakat p = %10 dediimiz iin, uzatlm servis plann satn almak hala iyi bir
fikir midir? - ktisatlar, insanlarn belirsizlik durumunda karar aldklar zaman,
beklenen harcama miktar Wyla pek ilgilenmediklerini varsayarlar, ama harcadklar
dolardan elde edecekleri fayda (toplam harcama miktarnda ilave bir dolarlk artn ilave
deeri olduu iin) u(W) miktaryla ilgilenirler. Bu U(.)nun maliyette konkav olduunu
varsaydmz anlamna gelir, diyelim ki

de
rs
no

tla

burada balangtaki varlmzn 4800 olduunu ve 4800 - C harcayabileceimizi


varsayyoruz. C dizst bilgisayarn toplam maliyettir. Bu durumda, ilave servis planna
sahip olmamann beklenen faydas

Ancak sigorta planyla da unu buluruz:

Gerekten de, siz 4800 3481 = 119 dolar sigorta iin harcamak isteyeceksiniz,
hlbuki beklenen ilave maliyet sadece 1100p = 110 dolardr. Sigorta iin demek
istediimiz bu 9 dolarlk farka u(.)nun konkav olmasnda gelen risk-primi denilir.
Jensenin Eitsizlii ne gre, eer u(.) konkav ise bu risk-primi pozitiftir ve bu tr
tercihlerin riskten kanma gstergesi oluunu syleyebiliriz.

rnek 10. zleyen rnek St. Petersburg Paradoksu olarak bilinir ve sonlu beklenen
deeri olmayan rasgele bir deiken rneini verir.

ee

Bize aadaki bir kumar nerilir: Varsayalm ki adil bir madeni para tura gelinceye
kadar tekrar tekrar atlr. lk atta tura gelirse 2 dolar, 2ncide gelirse 22 dolar ve genel
olarak xnci seferde grnrse 2x dolar kazanacaksnz.
Bu oyunu oynamak iin ne kadar derdiniz? Prensip olarak, beklenen kazancnz kadar
vermek niyetinde olursunuz, bu nedenle imdi hesaplamalar yapalm: gerek duyulan
tam x atn olasl aadakine eittir:

.c

Bundan tr, beklenen kazanmlar ile ilgili st snr yoktur.

om

Bu nedenle, beklenen kazanmlar, Y, aadaki gibi hesaplanr:

de
rs
no

insanlar genellikle beklenen para miktaryla ilgilenmez, ancak sahip olduklar


toplam miktar iinde deer verdikleri para miktar azalr, yani nceki rnekte
olduu gibi insanlar bir eit konkav u(.) fonksiyonunu maksimize ederler.
ok kk olaslklarla, kazanacanz miktar ok yksektir- yani trilyon, katrilyon
dolarlar gibi, ve demeyi yapacak olan kar tarafn verdii sze bal kalacana
inanmayz, bu durumda gerekte byle bir bahisten en iyi umutla ne kadar
kazanabileceimize dair bir eit st snr vardr.

tla

ri

Bu, bu tr bahisler iin insanlarn sonsuz miktarda deme yapacan greceimiz


anlamna m geliyor? Kesinlikle hayr: genellikle insanlar oyunu oynamak iin aa
yukar en fazla 25 dolar verir. Bu paradoks farkl yollardan zlebilir:

Jensenin Eitsizliiyle balanty tekrar kurmak iin, p = 1/a olaslkla tura gelen bir
madeni para ile oynanan oyunun beklenen at saysn hesaplayalm:

burada kolaylkla kontrol edebileceiniz gibi G(a) aadaki ilikinin 1/aya gre birinci
trevidir

ee

Bu nedenle, yeni ifadenin G(1/a) iin trevini alnca, aadakini elde ederiz

ve rneimizde 1/a = 1/2 olduu iin, beklenen at says 2dir.

Bylece, insanlarn hala bahis iin kullanmak istedikleri 25 dolar ortalama atlarn
kazancna
dolar kadar uzaktr. Bunun aklamas bir kere daha Jensenin
Eitsizliidir, ve gerekte u(x) = 2x xin (ekstrem) bir konveks fonksiyonudur.

.c

om

rnek 11. Varsayalm ki iki deerli kat arasndan seim yapmak durumundasnz:
Birincisi insanlara internet sayfalarn bedava arattran mehul yeni balayan bir internet
firmasnn hisse senetleridir. %90 olaslkla kar paylar e0t = 1de sabit kalmasndan
tr ok risklidir ve %10 olaslkla firmann ad Googledr. t zamannda her hangi bir
anda deyecei kar paylar e0.1T kadar byr, yani srasyla %90 olaslkla %0, %10
olaslkla %10 deerini alan rasgele bir byme oran G1 vardr. Dier seenek ise,
gelecekte herhangi bir t zamanda e0.02t faiz deyecek olan devlet tahvilini tutmak olabilir,
yani kesin olarak G2 = %2dir.

tla

ri

t zamanda alacanz bir dolara imdi sahip olduunuz dolarn e-0.15t i kadar deer
verirsiniz, fakat yine de ikisinden birine yatrrsnz. Yani genel olarak, getirisi g
orannda byyen deerli bir kada kesin olarak aadaki kadar deeri biersiniz:

de
rs
no

Riskli hisse senedinin beklenen kar pay byme oran ise,

Ancak, hisse senedine bitiiniz deer udur:

Halbuki tahvil iin bitiiniz deer aadaki kadardr:

ee

Sezgisel olarak, byme oran zerindeki belirsizlik, her ne kadar yeni faaliyete
balayanlarn %90n bymese de (hata iflasta edebilirler), %10u inanlmaz bir ekilde
kt giden yatrmalar telafi ettikleri anlamna gelir. Biimsel olarak,
byme
oranlarnda V(g) fonksiyonu konvekstir, bylece Jensenin Eitsizliine gre, yatrmclar
byme oranndaki riske deer bimelidirler miktara (dzeye) deil.

Olaslk ve statistik Ders Notlar 12

Mart 19 2009

Rasgele bir deikenin medyann yle tanmlarz

ri

P(X> medyan(X)) = 1/2

.c

1. Medyan ve Yzdeliklerin zelikleri

om

Konrad Menzel

rs
no

tla

X kesikli ve c.d.fde sramalara neden olan nokta ylmalarna sahip ise, bu tanm
yararl olamayabilir, bu nedenle daha genel durumda, medyan aadaki gibi
tanmlarz

Dar tanm ile ilgili deiiklik, c.d.f.nin sreksizlie sahip olmas ve 1/2nin zerine
kmasyla, medyan sadece sreksizlik noktasnda aramaktr. X dalmnn dier
yzdeliklerini de tanmlayabiliriz.
Tanm 1. Rasgele bir deiken X iin, quantile aadaki ile verilir

de

Ayrca q(X, p/100)yi pnci yzdelik(percentile) olarak adlandryoruz.

Bu tanmdan hareketle, medyann 50nci yzdelie tekabl ettiine dikkat ediniz.


Dier daha sk kullanlan ondalklar (quantile) (p = 10, 20, 30, , 90) ve eyreklikler
(quartile) (p = 25, 50, 75)dr.

ee

Beklenen deerlerde yaptmz gibi ondalklarn zellikleri iin ok zaman


harcamayacaz, fakat medyann beklenen deerden farkl davrand iki nemli
noktaya temas etmek istiyorum: lki iin, Jensenin Eitsizliinde bir u(X) fonksiyonu
iin beklenen deer, [u(X)], nemli oranda Xin olaslk ynn bulunduu blgenin
erilii u(x)e bal olduunu grdk. Genel olarak, medyan medyan(u(X))
u(medyan(X))ten farkl da olacaktr, ancak bunun dikkat edilmesi gereken bir
istisnas udur:

nerme 1. Xi desteklemek iin u(X)in kesin artan olduunu varsayalm. O zaman


medyan(u(X) = u(medyan(X))

om

SPAT: Xin medyan P(X < medyan(X)) =1/2yi salar. u(x) kesin artan olduu iin,
herhangi bir sabit m deeri iin olay X < m olay u(X) < u(m)ye eittir. Bu nedenle
P(u(X) < u(medyan(X)) = P(X < medyan(X)) = 1/2dir, bylece u(medyan(X))
gerekten u(X)in medyandr.

Sezgisel olarak, medyan kesin artan dnm ile korunan rasgele deikenin ordinal
zeliine baldr.

.c

Beklenen deerin, oklu rasgele deikenin dorusal fonksiyonun beklenen deeri


beklenen deerlerin ayn dorusal fonksiyonuna eit olduu manasnda, dorusal
olduunu grdk. zleyen rnekte gsterildii gibi medyan iin bu doru deildir:

tla

ri

rnek 1. Varsayalm ki X1 ve X2 aadaki benzer marjinal dalmdan elde edilen

rs
no

ve birbirinden bamsz olan kesikli rasgele deikenler olsun. O zaman Y = X1 + X2


0,1 ve 2 deerlerini alabilir ve p.d.f.si

X1 ve X2nin medyan sfrdr, ancak medyan(Y) = 1


medyan(X2).

0 + 0 = medyan(X1) +

de

Daha genel olarak, ortalamalarn ondalklar ondalklarn ortalamasndan farkl


olabilir. zleyen rnek bu anlayn olduka pratik bir baka yorumunu vermektedir
(aadaki saysal rnei verdii iin Aleksandr Tamarkine teekkrler).

ee

rnek 2. X1 szel, X2 analitik ve X3 saysal eklinde blmden oluan standart bir


test olan GRE snavna girdiinizi dnn. Testin her blmde puannz yzde 90lk
dilimin zerindedir. Bu, genel puanda da yzde 90lk dilimin zerinde olduunuz
anlamna m gelir? Genel olarak cevap hayrdr?
Varsayalm ki, siz dhil, snava giren 100 kii vardr ve puanlarn dalm yledir: 84
kii hibir blmden bir tek puan bile almaz, siz her blmden 250 puan aldnz, ve
bunun dnda snava giren trl kii vardr ki her birisi sadece bir blm iin her
naslsa dar grl bir dhiye benzeyen bir yetenee sahiptir. Daha ak olmak
gerekirse, 5 kii szelde ok ar yeteneklidir ve szel blmden 800 dier
blmlerden 0 alrlar. Dier 5 kii analitik blmden 800, ve bir dier 5 kii ise saysal

om

blmden 800 alrken teki blmlerden 0 alrlar. Toparlayacak olursak, puanlarn


bileik dalm yledir (bu tipik GRE puanlarn dalmnda olduka farkldr)

ri

.c

Dolaysyla, siz her blmde en az %95lik dilimdesiniz, fakat 15 kiinin toplam skoru
800 iken sizin ki sadece 750dir, bu nedenle her blme gre toplam puanlarn
sadece %85lik dilimindesiniz.

tla

2. Varyans

Varyans rasgele bir deikenin yaylmasnn lsdr

rs
no

Tanm 2. Rasgele bir deikenin varyans aadaki ile verilir:

Bazen biz varyans 2 = Var(X) ile ifade ederiz.

zelik 1. Sadece ve sadece baz sabit saylar iin P(X = c) = 1 ise Var(X) = 0dr.

de

zelik 2. Eer Y = aX + b ise, o zaman

VarY = a2Var(X)

ee

SPAT: Yine, sadece srekli duruma bakalm. Beklenen deer iin elde edilen nceki
sonular kullanarak

Yaylmann lm iin rasgele deiken gibi bir eit birim kullanmak daha uygun
der. Ancak, bu son sonu Var(X)in biriminin Xin biriminin karesi olabileceini ima
etmektedir. Bu nedenle, varyans yerine sklkla standart sapma (X)i kullanrz:

zelik 3.
Var(X) = |X2| |X|2

om

SPAT:

.c

zelik 4. Eer

tla

ri

ve X1, , Xn bamsz ise, o zaman

rs
no

rnek 3. Varsayalm ki X kesikli bir rasgele deikendir ve p.d.f.si yle olsun:

Eer Y = 4X 7 ise, Ynin varyans nedir?

Var(Y) = 42Var(X) = 16( [X2] [X]2)

imdi aadakini hesaplayabiliriz.

de

[X]= (1/5)(-2 + 0 +1 + 3 + 4) = 6/5

ve

ee

Bundan tr,

rnek 4. Varsayalm ki Y
toplam olarak yazlabilir

B(n, p). Y n sayda bamsz denemenin sonularnn

Var(Y) = Var(X1) + + Var(Xn)


O halde Xinin varyans nedir? Akas
[Xi] = pdir

.c

ayn zamanda,

rs
no

tla

ri

Dolaysyla, zellik 3e gre,

Bundan tr,

om

unu hesaplayabiliriz

de

Varyans bir beklenen deer olduu iin, rasgele deikenin fonksiyonunun beklenen
deerini dorudan rasgele deikenin fonksiyonunun varyansna uygulayabiliriz: eer
Y = r(X) ise,

2.1 Daha Yksek Dereceli Momentler

Beklenen deerin ilgili dalmn konumunun ls olduunu grmtk, ama te


yandan varyans yaylmay ler. Dalm karakterize etmek iin rasgele deikenin
dier momentlerine bakabiliriz, rnein simetrik mi? Kaln kuyruklu mu? vs.

ee

Tanm 3. Xin rnci momenti aadaki ile verilir,

ve rnci merkezi momenti yle tanmlanr:

Beklenen deer, dolaysyla, X dalmnn birinci momenti, varyans ise ikinci merkezi
momenti olarak da ifade edilir.

Bir dalmn sk sk kullanlan dier zelikleri unlardr:

om

bu dalmn arpkl olarak adlandrlr, ve aadaki de Xin baskldr.

ee

de

rs
no

tla

ri

.c

Yksek basklk olaslk ylmasnn kuyruklarda younlatn ifade eder.

Olaslk ve statistik Ders Notlar 13

om

Konrad Menzel

.c

31 Mart 2009

ri

1. Kovaryans

X ile Ynin kovaryans iki rasgele deiken arasndaki ilikinin gcnn lsdr.

tla

Tanm 1. ki rasgele deiken X ve Y iin, kovaryans yle tanmlanr:

de
rs
no

lk olarak, sadece tanm uygulayarak aadakileri elde ederiz.


zelik 1.

Cov(X, X) = Var(X)

zelik 2.

Cov(X, Y) = Cov(Y, X)

Dahas, elimizde kovaryans hesaplamasnda ok yararl olan aadaki sonu var.

zelik 3.

Bu, varyansn benzer zeliinin genelletirilmiidir ve ispat da ayn tr argmanlar


kullanr. Bir rnek ile bu sonucun nasl yararl olduunu grelim:

ee

rnek 1. Varsayalm ki X ile Ynin bileik p.d.f.si aadaki gibidir.

ri

.c

om

Kovaryans Cov(X, Y) nedir? zelik 7deki denklemin sa tarafna gre dahil olan
bileenleri hesaplayalm:

de
rs
no

tla

Ayn ekilde, yukardaki admlar takip ederek unlar elde ederiz:

ve

Btn paralar biraya getirerek ve zelik 7yi uygulayarak u sonuca varrz:

ee

ki bamsz rasgele deiken X ve Y iin toplamlarn varyansnn varyanslarn


toplamna eit olduunu daha nce gstermitik. imdi ise bamsz olmas gerekli
olmayan rasgele deikenlerin genelletirilmesini grelim:
zelik 4.
Var (X + Y) = Var(X) + Var(Y) + 2Cov(X, Y)

om

spatn arkasndaki dnce, zelik 3 ve 7yi uygulayarak aadakini elde etmektir.

.c

zelik 5. X, Y, Z rasgele deikenler iin,

ri

zelik 6.

de
rs
no

tla

Son zelie gre, kovaryans X ile Ynin leine gre deitii iin, X ile Y arasndaki
ilikinin gcn veren, iki deikenin diyelim ki lm birimindeki deiiminden
etkilenmeyen, standart bir lye sahip olmak istiyoruz. ok sklkla kullanlan o l
korelasyon katsaysdr.
Tanm 2. X ve Ynin korelasyon katsays yle hesaplanr:

Korelasyon katsays bir ekilde normalleir (bkz. zelik 7).


zelik 7.

Genel konumak gerekirse, durumu ayrt ederiz.

ee

(X, Y) > 0: X ile Y arasnda pozitif korelasyon vardr


(X, Y) = 0: X ile Y arasnda korelasyon yoktur
(X, Y) < 0: X ile Y arasnda negatif korelasyon vardr

zelik 8.
Baz a

0 ve b sabitleri iin

Yani, eer iki rasgele deiken arasnda deterministtik dorusal bir iliki varsa,
korelasyon katsaysnn mutlak deeri 1e eittir. O durumda X ile Y arasnda
mkemmel korelasyon olduunu syleriz.

.c

om

Aklama 1. Veri analizinin ok nemli bir ilkesi, iki rasgele deiken arasndaki
istatiksel ilikinin mekanik veya nedensel ifadelere dayanmamasdr ki, biz bunun
gerekte veriye dayal olmasn arzularz. rnein, insanlarn jimnastik salonlarnda
spor yaparak harcadklar zaman ile salklar arasnda pozitif bir korelasyon olduunu
veri setleriyle gzlemleriz, ancak bu sporun salk durumunu iyiletirdii anlamna
gelmez. Dier taraftan salk durumlar ok kt olan ve spor salonlarna gitmeyi
akllarna bile getirmeyen kimi insanlarda vardr.

tla

ri

Neden X ile Ynin korelasyonun Xin Ynin nedeni olmasndan tamamen farkl kavramlar
olduunu grmenin daha soyut bir yolu, X ile Ynin kovaryansnn simetrik olduuna,
bylece deikenlerin rollerini deitirebileceimize dikkat etmektir. Ancak nedensellik
iin, ilikinin spesifik bir ynn dnrz, yani X Y veya X Ynin
nedenidir/etkileyendir, ancak ayn zamanda Y Xin nedeni/etkileyeni deildir deriz,
bylece X ile Ynin rollerini deitiremeyiz. Bunda tr,
KORELASYON NEDENSELLE ET DELDR

de
rs
no

Ekonometri derslerinde bunun (ok) daha fazlas vardr.

1.1.nizleme: Regresyon

Diyelim ki, bir iinin geliri Y ile onun okullama yl X ile llen eitimi arasndaki
ilikiyle ilgileniyoruz (kolaylk asndan her ikisinin de srekli olduunu varsayalm). Bu
durumda her zaman X ile Y arasndaki ilikiyi yle yazabiliriz:
Y = +X + U

Burada U E|U| = 0 ve Cov(X, U) = 0 zeliklerine sahip rasgele bir deikendir(regresyon


kapsamnda bu hata terimi olarak adlandrlacaktr).

ee

(, ) parametrelerini belirlemenin bir yolu aadakini zmektir.

ya gre birinci-derece koulunu belirleyince (trevini almak) (dikkat: beklenen deerler


dorusaldr, bu nedenle trevi integral araclyla alabiliriz) aadakini elde ederiz:

om
.c

tla

ri

Ayn ekilde, ya gre birinci-derece koulu yledir:

de
rs
no

Son ifadeyi iin znce aadaki u edilir:

Bunu b iin elde edilen birinci derece koulda yerine koyunca,

elde ederiz, bylece artk parametre iin zm yapabiliriz:

imdi unlar dorulayabiliriz:

ee

ve

(dourusu, ilki dorudan nn birinci derece koulundan, ikincisi ise nn birinci derece
koulundan elde edilir).
O zaman, tahmin edilen regresyon +X X ile ilikili (X tarafndan aklanan) Ynin
parasdr ve U ise Ynin X ile ilikili olmayan parasdr. ve parametreleri genellikle

regresyon parametreleri veya en kk kareler katsaylar olarak adlandrlr. Dorusal


regresyon ekonometrinin temel tadr ve bunu 14.32 ve dier ekonometri derslerinde
ok deiik varyasyonlarda greceksiniz.

om

2. Koullu Beklenen Deerler

.c

rnek 2. Her sene, bir firmann AR-GE blm rasgele bir sre sonucunda X kadar
bulu retmektedir, burada E|X| = 2 ve Var(X) = 2dir. Her bulu p = 0.2 olaslkla ticari
bir baar gsterecektir (bamszlk varsayalm). Bir yl ierisindeki ticari baar saysn
S ile gsterelim. Bir yl ierisinde X = x bulu saysna koullanm Snin ortalamasnn S
B(x, p) = xp olduunu bildiimiz iin, bulularn ortalama olarak xp kadarnn baarl
olmas gerekir.

de
rs
no

Tanm 3.

tla

ri

Y veriyken Xin koullu beklenen deeri koullu p.d.fden elde edilen Xin beklenen
deeridir:

fY|X(y|X) rasgele deiken Xi kendi argman olarak tad iin, koullu beklenen
deerin de ayn zamanda rasgele bir deiken olduunu not ediniz. Ancak, Xin belli bir
deeri veriyken, Ynin koullu beklenen deerini de tanmayabiliriz

burada koullu younluk tanmland srece bu herhangi bir verili x deeri iin sadece
bir saydr.

Hesaplamalar tam olarak nceki gibi yapld iin (tek fark imdi koullu dalm
zerinden integral alyoruz), saysal bir rnek yapmayacaz (problem seti iin sadece
tanm uygulaynz). Bunun yerine, koullu ve koulsuz rnekler arasndaki fark
gstermek iin daha kalitatif rnekleri tartalm.

ee

rnek 3 (Limon Piyasas). Aadaki ekonomist George Akerlofun mehur


kullanlm araba piyasas modelinin basitletirilmi bir versiyonudur. Varsayalm ki
tr X kullanlm araba vardr: mkemmel durumdaki arabalar (karpuzlar), orta kalite
arabalar (istatistiksel manada kesinlik ifade eden ortalama deil), ve ok kt
durumdaki arabalar (limonlar). Her tr araba eit frekansa sahiptir, yani
P(limon) = P(orta) = P(karpuz) = 1/3

Satc ve bir alc her bir araba tr iin, srasyla YS ve YB, kadar aada verilen
deerleri biiyorlar:
Satc
5000
6000
10000

Alc
6000
10000
11000

om

Tr
Limon
Orta
Karpuz

de
rs
no

tla

ri

.c

lk dikkat edilmesi gereken ey, her araba eidi iin, alcnn bitii deerin satcnn
bitiinden daha yksek olduudur, dolaysyla her bir tr araba iin, al veri alc ile
satcnn bitii deerin arasndaki bir fiyattan gereklemeli. Ancak, kullanlm arabalar
da, kalite ilk anda grlen ey deildir. Bu nedenle, eer ne alc ne de satc sz
konusu arabann tr Xi bilmiyorsa, onlarn beklenen deeri yinelenen beklentiler
kanununa gre aadaki gibidir:

Dolaysyla al veriin gereklemesi gerekir.

Daha gereki bir dzenlemede, arabann satcs arabann kalitesini alcdan daha iyi
bilir (tamirat gemiini, kazalarn vs.) ve arabay satmaya arzulayaca fiyat belirler.
Eer satc araba trn de mkemmel bir ekilde ayrt edebilirse, ki alc bunu
yapamaz, alcnn satcnn belirtilen fiyattan arabay satma arzusuna koullanm
beklentiler oluturmas gerekir.

Eer satc 6000 dolardan daha dk bir fiyat belirtirse, alc kesin olarak arabann
limon olduunu bilirdi, nk dier durumlarda satc en az 6000 dolar talep ederdi,
yani

ee

ve al veri gerekleirdi. Ancak, eer araba karpuz ise, satc en az 10000 dolar
talep ederdi, hlbuki alc en fazla

kadar deyecekti, bu nedenle de satc yksek kalite bir arabay makul bir fiyata
satamayacakt.

om

Piyasann karpuz iin almamasnn(break down) nedeni bu modelde satcnn


alcya arabann kalitesinin dk olmad konusunda kabul edilebilir bir garanti
verememesidir, bu nedenle alc al veriinde kt bir araba alma ihtimalini hesaba
katar.

.c

Koulu ve koulsuz beklenen deerler arasndaki nemli bir iliki Yinelenen


Beklentiler Kanunudur (daha nce grdmz Toplam Olaslk Kanununa ok
benzer):

ri

nerme 1 (Yinelenen Beklentiler Kanunu).

ee

de
rs
no

tla

SPAT: g(x) = [Y|X = x] olsun. g(x) xin bir fonksiyonudur. Beklenen deeri imdi
hesaplayabiliriz:

Olaslk ve statistik Ders Notlar 14

om

Konrad Menzel
2 Nisan 2009

.c

1. Koullu Beklenen Deerler

tla

ri

rnek 1. Her sene, bir firmann AR-GE blm rasgele bir sre sonucunda X kadar
bulu retmektedir, burada E|X| = 2 ve Var(X) = 2dir. Her bulu p = 0.2 olaslkla ticari
bir baar gsterecektir (bamszlk varsayalm). Bir yl ierisindeki ticari baar saysn
S ile gsterelim. Bir yl ierisinde X = x bulu saysna koullanm Snin ortalamasnn S
B(x, p) = xp olduunu bildiimiz iin, bulularn ortalama olarak xp kadarnn baarl
olmas gerekir.

de
rs
no

Y veriyken Xin koullu beklenen deeri koullu p.d.fden elde edilen Xin beklenen
deeridir:
Tanm 1.

fY|X(y|X) rasgele deiken Xi kendi argman olarak tad iin, koullu beklenen
deerin de ayn zamanda rasgele bir deiken olduunu not ediniz. Ancak, Xin belli bir
deeri veriyken, Ynin koullu beklenen deerini de tanmayabiliriz

ee

burada koullu younluk tanmland srece bu herhangi bir verili x deeri iin sadece
bir saydr.
Hesaplamalar tam olarak nceki gibi yapld iin (tek fark imdi koullu dalm
zerinden integral alyoruz), saysal bir rnek yapmayacaz (problem seti iin sadece
tanm uygulaynz). Bunun yerine, koullu ve koulsuz rnekler arasndaki fark
gstermek iin daha kalitatif rnekleri tartalm.

P(limon) = P(orta) = P(karpuz) = 1/3

om

rnek 2 (Limon Piyasas). Aadaki ekonomist George Akerlofun mehur


kullanlm araba piyasas modelinin basitletirilmi bir versiyonudur. Varsayalm ki
tr X kullanlm araba vardr: mkemmel durumdaki arabalar (karpuzlar), orta kalite
arabalar (istatistiksel manada kesinlik ifade eden ortalama deil), ve ok kt
durumdaki arabalar (limonlar). Her tr araba eit frekansa sahiptir, yani

Alc
6000
10000
11000

ri

Satc
5000
6000
10000

tla

Tr
Limon
Orta
Karpuz

.c

Satc ve bir alc her bir araba tr iin, srasyla Y S ve YB, kadar aada verilen
deerleri biiyorlar:

de
rs
no

lk dikkat edilmesi gereken ey, her araba eidi iin, alcnn bitii deerin satcnn
bitiinden daha yksek olduudur, dolaysyla her bir tr araba iin, al veri alc ile
satcnn bitii deerin arasndaki bir fiyattan gereklemeli. Ancak, kullanlm arabalar
da, kalite ilk anda grlen ey deildir. Bu nedenle, eer ne alc ne de satc sz
konusu arabann tr Xi bilmiyorsa, onlarn beklenen deeri yinelenen beklentiler
kanununa gre aadaki gibidir:

Dolaysyla al veriin gereklemesi gerekir.

Daha gereki bir dzenlemede, arabann satcs arabann kalitesini alcdan daha iyi
bilir (tamirat gemiini, kazalarn vs.) ve arabay satmaya arzulayaca fiyat belirler.
Eer satc araba trn de mkemmel bir ekilde ayrt edebilirse, ki alc bunu
yapamaz, alcnn satcnn belirtilen fiyattan arabay satma arzusuna koullanm
beklentiler oluturmas gerekir.

ee

Eer satc 6000 dolardan daha dk bir fiyat belirtirse, alc kesin olarak arabann
limon olduunu bilirdi, nk dier durumlarda satc en az 6000 dolar talep ederdi,
yani

om

ve al veri gerekleirdi. Ancak, eer araba karpuz ise, satc en az 10000 dolar
talep ederdi, hlbuki alc en fazla

kadar deyecekti, bu nedenle de satc yksek kalite bir arabay makul bir fiyata
satamayacakt.

.c

Piyasann karpuz iin almamasnn(break down) nedeni bu modelde satcnn


alcya arabann kalitesinin dk olmad konusunda kabul edilebilir bir garanti
verememesidir, bu nedenle alc al veriinde kt bir araba alma ihtimalini hesaba
katar.

tla

ri

rnek 3. Bu rnekte, insanlarn gelecekteki politik olaylar zerine bahse girdii bir
internet platformu olan IEM Political Marketsn 2008 bakanlk adaylar ile ilgili verisine
bakacaz(veri iin bkz.:http://www.biz.uiowa.edu/iem/markets/data_nomination08.html)
Piyasa yle alyor: Her bir politik aday i iin, katlmclar aadaki getiriyi veren
kontratlar satn alyorlar

de
rs
no

Yi = {

Verili bir t zamanda, piyasadaki katlmclar Xt olarak adlandracamz dardan gelen


ilave bilgiye sahip olurlar, rnein o ana kadar kazanlan delege says, adayn
propagandasnn momentumu, ya da adayn propaganda stratejisi hakknda
grevlilerin demeleri gibi.
Sz konusu ilave bilgi verilmiken, kontratn beklenen deeri

ee

Dier bir ifadeyle, katlmclarn aday inin kontrat iin demeyi arzuladklar dolar
miktar t zamanda verili bilgiye gre i nin kendi parti adayln kazanma olaslna
eittir. Son aydaki Demokrat Partinin ana adaylarnn kontratlarnn fiyatlarna
bakalm: Demokratik adaylarn kazanma ihtimali hakknda nemli bilgileri ortaya karan
3 olay iin dik doru izdim:

om
.c
ri
Barrack Obamann Hillary Clintona kar ezici bir farkla kazand Iowa parti
kongresi,
Iowadaki yenilgiden sonra Hillary Clintonun geri dn olarak grlen New
Hampshire n seimi,
Ohio ve Taksasn n seimleri; bu iki nemli eyaletin n seimlerini Hillary
Clinton kazand

de
rs
no

tla

Bu olaylarn her birisinden sonra koullu beklenen deerlerde ok nemli deiiklikler


olduunu grebiliriz. Bu, adaylarn partilerinin adayln salama alma ans hakknda
piyasann inanlarnn nasl deitiini gstermektedir.
Finansal Ekonomide, zel bir durumun gereklemesi halinde 1 dolar deyen bu tr
kontratlara Arrow-Debrue menkul kymeti de denir.

Koullu ve koulsuz beklenen deerler arasndaki nemli bir iliki Yinelenen Beklentiler
Kanunudur(bu daha nce bu derste grdmz Toplam Olaslk Kanunun yakndr).

ee

nerme 1 (Yinelenen Beklentiler Kanunu).

SPAT: g(x) = [Y|X = x] olsun. g(x) xin bir fonksiyonudur. Beklenen deeri imdi
hesaplayabiliriz:

om
.c
ri

tla

nerme 2 (Koullu Varyans / Toplam Varyans Kanunu).

de
rs
no

Bu sonu ayn zamanda ANOVA eitlii olarak bilinir. Burada ANOVA Varyans
Analizidir. zelikle, Var(Y|X) 0 olduu iin, aadakine ulalr

Bu, kabaca sylemek gerekirse, Xi bilmek Ynin varyansn drr eklinde


okunabilir.
SPAT:

ee

burada birinci eitlik VarX =


zelliini kullanr, ikinci adm yinelenen
beklentiler kanununu kullanr, ve son admda birinci ve ikinci terimler birbirini gtrnce
ispat tamamlanr.
rnek 4. Her sene, bir firmann AR-GE blm rasgele bir sre sonucunda X kadar
bulu retmektedir, burada
= 2 ve Var(X) = 2dir. Her bulu p = 0.2 olaslkla ticari
bir baardr (bamszlk varsayalm). Bir yl ierisindeki ticari baar saysn S ile
gsterelim.

om

(a) Varsayalm ki bu sene 5 yeni buluumuz var. Onlardan S tanesinin ticari


baar gsterme olasl nedir? X = 5 veri iken, Snin koullu p.d.f.si bir
binomdur, bu nedenle, rnein,

B(5,0.2) olduu

.c

(b) 5 bulu veri iken, beklenen baar says nedir? S|X = 5


iin, son dersteki sonular kullanabiliriz,

burada E[X] = 2 varsayyoruz.

tla

ri

(c) Bulularn koulsuz beklenen deeri nedir? Yinelenen beklentiler kanunu ile
unu buluruz,

de
rs
no

(d) Sin koulsuz varyans nedir? Toplam varyans kanunu hatrlaynz,

Bu binomlarn karmnn bir rneidir, yani Xe koullanm S iin binom dalmmz


var. O zaman yinelenen beklentiler kanununu kullanarak baarlarn toplam saysn
elde edebiliriz.

rnek 5. (IEM Politik Piyasa, devam) Cumhuriyetilerin geen seneki n seimlerine


bakacak olursak, belirsizliklerin ounun Sper Salda zldn grebiliriz. Diyelim
ki, koul deikeni Xt t tarihindeki yeminli delegasyonun says olsun. Toplam varyans
kanunu nda Iowa nseimlerinden nceki koulsuz ortalamalar ile Sper Saldan
sonraki koullu ortalamalar karlatrabiliriz.

ee

Iowa seimlerinde nce, ana adaylarin


si byk dalgalanmalar ile %10 ile %40 gibi
orta dzey bir aralkta yer alyorlard. Ancak, Sper Saldan sonra, fiyatlar (yani
)
0 veya 1e yaklat, ve oynamalar ok ufak olmaya balad. Bu nedenle, koullu
varyans formlne gre, Sper Saldan sonra koullu ortalama hakkndaki belirsizlik,
Var(
), gelimelerden sonraki varyansn, Var(Yi), en byk blmn
oluturuyordu, hlbuki koullu varyansn, Var(
) , katks nispeten daha dk
grnyordu.

de
rs
no

tla

ri

.c

om

Eer bunu Demokratlarn yarnn grafiiyle karlatrrsak, Sper Saldan sonra


demokratlar iin hala byk hareketlenme olduu grlebilir, bu nedenle Sper Saldan
tr yeminli delege saysnn zerine koul koymak varyansn nemli bir blmn yok
etmemektedir, yani varyans, Var(
), hala ok yksektir. Dier taraftan,
Cumhuriyetilerin yarnn ok abuk bitmesinin ska belirtilen nedeni, her bir eyalette,
Cumhuriyetilerin n seimlerinde delege saysnn adaylarn oy oranna gre deil (bu
Demokratlarn ou nseiminde bir kuraldr) kazanan hepsini alr kuralna gre
belirlendii iindir. Bu nedenle, en ufak bir oy farknda bile kazanan aday dier adaylara
fark atabilir ve rakiplerin aray kapatmas olduka zorlar.

2. zel Dalmlar

Bu derste, imdiye kadar yaygn olarak kullanlan dalm grdk, binom, uniform ve
stel. Bundan sonraki iki derste, bu listeyi birka nemli rnek ile genileteceiz ve
onlarn en sk kullanlan ile balayacaz, yani normal dalmla.

2.1 Hatrlatma: Derste imdiye kadar grdmz dalmlar

ee

Tanm 2. Eer p.d.f.si aadaki gibiyse, X deikeni, X


parametreleriyle bir binom dalmdr:

B(n, p), (n, p)

om

B(n, p) iin daha nce aadaki ilikileri gstermitik.

.c

tla

ri

Tanm 3. Eer p.d.f.si aadaki gibiyse, X deikeni [a, b] aralnda bir uniform
dalmdr, X U[a, b]:

de
rs
no

Tanm 4. Eer p.d.f.si aadaki gibiyse, X deikeni parametresiyle bir stel


dalmdr:

2.2 Standartlatrlm Rasgele Deiken


Bazen, rasgele deiken Xin standardizasyonu olan aadaki Zye bakmakta fayda
vardr.

ee

Son birka derste tretilen beklenen deer ve varyans kurallarn kullanarak


aadakileri elde ederiz:

ve

om

Eer rasgele deikenleri bu ekilde normalize edersek, lek ve konumdan bamsz


olarak farkl dalmlarn eklini karlatrmak daha kolay olur.

2.3 Normal Dalm

.c

Normal dalm srekli rasgele deiken ile ilintilidir. ok sayda ki istatistiki deneyin
sonularnn en iyi tahminini verdii ortaya kmtr (biraz sonra bunun iin bir rnek
greceiz, daha fazlasn Merkezi Limit Teoremini iledikten sonra greceiz).

de
rs
no

C.d.f.si ise yle gsterilir:

tla

ri

Tanm 5. Eer herhangi bir z


iin p.d.f. aadaki gibiyse, rasgele bir Z deikeni
normal dalmldr sembolik olarak Z N(0, 1),

ee

Bir standart normal rasgele deikenin c.d.f.si kapal-form ifadeye sahip deildir(fakat
tablo deerlerine ya da istatistiksel yazlm paketlerine baklabilir). P.d.f (z) an erisi
ve sfr etrafnda simetrik zeliklere sahiptir:

2.3.1. Standart Normal Dalmn nemli zelikleri

om

zelik 1. Bir standart normal rasgele deiken Z iin

ve

ri

.c

Normal dalmn neden yararl olduuna dair vurgulanmas gereken ilk nemli nokta,
ok sayda n deneme iin Binom rasgele deikenlerin normal dalm ile tahmin
edilebildiinin ortaya kmasdr.

tla

Teorem 1 (DeMoivre-Laplace Teoremi). Eer X B(n, p) bir binom rasgele deiken


ise, o zaman c d gibi herhangi bir say iin u ifade yazlabilir,

de
rs
no

Binom deikenin aadaki ifadeye dntrldne dikkat ediniz.

Bu ifade gerekte standardizasyondur. Bu sonular, ok sayda n iin standardize


edilmi binom rasgele deiken Xin (c, d| aralna dme olaslnn aa yukar
normal deikenin ayns olduunu ifade etmektedir. rnek olsun diye sadece ykselen
n deerleri iin binom p.d.f.leri grafik zerinde gsterdim ve daha sonra normalizasyon
uyguladm.

ee

n = 50 iin, bar grafiinin ekli nispeten normal younluun an erisine benzemektedir.


zelikle dikkat edilecek olursa, az saydaki n iin dalmn arpkl nerdeyse
tamamen yok olmutur (baarnn dk olaslndan tr, p = 1/4).

om
.c

ri

ekil 1. DeMoivre-Laplace Teoreminin Gsterimi

de
rs
no

tla

rnek 6. Uygulama asndan bu tr tahminlerin neden gerekten yararl olduunu


grmek iin ardk n denemenin olasln hesaplamak istiyoruz. Diyelim ki p = 1/5dir
bu durumda en az %25lik baar vardr.

Eer n = 5 ise, 25%ten daha fazla baarya sahip olmama olasl aadaki gibi
hesaplanr:

B(100, 1/5) ise, yani ni 100e ykseltirsek ne olur? Prensipte,


Peki, eer
aadakini hesaplayabiliriz:

ee

Bylece, her birinin toplamn ayr ayr hesaplayabiliriz. Ancak onlardan ok fazla olduu
iin, bu ok ar bir yk getirecektir. Dier bir seenek olarak, DeMoivre-Laplace
Teoremini kullanarak iyi bir tahminde bulunabilirdik. Standardize edilmi yledir:

Bu nedenle,

N(0, 1) iin, ayrca herhangi bir rasgele deikeni elde edebiliriz.

.c

om

Bu tahmin ne kadar iyidir? Hesaplamalar yaptm ve P(


25)
%91.25 elde ettim.
Eer ayn rnei n = 200 iin tekrarlarsak, tam olarak P(
50)
%96.55 binom
olasln ve P( 50) %96.15 normal tahminini elde ettim.

ri

Bu normal bir rasgele deikendir, ortalamas ve varyans 2dir. Sembolik olarak

de
rs
no

tla

Xin p.d.f.si nedir? Daha nce derste grdmz deiken deitirme formln
kullanabiliriz:

Bir normal rasgele deikenin dorusal dnmnn yine normal bir X1 deikeni
olduunu gz nnde bulundurarak tartmay daha ileri bir aamaya tayabiliriz.
nerme 3. Eer X1

N(, 2) ve X2 = a + bX1 ise, o zaman

Bu sonucu yine deiken deitirme formln kullanarak kontrol edebilirsiniz.

N saydaki X1, ..., Xn deikenin toplamnn beklenen deerinin, beklenen deerlerinin


toplam olduunu ve n bamsz ve rasgele deikenin varyansnn da varyanslarnn
toplam olduunu grmtk. Eer Xiler ayn zamanda normal ise, toplamlar da
normaldir:

ee

nerme 4. Eer X1, ..., Xn bamsz normal rasgele deikenler ve Xi


zaman,

N(i, i2) ise, o

de
rs
no

tla

ri

.c

om

Genel olarak, birka hafta nce grdmz bklme formln kullanmak zorunda
olabilirdik, ancak normallerin toplam iin, sadece toplamn beklenen deerini ve
varyansn hesaplamamz yeterlidir. Bu durumda p.d.f.leri hemen bulabiliriz:

ekil 2. in Farkl Deerleri iin Normal Younluk

2.3.2. Standart Normalin Tablo Deerlerini Kullanma


Eer X N(, ) ise, Xin kendi ortalamasndan bir veya iki standart sapmadan daha
daha uzakta olmama olaslnn kabaca bir tahminini verebiliriz:

ee

Yani dalm ynnn ou ortalamadan itibaren bir veya iki standart sapma aralnn
iindedir. Eer elinizin altnda c.d.f. tablosu yoksa normal olasln kabaca bir tahmini
elde etmek iin bu nicel deeri hatrlamakta fayda vardr.

om
.c
ri
tla

de
rs
no

Kaynak: MIT OpenCourseWare

Standart normal dalm yaygn olarak kullanld iin,


deerlerini herhangi bir istatistik kitabnda bulabilirsiniz.

(z)in c.d.f.sinin tablolatrlm

ounlukla sz konusu tablolar sadece z


0 deerlerini ierirler, fakat dalmn
simetrisini kullanarak c.d.f.nin > 0 deerlerini elde edebilirsiniz.

ee

rnein, eer P(Z 1.95)i bilmek istiyorsak, P(Z


1- P(Z -1.95) = 0.9744 hesaplayabiliriz.

-1.95)i arayabilir ve P(Z

1.95) =

om
.c
ri

tla

Kaynak: MIT OpenCourseWare

Genel olarak, eer X N(, ) ise, a


admlar takip ederek elde edebiliriz:

b iin P(a

b) tr olaslklar aadaki

de
rs
no

1. deikeni standardize et, yani bir standart normal rasgele Z deikeni iin olay
aadaki gibi tekrar yaz:

2. standart normal c.d.f.,

(.), cinsinden olasl yeniden ifade et:

3. olasl elde etmek iin yukarda hesaplanan deerlerin standart normal c.d.f.si
iin tablodan deerleri bul.

ee

2.4 Bir Parantez Amak: Standart Normal Rasgele Deikenin


izimi

Integral dntrme kullanarak uniform rasgele ekilileri dier herhangi bir srekli
dalma dntrmenin mmkn olduunu daha nce grmtk(rasgele deikenlerin
dntrlmesi zerine olan ders notlarna baknz). Eer bir bilgisayarnz yoksa ne

yaparsnz? 1900l yllarda, nl istatistiki Francis Galton zar kullanarak normal


rasgele bir deikeni taklit eden akl bir alet yapt1.

om

ekil 3te grlen farkl zar pei sra atlmtr. Bu yaplrken, deneyi yapan kii
tesadfi ekililerin listesini tabloya aadaki gibi aktarr: Birinci zar gerek deeri
verir(her zaman size doru olan yzeyin altndaki rakam okursunuz). lk zamanda
yldzlar bo braklrken, fakat daha sonra ikinci zarn atlyla doldurulurlar. En
sonunda, nc zar ilk iki zar ile oluturduunuz ekililerin nne konulacak art ve
eksilerin srasn verir.

ri

.c

Sonucun gerekten de standart normal rasgele deikene benzemesi iin zar


zerindeki rakamlar zelikle normal dalmn pozitif yarsnn eit aralkl yzdeleri
olarak seildi.

tla

2.5 Standart Normallerin Fonksiyonlar: Ki-kare, t- ve Fdalmlar

de
rs
no

Tahmin ve test etmek iin standart normal dalmn neminden tr, standart normal
rasgele deikenlerin baz fonksiyonlar da nemli rol oynarlar ve sk sk istatistik
testlerde tablo haline getirilirler. Btnlk asndan imdilik sadece tanmlar vereceiz,
fakat, dersin sonlarna doru (son te birinde) tekrar uygulamalara dneceiz. lgili
p.d.f.leri vermeyeceim nk onlarn kullanm pratik deildir.
in k
Tanm 6. Eer Z1, Z2, , Zk bamsz ve dalm Zi N(0,1) ise, Y =
serbestlik derecesiyle ki-kare dalml olduu sylenir. Semboller ile ifade edecek
olursak,

ee

Burada serbestlik derecesi karesi alnm ve toplanm bamsz ekililerin saysn


ifade etmektedir. Ki-karenin beklenen deeri serbestlik derecesi ile verilir,

Tanm 7. Eer X

N(0,1) ve Y

bkz. Stigler, S. (2002): Statistics on the Table

ise, o zaman

om

ilikisinin k serbestlik derecesiyle (renci) t-dalm olduu ifade edilir.

Serbestlik derecesi knin byk deerleri iin, t- dalm standart normal dalm ile ok
doru bir ekilde tahmin edilir.
ve Y2

ise, o zaman

ri

.c

Tanm 8. Eer Y1

ee

de
rs
no

tla

ilikisinin (k1, k2) serbestlik derecesiyle F- dalml olduu ifade edilir.

om
.c
ri
tla
de
rs
no

ee

ekil 3. Galtonnun Zarnn eidi. Zarlar 1890dan kalma 1.25


inlik kptrler ve normal dalml rasgele deikeni taklit etmek
iin kullanlrlar. Stigler, S. (2002): Statistics on the Table: The
History of Statistical Concepts and Methodstan uyarlanmtr.

om
.c
ri
tla
de
rs
no
m

ee

Kaynak: MIT OpenCourseWare

om
.c
ri
tla
de
rs
no
m

ee

Kaynak: MIT OpenCourseWare

Olaslk ve statistik Ders Notlar 15

om

Konrad Menzel
7 Nisan 2009

.c

1. zel Dalmlar (devam)

ri

1.1 Poisson Dalm

tla

Bazen, belli bir olayn belirli bir aralkta hangi sklkla meydan geldiini bilmek
isteyebiliriz.

ee

de
rs
no

rnek 1. Hava yolu gvenlii sz konusu olunca, bir uak modelinin ne kadar gvenli
olduu konusunda bir kanya sahip olmak isteyebiliriz. Aadaki veri www.airsafe.com
veri sitesinden elde edildi ve toplam uu says ile Aralk 2006ya kadar belli bir uak
tipinin yer ald lmcl kaza saysn vermektedir.

Tablodan hemen grebileceimiz gibi baz uak modelleri dierlerine gre daha az kaza
yapm nk, basit bir ifadeyle, ya uzun sreli kullanlmamlar ya da ok az

retilmiler. Daha anlaml bir karlatrma yapabilmek iin, lmcl kaza saylarnn
dalmlarn aklamak iin daha iyi bir ynteme ihtiyacmz var.

om

Bu trden tesadfi deikenler genellikle saylabilir veri olarak bilinir ve bu veriyi


aklamak iin sklkla kullanlan dalm Poisson Dalmdr.

ri

Xin kesikli olduuna zellikle dikkat ediniz.

.c

Tanm 1. Eer X aadaki gibi bir p.d.f.ye sahip ise, o zaman parametresiyle bir
Poisson Dalm olduu sylenir,

de
rs
no

tla

zelik 1. Bir Poisson rasgele deikeni X iin aadaki ilikiler yazlabilir:

Saylabilen bir deikenin dalm iin Poisson dalmnn neden uygun veya kabul
edilebilir olduunu grebilmek iin aadaki dnsel deneyi yapalm: Varsayalm ki

bir olayn bir 1/n zaman aralnda gerekleme olasl pn= /ndir
zamann herhangi bir annda gerekleen olaylarn zaman ierisinde bamsz
olduunu da varsayyoruz.

nnin sonsuza doru gitmesine izine vererek alt-aralklarn blntsnn giderek


klmesini salarz. Eer daralan iki alt araln olasl sfra doru giderse, ve ondan
sonra olayn en az bir kere gerekletii aralklar sayarsak, toplam gereklemelerin
saysn elde etmi oluruz. Bunun p = /n ve n parametreli bir binom rasgele deiken
olduuna dikkat ediniz.

ee

nerme 1. Xn
B (n, /n) dalml binom rasgele deiken iin, n
aadakine yaknsar:

iken p.d.f.

om

SPAT: arpmn limitini limitlerin arpm olarak alabiliriz ve her birini ayr ayr
deerlendirebiliriz: Kalkluste ok iyi bilinen bir sonuca gre (her iki tarafa Taylor
serisi(alm) uygulanabilir) aadaki ifadeyi yazlabilir,

tla

Ve bunun iin de unu gsterebiliriz.

ri

.c

Bylece, x ve sabit ve bu nedenle n ile karlatrnca kldnden, elimizde


aadaki ifade kalr,

de
rs
no

Btn paralar bir araya getirdiimizde nermedeki ifadeyi elde ederiz.


rnek 2. Saylabilir veri iin en klasik rnek (en azndan statistiin tarihinde bir klasiktir)
19ncu yzylda at tepmesi sonucunda len Prusya svarileridir. 1898de Rus istatistiki
Ladislaus Bortkiewiczin kefettii gibi, Poisson dalm Prusya ordusunda bir tmende
bir yl ierisinde at tepmesinden lenlerin gzlemlenmi frekansn artc bir ekilde
ok iyi tahmin etmitir.
Gzlemlenmi frekanslar, en nihayetinde bilinmeyen 'ya bal olan Poisson
dalmnn p.d.f.siyle nasl karlatrabiliriz? Bu derste daha sonra tartacamz
tahminin bir n izlencesi olarak, nn kabul edilebilir bir deer, rneklemde
gzlemlediimiz at tepme lmlerinin beklenen saysnn aynsn tahmin eden
p.d.f.deki bir parametrenin deeri olabilir. O halde X P() iin, [X] nedir?

Yukarda tarttmz gibi, bir Poisson rasgele deikeni Binom rasgele deikenin, Xn
B(n, /n), limitidir. Burada n deneme says sonsuza gitmektedir. Daha nceki Binom
dalm ile ilgili tartmalarmza gre, nden bamsz olarak, [Xn] = n(/n) = dir.

ee

Bylece

syleyebiliriz.

sonsuz serilerini dorudan kullanmadan,

[X] = olduunu

om
.c
ri
tla

de
rs
no

At tepme veri setinde, rneklem ortalamas (yl ve tmen itibariyle) = 0.7dir. imdi
ekil 2de gsterildii gibi rneklem frekansn = 0.7 parametre oran iin oluturulan
Poisson p.d.f.sinin teorik deerlerine kar izebiliriz. ki dalm belirgin bir ekilde
benzerdir ve bu durum sk sk Kk Saylar Kanunu olarak ifade edilir.

2. Asimptotik Teorisi

imdiye kadar, p.d.f.yi, parametreleri (normal iin ve 2, stel iin gibi) bildiimizi
(ya da bulabileceimizi) varsaydk ve sonra o bilgiye dayanarak olaslklar ile ilgili
ifadeler gelitirdik.

ee

Dersin izleyen blmnde, o bilgiye sahipmiiz gibi hareket etmeyeceiz ama, olaslk
zerine olan bilgimizi kullanarak, sz konusu rasgele deikenlerin dalm konusunda
bize bir eyler syleyecek fonksiyonlar oluturacaz. O fonksiyonlar tahmin ediciler
olacaktr.
statistikte nemli rol oynayan bir tahmin edici rneklem ortalamasdr. Bu tahmin edici
birazdan ileyeceimiz gibi, rasgele bir deikenin beklenen deerini tahmin eder.

Tanm 2. n byklndeki bir rasgele rneklem n sayda i.i.d, olan, yani btn Xler
bamsz ve ayn fx(x) p.d.f.sine sahip, X1, Xn rasgele deikenler dizisidir.

Biz sk sk gerekleen rasgele deikenleri rasgele rneklem olarak ta ifade ederiz.

om

Eer n byklnde rasgele bir rneklemimiz varsa, rneklemin ortalamasnn


dalmn doru bir ekilde aklamak iin Xinin dalm konusunda ok ey bilmeye
gerek duymaymz (rnein fx(x)i bilmeye gerek duymamak gibi) bu dersin ana mesaj
olacaktr.
Buradaki ana fikir, rneklem bykl ni artrarak geree giderek yaklap p.d.f.yi
tahmin etmektir. Burada oluan iki sonu udur:

tla

ri

.c

1. Byk Saylar Kanunu: Byk n saylar iin, rneklemin ortalamas btn


olabilirliiyle rasgele deikenin beklenen deeri [X]e yaklaacaktr.
2. Merkezi Limit Teoremi: Standardize edilmi rneklem ortalamasnn
(standardize son dersteki sfr ortalama birim varyans manasnda
kullanlmaktadr) p.d.f.si standart normal rasgele deikenin p.d.f.sine gayri
ihtiyar olarak yakn olacaktr.

Biimsel olarak, asimptotik sonular n


iken neler olacan ortaya koyar, ancak
pratik uygulama assndan (yani sonlu n iin), o sonular nin yeterince byk olmas
durumunda tahminlerin olduka doru olacan da ima eder.

de
rs
no

2.1 Byk Saylar Kanunu


2.1.1 Chebyshev Eitsizlii

Chebyshev Eitsizlii bir rasgele deikenin beklenen deerden ok uzakta bir yerde
gerekleme olaslnn snrlarn belirten biimsel bir sonutur.
olan rasgele bir deiken olsun. O zaman herhangi

nerme 2. X varyans Var(X) <


bir > 0 iin,

ee

SPAT: Xin p.d.f.si fX(x) ile verilmi olsun. Bu durumda aadaki ilikiyi gstereceiz

Varyansn tanmn kullanarak u ilikiyi buluruz:

om
[X] veya t

[X]

.c

integralin her birisi pozitiftir ve buna ilaveten, herhangi bir t


+ iin

tla

ri

Dolaysyla, ilk integrali atabiliriz ve u sonucuna ulaabiliriz.

de
rs
no

Bu durumda her taraf 2 e blerek sonucu elde ederiz.

ee

Bu derste rasgele bir deikenin varyansnn deikenin yaylmasnn ls olduunu


daha nce bir ara sylediimizi hatrlaynz. Chebyshev Eitsizlii varyans rasgele
deiken Xin ekstrem gereklemelerini gzlemenin (yani ortalamadan ok uzakta
olan deerlerin) olasl ile ilikilendirerek bu ifadeyi dorular.

om
.c
ri
tla

de
rs
no

Kaynak: MIT OpenCourseWare

2.1.2 Byk Saylar Kanun

Tanm 3. rneklem ortalamas n byklndeki rasgele bir rneklemden elde edilen n


rasgele deikenin (gereklemenin) aritmetik ortalamasdr.

Xilerin rasgele deiken olmasndan tr


ediniz.

nnin

ee

rneklem ortalamasnn beklenen deeri yledir:

de rasgele deiken olduunu not

om

Eer X1, , Xn bamsz ise, rneklem ortalamasnn varyans aadaki gibi


hesaplanr,

ri

.c

Eer Xiler i.i.d. normal ise, Xi


N( ,
) ne olur?
Normallerin dorusal
kombinasyonunun uygun varyans ve ortalama ile yine normal olduunu biliyoruz, yani

tla

ni artrdmzda varyans azald iin, byk bir olaslkla ortalama en nihayetinde


[X]e ok yakn olacaktr. Esas itibariyle Byk Saylar Kanununun syledii de budur.

de
rs
no

Teorem 1 (Byk Saylar Kanunu). Varsayalm ki, btn iler iin, X1, , Xn [X] =
ve Var(Xi) =
ile bir i.i.d. ekili dizisi olsun. O zaman herhangi bir > 0 iin (ok
kk bir say) rneklem ortalamas aadaki ilikiyi salar

Bu durumda

olaslkta e yaknsar deriz.

SPAT: nceki u sonucumuzu kullanalm

ee

Chebyshev Eitsizlii ile aadaki elde edilir.

Bu ifade, byk rneklemler iin, rnek ortalamasnn byk olaslkla rasgele


deikenin beklenen deerinden ok uzakta olmayacan syler. n ve varyans
veri
iken, Chebyshev Eitsizliini dorudan kullanarak rnek ortalamasnn verili mesafeden
daha uzakta olma olasln snrlarz.

om
.c
ri
tla
de
rs
no

ekil 1. n tane madeni para atnn ortalama tura saysnn 10 dizisi- kesikli
izgiler

dir.

rnek 3. lm Birimlerinin Standardizasyonu (Stiglerin kitabna bkz.): Ortaada


genellikle her ehir lm aracnn uzunluuna bal olarak ayak, in ve yarda vs
iin farkl lmler kullanrd. Bu, lm birimlerinde ticareti karmak hale getiren ve
hukuki tartmalarn artmasna yol aan ok fazla farklln olduu anlamna gelirdi:
rnein verili bir kuman uzunluunun gerekten de 20 yarda uzunluunda olup
olmamas gibi yasal tartmalar olurdu.

ee

nsanlarn bulduu akllca bir zm yleydi: 16 ayak uzunluundaki bir ubuun


uzunluunu belirlemek iin, rasgele 16 kiilik bir rneklem seiyorsunuz (bu durumda
bunlar Pazar gn Kiliseden kan ilk 16 kiidir), bunlarn ayak uzunluklarn toplayp 16
ayak gibi bir ly belirliyorsunuz, sonra uzunluu 16ya blyorsunuz. ekil 2ye
baknz. 16 gzlemin ortalamasnn varyansnn formlne gre, bu, yeni lm biriminin
varyansn 1/16 kadar azaltmal. Eer blgeler arasnda ayak byklklerinde (veya
kiliseye giden insanlarda) sistematik bir farkllk yok ise, bu l, farkl blgelerdeki
tacirlerin birbirleriyle daha kolay al veri yapmalarna yol amal.

om
.c
ri
tla

de
rs
no

ekil 2. Kbelin 16 kiinin 16 ayak uzunluundaki


bir srn yasal tanmn belirlemesini betimleyen
Ahap Bask eseri (1535)

2.1.3. rnek: Kalabalklarn Bilgelii

Varsayalm ki n byklndeki bir kitle, kamu idaresi iin 2 aday arasndan birini
seecektir. Burada basite en ok oyu alan aday kazanacaktr. Semen inin A aday
iin oy kullanmas durumunda 1, dier durumlarda 0 olan rasgele deiken Xiye
bakacaz. Eer oy oran aadaki gibiyse Aday A kazanr:

ee

Aday A phesiz en iyi tercihtir ancak bu kesin olarak A lehine oy kullanacaklarn


sadece 2 > 0 oran tarafndan bilinmektedir, yani i = 1, , 2n iin P(Xi = 1) = 1dir.
Semenin geri kalan 1 - 2 u her iki aday hakknda temel bir bilgiye sahip deildir ve her
iki aday iin herhangi bir tercih belirtmeden oyunu kullanmaktadr, yani i = 2n , , n
iin, P(Xi = 1) = P(Xi = 0) = 1/2dir. A adaynn oy oran aadaki ile verilir:

om

Bylece, aday Ann beklenen oy orannn deeri

ri

.c

Binom dalm sonularna gre, varyans ise

varyansndan balayabiliriz

de
rs
no

nnin

tla

Chebyshev Eitsizlii ile ilgili ispatn argmanlarna gre, olaslk snrlarn izmek iin

Kararsz semenler (grlt) herhangi bir aday zelikle tercih etmedikleri iin, dalm
etrafnda simetriktir, bylece

= (1/2) +

olduu iin, aday Bnin kaybetme olasl udur:

ee

Birka say deneyelim: Diyelim ki 2 = %5tir. Aday Bnin seilme olasln %5in
altnda tutmak iin n ne kadar byk olmak zorundadr? Snr yle olur,

bylece n

95dir. Eer semenin %95i kararn rasgele verse bile, yanl adayn

seilme olasln %5in altnda tutmak iin 95 yeterlidir. Bu durum kalabalklarn


bilgelii olarak bilinir: Seimin sonucunda bilgilendirilmemi semenin yarat stokastik

grlt byk rneklemlerde ortalamay aar, ancak sonuta sadece bilgilendirilmi


semenlerden gelen sistematik sinyaller seimin sonucunu belirler.

om

Byk Saylar Kanununda olduu gibi semenlerin bamsz olduunu varsaydmza


dikkat ediniz. Bamszlk varsaymndan vaz geersek ne olur?

ortalamas

ri

nin

tla

Yinelenen Olaslklar Kanununa gre,

.c

Varsayalm ki adaylar arasnda televizyonda gsterilen bir tartma srasnda TV


stdyosunda aday A veya Bnin yzne rasgele konabilecek (1/2 gibi eit bir olaslkla)
bir sinek vardr ve bir sre etrafta uuan sinek adaylarda rahatszla yol amaktadr.
Bilgilendirilmi semenler dncelerini deitirmezler,
fakat bilgilendirilmemi
semenler 1/3 olaslkla zerine sinek konan, 2/3 olaslkla da rakibi iin oy
kullanacaktr.

de
rs
no

dolaysyla ortalama daha ncekinin aynsdr. Ancak, varyans deiir: ANOVA


zdeliine gre (koulu varyans)

Buna gre aadakileri hesaplayabiliriz

ee

bylece

Adaylarn rolleri kararsz semen tarafnda deitirilebilecei iin, dalm ortalama


etrafnda simetriktir. Bu durumda yukarda elde edilen olaslklar iin oluturulan snrlar
kullanabiliriz

Var(

n)

n|sinek])

nye hi bir ekilde bal olmad iin, n

in sfra doru gitmediini artk grebiliyoruz.

= %15 ise (nceki hesaplamalarn alt kat), snr

.c

Saylar ile ifade edecek olursak, eer


aadakine eit olur

iken

om

Ancak, ilk terim Var( [

tla

ri

bylece n ne kadar byk olursa olsun snr 1/2'nin zerindedir. Bu sadece st snr
olduu iin, bize olayn gerekte ne kadar olas olduunu sylemiyor, ancak varyans
sfra dmedii iin, grltc semenlerin seimin sonucu zerinde ok gl bir
etkisinin olaca aktr.

ee

de
rs
no

Burada Byk Saylar Kanunu baarsz olur nk sinek olay btn grltc
semenleri ayn anda etkiler, bylece X1, , Xn artk bamsz deildir. Bamszlk
varsaym ok nemlidir nk byk saylar kanununun genellikle almasnn nedeni
grltnn birok gzlemde ortalamay amasdr. Eer grltnn bir bileeni btn
gzlemler iin ortak ise (veya en aznda hepsiyle yksek korelasyon iinde ise), bu
bileenin varyansa katks -rneimizde olaslnn snrndaki 49/81 terimi - rneklem
ok byk olsa da yok olmaz.

Olaslk ve statistik Ders Notlar 16

om

Konrad Menzel
9 Nisan 2009

de
rs
no

ri

2nci Snav gelecek hafta Sal gn snfta yaplacak ve saat tam 9:00da
balayacak.
lgili materyal: ncelik son snavdan sonra ilenen konularda olacak ancak
elbette kendinizi younluk, olaslk ve dersin ilk eyreindeki dier kavramlar
konusunda rahat hissetmelisiniz.
problem setlerindekinden daha metinsel sorular olacak, hesaplamalarda daha az
yorucu olacak.
normal dalm tablosu datlacaktr, bu nedenle yannzda getirmeniz
gerekmiyor
esas itibaryla ilk snavn formatnn ayns olacak
hesap makinesi getiriniz
kitaplar ve notlar kapal olacak
sre aa yukar 85 dakika olacak
Ksmi puan verilecektir, bu nedenle btn sorular cevaplandrmaya alnz

tla

.c

1. Genel Snav Kurallar

2. Tekrar

2.1 Rasgele Deikenlerin Fonksiyonlar


Genel olarak:

ee

Xin p.d.f.si fX(x)i bil (kesikli veya srekli)


Y Xin bilinen bir fonksiyonudur, Y = u(X)
p.d.f. fY(y)yi nasl bulacanla ilgilen

p.d.f. fY(y)yi bulmann yolu Xin srekli veya kesikli veya u(.) fonksiyonun bire-bir olup
olmamasna baldr. yntem vardr:

om

1. Eer X kesikli ise

2. Eer X srekli ise 2-adml bir yntem vardr:

tla

ri

Adm 2: p.d.f.yi elde etmek iin c.d.f.nin trevini al

.c

Adm 1: c.d.f. Fy(y)i elde et

de
rs
no

3. eer (a) X srekli ve (b) u(.) bire-bir ise, deiken deitirme formln kullan

Tarttmz birka nemli rnek:

Bklme forml: eer X ile Y bamsz ise, o zaman Z = X + Ynin p.d.f.si

Not: Eer X ve/veya Ynin younluu bir yerde sfr ise, integralin limitleri
konusunda dikkatli ol.
Integral Dntrme: Eer X srekli ise, o zaman rasgele deiken Y = FX(X)
uniform dalmdr. Burada FX(.) Xin c.d.f.sidir.
Sra statistii: Eer X1, , Xn i.i.d ise, o zaman en dk knci deer Yknin
p.d.f.si

ee

2.2. Beklentiler
2.2.1 Beklenen Deer

Eer X srekli ise,

.c

Eer X kesikli ise,

Beklenen deerin nemli zelikleri

de
rs
no

1. sabit a iin

tla

ri

om

Xin Beklenen deerinin tanm

2. Xin dorusal fonksiyonu, Y = aX + b, iin

3. 2 veya daha fazla rasgele deiken iin

4. Eer X ile Y bamsz ise, o zaman

ee

beklenen deer Xin dalmnn konumunun lsdr


Y = u(X) fonksiyonun beklenen deeri (kesikli durumda integrali toplam ile
deitirin)

Jensen Eitsizlii: Eer u(.) konveks ise, o zaman

2.2.2. Varyans

om

yle tanmlanr:

Xin yaylmasnn lsdr.

.c

Varyansn nemli zelikleri

2. varyansin dier bir ifade ekli

tla

Var(a) = 0

ri

1. bir a sabit deeri iin

de
rs
no

3. X1, , Xn bamsz rasgele deikenlerin bir dorusal fonksiyonu iin

4. Herhangi X1, X2 deikenleri iin daha genel olarak

2.2.3. Kovaryans ve Korelasyon

Kovaryans

olarak tanmlanr

ee

Kovaryansn zelikleri

Eer X ve Y bamsz ise, Cov(X,Y) = 0.

om

Korelasyon katsays yle tanmlanr:

.c

Burada eer sadece ve sadece Y Xin deterministtik dorusal bir fonksiyonu ise,

tla

2.2.4. Koullu Beklenen Deer

ri

ve

de
rs
no

Koullu beklenen deer rasgele deikeni yle tanmlanr.

Koullu beklenen deer ile ilgili iki nemli sonu:


Yinelenen Beklentiler Kanunu

Koullu Varyans

2.3 zel Dalmlar

ee

2.3.1. zet
Aadaki dalmlara bakld:

Uniform: X

U[a, b] eer Xin p.d.f.si aadaki gibiyse

Normal: X

Poisson: X

om

E(eer Xin p.d.f.si aadaki gibiyse

.c

stel: X

N(, 2) eer Xin p.d.f.si aadaki gibiyse

ri

B(n, p) eer Xin p.d.f.si aadaki gibiyse

P(eer Xin p.d.f.si aadaki gibiyse

tla

Binom: X

de
rs
no

Her bir dalmn ortalamasn ve varyansn bilmeniz veya hesaplamay renmeniz


gerekir. Ayrca, Binom ile Poisson ve Binom ile Normal arasndaki iliiklerde gsterildi.

2.3.2. Normal Dalm

Rasgele deikenleri nasl standardize edildiini bilmeniz gerekir:

Size standart normalin c.d.f.lerinin tablosunun bir kopyasn vereceim, tabloyu nasl
okuyacanz bilmeniz gerekiyor.

ee

Normal dalm ile ilgili nemli sonular:


1. normal p.d.f. ortalama etrafnda simetriktir.
2. normal rasgele deikenlerin dorusal fonksiyonlar yine normal dalmldr:
Eer X N(, 2) ise, o zaman Y = aX + b N(a + b, a22)dir.
3. bamsz normal rasgele deikenlerin toplam da normal dalmldr.

om

4. Merkezi Limit Teoremi: i.i.d. rneklemi X1, , Xn iin standardize rneklem


ortalamas byk nler iin yaklak olarak standart bir normal dalmdr.

2.4. Asimptotik Teorisi


2.4.1 Ana Fikir
her zaman i.i.d. rneklem X1, , Xn varsay
sadece rneklem ortalamasyla ilgilen

Xinin dalm hakkndaki bilgimiz veri iken, kesin deeri/dalm bulmak ok


zordur, hatta imknszdr
deney n
in byk nler iin tahmin verdii varsaylr.

ri

de
rs
no

2.4.2. Byk Saylar Kanunu

tla

.c

Chebyshev Eitsizlii: herhangi bir

Byk Saylar Kanunu: Eer X1, , Xn i.i.d. ise, o zaman btn

bamszlk varsaym nemlidir(Kabalklarn bilgeliindeki olaylar arasndaki


korelasyon rnei gibi)
V(Xi) <
gereklidir, bylece Byk Saylar Kanun (LLN) ok iman kuyruklu
dalmlarda almaz.

> 0 iin,

ee

> 0 iin

2.4.3. Merkezi Limit Teoremi

standardize edilmi rneklem ortalamasnn dalmna baknz


Merkezi Limit Teoremi: Varyans Var(Xi) < olan bir i.i.d rneklemi iin

(.) normal c.d.f.dir.

om

burada

Rasgele binom deikenleri iin DeMoivre-Laplace teoremini gsteren grafikler


grdk.

.c

3. rnek Problemler
rnek 1. Bahar 2003 Snav, problem 3

de
rs
no

zm:

tla

ri

Cambridgedeki Baldwin okulunda nc snf retmeni Bay Bayson terfi almak


zeredir ve bunun gerekleme ihtimali ksmen rencilerinin MCAS snavndaki
performansna baldr.
On rencisi vardr ve snavda on soru sorulacaktr.
Varsayalm ki her rencinin her soruyu doru cevaplandrma ans %60tr, ve btn
sorularn cevaplar birbirinden bamszdr. En yksek notu alan rencisinin on
zerinde en az dokuz alma olasl nedir? En dk notu alan rencisinin on
zerinden en az alma olasl nedir?

Bu sorunun iki blmnn olduuna dikkat etmeniz gerekir: (1) bireysel test
sonularnn dalmn belirlemek ve (2) maksimumun ve minimumun c.d.f.lerini
bulmak.
Her bir rencinin snav notu olan X 10 bamsz denemenin baar says olduu iin,
X p.d.f.sini bildiimiz bir binom rasgele deikendir, X B(10, 0.6).

ee

Genel olarak, bir i.i.d rneklem X1, , Xnnin maksimumu olan Y1 aadaki c.d.f.ye
sahiptir. Burada Xin c.d.f.si FX(x)tir.

ve minimum Y2nin c.d.f.si

Veri bir rencinin 9dan dk olma olasl

om

ri

Veri bir rencinin 10 zerinde en az 3 alma olasl

.c

Dolaysyla, en yksek notu alan rencinin 10 zerinde en az 9 alma olasl

tla

Dolaysyla, en dk notu alan rencinin 10 zerinde en az 3 alma olasl

de
rs
no

rnek 2 Bahar 2007 Snav, Problem 3


Eer X

N( ,

) ise, Y = eXin log-normal dalm olduunu syleriz, Y

L( ,

(a) Ynin p.d.f.sini bulunuz

(b) Varsayalm ki yatrm yapmak iin 100.000 dolarnz var ve R1 getirisinin dalm
L( ,

) olan bir yatrm yapma olananz var. Yatrmn ortalamas

1.10dur ve varyans (
) 0.01dir. Yatrmn birinci dneminin
sonunda (100.000R1 dolar) servetinizin 110.000 dolardan daha yksek olma
olasl nedir?

(c) (b)deki parametre deerlerinin aynsn kullanarak, yatrmn bamsz iki


dnemini sonunda servetinizin 115.000 dolardan daha yksek olma olasl
nedir?

ee

zm:

(a) Bu dnm bire-birdir, bu nedenle deiken deitirme formln kullanabiliriz.


Xin herhangi bir reel say olabileceini not ediniz ve bundan tr Ynin destei
(0, )dir. Ters dntrme X = ln(Y)dir. Burada dX/dY = 1/Xtir. Bylece, y > 0
iin deiken deitirme formln kullanarak aadakini buluruz,

dier durumlarda

ve
i zerek balamak yararl olacaktr. Varyansn ifadesini faktrlere
ayrabiliriz:

.c

(b)

om

fY(y) = 0

Ortalamann ifadesini yerine koyunca ve varyansn da 0.01 olduu gereinde

ri

hareketle
elde ederiz. iin znce
0.090722098
elde ederiz. Sonra geriye doru gideriz ve grrz ki
0.09119493tr.

de
rs
no

tla

imdi birinci dnemin sonunda servetinizin 110000 dolardan byk olma olasln
bulalm. Elimizde

var. Burada normal olaslk tablosunun kullanarak standart normal c.d.f.nin deerini
bulabilirsiniz.

(c)

ee

ln(R1) ile ln(R2)nin bamsz normal olduklarn ve dolaysyla toplamlarnn da


normal olduunu not ediniz. Ortalama ortalamalarn toplamdr ve varyans
varyanslarn toplamdr. apka iaretini yeni ortalama, varyans ve standart sapma
iin kullanrsak,
0.18238986,
0.016460998 ve
0.128300421 olur.
Daha nceki hesaplamalar srdrrsek,

rnek 3 Bahar 2007 Snav, Problem 4

.c

om

Bir sve ekonomisti olan Mikael Priks bir sredir holigan aktiviteleri, kavgalar,
yaralamalar, vs., zerine sve polisi tarafndan toplanan detayl veri ile Firman Boys
etesinin yelerinden birisinin kendi raporunu kullanarak (bkz. www.lrzmuenchen.de/ces/mikael.htm) futbol holiganlar ile ilgili eitli ekonomik konular
almaktadr. Bir makalesinde dman holigan gruplar arasnda olas ve sert
kavgalarn nedenlerini analiz eder. Bunun iin, kavgalar ve yaralanmalar zerine bir
model gelitirir. Modelde bir sezonda dman gruplarnn olas karlama says bir
P(5) dalmdr (Poisson = 5). Dahas, her kavgada en az bir yaralanmann olacan
ve gerekte, 10a kadar her yaralanmann eit olaslkl olduunu varsaymtr.

ri

(a) sz konusu varsaymlar veri iken, bir yl ierisinde iki dman grubun birbirini
yaralama saysnn beklenen deeri nedir? Sz konusu saynn varyans nedir?

de
rs
no

zm:

tla

(b) Varsayalm ki belirtilenlerin yerine, iki dman grup karlatnda kavga olma
olasl sadece 1/2dir (olas karlamalar bamsz varsayabilirsiniz). (a)ya
vereceiniz cevap nasl deiir.

(a) X bir sezondaki kavga saysn ve Y yaralanma saysn ifade etsin. Ayrca
karlamann kavga ile sonulanacan varsayacaz. Bu durumda, E(Y) =
E(E(Y|X)) = E(5.5X) = 5.5E(X) = 5.5(5) = 27.5 olur. Ve Var(Y) = E(Var(Y|X)) +
Var(E(Y|X)) = E(

) + Var(5.5X). [NOT: bir kavgadaki yaralanmalarn

saysnn varyans

dir. Bylece, eer kavgalar aras yaralanmalarn dalm

bamsz ise, X saydaki kavgada yaralanma saysnn varyans


Hesaplamalara devam edince, E(

) + Var(5.5X) = (99/12)E(X) +

(121/4)Var(X) = (99/12)(5) + (121/4)(5) = 192.5 elde ederiz.

ee

(b) Z karlama ihtimalini ifade etsin. Bu durumda

Varyans iin ise hala unu syleyebiliriz:

olur.]

om

Aslnda imdi E(X) ve Var(X) (a)dakine gre deimi oldu. E(X)in nceki deerinin
yars kadar olduunu grmek zor deil(imdi 2.5tir). p = 0.5 ve Z kadar deneme ile
X|Z bir binom olduu gereini kullanarak, Xin varyans yle yazabiliriz:

.c

Geriye doru gidince

Bahar 2003 Snav, problem 3

tla

rnek Problemler

ri

elde ederiz.

de
rs
no

Cambridgedeki Baldwin okulunda nc snf retmeni Bay Bayson terfi almak


zeredir ve bunun gerekleme ihtimali ksmen rencilerinin MCAS snavndaki
performansna baldr.
On rencisi vardr ve snavda on soru sorulacaktr.
Varsayalm ki her rencinin her soruyu doru cevaplandrma ans %60tr, ve btn
sorularn cevaplar birbirinden bamszdr. En yksek notu alan rencisinin on
zerinde en az dokuz alma olasl nedir? En dk notu alan rencisinin on
zerinden en az alma olasl nedir?

Bahar 2007 Snav, Problem 3


Eer X

N( ,

) ise, Y = eXin log-normal dalm olduunu syleriz, Y

L( ,

(a) Ynin p.d.f.sini bulunuz

ee

(b) Varsayalm ki yatrm yapmak iin 100.000 dolarnz var ve R1 getirisinin dalm
L( ,

) olan bir yatrm yapma olananz var. Yatrmn ortalamas

1.10dur ve varyans (
) 0.01dir. Yatrmn birinci dneminin
sonunda (100.000R1 dolar) servetinizin 110.000 dolardan daha yksek olma
olasl nedir?

om

(c) (b)deki parametre deerlerinin aynsn kullanarak, yatrmn bamsz iki


dnemini sonunda servetinizin 115.000 dolardan daha yksek olma olasl
nedir?

Bahar 2007 Snav, Problem 4

tla

ri

.c

Bir sve ekonomisti olan Mikael Priks bir sredir holigan aktiviteleri, kavgalar,
yaralamalar, vs., zerine sve polisi tarafndan toplanan detayl veri ile Firman Boys
etesinin yelerinden birisinin kendi raporunu kullanarak (bkz. www.lrzmuenchen.de/ces/mikael.htm) futbol holiganlar ile ilgili eitli ekonomik konular
almaktadr. Bir makalesinde dman holigan gruplar arasnda olas ve sert
kavgalarn nedenlerini analiz eder. Bunun iin, kavgalar ve yaralanmalar zerine bir
model gelitirir. Modelde bir sezonda dman gruplarnn olas karlama says bir
P(5) dalmdr (Poisson = 5). Dahas, her kavgada en az bir yaralanmann olacan
ve gerekte, 10a kadar her yaralanmann eit olaslkl olduunu varsaymtr.

de
rs
no

(a) sz konusu varsaymlar veri iken, bir yl ierisinde iki dman grubun birbirini
yaralama saysnn beklenen deeri nedir? Sz konusu saynn varyans nedir?

ee

(b) Varsayalm ki belirtilenlerin yerine, iki dman grup karlatnda kavga olma
olasl sadece 1/2dir (olas karlamalar bamsz varsayabilirsiniz). (a)ya
vereceiniz cevap nasl deiir.

Olaslk ve statistik Ders Notlar 17

om

Konrad Menzel
16 Nisan 2009

.c

1. Merkezi Limit Teoremi

B(n, p) dalml rasgele deikenin Z =

ri

Geen hafta binom rasgele deikenler iin DeMoivre-Laplace teoremini grdmz


hatrlaynz. Bu teorem esas itibariyle, byk n deerleri iin standardize edilmi Y ~
nin yaklak olarak standart normal

tla

dalml olduunu syler. Bir binom, i.i.d. sfr/bir rasgele deiken Xilerin (baar ile
sonulanan denemelerin saym) toplam olduu iin,
ortalamas olarak dnebiliriz.

yi X1, Xn rnekleminin

de
rs
no

Dolaysyla, DeMoivre-Laplace teoremi gerekte i.i.d. sfr/bir rasgele deikeninin


ortalamasnn bir sonucudur. Merkezi Limit Teoremi bunu sonlu varyans olan dier
herhangi bir dalmdan elde edilen i.i.d sekanslarnn rneklem ortalamalarna
genelletirir.
Teorem 1 (Merkezi Limit Teoremi). Varsayalm ki X1, , Xn ortalamas ve varyans
<
olan bir dalmdan elde edilen n byklnde bir rasgele rneklemdir.
Herhangi bir sabit x deeri iin aadaki yazlabilir:

ee

Burada nnin ortalamas ve varyans 2 olan normal dalma yaknsayacan


syleyebiliriz (bazlar buna yaknsama kanunu der). Semboller ile ifade edersek

O halde bir ortalama nasl olurda ayn anda hem sabit bir deer ya (Byk Saylar
Kanununa gre) ve hem de varyans 1 olan (merkezi limit teoremine gre) rasgele bir
deikene yaknsar? Buradaki nemli detay merkezi limit teoremi ile ilgilidir yani
dalmn bir noktaya dmesini (Byk Saylar Kanununda bu olur) veya sonsuza

kadar patlamasn engelleyecek en uygun oran verecek ekilde rneklem ortalamasn


nin arpm kadar yukar ekeriz.

.c

om

Bir dalmn ortalamasn snrlandrmak iin niye normal dalm balamak iin en
uygun adaydr? ki bamsz normal rasgele deikenin toplamnn yine normal bir
dalm olduunu (her ne kadar varyanslar farkl olsa da, sadece standardize edilmi
ortalamaya baktmz iin bu o kadar da nemli deildir) tarttmz tekrar
hatrlaynz. Yani bklme (yani dalmdan bamsz rasgele deiken ekleme)
asndan normal dalm ailesi istikrarldr. Bunun dier dalmlarn ou iin doru
olmadn belirtelim (uniform veya stel gibi).

de
rs
no

tla

ri

rneklem ortalamas tek tek gzlemlerin arlklandrlm ortalamas olduu iin,


diyelim ki rneklemi nden 2ne karrsak, Xn+1, , X2n sekansnn ortalamas birinci
ortalamaya eklenir ve 2ye blnr. Dolaysyla, eer byk nler iin bile,
nin
dalmnn elde edilen iki bamsz deikenin toplamnn ayn dalm ailesinde
olmayan trden olduunu varsaym olsaydk, rneklem ortalamasnn dalm yine de
ihtiyari byk n deerleri iin ok deiirdi ve dolaysyla istikrarl bir limite doru
gitmeyebilirdi. Bu durum, ortalamann dalmnn limitte normal dalma yaklamasnn
niye kabul edilebilir olduu konusunda yeterince bilgi veriyor olmas gerekir .

ee

ekil 1. n para atnn tura says: rneklem ortalamas


edilmi rneklemin ortalamas

n(solda)

ve standardize

(sada)

rnek 1. Varsayalm ki X1, , Xn i.i.d. olan rasgele deikenlerdir ve Xi ~ U[0, 1]


dalm uniformdur, dolaysyla p.d.f yle olur:

om

imdi ksm toplamlarn p.d.f.sini hesaplamak iin 10nuncu dersteki bklme formln
kullanabiliriz,

ri

.c

k = 2 iin, aadakini elde ederiz (integralin limitlerine dikkat etmek gerekir)

de
rs
no

tla

Sonraki hesaplamalar ok karmak olabilir nk integralin limitlerini ve younluktaki


krlma noktalarn srekli kontrol etmek gerekir. Baz hesaplamalardan sonra, k = 3 iin
unu elde ettik,

Rasgele deikenlerin toplamlarnn beklenen deeri ile ilgili kurala gre

Ayrca, X1, X2, , Xk bamsz olduklar iin, toplamn varyans ile ilgili kural
kullanabiliriz

ee

Bundan tr, SKnn standardize edilmi hali olan Zk aadaki ile verilir:

Buradan hareketle, deiken deitirme formln kullanarak standardize edilmi Z1,


ya eit olduuna dikkat

tla

ri

.c

om

Z2, Z3n younluklarn hesaplayabiliriz (trevin sadece


ediniz):

ee

de
rs
no

Bunun grafiksel olarak nasl grndne bakalm:

Uniform rasgele deikenlerin standardize edilmi toplamlarnn p.d.f.si sadece 3 kadar


bamsz ekiliin toplamlarnn standart normal p.d.f.sine ok benzemektedir. Bu bir

srprizdir nk uniform
deikeninkine benzemez.

younluun

kendisi

hibir

ekilde

normal

rasgele

om

Son rnek, 3 kadar az (en azndan optik olarak) saydaki n iin normal tahminin olduka
iyi grnmesi konusunda biraz aldatc olsa da, n
durumunda, genellikle n
40
veya daha yksek deerler iin tahminin doru olduunu ifade ederiz.

Gerek p.d.f.yi hesaplamayabiliriz nk Xlerin tam dalmn bilmiyoruzdur,


Gerek p.d.f.yi hesaplamak istemeyebiliriz nk hesaplamalar ok karmak
olabilir- Bu genel bklme forml (rnee baknz), ve dier birok kesikli rnek
(son dersteki Binom rnek gibi) iin nerdeyse tartmasz dorudur.

2. Tahmin

tla

ri

.c

zetleyecek olursak, rneklemin gerek ortalamasnn p.d.f.sini hesaplamak


istemediimiz zaman Merkezi Limit Teoremi zellikle yararldr. Bunun
gerekleebilecei iki durum vardr

de
rs
no

Bu derste imdiye kadar, bir rasgele deikenin dalmnn parametrelerini bildiimizi


varsayarak baladk. rnein X ~ P[] olduunu biliyorduk ve daha sonra o dalmdan
olaslklar ve rasgele deikenin dier zeliklerin hesaplyorduk. imdi ise probleme
tersten bakacaz:
parametreleri bilinmeyen bir dalmdan elde edilen bir i.i.d. rnekleme sahip
olduumuzu varsayacak olursak, ilediimiz dalm ailelerinde yer alan hangi
deerinin veriyi retmi olabilecei konusunda nasl makul bir cevap elde ederiz?
rnek 2. Eer bir madeni para verilmiken tek bir atn tura gelme olasln
bilmiyorsak, ok sayda at yapabiliriz. O zaman turalarn orann, =

, daha

sonra aklayacamz mantkla P(Tura) olasl iin iyi bir tahmin olabileceini
dnebiliriz.
f(x| ) p.d.f.leri veri iken, bir parametre bir dalmlar ailesinin sabit endeksidir. Burada
parametreleri genellikle 1 , k olarak ifade ederiz.

ee

rnek 3.

Binom dalm iin parametreler n deneme says ve p baar orandr.

om

Normal dalm iin parametreler ortalama ve standart sapma dr.

Poisson dalm bir tek parametreye sahiptir,

ri

.c

tla

statistiin ou, bilinen dalm ailelerinin hangi yesinin gzlemlenmi bir srecin veya
olayn doru olaslk dalmn vereceini belirlemekle ile ilgilidir. Sembolik olarak, X ~
f[x| 0] iken biz parametre deeri 0 bulmak isteriz. Bu durum, dalm karakterize
eden parametreleri tahmin etme problemidir.

de
rs
no

Her zaman bir rasgele rneklem X1, , Xn ile balayacaz ve her zaman aadaki
varsaymda bulunacaz:
bilinmeyen

iin X ~ f[x| 0]

Tanm 1. nin tahmin edicisi bir istatistiktir ( yani X1, , Xnin bir fonksiyonudur),

Bir rneklemde bir tahmin edicinin gereklemesi, (x1, , xn),


adlandrlr.

nn tahmini olarak

Rasgele bir rneklemin fonksiyonu olarak, tahmin edici uygun bir rasgele deikendir,
bu nedenle genel olarak p.d.f.si cinsinden dalmn aklamak ve dalmnn momenti
ile ilgileneceimize dikkat ediniz.

ee

rnek 4. Varsayalm ki Xi ~ Bernoulli( 0)dir, yani X sfr/bir rasgele deikendir ve 1


deerini olaslkla alr ve p.d.f.si yledir:

0n

nasl tahmin ederiz?

.c

rnein 5 Bernoulli denemesi 1, 0, 0, 1, 1 iin unu buluruz,

om

rneklem ortalamasn kullanabiliriz,

de
rs
no

tla

ri

5 gzlemli bir rneklemde tahmin edicisi bir rasgele deiken olduu iin, p.d.f.sini
elde edebiliriz: hatrlaynz S5
(
) iin S5 ~ B(5, 0)dr. Kesikli rasgele
deikenlerin p.d.f.sini bulmann yntemlerini = (S5)/5e uygularsak, aadakini elde
ederiz:

zelikle, tahmin edicinin dalm gerek 0 olaslna baldr o olaslk [0,1]


aralnda herhangi bir yerde olabilir- fakat sadece 6 farkl kesikli deer alabilir.
rnek 5. Eer X ~ U[0,
p.d.f.si yledir:

] dalm parametreye bal olarak bir aralkta uniform ise,

yi nasl tahmin edebiliriz? Aadakileri kullanabiliriz,

ee

Diyelim ki, dalmdan rnek setik, 0.2, 0.6, 0.4. O zaman 1 =0.6 ve 2 =0.8 olurdu
ve bylece ayn parametre iin iki tahmin edici farkl cevap verirdi. Bu farkl tahmin
ediciler arasndan nasl seim yapacaz? Buna biraz sonra geri dneceiz.

(X1, , Xn) fonksiyonlarna nasl ularsnz?


Bu tahmin edicilerin makul olduunu nasl belirleyebiliriz?

Ayn parametre iin bir veya iki tahmin edici arasndan nasl seim yapmalyz?

om

3. Tahmin Edicilerin Genel zelikleri

ri

ile varyans yle yazacam:

tla

Ayn ekilde, parametre

.c

Xin beklenen deerini parametre ile ifade edeceiz, yani eer gerek parametre ya
eitse Xin beklenen deeri yledir:

de
rs
no

Bir tahmin edicinin sapmas(yanll .N.) onun beklenen deeri ile gerek deeri
arasndaki farktr.

Elbette ki, ortalama olarak parametreyi doru veren bir tahmin ediciyi isteriz, yani ideal
olan sapmann sfr olmasdr.
Tanm 2. Bir tahmin edici = (X1, , Xn)
iin

iin sapmaszdr eer btn

deerleri

ee

rnek 6. Varsayalm ki, X1, ,Xn N( ,


) dalmndan elde edilen bir i.i.d.
rneklemdir. Geen hafta rneklem ortalamasnn beklenen deerinin herhangi bir
deeri iin

olduunu grmtk, bu nedenle


tahmin edicidir.

normal dalmn ortalamas iin sapmasz bir

om

rnek 7. .i.d. olan X1, , Xn rasgele rnekleminden ortalamas bilinmeyen X


N( ,
) dalm iin varyans parametresi yi tahmin etmek istediimizi varsayalm.
=
2
[(X - [X]) ] olduu iin, sezgisel olarak ilgi ekici bir tahmin edici aadaki gibi olabilir

de
rs
no

tla

ri

[X2] = [X])2 + Var(X) ilikisini hatrlaynz, bylece

.c

(burada rneklem ortalamasn gerek beklenen deeri ile yer deitirttik). Eer
dalmn gerek parametreleri (0, 02) ise, bu tahmin edicinin beklenen deeri nedir?

Dolaysyla 2
iin sapmasz bir tahmin edici deildir, fakat 2 iin ok kolay bir
sapmasz tahmin edici oluturabiliriz.

ee

Bu sapma nereden geliyor? Genel konumak gerekirse, bunun nedeni kare parantezin
iindeki y grltl bir tahmin olan = n ile yer deitirmemizdir. Eer 0
bilinseydi, tahmin edici 2 =

nin iin sapmasz olacan kendiniz

kontrol edebilirsiniz.

Ortalamay tahmin etmek veriden bir serbestlik derecesi gtrr- rnein eer elimizde
sadece tek gzlemli bir rneklem olsayd, tahmin edilen ortalama o gzleme eit olurdu

ve varyansn saf tahmin edicisi bize 2 = 0 verirdi, akas bu da doru cevap


deildir.

om

Sapmaszlk bizim ilgilendiimiz tek ey olmayabilir. Ortalama olarak tahmin edicinin


gerek parametreye eit olmas belli bir rneklem iinde yle olaca anlamna
gelemeyeceinden, gerekte tahmin gerek parametreye yakn olacaktr.

ri

.c

Tanm 3. Eer nyi artrrken tahmin edici olaslk bakmndan 0a yaknsarsa, bir X1,
, Xn rneklemi iin, nn iin tutarl bir tahmin edici olduunu syleyebiliriz. Btn
> 0 deerleri iin

tla

Kelimeler ile ifade edecek olursak, yeterince byk bir rneklemde, tutarl bir tahmin
edici yksek bir olaslkla gerek parametreye ok yakn bir araln iinde olacaktr.
Dikkat edilecek olursa sapmaszlk ve tutarllk iki ok farkl rten kavramdr, ancak
biri dierini ima etmez.

de
rs
no

rnek 8. Uniform dalm iin sz konusu olan tahmin edicilerimizden birine geri
dnelim, X ~ U[0, 0]. Eer aadaki ifadeye bakaca olursak,

1in iin sapmasz olmadn kolaylkla grebiliriz, nk uniform dalmn


doasndan tr, Xinin btn olas deerleri 0ten kktr. Bu nedenle, n ne kadar
byk olursa olsun, P(max{ X1, , Xn} < 0) =1dir. Bylece Beklenen deer o[ 1] <
0dr. Ancak,
0 iin tutarldr: Uniform dalmndan elde edilen bir tek gzlem olan X
iin c.d.f.nin FX(x) = x/ 0 olduunu kolayca grebiliriz. Yn := max{X1, , Xn}
rneklemin nnci sra istatistii olduu iin, daha nceki tartmalarmzdan 0 y 1
iin FYn(y) = (FX(y))n = (y/ 0)ni elde ederiz. 1 olaslkla 1 < 0 olduu iin, herhangi bir
rneklem says n ve herhangi bir > 0 iin aadakini hesaplayabiliriz,

ee

burada > 0 olduu iin p :=

< 1dir. Bu nedenle, ni artrrken,

0dan

dan daha

fazla sapmann olasl yok olur, ve dolaysyla 1 tutarldr.


rnek 9. Byk Saylar Kanununa gre, rneklem ortalamas olaslk olarak [X] = ya
yaknsar. Dolaysyla, N( ,
)) olan rasgele deikeninin bir i.i.d. olan X1, , Xn
rneklemi iin, rneklem ortalamas nn tutarl bir tahmin edicisidir.

om

Ayr bir seenek olarak, makul olmayan bir (X1, , Xn) tahmin edicisine bakalm. Bu
durumda,

ee

de
rs
no

sapmaszdr ancak tutarl deildir.

N(0, 1) dalmldr. Bu argmanlardan hareketle,

tla

burada standardize edilen Z :=

ri

.c

Dolaysyla bu tahmin edici sapmaszdr. Ancak, herhangi bir n rneklem bykl iin,
tahmin edicinin dalm sz konusu X
N( , )in aynsdr, bu nedenle rnein = 0
iin, btn nlerin olasl

14.30 Ekonomide statistiksel Yntemlere Giri


Ders Notlar 18

om

Konrad Menzel

.c

23 Nisan 2009

1.1. Standart Hata

ri

1. Tahmin Edicinin zelikleri (devam)

tla

Sk sk tahmin edicinin kesin doruluu hakknda da ifadeler gelitirmek isteriz


tahminin deerini her zaman ortaya koyabilirizz, fakat onun gerekten de gerek
parametreye yakn olduundan ne kadar eminiz?

de
rs
no

Tanm 1. Bir tahminin standart hatas ( ), tahmin edicinin standart sapmasdr (ya da
tahmin edilmi standart sapmas). yle gsterilir:

Bir tahmin edicinin bir rasgele deikenin fonksiyonu olduunu hatrlamanz gerekiyor
ve bu nedenle bu rasgele deiken iin beklenen deeri, varyans ve dier momentleri
hesaplayabiliriz.
ndir,

burada Var(Xi) =

/n

rnek 1. Bir i.i.d. olan rneklem X1, , Xnin ortalamas


varyansna sahiptir. Dolaysyla standart hata

ee

Eer

i bilmiyorsak, tahmin edilmi standart hatay hesaplarz

Standart hata tahminlerin doruluunu karlatrmann bir yoludur ve aka daha


dk standart hatal/varyansl tahmin ediciyi tercih ederiz.

0,

om

Tanm 2. Eer A ve B iin sapmasz tahmin ediciler ise, yani o[ A] = o[ B] =


zaman eer aadaki koul salanrsa A nispetten Bye gre daha etkindir deriz:

.c

Bazen tm tahmin edicilere, = { 1, 2 ,}, bakarz ve tm lar arasnda eer A en


dk varyansa sahip ise etkindir deriz.

de
rs
no

tla

ri

rnek 2. Varsayalm ki X ile Y iki farkl Matematik snavnn notlardr. Siz bir eit
matematik yetenei ile ilgileniyorsunuz ve iki notta grltldr (muhtemelen iki not
arasnda korelasyon vardr), ayrca [X] = [Y] = , Var(X) = X2, Var(Y) = Y2, ve
Cov(X,Y) = XY. Bir tek lm kullanmak yerine, ikisini arlklandrlm ortalama pX +
(1 p)Y ile birletirmeye karar verdiniz. Bu arlklandrlm ortalamann beklenen
deeri nedir? pnin hangi deeri arlklandrlm ortalamann varyansn minimize
eder? Bunu sadece iki gzlemli bir rneklem kullanarak y tahmin etmek istediimiz
bir tahmin problemi olarak yorumlayabiliriz. Btn X ve Y arlklandrlm ortalamalar
olduu iin, etkin tahmin ediciyi bulmaya alacaz.
Rasgele deikenlerin toplamnn varyansnn formlnden

elde ederiz. Optimal pyi bulmak iin, birinci trevi sfra eitleriz, yani

p iin znce, varsayalm ki X2+ Y2 >2 XY varsaym altnda (bunun lokal


minimum iin yeterli bir koul olduuna dikkate diniz), aadakini elde ederiz

ee

Eer X ile Y arasnda korelasyon yoksa, etkin tahmin edici X zerine p* =

arln koyar. Bu arlk, nispeten Ynin varyansna gre Xin daha dk varyans
deerleri iin daha byk deerler alr.

bir

2. Tahmin Edici Oluturma Yntemleri


2.1. Momentler Yntemi

tla

ri

.c

om

Bu yntem1894te Britanyal istatistiki Karl Pearson tarafndan nerildi: varsayalm ki


bir dalmn k kadar parametresini tahmin etmek zorundayz. O zaman, verinin ilk k
rneklem momentlerine bakmalyz,

de
rs
no

ve dalma gre hesaplanan bir parametre deeri veri iken, onlar ilgili kitle
momentlerine eitlemeliyiz.

O zaman momentler yntemi (MoM) tahmin edicisi aadaki denklem zlerek elde
edilebilir. Btn lar iin

ee

rnek 3. Varsayalm ki X1, .,Xn parametresi, , bilinmeyen bir Poisson dalmndan,


X ~ P() elde edilen bir i.i.d. rneklemdir. Dalmn sadece bir bilinmeyen parametresi
vardr ve birinci kitle momenti aadaki ile verilir:

Dolaysyla MoM tahmin edicisi yledir:

om

Eer gerekenden fazla moment kullanarak parametreleri tahmin edersek ne olur?


Poisson dalm iin ayrca unu da biliyoruz:

ri

.c

rnek 4. Bir ift stel rasgele deikenini p.d.f.si

tla

o halde iki parametre (, )y tahmin etmek zorundayz. Bir istatistik kitabna baknca
unu buluruz

de
rs
no

bylece momentler ynteminin tahmin edicisi aadakini zer.

O halde ( , ) iin znce aadaki, elde edilir:

2.2. Maksimum Olabilirlik Tahmini

ee

Momentler yntemi sadece seili sayda kitle momentini rneklemdeki karlklar ile
eletirmeye alrken, ayr bir seenek olarak mmkn olduunca en iyi ekilde
rneklem dalmn bir btn olarak kitle dalmyla eletiren bir tahmin edici
gelitirebiliriz. Bu, parametre nn maksimum olabilirlik tahmin edicisinin yapt eydir.
Sz konusu parametre, kabaca sylemek gerekirse, byk ihtimalle gzlemlenen
rneklemi ortaya karan deerdir:

Varsayalm ki bir i.i.d. olan bir Y1, , Yn rneklemimiz var. Ynin p.d.f.si parametre ya
kadar bilinen fY(y|) ile veriliyor. Maksimum olabilirlik tahmin edicisi( MLE) nn altndaki
verinin bileik p.d.f.sini maksimize eden nn bir fonksiyonudur.

om

Daha spesifik olmak gerekirse, rneklemin olabilirliini aadaki gibi tanmlarz:

() ve L()nin ayn deerlerde

tla

Logaritma kesin artan bir fonksiyon olduu iin,


maksimize olacan not ediniz.

ri

.c

Genellikle olabilirlik fonksiyonun logaritmasn maksimize etmek ok daha kolaydr.

de
rs
no

nerme 1. Parametre 0da log- olabilirliinin beklenen deeri

ile gerek parametre 0da maksimize olur.

SPAT: zerinde beklenen deeri hesapladmz gerek younluk fY(y|) olduu iin,
Jensen Eitsizliini kullanarak btn deerleri iin o[L(Y|) L(Y| 0)]
0 ve
log(.)nin konkav olduunu gsterebiliriz.

ee

burada f(y|) bir younluk olduu iin, integrali 1dir. Bundan tr btn deerleri iin
o[L(Y| 0)]
o[L(Y|)] olduundan, sz konusu 0 fonksiyonu maksimize eder.
Byk Saylar Kanununa gre, i.i.d. olan bir rneklem iin log-olabilirlik yledir:

Dolaysyla, i.i.d olan byk rneklemlerin log olabilirliini maksimize etmenin bize
yakn bir parametre vereceini dnebiliriz.

0e

om

rnek 5. Varsayalm ki X
N( 0, 02)dir ve bir i.i.d. rneklem X1, , Xnden ve 2
parametrelerini tahmin etmek istiyoruz. Olabilirlik fonksiyonu yledir:

de
rs
no

tla

ri

.c

Log-olabilirlii maksimize etmenin daha kolay olduunu ortaya koyabiliriz,

Maksimumu bulmak iin, ve 2ye gre trevleri alp sfra eitleriz:

Ayn ekilde,

Hlihazrda, bu tahmin edicinin 02 iin sapmasz olmadn gsterdiimizi hatrlaynz,


bu nedenle genel olarak Maksimum Olabilirlik Tahmin Edicileri sapmasz olmak zorunda
deildir.

ee

rnek 6. Uniform dalml rnee geri dnelim: varsayalm ki Xi ~ U[0, ]dr ve nn


tahmini ile ilgileniyoruz. Momentler yntemi tahmin edicisi iin aadakini grebilirsiniz,

bylece bunu rneklem ortalamasna eitleyerek aadakini elde ederiz:

om

Maksimum olabilirlik tahmin edicisi nedir? Akas, biz herhangi bir


max { X1, ,

Xn } almayacaz nk dan byk gereklemi bir rneklemin altnda sfr olasl


vardr. Biimsel olarak, olabilirlik

tla

ri

.c

max { X1, , Xn }nin herhangi bir deeri maksimumu olamaz nk btn o


noktalarda L()in sfr olduunu grebiliriz. Ayn zamanda,
max { X1, , Xn } iin
olabilirlik fonksiyonu da kesin azalandr ve bu nedenle aada ifade edildii gibi
maksimumdur

de
rs
no

1 olaslkla Xi < 0 olduu iin, maksimum olabilirlik tahmin edicisi de 1 olaslkla 0dan
dk olacaktr, bylece sapmasz deildir. Daha da ak olmak gerekirse, X(n)in p.d.f.si
aadaki gibi verilir:

Bylece,

ok kolay bir ekilde bir sapmasz tahmin edici, =

, oluturabiliriz.

2.3. MLEnin zellikleri

ee

Aadakiler sadece MLE iin elde edilen temel teorik sonularn zetidir(bu aamada
ispatlar yapmayacaz):

Tutarl tahmin ediciler grubunda etkin bir tahmin edici varsa, MLE onu oluturur.
Belli dzenleyici koullar altnda, MLE asimptotik olarak normal dalm olabilir
(bu esas itibariyle Merkezi Limit Teoreminin bir uygulamasndan gelmektedir).

Maksimum olabilirlik her zaman yaplmas gereken en iyi ey mi? Hayr

sapmal olabilir
genellikle hesaplanmas zordur
ilgili dalm ile ilgili yanl varsaymlara kar ok hassas olabilir.

ee

de
rs
no

tla

ri

.c

om

Olaslk ve statistik Ders Notlar 19

om

Konrad Menzel
28 Nisan 2009

.c

1. Maksimum Olabilirlik Tahmin: lave rnekler

tla

ri

rnek 1. Varsayalm ki X
N( 0, 02)dir ve bir i.i.d. rneklem X1, , Xnden ve 2
parametrelerini tahmin etmek istiyoruz. Olabilirlik fonksiyonu yledir:

de
rs
no

Log-olabilirlii maksimize etmenin daha kolay olduunu ortaya koyabiliriz,

Maksimumu bulmak iin, ve 2ye gre trevleri alp sfra eitleriz:

ee

Ayn ekilde,

om

Hlihazrda, bu tahmin edicinin 02 iin sapmasz olmadn gsterdiimizi hatrlaynz,


bu nedenle genel olarak Maksimum Olabilirlik Tahmin Edicileri sapmasz olmak zorunda
deildir.

.c

rnek 2. Uniform dalml rnee geri dnelim: varsayalm ki Xi ~ U[0, ]dr ve nn


tahmini ile ilgileniyoruz. Momentler yntemi tahmin edicisi iin aadakini grebilirsiniz,

ri

bylece bunu rneklem ortalamasna eitleyerek aadakini elde ederiz:

de
rs
no

tla

max { X1, ,
Maksimum olabilirlik tahmin edicisi nedir? Akas, biz herhangi bir

Xn } almayacaz nk dan byk gereklemi bir rneklemin altnda sfr olasl


vardr. Biimsel olarak, olabilirlik

max { X1, , Xn }nin herhangi bir deeri maksimumu olamaz nk btn o


noktalarda L()in sfr olduunu grebiliriz. Ayn zamanda,
max { X1, , Xn } iin
olabilirlik fonksiyonu da kesin azalandr ve bu nedenle aada ifade edildii gibi
maksimumdur

ee

1 olaslkla Xi < 0 olduu iin, maksimum olabilirlik tahmin edicisi de 1 olaslkla 0dan
dk olacaktr, bylece sapmasz deildir. Daha da ak olmak gerekirse, X (n)in p.d.f.si
aadaki gibi verilir:

Bylece,

ok kolay bir ekilde bir sapmasz tahmin edici, =

, oluturabiliriz.

1.1. MLEnin zellikleri

Tutarl tahmin ediciler grubunda etkin bir tahmin edici varsa, MLE onu oluturur.
Belli dzenleyici koullar altnda, MLE asimptotik olarak normal dalm olabilir
(bu esas itibariyle Merkezi Limit Teoreminin bir uygulamasndan gelmektedir).

.c

om

Aadakiler sadece MLE iin elde edilen temel teorik sonularn zetidir(bu aamada
ispatlar yapmayacaz):

Maksimum olabilirlik her zaman yaplmas gereken en iyi ey mi? Hayr

de
rs
no

2. Gven Aral

ri

sapmal olabilir
genellikle hesaplanmas zordur
ilgili dalm ile ilgili yanl varsaymlara kar ok hassas olabilir.

tla

Tahminin deeri ve onun doruluu(standart hatas tarafndan verildii gibi) hakkndaki


bilgileri birletirmek iin, genellikle yaplan, bir tahminin etrafnda muhtemelen gerek
deeri ieren bir aralk belirlemektir.
rnek 3. Varsayalm ki deniz kuvvetlerinin bir topekerinin(bot) kaptan ky eridi
boyunca bir sahil koruma hatt oluturacaktr, fakat ondan nce denizden dorudan
grlmeyen sahildeki bir makineli tfein yok edilmesi veya en azndan ar tahribata
uratlmas gerekecektir.

Bota halihazrda sahilden birka kere at alr ve mermilerin geldii yne dayanarak,
kaptan silahn konumu hakknda bir tahmin oluturur. Tahmin, gerek 0 konumun
etrafnda 2 varyansl bir normal dalmdr.

ee

Kaptan, sahillin bir aralna fzelerle yaylm ateinde bulunarak o alandaki her eyi yok
edebilir. Kaptan, sahillin hangi aralna ate edeceini nasl belirleyebilir ki %95
olaslkla makineli tfein orada olup tahrip olacandan emin olabilir ve bylece birlikleri
gvenli bir ekilde sahile karabilir?

om
.c
ri
tla

de
rs
no

Kaynak: MIT OpenCourseWare

Normal dalm iin, olaslk ynn %95inin ortalamann her iki tarafndaki 1.96
standart sapmalk araln iinde olduunu biliyoruz. Bylece, eer kaptan CI = [
1.96, + 1.96] aral iin ate emri verirse, in 0 CI olma olasl %95tir.
Daha nce sadece gerek parametre 0 deerine yakn deer veren tek fonksiyon (X1,
, Xn ) aryor iken, imdi belli bir deere eit veya daha yksek olaslkla gerek
parametre deerini kapsayan (ieren) iki fonksiyon, A(X1, , Xn) < B(X1, , Xn),
oluturmaya alacaz.

Tanm1. Parametre 0 iin bir 1-lk gven aral A(.) ve B(.) gibi veriye-dayal iki
fonksiyona bal bir aralktr [A(X1, , Xn ), B(X1, , Xn )]. Yani,

ee

Bu fonksiyonlar benzersiz deildir fakat teamllere bal olarak, A ve Byi /2 olasl


araln her iki tarafna eit decek ekilde seiyoruz.

Bir gven aralnn, [A(x1, , xn), B(x1, , xn)], gereklemesi iin, P(A(x1, , xn)
0
B(x1, , xn) = 1 - olduunu sylemek mantkl deil, nk araln limitleri ve
gerek parametre imdi reel saylardr, bylece rneklemin gereklemesi veri iken,

tahmin edilen aralk ya 0 kapsar(1 olaslkla) ya da kapsamaz. Gerek parametre veri


iken rasgele olan gven araldr, yoksa 0 deil.

om

Aadaki kendisi iin gven aral oluturmak istediimiz en yaygn durumdur.

aadaki olaslkla kapsadn kontrol edebiliriz,

nn standardizasyonu olduu iin standart normal dalmldr.

de
rs
no

burada

tla

ri

.c

rnek 4. Varsayalm ki ~ N( 0,
)dir ve bir 1-lk birgven aral oluturmak
istiyoruz. Eer z1-/2 standart normal dalmn 1- (/2) ondal ise yani (z1-/2) = 1(/2) ise, o zaman aadakinin

Bylece eer bir %95lik gven aral istiyorsak, z1-/2 = z0.975 = 1.96dr, bu nedenle
gven aral 1.96 ile verilir.
Bu gven araln elde etmenin en yaygn yoludur, bu nedenle bunun nasl ilediini
anlamanz gerekiyor.

rnek 5. Anket sonular genellikle bir hata pay ile rapor edilir. rnein Gallupun 18
Nisan raporuna gre semenlerin %46snn McCaine kar Clintone, %44nn
McCaine oy vereceini, %10nun ise ya her ikisi iin de oy kullanmayacan ya da
herhangi bir fikri olmadn sylemitir. Bu sonular 4385 kiiyle yaplan grmeye
dayanmaktadr ve rapor ayrca ulusal yetikinlerin toplam rneklemine dayal sonular
iin, %95 gvenilirlikle maksimum rneklem hata pay yzde iki olduu sylenebilir
ifadesine yer vermitir. Bu ne anlama gelmektedir? Eer bir adayn gerek oy oran p
ise, n saydaki semen rnekleminde ortalama payn varyans VAR(

n)

dir. Bu

ee

varyansn p = 0.5 iin en yksek olduunu kendiniz de kontrol edebilirsiniz. Dolaysyla


4385 grmeli bir rneklem iin, maksimum standart sapma

tir.

Merkezi Limit Teoremine gre, n yaklak olarak normal dalmldr ve bir normal
dalm iin %95lik bir olaslk ktlesinin ortalamann 1.96 standart sapmalk aralnda

yer aldn daha nce grmtk. Bu nedenle, [ n -1.96(0.76) , n + 1.96(0.76)] aral


gerek oy orann %95ten daha byk bir olaslkla ierecektir. Semenin daha kk
alt gruplar iin hata pay daha byk olacaktr.

ri

tla

%95lik gven aralnn genilii yledir:

.c

om

rnek 6. Bir laboratuvar bir davada kant olarak kullanlabilecek bir kan rnei zerinde
kimyasal analiz yapmaktadr. Kant olarak kabul edilebilmesi iin, baz maddelerin
mevcudiyetinin %90lk gven aralnda % 0.001 g/mlden daha az olmas gerekir.
Analizler iin kullanlan makine gerek deer etrafnda standart sapmas = 0.05g/ml
olan normal dalml sonular vermektedir. %90lik gven aralnn 0.001 g/mlden az
olduundan emin olmak iin ka tane sonu almamz gerekir?

de
rs
no

Dolaysyla, l 0.001 olmas iin, n 16.452 = 270.6025e ihtiyacmz var, bu nedenle


de en az 271(bamsz) sonu almamz gerekir.
Sonraki rnek tahmin edicinin dalmnn normal olmad durumlarda gven aral
oluturmann bir yolunu gstermektedir.
rnek 7. Varsayalm ki X1, , Xn i.i.d.dir, dalm X ~ U[0, ]dir ve
gven aral oluturmak istiyoruz.

iin %90lik

ee

Yukardaki ifade nnci sra istatistii olsun (nceki derslerde gsterildii zere bu ayn
zamanda bir maksimum olabilirlik tahmin edicisidir). Daha nce grdmz gibi,
iin sapmasz olmamasna ramen, onu iin bir gven aral oluturmakta
kullanabiliriz. Sra istatistiinin sonularndan grdk ki nn c.d.f.sini veren in c.d.f.si
aadaki gibi belirlenmektedir:

burada U[0, 0] olan bir rasgele deikenin c.d.f.sini, F(x) = x/

0,

yerine koyduk,

A ve B fonksiyonlarn elde etmek iin, nce a ve b sabit deerlerini bulalm,

om

a ve b deerlerini aadakileri znce bulabiliriz

.c

bylece a =
ve b =
i elde ederiz. Bu bize henz bir gven aral
vermemektedir, nk gven aralnn tanmna gre biz gerek 0 deerini eitsizliin
ortasnda isteriz. Ve her iki tarafn fonksiyonlar sadece veriye ve dier bilinmeyen
byklkler baldr.

iin bir %90lik gven araldr.

de
rs
no

Bundan tr aadaki

tla

ri

Ancak aadakini yazabiliriz,

Bu durumda, araln snrlar sadece (X1, , Xn) tahmin ediciler araclyla veriye
baldr. Bu genel olarak doru olmak zorunda deildir.
imdi gven aralna nasl ulatmz tekrarlayalm:
1. nce (X1, , Xn) tahmin edicileri ve in dalmn elde et,
2. aadaki koulu salayacak olan a() ve b()yi bul

3. y zerek olay yeniden yaz

ee

4. A(X), B(X) deerlerini gzlemlenen rneklem X1, ,Xni kullanarak bul,


5. 1 lk gven aral aadaki ile verilir:

2.1 nemli Durumlar


bilinmiyor: Gven aral aadaki gibi

tahmin edicisi var:

ri

.c

2. normal dalmldr, Var( ) bilinmiyor fakat 2 =


Gven aral aadaki ile verilir

om

1. normal dalmldr, Var( )


oluturulabilir

Burada tn-1(p)deeri n -1 serbestlik dereceli t-dalmnn pnci yzdeliidir.

de
rs
no

tla

3. normal deil, fakat n > 30 veya daha fazla: yle anlalyor ki grdmz
btn tahmin ediciler(unifom dalm iin rneklemin maksimumu hari) merkezi
limit teoremine gre asimptotik olarak normaldir (Merkezi Limit Teorisini nasl
uygulayacamz konusu her zaman ak deil deildir). Bu durumda gven
araln
2deki
gibi
olutururuz.

4. normal deil, n kk: eer in p.d.f.si biliniyor ise, 1nci kullanlarak gven
aral oluturulabilir(son rnekteki gibi). Eer p.d.f. bilinmiyor ise,
yapabileceimiz bir ey yok.
2nci durumda t dalmn kullanmamzn nedeni udur:

N( ,

) olduu iin,

Dier taraftan, unu kontrol edebiliriz

ee

burada genellikle ortalamas sfr ve varyans 2 olan normal hatalarn karelerinin


toplam iin yazlr. Dolaysyla,

ee

de
rs
no

tla

ri

.c

om

Ayrca 4n genel durumunda (ve uniform ieren son rnekte), (X1, , Xn) istatistiinin
herhangi bir eyin sapmasz ve tutarl tahmin edicisi olmasn istemedik, fakat gerek
parametrede kesin monoton olmak zorundayd. Ancak, normal durumlar( in varyans
hakknda bilgi sahip olsak ta olmasak ta) ve durum 3 iin gven araln
oluturduumuzda, tutarl olmak zorundaydk.

Olaslk ve statistik Ders Notlar 20

om

Konrad Menzel
30 Nisan 2009

.c

1. Gven Aral (devam)

ri

Sonraki rnek tahmin edicinin dalmnn normal olmad durumlarda gven aral
oluturmann bir yolunu gstermektedir.
0

iin %90lik

tla

rnek 1. Varsayalm ki X1, , Xn i.i.d.dir, dalm X ~ U[0, ]dir ve


gven aral oluturmak istiyoruz.

de
rs
no

Yukardaki ifade nnci sra istatistii olsun (nceki derslerde gsterildii zere bu ayn
zamanda bir maksimum olabilirlik tahmin edicisidir). Daha nce grdmz gibi,
iin sapmasz olmamasna ramen, onu iin bir gven aral oluturmakta
kullanabiliriz. Sra istatistiinin sonularndan grdk ki nn c.d.f.sini veren in c.d.f.si
aadaki gibi belirlenmektedir:

burada U[0, 0] olan bir rasgele deikenin c.d.f.sini, F(x) = x/

0,

yerine koyduk,

A ve B fonksiyonlarn elde etmek iin, nce a ve b sabit deerlerini bulalm,

ee

a ve b deerlerini aadakileri znce bulabiliriz

bylece a =
ve b =
i elde ederiz. Bu bize henz bir gven aral
vermemektedir, nk gven aralnn tanmna gre biz gerek 0 deerini eitsizliin

ortasnda isteriz. Ve her iki tarafn fonksiyonlar sadece veriye ve dier bilinmeyen
byklkler baldr.

iin bir %90lik gven araldr.

.c

Bundan tr aadaki

om

Ancak aadakini yazabiliriz,

ri

Bu durumda, araln snrlar sadece (X1, , Xn) tahmin ediciler araclyla veriye
baldr. Bu genel olarak doru olmak zorunda deildir.

tla

imdi gven aralna nasl ulatmz tekrarlayalm:

de
rs
no

1. nce (X1, , Xn) tahmin edicileri ve in dalmn elde et,


2. aadaki koulu salayacak olan a() ve b()yi bul

3. y zerek olay yeniden yaz

4. A(X), B(X) deerlerini gzlemlenen rneklem X1, ,Xni kullanarak bul,


5. 1 lk gven aral aadaki ile verilir:

ee

1.1 nemli Durumlar


1. normal dalmldr, Var( )
oluturulabilir

bilinmiyor: Gven aral aadaki gibi

tahmin edicisi var:

om

2. normal dalmldr, Var( ) bilinmiyor fakat 2 =


Gven aral aadaki ile verilir

Burada tn-1(p)deeri n -1 serbestlik dereceli t-dalmnn pnci yzdeliidir.

ri

.c

3. normal deil, fakat n > 30 veya daha fazla: yle anlalyor ki grdmz
btn tahmin ediciler(unifom dalm iin rneklemin maksimumu hari) merkezi
limit teoremine gre asimptotik olarak normaldir (Merkezi Limit Teorisini nasl
uygulayacamz konusu her zaman ak deil deildir). Bu durumda gven
araln
2deki
gibi
olutururuz.

tla

4. normal deil, n kk: eer in p.d.f.si biliniyor ise, 1nci kullanlarak gven
aral oluturulabilir(son rnekteki gibi). Eer p.d.f. bilinmiyor ise,
yapabileceimiz bir ey yok.
N( ,

) olduu iin,

de
rs
no

2nci durumda t dalmn kullanmamzn nedeni udur:

Dier taraftan, unu kontrol edebiliriz

burada genellikle ortalamas sfr ve varyans 2 olan normal hatalarn karelerinin


toplam iin yazlr. Dolaysyla,

ee

Ayrca 4n genel durumunda (ve uniform ieren son rnekte), (X1, , Xn) istatistiinin
herhangi bir eyin sapmasz ve tutarl tahmin edicisi olmasn istemedik, fakat gerek
parametrede kesin monoton olmak zorundayd. Ancak, normal durumlar( in varyans
hakknda bilgi sahip olsak ta olmasak ta) ve durum 3 iin gven araln
oluturduumuzda, tutarl olmak zorundaydk.

2 Hipotez Testi

om

2.1 Ana Fikir

Fikir: bir kitleden elde edilen bir rasgele rneklem verilmi olsun, kitle hakkndaki baz
iddialara kar kmak iin yeterince kant var mdr? nce baz nemli kavramlar
tanmlayalm:

.c

ri

bir hipotez bir kitledeki (poplasyon) bir rasgele deikenin dalm hakknda bir
varsaymdr
sabit(maintained) hipotez test edilemeyen ancak ne olursa olsun doru olduu
varsaylan bir hipotezdir.
test edilebilir hipotez rasgele bir deikenden elde edilen kantlara gre test
edilebilir ve test edilecek bir hipotezdir.
bo hipotez test edilecek bir hipotezdir
alternatif hipotez bo hipotez dnda kitle hakkndaki dier olas varsaymdr.

tla

de
rs
no

Test problemi X1, , Xn rneklemini elde ettiimiz younluk f(x|0) ile ilintili olan 0
parametresinin 0 olas parametre deerler kmesine ait olup olmamas olarak ifade
edilebilir. Genellikle bo hipotezi aadaki gibi yazarz:

Bunu aadaki alternatif hipoteze kar test ederiz.

burada

Eer 0 = { 0} sadece bir tek parametre deeri ierirse, hipotezin basit olduunu
syleriz. Bir bileik hipotez birden fazla deer veya bir say aralnn tmn ieren bir
kmesi tarafndan verilir.

ee

rnek 2. En yaygn kurulumuyla, H0 basittir ve HA bileiktir. rnein, X


N( , ),
bilinmiyor ve = 0 olup olmadn test etmek istiyoruz. Bu kurulumda, sabit hipotez
Xiler i.i.d. normal ve Var(Xi) = dir. Bo hipotez H0 : = 0 (basit)tir ve bunu alternatif
hipotez H0 : 0 (bileik)e kar test etmek istiyoruz.

= P(1.Tip Hata) = P(Ret|H0)

om

Hipotezi test etmek iin veri toplamak zorundayz ve veriye dayanarak bo hipotezi ret
veya kabul edebiliriz. Ancak, verimiz her zaman btn kitlenin bir rneklemi olduu iin,
verdiimiz kararlarda hata yapma ihtimalimiz vardr. Belirli bir test iin 1. Tip hata yapma
olasl yle verilir:

Bu testin gvenirlik dzeyi (ayn zamanda bykl) olarak adlandrlr. Eer aadaki
ifadeyi yazarsak,

.c

= P(2.Tip Hata) = P(Ret etme|HA)

de
rs
no

tla

ri

o zaman 1 testin gcdr.

Genellikle testin gvenirlik dzeyini olutururuz, rnein % 5 gibi ve daha sonra


gvenirlik testi veri iken en yksek gce sahip bir test oluturmaya alrz. Dolaysyla
sanki bo hipotezi ret etmeme hatasn yapmay tercih ediyoruz.

ee

Bunun arkasndaki mantk ilk bata sezgisel alglamaya ters gibi grnr halbuki bu
gzlemlerden, btn kitleye genelletirilen ampirik sorundan veya bilimsel kanundan
kaynaklanmaktadr. Bilimsel kanun: kitle hakkndaki hipotezimizi dorulayan birka an
yakalam bile olsak, uymayan bir an gzlemlemek rtmek iin yeterlidir. Bu nedenle
ampirik kantlar sadece bir hipotezi ret etmek iin kullanabiliriz, hibir zaman kantlamak
iin deil. Aadaki Bertand Russeln mehur bir rneidir:
Evcilletirilmi hayvanlar kendilerini normalde besleyen kiileri grd
zaman yiyecek beklerler. Olduka kaba bu davrann tekdzelii,
yanlglarn sorumlusu olduunu biliriz. Tavuklar mrleri boyunca her
gn besleyen adam sonunda onun boynunu koparr, sanki doann
tekdzelii tavuklar iin yararlaym bak asna ince bir ayar yapar gibi.
[..] Gerek olan u ki, bir eyin belli sayda tekrarlanm olmas
hayvanlarda ve insanlarda ayn eyin tekrar olaca beklentisinin
olumasna neden olur. gdmz kesinlikle yarn gnein doacana
bizi inandrr, fakat beklenmeyen bir ekilde boynu kopartlan tavuktan
daha iyi durumda olmayabiliriz. (Rusell, The Problems of Philosophy) ,

om

Bu nedenle, eer, rnein, belli bir ilacn hastann durumunu belirgin bir ekilde
iyiletirdii konusunda bir kant sunmak istersek, bo hipotez H0 : ilacn hastann
durumu zerinde hibir etkisi yoktur olur. Bu hipotezi ret etmek, ilacn etkisi konusunda
ok gl kant bulduumuz anlamna gelir. Yani her zaman bo hipotezi rtmek
istediimiz ifade olarak belirliyoruz.

ri

.c

Baka bir rnek olarak, hukuk sistemini dnebiliriz: bir srete, iki tarafta sulu
veya susuz eklinde bir sonuca ulamak iin ortaya veri (kantlar) srerler ve jri yine
de iki hata yapabilir: masum bir kiiyi sulu bulabilir (1. Tip Hata) ya da bir suluyu
susuz bulabilir (2. Tip Hata). Modern hukuk sistemlerinin ou yarglamalar kiinin
susuz olduu varsaymna dayandrr, yani phelinin suu ispatlanan kadar masum
olduu varsaylr. Baka bir ifade ile, suu ispatlamann yk yargca veya jriye,
phelinin gerekten de sulu olduu konusunda ikna etmek iin yeterli kantt ortaya
koymak zorunda olan savcya biner.

de
rs
no

tla

Hipotez testlere gre alnan kararlar, alternatifin doru olmasna kar bo hipotezin
dorulu iin bata belirtilen olasl grmezlikten geldiimiz manasnda optimal olmak
zorunda deildir ve 1. Tip ile 2.Tip hatalar yapmann ilgili maliyetlerini hesaba
katmazlar. Hukuk sistemi iin, n sulamay (preemption) savunanlar bir ok konuda,
rnein terrizm gibi, 2. Tip hatann ok pahalya mal olabileceini sk sk tartrlar. Bu
nedenle hukuk sistemi baz vakalarda susuzluk varsaym iin istisnalara izin
vermelidir.

ee

Toparlayacak olursak, X1, , Xn rnekleminin her bir olas olayn ret etme ile ret
etmeme kararna balayacak bir kural formle etmek istiyoruz.

Olaslk ve statistik Ders Notlar 21

om

Konrad Menzel
5 Mays 2009

.c

Hipotez Testi Oluturmak

ri

i destekler. Bir
Eer Xi SX desteine sahipse, o zaman rneklem X = (X1, , Xn)
testin kritik blgesi kendisi iin bo hipotezi ret edeceimiz rneklemin desteinin
blgesidir.

tla

zleyen rnek bir standart kurulumun en nemli unsurlarn gstermektedir, bu nedenle


ona ok dikkatli bakmanz ve ayn admlarn benzer problemlere nasl uygulanacan
renmeniz gerekiyor.

ee

de
rs
no

rnek 1. Varsayalm ki X1, , Xn bir i.i.d. rneklemdir, Xi


N( ,4)tr ve HA : = 1e
kar H0 : = 0 test etmekle ilgileniyoruz. nce n = 2 durumuna bakalm:

Kaynak: MIT OpenCourseWare

= 0 ile uyumlu olmayacak kadar ok byk X1 + X2nin deerlerini ret edecek bir test
tasarlayabiliriz. Bu ret blgesini ayn zamanda bir dorunun st tarafnda da
gsterebiliriz.
Eer n byk ise bu gsterimin kullanm ok kolaydr, nk ret blgesini dorudan X1,
, Xn ile hayal etmek ok zordur. Ancak, resmi nden tek boyuta indirgeyerek, kritik

blgelerin garip ekillerini belirme yetimizi kaybedebiliriz, ancak onlar pratik uygulama
asndan okta yararl deildirler zaten.
n

om

Bylece bu rnekte, test srecini bir test istatistiine dayandracaz, T n(X1, , Xn) =
ve Tnnin byk deerleri iin ret edeceiz.

de
rs
no

tla

ri

.c

kyi nasl seeceiz? iki hata tr arasnda dei-toku ile ka karya gelmek zorunda
kalacaz. Varsayalm ki imdi n = 25tir. Xi
N( ,4) olduu iin,

Kaynak: MIT OpenCourseWare

ee

imdi 1. Tip ve 2. Tip hatalarn olaslklarn hesaplayabiliriz.

Bu durumda, , kden herhangi birini belirlemek dier ikisini belirler, ve o seim 1.nci
ve 2.nci Tip hatalarn olaslklar arasnda belirli bir dei-toku ierir eer kyi
ykseltirsek, gvenirlik dzeyi der, ayn ekilde 1 gcde der. Spesifik olmak
gerekirse, eer k = 3/5 olarak seersek, %6.7 ve %15.87 olur.

Farkl rneklem byklkleri iin 1.nci ve 2.nci Tip hatalarn olaslklar arasndaki deitokuu eitli k seimleri iin aadaki gibi gsterebiliriz:

om

Dk bir k deeri daha byk g ve ayn zamanda daha byk gvenirlik dzeyi verir,
bylece kyi ykseltmek bizi grafik zerinde sola doru kaydrr.

kyi nasl sememiz gerekir? Normal kurulumda nceliin yanl ret etme olasl nn
kontrol edilmesine verildiini hatrlaynz, bu nedenle kyi 1. Tip hata olasln kabul
edilebilir bir dzeyde tutacak ekilde seeceiz, genellikle bu %5 veya %1dir.

de
rs
no

tla

ri

.c

Elbette, n
iken, sabit iin testin gc, 1 1e doru gider. Bir teaml olarak,
genellikle = %5 dzeyindeki bir ret edi anlamllk tr, benzer ekilde = %1de ret
etme yksek anlamllk tr.

Kaynak: MIT OpenCourseWare

ee

rnek 2. Bir nceki rnekte, sabit hipotez {0, 1} idi, fakat bu ok yapay bir
varsaymd ve genellikle bunun byle bir durum olduuna inanmak iin bir nedenimiz
yoktur.
Daha nce olduu gibi, varsayalm ki X1, , Xn bir i.i.d. rneklemdir, ancak imdi
aadakini test edeceiz:
H0 : = 0

HA : 0
imdi HA iki ynl bir bileik hipotezdir (yani alternatif altnda, birka deer alabilir,
25,

om

bazlar n sollunda bazlar sandadr). Yine sadece rneklem ortalamasna,


dayal bir teste bakacaz Kritik blge imdi nasl grnr?

de
rs
no

tla

ri

.c

Sezgisel olarak, in hem byk ve hem kk deerleri iin H0 ret etmek anlamaldr.
Yani eer bo hipotez doru ise, byk ihtimalle her iki kuyrukta da deerler
grmeyeceiz. Alternatif hipotez, nn 0dan ya byk ya da kk olduuna dair
kantlar ile ilgilendiimizi ifade etmektedir.

Kaynak: MIT OpenCourseWare

Bu nedenle iki deer yani k1 ve k2yi belirleyeceiz ki bylece

ee

nedir? Alternatif tek bir olaslk kanunu belirlemedii ve onun yerine onlarn
srekliliini verdii iin, ok iyi tanmlanmamtr, yani sabit bir iin u yazlr:

Genellikle arzulanan bir gvenirlik dzeyi iin, k1, k2yi bo hipotezi tarafndan
varsaylan deer etrafnda simetrik olarak seeriz (normal dalmn bir tek tepe noktas
ve simetrik olduu iin, bu da kritik blgeyi olabildiince byk yapar).

om

Son rnek varyans bilinen bir normal kitleden elde edilen iin gven araln
oluturma yolunu hatrlatmal: Yukardaki sre aslnda aadakine benzerdir:

.c

1. iin bir 1 lk gven aral [A(X), B(X)] olutur (Durum 1, son dersteki notlara
baknz)
2. Eer 0 = 0 [A(X), B(X)] ise, H0' ret et

de
rs
no

tla

ri

Dolayl olarak bo hipotez altnda P(A(X) < <B(X) = 1 - olacak ekilde [A(X), B(X)]
araln oluturduumuz iin,

Kaynak: MIT OpenCourseWare

1. Testlerin Deerlendirilmesi ve Oluturulmas

Tahmin ile ilgili tartmamzda olduu gibi, nce genel fikri tanttk sonra birka rnek
grdk. imdi ise testler arasnda nasl seim yapacamz ve onlar batan itibaren
nasl oluturacamz greceiz.

ee

1.1. Testlerin zelikleri

Herhangi bir testin gvenirlik dzeyi = P(1. Tip) ve onun gc 1 = 1 P(2. Tip) ile
ilgileniriz. Eer her iki H0 ve HA basit hipotez ise, ve verili bir iin iyi tanmlanmtr
ve en basitinden 1 s en yksek, yani en gl, testi seeriz.

om

Eer HA bileik ve H0 basit ise, verili bir byklnde 1 () = 1 P(2.Tip Hata|)


g fonksiyonlarn karlatrmak iin bir metrie ihtiyacmz vardr. Bir test en azndan
her HA noktasnda dier herhangi benzer byklkteki bir test kadar gl olduu
zaman, o test uniform(tekdze) olarak en gldr (UMP). Genel olarak, bir UMPnin
var olmas gerekmez.
rnek 3. Bazen uniform olarak gl bir test bulmak olasdr: Varsayalm ki Xi
ve aadaki hipotezi test etmek ile ilgileniyoruz:

.c

H0 : = 0

N( ,4)

HA : > 0

ri

HA : = 1e kar H0 : = 0 iin en gl test eer > k ise ret et formunu alan testtir.
A > 0 olduu srece A ne olursa olsun testin genel formu deimez. Bundan tr,
> k ise

tla

HA : = 1e kar H0 : = 0 iin en gl test te ayn zamanda ret et eer


formunu alr.

de
rs
no

Aadaki nemli sonuta, H0 : = 0 bo hipotezi altnda X1, , Xn rneklemin bileik


p.d.f.si f0(x) = f0(x1, , xn) ve HA : = A altnda rneklemin bileik p.d.f.si fA(x) olarak
ifade edilir.
nerme 1 (Neyman-Pearson Lemma). fAya kar f0n testinde (her iki H0 ve HA basit
hipotezdir), kritik blge

herhangi bir k

0 tercihinde en gldr.

k seiminin testin belirtilen gvenirlik dzeyi ya bal olduunu not ediniz. Bu, eer X1,
, Xn rneklemi iin aadaki olabilirlik oran dk ise, en gl test ret eder
anlamna gelir.

ee

Yani, veri byk bir olaslkla HA altnda olumutur.

om
.c
ri
tla

Kaynak: MIT OpenCourseWare

de
rs
no

Neyman-Pearson Lemmada dorudan verilen en gl test, rnek uzayda her x


noktasnda (burada integraller ok boyutludur, yani tipik olarak x n ) byklk

ve g

arasndaki dei-tokuu zer. ve 1- ifadelerinden olabilirlik oran

in kritik

blgeye x eklemenin fiyatn CX blgesinden bir nokta eklemenin gteki kazanmna


nispetten cinsinden ne kadar deyeceimizi verdiini grebiliriz.

ee

Dolaysyla, en ucuz yani kk olabilirlik oranna sahip- x noktalarn ekleyerek kritik


blgeler oluturmaya balamalyz. O zaman, olabilirlik oranna gre sralanm x
deerlerinden aa doru gideriz ve nn bykl istenilen dzeye ininceye kadar
nokta semeye devam ederiz.
rnek 4. Bir sank (D) kapkalktan mahkemededir. Mahkm etmek iin, jri %95
olaslkla kararn doru olduuna inanmak zorundadr.

susuz
0.3

olabilirlik oran
1/2

0.9

0.3

1/3

0.4

0.1

1/4

ri

3.

sulu
0.6

.c

D polisin geldiini grnce kaar


D su ilendiinde baka yerde olduunu
kantlayamaz (mazeret)
Dnin evininin yaknnda bo anta bulunur

1.
2.

om

Savcnn ortaya koyabilecei veya koyamayaca para potansiyel kant vardr. Bir
durumada jri kendisine gsterilen paradan sadece birine dayanarak mahkmiyet
karar verir. Aadakiler potansiyel kant paralardr, karlkl bamszlk
varsaylmtr. Tabloda ayrca sann sulu olduu veri iken her parann incelenmesi
olasl ile sann sulu olmad veri iken her parann incelenmesi olasl da
verilmitir.

de
rs
no

tla

Neyman-Pearson gsterimine gre, x kant paralarnn 2 3 olas kombinasyonlarndan


herhangi birisi olabilir. Bamszlk varsaymn kullanarak, btn ipularnn
kombinasyonlarn, her bir ipucunun her hipotez altndaki ilgili olabilirliklerini ve ilgili
olabilirlik oranlarn listeleyebiliriz. Listeyi nc kolondaki olabilirlik oranna gre
sraladm. Son kolona sralanm x kombinasyon listesine gre birikimli toplam ekledim:

Sulu fA(x) Susuz(f0(x)

her ipucu
mazeret, bulunan anta
ka, mazeret
mazeret
ka, bulunan anta
bulunan anta
ka
hibirisi

216/1000
144/1000
324/1000
216/1000
24/1000
16/1000
36/1000
24/1000

9/1000
21/1000
81/1000
189/1000
21/1000
49/1000
189/1000
441/1000

(k)

0.0417
0.1458
0.25
0.875
0.875
3.0625
5.25
18.375

9/1000
30/1000
111/1000
300/1000
321/1000
370/1000
559/1000
1

1.
2.
3.
4.
5.
6.
7.
8.

Olabilirlik Oran
r(x) =

ee

Jri, %5ten daha dk olaslkl yanl mahkmiyete karn (yani sank masum ise),
eer doru ise en az %95 gvenilirlikle mahkmiyet karar verir. Hipotez testi
terminolojisine gre, mahkmiyet karar, = %5 byklndeki en gl testi
kullanarak sann masum olduu bo hipotezinin ret edilmesi ile ilintilidir.
Son kolondaki (k) deerlerine baknca, ilk iki kanttn kombinasyondan fazla kant
eklemek yanl mahkmiyet olasl y %5ten fazla artrdn okuyabiliyoruz.
Dolaysyla, jri sulunun polisi grdnde kap kamamasna bakmadan, baka

yerde olduunu ispatlamamasndan ve evinin yaknnda bulunan antadan tr san


mahkm etmelidir. Prensip olarak, jri, ilaveten, sann kan, bulunduu yeri
ispatlamamay ve antann bulunmamasn rasgele belirleyebilir (3. durum): Eer bu

olaslkla mahkum etmi olsayd, yanl mahkumiyetin

om

durumda jri san

olasl tam olarak %5 olurdu, fakat bu muhtemelen hukuk sistemi tarafnda kabul
edilebilir bir uygulama olmazd.

.c

rnek 5. Ortalamaya dayal bir testin normal durumda en gl test olduunu imdi
gsterebiliriz. Varsayalm ki Xi
N( , 4) ve HA : = 1e kar H0 : = 0 test edeceiz.
Burada 25 gzlemli i.i.d. olan bir X1, , X25 rneklemimiz var.

de
rs
no

tla

ri

Gzlemler i.i.d. normal olduklar iin, gzlemlenen rnekleme gre hesaplanan olabilirlik
oran aadaki ile verilir:

ee

r(X)in rneklem ortalamas 25 araclyla rnekleme bal olduunu ve 25te kesin


azalan olduunu grebiliriz. Bu nedenle, en gl testin kritik blgesi aadaki formu
alr:

Olaslk ve statistik Ders Notlar 22

om

Konrad Menzel

.c

7 Mays 2009

herhangi bir k

tla

ri

nerme 1 (Neyman-Pearson Lemma). fAya kar f0n testinde (her iki H0 ve HA basit
hipotezdir), kritik blge

0 tercihinde en gldr.

de
rs
no

k seiminin testin belirtilen gvenirlik dzeyi ya bal olduunu not ediniz. Bu, eer X1,
, Xn rneklemi iin aadaki olabilirlik oran dk ise, en gl test ret eder
anlamna gelir.

ee

Yani, veri byk bir olaslkla HA altnda olumutur.

om
.c
ri
tla

Kaynak: MIT OpenCourseWare

de
rs
no

Neyman-Pearson Lemmada dorudan verilen en gl test, rnek uzayda her x


n
noktasnda (burada integraller ok boyutludur, yani tipik olarak x
) byklk

ve g

arasndaki dei-tokuu zer. ve 1- ifadelerinden olabilirlik oran

in kritik

blgeye x eklemenin fiyatn CX blgesinden bir nokta eklemenin gteki kazanmna


nispetten cinsinden ne kadar deyeceimizi verdiini grebiliriz.

ee

Dolaysyla, en ucuz yani kk olabilirlik oranna sahip- x noktalarn ekleyerek kritik


blgeler oluturmaya balamalyz. O zaman, olabilirlik oranna gre sralanm x
deerlerinden aa doru gideriz ve nn bykl istenilen dzeye ininceye kadar
nokta semeye devam ederiz.
.

rnek 1. Bir sank (D) kapkalktan mahkemededir. Mahkm etmek iin, jri %95
olaslkla kararn doru olduuna inanmak zorundadr.

susuz
0.3

olabilirlik oran
1/2

0.9

0.3

1/3

0.4

0.1

1/4

ri

3.

sulu
0.6

.c

D polisin geldiini grnce kaar


D su ilendiinde baka yerde olduunu
kantlayamaz (mazeret)
Dnin evininin yaknnda bo anta bulunur

1.
2.

om

Savcnn ortaya koyabilecei veya koyamayaca para potansiyel kant vardr. Bir
durumada jri kendisine gsterilen paradan sadece birine dayanarak mahkmiyet
karar verir. Aadakiler potansiyel kant paralardr, karlkl bamszlk
varsaylmtr. Tabloda ayrca sann sulu olduu veri iken her parann incelenmesi
olasl ile sann sulu olmad veri iken her parann incelenmesi olasl da
verilmitir.

de
rs
no

tla

Neyman-Pearson gsterimine gre, x kant paralarnn 2 3 olas kombinasyonlarndan


herhangi birisi olabilir. Bamszlk varsaymn kullanarak, btn ipularnn
kombinasyonlarn, her bir ipucunun her hipotez altndaki ilgili olabilirliklerini ve ilgili
olabilirlik oranlarn listeleyebiliriz. Listeyi nc kolondaki olabilirlik oranna gre
sraladm. Son kolona sralanm x kombinasyon listesine gre birikimli toplam ekledim:

Sulu fA(x) Susuz(f0(x)

her ipucu
mazeret, bulunan anta
ka, mazeret
mazeret
ka, bulunan anta
bulunan anta
ka
hibirisi

216/1000
144/1000
324/1000
216/1000
24/1000
16/1000
36/1000
24/1000

9/1000
21/1000
81/1000
189/1000
21/1000
49/1000
189/1000
441/1000

(k)

0.0417
0.1458
0.25
0.875
0.875
3.0625
5.25
18.375

9/1000
30/1000
111/1000
300/1000
321/1000
370/1000
559/1000
1

1.
2.
3.
4.
5.
6.
7.
8.

Olabilirlik Oran
r(x) =

ee

Jri, %5ten daha dk olaslkl yanl mahkmiyete karn (yani sank masum ise),
eer doru ise en az %95 gvenilirlikle mahkmiyet karar verir. Hipotez testi
terminolojisine gre, mahkmiyet karar, = %5 byklndeki en gl testi
kullanarak sann masum olduu bo hipotezinin ret edilmesi ile ilintilidir.
Son kolondaki (k) deerlerine baknca, ilk iki kanttn kombinasyondan fazla kant
eklemek yanl mahkmiyet olasl y %5ten fazla artrdn okuyabiliyoruz.
Dolaysyla, jri sulunun polisi grdnde kap kamamasna bakmadan, baka

yerde olduunu ispatlamamasndan ve evinin yaknnda bulunan antadan tr san


mahkm etmelidir. Prensip olarak, jri, ilaveten, sann kan, bulunduu yeri
ispatlamamay ve antann bulunmamasn rasgele belirleyebilir (3. durum): Eer bu
olaslkla mahkum etmi olsayd, yanl mahkumiyetin

om

durumda jri san

olasl tam olarak %5 olurdu, fakat bu muhtemelen hukuk sistemi tarafnda kabul
edilebilir bir uygulama olmazd.

1. Testlerin Oluturulmas

tla

ri

.c

Genel olarak, optimal bir testin nasl oluturulmas gerektii sorusunun dorudan bir
cevab yoktur. Neyman-Pearson Lemma bir basit hipotezin dierine kar test
edilmesinin en gl testi iin basit bir reete vermektedir, fakat gerek dnya
uygulamalarnn ounda alternatif hipotez bileiktir. Aadaki neriler her zaman
tartmasz ok gl bir test vermeyen (bazen var bile olmayan) ama genellikle kabul
edilebilir sonular douran ilemler listesidir.

de
rs
no

1. Her her iki H0 ve HA basit ise, Neyman Pearson Lemma bize aadaki gibi bir
istatistik oluturmamz

ve uygun ekilde seilmi baz kler iin eer T(X) > k ise ret etmemizi syler(genellikle
k, testin bykl kesin olacak ekilde seilir). Bu test ayn zamanda olabilirlik oran
testi (LRT) olarak ta adlandrlr.

ee

2. eer H0 : = 0 basit ve HA :
0 bileik ve 2- tarafl ise, bir tahmin edici
kullanarak iin 1 lik gven aral [A(X), B(X)] (genellikle simetrik)
oluturabiliriz. Sonra eer 0 [A(X), B(X)] ise ret ederiz. Bu bize H0 iin
byklnde bir test verir.
3. eer H0 : = 0 basit t ve HA :
0 bileik ve tek-tarafl ise, iin simmetrik 1
2lk gven aral oluturabiliriz ve sadece eer bo hipotez deeri gven
aralnn dnda ise ve ilgili bykln elde etmek iin ilgili kuyrukta ise ret
ederiz.
4. ya H0 :
0 ya da HA :
0 (ya da her ikisi) bileik ise, aadaki istatistii
tanmla

ve uygun ekilde seilmi baz kler iin eer T(X) > k ise ret et. Bu tr testler
genelletirilmi olabilirlik oran testi (GLRT) olarak adlandrlr.

Son durumu daha nce tartmadmz iin, baz aklamalar yapmak gerekecek:

om

test akla uygundur nk, eer veri H0 desteklemezse T(X) kk olma eilimde
olacaktr.
younluklar her zaman pozitiftir, bu nedenle istatistik 0 ile 1 arasnda olacaktr
(nk zerinde younluu maksimize ettiimiz paydaki kme, zerinde
younluu maksimize ettiimiz paydadaki kmeyi ierdii iin)
bo hipotez altndaki test istatistiin kesin dalmn bilmemiz gerekir, bylece
uygun bir kritik deer kyi bulabiliriz. Dalmlarn ou iin, onu byk
rneklemlerle elde ederiz:

.c

burada p = dim(

A)

dim(

0).

tla

GLRT LRTnin optimal zeliini paylamak zorunda deildir, dorusu bileik


alternatif hipotezli bu kurulumda, tartmasz ok gl test genellikle var
olmayabilir de.

de
rs
no

ri

-2logT(X)

2. rnekler

rnek 2. Varsayalm ki doum srasnda bebeklerin arl (pound cinsinden) X ~ N(7,


1)e gre dalmaktadr. Diyelim ki eer bir doum uzman bebek bekleyen bir anneye
zayf bir diyet nerisinde bulunsayd, bu neri bebein ortalamadan 1 pound daha hafif
(fakat ayn varyansa sahip) domasna sebep olurdu. Canl doan 10 kiilik bir
rneklem iin, 10 = 6.2yi gzlemleriz.
Doum uzman kt neride bulunmuyor bo hipotezine kar kt neride
bulunuyor alternatif hipotezi iin %5lik bir testi nasl olutururuz? Elimizde

H0 : = 7ye kar HA : = 6

var.

ee

Normal dalm iin, bu basit testi sadece rneklem ortalamasna,


daha optimal olduunu gstermitik, yani T(x) =

10.

H0 altnda,

10

10,

dayandrmann

~ N(7, 0.1) ve HA

altnda 10 ~ N(6, 0.1)dir. Eer 10 < k ise test ret eder. Bu nedenle test bykl %5
olacak ekilde kyi semeliyiz, yani

10

= 6.2 < 6.48 = k olduu iin ret ederiz.

.c

Bundan tr,

om

burada (.) standart normal c.d.f.dir. Bu nedenle aadaki denklemin tersini alarak kyi
elde ederiz

Bu testin gc nedir?

Varsayalm ki gc en az %99 olan bir test istiyoruz, gzlemlemek zorunda


olduumuz yeni doan bebek says n en az ne kadar olmaldr? n ile deiecek
tek ey rneklemin varyansdr, bu nedenle bu rnein birinci blmnden, kritik
deer kn = 7

tla

ri

olduunu buluruz, dier taraftan

ne

dayal testin gc ve

de
rs
no

kritik deer kn aadaki ile verilir:

0.99 olarak ayarlaynca u koullu elde ederiz:

Bu tr g hesaplamalar genellikle bir istatistiki deney veya bir anket almas


planlandnda yaplr rnein, belli bir ilacn byklnn etkisini aratrmak iin bir
ila testinde ka tane hasta kullanacamz belirlemek gibi. ok sayda kii zerinde
almak veya anket yapmak ou zaman maliyetlidir, bu nedenle yeterince byk bir
olaslkla anlaml deiiklikleri bulabilmek iin bir deneyin byklnn ne olmas
gerektiini nceden bilmek isteriz.

ee

rnek 3. Varsayalm ki nceki rnein kurulumuna olduu gibi sahibiz, fakat varyans
bilmiyoruz. Onun yerine, S2 = 1.5 gibi bir tahminimiz var. Testi nasl yapardnz? Daha
nce tarttmz gibi,

Problemde verilen rakamlar yerine koyarsak, T = -

om

istatistii, eer gerek ortalama 0 ise n -1 serbestlik dereceli bir renci t-dalmdr.
Dolaysyla eer aadaki koul salanrsa, H0 ret ederiz:

-2.066 olur. Bu da t9(0.05)

= -1.83ten kktr.

tla

ri

.c

rnek 4. Xi ~ Bernoulli(p), i = 1,2,3, olsun. Yamuk bir paray birbirinden bamsz olarak
kere frlatyoruz ve eer tura gelirse Xi = 1dir, dier durumda Xi = 0dr. HA : p = 2/3e
kar H0 : p = 1/3 test etmek istiyoruz. Her iki test basit olduu iin, olabilirlik oran
testini kullanabiliriz,

de
rs
no

Bu nedenle eer aadaki koul gerekleirse ret ederiz.

burada

ye eittir. kyi belirlemek iin, H0 ve HA altnda

in olas btn

deerlerini ve olaslklarn listeleyelim:

Bylece eer testin byklnn = 1/27ye eit olmasn arzuluyorsak, sadece ve

ee

sadece 3 > 2/3 ise ret edebilirdik. Ayn sonucu douracak ekilde k = 2/3 seebiliriz.
Bu testin gc una eittir:

om

rnek 5. Varsayalm ki aadaki fonksiyon tarafndan tretilmi bir tek gzlemimiz var,

+ toplamn minimize eden test prosedrn bulunuz eer X = 0.6 ise ret

tla

ri

.c

eder miyiz? Sadece bir X gzlemimiz olduu iin, X cinsinden kritik blgeyi
oluturmak ok karmak deildir, baz ileri dzeyde istatistikleri bulmaya
almak ok ey kazandrmayacaktr (ancak Neyman-Pearson burada ie
yarayabilir). Younluk grafiine bakarak, k kritik deerlerinde kk X deerleri
iin testin ret etmesi gerektii konusunda ikna olabiliriz. Tip I ve Tip IInin
olaslklar, srasyla, 0 k 1 iin yledir,

de
rs
no

ve

Bu nedenle, k zerinden hata olaslklarn minimize ederiz.

Minimize edilmi terimin trevin alp sfra eitlersek,

Dolaysyla, eer X < 1/2 ise ret etmeliyiz ve = 1/4tr. Ancak, X = 0.6 iin H0
zelikle ret etmiyoruz.

ee

k=

Btn testler arasnda 0.1 gibi, en kk deerli testi bul. nedir? X = 0.4
olsa ret eder miydiniz? nce k iin (k) = 0.1i zeriz. Yukardaki forml
kullanarak, k =
olur. Dolaysyla,

0.316 < 0.4 olduu iin, X = 0.4 iin H0 ret etmeyiz.

om

rnek 6. X geikeni Xi ~ U[0, ] dalmldr ve varsayalm ki bir i.i.d. rneklem X1, ,


Xni gzlemledik ve aadakini test etmek istiyoruz

ri

tla

Olabilirlik fonksiyonu aadaki ile verilir:

.c

ki seeneimiz var: iin bir 1- lk gven araln oluturabiliriz ve eer


kapsamazsa ret ederiz. Dier bir seenek olarak, bir GLRT testi oluturabiliriz

de
rs
no

Tnin pay maksimize edici zerinden hesaplanan olabilirlik ile elde edilir. Bu maksimum
olabilirlik tahmin edicidir, MLE = X(n) = max{ X1, , Xn }, yani

Dolaysyla

Test bykln arzulanan dzeye eitleyen istatistiin kritik deeri kyi bulmak iin,
= 0 bo hipotezi altndaki dalm bilmek zorundayz bunun iin sra istatistii
blmne bakmamz gerekebilir.

ee

Bir dip not olarak, daha nce byk nler iin, bo hipotez altnda GLRTnin bir ki-kare,
2
, dalm olduunu sylediimiz halde, bu rnek iin bunun doru olmad anlalyor
nk gerek parametre deerinde younluk srekli deildir.

Olaslk ve statistik Ders Notlar 23

om

Konrad Menzel

.c

12 Mays 2009

ri

1. rnekler

Doum uzman kt neride bulunmuyor bo hipotezine kar kt neride


bulunuyor alternatif hipotezi iin %5lik bir testi nasl olutururuz? Elimizde

de
rs
no

tla

rnek 1. Varsayalm ki doum srasnda bebeklerin arl (pound cinsinden) X ~ N(7,


1)e gre dalmaktadr. Diyelim ki eer bir doum uzman bebek bekleyen bir anneye
zayf bir diyet nerisinde bulunsayd, bu neri bebein ortalamadan 1 pound daha hafif
(fakat ayn varyansa sahip) domasna sebep olurdu. Canl doan 10 kiilik bir
rneklem iin, 10 = 6.2yi gzlemleriz.

H0 : = 7ye kar HA : = 6

var.

Normal dalm iin, bu basit testi sadece rneklem ortalamasna,

dayandrmann

H0 altnda, 10 ~ N(7, 0.1) ve HA


< k ise test ret eder. Bu nedenle test bykl %5

daha optimal olduunu gstermitik, yani T(x) =

10.

altnda 10 ~ N(6, 0.1)dir. Eer 10


olacak ekilde kyi semeliyiz, yani

10,

ee

burada (.) standart normal c.d.f.dir. Bu nedenle aadaki denklemin tersini alarak kyi
elde ederiz

Bundan tr,

10

= 6.2 < 6.48 = k olduu iin ret ederiz.

Bu testin gc nedir?

Varsayalm ki gc en az %99 olan bir test istiyoruz, gzlemlemek zorunda


olduumuz yeni doan bebek says n en az ne kadar olmaldr? n ile deiecek
tek ey rneklemin varyansdr, bu nedenle bu rnein birinci blmnden, kritik
deer kn = 7

olduunu buluruz, dier taraftan

ri

0.99 olarak ayarlaynca u koullu elde ederiz:

tla

dayal testin gc ve

.c

kritik deer kn aadaki ile verilir:

ne

om

de
rs
no

Bu tr g hesaplamalar genellikle bir istatistiki deney veya bir anket almas


planlandnda yaplr rnein, belli bir ilacn byklnn etkisini aratrmak iin bir
ila testinde ka tane hasta kullanacamz belirlemek gibi. ok sayda kii zerinde
almak veya anket yapmak ou zaman maliyetlidir, bu nedenle yeterince byk bir
olaslkla anlaml deiiklikleri bulabilmek iin bir deneyin byklnn ne olmas
gerektiini nceden bilmek isteriz.
rnek 2. Varsayalm ki nceki rnein kurulumuna olduu gibi sahibiz, fakat varyans
bilmiyoruz. Onun yerine, S2 = 1.5 gibi bir tahminimiz var. Testi nasl yapardnz? Daha
nce tarttmz gibi,

ee

istatistii, eer gerek ortalama 0 ise n -1 serbestlik dereceli bir renci t-dalmdr.
Dolaysyla eer aadaki koul salanrsa, H0 ret ederiz:

Problemde verilen rakamlar yerine koyarsak, T = -

-2.066 olur. Bu da t9(0.05)

= -1.83ten kktr.
rnek 3. Xi ~ Bernoulli(p), i = 1,2,3, olsun. Yamuk bir paray birbirinden bamsz olarak
kere frlatyoruz ve eer tura gelirse Xi = 1dir, dier durumda Xi = 0dr. HA : p = 2/3e

om

kar H0 : p = 1/3 test etmek istiyoruz. Her iki test basit olduu iin, olabilirlik oran
testini kullanabiliriz,

ye eittir. kyi belirlemek iin, H0 ve HA altnda

in olas btn

de
rs
no

tla

deerlerini ve olaslklarn listeleyelim:

ri

burada

.c

Bu nedenle eer aadaki koul gerekleirse ret ederiz.

Bylece eer testin byklnn = 1/27ye eit olmasn arzuluyorsak, sadece ve


sadece 3 > 2/3 ise ret edebilirdik. Ayn sonucu douracak ekilde k = 2/3 seebiliriz.
Bu testin gc una eittir:

rnek 4. Varsayalm ki aadaki fonksiyon tarafndan tretilmi bir tek gzlemimiz var,

ee

+ toplamn minimize eden test prosedrn bulunuz eer X = 0.6 ise ret

eder miyiz? Sadece bir X gzlemimiz olduu iin, X cinsinden kritik blgeyi
oluturmak ok karmak deildir, baz ileri dzeyde istatistikleri bulmaya
almak ok ey kazandrmayacaktr (ancak Neyman-Pearson burada ie
yarayabilir). Younluk grafiine bakarak, k kritik deerlerinde kk X deerleri

om

iin testin ret etmesi gerektii konusunda ikna olabiliriz. Tip I ve Tip IInin
olaslklar, srasyla, 0 k 1 iin yledir,

.c

ve

ri

Bu nedenle, k zerinden hata olaslklarn minimize ederiz.

tla

Minimize edilmi terimin trevin alp sfra eitlersek,

de
rs
no

Dolaysyla, eer X < 1/2 ise ret etmeliyiz ve = 1/4tr. Ancak, X = 0.6 iin H0
zelikle ret etmiyoruz.

k=

Btn testler arasnda 0.1 gibi, en kk deerli testi bul. nedir? X = 0.4
olsa ret eder miydiniz? nce k iin (k) = 0.1i zeriz. Yukardaki forml
kullanarak, k =
olur. Dolaysyla,

0.316 < 0.4 olduu iin, X = 0.4 iin H0 ret etmeyiz.

ee

rnek 5. X geikeni Xi ~ U[0, ] dalmldr ve varsayalm ki bir i.i.d. rneklem X1, ,


Xni gzlemledik ve aadakini test etmek istiyoruz

ki seeneimiz var: iin bir 1- lk gven araln oluturabiliriz ve eer


kapsamazsa ret ederiz. Dier bir seenek olarak, bir GLRT testi oluturabiliriz

om

Olabilirlik fonksiyonu aadaki ile verilir:

tla

de
rs
no

Dolaysyla

ri

.c

Tnin pay maksimize edici zerinden hesaplanan olabilirlik ile elde edilir. Bu maksimum
olabilirlik tahmin edicidir, MLE = X(n) = max{ X1, , Xn }, yani

Test bykln arzulanan dzeye eitleyen istatistiin kritik deeri kyi bulmak iin,
= 0 bo hipotezi altndaki dalm bilmek zorundayz bunun iin sra istatistii
blmne bakmamz gerekebilir.
Bir dip not olarak, daha nce byk nler iin, bo hipotez altnda GLRTnin bir ki-kare,
2
, dalm olduunu sylediimiz halde, bu rnek iin bunun doru olmad anlalyor
nk gerek parametre deerinde younluk srekli deildir.

2. Dier zel Testler

ee

Varsayalm ki i.i.d. zeliine sahip iki rneklemimiz var, bunlar X1, , Xn ve Z1, , Zndir
ve potansiyel olarak ikisi farkl byklktedir, n1 ve n2 gibi. ki farkl dalm
oluturabiliriz:

Yapmaya altmz iki farkl test unlardr:

om

Bu hipotezleri nasl test ederiz?

.c

deerleri bilinen durumu ele alacaz (dier durumlar ile


ve
1. Burada sadece
ilgili tartma iin kitaba baknz). H0 : X = Z altnda

tla

ri

Sezgisel olarak, eer bo hipotez doru deil ise, T byk olmal (mutlak deer
cinsinden). Dolaysyla, bykle sahip HAya kar H0 testinde H0 ret edilir
eer aadaki koul salanrsa:

de
rs
no

2. Varyans testi iin, dalmlar ile ilgili sonular hatrlamak gerekir:

ve

Bunlar birbirinden bamszdr. Hatrlaynz, bamsz ki-karelerin serbestlik derecesi ile


blm F dalmlyd:

ee

Akas biz

ile

yi bilmiyoruz, fakat H0 :

altnda bu ifade basitletirilebilir,

Dolaysyla, eer aadaki koullar salanrsa byklkl bir test ret eder:

om

2.2 Parametrik Olmayan karmlar

.c

imdiye kadar, veri retim prosesi f(x|) formunda olan ve sonlu parametre boyutuna
kadar bilinen durumdaki problemler ile ilgilendik. O durumdaki testlere parametrik
karm denilir.

ri

stisna olarak, tahmin konusunda vurguladmz gibi, rneklem ortalamalar, varyanslar


ve dier momentleri herhangi bir dalmn ortalamalarnn, varyanslarnn ve dier
yksek-sral momentlerinin hesaplanmas iin avantajl zeliklere sahiptir.

tla

Bir rasgele deikenin dalmnn tm kendi c.d.f.si ile karakterize edilebildii iin,
herhangi bir snrlama getirmeden(elbette ki geerli bir c.d.f. olmal yani monoton ve
sadan srekli), sanki veriden c.d.f.yi tahmin etmek iyi bir fikirmi gibi grnyor.

de
rs
no

rnek dalm fonksiyonu Fn(x) yledir:

Burada X(j) j. sral istatistiktir(bunun rneklemdeki j en kk deer olduunu


hatrlaynz), ayrca X(0) - ve X(n+1) -dur.

ee

rnek 6. bir {-1, 3, 1, 1, 0.5, 2, 0} rneklemi iin, sralanm rneklem {-1, 0, 0.5, 1, 1,
2, 3}tr ve rneklem dalm fonksiyonu Fn(x)i grafik ile gsterebiliriz:

Kaynak: MIT OpenCourseWare

de
rs
no

tla

ri

.c

om

Bilinmeyen bir dalm ailesinden elde edilen bir X1, Xn rasgele rneklem ile
ilgili karm problemi ile ilgileniyoruz ve c.d.f.si F(x) olan (rnein bir standart normal
dalm iin F(x) = (x) gibi) belirli bir dalmdan elde edilip edilmediini test etmeyi
arzuluyoruz. Daha nceki tartmalarda alt izilen testlerden herhangi birini uygulamak
iin elimizde spesifik parametreler olmad iin, test fikri Fn(X)in F(x)ten ok fazla
sapp sapmadn kontrol etmek olur.

Kaynak: MIT OpenCourseWare

2.3. Kolmogorov-Smirnov Testi

Gzlemlenen bir rneklemin F(x) dalm tarafndan tretilip tretilmediin test etmek
iin, Kolmogorov-Smirnov istatistiinin byk deerleri iin testi ret ederiz. statistik
aadaki gibi tanmlanr,

ee

burada supxF(x) supremumdur, yani {F(x): x


}in en kk st snrdr ufak
kmelerde srekli fonksiyonlar iin bu maksimumun aynsdr, fakat KolomogorovSmirnov istatistii 1/n byklndeki sramalar ieren rneklem dalm fonksiyonu
ierdii ve supremum btn reel say izgisini kapsad iin, gerekte hibir belirli x
deerine ulalmam olabilir.

om

statistiin kritik deerleri asimptotik (yani byk nler iin) dalm fonksiyonundan elde
edilebilir

de
rs
no

tla

ri

.c

Bu ifadeyi douran argmanlar ok ak deildir ve ok tekniktir nk bu, reel saylar


deil, fonksiyonlarn dalmn ieriyor (rasgele fonksiyonlar genellikle stokastik proses
olarak adlandlar).

Kaynak: MIT OpenCourseWare

C.d.f.nin hesaplanmas sonsuz bir serinin hesaplanmasn gerektirdii iin, forml


kullanmak basit deildir. Ancak, birok ders kitab yaygn kritik deerler iin tablo
oluturur.

rnek 7. Varsayalm ki bir madeni paray tekrar tekrar, rnein 160 kere, frlatyoruz ve
rneklemin bir B(4, 0.5) dalmndan tretilip tretilmediin = 0.2 gvenirlik dzeyi ile
test etmek istiyoruz. Diyelim ki aadaki rneklem frekanslarn gzlemledik:

ee

Tura says
rneklem frekans
Kmlatif rneklem frekans Fn(.)
H0 F(.) altnda Kmlatif frekans
fark

0
10
10
10
0

1
33
43
50
7

2
61
104
110
6

3
43
147
150
3

4
13
160
160
0

Kitaptaki asimptotik formln kullanarak, C0.20 =

om

O zaman Kolmogorov-Smirnov istatistii una eittir:

0.85tir. 0.44<0.85 olduu iin,

bo hipotezi %20 dzeyinde ret edemiyoruz.

2.4. 2-rneklemli Kolmogorov-Smirnov Testi

tla

Bir istatistik oluturuyoruz,

ri

.c

Varsayalm ki dalm ailesi bilinmeyen iki bamsz rasgele rneklemimiz var ve bunlar
X1, , Xn ile Y1, , Yn olsun. Her iki rnekleminde ayn dalm tarafndan tretilip
tretilmediini test etmek istiyoruz. Buradaki dnce Fn(x) ile Gn(x)in birbirinden ok
uzakta olup olmadn test etmektir.

de
rs
no

ve byk D deerleri iin ret ediyoruz.


Eer aadaki koul salanrsa,
byklndeki bir test iin kritik deerlerin asimptotik olarak iyi bir tahmini testi ret
eder:

2.5 Pearsonnn 2 Testi

Varsayalm ki n tane i.i.d. gzlemli bir rneklemdeki her bir Xi deeri k kadar, A1,, Ak,
kategoriden birine yerleecek ekilde snflandrld. p 1, , pk her bir kategorinin
olasl, ve f1, , fkde gzlemlenen frekanslar olsun. Aadaki bileik hipotezi

ee

alternatife kar test ettiimizi dnelim. Alternatif hipotez bu eitliklerden en az iki


veya daha fazlasnn gereklememesidir(olaslklarn toplam 1 olduu iin, burada tam
olarak bir eitlik tutmad diyemeyiz). Aadaki istatistii kullanabiliriz

ee

de
rs
no

tla

ri

.c

om

ve byk T deerleri iin ret ederiz. En uygun kritik deerleri belirlemek iin, Tnin nasl
daldn bilmek zorundayz. Maalesef, bu dalm ilgili modele baldr. Ancak, H0
altnda dalm asimptotik olarak modelden bamszdr ve byk n rneklemler iin
dir. Pratik bir kural olarak, eer n
4k ise ki-kare tahmini
asimptotik olarak T ~
alabilir.

14.30 Ekonomide statistiksel Yntemlere Giri


Ders Notlar 24

om

Konrad Menzel
14 Mays 2009

.c

1. Tekrar

ri

Nokta Tahmini
rneklemin tahmin edici fonksiyonu (X1, , Xn)
Tahmin edicinin sapmas

Tahmin edicinin standart hatas

de
rs
no

tla

Tahmin edicileri deerlendirmek iin nemli kriterler

Sapmaszlk
Etkinlik
Tutarllk

Tahmin edici oluturma yntemleri

1. Momentler Yntemi
mnci kitle momenti

ee

mnci rneklem momenti

ilk momenti hesapla, m = 1, , k iin


2. Maksimum Olabilirlik

m( ) eitliin olutur ve iin z.

X1, , Xn rneklemi iin olabilirlik fonksiyonunu yaz

L() ile log(L())i maksimize eden deerlerini bul


maksimumu bulmak iin ilk trevi sfra eitle, eer destekli rasgele deikenin
trevi alnmayacak durumda ise, o zaman fonksiyonun nasl grndne
bakmal ve maksimumun nerede olmas gerektiini belirlemelisiniz.

.c

om

Gven Aral

A(X1, , Xn) ile B(X1, , Xn) verisinin fonksiyonlarn bulunuz, yani

[A(X1, , Xn), B(X1, , Xn)] iin gven araldr


Verili 1-lik gvenirlik dzeyi iin ok sayda olas gven aral vardr

tla

ri

de
rs
no

Gven aral oluturmak iin ou zaman aadaki admlar takip et:


1. a(0) ile b(0)yi bul ve baz T(X1, , Xn) istatistikleri iin aadakini olutur
(doal olarak burada bir tahmin edici kullanlacaktr)

2. olasln iindeki olay aadaki gibi tekrar yaz

3. gven araln oluturmak iin X1, , Xn ile A(.) ve B(.)yi hesapla

Baz nemli Durumlar:

ee

sapmaszdr ve normal dalmldr, Var( ) biliniyor:

sapmaszdr ve normal dalmldr, Var( ) bilinmiyor ve bir tahmin edicimiz var,


:

om

normal deil, n > 30 veya daha fazla: imdiye kadar grdmz tahmin
edicilerin asimptotik olarak normal dalml olduklarn grdk, dolaysyla sz
konusu tahmini kullanacaz ve bir nceki durumu uygulayacaz. Varyans
bilsek te bilmesek te t-dalmn kullanarak bir ekilde gven aralnn tahmin
kullanmn cezalandrm olacaz.
normal deil, n kk: eer (a) in p.d.f.sini biliyorsak, ilk durumu kullanarak
gven aral oluturabiliriz, eer (b) p.d.f.yi bilmiyorsak, yapabileceimiz bir ey
yoktur

.c

hipotezler, HA : Aya kar H0 : 0


bo ve alternatif altnda farkl dalma sahip datann fonksiyonlarnn T(X)
istatistiini test et
C kritik blgesi: bo hipotezi ret ettiimiz, T(X)in gerekletii blge.
test prosedr: Eer T(X) C ise H0 ret et.

de
rs
no

Cnin seimi aadakileri belirler

tla

ri

Hipotez Testi

= P(1. Tip Hata) = P(ret|H0)


= P(2. Tip Hata) = P(ret etme|HA)

alfa byklk olarak, 1- ise testin gc olarak adlandrlr.

ayn byklkteki iki testten 1- gc en byk olan tercih et


Eer = () ise en dk () deerli testi tercih et, bu uniform olarak en gl
testtir.
H0 ve HAnn ikisi de basittir: Neyman-Pearson Lemmaya gre en gl test
< k ise ret et formunda olandr.

eer

baz monoton fonksiyonlar iin eer g(T(X)) < g(k) ise ret et formundaki bir test
eer T(X) < k ret et formundaki bir testin benzeridir.

ee

Testin oluumu H0 ve HAnn formuna baldr:


1. her iki H0 ve HA basittir: olabilirlik oran testi

ve uygun bir ekilde seilmi k deerleri iin eer T(X) < k ise ret et (Neyman-Pearson
Lemmaya gre en gl olan)

om

2. H0 : = 0 basit, HA: A bileiktir ve 2-yanldr: 1 lk gven aral [A(X),


B(X)] olutur ve ret et eer

ri

.c

3. H0 : = 0 basit, HA: > 0 bileiktir ve 1-yanldr: 1 2lk gven aral [A(X),


B(X)] olutur ve eer 0 < A(X) ise ret et.
4. Genel durum: Genelletirilmi Olabilirlik Oran Testi istatistii:

ki-rneklem Testi

ki bamsz X1, , Xn ve Z1, , Zn gibi deikenin i.i.d. rneklemleri olsun, Xi


N( X, ) ve Zi
N( Z, ).
Aadakileri test edebiliriz:

de
rs
no

tla

uygun bir ekilde seilmi k deerleri iin eer T(X) < k ise ret et.

(i)

veya

ee

(ii)

(i) durumunda aadaki testi olutur

bu bo hipotez altnda N(0, 1)dir.


(ii) durumunda aadaki testi olutur

om

bu bo hipotez altnda F(n1 1, n2 1) dalmldr, ve ret et eer ya T > F-1 ( ) ya da

.c

T > F-1 (1- ) ise.

rnek Sorular ( Bahar 2000 Snav)

de
rs
no

tla

ri

1. Momentler Yntemi: Bamsz deikenler olan X1, , Xn [0, ] destekli srekli


uniform dalmdan ekilmitir. 14:30daki dersinizden hatrlarsanz, X i
rnekleminden tahmin edicisini elde etmek iin ya Momentler Yntemini ya da
Maksimum Olabilirlik yntemini kullanabilirsiniz. Ancak siz ufak deiiklikler
istiyorsunuz ve yeni bir rasgele deiken tanmlyorsunuz, yani

burada k tarafnzdan belirlenmi ya da tarafnzdan bilinen bir sabit deerdir. Y1, ,


Yni kullanarak sadece y tahmin edebilirsiniz.

(a) varsayalm ki k (0, )dr. Yinin bir fonksiyonu olarak momentin yntemini de
kullanarak iin bir tahmin edici tretin. Ayrca, (0, ) aralnda olmak iin neden
kye gereksinim duyduunuzu aklaynz.
(b) imdi varsayalm ki k (0, )dr ve k bilinmeyen parametre dan daha byk

veya daha kk olabilir. Eer n = 0l bir rneklem gzlemleyecek olursanz, k


ile arasndaki iliki iin ne syleyebilirsiniz?
(c) iin maksimum olabilirlik tahmin edicisi tretiniz (unutmaynz, tahminler iin
sadece Y1, , Yn i kullanabilirsiniz).

Cevaplar:

ee

(a) bir-boyutlu olduu iin, sadece Yinin birinci momentini kullanmak zorundayz.
Kitlenin beklenen deeri

om

eer k < ise, momentler ynteminin tahmin edicisi aadaki gibi zlerek
elde edilir

= 0 ise, k byk bir olaslkla dan byk olacaktr.

tla

Eer byk rneklemler iin

ri

.c

(b) eer k > ise, [Yi] = P(Xi k) = max{1 (k/), 0} = 0 artk ya bal deildir.
Eer knin dan daha byk veya kk olduunu bilmiyorsak, parametre
kurulumunu snrlandrmak iin momentler ynteminin tahmin edicisinin mantn
kullanabiliriz:

de
rs
no

(c) Olabilirlik fonksiyonunu tretmek iin aadakini not etmek gerekir:

Dolaysyla,

Loglar alnca,

ee

cinsinde alnan trevleri sfra eitleyince

iin znce,

om

Bu tahmin edici k > olsa bile alr.


2. Hipotez Testi: Varsayalm ki X1, , Xn ortalamas, , bilinmeyen ancak varyans,
, bilinen ve 1e eit olan normal dalmdan elde edilen bir rneklem olutursun.

ri

.c

(a) Aadaki kurulum iin, %5lik gvenirlik dzeyinde en gl testi veren blgeyi
belirtiniz. Testin gcn hesaplaynz.

de
rs
no

tla

(b) Aadaki kurulum iin, %5lik gvenirlik dzeyinde en gl testi veren blgeyi
belirtiniz.

(c) nnin ve nnin hangi deerleri iin (a)da ki = 0 hipotez ile (b)deki = 1
hipotezini ayn anda kabul edersiniz?

(d) Aadaki kurulum iin, %5lik gvenirlik dzeyinde uniform olarak en gl testi
veren blgeyi belirtiniz.

Bu test iin, g fonksiyonu 1 iin bir forml oluturup, grafiin iziniz.

(e) (a) ve (b)deki testlerin kritik blgeleri arasnda nasl bir iliki vardr? 2. Tip hata
yapma olaslklarnn ilikisi nedir?

ee

Cevaplar:
(a) Neyma-Pearson Lemmaya gre, en gl test olabilirlik oranna dayanr

Eer olabilirlik oran kritik deerden dk ise en gl test ret eder, ya da benzer
ekilde, eer uygun bir ekilde seilmi k iin n > k ise, ret eder (snavda bunu hal
hazrda trettiimizi belirtmeniz yeterlidir).

bylece k =

N(0, 1/n),

om

Bo hipotez altnda,

i semek %5 byklnde bir test verir. O zaman testin gc

k = 1 +

< k ise en gl test ret eder. Burada

de
rs
no

(c) Her iki testi kabul ederiz eer,

tla

(b) (a)dakine benzer gerekeler ile, eer

ri

.c

yledir:

Yeterince byk nler iin,

iki testinde ret etmeyecei deerleri olmayacaktr.

(d) Bu test (a)dakinin aynsdr, nk herhangi bir > 1 deeri iin olabilirlik oran
rneklem ortalamas nnin kesin azalan bir fonksiyonudur ve byklndeki bir
testin k kritik deerleri, blm (a)da olduu gibi, sadece bo hipotezin altndaki
dalm tarafndan belirleniyor.

ee

(e) Kritik blgeler ayndr, fakat, btn alternatifler = 1e gre bo hipotezden daha
uzakta olduklar iin, blm (d)deki 2. Tip hatann olasl daha kktr,

You might also like