Professional Documents
Culture Documents
om
Konrad Menzel
3 ubat 2009
.c
tla
ri
Bu ders size Olaslk Teorisine girii ve statistiin temel aralarn verecektir. Olaslk,
ilgili belirleyicilerini tam olarak bilmediimiz durumlar aklayan ve analiz eden bir
matematiksel yapdr. Modern hayatta, hepimiz, tptan sosyolojiye kadar btn alanlarda
yaplan istatistiksel almalarn dzenli mterileriyiz ve olaslk muhakemesi ekonomi
ve finans alannda son dnemde yaplan bir ok tartmann takip edilmesinde olduka
nemlidir.
de
rs
no
Bu dersin ilk yarsnda, olaylarda bulunan gerek riski - veya kiisel bilgi yetersizliimiziaklamann bir yolu olarak olaslk zerinde konuacaz.
ee
Nasl olur da, belirtilen herhangi bir yeni nesil ev kredisi gvenli deilken, bir ok risk
barndran bir havuzdan oluan ilk grup gvende olabiliyordu? Daha dk ncelii
olanlar daha riskli oluyorlard. Niye? Geriye doru bakldnda, niye piyasann
beklediinin aksine daha gvenli olan deerli katlar piyasadaki herkesin beklediinden
daha riskli oldular? Byk Saylar Kanunu hakknda konuurken, ve hangi koullarda
alp hangi koularda almadn belirtikten sonra, bu konuya geri dneceiz.
om
tla
ri
.c
Dersin ikinci yars, veriden kitle ve olaslk dalmlar hakknda nasl bilgi
edinilecei sorusuyla ilgili olacaktr. Herhangi bir ampirik bilimde, tmevarm problemi ile
karlaabilirsiniz. Tmevarm birka (belki biraz daha ok) gzlemden genel sonular
karmaktr. Politik yoklamalarda (sonraki bakanlk seiminde kimin iin oy
kullanacaksnz?), bir anket firmas tipik olarak yzbinlerce potansiyel semen
arasndan en fazla birka bin kiiye anket uygular. Tbbi deneylerde, bir ilacn etkinlii
konusunda birka dzine katlmcdan elde edilen sonulardan btn kitle iin
genellemeler elde etmeye alrz.
de
rs
no
Eer ilgilendiimiz bir kitlenin (rnein bir genel seimde oy kullanabilecek btn
semenler gibi) yalnzca bir alt-grubundaki kiileri (rnein semenlerin rasgele bir
rneklemi gibi) gzlemlersek, cevaplandrmak istediimiz soru asndan (rnein belli
bir adayn oy oran gibi) bu rneklemin gerekten btn kitleyi temsil edip etmedii
konusunda bir eit belirsizlik olacaktr. Bu belirsizlii formle edip kullanmn pratik
hale getirmek olaslk teorisinin youn kullanmn gerektirir.
ee
rnek 2. Mart 2003 ylndaki igalden buuk yl sonra, Irak savanda len siviller
zerinde yaplan tartmal ilk Lancet almasnda lke genelinde1849 hane halkndan
oluan (toplam olarak 12801 kii) bir rasgele rnekleme anket uygulanmtr ve hane
halklar tarafndan beyan edilen lm saylar, 29 Milyonluk, tm lkedeki l saysnn
tahmini iin kullanlmtr. almann yazarlar, igalden sonraki ilk 18 ay iin 112 000
"fazla" lm tahminine ulatlar ve "%95'lik gvenirlikle" gerek rakamn 69000 ile
155000 arasnda olduunu ifade ettiler. Bu ifadenin ne anlama geldiini daha sonra
derste greceiz. Tahminin etrafndaki gven aralnn genilii, ufak bir alt-kitleden
btn lke iin hesaplamalar yapmann kendi iindeki var olan belirsizliinin lsdr.
Bu politik ve duygusal etkileri olan bir konu olduu iin, alma bilimsel yaynlarda ve
bloglarda youn bir tartma balatmtr- tartmalar okumak uygulamada istatistiin
gerekten nasl yapld konusunda size ok ey retecektir.
Tanm 1. Bir rasgele deney en azndan teorik olarak- (a) sk sk ve ayn koullarda
keyfi olarak tekrarlanabilir (b) ok iyi tanmlanm olas sonular kmesine sahiptir.
ri
.c
om
Bunun standart rnei yaz (T) ve tura (H) gibi iki sonucu olabilen madeni para
atmadr (parann dik bir ekilde durma olasln grmezlikten geliyoruz). statistik
alannn bir dier nemli deney tr bir seim srasnda yaplan yoklamadr. Diyelim ki
oylama yaplan yerden kanlar arasndan rasgele olarak seilen 2000 kiiye kime oy
verdiklerini sorduk. Kural olarak, seim gn oy kullanacak kitleden keyfi olarak ok
sayda 2000 kiilik rneklem seebiliriz. Dolaysyla koul (a)y gerekletirmi oluruz.
Bu deneyin sonu kmesi, seimde hangi aday iin oy kullandn beyan eden semen
saysdr.
Tanm 2. Bir rneklem uzay olan S, bir deneyin btn olas sonularnn toplamdr.
de
rs
no
tla
Birok amatan tr, esas itibariyle olaylarn tek sonucuyla deil, olaylarn
btn sonular grubu ile ilgileniyoruz. Bu nedenle, izleyen blmde deneyi kmeler
cinsinden tanmlayacaz.
Tanm 3. A olay herhangi bir sonular toplam olabilir (bu, tekli sonucu, bo kmeyi
veya rnek uzayn tmn ierir).
Eer gerekleen sonu A olaynn bir eleman ise, o zaman Ann gerekletiini
syleyebiliriz.
Bir rnek olarak, imdi geen seneki bakanlk yarn ele alalm. En basit
ekliyle, rnek uzayn (S) mantksal bir olabilirlii dndmzde- Kasm aynda
bakan olarak seilebilecek kiiler olarak tanmlayabilirdik (rnein, ilk deneme olarak
n seimlerin balca adaylarna bakabilirdik).
S = {Clinton, Huckabee, McCain, Obama, Paul, Romney, Schwarzenegger }
ee
om
.c
ri
Eer Bnin btn sonular Aya ait ise, olay B Ann iindedir. Sembolik olarak,
tla
Kesinlikle, herhangi bir C olay rneklem uzay Sde yer alr, yani
Herhangi bir C olay iin
de
rs
no
B Ay gerektirir
ekil 1.
ee
{McCain, Schwarzenegger}
.c
om
ve
ri
ee
de
rs
no
tla
A ve Bnin birleimi, A veya Bnin (veya her ikisinin, U mantksal veya sembol olan
Vnin karldr) elemanlarnn btn sonularnn toplamdr
A B=B A
Buna ilaveten,
Herhangi A, B
S olaylar iin
om
zellikle,
.c
Ayrca kme/olay birleimini hangi srada yaptmzn da bir nemi yoktur (birleim
zellii).
ri
tla
A ve Bnin kesiimi (bo olabilir) A ve Bnin ikisinde birden olan sonular toplamdr.
Aadaki gibi yazlr,
de
rs
no
Burada mantksal veyi ifade eder. Baz metinlerde alternatif iaretleme kullanlr,
ee
Keza,
Herhangi A, B
S olaylar iin
om
Buradan hareketle,
.c
Ayrca, kme birleiminde olduu gibi, kmelerin kesiimi birleme zeliine sahiptir.
ri
de
rs
no
tla
ve
= {Clinton}
ee
= {Clinton}
Ann tmleyeni AC, Sdeki Aya ait olmayan sonular kmesidir. Yani,
AC =
om
.c
ri
tla
de
rs
no
ee
om
.c
ri
de
rs
no
ekil 5.
tla
kuraln da
ee
A1, A2, olay grubu, eer aadaki iki koulu salyorsa rneklem uzaynn blnts
olarak adlandrlr. Koullar: (1) Ai, Aj (i j) herhangi iki farkl olay olsun. Ai ve Aj ayrk
ve (2) A1, A2, grubu eksiksiz ise. Ayn ekilde, B olaynn blntlerini,
birleimi Bye eit olan karlkl dlayan alt-olaylar olarak tanmlayabiliriz.
om
.c
ee
de
rs
no
tla
ri
om
Konrad Menzel
5 ubat 2009
1. Olaylarn Olasl
de
rs
no
tla
ri
.c
Kullanl bir olaslk tanm yapabilmek iin, her hangi bir olaslk fonksiyonu Pnin
aadaki aksiyomlar salamasn bekleriz:
(P1) Herhangi bir A
iin P(A)
ee
Matematiksel bir not olarak, bu aksiyomlarn (ve sonraki derste P(A)nn zelliklerinin
tretimlerinin) bir anlam ifade edebilmesi iin
yn Syi ve onun elemanlarnn
tmleyenleri ile birleimlerini iermek zorundadr. Bu, bir nceki sayfada dipnotta
1
Olasln tutarl bir tanm iin, olaylar grubu aadaki zelikler sahip olmak zorundadr
(S1) S
C
(S2) Eer A
ise, o zaman onun tmleyeni A
(S3) Herhangi saylabilir A1, A2. olaylarn birleimi dir, yani A1 A2
Bu olaylar ynna Snin sigma-cebiri olarak adlandrlr. Bu dersin amac iin, bu nemli deildir, ve
eldeki sorunun bu tr aksiyomlara uygunu olduu gereini veri olarak kabul edeceiz.
om
Tanm 1. Bir rneklem uzay S zerinden tanmlanan bir olaslk dalm (P1) (P3)
aksiyomlarn salayan P(A) ile gsterilen bir saylar yndr.
tla
ri
.c
P(1)-P(3) aksiyomlarnn olaylara bir tek olaslk atamadna dikkat ediniz. Onun
yerine, bu aksiyomlar sadece olasln ne olmas gerektii konusunda sezgilerle tutarl
bir ekilde herhangi bir olaslk dalmnn salamas gereken minimum koullar
verirler(gerekte bunu aada kontrol edeceiz). Prensipte, bu zelikleri salayan
herhangi bir P(.) fonksiyonu geerli bir olaslk oluturur, fakat bunun eldeki rasgele
deneyin iyi bir aklamas olup olmadn anlamak iin zelikleri ayr ayr grmek
zorundayz. Bu her zaman zor bir sorudur. Bu dersin 5. blmnde (zel Dalmlar),
belli standart durumlar iin baz popler P(.) seimlerini tartacaz.
de
rs
no
P(AC) = 1 P(A)
ee
nerme 2
P( ) = 0
C
om
ISPAT:
nerme 3. Eer B
P(A)dr.
.c
olduunu gsterebiliriz.
ri
tla
A ise
kullanlmtr. (P3) aksiyomunu
nin ayrk olduuna dikkat etmek gerekir.
de
rs
no
0i
SPAT: 0
salar.
P(A)
ee
rnein, Daniel Kahneman ve Amos Tversky tarafndan yaplan bir almada birka kii Lindann
tarifini aadaki gibi veriyorlard:
Linda 31 yandadr, bekardr, gevezedir, ve ok zekidir. Felsefe eitimi ald. renci iken, ayrmclk ve
sosyal adalet konularyla ok derinden ilgilenirdi ve ayn zamanda nkleer kart gsterilere de katlrd.
Lindann bir gie memuru olma olasl sorulan kiiler, onun feminist bir gie memuru olma olasl
sorulan kiilere gre daha dk deerler verme eilimindeydiler.
P(A) = 1- P(
om
nerme 5
.c
ri
Ayn ekilde,
tla
Bunlarn blnt olduu kolayca kontrol edilebilir. Yani kmelerin her bir ifti ayrktr.
Dolaysyla aksiyom (P3) kullanlarak grlecei gibi
(
de
rs
no
ve
Dolaysyla,
,
ile
nin blnts olduu iin (P3)
kullanlarak (ekil 1 sz konusu fikrin grafiksel gsterimini vermektedir)
[
ee
om
.c
tla
ekil 1.
ri
de
rs
no
Sonularn olay gereklemeden nce simetrik olduu, yani bir olayn olma
olaslnn dierinden fazla olmas iin bir sebebin olmad sonlu bir rneklem
uzaymzn olduunu varsayalm. Eer n(C) bir C olayndaki sonularn saysn ifade
ederse, olaslk
P(A) :=
olarak tanmlanr. Yani, olaslk, A olaynda yer alan Sdeki btn olas sonularn
oranna eittir. Bu dalm, basit olaslk dalm veya mantksal dalm olarak
adlandrlr. Para veya zar gibi her bir sonucun olasl eit olan aralar iin adil
olduklar sylenir. imdi aksiyomun da salanp salanmadna bakalm.
(P1): P(A) 0 n(.)nin sadece (zayf ihtimalle de olsa) pozitif deerler almasnn
dorudan sonucudur
=1
ee
(P2): P(S) =
om
rnek 1. Kusursuz bir zarn bir kere atldn varsayalm. Bu durumda rneklem uzay
S = {1,2,,6}a eittir, dolaysyla n(S) = 6. Gelen saynn kesinlikle 4ten byk olma
olasl nedir?
.c
Eer bir zar iki kere atlrsa, iki rakamn toplamnn 4 veya daha dk olma olasl
nedir?
Bu durumda: S = {(1, 1),(1, 2), , (2, 1),(2, 2), , (6, 6)} olduu iin n(S) = 62 = 36.
tla
Dolaysyla P(B) =
ri
de
rs
no
Biraz sonra, belli olaylar sonucunda oluan sonular saymak iin daha sofistike
teknikleri greceiz.
4 Sayma Kurallar
ee
rnek 2. nl satran oyuncusu Bobby Fischer (3 hafta nce ld) sonunda klasik
satranc oynamaktan sklr ve sadece 8+8 piyonun allageldii gibi yerletirildii
ancak, ilk srada, dier talarn (1 ah, 1 vezir, 2 fil, 2 at ve 2 kale) her bir beyazn ayn
cins siyaha karlk gelecei ekilde rasgele yerletirildii bir varyant nerir. Dier
kstlamalar ise (1) bir fil siyah karede iken dieri beyaz karede olmak zorunda, (2) ah
ilk seferde iki kale arasndan hareket etmek zorundadr (rok yapmaya izin vermek iin).
Bunun arkasndaki dnce, satran oyuncularnn sadece standart balama
pozisyonu ile iyi ileyen standart oyun amay kullanma eilimde olduklar iin, yeni
varyant, oyunun ezberlenmeyi imknszlatracak kadar yeterli sayda oluturulmas
durumunda, oyuncular yaratc bir ekilde oynamaya zorlamaktr. Fakat ka tane farkl
muhtemel balama pozisyonu vardr?
om
ri
.c
tla
Kural 1 (arpm Kural): Eer bir deney birincisi m olas sonuca ve ikincisi birincisinin
sonucu ne olursa olsun n olas sonuca sahip 2 blmden oluuyorsa, o zaman deney
mxn sonuca sahiptir.
de
rs
no
rnek 3. Eer bir ifrenin 8 karakterli (harf ve rakam) olmas gerekiyorsa, o zaman sz
konusu deney her birisi 2x26 + 10 = 62 sonucu olan 8 paraya sahiptir (ifrenin byk
ve kk harfe duyarl olduu varsaymna gre). O halde, toplam olarak 628 (kabaca
218 trilyon) kadar farkl ifre elde ederiz. Aka sylemek gerekirse, onlarn tmn el
ile saymaya almak iyi bir fikir olmazd.
rnek 4. Bilgisayar sistemlerinin ounda kullanlan standart ASCII karakter seti 127
karakter ierir (boluk hari). Hafza iin her karaktere 1 byte = 8 bit isnat edilir.
Gemiten gelen sebeplerden tr, aktarma veya koddaki kopyalama hatalarn tespit
etmek iin 8nci bit tutarllk kontrolnde parite olarak kullanlrd. Bundan tr, her
birisi {0,1}den oluan sonuca sahip 7 paral bir deneyimiz ve bu nedenle de toplam 2 7
= 128 sayda farkl karakterimiz var.
ee
rnek 5. Bir kart destesinde 52 kart vardr, dolaysyla eer mavi ve krmz destelerden
birer kart ekersek 52x52=2704 olas kart kombinasyonu elde ederiz (eer ekiliten
sonra hangi desteden hangi kartn geldiini bilemezsek, o zaman daha az sayda ayrt
edilebilir sonular elde ederiz). Dier taraftan, eer ayn desteden geri koymadan iki kart
ekersek, hangi kart nce ektiimizden bamsz olarak, ikinci kart ekmek iin
destede sadece 51 kart kalm olur. Elbette hangi 51 kartn kald hangi ilk kartn
ekildiine bal olacaktr, ancak bunun arpm kural iin nemli olmadna dikkat
edilmelidir. Bu nedenle, eer ayn desteden iki kart ekersek, 52*51 = 2652 olas
kombinasyonumuz olacaktr.
Son rnek genel ekilde aklamaya altmz iki tr deneyi gstermektedir: her biri
farkl sayma kuralarna sahip geri koymal rneklem ile geri koymasz rneklem.
N byklndeki bir gruptan geri koyma ile n tanesi ekilmitir.
om
N.N.N = Nn
n tane
mmkn sonu.
tla
mmkn sonu
n)
.c
ri
de
rs
no
Gerekte, bu iki sayma kural arpm kuralndan elde edilir, fakat bunlar istatistikte ok
nemli olduklar iin onlar ayr deerlendirdik.
4.2 Permtasyonlar
Permtasyon oluturmann, yerine koymadan, N yeli bir gruptan N tane ekili yapma
olduunu not ediniz.
ee
rnek 7. 12 ton teknii modern klasik mzikte bir besteleme tertibidir. Bu tertip iinde
her para bir tona dayanr. Her yarm tonlu lein (kromatik gam) on iki notas (C, C
keskin, D, D keskin, vs.Bye kadar) tam olarak bir kere grlr. Bu nedenle, her bir
tonun dizisi yarm tonlu lein bir permtasyonudur ve prensipte farkl olan her olas
melodiyi sayabiliriz (yaklak olarak 479 milyon).
rnek 8. Mehur gezgin satc problemi. Diyelim ki ihtiyari olarak sralanm, aradaki
mesafesi belli 15 kasabadan gemek zorunda olan bir satcy ele alp ve her
kasabadan (en azndan) bir kere geen en ksa yolu bulacamz varsayalm. 15lik
gruptan 15 tane ekme formlmz kullanarak 15! sonucuna varabiliriz. Bu 1.3 trilyon
farkl yol demektir. Bu karmak bir problemdir, bu nedenle zmeyeceiz.
ri
.c
om
Satcnn her bir kasabada 5 mteriyi ziyaret ettiini hayal edebiliriz. Eer
mteriden mteriye mmkn olan btn yollar dnecek olursak, (15x5)!
permtasyon elde ederiz (bu ok fazla!). Ancak, aratrmamz satcnn kasabada iken
5 mteriyle ayn anda (tanmlanabilir bir sra ile) grme eklindeki yolculuk plan ile
snrlandrmak mantkl gibi grnyor. Her kasabadaki mteriyi grebilmesi iin 5!
olas sralama vardr ve ziyaret edebilecei kasabalar iinse 15! olas sralama vardr.
Dolaysyla, arpm kuraln kullanarak sz konusu ilave snrlamay salayacak
permtasyon saysnn hesaplayabiliriz:
15 tane
de
rs
no
4.3 Kombinasyonlar
tla
Bu hala arpc bir ekilde yksek bir rakamdr, fakat snrlandrlmam (15.5)!
permtasyonundan kesinlikle ok daha dktr3.
rnek 9. Eer bir tek desteden ka farkl poker eli ekeceimizi saymak istersek, yani
bir tek desteden yerine koymadan 5 kart ekmek gibi, kartlarn ekilme srasyla deil
ancak her hangi bir kartn ekilip ekilmediiyle ilgileniriz.
Tanm 3. Herhangi sralanmam eler toplamna kombinasyon denilir.
ee
k! kye gre ok hzl byd iin ok az kii faktriyelin lei hakknda sezgiye sahiptir. Byk k
deerleri iin olduka iyi i gren Strlingsin tahmin
( )
Popler bilimde olduka yksek rakamlar karlatrmak iin yaygn olarak kullanlan bir hesaplama
80
gzlemlenen kinatn toplam atom saysn tahmin etmektir.Bu deer aa yukar 10 (dorusu, bu
18
rakam alglamak da bile gl ekiyorum). Faktriyle cinsinde 10
59!dur. 75! says kabaca 2.5 x
30
10 (iki buuk milyon trilyon trilyon) arp kainattaki atom says olarak ifade edilebilir.
Bu ekilde karmak hesaplamalardan kanmak isteyeceimiz iin, sadece faktriyellerin oranlar ile
ilgileniriz, bu nedenle de nce hangi terimin birbirini gtreceini grmek gerekir. rnein
.
om
.c
Not: Her ne kadar faktriyellerin oranlarna bakyorsak da, binom katsays daima
tamsaydr (kombinasyon saysnn anlaml olabilmesi iin gereklidir).
ri
de
rs
no
tla
rnek 11. levsel bir alma grubu, diyelim ki, 5 kiiden fazla olmamal (bu say iin
pedagojik bir gereke yoktur, sadece matematiksel ilemlerim gereinden fazla
karmaklamasn nlemek istiyorum). Bu derse u anda 28 renci kaydn
yaptrmtr. Ka tane uygun alma grubu mmkndr (kendi bana alan
renciler dhil)? Her bir 1, 2, 3, 4, 5 grup byklkleri iin alma gruplarnn saysn
hesaplamak ve toplamn almak zorundayz. Bu durumda (eer herhangi bir hata
yapmadysam)
ee
rnek 12: Fischerin Rassal Satrancna Geri Dn: lk olarak kale ve filler hakkndaki
(1) ve (2) nci snrlamalar grmezlikten gelelim, yani satran tahtasnn alt srasnda
talarn herhangi bir ekildeki yerleimine izin verelim. 8 beyaz ta (siyahta olabilir, bu
nemli deil) tahtann alt srasndaki 8 kareye datmak zorundayz. Dikkat ederseniz
bu bir permtasyondur, bu nedenle 8! kadar olas sralamamz var. Ancak, sadaki ve
soldaki talarn eit olas kuralndan tr kale, vezir ve filler ifterdir. Dolaysyla,
srasyla iki kale/fil/veziri birbiriyle deitirerek 2x2x2 olas bir balang pozisyonu
oluturma yolu vardr. Bundan tr, farkl oyun says
Oyun Says =
= 7! = 5040
kadardr.
.c
kombinasyondur, yani ( )
om
Daha nce sylediimiz gibi, gerek kurallar Fischerin Rasgele Satrancna ilaveten
unlar empoze eder: (1) bir fil siyah karede ise dieri beyaz karededir, (2) ah iki kale
arasnda ilk hareketini yapabilir. Bu varyant iin, eer sralar doldurma sralamas
konusunda biraz zekiysek, arpm kuraln kullanabiliriz. ncelikle iki fili, tesadfen
seilen bir siyah kare ile tesadfen seilen bir beyaz kareye yerletirmeyi neriyorum.
Bylece 4x4 olanamz vardr. Sonra, at geri kalan 6 kareden birine yerletirilir (6
olanak). ki veziri, geriye kalan 5 kareden herhangi birine yerletiririz. Bu bir
ri
iin bir snrlama olduundan, geriye kalan ta bo olan alana yerletirmek iin
her zaman bir tek yol vardr. Toplam olarak, elimizde
Oyun Says = 4x4x6x10x1 = 960
tla
de
rs
no
ee
Yaayan veya l bakanlar ile ilgili komplo teorileri tipik olarak sra d
tesadfler zerine kurulur. rnein, suikaste urayan iki Amerikan bakan iin, yani
Lincoln ve Kennedy, bir kii az ok dikkate deer ortak noktalarla alakal ok uzun bir
liste oluturabilir. rnein, Lincolnun vurulduu tiyatroya gitmemesi konusunda uyaran
Kennedy adnda bir sekreteri varken, Kennedynin de suikastten nce Dallasa
gitmemesi konusunda uyaran Evelyn Lincoln adnda bir sekreteri varm (Ho! En
azndan Wikipedia yle diyor).
Bir dier belirgin tesadf ise 39 bakandan lm olan bazlarnn ayn lm
tarihine sahip olmalardr: Filmore ve Taftn ikisi de, 8 Martta, lmlerdir. John Adams
ve Thomas Jeffersonun ikisi de 4 Temmuz 1826 tarihinde, bamszlk bildirgesinin
om
lgili olaya ait sonularn oranlarnn olaslklara eit olduu varsaym altnda,
imdi iki belirlenmi bakann belli bir gnde, ubat 6 diyelim, lmesinin basit
olaslna bakalm. Bu durumda, iki bakann lm gnlerinin 6 ubata denk
gelmesinin sadece bir tek kombinasyonu olduunu buluruz. Fakat saymann arpm
kuralna gre toplam olarak 3652 kadar olas lm gn kombinasyonu vardr. Buna
gre, sz konusu olayn olasl son derece dk bir rakam olan 1/3652dir.
de
rs
no
tla
ri
.c
Ancak, duble lmn potansiyel aday olarak bir ylda ok sayda bakan ve gn
elemesi vardr. imdi, 39 bakandan en az 2sinin ayn gnde lmesi olay olan Ann
olasl, prensip olarak bir ift, iki ift, ifti vb bakann ayn lm tarihine sahip
olmasnn btn olas kombinasyonlarn oran olarak hesaplanr. Bu sorunu zmenin
en zarif ekli ise A AC = S ve A AC = olduu iin aksiyom (P2) ve P(3)ten P(A) =
P(S) P(AC= 1 P(AC) elde ederiz. Olay AC 39 bakann tm farkl lm gnne
sahiptir olarak formle edilebilir. Eer sadece iki l bakan varsa, ilkinin lmnden
sonra ikinci bakann farkl bir gnde lmesi iin 364 farkl yol vardr. imdi her bir n
bakana farkl bir lm gn tayin etme olanaklarnn saysn belirlemenin yerine
koymadan 365ten n tane ekilie tekabl ettiini farketmemiz gerekir, bu nedenle
olanaklarn says
dir.
ee
.c
om
ee
de
rs
no
tla
ri
om
Konrad Menzel
10 ubat 2009
.c
tla
ri
Hatrlanaca gibi, basit olaslk ile sonularn eit olarak mmkn olduu ve sonlu bir
rneklem uzay iin, A olaynn olasl
de
rs
no
)(
n(S) = 522
ee
ierir. Bylece
om
Baz baka rneklerde, bir olayn olasln, tmleyeni araclyla hesaplamak ilemleri
ok basitletirebilir.
.c
tla
ri
Her durumda, tam olarak 4 fze hedefine ulaaca iin, S rneklem uzay 16da 4
fzenin btn kombinasyonlarn ierir. Dolaysyla, Snin elemanlarnn says binom
katsays ile verilir.
de
rs
no
Bu nedenle,
yleyse bu olaslk bire olduka yakn bunu bekleyip beklemediinizden emin deilim,
fakat politik olarak doru olmasa da, bu rnek ok sayda olanan olduu kombinasyon
problemlerinde sezgilerin ok kolay yanlabileceini gstermektedir.
ee
rnek 3. Mehur doumu gn paradoksu (bir zamanlar) popler bir parti oyunu ile
ilgilidir: n kiilik bir arkada grubunuz olsun, onlardan en az bir iftin ayn doum gnne
sahip olma olasl nedir? (btn doum gnlerinin eit olaslkl olduunu varsayalm.
Bu gerekte, sadece kabaca ampirik olarak dorudur. ) Yine, her bir n arkadanzn
1
Buradaki isimler Orwellin roman 1984 ten alnmtr, dolaysyla bunun bir gerek dnya rnei olmas
gerekmiyor.
om
farkl doum gnne sahip olduu AC tmleyen olayna bakalm: Bu, yerine koymadan
365ten n tane ekilie tekabl ettii iin, ilgili forml kullanabiliriz:
.c
Bylece en az iki arkadanzn ayn doum gnne sahip olma olasln, P(A),
hesaplayabiliriz:
de
rs
no
tla
ri
Bu forml bilhassa kolay okunmaz, bu nedenle imdi nnin birka deeri iin olaslklar
ondalk olarak aaya yazalm:
ee
olduuna ikna edersiniz. Bu farklln nedeni, nceki durumda, Ann ayn zamanda n
arkadanz arasndaki btn elemeleri kapsamasdr ki bu da sayy hzl bir ekilde
yukar doru ekmitir.
om
.c
2. Bamsz Olaylar
tla
ri
Sezgisel olarak, iki farkl olay olan A ve B iin Ann gereklemesinin Bnin
gerekleme olasln etkilemedii bir kavram tanmlamak istiyoruz. rnein eer bir
madeni paray iki kere frlatrsak, ikinci atn sonucu herhangi bir ekilde birinci atn
sonucundan etkilenmemelidir. Notasyonu basit tutmak iin bundan sonra
P(A B) = P(AB)
de
rs
no
Buradaki bamszln, olaylarn fiziksel doasnn deil, sadece olaslk dalmn bir
zelii olduunu grebilirsiniz. Bu yzden baz olaylarda bamszlk hakknda iyi
sezgiye sahip iken (bir dizi yaz-tura atma gibi), ou durumda bu formal koulu kontrol
etmekten baka seeneimiz yoktur.
rnek 4. Diyelim ki adil bir zar iki kere frlattk, aadaki olaylarn ve kesiimlerinin
olasl nedir?
A = {2, 4, 6}
ee
B = {1, 2, 3, 4}
( )
( )
tr. Olaylarn
.c
om
Bamszln belirtilen olaslk dalmna ne denli nemli bir ekilde bal olduunu
grmek iin, imdi varsayalm ki, zar maniple edildi ve bylece P(6)=3/8, dier btn
saylar iin n = 1, , 5, P(n) = 1/8 olsun. O zaman, ayrk olaylarn olaslklarnn
toplam zerine olan (P3) aksiyomuna gre,
ri
ve
de
rs
no
tla
ee
Tanm 2. Bir grup A1, A2,. olaylarnn bamsz olmas iin, bu olaylarn herhangi bir
alt grubu Ai1, Ai2, iin (btn indeksler farklyken), aadaki koul salanmaldr:
ve
om
rnek 5.
rneklem uzay S = {s1, s2,s3,s4} ve btn sonular iin P(si) = 1/4 olsun, o zaman her
bir olay
ri
tla
(A B) olaynn olasl
.c
de
rs
no
ve bu durum herhangi iki olay iin de dorudur, bylece olaylar ikili olarak bamszdr.
Ancak, hepsi beraber ele alndnda toplam yn bamsz deildir. nk
3. Koullu Olaslk
ee
rnek 6. Eer adil bir zar atarsak ve gerekte sonucun ift bir say olduunu sylersek,
yani B = {2, 4, 6} olmusa, zarn 6 gelmi olma olasl nedir? Bde sadece 3 tane eit
olaslkl sonu olduu iin, ki 6 onlardan biridir, biz sezgisel olarak cevabn 1/3 olmasn
bekleriz. Burada rneklem uzayn = B = {2, 4, 6}ye indirgedik ve yeniden
tanmlanm probleme gre basit olasl hesapladk.
Tanm 3. Varsayalm ki, P(B) > 0 iken, A ve B, Sde tanmlanm olaylar olsun. Bnin
gereklemesi durumunda Ann koullu olasl
om
ile verilir.
de
rs
no
tla
ri
.c
ee
rnek 7. Bu rnek Greg Mankiwin web gnlnden (blog)2 uyarlanmtr. Intrade gibi
platformlarda, eer bir olay gerekleirse (rnein, Yankeelerin dnya ampiyonasn
kazanmas) 1 dolar deyen deerli katlar alp satabilirsiniz . Eer piyasa gerektii gibi
alrsa, bu tip deerli katlarn belirli bir t zamanndaki fiyat, alp satanlarn bu t
zamanndaki bilgisine bal olan olaslk eklinde yorumlanabilir. Intradedeki politik
piyasada, aadaki olaylar iin deerli kt alp satabilirsin:
om
ri
tla
Bylece,
.c
de
rs
no
Bylece, ilgili deerli kadn fiyatn sadece formlde yerine koymamz yeterlidir. 6
ubattaki Intrade politik piyasasndaki deerli kat fiyatlarna dayanarak, aadaki
rakamlar elde ederiz (son stunda, Mankiwun Kasm 2006daki orijinal web
gnlnde yer alan deerleri kullandm).
P(A)y P(A|Bi) koullu olaslndan ayrt etmek iin, P(A), Ann marjinal olasl olarak
da adlandrlr. Marjinal ile koullu olaslk arasndaki iliki Toplam Olaslk Kanunu ile
verilir.
ee
Teorem 1. (Toplam Olaslk Kanunu) Varsayalm ki B1, , Bn rneklem uzay Snin bir
blnts ve her i = 1, , n iin P(Bi) > 0 olsun. O zaman herhangi bir B olay iin,
om
SPAT: Koullu olaslk tanmndan herhangi bir Bi olay iin P(A|Bi)P(Bi) = P(A Bi). B1,
, Bn rneklem uzay Snin blntleri olduundan, (A B1) (A Bn), ayrk ve A iin
karlkldr, yani A iin blnt olutururlar. Bu nedenle, ayrk kmelerin birleiminin
olasl zerine olan aksiyom (P3)e gre
.
rnek 8.
de
rs
no
tla
ri
.c
Tbbi veride, sklkla daha yal ve tecrbeli kalp cerrahlar tarafndan tedavi edilen
hastalarn aslnda daha gen olanlar tarafndan tedavi edilenlere gre daha yksek
ameliyat sonras lm oranna sahip olduklar grlmektedir. Tecrbeli cerrahlar iin %
6lk, daha gen olanlar iin sadece %5.5lik lm oranlarn gzlemlediimizi
varsayalm. Bu durum, cerrahlarn yeteneklerinin ya ilerledike azald anlamna gelir
mi? Muhtemelen deil Burada bir cerrahn uygulamak zorunda olabilecei drt eit
prosedr olduunu varsayalm tekli, ikili, l ve drtl bypass (terminoloji bypass
edilmesi gereken koroner arter saysn gstermektedir). Prosedrn karmakl ve
hastalarn riski baypas saysyla artar ve genellikle daha hasta olan hastalar daha
komplike prosedrlere ihtiya duyabilirler. Varsayalm ki, her bir prosedr iin, tecrbeli
cerrahlarn hastalarnn bariz bir ekilde ok daha dk lm oranna sahip olduklar,
fakat tecrbesiz cerrahlarn hasta lmlerinin orannn genel olarak daha dk olduu
bize sylendi. Toplam olaslk kanunun nda, bu iki durum nasl bir arada
gerekleebilir? imdi bir rnee bakalm (Bu rakamlar elbette uydurmadr)
Prosedr
Tekli Baypas
kili Baypas
l Baypas
Drtl Baypas
Toplam
Tecrbesiz
lm Oran
Vaka Yzdesi
% 4.0
% 50.0
% 6.0
% 40.0
% 10.0
% 9.0
% 20.0
% 1.0
% 5.5
% 100.0
Tecrbeli
lm Oran
Vaka Yzdesi
% 2.0
% 25.0
% 4.0
% 25.0
% 6.0
% 25.0
% 12.0
% 25.0
% 6.0
% 100.0
ee
Tecrbeli cerrahlar her prosedre karlk gelen orantsz bir ekilde yksek oranlarda
riskli vakalarda grevlendirildikleri iin (varsaymsal olarak bu gibi durumlarda daha
fazla tecrbeye ihtiya olduu iin), her bir tedavi kategorisini daha iyi uyguladklar
halde, ortalama (marjinal demek daha doru) lm oranlarnn tecrbesiz
cerrahlarnkinden daha yksek olduunu grebiliyoruz. Bu durum sklkla kompozisyon
etkisi olarak anlr.
Marjinal lm oranlar iin iyi bir kullanm alan bulmak daha zor.
om
O halde her bir olaslk trnn pratik nemi nedir? Eer baypas iin cerrahlar
arasndan birini semek durumunda olsaydnz, prosedrn tipi yalnzca salk
durumunuza bal olmalyd, cerrahn tecrbeli olup olmamasna deil, dolaysyla bu
durumda sadece koullu olasl nemsemeliydiniz.
ri
.c
tla
Aklama 2. Dier bir yakn ilikili kavram da ekonometride ok nemli olan koulu
bamszlktr. Aadaki koulun salanmas durumunda, A ve Bnin Cye koullanm
iki bamsz olay olduu sylenebilir.
de
rs
no
Yani A ve Bnin bamsz olup olmamas ciddi bir ekilde neye koulladmza baldr.
Sonraki problem setinde bir kar- rnek ieren bir uygulama olacaktr.
ee
Bu tanm daha nce ele aldmz koulsuz bamszlk ile tam uyumludur. Biz sadece
kendimizi yeni rnekle S = C ile snrlyoruz. Koullu bamszlk daha sonra
ekonometride ok nemli bir rol oynayacak. Bu nedenle zel olarak zerinde durulmay
hak ediyor. Teknik olarak, koullu bamszln koulsuz bamszl salamadn
(ya da tersini) not etmek nemlidir. Baka bir ifade ile, iki olayn bamsz olup
om
olmamas ciddi bir ekilde baka neye koulladmza baldr. Bunu nceki derste
belirtmitim, imdi ise baka bir rnek vererek aklayacam.
rnek 9. Her bir sonucun 1/6 olaslkla gerekletii, zar atma rneine tekrar bakalm,
yani S = {1, 2, 3, 4, 5, 6} .
.c
tla
de
rs
no
Ancak,
ri
Yani, onlarn kesiimi C ile ayrk olduu iin, A ve B, Cye bal olarak bamsz
deillerdir.
(2) ki baml olay bamsz yapma: D = {2, 3, 4} ve E = {2, 4, 6} olsun. D ile Enin
baml olduunu kontrol edebiliriz: P(D) = P(E) = 1/2 olduunu grebiliriz.
Ancak,
ee
Halbuki
ee
de
rs
no
tla
ri
.c
om
om
Konrad Menzel
12 ubat 2009
.c
1. Bayes Teoremi
tla
ri
de
rs
no
rnek 1. Antik Yunanllar (belli ki henz istatistik hakknda ok ey bilmiyorlard) her bir
gemi batndan sonra, kurtulan btn deniz adamlarnn deniz tanrs Poseidana dua
ettiklerini fark ederler. Bu gzlemden hareketle, onlarn gerekten kurtulmasnn nedeni
dua etmi olmalar olduu yorumu yaplr. Bu rnek gerekte 16nc yzyl ngiliz filozofu
Francsi Bacon tarafndan gndeme getirilmitir. statistiki terimlerle, kurtulanlar olay A
ve dua etmeyi olay B olarak tanmlayalm. Bylece, soru dua etmenin kurtulma
olasln ykseltip ykselmedii olur, yani (P(A|B) > P(A)
p ilikisi doru mu, deil
mi? Btn kurtulan denizcilerin dua etmi olduu gzlemi P(B|A) = 1e dnr. Bu bilgi
gerekten de dua etmenin kurtulma ansn nemli lde artrp artmad sorusunu
cevaplandrmak iin yeterli midir? P(B|A) ile ilgili bilgiyi kullanarak P(A|B) hakkndaki
bilgiyi nasl reniriz?
ee
om
tla
ri
.c
Teorem 1. (Bayes Teoremi) Eer A1, A2, , Snin bir blnts ise, P(B) > 0l
herhangi bir B olay iin aadakini yazabiliriz
de
rs
no
rnek 2. nceki, batan gemiden kurtulan deniz adamlar rnei iin, P(B|A) = 1i ve
(koulsuz) deniz adamlarnn kurtulma orann P(A) gzlemleyebiliyorduk. Ancak,
P(B|AC)yi (boulanlar arasnda dua edenlerin oran) gzlemleyemediimiz iin, dua
etmenin kesinlikle kurtulma ansn artrp artrmad ile ilgili soruyu cevaplandrmak
iin yeterli bilgiye sahip olmadmz da grebiliyoruz. Onlarn da lm korkusundan
dua ettiini rahatlkla varsayabiliriz (yani P(B|AC) = 1). Bylece aadaki ilikiyi elde
edebiliriz,
ee
Antik Yunanllarn muhakemesi, bir bakma, kurtulan sapma sna bir rnektir (ho! en
gereki ifadesiyle): Bayes teoremi bize, eer sadece kurtulanlar gzlemlersek,
kurtulamayanlar hakknda ok ey bilmedike kurtulan alt-nfusun neden kurtulduu
konusunda bir yargya varmayacamz gsterir.
rnek 3. Bayes kuralnn nemli bir uygulamas da tbbi testlerin nasl yorumlanaca
ile ilgilidir. Bir doktorun ok naho bir hastalk iin bir hastaya test uyguladn
varsayalm ve hastann gerekte hasta olduu olayna A diyelim. Test pozitif bir sonu
verebilir, ki biz buna B olay diyeceiz, veya negatif sonu verebilir, bu da BCdir.
Hastann hastalkl olup olmadn belirleme konusunda test tam olarak gvenli deildir,
fakat pozitif test sonucunun olasl,
om
P(B|A) = % 99 , P(B|AC) = %5
.c
ri
Hastaln genel yaygnl, P(A), olduka dk olduu iin, pozitif test sonucu bile
hastaln nispeten zayf kant oluyor.
de
rs
no
tla
rnek 4. Romeo ile Juliet bir sredir gryorlar ve bir gn sevgililer gn (hatrlatmak
iin: bu Cumartesidir) gelir. Romeo Juliete ya mcevher hediye edebilir, J, ya da ona
bir serenat yapabilir, S. Juliet mcevher ister. Eer Romeo onu gerekten sevdiyse,
onun isteini gzlerinden okuyabilirdi. Dorusu, Juliet ona bu isteini iki hafta nce,
Amerikan futbol ligi finalinin son yarm saatinde sylemiti. Juliet ayn zamanda
Romeonun kendisini hala sevip sevmedii konusunda ilk kez pheye der. Buna L
olay diyelim. Spesifik olmak gerekirse,
P(L) = 0.95
Juliet, Rome kendisini seviyorsa, ona P(J|L) = 0.80 olaslkla mcevher vereceini veya
P(S|L) = 0.20
ee
olaslyla Julietin ne sevdii konusunda bir fikri olmayacak ya da ona bir serenat
yapacaktr (veya daha gereki bir ekilde, nceki sene Julietin istedii glleri verebilir
ya da sevgililer gnn tamamen unutabilir). (Not: Serenat yapmak Romeo iin ok
utan verici olabilir ama ayn zamanda daha da ucuzdur). Sonuta Romeo Juliete
serenat yapar. Juliet onu hemen terk etmeli mi? Bayes teoremine gre, Julietin
Romeonun eilimi hakknda sonraki inanc aadaki iliki ile verilir
Bunun Juliet iin iyi olup olmayacana kendisinin karar vermesini bekleyeceiz.
om
Gerek hayatta, bir ok insann bu tr yarglar ok iyi deildir ve, son iki rnekte olduu
gibi, testlerin gvenirliini gereinden fazla nemseme eilimindedirler. Bilisel psikoloji
literatrnde, bu durum Temel-Oran Yanlgs olarak bilinir. rneimizde temel-oran
etkilenen veya salkl insanlarn, srasyla, P(A) ve P(AC) oranlar ile Romeonun Julieti
sevip, P(L), veya sevmeme, P(LC), n bilgisidir. Eer bu olaslklar ok farkl ise,
sezgilerdeki muhakemenin yanlgs ok fena olabilir.
tla
ri
.c
rnek 5. Monty Hall paradoksu1: Bir zamanlar TVde bir yarmacdan A, B, ve C gibi
kapdan birisini semesi istenilen bir program vard. Kaplarn birinin arkasnda bir
dl (son model bir amar makinesi gibi) ve dier iki kapnn arkasnda ise birer kei
olurdu. Eer yarmac arkasnda dl olan kapy seerse, dl kendisinin olurdu. Eer
arkasnda kei olan bir kapy aarsa, hibir ey kazanmazd. Oyunu biraz daha ilgin
hale getirmek iin, yarmac ilk seimini yaptktan sonra sunucu her zaman dier iki
kapdan arkasnda kei olan birini aard. Bu durumda, yarmacnn istemesi halinde
setii kapy dier kapal kapyla deitirmesine izin verilirdi. Kapy deitirmek iyi bir
fikir olur muydu?
de
rs
no
(
(
Dier taraftan
(
(
ee
Sezgisel olarak, yeni alan kap dln A kapsnn arkasnda olma ihtimali konusunda
hi bilgi iermemektedir, nk sunucu onu hibir ekilde amayacaktr. Gerekte Ay
sememiz halinde, Ada dl var ile C ald olaylar bamszdr. Ancak, sunucunun
B kapsn amamas iki nedenden kaynaklanabilirdi: (1) dl A kapsnn arkasndayd,
sunucu Cyi tamamen rasgele at, (2) dl B kapsnn arkasndayd, sunucu baka
1
om
seenei olmad iin Cyi at. Dolaysyla, C olasln ortadan kaldrmak sadece Bye
avantaj salar.
Dersin ikinci nitesine gemeden nce imdiye kadar yaptklarmz, aina olduklarnz
ve kendinizi rahata hissedeceklerinizi zetleyelim:
Permutasyonlar: N! olanak
Nden n kombinasyonu: ( ) olanak
ri
kadar olanak
tla
2.2 Olaslklar
.c
Bayes Teoremi
de
rs
no
(
(
ee
om
3 Rasgele Deikenler
imdi dersimizin ikinci byk konusu olan rasgele deikenler ile devam edelim.
tla
ri
.c
Tanm 1. Reel-deerli bir rasgele X deikeni bir deneyin sonularn reel saylar ile
eletiren aadaki gibi herhangi bir fonksiyondur.
de
rs
no
Tarihsel olarak, 1800 yllarda rasgele deiken fikri gelitirildii zaman matematikiler ile
dier bilim adamlarnn dncesinde hakiki rassaln ilevi yoktu. Onun yerine, ans,
analiz ettiimiz durumun btn parametreleri hakknda tam bilgi sahibi olmaymz ve
bir deneyin sonucunu tahmin etmede doann kanunlarndan (gya tam belirleyici)
faydalanma konusundaki yeteneksizliimizin bir sonucu olarak grlyordu. Bunlarn
tmn yapabilmek Laplace eytan olarak bilinir ve nl matematiki Pierre Simon de
Laplace aadaki gibi aklar:
Zamann herhangi bir annda bir akl doaya canllk veren btn gleri
ve onu oluturan btn varlklarn karlkl duruunu bilmi olsayd, eer bu akl
verisini analiz etmek iin verecek kadar engin olsayd, kinatn byk
bedenlerinin ve en hafif atomlarn hareketini bir tek forml ile zetleyebilseydi:
byle bir akl iin hibir ey belirsiz olmazd ve gelecek tpk gemi gibi
gzlerinin nnde olurdu.2
ee
Ardndan gelen Fizikteki (rnein quantum fiziindeki gerek belirsizlik) veya hesap
teorisindeki (rnein Gdel teoremi: Bir akl kendisinden daha karmak olmal nk
tahminleri tahmin etmeye alt kinatn bir parasdr) gelimeler bu dnya grn
korumad ama hala bizim olaslk kavramnn temel altyapsn oluturmaya devam
etmektedir: etrafmzdaki dnyann rassal esas itibariyle onun hakkndaki yetersiz
bilgimizi yanstmaktr.
{0, 1} ,
ee
de
rs
no
X: {
12
tla
X:=
ri
.c
om
rnek 7. Bir rnek olarak, Yaz Tura atmann kinci Versiyonu: Laplacenin fikrini
gstermek iin, rneklem uzaynn yukarda ilk yaplanlardan daha karmak tanmn
dnebiliriz: Klasik mekanikte herhangi bir zaman noktasnda parann durumunun (kat
cisim) tam bir aklamasn verebiliriz (en azndan prensipte). Ve o zaman klasik
mekaniin kanunlarn kullanarak onun tam ynn ve zelike Tura (H) veya Yaz (T) ile
sonulanp sonulanmayacan tahmin ederiz. Daha spesifik olarak, parann havaya
atld andaki mekanik sistemin durumunu rneklem uzay olarak aklayabilirdik. Bir
sistemin durumunun tam aklamas (ok ideal!) (1) konumu, (2) parann ktlesinin
merkezinin ivmesi ile (3) yn ve (4) belli bir t0 zamanndaki asal momenti ile verilir.
Bunlarn her birisinin koordinat vardr, yani S = 12. Her nokta s
S aka iki
olaydan {H, T} birine aittir. Turann gelmesi olay, H S, iin X = 1 ve yaz iin X = 0
deerlerini verirsek, bu eletirme aadaki gibi ifade edilen rasgele deikendir.
om
katlmadan). Paray nasl frlattmza bakmadan, istenilen sonucu kesin olarak verecek
balang durumunu, ivmeyi vs. kontrol altnda tutmak tamamen imknszdr. Ayrca,
tipik olarak bir sistemi aklayan diferansiyel denklemleri kesin dorulukla zmek te
imknszdr. Bu nedenle, sadece Snin bir paras olma olaslklarn verebiliriz, ki bu H
ve T sonularnn olaslklarn eletirir. Dolaysyla, bu durumda hakiki bir rassalla
ihtiya olmazsa bile, bu pratikte bizim iin nasl altn gsterir.
.c
tla
ri
de
rs
no
X biimsel olarak rneklem uzayn reel saylara dntren bir fonksiyon olmasna
ramen, genellikle onu deiken olarak ele alrz. Yani argmanlar belirtmeden onun
olaslkla ilintili eitli deerler aldn syleriz. Baka bir ifadeyle, uygulamalarn ou
iin, ilgili herhangi bir rneklem uzay S ve Snin olaslklarn referans gstermeden,
sadece P(X A)i belirtiriz. rnein yaz tura rneinde yukarda akland gibiSdeki koordinatlar(metal parann balang durumu, ivme, yn gibi) arasndaki doru
ilikiyi, sonularn (saysal olarak imkanszdr) ve koordinatlarn bir olaslk dalmn
anlamaya almayacaz, sadece (P(X = 1) = P(X = 0) = yi bilmemiz yeterlidir.
rnek 8. Eer 10 tane metalik paray birbirinden bamsz olarak atarsak, Bir rasgele
deiken tanmlayabiliriz, X = (Toplam Yaz Says). Bu tr rasgele deikenlerin
dalmlarn aada detayl bir ekilde analiz edeceiz.
ee
rnek 9. Bir seimin sonular ile ilgileniyor olabiliriz. Diyelim ki 100 milyon semen ve
iki aday var. Her semen adaylardan sadece birisi iin oy kullanabilir, hangi semenin
hangi aday iin oy kullandna bal olarak 2100 000 000 kadar farkl sonu vardr. imdi,
Aday A iin (ve esas ilgilendiimiz seim iin) kullanlan toplam oylar ile ilgili olarak bir
rasgele X deikeni tanmlayabiliriz. Oylarn saysnn her bir deeri iin, esas
sonularla ilintili bir say vardr, yani aday Ann btn sonular almasnn tek bir yolu
vardr. Her bir sonucun olasln basit olaslk cinsinden formle edebiliriz ve oradan
hareketle benzer deerler zerinde toplulatrma yaparak verilen toplam oy saysnn
olasln elde edebiliriz.
Aklama 2. Rasgele olaylarn tm, ilgilendiimiz gibi, saysal bir zelie sahip deildir
(rnein, eer olay yarn yamur yaacak ise, ne kadar yaaca ile ilgilenmeyebiliriz).
ee
de
rs
no
tla
ri
.c
om
O zaman rasgele deikene ilimemek gerekir, sadece olaylarla daha nceki gibi
ilgilenebiliriz. Baka bir seenek olarak ta, olayn geeklemesi halinde 1 dier
durumlarda 0 alan bir rasgele deiken tanmlayabiliriz (gelecekte bazen hile ye
bavuracaz).
om
Konrad Menzel
19 ubat 2009
.c
ri
Tanm 1. Eer bir rasgele deiken olan X sadece sonlu sayda deerler (ya da
saylabilir sonsuz) alrsa (x1, x2, ), Xin kesikli bir dalm vardr.
tla
Tanm 2. Eer rasgele deiken Xin kesikli bir dalm varsa, Xin olaslk younluk
fonksiyonu (p.d.f.) aadaki gibi tanmlanr:
fX(x) = P(X = x)
de
rs
no
Eer { x1, x2, } Xin muhtemel btn deerlerinin kmesi ise, o zaman herhangi bir x
{ x1, x2, } iin, fX(x) = 0dr. Ayn zamanda,
iin, X
Ann olasl,
ee
rnek 1. Eer X frlattmz zarn yzndeki say ise, btn tam saylar 1, 2, , 6 eit
ansldr. Daha genel olarak, kesikli uniform dalmn x1, x2, , xk saylarnn
zerinden dalmn p.d.fsiyle tanmlayabiliriz.
fX(x) = {
om
.c
ri
tla
de
rs
no
ee
Zar atma rneinde, her tek sonu tam olarak rasgele deikenin bir deeri ile ilintiliydi.
Dier yandan, be madeni para atma durumunda, diyelim ki, X = 2, X = 0 ile
karlatrldnda, sonularn saylar arasnda ok byk farklar vard. Sonularn
rasgele bir deikenin gerekleen deerleri ile eletirilmesi, rasgele deneyin sonular
eit olasla sahip olsa bile, ok arpk bir dalma yol aabilir.
om
nceki rnei genelletirmek iin, her birisi baarl ve baarsz olarak sonulanacak
(olaslklar eit olmak zorunda olmayan) ardk (dizi) n tane bamsz ve benzer
denemeyi gzlemlediimizi ve toplam baarl X saysyla ilgilendiimiz varsayalm.
ri
.c
rnek 3. Kalite kontrol iin, bir retim fabrikasnda araba paralar ynndan 100
paralk bir rneklem setiimizi varsayalm. Kalite kontroln geen para baarl
olarak belirlenirken, bir veya iki kritere uymayan para ise baarsz olacaktr.
rneklemden hareketle paralarn %1nden fazlasnn standartlara uymadna inanmak
iin iyi bir nedenimizin olmad sonucuna varmak istiyoruz. Bunun iin de toplam
iindeki bozuk paralarn toplam paynn bir fonksiyonu olarak baarszln dalmyla
ilgileniyoruz.
tla
de
rs
no
Ancak, sadece baarl X says ile ilgilendiimiz iin, ( ) sayda baar xli farkl dizi
olduunu hesaba katmak zorundayz.
Tanm 3. Aadaki gibi bir olaslk younluk fonksiyonu olan X rasgele deikenin X
B(n, p) eklinde yazlan p ve n parametreli bir binom dalml olduu sylenebilir.
Daha nce her bir rasgele deney iin ayr ayr olarak olaslk dalm trettiimize, olas
sonularn, her olayn sonularn vs. yazdmza dikkat etmelisiniz. Binom dalm
rasgele deneylerin tmne hizmet eden bir modeldir. Bu kategoriye den herhangi bir
rnek iin, verilen bir (n, p) parametre setinin sadece olaslklara bakarz.
ee
rnek 4. Bir snf arkadanzdan biraz para koparmak iin, tura gelme olasl pL =
olan yamuk bir 1 madeni paray temin ettiinizi dnn. Maalesef, o para sizin dier
normal paralarnzla kart ve ancak 9 lirann 8 lirasn kola makinesine attnzda fark
ettiniz. Aceleyle hemen paray 10 kere frlatnz ve toplam olarak 8 tanesi tura geldi.
Bilinen eski bir madeni para hilesiyle arkadanz soymaya devam etmeye almak iyi
om
kalan madeni para yamuktur ve B = 10da 8 Tura iin P(A|B) katr? Eer madeni
para adil ise,
ri
tla
.c
de
rs
no
Dolaysyla, geri kalan madeni parann gerekte daha ok sradan bir madeni para olma
olasl yksektir - ki toplam yle demiyor, nk tura olasl hala
ee
Ancak, elbette paray birka kere daha atmaktr daha iyi bir fikir olurdu. Eer deneyi
keyfi olarak sk sk tekrarlarsanz, o zaman en sonunda iki para arasndaki fark ihtiyari
bir doruluk derecesiyle tespit edebilecek duruma gelirsiniz. Bir parantez amak
gerekirse, bu uygulamay basit hipotez testi iin bir rnek olarak grebilirsiniz. Diyelim
ki, turann orann daha nce ki gibi tutmak artyla, dier bir 10 denemede yine 8 tura
elde ettiniz (buna olay C diyelim). O zaman, nceki admlarn aynsn takip ederek, bu
sefer evvelki P(B) yerine sonraki P(H|B)ye dayanarak koulu olaslk yle olur:
Dier bir seenek olarak, eer iki seriyi 16 tura ve 20 deneme olarak toplulatrrsak,
elde deriz.
om
Bylece, gncellemeyi ayn anda veya farkl zamanda yapm olmamz fark
etmeyecektir. Bu genel olarak arzulanan Bayesyen gncellemenin zeliidir: nihai
sonu kullandmz genel bilgiye baldr, gncelleme srasna deil.
tla
ri
.c
Verinin birok tr bir eit lmn sonucudur: en azndan kavramsal olarak, bir reel
say aralndaki herhangi bir deeri (bazen tmn) alabilen arlk, uzunluk, gelir vs.
gibi. Bu durumda, bir kesikli deikenin olaslk younluk fonksiyonun tanm kullanl
deildir, nk (a) olas sonularn miktar saylabilir deildir, bu nedenle de sadece tek
tek saylarn olaslklarnn toplamn alamayz ve (b) blnmez bir btnn belirli bir
deerinin olasl sfrdr. Bu yzden, kesikli durumdan ayr olarak, bu tr rasgele
deikenler ile ilgilenmek zorundayz.
de
rs
no
ee
Kesikli rasgele deikenler iin olaslk younluk fonksiyonu tanmlamak nispetten daha
basitti nk snrl sayda deeri vard. Srekli bir rasgele deiken saylabilir
rakamlardan daha fazla deer alr, bu yzden de elde etmek fazlaca aba gerektirir.
yle ki: rasgele deikenin alabilecei muhtemel deerleri bir grupa koyarak dalm
kesikletiriyoruz, yani P(X = x) olaslna bakmak yerine P(x1
X
x2) gibi bir
araln olaslna bakyoruz. Bunun grafiksel gsterimi histogramdr: say dorusu
zerinde bir grup sayy, x0 < x1 < < xn, sabitletiriyoruz ve X deerinin gruplara
dme olasln hesaplyoruz. Grup birbirinin devam iki say aralndr, yani P(xi-1 X
xi). Ondan sonra [x0, x1] aralndaki deerler iin aadaki fonksiyonu tanmlyoruz:
[xi-1, xi) aralnn uzunluuyla blmek, verili bir aralkta grafiin altnda kalan alann
rasgele deiken Xin aralktaki bir deeri alma olaslna eit olmasn garantiler. Yani
unu hesaplayabiliriz:
om
.c
ri
tla
de
rs
no
ee
Bu henz tam tatmin edici deil, nk bu sadece bize x0 < x1 < < xn
saylarnn iki noktas arasna den Xin olasln hesaplamamza yarar, yoksa [xj, xk]
gibi bir alt araln iine deni deil. Bu sorunu, x1, x2, silsilesini klterek ve
bylece aral daraltarak zebiliriz. Bir birine komu iki nokta, xi-1, xi, arasn ihtiyari bir
kk dx deeri kadar daraltrsak, Xin a ve b gibi iki nokta arasna dmesini adan
bye
integrali olarak veren
fonksiyonunu elde ederiz. Bu limit bir srekli
rasgele fonksiyonun olaslk younluk fonksiyonu olarak adlandrlr.
de
rs
no
tla
ri
.c
om
Tanm 5. Eer rasgele deiken X srekli bir dalma sahip ise, Xin olaslk younluk
fonksiyonu (p.d.f.) pozitif bir fx(x) fonksiyonu olarak tanmlanr yani A
gibi herhangi
bir aralk iin
ve
ee
iin P(X
iin
P(X = x) = 0
.c
om
Bu, ksmi olarak sezgilere aykr gibi grnebilir nk biz gerekte kesikli olan eyleri
(gelir, isizlik sresi gibi) tahmin etmek iin srekli dalm kullanyoruz. imdiye kadar,
hesapladmz herhangi bir olaslk iin herhangi bir srekli rasgele deiken rnei
grmedik.
3. rnekler
tla
ri
Bir rasgele deikenin, reel eksen zerindeki baz [a, b] aralklarnda yer aldn
varsayalm, Xin baz [a,b] (burada a a b b) alt gruplarna ait olma olasl, alt
araln uzunluu ile orantldr. .
Tanm 6. Eer aadaki gibi bir olaslk younluk fonksiyonuna sahip ise, X rasgele
deikeni [a, b], a < b, aralnda uniform dalr.
de
rs
no
fX(x) = {
ee
[a, b]
om
rnein, eer X
P(3 X 4) nedir? Olaslk P(X = 3) = 0 = P(X = 4) olduu iin, bu P(3 < X < 4)n
aynsdr.
.c
de
rs
no
tla
ri
fX(x) = {
ee
om
Konrad Menzel
24 ubat 2009
1. rnekler
ri
.c
Bir rasgele deikenin, reel eksen zerindeki baz [a, b] aralklarnda yer aldn
varsayalm, Xin baz [a,b] (burada a a b b) alt gruplarna ait olma olasl, alt
araln uzunluu ile orantldr. .
fX(x) = {
ee
de
rs
no
tla
Tanm 1. Eer aadaki gibi bir olaslk younluk fonksiyonuna sahip ise, X rasgele
deikeni [a, b], a < b, aralnda uniform dalr.
rnein, eer X
[a, b]
om
P(3 X 4) nedir? Olaslk P(X = 3) = 0 = P(X = 4) olduu iin, bu P(3 < X < 4)n
aynsdr.
ri
tla
.c
fX(x) = {
de
rs
no
ee
Esas itibariyle iki farkl sebepten tr birok gerek-dnya verisi baz deerler iin
nokta etrafnda ylma gsterir:
baz sonular mekanik olarak baz deerler ile snrlandrlmtr, bylece bir ok
olaslk yn rasgele deikenin geniliinin tam kelerinde birikir, rnein
gnlk ya miktar herhangi bir reel pozitif deer alr, fakat ya miktarnn sfr
olduu bir ok gn vardr.
om
.c
ri
rnek 2. zleyen grafik 1979 ylna ait Current Population Survey (CPS) verisi
kullanlarak oluturulmutur1.
ee
de
rs
no
tla
Yazar, grafik iin geliri ok dk bir alt grup semitir, bylece asgari cretin
snrlandrmasnn aksine rneklem nispeten daha byk olmutur. 1979 ylnn asgari
cret deerinin solunda kalan baz kiiler var. Bu, muhtemelen ksm olarak asgari cret
kanunu kapsam dnda kalan sektrleri yanstmaktadr (rnein, iftilik, gen iiler
gibi).
DiNardo, J., N. Fortin ve T. Lemieux. Labor Market Institutions and the Distribution of Wages, 19731992: A Semiparametric Approach. Econometrica 64, no. 5 (1996): 1001- 1044teki ekil 3b.
FX(x) = P(X
om
Tanm 2. Bir rasgele deiken Xin Birikimli Dalm Fonksiyonu (c.d.f.) FX her bir reel
say iin aadaki gibi tanmlanr.
x)
.c
Dikkat edilecek olursa, bu tanm kesikli, srekli ve kark rasgele deikenler iin
ayndr. zelikle, Xin kesikli olmasna olanak verdiimizden ve P(X
x)in P(X < x)
den farkl olduunu aklda tutmak kouluyla, ilintili olaylar birbirinden ayrt etmek nemli
olmaktadr. C.d.f.nin tanmnda, Xi her zaman xten kk veya eittir eklinde
kullanacaz.
ri
C.d.f. bir olaslk olduu iin, olaslk fonksiyonunun btn zeliklerini iinde barndrr.
zelikle,
Btn x
x1 olay X
iin 0
FX(x)
de
rs
no
tla
Fx(x2)
Eer x
ise, olasln gereklemesi bakmnda (X
x) olay imknsz olaya
yakn olur (burada bunun ne anlama geldii konusunda emin deilim), halbuki eer x
ise (X x) olay neredeyse kesindir ve bylece zelik 3 elde edilir.
zelik 3.
ee
olarak ve sa limiti de
de
rs
no
tla
ri
.c
om
rnek 3. Rasgele deiken Xin zar atma says ile ilikilendirildii, zar atma rneini
tekrar dnn. O durumda Xin c.d.f.si aadaki gibi verilir.
Ancak, reel analizlerin bir sonucu olarak, bir monoton fonksiyon (burada zelikle c.d.f
FX) sadece saylabilir sreksiz birok noktaya sahip olabilir.
ee
C.d.fnin daha fazla zeliini gsterebilmek iin imdi olaslkla ilgili bilgimizi
kullanabiliriz.
om
Ayn ekilde,
.c
tla
ri
de
rs
no
Bu son sonular srekli deikenler iin btn x deerleri iin zelikle (P(X = x) = 0
anlamna gelir.
rnek 4. Aadaki grafikte Gx(x) fonksiyonun bir c.d.f. olup olmadn kontrol edelim.
ee
om
de
rs
no
tla
ri
.c
rnek 5. P.d.f ve c.d.fyi bir birine balayan tek-doru formlmzn olduu srekli
rasgele deiken durumundan farkl olarak, kesikli durumda daha yeni tarttmz
c.d.fden elde edilen olaslk sonularn kullanmak zorundayz. imdi ilikiye baka bir
grafik rneiyle bakalm:
ee
Eer X p.d.f f(x)li ve F(x)li srekli bir dalma sahip ise (karklk olmad srece
bundan sonra X iin altsimgeyi kullanmayacam), o zaman
om
tla
ri
.c
de
rs
no
f(x) bir p.d.f. mi? -Dorusu, biz zaten temelde F(X)in bir c.d.f. olduunu gstermitik.
Aadaki ifadeleri hemen grebiliriz
btn x deerleri iin, f(x)
ve ayn zamanda,
ee
rnek 7. Eer X
om
.c
ri
tla
de
rs
no
ekil 5: X
Tek yumurta ikizlerin IQs - yani X ocuklardan birisinin, Y ise dierinin IQs
olabilir.
ee
Eitime katlm X ile gelir Y: Eitim ile gelirin dalmna ayr ayr bakabileceimiz
gibi, bir veri tabanndan elde edilen verileri kullanarak iki deikeni bir grafikte de
gsterebiliriz. Dorusu, grafikte iki deiken arasnda phesiz bir iliki varm
gibi grnyor.
om
.c
ri
Relaps (nks) sresi: Kanseri ameliyat ile yok etmek her zaman mmkn
olmad iin, tbbi prosedrlerin etkinliini deerlendirmek isteyebiliriz. Bunu (a)
yeni bir ameliyatn gerekli olduunun anlalmas iin ne kadar zaman getiine
(X) ve (b) ne kadar sre sonra hastann ldne (Y) bakarak yaparz. Her ne
kadar iki sonula ilgilensek de, her iki olay da bamszdr: eer yeni bir
ameliyattan nce hasta lrse, onun lmemesi durumunda ne zaman yeniden
ameliyat olmak zorunda kalacan gzlemleyemeyiz.
de
rs
no
tla
Dersin bu blmnde, iki (veya daha fazla) rasgele deikenin, aralarndaki iliki dahil,
ayn anda zeliklerini ele alacaz. Ayn zamanda bamszlk ve koullu olaslk
olaylar ile benzeen kavramlar da tantacaz. (X, Y) (ortaklaa) ayn deerleri (x, y)
alan iki rasgele deiken olsun. Her iki deiken srekli, kesikli veya kark olabilir.
ee
Eer {(x1, y2), , (xn, yn)} (X,Y)nin mmkn olan btn deerlerini ierirse, o zaman
iin,
tla
ri
.c
om
rnek 8. Bir spermarkette, X sradan bir kasa srasnda bulunan mterilerin says,
Yde ekspres kasada bulunan mterilerin says olsun. Bu durumda X ile Ynin ortak
p.d.fsi aadaki gibi grnebilir: Bu yapdaki bir tablo, (X, Y)nin birleik p.d.flerinden
elde edilen hcre-olaslklarn zetleyen ve marjinal olaslklarn yanda gsteren,
ihtimal tablosu olarak adlandrlr. Daha ncede tartld gibi, tablodaki olaslklarn
toplam 1 olmal ve nitekim yleler.
Tablo deerlerinden, iki deiken arasnda bir eit iliki varm gibi grndn
grebiliyoruz: Sradan kasada deme yapan kii says yksek olduu zaman, ekspres
kasadaki kii says da yksek olma eilimdedir.
ee
de
rs
no
Tabloda verilen p.d.f. lere dayanarak farkl olaylar iin de olaslklar hesaplayabiliriz:
om
Konrad Menzel
26 ubat 2009
ri
.c
tla
de
rs
no
iin fXY(x,y)
ve
Bylece,
ee
rnek 1. Wyoming zerinde rasgele bir yerde bir UFO grlr. Dnyann eimini
grmezlikten gelirsek, Wyoming gereki bir ekilde 276 x 375 millik bir dikdrtgen
olarak tarif edilebilir. UFOnun konumu btn eyalet zerinde uniform olarak dalmtr
ve rasgele boylam deeri X (111-104 derece aras) ve rasgele enlem deeri Y ( 41-45
aras) olarak ifade edilsin.
Bu, koordinatlarn birleik younluunun aadaki ifade ile verildii anlamna gelir.
om
Eer bir UFO 40 millik bir uzaklktan grlebilirse, eyaletin aa yukar tam ortasnda
yer alan Casperdan grlme olasl nedir?
de
rs
no
tla
ri
.c
imdi soruna grafik yardmyla ile bakalm: Casperdan UFOnun grlebilecei yerlerin
kmesi, Casper etrafnda 40 Mil yarapl bir daire ile ifade edilebilir. Ayn zamanda,
uniform younlua gre, UFOnun eyaletin A yerinden grlebilme olasl (yani A
zerinden sabit younluun integrali) Ann kaplad alan ile orantldr. Dolaysyla,
herhangi bir integral almak zorunda deiliz, nk olasl bulmak tamamen geometrik
bir uygulamaya indirgenebilir.
ee
)
(
Uniform dalm iin genellikle karmak integral almaya ihtiya duyulmadna dikkat
etmelisiniz, nk her eyi salt geometrik olarak ileyebilirsiniz.
om
Son rnektekinden farkl olarak, olaslklar elde etmek iin younluk fonksiyonun
integralini almann yolu yoktur, nk herhangi bir sabit olmayan younluk, olaslk
ylmas asndan farkl blgeleri yeniden arlklandrr. Bunu, ak ve sistematik bir
ekilde izleyen rnekte greceiz:
.c
de
rs
no
tla
ri
ee
Eer her iki buji alt srece im bime makinesi de alacaksa, im bime
makinesinin 1000 saat ierisinde bozulma olasl nedir?
om
.c
ri
de
rs
no
tla
ee
Sz konusu olaslk, birinci bujinin bozulmas halinde sadece ikinci bujinin kullanlmas
durumunda nedir? Yani P( X + Y
1000)i nasl hesaplarz? Bunun sadece
ilgilendiimiz olay deitirdiine dikkat ediniz, yani integralini hesapladmz 2 alan
deiti, halbuki hala ayn younluun integralini alyoruz.
om
.c
ri
tla
de
rs
no
ekil 4: im Bime Makinesi 1000 Saatten nce Bozulur Olaynn kinci Durumu
Tekrar etmek gerekirse, srekli iki-deikenli rasgele deikenler ile alakal olaylar
dzlemdeki alanlara tekabl eder. Ve bu alanlar zerinden younluun integralini alarak
olasl buluruz.
ee
iin, FXY(x,y)
om
de
rs
no
3. Marjinal p.d.f.ler
tla
Kesikli durumda,
ri
.c
Birleik c.d.f.ler p.d.fler ile aadaki ekilde ilikilidir: srekli rasgele deikenler iin
Eer birleik dalmlarmz varsa, tek deiken Xin dalmn yeniden elde etmek
isteyebiliriz. Eer X ve Y bileik p.d.f.si fXY olan kesikli rasgele deikenler ise, o zaman
Eer X ve Y srekli ise, esas itibariyle toplam integral ile deitirmemiz gerekir, bylece
ee
tla
ri
.c
om
lgin bir ekilde, her ne kadar marjinal dalmlar eit dalmsa da, birleik dalmlar
tablonun alt sol ve st sa kelerinde, birleik p.d.f.lerde daha dk deerler alarak
st sol ve alt sa kelerinde younlam gibi grnyor.
de
rs
no
rnek 4. Geen seferki iki bujili rneini hatrlaynz. Birleik p.d.f aadaki gibiydi:
ee
Benzer ekilde,
4. Bamszlk
Eer P(AB) = P(A)P(B) ise, A ve B olaylarnn bamsz olduunu sylemitik. imdi
benzer bir kavram rasgele deikenler iin tanmlayacaz.
om
B tr olaylara
.c
Bu tanm kendi bana pratik deildir nk kontrol etmek zordur, ancak eer X ile Y
bamsz ise, tanmdan hareketle u ifadeyi elde ederiz:
ri
Buradan, genellikle dorulanmas daha kolay olan aadaki koulu elde edebiliriz.
tla
de
rs
no
o zaman
Bunun aksine, eer marjinal p.d.f.lerin arpm birleik p.d.flere eit ise,
integralini alrz
ee
Dolaysyla marjinal zerindeki koul bamszl salar ve eitliin her iki ynn de
ispatlam oluruz.
rnek 5. Evlilik D ilikiler rneine geri dnecek olursak, evlilik kalitesi X ile yllar
itibariyle evlilik sresi Ynin marjinal p.d.f.lerini rapor ettiimizi hatrlaynz, yani
om
ve
.c
Eer iki rasgele deiken gerekten de bamsz ise birleik dalm nasl grnmelidir?
Burada unu elde ederiz.
de
rs
no
tla
ri
Birleik p.d.f.nin o noktadaki gerek deeri 13.48di ve aka grld gibi iki
deiken bamsz deildir. imdi bamszlk varsaym altnda tablonun geri kalann
doldurabiliriz: Bunu son tablomuzla karlatrnca baz sistematik elikiler olduunu
grebiliriz, zelikle oluturulan birleik p.d.f.
belirgin bir ekilde diyagonalde
younlamamaktadrlar, halbuki bu gerek birleik p.d.f.lerin zerinde durmaya deer
zelliiydi.
Fakat gerekten bu X ile Ynin bamsz olmad anlamna m gelir? Dikkat edilmesi
gereken bir husus, olaslklar, belirtilen dalmdan ekilen rneklemden edindiimiz
birleik p.d.flerden hesapladk, bu nedenle gerek hcre olaslklarn doru bir ekilde
lebilme konusunda baz belirsizlikler var. Dersin son blmnde, oluturulan ve
gerek p.d.f.ler arasndaki farkn X ile Ynin bamsz olmadn gsterecek kadar
byk olup olmadn formal olarak neren bir yntem greceiz.
ee
rnek 6. Daha nceki iki bujili rneini hatrlaynz. Birleik p.d.f. aadaki gibiydi
om
ri
.c
tla
o zaman X ile Y bamszdr. Burada g(.) sadece xe ve h(.) sadece yye baldr.
zelikle belirtmek gerekirse, marjinal younluklar dorudan hesaplamak zorunda
deiliz.
de
rs
no
O zaman, rnein g(x) = ce-x ve h(y) = e-2y dir diyebiliriz. Her ne kadar bunlar uygun
younluklar deilse de, X ile Ynin bamsz olduunu gstermek iin yeterlidir.
rnek 8. Varsayalm ki aadaki gibi bir birleik p.d.f.miz var.
ee
Her iki durumda (yani x2 y 1 salanr m yoksa salanmaz m?) p.d.f. x ve ynin
fonksiyonlarna ayrtrlrsa (faktr, N) (sfr blm iin doruluu phelidir) bile, Xin
desteinin Yye baml olduunu grebiliriz ve dolaysyla X ve Y bamsz olamazrnein eer X 1/2 ise, Y 1/4 olmak zorundadr. Bylece
ee
de
rs
no
tla
ri
.c
om
X ve Ynin bamsz olabilmesi iin iki rasgele deikenin bileik desteinin dikdrtgen
(byk ihtimalle btn 2) olmak zorunda olduuna dikkat ediniz. Eer deilse,
gerekleen baz X deerleri iin, belli Y deerleri gerekleebilecekken,
gerekleemez. Fakat eer doruysa, yani Xin Y hakknda bilgi verdiini bilirsek, o
zaman onlar bamsz olamaz. Destek iin bu koul tek bana bamszl salar.
om
Konrad Menzel
3 Mart 2009
.c
1. Koullu p.d.f.ler
de
rs
no
tla
ri
Bu, sadece iki hafta nce tanmlanan ve Y = y verilmiken X = x durumuyla ilintili olayn
koullu olaslyla ilintisidir.
Unutmamak gerekir ki,
Koullu deikenin belirli bir deeri iin, koullu p.d.f normal p.d.f.nin btn
zeliklerini tar(yani pozitiftir, integrali 1dir gibi),
Tanm her iki taraftan herhangi bir saydaki rasgele deikene genelletirilebilir.
ee
om
tla
ri
.c
X = 1, 2, 3, deerleri iin koullu c.d.f.lerini beraber bir tabloya koyarsak, unu elde
ederiz.
de
rs
no
ee
Yksek deerli iliki says Z veriyken, Xin koullu p.d.f. leri dk deerli evlilik
tatminine daha yksek olaslk vermektedir. Bylece rakamlar, evlilik-d ilikinin
evlilie zarar verdii eklinde de okuyabilirdik. Bu genellikle ters nedensellik olarak
atfedilir: Ann Bye neden olduuna inansak bile, B ayn zamanda Aya neden olabilir.
om
Dolaysyla, koullu olaslk her iki hikyeyle tutarl olacak ekilde hareket etse bile,
ilikiyi iki ynl nedensellik olarak yorumlayamayz, nk her iki hikaye de eit
derecede kabul edilebilirdir ve varsaymsal olarak gerek yaamda her ikisinde de
gereklik pay vardr.
2. Tekrar
.c
ri
1. Olaslk
Bunu tartmayacaz.
Olasln tanm
S iin P(A)
de
rs
no
(P1) btn A
tla
(P2) P(S) = 1
P(A) =
ee
Olasln Hesaplanmas
Sorunlara u sraya gre yklenin
om
(ii) basit olaslklar iin, her bir sonucun olumasn eit derecede mmkn
klacak ekilde bir rnek uzay tanmladnzdan emin olunuz,
.c
ri
de
rs
no
tla
= N):
3. k
yerine
( ) =
koymadan
ekilir,
sralama
nemsizdir
ee
(kombinasyon):
sayda ihtimal
.c
om
Toplam olaslk kanunu koullu olasl marjinal olasla balar, yani P(A)nn nasl
P(A|B1) P(A|Bn)ye balanaca gibi. Klasik uygulama: alt-nfus/alt-vaka zerinden
toplulatrma, rnein farkl baypas ameliyatlarna gre lm oranlar gibi.
ri
Bayes teorisi bize koullama srasnn nasl deitirileceini syler, yani nasl
P(B|A)dan P(A|B)ye gidilir gibi. Klasik uygulama: B verisi verildiinde A ile ilgili inancn
gncellenmesi gibi, rnein tbbi testler rnei gibi.
tla
de
rs
no
ee
Kesikli bir rasgele deiken iin nemli bir rnek olarak, ardk N bamsz
denemedeki X sayda baar y aklayan Binom dalm iin biraz zaman harcadk.
Her denemedeki baarnn olasl pye eittir. Binom dalm iin p.d.f. aadaki
gibiydi (bunu snav iin bilmelisiniz):
om
de
rs
no
tla
ri
.c
eer X srekliyse
btn x
iin 0 FX(x) 1,
Fx(x) xte azalan deildir
Fx(x) sadan sreklidir
Fx(x) her yerde sreklidir, Sadece ve sadece X srekliyse.
Birleik Dalm
ee
Aadakiler bakmtk
3. Rasgele Problemler
.c
ri
om
de
rs
no
tla
rnek 2 (Bahar 2003 Snav). Bir Monet uzmanna szde kaybolan bir Monet resmi
verilir. Resmin orijinal olma olaslklarn deerlendirmesi istenir. Uzman aadaki
bilgiye sahiptir:
Bu resmin orijinal olma olasl nedir? Soruyu cevaplandrmak iin herhangi bir ilave
varsaymda bulunmak zorunda myz?
ee
om
.c
ve
tla
ri
Bayes teoremini uygulamak iin neye ihtiyacmz var? Teorem bize unu syler:
Ancak, her rengin marjinal olasl biliniyor, bize birleik olaslk gereklidir (hem G
koullu hem de koulsuz)
de
rs
no
ve
ee
Bu varsaymn ne derece nemli olduunu grmek iin, farkl pigment trleri arasnda
farkl bir baml yap kefedin: varsayalm ki orijinal Monet iin her sienna S kullanlan
resimde, ayn zamanda kesin olarak ham toprak rengi U da kullanlmaktadr. O zaman,
koullu olaslk tanmna gre unu elde ederiz:
Bylece gerek bir Monet iin, sienna Syi bulmak imknszdr fakat ham toprak rengi U
deil, bu nedenle kesinlikle biliyoruz ki sz konusu resim Monet olamaz ( resmimiz bu
kombinasyona sahip olduundan, genel olarak bulunan btn resimler iin yle olmak
zorundadr).
om
Toparlayacak olursak, bu problem bize soruyu cevaplandrmak iin yeterli bilgi vermedi.
.c
rnek 3(Gz 2003 Snav). Benim evimde geri dnm 10 a.m. ile le saati arasnda
bir ara toplanr. pn topland aralkta herhangi bir dakika herhangi bir dieri kadar
olasdr. p ise saat 8:30 a.m. ile 11.00 a.m. arasnda bir ara toplanr ve yine
tekrarlamak gerekirse herhangi bir an herhangi dier bir an kadar olasdr. ki toplama
zaman birbirinden bamszdr.
ri
tla
de
rs
no
ee
om
sralama, rnein Z5, B7, B2, B5, Z4, B9, , ise, o zaman birinci snfta karatahta
olmayacak, tahta 7, 2, ve 5 2nci snfa gider, v.b.
o dizinin farkl saydaki sralamas (N + (k - 1)! kadardr.
o karatahtalar ve ayrtrclar eit olduu iin (snflar deil), her bir karatahtann
permtasyonu (N! permtasyon) ve ayrtrcs (k - 1)! permtasyon) ile blmek
zorundayz.
ee
de
rs
no
tla
ri
.c
Btn paralar bir araya getirince aadaki gibi btn olas yerletirmeleri elde
ederiz.
om
Konrad Menzel
.c
10 Mart 2009
ri
de
rs
no
ve u :
elemedir:
tla
ee
imdi dntrlm rasgele deiken u(X) iin younluk ve c.d.fyi nasl elde
edeceimizi bilmek istiyoruz, bylece p.d.f. si bilinen bir rasgele deikenin sadece
kendisini ieren bir soruda olduu gibi, bir rasgele deikenin fonksiyonunu da ieren
her bir problemi ele alabilelim.
durumu dneceiz
1. lgili deiken kesiklidir
2. lgili deiken sreklidir
3. X sreklidir ve u(X) kesin artandr
Son durum elbette ikincinin zel durumudur, fakat greceimiz gibi allmas en
kolay olandr.
om
.c
Eer X p.d.f.si fX(x) olan bir kesikli rasgele deiken ise ve u(.) deterministtik bir
fonksiyon iken Y = u(X) ise,
de
rs
no
tla
ri
rnek 3.
Eer X p.d.f.si fX(x) olan bir srekli rasgele deiken, ve Y = u(X) ise, o zaman Ynin
c.d.f.si aadaki ifade ile verilir:
ee
rnek 4. Xten kk en byk tamsay Y = [X], Xin srekli veya kesikli olup
olmamasna bal olmadan, kesiklidir.
om
rnek 5.
.c
Y = X2
de
rs
no
Toparlarsak,
tla
ri
ee
om
Genel olarak Ynin younluunu, zelikle bir integral ve bir trev ierdii iin, c.d.fler
araclyla Xin fx(x) younluundan elde etmek uygun deildir. Bu durumda, p.d.f.ler
arasnda daha direkt bir balant olup olmad merak edilebilir.
ri
.c
Daha genel duruma gemeden nce, varsayalm ki baz sabit deerler a > 0 iin u(x) =
axtir. O zaman Y = u(X) = aXin c.d.f si aadaki ile elde edilir.
tla
de
rs
no
Bunun iin en iyi sezgisel deerlendirme nedir? Eer a > 1 ise, dnm, rasgele
deikenin zerine dt ekseni germe olarak dnebiliriz. Bu durum, eksen
zerindeki herhangi bir iki noktaya ann arpm kadar yer deitirtir, fakat deikenin iki
nokta arasna dme olasln sabit tutar. Dolaysyla, Xin dalm ile
karlatrldnda Ynin dalm 1/a arpm kadar seyreklemi olur. Bunu iinde bir
miktar zm olan hamur ile hayal edebiliriz. Hamuru ne kadara yayarsak, hamur
iindeki zmlerin hamur tahtasnn yzeyine gre dalm o kadar seyrek olacaktr.
Xin u(.)sunun trevlenebilir monoton dnm iin aadaki sonucu elde ederiz.
nerme 1. X fX(x) younluu bilinen rasgele srekli bir deiken olsun, ayrca P(a
X
b) = 1 ve Y = u(X)dir. Eer u(.) |a,b| gibi bir aralkta kesin artan ve trevlenebilir ise
ters yer deiim s(y) = u-1(y)ye sahipse, o zaman Tnin younluu aadaki ifade ile
verilir.
ee
Benzer sonucun, u(x)in |a, b|de kesin azalan olma durumunda da doru olduuna
dikkat ediniz.
rnek 6. X [0, 1] aralnda uniform, bylece p.d.f.si de aadaki gibi olsun
om
.c
Y = X2nin p.d.f.si nedir? Xi desteklemek iin, u(x) = x2nin kesin artan ve trevlenebilir
olduunu dnyoruz ve bylece Ynin p.d.f.sini elde etmek iin u(.)nun tersi olan s(y)
= yi kullanarak aadaki ilikiyi elde ederiz.
ri
Bu, yukarda yaptmz bir rnee benzemektedir. ncekinden farkl olarak, Xin
destei [-1, 1] idi ve bylece u(x) = x2 Xi desteklemek iin monoton deildi.
tla
de
rs
no
Srekli rasgele deikenler iin, ilgin- ayn zamanda ok yararl- bir sonu vardr:
aadaki manada c.d.fnin c.d.f.si uniform bir deikendir:
nerme 2. X, c.d.f.si Fx(X) olan srekli bir rasgele deiken olsun. O zaman, c.d.f. Xin
rasgele ekiliiyle llrken, Fx(X) uniform dalmldr. Yani
Rasgele bir deikenin fonksiyonun kendisinin de rasgele bir deiken olduuna dikkat
ediniz (bunu daha sonra detayl bir ekilde tartacaz).
ee
SPAT: C.d.f. sadece sfr ile 1 arasnda deerler ald iin, F(X)in c.d.f.si olan G(.)nin
hali hazrda u koular saladn grebiliyoruz:
Genelletirmeyi ortadan kaldrmadan (sadece birka ilgin olmayan ekstra tanm veya
durum farkllndan kanarak), varsayalm ki F(.) kesin monotondur- unutmayn ki
btn c.d.f.ler azalmayandr. Bunun anlam, F-1(.) gibi ters bir fonksiyonun olduudur,
yani , F-1(F(x)) = x gibi bir fonksiyondur.
om
.c
ri
x
1 iin rasgele
tla
de
rs
no
Bunun, [0, 1] aralnda uniform rasgele bir deikenin c.d.f.si olduunu da kolaylkla
kontrol edebiliriz, bylece F(X) U[0, 1] ile ayn olaslk dalmna sahiptir.
Bu sonu ne ie yarar? Bir rnek olmas bakmndan, bilgisayar ile uniform rasgele
rakamlar elde etmenin ok etkin yollar vardr. C.d.f.si FX(.) olan bir rasgele
deikenden n ekilili bir rneklem elde etmek istiyorsanz, unlar yapabilirsiniz:
ee
Daha nceki argmanmza gre, X1, ..Xn c.d.f. si FX(.) olan bir rasgele deiken gibi
davranr. Bu yntem integral (ya da quantile) dntrme olarak bilinir.
om
rnek 7. Uniform dalmndan bir rasgele deiken Uyu ekmemize izin veren bir
bilgisayar programmzn olduunu varsayalm, fakat biz gerekte rasgele ekilen ve
p.d.f.si aadaki gibi olan bir X elde etmek istiyoruz
ri
tla
.c
de
rs
no
Eer bunu bir istatistik yazlm veya Excel kullanarak denersek, ekiliin histogram
yle grnecektir:
ee
Eer Excelde kendi banza birka rnek denemek istiyorsanz, RAND() fonksiyonunu
kullanarak birka uniform rasgele ekili yaratabilirsiniz. Sonra, menlere tklayarak
histogram oluturabilirsiniz( Aralar> Veri Analizi > Analiz aralar > Histogram)
12 Mart 2009
ri
.c
om
Konrad Menzel
tla
de
rs
no
ile verilir.
Eer X1, ,Xn srekli ise, onlarn birleik p.d.f.si pozitif bir fonksiyondur,
n
f X1, ,Xn(x1, ,xn), bu nedenle herhangi bir D
iin
ee
imdi yukarda tartlan tek deikenli durumdan nasl 2 veya daha fazla boyuta
geneleme yapacamza bakalm.
Tek boyutlu durumda olduu gibi yine durumu ayrt edeceiz:
1. lgili deiken X1, ,Xn kesiklidir
2. lgili deiken X1, ,Xn sreklidir
3. X sreklidir ve u(X1, ,Xn) n-boyutlu bire-bir bir fonksiyondur.
om
Varsayalm ki X1, , Xn birleik younluu p.d.f. f X1, ,Xn(x1, ,xn) ile kesiklidir ve Y1,
,Ym m tane fonksiyon ile veriliyor
.c
Ayn zamanda,
tla
ri
de
rs
no
ee
om
pz(1 p)n -z terimi kye bal deildir, bu nedenle onu toplamdan ekebiliriz. Dier
taraftan, aadakini iddia ediyorum,
B(m + n, p).
de
rs
no
Bylece gerekten Z
tla
ri
.c
Gerekten de,
sayma kuraln kullanarak bunu gsterebiliriz: arpm kural ve
kombinasyon forml ile, ( )( ) terimi m sayl bir gruptan ekilen k eleman ieren bir
kme ile n sayl baka bir gruptan ekilen z-k eleman ieren farkl kme saysna
karlk gelir. Btn k deerleri zerinden toplayarak, birletirilmi iki kmeden (yani, m
+ n elemanl bir kme) bir z kmesinin elemanlarn ekmenin toplam yollarnn saysn
elde ederiz. Kombinasyon formlne gre bu kme (
)ye eittir, bu da ispatlamaya
altmz eitliin sa tarafdr
Bir tedbir notu olarak, genel olarak ayn dalm ailesinden bu durumda binom gelen
iki bamsz rasgele deiken X ile Ynin toplam olan Z ayn aileye ait olmayacaktr. Bu
balamda, binom dalm ok zel bir durumdur ve ayn zelie sahip sadece birka
tane daha yaygn olarak kullanlan dalm vardr. rnein, Eer X
B(m, pX) iken Y
B(m, pY) ve pX pY ise, yukarda elde edilenler hibir ie yaramayacaktr.
Varsayalm ki X1, , Xn birleik younluu yani f X1, ,Xn(x1, ,xn) p.d.f.si ile sreklidir
ve Y (kavram basit tutmak iin sadece bir deiken kullanalm) aadaki fonksiyon ile
verilmektedir.
ee
Eer
om
Bu da yine sadece srekli deikenler ile alan zel bir durumdur: A X 1, ,Xnnin
destekleyeni olsun, yani
.c
tla
ri
Varsayalm ki Y1, ,Yn trevlenebilir bire-bir dnmnden elde edilen X1, ,Xnden
elde edilsin,
de
rs
no
Yani (x1, , xn) Ann her deeri (y1, , yn) Bnin birer elamanyla elemektedir. Bu
durumda [s1(x1, , xn), , sn(x1, , xn)]nin tersini tanmlayabiliriz, bylece
ee
Ksm trevin bu matrisi ayn zamanda Jacobiann ters dnm olarak adlandrlr.
Dorusal Cebiri almayanlarn, 2ye 2 durumlarn almalar yeterlidir. kiye iki
durumlarnda Matris Ann determinantnn aadaki gibi hesaplandn bilmeniz
gerekiyor:
om
nerme 1. X1, , Xn yukarda vurguland gibi Y1, , Yn ile elemesi bire-bir ve tersi
olan s1(.), , sn(.) trevlenebilir ise, o zaman Y1, , Ynnin birleik p.d.f.si aadaki ile
verilir.
de
rs
no
tla
ve
ri
.c
Burada us rasgele bir deikendir (diyelim ki Floridadaki gneli saatler gibi). Tketiciler
baka bir tesadfi ok ud veriyken (diyelim ki gelir) miktar qdyi talep ederler.
qd = d - dp + ud
ee
Denge durumunda, arz talebe eittir, yani fiyatlar yledir ki qs = qd = qdir ve fiyatlar ile
miktarlar beraber aadaki iliki tarafndan belirlenir.
om
Fiyat ve miktarlarn birleik dalmn elde edeceimiz oklarn (ud, us) birleik p.d.f.si
fU(us, ud)yi biliyor olabiliriz ya da varsayabiliriz. Bu birleik p.d.f. kesin ekilde
Jacobiana (sol taraftaki matris) bal olacaktr. Bu durumda det(J) = d + sdir, bu
nedenle eer arz veya talep nemli (nontrivial) bir eime sahip ise, oklardan fiyata ve
miktara dnm bire-birdir ve sonuta ortaya kan birleik p.d.f. aadaki gibidir:
ri
.c
tla
de
rs
no
rnek 3. Bunun gibi bir rnei snfta yaptmz hatrlaynz: im bime makinesindeki
iki bujini mrne bakmtk, ve P(X + Y z) olasl {(x, y) : y z x} ile tanmlanm
gen zerinden fXY(x, y) birleik younluun integrali olduu ortaya kmt. Bu
durumda Znin c.d.f.si aadaki gibidir:
ee
om
ri
tla
Bundan tr,
.c
Bu durumda
de
rs
no
Birleik p.d.f.yi w zerinden integralini alarak Znin marjinal p.d.f.sini elde edebiliriz
artk.
rnek 5. imdiye kadar stel dalmn birka rneini grdk (im bime makinesi
rneindeki gibi). X ve Y bamsz stel rasgele deikenlerdir ve marjinal p.d.f.leri
yle olsun:
ee
ee
de
rs
no
tla
ri
.c
om
Burada, ikinci admdaki integralin limiti X ve Ynin desteinin pozitif reel saylar ile snrl
olmas gereinden gelmektedir. Yani z < 0 iin fX(z) sfrdr, halbuki z > w iin fY(z - w)
sfr olur.
om
Konrad Menzel
12 Mart 2009
tla
ri
.c
de
rs
no
ee
Jacobian
[ ]=[
.c
de
rs
no
tla
ri
om
det (J)
ve
ee
ri
tla
de
rs
no
ee
om
.c
om
Konrad Menzel
17 Mart 2009
.c
1. Sra statistikleri
tla
ri
X1, , Xn p.d.f.leri fx1(x) = = fxn(x) benzer olan bamsz rasgele deikenler olsun
genellikle byle bir sral ifadeyi bamsz ve ayn(benzer) dalml olarak adlandrrz
ve i.i.d. olarak ksaltrz. Aadaki fonksiyon ile ilgileniyoruz.
de
rs
no
ee
rnek 1. Eski bir resim bir ak arttrmada satlr. n kii ak artrmada bamsz olarak
B1,, Bn tekliflerini sunarlar ve tekliflerin marjinal c.d.f.si FB(b)dir. En yksek teklifi
veren potansiyel alc resmi alacak olan kiidir ve teklif miktarn demek zorundadr (bu
tr ak artrmalar Dutch, ya da birinci fiyat ak artrmas olarak bilinir). Bu durumda
resim satcsnn haslasnn p.d.f.si aadaki ile verilir:
om
Bu rasgele deiken X1, , Xnnin (n-1)nci sral istatistii olarak adlandrlr ve onun
p.d.f.sini belirleyebiliriz.
.c
nerme 1. X1, , Xn p.d.f.si fX(f) ve c.d.f.si FX(x) bir i.i.d. rasgele deikenler silsilesi
olsun. Bu durumda knci sral istatistik Yknn p.d.f.si yledir:
ri
SPAT: Deneyi iki blme ayrabiliriz, (a) Xlerden biri younluk fX(y)e gre y deerini
almak zorunda olsun, ve (b) y deeri veriyken, dier ekililer dizisi ynin etrafnda y
rneklemin en kk knci deer olacak ekilde gruplandrlsn.
de
rs
no
tla
Blm (b) n deneyin X1, , Xnin n ekiliine karlk gelen bir binom deneydir ve inci
turdaki baar olay (X1
y) olarak tanmlanr. ekililer bamsz ve ayn p.d.f. ile
ilintili olduklar iin, binom dalmdaki p parametresi FX(y)e eittir. ynin daha kk
olmas veya en kk knci deere eit olmas binom dalmdaki en az k kadar baar
ile ilgilidir ve bu nedenle ilgili c.d.f aadaki gibidir.
imdi c.d.f.nin yye gre trevini arpm ve zincir kural ile alarak p.d.f.yi elde edebiliriz.
ee
Bu ifade karmak grnyor, fakat bunun esasnda teleskopik bir toplam olduu
anlalabilir, bunda tr toplaml terimlerin (summand) ou decektir. kinci terimdeki
l = n ile ilgili toplam deerin sfr olduuna dikkat ediniz. Onu yeniden yazabiliriz
burada mevcut l endeksi l-1 ile yer deitirmitir. Birinci terim iin aadaki sz
konusudur:
om
tla
ri
.c
de
rs
no
rnek 2. Alcnn en yksek fiyat teklifini verip resmi ald birinci ak artrmadan farkl
bir ak artrmay imdi dnebiliriz. Buna gre en yksek fiyat teklif eden yine resmi
alr ancak bu durumda ikinci en byk fiyat teklifi kadar demek yapmak zorundadr (bu
ak artrma ekli ilkine gre daha yaygndr ve ngiliz yada ikinci-fiyat ak artrmas
olarak bilinir). Eer teklif edilen fiyat rasgele deikenler, C1, , Cn, ise, satcnn geliri
Y imdi aadaki p.d.f.ye sahiptir.
Ayn fiyat teklifini veren kiinin iki farkl ak artrma formatna farkl fiyat teklifi vermesi
gerektiini ekonomi teorisinden bildiimiz iin, fiyat teklifleri iin farkl harf kullandma
dikkat ediniz.
ee
om
tla
ri
.c
Sezgisel olarak, uniform dalm sanki rakamlar ve birimleri hakknda ok fazla bilgi
iermedii iin, ilk tahminimiz, ilk basaman uniform (kesikli) dalml olmas olabilir.
Ancak, eer uniform dalm alrsak ve birimleri deitirirsek (rnein varsaylan
dalmda btn rakamlar ikiye ve drde katlarsak), birinci basamaklarn dalm
uniform olarak kalmaz. rnein, eer gerek rakamlar X U[1, 10] , 4X U[0, 40] ise,
4Xin birinci basama Y aadaki p.d.f.ye sahiptir.
de
rs
no
Ya da, grld gibi, birinci basamaklarn dalm hakknda minimal dzeyde gerekli
olan bilgi, lm birimini deitirdiimizde dalmn deiemeyeceidir.
Gerekte aradmz, lek deiimine bal olarak dalm deimeyen bir rasgele
deiken Xtir, yani a > X iin aX. Eer Z = log(X) U[log(1), log(10)] varsayarsak bu
dorudur, nk bir lek kaymas iin aadaki elde edilir:
ee
om
.c
ri
tla
ee
de
rs
no
Bu deimeyen fikir bir dalm elde etmenin ok yapay bir yolu gibi grnebilir, nk
dalmn X lm veya lme birimi ile ok belirgin bir ba yoktur. Ancak, ortaya
kan p.d.f. kategoriye den gerek-dnya verisi hakknda ok iyi bir tahmin veriyor
gibi grnyor. rnein New York Timesta grnen rakamlarn bir eyi lmesini temsil
etmeleri gibi. Aadaki ekil, Economistin Rakamlarla Dnya 2007 cep kitabnda yer
alan 77 lkenin ulusal para birimi cinsinden (Japonya iin Yen, Kanada iin C$ gibi)
GSYHlarn birinci basamaklarnn histogram ile beraber teorik younluklarn
gstermektedir. zetleyecek olursak, bu rnek verilen iki rasgele deikenin dalmn
belirlemede deiik radikal bir yaklam ortaya koymaktadr: burada X ile Ynin
p.d.f.lerini bilmeden baladk, fakat her nasl bir dalm ortaya kacaksa, birim
deiikliklerinden etkilenmemek zorunda olduunu belirttik, yani Ynin gereklemesi
gibi. Deimeyen (invariance) illeri istatistikte ok nemli yeri olan bir kavramdr, fakat
bu dersin amac nedeniyle, bu rnekten teye gitmeyeceiz.
om
.c
ri
tla
de
rs
no
P.d.f.si fx(x) olan bir rasgele deiken X verilmiken, tm younluk dalmn vermek
zorunda kalmadan tm dalmn en nemli zeliklerini zetlemek istiyoruz. Beklenen
deer esas itibariyle bize Xin dalmnn nerede merkezlendiini syler.
3.1 Tanmlar
Tanm 1. Eer X kesikli rasgele bir deiken ise, toplam sonluysa, Xin E|X| ile belirtilen
beklenen deeri aadaki gibidir.
ee
Eer X srekli ise, integrali sonluysa, beklenen deer aadaki gibi tanmlanr
om
.c
ri
tla
burada ikinci srada, x = 0 ile ilintili toplam deeri grmezlikten gelebiliriz nk sfra
eittir. nc srada nyi binom katsaysndan attk ve izleyen admda, toplam
endeksini xten x-1e dntrdk. Sonu olarak, eer npyi ekersek, toplamlar
B(n-1, p)in binom olaslklar olur ve bu nedenle toplamlar birdir.
de
rs
no
Sonsuz sayda deer alabilen bir rasgele deikenin sonlu bir beklenen deere sahip
olamayabileceine dikkat ediniz. Bu durumda beklenen deer tanmlanmamtr. Her ne
kadar beklenen deer dalmn konumu hakknda bilgi verse de, genel olarak onun
rasgele bir deiken iin tipik bir deer olmadna da dikkat ediniz: rnein zar
atmann beklenen deeri (1+2+3+4+5+6) =
deildir.
Eer rasgele deiken Xin dalm m(X) etrafnda simetrik ise Xin medyan ve
beklenen deeri akr, yani fx(m(X) x) = fx(m(X) + x)dir, fakat bu durum genelde ayn
deildir.
ee
om
ri
.c
tla
de
rs
no
rnek 5. X adil bir zarn atlarnn sonucu olsun. Herhangi bir say iin m (3, 4], P(X
< m) = P(X 3) = 1/2dir. Dolaysyla, o aralktaki herhangi bir say medyandr.
E|Y| = aE|X| + b
ee
SPAT: Sadece srekli duruma bakalm: Eer X p.d.f.si fX(x) olan bir srekli rasgele
deiken ise, o zaman Ynin beklenen deeri yledir:
integralin
dorusall
zelik 3.
iin
dorudan
beklenen
deerin
om
ri
.c
rnek 6. Yukarda, X
B(n, p)nin beklenen deerini, [X] = np, Xin olas btn
sonularnn zerinden toplam yaparak hesapladk. Fakat son sonutan, ayn sonucu
elde etmenin baka daha kolay bir yolu olduunu grebiliriz: X ardk n denemenin
baar sonucu olduu iin, her bir deneyin sonucunu Z1, Z2, , Zn olarak kodlayabiliriz.
Burada eer inci deney baar ise Zi = 1dir, dier durumlarda Zi = 0dr.
de
rs
no
tla
ve dolaysyla
Y = r(X) olsun. Geen hafta, eer f x(x)i biliyorsak, Ynin p.d.f.sini nasl tretebileceimizi
grmtk. Beklenen deer iin bu sorun daha kolaydr nk biz dalmn sadece bir
tek zeliine bakyoruz.
ee
om
de
rs
no
tla
O zaman
ri
.c
ee
om
.c
ri
tla
de
rs
no
nerme 2 (Jensenin Eitsizlii). X rasgele bir deiken ve u(x) konveks bir fonksiyon
olsun. O zaman,
Eer u(.) kesin konvex ve X pozitif olaslkla en az iki farkl deer alr ise eitsizlik
kesindir(strict).
SPAT: ( [X], u( [X])) noktasndan geen ve u(x)e teet bir dorusal fonksiyon
tanmlayabiliriz:
ee
u(.) konveks olduu iin, btn xler iin aadaki ilikiyi elde ederiz:
zellikle,
om
r(x) dorusal olarak oluturulduu iin, a = u( [X]) ve b = u( [X]) u( [X]) [X]li dorusal
fonksiyonun beklenen deeri ile ilgili zellik 2yi, aadakini elde etmek iin
kullanabiliriz.
Bunu daha nce tretilen eitsizlikle bir araya getirecek olursak ispat tamamlanm olur:
de
rs
no
tla
ri
.c
Bir konkav fonksiyon v(x)in negatifi v(x) konveks olduundan, Jensenin Eitsizlii de
bir konkav v(.) iin aadakini salar:
ee
rnek 9 (riskten kanma): Varsayalm ki ilk senesi iin snrl garantiyle gelen 1200
dolarlk bir dizst bilgisayar aldnz. O ilk yl sresince, p = %10 olaslkla bir bardak
kahveyi dizst bilgisayarn zerine dkme (ya da sizin hatanz olan baka bir kaza) ve
1100 dolara mal olacak anakart deitirme ihtimaliniz var. Bu tamirat snrl garanti
kapsamna girmez ama siz 115 dolara uzatlm bir garanti (servis) alabilirsiniz. Bu ilave
sigortay almal msnz?
lave sigorta olmadan, 1-p olaslkla, dizst bilgisayarn toplam maliyetini rasgele bir
deiken olarak X = 120 dolar, p olaslkla, X = 1200 + 1100 = 2300 dolar olacak gibi
dnebiliriz (bu problemi farkl ekillerde oluturmak mmkndr, ancak imdilik her
eyi basit tutalm). Uzatlm servis planyla dizst bilgisayarnz size X = 1200 + 115 =
1315 dolara mal olacaktr.
ri
.c
om
Eer siz sadece dizst bilgisayarn beklenen deeriyle ilgileniyorsanz, o zaman [X]) =
2300p + 1200(1 p) = 1200 + 1100p. Bu, eer p
%10.45 ise, [Y]) = 1315ten daha
byktr. Fakat p = %10 dediimiz iin, uzatlm servis plann satn almak hala iyi bir
fikir midir? - ktisatlar, insanlarn belirsizlik durumunda karar aldklar zaman,
beklenen harcama miktar Wyla pek ilgilenmediklerini varsayarlar, ama harcadklar
dolardan elde edecekleri fayda (toplam harcama miktarnda ilave bir dolarlk artn ilave
deeri olduu iin) u(W) miktaryla ilgilenirler. Bu U(.)nun maliyette konkav olduunu
varsaydmz anlamna gelir, diyelim ki
de
rs
no
tla
Gerekten de, siz 4800 3481 = 119 dolar sigorta iin harcamak isteyeceksiniz,
hlbuki beklenen ilave maliyet sadece 1100p = 110 dolardr. Sigorta iin demek
istediimiz bu 9 dolarlk farka u(.)nun konkav olmasnda gelen risk-primi denilir.
Jensenin Eitsizlii ne gre, eer u(.) konkav ise bu risk-primi pozitiftir ve bu tr
tercihlerin riskten kanma gstergesi oluunu syleyebiliriz.
rnek 10. zleyen rnek St. Petersburg Paradoksu olarak bilinir ve sonlu beklenen
deeri olmayan rasgele bir deiken rneini verir.
ee
Bize aadaki bir kumar nerilir: Varsayalm ki adil bir madeni para tura gelinceye
kadar tekrar tekrar atlr. lk atta tura gelirse 2 dolar, 2ncide gelirse 22 dolar ve genel
olarak xnci seferde grnrse 2x dolar kazanacaksnz.
Bu oyunu oynamak iin ne kadar derdiniz? Prensip olarak, beklenen kazancnz kadar
vermek niyetinde olursunuz, bu nedenle imdi hesaplamalar yapalm: gerek duyulan
tam x atn olasl aadakine eittir:
.c
om
de
rs
no
tla
ri
Jensenin Eitsizliiyle balanty tekrar kurmak iin, p = 1/a olaslkla tura gelen bir
madeni para ile oynanan oyunun beklenen at saysn hesaplayalm:
burada kolaylkla kontrol edebileceiniz gibi G(a) aadaki ilikinin 1/aya gre birinci
trevidir
ee
Bu nedenle, yeni ifadenin G(1/a) iin trevini alnca, aadakini elde ederiz
Bylece, insanlarn hala bahis iin kullanmak istedikleri 25 dolar ortalama atlarn
kazancna
dolar kadar uzaktr. Bunun aklamas bir kere daha Jensenin
Eitsizliidir, ve gerekte u(x) = 2x xin (ekstrem) bir konveks fonksiyonudur.
.c
om
rnek 11. Varsayalm ki iki deerli kat arasndan seim yapmak durumundasnz:
Birincisi insanlara internet sayfalarn bedava arattran mehul yeni balayan bir internet
firmasnn hisse senetleridir. %90 olaslkla kar paylar e0t = 1de sabit kalmasndan
tr ok risklidir ve %10 olaslkla firmann ad Googledr. t zamannda her hangi bir
anda deyecei kar paylar e0.1T kadar byr, yani srasyla %90 olaslkla %0, %10
olaslkla %10 deerini alan rasgele bir byme oran G1 vardr. Dier seenek ise,
gelecekte herhangi bir t zamanda e0.02t faiz deyecek olan devlet tahvilini tutmak olabilir,
yani kesin olarak G2 = %2dir.
tla
ri
t zamanda alacanz bir dolara imdi sahip olduunuz dolarn e-0.15t i kadar deer
verirsiniz, fakat yine de ikisinden birine yatrrsnz. Yani genel olarak, getirisi g
orannda byyen deerli bir kada kesin olarak aadaki kadar deeri biersiniz:
de
rs
no
ee
Sezgisel olarak, byme oran zerindeki belirsizlik, her ne kadar yeni faaliyete
balayanlarn %90n bymese de (hata iflasta edebilirler), %10u inanlmaz bir ekilde
kt giden yatrmalar telafi ettikleri anlamna gelir. Biimsel olarak,
byme
oranlarnda V(g) fonksiyonu konvekstir, bylece Jensenin Eitsizliine gre, yatrmclar
byme oranndaki riske deer bimelidirler miktara (dzeye) deil.
Mart 19 2009
ri
.c
om
Konrad Menzel
rs
no
tla
X kesikli ve c.d.fde sramalara neden olan nokta ylmalarna sahip ise, bu tanm
yararl olamayabilir, bu nedenle daha genel durumda, medyan aadaki gibi
tanmlarz
Dar tanm ile ilgili deiiklik, c.d.f.nin sreksizlie sahip olmas ve 1/2nin zerine
kmasyla, medyan sadece sreksizlik noktasnda aramaktr. X dalmnn dier
yzdeliklerini de tanmlayabiliriz.
Tanm 1. Rasgele bir deiken X iin, quantile aadaki ile verilir
de
ee
om
SPAT: Xin medyan P(X < medyan(X)) =1/2yi salar. u(x) kesin artan olduu iin,
herhangi bir sabit m deeri iin olay X < m olay u(X) < u(m)ye eittir. Bu nedenle
P(u(X) < u(medyan(X)) = P(X < medyan(X)) = 1/2dir, bylece u(medyan(X))
gerekten u(X)in medyandr.
Sezgisel olarak, medyan kesin artan dnm ile korunan rasgele deikenin ordinal
zeliine baldr.
.c
tla
ri
rs
no
0 + 0 = medyan(X1) +
de
ee
om
ri
.c
Dolaysyla, siz her blmde en az %95lik dilimdesiniz, fakat 15 kiinin toplam skoru
800 iken sizin ki sadece 750dir, bu nedenle her blme gre toplam puanlarn
sadece %85lik dilimindesiniz.
tla
2. Varyans
rs
no
zelik 1. Sadece ve sadece baz sabit saylar iin P(X = c) = 1 ise Var(X) = 0dr.
de
VarY = a2Var(X)
ee
SPAT: Yine, sadece srekli duruma bakalm. Beklenen deer iin elde edilen nceki
sonular kullanarak
Yaylmann lm iin rasgele deiken gibi bir eit birim kullanmak daha uygun
der. Ancak, bu son sonu Var(X)in biriminin Xin biriminin karesi olabileceini ima
etmektedir. Bu nedenle, varyans yerine sklkla standart sapma (X)i kullanrz:
zelik 3.
Var(X) = |X2| |X|2
om
SPAT:
.c
zelik 4. Eer
tla
ri
rs
no
de
ve
ee
Bundan tr,
rnek 4. Varsayalm ki Y
toplam olarak yazlabilir
.c
ayn zamanda,
rs
no
tla
ri
Bundan tr,
om
unu hesaplayabiliriz
de
Varyans bir beklenen deer olduu iin, rasgele deikenin fonksiyonunun beklenen
deerini dorudan rasgele deikenin fonksiyonunun varyansna uygulayabiliriz: eer
Y = r(X) ise,
ee
Beklenen deer, dolaysyla, X dalmnn birinci momenti, varyans ise ikinci merkezi
momenti olarak da ifade edilir.
om
ee
de
rs
no
tla
ri
.c
om
Konrad Menzel
.c
31 Mart 2009
ri
1. Kovaryans
X ile Ynin kovaryans iki rasgele deiken arasndaki ilikinin gcnn lsdr.
tla
de
rs
no
Cov(X, X) = Var(X)
zelik 2.
Cov(X, Y) = Cov(Y, X)
zelik 3.
ee
ri
.c
om
Kovaryans Cov(X, Y) nedir? zelik 7deki denklemin sa tarafna gre dahil olan
bileenleri hesaplayalm:
de
rs
no
tla
ve
ee
om
.c
ri
zelik 6.
de
rs
no
tla
Son zelie gre, kovaryans X ile Ynin leine gre deitii iin, X ile Y arasndaki
ilikinin gcn veren, iki deikenin diyelim ki lm birimindeki deiiminden
etkilenmeyen, standart bir lye sahip olmak istiyoruz. ok sklkla kullanlan o l
korelasyon katsaysdr.
Tanm 2. X ve Ynin korelasyon katsays yle hesaplanr:
ee
zelik 8.
Baz a
0 ve b sabitleri iin
Yani, eer iki rasgele deiken arasnda deterministtik dorusal bir iliki varsa,
korelasyon katsaysnn mutlak deeri 1e eittir. O durumda X ile Y arasnda
mkemmel korelasyon olduunu syleriz.
.c
om
Aklama 1. Veri analizinin ok nemli bir ilkesi, iki rasgele deiken arasndaki
istatiksel ilikinin mekanik veya nedensel ifadelere dayanmamasdr ki, biz bunun
gerekte veriye dayal olmasn arzularz. rnein, insanlarn jimnastik salonlarnda
spor yaparak harcadklar zaman ile salklar arasnda pozitif bir korelasyon olduunu
veri setleriyle gzlemleriz, ancak bu sporun salk durumunu iyiletirdii anlamna
gelmez. Dier taraftan salk durumlar ok kt olan ve spor salonlarna gitmeyi
akllarna bile getirmeyen kimi insanlarda vardr.
tla
ri
Neden X ile Ynin korelasyonun Xin Ynin nedeni olmasndan tamamen farkl kavramlar
olduunu grmenin daha soyut bir yolu, X ile Ynin kovaryansnn simetrik olduuna,
bylece deikenlerin rollerini deitirebileceimize dikkat etmektir. Ancak nedensellik
iin, ilikinin spesifik bir ynn dnrz, yani X Y veya X Ynin
nedenidir/etkileyendir, ancak ayn zamanda Y Xin nedeni/etkileyeni deildir deriz,
bylece X ile Ynin rollerini deitiremeyiz. Bunda tr,
KORELASYON NEDENSELLE ET DELDR
de
rs
no
1.1.nizleme: Regresyon
Diyelim ki, bir iinin geliri Y ile onun okullama yl X ile llen eitimi arasndaki
ilikiyle ilgileniyoruz (kolaylk asndan her ikisinin de srekli olduunu varsayalm). Bu
durumda her zaman X ile Y arasndaki ilikiyi yle yazabiliriz:
Y = +X + U
ee
om
.c
tla
ri
de
rs
no
ee
ve
(dourusu, ilki dorudan nn birinci derece koulundan, ikincisi ise nn birinci derece
koulundan elde edilir).
O zaman, tahmin edilen regresyon +X X ile ilikili (X tarafndan aklanan) Ynin
parasdr ve U ise Ynin X ile ilikili olmayan parasdr. ve parametreleri genellikle
om
.c
rnek 2. Her sene, bir firmann AR-GE blm rasgele bir sre sonucunda X kadar
bulu retmektedir, burada E|X| = 2 ve Var(X) = 2dir. Her bulu p = 0.2 olaslkla ticari
bir baar gsterecektir (bamszlk varsayalm). Bir yl ierisindeki ticari baar saysn
S ile gsterelim. Bir yl ierisinde X = x bulu saysna koullanm Snin ortalamasnn S
B(x, p) = xp olduunu bildiimiz iin, bulularn ortalama olarak xp kadarnn baarl
olmas gerekir.
de
rs
no
Tanm 3.
tla
ri
Y veriyken Xin koullu beklenen deeri koullu p.d.fden elde edilen Xin beklenen
deeridir:
fY|X(y|X) rasgele deiken Xi kendi argman olarak tad iin, koullu beklenen
deerin de ayn zamanda rasgele bir deiken olduunu not ediniz. Ancak, Xin belli bir
deeri veriyken, Ynin koullu beklenen deerini de tanmayabiliriz
burada koullu younluk tanmland srece bu herhangi bir verili x deeri iin sadece
bir saydr.
Hesaplamalar tam olarak nceki gibi yapld iin (tek fark imdi koullu dalm
zerinden integral alyoruz), saysal bir rnek yapmayacaz (problem seti iin sadece
tanm uygulaynz). Bunun yerine, koullu ve koulsuz rnekler arasndaki fark
gstermek iin daha kalitatif rnekleri tartalm.
ee
Satc ve bir alc her bir araba tr iin, srasyla YS ve YB, kadar aada verilen
deerleri biiyorlar:
Satc
5000
6000
10000
Alc
6000
10000
11000
om
Tr
Limon
Orta
Karpuz
de
rs
no
tla
ri
.c
lk dikkat edilmesi gereken ey, her araba eidi iin, alcnn bitii deerin satcnn
bitiinden daha yksek olduudur, dolaysyla her bir tr araba iin, al veri alc ile
satcnn bitii deerin arasndaki bir fiyattan gereklemeli. Ancak, kullanlm arabalar
da, kalite ilk anda grlen ey deildir. Bu nedenle, eer ne alc ne de satc sz
konusu arabann tr Xi bilmiyorsa, onlarn beklenen deeri yinelenen beklentiler
kanununa gre aadaki gibidir:
Daha gereki bir dzenlemede, arabann satcs arabann kalitesini alcdan daha iyi
bilir (tamirat gemiini, kazalarn vs.) ve arabay satmaya arzulayaca fiyat belirler.
Eer satc araba trn de mkemmel bir ekilde ayrt edebilirse, ki alc bunu
yapamaz, alcnn satcnn belirtilen fiyattan arabay satma arzusuna koullanm
beklentiler oluturmas gerekir.
Eer satc 6000 dolardan daha dk bir fiyat belirtirse, alc kesin olarak arabann
limon olduunu bilirdi, nk dier durumlarda satc en az 6000 dolar talep ederdi,
yani
ee
ve al veri gerekleirdi. Ancak, eer araba karpuz ise, satc en az 10000 dolar
talep ederdi, hlbuki alc en fazla
kadar deyecekti, bu nedenle de satc yksek kalite bir arabay makul bir fiyata
satamayacakt.
om
.c
ri
ee
de
rs
no
tla
SPAT: g(x) = [Y|X = x] olsun. g(x) xin bir fonksiyonudur. Beklenen deeri imdi
hesaplayabiliriz:
om
Konrad Menzel
2 Nisan 2009
.c
tla
ri
rnek 1. Her sene, bir firmann AR-GE blm rasgele bir sre sonucunda X kadar
bulu retmektedir, burada E|X| = 2 ve Var(X) = 2dir. Her bulu p = 0.2 olaslkla ticari
bir baar gsterecektir (bamszlk varsayalm). Bir yl ierisindeki ticari baar saysn
S ile gsterelim. Bir yl ierisinde X = x bulu saysna koullanm Snin ortalamasnn S
B(x, p) = xp olduunu bildiimiz iin, bulularn ortalama olarak xp kadarnn baarl
olmas gerekir.
de
rs
no
Y veriyken Xin koullu beklenen deeri koullu p.d.fden elde edilen Xin beklenen
deeridir:
Tanm 1.
fY|X(y|X) rasgele deiken Xi kendi argman olarak tad iin, koullu beklenen
deerin de ayn zamanda rasgele bir deiken olduunu not ediniz. Ancak, Xin belli bir
deeri veriyken, Ynin koullu beklenen deerini de tanmayabiliriz
ee
burada koullu younluk tanmland srece bu herhangi bir verili x deeri iin sadece
bir saydr.
Hesaplamalar tam olarak nceki gibi yapld iin (tek fark imdi koullu dalm
zerinden integral alyoruz), saysal bir rnek yapmayacaz (problem seti iin sadece
tanm uygulaynz). Bunun yerine, koullu ve koulsuz rnekler arasndaki fark
gstermek iin daha kalitatif rnekleri tartalm.
om
Alc
6000
10000
11000
ri
Satc
5000
6000
10000
tla
Tr
Limon
Orta
Karpuz
.c
Satc ve bir alc her bir araba tr iin, srasyla Y S ve YB, kadar aada verilen
deerleri biiyorlar:
de
rs
no
lk dikkat edilmesi gereken ey, her araba eidi iin, alcnn bitii deerin satcnn
bitiinden daha yksek olduudur, dolaysyla her bir tr araba iin, al veri alc ile
satcnn bitii deerin arasndaki bir fiyattan gereklemeli. Ancak, kullanlm arabalar
da, kalite ilk anda grlen ey deildir. Bu nedenle, eer ne alc ne de satc sz
konusu arabann tr Xi bilmiyorsa, onlarn beklenen deeri yinelenen beklentiler
kanununa gre aadaki gibidir:
Daha gereki bir dzenlemede, arabann satcs arabann kalitesini alcdan daha iyi
bilir (tamirat gemiini, kazalarn vs.) ve arabay satmaya arzulayaca fiyat belirler.
Eer satc araba trn de mkemmel bir ekilde ayrt edebilirse, ki alc bunu
yapamaz, alcnn satcnn belirtilen fiyattan arabay satma arzusuna koullanm
beklentiler oluturmas gerekir.
ee
Eer satc 6000 dolardan daha dk bir fiyat belirtirse, alc kesin olarak arabann
limon olduunu bilirdi, nk dier durumlarda satc en az 6000 dolar talep ederdi,
yani
om
ve al veri gerekleirdi. Ancak, eer araba karpuz ise, satc en az 10000 dolar
talep ederdi, hlbuki alc en fazla
kadar deyecekti, bu nedenle de satc yksek kalite bir arabay makul bir fiyata
satamayacakt.
.c
tla
ri
rnek 3. Bu rnekte, insanlarn gelecekteki politik olaylar zerine bahse girdii bir
internet platformu olan IEM Political Marketsn 2008 bakanlk adaylar ile ilgili verisine
bakacaz(veri iin bkz.:http://www.biz.uiowa.edu/iem/markets/data_nomination08.html)
Piyasa yle alyor: Her bir politik aday i iin, katlmclar aadaki getiriyi veren
kontratlar satn alyorlar
de
rs
no
Yi = {
ee
Dier bir ifadeyle, katlmclarn aday inin kontrat iin demeyi arzuladklar dolar
miktar t zamanda verili bilgiye gre i nin kendi parti adayln kazanma olaslna
eittir. Son aydaki Demokrat Partinin ana adaylarnn kontratlarnn fiyatlarna
bakalm: Demokratik adaylarn kazanma ihtimali hakknda nemli bilgileri ortaya karan
3 olay iin dik doru izdim:
om
.c
ri
Barrack Obamann Hillary Clintona kar ezici bir farkla kazand Iowa parti
kongresi,
Iowadaki yenilgiden sonra Hillary Clintonun geri dn olarak grlen New
Hampshire n seimi,
Ohio ve Taksasn n seimleri; bu iki nemli eyaletin n seimlerini Hillary
Clinton kazand
de
rs
no
tla
Koullu ve koulsuz beklenen deerler arasndaki nemli bir iliki Yinelenen Beklentiler
Kanunudur(bu daha nce bu derste grdmz Toplam Olaslk Kanunun yakndr).
ee
SPAT: g(x) = [Y|X = x] olsun. g(x) xin bir fonksiyonudur. Beklenen deeri imdi
hesaplayabiliriz:
om
.c
ri
tla
de
rs
no
Bu sonu ayn zamanda ANOVA eitlii olarak bilinir. Burada ANOVA Varyans
Analizidir. zelikle, Var(Y|X) 0 olduu iin, aadakine ulalr
ee
om
B(5,0.2) olduu
.c
tla
ri
(c) Bulularn koulsuz beklenen deeri nedir? Yinelenen beklentiler kanunu ile
unu buluruz,
de
rs
no
ee
de
rs
no
tla
ri
.c
om
2. zel Dalmlar
Bu derste, imdiye kadar yaygn olarak kullanlan dalm grdk, binom, uniform ve
stel. Bundan sonraki iki derste, bu listeyi birka nemli rnek ile genileteceiz ve
onlarn en sk kullanlan ile balayacaz, yani normal dalmla.
ee
om
.c
tla
ri
Tanm 3. Eer p.d.f.si aadaki gibiyse, X deikeni [a, b] aralnda bir uniform
dalmdr, X U[a, b]:
de
rs
no
ee
ve
om
.c
Normal dalm srekli rasgele deiken ile ilintilidir. ok sayda ki istatistiki deneyin
sonularnn en iyi tahminini verdii ortaya kmtr (biraz sonra bunun iin bir rnek
greceiz, daha fazlasn Merkezi Limit Teoremini iledikten sonra greceiz).
de
rs
no
tla
ri
ee
Bir standart normal rasgele deikenin c.d.f.si kapal-form ifadeye sahip deildir(fakat
tablo deerlerine ya da istatistiksel yazlm paketlerine baklabilir). P.d.f (z) an erisi
ve sfr etrafnda simetrik zeliklere sahiptir:
om
ve
ri
.c
Normal dalmn neden yararl olduuna dair vurgulanmas gereken ilk nemli nokta,
ok sayda n deneme iin Binom rasgele deikenlerin normal dalm ile tahmin
edilebildiinin ortaya kmasdr.
tla
de
rs
no
ee
om
.c
ri
de
rs
no
tla
Eer n = 5 ise, 25%ten daha fazla baarya sahip olmama olasl aadaki gibi
hesaplanr:
ee
Bylece, her birinin toplamn ayr ayr hesaplayabiliriz. Ancak onlardan ok fazla olduu
iin, bu ok ar bir yk getirecektir. Dier bir seenek olarak, DeMoivre-Laplace
Teoremini kullanarak iyi bir tahminde bulunabilirdik. Standardize edilmi yledir:
Bu nedenle,
.c
om
ri
de
rs
no
tla
Xin p.d.f.si nedir? Daha nce derste grdmz deiken deitirme formln
kullanabiliriz:
Bir normal rasgele deikenin dorusal dnmnn yine normal bir X1 deikeni
olduunu gz nnde bulundurarak tartmay daha ileri bir aamaya tayabiliriz.
nerme 3. Eer X1
ee
de
rs
no
tla
ri
.c
om
Genel olarak, birka hafta nce grdmz bklme formln kullanmak zorunda
olabilirdik, ancak normallerin toplam iin, sadece toplamn beklenen deerini ve
varyansn hesaplamamz yeterlidir. Bu durumda p.d.f.leri hemen bulabiliriz:
ee
Yani dalm ynnn ou ortalamadan itibaren bir veya iki standart sapma aralnn
iindedir. Eer elinizin altnda c.d.f. tablosu yoksa normal olasln kabaca bir tahmini
elde etmek iin bu nicel deeri hatrlamakta fayda vardr.
om
.c
ri
tla
de
rs
no
ee
1.95) =
om
.c
ri
tla
b iin P(a
b) tr olaslklar aadaki
de
rs
no
1. deikeni standardize et, yani bir standart normal rasgele Z deikeni iin olay
aadaki gibi tekrar yaz:
3. olasl elde etmek iin yukarda hesaplanan deerlerin standart normal c.d.f.si
iin tablodan deerleri bul.
ee
Integral dntrme kullanarak uniform rasgele ekilileri dier herhangi bir srekli
dalma dntrmenin mmkn olduunu daha nce grmtk(rasgele deikenlerin
dntrlmesi zerine olan ders notlarna baknz). Eer bir bilgisayarnz yoksa ne
om
ekil 3te grlen farkl zar pei sra atlmtr. Bu yaplrken, deneyi yapan kii
tesadfi ekililerin listesini tabloya aadaki gibi aktarr: Birinci zar gerek deeri
verir(her zaman size doru olan yzeyin altndaki rakam okursunuz). lk zamanda
yldzlar bo braklrken, fakat daha sonra ikinci zarn atlyla doldurulurlar. En
sonunda, nc zar ilk iki zar ile oluturduunuz ekililerin nne konulacak art ve
eksilerin srasn verir.
ri
.c
tla
de
rs
no
Tahmin ve test etmek iin standart normal dalmn neminden tr, standart normal
rasgele deikenlerin baz fonksiyonlar da nemli rol oynarlar ve sk sk istatistik
testlerde tablo haline getirilirler. Btnlk asndan imdilik sadece tanmlar vereceiz,
fakat, dersin sonlarna doru (son te birinde) tekrar uygulamalara dneceiz. lgili
p.d.f.leri vermeyeceim nk onlarn kullanm pratik deildir.
in k
Tanm 6. Eer Z1, Z2, , Zk bamsz ve dalm Zi N(0,1) ise, Y =
serbestlik derecesiyle ki-kare dalml olduu sylenir. Semboller ile ifade edecek
olursak,
ee
Tanm 7. Eer X
N(0,1) ve Y
ise, o zaman
om
Serbestlik derecesi knin byk deerleri iin, t- dalm standart normal dalm ile ok
doru bir ekilde tahmin edilir.
ve Y2
ise, o zaman
ri
.c
Tanm 8. Eer Y1
ee
de
rs
no
tla
om
.c
ri
tla
de
rs
no
ee
om
.c
ri
tla
de
rs
no
m
ee
om
.c
ri
tla
de
rs
no
m
ee
om
Konrad Menzel
7 Nisan 2009
.c
ri
tla
Bazen, belli bir olayn belirli bir aralkta hangi sklkla meydan geldiini bilmek
isteyebiliriz.
ee
de
rs
no
rnek 1. Hava yolu gvenlii sz konusu olunca, bir uak modelinin ne kadar gvenli
olduu konusunda bir kanya sahip olmak isteyebiliriz. Aadaki veri www.airsafe.com
veri sitesinden elde edildi ve toplam uu says ile Aralk 2006ya kadar belli bir uak
tipinin yer ald lmcl kaza saysn vermektedir.
Tablodan hemen grebileceimiz gibi baz uak modelleri dierlerine gre daha az kaza
yapm nk, basit bir ifadeyle, ya uzun sreli kullanlmamlar ya da ok az
retilmiler. Daha anlaml bir karlatrma yapabilmek iin, lmcl kaza saylarnn
dalmlarn aklamak iin daha iyi bir ynteme ihtiyacmz var.
om
ri
.c
Tanm 1. Eer X aadaki gibi bir p.d.f.ye sahip ise, o zaman parametresiyle bir
Poisson Dalm olduu sylenir,
de
rs
no
tla
Saylabilen bir deikenin dalm iin Poisson dalmnn neden uygun veya kabul
edilebilir olduunu grebilmek iin aadaki dnsel deneyi yapalm: Varsayalm ki
bir olayn bir 1/n zaman aralnda gerekleme olasl pn= /ndir
zamann herhangi bir annda gerekleen olaylarn zaman ierisinde bamsz
olduunu da varsayyoruz.
ee
nerme 1. Xn
B (n, /n) dalml binom rasgele deiken iin, n
aadakine yaknsar:
iken p.d.f.
om
SPAT: arpmn limitini limitlerin arpm olarak alabiliriz ve her birini ayr ayr
deerlendirebiliriz: Kalkluste ok iyi bilinen bir sonuca gre (her iki tarafa Taylor
serisi(alm) uygulanabilir) aadaki ifadeyi yazlabilir,
tla
ri
.c
de
rs
no
Yukarda tarttmz gibi, bir Poisson rasgele deikeni Binom rasgele deikenin, Xn
B(n, /n), limitidir. Burada n deneme says sonsuza gitmektedir. Daha nceki Binom
dalm ile ilgili tartmalarmza gre, nden bamsz olarak, [Xn] = n(/n) = dir.
ee
Bylece
syleyebiliriz.
[X] = olduunu
om
.c
ri
tla
de
rs
no
At tepme veri setinde, rneklem ortalamas (yl ve tmen itibariyle) = 0.7dir. imdi
ekil 2de gsterildii gibi rneklem frekansn = 0.7 parametre oran iin oluturulan
Poisson p.d.f.sinin teorik deerlerine kar izebiliriz. ki dalm belirgin bir ekilde
benzerdir ve bu durum sk sk Kk Saylar Kanunu olarak ifade edilir.
2. Asimptotik Teorisi
imdiye kadar, p.d.f.yi, parametreleri (normal iin ve 2, stel iin gibi) bildiimizi
(ya da bulabileceimizi) varsaydk ve sonra o bilgiye dayanarak olaslklar ile ilgili
ifadeler gelitirdik.
ee
Dersin izleyen blmnde, o bilgiye sahipmiiz gibi hareket etmeyeceiz ama, olaslk
zerine olan bilgimizi kullanarak, sz konusu rasgele deikenlerin dalm konusunda
bize bir eyler syleyecek fonksiyonlar oluturacaz. O fonksiyonlar tahmin ediciler
olacaktr.
statistikte nemli rol oynayan bir tahmin edici rneklem ortalamasdr. Bu tahmin edici
birazdan ileyeceimiz gibi, rasgele bir deikenin beklenen deerini tahmin eder.
Tanm 2. n byklndeki bir rasgele rneklem n sayda i.i.d, olan, yani btn Xler
bamsz ve ayn fx(x) p.d.f.sine sahip, X1, Xn rasgele deikenler dizisidir.
om
tla
ri
.c
de
rs
no
Chebyshev Eitsizlii bir rasgele deikenin beklenen deerden ok uzakta bir yerde
gerekleme olaslnn snrlarn belirten biimsel bir sonutur.
olan rasgele bir deiken olsun. O zaman herhangi
ee
SPAT: Xin p.d.f.si fX(x) ile verilmi olsun. Bu durumda aadaki ilikiyi gstereceiz
om
[X] veya t
[X]
.c
tla
ri
de
rs
no
ee
om
.c
ri
tla
de
rs
no
nnin
ee
om
ri
.c
tla
de
rs
no
Teorem 1 (Byk Saylar Kanunu). Varsayalm ki, btn iler iin, X1, , Xn [X] =
ve Var(Xi) =
ile bir i.i.d. ekili dizisi olsun. O zaman herhangi bir > 0 iin (ok
kk bir say) rneklem ortalamas aadaki ilikiyi salar
Bu durumda
ee
om
.c
ri
tla
de
rs
no
ekil 1. n tane madeni para atnn ortalama tura saysnn 10 dizisi- kesikli
izgiler
dir.
ee
om
.c
ri
tla
de
rs
no
Varsayalm ki n byklndeki bir kitle, kamu idaresi iin 2 aday arasndan birini
seecektir. Burada basite en ok oyu alan aday kazanacaktr. Semen inin A aday
iin oy kullanmas durumunda 1, dier durumlarda 0 olan rasgele deiken Xiye
bakacaz. Eer oy oran aadaki gibiyse Aday A kazanr:
ee
om
ri
.c
varyansndan balayabiliriz
de
rs
no
nnin
tla
Chebyshev Eitsizlii ile ilgili ispatn argmanlarna gre, olaslk snrlarn izmek iin
Kararsz semenler (grlt) herhangi bir aday zelikle tercih etmedikleri iin, dalm
etrafnda simetriktir, bylece
= (1/2) +
ee
Birka say deneyelim: Diyelim ki 2 = %5tir. Aday Bnin seilme olasln %5in
altnda tutmak iin n ne kadar byk olmak zorundadr? Snr yle olur,
bylece n
95dir. Eer semenin %95i kararn rasgele verse bile, yanl adayn
om
ortalamas
ri
nin
tla
.c
de
rs
no
ee
bylece
Var(
n)
n|sinek])
.c
iken
om
tla
ri
bylece n ne kadar byk olursa olsun snr 1/2'nin zerindedir. Bu sadece st snr
olduu iin, bize olayn gerekte ne kadar olas olduunu sylemiyor, ancak varyans
sfra dmedii iin, grltc semenlerin seimin sonucu zerinde ok gl bir
etkisinin olaca aktr.
ee
de
rs
no
Burada Byk Saylar Kanunu baarsz olur nk sinek olay btn grltc
semenleri ayn anda etkiler, bylece X1, , Xn artk bamsz deildir. Bamszlk
varsaym ok nemlidir nk byk saylar kanununun genellikle almasnn nedeni
grltnn birok gzlemde ortalamay amasdr. Eer grltnn bir bileeni btn
gzlemler iin ortak ise (veya en aznda hepsiyle yksek korelasyon iinde ise), bu
bileenin varyansa katks -rneimizde olaslnn snrndaki 49/81 terimi - rneklem
ok byk olsa da yok olmaz.
om
Konrad Menzel
9 Nisan 2009
de
rs
no
ri
2nci Snav gelecek hafta Sal gn snfta yaplacak ve saat tam 9:00da
balayacak.
lgili materyal: ncelik son snavdan sonra ilenen konularda olacak ancak
elbette kendinizi younluk, olaslk ve dersin ilk eyreindeki dier kavramlar
konusunda rahat hissetmelisiniz.
problem setlerindekinden daha metinsel sorular olacak, hesaplamalarda daha az
yorucu olacak.
normal dalm tablosu datlacaktr, bu nedenle yannzda getirmeniz
gerekmiyor
esas itibaryla ilk snavn formatnn ayns olacak
hesap makinesi getiriniz
kitaplar ve notlar kapal olacak
sre aa yukar 85 dakika olacak
Ksmi puan verilecektir, bu nedenle btn sorular cevaplandrmaya alnz
tla
.c
2. Tekrar
ee
p.d.f. fY(y)yi bulmann yolu Xin srekli veya kesikli veya u(.) fonksiyonun bire-bir olup
olmamasna baldr. yntem vardr:
om
tla
ri
.c
de
rs
no
3. eer (a) X srekli ve (b) u(.) bire-bir ise, deiken deitirme formln kullan
Not: Eer X ve/veya Ynin younluu bir yerde sfr ise, integralin limitleri
konusunda dikkatli ol.
Integral Dntrme: Eer X srekli ise, o zaman rasgele deiken Y = FX(X)
uniform dalmdr. Burada FX(.) Xin c.d.f.sidir.
Sra statistii: Eer X1, , Xn i.i.d ise, o zaman en dk knci deer Yknin
p.d.f.si
ee
2.2. Beklentiler
2.2.1 Beklenen Deer
.c
de
rs
no
1. sabit a iin
tla
ri
om
ee
2.2.2. Varyans
om
yle tanmlanr:
.c
tla
Var(a) = 0
ri
de
rs
no
Kovaryans
olarak tanmlanr
ee
Kovaryansn zelikleri
om
.c
Burada eer sadece ve sadece Y Xin deterministtik dorusal bir fonksiyonu ise,
tla
ri
ve
de
rs
no
Koullu Varyans
ee
2.3.1. zet
Aadaki dalmlara bakld:
Uniform: X
Normal: X
Poisson: X
om
.c
stel: X
ri
tla
Binom: X
de
rs
no
Size standart normalin c.d.f.lerinin tablosunun bir kopyasn vereceim, tabloyu nasl
okuyacanz bilmeniz gerekiyor.
ee
om
ri
de
rs
no
tla
.c
> 0 iin,
ee
> 0 iin
om
burada
.c
3. rnek Problemler
rnek 1. Bahar 2003 Snav, problem 3
de
rs
no
zm:
tla
ri
Bu sorunun iki blmnn olduuna dikkat etmeniz gerekir: (1) bireysel test
sonularnn dalmn belirlemek ve (2) maksimumun ve minimumun c.d.f.lerini
bulmak.
Her bir rencinin snav notu olan X 10 bamsz denemenin baar says olduu iin,
X p.d.f.sini bildiimiz bir binom rasgele deikendir, X B(10, 0.6).
ee
Genel olarak, bir i.i.d rneklem X1, , Xnnin maksimumu olan Y1 aadaki c.d.f.ye
sahiptir. Burada Xin c.d.f.si FX(x)tir.
om
ri
.c
tla
de
rs
no
N( ,
L( ,
(b) Varsayalm ki yatrm yapmak iin 100.000 dolarnz var ve R1 getirisinin dalm
L( ,
1.10dur ve varyans (
) 0.01dir. Yatrmn birinci dneminin
sonunda (100.000R1 dolar) servetinizin 110.000 dolardan daha yksek olma
olasl nedir?
ee
zm:
dier durumlarda
ve
i zerek balamak yararl olacaktr. Varyansn ifadesini faktrlere
ayrabiliriz:
.c
(b)
om
fY(y) = 0
ri
hareketle
elde ederiz. iin znce
0.090722098
elde ederiz. Sonra geriye doru gideriz ve grrz ki
0.09119493tr.
de
rs
no
tla
imdi birinci dnemin sonunda servetinizin 110000 dolardan byk olma olasln
bulalm. Elimizde
var. Burada normal olaslk tablosunun kullanarak standart normal c.d.f.nin deerini
bulabilirsiniz.
(c)
ee
.c
om
Bir sve ekonomisti olan Mikael Priks bir sredir holigan aktiviteleri, kavgalar,
yaralamalar, vs., zerine sve polisi tarafndan toplanan detayl veri ile Firman Boys
etesinin yelerinden birisinin kendi raporunu kullanarak (bkz. www.lrzmuenchen.de/ces/mikael.htm) futbol holiganlar ile ilgili eitli ekonomik konular
almaktadr. Bir makalesinde dman holigan gruplar arasnda olas ve sert
kavgalarn nedenlerini analiz eder. Bunun iin, kavgalar ve yaralanmalar zerine bir
model gelitirir. Modelde bir sezonda dman gruplarnn olas karlama says bir
P(5) dalmdr (Poisson = 5). Dahas, her kavgada en az bir yaralanmann olacan
ve gerekte, 10a kadar her yaralanmann eit olaslkl olduunu varsaymtr.
ri
(a) sz konusu varsaymlar veri iken, bir yl ierisinde iki dman grubun birbirini
yaralama saysnn beklenen deeri nedir? Sz konusu saynn varyans nedir?
de
rs
no
zm:
tla
(b) Varsayalm ki belirtilenlerin yerine, iki dman grup karlatnda kavga olma
olasl sadece 1/2dir (olas karlamalar bamsz varsayabilirsiniz). (a)ya
vereceiniz cevap nasl deiir.
(a) X bir sezondaki kavga saysn ve Y yaralanma saysn ifade etsin. Ayrca
karlamann kavga ile sonulanacan varsayacaz. Bu durumda, E(Y) =
E(E(Y|X)) = E(5.5X) = 5.5E(X) = 5.5(5) = 27.5 olur. Ve Var(Y) = E(Var(Y|X)) +
Var(E(Y|X)) = E(
saysnn varyans
) + Var(5.5X) = (99/12)E(X) +
ee
olur.]
om
Aslnda imdi E(X) ve Var(X) (a)dakine gre deimi oldu. E(X)in nceki deerinin
yars kadar olduunu grmek zor deil(imdi 2.5tir). p = 0.5 ve Z kadar deneme ile
X|Z bir binom olduu gereini kullanarak, Xin varyans yle yazabiliriz:
.c
tla
rnek Problemler
ri
elde ederiz.
de
rs
no
N( ,
L( ,
ee
(b) Varsayalm ki yatrm yapmak iin 100.000 dolarnz var ve R1 getirisinin dalm
L( ,
1.10dur ve varyans (
) 0.01dir. Yatrmn birinci dneminin
sonunda (100.000R1 dolar) servetinizin 110.000 dolardan daha yksek olma
olasl nedir?
om
tla
ri
.c
Bir sve ekonomisti olan Mikael Priks bir sredir holigan aktiviteleri, kavgalar,
yaralamalar, vs., zerine sve polisi tarafndan toplanan detayl veri ile Firman Boys
etesinin yelerinden birisinin kendi raporunu kullanarak (bkz. www.lrzmuenchen.de/ces/mikael.htm) futbol holiganlar ile ilgili eitli ekonomik konular
almaktadr. Bir makalesinde dman holigan gruplar arasnda olas ve sert
kavgalarn nedenlerini analiz eder. Bunun iin, kavgalar ve yaralanmalar zerine bir
model gelitirir. Modelde bir sezonda dman gruplarnn olas karlama says bir
P(5) dalmdr (Poisson = 5). Dahas, her kavgada en az bir yaralanmann olacan
ve gerekte, 10a kadar her yaralanmann eit olaslkl olduunu varsaymtr.
de
rs
no
(a) sz konusu varsaymlar veri iken, bir yl ierisinde iki dman grubun birbirini
yaralama saysnn beklenen deeri nedir? Sz konusu saynn varyans nedir?
ee
(b) Varsayalm ki belirtilenlerin yerine, iki dman grup karlatnda kavga olma
olasl sadece 1/2dir (olas karlamalar bamsz varsayabilirsiniz). (a)ya
vereceiniz cevap nasl deiir.
om
Konrad Menzel
16 Nisan 2009
.c
ri
tla
dalml olduunu syler. Bir binom, i.i.d. sfr/bir rasgele deiken Xilerin (baar ile
sonulanan denemelerin saym) toplam olduu iin,
ortalamas olarak dnebiliriz.
yi X1, Xn rnekleminin
de
rs
no
ee
O halde bir ortalama nasl olurda ayn anda hem sabit bir deer ya (Byk Saylar
Kanununa gre) ve hem de varyans 1 olan (merkezi limit teoremine gre) rasgele bir
deikene yaknsar? Buradaki nemli detay merkezi limit teoremi ile ilgilidir yani
dalmn bir noktaya dmesini (Byk Saylar Kanununda bu olur) veya sonsuza
.c
om
Bir dalmn ortalamasn snrlandrmak iin niye normal dalm balamak iin en
uygun adaydr? ki bamsz normal rasgele deikenin toplamnn yine normal bir
dalm olduunu (her ne kadar varyanslar farkl olsa da, sadece standardize edilmi
ortalamaya baktmz iin bu o kadar da nemli deildir) tarttmz tekrar
hatrlaynz. Yani bklme (yani dalmdan bamsz rasgele deiken ekleme)
asndan normal dalm ailesi istikrarldr. Bunun dier dalmlarn ou iin doru
olmadn belirtelim (uniform veya stel gibi).
de
rs
no
tla
ri
ee
n(solda)
ve standardize
(sada)
om
imdi ksm toplamlarn p.d.f.sini hesaplamak iin 10nuncu dersteki bklme formln
kullanabiliriz,
ri
.c
de
rs
no
tla
Ayrca, X1, X2, , Xk bamsz olduklar iin, toplamn varyans ile ilgili kural
kullanabiliriz
ee
Bundan tr, SKnn standardize edilmi hali olan Zk aadaki ile verilir:
tla
ri
.c
om
ee
de
rs
no
srprizdir nk uniform
deikeninkine benzemez.
younluun
kendisi
hibir
ekilde
normal
rasgele
om
Son rnek, 3 kadar az (en azndan optik olarak) saydaki n iin normal tahminin olduka
iyi grnmesi konusunda biraz aldatc olsa da, n
durumunda, genellikle n
40
veya daha yksek deerler iin tahminin doru olduunu ifade ederiz.
2. Tahmin
tla
ri
.c
de
rs
no
, daha
sonra aklayacamz mantkla P(Tura) olasl iin iyi bir tahmin olabileceini
dnebiliriz.
f(x| ) p.d.f.leri veri iken, bir parametre bir dalmlar ailesinin sabit endeksidir. Burada
parametreleri genellikle 1 , k olarak ifade ederiz.
ee
rnek 3.
om
ri
.c
tla
statistiin ou, bilinen dalm ailelerinin hangi yesinin gzlemlenmi bir srecin veya
olayn doru olaslk dalmn vereceini belirlemekle ile ilgilidir. Sembolik olarak, X ~
f[x| 0] iken biz parametre deeri 0 bulmak isteriz. Bu durum, dalm karakterize
eden parametreleri tahmin etme problemidir.
de
rs
no
Her zaman bir rasgele rneklem X1, , Xn ile balayacaz ve her zaman aadaki
varsaymda bulunacaz:
bilinmeyen
iin X ~ f[x| 0]
Tanm 1. nin tahmin edicisi bir istatistiktir ( yani X1, , Xnin bir fonksiyonudur),
nn tahmini olarak
Rasgele bir rneklemin fonksiyonu olarak, tahmin edici uygun bir rasgele deikendir,
bu nedenle genel olarak p.d.f.si cinsinden dalmn aklamak ve dalmnn momenti
ile ilgileneceimize dikkat ediniz.
ee
0n
.c
om
de
rs
no
tla
ri
5 gzlemli bir rneklemde tahmin edicisi bir rasgele deiken olduu iin, p.d.f.sini
elde edebiliriz: hatrlaynz S5
(
) iin S5 ~ B(5, 0)dr. Kesikli rasgele
deikenlerin p.d.f.sini bulmann yntemlerini = (S5)/5e uygularsak, aadakini elde
ederiz:
ee
Diyelim ki, dalmdan rnek setik, 0.2, 0.6, 0.4. O zaman 1 =0.6 ve 2 =0.8 olurdu
ve bylece ayn parametre iin iki tahmin edici farkl cevap verirdi. Bu farkl tahmin
ediciler arasndan nasl seim yapacaz? Buna biraz sonra geri dneceiz.
Ayn parametre iin bir veya iki tahmin edici arasndan nasl seim yapmalyz?
om
ri
tla
.c
Xin beklenen deerini parametre ile ifade edeceiz, yani eer gerek parametre ya
eitse Xin beklenen deeri yledir:
de
rs
no
Bir tahmin edicinin sapmas(yanll .N.) onun beklenen deeri ile gerek deeri
arasndaki farktr.
Elbette ki, ortalama olarak parametreyi doru veren bir tahmin ediciyi isteriz, yani ideal
olan sapmann sfr olmasdr.
Tanm 2. Bir tahmin edici = (X1, , Xn)
iin
deerleri
ee
om
de
rs
no
tla
ri
.c
(burada rneklem ortalamasn gerek beklenen deeri ile yer deitirttik). Eer
dalmn gerek parametreleri (0, 02) ise, bu tahmin edicinin beklenen deeri nedir?
Dolaysyla 2
iin sapmasz bir tahmin edici deildir, fakat 2 iin ok kolay bir
sapmasz tahmin edici oluturabiliriz.
ee
Bu sapma nereden geliyor? Genel konumak gerekirse, bunun nedeni kare parantezin
iindeki y grltl bir tahmin olan = n ile yer deitirmemizdir. Eer 0
bilinseydi, tahmin edici 2 =
kontrol edebilirsiniz.
Ortalamay tahmin etmek veriden bir serbestlik derecesi gtrr- rnein eer elimizde
sadece tek gzlemli bir rneklem olsayd, tahmin edilen ortalama o gzleme eit olurdu
om
ri
.c
Tanm 3. Eer nyi artrrken tahmin edici olaslk bakmndan 0a yaknsarsa, bir X1,
, Xn rneklemi iin, nn iin tutarl bir tahmin edici olduunu syleyebiliriz. Btn
> 0 deerleri iin
tla
Kelimeler ile ifade edecek olursak, yeterince byk bir rneklemde, tutarl bir tahmin
edici yksek bir olaslkla gerek parametreye ok yakn bir araln iinde olacaktr.
Dikkat edilecek olursa sapmaszlk ve tutarllk iki ok farkl rten kavramdr, ancak
biri dierini ima etmez.
de
rs
no
rnek 8. Uniform dalm iin sz konusu olan tahmin edicilerimizden birine geri
dnelim, X ~ U[0, 0]. Eer aadaki ifadeye bakaca olursak,
ee
0dan
dan daha
om
Ayr bir seenek olarak, makul olmayan bir (X1, , Xn) tahmin edicisine bakalm. Bu
durumda,
ee
de
rs
no
tla
ri
.c
Dolaysyla bu tahmin edici sapmaszdr. Ancak, herhangi bir n rneklem bykl iin,
tahmin edicinin dalm sz konusu X
N( , )in aynsdr, bu nedenle rnein = 0
iin, btn nlerin olasl
om
Konrad Menzel
.c
23 Nisan 2009
ri
tla
de
rs
no
Tanm 1. Bir tahminin standart hatas ( ), tahmin edicinin standart sapmasdr (ya da
tahmin edilmi standart sapmas). yle gsterilir:
Bir tahmin edicinin bir rasgele deikenin fonksiyonu olduunu hatrlamanz gerekiyor
ve bu nedenle bu rasgele deiken iin beklenen deeri, varyans ve dier momentleri
hesaplayabiliriz.
ndir,
burada Var(Xi) =
/n
ee
Eer
0,
om
.c
de
rs
no
tla
ri
rnek 2. Varsayalm ki X ile Y iki farkl Matematik snavnn notlardr. Siz bir eit
matematik yetenei ile ilgileniyorsunuz ve iki notta grltldr (muhtemelen iki not
arasnda korelasyon vardr), ayrca [X] = [Y] = , Var(X) = X2, Var(Y) = Y2, ve
Cov(X,Y) = XY. Bir tek lm kullanmak yerine, ikisini arlklandrlm ortalama pX +
(1 p)Y ile birletirmeye karar verdiniz. Bu arlklandrlm ortalamann beklenen
deeri nedir? pnin hangi deeri arlklandrlm ortalamann varyansn minimize
eder? Bunu sadece iki gzlemli bir rneklem kullanarak y tahmin etmek istediimiz
bir tahmin problemi olarak yorumlayabiliriz. Btn X ve Y arlklandrlm ortalamalar
olduu iin, etkin tahmin ediciyi bulmaya alacaz.
Rasgele deikenlerin toplamnn varyansnn formlnden
elde ederiz. Optimal pyi bulmak iin, birinci trevi sfra eitleriz, yani
ee
arln koyar. Bu arlk, nispeten Ynin varyansna gre Xin daha dk varyans
deerleri iin daha byk deerler alr.
bir
tla
ri
.c
om
de
rs
no
ve dalma gre hesaplanan bir parametre deeri veri iken, onlar ilgili kitle
momentlerine eitlemeliyiz.
O zaman momentler yntemi (MoM) tahmin edicisi aadaki denklem zlerek elde
edilebilir. Btn lar iin
ee
om
ri
.c
tla
o halde iki parametre (, )y tahmin etmek zorundayz. Bir istatistik kitabna baknca
unu buluruz
de
rs
no
ee
Momentler yntemi sadece seili sayda kitle momentini rneklemdeki karlklar ile
eletirmeye alrken, ayr bir seenek olarak mmkn olduunca en iyi ekilde
rneklem dalmn bir btn olarak kitle dalmyla eletiren bir tahmin edici
gelitirebiliriz. Bu, parametre nn maksimum olabilirlik tahmin edicisinin yapt eydir.
Sz konusu parametre, kabaca sylemek gerekirse, byk ihtimalle gzlemlenen
rneklemi ortaya karan deerdir:
Varsayalm ki bir i.i.d. olan bir Y1, , Yn rneklemimiz var. Ynin p.d.f.si parametre ya
kadar bilinen fY(y|) ile veriliyor. Maksimum olabilirlik tahmin edicisi( MLE) nn altndaki
verinin bileik p.d.f.sini maksimize eden nn bir fonksiyonudur.
om
tla
ri
.c
de
rs
no
SPAT: zerinde beklenen deeri hesapladmz gerek younluk fY(y|) olduu iin,
Jensen Eitsizliini kullanarak btn deerleri iin o[L(Y|) L(Y| 0)]
0 ve
log(.)nin konkav olduunu gsterebiliriz.
ee
burada f(y|) bir younluk olduu iin, integrali 1dir. Bundan tr btn deerleri iin
o[L(Y| 0)]
o[L(Y|)] olduundan, sz konusu 0 fonksiyonu maksimize eder.
Byk Saylar Kanununa gre, i.i.d. olan bir rneklem iin log-olabilirlik yledir:
Dolaysyla, i.i.d olan byk rneklemlerin log olabilirliini maksimize etmenin bize
yakn bir parametre vereceini dnebiliriz.
0e
om
rnek 5. Varsayalm ki X
N( 0, 02)dir ve bir i.i.d. rneklem X1, , Xnden ve 2
parametrelerini tahmin etmek istiyoruz. Olabilirlik fonksiyonu yledir:
de
rs
no
tla
ri
.c
Ayn ekilde,
ee
om
tla
ri
.c
de
rs
no
1 olaslkla Xi < 0 olduu iin, maksimum olabilirlik tahmin edicisi de 1 olaslkla 0dan
dk olacaktr, bylece sapmasz deildir. Daha da ak olmak gerekirse, X(n)in p.d.f.si
aadaki gibi verilir:
Bylece,
, oluturabiliriz.
ee
Aadakiler sadece MLE iin elde edilen temel teorik sonularn zetidir(bu aamada
ispatlar yapmayacaz):
Tutarl tahmin ediciler grubunda etkin bir tahmin edici varsa, MLE onu oluturur.
Belli dzenleyici koullar altnda, MLE asimptotik olarak normal dalm olabilir
(bu esas itibariyle Merkezi Limit Teoreminin bir uygulamasndan gelmektedir).
sapmal olabilir
genellikle hesaplanmas zordur
ilgili dalm ile ilgili yanl varsaymlara kar ok hassas olabilir.
ee
de
rs
no
tla
ri
.c
om
om
Konrad Menzel
28 Nisan 2009
.c
tla
ri
rnek 1. Varsayalm ki X
N( 0, 02)dir ve bir i.i.d. rneklem X1, , Xnden ve 2
parametrelerini tahmin etmek istiyoruz. Olabilirlik fonksiyonu yledir:
de
rs
no
ee
Ayn ekilde,
om
.c
ri
de
rs
no
tla
max { X1, ,
Maksimum olabilirlik tahmin edicisi nedir? Akas, biz herhangi bir
ee
1 olaslkla Xi < 0 olduu iin, maksimum olabilirlik tahmin edicisi de 1 olaslkla 0dan
dk olacaktr, bylece sapmasz deildir. Daha da ak olmak gerekirse, X (n)in p.d.f.si
aadaki gibi verilir:
Bylece,
, oluturabiliriz.
Tutarl tahmin ediciler grubunda etkin bir tahmin edici varsa, MLE onu oluturur.
Belli dzenleyici koullar altnda, MLE asimptotik olarak normal dalm olabilir
(bu esas itibariyle Merkezi Limit Teoreminin bir uygulamasndan gelmektedir).
.c
om
Aadakiler sadece MLE iin elde edilen temel teorik sonularn zetidir(bu aamada
ispatlar yapmayacaz):
de
rs
no
2. Gven Aral
ri
sapmal olabilir
genellikle hesaplanmas zordur
ilgili dalm ile ilgili yanl varsaymlara kar ok hassas olabilir.
tla
Bota halihazrda sahilden birka kere at alr ve mermilerin geldii yne dayanarak,
kaptan silahn konumu hakknda bir tahmin oluturur. Tahmin, gerek 0 konumun
etrafnda 2 varyansl bir normal dalmdr.
ee
Kaptan, sahillin bir aralna fzelerle yaylm ateinde bulunarak o alandaki her eyi yok
edebilir. Kaptan, sahillin hangi aralna ate edeceini nasl belirleyebilir ki %95
olaslkla makineli tfein orada olup tahrip olacandan emin olabilir ve bylece birlikleri
gvenli bir ekilde sahile karabilir?
om
.c
ri
tla
de
rs
no
Normal dalm iin, olaslk ynn %95inin ortalamann her iki tarafndaki 1.96
standart sapmalk araln iinde olduunu biliyoruz. Bylece, eer kaptan CI = [
1.96, + 1.96] aral iin ate emri verirse, in 0 CI olma olasl %95tir.
Daha nce sadece gerek parametre 0 deerine yakn deer veren tek fonksiyon (X1,
, Xn ) aryor iken, imdi belli bir deere eit veya daha yksek olaslkla gerek
parametre deerini kapsayan (ieren) iki fonksiyon, A(X1, , Xn) < B(X1, , Xn),
oluturmaya alacaz.
Tanm1. Parametre 0 iin bir 1-lk gven aral A(.) ve B(.) gibi veriye-dayal iki
fonksiyona bal bir aralktr [A(X1, , Xn ), B(X1, , Xn )]. Yani,
ee
Bir gven aralnn, [A(x1, , xn), B(x1, , xn)], gereklemesi iin, P(A(x1, , xn)
0
B(x1, , xn) = 1 - olduunu sylemek mantkl deil, nk araln limitleri ve
gerek parametre imdi reel saylardr, bylece rneklemin gereklemesi veri iken,
om
de
rs
no
burada
tla
ri
.c
rnek 4. Varsayalm ki ~ N( 0,
)dir ve bir 1-lk birgven aral oluturmak
istiyoruz. Eer z1-/2 standart normal dalmn 1- (/2) ondal ise yani (z1-/2) = 1(/2) ise, o zaman aadakinin
Bylece eer bir %95lik gven aral istiyorsak, z1-/2 = z0.975 = 1.96dr, bu nedenle
gven aral 1.96 ile verilir.
Bu gven araln elde etmenin en yaygn yoludur, bu nedenle bunun nasl ilediini
anlamanz gerekiyor.
rnek 5. Anket sonular genellikle bir hata pay ile rapor edilir. rnein Gallupun 18
Nisan raporuna gre semenlerin %46snn McCaine kar Clintone, %44nn
McCaine oy vereceini, %10nun ise ya her ikisi iin de oy kullanmayacan ya da
herhangi bir fikri olmadn sylemitir. Bu sonular 4385 kiiyle yaplan grmeye
dayanmaktadr ve rapor ayrca ulusal yetikinlerin toplam rneklemine dayal sonular
iin, %95 gvenilirlikle maksimum rneklem hata pay yzde iki olduu sylenebilir
ifadesine yer vermitir. Bu ne anlama gelmektedir? Eer bir adayn gerek oy oran p
ise, n saydaki semen rnekleminde ortalama payn varyans VAR(
n)
dir. Bu
ee
tir.
Merkezi Limit Teoremine gre, n yaklak olarak normal dalmldr ve bir normal
dalm iin %95lik bir olaslk ktlesinin ortalamann 1.96 standart sapmalk aralnda
ri
tla
.c
om
rnek 6. Bir laboratuvar bir davada kant olarak kullanlabilecek bir kan rnei zerinde
kimyasal analiz yapmaktadr. Kant olarak kabul edilebilmesi iin, baz maddelerin
mevcudiyetinin %90lk gven aralnda % 0.001 g/mlden daha az olmas gerekir.
Analizler iin kullanlan makine gerek deer etrafnda standart sapmas = 0.05g/ml
olan normal dalml sonular vermektedir. %90lik gven aralnn 0.001 g/mlden az
olduundan emin olmak iin ka tane sonu almamz gerekir?
de
rs
no
iin %90lik
ee
Yukardaki ifade nnci sra istatistii olsun (nceki derslerde gsterildii zere bu ayn
zamanda bir maksimum olabilirlik tahmin edicisidir). Daha nce grdmz gibi,
iin sapmasz olmamasna ramen, onu iin bir gven aral oluturmakta
kullanabiliriz. Sra istatistiinin sonularndan grdk ki nn c.d.f.sini veren in c.d.f.si
aadaki gibi belirlenmektedir:
0,
yerine koyduk,
om
.c
bylece a =
ve b =
i elde ederiz. Bu bize henz bir gven aral
vermemektedir, nk gven aralnn tanmna gre biz gerek 0 deerini eitsizliin
ortasnda isteriz. Ve her iki tarafn fonksiyonlar sadece veriye ve dier bilinmeyen
byklkler baldr.
de
rs
no
Bundan tr aadaki
tla
ri
Bu durumda, araln snrlar sadece (X1, , Xn) tahmin ediciler araclyla veriye
baldr. Bu genel olarak doru olmak zorunda deildir.
imdi gven aralna nasl ulatmz tekrarlayalm:
1. nce (X1, , Xn) tahmin edicileri ve in dalmn elde et,
2. aadaki koulu salayacak olan a() ve b()yi bul
ee
ri
.c
om
de
rs
no
tla
3. normal deil, fakat n > 30 veya daha fazla: yle anlalyor ki grdmz
btn tahmin ediciler(unifom dalm iin rneklemin maksimumu hari) merkezi
limit teoremine gre asimptotik olarak normaldir (Merkezi Limit Teorisini nasl
uygulayacamz konusu her zaman ak deil deildir). Bu durumda gven
araln
2deki
gibi
olutururuz.
4. normal deil, n kk: eer in p.d.f.si biliniyor ise, 1nci kullanlarak gven
aral oluturulabilir(son rnekteki gibi). Eer p.d.f. bilinmiyor ise,
yapabileceimiz bir ey yok.
2nci durumda t dalmn kullanmamzn nedeni udur:
N( ,
) olduu iin,
ee
ee
de
rs
no
tla
ri
.c
om
Ayrca 4n genel durumunda (ve uniform ieren son rnekte), (X1, , Xn) istatistiinin
herhangi bir eyin sapmasz ve tutarl tahmin edicisi olmasn istemedik, fakat gerek
parametrede kesin monoton olmak zorundayd. Ancak, normal durumlar( in varyans
hakknda bilgi sahip olsak ta olmasak ta) ve durum 3 iin gven araln
oluturduumuzda, tutarl olmak zorundaydk.
om
Konrad Menzel
30 Nisan 2009
.c
ri
Sonraki rnek tahmin edicinin dalmnn normal olmad durumlarda gven aral
oluturmann bir yolunu gstermektedir.
0
iin %90lik
tla
de
rs
no
Yukardaki ifade nnci sra istatistii olsun (nceki derslerde gsterildii zere bu ayn
zamanda bir maksimum olabilirlik tahmin edicisidir). Daha nce grdmz gibi,
iin sapmasz olmamasna ramen, onu iin bir gven aral oluturmakta
kullanabiliriz. Sra istatistiinin sonularndan grdk ki nn c.d.f.sini veren in c.d.f.si
aadaki gibi belirlenmektedir:
0,
yerine koyduk,
ee
bylece a =
ve b =
i elde ederiz. Bu bize henz bir gven aral
vermemektedir, nk gven aralnn tanmna gre biz gerek 0 deerini eitsizliin
ortasnda isteriz. Ve her iki tarafn fonksiyonlar sadece veriye ve dier bilinmeyen
byklkler baldr.
.c
Bundan tr aadaki
om
ri
Bu durumda, araln snrlar sadece (X1, , Xn) tahmin ediciler araclyla veriye
baldr. Bu genel olarak doru olmak zorunda deildir.
tla
de
rs
no
ee
om
ri
.c
3. normal deil, fakat n > 30 veya daha fazla: yle anlalyor ki grdmz
btn tahmin ediciler(unifom dalm iin rneklemin maksimumu hari) merkezi
limit teoremine gre asimptotik olarak normaldir (Merkezi Limit Teorisini nasl
uygulayacamz konusu her zaman ak deil deildir). Bu durumda gven
araln
2deki
gibi
olutururuz.
tla
4. normal deil, n kk: eer in p.d.f.si biliniyor ise, 1nci kullanlarak gven
aral oluturulabilir(son rnekteki gibi). Eer p.d.f. bilinmiyor ise,
yapabileceimiz bir ey yok.
N( ,
) olduu iin,
de
rs
no
ee
Ayrca 4n genel durumunda (ve uniform ieren son rnekte), (X1, , Xn) istatistiinin
herhangi bir eyin sapmasz ve tutarl tahmin edicisi olmasn istemedik, fakat gerek
parametrede kesin monoton olmak zorundayd. Ancak, normal durumlar( in varyans
hakknda bilgi sahip olsak ta olmasak ta) ve durum 3 iin gven araln
oluturduumuzda, tutarl olmak zorundaydk.
2 Hipotez Testi
om
Fikir: bir kitleden elde edilen bir rasgele rneklem verilmi olsun, kitle hakkndaki baz
iddialara kar kmak iin yeterince kant var mdr? nce baz nemli kavramlar
tanmlayalm:
.c
ri
bir hipotez bir kitledeki (poplasyon) bir rasgele deikenin dalm hakknda bir
varsaymdr
sabit(maintained) hipotez test edilemeyen ancak ne olursa olsun doru olduu
varsaylan bir hipotezdir.
test edilebilir hipotez rasgele bir deikenden elde edilen kantlara gre test
edilebilir ve test edilecek bir hipotezdir.
bo hipotez test edilecek bir hipotezdir
alternatif hipotez bo hipotez dnda kitle hakkndaki dier olas varsaymdr.
tla
de
rs
no
Test problemi X1, , Xn rneklemini elde ettiimiz younluk f(x|0) ile ilintili olan 0
parametresinin 0 olas parametre deerler kmesine ait olup olmamas olarak ifade
edilebilir. Genellikle bo hipotezi aadaki gibi yazarz:
burada
Eer 0 = { 0} sadece bir tek parametre deeri ierirse, hipotezin basit olduunu
syleriz. Bir bileik hipotez birden fazla deer veya bir say aralnn tmn ieren bir
kmesi tarafndan verilir.
ee
om
Hipotezi test etmek iin veri toplamak zorundayz ve veriye dayanarak bo hipotezi ret
veya kabul edebiliriz. Ancak, verimiz her zaman btn kitlenin bir rneklemi olduu iin,
verdiimiz kararlarda hata yapma ihtimalimiz vardr. Belirli bir test iin 1. Tip hata yapma
olasl yle verilir:
Bu testin gvenirlik dzeyi (ayn zamanda bykl) olarak adlandrlr. Eer aadaki
ifadeyi yazarsak,
.c
de
rs
no
tla
ri
ee
Bunun arkasndaki mantk ilk bata sezgisel alglamaya ters gibi grnr halbuki bu
gzlemlerden, btn kitleye genelletirilen ampirik sorundan veya bilimsel kanundan
kaynaklanmaktadr. Bilimsel kanun: kitle hakkndaki hipotezimizi dorulayan birka an
yakalam bile olsak, uymayan bir an gzlemlemek rtmek iin yeterlidir. Bu nedenle
ampirik kantlar sadece bir hipotezi ret etmek iin kullanabiliriz, hibir zaman kantlamak
iin deil. Aadaki Bertand Russeln mehur bir rneidir:
Evcilletirilmi hayvanlar kendilerini normalde besleyen kiileri grd
zaman yiyecek beklerler. Olduka kaba bu davrann tekdzelii,
yanlglarn sorumlusu olduunu biliriz. Tavuklar mrleri boyunca her
gn besleyen adam sonunda onun boynunu koparr, sanki doann
tekdzelii tavuklar iin yararlaym bak asna ince bir ayar yapar gibi.
[..] Gerek olan u ki, bir eyin belli sayda tekrarlanm olmas
hayvanlarda ve insanlarda ayn eyin tekrar olaca beklentisinin
olumasna neden olur. gdmz kesinlikle yarn gnein doacana
bizi inandrr, fakat beklenmeyen bir ekilde boynu kopartlan tavuktan
daha iyi durumda olmayabiliriz. (Rusell, The Problems of Philosophy) ,
om
Bu nedenle, eer, rnein, belli bir ilacn hastann durumunu belirgin bir ekilde
iyiletirdii konusunda bir kant sunmak istersek, bo hipotez H0 : ilacn hastann
durumu zerinde hibir etkisi yoktur olur. Bu hipotezi ret etmek, ilacn etkisi konusunda
ok gl kant bulduumuz anlamna gelir. Yani her zaman bo hipotezi rtmek
istediimiz ifade olarak belirliyoruz.
ri
.c
Baka bir rnek olarak, hukuk sistemini dnebiliriz: bir srete, iki tarafta sulu
veya susuz eklinde bir sonuca ulamak iin ortaya veri (kantlar) srerler ve jri yine
de iki hata yapabilir: masum bir kiiyi sulu bulabilir (1. Tip Hata) ya da bir suluyu
susuz bulabilir (2. Tip Hata). Modern hukuk sistemlerinin ou yarglamalar kiinin
susuz olduu varsaymna dayandrr, yani phelinin suu ispatlanan kadar masum
olduu varsaylr. Baka bir ifade ile, suu ispatlamann yk yargca veya jriye,
phelinin gerekten de sulu olduu konusunda ikna etmek iin yeterli kantt ortaya
koymak zorunda olan savcya biner.
de
rs
no
tla
Hipotez testlere gre alnan kararlar, alternatifin doru olmasna kar bo hipotezin
dorulu iin bata belirtilen olasl grmezlikten geldiimiz manasnda optimal olmak
zorunda deildir ve 1. Tip ile 2.Tip hatalar yapmann ilgili maliyetlerini hesaba
katmazlar. Hukuk sistemi iin, n sulamay (preemption) savunanlar bir ok konuda,
rnein terrizm gibi, 2. Tip hatann ok pahalya mal olabileceini sk sk tartrlar. Bu
nedenle hukuk sistemi baz vakalarda susuzluk varsaym iin istisnalara izin
vermelidir.
ee
Toparlayacak olursak, X1, , Xn rnekleminin her bir olas olayn ret etme ile ret
etmeme kararna balayacak bir kural formle etmek istiyoruz.
om
Konrad Menzel
5 Mays 2009
.c
ri
i destekler. Bir
Eer Xi SX desteine sahipse, o zaman rneklem X = (X1, , Xn)
testin kritik blgesi kendisi iin bo hipotezi ret edeceimiz rneklemin desteinin
blgesidir.
tla
ee
de
rs
no
= 0 ile uyumlu olmayacak kadar ok byk X1 + X2nin deerlerini ret edecek bir test
tasarlayabiliriz. Bu ret blgesini ayn zamanda bir dorunun st tarafnda da
gsterebiliriz.
Eer n byk ise bu gsterimin kullanm ok kolaydr, nk ret blgesini dorudan X1,
, Xn ile hayal etmek ok zordur. Ancak, resmi nden tek boyuta indirgeyerek, kritik
blgelerin garip ekillerini belirme yetimizi kaybedebiliriz, ancak onlar pratik uygulama
asndan okta yararl deildirler zaten.
n
om
Bylece bu rnekte, test srecini bir test istatistiine dayandracaz, T n(X1, , Xn) =
ve Tnnin byk deerleri iin ret edeceiz.
de
rs
no
tla
ri
.c
kyi nasl seeceiz? iki hata tr arasnda dei-toku ile ka karya gelmek zorunda
kalacaz. Varsayalm ki imdi n = 25tir. Xi
N( ,4) olduu iin,
ee
Bu durumda, , kden herhangi birini belirlemek dier ikisini belirler, ve o seim 1.nci
ve 2.nci Tip hatalarn olaslklar arasnda belirli bir dei-toku ierir eer kyi
ykseltirsek, gvenirlik dzeyi der, ayn ekilde 1 gcde der. Spesifik olmak
gerekirse, eer k = 3/5 olarak seersek, %6.7 ve %15.87 olur.
Farkl rneklem byklkleri iin 1.nci ve 2.nci Tip hatalarn olaslklar arasndaki deitokuu eitli k seimleri iin aadaki gibi gsterebiliriz:
om
Dk bir k deeri daha byk g ve ayn zamanda daha byk gvenirlik dzeyi verir,
bylece kyi ykseltmek bizi grafik zerinde sola doru kaydrr.
kyi nasl sememiz gerekir? Normal kurulumda nceliin yanl ret etme olasl nn
kontrol edilmesine verildiini hatrlaynz, bu nedenle kyi 1. Tip hata olasln kabul
edilebilir bir dzeyde tutacak ekilde seeceiz, genellikle bu %5 veya %1dir.
de
rs
no
tla
ri
.c
Elbette, n
iken, sabit iin testin gc, 1 1e doru gider. Bir teaml olarak,
genellikle = %5 dzeyindeki bir ret edi anlamllk tr, benzer ekilde = %1de ret
etme yksek anlamllk tr.
ee
rnek 2. Bir nceki rnekte, sabit hipotez {0, 1} idi, fakat bu ok yapay bir
varsaymd ve genellikle bunun byle bir durum olduuna inanmak iin bir nedenimiz
yoktur.
Daha nce olduu gibi, varsayalm ki X1, , Xn bir i.i.d. rneklemdir, ancak imdi
aadakini test edeceiz:
H0 : = 0
HA : 0
imdi HA iki ynl bir bileik hipotezdir (yani alternatif altnda, birka deer alabilir,
25,
om
de
rs
no
tla
ri
.c
Sezgisel olarak, in hem byk ve hem kk deerleri iin H0 ret etmek anlamaldr.
Yani eer bo hipotez doru ise, byk ihtimalle her iki kuyrukta da deerler
grmeyeceiz. Alternatif hipotez, nn 0dan ya byk ya da kk olduuna dair
kantlar ile ilgilendiimizi ifade etmektedir.
ee
nedir? Alternatif tek bir olaslk kanunu belirlemedii ve onun yerine onlarn
srekliliini verdii iin, ok iyi tanmlanmamtr, yani sabit bir iin u yazlr:
Genellikle arzulanan bir gvenirlik dzeyi iin, k1, k2yi bo hipotezi tarafndan
varsaylan deer etrafnda simetrik olarak seeriz (normal dalmn bir tek tepe noktas
ve simetrik olduu iin, bu da kritik blgeyi olabildiince byk yapar).
om
Son rnek varyans bilinen bir normal kitleden elde edilen iin gven araln
oluturma yolunu hatrlatmal: Yukardaki sre aslnda aadakine benzerdir:
.c
1. iin bir 1 lk gven aral [A(X), B(X)] olutur (Durum 1, son dersteki notlara
baknz)
2. Eer 0 = 0 [A(X), B(X)] ise, H0' ret et
de
rs
no
tla
ri
Dolayl olarak bo hipotez altnda P(A(X) < <B(X) = 1 - olacak ekilde [A(X), B(X)]
araln oluturduumuz iin,
Tahmin ile ilgili tartmamzda olduu gibi, nce genel fikri tanttk sonra birka rnek
grdk. imdi ise testler arasnda nasl seim yapacamz ve onlar batan itibaren
nasl oluturacamz greceiz.
ee
Herhangi bir testin gvenirlik dzeyi = P(1. Tip) ve onun gc 1 = 1 P(2. Tip) ile
ilgileniriz. Eer her iki H0 ve HA basit hipotez ise, ve verili bir iin iyi tanmlanmtr
ve en basitinden 1 s en yksek, yani en gl, testi seeriz.
om
.c
H0 : = 0
N( ,4)
HA : > 0
ri
HA : = 1e kar H0 : = 0 iin en gl test eer > k ise ret et formunu alan testtir.
A > 0 olduu srece A ne olursa olsun testin genel formu deimez. Bundan tr,
> k ise
tla
de
rs
no
herhangi bir k
0 tercihinde en gldr.
k seiminin testin belirtilen gvenirlik dzeyi ya bal olduunu not ediniz. Bu, eer X1,
, Xn rneklemi iin aadaki olabilirlik oran dk ise, en gl test ret eder
anlamna gelir.
ee
om
.c
ri
tla
de
rs
no
ve g
in kritik
ee
susuz
0.3
olabilirlik oran
1/2
0.9
0.3
1/3
0.4
0.1
1/4
ri
3.
sulu
0.6
.c
1.
2.
om
Savcnn ortaya koyabilecei veya koyamayaca para potansiyel kant vardr. Bir
durumada jri kendisine gsterilen paradan sadece birine dayanarak mahkmiyet
karar verir. Aadakiler potansiyel kant paralardr, karlkl bamszlk
varsaylmtr. Tabloda ayrca sann sulu olduu veri iken her parann incelenmesi
olasl ile sann sulu olmad veri iken her parann incelenmesi olasl da
verilmitir.
de
rs
no
tla
her ipucu
mazeret, bulunan anta
ka, mazeret
mazeret
ka, bulunan anta
bulunan anta
ka
hibirisi
216/1000
144/1000
324/1000
216/1000
24/1000
16/1000
36/1000
24/1000
9/1000
21/1000
81/1000
189/1000
21/1000
49/1000
189/1000
441/1000
(k)
0.0417
0.1458
0.25
0.875
0.875
3.0625
5.25
18.375
9/1000
30/1000
111/1000
300/1000
321/1000
370/1000
559/1000
1
1.
2.
3.
4.
5.
6.
7.
8.
Olabilirlik Oran
r(x) =
ee
Jri, %5ten daha dk olaslkl yanl mahkmiyete karn (yani sank masum ise),
eer doru ise en az %95 gvenilirlikle mahkmiyet karar verir. Hipotez testi
terminolojisine gre, mahkmiyet karar, = %5 byklndeki en gl testi
kullanarak sann masum olduu bo hipotezinin ret edilmesi ile ilintilidir.
Son kolondaki (k) deerlerine baknca, ilk iki kanttn kombinasyondan fazla kant
eklemek yanl mahkmiyet olasl y %5ten fazla artrdn okuyabiliyoruz.
Dolaysyla, jri sulunun polisi grdnde kap kamamasna bakmadan, baka
om
olasl tam olarak %5 olurdu, fakat bu muhtemelen hukuk sistemi tarafnda kabul
edilebilir bir uygulama olmazd.
.c
rnek 5. Ortalamaya dayal bir testin normal durumda en gl test olduunu imdi
gsterebiliriz. Varsayalm ki Xi
N( , 4) ve HA : = 1e kar H0 : = 0 test edeceiz.
Burada 25 gzlemli i.i.d. olan bir X1, , X25 rneklemimiz var.
de
rs
no
tla
ri
Gzlemler i.i.d. normal olduklar iin, gzlemlenen rnekleme gre hesaplanan olabilirlik
oran aadaki ile verilir:
ee
om
Konrad Menzel
.c
7 Mays 2009
herhangi bir k
tla
ri
nerme 1 (Neyman-Pearson Lemma). fAya kar f0n testinde (her iki H0 ve HA basit
hipotezdir), kritik blge
0 tercihinde en gldr.
de
rs
no
k seiminin testin belirtilen gvenirlik dzeyi ya bal olduunu not ediniz. Bu, eer X1,
, Xn rneklemi iin aadaki olabilirlik oran dk ise, en gl test ret eder
anlamna gelir.
ee
om
.c
ri
tla
de
rs
no
ve g
in kritik
ee
rnek 1. Bir sank (D) kapkalktan mahkemededir. Mahkm etmek iin, jri %95
olaslkla kararn doru olduuna inanmak zorundadr.
susuz
0.3
olabilirlik oran
1/2
0.9
0.3
1/3
0.4
0.1
1/4
ri
3.
sulu
0.6
.c
1.
2.
om
Savcnn ortaya koyabilecei veya koyamayaca para potansiyel kant vardr. Bir
durumada jri kendisine gsterilen paradan sadece birine dayanarak mahkmiyet
karar verir. Aadakiler potansiyel kant paralardr, karlkl bamszlk
varsaylmtr. Tabloda ayrca sann sulu olduu veri iken her parann incelenmesi
olasl ile sann sulu olmad veri iken her parann incelenmesi olasl da
verilmitir.
de
rs
no
tla
her ipucu
mazeret, bulunan anta
ka, mazeret
mazeret
ka, bulunan anta
bulunan anta
ka
hibirisi
216/1000
144/1000
324/1000
216/1000
24/1000
16/1000
36/1000
24/1000
9/1000
21/1000
81/1000
189/1000
21/1000
49/1000
189/1000
441/1000
(k)
0.0417
0.1458
0.25
0.875
0.875
3.0625
5.25
18.375
9/1000
30/1000
111/1000
300/1000
321/1000
370/1000
559/1000
1
1.
2.
3.
4.
5.
6.
7.
8.
Olabilirlik Oran
r(x) =
ee
Jri, %5ten daha dk olaslkl yanl mahkmiyete karn (yani sank masum ise),
eer doru ise en az %95 gvenilirlikle mahkmiyet karar verir. Hipotez testi
terminolojisine gre, mahkmiyet karar, = %5 byklndeki en gl testi
kullanarak sann masum olduu bo hipotezinin ret edilmesi ile ilintilidir.
Son kolondaki (k) deerlerine baknca, ilk iki kanttn kombinasyondan fazla kant
eklemek yanl mahkmiyet olasl y %5ten fazla artrdn okuyabiliyoruz.
Dolaysyla, jri sulunun polisi grdnde kap kamamasna bakmadan, baka
om
olasl tam olarak %5 olurdu, fakat bu muhtemelen hukuk sistemi tarafnda kabul
edilebilir bir uygulama olmazd.
1. Testlerin Oluturulmas
tla
ri
.c
Genel olarak, optimal bir testin nasl oluturulmas gerektii sorusunun dorudan bir
cevab yoktur. Neyman-Pearson Lemma bir basit hipotezin dierine kar test
edilmesinin en gl testi iin basit bir reete vermektedir, fakat gerek dnya
uygulamalarnn ounda alternatif hipotez bileiktir. Aadaki neriler her zaman
tartmasz ok gl bir test vermeyen (bazen var bile olmayan) ama genellikle kabul
edilebilir sonular douran ilemler listesidir.
de
rs
no
1. Her her iki H0 ve HA basit ise, Neyman Pearson Lemma bize aadaki gibi bir
istatistik oluturmamz
ve uygun ekilde seilmi baz kler iin eer T(X) > k ise ret etmemizi syler(genellikle
k, testin bykl kesin olacak ekilde seilir). Bu test ayn zamanda olabilirlik oran
testi (LRT) olarak ta adlandrlr.
ee
2. eer H0 : = 0 basit ve HA :
0 bileik ve 2- tarafl ise, bir tahmin edici
kullanarak iin 1 lik gven aral [A(X), B(X)] (genellikle simetrik)
oluturabiliriz. Sonra eer 0 [A(X), B(X)] ise ret ederiz. Bu bize H0 iin
byklnde bir test verir.
3. eer H0 : = 0 basit t ve HA :
0 bileik ve tek-tarafl ise, iin simmetrik 1
2lk gven aral oluturabiliriz ve sadece eer bo hipotez deeri gven
aralnn dnda ise ve ilgili bykln elde etmek iin ilgili kuyrukta ise ret
ederiz.
4. ya H0 :
0 ya da HA :
0 (ya da her ikisi) bileik ise, aadaki istatistii
tanmla
ve uygun ekilde seilmi baz kler iin eer T(X) > k ise ret et. Bu tr testler
genelletirilmi olabilirlik oran testi (GLRT) olarak adlandrlr.
Son durumu daha nce tartmadmz iin, baz aklamalar yapmak gerekecek:
om
test akla uygundur nk, eer veri H0 desteklemezse T(X) kk olma eilimde
olacaktr.
younluklar her zaman pozitiftir, bu nedenle istatistik 0 ile 1 arasnda olacaktr
(nk zerinde younluu maksimize ettiimiz paydaki kme, zerinde
younluu maksimize ettiimiz paydadaki kmeyi ierdii iin)
bo hipotez altndaki test istatistiin kesin dalmn bilmemiz gerekir, bylece
uygun bir kritik deer kyi bulabiliriz. Dalmlarn ou iin, onu byk
rneklemlerle elde ederiz:
.c
burada p = dim(
A)
dim(
0).
tla
de
rs
no
ri
-2logT(X)
2. rnekler
H0 : = 7ye kar HA : = 6
var.
ee
10.
H0 altnda,
10
10,
dayandrmann
~ N(7, 0.1) ve HA
altnda 10 ~ N(6, 0.1)dir. Eer 10 < k ise test ret eder. Bu nedenle test bykl %5
olacak ekilde kyi semeliyiz, yani
10
.c
Bundan tr,
om
burada (.) standart normal c.d.f.dir. Bu nedenle aadaki denklemin tersini alarak kyi
elde ederiz
Bu testin gc nedir?
tla
ri
ne
dayal testin gc ve
de
rs
no
ee
rnek 3. Varsayalm ki nceki rnein kurulumuna olduu gibi sahibiz, fakat varyans
bilmiyoruz. Onun yerine, S2 = 1.5 gibi bir tahminimiz var. Testi nasl yapardnz? Daha
nce tarttmz gibi,
om
istatistii, eer gerek ortalama 0 ise n -1 serbestlik dereceli bir renci t-dalmdr.
Dolaysyla eer aadaki koul salanrsa, H0 ret ederiz:
= -1.83ten kktr.
tla
ri
.c
rnek 4. Xi ~ Bernoulli(p), i = 1,2,3, olsun. Yamuk bir paray birbirinden bamsz olarak
kere frlatyoruz ve eer tura gelirse Xi = 1dir, dier durumda Xi = 0dr. HA : p = 2/3e
kar H0 : p = 1/3 test etmek istiyoruz. Her iki test basit olduu iin, olabilirlik oran
testini kullanabiliriz,
de
rs
no
burada
in olas btn
ee
sadece 3 > 2/3 ise ret edebilirdik. Ayn sonucu douracak ekilde k = 2/3 seebiliriz.
Bu testin gc una eittir:
om
rnek 5. Varsayalm ki aadaki fonksiyon tarafndan tretilmi bir tek gzlemimiz var,
+ toplamn minimize eden test prosedrn bulunuz eer X = 0.6 ise ret
tla
ri
.c
eder miyiz? Sadece bir X gzlemimiz olduu iin, X cinsinden kritik blgeyi
oluturmak ok karmak deildir, baz ileri dzeyde istatistikleri bulmaya
almak ok ey kazandrmayacaktr (ancak Neyman-Pearson burada ie
yarayabilir). Younluk grafiine bakarak, k kritik deerlerinde kk X deerleri
iin testin ret etmesi gerektii konusunda ikna olabiliriz. Tip I ve Tip IInin
olaslklar, srasyla, 0 k 1 iin yledir,
de
rs
no
ve
Dolaysyla, eer X < 1/2 ise ret etmeliyiz ve = 1/4tr. Ancak, X = 0.6 iin H0
zelikle ret etmiyoruz.
ee
k=
Btn testler arasnda 0.1 gibi, en kk deerli testi bul. nedir? X = 0.4
olsa ret eder miydiniz? nce k iin (k) = 0.1i zeriz. Yukardaki forml
kullanarak, k =
olur. Dolaysyla,
om
ri
tla
.c
de
rs
no
Tnin pay maksimize edici zerinden hesaplanan olabilirlik ile elde edilir. Bu maksimum
olabilirlik tahmin edicidir, MLE = X(n) = max{ X1, , Xn }, yani
Dolaysyla
Test bykln arzulanan dzeye eitleyen istatistiin kritik deeri kyi bulmak iin,
= 0 bo hipotezi altndaki dalm bilmek zorundayz bunun iin sra istatistii
blmne bakmamz gerekebilir.
ee
Bir dip not olarak, daha nce byk nler iin, bo hipotez altnda GLRTnin bir ki-kare,
2
, dalm olduunu sylediimiz halde, bu rnek iin bunun doru olmad anlalyor
nk gerek parametre deerinde younluk srekli deildir.
om
Konrad Menzel
.c
12 Mays 2009
ri
1. rnekler
de
rs
no
tla
H0 : = 7ye kar HA : = 6
var.
dayandrmann
10.
10,
ee
burada (.) standart normal c.d.f.dir. Bu nedenle aadaki denklemin tersini alarak kyi
elde ederiz
Bundan tr,
10
Bu testin gc nedir?
ri
tla
dayal testin gc ve
.c
ne
om
de
rs
no
ee
istatistii, eer gerek ortalama 0 ise n -1 serbestlik dereceli bir renci t-dalmdr.
Dolaysyla eer aadaki koul salanrsa, H0 ret ederiz:
= -1.83ten kktr.
rnek 3. Xi ~ Bernoulli(p), i = 1,2,3, olsun. Yamuk bir paray birbirinden bamsz olarak
kere frlatyoruz ve eer tura gelirse Xi = 1dir, dier durumda Xi = 0dr. HA : p = 2/3e
om
kar H0 : p = 1/3 test etmek istiyoruz. Her iki test basit olduu iin, olabilirlik oran
testini kullanabiliriz,
in olas btn
de
rs
no
tla
ri
burada
.c
rnek 4. Varsayalm ki aadaki fonksiyon tarafndan tretilmi bir tek gzlemimiz var,
ee
+ toplamn minimize eden test prosedrn bulunuz eer X = 0.6 ise ret
eder miyiz? Sadece bir X gzlemimiz olduu iin, X cinsinden kritik blgeyi
oluturmak ok karmak deildir, baz ileri dzeyde istatistikleri bulmaya
almak ok ey kazandrmayacaktr (ancak Neyman-Pearson burada ie
yarayabilir). Younluk grafiine bakarak, k kritik deerlerinde kk X deerleri
om
iin testin ret etmesi gerektii konusunda ikna olabiliriz. Tip I ve Tip IInin
olaslklar, srasyla, 0 k 1 iin yledir,
.c
ve
ri
tla
de
rs
no
Dolaysyla, eer X < 1/2 ise ret etmeliyiz ve = 1/4tr. Ancak, X = 0.6 iin H0
zelikle ret etmiyoruz.
k=
Btn testler arasnda 0.1 gibi, en kk deerli testi bul. nedir? X = 0.4
olsa ret eder miydiniz? nce k iin (k) = 0.1i zeriz. Yukardaki forml
kullanarak, k =
olur. Dolaysyla,
ee
om
tla
de
rs
no
Dolaysyla
ri
.c
Tnin pay maksimize edici zerinden hesaplanan olabilirlik ile elde edilir. Bu maksimum
olabilirlik tahmin edicidir, MLE = X(n) = max{ X1, , Xn }, yani
Test bykln arzulanan dzeye eitleyen istatistiin kritik deeri kyi bulmak iin,
= 0 bo hipotezi altndaki dalm bilmek zorundayz bunun iin sra istatistii
blmne bakmamz gerekebilir.
Bir dip not olarak, daha nce byk nler iin, bo hipotez altnda GLRTnin bir ki-kare,
2
, dalm olduunu sylediimiz halde, bu rnek iin bunun doru olmad anlalyor
nk gerek parametre deerinde younluk srekli deildir.
ee
Varsayalm ki i.i.d. zeliine sahip iki rneklemimiz var, bunlar X1, , Xn ve Z1, , Zndir
ve potansiyel olarak ikisi farkl byklktedir, n1 ve n2 gibi. ki farkl dalm
oluturabiliriz:
om
.c
tla
ri
Sezgisel olarak, eer bo hipotez doru deil ise, T byk olmal (mutlak deer
cinsinden). Dolaysyla, bykle sahip HAya kar H0 testinde H0 ret edilir
eer aadaki koul salanrsa:
de
rs
no
ve
ee
Akas biz
ile
yi bilmiyoruz, fakat H0 :
Dolaysyla, eer aadaki koullar salanrsa byklkl bir test ret eder:
om
.c
imdiye kadar, veri retim prosesi f(x|) formunda olan ve sonlu parametre boyutuna
kadar bilinen durumdaki problemler ile ilgilendik. O durumdaki testlere parametrik
karm denilir.
ri
tla
Bir rasgele deikenin dalmnn tm kendi c.d.f.si ile karakterize edilebildii iin,
herhangi bir snrlama getirmeden(elbette ki geerli bir c.d.f. olmal yani monoton ve
sadan srekli), sanki veriden c.d.f.yi tahmin etmek iyi bir fikirmi gibi grnyor.
de
rs
no
ee
rnek 6. bir {-1, 3, 1, 1, 0.5, 2, 0} rneklemi iin, sralanm rneklem {-1, 0, 0.5, 1, 1,
2, 3}tr ve rneklem dalm fonksiyonu Fn(x)i grafik ile gsterebiliriz:
de
rs
no
tla
ri
.c
om
Bilinmeyen bir dalm ailesinden elde edilen bir X1, Xn rasgele rneklem ile
ilgili karm problemi ile ilgileniyoruz ve c.d.f.si F(x) olan (rnein bir standart normal
dalm iin F(x) = (x) gibi) belirli bir dalmdan elde edilip edilmediini test etmeyi
arzuluyoruz. Daha nceki tartmalarda alt izilen testlerden herhangi birini uygulamak
iin elimizde spesifik parametreler olmad iin, test fikri Fn(X)in F(x)ten ok fazla
sapp sapmadn kontrol etmek olur.
Gzlemlenen bir rneklemin F(x) dalm tarafndan tretilip tretilmediin test etmek
iin, Kolmogorov-Smirnov istatistiinin byk deerleri iin testi ret ederiz. statistik
aadaki gibi tanmlanr,
ee
om
statistiin kritik deerleri asimptotik (yani byk nler iin) dalm fonksiyonundan elde
edilebilir
de
rs
no
tla
ri
.c
rnek 7. Varsayalm ki bir madeni paray tekrar tekrar, rnein 160 kere, frlatyoruz ve
rneklemin bir B(4, 0.5) dalmndan tretilip tretilmediin = 0.2 gvenirlik dzeyi ile
test etmek istiyoruz. Diyelim ki aadaki rneklem frekanslarn gzlemledik:
ee
Tura says
rneklem frekans
Kmlatif rneklem frekans Fn(.)
H0 F(.) altnda Kmlatif frekans
fark
0
10
10
10
0
1
33
43
50
7
2
61
104
110
6
3
43
147
150
3
4
13
160
160
0
om
tla
ri
.c
Varsayalm ki dalm ailesi bilinmeyen iki bamsz rasgele rneklemimiz var ve bunlar
X1, , Xn ile Y1, , Yn olsun. Her iki rnekleminde ayn dalm tarafndan tretilip
tretilmediini test etmek istiyoruz. Buradaki dnce Fn(x) ile Gn(x)in birbirinden ok
uzakta olup olmadn test etmektir.
de
rs
no
Varsayalm ki n tane i.i.d. gzlemli bir rneklemdeki her bir Xi deeri k kadar, A1,, Ak,
kategoriden birine yerleecek ekilde snflandrld. p 1, , pk her bir kategorinin
olasl, ve f1, , fkde gzlemlenen frekanslar olsun. Aadaki bileik hipotezi
ee
ee
de
rs
no
tla
ri
.c
om
ve byk T deerleri iin ret ederiz. En uygun kritik deerleri belirlemek iin, Tnin nasl
daldn bilmek zorundayz. Maalesef, bu dalm ilgili modele baldr. Ancak, H0
altnda dalm asimptotik olarak modelden bamszdr ve byk n rneklemler iin
dir. Pratik bir kural olarak, eer n
4k ise ki-kare tahmini
asimptotik olarak T ~
alabilir.
om
Konrad Menzel
14 Mays 2009
.c
1. Tekrar
ri
Nokta Tahmini
rneklemin tahmin edici fonksiyonu (X1, , Xn)
Tahmin edicinin sapmas
de
rs
no
tla
Sapmaszlk
Etkinlik
Tutarllk
1. Momentler Yntemi
mnci kitle momenti
ee
.c
om
Gven Aral
tla
ri
de
rs
no
ee
om
normal deil, n > 30 veya daha fazla: imdiye kadar grdmz tahmin
edicilerin asimptotik olarak normal dalml olduklarn grdk, dolaysyla sz
konusu tahmini kullanacaz ve bir nceki durumu uygulayacaz. Varyans
bilsek te bilmesek te t-dalmn kullanarak bir ekilde gven aralnn tahmin
kullanmn cezalandrm olacaz.
normal deil, n kk: eer (a) in p.d.f.sini biliyorsak, ilk durumu kullanarak
gven aral oluturabiliriz, eer (b) p.d.f.yi bilmiyorsak, yapabileceimiz bir ey
yoktur
.c
de
rs
no
tla
ri
Hipotez Testi
eer
baz monoton fonksiyonlar iin eer g(T(X)) < g(k) ise ret et formundaki bir test
eer T(X) < k ret et formundaki bir testin benzeridir.
ee
ve uygun bir ekilde seilmi k deerleri iin eer T(X) < k ise ret et (Neyman-Pearson
Lemmaya gre en gl olan)
om
ri
.c
ki-rneklem Testi
de
rs
no
tla
uygun bir ekilde seilmi k deerleri iin eer T(X) < k ise ret et.
(i)
veya
ee
(ii)
om
.c
de
rs
no
tla
ri
(a) varsayalm ki k (0, )dr. Yinin bir fonksiyonu olarak momentin yntemini de
kullanarak iin bir tahmin edici tretin. Ayrca, (0, ) aralnda olmak iin neden
kye gereksinim duyduunuzu aklaynz.
(b) imdi varsayalm ki k (0, )dr ve k bilinmeyen parametre dan daha byk
Cevaplar:
ee
(a) bir-boyutlu olduu iin, sadece Yinin birinci momentini kullanmak zorundayz.
Kitlenin beklenen deeri
om
eer k < ise, momentler ynteminin tahmin edicisi aadaki gibi zlerek
elde edilir
tla
ri
.c
(b) eer k > ise, [Yi] = P(Xi k) = max{1 (k/), 0} = 0 artk ya bal deildir.
Eer knin dan daha byk veya kk olduunu bilmiyorsak, parametre
kurulumunu snrlandrmak iin momentler ynteminin tahmin edicisinin mantn
kullanabiliriz:
de
rs
no
Dolaysyla,
Loglar alnca,
ee
iin znce,
om
ri
.c
(a) Aadaki kurulum iin, %5lik gvenirlik dzeyinde en gl testi veren blgeyi
belirtiniz. Testin gcn hesaplaynz.
de
rs
no
tla
(b) Aadaki kurulum iin, %5lik gvenirlik dzeyinde en gl testi veren blgeyi
belirtiniz.
(c) nnin ve nnin hangi deerleri iin (a)da ki = 0 hipotez ile (b)deki = 1
hipotezini ayn anda kabul edersiniz?
(d) Aadaki kurulum iin, %5lik gvenirlik dzeyinde uniform olarak en gl testi
veren blgeyi belirtiniz.
(e) (a) ve (b)deki testlerin kritik blgeleri arasnda nasl bir iliki vardr? 2. Tip hata
yapma olaslklarnn ilikisi nedir?
ee
Cevaplar:
(a) Neyma-Pearson Lemmaya gre, en gl test olabilirlik oranna dayanr
Eer olabilirlik oran kritik deerden dk ise en gl test ret eder, ya da benzer
ekilde, eer uygun bir ekilde seilmi k iin n > k ise, ret eder (snavda bunu hal
hazrda trettiimizi belirtmeniz yeterlidir).
bylece k =
N(0, 1/n),
om
Bo hipotez altnda,
k = 1 +
de
rs
no
tla
ri
.c
yledir:
(d) Bu test (a)dakinin aynsdr, nk herhangi bir > 1 deeri iin olabilirlik oran
rneklem ortalamas nnin kesin azalan bir fonksiyonudur ve byklndeki bir
testin k kritik deerleri, blm (a)da olduu gibi, sadece bo hipotezin altndaki
dalm tarafndan belirleniyor.
ee
(e) Kritik blgeler ayndr, fakat, btn alternatifler = 1e gre bo hipotezden daha
uzakta olduklar iin, blm (d)deki 2. Tip hatann olasl daha kktr,