You are on page 1of 25

Binomna raspodela

Bernoullijev ogled – ogled sa binomnim (dihotomnim)


Binomna, Poissonova i međusobno isključivim ishodima:
1. ishod od interesa, povoljan ishod, “uspeh” (sa
normalna raspodela verovatnoćom p)
2. nepovoljan ishod, “neuspeh” (sa verovatnoćom q=1- p)

Bernoullijev proces:
Goran Trajković 1. Ponavljanje jednog ogleda sa dva ishoda
2. Ogledi su nezavisni
februar, 2009. godine 3. Verovatnoća ishoda u pojedinačnim ogledima je jednaka

Binomna raspodela Binomni keoficijent – broj kombinacija x povoljnih ishoda


u n ogleda:
n!
x!(n − x )!
Raspodela verovatnoća diskretne slučajne promenljive za Npr. broj kombinacija za dva ostvarena povoljna ishoda
broj ostvarenih događaja od interesa u ogledu koji se sastoji (x=2) u sekvenci od 4 nezavisnih ogleda (n=4) iznosi 6:
od fiksnog broja Bernoullijevih ogleda. Slučajna promenljiva
može imati celobrojne nenegativne vrednosti x=0, 1, 2, ..., 4!
=6
n koje predstavljaju:
2!(4 − 2 )!
(1) broja “povoljnih” ishoda posle n pokušaja, ili (2) broja
jedinica sa datom karakteristikom u uzorku veličine n.
Ako je A povoljan, a B nepovoljan ishod, specifične
kombinacije za dva “povoljna” ishoda u 4 ogleda imaće
izgled:

AABB ABAB ABBA BAAB BABA BBAA

Binomna verovatnoća – verovatnoća da će se ostvariti x


povoljnih ishoda u sekvenci od n nezavisnih ogleda
Primer:
n!
P(x ) =
Ako je učestalost krvne grupe A u datoj populaciji 42%
⋅ p x q n− x
x!(n − x )! (p=0.42), verovatnoća da će slučajan uzorak veličine 7
osoba (n=7), izabran iz te iste populacije, sadržati 2 osobe
x – broj “uspeha” sa krvnom grupom A (x=2) iznosi:
n – broj dihotomnih ogleda (veličina uzorka)
p – verovatnoća “uspeha”
q – verovatnoća “neuspeha”
7!
P(x ) = ⋅ 0.42 2 ⋅ 0.58(7 − 2 ) = 0.243
2!(7 − 2)!
n i p – parametri binomne raspodele

Očekivanje μ = n⋅ p

Standardna devijacija σ = n⋅ p⋅q

1
U istom primeru, verovatnoće za svih 8 mogućih rezultata,
da u uzorku neće biti nijedne, pa sve do toga će svih 7
Poissonova raspodela
osoba imati krvnu grupu A (x= 0, ... 7) iznose (tabelarno i
grafički): Poissonova raspodela definiše verovatnoće broja
retkih slučajnih događaja u konstatnoj jednici
Broj osoba sa p
krvnom grupom A prostora ili vremena.
0 0.022
Za ove događaje važi:
1 0.112 0.4
1. Događaji su nezavisni. Pojava jednog događaja ne
2 0.243 0.3 utiče na verovatnoću drugog događaja (slučajnost
Verovatnoća

3 0.294
0.2 događaja)
4 0.213 2. U teorijskom smilsu, moguć je beskonačan broj
0.1
5 0.092 događaja u konstantnoj jedinici prostora ili vremena
6 0.022 0
3. U bilo kom malom intervalu ili prostoru verovatnoća
0 1 2 3 4 5 6 7
7 0.002 Broj osoba sa krvnom grupom A pojave događaja proporcionalna je veličini intervala
Σ 1.000

Poissonova raspodela Funkcija verovatnoć


verovatnoća Poissonove
oissonove
raspodele
raspodele
Funkcija verovatnoća Poissonove raspodele definisana je
formulom:
Primeri moguće primene u analizi:
•Slučajne raspodele retkih bolesti u različitim delovima λx
P( x ) = e −λ
zemlje x!
•Broja zahteva za hitnu medicinsku intervenciju
•Broja mutacija u lancu DNA za dati nivo radijacije x - broj ostvarenih događaja u konstatnoj jednici prostora
ili vremena,
•Broj bakterijskih kolonija, ili broja bakterija u
λ- parametar Puasonove raspodele i predstavlja
preparatu prosečan broj događaja u jednici prostora ili vremena,
•Broja krvnih ćelija u komori za prebrojavanje e ≈ 2.72 (osnova prirodnih logaritama)
•Broja nesreća Očekivana vrednost, varijansa i standardna devijacija:

μ =σ 2 = λ σ= λ

Verovatnoća za nula događaja (x=0) dobija se iz tablice ili Primer:


pomoću formule: Broj porođaja po danima u jednoj opštini u vremesnkom
λ0 periodu od 110 dana iznosio je:
P(0) = e −λ
0! broj porođaja 0 1 2 3 4 5 6 7 8 9 10
Verovatnoće za jedan, dva ili više (x=1, 2, ...) događaja u jednom danu
mogu se dobiti rekurzivnim formulama:
broj dana 2 10 18 23 22 16 10 5 3 0 1

P(1) = P(0)λ
λ Kolika je verovatnoća da u jednom danu budu dva porođaja?
P(2) = P(1) Kolika je verovatnoća da u jednom danu bude manje od 3
2 porođaja? Kolika je verovatnoća da u jednom danu bude više
λ
P(3) = P(2) od 2 porođaj?
3

2
Prosečan broj porođaja po jednom danu iznosio je: Normalna raspodela
λ=412/110=3.75
Kontinuirana raspodela verovatnoća. Definisana formulom:
Verovatnoća da u jednom danu ne bude porođaja iznosi: ( x− μ )2
P(0) = 0.024 1 −
f (x) =
2

e
σ 2π
Verovatnoća da u jednom danu budu dva porođaja oznosi:
P(2) = 0.166 μ – sredina, σ2 – varijansa, π – 3.14, e – 2.72

Verovatnoća da u jednom danu bude manje od 3 porođaja f(X)


iznosi: •Kompletno opisana
P(X<3) = P(0) + P(1) + P(2) = 0.024 + 0.088 + 0.166 = 0.278 parametrima μ i σ.
•Dobra aproksimacija za mnoge
biološke varijable. σ
Verovatnoća da u jednom danu bude više od 2 porođaja
iznosi: P(X>4) = 1 – (P(0) + P(1) + P(2)) = •Osnova u procesu statističkog
= 1 – 0.024 + 0.088 + 0.166 = 0.722 zaključivanja μ X

Osobine normalne
ormalne raspodele
raspodele Standardna
Standardna normalna
normalna raspodela
Sve normalne raspodele mogu biti konvertovane u
standardnu normalnu raspodelu oduzimanjem aritmetičke
• U intervalu od μ-σ do sredine od svake vrednosti i deljenjem sa standardnom
μ+σ nalazi se 68% devijacijom čime se dobijaju standardni skorovi ili z-skorovi:
vrednosti
• U intervalu od μ-2σ do
X −μ
Z=
μ+2σ nalazi se 95% σ
vrednosti Standardna normalna raspodela ima μ=0 i σ=1.
• U intervalu od μ-3σ do 0.4
μ+3σ nalazi se 99.7%
vrednosti 0.3

0.2

0.1

-2 -1 0 1 2 3

Tabele površ
površine ispod krive Tabele površ
površine ispod krive
standardne
tandardne normalne
normalne raspodele standardne
tandardne normalne
normalne raspodele
Primer:
Telesna masa određene populacije dece je normalno
Tabele pokazuje površine odnosno verovatnoće da neka raspoređena sa aritmetičkom sredinom 15kg i SD 3kg.
vrednost bude veća ili manja od specifikovane standardne Kolika je verovatnoća da će slučajno izabrano dete imati
vrednosti. Ako tabela pokazuje površine od -∞ do z0 onda telesnu masu između 11kg i 17kg?
vrednosti u toj tabeli pokazuju verovatnoće: P(z≤z0).
Uz pomoć tabela se može izračunati verovatnoća da se
neka vrednost nađe između dve specifikovane standardne 11 − 15 17 − 15
z1 = = −1.33 z2 = = 0.66
vrednosti. 3 3

P(11≤x ≤17)=P(-1.33≤z ≤0.66)= 0.4082+0.2454=0.6536

3
Provera normalnosti raspodele Provera normalnosti raspodele
1. CV>50% ukazuje na odstupanje od normalne Grafičke metode:
raspodele 4. Histogram – vizuelna procena da li je empirijska
2. Vrednosti skjunisa i kurtosisa od -1 do 1 ukazuju na raspodela slična zvonastoj simetričnoj raspodeli
normalnu raspodelu. Vrednosti skjunisa i kurtosisa
veće od 3 i manje od -3 ukazuju na odstupanje od 5. Normalni Q–Q grafikon. Ako je raspodela normalna
normalne raspodele. Kod pozitivno iskošene tačke će biti na pravoj liniji. Odstupanje tačaka od
raspodele aritmetička sredina je veća od medijane. prave linije ukazuje na odstupanje raspodele od
Kod negativno iskošene raspodele aritmetička normalne.
sredina je manja od medijane 6. Detrendovani normalni Q–Q grafikon. Ako je
3. Statističko testiranje normalnosti: Kolmogorov- raspodela normalna tačke će biti ravnomerno
Smirnov test i Shapiro-Wilk test. Ako je p<0.05 u raspoređene iznad i ispod horizontalne linije. Ako
ovim testovima, empirijska raspodela statistički raspodela nije normalna raspored tačaka će imati
značajno odstupa od normalne.
neki oblik kao npr. slovo J

Provera normalnosti raspodele


8. Grafikon kutije (“boxplot”). Ako postoji nekoliko
ekstremnih vrednosti ili neobičnih vrednosti na bilo
kom kraju raspodele to ukazuje na odstupanje od
normalne raspodele. Ako medijana nije u centru
grafikona kutije već je znatno bliža jednom od
krajeva kutije, to ukazuje na odstupanje od
normalne raspodele

4
Binomna, Poissonova i
normalna raspodela

Goran Trajković

februar, 2009. godine


Binomna raspodela

Bernoullijev ogled – ogled sa binomnim (dihotomnim)


međusobno isključivim ishodima:
1. ishod od interesa, povoljan ishod, “uspeh” (sa
verovatnoćom p)
2. nepovoljan ishod, “neuspeh” (sa verovatnoćom q=1- p)

Bernoullijev proces:
1. Ponavljanje jednog ogleda sa dva ishoda
2. Ogledi su nezavisni
3. Verovatnoća ishoda u pojedinačnim ogledima je jednaka
Binomna raspodela

Raspodela verovatnoća diskretne slučajne promenljive za


broj ostvarenih događaja od interesa u ogledu koji se sastoji
od fiksnog broja Bernoullijevih ogleda. Slučajna promenljiva
može imati celobrojne nenegativne vrednosti x=0, 1, 2, ...,
n koje predstavljaju:
(1) broja “povoljnih” ishoda posle n pokušaja, ili (2) broja
jedinica sa datom karakteristikom u uzorku veličine n.
Binomni keoficijent – broj kombinacija x povoljnih ishoda
u n ogleda:
n!
x!(n − x )!
Npr. broj kombinacija za dva ostvarena povoljna ishoda
(x=2) u sekvenci od 4 nezavisnih ogleda (n=4) iznosi 6:
4!
=6
2!(4 − 2 )!

Ako je A povoljan, a B nepovoljan ishod, specifične


kombinacije za dva “povoljna” ishoda u 4 ogleda imaće
izgled:

AABB ABAB ABBA BAAB BABA BBAA


Binomna verovatnoća – verovatnoća da će se ostvariti x
povoljnih ishoda u sekvenci od n nezavisnih ogleda
n!
P(x ) = ⋅ p x q n− x
x!(n − x )!
x – broj “uspeha”
n – broj dihotomnih ogleda (veličina uzorka)
p – verovatnoća “uspeha”
q – verovatnoća “neuspeha”

n i p – parametri binomne raspodele

Očekivanje μ = n⋅ p

Standardna devijacija σ = n⋅ p⋅q


Primer:
Ako je učestalost krvne grupe A u datoj populaciji 42%
(p=0.42), verovatnoća da će slučajan uzorak veličine 7
osoba (n=7), izabran iz te iste populacije, sadržati 2 osobe
sa krvnom grupom A (x=2) iznosi:

7!
P(x ) = ⋅ 0.42 ⋅ 0.58
2 (7 − 2 )
= 0.243
2!(7 − 2 )!
U istom primeru, verovatnoće za svih 8 mogućih rezultata,
da u uzorku neće biti nijedne, pa sve do toga će svih 7
osoba imati krvnu grupu A (x= 0, ... 7) iznose (tabelarno i
grafički):
Broj osoba sa p
krvnom grupom A
0 0.022
1 0.112 0.4

2 0.243 0.3
3 0.294 Verovatnoća
0.2
4 0.213
0.1
5 0.092
6 0.022 0
0 1 2 3 4 5 6 7
7 0.002 Broj osoba sa krvnom grupom A

Σ 1.000
Poissonova raspodela
Poissonova raspodela definiše verovatnoće broja
retkih slučajnih događaja u konstatnoj jednici
prostora ili vremena.

Za ove događaje važi:


1. Događaji su nezavisni. Pojava jednog događaja ne
utiče na verovatnoću drugog događaja (slučajnost
događaja)
2. U teorijskom smilsu, moguć je beskonačan broj
događaja u konstantnoj jedinici prostora ili vremena
3. U bilo kom malom intervalu ili prostoru verovatnoća
pojave događaja proporcionalna je veličini intervala
Poissonova raspodela

Primeri moguće primene u analizi:


•Slučajne raspodele retkih bolesti u različitim delovima
zemlje
•Broja zahteva za hitnu medicinsku intervenciju
•Broja mutacija u lancu DNA za dati nivo radijacije
•Broj bakterijskih kolonija, ili broja bakterija u
preparatu
•Broja krvnih ćelija u komori za prebrojavanje
•Broja nesreća
Funkcija verovatnoća Poissonove
raspodele
Funkcija verovatnoća Poissonove raspodele definisana je
formulom:
λx
P(x ) = e −λ

x!
x - broj ostvarenih događaja u konstatnoj jednici prostora
ili vremena,
λ- parametar Puasonove raspodele i predstavlja
prosečan broj događaja u jednici prostora ili vremena,
e ≈ 2.72 (osnova prirodnih logaritama)
Očekivana vrednost, varijansa i standardna devijacija:

μ =σ = λ
2
σ= λ
Verovatnoća za nula događaja (x=0) dobija se iz tablice ili
pomoću formule:
λ0
P(0 ) = e −λ

0!
Verovatnoće za jedan, dva ili više (x=1, 2, ...) događaja
mogu se dobiti rekurzivnim formulama:

P(1) = P(0 )λ
λ
P(2 ) = P(1)
2
λ
P(3) = P(2 )
3
Primer:
Broj porođaja po danima u jednoj opštini u vremesnkom
periodu od 110 dana iznosio je:

broj porođaja 0 1 2 3 4 5 6 7 8 9 10
u jednom danu

broj dana 2 10 18 23 22 16 10 5 3 0 1

Kolika je verovatnoća da u jednom danu budu dva porođaja?


Kolika je verovatnoća da u jednom danu bude manje od 3
porođaja? Kolika je verovatnoća da u jednom danu bude više
od 2 porođaj?
Prosečan broj porođaja po jednom danu iznosio je:
λ=412/110=3.75

Verovatnoća da u jednom danu ne bude porođaja iznosi:


P(0) = 0.024

Verovatnoća da u jednom danu budu dva porođaja oznosi:


P(2) = 0.166

Verovatnoća da u jednom danu bude manje od 3 porođaja


iznosi:
P(X<3) = P(0) + P(1) + P(2) = 0.024 + 0.088 + 0.166 = 0.278

Verovatnoća da u jednom danu bude više od 2 porođaja


iznosi: P(X>4) = 1 – (P(0) + P(1) + P(2)) =
= 1 – 0.024 + 0.088 + 0.166 = 0.722
Normalna raspodela
Kontinuirana raspodela verovatnoća. Definisana formulom:
( x− μ )2
1 −
f (x) = e 2σ 2

σ 2π
μ – sredina, σ2 – varijansa, π – 3.14, e – 2.72

f(X)
•Kompletno opisana
parametrima μ i σ.
•Dobra aproksimacija za mnoge
biološke varijable. σ
•Osnova u procesu statističkog
zaključivanja μ X
Osobine normalne raspodele

„ U intervalu od μ-σ do
μ+σ nalazi se 68%
vrednosti
„ U intervalu od μ-2σ do
μ+2σ nalazi se 95%
vrednosti
„ U intervalu od μ-3σ do
μ+3σ nalazi se 99.7%
vrednosti
Standardna normalna raspodela
Sve normalne raspodele mogu biti konvertovane u
standardnu normalnu raspodelu oduzimanjem aritmetičke
sredine od svake vrednosti i deljenjem sa standardnom
devijacijom čime se dobijaju standardni skorovi ili z-skorovi:
X −μ
Z=
σ
Standardna normalna raspodela ima μ=0 i σ=1.
0.4

0.3

0.2

0.1

-2 -1 0 1 2 3
Tabele površine ispod krive
standardne normalne raspodele

Tabele pokazuje površine odnosno verovatnoće da neka


vrednost bude veća ili manja od specifikovane standardne
vrednosti. Ako tabela pokazuje površine od -∞ do z0 onda
vrednosti u toj tabeli pokazuju verovatnoće: P(z≤z0).
Uz pomoć tabela se može izračunati verovatnoća da se
neka vrednost nađe između dve specifikovane standardne
vrednosti.
Tabele površine ispod krive
standardne normalne raspodele
Primer:
Telesna masa određene populacije dece je normalno
raspoređena sa aritmetičkom sredinom 15kg i SD 3kg.
Kolika je verovatnoća da će slučajno izabrano dete imati
telesnu masu između 11kg i 17kg?

11 − 15 17 − 15
z1 = = −1.33 z2 = = 0.66
3 3

P(11≤x ≤17)=P(-1.33≤z ≤0.66)= 0.4082+0.2454=0.6536


Provera normalnosti raspodele
1. CV>50% ukazuje na odstupanje od normalne
raspodele
2. Vrednosti skjunisa i kurtosisa od -1 do 1 ukazuju na
normalnu raspodelu. Vrednosti skjunisa i kurtosisa
veće od 3 i manje od -3 ukazuju na odstupanje od
normalne raspodele. Kod pozitivno iskošene
raspodele aritmetička sredina je veća od medijane.
Kod negativno iskošene raspodele aritmetička
sredina je manja od medijane
3. Statističko testiranje normalnosti: Kolmogorov-
Smirnov test i Shapiro-Wilk test. Ako je p<0.05 u
ovim testovima, empirijska raspodela statistički
značajno odstupa od normalne.
Provera normalnosti raspodele
Grafičke metode:
4. Histogram – vizuelna procena da li je empirijska
raspodela slična zvonastoj simetričnoj raspodeli
5. Normalni Q–Q grafikon. Ako je raspodela normalna
tačke će biti na pravoj liniji. Odstupanje tačaka od
prave linije ukazuje na odstupanje raspodele od
normalne.
6. Detrendovani normalni Q–Q grafikon. Ako je
raspodela normalna tačke će biti ravnomerno
raspoređene iznad i ispod horizontalne linije. Ako
raspodela nije normalna raspored tačaka će imati
neki oblik kao npr. slovo J
Provera normalnosti raspodele
8. Grafikon kutije (“boxplot”). Ako postoji nekoliko
ekstremnih vrednosti ili neobičnih vrednosti na bilo
kom kraju raspodele to ukazuje na odstupanje od
normalne raspodele. Ako medijana nije u centru
grafikona kutije već je znatno bliža jednom od
krajeva kutije, to ukazuje na odstupanje od
normalne raspodele

You might also like