Professional Documents
Culture Documents
de
Estatstica
Braslia 2003
NDICE
INTRODUO................................................................................................................ 01
UNIDADE I Conceitos Iniciais em Estatstica.............................................................. 05
UNIDADE II Normas para Construo de Tabelas....................................................... 15
UNIDADE III Normas para Construo de Grficos..................................................... 25
UNIDADE IV Distribuio de Freqncias....................................................................34
UNIDADE V Medidas de Posio e Separatrizes......................................................... 42
UNIDADE VI Medidas de Disperso............................................................................ 56
UNIDADE VII Medidas de Assimetria e Curtose......................................................... 62
UNIDADE VIII Introduo Teoria da Probabilidade................................................. 65
UNIDADE IX Variveis Aleatrias............................................................................... 71
UNIDADE X Distribuies Discretas............................................................................ 85
UNIDADE XI Distribuio Contnuas........................................................................... 90
UNIDADE XII Estimao.............................................................................................. 94
UNIDADE XIII Testes de Significncia......................................................................... 97
UNIDADE XIV Regresso Linear e Correlao.............................................................101
UNIDADE XV Aplicaes no Excel............................................................................. 109
1
INTRODUO
1.1. PANORAMA HISTRICO
Toda Cincia tem suas razes na histria do homem;
A Matemtica que considerada A Cincia que une a clareza do raciocnio sntese da linguagem,
originou-se do convvio social, das trocas, da contagem, com caracter prtico, utilitrio e emprico;
A Estatstica um ramo da Matemtica que teve origem semelhante;
Desde a antigidade vrios povos j registravam o nmero de habitantes, de nascimento, de bitos, faziam
estimativas de riquezas individuais e sociais, etc;
Na idade mdia colhiam-se informaes, geralmente com a finalidade tributria;
A partir do sculo XVI comearam a surgir as primeiras anlises de fatos sociais, como batizados,
casamentos, funerais, originando as primeiras tbuas e tabelas e os primeiros nmeros relativos;
No sculo XVII o estudo de tais fatos foi adquirindo propores verdadeiramente cientficas;
Godofredo Achenwall, batizou a nova cincia (ou mtodo) com o nome de ESTATSTICA, determinando
assim o seu objetivo e suas relaes com a cincia.
1.2. MTODO
Existem vrias definies para mtodos, Lakatos e Marconi (1982:39-40) mencionaram diversas
definies, entre elas:
Mtodo o caminho pelo qual se chega a um determinado resultado... (Hegemberg, 1976:II-115)
Mtodo um procedimento regular, explcito e passvel de ser repetido para conseguirmos alguma coisa,
seja material ou conceitual (Bunge 1980: 19)
1.3. A ESTATSTICA
A definio de estatstica no nica, a estatstica abrange muito mais do que um simples traado de
grficos e clculos de medidas. Uma definio seria:
A estatstica uma coleo de mtodos para planejar experimentos, obter dados e organiz-los, resumi-
lo, analis-los interpret-los e deles extrair concluses.
1.4. O MTODO ESTATSTICO
Dois mtodos cientficos podem destacar o mtodo Experimental e o Mtodo Estatstico.
O mtodo experimental consiste em manter constante todas as causas (fatores) menos uma e variar esta
causa de modo que o pesquisador possa descobrir seus efeitos caso existam.
O mtodo estatstico diante da impossibilidade de se manter causas constantes, admite todas essas
causas presentes variando-as registrando essa variao e procurando determinar no resultado final que
influncias cabem a cada uma delas.
2
RESUMO DA PROFISSO
O Estatstico promove o levantamento de pesquisas estatsticas em suas aplicaes tcnicas e cientficas,
investigando, elaborando e testando mtodos matemticos e sistema de amostragem, bem como coletando,
analisando e interpretando os dados relacionados com os fenmenos estatsticos, e ainda estudando e
renovando a metodologia estatstica a fim de estabelecer a sua evoluo e desenvolvimento
ALGUMAS ESPECIALIZAES
Vinculam-se aos campos profissionais que exigem ou permitem o exerccio do estatstico. Resultam da prtica
profissional e decorrem quase sempre da demanda decorrente no mercado de trabalho.
Demografia
Bioestatstica
Estatstico Matemtico
Estatstico de Estatstica Aplicada, Etc.
CARGOS PROCURADOS
Estatstico
Estatstico Matemtico
Estatstico de Estatstica Aplicada
1.5. A NATURZA DA ESTATSTICA
Podemos descrever duas variveis para um estudo:
VARIVEL QUALITATIVA (ou dados categricos) podem ser separados em diferentes categorias,
atributos, que se distinguem por alguma caracterstica no numrica.
VARIVEL QUANTITATIVA consistem em nmeros que representam contagens ou medidias.
Dividem-se em:
VARIVEIS QUANT. DISCRETAS resultam de um conjunto finito, enumervel de valores
possveis. Ex: nmero de filhos.
VARIVEIS QUANT. CONTNUAS resultam de nmeros infinitos de valores possveis que
podem ser associados a pontos em uma escala contnua. Ex: peso, altura.
Medida de Desobedincia
Como coletar dados sobre algo que no se apresente mensurvel, como o nvel de desobedincia do povo? O
psiclogo Stanley Milgran planejou o seguinte experimento: Um pesquisador determinou que um voluntrio
acionasse um painel de controle que dava choques eltricos crescentemente dolorosos em uma terceira pessoa.
Na realidade, no eram dados choques e a terceira pessoa era um ator. O voluntrio comeou com 15 volts e foi
orientado a aumentar os choques de 15 em 15 volts. O nvel de desobedincia era o ponto em que a pessoa se
recusava a aumentar a voltagem. Surpreendentemente, dois teros dos voluntrios obedeceram s ordens
mesmo que o ator gritasse e simulasse um ataque cardaco.
3
Texto extrado do livro: Tiola, Mario F. . Introduo Estatstica. 7
<
=
25 n se , n
25 n se 5,
K
Frmula de Sturges: K= 1 + 3,32 log(n)
onde: n = tamanho da amostra.
EXEMPLO:
Considere o exemplo apresentada no ROL:
( ) 6 K 5,9 K 30 log 3,32 1 K = = + =
Portanto, a tabela ir conter 6 classes.
7) AMPLITUDE DA CLASSE (h):
K
R
h = (aproximar para o maior inteiro).
EXEMPLO:
Considere novamente o exemplo apresentada no ROL:
3 h 5 , 2 h
6
15
h = = =
8) LIMITE DE CLASSES: Representado por
10 |-| 12: valores entre 10 e 12;
10 -| 12 : valores de 10 a 12, excluindo o 10;
10 |- 12 : valores de 10 a 12, excluindo o 12.
Obs.: Neste curso iremos utilizar a ltima representao.
36
EXEMPLO:
Considere o exemplo apresentada no ROL:
9) PONTO MDIO DA CLASSE (x
i
) : a mdia aritmtica entre o limite superior (L
i
) e o inferior da classe
(l
i
).
2
L l
x
i i
i
+
=
EXEMPLO:
Da tabela acima:
10) FREQNCIA ABSOLUTA ACUMULADA (F
ac
): a soma das freqncias dos valores inferiores ou
iguais ao valor dado.
Exemplo:
Classe F
i
21 |- 24 8
24 |- 27 9
27 |- 30 1
30 |- 33 4
33 |- 36 7
36 |- 39 1
TOTAL 30
Classe F
i
x
i
21 |- 24 8 22,5
24 |- 27 9 25,5
27 |- 30 1 28,5
30 |- 33 4 31,5
33 |- 36 7 34,5
36 |- 39 1 37,5
TOTAL 30 -
Classe F
i
x
i
F
ac
21 |- 24 8 22,5 8
24 |- 27 9 25,5 17
27 |- 30 1 28,5 18
30 |- 33 4 31,5 22
33 |- 36 7 34,5 29
36 |- 39 1 37,5 30
TOTAL 30 - -
37
11) FREQNCIA RELATIVA SIMPLES ( f
i
): A freqncia relativa de um valor dada por,
=
i
i
i
F
F
f , ou
ser a percentagem daquele valor na amostra caso multiplique por 100.
Exemplo:
12) FREQNCIA RELATIVA ACUMULADA (f
ac
): a soma das freqncias relativas dos valores inferiores
ou iguais ao valor dado.
Exemplo:
13) HISTOGRAMA: a representao grfica de uma distribuio de FREQNCIA por meio de retngulos
justapostos (veja exemplo a seguir).
14) POLGONO DE FREQNCIA: a representao grfica de uma distribuio por meio de um polgono.
Exemplo:
HISTOGRAMA E POLGONO DE FREQUNCIA SIMPLES DA TABELA ACIMA
Classe F
i
x
i
F
ac
f
i
21 |- 24 8 22,5 8 0,267
24 |- 27 9 25,5 17 0,300
27 |- 30 1 28,5 18 0,033
30 |- 33 4 31,5 22 0,133
33 |- 36 7 34,5 29 0,233
36 |- 39 1 37,5 30 0,033
TOTAL 30 - - 1,000
Classe F
i
x
i
F
ac
f
i
f
ac
21 |- 24 8 22,5 8 0,267 0,267
24 |- 27 9 25,5 17 0,300 0,567
27 |- 30 1 28,5 18 0,033 0,600
30 |- 33 4 31,5 22 0,133 0,733
33 |- 36 7 34,5 29 0,233 0,966
36 |- 39 1 37,5 30 0,033 1,000
TOTAL 30 - - 1,000 -
0
1
2
3
4
5
6
7
8
9
10
Classes
F
i
21 24 27 30 33 36 39
38
15) POLGONO DE FREQNCIA ACUMULADA:
Exemplo:
POLGONO DE FREQUNCIA ACUMULADA DA TABELA ACIMA
0
5
10
15
20
25
30
Classes
F
a
c
21 24 27 30 33 36 39
39
EXERCCIOS
1. Um dado foi lanado 50 vezes e foram registrados os seguintes resultados
5 4 6 1 2 5 3 1 3 3
4 4 1 5 5 6 1 2 5 1
3 4 5 1 1 6 6 2 1 1
4 4 4 3 4 3 2 2 2 3
6 6 3 2 4 2 6 6 2 1
2. Construa uma distribuio de freqncia sem intervalo de classe e determine:
a) A amplitude Total (n)
i) 5
ii) 6
iii) 7
iv) 10
v) 50
b) A freqncia total
i) 5
ii) 6
iii) 7
iv) 10
v) 50
c) A freqncia simples absoluta do primeiro elemento:
i) 10%
ii) 20%
iii) 1
iv) 10
v) 20
d) A freqncia simples relativa do primeiro elemento:
i) 10%
ii) 20%
iii) 1
iv) 10
v) 20
e) A freqncia acumulada do primeiro elemento:
i) 10%
ii) 20%
iii) 1
iv) 10
v) 20
f) A freqncia acumulada relativa do primeiro elemento:
i) 10%
ii) 20%
iii) 1
iv) 10
v) 20
g) A freqncia simples absoluta do segundo elemento:
i) 19
ii) 9
iii) 2
iv) 38%
40
v) 18%
h) A freqncia simples relativa do quinto elemento:
i) 12%
ii) 84%
iii) 5
iv) 6
v) 42
i) A freqncia acumulada relativa do sexto elemento:
i) 50
ii) 8
iii) 6
iv) 100%
v) 16%
3. Dado o rol de medidas das alturas (dadas em cm) de uma amostra de 100 indivduos de uma faculdade:
151 152 154 155 158 159 159 160 161 161
161 162 163 163 163 164 165 165 165 166
166 166 166 167 167 167 167 167 168 168
168 168 168 168 168 168 168 168 169 169
169 169 169 169 169 170 170 170 170 170
170 170 171 171 171 171 172 172 172 173
173 173 174 174 174 175 175 175 175 176
176 176 176 177 177 177 177 178 178 178
179 179 180 180 180 180 181 181 181 182
182 182 183 184 185 186 187 188 190 190
calcule:
a) a amplitude amostral;
b) o nmero de classes;
c) a amplitude de classes;
d) os limites de classes;
e) as freqncias absolutas das classes;
f) as freqncias relativas;
g) os pontos mdios das classes;
h) as freqncias acumuladas;
i) o histograma e o polgono de freqncia;
j) o polgono de freqncia acumulada;
k) faa um breve comentrio sobre os valores das alturas desta amostra atravs da distribuio de frequncia.
4. Os dados seguintes representam 20 observaes relativas ao ndice pluviomtrico em determinado
municpio do Estado:
Milmetros de chuva
a) Determinar o nmero de classes pela regra de Sturges;
b) Construir a tabela de freqncias absolutas simples;
144 152 159 160
160 151 157 146
154 145 151 150
142 146 142 141
141 150 143 158
41
c) Determinar as freqncias absolutas acumuladas;
d) Determinar as freqncias simples relativas;
5. Considere a seguinte distribuio de frequncia correspondente aos diferentes preos de um determinado
produto em vinte lojas pesquisadas.
a) Quantas lojas apresentaram um preo de R$52,00?
b) Construa uma tabela de freqncias simples relativas.
c) Construa uma tabela de freqncias absolutas acumuladas.
d) Quantas lojas apresentaram um preo de at R$52,00 (inclusive)?
e) Qual o percentual de lojas com preo maior de que R$51,00 e menor de que R$54,00?
6. O quadro seguinte representa as alturas (em cm) de 40 alunos de uma classe.
a) Calcular a amplitude total.
b) Admitindo-se 6 classes, qual a amplitude do intervalo de classe?
c) Construir uma tabela de frequncia das alturas dos alunos.
d) Determinar os pontos mdios das classes.
7. Vinte alunos foram submetidos a um teste de aproveitamento cujos resultados so.
Pede-se agrupar tais resultados em uma distribuio de freqncias:
Preos No. De lojas
50 2
51 5
52 6
53 6
54 1
Total 20
162 163 148 166 169 154 170 166
164 165 159 175 155 163 171 172
170 157 176 157 157 165 158 158
160 158 163 165 164 178 150 168
166 169 152 170 172 165 162 164
26 28 24 13 18
18 25 18 25 24
20 21 15 28 17
27 22 13 19 28
25
UNIDADE III - NORMAS PARA CONSTRUO DE GRFICOS
Introduo
Tem como finalidade:
Representar os resultados de forma simples, clara e verdadeira
Demonstrar a evoluo do fenmeno em estudo
Observar a relao dos valores da srie
Normas para construo de grficos
A disposio dos elementos idntica das tabelas:
CABEALHO DO GRFICO
CORPO DO GRFICO
RODAP
26
TIPOS DE GRFICOS
GRFICO EM COLUNAS
Conjunto de retngulos dispostos verticalmente separados por um espao.
Tabela 01. Efetivo do CBMDF em Cinco Regies Administrativas do DF - 1998
FONTE: Banco de Dados do Distrito Federal 1998
NOTAS: Os efetivos especializados (emergncia mdica, incndio florestal e guarda e
segurana) esto alocados nas regies administrativas.
Grfico 01. Efetivo do CBMDF em algumas Regies Administrativas do DF - 1998
Fonte: Tabela 01
GRFICOS EM BARRAS
Semelhante ao grfico em colunas, porm os retngulos so dispostos horizontalmente.
Regio Efetivo
Administrativa
RA I - Braslia 867
RA III - Taguatinga 443
RA V - Sobradinho 116
RA XIII - Santa Maria 77
RA XVIII - Lago Norte 203
Total 1.706
0
100
200
300
400
500
600
700
800
900
1.000
RA I - Braslia RA III - Taguatinga RA V - Sobradinho RA XIII - Santa Maria RA XVIII - Lago Norte
Regio Administrativa
E
f
e
t
i
v
o
27
Tabela 02. Efetivo do CBMDF em Cinco Regies Administrativas do DF - 1998
FONTE: Banco de Dados do Distrito Federal 1998
NOTAS: Os efetivos especializados (emergncia mdica, incndio florestal e guarda e
segurana) esto alocados nas regies administrativas.
Grfico 02. Efetivo do CBMDF em algumas Regies Administrativas do DF - 1998
Fonte: Tabela 02
0 100 200 300 400 500 600 700 800 900 1.000
RA I - Braslia
RA III - Taguatinga
RA V - Sobradinho
RA XIII - Santa Maria
RA XVIII - Lago Norte
R
e
g
i
o
A
d
m
i
n
i
s
t
r
a
t
i
v
a
Efetivo
Regio Efetivo
Administrativa
RA I - Braslia 867
RA III - Taguatinga 443
RA V - Sobradinho 116
RA XIII - Santa Maria 77
RA XVIII - Lago Norte 203
Total 1.706
28
GRFICO EM SETORES
a representao atravs de um crculo, por meio de setores.
Muito utilizado quando pretendemos comparar cada valor da srie com o total - proporo.
Forma de clculo:
Tabela 03. Efetivo (valores absoluto e relativo) do CBMDF em Cinco Regies Administrativas do DF - 1998
FONTE: Banco de Dados do Distrito Federal 1998
NOTAS: Os efetivos especializados (emergncia mdica, incndio florestal e guarda e
segurana) esto alocados nas regies administrativas.
Total 360
o
parte x
o
Efetivo x
o
RA I - Braslia 867 183,0
RA III - Taguatinga 443 93,5
RA V - Sobradinho 116 24,5
RA XIII - Santa Maria 77 16,2
RA XVIII - Lago Norte 203 42,8
Total 1.706 360,0
Regio
Administrativa Absoluto Relativo (%)
RA I - Braslia 867 50,82
RA III - Taguatinga 443 25,97
RA V - Sobradinho 116 6,80
RA XIII - Santa Maria 77 4,51
RA XVIII - Lago Norte 203 11,90
Total 1.706 100,00
Efetivo
29
Grfico 03.a. Comparativo (percentual) do Efetivo do CBMDF em Cinco Regies Administrativas do DF
1998
FONTE: Tabela 03
Grfico 03.b. Comparativo (percentual) do Efetivo do CBMDF em Cinco Regies Administrativas do DF
1998
FONTE: Tabela 03
RA I - Braslia
50,82%
RA III - Taguatinga
25,97%
RA V - Sobradinho
6,80%
RA XIII - Santa
Maria
4,51%
RA XVIII - Lago
Norte
11,90%
RA I - Braslia
50,82%
RA III - Taguatinga
25,97%
RA V - Sobradinho
6,80%
RA XIII - Santa
Maria
4,51%
RA XVIII - Lago
Norte
11,90%
30
GRFICO EM CURVAS / LINHAS
Muito utilizado para representar dados temporais.
Tabela 04. Populao da RA XIV So Sebastio 1991 a 1995
FONTE: Censo Demogrfico de 1991 IBGE
Estimativas para 1992 a 1995 - CODEPLAN
Grfico 04. Populao da RA XIV So Sebastio 1991 a 1995
FONTE: Tabela 04
Grfico 05. Populao da RA XIV So Sebastio 1991 a 1995
Ano Populao
1991 17.399
1992 20.971
1993 25.271
1994 30.457
1995 36.703
15.000
20.000
25.000
30.000
35.000
40.000
1990 1991 1992 1993 1994 1995 1996
Ano
P
o
p
u
l
a
o
0
10.000
20.000
30.000
40.000
50.000
60.000
1990 1991 1992 1993 1994 1995 1996
Ano
P
o
p
u
l
a
o
FONTE: Tabela 04
31
GRFICO POLAR / RADAR
Representao por meio de um polgono
Geralmente presta-se para apresentao de sries temporais
Grfico 05. Populao da RA XIV So Sebastio 1991 a 1995
FONTE: Tabela 04
0
10.000
20.000
30.000
40.000
1991
1992
1993 1994
1995
32
EXERCCIOS
1. Assinale a afirmativa verdadeira:
a) Um grfico de barras ou colunas aquele em que os retngulos que o compem esto dispostos
horizontalmente.
b) Um grfico de barras ou colunas aquele em que os retngulos que o compem esto dispostos
verticalmente.
c) Um grfico de barras aquele em que os retngulos que o compem esto dispostos verticalmente e um
grfico de colunas, horizontalmente.
d) Um grfico de barras aquele em que os retngulos que o compem esto dispostos horizontalmente e um
grfico de colunas, verticalmente.
e) Todas as alternativas anteriores so falsas.
2. O grfico mais comumente utilizado quando se deseja evidenciar a participao de um dado em relao ao total
denominado:
a) Grfico em barras;
b) Grficos em colunas;
c) Grfico em setores;
d) Grfico pictrico ou pictograma;
e) Grfico decorativo.
3. Uma representao grfica comumente encontrada em jornais e revistas que inclui figuras de modo a torn-las
mais atraente denominada:
a) Grfico em barras;
b) Grficos em colunas;
c) Grfico em setores;
d) Grfico pictrico ou pictograma;
e) Grfico decorativo.
4. A tabela abaixo mostra o consumo de determinada bebida durante um baile de carnaval:
Bebida Consumo (l)
Vinho 100
Suco de Frutas 200
gua Mineral 400
Refrigerante 700
Cerveja 1600
Foi construdo um grfico em setores para melhor representar o fenmeno acima.
a) Qual o ngulo do setor correspondente ao vinho?
i) 6
ii) 10
iii) 12
iv) 24
v) 100
b) Qual o ngulo do setor correspondente ao suco de frutas?
i) 12
ii) 20
iii) 24
iv) 48
v) 200
c) Qual o ngulo do setor correspondente gua mineral?
33
i) 24
ii) 40
iii) 48
iv) 84
v) 100
d) Qual o ngulo do setor correspondente aos refrigerantes?
i) 42
ii) 70
iii) 84
iv) 192
v) 700
e) Qual o ngulo do setor correspondente s cervejas?
i) 12
ii) 96
iii) 160
iv) 192
v) 1600
42
UNIDADE V - MEDIDAS DE POSIO E SEPARATRIZES
MEDIDAS DE POSIO
As medidas de posio, tambm chamada de medidas de tendncia central, possuem trs formas
diferentes para trs situaes distintas:
MDIA ARITMTICA
Existem duas mdias:
POPULACIONAL, representada letra grega
AMOSTRAL, representada por x
1
a
SITUAO: Dados no agrupados
Sejam os elementos x
1
, x
2
, x
3
,...,x
n
de uma amostra, portanto n valores da varivel X. A mdia aritmtica
da varivel aleatria de X definida por,
n
x
x
1
i
=
=
n
i ou simplesmente,
n
x
x
=
onde n o nmero de elementos do conjunto.
Exemplo:
Suponha o conjunto de tempo de servio de cinco funcionrios: 3, 7, 8, 10 e 11. Determinar a mdia aritmtica
simples deste conjunto de dados.
8 , 7
5
39
5
11 10 8 7 3
x = =
+ + + +
=
Interpretao: o tempo mdio de servio deste grupo de funcionrios de 7,8 anos.
2
a
SITUAO: Dados agrupados em uma distribuio de frequncia por valores simples
Quando os dados estiverem agrupados numa distribuio de freqncia usaremos a mdia aritmtica dos
valores x
1
, x
2
, x
3
,...,x
n
, ponderados pelas respectivas freqncias absolutas: F
1
, F
2
, F
3
, ... , F
n
. Assim
n
F x
x
1
i i
=
=
n
i
Exemplo:
Em um determinado dia foi registrado o nmero de veculos negociados por uma amostra de 10
vendedores de uma agncia de automveis obtendo a seguinte tabela:
43
Portanto:
6 , 2
10
26
x = =
Interpretao: em mdia, cada vendedor negociou 2,6 veculos.
3
a
SITUAO: Dados agrupados em uma distribuio de frequncia por classes
Quando os dados estiverem agrupados numa distribuio de freqncia usaremos a mdia aritmtica dos
pontos mdios x
1
, x
2
, x
3
,...,x
n
de cada classe, ponderados pelas respectivas freqncias absolutas: F
1
, F
2
, F
3
, ... ,
F
n
. Desta forma, o clculo da mdia passa a ser igual ao da 2
a
situao. Assim
n
F x
x
1
i i
=
=
n
i
Exemplo:
A tabela abaixo representa os escores obtidos por um grupo de 58 alunos matriculados em uma determinada
disciplina:
Portanto,
62,24 =
58
3610
x =
Interpretao: o desempenho mdio deste grupo de alunos foi de 62,24 pontos nesta disciplina.
ESCORES ALUNOS x
i
x
i
F
i
(F
i
)
35 |- 45 5 40 200
45 |- 55 12 50 600
55 |- 65 18 60 1.080
65 |- 75 14 70 980
75 |- 85 6 80 480
85 |- 95 3 90 270
TOTAL 58 - 3.610
veculos nmero de
negociados vendedores x
i
F
i
(x
i
) (F
i
)
1 1 1
2 3 6
3 5 15
4 1 4
TOTAL 10 26
44
MODA - Mo
Dentre as principais medidas de posio, destaca-se a moda. o valor mais freqente da distribuio.
1
a
SITUAO: Dados no agrupados
Sejam os elementos x
1
, x
2
, x
3
,...,x
n
de uma amostra, o valor da moda para este tipo de conjunto de dados
simplesmente o valor com maior frequncia.
Exemplo 1:
Suponha o conjunto de tempo de servio de cinco funcionrios: 3, 7, 8, 8 e 11. Determinar a moda deste
conjunto de dados.
= 8 Mo distribuio unimodal ou modal
Interpretao: o tempo de servio com maior frequncia de 8 anos.
Exemplo 2:
Suponha o conjunto de tempo de servio de cinco funcionrios: 3, 3, 7, 8, 8 e 11. Determinar a moda deste
conjunto de dados.
=
=
8 Mo
3 Mo
distribuio bimodal
Interpretao: os tempos de servio com maior frequncia foram de 3 e 8 anos.
Exemplo 3:
Suponha o conjunto de tempo de servio de cinco funcionrios: 3, 7, 8, 10 e 11. Determinar a moda deste
conjunto de dados.
Mo existe no distribuio amodal
Interpretao: no existe o tempo de servio com maior frequncia.
2
a
SITUAO: Dados agrupados em uma distribuio de frequncia por valores simples
Para este tipo de distribuio, a identificao da moda facilitada pela simples observao do elemento que
apresenta maior freqncia. Assim, para a distribuio
Exemplo:
Em um determinado dia foi registrado o nmero de veculos negociados por uma amostra de 10
vendedor de uma agncia de automveis obtendo a seguinte tabela:
veculos nmero de
negociados vendedores
(x
i
) (F
i
)
1 1
2 3
3 5
4 1
TOTAL 10
45
Portanto, se a maior frequncia F
i
= 5, logo Mo = 3.
Interpretao: A quantidade de veculos comercializados no dia com maior frequncia foi de 3 veculos.
3
a
SITUAO: Dados agrupados em uma distribuio de frequncia por classes
Para dados agrupados em classes, temos diversas frmulas para o clculo da moda. A utilizada ser:
Frmula de Czuber
Procedimento:
a) Identifica-se a classe modal (aquela que possuir maior freqncia) CLASSE(Mo).
b) Utiliza-se a frmula:
h
+
+ l Mo
2 1
1
i
=
em que:
modal classe da amplitude h
F F
F F
modal classe da inferior limite l
post i, i 2
ant i, i 1
i
=
=
=
=
Exemplo:
A tabela abaixo representa os escores obtidos por um grupo de 58 alunos matriculados em uma determinada
disciplina:
( )
4 14 18
6 12 18
:
61 Mo 6 55 10
4 6
6
55 Mo
65 | 55 Mo CLASSE
2
1
= =
= =
= + =
+
+ =
onde
Interpretao: O escore com maior frequncia entre o grupo de 58 alunos foi de 61 pontos.
ESCORES ALUNOS
F
i
35 |- 45 5
45 |- 55 12
55 |- 65 18
65 |- 75 14
75 |- 85 6
85 |- 95 3
TOTAL 58
46
MEDIANA - Md
Construdo o ROL, o valor da mediana o elemento que ocupa a posio central, ou seja, o elemento
que divide a distribuio em 50% de cada lado:
1
a
SITUAO: Dados no agrupados
Sejam os elementos x
1
, x
2
, x
3
,...,x
n
de uma amostra, portanto n valores da varivel X. A mediana da
varivel aleatria de X definida por,
+
+
=
2
1 n
posio na localizado valor o ser mediana da valor o ento mpar,
2
1 n
posio adjacentes s observae duas das mdia a ser mediana da valor o ento par,
n se
Exemplo 1:
Suponha o conjunto de tempo de servio de cinco funcionrios: 3, 7, 8, 10 e 11. Determinar a mediana deste
conjunto de dados.
Como
3
2
1 5
posio na localizado estar mediana da valor o ento 5, n =
+
=
. Portanto,
8 Md =
Interpretao: 50% dos funcionrios possuem at 8 anos de tempo de servio, ou, 50% dos funcionrios possuem
no mnimo 8 anos de tempo de servio.
Exemplo 2:
Suponha o conjunto de tempo de servio de cinco funcionrios: 3, 7, 8, 10, 11 e 13. Determinar a mediana deste
conjunto de dados.
Como
5 , 3
2
1 6
posio na localizado estar mediana da valor o ento 6, n =
+
=
. Portanto,
9
2
10 8
=
+
= Md
Interpretao: 50% dos funcionrios possuem at 9 anos de tempo de servio, ou, 50% dos funcionrios possuem
no mnimo 9 anos de tempo de servio.
2
a
SITUAO: Dados agrupados em uma distribuio de frequncia por valores simples
Quando os dados estiverem agrupados numa distribuio de freqncia identificaremos a mediana dos
valores x
1
, x
2
, x
3
,...,x
n
pela posio da mediana ( )
2
n
Md POS = atravs da frequncia absoluta acumulada - F
ac
,
100% 50% 0%
Md
47
Exemplo:
Em um determinado dia foi registrado o nmero de veculos negociados por uma amostra de 10
vendedor de uma agncia de automveis obtendo a seguinte tabela:
Portanto:
( ) 3 Md 5
2
10
Md POS = = =
Interpretao: 50% dos vendedores comercializaram no mximo 3 veculos, ou ento, metade dos vendedores
comercializou pelo menos 3 veculos.
3
a
SITUAO: Dados agrupados em uma distribuio de frequncia por classes
Procedimento:
1. Calcula-se a posio da mediana: ( )
2
n
Md POS =
2. Pela F
ac
identifica-se a classe que contm o valor da mediana - CLASSE(Md)
3. Utiliza-se a frmula:
( )
h
F
F - Md POS
+ l = Md
i
ant ac,
i
onde:
l
i
= Limite inferior da classe mediana
n = Tamanho da amostra ou nmero de elementos
F
ac,ant
= Frequncia acumulada anterior classe mediana
h = Amplitude da classe mediana
F
i
= Freqncia absoluta simples da classe mediana
Exemplo:
A tabela abaixo representa os escores obtidos por um grupo de 58 alunos matriculados em uma determinada
disciplina:
veculos nmero de
negociados vendedores F
ac
(x
i
) (F
i
)
1 1 1
2 3 4
3 5 9
4 1 10
TOTAL 10 -
48
Portanto,
61,67 Md 67 , 6 55 10
18
17 - 29
55 Md . 3
65 | 55 CLASSE(Md) . 2
29
2
58
POS(Md) . 1
= + = + =
=
= =
Interpretao: 50% dos alunos obtiveram escore mximo de 61,67 pontos, ou ento, metade dos alunos
obtiveram escore maior que 61,67 pontos..
SEPARATRIZES
QUARTIS
Os quartis dividem um conjunto de dados em quatro partes iguais.
Assim:
Onde:
Q
1
= 1 quartil, deixa 25% dos elementos
Q
2
= 2 quartil, coincide com a mediana, deixa 50% dos elementos
Q
3
= 3 quartil, deixa 75% dos elementos
Procedimento:
1. Calcula-se a posio do quartil:
( )
1,2,3 i : onde
i
4
n
Q POS
i
=
=
2. Pela F
ac
identifica-se a classe que contm o valor do quartil - CLASSE(Q
i
)
100%
Q
1
Q
2
= Md Q
3
0% 25% 50% 75%
ESCORES ALUNOS F
ac
(F
i
)
35 |- 45 5 5
45 |- 55 12 17
55 |- 65 18 35
65 |- 75 14 49
75 |- 85 6 55
85 |- 95 3 58
TOTAL 58 -
49
3. Utiliza-se a frmula:
( )
h
F
F - Q POS
+ l = Q
i
ant ac, i
i i
onde:
l
i
= Limite inferior da classe quartlica
n = Tamanho da amostra ou nmero de elementos
F
ac,ant
= Frequncia acumulada anterior classe quartlica
h = Amplitude da classe quartlica
F
i
= Freqncia absoluta simples da classe quartlica
Exemplo:
A tabela abaixo representa os escores obtidos por um grupo de 58 alunos matriculados em uma determinada
disciplina. Calcule o primeiro e o terceiro quartil.
Portanto,
2,92 5 Q 92 , 7 45 10
12
5 - 14,5
5 4 Q . 3
55 | 45 ) CLASSE(Q . 2
5 , 14 1
4
58
) POS(Q . 1
1 1
1
1
= + = + =
=
= =
Interpretao: 25% dos alunos obtiveram escore mximo de 52,92 pontos, ou ento, 75% dos alunos obtiveram
escore maior que 52,92 pontos.
07 , 71 Q 07 , 6 65 10
14
35 - 43,5
5 6 Q . 3
75 | 65 ) CLASSE(Q . 2
5 , 43 3
4
58
) POS(Q . 1
3 3
1
3
= + = + =
=
= =
Interpretao: 75% dos alunos obtiveram escore menor que 71,07 pontos, ou ento, 25% dos alunos obtiveram
escore de pelo menos 71,07 pontos.
ESCORES ALUNOS F
ac
(F
i
)
35 |- 45 5 5
45 |- 55 12 17
55 |- 65 18 35
65 |- 75 14 49
75 |- 85 6 55
85 |- 95 3 58
TOTAL 58 -
50
DECIS
So valores que divide a srie em dez partes.
Procedimento:
1. Calcula-se a posio da medida:
( )
6,7,8,9 1,2,3,4,5, i : onde
i
10
n
POS
i
=
= D
2. Pela F
ac
identifica-se a classe que contm o valor do decil - CLASSE(D
i
)
3. Utiliza-se a frmula:
( )
h
F
F - D POS
+ l = D
i
ant ac, i
i i
onde:
l
i
= Limite inferior da classe do decil
n = Tamanho da amostra ou nmero de elementos
F
ac,ant
= Frequncia acumulada anterior classe do decil
h = Amplitude da classe do decil
F
i
= Freqncia absoluta simples da classe do decil
Exemplo:
A tabela abaixo representa os escores obtidos por um grupo de 58 alunos matriculados em uma determinada
disciplina. Calcule o sexto decil.
Portanto,
ESCORES ALUNOS F
ac
(F
i
)
35 |- 45 5 5
45 |- 55 12 17
55 |- 65 18 35
65 |- 75 14 49
75 |- 85 6 55
85 |- 95 3 58
TOTAL 58 -
D
8
D
9
D
2
D
3
D
4
D
5
D
6
D
7
90% 100% 0%
D
1
50% 60% 70% 80% 10% 20% 30% 40%
51
89 , 64 D 89 , 9 55 10
18
17 - 34,8
5 5 D . 3
65 | 55 ) CLASSE(D . 2
8 , 34 6
10
58
) POS(D . 1
6 6
6
6
= + = + =
=
= =
Interpretao: 60% dos alunos obtiveram escore inferior a 64,89 pontos, ou ento, 40% dos alunos obtiveram
escore mnimo de 64,89 pontos.
PERCENTIS
So as medidas que dividem a amostra em 100 parte iguais. A frmula ser:
Procedimento:
1. Calcula-se a posio da medida:
( )
98,99 1,2,3,..., i : onde
i
100
n
POS
i
=
= P
2. Pela F
ac
identifica-se a classe que contm o valor do percentil - CLASSE(P
i
)
3. Utiliza-se a frmula:
( )
h
F
F - P POS
+ l = P
i
ant ac, i
i i
onde:
l
i
= Limite inferior da classe do percentil
n = Tamanho da amostra ou nmero de elementos
F
ac,ant
= Frequncia acumulada anterior classe do percentil
h = Amplitude da classe do percentil
F
i
= Freqncia absoluta simples da classe do percentil
Exemplo:
A tabela abaixo representa os escores obtidos por um grupo de 58 alunos matriculados em uma determinada
disciplina. Calcule o percentil de ordem 23.
.. .
.30%..
.P
80
.. .P
90
.. .P
20
.. .P
30
.. .P
40
.. .P
50 ..
.P
60
.. .P
70
..
.90%.. .100% 0%..
.P
10
..
.50%.. .60%.. .70%.. .80%.. .10%.. .20%.. .40%..
ESCORES ALUNOS F
ac
(F
i
)
35 |- 45 5 5
45 |- 55 12 17
55 |- 65 18 35
65 |- 75 14 49
75 |- 85 6 55
85 |- 95 3 58
TOTAL 58 -
52
Portanto,
95 , 51 P 95 , 6 45 10
12
5 - 13,34
5 4 P . 3
55 | 45 ) CLASSE(P . 2
34 , 13 23
100
58
) POS(P . 1
23 23
23
23
= + = + =
=
= =
Interpretao: 23% dos alunos com os menores escores obtiveram pontuao inferior a 51,95 pontos, ou ento,
77% dos alunos obtiveram escore maior que 51,95 pontos.
53
EXERCCIOS
1. Construa uma tabela para mostrar que, em determinado curso, o nmero de alunos matriculados nas 1
, 2
e
3
\
|
=
=
|
|
.
|
\
|
=
n
x
x
1 - n
1
1 - n
x x
S
ou
N
x
x
N
1
N
x
2
i 2
i
2
i 2
2
i 2
i
2
i 2
Obs.: A Segunda frmula chamada de Frmula Desenvolvida.
Exemplo:
Suponha o conjunto de tempo de servio de cinco funcionrios: 3, 7, 8, 10 e 11. Determinar o desvio-padro
deste conjunto de dados.
( ) ( ) ( ) ( ) ( )
2 2
2 2 2 2 2
2
anos 7 , 9 S
4
8 , 38
1 5
8 , 7 11 8 , 7 10 8 , 7 8 8 , 7 7 7,8 - 3
S ento
8 , 7 x como
= =
+ + + +
=
=
Interpretao: encontramos ento uma varincia para o tempo de servio de 9,7anos
2
. Para eliminarmos o
quadrado da unidade de medida, extramos a raiz quadrada do resultado da varincia, que chegamos a uma
terceira medida de disperso, chamada de DESVIO-PADRO:
POPULACIONAL, representada letra grega
2
=
AMOSTRAL, representada por
2
S S =
Portanto, o desvio-padro do exemplo foi de 3,11anos. Ou seja, se calcularmos um intervalo utilizando um
desvio-padro em torno da mdia, encontraremos a concentrao da maioria dos dados.
2
a
SITUAO: Dados agrupados em uma distribuio de frequncia por valores simples
Quando os dados estiverem agrupados numa distribuio de freqncia usaremos a varincia dos valores x
1
,
x
2
, x
3
,...,x
n
, ponderados pelas respectivas freqncias absolutas: F
1
, F
2
, F
3
, ... , F
n
. Assim
59
( ) ( )
( ) ( )
|
|
.
|
\
|
=
=
|
|
.
|
\
|
=
=
n
F x
F x
1 - n
1
1 - n
F x x
S
ou
N
F x
F x
N
1
N
F x
2
i i
i
2
i
i
2
i 2
2
i i
i
2
i
i
2
i 2
Exemplo:
Em um determinado dia foi registrado o nmero de veculos negociados por uma amostra de 10
vendedores de uma agncia de automveis como mostra a tabela abaixo. O clculo do desvio-mdio ser:
veculos 84 , 0 os 0,71vecul S
veculos 71 , 0
9
4 , 6
S ento
2,6 x como
2
2 2
= =
= =
=
veculos 84 , 0 os 0,71vecul S
veculos 71 , 0
10
26
74
9
1
S
2
2
2
2
= =
=
(
=
Interpretao: Portanto, o desvio-padro do exemplo foi de 0,84 veculos. Ou seja, se calcularmos um intervalo
utilizando um desvio-padro em torno da mdia, encontraremos a concentrao da maioria dos veculos
negociados por vendedor.
3
a
SITUAO: Dados agrupados em uma distribuio de frequncia por classes
Quando os dados estiverem agrupados numa distribuio de freqncia usaremos a varincia dos pontos
mdios x
1
, x
2
, x
3
,...,x
n
de cada classe, ponderados pelas respectivas freqncias absolutas: F
1
, F
2
, F
3
, ... , F
n
.
Desta forma, o clculo da varincia passa a ser igual ao da 2
a
situao. Assim
( ) ( )
( ) ( )
|
|
.
|
\
|
=
=
|
|
.
|
\
|
=
=
n
F x
F x
1 - n
1
1 - n
F x x
S
ou
N
F x
F x
N
1
N
F x
2
i i
i
2
i
i
2
i 2
2
i i
i
2
i
i
2
i 2
veculos nmero de veculos nmero de
negociados vendedores (xi-mdia)
2
(xi-mdia)
2
*Fi negociados vendedores xi*Fi xi
2
*Fi
(x
i
) (F
i
) (x
i
) (F
i
)
1 1 2,56 2,56 1 1 1 1
2 3 0,36 1,08 OU 2 3 6 12
3 5 0,16 0,80 3 5 15 45
4 1 1,96 1,96 4 1 4 16
TOTAL 10 5,04 6,40 TOTAL 10 26 74
60
Exemplo:
A tabela abaixo representa os escores obtidos por um grupo de 58 alunos matriculados em uma determinada
disciplina. O clculo do desvio-mdio ser:
pontos 85 , 12 pontos 1 , 165 S
pontos 1 , 165
57
409 . 9
S ento
24 , 2 6 x como
2
2 2
= =
= =
=
pontos 85 , 12 pontos 1 , 165 S
pontos 1 , 165
58
610 . 3
100 . 234
57
1
S
2
2
2
= =
=
(
=
Interpretao: Portanto, o desvio-padro do exemplo foi de 12,85 pontos. Ou seja, se calcularmos um intervalo
utilizando um desvio-padro em torno do escore mdio de 62,24 ponots, encontraremos a concentrao da
maioria dos alunos dentro deste intervalo de pontuao.
COEFICIENTE DE VARIAO
Trata-se de uma mdia relativa disperso, til para a comparao e observao em termos relativos do
grau de concentrao em torno da mdia de sries distintas. dada por:
100
x
S
CV OU 100
CV = =
Classificao da distribuio quanto disperso:
DISPERSO BAIXA: CV 15%
DISPERSO MDIA: 15% < CV < 30%
DISPERSO ALTA: CV 30%
ESCORES ALUNOS ESCORES ALUNOS
F
i xi
(xi-mdia)
2
(xi-mdia)
2
*Fi F
i xi xi*Fi
xi
2
*Fi
35 |- 45 5 40 495 2.473 35 |- 45 5 40 200 8.000
45 |- 55 12 50 150 1.798 45 |- 55 12 50 600 30.000
55 |- 65 18 60 5 90 OU 55 |- 65 18 60 1.080 64.800
65 |- 75 14 70 60 843 65 |- 75 14 70 980 68.600
75 |- 85 6 80 315 1.893 75 |- 85 6 80 480 38.400
85 |- 95 3 90 771 2.312 85 |- 95 3 90 270 24.300
TOTAL 58 - - 9.409 TOTAL 58 - 3.610 234.100
61
Exemplo:
Numa empresa o salrio mdio dos funcionrios do sexo masculino de R$ 4.000,00, com um desvio
padro de R$ 1.500,00, e os funcionrios do sexo feminino em mdia de R$ 3.000,00, com um desvio padro
de R$ 1.200,00. Ento:
% 40 100
3000
1200
CV : feminino Sexo
% 5 , 37 100
4000
1500
CV : masculino Sexo
= =
= =
Interpretao: Logo, podemos concluir que o salrio das mulheres apresenta maior disperso relativa que a dos
homens. Para obtermos o resultado de C.V basta multiplicarmos por 100.
EXERCCIOS
1. Desvio Mdio para o conjunto de dados abaixo ser:
xi Fi
5 2
7 3
8 5
9 4
11 2
a) ( ) 1,28 c) ( ) 1,00
b) ( ) 1,20 d) ( ) 0,83
2. O Desvio Padro de um conjunto de dados 9. A varincia :
a) ( ) 3 c) ( ) 81
b) ( ) 36 d) ( ) 18
3. Na distribuio de valores iguais, o Desvio padro :
a) ( ) negativo c) ( ) zero
b) ( ) a unidade d) ( ) positivo
4. O calculo da varincia supe o conhecimento da:
a) ( ) Fac c) ( ) mediana
b) ( ) mdia d) ( ) moda
5. A varincia do conjunto de dados tabelados abaixo ser:
Classes Fi
03 |- 08 5
08 |- 13 15
13 |- 18 20
18 |- 23 10
a) ( ) 1,36 c) ( ) 4,54
b) ( ) 18,35 d) ( ) 20,66
62
UNIDADE VII - MEDIDAS DE ASSIMETRIA E DE CURTOSE
MEDIDAS DE ASSIMETRIA
DEFINIO: grau de deformao de uma distribuio em relao ao eixo de simetria.
Podemos observar os tipos de assimetria abaixo:
a)
Mo Md x = =
b)
Mo Md x < <
c)
x Md Mo < <
Existem vrias coeficientes com o objetivo de quantificar tais assimetrias. Estudaremos dois destes
coeficientes que veremos a seguir:
COEFICIENTE DE PEARSON
O coeficiente de Pearson apresentado pela seguinte frmula:
S
Mo x
As ou
Mo
As
=
=
Classificao do coeficiente de Pearson:
0 As =
DISTRIBUIO SIMTRICA
1 As 0 < <
DISTRIBUIO ASSIMTRICA POSITIVA FRACA
1 As
DISTRIBUIO ASSIMTRICA POSITIVA FORTE
0 As 1 - < <
DISTRIBUIO ASSIMTRICA NEGATIVA FRACA
-1 As
DISTRIBUIO ASSIMTRICA NEGATIVA FORTE
63
COEFICENTE DE BOWLEY
1 3
1 3
Q Q
Md 2 Q Q
As
+
=
Classificao do coeficiente de Bowley:
0 As =
DISTRIBUIO SIMTRICA
1 , 0 As 0 <
DISTRIBUIO ASSIMTRICA POSITIVA FRACA
0,3 As 0,1 < <
DISTRIBUIO ASSIMTRICA POSITIVA MODERADA
1 As 0,3
DISTRIBUIO ASSIMTRICA POSITIVA FORTE
0 As 0,1 - <
DISTRIBUIO ASSIMTRICA NEGATIVA FRACA
0,1 As 0,3 - < <
DISTRIBUIO ASSIMTRICA NEGATIVA MODERADA
-0,3 As 1 -
DISTRIBUIO ASSIMTRICA NEGATIVA FORTE
MEDIDA DE CURTOSE
Entende-se por curtose o grau de achatamento de uma distribuio. Podemos ter:
CURVA PLATICRTICA
CURVA MESOCRTICA
CURVA LEPTOCRTICA
64
Para medir o grau de curtose utilizaremos o coeficiente
( )
10 90
1 3
P - P 2
Q - Q
= K
Classificao do coeficiente de Curtose:
0,263 K =
CURVA MESOCRTICA
0,263 K >
CURVA PLATICRTICA
0,263 K <
CURVA LEPTOCRTICA
EXERCCIOS
1. Analisando as curvas abaixo marque a resposta correta.
(I) (II) (III)
a) a curva I simtrica - x > med > mo ;
b) a curva II assimtrica positiva - mo > > x
2
;
c) a curva I simtrica x = med = mo ;
d) a curva III simtrica positiva x = med = mo ;
2. Para as distribuies abaixo foram calculados
Distrib. A Distrib. B Distrib. C
x = 12Kg
Med = 12Kg
Mo = 12Kg
S = 4,42Kg
x = 12,9Kg
Med = 13,5Kg
Mo = 16Kg
S = 4,20Kg
x = 11,1Kg
Med = 10,5Kg
Mo = 8Kg
S = 4,20Kg
Marque a alternativa correta:
a) a distribuio I assimtrica negativa;
b) a distribuio II assimtrica positiva;
c) a distribuio III assimtrica negativa moderada.
d) a distribuio I simtrica;
3. Sabe-se que uma distribuio apresentou as seguintes medidas:
Q
1
= 24,4cm Q
3
= 41,2cm
P
10
=20,2cm P
90
= 49.5cm,
com tais medidas a curtose :
a) ( ) Leptocrtica c) ( ) Mesocrtica
b) ( ) Platicrtica d) ( ) Assimtrica.
Classes Fi Classes Fi Classes Fi
02 |- 06 6 02 |- 06 6 02 |- 06 6
06 |- 10 12 06 |- 10 12 06 |- 10 30
10 |- 14 24 10 |- 14 24 10 |- 14 24
14 |- 18 12 14 |- 18 30 14 |- 18 12
18 |- 22 6 18 |- 22 6 18 |- 22 6
65
UNIDADE VIII INTRODUO TEORIA DA PROBABILIDADE
EXPERIMENTO ALEATRIO OU NO DETERMINISTICO - E
Definio:
1. o processo de observao ou medida de um determinado fenmeno em estudo.
2. o experimento que repetido sob as mesmas condies, conduz a resultados, em geral, distintos.
Exemplos:
E1 lanamento de um dado e observar o nmero na face superior.
E2 lanamento de uma moeda e observar o valor na face superior.
E3 lanamento de um dado e uma moeda, nesta seqncia, observar os valores nas faces superiores.
E4 um casal deseja ter trs filhos e observar o sexo, de acordo com a ordem de nascimentos das crianas.
ESPAO AMOSTRAL - S
Definio:
Um espao amostral um conjunto de todas as ocorrncias possveis de um determinado experimento
aleatrio E.
Exemplos: Considere os experimentos aleatrios apresentados anteriormente:
No E1 - S={1, 2, 3, 4, 5, 6}
No E2 - S={k, c}, onde k=cara, C=coroa
No E3 - S={1k, 2k, 3k, 4k, 5k, 6k, 1c, 2c, 3c, 4c, 5c, 6c}
No E4 - S={MMM, MMF, MFM, MFF, FMM, FMF, FFM, FFF}
EVENTOS (qualquer letra maiscula do alfabeto)
Definio :
Um evento qualquer subconjunto de ocorrncias de um determinado espao amostral S.
Exemplo: Considere o experimento aleatrio E3, com seu respectivo espao amostral S:
S={1k, 2k, 3k, 4k, 5k, 6k, 1c, 2c, 3c, 4c, 5c, 6c}
Determine os seguintes eventos:
A = ocorrncia de valor cara (K)
B = ocorrncia de valor par
C = ocorrncia de valor coroa (C)
D = ocorrncia de valor mpar
E = ocorrncia de nmero primo
F = ocorrncia de valor maior que 4
G = ocorrncia de valor menor ou igual a 3
H = ocorrncia de valor par ou cara (K)
66
I = ocorrncia de valor par ou mpar
J = ocorrncia de valor par e cara (K)
K = ocorrncia de valor par e mpar
L = ocorrncia de valor maior que 7
TIPOS DE EVENTOS
EVENTO CERTO
Definio:
aquele evento que se igual ao espao amostral S.
Exemplo: O evento I acima um evento certo.
EVENTO IMPOSSVEL
Definio:
aquele evento que no possui elemento algum.
Exemplo: Os eventos K e L acima so eventos impossveis.
EVENTOS MUTUAMENTES EXCLUSIVOS
Definio:
Dois eventos A e B quaisquer so chamados de mutuamente exclusivos, se eles no podem ocorrer
simultaneamente, isto ,
AB =
Exemplo: Considere os eventos descritos acima:
Os eventos A e C so mutuamente exclusivos pois AC = .
Os eventos B e D so mutuamente exclusivos pois BD = .
Os eventos C e J so mutuamente exclusivos pois CJ = .
Os eventos H e J no so mutuamente exclusivos pois HJ .
EVENTOS COMPLEMENTARES
Definio:
Dois eventos A e B quaisquer so chamados de complementares se:
AB =
AB = S
Exemplo: Considere os eventos descritos acima:
Os eventos A e C so complementares pois AC = e AC = S.
Os eventos B e D so complementares pois BD = e BD = S.
Os eventos H e J no so complementares pois HJ e HJ S.
Os eventos F e K no so complementares pois FK apesar de FK = S.
67
Os eventos C e J no so complementares pois CJ S apesar de CJ = .
PROBABILIDADE:
Enfoque Terico
A probabilidade de ocorrncia de um evento A, P(A), um nmero real que satisfaz as seguintes
condies:
a) 0 P(A) 1
b) P(S) = 1
c) Se A e B so eventos mutuamente exclusivos ento P(AB) = P(A) + P(B)
d) Se A
1
, A
2
, ...,A , ... so mutuamente exclusivos, dois a dois, ento:
Principais teoremas
:
I) P( A) = 1 - P(A)
II) Se A um evento impossvel de ocorrer (A=), ento P(A) = P() =0
III) Se A e B so eventos quaisquer, ento: P(AB) = P(A) + P(B) - P(BA).
CLCULO DA PROBABILIDADE
A probabilidade dever ser calculada a partir da frmula: P(A) =
n(S)
n(A)
Exemplo:
Seja o Experimento E o lanamento de um dado e o seu espao amostral dado por: S = {1, 2, 3, 4, 5, 6}. Qual a
probabilidade do evento A Nmeros maiores e iguais a 2?
O Evento A pode ser descrito na forma: A ={2, 3, 4, 5, 6}
n(A) = 5 e n(S) = 6. Logo a probabilidade do evento A P(A) =
n(S)
n(A)
= 5/6.
PROBABILIDADE CONDICIONAL
Ilustrao:
Seja o experimento aleatrio E: lanar um dado e o evento A = {sair o nmero 3}. Ento:
P(A) =
6
1
Seja o evento B = {sair o nmero impar} = {1, 3, 5}
Podemos estar interessados em avaliar a probabilidade do evento A estar condicionado ocorrncia do evento B,
designado por P(A|B), onde o evento A o evento condicionado e o evento B o condicionante.
Assim P(A|B) =
3
1
Formalmente a probabilidade condicionada definida por:
68
Dado dois eventos quaisquer A e B, denotaremos P(A|B), por
( )
( )
( )
( )
( ) B n
B A n
B P
B A P
B A P
=
=
,
com P(B)0, pois B j ocorreu.
TEOREMA DO PRODUTO
A probabilidade da ocorrncia simultnea de dois eventos quaisquer A e B, do mesmo espao amostra,
igual ao produto da probabilidade de ocorrncia do primeiro deles pela probabilidade condicional do outro,
dado que o primeiro ocorreu.
Assim:
( )
( )
( )
( ) ( ) ( ) B A P B P B A P
B P
B A P
B A P =
=
INDEPENDNCIA ESTATSTICA
Um evento A considerado independente de um outro evento B se a probabilidade de A igual
probabilidade condicional de A dado B, isto , se:
( ) ( ) B A P A P =
Considerando o teorema do produto podemos afirmar que:
( ) ( ) ( ) B P A P B A P =
TEOREMA DE BAYES
Suponha que os eventos A
1
, A
2
, ...,A
n
formam uma partio de um espao amostral S; ou seja, os
eventos A
i
so mutuamente exclusivos e sua unio S. Seja B outro evento qualquer. Ento:
B = SB = (A
1
A
2
...A
n
) B = (A
1
B) (A
2
B) ... (A
n
B)
Onde os A
i
B so tambm mutuamente exclusivos.
Consequentemente,
P(B) = P(A
1
B) + P(A
2
B) +... +P(A
n
B)
Assim pelo teorema da multiplicao,
P(B) = P(A
1
)P(B\ A
1
)+ P(A
2
)P(B\ A
2
)+...+ P(A
N
)P(B\ A
N
)
Por outro lado, para qualquer i, a probabilidade condicional de A
i
dado B definida como
69
P(A
i
\B) =
P(B)
B) P(A
i
Nesta equao, usamos (1) para substituir P(B) e P(A
i
B) = P(A
i
)P(B\ A
i
) para substituir P(A
i
B),
obtendo assim o:
Teorema de Bayes: Suponha A
1
, A
2
, ...,A
n
ser uma partio de S e B, um evento qualquer. Ento, para qualquer
i,
) A \ )P(B P(A ... ) A \ )P(B P(A ) A \ )P(B P(A
) A \ )P(B P(A
B) \ P(A
n n 2 2 1 1
i i
i
+ + +
=
Exemplos:
Trs mquinas, A, B e C produzem 50%, 30% e 20%, respectivamente do total de peas de uma fbrica.
As percentagens de produo defeituosa destas mquinas so 3%, 4% e 5%. Se uma pea selecionada
aleatoriamente, ache a probabilidade de ela ser defeituosa. Suponha agora que uma pea selecionada
aleatoriamente seja defeituosa. Encontre a probabilidade de ela ter sido produzida pela mquina A
EXERCCIOS
1. Lance um dado e uma moeda um aps o outro nesta seqncia.
a) Construa o espao amostral
b) Enumere os resultados seguintes
I A ={coroa marcada por par}
II B = {cara marcada por mpar}
III C = {Mltiplo de 3}
c) Expresse os eventos
I B complementar
II A ou B ocorrem
III B ou C ocorrem
IV A ou B complementar
c) Calcule as probabilidades abaixo:
P(A), P(B), P(C), P( A),P( B), P(A B) e P(BC)
2. Um revendedor de carros tem dois carros, corsas 1996, na sua loja para serem vendidos, interessa-nos saber
quanto cada um dos dois vendedores vender ao final de uma semana. Como representar o primeiro vendedor
no vende nenhum carro e depois o segundo vendedor vende ao menos um dos carros.
3. Se A o evento Um estudante fica em casa para estudar. E B o evento o estudante vai ao cinema,
P(A) = 0,64 e P(B) = 0,21. Determine:
P(A
c
), P(B
c
), P(B/A)
4. Se P(A) = ; P(B) = e A e B so mutuamente exclusivos ento:
a) P(A
c
)
b) P(B
c
)
c) P(AB)
5. Se P(A) = ; P(B) = 1/3 e P(AB) = calcule P(AUB).
6. Quantas comisses de trs pessoas podem formar com um grupo de 10 pessoas?
70
7. A probabilidade de trs jogadores acertarem um pnalti, so respectivamente 2/3, 4/5 e 7/10. Se cada um
cobrar 1 nica vez, qual a probabilidade de :
a) Todos acertarem
b) Ao menos um acertar
c) Nenhum acertar
8. Qual a probabilidade de duas pessoas aniversariarem no mesmo dia da semana?
9. Sr Ray Moon Dee, ao dirigir-se ao trabalho, usa um nibus ou o metr com probabilidade de 0,2 e 0,8, nessa
ordem. Quando toma o nibus, chega atrasado 30% das vezes. Quando toma o metr, atrasa-se 20% dos
dias. Se o Sr Ray Moon Dee Chegar atrasado ao trabalho em determinado dia, qual a probabilidade dele
haver tomado um nibus?
10. Em certo colgio, 5% dos homens e 2% das mulheres tem mais que 1,80m de altura. Por outro lado, 60%
dos estudantes so homens. Se um estudante selecionado aleatoriamente e tem mais de 1,80m de altura,
qual a probabilidade de que o estudante seja mulher?
71
UNIDADE IX - VARIVEIS ALEATRIAS
CONCEITOS
Seja X um valor numrico que depende um resultado de uma experincia; como X associa um resultado
a um nmero, X uma funo cujo o domnio o conjunto de resultados e a imagem o conjunto dos nmeros
reais. Essa funo X conhecida como Varivel Aleatria. O que Eqivale a descrever os resultados de um
experimento aleatrio por meio de nmeros em vez de palavras, possibilitando um tratamento Estatstico.
As v.a. podem ser Unidimensional Discreta ou Contnua e Bidimensional Discreta e Contnua.
VARIVEIS ALEATRIAS UNIDIMENSIONAL DISCRETAS
As v.a. unid. Discretas so aquelas que fazem uso de uma nica varivel no estudo, e como so
discretas trabalham com valores inteiros.
FUNO DE PROBABILIDADE
Quando utilizamos uma v.a. x para transformar os valores de um espao amostral S em um novo espao
amostral constitudo de nmeros reais, em geral modificamos tambm a funo de probabilidade associada a este
espao amostral. A funo de probabilidade ser representada por p(X=x) ou p(x).
Onde:
p(x) = 1 e
p(x) poder ser expresse por uma tabela grfico ou frmula:
EXEMPLO:
E lanamento de duas moedas
X nmero de caras obtidas
S = {(c,c) (c,k) (k,c) (k,k)}
A TABELA:
O GRFICO
xi 0 1 2
p(xi) 0,25 0,5 0,25
72
A FRMULA
p(x) =
|
|
.
|
\
|
x
2
4
1
, para x = 0, 1, 2
OBS: Qualquer funo de uma v.a. tambm uma v.a. isto se x uma v.a., ento y =(x) tambm ser.
EXEMPLO:
x v.a. pontos de um dado;
y = x + x v.a. soma dos pontos de dois lanamento;
z = max{(x
1
, x
2
)} onde (x
1
, x
2
) pontos de dois dados.
A distribuio de probabilidade de x ser:
A distribuio de y ser:
( ) ( ) ( )
( ) ( ) ( )
( ) ( ) ( )
( ) ( ) ( )
=
6,6 ... 2 , 6 6,1
3,6 ... 2 , 3 3,1
2,6 ... 2 , 2 2,1
1,6 ... 2 , 1 1,1
S
M
yi 2 3 4 5 6 7 8 9 10 11 12
p(yi) 1/36 2/36 3/36 4/36 5/36 6/36 5/36 4/36 3/36 2/36 1/36
A de z ser:
zi 1 2 3 4 5 6
p(zi) 1/36 3/36 5/36 7/36 9/36 11/36
Exemplo:
No lanamento de dois dados a v.a. x anota a diferena dos pontos das faces superiores. Determine os
valores de x e a funo de probabilidade associada.
EXERCCIO
A urna A contm 3 bolas brancas e 2 bolas pretas. A urna B contm 5 bolas brancas e
1 bola preta. Uma bola retirada ao acaso de cada urna e a v.a. x anota o nmero de bolas
brancas obtidas. Determine os valores de x e a funo de probabilidade.
xi 1 2 3 4 5 6
p(xi) 1/6 1/6 1/6 1/6 1/6 1/6
73
MEDIDAS DE POSIO E VARIABILIDADE DA V. ALEATRIA
UNIDIMENSIONAL DISCRETA.
O VALOR ESPERADO DA V.A. .
A v.a. ser utilizada para estabelecer modelos tericos de prob. Com a finalidade de descrever
populaes. A mdia, a varincia, o desvio padro, representaro parmetros destas populaes e sero
denotados por ,
2
(x) e (x), respectivamente.
Se x uma v.a. dada por:
xi x
1
x
2
x
3
... x
n
p(xi) p(x
1
) p(x
2
) p(x
3
) ... p(x
n
)
= x
i *
p(x
i
) tambm conhecido como E(x)
A VARINCIA DA V.A. VAI SER:
2
(x) = (x
i
- )
2
* p(x
i
) ou
2
(x) = E(x
2
) [E(x)]
2
E O DESVIO PADRO:
____
(x) =
2
(x)
Exemplo:
No lanamento de uma moeda, a v.a. anota o no. de caras obtidos. Calcule a mdia a varincia e o
desvio padro da v.a. x.
EXERCCIO:
Calcule a mdia a varincia e o desvio padro da v.a. x dada abaixo.
xi 2
5 8 10
p(xi) 0,3 0,4 0,2 0,1
VARIVEL ALEATRIA UNIDIMENSIONAL CONTNUA
Se uma v.a. assume todos os valores de um intervalo real, ento x denominada uma v.a. contnua.
Essas v.a. surgem de processos definidos a partir de medidas.
Ex: Considere o intervalo real de [2,10] e a funo que associa a cada ponto deste intervalo sua distncia ao
ponto 2.
A v.a. x assumir valores no intervalo[0,8] sendo portanto uma v.a. contnua.
FUNO DENSIDADE DE PROBABILIDADE (F.D.P.)
Quando definimos a v.a. discreta associamos a cada ponto x
i
do espao amostral um valor real p(x
i
)
com:
74
1. 0 p(x
i
) 1
2. p(x
i
) = 1
Para a v.a. contnua no poderemos usar tal processo pois no existe uma funo que associa cada ponto
p de um intervalo um valor real.
Para a v.a. contnua definiremos:
1. f(x
i
) 0
2. A rea da regio compreendida sobre o grfico da funo e o eixo ox igual a 1.
EXEMPLO:
No exemplo anterior, em que a v.a. x assume os valores do intervalo [0,8] podemos definir a seguinte
F.D.P.
[0,8] ------- x
x ------- f(x)
A representao grfica :
Note que f(x) 0 e que a rea do retngulo definido pelo eixo ox deve ser calculada por b*h = 1/8*8 = 1.
Assim podemos dizer que esta uma legitima F.D.P pois satisfaz as condies anteriormente mencionadas.
A probabilidade da v.a. assumir qualquer valor no intervalo [a,b] definido como a rea determinada pelo
grfico da funo e pelo intervalo [a,b].
75
EXEMPLO:
p(3 x 5) =
p(x 3) =
p(x 3) =
p(x = 6) =
EXERCCIOS:
Considere a v.a. x que assume valores no intervalo [0,5] com a seguinte F.D.P.
[0,5] --------R
x ----------f(x) = 0,08x
Construa o grfico da funo f e calcule:
a) p(0 x 5) =
b) p(x > 2) =
c) p(1 < x < 4) =
d) p(x < 3) =
e) p(x = 4) =
MEDIDAS DE POSIO E DE VARIABILIDADE DE UMA V.A.
UNIDIMENSIONAL CONTNUA.
VALOR ESPERADO:
E(x) =
f(x)dx x E(x
2
) =
f(x)dx x
2
VARINCIA E DESVIO PADRO
( ) ( ) | |
2 2 2
x E ) E(x x = e o D.P. = ( ) ( ) x x
2
=
VARIVEL ALEATRIA BIDIMENSIONAL
Exemplo: Considere E, que consiste no lanamento de dois dados. Seja x a v. a. que anota o nmero de pontos da
face superior do primeiro dado, e seja y a v.a. que anota o nmero de pontos da face superior do segundo dado.
76
A tabela de Probabilidade :
Logo a funo de probabilidade conjunta
P(X = x
i
, Y = y
j
) satisfazendo as condies
Discreta
Contnua
1. p(x
i
,y
j
) 0 1. f(x,y) 0
2.
=
=
1 1
j i
1 ) y , p(x
i j
2. 1 y)dxdy f(x, =
A DISTRIBUIO MARGINAL DE PROBABILIDADE
Dada uma v.a. bidimensional e sua distribuio conjunta pode-se determinar a distribuio de X sem
considerar Y, ou vice-versa. So as chamadas distribuies marginais.
Se (X,Y) discreta; ento:
Distribuio Marginal de X:
= =
< < = = =
j
j i i
i
y x P x X P
ou
y x X P x X P
) , ( ) (
, ( ) (
Y
X
1 (1 1) (1 2) ... (1 6)
2
3 ...
4 ...
5
6 (6 1 ) ... (6 6)
1 2 3 4 5 6
Y
X
1 1/36 ... 1/36
2 1/36
3 ...
4 ...
5
6 1/36 ... 1/36
5 6 1 2 3 4
77
Distribuio Marginal de X:
= =
< < = = =
i
j i j
ji
y x P y Y P
ou
x y Y P y Y P
) , ( ) (
, ( ) (
Exemplo: anterior
VARIVEL ALEATRIA INDEPENDENTES
Seja (X,Y) uma v.a. discreta bidimensional. Diz-se que X e Y so independentes se, e somente se ,
p(x
i
,y
j
) = p(x
i
)p(y
j
) para quaisquer i e j.
Seja (X,Y) uma v.a. aleatria contnua bidimensional. Diz-se que X e Y so independentes se e somente
se, f(x,y)=g(x)h(y) para todo (x,y).
Obs: g(x) distribuio marginal de x da v.a. contnua e h(x) da v. a. de y
EXEMPLO:
Dada a distribuio de probabilidade conjunta de (X,Y) pela tabela abaixo. Verificar se X e Y so independentes.
Soluo: Para todo i, j; i=0, 1, 2 e j=0, 1, 2
P(x
i
,y
j
) = p(x
i
)p(y
j
)
Para o par (0,0) tem-se :
P(0,0) = 0,10 e p(x=0) . P(y=0) = 0,2 . 0,5 = 0,10
Para o par (0,1) tem-se :
P(0,1) = 0,04 e p(x=0) . P(y=1) = 0,2 . 0,2 = 0,04
Y
X
1 1/36 ... 1/36 1/36
2 1/36
3 ...
4 ...
5
6 1/36 ... 1/36 1/36
p(y) 1/36 1/36 1
p(x) 1 2 3 4 5 6
y\x 0 1 2 p(y
j
)
0 0,1 0,2 0,2 0,5
1 0,04 0,08 0,08 0,2
2 0,06 0,12 0,12 0,3
p(x
i
) 0,2 0,4 0,4 1
78
Continuando todos os clculos se verificar que todos sero satisfeitos e por isso conclumos que X e Y so
independentes.
MEDIDAS DE POSIO E DE VARIABILIDADE DE UMA V.A. BIDIMENSIONAL
DISCRETA E CONTNUA.
A mdia ou esperana matemtica deve ser calculada usando as frmulas:
( ) ( )
( ) ( )
( ) ( )
= =
= =
= =
dxdy ) y x ( y x xy E ) y p(x y x xy E
dy ) y ( y y E ) p(y y y E
dx ) x ( x x E ) p(x x x E
j i j j i j i
j j j
i i i
f
f
f
i
j
i
A varincia, o desvio padro, a covarincia e o coeficiente de correlao sero calculados a partir das
frmulas abaixo.
( ) | |
( ) | |
( ) ( ) ( ) }
( ) ( ) ( )} tes independen forem y e x Quando y x y x
quaisquer forem y e x que em caso o Para ) xy cov( 2 y x y x
contnuo e discreto caso o Para
E(y) - ) E(y y
E(x) - ) E(x x
2 2 2
2 2 2
2 2 2
2 2 2
+ =
+ =
)
=
=
( ) ( ) x x
2
=
E(y) E(x) - E(xy) Cov(xy) =
( ) ( ) y x
cov(xy)
(xy)
Exerccios Resolvidos
1. Uma carta retirada aleatoriamente de um baralho comum de 52 cartas, e a v.a. X anota o nmero de
damas obtidos nessa retirada. Determinar os valores de X e a funo de probabilidade associada.
Soluo
Seja S o espao amostral da retirada de uma carta do baralho S = { A
O
, 2
O
, ..., 10
O
, ..., J
O
, D
O
, K
O
, A
P
,
2
P
, ..., 10
P
, ..., J
P
, D
P
, K
P
, A
E
, 2
E
, ..., 10
E
, ..., J
E
, D
E
, K
E
, A
C
, 2
C
, ..., 10
C
, ..., J
C
, D
C
, K
C
}
Onde: A
O
a carta s de Ouro 2
O
a carta 2 de Ouro e assim sucessivamente
A v.a. X anota o nmero de damas obtidos, veja que aqui no foi mencionado o naipe, logo estamos
interessados somente se sai (1) ou no (0) uma carta de damas. As probabilidade bem como os valores que a v.a.
X pode assumir esto discriminados na distribuio de probabilidade abaixo.
X 0 1
p(x) 48/52 4/52
2. A tabela a seguir d as probabilidades de um oficial de justia receber 0, 1, 2, 3, 4 ou 5, relatrios de
violao de liberdade condicional em um dia qualquer.
X 0 1 2 3 4 5
p(x) 0,15 0,25 0,36 0,18 0,04 0,02
79
a) Encontre a mdia e o desvio padro de X.
Soluo
A mdia pode ser denotada por E(x) ou por , assim:
E(x) = x
i
.p(x
i
) = 0.(0,15) + 1.(0,25) + 2.(0,36) + 3.(0,18) + 4.(0,04) + 5.(0,02) = 1,77
Para calcularmos o Desvio padro, que ser denotado por D.P. ou por
(x)
,
deveremos antes encontra a
varincia que ser:
Var(x) =
2
(x)
= E(x
2
) [E(x)]
2
Onde
E(x
2
) = x
i
2
.p(x
i
) = 0
2
.(0,15) + 1
2
.(0,25) + 2
2
.(0,36) + 3
2
.(0,18) + 4
2
.(0,04) + 5
2
.(0,02) = 4,45
Assim a varincia de x ser:
2
(x)
= E(x
2
) [E(x)]
2
= 4,45 [1,77]
2
= 1,32
Como estamos interessados no desvio padro teremos que tirar a raiz quadrada da varincia . Logo:
(x)
= 1,14
3. A tabela abaixo fornece a probabilidade de que um sistema de computao fique fora de operao um
dado perodo por dia durante a fase inicial de instalao do sistema. Calcular:
a) o nmero esperado de vezes que o computados fique fora de operao por dia
b) O desvio padro desta distribuio de probabilidade.
Soluo
a) E(x) = 6,78
b)
2
(x)
= E(x
2
) [E(x)]
2
= 47 [6,78]
2
= 1,032
(x)
= 1,016
4. O trem do metr para no meio de um tnel. O defeito pode ser na antena receptora ou no painel de
controle. Se o defeito for na antena, o conserto poder ser feito em 5 minutos. Se o defeito for no painel, o
conserto poder ser feito em 15 minutos. O encarregado da manuteno acredita que a probabilidade de o
defeito ser no painel de 60%. Qual a expectativa do tempo de concerto?
Soluo
Se o defeito for na antena o conserto dever ser feito em 5 minutos
Se o defeito for no painel estima-se um conserto em 15 minutos. Logo a distribuio de probabilidade
ser:
X 5 15
p(x) 0,4 0,6
E(x) = 5.(0,4) + 15.(0,6) = 11 minutos a expectativa do tempo de conserto
5. Uma v.a. assume os valores 2, 3, 5, com probabilidades de 0,3, 0,5 e 0,2 respectivamente. Calcule o
valor esperado e o desvio padro da v.a. Y = 2x + 5.
Nmero de perodo X 4 5 6 7 8 9
Probabilidade p(x) 0,01 0,08 0,29 0,42 0,14 0,06
Nmero de perodo X 4 5 6 7 8 9 Total
Probabilidade p(x) 0,01 0,08 0,29 0,42 0,14 0,06 1
x.p(x) 0,04 0,4 1,74 2,94 1,12 0,54 6,78
x^2.p(x) 0,16 2 10,44 20,58 8,96 4,86 47
80
Soluo
Y = 2x + 5
E(y) = E(2x) + E(5) =
E(y) = 2E(x) + 5 = ?
Calculando a esperana de x e a esperana de x
2
teremos:
X 2 3 5
p(x) 0,3 0,5 0,2
E(x) = 2.(0,3) + 3.(0,5) + 5.(0,2) = 3,1
Logo E(y) = 2(3,1) + 5 = 11,2
Descubra como encontrar a Var(Y)!!!!!!!
6. Seja ( )
( )
, 0
1 x 0 , 1
2
3
2
=
contrrio caso
x
x f
a) f(x) uma legitima Funo Densidade de Probabilidade (f.d.p)?
b) Encontre a mdia e o Desvio padro da v.a. X
Soluo
Para que uma funo f(x) seja uma legitima f.d.p. ela dever satisfazer as seguintes condies:
1. f(x) 0
2. a 1 ) (
1
0
=
dx x f
Observe que a funo foi definida no intervalo de [0,1] e recebe o valor 0 para qualquer outro intervalo.
Logo a 1
\
|
=
|
|
.
|
\
|
= = =
x dx x dx x
Logo f(x) uma legtima f.d.p.
Para achar a Mdia faremos:
E(x) = 1 ) ( .
1
0
=
dx x f x =
( ) ( )
8
3
4
1
2
3
4
x
-
2 2
3
2
3
1 1
2
3
.
1
0
4
1
0
2 1
0
3
1
0
2
= |
.
|
\
|
=
|
|
.
|
\
|
= = =
(
x
dx x x dx x x
E(x
2
) =
1 ) ( .
1
0
2
=
dx x f x =
( ) ( )
5
1
15
3
15
2
2
3
5
x
-
3 2
3
2
3
1 1
2
3
.
1
0
5
1
0
3 1
0
4 2
1
0
2 2
= = |
.
|
\
|
=
|
|
.
|
\
|
= = =
(
x
dx x x dx x x
Logo a varincia ser:
2
(x)
= E(x
2
) [E(x)]
2
= 1/5 [3/8]
2
= 19/320 = 0,0594
7. Considere a seguinte distribuio conjunta de probabilidade. Encontre as marginais de X e Y e
verifique se X e Y so independentes.
Soluo
O clculo das marginais de X e Y feito da seguinte forma:
x
y
1 0,05 0,08 0,05
3 0,2 0,15 0,05
5 0,25 0,07 0,1
p(x)
2 4 6 p(y)
81
Para saber se X e Y so independentes devemos verificar para todos os casos se P(X=x
i
,Y = y
j
) = P(X=x
i
).P(Y =
y
j
), ento:
1. (x = 2 e y = 1) 0,05 0,5 . 0,18
2. (x = 2 e y = 3) 0,2 = 0,5 . 0,4
3. (x = 2 e y = 5) 0,25 0,5 . 0,42
4. (x = 4 e y = 1) 0,08 0,3 . 0,4
...
E assim sucessivamente. Podemos ver que como a condio P(X=x
i
,Y = y
j
) = P(X=x
i
).P(Y = y
j
) no foi satisfeita
para todos i e j diremos que X e Y no so independentes.
8. Considere a seguinte distribuio conjunta de X e Y .
a) achar as distribuies marginais de X e Y;
b) Calcular E(x), E(y) e E(x,y);
c) Calcular a covarincia de X e Y;
d) Calcular a correlao de X e Y.
e) X e Y so independentes?
Soluo
X
Y
1 0,05 0,08 0,05 0,05+0,08+0,05=0,18 P(Y=1)
3 0,2 0,15 0,05 0,4
5 0,25 0,07 0,1 0,42
p(x) 0,5 0,3 0,2 1
P(X=2)
2 4 6 p(y)
Probabilidade
Conjunta
de X e Y
X
Y Probabilidade
1 0,05 0,08 0,05 0,05+0,08+0,05=0,18 P(Y=1) Marginal
3 0,2 0,15 0,05 0,4 de Y quando yj = 1
5 0,25 0,07 0,1 0,42
p(x) 0,5 0,3 0,2 1
Probabilidade
P(X=2) Marginal
de X quando xi = 2
p(y)
P(X = 2 , Y = 1)
2 4 6
X
Y
1 0,1 0,2 0 0,3
2 0,2 0,1 0,1 0
p(x)
5 p(y) -2 -1 4
X
Y
1 0,1 0,2 0 0,3 0,6
2 0,2 0,1 0,1 0 0,4
p(x) 0,3 0,3 0,1 0,3 1
Distribuio X 1 2 Total
de Probabilidade p(x) 0,6 0,4 1 A varincia de x :
de X e sua Marginal x.p(x) 0,6 0,8 1,4 E(x) Var(x) = E(x
2
) - [E(x)]
2
x^2.p(x) 0,6 1,6 2,2 E(x
2
) Var(x) = 2,2 - (1,4)
2
= 0,24
D.P. = 0,49
Distribuio Y -2 -1 4 5 Total A varincia de y :
de Probabilidade p(y) 0,3 0,3 0,1 0,3 1 Var(y) = E(y
2
) - [E(y)]
2
de Y e sua Marginal y.p(y) -0,6 -0,3 0,4 1,5 1 E(y) Var(y) = 10,6 - (1)
2
=9,6
y^2.p(y) 1,2 0,3 1,6 7,5 10,6 E(y
2
) D.P. = 3,09
5 p(y) -2 -1 4
82
A E(x,y) = x
i
.y
j
. p(x
i
, y
j
)
E(x,y) = (-2) . (1) . (0,1) + (-2) . (2) . (0,2) + ... +(5) . (2) . (0) = 0,9
A Covarincia dada por Cov(x,y) = E(x,y) E(x) . E(y) = 0,9 [1,4 . 1] = - 0,5
A Correlao ser:
( )
( )
( ) ( ) y x
.
y x, Cov
y x, =
=
0,3 -
3,09 . 49 , 0
5 , 0
=
Se utilizarmos P(X=x
i
,Y = y
j
) = P(X=x
i
).P(Y = y
j
) verificaremos que em alguns caso ela no ser satisfeita para
algum i e j, logo X e Y no so independentes.
83
Exerccios
1. Sabe-se que a chegada de clientes a uma loja de material computacional, durante intervalos aleatoriamente
escolhidos de 10 minutos, segue uma distribuio de probabilidade dada na tabela abaixo. Calcule o nmero
esperado de chegada de clientes por intervalo de 10 minutos, e calcule tambm o desvio padro das
chegadas.
2. As vendas de uma revista mensal em uma banca segue uma distribuio de probabilidade dada na tabela
abaixo. Calcule o valor esperado e a varincia.
3. Um vendedor determinou as probabilidades referentes a vendas dirias visitando 10 possveis compradores,
as probabilidades esto apresentadas na tabela abaixo. Calcule o nmero esperado de vendas e o desvio
padro
4. Dada a v.a.
Calcule a mdia e o desvio padro da v.a. Y = 3 -
3
4
x
5. Uma v.a. discreta tem distribuio de probabilidade dada por:
P(x) = 7 5, 3, 1, x para ,
x
K
=
a) Calcule o valor de K b) Calcule P(x = 5)
6. Verifique se a funo abaixo uma legtima f.d.p.
=
contrrio caso 0,
1 x 0 se ,
2
1
) (
x
x f
Nmero de chegadas X 0 1 2 3 4 5
Probabilidade p(x) 0,15 0,25 0,25 0,2 0,1 0,05
Respostas E(x) = 2 e Var(x)= 1,9
Nmero de revistas em
Milhares X
probabilidade de X 0,05 0,1 0,25 0,3 0,2 0,1
Respostas E(x) = 17,8 e Var(x)= 1,66
18 20 19 15 16 17
Nmero de vendas X 1 2 3 4 5 6 7 8
Probabilidade p(x) 0,04 0,15 0,2 0,25 0,19 0,1 0,05 0,02
Respostas E(x) = 4 e Var(x)= 2,52
x -1 2 5 8
p(x) 0,2 0,3 0,4 0,1
84
7. Verifique se X e Y so independentes para a distribuio conjunta de probabilidade dada abaixo.
8. Sejam M e N duas v.a. aleatrias independentes com as seguintes distribuies de probabilidade
a) Achar a distribuio conjunta de probabilidade de M e N;
b) Calcular E(m) e E(n)
c) Calcule a covarincia de M e N
d) Encontre a correlao de M e N
9. As v.a. X e Y admitem a seguinte distribuio conjunta de probabilidade.
Encontre a e b para que as v.a. X e Y sejam independentes.
10. Utilizando a Funo Densidade de Probabilidade do exerccio % encontre a mdia e a varincia.
11. Suponha que X e Y tenha distribuio conjunta dada pela tabela abaixo.
a) Encontre a cov(X,Y)
b) Ache a Correlao de X e Y
c) Verifique se x e Y so independentes.
X
Y
0 0,1 0,2 0,2
1 0,04 0,08 0,08
2 0,06 0,12 0,12
p(x)
0 1 2 p(y)
M 1 3 N 5 10 12
p(m) 0,6 0,4 p(n) 0,3 0,5 0,2
X
Y
4 0,2 0,15 b
5 a 0,15 0,15
p(x)
1 2 3 p(y)
X
Y
-1 0 1/5 0
0 1/5 1/5 1/5
1 0 1/5 0
1 -1 0
85
UNIDADE X DISTRIBUIO DISCRETA
INTRODUO VARIVEIS ALEATRIAS
Quando na prtica desejamos investigar algum fenmeno, estamos na realidade interessados
em estudar a distribuio de uma ou mais variveis. Do ponto de vista prtico, desejvel que se defina uma
varivel aleatria (v.a.) associada a uma amostra ou experimento, de tal modo que seus resultados possveis
sejam numricos. Por exemplo, a jogada de uma moeda tem dois resultados - cara (k) ou coroa (c) - que no so
numricos. Poderamos ento considerar como nossa varivel aleatria o nmero de caras numa jogada, que
tem os valores numricos possveis 0 e 1. Para uma moeda jogada duas vezes, nossa varivel aleatria poderia
ser nmero de caras em duas jogadas, como os valores numricos 0, 1 e 2. Outro exemplo de varivel
aleatria seria o nmero de fregueses que entram numa grande loja num intervalo de 20 minutos: 0, 1, 2, ....
Ainda outro exemplo de varivel aleatria seria a altura dos estudantes numa sala de aula de uma universidade,
com um mbito contnuo que iria, digamos, de 1,5 a 2,0m.
Para todos os exemplos aqui descritos, atribumos a um ponto amostral um nico valor real,
conhecido como varivel aleatria unidimensional. Porm, na maioria das vezes, h interesse em atribuir, para
um mesmo ponto amostral, duas ou mais caractersticas numricas. Assim, por exemplo, podemos estar
interessados em investigar, ao mesmo tempo, a altura (h) e o peso (p) de uma pessoa em uma certa populao.
Neste caso, temos o par (h, p), que dito como varivel aleatria bidimensional.
As varveis aleatrias podem ser do tipo:
Discreta: uma varivel aleatria considerada discreta se toma valores que podem ser contadas. Exemplos
de variveis aleatrias discretas so
nmero de acidentes de carro por semana;
nmero de defeitos em sapatos produzidos;
nmero de terremotos;
nmero de livros em uma estante.
Contnua
1
: uma varivel aleatria considerada contnua quando pode tomar qualquer valor de um
determinado intervalo. Alguns exemplos de v.a. contnua so apresentados a seguir:
pesos de caixas de laranja;
alturas de rvore;
durao de uma conversa telefnica.
DISTRIBUIES DISCRETAS
PROVAS INDEPENDENTES. FRMULA DE BERNOULLI.
A frmula de Bernoulli designada atravs dos ensaios de Bernoulli, que na realidade so
ensaios independentes repetidos, cada um deles com apenas dois resultados possveis e cujas probabilidades
permanecem constantes durante toda a realizao dos ensaios. usual denotarmos as duas probabilidades por p e
por q = 1-p, e nos referimos ao resultado que tem probabilidade p como um sucesso S e q como um fracasso F.
1
Este tipo de varivel ser abordado na prxima unidade.
86
Obviamente p e q 0 e que p+q = 1. O espao amostral associado a cada ensaio individualmente formado por
um dos dois pontos.
EXEMPLO:
Suponhamos o lanamento de uma moeda (honesta), ocorre sucesso quando aparecer cara. Ento o
espao amostral ser S ou F, para um lanamento.
( ) ( )
( ) ( )
= = = =
= = =
=
F P q p 1 0 x P (F) coroa" " lor ocorrer va se , 0
S P p 1 x P (S) cara" " lor ocorrer va se , 1
X
ento:
( ) ( )
x 1 x
p 1 p x X P
= =
para x = 0, 1, que conhecida como Distribuio de Bernoulli, com parmetros 1 e p:
X
i
~ Bernoulli(1,p)
Sabemos que:
Esperana matemtica: E(x) = p
Varincia: Var(x) = p(1-p) = pq.
Suponhamos agora n ensaios de Bernoulli. O espao amostral associado contm 2
n
pontos ou
sucesso de n smbolos S ou F, cada um deles representando um resultado possvel do experimento. Como os
ensaios so independentes, suas probabilidades se multiplicam. Em outras palavras, a probabilidade de qualquer
seqncia especificada o produto obtido quando substitumos os smbolos S ou F por p e q, respectivamente.
Dessa forma:
P(SSFSFF...FS) = ppqpqq...qp.
EXEMPLO 1:
Suponhamos o lanamento de uma moeda honesta 3 vezes, onde a ocorrncia de cara, corresponde ao
sucesso. Ento o nmero de elementos do espao amostral ser 2
3
= 8. Abaixo est indicado o espao amostral
com suas respectivas probabilidades:
=
3 2
2 2
2 2
2 3
q FFF pq SFF
pq FFS q p SFS
pq FSF q p SSF
q p FSS p SSS
tral EspaoAmos
87
EXEMPLO 2:
Supor que em certa comunidade a probabilidade de uma pessoa ter problemas de psicose seja igual a
0.01. Se definimos:
=
contrrio caso se , 0
psicose tem comunidade da pessoa certa uma se , 1
Y
Teremos ento que Y uma v.a de Bernoulli e sua distribuio dada por:
y 0 1
P(Y=y) 0,99 0,01
DISTRIBUIO BINOMIAL
Vamos supor que estamos interessados em calcular a probabilidade de se obter exatamente
duas faces 4 em trs lanamento de um dado.
possvel descrever este procedimento atravs das seguintes combinaes:
(44N) ou (4N4) ou (N44)
em termos de probabilidade ficaria:
P[(44N) (4N4) (N44)]
Como esses trs eventos so mutuamente exclusivos, ento:
P[(44N) (4N4) (N44)] = P(44N) + P(4N4) + P(N44)]=(
6
5
6
1
6
1
6
1
6
5
6
1
6
1
6
1
6
5
+ +
)
As probabilidades destes trs casos so iguais podendo ser escritas da seguinte forma:
=3
2 3 2
6
5
6
1
|
.
|
\
|
|
.
|
\
|
= = C
Quando observamos uma sucesso de n ensaios de Bernoulli, estamos interessados apenas no
nmero total de sucessos e no na ordem em que eles ocorrem. O nmero de sucessos poder ser qualquer um
dos nmeros 0, 1, 2, 3,..., k. Em n ensaios h ocorrncia de n-k fracassos. E isto pode acontecer de tantas
maneiras quantas so as formas de distribuirmos as k letras S em n posies, ou seja,
n
k
|
\
|
.
|
maneiras diferentes de
ocorrer k sucessos, a cada maneira associarmos a probabilidade p
k
q
n-k
. Considerando o exemplo anterior, para
k=2 (sucessos):
maneiras 3
2
3
k
n
2 k
3 n
q p FSS
q p SFS
q p SSF
2
2
2
=
|
|
.
|
\
|
=
|
|
.
|
\
|
=
|
|
.
|
\
|
=
=
88
Da,
( )
1 2 1 2
3
2
3
2 q p q p x P =
|
|
.
|
\
|
= =
n ..., 3, 2, 1, i onde
ensaio simo - i no falha ocorrer se , 0
ensaio simo - i no sucesso ocorrer se , 1
X
i
=
=
Se X
i
~ Bernoulli(1,p), ento a seqncia (X
1
, X
2
, ..., X
n
) poder obter 2
n
resultados do tipo
(0,0,1,1,...,0), (0,0,...,1,1), (1,1,...,1).
Se X = X
i
, ento X = nmero de sucessos nos n ensaios, da,
( )
( )
( )
k n k
1 n 1
0 n 0
q p
k
n
k x P
q p
1
n
1 x P
q p
0
n
0 x P
|
|
.
|
\
|
= =
|
|
.
|
\
|
= =
|
|
.
|
\
|
= =
K
para k = 0, 1, 2, ... , n.
Neste caso dizemos que:
X ~ Binomial(n,p)
Se x = x
1
+ x
2
+ ... + x
n
, onde cada x
i
~ Bernoulli(1,p) apresenta, respectivamente, uma esperana
matemtica e varincia E(x
i
) =p e Var(x
i
) =p(1-p), ento, para a distribuio binomial teremos:
Esperana matemtica: E(x) = np
Varincia: Var(x) = p(1-p) = npq.
CARACTERSTICAS DA DISTRIBUIO BINOMIAL
1) As repeties do experimento so independentes,
2) uma soma de Bernoulli,
3) A v.a X, conta o nmero de sucessos nas n repeties do experimento. (ensaios de Bernoulli),
4) Existe P(Sucesso) = p constante e consequentemente q = P(F) = 1-p, tambm constante.
Em particular a probabilidade de que no ocorra sucesso :
( ) ( )
n n 0
q p 1 p 0 x P = = =
89
E a probabilidade de que ocorra pelo menos um sucesso :
( ) ( ) ( )
n
q 1 0 x P 1 1 x P 1 1 x P = = = < =
EXEMPLO 1:
Em oito lanamentos de uma moeda, qual ser a probabilidade de ocorrerem pelo menos duas caras?
Definindo a v.a aleatria X = nmero de caras nos oito lanamentos, verificamos de imediato que
X~Binomial(8,1/2). Assim:
( ) ( ) ( ) ( ) | | 1 x P 0 x P 1 2 x P caras duas menos pelo P = + = = =
Exerccios
1. A probabilidade de um atirador acertar o alvo de 25%. Se ele atirar cinco vezes, qual a probabilidade dele
acertar dois tiros.
2. Suponha que 1% dos programas que do entrada no guich de atendimento ao aluno, no CPD da UCB, no
so executados devido a erros. Se em um dado dia 500 programas do entrada no referido guich, calcule:
a) A probabilidade de que todo a os programas tenham sido executados
b) O nmero esperado de programas no executados devido a erro de impresso.
3. Os registros de uma pequena companhia indicam que 40% das faturas por ela emitidas so pagas aps o
vencimento. De 14 faturas expedidas, determine a probabilidade de:
a) Nenhuma ser paga com atraso.
b) No mximo 2 serem pagas com atraso.
c) Ao menos 3serem pagas com atraso.
90
UNIDADE XI DISTRIBUIO CONTNUA
DISTRIBUIO NORMAL
uma das mais importantes distribuies de probabilidades, sendo aplicada em inmeros
fenmenos e constantemente utilizada para o desenvolvimento terico da inferncia estatstica. tambm
conhecida como distribuio de Gauss, Laplace ou Laplace-Gauss.
Seja X uma v.a. (varivel aleatria) contnua. X ter distribuio normal se:
( ) f x e x
X
=
< <
1
2
1
2
2
,
onde os parmetros e
2
so respectivamente a Mdia e a Varincia.
A notao utilizada :
X ~ N ( ,
2
)
que lida da seguinte forma: a v.a. X se aproxima a uma distribuio normal com mdia e varincia
2
.
Para o clculo das probabilidades, surgem dois grandes problemas: primeiro, para a integrao
de f(x) , pois para o clculo necessrio o desenvolvimento em srie; segundo, seria a elaborao de uma tabela
de probabilidades, pois f(x) depende de dois parmetros, fato este que acarretaria um grande trabalho para tabelar
essas probabilidades considerando-se as vrias combinaes de e
2
.
Os problemas foram solucionados por meio de uma mudana de varivel obtendo-se, assim, a
distribuio normal padronizada ou reduzida.
VARIVEL NORMAL PADRONIZADA
A varivel Z dada por:
X
onde X uma varivel normal de Mdia e varincia
2
.
Ento a esperana matemtica e a varincia de Z ser respectivamente:
E[z] = 0
Var[z] = 1
Ento sua funo ser:
( ) z e
z
=
1
2
1
2
2
A notao utilizada :
X ~ N ( 0 , 1 )
que lida da seguinte forma: a v.a. X se aproxima a uma distribuio normal padronizada com mdia 0 e
varincia 1. As probabilidades, isto , as reas sob esta curva esto tabeladas.
91
PROPRIEDADES DA CURVA NORMAL
O grfico da funo densidade de uma varivel normal tem a forma de um sino e simtrico
em relao mdia . Fixando-se a mdia, verificamos que o achatamento est diretamente ligado ao valor
de . Ou seja,
Analisando os grficos da distribuio normal padro, poderemos destacar as seguintes
propriedades:
1. f(x) simtrica em relao origem X= ou (z) simtrica em relao origem z=0;
2. f(x) possui um ponto de mximo para x = ou (z) possui um ponto de mximo para z=0 e, neste caso, sua
ordenada vale
1
2
0 39
, .
3. f(x) tende a zero quando x tende para ou (z) tende a zero quando z tende para ;
4. f(x) tem dois pontos de inflexo cujas abcissas valem + e - ou (z) tem dois pontos de inflexo
cujas abcissas valem -1 e +1.
92
Stevenson, William J. Estatstica aplicada administrao. Harper & Row do Brasil, So Paulo, 1986, p.461
93
Exemplos:
1. Para cada item abaixo monte a curva normal, pinte a rea e encontre a probabilidade.
a) P(0 < z < 1)
b) P(-2,25 < z < 1,2)
c) P(z > 1,93)
2. As alturas dos alunos de determinada escola so normalmente distribudas com mdia 1,60m e desvio
padro de 0,30m. Encontre a probabilidade de um aluno medir:
a) Entre 1,5 e 1,8m
b) Mais de 1,75
c) Menos de 1,48
d) Qual deve ser a medida mnima para escolhermos 10% dos mais altos?
94
UNIDADE XII ESTIMAO
INTRODUO
O processo de estimao tem por finalidade avaliar parmetros de uma distribuio.
Podemos utilizar um nico nmero real para avaliar um parmetro. Neste caso estamos procedendo a uma
estimao pontual.
O valor da mdia amostral uma estimao por ponto. Da mesma forma o valor da varincia, desvio
padro e proporo amostrais so estimativas por ponto dos parmetros varincia, desvio padro e proporo
populacionais, respectivamente.
Estimador Estimativa por ponto Parmetro
x x = 20
s
2
(x) s
2
(x) = 5
( ) x
2
s(x) s(X) = 2
( ) x
p p = 0,3
p
Fazendo uso da estimativa por ponto encontramos uma dificuldade a de que amostras diferentes
conduzem normalmente a estimativas diferentes. A variabilidade no pode ser controlada neste processo.
O controle estatstico desta variabilidade nos leva ento a fixar a estimao atravs de um intervalo.
INTERVALO DE CONFIANA
um intervalo real, centrado na estimativa pontual que dever conter o parmetro com determinada
probabilidade. Esta probabilidade ser conhecida como nvel de confiana associado ao intervalo.
A notao mais usual para o nvel de confiana 1- .
Se pensarmos em uma diferena entre o valor estimado e o parmetro, j que diferentes amostras
conduzem a valores diferentes de estimadores, estaremos calculando o erro-padro de estimativa.
e = |estimativa parmetro |
O controle da preciso se resumir na determinao do erro-padro da estimativa.
DISTRIBUIO AMOSTRAL DAS MDIAS
Considere a seguinte populao x={2, 3, 4, 5}.
Esta populao apresenta ( ) ( ) 12 , 1 x 25 , 1 x 3,5
2
= = =
Se ns considerarmos todas as amostras de tamanho n=2 que podemos obter com reposio teremos:
A
1
= (2,2) A
6
= (3,4)
A
2
= (2,3) A
7
= (3,5)
A
3
= (2,4) A
8
= (4,4)
A
4
= (2,5) A
9
= (4,5)
A
5
= (3,3) A
10
= (5,5)
Cada uma destas amostras possui um valor mdio:
2 x
1
= 3,5 x
6
=
2,5 x
2
= 4 x
7
=
3 x
3
= 4 x
8
=
3,5 x
4
= 4,5 x
9
=
95
3 x
5
= 5 x
10
=
Podemos calcular a mdias das mdias bem como a sua varincia e o seu desvio-padro, assim:
( ) ( ) 87 , 0 x 75 , 0 x 3,5 x
2
= = =
Note que:
A mdia das mdias igual a mdia populacional : x = ;
A varincia das mdias amostrais mantm com a varincia populacional a seguinte relao :
( )
( )
n
x
x
2
2
=
No exemplo:
( )
( )
n
x
x
2
2
=
= 75 , 0
2
1,25
=
Estes resultados so concluses gerais dos seguintes teoremas:
1. Se a varivel aleatria x admite distribuio Normal de probabilidade com mdia e desvio padro
( ) x , ento a distribuio amostral das mdias tambm normal com mdia x = e desvio padro
( )
( )
n
x
x
2
2
=
;
2. Se uma varivel aleatria x tem mdia e desvio padro ( ) x , ento distribuio amostral das
mdias se aproxima de uma distribuio normal com mdia x = e com desvio-padro
( )
( )
n
x
x
2
2
=
, a medida que o nmero n de elementos tende a infinito.
EXEMPLO:
1. Uma v.a. x tem distribuio normal com mdia 20 e desvio-padro de 3. Calcule a probabilidade de que uma
amostra de 20 elementos selecionada ao acaso tenha mdia maior que 21.
O INTERVALO DE CONFIANA PARA A MDIA POPULACIONAL
Como j foi estudado para se transformar uma distribuio Normal x em uma distribuio Normal z
utilizamos a mudana de varivel
( ) x
- x
z =
A transformao da distribuio x na distribuio z , por analogia:
( ) x
x - x
z =
como foi visto
anteriormente x = e
( )
( )
n
x
x
2
2
=
, logo:
( )
n
x
- x
z =
.
Em termos de distribuio normal z o nvel de confiana a probabilidade de o intervalo conter o
96
parmetro estimado, isto representa a rea central sob a curva normal entre os pontos
2
z e z - ,
Observe que a rea total sob a curva normal unitria. Se a rea central 1- ., a notao
z -
2
, e a notao
2
. Desta forma:
P( z -
2
< z <
2
z ) = 1-
Se substituirmos o valor de z por
( )
n
x
- x
z = e utilizando alguns clculos matemticos encontraremos a
expresso final do Intervalo de Confiana para a estimativa da mdia populacional.
( ) ( )
1
n
x
z x
n
x
z - x p
2
+ < <
Para calcular esta expresso deveremos pressupor o conhecimento do desvio-padro populacional, e que a
amostragem foi obtida com reposio. Alm disso importante salientar que
( )
n
x
z
2
representa o erro-padro
de estimativa, e que os limites so estabelecidos pelos valores (estimativa erro, estimativa +erro)
EXEMPLO:
1. O departamento de recursos humanos de uma grande empresa informa que o tempo de execuo de tarefas
que envolvem participao manual varia de tarefa para tarefa, mas que o desvio padro permanece
aproximadamente constante , em 3 minutos.Uma nova tarefa est sendo implantada na empresa. Uma amostra
aleatria do tempo de execuo de 50 destas novas tarefas forneceu o valor mdio de 15 minutos. Determine
um intervalo de confiana de 95% para o tempo mdio de execuo desta nova tarefa.
97
UNIDADE XIII TESTES DE SIGNIFICNCIA
INTRODUO
Como vimos toda avaliao feita sobre um parmetro populacional, o qual no possumos nenhuma
informao, pode ser resultado do processo de estimao feito atravs do Intervalo de Confiana.
Se j possumos alguma informao, podemos test-la no sentido de aceit-la como verdadeira ou rejeit-la.
Os Teste de Significncia tem por finalidade, a partir da elaborao de uma Hiptese Nula H
0
e de uma
Hiptese Alternativa H
a
, verificar a aceitabilidade ou no da informao. Por isso ser conhecida como uma Regra de
Deciso.
Para sermos mais claro, isto significa que a partir de uma amostra de uma determinada populao iremos
confirmar ou no o valor do parmetro atravs da anlise de deciso sobre aceitar H
0
ou rejeitar H
0
. Quando nos
propuser a utilizar tal procedimento devemos ter em mente que estamos sujeitos a erros e acertos na deciso. De um
modo geral, em qualquer tipo de deciso, os acertos e os erros podem ser dispostos segundo o quadro abaixo:
Estado da Natureza
Deciso H
0
verdadeira H
0
falsa
Aceita-se H
0
Deciso Correta Erro tipo II
Rejeita-se H
0
Erro tipo I Deciso Correta
Erro Tipo I - Consiste em rejeitar H
0
quando H
0
verdadeira
Erro Tipo II - Consiste em aceitar H
0
quando H
0
falsa
Nvel de Significncia do Teste - a probabilidade de se cometer o erro Tipo I, ou seja, rejeitar uma Hiptese
verdadeira. O Nvel de significncia ser denotado por .
A probabilidade do erro Tipo II no possui um nome em especial mais ser conhecida como erro .
A fixao da Hiptese alternativa que diferencia os vrios tipos de Teste.
EXEMPLOS
1. Julgamento do Ru
Estado da Natureza
Deciso Inocente Culpado
Inocente Deciso Correta Erro tipo II
Culpado Erro tipo I Deciso Correta
O erro Tipo I, no caso, seria julgar o ru culpado, quando na verdade ele inocente.
O erro Tipo II, seria julgar o ru inocente , quando na verdade ele culpado.
2. Deciso de um mdico sobre uma cirurgia
Estado da Natureza
Deciso Precisa Operar No Precisa Operar
Opera Deciso Correta Erro tipo II
No Opera Erro tipo I Deciso Correta
O erro Tipo I seria no operar, quando na verdade o paciente precisa ser operado
O erro Tipo II seria operar, quando o paciente no precisa ser operado.
Na realizao dos testes, controlaremos o erro tipo I, procurando diminuir a probabilidade de sua ocorrncia
Quando controlarmos os nveis e , estaremos realizando um Teste de Hiptese.
98
TIPOS DE TESTES.
1
Tipo -
>
=
r parmetro : H
r parmetro : H
a
0
2
Tipo -
<
=
r parmetro : H
r parmetro : H
a
0
3
Tipo -
=
r parmetro : H
r parmetro : H
a
0
A realizao de um Teste Compreende as seguintes etapas
1. Identificar H
0
;
2. Identificar H
a
(ateno, pois H
a
define o tipo de teste a ser empregado)
3. Construir a regio crtica para o teste escolhido;
4. Calcular o estimador e verificar se ele se situa na regio de aceitao ou na regio de rejeio da hiptese
H
0
.
5. Deciso do teste Se o estimador estiver na regio de aceitao Aceita-se H
0
Se o estimador estiver na regio de rejeio, Rejeita-se H
0
TESTE DE SIGNIFICNCIA PARA A MDIA
O melhor estimador para e x . A distribuio amostral das mdias normal, com:
( )
n
x
- x
z =
1
Teste -
>
=
b : H
b : H
a
0
A regio crtica (de Rejeio RR) :
( )
n
x
- x
z =
2
Teste
<
=
b : H
b : H
a
0
A regio crtica (de Rejeio RR) :
( )
n
x
- x
z =
3
Teste
=
b : H
b : H
a
0
A regio crtica (de Rejeio RR) :
( )
n
x
- x
z =
99
EXEMPLO
1. Uma amostra Aleatria de 40 elementos retirados de uma populao normal com desvio padro igual a 3
apresentou um valor mdio igual a 60. Teste, ao nvel de significncia de 5%, a hiptese de que a mdia populacional
seja igual a 59, supondo a hiptese alternativa >59.
Soluo:
>
=
59 : H
59 : H
a
0
Ao nvel de 5% de significncia, a regio crtica para a hiptese nula :
O valor de z
t
= 1,64 proveniente da tabela normal onde no corpo podemos procurar o valor de 0,5 - 0,05.
O valor de z
c
dado por:
( )
n
x
- x
z
c
=
=
40
3
59 - 60
= 2,11
Como o valor de z
c
= 2,11 est na regio de rejeio para a hiptese H
0
. No temos motivos para aceitar H
0
.
2. Uma amostra aleatria de 20 elementos selecionados de uma populao normal com varincia 3 apresentou
mdia 53. Teste ao nvel de significncia de 5% a hiptese =50.
Soluo
=
50 : H
50 : H
a
0
Ao nvel de 10% de significncia, a regio crtica para a hiptese nula :
O valor de z
c
dado por:
( )
n
x
- x
z
c
=
=
20
1,73
50 - 53
= 7,755
Como o valor de z
c
= 7,755 est na regio de rejeio para a hiptese H
0
. No temos motivos para aceitar H
0
.
100
Exerccios
1. Uma agncia de empregos alega que os candidatos por elas colocados nos ltimos 6 meses tm salrios de
R$9.000,00 anuais, em mdia. Uma agncia governamental extraiu uma amostra aleatria daquele grupo,
encontrando um salrio mdio de R8.000,00, com desvio-padro de R$1.000,00 com base em 50 empregados. Teste
a afirmao da agncia, contra a alternativa de que o salrio mdio inferior a R$9.000,00, ao nvel de significncia
de 0,05.
2. A DeBug Company vende um repelente de insetos que alega ser eficiente pelo prazo de 400 horas no mnimo. Uma
anlise de nove itens escolhidos aleatoriamente acusou uma mdia de eficincia de 380 horas. Teste a alegao da
companhia, contra a alternativa que a durao inferior a 400 horas, ao nvel de 0,01, se o desvio-padro 90 horas.
101
UNIDADE XIV REGRESSO LINEAR E CORRELAO
INTRODUO
A anlise de Regresso Linear e de Correlao compreende anlise de dados amostrais para saber se e como
duas ou mais variveis esto relacionadas uma com as outras em uma populao. O objetivo nesse item o estudo de
situaes de duas variveis.
A anlise de regresso linear apresenta como resultado uma equao matemtica que descreve um
determinado relacionamento. A equao pode ser usada para estimar, ou predizer, valores de uma varivel quando se
conhecem ou se supe conhecidos valores de outra varivel.
A anlise de correlao fornece um nmero que resume o grau de relacionamento entre duas variveis. Ela
til em um trabalho exploratrio, quando um pesquisador ou analista procura determinar quais variveis so
potencialmente importantes e o interesse est no grau ou na fora desse relacionamento. Por exemplo, quando uma
varivel aumenta de valor, de que maneira influenciada a outra varivel?
ALGUNS CASO DE RELACIONAMENTO DE VARIVEIS:
1. A idade e a resistncia fsica?
2. Pessoas de maior renda tendem a apresentar maior escolaridade?
3. O sucesso em um emprego pode ser predito com base no resultado de testes?
4. A temperatura parece influenciar a taxa de criminalidade?
Dois tipos de pesquisas so avaliados quando se pretende estudar um conjunto de dado. A pesquisa
Experimental e a pesquisa de um estudo de relacionamento. A primeira, manipula-se uma varivel e medem-se as
mudanas conseqentes em uma outra varivel, enquanto que o segundo tipo de pesquisa, medem-se ambas variveis,
procurando relacionar as mudanas que ocorrem naturalmente em uma varivel por exemplo, a rapidez na leitura
com as mudanas que ocorrem naturalmente com a outra varivel por exemplo, a inteligncia. Para tal medem-se os
QIs e a rapidez em uma grande amostra de pessoas e depois analisam-se os dados, para verificar se as pessoas de
elevado QI tendem tambm a Ter melhores velocidades, e as pessoas de baixo QI, piores.
Um modo de apresentar os resultados atravs de um diagrama de disperso:
REGRESSO LINEAR
H diversas maneira de se utilizarem as equaes de regresso. Uma em situaes em que as duas variveis
medem aproximadamente a mesma situao, mais uma delas mais difcil de se trabalhar, enquanto a outra no. Por
exemplo a resistncia e a dureza de um metal podem estar inter-relacionadas, de modo que conhecendo a dureza pode-
se estimar a resistncia. Assim sendo, a finalidade de uma equao de regresso seria estimar valores de uma varivel
com base em valores conhecidos da outra varivel.
0
2
4
6
8
10
12
90 100 110 120 130 140
QI
R
a
p
i
d
e
z
102
Outra utilizao das equaes de regresso explicar valores de uma varivel em termos da outra varivel,
isto , pode-se suspeitar de uma relao de causa e efeito entre duas variveis. Por exemplo, um Psiclogo pode tentar
explicar as variaes de comportamento em funo de uma pessoa estar ou no empregada.
A EQUAO DA RETA
Embora tais relaes possam assumir uma grande diversidade de formas, nos limitaremos a estudar as
Equaes Lineares. Duas grandes caractersticas da equao linear so:
1. a inclinao da reta ( o coeficiente angular) e
2. a ordenada da reta (valor de y) em determinado ponto (quando x=0)
Uma equao linear tem a forma
y = a +bx
onde a e b so valores que se determinam com base nos dados amostrais; a a ordenada da reta em x=0, e b o
coeficiente angular.
Exemplo: Considere a equao linear y = 5 + 3x. A reta intercepta o eixo y quando x=0 no ponto y = 5. O coeficiente
angular da reta 3, o que significa que a cada unidade de variao de x correspondem 3 unidade de y.
DETERMINAO DA EQUAO MATEMTICA
Considere a maneira de determinar a equao de uma reta que melhor descreva um conjunto de observaes..
por exemplo suponha que se queira determinar se h alguma relao entre o desempenho de um aluno em uma
disciplina e a renda familiar. Na linguagem de regresso a varivel independente ser a renda familiar, e a varivel
dependente ser o desempenho escolar utilizaremos a varivel x para determinar a varivel independente e y para a
varivel dependente.
Os valores da tabela 1 resultam no diagrama de disperso abaixo:
Aluno Desempenho Renda familiar
1 5 10
2 4 15
3 4 12
4 4 18
5 6 8
6 7 10
7 8 5
8 2 30
9 3 25
0
5
10
15
20
25
30
35
40
45
0 2 4 6 8 10 12 14
X
Y
103
MTODO DE MNIMOS QUADRADOS
O mtodo Mnimos Quadrado usado para ajustar uma linha reta a um conjunto de pontos conhecido como
a tcnica dos mnimos quadrados, cuja a reta realmente tem duas caractersticas importantes:
1. a soma dos desvios verticais dos pontos em relao a reta zero;
2. a soma dos quadrados desses desvios mnima (isto , nenhuma outra reta daria menor soma de
quadrados de tais desvios)
Simbolicamente, o valor que minimizado :
( )
=
n
i 1
2
c i
y y
onde y
i
o valor observado de y e y
c
o valor calculado de y utilizando-se a soma de mnimos quadrados com os
valores de x correspondente a y.
Os valores de a e b para a reta y
c
= a + bx que minimizam a soma dos quadrados dos desvios so as
solues das chamadas Equaes Normais da Reta de Regresso:
+ =
= =
n n
i 1 i
i
1
i
x b a n y
=
= = =
n
1 i
2
i
1
n
1 i
i i i
x b x a y x
n
i
Com o desenvolvimento de tais equaes chegaremos em:
( ) ( )( )
( ) ( )
2
2
x x n
y x xy n
b
=
e
Equao da reta
0
2
4
6
8
10
0 5 10 15 20 25 30 35
Renda Familiar
D
e
s
e
m
p
e
n
h
o
104
n
x b - y
a
=
EXEMPLO:
1. determinar os somatrios
2. levar esses resultados numricos s expresses de a e b, com n =9
b = -0,2076
a = 7,846
3. Escrever a Equao da reta
y
c
= 7,846 0,2076x
Aluno Desempenho Renda familiar
x
2
XY
1 5 10 100 50
2 4 15 225 60
3 4 12 144 48
4 4 18 324 72
5 6 8 64 48
6 7 10 100 70
7 8 5 25 40
8 2 30 900 60
9 3 25 625 75
Soma
x = 43 y = 133 x
2
= 2507 xy = 523
105
USANDO O EXCEL
Passo 1: coloque os valores em duas colunas, conforme a figura anterior
x y
2 3,5
3 5,7
5 9,9
8 16,3
10 19,3
12 25,7
14 28,2
15 32,6
106
Passo 2: no Excel, v ao Assistente de Funo e escolha as funes:
INCLINNAO para se determinar o valor de b e a funo INTERCEPO* para se determinar o valor de a.
Em val_conhecido_y, devem ser digitadas a primeira e a ltima clula, separadas por dois pontos, dos
valores de y; de modo semelhante, em val_conhecidos_x, devem ser digitadas a primeira e a ltima clula,
separadas por dois pontos, dos valores de x.
Para os valores da tabela anterior encontramos b = 2,16 e a =-0.985.
107
CORRELAO
O objetivo do estudo da correlao determinar a fora do relacionamento entre duas observaes
emparelhadas.
EXEMPLO:
razovel pensar que os estudantes obtenham na universidade aproximadamente o mesmo desempenho
obtido no ensino mdio. Sendo assim forma observadas 15 universitrios escolhidos aleatoriamente em uma
universidade, comparadas as suas mdias na universidade e no ensino mdio, chegou-se aos valores que constam na
tabela abaixo:
Graficamente o desempenho dos estudantes foi:
Para o clculo do coeficiente de correlao de Pearson faremos::
r =
( )( )
( ) ( ) ( ) ( ) n / Y Y n / X X
n / Y X - XY
2
2
2
2
Desempenho Desempenho
Estudantes no ensino mdio na universidade
1 80 81
2 82 81
3 84 82,1
4 85 81,4
5 87 82,1
6 88 81,7
7 88 82
8 89 83,5
9 90 83,1
10 91 82,4
11 91 82,7
12 92 83
13 94 83,9
14 96 83,6
15 98 84
80,5
81
81,5
82
82,5
83
83,5
84
84,5
80 82 84 86 88 90 92 94 96 98 100
Ensino mdio
U
n
i
v
e
r
s
i
d
a
d
e
108
USANDO O EXCEL