Apostila de Estatística Básica Com Resolução UFV

UNIVERSIDADE FEDERAL DE VIÇOSA
CENTRO DE CIÊNCIAS EXATAS E TECNOLÓGICAS

DEPARTAMENTO DE ESTATÍSTICA
Manual de soluções do roteiro de aulas - EST 103

2019/I
VIÇOSA - MG
22 de maio de 2019
LISTA DE FIGURAS
Capítulo I . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 6
Capítulo II . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 7
Capítulo III . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 23
Figura 1 Gráfico de setores da variável sexo . . . . . . . . . . . . . . . . . . . . . . . . . . . . 29
Figura 2 Gráfico de setores da variável fuma . . . . . . . . . . . . . . . . . . . . . . . . . . . 30
Figura 3 Gráfico de setores da variável trabalha . . . . . . . . . . . . . . . . . . . . . . . . . 30
Figura 4 Gráfico de setores da variável time . . . . . . . . . . . . . . . . . . . . . . . . . . . 31
Figura 5 Gráfico de setores da variável curso . . . . . . . . . . . . . . . . . . . . . . . . . . . 32
Figura 6 Gráfico de setores da variável nomofobia . . . . . . . . . . . . . . . . . . . . . . . . 32
Figura 7 Gráfico de setores da variável presença . . . . . . . . . . . . . . . . . . . . . . . . . 33
Figura 8 Gráfico de setores da variável voto . . . . . . . . . . . . . . . . . . . . . . . . . . . . 33
Figura 9 Gráfico de setores da variável tolerância . . . . . . . . . . . . . . . . . . . . . . . . . 34
Figura 10 Gráfico de barras da variável sexo . . . . . . . . . . . . . . . . . . . . . . . . . . . . 34
Figura 11 Gráfico de barras da variável fuma . . . . . . . . . . . . . . . . . . . . . . . . . . . 35
Figura 12 Gráfico de barras da variável trabalha . . . . . . . . . . . . . . . . . . . . . . . . . . 36
Figura 13 Gráfico de barras da variável time . . . . . . . . . . . . . . . . . . . . . . . . . . . . 37
Figura 14 Gráfico de barras da variável curso . . . . . . . . . . . . . . . . . . . . . . . . . . . 38
Figura 15 Gráfico de barras da variável nomofobia . . . . . . . . . . . . . . . . . . . . . . . . 39
Figura 16 Gráfico de barras da variável presença . . . . . . . . . . . . . . . . . . . . . . . . . . 40
Figura 17 Gráfico de barras da variável voto . . . . . . . . . . . . . . . . . . . . . . . . . . . . 41
Figura 18 Gráfico de barras da variável tolerância . . . . . . . . . . . . . . . . . . . . . . . . . 42
Figura 19 Gráfico de barras da variável idade - valores absolutos . . . . . . . . . . . . . . . . . 44
Figura 20 Gráfico de barras da variável idade - valores percentuais . . . . . . . . . . . . . . . . 45
Figura 21 Gráfico de barras da variável horas de estudo - valores absolutos . . . . . . . . . . . 46
Figura 22 Gráfico de barras da variável horas de estudo - valores percentuais . . . . . . . . . . 46
Figura 23 Gráfico de barras da variável nota - valores absolutos . . . . . . . . . . . . . . . . . 47
Figura 24 Gráfico de barras da variável nota - valores percentuais . . . . . . . . . . . . . . . . 47
Figura 25 Gráfico de barras da variável período - valores absolutos . . . . . . . . . . . . . . . 48
Figura 26 Gráfico de barras da variável período - valores percentuais . . . . . . . . . . . . . . 49
Figura 27 Histograma para a variável altura . . . . . . . . . . . . . . . . . . . . . . . . . . . . 51
Figura 28 Histograma para a variável peso . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 54
Figura 29 Histograma para a variável tempo de espera . . . . . . . . . . . . . . . . . . . . . . 56
Figura 30 Histograma para a variável tempo de sobrevivência . . . . . . . . . . . . . . . . . . 58
Figura 31 Histograma para a variável número de pessoas diabéticas, que necessitam do medi-
camento . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 60
Capítulo IV . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 61
Capítulo V . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 92
Figura 1 Gráfico de dispersão de Idade versus Massa muscular . . . . . . . . . . . . . . . . . 101
Capítulo VI . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 121
Capítulo VII . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 173
Capítulo VIII . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 238
Figura 1 Região crítica do teste t, para duas médias, unilateral à esquerda. . . . . . . . . . . 239
Figura 2 Região crítica do teste t, para uma média, unilateral à direita. . . . . . . . . . . . . 240
Figura 3 Região crítica do teste t, para duas médias, unilateral à direita. . . . . . . . . . . . 243
Figura 4 Região crítica do teste t, para uma média, bilateral. . . . . . . . . . . . . . . . . . . 244
Figura 6 Região crítica para o teste de χ2 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 248
Figura 13 Região crítica do teste t, para uma média, unilateral à esquerda. . . . . . . . . . . . 263
Figura 23 Região crítica do teste t, para duas médias, bilateral. . . . . . . . . . . . . . . . . . 285
Figura 29 Região crítica do teste Z, para uma média, unilateral à esquerda. . . . . . . . . . . 298
Figura 30 Região crítica para o teste. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 301
LISTA DE TABELAS
Capítulo I . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 6
Capítulo II . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 7
Tabela 1 Exemplo de uma tabela de números aleatórios . . . . . . . . . . . . . . . . . . . . . 8
Capítulo III . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 23
Tabela 1 Distribuição de frequências da variável sexo . . . . . . . . . . . . . . . . . . . . . . 24
Tabela 2 Distribuição de frequências da variável fuma . . . . . . . . . . . . . . . . . . . . . . 25
Tabela 3 Distribuição de frequências da variável trabalha . . . . . . . . . . . . . . . . . . . . 25
Tabela 4 Distribuição de frequências da variável time . . . . . . . . . . . . . . . . . . . . . . 26
Tabela 5 Distribuição de frequências da variável curso . . . . . . . . . . . . . . . . . . . . . . 27
Tabela 6 Distribuição de frequências da variável nomofobia . . . . . . . . . . . . . . . . . . . 28
Tabela 7 Distribuição de frequências da variável presença . . . . . . . . . . . . . . . . . . . . 28
Tabela 8 Distribuição de frequências da variável voto . . . . . . . . . . . . . . . . . . . . . . 28
Tabela 9 Distribuição de frequências da variável tolerância . . . . . . . . . . . . . . . . . . . 29
Tabela 10 Distribuição de frequências para a idade . . . . . . . . . . . . . . . . . . . . . . . . 43
Tabela 11 Distribuição de frequências para horas de estudo . . . . . . . . . . . . . . . . . . . . 43
Tabela 12 Distribuição de frequências para a nota . . . . . . . . . . . . . . . . . . . . . . . . . 43
Tabela 13 Distribuição de frequências para o período . . . . . . . . . . . . . . . . . . . . . . . 44
Tabela 14 Distribuição de frequências para a variável “altura” . . . . . . . . . . . . . . . . . . 50
Tabela 15 Distribuição de frequências para a variável “peso” . . . . . . . . . . . . . . . . . . . 53
Tabela 16 Distribuição de frequências para a variável “tempo de espera”. . . . . . . . . . . . . 56
Tabela 17 Distribuição de frequências para a variável “tempo de sobrevivência”. . . . . . . . . 58
Tabela 18 Distribuição de frequências para a variável “número de pessoas diabéticas, que
necessitam do medicamento”. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 60
Capítulo IV . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 61
Capítulo V . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 92
Capítulo VI . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 121
Capítulo VII . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 173
Capítulo VIII . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 238
SUMÁRIO
CAPÍTULO I Introdução à Estatística . . . . . . . . . . . . . . . . . . . . . . . 6

CAPÍTULO II Amostragem . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 7
CAPÍTULO III Estatística descritiva . . . . . . . . . . . . . . . . . . . . . . . . 23
CAPÍTULO IV Medidas resumo . . . . . . . . . . . . . . . . . . . . . . . . . . 61
CAPÍTULO V Regressão linear simples . . . . . . . . . . . . . . . . . . . . . . 92
CAPÍTULO VI Probabilidade . . . . . . . . . . . . . . . . . . . . . . . . . . . . 121
CAPÍTULO VII Distribuições de probabilidade . . . . . . . . . . . . . . . . . 173
CAPÍTULO VIII Testes de hipóteses . . . . . . . . . . . . . . . . . . . . . . . 238
6
CAPÍTULO I
Introdução à Estatística
Esse capítulo não tem exercícios

7
CAPÍTULO II
Amostragem
8
Tabela 1: Exemplo de uma tabela de números aleatórios

3690 2492 7171 7720 6509 7549 2330 5733 4730
0813 6790 6858 1489 2669 3743 1901 4971 8280
6477 5289 4092 4223 6454 7632 7577 2816 9202
0772 2160 8236 0812 4195 5589 0830 8261 9232
5692 9870 3583 8997 1533 6566 8830 7271 3809
2080 3828 7880 0586 8482 7811 6807 3309 2729

1039 3382 7600 1077 4455 8806 1822 1669 7501
7227 0104 4141 1521 9104 5563 1392 8238 4882
8506 6348 4612 8252 1062 1757 0964 2983 2244
5086 0303 7423 3298 3979 2831 2257 1508 7642
0092 1629 0377 3590 2209 4839 6332 1490 3092

0935 5565 2315 8030 7651 5189 0075 9353 1921
2605 3973 8204 4143 2677 0034 8601 3340 8383
7277 9889 0390 5579 4620 5650 0210 2082 4664
5484 3900 3485 0741 9069 5920 4326 7704 6525
6905 7127 5933 1137 7583 6450 5658 7678 3444

8387 5323 3753 1859 6043 0294 5110 6340 9137
4094 1957 0163 9717 4118 4276 9465 8820 4127
4951 3781 5101 1815 7068 6379 7252 1086 8919
9047 0199 5068 7447 1664 9278 1708 3625 2864
7274 9512 0074 6677 8676 0222 3335 1976 1645

9192 4011 0255 5458 6942 8043 6201 1587 0972
0554 1690 6333 1931 9433 2661 8690 2313 6999
8231 5627 1815 7171 8036 1832 2031 6298 6073
3995 9677 7765 3194 3222 4191 2734 4469 8617
2402 6250 9362 7373 4757 1716 1942 0417 5921

5295 7385 5474 2123 7035 9983 5192 1840 6176
5177 1191 2106 3351 5057 0967 4538 1246 3374
7315 3365 7203 1231 0546 6612 1038 1425 2709
5775 7517 8974 3961 2183 5295 3096 8536 9442
5500 2276 6307 2346 1285 7000 5306 0414 3383

3251 8902 8843 2112 8567 8131 8116 5270 5994
4675 1435 2192 0874 2897 0262 5092 5541 4014
3543 6130 4247 4859 2660 7852 9096 0578 0097
3521 8772 6612 0721 3899 2999 1263 7017 8057
5573 9396 3464 1706 9204 3389 5678 2589 0288

7478 7569 7551 3380 2152 5411 2647 7242 2800
3339 2854 9691 9562 3252 9848 6030 8472 2266
5505 8474 3167 8552 5409 1556 4247 4652 2953
6381 2086 5457 7703 2758 2963 8167 6712 9820
Fonte: STEVENSON, W. J. Estatística aplicada à administração. São Paulo, Harbra, 1981.
9
1) Qual a principal diferença entre uma amostra probabilística e uma amostra não probabilística?
A amostragem probabilística é aquela em que cada elemento da população tem uma chance conhecida
e diferente de zero de ser selecionado para compor a amostra.
Amostragem não probabilística é aquela em que a seleção dos elementos da população para compor
a amostra depende ao menos em parte do julgamento do pesquisador ou do entrevistador no campo.
Dessa forma a principal diferença entre as duas amostragens é a forma de se compor a amostra,
ocorrendo algum mecanismo de sorteio na amostragem probabilística, enquanto que na amostragem
não probabilística isso não ocorre.
10
2) Diferencie: amostragem aleatória simples, amostragem aleatória estratificada e amostragem siste-

mática.
A amostragem aleatória simples é utilizada quando os elementos que compõem a população são
homogêneos. Nesse tipo de processo de amostragem, todos os elementos da população tem a mesma
probabilidade de serem amostrados e, sorteia-se um a um cada elemento a fim de se compor a amostra
aleatória.
A amostragem sistemática tem os mesmos pressupostos que a amostragem aleatória simples, mas
o modo de se obter a amostra é um processo mais rápido que aquele empregado na amostragem
aleatória simples.
Na amostragem estratificada a população não é homogênea, ela é constituída de subgrupos, denomi-

nados estratos, os quais são internamente homogêneos e externamente heterogêneos.
11
3) Em uma convenção partidária estão presentes 5 senadores, 8 prefeitos e 27 vereadores. Deseja-se

estudar a média salarial da população composta pelos 40 participantes. Sendo assim, responda:
Senadores: S01 S02 S03 S04 S05

Prefeitos: P01 P02 P03 P04 P05 P06 P07 P08
Vereadores: V01 V02 V03 V04 V05 V06 V07 V08 V09 V10
V11 V12 V13 V14 V15 V16 V17 V18 V19 V20
V21 V22 V23 V24 V25 V26 V27
a) Qual o tamanho amostral indicado para que os erros amostrais não ultrapassem 5%?
1 1
& ' & '
n0 = = = 400.
2
E0 (0, 05)2
Como N = 40, podemos corrigir, a expressão anterior:
N.n0 40 × 400

n= = = d36, 36e = 37.
N + n0 40 + 400
b) O tamanho amostral obtido no item anterior é próximo, ou distante, do tamanho da população?

Por quê?
O tamanho amostral obtido é próximo, do tamanho da população. Isso se dá pelo fato de que o
tamanho da população é pequeno e também devido ao erro amostral admitido no estudo. Fixado um
erro amostral, quanto maior for o tamanho da população, mais distantes estarão o tamanho amostral
obtido e o tamanho da população; fixado o tamanho da população, quanto menor for o erro amostral,
mais próximos estarão o tamanho amostral obtido e o tamanho da população.
c) Qual o processo de amostragem indicado para selecionar uma amostra, a fim de estudar a média
salarial?
O processo de amostragem mais indicado seria o estratificado, pois na população em estudo percebe-
se, claramente, três subconjuntos (Senadores, Prefeitos e Vereadores) com características diferentes
entre os estratos, porém dentro de cada estrato há homogeneidade.
12
4) Uma empresa tem 3414 empregados distribuídos nos seguintes departamentos: Administração
(914), Transportes (348), Produção (1401) e Outros (751). Deseja-se extrair uma amostra entre
os empregados, para verificar o grau de satisfação, em relação à qualidade da comida servida no
refeitório. Admitindo-se um erro amostral de 6%, determine quantos empregados de cada estrato
deverão ser selecionados?
O erro tolerável deve ser igual a E0 = 0, 06 então:
1 1
& ' & '
n0 = = = d277, 78e = 278.
2
E0 (0, 06)2
Esse seria o tamanho amostral indicado se não soubéssemos o tamanho da população e, admitindo-se
um erro de 6%. Como sabemos que o número total de estudantes é N = 3414, o tamanho amostral
é dado por:
N.n0 3414 × 278

n= = = 258
N + n0 3414 + 278
devemos assim tomar n = 258 empregados.
Temos h = 4 estratos, quais sejam, Administração, Transportes, Produção e Outros, sendo que os
tamanhos dos estratos são N1 = 914, N2 = 348, N3 = 1401 e N4 = 751, respectivamente. Além
disso, vimos que, o número total de empregados a serem amostrados é 258 e, o número de elementos
de cada estrato que devem ser selecionados é:
• Para o estrato da Administração devemos selecionar
N1 914

n1 = ×n = × 258 = d69, 07e = 70,
N 3414
empregados;
• Para o estrato do Transportes devemos selecionar
N2 348

n2 = ×n = × 258 = d26, 3e = 27,
N 3414
empregados;
• Para o estrato do Produção devemos selecionar
N3 1401

n3 = ×n = × 258 = d105, 88e = 106,
N 3414
empregados;
13
• Para o estrato do Outros devemos selecionar
N4 751

n4 = ×n = × 258 = d56, 75e = 57,
N 3414
empregados.
Note que, nesse caso temos uma amostra de tamanho n = 70 + 27 + 106 + 57 = 260 e não 258, como
anteriormente pedia-se. Isso deve-se ao fato da impossibilidade de amostrar um número não inteiro
de elementos e, a fim de garantir o erro tolerável admitido, por vezes uma amostra um pouco maior
pode ser necessária.
14
5) Considere os 30 empregados de uma fábrica e, realize o processo de amostragem aleatória sistemá-

tica para selecionar uma amostra de tamanho n = 9.
E01 E02 E03 E04 E05 E06 E07 E08 E09 E10
E11 E12 E13 E14 E15 E16 E17 E18 E19 E20
E21 E22 E23 E24 E25 E26 E27 E28 E29 E30
Utilize a tabela de números aleatórios, iniciando na linha 04, coluna 05 e siga horizontalmente para
a esquerda. Ao chegar no início da linha vá para o final da linha de cima.
Temos que N = 30, n = 9 e, o salto amostral é
N 30

k= = = d3, 33e = 4.
n 9
Sabemos que k = 4, assim sendo, somente os k = 4 primeiros elementos da amostra serão considera-
dos, isto é,
E01 E02 E03 E04
Considerando-se a linha e a coluna indicadas (linha 04, coluna 05), selecionaremos primeiramente.
Os demais elementos serão obtidos somando-se o salto amostral da seguinte forma:
1◦ elemento 02
2◦ elemento 02 + 4 = 6
3◦ elemento 6 + 4 = 10
4◦ elemento 10 + 4 = 14
5◦ elemento 14 + 4 = 18
6◦ elemento 18 + 4 = 22
7◦ elemento 22 + 4 = 26
8◦ elemento 26 + 4 = 30
9◦ elemento 4
Dessa forma, a amostra selecionada é
X = {E2 , E6 , E10 , E14 , E18 , E22 , E26 , E30 , E4 } .

15
6) Uma empresa pública conta com 70 servidores. Uma pesquisa por amostragem precisa ser realizada,
sendo que, a princípio deseja-se 5% de erro.
a) Qual seria o tamanho da amostra para esse erro desejado?
Temos que E0 = 0, 05; N = 70, assim
1 1 1
& ' & ' & '
n0 = = = = 400,
2
E0 0, 052 0, 0025
n0 N 400 × 70 28000

logo n = = = = 60.
n0 + N 400 + 70 470
b) Devido à impossibilidade da realização de uma pesquisa desse tamanho, somente 25 serão pesqui-
sados, sendo assim, qual o novo erro da pesquisa?
n0 N n0 × 70
n= ⇒ 25 =
n0 + N n0 + 70
25 × (n0 + 70) = 70n0 ⇒ 70n0 − 25n0 = 1750
1750
45n0 = 1750 ⇒ n0 = = 38, 89.
45
Desse modo
1 1
n0 = 2
⇒ 2 = 38, 89
E0 E0
1
E02 = ⇒ E02 = 0, 0257
38, 89
√
E0 = 0, 0257 = 0, 1604.
16
7) Em relação à questão 6) devemos numerar os servidores de 01 a 70, a fim de selecionarmos os 25

que comporão a nossa amostra. Começando na 2ª linha e 1ª coluna da tabela de números aleatórios
(Tabela 1), seguindo horizontalmente para a direita e ao chegar ao fim da linha iniciar no começo da
linha de baixo, selecione os 25 servidores da amostra.
S = {08, 13, 67, 68, 58, 14, 26, 69, 37, 43, 19, 01, 49, 64, 52, 40, 42, 23, 54, 32, 28, 16, 02, 07, 21} ,
e ordenando-os temos
S = {01, 02, 07, 08, 13, 14, 16, 19, 21, 23, 26, 28, 32, 37, 40, 42, 43, 49, 52, 54, 58, 64, 67, 68, 69} .
17
8) Uma empresa possui 35 empregados (listados abaixo) e, ao final do ano, devido ao bom desempenho
por parte dos funcionários, o proprietário resolveu presentear 5 deles com uma semana de folga em
um resort e tudo pago pela empresa. Como todos trabalharam arduamente durante o ano todo e,
para que não houvessem injustiças, ele resolveu utilizar a amostragem aleatória simples e uma tabela
de números aleatórios para realizar o sorteio.
01 - Adriana 02 - Almir 03 - Ana Paula 04 - Andreza 05 - Cataline

06 - Débora 07 - Edna 08 - Elaine 09 - Erivaldo 10 - Erivan
11 - Jamilly 12 - Janaína 13 - Jeane 14 - Jessica 15 - João Paulo
16 - Karina 17 - Leandro 18 - Luciano 19 - Luiz 20 - Maria
21 - Mariana 22 - Marilza 23 - Mário 24 - Maytê 25 - Michell
26 - Nayara 27 - Neyber 28 - Priscila 29 - Roberta 30 - Suélen
31 - Tatiana 32 - Tatiara 33 - Thaís 34 - Thuanne 35 - Wellington
Se ele utilizar a tabela de números aleatórios e, começar na terceira linha, segunda coluna, seguindo
verticalmente para baixo e, ao chegar ao final da coluna for para o início da próxima coluna, quais
serão os empregados sorteados?
S = {27, 06, 35, 05, 31} ,
S = {05, 06, 27, 31, 35} .
18
9) Em um congresso de Medicina Veterinária, estão presentes 400 alunos de diferentes universidades,

conforme vê-se abaixo:
Universidade Alunos
UFV 55
UFLA 105
USP 155
UFMG 85
Deseja-se estudar a opinião dos alunos acerca do conteúdo de uma palestra, admitindo-se um erro
amostral de 10%. Assim sendo, responda às seguintes questões:
a) A amostragem estratificada é a indicada nesse caso. Justifique essa afirmação baseando-se nos
pré-requisitos para que ela seja utilizada.
A amostragem estratificada é a indicada nesse caso porque a população está dividida em estratos
(universidades), que são homogêneos internamente e, quando comparamos dois quaisquer eles são
heterogêneos.
b) Quantos alunos de cada universidade devem ser amostrados? Justifique.
Temos aqui h = 4 estratos, quais sejam, UFV, UFLA, USP e UFMG, sendo que os tamanhos dos
estratos são N1 = 55, N2 = 105, N3 = 155 e N4 = 85 respectivamente.
Uma primeira aproximação para o tamanho amostral é dado por:
1 1
& ' & '
n0 = = = 100.
2
E0 (0, 1)2
Como conhecemos o tamanho da população, N = 400, podemos corrigir, a expressão anterior da

seguinte maneira:
N.n0 400 × 100

n= = = d80e = 80.
N + n0 400 + 100
Assim
• O número de alunos da UFV que devemos selecionar é
N1 55

n1 = ×n = × 80 = 11.
N 400
• O número de alunos da UFLA que devemos selecionar é
N2 105

n2 = ×n = × 80 = 21.
N 400
19
• O número de alunos da USP que devemos selecionar é
N3 155

n3 = ×n = × 80 = 31.
N 400
• O número de alunos da UFMG que devemos selecionar é
N4 85

n4 = ×n = × 80 = 17.
N 400
20
10) A cárie é considerada uma doença comportamental que afeta principalmente crianças em idade
escolar. Uma cirurgiã-dentista, voluntária em um projeto social visitou algumas escolas em regiões
rurais para tentar estimar a prevalência desse mal e planejar ações futuras de tratamento. A amos-
tragem aleatória simples foi utilizada para selecionar n = 6 crianças em cada escola. A listagem a
seguir indica os nomes das N = 35 crianças de uma dessas escolas. Pede-se: Informe os seis nomes.
01 - Abel 02 - Adriana 03 - Alda 04 - Ana 05 - Andreza

06 - Cataline 07 - Débora 08 - Edna 09 - Elaine 10 - Erivan
11 - Erivaldo 12 - Jamilly 13 - Janaína 14 - Jeane 15 - Jéssica
16 - João 17 - Karina 18 - Leandro 19 - Luciano 20 - Luiz
21 - Maria 22 - Mariana 23 - Mariane 24 - Mário 25 - Mayke
26 - Michell 27 - Nayara 28 - Neyber 29 - Priscila 30 - Roberta
31 - Suélen 32 - Tatiana 33 - Tatiara 34 - Thaís 35 - Thuanne
Ponto de partida: linha 03 e coluna 08 da tabela de números aleatórios. Direção: horizontal. Sentido:
esquerda para direita. Ao chegar ao final da linha volte ao início da linha anterior.
S = {23, 32, 28, 16, 02, 08} ,
S = {02, 08, 16, 23, 28, 32} .
21
11) Em uma convenção partidária estão presentes 30000 filiados. Deseja-se realizar uma pesquisa de
aceitação de um certo candidato para as próximas eleições com 5% de erro tolerável. Dessa forma,
o tamanho da amostra deveria ser de 394,74 (ou seja, 395 pessoas), entretanto, somente 271 filiados
devolveram o questionário. Pergunta-se: Qual o novo erro tolerável da pesquisa?
Como somente n2 = 271 filiados retornaram as fichas temos:
30000 × n0
271 =
30000 + n0
271 × 30000 + 271n0 = 30000n0
8130000 = 30000n0 − 271n0
29729n0 = 8130000
8130000
n0 = = 273, 47.
29729
1
Assim como n0 = , logo
(E0 )2
1 1
E0 = √ = √ = 0, 0605.
n0 273, 47
Dessa forma o novo erro tolerável da pesquisa é de 6, 05%.

22
12) Uma metrópole possui 110 locais de venda de carne. Devido a uma nova lei de armazenamento,
um inspetor foi designado para verificar se as novas exigências estavam sendo cumpridas. No entanto,
por falta de tempo, o mesmo optou por inspecionar uma amostra composta por 35 locais. Dado que
o cumprimento da nova lei exige alguns investimentos, para não correr o risco de selecionar muitos
locais de maior rentabilidade e que possivelmente se adequariam à mudança, ele optou por uma
amostra estratificada, classificando cada local de acordo com o seu tamanho, da seguinte forma:
Hipermercado (6), Supermercado (14), Mercado (30), Açougues e Mercearias (60). Determine o
número de elementos que devem ser amostrados em cada estrato.
O número total de elementos a serem amostrados é 35 e, assim:
• Para o estrato dos Hipermercados devemos selecionar 2 elementos, pois
N1 6

n1 = ×n = × 35 = d1, 91e = 2;
N 110
• Para o estrato dos Supermercados devemos selecionar 5 elementos, pois
N2 14

n2 = ×n = × 35 = d4, 45e = 5;
N 110
• Para o estrato dos Mercados devemos selecionar 10 elementos, pois
N3 30

n3 = ×n = × 35 = d9, 55e = 10;
N 110
• Para o estrato dos Açougues e Mercearias devemos selecionar 20 elementos, pois
N4 60

n4 = ×n = × 35 = d19, 09e = 20.
N 110
Note que queríamos 35 elementos, mas obtivemos um total de 37. Isso deve-se ao fato de garantirmos
que o erro amostral desejado seja alcançado.
Se arredondarmos para o inteiro mais próximo teremos
n1 = 2 n2 = 4 n3 = 10 n4 = 19
totalizando n = 35 elementos amostrados.

23
CAPÍTULO III
Estatística descritiva
1) Classifique cada uma das variáveis.
Tipo Variável
Sexo: “sexo”;
Fuma: “fuma”;
Trab: “trabalha”;
Time: “time para o qual torce”;
Qualitativa nominal
Curs: “curso no qual está matriculado”;
Nomo: “viciado em celular”;
Pres: “viria a aula se a presença não fosse obrigatória”;
Voto: “teria votado na última eleição se o voto não fosse obrigatório”;
Qualitativa ordinal Tole: “tolerância ao cigarro”;
Idad: “idade em anos”;
Estu: “número de horas semanais dedicadas a disciplina”;
Quantitativa discreta
Nota: “nota pretendida nessa disciplina”;
Peri: “período que está cursando esse semestre”;
Quantitativa contínua Altu: “altura”.
24
2) Para as variáveis qualitativas, determine:
a) A tabela de distribuição de frequências;

Para a variável “sexo”, temos que:
n = 30, n1 = 21, n2 = 9,
n1 21
f1 = = = 0, 7,
n 30
n2 9
f2 = = = 0, 3,
n 30
1
fac1 = fj = f1 = 0, 7,
X
j=1
2
fac2 = fj = f1 + f2 = 0, 7 + 0, 3 = 1,
X
j=1
e, utilizando-se esses resultados obteremos a tabela de distribuição de frequências, dada pela Tabela
1.
Tabela 1: Distribuição de frequências da variável sexo

Sexo ni f i fac
Feminino 21 0,7 0,7
Masculino 9 0,3 1
Total 30 1
Para a variável “fuma”, temos que:
n = 30, n1 = 29, n2 = 1,
n1 29
f1 = = = 0, 9667,
n 30
n2 1
f2 = = = 0, 0333,
n 30
1
fac1 = fj = f1 = 0, 9667,
X
j=1
2
fac2 = fj = f1 + f2 = 0, 9667 + 0, 0333 = 1,
X
j=1
2.
Para a variável “trabalha”, temos que:
25
Tabela 2: Distribuição de frequências da variável fuma

Fuma ni fi fac
NAO 29 0,9667 0,9667
SIM 1 0,0333 1
Total 30 1
n = 30, n1 = 20, n2 = 10,
n1 20
f1 = = = 0, 6667,
n 30
n2 10
f2 = = = 0, 3333,
n 30
1
fac1 = fj = f1 = 0, 6667,
X
j=1
2
fac2 = fj = f1 + f2 = 0, 6667 + 0, 3333 = 1,
X
j=1
3.
Tabela 3: Distribuição de frequências da variável trabalha

Trabalha ni fi fac
NAO 20 0,6667 0,6667
SIM 10 0,3333 1
Total 30 1
Para a variável “time”, temos que:
n = 30, n1 = 7, n2 = 1, n3 = 1, n4 = 8, n5 = 4, n6 = 1, n7 = 8,
7 1 1 8
f1 = = 0, 2333, f2 = = 0, 0333, f3 = = 0, 0333, f4 = = 0, 2667,
30 30 30 30
4 1 8
f5 = = 0, 1333, f6 = = 0, 0333, f7 = = 0, 2667,
30 30 30
26
1
fac1 = fj = 0, 2333,
X
j=1
2
fac2 = fj = 0, 2333 + 0, 0333 = 0, 2667,
X
j=1
3
fac3 = fj = 0, 2333 + 0, 0333 + 0, 0333 = 0, 3,
X
j=1
4
fac4 = fj = 0, 2333 + 0, 0333 + 0, 0333 + 0, 2667 = 0, 5667,
X
j=1
5
fac5 = fj = 0, 2333 + 0, 0333 + 0, 0333 + 0, 2667 + 0, 1333 = 0, 7,
X
j=1
6
fac6 = fj = 0, 2333 + 0, 0333 + 0, 0333 + 0, 2667 + 0, 1333 + 0, 0333 = 0, 7333,
X
j=1
7
fac7 = fj = 0, 2333 + 0, 0333 + 0, 0333 + 0, 2667 + 0, 1333 + 0, 0333 + 0, 2667 = 1
X
j=1
4.
Tabela 4: Distribuição de frequências da variável time

Time ni fi fac
ATLETICO 7 0,2333 0,2333
BOTAFOGO 1 0,0333 0,2667
CORINTHIANS 1 0,0333 0,3
CRUZEIRO 8 0,2667 0,5667
FLAMENGO 4 0,1333 0,7
FLUMINENSE 1 0,0333 0,7333
NENHUM 8 0,2667 1
Total 30 1
Para a variável “curso”, temos que:
n = 30, n1 = 4, n2 = 5, n3 = 5, n4 = 15, n5 = 1,
4 5 5
f1 = = 0, 1333, f2 = = 0, 1667, f3 = = 0, 1667,
30 30 30
15 1
f4 = = 0, 5, f5 = = 0, 0333,
30 30
27
1
fac1 = fj = 0, 1333,
X
j=1
2
fac2 = fj = 0, 1333 + 0, 1667 = 0, 3,
X
j=1
3
fac3 = fj = 0, 1333 + 0, 1667 + 0, 1667 = 0, 4667,
X
j=1
4
fac4 = fj = 0, 1333 + 0, 1667 + 0, 1667 + 0, 5 = 0, 9667,
X
j=1
5
fac5 = fj = 0, 1333 + 0, 1667 + 0, 1667 + 0, 5 + 0, 0333 = 1,
X
j=1
5.
Tabela 5: Distribuição de frequências da variável curso

Curso ni fi fac
CIS 4 0,1333 0,1333
ECD 5 0,1667 0,3
GEO 5 0,1667 0,4667
MVT 15 0,5 0,9667
NUT 1 0,0333 1
Total 30 1
Para a variável “nomofobia”, temos que:
n = 30, n1 = 23, n2 = 7,
23 7
f1 = = 0, 7667, f2 = = 0, 2333,
30 30
1
fac1 = fj = 0, 7667,
X
j=1
2
fac2 = fj = 0, 7667 + 0, 2333 = 1,
X
j=1
6.
Para a variável “presença”, temos que:
1
fac1 = fj = 0, 0333,
X
j=1
2
fac2 = fj = 0, 0333 + 0, 9667 = 1,
X
j=1
28
Tabela 6: Distribuição de frequências da variável nomofobia

Nomofobia ni fi fac
NAO 23 0,7667 0,7667
SIM 7 0,2333 1
Total 30 1
n = 30, n1 = 1, n2 = 29,
1 29
f1 = = 0, 0333, f2 = = 0, 9667,
30 30
7.
Tabela 7: Distribuição de frequências da variável presença

Presença ni fi fac
NAO 1 0,0333 0,0333
SIM 29 0,9667 1
Total 30 1
Para a variável “voto”, temos que:
n = 30, n1 = 11, n2 = 19,
11 19
f1 = = 0, 3667, f2 = = 0, 6333,
30 30
1
fac1 = fj = 0, 3667,
X
j=1
2
fac2 = fj = 0, 3667 + 0, 6333 = 1,
X
j=1
8.
Tabela 8: Distribuição de frequências da variável voto

Voto ni fi fac
NAO 11 0,3667 0,3667
SIM 19 0,6333 1
Total 30 1
Para a variável “tolerância”, temos que:
n = 30, n1 = 9, n2 = 7, n3 = 14,
29
9 7 14
f1 = = 0, 3, f2 = = 0, 2333, f3 = = 0, 4667,
30 30 30
1
fac1 = fj = 0, 3,
X
j=1
2
fac2 = fj = 0, 3 + 0, 2333 = 0, 5333,
X
j=1
3
fac3 = fj = 0, 3 + 0, 2333 + 0, 4667 = 1,
X
j=1
9.
Tabela 9: Distribuição de frequências da variável tolerância

Tolerância ni fi fac
INDIFERENTE 9 0,3 0,3
POUCO 7 0,2333 0,5333
MUITO 14 0,4667 1
Total 30 1
b) O gráfico de setores;
Utilizando os resultados obtidos em a), para a variável sexo temos
21
g1 = 360◦ × f1 = 360◦ × = 252◦ ,
30
9
g2 = 360 × f2 = 360 ×
◦ ◦
= 108◦ ,
30
o que resultará no gráfico de setores mostrado na Figura 1.

Feminino
70 %
Masculino
30 %
Figura 1: Gráfico de setores da variável sexo
30
Utilizando os resultados obtidos em a), para a variável fuma temos
29
g1 = 360◦ × f1 = 360◦ × = 348◦ ,
30
1
g2 = 360◦ × f2 = 360◦ × = 12◦ ,
30
NAO
96,67 %
SIM
3,33 %
Figura 2: Gráfico de setores da variável fuma
Utilizando os resultados obtidos em a), para a variável trabalha temos
20
g1 = 360◦ × f1 = 360◦ × = 240◦ ,
30
10
g2 = 360◦ × f2 = 360◦ × = 120◦ ,
30

NAO
66,67 %
SIM
33,33 %
Figura 3: Gráfico de setores da variável trabalha
31
Utilizando os resultados obtidos em a), para a variável time temos
7
g1 = 360◦ × f1 = 360◦ × = 84◦ ,
30
1
g2 = 360◦ × f2 = 360◦ × = 12◦ ,
30
1
g3 = 360◦ × f3 = 360◦ × = 12◦ ,
30
8
g4 = 360◦ × f4 = 360◦ × = 96◦ ,
30
4
g5 = 360◦ × f5 = 360◦ × = 48◦ ,
30
1
g6 = 360◦ × f6 = 360◦ × = 12◦ ,
30
8
g7 = 360◦ × f5 = 360◦ × = 96◦ ,
30
CORINTHIANS BOTAFOGO
3,33 % 3,33 %
ATLETICO
23,33 %
CRUZEIRO
26,67 %
FLAMENGO NENHUM
13,33 % 26,67 %
FLUMINENSE
3,33 %
Figura 4: Gráfico de setores da variável time
Utilizando os resultados obtidos em a), para a variável curso temos
4
g1 = 360◦ × f1 = 360◦ × = 48◦ ,
30
5
g2 = 360◦ × f2 = 360◦ × = 60◦ ,
30
5
g3 = 360◦ × f3 = 360◦ × = 60◦ ,
30
15
g4 = 360◦ × f4 = 360◦ × = 180◦ ,
30
1
g5 = 360◦ × f5 = 360◦ × = 12◦ ,
30

32
ECD
16,67 %
GEO
16,67 %
CIS
13,33 %
NUT
3,33 %
MVT
50 %
Figura 5: Gráfico de setores da variável curso
Utilizando os resultados obtidos em a), para a variável nomofobia temos
23
g1 = 360◦ × f1 = 360◦ × = 276◦ ,
30
7
g2 = 360◦ × f2 = 360◦ × = 84◦ ,
30
NAO
76,67 %
SIM
23,33 %
Figura 6: Gráfico de setores da variável nomofobia
Utilizando os resultados obtidos em a), para a variável presença temos
1
g1 = 360◦ × f1 = 360◦ × = 12◦ ,
30
29
g2 = 360◦ × f2 = 360◦ × = 348◦ ,
30

33
NAO
3,33 %
SIM
96,67 %
Figura 7: Gráfico de setores da variável presença
Utilizando os resultados obtidos em a), para a variável voto temos
11
g1 = 360◦ × f1 = 360◦ × = 132◦ ,
30
19
g2 = 360 × f2 = 360 ×
◦ ◦
= 228◦ ,
30
NAO
36,67 %
SIM
63,33 %
Figura 8: Gráfico de setores da variável voto
Utilizando os resultados obtidos em a), para a variável tolerância temos
9
g1 = 360◦ × f1 = 360◦ × = 108◦ ,
30
7
g2 = 360 × f2 = 360 ×
◦ ◦
= 84◦ ,
30
14
g3 = 360 × f3 = 360 ×
◦ ◦
= 168◦ ,
30
34

INDIFERENTE
30 %
POUCO
23,33 %
MUITO
46,67 %
Figura 9: Gráfico de setores da variável tolerância
c) O gráfico de barras.
Utilizando os resultados obtidos em a), para a variável sexo temos a Figura 10.
20
15
10
5
0
Feminino Masculino
Figura 10: Gráfico de barras da variável sexo

35
Utilizando os resultados obtidos em a), para a variável fuma temos a Figura 11.
25
20
15
10
5
0
NAO SIM
Figura 11: Gráfico de barras da variável fuma

36
Utilizando os resultados obtidos em a), para a variável trabalha temos a Figura 12.
20
15
10
5
0
NAO SIM
Figura 12: Gráfico de barras da variável trabalha

37
Utilizando os resultados obtidos em a), para a variável time temos a Figura 13.
8
6
4
2
0
ATL BOT COR CRU FLA FLU NEN
Figura 13: Gráfico de barras da variável time

38
Utilizando os resultados obtidos em a), para a variável curso temos a Figura 14.
14
12
10
8
6
4
2
0
CIS ECD GEO MVT NUT
Figura 14: Gráfico de barras da variável curso

39
Utilizando os resultados obtidos em a), para a variável nomofobia temos a Figura 15.
20
15
10
5
0
NAO SIM
Figura 15: Gráfico de barras da variável nomofobia

40
25
20
15
10
5
0
NAO SIM
Figura 16: Gráfico de barras da variável presença

41
Utilizando os resultados obtidos em a), para a variável voto temos a Figura 17.
15
10
5
0
NAO SIM
Figura 17: Gráfico de barras da variável voto

42
Utilizando os resultados obtidos em a), para a variável tolerância temos a Figura 18.
14
12
10
8
6
4
2
0
IND POU MUI
Figura 18: Gráfico de barras da variável tolerância

43
3) Para as variáveis quantitativas discretas, determine
a) A tabela de distribuição de frequências;
Tabela 10: Distribuição de frequências para a idade

Idade ni fi fac
18 5 0,16667 0,1667
19 7 0,23333 0,4000
20 3 0,10000 0,5000
21 4 0,13333 0,6333
22 3 0,10000 0,7333
23 2 0,06667 0,8000
24 2 0,06667 0,8667
26 1 0,03333 0,9000
28 2 0,06667 0,9667
29 1 0,03333 1,0000
Total 30 1
Tabela 11: Distribuição de frequências para horas de estudo

Horas de estudo ni fi fac
1 1 0,03333 0,03333
2 11 0,36667 0,40000
3 5 0,16667 0,56667
4 8 0,26667 0,83333
5 2 0,06667 0,90000
6 1 0,03333 0,93333
10 1 0,03333 0,96667
30 1 0,03333 1,00000
Total 30 1
Tabela 12: Distribuição de frequências para a nota

Nota ni fi fac
60 4 0,13333 0,1333
70 6 0,20000 0,3333
75 5 0,16667 0,5000
80 8 0,26667 0,7667
85 4 0,13333 0,9000
90 2 0,06667 0,9667
95 1 0,03333 1,0000
Total 30 1
44
Tabela 13: Distribuição de frequências para o período

Período ni fi fac
3 17 0,56667 0,5667
5 3 0,10000 0,6667
7 2 0,06667 0,7333
9 8 0,26667 1,0000
Total 30 1
b) O gráfico de barras.
Faremos agora o gráfico de barras para a variável idade, utilizando as frequências absolutas na
Tabela 10 que resultarão na Figura 19; posteriormente utilizaremos os resultados obtidos nessa
mesma tabela a fim de construirmos o gráfico com as frequências relativas (Figura 20).
7
6
5
4
3
2
1
0
18 19 20 21 22 23 24 26 28 29
Figura 19: Gráfico de barras da variável idade - valores absolutos

45
0,25
0,20
0,15
0,10
0,05
0,00
18 19 20 21 22 23 24 26 28 29
Figura 20: Gráfico de barras da variável idade - valores percentuais
Faremos agora o gráfico de barras para a variável horas de estudo, utilizando as frequências
absolutas na Tabela 10 que resultarão na Figura 21; posteriormente utilizaremos os resultados
obtidos nessa mesma tabela a fim de construirmos o gráfico com as frequências relativas (Figura
22).
46
10
8
6
4
2
0
1 2 3 4 5 6 10 30
Figura 21: Gráfico de barras da variável horas de estudo - valores absolutos

0,4
0,3
0,2
0,1
0,0
1 2 3 4 5 6 10 30
Figura 22: Gráfico de barras da variável horas de estudo - valores percentuais
Faremos agora o gráfico de barras para a variável nota, utilizando as frequências absolutas na
Tabela 12 que resultarão na Figura 23; posteriormente utilizaremos os resultados obtidos nessa
47
mesma tabela a fim de construirmos o gráfico com as frequências relativas (Figura 24).
8
6
4
2
0
60 70 75 80 85 90 95
Figura 23: Gráfico de barras da variável nota - valores absolutos

0,30
0,25
0,20
0,15
0,10
0,05
0,00
60 70 75 80 85 90 95
Figura 24: Gráfico de barras da variável nota - valores percentuais

48
Faremos agora o gráfico de barras para a variável período, utilizando as frequências absolutas
na Tabela 13 que resultarão na Figura 25; posteriormente utilizaremos os resultados obtidos
nessa mesma tabela a fim de construirmos o gráfico com as frequências relativas (Figura 26).
15
10
5
0
3 5 7 9
Figura 25: Gráfico de barras da variável período - valores absolutos

49
0,6
0,5
0,4
0,3
0,2
0,1
0,0
3 5 7 9
Figura 26: Gráfico de barras da variável período - valores percentuais
4) Para as variáveis quantitativas contínuas, determine o histograma.
i) Rol.
1,55 1,56 1,57 1,58 1,58 1,59 1,60 1,60 1,60 1,61
1,62 1,63 1,63 1,65 1,65 1,65 1,66 1,66 1,67 1,68
1,68 1,69 1,69 1,69 1,70 1,72 1,73 1,80 1,82 1,86
ii) Número de classes.
Como temos 30 dados, devemos ter
h√ i
k= 30 = [5, 48] .
Devemos tomar o inteiro mais próximo de 5,48, desse modo devemos ter k = 5 classes.
iii) Comprimento de cada classe.
A amplitude é dada por

AT (X) = Xmáx − Xmin = 9 − 3 = 6,
e o comprimento das classes é
AT (X) 0, 31 0, 31
c= = = = 0, 08. (1)
k−1 5−1 4
50
iv) Determinar o limite inferior da primeira classe.
Esse limite é dado por
c 0, 08
LI1 = Xmin − =3− = 3 − 0, 04 = 2, 96. (2)
2 2
Entretanto, temos 5 classes e, portanto devemos encontrar os limites das outras classes. Isso é
feito somando-se o valor do comprimento das classess, assim:
LI1 = 1, 51;
LI2 = LI1 + c = 1, 51 + 0, 08 = 1, 59;
LI3 = LI2 + c = 1, 59 + 0, 08 = 1, 67;
LI4 = LI3 + c = 1, 67 + 0, 08 = 1, 75;
LI5 = LI4 + c = 1, 75 + 0, 08 = 1, 83.
O limite superior também é obtido somando-se c = 0, 08 ao limite inferior da última classe, isto
é,
LS = LI5 + c = 1, 83 + 0, 08 = 1, 91.
v) Com esses resultados obtemos os limites das classes e podemos construir a tabela de distribuição
de frequências, conforme a Tabela 14.
Tabela 14: Distribuição de frequências para a variável “altura”

Altura ni fi fac
1,51 ` 1,59 5 0,1667 0,1667
1,59 ` 1,67 13 0,4333 0,6
1,67 ` 1,75 9 0,3 0,9
1,75 ` 1,83 2 0,0667 0,9667
1,83 ` 1,91 1 0,0333 1
Total 30 1
Conhecendo-se a tabela de distribuição de frequências dada na Tabela 14, podemos determinar

o histograma para a variável altura, o que resultará na Figura 27 a seguir.
51
15
Frequencia absoluta
10
5
0
1,51 1,59 1,67 1,75 1,83 1,91
Altura
Figura 27: Histograma para a variável altura

52
5) Como parte de um estudo para se definir um novo cardápio mais balanceado para a merenda escolar,
os alunos de uma escola de ensino médio foram pesados, registrando-se os pesos em quilogramas. Os
dados obtidos foram:
44,2 77,1 52,6 58,2 40,8 63,4 64,5 53,2 54,6 66,6 76,3 75,5
84,6 60,2 49,0 64,0 58,0 60,3 42,1 55,0 57,9 63,2 40,6 63,2
Determine o histograma para o peso dos alunos.
i) Rol.
40,60 40,80 42,10 44,20 49,00 52,60 53,20 54,60

55,00 57,90 58,00 58,20 60,20 60,30 63,20 63,20
63,40 64,00 64,50 66,60 75,50 76,30 77,10 84,60
ii) Número de classes.
Como temos 24 dados, devemos ter
√
k = [ 24] = [4, 9].
Devemos tomar o inteiro mais próximo de 4,9, desse modo devemos ter k = 5 classes.
iii) Comprimento de cada classe.
A amplitude é dada por
AT (X) = Xmáx − Xmin = 84, 6 − 40, 6 = 44,
AT (X) 44 44
c= = = = 11. (3)
k−1 5−1 4
iv) Determinar o limite inferior da primeira classe.
Esse limite é dado por
c 11
LI1 = Xmin − = 40, 6 − = 40, 6 − 5, 5 = 35, 1. (4)
2 2
Entretanto, temos 5 classes e, portanto devemos encontrar os limites das outras classes. Isso é feito
53
somando-se o valor do comprimento das classess, assim:
LI1 = 35, 1;
LI2 = LI1 + c = 35, 1 + 11 = 46, 1;
LI3 = LI2 + c = 46, 1 + 11 = 57, 1;
LI4 = LI3 + c = 57, 1 + 11 = 68, 1;
LI5 = LI4 + c = 68, 1 + 11 = 79, 1.
O limite superior também é obtido somando-se c = 11 ao limite inferior da última classe, isto é,
LS = LI5 + c = 79, 1 + 11 = 90, 1.
de frequências, conforme a Tabela 15.
Tabela 15: Distribuição de frequências para a variável “peso”

Peso ni fi fac
35,1 ` 46,1 4 0,1667 0,1667
46,1 ` 57,1 5 0,2083 0,375
57,1 ` 68,1 11 0,4583 0,8333
68,1 ` 79,1 3 0,125 0,9583
79,1 ` 90,1 1 0,0417 1
Total 24 1
Conhecendo-se a tabela de distribuição de frequências dada na Tabela 15, podemos determinar o

histograma para a variável peso, o que resultará na Figura 28 a seguir.
54
14
12
10
Frequencia absoluta
8
6
4
2
0
35,1 46,1 57,1 68,1 79,1 90,1
Peso
Figura 28: Histograma para a variável peso

55
6) Em um estudo acerca do tempo de espera em uma fila de um grande supermercado obteve-se os

seguintes valores (em segundos):
98,31 116,81 90,73 88,98 114,72 97,84 96,59

78,23 39,78 88,14 84,80 105,84 108,43 74,11
101,39 83,74 130,22 94,57 131,17 95,25 125,66
Determine o histograma para o tempo de espera.
i) Rol.
39,78 74,11 78,23 83,74 84,80 88,14 88,98

90,73 94,57 95,25 96,59 97,84 98,31 101,39
105,84 108,43 114,72 116,81 125,66 130,22 131,17
√
ii) Número de classes. Como temos 21 dados, então k = [ 21] = [4, 58]. Devemos tomar o
inteiro mais próximo de 4,58, desse modo devemos ter k = 5 classes.
iii) Comprimento de cada classe. A amplitude é dada por
AT (X) = Xmáx − Xmin = 131, 17 − 39, 78 = 91, 39,
AT (X) 91, 39 91, 39

c= = = = 22, 85. (5)
k−1 5−1 4
iv) Determinar o limite inferior da primeira classe. Temos que
c 22, 85
LI1 = Xmin − = 39, 78 − = 39, 78 − 11, 42 = 28, 36. (6)
2 2
Para as 5 classes temos:
LI1 = 28, 36
LI2 = LI1 + c = 28, 36 + 22, 85 = 51, 21
LI3 = LI2 + c = 51, 21 + 22, 85 = 74, 06
LI4 = LI3 + c = 74, 06 + 22, 85 = 96, 91
LI5 = LI4 + c = 96, 91 + 22, 85 = 119, 76
O limite superior também é obtido somando-se c = 22, 85 ao limite inferior da última classe,
isto é,
LS = LI5 + c = 119, 76 + 22, 85 = 142, 61.
56
de probabilidades, conforme a Tabela 16.
Tabela 16: Distribuição de frequências para a variável “tempo de espera”.

Tempo de espera ni fi fac
28, 36 ` 51, 21 1 0,0476 0,0476
51, 21 ` 74, 06 0 0 0,0476
74, 06 ` 96, 91 10 0,4762 0,5238
96, 91 ` 119, 76 7 0,3333 0,8571
119, 76 ` 142, 61 3 0,1429 1
Total 21 1
Conhecendo-se a tabela de distribuição de frequências dada na Tabela 16, podemos determinar

o histograma para a variável tempo de espera, o que resultará na Figura 29 a seguir.
12
10
FrequÃªncia absoluta
8
6
4
2
0
28,36 51,21 74,06 96,91 119,76 142,61
Tempo de espera
Figura 29: Histograma para a variável tempo de espera
57
7) Nas pesquisas da área de saúde é comum o interesse por estudar o tempo até a ocorrência de
um determinado evento, em geral, o tempo até o falecimento ou o óbito de um paciente, devido a
uma determinada doença. Os dados a seguir (já em rol) apresentam informações sobre o tempo de
sobrevivência (em meses) de 20 pacientes com linfoma de Hodgkin, um tipo de câncer que afeta os
gânglios linfáticos, tendo como sintomas principais a febre, sudorese noturna, perda de peso, coceira,
cansaço e perca de apetite.
2 4 6 7 7 13 14 18 20 25 25 27 29 30 32 33 35 41 43 45
a) Agrupe os dados em uma tabela de classes de frequências (Tabela que é utilizada para fazer o
histograma);
i) Rol.
2 4 6 7 7 13 14 18 20 25 25 27 29 30 32 33 35 41 43 45
√
ii) Número de classes. Como temos 20 dados, então k = [ 20] = [4, 47]. Devemos tomar o inteiro
mais próximo de 4,47, desse modo devemos ter k = 4 classes.
AT (X) = Xmáx − Xmin = 45 − 2 = 43,
AT (X) 43 43
c= = = = 14, 33. (7)
k−1 4−1 3
c 14, 33
LI1 = Xmin − =2− = 2 − 7, 17 = −5, 17. (8)
2 2
LI1 = −5, 17
LI2 = LI1 + c = −5, 17 + 14, 33 = 9, 16
LI3 = LI2 + c = 9, 16 + 14, 33 = 23, 49
LI4 = LI3 + c = 23, 49 + 14, 33 = 37, 82
58
é,
LS = LI4 + c = 37, 82 + 14, 33 = 52, 15.
Tabela 17: Distribuição de frequências para a variável “tempo de sobrevivência”.

Tempo de sobrevivência ni fi fac
−5, 17 ` 9, 16 5 0,25 0,25
9, 16 ` 23, 49 4 0,2 0,45
23, 49 ` 37, 82 8 0,4 0,85
37, 82 ` 52, 15 3 0,15 1
Total 20 1
b) Determine o histograma de frequências absolutas para o tempo de sobrevivência.

histograma para a variável tempo de sobrevivência, o que resultará na Figura 30 a seguir.
10
8
6
4
2
0
−5,17 9,16 23,49 37,82 52,15
Tempo de sobrevivÃªncia
Figura 30: Histograma para a variável tempo de sobrevivência
59
8) O Diabetes é uma doença crônica na qual o organismo não produz insulina suficiente, o que eleva os
níveis de glicose no sangue e causa o quadro de hiperglicemia. Adicionalmente, se não for devidamente
controlado, o Diabetes pode prejudicar o funcionamento de órgãos como rins, olhos e até mesmo o
coração. Os dados a seguir (já em rol) indicam o número de pessoas diabéticas em 20 hospitais, que
necessitam de um medicamento específico (insulina) para o controle dessa doença.
7 8 8 9 9 9 9 9 10 10 10 10 10 10 10 10 11 11 11 12
a) Agrupe os dados em uma tabela de classes de frequências;
i) Rol.
7 8 8 9 9 9 9 9 10 10 10 10 10 10 10 10 11 11 11 12
√
ii) Número de classes. Como temos 20 dados, então k = [ 20] = [4, 47]. Devemos tomar o inteiro
mais próximo de 4,47, desse modo devemos ter k = 4 classes.
AT (X) = Xmáx − Xmin = 12 − 7 = 5,
AT (X) 5 5
c= = = = 1, 67. (9)
k−1 4−1 3
c 1, 67
LI1 = Xmin − =7− = 7 − 0, 83 = 6, 17. (10)
2 2
LI1 = 6, 17
LI2 = LI1 + c = 6, 17 + 1, 67 = 7, 84
LI3 = LI2 + c = 7, 84 + 1, 67 = 9, 51
LI4 = LI3 + c = 9, 51 + 1, 67 = 11, 18
é,
LS = LI4 + c = 11, 18 + 1, 67 = 12, 85.
60
Tabela 18: Distribuição de frequências para a variável “número de pessoas diabéticas, que necessitam
do medicamento”.
Número de pessoas diabéticas, que necessitam do medicamento ni fi fac
6, 17 ` 7, 84 1 0,05 0,05
7, 84 ` 9, 51 7 0,35 0,4
9, 51 ` 11, 18 11 0,55 0,95
11, 18 ` 12, 85 1 0,05 1
Total 20 1
b) Determine o histograma de frequências absolutas.

histograma para a variável número de pessoas diabéticas, que necessitam do medicamento, o que
resultará na Figura 31 a seguir.
14
12
10
8
6
4
2
0
6,17 7,84 9,51 11,18 12,85
NÃºmero de pessoas diabÃ©ticas, que necessitam do medicamento

Figura 31: Histograma para a variável número de pessoas diabéticas, que necessitam do medicamento
61
CAPÍTULO IV
Medidas resumo
1) João e Izabel decidiram verificar o consumo de energia elétrica (Kw/h) em sua residência. As
observações de doze meses são apresentadas a seguir.
605; 637; 305; 448; 448; 457; 534; 544; 544; 544; 544; 545
a) Determine a moda do consumo de energia elétrica nessa amostra.
A moda é Mo1 (X) = 544, sendo o conjunto unimodal.
b) Determine a mediana do consumo de energia elétrica nessa amostra.
Como nX = 12 é par quando os dados estão organizados em rol, a mediana é dada pela média dos
n n

elementos que ocupam as posições e + 1 , isto é:
2 2
X( 12 ) + X( 12 +1) X(6) + X(7) 544 + 544

Md(X) = 2 2
= = = 544.
2 2 2
c) Interprete o significado do resultado do item b).
Para o conjunto de valores colocados em ordem crescente ou decrescente de grandeza, a mediana 544
é o elemento que ocupa a posição central, sendo pelo menos 50% das observações da amostra valores
iguais ou superiores e, pelo menos 50% das observações da amostra valores iguais ou inferiores a ela.
d) Determine o desvio padrão amostral da média do consumo de energia elétrica.
Temos que
Assim
v
u n 2
u P
u
uP n
Xi
i=1
v
u X2 − u 3241001 − (6155)2
u
t i=1 i n
q u
S (X) = S 2 (X) = = 12
t
n−1 12 − 1
s
83998, 9167 √
= = 7636, 2652 = 87, 3857.
11
62
Xi Xi2
605 366025
637 405769
305 93025
448 200704
448 200704
457 208849
534 285156
544 295936
544 295936
544 295936
544 295936
545 297025
12 12
Xi = 6155 Xi2 = 3241001
P P
i=1 i=1
2) Francine observou o resultado do lançamento do disco (em metros) de 27 atletas veteranos, no

último campeonato mundial de atletismo e obteve as seguintes somas:
27 27
Xi = 866, 8005, Xi2 = 29434, 1497.
X X
i=1 i=1
a) Determine a média dos resultados no lançamento do disco desses atletas.
Temos que
27
P
Xi
866, 8005
X̄ = i=1
= = 32, 1037.
27 27
b) Determine o desvio padrão dos resultados no lançamento do disco desses atletas.
v
u n 2
u P
u
uP n
Xi
i=1
v
u X2 − u 29434, 1497 − (866,8005)2
u
t i=1 i n
q u
S (X) = S 2 (X) = = 27
t
n−1 27 − 1
s
1606, 626 √
= = 61, 7933 = 7, 8609.
26
63
3) Érica realizou a descrição estatística do comprimento (em mm) e a biomassa (em mg) em sementes
de pinhão manso (Jatropha curcas L.) (dados fictícios). Após os cálculo obteve:
Comprimento X̄ = 18, 05 mm S(X) = 1, 02 mm CV (X)% = 5, 65%

Biomassa Ȳ = 631, 98 mg S(Y ) = 55, 75 mg CV (Y )% = 8, 821%
Determine qual é a variável mais homogênea. Justifique sua resposta.
Sabemos que a amostra mais homogênea é aquela que apresenta menor coeficiente de variação e,
como
CV (X)% = 5, 65% < 8, 821% = CV (Y )%
temos que o comprimento é mais homogêneo que a biomassa para as sementes de pinhão manso.
64
4) Uma fábrica empacotava um determinado produto com as seguintes especificações:
Massa média de empacotamento (kg) Desvio padrão (kg)

X̄ = 50 SX = 2
Após ser vendida, o novo proprietário determinou que as especificações agora não seriam mais as
mesmas, ao invés disto a correção Y = 0, 9X + 4 deveria ser efetuada.
a) Determine a massa média e a variância com que a fábrica opera após ser efetuada a correção.
Temos que Y = 0, 9X + 4 e utilizando-se propriedades da média temos
Ȳ = 0, 9X̄ + 4 = 0, 9 · 50 + 4 = 49.
Utilizando-se propriedades da variância temos que
var (Y ) = var (0, 9X + 4) = var (0, 9X) = 0, 92 · var (X) = 0, 81 · 22 = 3, 24.
b) A produção da fábrica era mais homogênea antes ou após a correção efetuada?
S(X) 2
CV (X)% = × 100% = × 100% = 4%,
X̄ 50
e,
√
S(Y ) 3, 24 1, 8
CV (Y )% = × 100% = × 100% = × 100% = 3, 67%.
Ȳ 49 49
Sabemos que a amostra mais homogênea é aquela que apresenta menor coeficiente de variação e,
como
CV (Y )% = 3, 6735% < 4% = CV (X)%
temos que a produção da fábrica tornou-se mais homogênea após a correção efetuada.
65
5) Em duas turmas de EST 103, X e Y , os alunos que realizaram as provas obtiveram as seguintes
notas:
X 2 3 9 7 8,5 6,5 7,5 6 5 7 6,5 2,5 8 9 10 —

Y 2,5 3,5 4 4,5 5 5,5 6 6 6,5 7 7 9 9 9 9,5 10
a) Determine a nota mediana para a turma X e para a turma Y ;
Como nX = 15 é ímpar quando os dados estão organizados em rol, a mediana é dada pelo
n+1

elemento que ocupa a posição , isto é:
2
Md(X) = X( 15+1 ) = X(8) = 7.

2
Como nY = 16 é par quando os dados estão organizados em rol, a mediana é dada pela média
n n

dos elementos que ocupam as posições e + 1 , isto é:
2 2
Y( 16 ) + Y( 16 +1) Y(8) + Y(9) 6 + 6, 5

Md(Y ) = 2 2
= = = 6, 25.
2 2 2
b) Determine a(s) nota(s) modais para a turma X e para a turma Y ;
As moda são Mo1 (X) = 9, Mo2 (X) = 7, e Mo3 (X) = 6, 5, sendo o conjunto multimodal.
A moda é Mo1 (Y ) = 9, sendo o conjunto unimodal.
c) Determine a nota média para a turma X e para a turma Y ;
n
P
Xi
2 + 3 + · · · + 10 97, 5
X̄ = i=1
= = = 6, 5,
n 15 15
n
P
Yi
2, 5 + 3, 5 + · · · + 10 104
Ȳ = i=1
= = = 6, 5.
n 16 16
d) Qual turma é mais homogênea? justifique.
v
u 717, 25 − (97,5)2
u s
q 83, 5 √
S (X) = S 2 (X) = 15
= = 5, 9643 = 2, 4422,
t
15 − 1 14
v
u 755, 5 − (104)2
u s
q 79, 5 √
S (Y ) = S 2 (Y ) = 16
= = 5, 3 = 2, 3022,
t
16 − 1 15
66
S(X) 2, 4422
CV (X)% = × 100% = × 100% = 37, 57%,
X̄ 6, 5
e,
S(Y ) 2, 3022
CV (Y )% = × 100% = × 100% = 35, 42%.
Ȳ 6, 5
Como 35, 42% = CV (Y )% < CV (X)% = 37, 57% temos que a turma Y é mais homogênea que
a turma X.
67
6) Faça as devidas associações.
A Valor mediano F Estatística descritiva

B Estatística G População
C Moda H Estatística inferencial
D Variável quantitativa I Variância
E Parâmetro J Variável qualitativa
(F) Parte da estatística que visa somente resumir, descrever e apresentar os dados, sem inferir.
(I) Mede a dispersão dos valores em torno da média aritmética.
(A) Pelo menos metade dos valores são maiores ou iguais e também pelo menos metade são menores
ou iguais a esse valor.
(J) Variável cujos valores são referentes à qualidade, atributo ou categoria.
(E) É uma medida que descreve certa característica dos elementos da população.
(B) Método científico para planejar, coletar, organizar, resumir, apresentar e analisar dados. Tam-
bém inclui princípios e definições para validar resultados das análises e permitir conclusões
válidas.
(C) É o valor mais frequente do conjunto de valores observado.
(G) É o conjunto de todos os elementos ou resultados sob investigação.
(D) Variável cujos valores são numéricos, podendo ser obtidos por meio de uma contagem ou men-
suração.
(H) Conjunto de técnicas que possibilitam a extrapolação, a um grande conjunto de dados, das
informações e conclusões obtidas a partir da amostra.
68
7) Assinale (V) se a afirmativa for totalmente verdadeira, caso contrário assinale (F).
(F) Para quaisquer valores X1 , X2 , . . . , Xn temos sempre que X̄ ≤ Md(X).
Por exemplo, se X = {0, 1, 10}, temos que
3
X
Xi
11
X̄ = i=1
= = 3, 6667.
3 3
n+1

2
Md(X) = X( 3+1 ) = X(2) = 1.

2
Note que, nesse caso, X̄ > Md(X).
(F) Para quaisquer valores X1 , X2 , . . . , Xn temos sempre que X̄ ≥ Md(X).
Por exemplo, se X = {0; 9; 10}, temos que
3
X
Xi
19
X̄ = i=1
= = 6, 3333.
3 3
n+1

2
Md(X) = X( 3+1 ) = X(2) = 9.

2
Note que, nesse caso, X̄ < Md(X).
(F) Para quaisquer valores X1 , X2 , . . . , Xn temos sempre que Mo(X) ≤ Md(X).
Por exemplo, considere o conjunto X = {0; 1; 9; 10; 10}. A moda é Mo1 (X) = 10, sendo o
conjunto unimodal. Como nX = 5 é ímpar quando os dados estão organizados em rol, a
n+1

mediana é dada pelo elemento que ocupa a posição , isto é:
2
Md(X) = X( 5+1 ) = X(3) = 9.

2
Note que, nesse caso, Mo(X) > Md(X).
(V) A variância amostral mede a dispersão em torno da média aritmética e resulta sempre em um
valor não negativo.
69
(F) Em uma amostra com n observações, tem-se pelo menos n/2 observações maiores e também
pelo menos n/2 observações menores que o valor mediano.
(F) O coeficiente de variação é adimensional, isto é, não possui unidade de medida.
(F) As amostras X = {15; 13; 10; 7; 4} e Y = {105; 103; 100; 97; 94} possuem variâncias iguais, porém
os não possuem igual homogeneidade ou dispersão relativa, pois os coeficientes de variação são
diferentes.
n
P
Xi
15 + 13 + · · · + 4 49
X̄ = i=1
= = = 9, 8,
n 5 5
n
P
Yi
105 + 103 + · · · + 94 499
Ȳ = i=1
= = = 99, 8.
n 5 5
v
u 559 − (49)2
u s
q 78, 8 √
S (X) = S 2 (X) = 5
= = 19, 7 = 4, 4385,
t
5−1 4
v
u 49879 − (499)2
u s
q 78, 8 √
S (Y ) = S 2 (Y ) = 5
= = 19, 7 = 4, 4385,
t
5−1 4
S(X) 4, 4385
CV (X)% = × 100% = × 100% = 45, 29%,
X̄ 9, 8
e,
S(Y ) 4, 4385
CV (Y )% = × 100% = × 100% = 4, 45%.
Ȳ 99, 8
Como 4, 45% = CV (Y )% < CV (X)% = 45, 29% temos que a turma Y é mais homogênea que
a turma X.
70
8) A tabela a seguir apresenta os tempos de duração de chamadas telefônicas (em minutos), obtidos
em uma amostra de oito telefonemas.
Telefonema 1 2 3 4 5 6 7 8
Tempo (min.) 1 3 6 15 8 1 4 2
Calcule e interprete:
a) O tempo médio.
Temos que
n
P
Xi
1 + 3 + ··· + 2 40
X̄ = i=1
= = = 5,
n 8 8
sendo esse um valor central, em torno do qual a duração média das chamadas tendem a se concentrar.
b) O tempo mediano.
n n

2 2
X( 8 ) + X( 8 +1) X(4) + X(5) 3+4

Md(X) = 2 2
= = = 3, 5.
2 2 2
Para o conjunto de valores colocados em ordem crescente ou decrescente de grandeza, o valor mediano
obtido é o elemento que ocupa a posição central, sendo pelo menos 50% das ligações telefônicas com
duração igual ou superior e, pelo menos 50% das ligações telefônicas com duração menor ou inferior
a ele.
c) O tempo modal.
A moda é Mo1 (X) = 1, sendo o conjunto unimodal. Dessa forma essa é a duração telefônica que
ocorre com maior frequência.
71
9) Considere a seguinte amostra,
Frequência 3 2 1 4
Valor 2 3 5 1
Determine:
a) O valor médio.
A média pode ser calculada da seguinte maneira:
k
P
ni Xi
3×2+2×3+1×5+4×1
X̄ = i=1
=
k
P 3+2+1+4
ni
i=1
21
= = 2, 1. (1)
10
b) O valor mediano.
n n

2 2
X( 10 ) + X( 10 +1) X(5) + X(6) 2+2

Md(X) = 2 2
= = = 2.
2 2 2
c) O valor modal.

72
10) Sejam X = {1; 5; 12; −3; 5; 7; 8; −5; 6}, Y = X + 20, Z = 20X e W = 8X − 30. Determine:
a) A média de X;
n
P
Xi
1 + 5 + ··· + 6 36
X̄ = i=1
= = = 4.
n 9 9
b) A variância de X;
2
378 − (36) 234
S (X) =
2 9
= = 29, 25.
9−1 8
c) O coeficiente de variação de X;
q √
S (X) = S 2 (X) = 29, 25 = 5, 4083,
S(X) 5, 4083
CV (X)% = × 100% = × 100% = 135, 21%.
X̄ 4
d) A média de Y ;
n
P
Yi
21 + 25 + · · · + 26 216
Ȳ = i=1
= = = 24,
n 9 9
ou
Ȳ = X̄ + 20 = 4 + 20 = 24.
e) A variância de Y ;
2
5418 − (216) 234
S (Y ) =
2 9
= = 29, 25,
9−1 8
ou
S 2 (Y ) = S 2 (X + 20) = S 2 (X) = 29, 25.
f) O coeficiente de variação de Y ;
73
√q
S (Y ) =S 2 (Y ) = 29, 25 = 5, 4083
S(Y ) 5, 4083
CV (Y )% = × 100% = × 100% = 22, 53%.
Ȳ 24
g) O coeficiente de variação de Z;
n
P
Zi
20 + 100 + · · · + 120 720
Z̄ = i=1
= = = 80,
n 9 9
ou
Z̄ = X̄ = 20 · 4 = 80,
2
151200 − (720) 93600
S (Z) =
2 9
= = 11700,
9−1 8
ou
S 2 (Z) = S 2 (20X) = 202 S 2 (X) = 400 · 29, 25 = 11700.
√q
S (Z) =S 2 (Z) = 11700 = 108, 1665
S(Z) 108, 1665
CV (Z)% = × 100% = × 100% = 135, 21%.
Z̄ 80
h) O coeficiente de variação de W .
n
P
Wi
−22 + 10 + · · · + 18 18
W̄ = i=1
= = = 2,
n 9 9
ou
W̄ = 8X̄ − 30 = 8 · 4 − 30 = 32 − 30 = 2.
2
15012 − (18) 14976
S (W ) =
2 9
= = 1872,
9−1 8
ou
S 2 (W ) = S 2 (8X − 30) = 82 S 2 (X) = 64 · 29, 25 = 1872.
74
q √
S (W ) = S 2 (W ) = 1872 = 43, 2666
S(W ) 43, 2666
CV (W )% = × 100% = × 100% = 2163, 33%.
W̄ 2
75
11) Na tabela a seguir são informadas as notas de uma amostra de 18 alunos. Calcule as medidas de
posição e dispersão abordadas e interprete o significado do valor encontrado.
Nota 59 60 61 64 65 67 68 72 73 91 99 100
Nº de alunos 1 1 1 1 3 1 2 1 2 3 1 1
Temos que
k
P
ni Xi
1 × 59 + 1 × 60 + · · · + 1 × 100 1332
X̄ = i=1
= = = 74,
k
P 1 + 1 + ··· + 1 18
ni
i=1
sendo esse um valor central, em torno do qual a duração média das chamadas tendem a se concentrar.
n n

2 2
X( 18 ) + X( 18 +1) X(9) + X(10) 68 + 68

Md(X) = 2 2
= = = 68.
2 2 2
Para o conjunto de valores colocados em ordem crescente ou decrescente de grandeza, o valor mediano
obtido é o elemento que ocupa a posição central, sendo pelo menos 50% das notas são iguais ou
superiores e, pelo menos 50% das notas são menores ou inferiores a ele.
As modas são Mo1 (X) = 65 e Mo2 (X) = 91, sendo o conjunto bimodal. Dessa forma essas são as
notas que ocorrem com maior frequência.
A amplitude total é,
AT (X) = Xmáx − Xmin = 100 − 59 = 41,
e, dessa forma, a diferença entre duas observações quaisquer é, no máximo, igual a 41.
A variância é dada por

!2
k
P
f i Xi
k i=1
fi Xi2 −
P
k
i=1 P
fi 101796 − (1332)
2
S (X) =
2 i=1
= 18
k 18 − 1
fi − 1
P
i=1
3228
= = 189, 8824,
17
sendo a variância uma medida de dispersão dos valores em torno da média.

76
O desvio padrão é dado por
q √
S (X) = S 2 (X) = 189, 8824 = 13, 7798,
sendo o desvio padrão uma medida de dispersão dos valores em torno da média.
O coeficiente de variação é
S (X) 13, 7798

CV (X) % = × 100% = × 100% = 18, 62%,
X̄ 74
sendo a dispersão relativa, que é a razão entre a dispersão absoluta e a média. Ele mede a homoge-
neidade de um conjunto de valores e, geralmente é utilizado quando se tem interesse em comparar
variabilidades de diferentes conjuntos de valores.
77
12) O professor de EST 103 divulgou, para as três turmas da disciplina, os resultados ao final do
semestre, os quais são apresentados abaixo. Determine a média geral de todos os alunos da disciplina.
T1 T2 T3
ni 58 58 48
X̄i 76 74 64
Si (X) 2,56 3,23 4,23
Temos que
n1
P n1
P
X1i X1i n1
• X̄1 = i=1
, logo 76 = i=1
, donde X1i = 76 · 58 = 4408;
P
n1 58
i=1
n2
P n2
P
X2i X2i n2
• X̄2 = i=1
, logo 74 = i=1
, donde X2i = 74 · 58 = 4292;
P
n2 58
i=1
n3
P n3
P
X3 i X3i n3
• X̄3 = i=1
, logo 64 = i=1
, donde X3i = 64 · 48 = 3072;
P
n3 48
i=1
n n1 n2 n3
Xi = X1i + X2i +
X X X X
X3i
i=1 i=1 i=1 i=1
= 4408 + 4292 + 3072 = 11772
além disso,
n = n1 + n2 + n3 = 58 + 58 + 48 = 164,
logo
n
P 27
P
Xi Xi
11772
X̄ = i=1
= i=1
= = 71, 78.
n 27 164
78
13) Em uma empresa, cada trabalhador recebia um salário X, sendo que o salário médio dos trabalha-
dores da empresa era R$ 1800, com desvio padrão de R$ 400. A nova diretoria da empresa resolveu
que, como estímulo aos trabalhadores, promoveria um aumento de 20% a todos os trabalhadores da
empresa, além disto, uma bonificação de R$ 300 seria instituída. Dessa forma, o salário de cada
trabalhador passa a ser Yi = 1, 2Xi + 300. Pergunta-se:
a) Qual o salário médio Ȳ após a nova diretoria ter assumido?
Temos que Yi = 1, 2Xi + 300 e queremos determinar Ȳ . Pelas propriedades da média, temos:
• ao somarmos uma constante a cada um dos valores da variável aleatória, a média final ficará
somada dessa constante;
• ao multiplicarmos cada um dos valores da variável aleatória por uma constante, a média final
ficará multiplicada dessa constante.
Logo
Ȳ = 1, 2X̄ + 300 = 1, 2 × 1800 + 300
= 2460.
Dessa forma, o salário médio após a nova diretoria ter assumido é de R$ 2460.
b) Os salários eram mais homogêneos antes ou após a nova diretoria ter assumido? justifique sua
resposta.
Temos que S 2 (X) = (400)2 = 160000 e Yi = 1, 2Xi + 300. Pelas propriedades da variância, temos:
• ao somarmos uma constante a cada um dos valores da variável aleatória, a variância final não se
altera;
• ao multiplicarmos cada um dos valores da variável aleatória por uma constante, a variância final
ficará multiplicada pelo quadrado dessa constante.
Assim
S 2 (Y ) = S 2 (1, 2Xi + 300) = S 2 (1, 2Xi )
= (1, 2)2 S 2 (Xi ) = 1, 44 × 160000 = 230400.
q √
Assim S(X) = S 2 (Y ) = 230400 = 480.
Para determinarmos o conjunto mais homogêneo, encontraremos CV (X)% e CV (Y )%, para que
possamos compará-los e, o menor coeficiente de variação estará ligado ao conjunto mais homogêneo.
79
S(X) 400
CV (X)% = × 100% = × 100% = 22, 22%,
X̄ 1800
e,
S(Y ) 480
CV (Y )% = × 100% = × 100% = 19, 51%.
Ȳ 2460
Como 19, 51% = CV (Y )% < CV (X)% = 22, 22% temos que a os salários após a nova diretoria ter
assumido (Y ) são mais homogêneos que antes dela (X).
80
14) Foram feitas 24 determinações para se avaliar a temperatura (em grau Celsius) em um certo
ambiente. Os resultados foram os seguintes:
22,0 22,9 23,3 23,6 23,9 24,0 24,1 24,2 24,5 25,2 26,0 26,8
22,6 23,0 23,4 23,6 24,0 24,0 24,2 24,3 24,8 25,2 26,0 27,0
Determine:
a) A temperatura média;
n
P
Xi
22 + 22, 9 + · · · + 27 582, 6
X̄ = i=1
= = = 24, 275.
n 24 24
b) A temperatura mediana;
Primeiramente devemos colocar os dados em rol, o qual é
22,00 22,60 22,90 23,00 23,30 23,40 23,60 23,60 23,90 24,00 24,00 24,00
24,10 24,20 24,20 24,30 24,50 24,80 25,20 25,20 26,00 26,00 26,80 27,00
n n

2 2
X( 24 ) + X( 24 +1) X(12) + X(13) 24 + 24, 1

Md(X) = 2 2
= = = 24, 05.
2 2 2
c) A(s) temperatura(s) modais e classifique a amostra;

d) A variância;
2
14178, 94 − (582,6) 36, 325
S (X) =
2 24
= = 1, 5793.
24 − 1 23
e) O desvio padrão;
q √
S (X) = S 2 (X) = 1, 5793 = 1, 2567.
f) O coeficiente de variação;
S(X) 1, 2567
CV (X)% = × 100% = × 100% = 5, 18%.
X̄ 24, 275
81
g) O erro padrão da média.
S (X) 1, 2567
S X̄ = √ = √ = 0, 2565.
n 24
82
15) Sejam X = {10; 14; 11; −3; 15; 0; 16; −1; 12; 16}, Y = 9X − 2 e W = −3X + 100. Determine:
a) A média de X;
n
P
Xi
10 + 14 + · · · + 16
X̄ = i=1
=
n 10
90
= = 9.
10
b) A variância de X;
Temos que
Xi Xi2
10 100
14 196
.. ..
. .
16 256
n n
Xi = 90 Xi2 = 1308
P P
i=1 i=1
logo
n 2
P
n
Xi
i=1
Xi2 −
P 2
n 1308 − (90)
S (X) =
2 i=1
= 10
n−1 10 − 1
498
= = 55, 33.
9
c) O coeficiente de variação de Y ;
Temos Y = 9X − 2,
Ȳ = 9X̄ − 2 = 9 × 9 − 2 = 79
S 2 (Y ) = S 2 (9X − 2) = S 2 (9X) = (9)2 S 2 (X) = 81 × 55, 33 = 4481, 73

q √
S(Y ) = S 2 (Y ) = 4481, 73 = 66, 95
S(Y ) 66, 95
CV (Y )% = × 100% = × 100% = 84, 74%.
Ȳ 79
d) O coeficiente de variação de W .
83
Temos W = −3X + 100,
W̄ = −3X̄ + 100 = −3 × 9 + 100 = 73
S 2 (W ) = S 2 (−3X + 100) = S 2 (−3X) = (−3)2 S 2 (X) = 9 × 55, 33 = 497, 97

q √
S(W ) = S 2 (W ) = 497, 97 = 22, 32
S(W ) 22, 32
CV (W )% = × 100% = × 100% = 30, 57%.
W̄ 73
e) Qual conjunto é mais homogêneo, Y ou W ? Justifique.
Como 30, 57% = CV (W )% < CV (Y )% = 84, 74% temos que o conjunto W é mais homogêneo que
o conjunto Y .
84
16) Uma reportagem exibida revelou que no dia 18/07/2016 o estado de Santa Catarina (SC) foi o mais
castigados pelo frio rigoroso do inverno, apresentando registros de temperaturas negativas e geadas
em diversas cidades. Mais especificamente, na cidade de Urupema foi registrada uma temperatura
de −7, 1 °C e em São Joaquim de −4 °C. No entanto, para apresentar informações mais precisas
sobre o clima dessas duas cidades, um estudo mais completo seria necessário e uma análise descritiva
foi recomendada. A Tabela a seguir apresenta valores de temperatura dessas duas cidades, em um
determinado ano.
Cidades Jan. Fev. Mar. Abr. Mai. Jun. Jul. Ago. Set. Out. Nov. Dez.
Urupema 15 12 8 7 6 -7 -9 -8 3 5 6 10
São Joaquim 17 14 10 7 9 -4 -5 -2 2 9 9 —
a) Baseado no valor médio da amostra, qual cidade pode ser considerada a mais fria?
n
P
Xi
15 + 12 + · · · + 10 48
X̄U = i=1
= = = 4,
n 12 12
n
P
Yi
17 + 14 + · · · + 9 66
ȲS = i=1
= = = 6,
n 11 11
b) Obtenha a mediana e a moda para as duas amostras de temperatura.

Mo(XU ) = 6 e Mo(YS ) = 9 e assim os dois conjuntos são unimodais.
Como nU = 12 é ímpar, quando os dados estão organizados, a mediana é dada pela média dos
n n

2 2
X( 12 ) + X( 12 +1) X(6) + X(7) 6+6

Md (XU ) = 2 2
= = = 6.
2 2 2
Como nS = 11 é ímpar, a mediana é o elemento que ocupa a posição n+1

2
= 11+1
2
= 6, quando os
dados estão organizados em rol, assim:
Md (YS ) = Y( 11+1 ) = Y(6) = 9.

2
c) Qual dessas cidades possui a amostra de temperatura mais homogênea? Justifique.
v
u 882 − (48)2
u s
q 690 √
S (X) = S 2 (X) = 12
= = 62, 7273 = 7, 9201,
t
12 − 1 11
85
v
u 926 − (66)2
u s
q 530 √
S (Y ) = S 2 (Y ) = 11
= = 53 = 7, 2801,
t
11 − 1 10
S(X) 7, 9201
CV (X) % = × 100% = × 100% = 198%,
X̄ 4
e,
S(Y ) 7, 2801
CV (Y ) % = × 100% = × 100% = 121, 34%.
Ȳ 6
Como 121, 33% = CV (Y )% < CV (X)% = 198% temos que as temperaturas da cidade Y (São
Joaquim) é mais homogênea que as temperaturas da cidade X (Urupema).
d) Qual a amplitude total de cada uma das amostras?
AT (XU ) = Xmáx − Xmin = 15 − (−9) = 24,
AT (YS ) = Ymáx − Ymin = 17 − (−5) = 22,

86
17) Suponha que um geógrafo esteja interessado em comparar a quantidade de partículas suspensas
no ar em duas cidades distintas. Para tal, ele coletou dados de 10 PM (partículas de 10 micrômetros
ou menores) durante oito dias na cidade A e, devido a um problema com seu equipamento, durante
apenas 7 dias na cidade B. A Tabela a seguir apresenta os resultados.
Cidade A 22 26 27 35 38 40 52 52
Cidade B 34 41 45 49 52 56 59 —
Pede-se:
a) A quantidade média de partículas suspensas no ar em cada uma das cidades;
n
P
Xi
22 + 26 + · · · + 52 292
X̄ = i=1
= = = 36, 5,
n 8 8
n
P
Yi
34 + 41 + · · · + 59 336
Ȳ = i=1
= = = 48.
n 7 7
b) As quantidades mediana e modal(is) de partículas suspensas no ar em cada uma das cidades;
Mo(X) = 52 assim a cidade A é unimodal enquanto que a cidade B é amodal.
Como nX = 8 é ímpar, quando os dados estão organizados, a mediana é dada pela média dos
n n

2 2
X( 8 ) + X( 8 +1) X(4) + X(5) 35 + 38

Md(X) = 2 2
= = = 36, 5.
2 2 2
Como nY = 7 é ímpar, a mediana é o elemento que ocupa a posição n+1

2
= 7+1
2
= 4, quando os
dados estão organizados em rol, assim:
Md(Y ) = Y( 7+1 ) = Y(4) = 49.

2
c) Qual amostra é mais homogênea?
v
u 11566 − (292)2
u s
q 908 √
S (X) = S 2 (X) = 8
= = 129, 7143 = 11, 3892,
t
8−1 7
v
u 16584 − (336)2
u s
q 456 √
S (Y ) = S 2 (Y ) = 7
= = 76 = 8, 7178,
t
7−1 6
87
S(X) 11, 3892

CV (X)% = × 100% = × 100% = 31, 2%,
X̄ 36, 5
e,
S(Y ) 8, 7178
CV (Y )% = × 100% = × 100% = 18, 16%.
Ȳ 48
Como 18, 16% = CV (Y )% < CV (X)% = 31, 2% temos que a quantidade de partículas suspensas no
ar da cidade B é mais homogênea que a quantidade de partículas suspensas da cidade A.
88
18) A depressão ocupa uma posição de destaque entre os problemas de saúde pública, sendo consi-
derada como a principal causa de incapacidade e suicídio. A OMS estima que anualmente cerca de
850.000 novas pessoas apresentem sintomas depressivos, o que evidencia o quão sério é esse trans-
torno. Um grupo de psicólogos avaliou o nível de depressão em jovens (com idade entre 15 e 30 anos)
e adultos (com idade entre 46 e 60 anos) de uma determinada localidade. Os valores informados na
tabela a seguir representam scores, interpretados da seguinte forma: valores entre 0 e 9 indicam que
a pessoa não tem depressão, entre 10 e 18 depressão leve, entre 19 e 29 depressão moderada e entre
30 e 63 depressão severa. Essa é a escala de depressão de Beck e os scores são originados a partir de
um questionário com 21 itens de múltipla escolha. Pede-se:
Jovens 42 14 56 23 12 11 49 10
Adultos 17 3 7 21 12 10 2 24
a) Calcule a média dos dois grupos. Baseado nesse resultado, em qual grupo a depressão parece ser
mais perigosa?
Sejam X : “nível de depressão em jovens” e Y : “nível de depressão em adultos”, então
n
P
Xi
42 + 14 + · · · + 10 217
X̄ = i=1
= = = 27, 125,
n 8 8
n
P
Yi
17 + 3 + · · · + 24 96
Ȳ = i=1
= = = 12.
n 8 8
Como o nível de depressão médio é maior para os jovens com X̄ = 27, 125, enquanto que nos adultos
o nível de depressão médio é Ȳ = 12, a depressão parece ser mais perigosa no grupo de jovens.
b) Calcule a mediana e a moda para o grupo de jovens.
10 11 12 14 23 42 49 56
n n

2 2
X( 8 ) + X( 8 +1) X(4) + X(5) 14 + 23

Md(X) = 2 2
= = = 18, 5.
2 2 2
2 3 7 10 12 17 21 24
89
Como nY = 8 é par quando os dados estão organizados em rol, a mediana é dada pela média dos
n n

2 2
Y( 8 ) + Y( 8 +1) Y(4) + Y(5) 10 + 12

Md(Y ) = 2 2
= = = 11.
2 2 2
c) Qual dos dois grupos é mais homogêneo? justifique.
v
u 8391 − (217)2
u s
q 2504, 875 √
S (X) = S 2 (X) = 8
= = 357, 8393 = 18, 9166,
t
8−1 7
v
u 1612 − (96)2
u s
q 460 √
S (Y ) = S 2 (Y ) = 8
= = 65, 7143 = 8, 1064,
t
8−1 7
S(X) 18, 9166

CV (X)% = × 100% = × 100% = 69, 74%,
X̄ 27, 125
e,
S(Y ) 8, 1064
CV (Y )% = × 100% = × 100% = 67, 55%.
Ȳ 12
Como 67, 55% = CV (Y )% < CV (X)% = 69, 74% temos que o nível de depressão Y é mais homo-
gênea que o nível de depressão X, assim o nível de depressão é mais homogêneo entre os adultos do
que entre os jovens.
d) Estime o erro padrão da média para o grupo de adultos.
S (Y ) 8, 1064
S Ȳ = √ = √ = 2, 866.
n 8
90
19) Em uma turma de EST 103, as notas obtidas ao final do semestre foram:
Nota 75 97 69 60 40 23
Número de alunos 8 13 11 4 11 13
a) Determine a(s) nota(s) modal(is).
As modas são Mo1 (X) = 97 e Mo2 (X) = 23, sendo o conjunto bimodal.
b) Determine a nota mediana.
O rol é dado por Como nX = 60 é par quando os dados estão organizados em rol, a mediana é dada
Nota Número de alunos

23 13
40 11
60 4
69 11
75 8
97 13
n n

pela média dos elementos que ocupam as posições e + 1 , isto é:
2 2
X( 60 ) + X( 60 +1) X(30) + X(31) 69 + 69

Md(X) = 2 2
= = = 69.
2 2 2
c) Determine a nota média.
Temos que
6
P
ni Xi
8 × 75 + 13 × 97 + · · · + 13 × 23 3599
X̄ = i=1
= = = 59, 9833,
6
P 8 + 13 + · · · + 13 60
ni
i=1
d) Determine a variância.
Xi ni ni Xi ni Xi2
75 8 600 45000
97 13 1261 122317
69 11 759 52371
60 4 240 14400
40 11 440 17600
23 13 299 6877
6 6 6
ni = 60 ni Xi = 3599 ni Xi2 = 258565
P P P
i=1 i=1 i=1
91
A variância é dada por
6 2
P
6
ni Xi
i=1
ni Xi2 −
P
6
i=1 P
ni 2
258565 − (3599)
S (X) =
2 i=1
= 60
6 60 − 1
ni − 1
P
i=1
42684, 9833
= = 723, 4743,
59
e) Determine o coeficiente de variação.
O desvio padrão é dado por
q √
S (X) = S 2 (X) = 723, 4743 = 26, 8975,
assim o coeficiente de variação é
S (X) 26, 8975

CV (X) % = × 100% = × 100% = 44, 84%.
X̄ 59, 9833
92
CAPÍTULO V
Regressão linear simples
1) Os dados a seguir provêm de um experimento para testar o desempenho de uma máquina industrial.
O experimento utilizou uma mistura de óleo diesel e gás, derivados de materiais destilados orgânicos.
O valor da capacidade da máquina (Y ) em cavalo vapor (HP) foi coletado a diversas velocidades (X)
medidas em rotações por minuto (rpm × 100).
X Y X Y X Y X Y
22,0 64,03 15,0 46,85 18,0 52,90 15,0 45,79
20,0 62,47 17,0 51,17 16,0 48,84 17,0 51,17
18,0 54,94 19,0 58,00 14,0 42,74 19,0 56,65
16,0 48,84 21,0 63,21 12,0 36,63 21,0 62,61
14,0 43,73 22,0 64,03 10,5 32,05 23,0 65,31
12,0 37,48 20,0 62,63 13,0 39,68 24,0 63,89
Admitindo-se que as variáveis X e Y estão relacionadas de acordo com o modelo
Yi = β0 + β1 Xi + i , pede-se:
a) Obter a equação de regressão ajustada;
(418, 5) (1255, 64)

SP DXY = 22761, 025 − = 865, 8025
24
(418, 5)2
SQDX = 7624, 25 − = 326, 6562
24
(1255, 64)2
SQDY = 68063, 8884 − = 2370, 8963
24
SPDXY 865, 8025

βb1 = = = 2, 6505
SQDX 326, 6562
1255, 64 418, 5
βb0 = Ȳ − βb1 X̄ = − (2, 6505) × = 52, 3183 − 46, 2181 = 6, 1002
24 24
Ybi = βb0 + βb1 Xi = 6, 1002 + 2, 6505Xi .
b) Calcule o coeficiente de determinação e interprete-o;

93
SQRegressão 2294, 81
r2 (%) = × 100% = × 100%
SQTotal 2370, 9
= 96, 79%.
O coeficiente de determinação r2 foi de 96,79%, dessa forma, o percentual da variabilidade observada

da capacidade da máquina, explicado pela regressão linear simples, nos valores da velocidade, em
centenas de rotações por minuto, é 96,79%.
c) Interprete a estimativa obtida para o coeficiente de regressão;
βb1 = 2, 6505 é o aumento médio estimado, em cavalo vapor (HP), da capacidade da máquina a cada
aumento da velocidade em 100rpm.
d) Determine a estimativa de Y para X = 15,5.
Para X = 15, 5 ⇒ Yb =?
Yb = 6, 1002 + 2, 6505 × 15, 5 = 47, 183.
94
2) Joana verificou que as variáveis X (anos de experiência no cargo de supervisora do refeitório de

uma grande indústria) e Y (o tempo, em minutos, gasto na execução de certa tarefa relacionada com
esse cargo) se relacionam de acordo com o modelo linear
Ybi = 9, 8 − 1, 7Xi
e, que são válidas as pressuposições usuais acerca dos erros. Ela tomou uma amostra de 15 supervi-
soras, com tempo experiência no cargo variando de zero a 5 anos, e ajustou a equação de regressão
linear com r = −0, 875. Complete corretamente as afirmações abaixo.
a) A estimativa do tempo gasto na execução dessa tarefa relacionada com o cargo, para uma super-
visora com 3 anos de experiência é de minutos.
Para X = 3 ⇒ Yb =?
Yb = 9, 8 − 1, 7 × 3 = 4, 7,
dessa forma “A estimativa do tempo gasto na execução dessa tarefa relacionada com o cargo, para
uma supervisora com 3 anos de experiência é de 4,7 minutos.”
b) A cada acréscimo de um ano de experiência no cargo de supervisora do refeitório, estima-se um

decréscimo de minutos no tempo gasto na execução dessa tarefa relacionada ao cargo.
Temos que βb1 = −1, 7, dessa forma, “A cada acréscimo de um ano de experiência no cargo de
supervisora do refeitório, estima-se um decréscimo de 1, 7 minutos no tempo gasto na execução dessa
tarefa relacionada ao cargo.”
c) A estimativa do tempo gasto na execução dessa tarefa, para uma supervisora sem experiência no
cargo (com 0 anos) é de minutos.
Para X = 0 ⇒ Yb =?
Yb = 9, 8 − 1, 7 × 0 = 9, 8,
dessa forma “A estimativa do tempo gasto na execução dessa tarefa, para uma supervisora sem
experiência no cargo (com 0 anos) é de 9,8 minutos.”.
d) A proporção da variação do tempo gasto na execução dessa tarefa relacionada com o cargo de
supervisora do refeitório, que é explicada pela equação ajustada em função do tempo de experiência
no cargo é igual a .
r2 (%) = r2 × 100% = (−0, 875)2 × 100% = 76, 56%,
dessa forma, “A proporção da variação do tempo gasto na execução dessa tarefa relacionada com o
cargo de supervisora do refeitório, que é explicada pela equação ajustada em função do tempo de
95
experiência no cargo é igual a 76,56%”.
e) A correlação foi o que indica que a relação linear entre o tempo, em minutos, gasto
na execução da tarefa relacionada ao cargo de supervisora e o tempo de experiência no cargo é
.
“A correlação foi −0, 875 o que indica que a relação linear entre o tempo, em minutos, gasto na
execução da tarefa relacionada ao cargo de supervisora e o tempo de experiência no cargo é inversa.”.
96
3) Com a finalidade de, se tentar explicar a eficiência do consumo de combustível de automóveis de

passeio através de suas massas, selecionou-se aleatoriamente quatorze automóveis do mesmo ano de
fabricação, pertencentes a uma grande empresa. Foram registrados os pesos (X) em kg, e o consumo
(Y ) em quilômetros por litro (km/l), dos automóveis durante um certo trecho de uma determinada
estrada e foram obtidos:
14
Xi = 17688; SQDX = 1341371; SQDY = 72, 8686;
P
i=1
14
Yi = 148, 8; SP DXY = −9322, 971;
P
i=1
a) Ajuste uma reta de regressão para explicar a eficiência do consumo, em termos da massa dos
veículos.
SP DXY −9322, 971

βb1 = = = −0, 007,
SQDX 1341371
148, 8 17688
βb0 = Ȳ − βb1 X̄ = − (−0, 007) × = 10, 6286 − (−8, 844) = 19, 4726,
14 14
Ybi = βb0 + βb1 Xi = 19, 4726 − 0, 007Xi .
b) Interprete o coeficiente de regressão obtido no item a).
βb1 = −0, 007 é o decréscimo médio estimado da eficiência do consumo, em quilômetros por litro, a
cada aumento de um quilograma do massa.
c) Considerando que a massa dos carros avaliados variou de 800 kg a 1200 kg. Qual a eficiência do
consumo estimada para um carro que pesa 1000 kg?
Para X = 1000 ⇒ Yb =?
Yb = 19, 4726 − 0, 007 × 1000 = 12, 4726.
97
4) Uma doença contagiosa assola uma região de um determinado país. Duas cidades A e B são as mais
infectadas e pesquisadores, após observaram o número de doentes ao longo de oito meses, obtiveram:
Cidade Equação de Regressão r2 % CV

A Ybi = 25 + 15Xi 0,96 5%
B Ybi = 30 + 10Xi 0,98 6%
em que, Ybi é o número de pessoas doentes; e Xi é o tempo em meses.
a) Em qual cidade o avanço da doença é mais preocupante? justifique sua resposta.
O avanço da doença é mais preocupante na cidade A, pois a cada mês há um aumento médio estimado
de 15 casos de doença, enquanto que na cidade B, o aumento médio mensal estimado é de 10 casos.
b) Para qual das duas cidades o modelo de regressão explica melhor o progresso da doença?
A porcentagem da variabilidade explicada pelo modelo de regressão é dado pelo coeficiente de deter-
minação, (r2 %), sendo assim, para a cidade B o modelo de regressão explica melhor o progresso da
doença, por apresentar maior coeficiente de determinação.
98
5) Em um estudo acerca da influência do tamanho da população residente em uma cidade (X, em mi-
lhares de pessoas) e a taxa de mortalidade (Y , número de mortes por mil habitantes), um pesquisador
obteve os seguintes valores para doze cidades pesquisadas:
X 101 193 42 304 42 152 55 105 68 219 129 42

Y 37 27 38 25 67 63 41 13 28 17 32 32
Com base na tabela responda:
a) Determine o coeficiente de correlação linear entre X e Y ;
b) X e Y são correlacionados, dessa forma à medida que o tamanho da população residente

tende a a taxa de mortalidade tende a .
Com base no item a), marque a alternativa que completa corretamente a frase acima:
i) positivamente, aumentar, diminuir;
ii) negativamente, aumentar, aumentar;
iii) positivamente, diminuir, diminuir;
iv) negativamente, aumentar, diminuir;
v) positivamente, diminuir, aumentar;
vi) negativamente, diminuir, diminuir.
Temos que
12 12
n = 12 Xi = 1452; Xi2 = 251538;
P P
i=1 i=1
12 12 12
Yi = 420; Yi2 = 17596; Xi Yi = 45253.
P P P
i=1 i=1 i=1
45253 − (1452)(420)
−5567
rXY = r 12
=
2 2 14820, 5943
251538 − (1452)
12
17596 − (420)
12
= −0, 3756
Dessa forma, X e Y são negativamente correlacionados, dessa forma à medida que o tamanho da
população residente tende a aumentar a taxa de mortalidade tende a diminuir.
Equivalentemente, temos que X e Y são negativamente correlacionados, dessa forma à medida que
o tamanho da população residente tende a diminuir a taxa de mortalidade tende a aumentar.
Vemos assim que a única solução é a letra iv).

99
6) Uma empresa está estudando como varia a demanda de certo produto (em unidades) em função de
seu preço de venda que varia de R$ 160,00 a R$ 200,00. Para isso levantou as seguintes informações:
n n n n n
n = 12, Xi = 2130, Xi2 = 379440, Yi = 2658, Yi2 = 593812, Xi Yi = 471133.
P P P P P
i=1 i=1 i=1 i=1 i=1
Utilizando essas informações, responda às seguintes questões:
a) Obter a equação da regressão linear simples;
(2130) (2658)
SPDXY = 471133 − = −662
12
(2130)2
SQDX = 379440 − = 1365
12
(2658)2
SQDY = 593812 − = 5065
12
SPDXY −662
βb1 = = = −0, 485
SQDX 1365
2658 2130
βb0 = Ȳ − βb1 X̄ = − (−0, 485) × = 221, 5 + 86, 0875 = 307, 5875
12 12
Ybi = βb0 + βb1 Xi = 307, 5875 − 0, 485Xi .
b) Qual a interpretação da estimativa obtida para a constante de regressão?
βb0 = 307, 5875 é número médio estimado, em unidades, da demanda do produto quando o produto é
dado ao consumidor (preço de venda é R$ 0, 00). Note que esse valor trata-se de uma extrapolação,
haja vista que, no estudo o preço de venda variou de R$ 160,00 a R$ 200,00 e, assim, essa estimativa
não é confiável.
c) Qual a interpretação da estimativa obtida para o coeficiente da regressão?
βb1 = −0, 485 é o decréscimo médio estimado, em unidades, da demanda do produto a cada aumento
de R$ 1,00 no preço de venda.
d) Calcule o coeficiente de determinação e interprete o valor obtido;

100
2
(SPDXY ) 2 471133 − 2130×2658
12
SQRegressão = = ,
SQDX 379440 − (2130)2
12
(−662)2
= = 321, 06
1365
(2658)2
SQTotal = SQDY = 593812 − = 5065.
12
r2 (%) = × 100% = × 100%
SQTotal 5065
= 6, 34%.

da demanda do produto, explicado pela regressão linear simples, nos valores do preço de venda, em
reais, é 6,34%.
e) Para um artigo que custa R$ 180, qual o número estimado de unidades a serem vendidas?
Para X = 180 ⇒ Yb =?
Yb = 307, 5875 − 0, 485 × 180 = 220, 2875.
Para um artigo que custa R$ 180, o número estimado de unidades a serem vendidas é 220,2875.
f) Para um artigo que custa R$ 280, qual o número estimado de unidades a serem vendidas? o que
você pode dizer acerca dessa estimativa?
Para X = 280 ⇒ Yb =?
Yb = 307, 5875 − 0, 485 × 280 = 171, 7875.
Para um artigo que custa R$ 280, qual o número estimado de unidades a serem vendidas é 171,7875.
Note que esse valor trata-se de uma extrapolação, haja vista que, no estudo o preço de venda variou
de R$ 160,00 a R$ 200,00 e, assim, essa estimativa não é confiável.
101
7) É esperado que a massa muscular de uma pessoa diminua com a idade. Para estudar essa relação,
uma nutricionista selecionou 18 mulheres, com idade entre 43 e 78 anos, e observou em cada uma
delas a idade (X) e a massa muscular (Y ).
X 71 64 43 67 56 73 68 56 76 65 45 58 45 53 49 78 73 68
Y 82 91 100 68 87 73 78 80 65 84 116 76 97 100 105 77 73 78
a) Construa o diagrama de dispersão.
●
110
●
100
● ●
Massa muscular
●
90
●
●
80
●
●
●
●
●
70
45 50 55 60 65 70 75
Idade
Figura 1: Gráfico de dispersão de Idade versus Massa muscular
b) Calcule o coeficiente de correlação linear entre X e Y .
Temos que
18 18
n = 18 Xi = 1108; Xi2 = 70362;
P P
i=1 i=1
18 18 18
Yi = 1530; Yi2 = 133300; Xi Yi = 91964.
P P P
i=1 i=1 i=1
91964 − (1108)(1530)
−2216
rXY = r 18
=
2 2
2648, 574
70362 − (1108)
18
133300 − (1530)
18
= −0, 8367
102
Dessa forma, X e Y são negativamente correlacionados, dessa forma à medida que a idade tende a
aumentar a massa muscular tende a diminuir.
Equivalentemente, temos que X e Y são negativamente correlacionados, dessa forma à medida a

idade tende a diminuir a massa muscular tende a aumentar.
c) Qual das duas variáveis é mais homogênea?
n
P
Xi
71 + 64 + · · · + 68 1108
X̄ = i=1
= = = 61, 5556.
n 18 18
n
P
Yi
82 + 91 + · · · + 78 1530
Ȳ = i=1
= = = 85.
n 18 18
v
u 70362 − (1108)2
u s
q 2158, 4444 √
S (X) = S 2 (X) = 18
= = 126, 9673 = 11, 268,
t
18 − 1 17
v
u 133300 − (1530)2
u s
q 3250 √
S (Y ) = S 2 (Y ) = 18
= = 191, 1765 = 13, 8267,
t
18 − 1 17
S(X) 11, 268

CV (X)% = × 100% = × 100% = 18, 31%,
X̄ 61, 5556
e,
S(Y ) 13, 8267

CV (Y )% = × 100% = × 100% = 16, 27%.
Ȳ 85
Como 16, 27% = CV (Y )% < CV (X)% = 18, 31% temos que a variável Y é mais homogênea que a
variável X.
d) Ajuste a reta de regressão para a relação linear entre as variáveis Y e X.
(1108) (1530)
SPDXY = 91964 − = −2216
18
(1108)2
SQDX = 70362 − = 2158, 4444
18
(1530)2
SQDY = 133300 − = 3250
18
103
SPDXY −2216
βb1 = = = −1, 0267
SQDX 2158, 4444
1530 1108
βb0 = Ȳ − βb1 X̄ = − (−1, 0267) × = 8563, 1991 = 148, 1991
18 18
Ybi = βb0 + βb1 Xi = 148, 1991 − 1, 0267Xi .
e) Considerando a reta estimada dada no item d), estime a massa muscular média de mulheres com
50 anos.
Para X = 50 ⇒ Yb =?
Yb = 148, 1991 − 1, 0267 × 50 = 96, 8641.
104
8) A tabela abaixo apresenta dados relativos ao nível de escolaridade (medido pelo número de anos
de estudo) e o salário (em R$) de 10 indivíduos. Suponha que o salário médio de um indivíduo esteja
linearmente relacionado à escolaridade do mesmo.
X 4 7 8 9 11 12 13 14 15 16
Y 420 450 600 620 700 1000 1200 1600 2000 2500
Pede-se:
a) O aumento de um ano de estudo gera um aumento médio esperado de R$ no salário.
Temos que
10 10
n = 10; Xi = 109; Xi2 = 1321;
P P
i=1 i=1
10 10 10
Yi = 11090; Yi2 = 16863300; Xi Yi = 142910.
P P P
i=1 i=1 i=1
(109) (11090)
SPDXY = 142910 − = 22029
10
(109)2
SQDX = 1321 − = 132, 9
10
(11090)2
SQDY = 16863300 − = 4564490
10
SPDXY 22029
βb1 = = = 165, 7562
SQDX 132, 9
11090 109
βb0 = Ȳ − βb1 X̄ = − (165, 7562) × = 1109 − 1806, 7426 = −697, 7426
10 10
Ybi = βb0 + βb1 Xi = −697, 7426 + 165, 7562Xi .
Dessa forma, “O aumento de um ano de estudo gera um aumento médio esperado de R$ 165,76 no
salário.”.
b) é a estimativa da constante da regressão.
Como βb0 = −697, 7426, temos que “−697, 7426 é a estimativa da constante da regressão”.
c) R$ é uma estimativa do salário médio para um indivíduo que estudou 10 anos.
Para X = 10 ⇒ Yb =?
Yb = −697, 7426 + 165, 7562 × 10 = 959, 82,
assim “R$ 959,82 é uma estimativa do salário médio para um indivíduo que estudou 10 anos”.
d) é o coeficiente de correlação linear entre os anos de estudo e o salário.

105
Temos que
142910 − (109)(11090)
22029
rXY = r 10
=
2 2 24629, 6716
1321 − (109)
10
16863300 − (11090)
10
= 0, 8944
Dessa forma “0, 8944 é o coeficiente de correlação linear entre os anos de estudo e o salário.”.
e) O percentual da variação observada nos valores de salário que é explicado pela regressão linear
simples nos valores de anos de estudo é igual a %.
2
(SPDXY ) 2 142910 − 109×11090
10
SQRegressão = = ,
SQDX 1321 − (109)2
10
(22029)2
= = 3651443, 5
132, 9
(11090)2
SQTotal = SQDY = 16863300 − = 4564490.
10
r2 (%) = × 100% = × 100%
SQTotal 4564490
= 80%.
O coeficiente de determinação r2 foi de 80%, dessa forma, “O percentual da variação observada nos
valores de salário que é explicado pela regressão linear simples nos valores de anos de estudo é igual
a 80%.”
f) O desvio da regressão para 11 anos de estudo é .
Para X = 11 ⇒ Yb =?
Yb = −697, 7426 + 165, 7562 × 11 = 1125, 58,
b5 = Y5 − Yb5 = 700 − 1125, 58 = −425, 58.
Assim “O desvio da regressão para 11 anos de estudo é −425, 58”.
g) Estimar que o salário médio de um indivíduo com 20 anos de estudo seja igual a R$
seria uma do modelo.
Para X = 20 ⇒ Yb =?
Yb = −697, 7426 + 165, 7562 × 20 = 2617, 38,
assim “Estimar que o salário médio de um indivíduo com 20 anos de estudo seja igual a R$ 2617,38
seria uma extrapolação do modelo.”.
106
9) Francine verificou que as variáveis X (anos de experiência no cargo de supervisora do refeitório

de uma grande indústria) e Y (o tempo, em minutos, gasto na execução de certa tarefa relacionada
com esse cargo) se relacionam de acordo com o modelo linear Y = β0 + β1 X + ε e que são válidas
as pressuposições usuais sobre o erro ε. Ela tomou uma amostra de 15 supervisoras, com tempo
experiência no cargo variando de zero a 5 anos, e ajustou a equação de regressão linear Ybi = 9, 8 −
1, 7Xi , com rXY = −0, 875. Complete corretamente as afirmações abaixo
a) A estimativa do tempo gasto na execução dessa certa tarefa relacionada com o cargo, para uma
supervisora com 3 anos de experiência no mesmo é de min.
Para X = 3 ⇒ Yb =?
Yb = 9, 8 − 1, 7 × 3 = 4, 7,
assim: “A estimativa do tempo gasto na execução dessa certa tarefa relacionada com o cargo, para
uma supervisora com 3 anos de experiência no mesmo é de 4,7 min.”
b) A cada acréscimo de um ano de experiência no cargo de supervisora do refeitório, estima-se um

decréscimo de min. no tempo gasto na execução dessa certa tarefa relacionada
com o cargo.
Como Ybi = 9, 8−1, 7Xi , temos que βb1 = −1, 7, assim: “A cada acréscimo de um ano de experiência no
cargo de supervisora do refeitório, estima-se um decréscimo de 1,7 min. no tempo gasto na execução
dessa certa tarefa relacionada com o cargo.”
c) A estimativa do tempo gasto na execução dessa certa tarefa relacionada com o cargo de supervisora,
para uma supervisora sem experiência no cargo (com 0 anos) é de min.
Para X = 0 ⇒ Yb =?
Yb = 9, 8 − 1, 7 × 0 = 9, 8,
assim: “A estimativa do tempo gasto na execução dessa certa tarefa relacionada com o cargo de
supervisora, para uma supervisora sem experiência no cargo (com 0 anos) é de 9,8 min.”
d) O grau de associação dos pontos observados e a reta foi de .
Como rXY = −0, 875 temos que “O grau de associação dos pontos observados e a reta foi de 87,5%.”
e) A proporção da variação do tempo gasto na execução dessa certa tarefa relacionada com o cargo de
supervisora do refeitório, que é explicada pela equação ajustada em função do tempo de experiência
no cargo é igual a .
Temos que r2 = (rXY )2 = (−0, 875)2 = 76, 56%, dessa forma, “ A proporção da variação do tempo
gasto na execução dessa certa tarefa relacionada com o cargo de supervisora do refeitório, que é
explicada pela equação ajustada em função do tempo de experiência no cargo é igual a 76,56%.”
107
f) O sinal do coeficiente de correlação linear indica que a relação linear entre

o tempo, em minutos, gasto na execução de certa tarefa relacionada com o cargo de supervisora do
refeitório de uma grande indústria e o tempo de experiência no cargo é .
O sinal negativo do coeficiente de correlação linear indica que a relação linear entre o tempo, em
minutos, gasto na execução de certa tarefa relacionada com o cargo de supervisora do refeitório de
uma grande indústria e o tempo de experiência no cargo é inversa.
108
10) O consumo máximo de oxigênio (VO2máx ) é considerado um parâmetro fisiológico que permite
avaliar o nível da capacidade funcional do sistema cardiorrespiratório. Um pesquisador decidiu
ajustar uma equação de regressão com a finalidade de predição do VO2máx em função do desempenho
em um teste de 1600 m, para a população de brasileiros jovens fisicamente ativos. A partir de X
= velocidade do indivíduo em teste de 1600 m (em m/min) e Y = consumo máximo de oxigênio
(em ml/(kg·min)), ele obteve a equação de regressão: Ybi = 8, 15 + 0, 18Xi , com um coeficiente
de determinação igual r2 = 0, 79. Os valores de X variaram de 200 a 270 m/min. Complete
CORRETAMENTE as afirmações abaixo.
a) A proporção da variação do VO2máx (consumo máximo de oxigênio) que não é explicada pela
equação de regressão ajustada em função velocidade do indivíduo em teste de 1600 m (em m/min)
é igual a %.
O coeficiente de determinação r2 = 0, 79 é a proporção da variação do VO2máx (consumo máximo de

oxigênio) que é explicada pela equação de regressão ajustada em função velocidade do indivíduo em
teste de 1600 m (em m/min), dessa forma,“A proporção da variação do VO2máx (consumo máximo de
oxigênio) que não é explicada pela equação de regressão ajustada em função velocidade do indivíduo
em teste de 1600 m (em m/min) é igual a 21%.”
b) A estimativa do VO2máx (consumo máximo de oxigênio) para um indivíduo com velocidade de 276
m/min em teste de 1600 m é igual a ml/(kg·min). Entretanto essa estimativa
deve ser analisada com cautela em razão de essa velocidade não pertencer ao .
Para X = 276 ⇒ Yb =?
Yb = 8, 150, 18 × 276 = 57, 83,
assim: “A estimativa do VO2máx (consumo máximo de oxigênio) para um indivíduo com velocidade
de 276 m/min em teste de 1600 m é igual a 57,83 ml/(kg·min). Entretanto essa estimativa deve ser
analisada com cautela em razão de essa velocidade não pertencer ao intervalo pesquisado que variou
de 200 a 270 m/min.”
109
11) Érica supõe que as variáveis: comprimento do corpo em cm (X) de Bothrops moojeni - um tipo
de jararaca - e comprimento de sua cauda em cm (Y ) se relacionam de acordo com o modelo linear e
que são válidas as pressuposições usuais sobre o erro. Érica toma uma amostra de Bothrops moojeni
e obtém os seguintes resultados para a amostra escolhida:
X 124 125 135 135 140 140 143 148 150

Y 5 4 6 5 7 7 8 7 9
Determine:
a) Os somatórios;
n n
n= Xi = Xi2 =
P P
i=1 i=1
n n n
Yi = Yi2 = Xi Yi =
P P P
i=1 i=1 i=1
n n
n=9 Xi = 1240 Xi2 = 171504
P P
i=1 i=1
n n n
Yi = 58 Yi2 = 394 Xi Yi = 8095
P P P
i=1 i=1 i=1
b) Ajuste a equação de regressão para o modelo linear.
(1240) (58)
SPDXY = 8095 − = 103, 8889
9
(1240)2
SQDX = 171504 − = 659, 5556
9
(58)2
SQDY = 394 − = 20, 2222
9
SPDXY 103, 8889

βb1 = = = 0, 1575
SQDX 659, 5556
58 1240
βb0 = Ȳ − βb1 X̄ = − (0, 1575) × = 6, 4444 − 21, 7 = −15, 2556
9 9
Ybi = βb0 + βb1 Xi = −15, 2556 + 0, 1575Xi .
c) Determine (e interprete) o coeficiente de determinação da regressão.

110
2
(SPDXY ) 2 8095 − 1240×58
9
SQRegressão = = ,
SQDX 171504 − (1240)2
9
(103, 8889)2
= = 16, 3639
659, 5556
(58)2
SQTotal = SQDY = 394 − = 20, 2222.
9
r2 (%) = × 100% = × 100%
SQTotal 20, 2222
= 80, 92%.

do comprimento da cauda, explicado pela regressão linear simples, nos valores do comprimento do
corpo, é 80,92%.
111
12) Considere as afirmações a seguir a respeito do coeficiente de correlação entre duas variáveis X e
Y.
I - Se rXY = −1, as observações estão todas sobre uma linha reta no diagrama de dispersão.
II - Se rXY > 0, a variável X tende a aumentar quando a variável Y tende a aumentar.
III - Se rXY < 0, a variável X tende a decrescer quando a variável Y tende a decrescer.
IV - rXY varia de −1 a 1, sendo que, quanto mais próximo de −1 menos correlacionadas são as
variáveis e, quanto mais próximo de 1, mais correlacionadas elas estão.
São corretas APENAS as afirmações
a) I e II; c) I, II e III; e) II, III e IV;
b) I e III; d) I, II e IV; f) n.d.r.a.
I - Verdadeiro.
II - Verdadeiro.
III - Falso. Se X e Y estão negativamente correlacionadas, isto é, −1 < rXY < 0 então as variáveis
caminham em sentido contrário e, dessa forma:
• À medida que uma variável tende a crescer a outra tende a diminuir;
• À medida que uma variável tende a diminuir a outra tende a aumentar.
IV - Falso. Quanto mais próximo de −1 e 1, maior a correlação entre as variáveis, no primeiro caso elas
estão negativamente correlacionadas e no segundo positivamente correlacionadas. Uma correlação
próxima a zero indica que as duas variáveis não estão linearmente relacionadas.
Opção correta letra a).

112
13) Considere a tabela abaixo:
Y 2 -1 5 1 6
X 0 0 3 -1 4
O valor do coeficiente de determinação, da constante da regressão, do coeficiente de correlação e do

coeficiente da regressão são dados respectivamente por:
a) 0,9671; −1, 5273; 0,9834 e 0,9091; d) 0,8966; 1,1702; 0,8039 e 1,1915;
b) 0,7289; 0,125; 0,8538 e 1,375; e) 1,1915; 1,1702; 0,8966 e 0,8039;
c) 0,8039; −0, 5542; 0,8966 e 0,6747; f) n.d.r.a.
Temos que
n n n n n
Xi = 6; Xi2 = 26; Yi = 13; Yi2 = 67; Xi Yi = 38;
P P P P P
i=1 i=1 i=1 i=1 i=1
SQDX = 18, 8; SQDY = 33, 2; SPDXY = 22, 4.
38 − (6)(13)
22, 4
rXY = r 5
=√ = 0, 8966.
2 2 18, 8 × 33, 2
26 − (6)
5
67 − (13)
5
r2 (%) = (0, 8966)2 × 100% = 80, 3896% = 0, 8039

22, 4
βb1 = = 1, 1915
18, 8
βb0 = 2, 6 − 1, 1915 × 1, 2 = 1, 1702
Assim a opção correta teria respectivamente os valores:
r2 (%) = 0, 8039; βb0 = 1, 1702; rXY = 0, 8966 e βb1 = 1, 1915.
Como não há nenhum item dessa maneira a resposta é a letra f)

113
14) Com o objetivo de verificar, em certa região, a relação existente entre o nível de escolaridade
médio dos pais e o nível de escolaridade dos filhos, observou-se uma amostra de 9 indivíduos adultos,
verificando-se o número de anos que esses frequentaram (e tiveram aprovação) em escolas regulares
(Y ) e, o número médio de anos que os seus pais frequentaram (e tiveram aprovação) em escolas
regulares (X), sendo que a escolaridade dos pais variou de três a doze anos de estudo. Nesse estudo
obteve-se:
rXY = 0, 9475 e Ybi = −1, 6964 + 1, 447Xi .
Pode-se afirmar que:
a) 1, 447 é o aumento médio estimado, em anos, da escolaridade dos pais quando aumenta-se em um
ano a escolaridade média dos filhos;
b) 1, 6964 é o decréscimo médio estimado, em anos, da escolaridade dos pais quando aumenta-se em
um ano a escolaridade média dos filhos;
c) 1, 6964 é o decréscimo médio estimado, em anos, da escolaridade dos pais quando diminui-se em
um ano a escolaridade média dos filhos;
d) O percentual da variabilidade observada do nível de escolaridade médio dos pais, explicado pela
regressão linear simples, nos valores do nível de escolaridade médio dos filhos é 94,75%;
e) O percentual da variabilidade observada do nível de escolaridade médio dos filhos, explicado pela
regressão linear simples, nos valores do nível de escolaridade médio dos pais é 89,78%.
f) 1, 447 é o aumento médio estimado, em anos, da escolaridade dos pais quando diminui-se em um
ano a escolaridade média dos filhos;
Temos que
n n n n n
Xi = 61; Xi2 = 491; Yi = 73; Yi2 = 773; Xi Yi = 607.
P P P P P
i=1 i=1 i=1 i=1 i=1
(61) (73)
SPDXY = 607 − = 112, 2222
9
(61)2
SQDX = 491 − = 77, 5556
9
(73)2
SQDY = 773 − = 180, 8889
9
SPDXY 112, 2222

βb1 = = = 1, 447
SQDX 77, 5556
73 61
βb0 = Ȳ − βb1 X̄ = − (1, 447) × = 8, 1111 − 9, 8075 = −1, 6964
9 9
114
Ybi = βb0 + βb1 Xi = −1, 6964 + 1, 447Xi .
607 − (61)(73)
112, 22
rXY = r 9
=√ = 0, 9475.
2 2 77, 56 × 180, 89
491 − (61)
9
773 − (73)
9
r2 (%) = (0, 9475)2 × 100% = 89, 78% = 0, 8978.
Assim, a única alternativa correta é a letra e).

115
15) O Departamento de Economia da UFV através do CENSUS (Centro de Promoção do Desenvolvi-

mento Sustentável) disponibiliza boletins semestrais acerca de vários assuntos nas áreas social, urba-
nística, ambiental e de gestão pública. No boletim de 2015, dentre diversas variáveis disponibilizadas
estavam o IPC-VIÇOSA (Índice de Preço ao Consumidor da cidade de Viçosa, em porcentagem), o
qual denotaremos por X e a variação dos empregos (diferença entre as Admissões e Demissões de
trabalhadores em Viçosa-MG), a qual denotaremos pos Y . Na tabela abaixo temos os valores obtidos
para o ano de 2012.
Mês Jan. Fev. Mar. Abr. Mai. Jun. Jul. Ago. Set. Out. Nov. Dez.
Y −29 115 84 −8 169 74 −107 −43 75 23 −2 7
X 2, 32 1, 19 −0, 46 0, 38 0, 02 0, 8 0, 63 0, 9 1, 43 1, 26 1, 29 1, 15
Fonte: http://www.censusvicosa.com.br/images/publicacoes/475/boletim-estatstico-de-viosa-15-de-janeiro-de-2013-3pdf.pdf
Considerando quatro casas decimais nos cálculos, indique a seguir a única resposta correta:
a) 34, 9747 é o aumento médio estimado, em unidades, da variação dos empregos quando aumenta-se
em uma unidade o índice de preços ao consumidor da cidade de Viçosa;
b) A reta de regressão estimada e o coeficiente de correlação são dados respectivamente por:

Ybi = 1, 0021 − 0, 0031Xi e rXY = −0, 33;
c) A reta de regressão estimada e o coeficiente de determinação são dados respectivamente por:
Ybi = 66, 2072 − 36, 0733Xi e rX,Y
2
= 7, 6%;
d) A reta de regressão estimada e o coeficiente de determinação são dados respectivamente por:
Ybi = 61, 6311 − 34, 9747Xi e rX,Y
2
= −0, 33;
e) O percentual da variabilidade observada da variação dos empregos, explicado pela regressão linear
simples, nos valores do índice de preços ao consumidor da cidade de Viçosa é 10,89%;
f) n.d.r.a.
Temos que
126, 06 − (10,91)(358)
rXY = r 12
= −0, 33.
(10,91)2 (358)2

15, 6209 − 12
74728 − 12
126, 06 − 10,91×358
−199, 4217
βb1 = 12
= = −34, 9747,
15, 6209 (10,91)2
− 12 5, 7019
358 10, 91
βb0 = − (−34, 9747) × = 61, 6311,
12 12
Ybi = 61, 6311 − 34, 9747Xi .
r2 (%) = (−0, 33)2 × 100% = 10, 89%.

da variação dos empregos, explicado pela regressão linear simples, nos valores do índice de preços ao
116
consumidor da cidade de Viçosa é 10,89%.
A única resposta correta é a letra e).

117
16) Uma forma para avaliar a capacidade reprodutiva de um touro é medindo o seu índice de con-
centração sérica de testosterona. Há evidências de que animais com altos valores desse índice são
também melhores reprodutores. Portanto, existe o interesse em descobrir possíveis fatores que provo-
cam o aumento desse índice e, consequentemente, da fertilidade do touro. Nesse sentido, estudou-se
via Regressão Linear Simples (RLS) como a massa corporal dos animais (X) influenciaria o índice
de concentração sérica de testosterona (Y ), através de uma amostra de 10 touros da raça Guzerá,
com idade entre 24 e 34 meses. A Tabela a seguir apresenta os valores de X e Y , sendo que ng/ml
representa nanogramas/mililitro.
Massa (kg) 305 541 579 388 422 755 599 693 392 659
Testosterona (ng/ml) 0, 1 2, 2 2, 6 0, 74 1, 02 3, 45 2, 47 3, 24 0, 85 3, 6
a) Determine a equação ajustada de regressão linear simples;
Temos que
n n
n = 10; Xi = 5333; Xi2 = 3046595;
P P
i=1 i=1
n n n
Yi = 20, 27; Yi2 = 55, 3815; Xi Yi = 12478, 86.
P P P
i=1 i=1 i=1
(5333) (20, 27)

SPDXY = 12478, 86 − = 1668, 869
10
(5333)2
SQDX = 3046595 − = 202506, 1
10
(20, 27)2
SQDY = 55, 3815 − = 14, 2942
10
SPDXY 1668, 869

βb1 = = = 0, 0082
SQDX 202506, 1
20, 27 5333
βb0 = Ȳ − βb1 X̄ = − (0, 0082) × = 2, 027 − 4, 3731 = −2, 3461
10 10
Ybi = βb0 + βb1 Xi = −2, 3461 + 0, 0082Xi .
Olhando-se direto na calculadora obteremos: Ybi = −2, 3680 + 0, 0082Xi .
b) Interprete a estimativa do coeficiente da regressão;
βb1 = 0, 0082 é o aumento médio estimado, em nanogramas/mililitro, do índice de concentração sérica

de testosterona quando aumenta-se em um quilograma o massa corporal dos animais;
c) Estime o índice de concentração sérica de testosterona e o desvio da regressão para um touro com
massa de 541 kg;
Para X2 = 541 ⇒ Yb2 =?

Yb2 = −2, 3461 + 0, 0082 × 541 = 2, 0901.
118
O desvio da regressão é b2 = Y2 − Yb2 = 2, 2 − 2, 0901 = 0, 1099.
Com os valores da calculadora obteremos
Yb2 = −2, 368 + 0, 0082 × 541 = 2, 0682.
assim b2 = Y2 − Yb2 = 2, 2 − 2, 0682 = 0, 1318
ou ainda olhando-se diretamente teremos Yb2 = 2, 0905. Logo b2 = Y2 − Yb2 = 2, 2 − 2, 0905 = 0, 1095.
d) Obtenha o coeficiente de correlação linear;
SPDXY 12478, 86 − (5333)(20,27)

rXY = √ = r 10
SQDX SQDY (5333)2

(20,27)2

3046595 − 10
55, 38 − 10
1668, 87
= √ = 0, 9809.
202506, 1 × 14, 29
e) Obtenha o coeficiente de determinação e interprete-o.
Temos que
(SPDXY )2 (1668, 869)2

SQRegressão = = = 13, 7533,
SQDX 202506, 1
SQTotal = SQDY = 14, 2942,
r2 (%) = × 100% = × 100%
SQTotal 14, 2942
= 96, 22%.
O coeficiente de determinação r2 (%) foi de 96,22%, dessa forma, o percentual da variabilidade ob-
servada do índice de concentração sérica de testosterona, explicado pela regressão linear simples, nos
valores do massa corporal dos animais é 96,22%.
119
17) Investigou-se, via regressão linear simples (RLS), como a idade dos consumidores (X, em anos)
poderia influenciar a intenção de compra de produtos de uma determinada linha. Para tal, n = 8
indivíduos foram apresentados a fotografias que ilustravam alguns desses produtos. As notas de
preferência (Y ), definidas em uma escala contínua de 1 a 6, foram atribuídas a cada imagem, conforme
apresentado na tabela a seguir:
Xi 18 19 20 23 24 25 26 27
Yi 5,4 5,6 5,3 4,7 3,9 4,0 3,7 3,3
Pede-se:
a) A equação de regressão linear simples (RLS) ajustada e a interpretação da estimativa do coeficiente

da regressão.
Temos que
n n
n = 8; Xi = 182; Xi2 = 4220;
P P
i=1 i=1
n n n
Yi = 35, 9; Yi2 = 166, 49; Xi Yi = 796, 6.
P P P
i=1 i=1 i=1
(182) (35, 9)
SPDXY = 796, 6 − = −20, 125
8
(182)2
SQDX = 4220 − = 79, 5
8
(35, 9)2
SQDY = 166, 49 − = 5, 3888
8
SPDXY −20, 125

βb1 = = = −0, 2531
SQDX 79, 5
35, 9 182
βb0 = Ȳ − βb1 X̄ = − (−0, 2531) × = 4, 4875 + 5, 758 = 10, 2455
8 8
Ybi = βb0 + βb1 Xi = 10, 2455 − 0, 2531Xi .
βb1 = −0, 2531 é o decréscimo médio estimado, da nota de preferência quando aumenta-se em um
ano a idade do consumidor;
b) A nota de preferência média estimada e o desvio da regressão para um consumidor com 20 anos;
Para X = 20 ⇒ Yb =?
Yb = 10, 2455 − 0, 2531 × 20 = 5, 1835,
b3 = Y3 − Yb3 = 5, 3 − 5, 1835 = 0, 1165.
Assim “o desvio da regressão para um indivíduo com 20 anos é 0, 1165”.

120
c) Estime a nota de preferência média para um consumidor com idade de 10 anos. Comente sobre
esse resultado.
Para X = 10 ⇒ Yb =?
Yb = 10, 2455 − 0, 2531 × 10 = 7, 7145.
Essa estimativa obtida trata-se de uma extrapolação, haja vista que no estudo em questão, a idade
do consumidor variou de 18 a 27 anos, dessa forma, essa estimativa não é confiável.
d) Calcule e interprete o coeficiente de determinação do modelo de RLS ajustado.
Temos que
(SPDXY )2 (−20, 125)2

SQRegressão = = = 5, 0945,
SQDX 79, 5
SQTotal = SQDY = 5, 3888,
r2 (%) = × 100% = × 100%
SQTotal 5, 3888
= 94, 54%.
O coeficiente de determinação r2 (%) foi de 94,54%, dessa forma, o percentual da variabilidade ob-
servada da nota de preferência, explicado pela regressão linear simples, nos valores da idade do
consumidor é 94,54%.
121
CAPÍTULO VI
Probabilidade
1) De 100 estudantes, 30 frequentam um curso de natação, 20 frequentam um curso de computação

e 10 frequentam tanto o curso de natação quanto o de computação. Um estudante é selecionado ao
acaso.
a) Determine a probabilidade de que ele frequente pelo menos um dos dois cursos.
Sejam A:“o aluno frequenta o curso de natação” e, B:“o aluno frequenta o curso de computação”.
Temos que
30 20 10
P [A] = = 0, 3, P [B] = = 0, 2 e P [A ∩ B] = = 0, 1.
100 100 100
assim
Ω
P [A ∪ B] = P [A] + P [B] − P [A ∩ B]
= 0, 3 + 0, 2 − 0, 1
A 0, 2 0, 1 0, 1 B
= 0, 4
0, 6
b) Determine a probabilidade de que ele frequente apenas o curso de natação.

Ω
P [A ∩ B ] = P [A] − P [A ∩ B]
c
= 0, 3 − 0, 1
= 0, 2 A 0, 2 0, 1 0, 1 B
0, 6
122
2) Dentre 10 pessoas que estão na sala de espera de um médico, 3 praticam alguma atividade física.
Duas pessoas são selecionadas aleatoriamente, uma após a outra sem reposição, para serem atendidas
gratuitamente.
a) Determine a probabilidade de que a segunda pessoa escolhida pratique atividade física, sabendo
que a primeira pessoa a ser escolhida pratica atividade física.
Sejam A:“a primeira pessoa pratica atividade física” e, B:“a segunda pessoa pratica atividade física”.
B
2
9
3 7
10 9
Bc
2
P [B|A] = = 0, 2222 •
9
7
B
3
10 9
Ac
6
9
Bc
b) Determine a probabilidade de que a segunda pessoa escolhida pratique atividade física, sabendo
que a primeira pessoa a ser escolhida não pratica atividade física.
3
P [B|Ac ] = = 0, 3333
9
c) Determine a probabilidade de que a primeira pessoa escolhida pratique atividade física, sabendo
que a segunda pessoa a ser escolhida não pratica atividade física.
P [A ∩ B c ] P [B c |A] P [A]
P [A|B c ] = =
P [B c ] P [B c |A] P [A] + P [B c |Ac ] P [Ac ]
7 3
· 0, 2333
= 7 39 106 7 =
· + · 0, 7
9 10 9 10
= 0, 3333
123
3) Numa usina nuclear somente em um a cada 100 dias há algo errado com o reator. Em 99% dos dias
em que há algo errado com o reator o alarme dessa usina dispara e, por outro lado, ele também dispara
em 1% dos dias em que não há nada de errado com o reator. Qual é a probabilidade condicional de
haver algo errado com o reator se o alarme disparou?
Sejam A:“há algo errado com o reator” e, B:“o alarme diparou”.
B
0,99
1 0,01
100
Bc
99
B
100 0,01
Ac
0,99
Bc
P [A ∩ B] P [B|A] P [A]
P [A|B] = =
P [B] P [B|A] P [A] + P [B|Ac ] P [Ac ]
0, 99 · 0, 01 0, 0099
= =
0, 99 · 0, 01 + 0, 01 · 0, 99 0, 0198
= 0, 5
124
4) Um estudante em uma certa manhã, sai de casa apressado para a escola e apanha na cozinha
aleatoriamente uma das 3 sacolas iguais que estão em cima da mesa. Uma delas contém o seu lanche:
dois sanduíches de queijo e manteiga. Outra sacola contém o lanche de sua irmã: um sanduíche de
queijo e manteiga e outro de presunto, (que ele detesta). A terceira sacola contém restos de comida
que serão dados ao gato. Pensando em ter ou não, pegado a sacola errada, no meio do caminho, ele
abre a sacola e tira um sanduíche e verifica que é de queijo e manteiga. (Fica aliviado, pelo menos
não é a sacolinha da comida do gato). Pergunta-se: Nessas condições, qual a probabilidade dele ter
apanhado a sacola correta?
Sejam A:“ele apanhou sua sacola”, B:“ele apanhou a sacola de sua irmã”, C:“ele apanhou a sacola
com restos de comida” e D:“A sacola contém um sanduíche de queijo e manteiga”. Temos que assim
1 1 1
P [A] = = 0, 3333, P [B] = = 0, 3333 P [C] = = 0, 3333
3 3 3
P [D | A] = 1, P [D | B] = 0, 5 P [D | C] = 0
P [Dc | A] = 0, P [Dc | B] = 0, 5 P [Dc | C] = 1
D
1
0
Dc
0,3333
D
0,5
• 0,3333
B
0,5
Dc
0,3333
D
0
1
Dc
P [A ∩ D] P [A] P [D|A]
P [A|D] = =
P [D] P [A] P [D|A] + P [B] P [D|B] + P [C] P [D|C]
0, 3333 × 1
=
0, 3333 × 1 + 0, 3333 × 0, 5 + 0, 3333 × 0
0, 3333
= = 0, 6667
0, 5
125
5) Extraem-se aleatoriamente duas cartas de um baralho comum de 52 cartas. Determine a probabi-

lidade de serem ambas ases, se:
a) a primeira carta é reposta;
Sejam A:“a primeira carta retirada é um ás” e, B:“a segunda carta retirada é um ás”.
B
4
52
4 48
52
P [A ∩ B] = P [B | A] · P [A] 52
Bc
4 4 16
= · =
52 52 2704 •
= 0, 0059
48
B
4
52 52
Ac
48
52
Bc
b) a primeira carta não é reposta.
B
3
P [A ∩ B] = P [B | A] · P [A] 51
3 4 12 A
= · =
51 52 2652
= 0, 0045 4 48
52 51
Bc
48
B
4
52 51
Ac
47
51
Bc
126
6) Sejam duas urnas I e II. A urna I contém três fichas vermelhas e duas fichas azuis, e a urna II
contém duas fichas vermelhas e oito fichas azuis. Joga-se uma moeda honesta. Se a moeda resultar
em cara, extrai-se uma ficha da urna I; se resultar em coroa, extrai-se uma ficha da urna II. Pede-se:
a) Determine a probabilidade de escolha de uma ficha vermelha.
Urna I Urna II
3 Vermelhas 2 Vermelhas
2 Azuis 8 Azuis
Sejam A:“a moeda resulta em cara” e, B:“a ficha extraída é vermelha”. Temos que
3
P [A] = 0, 5, P [Ac ] = 0, 5 P [B | A] = = 0, 6
5
2 2 8
P [B c | A] = = 0, 4, P [B | Ac ] = = 0, 2 P [B c | Ac ] = = 0, 8
5 10 10
B
3
5
A
2
0,5 5
Bc
P [B] = P [B | A] P [A] + P [B | Ac ] P [Ac ]

•
= 0, 6 · 0, 5 + 0, 2 · 0, 5
= 0, 4 0,5 2
B
10
Ac
8
10
Bc
b) Dado que a ficha é vermelha, qual é a probabilidade condicional de ter vindo da urna I?
P [A ∩ B] P [B|A] P [A]
P [A|B] = =
P [B] P [B|A] P [A] + P [B|Ac ] P [Ac ]
0, 6 · 0, 5 0, 3
= =
0, 6 · 0, 5 + 0, 2 · 0, 5 0, 4
= 0, 75
127
7) Em uma fábrica de peças, as máquinas A, B e C respondem por 40, 50 e 10 por cento do total
produzido, respectivamente. Da produção de cada máquina 3%, 5% e 2%, respectivamente, são peças
defeituosas. Escolhida ao acaso uma peça da produção conjunta das três máquinas, pede-se:
a) Qual a probabilidade da peça escolhida ser defeituosa?

Sejam A:“a peça foi produzida pela máquina A”, B:“a peça foi produzida pela máquina B”, C:“a
peça foi produzida pela máquina C” e D:“ a peça produzida é defeituosa”. Temos que
P [A] = 0, 4, P [B] = 0, 5 P [C] = 0, 1

P [D | A] = 0, 03, P [D | B] = 0, 05 P [D | C] = 0, 02
P [Dc | A] = 0, 97, P [Dc | B] = 0, 95 P [Dc | C] = 0, 98
D
assim 0,03
0,97
Dc
0,4
D
0,05
• 0,5
B
0,95
Dc
0,1
D
0,02
0,98
Dc
P [D] = P [A] P [D|A] + P [B] P [D|B] + P [C] P [D|C]
= 0, 4 × 0, 03 + 0, 5 × 0, 05 + 0, 1 × 0, 02
= 0, 039.
b) Sabendo-se que a peça escolhida é defeituosa, qual a probabilidade condicional de ter vindo da
máquina B?
P [B ∩ D] P [B] P [D|B]
P [B|D] = =
P [D] P [A] P [D|A] + P [B] P [D|B] + P [C] P [D|C]
0, 5 × 0, 05
=
0, 4 × 0, 03 + 0, 5 × 0, 05 + 0, 1 × 0, 02
0, 025
= = 0, 641.
0, 039
128
8) Uma caixa contém 20 peças, das quais 5 são defeituosas. Extraem-se sucessivamente duas peças
ao acaso. Qual a probabilidade de:
a) Ambas serem perfeitas?

Sejam A: “a primeira peça é perfeita” e, B: “a segunda peça é perfeita”.
Temos que
15 5 14
P [A] = = 0, 75, P [Ac ] = = 0, 25, P [B |A ] = = 0, 7368,
20 20 19
5 15 4
P [B c |A] = = 0, 2632, P [B |Ac ] = = 0, 7895, P [B c |Ac ] = = 0, 2105.
19 19 19
B
14
P [A ∩ B] = P [B | A] · P [A] 19
14 15 210 A
= · =
19 20 380
= 0, 5526 15 5
20 19
Bc
5
B
15
20 19
Ac
4
19
Bc
b) Ambas serem defeituosas?
P [Ac ∩ B c ] = P [B c | Ac ] · P [Ac ]
4 5 20
= · =
19 20 380
= 0, 0526
c) Uma ser perfeita e outra defeituosa?
P [(A ∩ B c ) ∪ (Ac ∩ B)] = P [A ∩ B c ] + P [Ac ∩ B]
= P [B c | A] · P [A] + P [B | Ac ] · P [Ac ]
5 15 15 5 75 75
= · + · = +
19 20 19 20 380 380
= 0, 1974 + 0, 1974 = 0, 3948
129
9) Certa firma utilizava um teste para classificar os funcionários em categorias; ao final eles eram
classificados em: 25% bons (B), 50% médios (M) e 25% fracos (F). Um novo teste é proposto, de tal
forma a classificar os funcionários como aprovado (A) ou reprovado (R). Com base em informações
do antigo teste, foram obtidas as seguintes probabilidades condicionais com o novo teste:
Categorias do Aprovados pelo

antigo teste novo teste (%)
B 80
M 50
F 20
Pede-se: qual é a probabilidade condicional de um funcionário aprovado no novo teste, ser classificado
como fraco pelo antigo teste?
Sejam
• B : “o funcionário é classificado como bom pelo antigo teste”;
• M : “o funcionário é classificado como médio pelo antigo teste”;
• F : “o funcionário é classificado como fraco pelo antigo teste”;
• A : “o funcionário é aprovado no novo teste”.

Ac
Temos que 0,2
B
0,8
P [B]=0,25, P [A|B]=0,8, 0,25
A
0,5 Ac
P [M ]=0,5, P [A|M ]=0,5, • 0,5

M
0,5
A
0,25
P [F ]=0,25, P [A|F ]=0,2. 0,8 Ac
F
0,2
A
P [F ∩ A] P [A|F ] P [F ]
P [F |A] = =
P [A] P [A|B] P [B] + P [A|M ] P [M ] + P [A|F ] P [F ]
0, 2 × 0, 25
=
0, 8 × 0, 25 + 0, 5 × 0, 5 + 0, 2 × 0, 25
0, 05
=
0, 2 + 0, 25 + 0, 05
0, 05
= = 0, 1.
0, 5
Dessa forma, sabendo-se que o aluno foi aprovado no novo teste, a probabilidade de que ele tenha
sido classificado como fraco pelo antigo teste é 0,1.
130
10) Considerando o espaço amostral de um experimento constituído do lançamento de dois dados

perfeitamente simétricos, pede-se:
a) Qual a probabilidade de que o primeiro dado mostre a face 2 e o segundo a face 3?
Determinemos primeiramente o espaço amostral, para isso consideremos a tabela auxiliar que se
segue.
HHD2
HH
1 2 3 4 5 6
D1 HH
1 (1, 1) (1, 2) (1, 3) (1, 4) (1, 5) (1, 6)
2 (2, 1) (2, 2) (2, 3) (2, 4) (2, 5) (2, 6)
3 (3, 1) (3, 2) (3, 3) (3, 4) (3, 5) (3, 6)
4 (4, 1) (4, 2) (4, 3) (4, 4) (4, 5) (4, 6)
5 (5, 1) (5, 2) (5, 3) (5, 4) (5, 5) (5, 6)
6 (6, 1) (6, 2) (6, 3) (6, 4) (6, 5) (6, 6)
Note que Ω = {(1, 1), (1, 2), · · · , (6, 6)} constituído de n = 36 pontos amostrais.
Considere o evento A : “o primeiro dado mostre a face 2 e o segundo a face 3”. Perceba que esse
evento só ocorre uma vez nos 36 resultados possíveis do espaço amostral, pois A = {(2, 3)}, e assim
n (A) = 1. Dessa maneira
n (A) 1
P [A] = = .
n 36
b) Qual a probabilidade de que ambos os dados mostrem a mesma face?
Considere o evento B : “ambos os dados mostrem a mesma face”. Perceba que esse evento ocorre 6 ve-
zes nos 36 resultados possíveis do espaço amostral, pois B = {(1, 1); (2, 2); (3, 3); (4, 4); (5, 5); (6, 6)},
e assim n (B) = 6. Dessa maneira
n (B) 6 1
P [B] = = = .
n 36 6
c) Qual a probabilidade de que o segundo dado mostre um número par?
Considere o evento c : “o segundo dado mostra um número par”. Perceba que esse evento ocorre 18
vezes nos 36 resultados possíveis do espaço amostral, pois
C = {(1, 2); (2, 2); (3, 2); (4, 2); (5, 2); (6, 2); (1, 4); (2, 4); (3, 4); (4, 4);
(5, 4); (6, 4); (1, 6); (2, 6); (3, 6); (4, 6); (5, 6); (6, 6)} ,
e assim n (C) = 18. Dessa maneira
n (C) 18 1
P [C] = = = .
n 36 2
131
11) Uma moeda perfeita é lançada 3 vezes e observado o número de caras. Qual é a probabilidade de
ocorrer?
a) Exatamente uma cara?
Considere os eventos
• A1 : “ocorre cara no primeiro lançamento”;
• A2 : “ocorre cara no segundo lançamento”;
• A3 : “ocorre cara no terceiro lançamento”;
• A : “ocorre exatamente uma cara nos três lançamentos”;
então
1 A3 ⇒ 3 caras
2
1 A2 1
Ac3 ⇒ 2 caras
2
2
A1 1 A3 ⇒ 2 caras
2
1
2 1
2 Ac2 1
Ac3 ⇒ 1 caras
2
•
1
1 A2 2
A3 ⇒ 2 caras
1 2
2
1
Ac1 2 Ac3 ⇒ 1 cara
1
1
1 cara
2
2 Ac2 A3 ⇒
1
2 Ac3 ⇒ 0 cara
e
P [A] = P [(A1 ∩ Ac2 ∩ Ac3 ) ∪ (Ac1 ∩ A2 ∩ Ac3 ) ∪ (Ac1 ∩ Ac2 ∩ A3 )]
= P [A1 ∩ Ac2 ∩ Ac3 ] + P [Ac1 ∩ A2 ∩ Ac3 ] + P [Ac1 ∩ Ac2 ∩ A3 ]
= P [ Ac3 | A1 ∩ Ac2 ] P [ Ac2 | A1 ] P [A1 ] + P [ Ac3 | Ac1 ∩ A2 ] P [ A2 | Ac1 ] P [Ac1 ]
+ P [ A3 | Ac1 ∩ Ac2 ] P [ Ac2 | Ac1 ] P [Ac1 ]

1 1 1 1 1 1 1 1 1 1 1 1 3
= · · + · · + · · = + + =
2 2 2 2 2 2 2 2 2 8 8 8 8
b) Pelo menos uma cara?
Seja B : “ocorre pelo menos uma cara nos três lançamentos”, nesse caso B c : “ocorre menos que uma
cara nos três lançamentos”, ou seja, B c = {Ac1 ∩ Ac2 ∩ Ac3 } é o evento em que não ocorrem caras nos
três lançamentos.
132
P [B] = 1 − P [B c ] = 1 − P [Ac1 ∩ Ac2 ∩ Ac3 ]
= 1 − P [ Ac3 | Ac1 ∩ Ac2 ] P [ Ac2 | Ac1 ] P [Ac1 ]

1 1 1 1 8−1 7
= 1− · · =1− = = .
2 2 2 8 8 8
c) Somente cara ou somente coroa?
Seja C : “ocorrem três ou três coroas caras nos três lançamentos”.
P [C] = P [(A1 ∩ A2 ∩ A3 ) ∪ (Ac1 ∩ Ac2 ∩ Ac3 )] = P [A1 ∩ A2 ∩ A3 ] + P [Ac1 ∩ Ac2 ∩ Ac3 ]
= P [ A3 | A1 ∩ A2 ] P [ A2 | A1 ] P [A1 ] + P [ Ac3 | Ac1 ∩ Ac2 ] P [ Ac2 | Ac1 ] P [Ac1 ]

1 1 1 1 1 1 1 1 2 1
= · · + · · = + = =
2 2 2 2 2 2 8 8 8 4
133
12) Das 10 alunas de uma classe, 3 têm olhos azuis. Se duas alunas da classe são escolhidas aleatori-
amente, qual é a probabilidade de:
a) Ambas terem olhos azuis?
Sejam A:“a primeira aluna tem olhos azuis” e, B:“a segunda aluna tem olhos azuis”.
Temos que
3 7 2
P [A] = = 0, 3, P [Ac ] = = 0, 7, P [B |A ] = = 0, 2222,
10 10 9
7 3 6
P [B c |A ] = = 0, 7778, P [B |Ac ] = = 0, 3333, P [B c |Ac ] = = 0, 6667.
9 9 9
B
2
P [A ∩ B] = P [B | A] · P [A] 9
2 3 6 A
= · =
9 10 90
= 0, 0667 3 7
10 9
Bc
7
B
3
10 9
Ac
6
9
Bc
b) Nenhuma ter olhos azuis?
P [Ac ∩ B c ] = P [B c | Ac ] · P [Ac ]
6 7 42
= · =
9 10 90
= 0, 4667
c) Pelo menos uma ter olhos azuis?
P [A ∪ B] = 1 − P [(A ∪ B)c ] = 1 − P [Ac ∩ B c ]
= 1 − 0, 4667 = 0, 5333
134
13) Um homem possui duas moedas, uma comum e outra cunhada com duas caras. Ele apanhou uma
moeda aleatoriamente e a lançou, se ocorreu a face cara, qual é a probabilidade condicional de que
a moeda lançada tenha sido a de duas caras?
Sejam A:“a moeda lançada é a de duas caras” e, B:“a moeda resulta em cara”. Temos que
2
P [A] = 0, 5, P [Ac ] = 0, 5 P [B | A] = =1
2
0 1 1
P [B c | A] = = 0, P [B | Ac ] = = 0, 5 P [B c | Ac ] = = 0, 5
2 2 2
B
2
2
P [A ∩ B] 0,5
0
2
P [A|B] = Bc
P [B]
P [B|A] P [A]
=
P [B|A] P [A] + P [B|Ac ] P [Ac ] •
1 · 0, 5 0, 5
= =
1 · 0, 5 + 0, 5 · 0, 5 0, 75 B
0,5
= 0, 6667
1
2
Ac
1
2
Bc
135
14) Jogam-se dois dados de seis faces honestos.
a) Se as duas faces mostram números diferentes, qual é a probabilidade condicional de que uma das
faces seja o 4?
Note que Ω = {(1, 1), (1, 2), · · · , (6, 6)} constituído de n = 36 pontos amostrais, conforme mostra a
tabela a seguir.
HH
D2
H 1 2 3 4 5 6
D1 HHH
1 (1, 1) (1, 2) (1, 3) (1, 4) (1, 5) (1, 6)
2 (2, 1) (2, 2) (2, 3) (2, 4) (2, 5) (2, 6)
3 (3, 1) (3, 2) (3, 3) (3, 4) (3, 5) (3, 6)
4 (4, 1) (4, 2) (4, 3) (4, 4) (4, 5) (4, 6)
5 (5, 1) (5, 2) (5, 3) (5, 4) (5, 5) (5, 6)
6 (6, 1) (6, 2) (6, 3) (6, 4) (6, 5) (6, 6)
Se A : “as duas faces mostram números diferentes” e B : “uma das faces mostradas é o número
quatro”. Desejamos encontrar P [B | A]. Temos que
A = {(1, 2); (1, 3); (1, 4); (1, 5); (1, 6); (2, 1); (2, 3); (2, 4); (2, 5); (2, 6);
(3, 1); (3, 2); (3, 4); (3, 5); (3, 6); (4, 1); (4, 2); (4, 3); (4, 5); (4, 6);
(5, 1); (5, 2); (5, 3); (5, 4); (5, 6); (6, 1); (6, 2); (6, 3); (6, 4); (6, 5)} ,
B = {(1, 4); (2, 4); (3, 4); (4, 4); (5, 4); (6, 4), (4, 1); (4, 2); (4, 3); (4, 5); (4, 6)} ,
A ∩ B = {(1, 4); (2, 4); (3, 4); (4, 1); (4, 2); (4, 3); (4, 5); (4, 6); (5, 4); (6, 4)}
então
n (A) 30 5
P [A] = = = = 0, 8333
n 36 6
n (A ∩ B) 10 5
P [A ∩ B] = = = = 0, 2778
n 36 18
e
P [A ∩ B] 5
5 6 1
P [B | A] = = 18
= · = = 0, 3333.
P [A] 5
6
18 5 3
b) Qual a probabilidade da soma das faces seja maior do que 8?

As somas das faces são dadas na tabela abaixo e, note que, se C : “soma das faces voltadas para
cima é maior que 8”, então
C = {(3, 6), (4, 5), (4, 6), (5, 4), (5, 5), (5, 6), (6, 3), (6, 4), (6, 5), (6, 6)}
e n(C) = 10,
136
H
E2
1 2 3 4 5 6
HH
E1 HHH
1 2 3 4 5 6 7
2 3 4 5 6 7 8
3 4 5 6 7 8 9
4 5 6 7 8 9 10
5 6 7 8 9 10 11
6 7 8 9 10 11 12
dessa forma
n(C) 10 5
P [C] = = = .
n 36 18
137
15) Considere dois tipos de caixas de bombons, I e II. O tipo I contém 65% de bombons doces e 35%
de bombons amargos, enquanto no tipo II essas percentagens de sabor são inversas. Além disso, 45%
de todas as caixas de bombons são do tipo I e as restantes do tipo II. Escolhe-se, aleatoriamente,
uma caixa e dela retira-se um bombom; se for constatado que ele é doce, qual é a probabilidade
condicional de ter vindo de uma caixa do tipo II?
Sejam A: “as caixas de bombons são do tipo I” e, B: “os bombons são doces”.
Temos que
P [A] = 0, 45, P [Ac ] = 0, 55, P [B |A ] = 0, 65,

P [B c |A ] = 0, 35, P [B |Ac ] = 0, 35, P [B c |Ac ] = 0, 65.
B
0,65
0,35
0,45
Bc
0,55
B
0,35
Ac
0,65
Bc
P [Ac ∩ B] P [B | Ac ] P [Ac ]
P [Ac | B] = =
P [B] P [B | A] P [A] + P [B | Ac ] P [Ac ]
0, 35 · 0, 55 0, 1925 0, 1925
= = =
0, 65 · 0, 45 + 0, 35 · 0, 55 0, 2925 + 0, 1925 0, 485
= 0, 3969.
138
16) Considere dois eventos, A = {atirador A acerta o alvo} e B = {atirador B acerta o alvo}, com
probabilidades P [A] = 0, 51 e P [B] = 0, 32. Pede-se, se os atiradores A e B atiram simultaneamente
em um alvo, qual é a probabilidade do alvo ser atingido quando os eventos A e B:
a) são independentes.
Note que o alvo é atingido se um dos dois atiradores acertar o alvo, dessa forma desejamos encontrar
P [A ∪ B]. Além disso, em sendo os eventos A e B independentes, temos que P [A ∩ B] = P [A] P [B]
e dessa maneira
P [A ∪ B] = P [A] + P [B] − P [A ∩ B]
= P [A] + P [B] − P [A] P [B]
= 0, 51 + 0, 32 − 0, 51 · 0, 32
= 0, 6668.
b) são mutuamente exclusivos.
Note que o alvo é atingido se um dos dois atiradores acertar o alvo, dessa forma desejamos encontrar
P [A ∪ B]. Além disso, em sendo os eventos A e B mutuamente exclusivos, temos que A ∩ B = ∅ e
dessa maneira
P [A ∪ B] = P [A] + P [B] − P [A ∩ B]
= P [A] + P [B] − P [∅]
= 0, 51 + 0, 32 − 0
= 0, 83.
139
17) Dois eventos A e B pertencentes a um mesmo espaço amostral possuem probabilidades P [A] = 1/5
e P [B] = 1/6. Se A e B são eventos independentes calcule a probabilidade de ocorrência de pelo
menos um dos dois eventos.
P [A ∪ B] = P [A] + P [B] − P [A ∩ B]
= P [A] + P [B] − P [A] P [B]

1 1 1 1
= + − ·
5 6 5 6
1 1 1
= + −
5 6 30
6+5−1 10
= =
30 30
= 0, 3333
ou pelo diagrama de Venn

Ω
1 1 2
A 6 30 15 B
2
3
1 1 2
P [A ∪ B] = + +
6 30 15
= 0, 1667 + 0, 0333 + 0, 1333
= 0, 3333.
140
18) Um réu foi a julgamento acusado de homicídio. Numa tentativa de inocentar seu cliente o advo-
gado de defesa alega que ele é esquizofrênico e, portanto, deve ser tratado e não preso. O advogado
se baseia no resultado do exame de tomografia computadorizada (CAT) do réu que acusou atrofia
cerebral. Um neurologista especialista em exames CAT informa que 30% dos esquizofrênicos são
diagnosticados com atrofia cerebral enquanto que somente 2% dos indivíduos normais recebem o
mesmo diagnóstico. Se 1,5% da população são esquizofrênicos, calcule a probabilidade condicional
do réu ser um esquizofrênico, dado que seu exame CAT revelou atrofia cerebral.
Sejam A:“o indivíduo é esquizofrênico” e, B:“o exame detectou atrofia cerebral”. Temos que
P [A] = 0, 015, P [Ac ] = 0, 985 P [B | A] = 0, 3

P [B c | A] = 0, 7, P [B | Ac ] = 0, 02 P [B c | Ac ] = 0, 98
B
0,3
P [A ∩ B] 0,015
0,7
P [A|B] = Bc
P [B]
P [B|A] P [A]
=
P [B|A] P [A] + P [B|Ac ] P [Ac ] •
0, 3 · 0, 015 0, 0045
= =
0, 3 · 0, 015 + 0, 02 · 0, 985 0, 0242 B
0,985
= 0, 186 0,02
Ac
0,98
Bc
141
19) Em uma grande empresa 60% do total de funcionários são homens. Sabe-se também que 10% dos
homens e 25% das mulheres, trabalham no setor de recursos humanos dessa empresa. Pede-se: Se
aleatoriamente for selecionado um funcionário do setor de recursos humanos, qual é a probabilidade
condicional de que seja uma mulher?
Sejam A:“o indivíduo é do sexo feminino” e, B:“o indivíduo trabalha no setor de recursos humanos
da empresa”. Temos que
P [A] = 0, 4, P [Ac ] = 0, 6 P [B | A] = 0, 25
P [B c | A] = 0, 75, P [B | Ac ] = 0, 1 P [B c | Ac ] = 0, 9
B
0,25
P [A ∩ B] 0,4
0,75
P [A|B] = Bc
P [B]
P [B|A] P [A]
=
P [B|A] P [A] + P [B|Ac ] P [Ac ] •
0, 25 · 0, 4 0, 1
= =
0, 25 · 0, 4 + 0, 1 · 0, 6 0, 16 B
0,6
= 0, 625 0,1
Ac
0,9
Bc
142
20) Numa espécie de inseto sabe-se que a população é formada por 70% de fêmeas e 30% de machos.
Sabe-se também que 90% das fêmeas e 60% dos machos são estéreis. Calcule a probabilidade de se
amostrar aleatoriamente um inseto não estéril dessa espécie.
Sejam A:“o inseto é fêmea” e, B:“o inseto é estéril”. Temos que
P [A] = 0, 7, P [Ac ] = 0, 3 P [B | A] = 0, 9
P [B c | A] = 0, 1, P [B | Ac ] = 0, 6 P [B c | Ac ] = 0, 4
B
0,9
0,1
0,7
P [B ] = P [B |A] P [A] + P [B |A ] P [A ]
c c c c c
Bc
= 0, 1 · 0, 7 + 0, 4 · 0, 3 = 0, 07 + 0, 12
•
= 0, 19
0,3
B
0,6
Ac
0,4
Bc
143
21) Uma indústria inspeciona os itens que fabrica por amostragem, antes de serem enviados aos
compradores. Observações anteriores demonstraram que 8% dos itens inspecionados apresentam
defeito do tipo A, 6% apresentam defeito do tipo B, e 4% apresentam defeito do tipo C. Somente
um defeito pode ocorrer em cada item. Érica seleciona aleatoriamente, um item de um lote a ser
entregue amanhã. Determine a probabilidade de esse item apresentar pelo menos um desses três
defeitos.
Sejam
• A : “o item apresenta defeito do tipo A”;
• B : “o item apresenta defeito do tipo B”;
• C : “o item apresenta defeito do tipo C”.
Como somente um defeito pode ocorrer em cada item, temos que A ∩ B = ∅, A ∩ C = ∅, B ∩ C = ∅,

A ∩ B ∩ C = ∅, além disso, um defeito ocorrerá se A ∪ B ∪ C ocorrer, assim
P [A ∪ B ∪ C] = P [A] + P [B] + P [C] − P [A ∩ B]
− P [A ∩ C] − P [B ∩ C] + P [A ∩ B ∩ C]
= P [A] + P [B] + P [C] − P [∅] − P [∅] − P [∅] + P [∅]
= 0, 08 + 0, 06 + 0, 04 − 0 − 0 − 0 + 0
= 0, 18
144
22) A probabilidade de a cadela Nana ganhar massa na próxima semana é de 0,1, e a probabilidade
de sua massa manter-se inalterada é 0,83. Determine a probabilidade de a massa de Nana diminuir
na próxima semana.
Sejam
• A : “a massa aumentará na próxima semana”;
• B : “a massa se manterá na próxima semana”;
• C : “a massa diminuirá na próxima semana”.
Note que uma, e apenas uma, das três possibilidades ocorrerá, ou seja, A ∩ B = ∅, A ∩ C = ∅,
B ∩ C = ∅, A ∩ B ∩ C = ∅. Além disso,P [A ∪ B ∪ C] = P [Ω] = 1, logo
1 = P [A ∪ B ∪ C] = P [A] + P [B] + P [C] − P [A ∩ B]
− P [A ∩ C] − P [B ∩ C] + P [A ∩ B ∩ C]
= P [A] + P [B] + P [C] − P [∅] − P [∅] − P [∅] + P [∅]
= 0, 1 + 0, 83 + P [C] = 0, 93 + P [C] ,
dessa maneira P [C] + 0, 93 = 1 e finalmente temos que P [C] = 1 − 0, 93 = 0, 07.
Ou por diagrama de Venn
A B
0,1 0,83
0,07
C Ω
Assim
P [C] = 0, 07.
145
23) A probabilidade de sobrevivência nos próximos 30 anos de Nádia é de 0,9 e de seu marido é de
0,8. [A sobrevivência de um não depende da sobrevivência do outro]. Determine a probabilidade de
nenhum dos dois sobreviver aos próximos 30 anos.
Sejam
• A : “Nádia sobrevive aos próximos 30 anos”;
• B : “o marido de Nádia sobrevive aos próximos 30 anos”.
Sabemos que P [A] = 0, 9, P [B] = 0, 8 e queremos determinar P [(A ∪ B)c ].
Como a sobrevivência de um não depende da sobrevivência do outro temos que
P [A ∩ B] = P [A] P [B] = 0, 9 · 0, 8 = 0, 72.
Assim
P [Ac ∩ B c ] = P [(A ∪ B)c ] = 1 − P [A ∪ B]
= 1 − (P [A] + P [B] − P [A ∩ B])
= 1 − (0, 9 + 0, 8 − 0, 72) = 1 − 0, 98
= 0, 02.
A 0, 18 0, 72 0, 08 B
0, 02
Assim
P [Ac ∩ B c ] = 0, 02.
146
24) Dentre 20 garotas em uma sala de aula, 8 têm olhos azuis. Marcelo escolhe três garotas, simulta-
neamente, ao acaso. Determine a probabilidade de que duas delas possuam olhos azuis [a outra não
têm olhos azuis].
• A1 : “a primeira garota tem olhos azuis”;
• A2 : “a segunda garota tem olhos azuis”;
• A3 : “a terceira garota tem olhos azuis”;
• A : “exatamente duas das três têm olhos azuis”;
então
6
18
A3
7
19
A2 12
Ac3
18
A1 7
18
A3
8
20 12
19 Ac2 11
Ac3
18
•
7
18
12
8
19
A2 A3
20
11
Ac1 18 Ac3
8
11 18
19 Ac2 A3
10
18 Ac3
e
A = (A1 ∩ A2 ∩ Ac3 ) ∪ (A1 ∩ Ac2 ∩ A3 ) ∪ (Ac1 ∩ A2 ∩ A3 )
então
P [A] = P [A1 ∩ A2 ∩ Ac3 ] + P [A1 ∩ Ac2 ∩ A3 ] + P [Ac1 ∩ A2 ∩ A3 ]

8 7 12 8 12 7 12 8 7
= · · + · · + · ·
20 19 18 20 19 18 20 19 18
672 672 672 2016
= + + =
6840 6840 6840 6840
28
=
95
147
25) Uma urna contém seis cartões numerados de 1 a 6. Esther retira dois cartões ao acaso dessa urna.
Determine a probabilidade de que a soma dos números dos dois cartões seja par, sabendo que um
dos cartões está numerado com o número 4.
Determinemos primeiramente o espaço amostral, para isso consideremos a tabela auxiliar que se
segue.
H C2
HH
1 2 3 4 5 6
C1 HHH
1 −−− (1, 2) (1, 3) (1, 4) (1, 5) (1, 6)
2 (2, 1) −−− (2, 3) (2, 4) (2, 5) (2, 6)
3 (3, 1) (3, 2) −−− (3, 4) (3, 5) (3, 6)
4 (4, 1) (4, 2) (4, 3) −−− (4, 5) (4, 6)
5 (5, 1) (5, 2) (5, 3) (5, 4) −−− (5, 6)
6 (6, 1) (6, 2) (6, 3) (6, 4) (6, 5) −−−
Note que Ω = {(1, 2), (1, 3), · · · , (6, 5)} constituído de n = 30 pontos amostrais.
Sejam A : “a soma dos números mostrados é par” e B : “um dos cartões está numerado com o número
4”. Queremos determinar P [A | B].
Como
A = {(1, 3), (1, 5), (2, 4), (2, 6), (3, 1), (3, 5), (4, 2), (4, 6), (5, 1), (5, 3), (6, 2), (6, 4)}
B = {(1, 4), (2, 4), (3, 4), (5, 4), (6, 4), (4, 1), (4, 2), (4, 3), (4, 5), (4, 6)}
e
A ∩ B = {(2, 4), (4, 2), (4, 6), (6, 4)} ,
temos que n (A) = 12, n (B) = 10 e n (A ∩ B) = 4, donde
n(A ∩ B) 4
P [A ∩ B] = = ,
n 30
n(B) 10
P [B] = = ,
n 30
dessa maneira
4
4 30 120 2
P [A | B] = 30
= · = = .
10
30
30 10 300 5
148
26) Comparando o resultado de dois experimentos, E1 : “lançar dois dados de seis faces não-viciados
e anotar a soma das faces superiores” e E2 : “lançar um dado não viciado de 12 faces e anotar a face
superior, em qual existe a maior probabilidade de um resultado igual a 4”.
Ao lançarmos dois dados não viciados, obtemos o seguinte espaço amostral
HH D2
H
1 2 3 4 5 6
D1 HHH
1 (1, 1) (1, 2) (1, 3) (1, 4) (1, 5) (1, 6)
2 (2, 1) (2, 2) (2, 3) (2, 4) (2, 5) (2, 6)
3 (3, 1) (3, 2) (3, 3) (3, 4) (3, 5) (3, 6)
4 (4, 1) (4, 2) (4, 3) (4, 4) (4, 5) (4, 6)
5 (5, 1) (5, 2) (5, 3) (5, 4) (5, 5) (5, 6)
6 (6, 1) (6, 2) (6, 3) (6, 4) (6, 5) (6, 6)
Note que Ω1 = {(1, 1), (1, 2), · · · , (6, 6)} constituído de n1 = 36 pontos amostrais.
As somas das faces são dadas na tabela abaixo

HH
E2
H 1 2 3 4 5 6
E1 HH
H
1 2 3 4 5 6 7
2 3 4 5 6 7 8
3 4 5 6 7 8 9
4 5 6 7 8 9 10
5 6 7 8 9 10 11
6 7 8 9 10 11 12
e note que se A : “soma das faces voltadas para cima é quatro”, então A = {(1, 3), (2, 2), (3, 1)} e
n(A) = 4, dessa forma
n(A) 4 1
P [A] = = = .
n1 36 9
No segundo experimento temos que Ω2 = {1, 2, · · · , 12} constituído de n2 = 12 pontos amostrais e

se B : “a face voltada para cima é quatro”, então B = {4} e n(B) = 1, dessa forma
n(B) 1
P [B] = = .
n2 12
Como 1
9
= 0, 1111 > 0, 0833 = 1
12
, a probabilidade de que a soma de dois dados de seis faces resulte
em quatro é maior que a probabilidade de que observe-se o número quatro ao lançarmos um dado
não viciado de 12 faces.
149
27) Francisca realizou uma pesquisa com 680 eleitores, de várias categorias econômicas, a respeito do
seu candidato de preferência. Parte dessa pesquisa revela que
• 102 dos eleitores são da classe A;
• 136 votarão no candidato B;
• 68 são da classe A e votarão no candidato B.
Francisca seleciona uma pessoa aleatoriamente. Determine a probabilidade de que essa pessoa não
ser da classe A e votar no candidato B.
Sejam
• A : “o eleitor é da classe A”;
• B : “o eleitor votará no candidato B”.
Queremos determinar P [Ac ∩ B]. Sabemos que
P [Ac ∩ B] = P [B] − P [A ∩ B] ,
além disso,
n(B) 136
P [B] = = = 0, 2
n 680
n (A ∩ B) 68
P [A ∩ B] = = = 0, 1
n 680
logo
P [Ac ∩ B] = 0, 2 − 0, 1 = 0, 1.
A 0, 1 0, 1 B
150
28) Em um estudo das necessidades futuras do bairro em que pretende residir, Joana determina dois
eventos fundamentais: A : “haverá investimento público suficiente para evitar enchentes” e B :
“haverá investimento suficiente para a conservação das vias públicas”. Ela estima que P [A ∩ B c ] =
0, 17; P [Ac ∩ B] = 0, 23; P [Ac ∩ B c ] = 0, 07. Determine a probabilidade de “haver investimento
público suficiente para evitar enchentes e também haver investimento suficiente para a conservação
das vias públicas”.
Queremos determinar P [A ∩ B].
1 = P [Ω] = P [A ∩ B] + P [Ac ∩ B] + P [A ∩ B c ] + P [Ac ∩ B c ]
= P [A ∩ B] + 0, 23 + 0, 17 + 0, 07
= P [A ∩ B] + 0, 47,
logo
P [A ∩ B] = 1 − 0, 47 = 0, 53.
A 0, 17 0, 53 0, 23 B
0, 07
151
29) Dentre os 120 alunos que participam da Semana Acadêmica do curso de Ciências Sociais, 40 alunos
presentes se interessam pelo tema “Políticas Públicas e Educação”. Martha seleciona ao acaso três
alunos um após o outro, sem reposição, para participarem de uma ONG que se dedica a melhorar a
educação no país. Determine a probabilidade de o primeiro e o segundo alunos, selecionados, serem
interessados pelo tema “Políticas Públicas e Educação”, e o terceiro aluno não ser interessado nesse
tema.
• A1 : “o primeiro aluno se interessa pelo tema Políticas Públicas e Educação”;
• A2 : “o segundo aluno se interessa pelo tema Políticas Públicas e Educação”;
• A3 : “o terceiro aluno se interessa pelo tema Políticas Públicas e Educação”;
• A : “o primeiro e o segundo alunos, selecionados, serem interessados pelo tema “Políticas Pú-
blicas e Educação”, e o terceiro aluno não ser interessado nesse tema”;
então
38
118
A3
39
119
A2 80
Ac3
118
A1 39
118
A3
40
120 80
119 Ac2 79
Ac3
118
•
39
118
80
40
119
A2 A3
120
79
Ac1 118 Ac3
40
79 118
119 Ac2 A3
78
118 Ac3
e
A = A1 ∩ A2 ∩ Ac3
então
P [A] = P [A1 ∩ A2 ∩ Ac3 ]

40 39 80 124800
= · · =
120 119 118 1685040
520
=
7021
152
30) Márcio realizou uma pesquisa sobre os fatores considerados necessários para se ter qualidade de
vida, com 500 indivíduos [metade com mais de 60 anos e metade com idade de 25 a 60 anos]. Ele
encontrou:
• Dentre os indivíduos com mais de 60 anos: 100 consideram a saúde e 150 consideram a atividade
física como o fator necessário para se ter qualidade de vida.
• Dentre os indivíduos com idade de 25 a 60 anos: 50 consideram a saúde e 200 consideram a

atividade física como o fator necessário para se ter qualidade de vida.
Márcio seleciona um desses indivíduos aleatoriamente. Determine a probabilidade de que esse indi-
víduo tenha considerado saúde como fator necessário para se ter qualidade de vida.
Sejam A:“o indivíduo tem mais de 60 anos” e, B:“o indivíduo considera saúde como o fator necessário
para se ter qualidade de vida”. Queremos determinar P [B], assim
P [A] = 250
500
= 0, 5, P [Ac ] = 1 − P [A] = 1 − 250
500
= 0, 5,
P [B | A] = 100
250
= 0, 4, P [B c | A] = 1 − P [B | A] = 0, 6,
P [B | Ac ] = 50
250
= 0, 2, P [B c | Ac ] = 1 − P [B | Ac ] = 0, 8.
B
0,4
0,6
0,5
P [B] = P [B|A] P [A] + P [B|A ] P [A ] c c
Bc
= 0, 4 · 0, 5 + 0, 2 · 0, 5
•
= 0, 3
0,5
B
0,2
Ac
0,8
Bc
153
31) Luana tem dois fisioterapeutas empregados no Studio Pilates. Os atendimentos são divididos
da seguinte maneira: o fisioterapeuta A atende 20% dos pacientes, o fisioterapeuta B atende 30%,
enquanto ela atende os demais (50%) pacientes. A metade dos pacientes do fisioterapeuta A é de
convênios de saúde; um terço dos pacientes do fisioterapeuta B é de convênios de saúde; e também
a metade dos pacientes da Luana é de convênios de saúde. Um paciente é selecionado ao acaso.
Determine a probabilidade de ele ser de convênios de saúde.
Sejam
• A : “o fisioterapeuta A atende os pacientes”;
• B : “o fisioterapeuta B atende os pacientes”;
• C : “Lilian atende os pacientes”;
• D : “o paciente é de convênios de saúde”.

Dc
Temos que 0,5
A
0,5
P [A] = 0, 2, P [D|A] = 0, 5, 0,2
D
0,6667 Dc
P [B] = 0, 3, P [D|B] = 1
= 0, 3333, • 0,3
B
3
0,3333
D
0,5
P [C] = 0, 5, P [D|C] = 0, 5. 0,5 Dc
C
0,5
D
Queremos determinar P [D],
P [D] = P [D|A] P [A] + P [D|B] P [B] + P [D|C] P [C]
= 0, 5 × 0, 2 + 0, 3333 × 0, 3 + 0, 5 × 0, 5
= 0, 1 + 0, 1 + 0, 25
= 0, 45.
Dessa forma, a probabilidade de que o paciente seja de convênios da saúde é 0,45.

154
32) Uma pesquisa realizada junto a 450 médicos veterinários mostrou que: 220 desses profissionais
gostam de tomar decisões financeiras, 190 estão dispostos a assumir riscos sérios, e 110 gostam
de tomar decisões financeiras e estão dispostos a assumir riscos sérios. Um médico veterinário é
selecionado ao acaso. Determine a probabilidade de ele estar disposto a assumir riscos, sabendo que
ele gosta de tomar decisões financeiras.
Sejam
• A : “o médico veterinário gosta de tomar decisões financeiras”;
• B : “o médico veterinário está disposto a assumir riscos sérios”.
Queremos determinar P [B | A]. Temos que

n = 450, n (A) = 220, n (B) = 190,
n (A ∩ B) = 110, P [A] = 220

450
= 0, 4889, P [B] = 190
450
= 0, 4222,
P [A ∩ B] = n(A∩B)
n
= 110
450
= 0, 2444.
Note que
P [Ac ∩ B] = P [B] − P [A ∩ B] = 0, 4222 − 0, 2444 = 0, 1778
P [A ∩ B c ] = P [A] − P [A ∩ B] = 0, 4889 − 0, 2444 = 0, 2444
P [Ac ∩ B c ] = 1 − (P [A] + P [B] − P [A ∩ B]) = 1 − (0, 4889 + 0, 4222 − 0, 2444) = 1 − 0, 6667
= 0, 3333
A 0, 2444 0, 2444 0, 1778 B
0, 3333
P [A ∩ B] 0, 2444
P [B | A] = =
P [A] 0, 4889
= 0, 5.
155
33) Uma pesquisa realizada entre 100 consumidores registrou que:
• 20 deles trabalham somente com cartões de crédito da bandeira MasterCard;
• 30 deles trabalham somente com cartões de crédito da bandeira VISA;
• 40 deles trabalham com cartões de crédito de ambas as bandeiras.
Um consumidor é escolhido ao acaso desse grupo. Determine a probabilidade de esse consumidor

não trabalhar com cartões de crédito dessas duas bandeiras.
Sejam
• A : “o consumidor trabalha com cartões de crédito da bandeira MasterCard”;
• B : “o consumidor trabalha com cartões de crédito da bandeira VISA”.
Queremos determinar P [Ac ∩ B c ]. Temos que
n = 100, n (A ∩ B c ) = 20, n (Ac ∩ B) = 30, n (A ∩ B) = 40,
P [A ∩ B c ] = 20
100
= 0, 2, P [Ac ∩ B] = 30
100
= 0, 3, P [A ∩ B] = n(A∩B)
n
= 40
100
= 0, 4.
Como A = (A ∩ B) ∪ (A ∩ B c ) e B = (A ∩ B) ∪ (Ac ∩ B) temos que
n (A) = n (A ∩ B) + n (A ∩ B c ) = 40 + 20 = 60,
n (B) = n (A ∩ B) + n (Ac ∩ B) = 40 + 30 = 70,
logo P [A] = n(A)

n
= 60
100
= 0, 6 e P [B] = n(B)
n
= 70
100
= 0, 7. Assim
P [Ac ∩ B c ] = 1 − (P [A] + P [B] − P [A ∩ B]) = 1 − (0, 6 + 0, 7 − 0, 4) = 1 − 0, 9
= 0, 1
A 0, 2 0, 4 0, 3 B
0, 1
156
34) Em um dos hospitais da cidade de Vila Viçosa em Portugal, 10% dos pacientes são portadores
do vírus H1N1 [e os demais 90% não são portadoras do vírus]. Suponha que exista um teste para
detectar o vírus H1N1 com a seguinte propriedade: 75% das pessoas portadoras do vírus e 5% das
pessoas que não são portadoras do vírus reagem positivamente ao teste. Um paciente desse hospital
é escolhido aleatoriamente. Determine a probabilidade de esse paciente não seja portador do vírus
H1N1, sabendo que ele reagiu positivamente ao teste.
Sejam A:“o paciente é portador do vírus H1N1” e, B:“o teste detecta o vírus H1N1”. Queremos
determinar P [Ac |B], assim
P [A] = 0, 1, P [Ac ] = 1 − P [A] = 0, 9,
P [B | A] = 0, 75, P [B c | A] = 1 − P [B | A] = 0, 25,
P [B | Ac ] = 0, 05, P [B c | Ac ] = 1 − P [B | Ac ] = 0, 95.
B
0,75
P [Ac ∩ B] 0,1
0,25
P [Ac |B] = Bc
P [B]
P [B|Ac ] P [Ac ]
=
P [B|A] P [A] + P [B|Ac ] P [Ac ] •
0, 05 · 0, 9 0, 045
= =
0, 75 · 0, 1 + 0, 05 · 0, 9 0, 12 B
0,9
= 0, 375 0,05
Ac
0,95
Bc
157
35) Um quartel possui dois tipos de fuzis, os da classe I e os da classe II. Os fuzis da classe I são
modernos e possuem mira melhor, acertando o alvo em 91% das vezes em que se atira com ele. Os
fuzis da classe II são mais antigos e possuem mira pior, acertando o alvo em apenas 55% das vezes
em que se atira com ele. Entretanto, o fuzil II é bem mais barato e 75% dos fuzis do quartel são dessa
classe, enquanto que apenas 25% são da classe I. O soldado João pegou um fuzil, atirou e acertou o
alvo. Determine a probabilidade condicional de que ele tenha utilizado um fuzil da classe I.
Sejam A:“o fuzil é da classe I” e, B:“acerta-se o alvo”. Temos que
P [A] = 0, 25, P [Ac ] = 0, 75 P [B | A] = 0, 91

P [B c | A] = 0, 09, P [B | Ac ] = 0, 55 P [B c | Ac ] = 0, 45
B
0,91
P [A ∩ B] 0,25
0,09
P [A|B] = Bc
P [B]
P [B|A] P [A]
=
P [B|A] P [A] + P [B|Ac ] P [Ac ] •
0, 91 · 0, 25 0, 2275
= =
0, 91 · 0, 25 + 0, 55 · 0, 75 0, 64 B
0,75
= 0, 3555 0,55
Ac
0,45
Bc
158
36) Um piloto de Fórmula um (F1) tem 50% de probabilidade de vencer determinada corrida, quando
essa se realiza sob chuva. Caso não chova durante a corrida, sua probabilidade de vitória é de 25%.
Se o serviço de meteorologia estimar em 30% a probabilidade de que chova durante a corrida, qual
é a probabilidade de que esse piloto ganhe a corrida?
Sejam A:“a corrida é realizada sob chuva” e, B:“o piloto vence a corrida”. Queremos determinar
P [B] e temos que
P [A] = 0, 3, P [Ac ] = 0, 7 P [B | A] = 0, 5
P [B c | A] = 0, 5, P [B | Ac ] = 0, 25 P [B c | Ac ] = 0, 75
B
0,5
0,5
0,3
P [B] = P [B|A] P [A] + P [B|Ac ] P [Ac ] Bc
= 0, 5 · 0, 3 + 0, 25 · 0, 7
•
= 0, 325
0,7
B
0,25
Ac
0,75
Bc
159
37) Uma disciplina é constituída de duas turmas, sendo que 39% dos alunos são da turma 01 e os
restantes da turma 02. As turmas são constituídas de alunos de Medicina Veterinária, Geografia,
Ciências Sociais e Economia Doméstica, sendo assim distribuídas:
Turma 01 Turma 02
Ciências Sociais 14% 43%
Economia Doméstica 12% 22%
Geografia 23% 5%
Medicina Veterinária 51% 30%
a) Um aluno de Ciências Sociais é selecionado, determine a probabilidade de que ele seja da Turma
02.
b) Um aluno é selecionado aleatoriamente, determine a probabilidade de que ele curse Economia

Doméstica ou Ciências Sociais.
c) Um aluno da Medicina Veterinária é selecionado, determine a probabilidade de que ele seja da

Turma 01.
Sejam
• A : “o aluno é da turma 01”;
• C : “O aluno cursa Ciências Sociais”;
• E : “o aluno cursa Economia Doméstica”;
• G : “o aluno cursa Geografia”;
• M : “o aluno cursa Medicina Veterinária”.
Temos que
P [A] = 0, 39; P [C|A] = 0, 14; P [E|A] = 0, 12;
P [G|A] = 0, 23; P [M |A] = 0, 51; P [C|Ac ] = 0, 43;
P [E|Ac ] = 0, 22; P [G|Ac ] = 0, 05; P [M |Ac ] = 0, 3.
Essas probabilidades nos permitem montar o seguinte diagrama de árvores:

160
0,14 E
0,12
A 0,23 G
0,51
0,39 M
•
0,61 C
0,43
Ac 0,22 E
0,05
0,3 G
Em a) queremos determinar P [Ac |C].
P [Ac ∩ C] P [C|Ac ] P [Ac ]

P [A |C] =
c
=
P [C] P [C|A] P [A] + P [C|Ac ] P [Ac ]
0, 43 × 0, 61
=
0, 14 × 0, 39 + 0, 43 × 0, 61
0, 2623 0, 2623
= =
0, 0546 + 0, 2623 0, 3169
= 0, 8277
Em b) queremos determinar P [E ∪ C]. Sabemos que
P [E ∪ C] = P [E] + P [C] − P [E ∩ C] ,
e como E ∩ C = ∅, pois não há alunos cursando os dois cursos simultaneamente, temos
P [E ∪ C] = P [E] + P [C] , (1)
além disso,
P [E] = P [E ∩ A] + P [E ∩ Ac ] = P [E|A] P [A] + P [E|Ac ] P [E|Ac ]
= 0, 12 × 0, 39 + 0, 22 × 0, 61
= 0, 181 (2)
161
P [C] = P [C ∩ A] + P [C ∩ Ac ] = P [C|A] P [A] + P [C|Ac ] P [C|Ac ]
= 0, 14 × 0, 39 + 0, 43 × 0, 61
= 0, 3169 (3)
Substituindo (2) e (3) em (1), temos:
P [E ∪ C] = 0, 181 + 0, 3169 = 0, 4979.
Dessa maneira, a probabilidade de que ele curse economia doméstica ou ciências sociais é 0,4979.
Em c) queremos determinar P [A|M ].
P [A ∩ M ] P [M |A] P [A]
P [A|M ] = =
P [M ] P [M |A] P [A] + P [M |Ac ] P [Ac ]
0, 51 × 0, 39
=
0, 51 × 0, 39 + 0, 3 × 0, 61
0, 1989 0, 1989
= =
0, 1989 + 0, 183 0, 3819
= 0, 5208
162
38) Considere o experimento aleatório E: “lançar um dado não viciado uma vez e observar a face
superior” e os eventos:
A = “sair uma face par”; D = “não sair uma face superior a 2”;
B = “sair uma face maior que dois”; F = “sair uma face superior a 6”.
C = “sair uma face que é um número primo”;
Pode-se afirmar que:
a) P [F ] = 1; d) A e D são independentes;
4
b) A e D são mutuamente exclusivos; e) P [C] = ;
6
c) B e C são mutuamente exclusivos; f) n.d.r.a.
Temos que
Ω = {1, 2, 3, 4, 5, 6} e n (Ω) = B = {3, 4, 5, 6} e n (B) = 4; D = {1, 2} e n (D) = 2;

n = 6; F = {} = ∅ e n (F ) = 0;
A = {2, 4, 6} e n (A) = 3; C = {2, 3, 5} e n (C) = 3;
logo
P [A] = 36 ; P [C] = 36 ; P [F ] = 0
6
= 0.
P [B] = 64 ; P [D] = 62 ;
Desse modo
a) Falso. P [F ] = 0;
b) Verdadeiro. P [A ∩ D] = 1
6
= 3
6
· 2
6
= P [A] · P [D], logo A e D são independentes;
c) Falso. A ∩ D = {2} =
6 ∅, logo A e D não são mutuamente exclusivos;
d) Falso. B ∩ C = {3, 5} =
6 ∅, logo B e C não são mutuamente exclusivos;
3
e) Falso. P [C] = ;
6
f) Falso. d) é verdadeira.
163
39) Sejam A e B dois eventos em Ω. Marque V se a assertiva for verdadeira e F caso contrário e
justifique sua resposta.
a) Se A e B são independentes e P [A] > 0, então P [B | A] = P [B];
b) Se A e B são mutuamente exclusivos, então P [A ∩ B] = 0;
c) P [A ∩ B] ≤ P [A];
d) Se P [A] ≤ P [B] então A ⊂ B;
e) 0 ≤ P [A ∪ B] ≤ 1;
a) Verdadeiro. Essa é exatamente a definição de independência
b) Verdadeiro. Se A e B são mutuamente exclusivos, então A ∩ B = ∅, logo P [A ∩ B] = P [∅] = 0;
c) Verdadeiro. Pelo fato de que A ∩ B ⊂ A, temos que P [A ∩ B] ≤ P [A];
d) Falso. Considere o experimento aleatório E: “lançar um dado uma vez e observar a face superior”
e os eventos:
• A : “não sair uma face superior a 2”;
• B : “sair uma face par”.
Note que P [A] = 2

6
e P [B] = 36 . Assim P [A] ≤ P [B], mas {1, 2} = A 6⊂ B = {2, 4, 6} ;
e) Verdadeiro. Sabemos que a probabilidade de qualquer evento é sempre um número de zero a um,
assim 0 ≤ P [A ∪ B] ≤ 1.
164
40) Uma pesquisa ouviu 10000 habitantes de uma cidade e, verificou que 4087 aprovam as medidas
adotadas pelo vereador A e 3076 aprovam as medidas tomadas pelo vereador B, sendo que 1024 apro-
varam as medidas tomadas por ambos. Selecionado um habitante qualquer dessa cidade, determine:
a) Qual a probabilidade de que ele aprove as medidas tomadas apenas por um vereador? (somente
de A ou somente de B).
Sejam
• A : “o habitante aprova as medidas tomadas pelo vereador A”;
• B : “o habitante aprova as medidas tomadas pelo vereador B”.
Temos que
4087 3076 1024
P [A] = = 0, 4087, P [B] = = 0, 3076 e P [A ∩ B] = = 0, 1024.
10000 10000 10000
P [(A ∩ B c ) ∪ (Ac ∩ B)] = P [A ∩ B c ] + P [Ac ∩ B] − P [(A ∩ B c ) ∩ (Ac ∩ B)]
= P [A] − P [A ∩ B] + P [B] − P [A ∩ B] − 0
= P [A] + P [B] − 2P [A ∩ B]
= 0, 4087 + 0, 3076 − 2 · 0, 1024
= 0, 5115

Ω
A 0, 3063 0, 1024 0, 2052 B
0, 3861
P [(A ∩ B c ) ∪ (Ac ∩ B)] = 0, 3063 + 0, 2052 = 0, 5115
b) Qual a probabilidade de que ele não aprove as medidas tomadas por nenhum dos vereadores?
165
P [Ac ∩ B c ] = P [(A ∪ B)c ] = 1 − P [A ∪ B]
= 1 − (P [A] + P [B] − P [A ∩ B])
= 1 − (0, 4087 + 0, 3076 − 0, 1024)
= 1 − 0, 6139 = 0, 3861
ou
A B
0, 3063 0, 1024 0, 2052
0, 3861
Assim
P [Ac ∩ B c ] = 0, 3861
166
41) Os eventos a seguir representam os principais defeitos causadores de problemas em computadores:

A = {Aquecimento}, M = {Mau-contato em componentes eletrônicos} e V = {Vírus}. Em uma
empresa de manutenção foi verificado que esses defeitos aparecem com as seguintes probabilidades:
P [A] = 12%, P [M ] = 18% e P [V ] = 30%. Admita que esses eventos são mutuamente independentes
e determine a probabilidade de que um computador selecionado aleatoriamente apresente apenas os
defeitos M e V e não apresente o defeito A.
P [M ∩ V ∩ Ac ] = P [M ] P [V ] P [Ac ] = 0, 12 · 0, 18 · 0, 3 = 0, 0065.
Ou por diagrama de Venn
A M
0,0151
0,0689 0,1109
0,0065
0,0295 0,0475
0,2165
0,5051
V Ω
Assim
P [M ∩ V ∩ Ac ] = 0, 0475.
167
42) Uma pesquisa política social constatou que em certa localidade o percentual de eleitores que se
declaram independentes, liberais e conservadores é de 46%, 30% e 24%, respectivamente. Admita
que 35% dos eleitores independentes, 62% dos eleitores liberais e 58% dos eleitores conservadores
votaram na última eleição. Se um eleitor for escolhido aleatoriamente, dado que ele votou na última
eleição, qual a probabilidade condicional de que ele se declare liberal?
Sejam
• I: “eleitores que se declaram independentes”;
• L: “eleitores que se declaram liberais”;
• C: “eleitores que se declaram conservadores”;
• V : “eleitor votou na última eleição”.
Temos que
P [I] = 0, 46 P [L] = 0, 3 P [C] = 0, 24

P [V | I] = 0, 35 P [V | L] = 0, 62 P [V | C] = 0, 58
P [L ∩ V ] 0, 62 · 0, 3 0, 186
P [L | V ] = = =
P [V ] 0, 35 · 0, 46 + 0, 62 · 0, 3 + 0, 58 · 0, 24 0, 4862
= 0, 3826.
V
0,35
I
0,65
Vc
0,46
V
0,62
• 0,3
L
0,38
Vc
0,24
V
0,58
C
0,42
Vc
168
43) Sejam os eventos C = {o time do São Paulo é rebaixado para a série B do Campeonato Brasileiro}
e V = {o time do Vasco é novamente rebaixado para a série B do Campeonato Brasileiro}, tal que
P [C] = 0, 49 e P [V ] = 0, 67. Admita também que esses dois times podem ser rebaixados juntos
nesse mesmo ano, com probabilidade de 0,33. Determine a probabilidade de:
a) Pelo menos um desses dois times ser rebaixado.
Sejam
• C : “o time do São Paulo é rebaixado para a série B do Campeonato Brasileiro”;
• V : “o time do Vasco é novamente rebaixado para a série B do Campeonato Brasileiro”.
Temos que
P [C] = 0, 49, P [V ] = 0, 67 e P [C ∩ V ] = 0, 33.
P [C ∪ V ] = P [C] + P [V ] − P [C ∩ V ]
= 0, 49 + 0, 67 − 0, 33
= 0, 83,

Ω
C 0, 16 0, 33 0, 34 V
0, 17
P [C ∪ V ] = 0, 16 + 0, 33 + 0, 34
= 0, 83.
b) Exatamente um dos dois times ser rebaixado.

169
P [(C ∩ V c ) ∪ (C c ∩ V )] = P [C ∩ V c ] + P [C c ∩ V ] − P [(C ∩ V c ) ∩ (C c ∩ V )]
= P [C] − P [C ∩ V ] + P [V ] − P [C ∩ V ] − 0
= P [C] + P [V ] − 2P [C ∩ V ]
= 0, 49 + 0, 67 − 2 · 0, 33
= 0, 5

Ω
C 0, 16 0, 33 0, 34 V
0, 17
P [(C ∩ V c ) ∪ (C c ∩ V )] = 0, 16 + 0, 34 = 0, 5
170
44) Um veículo pode ter problemas mecânicos ou elétricos. Se ele tiver problemas mecânicos, não para,
mas se tiver problemas elétricos para imediatamente. A probabilidade de o veículo ter problemas
mecânicos é 0,2. A probabilidade do mesmo veículo ter problemas elétricos é de 0,15 se não houve
problema mecânico precedente, e de 0,25 se houve problema mecânico precedente. Nesse sentido,
dado que o veículo parou em certo dia, qual a probabilidade de que tenha ocorrido defeito mecânico?
a) 0,05 d) 0,29
b) 0,63 e) 0,72
c) 0,13 f) n.d.r.a.
Sejam A : “O carro tem problemas mecânicos” e B : “o carro tem problemas elétricos”. Temos que
P [A] = 0, 2 P [B |A ] = 0, 25 P [B|Ac ] = 0, 15
P [Ac ] = 0, 8 P [B c |A ] = 0, 75 P [B c |A c ] = 0, 85
conforme mostrado no diagrama de árvore:
B
0,25
0,75
0,2
Bc
0,8
B
0,15
Ac
0,85
Bc
0, 25 × 0, 2 0, 05
P [A |B ] = = = 0, 29.
0, 25 × 0, 2 + 0, 15 × 0, 8 0, 17
Dessa forma a resposta correta é a letra d).

171
45) Um baralho comum contém 52 cartas, das quais 4 são ases, sendo um de cada naipe. Se são
retiradas aleatoriamente três cartas desse baralho, qual a probabilidade de saírem exatamente dois
ases se:
a) as retiradas forem feitas com reposição.
• A1 : “a primeira carta retirada é um ás”;
• A2 : “a segunda carta retirada é um ás”;
• A3 : “a terceira carta retirada é um ás”;
• A : “saem exatamente dois ases”;
então
4
52
A3
4
52
A2 48
Ac3
52
A1 4
52
A3
4
52 48
52 Ac2 48
Ac3
52
•
4
52
48
4
52
A2 A3
52
48
Ac1 52 Ac3
4
48 52
52 Ac2 A3
48
52 Ac3
e
A = (A1 ∩ A2 ∩ Ac3 ) ∪ (A1 ∩ Ac2 ∩ A3 ) ∪ (Ac1 ∩ A2 ∩ A3 )
então

4 4 48 4 48 4 48 4 4
= · · + · · + · ·
52 52 52 52 52 52 52 52 52
768 768 768 2304
= + + =
140608 140608 140608 140608
36
= = 0, 0164.
2197
b) as retiradas forem feitas sem reposição.

172
2
50
A3
3
51
A2 48
Ac3
50
A1 3
50
A3
4
52 48
51 Ac2 47
Ac3
50
•
3
50
48
4
51
A2 A3
52
47
Ac1 50 Ac3
4
47 50
51 Ac2 A3
46
50 Ac3
e
A = (A1 ∩ A2 ∩ Ac3 ) ∪ (A1 ∩ Ac2 ∩ A3 ) ∪ (Ac1 ∩ A2 ∩ A3 )
então

4 3 48 4 48 3 48 4 3
= · · + · · + · ·
52 51 50 52 51 50 52 51 50
576 576 576 1728
= + + =
132600 132600 132600 132600
72
= = 0, 013.
5525
173
CAPÍTULO VII
Distribuições de probabilidade
1) Se 20% dos parafusos produzidos por uma máquina são defeituosos, determinar a probabilidade
de, entre 4 parafusos escolhidos ao acaso, no máximo 2 deles serem defeituosos.
Seja X: “número de parafusos defeituosos produzidos entre 4 amostrados”, note que X é binomial-
mente distribuída, sendo que, X ∼ Bin (4; 0, 2). Desejamos determinar P [X ≤ 2].
Observemos que
P [X ≤ 2] = P [X = 0] + P [X = 1] + P [X = 2] ,
4
!
P [X = 0] = 0, 20 (1 − 0, 2)4−0 = 1 × 1 × 0, 4096 = 0, 4096;
0
4
!
P [X = 1] = 0, 21 (1 − 0, 2)4−1 = 4 × 0, 2 × 0, 512 = 0, 4096;
1
4
!
P [X = 2] = 0, 22 (1 − 0, 2)4−2 = 6 × 0, 04 × 0, 64 = 0, 1536.
2
Dessa forma,
P [X ≤ 2] = P [X = 0] + P [X = 1] + P [X = 2]
= 0, 4096 + 0, 4096 + 0, 1536
= 0, 9728.
174
2) Um fabricante garante que uma caixa de suas peças conterá no máximo 2 itens defeituosos. Se a
caixa contém 20 peças e a experiência tem demonstrado que esse processo de fabricação produz 2
por cento de itens defeituosos, qual a probabilidade de que uma caixa de suas peças não vá satisfazer
a garantia?
As peças do fabricante não satisfarão a garantia se o número de peças defeituosas na caixa for
superior a 2. Seja X: “número de peças defeituosos na caixa que contém 20 peças”, note que X é
binomialmente distribuída, sendo que, X ∼ Bin (20; 0, 02). Desejamos determinar P [X > 2].
Observemos que
P [X > 2] = 1 − P [X ≤ 2] = 1 − (P [X = 0] + P [X = 1] + P [X = 2]) ,
20
!
P [X = 0] = 0, 020 (1 − 0, 02)20−0 = 1 × 1 × 0, 6676 = 0, 6676;
0
20
!
P [X = 1] = 0, 021 (1 − 0, 02)20−1 = 20 × 0, 02 × 0, 6812 = 0, 2725;
1
20
!
P [X = 2] = 0, 022 (1 − 0, 02)20−2 = 190 × 0, 0004 × 0, 6951 = 0, 0528.
2
Dessa forma,
P [X > 2] = 1 − (P [X = 0] + P [X = 1] + P [X = 2])
= 1 − (0, 6676 + 0, 2725 + 0, 0528)
= 1 − 0, 9929 = 0, 0071.
175
3) Numa indústria ocorrem, em média, 2 acidentes por mês.
a) Qual a probabilidade de ocorrerem 2 acidentes no próximo mês?

Seja X: “número de acidentes em 1 mês”, note que, X ∼ Poi (2), pois ocorrem em média λ = 2
acidentes por mês. Desejamos determinar P [X = 2].
e−2 22 0, 1353 × 4
P [X = 2] = =
2! 2
= 0, 2707.
b) Qual a probabilidade de ocorrerem 10 acidentes nos próximos 3 meses?

Sejam Y : “número de acidentes em 3 meses”. Sabemos que o número médio de acidentes que ocorre
por mês é 2, donde podemos determinar o número médio de acidentes que ocorrem em 3 meses
através de uma regra de três, assim,
Meses Acidentes
1 2
3 λ
assim λ1 = 3×2
1
= 6 e Y ∼ Poi (6).
e−6 610 0, 0025 × 60466176

P [Y = 10] = =
10! 3628800
= 0, 0413.
176
4) Determine a probabilidade de que, em 5 lançamentos de um dado honesto, apareça a face três:
a) Duas vezes;
Seja X: “número de vezes que aparece a face três em 5 lançamentos”, note que X é binomialmente

distribuída, sendo que, X ∼ Bin 5; 61 , pois p = 1
6
= 0, 1667. Desejamos determinar P [X = 2].
5
!
P [X = 2] = 0, 16672 (1 − 0, 1667)5−2 = 10 × 0, 0278 × 0, 5787 = 0, 1608.
2
b) No máximo uma vez;
P [X ≤ 1] = P [X = 0] + P [X = 1] ,
5
!
P [X = 0] = 0, 16670 (1 − 0, 1667)5−0 = 1 × 1 × 0, 4019 = 0, 4019;
0
5
!
P [X = 1] = 0, 16671 (1 − 0, 1667)5−1 = 5 × 0, 1667 × 0, 4823 = 0, 4019.
1
Dessa forma,
P [X ≤ 1] = P [X = 0] + P [X = 1]
= 0, 4019 + 0, 4019
= 0, 8038.
c) Ao menos duas vezes.
P [X ≥ 2] = 1 − P [X < 2] = 1 − (P [X = 0] + P [X = 1]) ,
Utilizando os resultados anteriormente obtidos teremos:
P [X ≥ 2] = 1 − (P [X = 0] + P [X = 1])
= 1 − (0, 4019 + 0, 4019)
= 1 − 0, 8038 = 0, 1962.
177
5) Considere a amostragem de 3 peças que saem de uma linha de produção. Sabe-se que são produzidas
20% de peças defeituosas. Determine
a) a probabilidade de se amostrar exatamente 2 peças defeituosas;
b) a probabilidade de se amostrar exatamente 2 peças não defeituosas;
c) Quantas peças defeituosas espera-se amostrar?
Seja X: “número de peças defeituosas em 3 produzidas”, note que X é binomialmente distribuída,

sendo que, X ∼ Bin (3; 0, 2), pois p = 0, 2.
Em a) temos que determinar P [X = 2].
3
!
P [X = 2] = 0, 22 (1 − 0, 2)3−2 = 3 × 0, 04 × 0, 8 = 0, 096.
2
Em b) temos que determinar P [X = 1], pois se temos 2 peças defeituosas em 3 amostradas, então 1
peça é defeituosa.
3
!
P [X = 1] = 0, 21 (1 − 0, 2)3−1 = 3 × 0, 2 × 0, 64 = 0, 384.
1
Em c) devemos determinar o número esperado de peças defeituosas. Sabemos que se X ∼ Bin (n; p)
então E [X] = np, dessa forma, o número esperado de peças defeituosas em 3 peças amostradas é
E [X] = np = 3 · 0, 2 = 0, 6.
178
6) Sabe-se que 24% dos indivíduos que recebem o medicamento X sofrem certos efeitos colaterais. Se
o medicamento X for ministrado a quatro pacientes, qual a probabilidade de que:
a) Nenhum sofra efeitos colaterais; c) Exatamente três não sofram efeitos colaterais.
b) Pelo menos um sofra efeitos colaterais;
Seja X: “número de indivíduos que sofrem efeitos colaterais em 4 amostrados”, note que X é bino-
mialmente distribuída, sendo que, X ∼ Bin (4; 0, 24), pois p = 0, 24.
Em a) temos que determinar P [X = 0].
4
!
P [X = 0] = 0, 240 (1 − 0, 24)4−0 = 1 × 1 × 0, 3336 = 0, 3336.
0
Em b) temos que determinar P [X ≥ 1].
P [X ≥ 1] = 1 − P [X < 1] = 1 − P [X = 0] ,
Utilizando o resultado obtido em a) teremos:
P [X ≥ 1] = 1 − P [X = 0]
= 1 − 0, 3336
= 0, 6664.
Em c) temos que determinar a probabilidade de que três não sofram efeitos colaterais. Entretanto,
como nossa variável aleatória só conta o número de indivíduos que sofrem efeitos colaterais, e se temos
3 indivíduos que não sofram efeitos colaterais em 4 amostrados, então 1 sofrerá efeitos colaterais.
4
!
P [X = 1] = 0, 241 (1 − 0, 24)4−1 = 4 × 0, 24 × 0, 439 = 0, 4214.
1
179
7) Se amostrarmos 500 casais (marido e esposa) com quatro filhos cada um, quantos casais nós
esperamos que tenham:
a) Pelo menos um filho homem; b) Exatamente 2 filhos homens.
Para a resolução de a), utilizaremos duas variáveis aleatórias: X, a qual contará o número de filhos
do sexo masculino e, Y a qual contará o número de famílias com pelo menos um filho homem.
Seja X: “número de homens em uma família com 4 filhos”, note que X é binomialmente distribuída,
sendo que, X ∼ Bin (4; 0, 5), pois p = 0, 5.
P [X ≥ 1] = 1 − P [X < 1] = 1 − P [X = 0] ,
4
!
P [X = 0] = 0, 50 (1 − 0, 5)4−0 = 1 × 1 × 0, 0625 = 0, 0625.
0
Dessa forma,
P [X ≥ 1] = 1 − P [X = 0] = 1 − 0, 0625
= 0, 9375.
Seja Y : “número de famílias com pelo menos um filho em 500 amostradas”, note que Y é binomial-
mente distribuída, sendo que, Y ∼ Bin (500; 0, 9375).
Sabemos que se Y ∼ Bin (nY ; pY ) então E [Y ] = nY pY , dessa forma, o número esperado de famílias
com pelo menos um homem em 500 famílias amostradas é
E [Y ] = nY pY = 500 · 0, 9375 = 468, 75 ≈ 469.
Em b), precisamos primeiramente determinar P [X = 2].
4
!
P [X = 2] = 0, 52 (1 − 0, 5)4−2 = 6 × 0, 25 × 0, 25 = 0, 375.
2
Seja T : “número de famílias com dois filhos em 500 amostradas”, note que T é binomialmente
distribuída, sendo que, T ∼ Bin (500; 0, 375).
Sabemos que se T ∼ Bin (nT ; pT ) então E [T ] = nT pT , dessa forma, o número esperado de famílias
com exatamente dois homens em 500 famílias amostradas é
E [T ] = nT pT = 500 · 0, 375 = 187, 5 ≈ 188.

180
8) Numa prova com 10 questões de múltipla escolha, cada uma com 5 alternativas e somente uma
correta. Um aluno não estudou e assinala todas as questões inteiramente ao acaso, pede-se:
a) Quantas questões acerta, em média, esse aluno?
b) Qual a probabilidade de que ele acerte exatamente 5 questões?
Seja X: “número de questõs marcadas corretamente em 10 marcadas aleatoriamente”, note que X é

binomialmente distribuída, sendo que, X ∼ Bin 10; 15 , pois p = 1
5
= 0, 2.
Em a) desejamos determinar o número esperado de questões marcadas corretamente. Sabemos que se

X ∼ Bin (n; p) então E [X] = np, dessa forma, o número esperado de questões marcadas corretamente
em 10 marcadas é
E [X] = np = 10 · 0, 2 = 2.
Em b) desejamos determinar P [X = 5]
10
!
P [X = 5] = 0, 25 (1 − 0, 2)10−5 = 252 × 0, 0003 × 0, 3277 = 0, 0264.
5
181
9) Suponha que a probabilidade de pais terem filhos com distúrbio de atenção seja 0,25. Se selecio-
narmos 6 crianças ao acaso, pede-se:
a) Qual é a probabilidade de que no máximo 2 tenham distúrbio de atenção?

b) Qual é a probabilidade de que pelo menos 3 tenham distúrbio de atenção?
c) Qual o número esperado de crianças com distúrbio de atenção? E a variância?
Seja X: “número de filhos com distúrbio de atenção em 6 selecionados”, note que X é binomialmente
distribuída, sendo que, X ∼ Bin (6; 0, 25).
Em a) queremos determinar
P [X ≤ 2] = P [X = 0] + P [X = 1] + P [X = 2] .
6
!
P [X = 0] = 0, 250 (1 − 0, 25)6−0 = 1 × 1 × 0, 178 = 0, 178;
0
6
!
P [X = 1] = 0, 251 (1 − 0, 25)6−1 = 6 × 0, 25 × 0, 2373 = 0, 356;
1
6
!
P [X = 2] = 0, 252 (1 − 0, 25)6−2 = 15 × 0, 0625 × 0, 3164 = 0, 2966;
2
P [X ≤ 2] = P [X = 0] + P [X = 1] + P [X = 2] = 0, 178 + 0, 356 + 0, 2966
= 0, 8306.
Em b) devemos determinar
P [X ≥ 3] = 1 − P [X < 3] = 1 − (P [X = 0] + P [X = 1] + P [X = 2]) .
Utilizando os resultados obtidos em a) temos
P [X ≥ 3] = 1 − (P [X = 0] + P [X = 1] + P [X = 2])
= 1 − (0, 178 + 0, 356 + 0, 2966)
= 1 − 0, 8306 = 0, 1694
Em c) devemos determinar o valor esperado e a variância do número de filhos com distúrbio de

atenção. Sabemos que se X ∼ Bin (n; p) então E [X] = np e var [X] = npq, dessa forma,
E [X] = np = 6 · 0, 25 = 1, 5,
var [X] = npq = 6 · 0, 25 · (1 − 0, 25) = 1, 125.

182
10) Suponha que a renda familiar em uma comunidade, seja uma distribuição normal com média igual
a R$ 15000 e desvio padrão igual a R$ 2500. Numa amostra de 5 famílias, qual a probabilidade de
que a soma das rendas seja inferior a R$ 60000?
Sejam X : “renda familiar de uma família” e Y : “renda familiar das 5 famílias”. Queremos determinar
P [Y < 60000].
Temos que Xi ∼ N (15000; 6250000). Seja Y = X1 + X2 + · · · + X5 a variável que mede a renda

familiar das 5 famílias e, pelo teorema da combinação linear, sabemos que Y ∼ N (75000; 31250000),
pois
µY = |1 × 15000 + 1 × 15000
{z
+ · · · + 1 × 15000} = 5 × 15000 = 75000
5 vezes
e,
σY2 = |1 × 6250000 + 1 × 6250000
{z
+ · · · + 1 × 6250000} = 5 × 6250000 = 31250000.
5 vezes
60000 µY y
Y − 75000 60000 − 75000

" #
P [Y < 60000] = P [Y − 75000 < 60000 − 75000] = P √ < √
156250000 156250000
60000 − 75000 −15000

= P Z< =P Z< = P [Z < −1, 2]
12500 12500
= P [Z > 1, 2] = 0, 5 − P [0 ≤ Z ≤ 1, 2]
= 0, 5 − 0, 3849
= 0, 1151.
Dessa maneira, a probabilidade de que a renda familiar das 5 famílias seja menor que R$ 60000 é
0,1151.
183
11) Suponha que o tempo de estudo de adultos de certo país apresente distribuição normal com média
de 11 anos e desvio padrão de 2 anos. Determine:
a) a probabilidade de que um adulto, escolhido aleatoriamente, tenha entre 9 e 14 anos de tempo de

estudo;
b) a probabilidade de que um adulto tenha mais de 15 anos de tempo de estudo;
c) a probabilidade de que um adulto tenha mais de 8 anos de tempo de estudo.
Seja X : “tempo de estudo dos adultos”.
Em a) queremos determinar P [9 < X < 14];
9 11 14 x −1 0 1.5 z
9 − 11 X − 11 14 − 11

P [9 < X < 14] = P < <
2 2 2
= P [−1 < Z < 1, 5] = P [−1 < Z < 0] + P [0 ≤ Z < 1, 5]
= P [0 < Z < 1] + P [0 ≤ Z < 1, 5]
= 0, 3413 + 0, 4332
= 0, 7745.
Dessa maneira, a probabilidade de que o tempo de estudo dos adultos esteja entre 9 e 14 anos é
0,7745.
Em b) queremos determinar P [X > 15];
X − 11 15 − 11

P [X > 15] = P [X − 11 > 15 − 11] = P >
2 2
15 − 11 4

= P Z> =P Z> = P [Z > 2]
2 2
= 0, 5 − P [0 ≤ Z ≤ 2] = 0, 5 − 0, 4772
= 0, 0228.
184
11 15 x 0 2 z
Dessa maneira, a probabilidade de que o tempo de estudo dos adultos seja maior que 15 anos é
0,0228.
Em c) queremos determinar P [X > 8];
8 11 x −1.5 0 z
X − 11 8 − 11 3
" #
P [X > 8] = P √ > √ =P Z>−
4 4 2
= P [Z > −1, 5] = P [−1, 5 < Z < 0] + P [Z ≥ 0]
= P [0 < Z < 1, 5] + 0, 5
= 0, 4332 + 0, 5
= 0, 9332.
Dessa maneira, a probabilidade de que o tempo de estudo dos adultos seja maior que 8 anos é 0,9332.
185
12) O tempo que os alunos gastam para fazer uma prova é normalmente distribuído com média de 72
minutos e desvio padrão de 5 minutos. Determine a probabilidade de um aluno gastar:
a) exatamente 72 minutos; d) entre 62 e 83 minutos;

b) mais de 84 minutos; e) entre 60 e 67 minutos.
c) mais de 66 minutos;
Seja X : “tempo gasto na resolução da prova”.
Em a) queremos determinar P [X = 72]. Note que a variável aleatória X é contínua e, assim sendo,
qualquer ponto tem probabilidade zero de acontecer, assim P [X = 72] = 0.
72 84 x 0 2.4 z
X − 72 84 − 72

P [X > 84] = P [X − 72 > 84 − 72] = P >
5 5
84 − 72 12

= P Z> =P Z> = P [Z > 2, 4]
5 5
= 0, 5 − P [0 ≤ Z ≤ 2, 4] = 0, 5 − 0, 4918
= 0, 0082.
Dessa maneira, a probabilidade de que o tempo gasto na resolução da prova seja maior que 84 minutos
é 0,0082.

186
66 72 x −1.2 0 z
X − 72 66 − 72 6
" #
P [X > 66] = P √ > √ =P Z>−
25 25 5
= P [Z > −1, 2] = P [−1, 2 < Z < 0] + P [Z ≥ 0]
= P [0 < Z < 1, 2] + 0, 5
= 0, 3849 + 0, 5
= 0, 8849.
é 0,8849.
Em d) queremos determinar P [62 < X < 83];
62 72 83 x −2 0 2.2 z
187
62 − 72 X − 72 83 − 72

P [62 < X < 83] = P < <
5 5 5
= P [−2 < Z < 2, 2] = P [−2 < Z < 0] + P [0 ≤ Z < 2, 2]
= P [0 < Z < 2] + P [0 ≤ Z < 2, 2]
= 0, 4772 + 0, 4861
= 0, 9633.
Dessa maneira, a probabilidade de que o tempo gasto na resolução da prova esteja entre 62 e 83 anos
é 0,9633.
Em e) queremos determinar P [60 < X < 67];
60 67 72 x −2.4 −1 0 z
60 − 72 X − 72 67 − 72

P [60 < X < 67] = P < <
5 5 5
= P [−2, 4 < Z < −1] = P [1 < Z < 2, 4]
= P [0 < Z < 2, 4] − P [0 ≤ Z < 1]
= 0, 4918 − 0, 3413
= 0, 1505.
Dessa maneira, a probabilidade de que o tempo gasto na resolução da prova esteja entre 60 e 67
minutos é 0,1505.
188
13) O conteúdo líquido das garrafas de um refrigerante é normalmente distribuído com média de
300 ml e desvio padrão de 2 ml.
a) Determine o percentual de garrafas cujo conteúdo é inferior a 302 ml.
b) Se 5 garrafas forem amostradas, qual a probabilidade de que o conteúdo médio das 5 garrafas seja
inferior a 302 ml?
Seja X : “conteúdo líquido das garrafas de refrigerante”, então Xi ∼ N (300; 4). Em a) queremos
determinar P [X < 302].
300 302 x 0 1 z
X − 300 302 − 300

" #
P [X < 302] = P [X − 300 < 302 − 300] = P √ < √
4 4
302 − 300 2

= P Z< =P Z< = P [Z < 1]
2 2
= P [Z ≤ 0] + P [0 < Z < 1] = 0, 5 + P [0 < Z < 1]
= 0, 5 + 0, 3413
= 0, 8413.
Dessa maneira, o percentual de garrafas para as quais o conteúdo líquido das garrafas de refrigerante
é inferior a 302 ml é 0,8413.
Seja Y : “conteúdo líquido médio das 5 garrafas de refrigerante”. Em b) queremos determinar

P [Y < 302].
Seja Y = X1 + X2 + · · · + X5 a variável que mede a conteúdo líquido médio das 5 garrafas de

refrigerante e, pelo teorema da combinação linear, sabemos que Y ∼ N (1500; 20), pois
X 1 + · · · + X5 1

µY = E = (E [X1 ] + · · · + E [X5 ])

5 5 
1 5 × 300
= 300 + 300 {z + · · · + 300} = = 300
5 | 5
5 vezes
189
e,
X1 + · · · + X 5 1

σY2 = var = 2 (var [X1 ] + · · · + var [X5 ])

5 
5
1  1
= 4| + 4 +{z· · · + 4} = × 20 = 0, 8.
25 25
5 vezes
300 302 y 0 2.24 z
Y − 300 302 − 300

" #
P [Y < 302] = P [Y − 300 < 302 − 300] = P √ < √
0, 8 0, 8
302 − 300 2
" # " #
= P Z< =P Z< = P [Z < 2, 24]
0, 8944 0, 8944
= 0, 5 + P [0 ≤ Z ≤ 2, 24]
= 0, 5 + 0, 4875
= 0, 9875.
Dessa maneira, o percentual de garrafas para as quais o conteúdo líquido médio das 5 garrafas de
refrigerante é inferior a 302 ml é 0,9875.
190
14) Numa indústria, ocorrem em média 3 acidentes de trabalho por mês.
a) Encontre a probabilidade de que ocorram pelo menos 2 acidentes de trabalho, em um período de

um mês.
b) Encontre a probabilidade de que ocorra no máximo 1 acidente de trabalho, em um período de dois

meses.
Seja X: “número de acidentes de trabalho em 1 mês”, note que, X ∼ Poi (3), pois ocorrem em média
λ = 3 acidentes por mês. Em a) desejamos determinar P [X ≥ 2]. Sabemos que
P [X ≥ 2] = 1 − P [X < 2] = 1 − (P [X = 0 + P [X = 1]])
e−3 30 0, 0498 × 1
P [X = 0] = = = 0, 0498
0! 1
e−3 31 0, 0498 × 3
P [X = 1] = = = 0, 1494,
1! 1
logo
P [X ≥ 2] = 1 − (0, 0498 + 0, 0498)
= 1 − 0, 1992
= 0, 8008
Em b) seja Y : “número de acidentes de trabalho em 2 meses”. Sabemos que o número médio de

acidentes que ocorre por mês é 3, donde podemos determinar o número médio de acidentes que
ocorrem em 2 meses através de uma regra de três, assim,
Meses Acidentes
1 3
2 λ
Desejamos determinar P [Y ≤ 1]. Sabemos que
P [Y ≤ 1] = P [Y = 0] + P [Y = 1]
191
e−6 60 0, 0025 × 1
P [Y = 0] = = = 0, 0025
0! 1
e−6 61 0, 0025 × 6
P [Y = 1] = = = 0, 0149
1! 1
assim
P [Y ≤ 1] = 0, 0025 + 0, 0149 = 0, 0174.

192
15) A massa de estudantes é normalmente distribuído com média de 65,3 kg e desvio padrão de 5,5 kg.
Determine a probabilidade de que a massa de um estudante seja:
a) 54,3 kg; c) mais de 57,2 kg;
b) entre 60 e 70 kg; d) menos de 71 kg.
Seja X : “massa de um estudante”.
Em a) queremos determinar P [X = 54, 3]. Note que a variável aleatória X é contínua e, assim sendo,
qualquer ponto tem probabilidade zero de acontecer, assim P [X = 54, 3] = 0.
Em b) queremos determinar P [60 < X < 70];
60 65.3 70 x −0.96 0 0.85 z
60 − 65, 3 X − 65, 3 70 − 65, 3

" #
P [60 < X < 70] = P < <
5, 5 5, 5 5, 5
= P [−0, 96 < Z < 0, 85] = P [−0, 96 < Z < 0] + P [0 ≤ Z < 0, 85]
= P [0 < Z < 0, 96] + P [0 ≤ Z < 0, 85]
= 0, 3315 + 0, 3023
= 0, 6338.
Dessa maneira, a probabilidade de que o massa de um estudante esteja entre 60 e 70 kg é 0,6338.
Em c) queremos determinar P [X > 57, 2];
X − 65, 3 57, 2 − 65, 3 8, 1

" # " #
P [X > 57, 2] = P √ > √ =P Z>−
30, 25 30, 25 5, 5
= P [Z > −1, 47] = P [−1, 47 < Z < 0] + P [Z ≥ 0]
= P [0 < Z < 1, 47] + 0, 5 = 0, 4292 + 0, 5
= 0, 9292.
193
57.2 65.3 x −1.47 0 z
Dessa maneira, a probabilidade de que o massa de um estudante seja maior que 57,2 kg é 0,9292.
Em d) queremos determinar P [X ≤ 71].
65.3 71 x 0 1.04 z
X − 65, 3 71 − 65, 3
" #
P [X ≤ 71] = P [X − 65, 3 ≤ 71 − 65, 3] = P √ ≤ √
30, 25 30, 25
71 − 65, 3 5, 7
" # " #
= P Z≤ =P Z≤ = P [Z ≤ 1, 04]
5, 5 5, 5
= P [Z < 0] + P [0 ≤ Z ≤ 1, 04] = 0, 5 + P [0 ≤ Z ≤ 1, 04]
= 0, 5 + 0, 3508
= 0, 8508.
Dessa maneira, o percentual de massa de um estudante que é inferior a 71 pontos é 0,8508.

194
16) Suponha que as notas da disciplina de Estatística estejam normalmente distribuídas com média
5 pontos e variância 4 pontos2 . Pede-se:
a) Determine a probabilidade dos estudantes obterem no máximo 3,2 pontos de nota.
b) Determine a probabilidade dos estudantes obterem pelo menos 3 pontos de nota.
c) Determine a probabilidade dos estudantes obterem exatamente 6 pontos de nota.
d) Determine a probabilidade dos estudantes obterem notas entre 6 e 8 pontos de nota.
Seja X : “notas da disciplina de Estatística”.
Em a) queremos determinar P [X ≤ 3, 2].
3.2 5 x −0.9 0 z
X −5 3, 2 − 5
" #
P [X ≤ 3, 2] = P [X − 5 ≤ 3, 2 − 5] = P √ ≤ √
4 4
3, 2 − 5 −1, 8

= P Z≤ =P Z≤ = P [Z ≤ −0, 9]
2 2
= P [Z ≥ 0, 9] = 0, 5 − P [0 ≤ Z < 0, 9] = 0, 5 − 0, 3159
= 0, 1841.
Dessa maneira, o percentual de notas da disciplina de Estatística que é inferior a 3,2 pontos é 0,1841.
X −5 3−5 2
" #
P [X > 3] = P √ > √ =P Z>−
4 4 2
= P [Z > −1] = P [−1 < Z < 0] + P [Z ≥ 0]
= P [0 < Z < 1] + 0, 5 = 0, 3413 + 0, 5
= 0, 8413.
195
3 5 x −1 0 z
Dessa maneira, a probabilidade de que o notas da disciplina de Estatística seja maior que 3 pontos
é 0,8413.
Em c) queremos determinar P [X = 6]. Note que a variável aleatória X é contínua e, assim sendo,
qualquer ponto tem probabilidade zero de acontecer, assim P [X = 6] = 0.
5 6 8 x 0 0.5 1.5 z
6−5 X −5 8−5

P [6 < X < 8] = P < < = P [0, 5 < Z < 1, 5]
2 2 2
= P [0 ≤ Z < 1, 5] − P [0 < Z < 0, 5] = 0, 4332 − 0, 1915
= 0, 2417.
Dessa maneira, a probabilidade de que as notas da disciplina de Estatística esteja entre 6 e 8 pontos
é 0,2417.
196
17) As notas em um teste padronizado seguem distribuição normal com média igual a 100 pontos e
desvio padrão de 10 pontos. Determine a probabilidade de que um indivíduo submetido ao teste
tenha nota:
a) 100 pontos; d) entre 85 e 115 pontos;
b) maior que 120 pontos; e) inferior a 110 pontos;
c) maior que 80 pontos; f) maior que 100 pontos.
Seja X : “notas no teste padronizado”.
Em a) queremos determinar P [X = 100]. Note que a variável aleatória X é contínua e, assim sendo,
qualquer valor tem probabilidade zero de acontecer, assim P [X = 100] = 0.
Em b) queremos determinar P [X > 120].
100 120 x 0 2 z
X − 100 120 − 100

P [X > 120] = P [X − 100 > 120 − 100] = P >
10 10
120 − 100 20

= P Z> =P Z> = P [Z > 2]
10 10
= 0, 5 − P [0 ≤ Z ≤ 2] = 0, 5 − 0, 4772
= 0, 0228.
Dessa maneira, a probabilidade de que o notas no teste padronizado seja maior que 120 pontos é
0,0228.

197
80 100 x −2 0 z
X − 100 80 − 100 20
" #
P [X > 80] = P √ > √ =P Z>−
100 100 10
= P [Z > −2] = P [−2 < Z < 0] + P [Z ≥ 0]
= P [0 < Z < 2] + 0, 5 = 0, 4772 + 0, 5
= 0, 9772.
Dessa maneira, a probabilidade de que o notas no teste padronizado seja maior que 80 pontos é
0,9772.
85 100 115 x −1.5 0 1.5 z
85 − 100 X − 100 115 − 100

P [85 < X < 115] = P < <
10 10 10
= P [−1, 5 < Z < 1, 5] = P [−1, 5 < Z < 0] + P [0 ≤ Z < 1, 5]
= P [0 < Z < 1, 5] + P [0 ≤ Z < 1, 5] = 0, 4332 + 0, 4332
= 0, 8664.
Dessa maneira, a probabilidade de que o notas no teste padronizado esteja entre 85 e 115 pontos é
198
0,8664.
Em e) queremos determinar P [X < 120].
100 110 x 0 1 z
X − 100 110 − 100

" #
P [X < 110] = P [X − 100 < 110 − 100] = P √ < √
100 100
110 − 100 10

= P Z< =P Z< = P [Z < 1]
10 10
= P [Z ≤ 0] + P [0 < Z < 1] = 0, 5 + P [0 < Z < 1]
= 0, 5 + 0, 3413
= 0, 8413.
Dessa maneira, o percentual de notas no teste padronizado que é inferior a 110 pontos é 0,8413.
Em f) queremos determinar P [X > 100];
100 x 0 z
X − 100 100 − 100 0

" #
P [X > 100] = P √ > √ =P Z>−
100 100 10
= P [Z > 0] = 0, 5.
199
Dessa maneira, a probabilidade de que o notas no teste padronizado seja maior que 100 pontos é 0,5.
200
18) Suponha que os diâmetros dos parafusos produzidos por uma fábrica sejam normalmente distri-
buídos com média de 0,25 polegadas e desvio padrão de 0,02 polegadas. Um parafuso é considerado
defeituoso se o seu diâmetro for menor que 0,2 polegadas ou maior que 0,28 polegadas. Encontre a
porcentagem de parafusos defeituosos produzidos pela fábrica.
Seja X: “notas no teste padronizado”. Queremos determinar P [X ≤ 0, 2] + P [X ≥ 0, 28];
0.2 0.25 0.28 x −2.5 0 1.5 z
X − 0, 25 0, 2 − 0, 25 X − 0, 25 0, 28 − 0, 25
" # " #
P [X ≤ 0, 2] + P [X ≥ 0, 28] = P ≤ +P ≥
0, 02 0, 02 0, 02 0, 02
−0, 05 0, 03
" # " #
= P Z≤ +P Z ≥
0, 02 0, 02
= P [Z ≤ −2, 5] + P [Z ≥ 1, 5] = P [Z ≥ 2, 5] + P [Z ≥ 1, 5]
= (0, 5 − P [0 ≤ Z < 2, 5]) + (0, 5 − P [0 ≤ Z < 1, 5])
= (0, 5 − 0, 4938) + (0, 5 − 0, 4332)
= 0, 0062 + 0, 0668
= 0, 073.
Dessa maneira, a probabilidade de que as notas no teste padronizado seja menor que 0,2 ou maior
que 0,28 pontos é 0,073.
201
19) Suponha que as notas de um exame são normalmente distribuídas com média 76 pontos e desvio
padrão de 15 pontos. Os estudantes que ficarem entre as 15% melhores notas, receberão conceito
A e os estudantes que ficarem entre as 10% piores notas, receberão conceito F . Determine a nota
mínima para um estudante:
a) receber conceito A; b) não receber conceito F .
Seja X: “notas no teste padronizado”. Devemos encontrar as notas xA e xF tais que P [X ≤ xF ] = 0, 1

e P [X ≥ xA ] = 0, 15.
0.15 0.15
0.1 0.1
xF 76 xA x zF 0 zA z
X − 76 xF − 76 xF − 76
" # " #
0, 1 = P [X ≤ xF ] = P √ ≤ √ =P Z≤ √
225 225 225
xF − 76 xF − 76
" # " #
= P Z≥− √ = 0, 5 − P 0 ≤ Z < − √
225 225
assim
xF − 76
" #
0, 5 − P 0 ≤ Z < − √ = 0, 1
225
xF − 76
" #
P 0≤Z<− √ = 0, 5 − 0, 1
225
xF − 76
" #
P 0≤Z<− √ = 0, 4
225
202
logo da tabela da distribuição normal temos que
xF − 76
− √ = 1, 28
225
xF − 76
√ = −1, 28
225
√
xF − 76 = −1, 28 · 225
xF = 76 − 19, 2
xF = 56, 8.
X − 76 xA − 76 xA − 76
" # " #
0, 15 = P [X ≥ xA ] = P √ ≥ √ =P Z≥ √
225 225 225
xA − 76
" #
= 0, 5 − P 0 ≤ Z < √
225
assim
xA − 76
" #
0, 5 − P 0 ≤ Z < √ = 0, 15
225
xA − 76
" #
P 0≤Z< √ = 0, 5 − 0, 15
225
xA − 76
" #
P 0≤Z< √ = 0, 35
225
xA − 76
√ = 1, 04
225
xA − 76
√ = 1, 04
225
√
xA − 76 = 1, 04 · 225
xA = 76 + 15, 6
xA = 91, 6.
203
20) Uma fábrica de carros sabe que os motores por ela fabricadas tem duração normal com média de
150000 km e desvio padrão de 5000 km.
a) Qual a probabilidade de que um carro tenha motor que dure mais que 150000 km?
b) Qual a probabilidade de que um carro tenha motor que dure menos que 158000 km?
c) Qual a probabilidade de que um carro tenha motor que dure entre 140000 e 159000 km?
d) Se a fábrica substitui o motor que apresente duração inferior a garantia, qual deve ser essa garantia,
para que a porcentagem de motores substituídos seja de 2%?
Seja X: “duração do motor”.
Em a) queremos determinar P [X > 150000];
150000 x 0 z
X − 150000 150000 − 150000 0

" #
P [X > 150000] = P √ > √ =P Z>−
25000000 25000000 5000
= P [Z > 0] = 0, 5.
Dessa maneira, a probabilidade de que a duração do motor seja maior que 150000 quilômetros é 0,5.
Em b) queremos determinar P [X < 158000].
150000 158000 x 0 1.6 z

204
X − 150000 158000 − 150000

" #
P [X < 158000] = P [X − 150000 < 158000 − 150000] = P √ < √
25000000 25000000
158000 − 150000 8000

= P Z< =P Z< = P [Z < 1, 6]
5000 5000
= P [Z ≤ 0] + P [0 < Z < 1, 6] = 0, 5 + P [0 < Z < 1, 6]
= 0, 5 + 0, 4452
= 0, 9452.
Dessa maneira, o percentual de duração do motor que é inferior a 158000 km é 0,9452.
Em c) queremos determinar P [140000 < X < 159000];
140000 150000 159000 x −2 0 1.8 z
140000 − 150000 X − 150000 159000 − 150000

P [140000 < X < 159000] = P < <
5000 5000 5000
= P [−2 < Z < 1, 8] = P [−2 < Z < 0] + P [0 ≤ Z < 1, 8]
= P [0 < Z < 2] + P [0 ≤ Z < 1, 8] = 0, 4772 + 0, 4641
= 0, 9413.
Dessa maneira, a probabilidade de que a duração do motor esteja entre 140000 e 159000 km é 0,9413.
Devemos encontrar o quilômetro xG tal que P [X ≤ xG ] = 0, 02.
X − 150000 xG − 150000 xG − 150000

" # " #
0, 02 = P [X ≤ xG ] = P √ ≤ √ =P Z≤ √
25000000 25000000 25000000
xG − 150000 xG − 150000
" # " #
= P Z≥− √ = 0, 5 − P 0 ≤ Z < − √
25000000 25000000
205
0.02 0.02
xG 150000 x zG 0 z
assim
xG − 150000
" #
0, 5 − P 0 ≤ Z < − √ = 0, 02
25000000
xG − 150000
" #
P 0≤Z<− √ = 0, 5 − 0, 02
25000000
xG − 150000
" #
P 0≤Z<− √ = 0, 48
25000000
xG − 150000
−√ = 2, 05
25000000
xG − 150000
√ = −2, 05
25000000
√
xG − 150000 = −2, 05 · 25000000
xG = 150000 − 10250
xG = 139750.
206
21) Um marinheiro recebe um telegrama avisando que sua esposa ainda não deu a luz. Ele não lembra
a data exata que esteve em casa, e refletindo um pouco chegou a conclusão de que tem pelo menos
308 dias que isso ocorreu. Se os prazos de gravidez têm distribuição normal com média de 268 dias
e desvio padrão de 15 dias, pergunta-se: o marinheiro deve se preocupar?
Seja X: “prazos de gravidez”. Queremos determinar P [X > 308]
268 308 0 2.67
X − 268 308 − 268

P [X > 308] = P [X − 268 > 308 − 268] = P >
15 15
308 − 268 40

= P Z> =P Z> = P [Z > 2, 67]
15 15
= 0, 5 − P [0 ≤ Z ≤ 2, 67] = 0, 5 − 0, 4962
= 0, 0038.
Dessa maneira, a probabilidade de que o prazos de gravidez sejam maiores que 308 dias é 0,0038, e
assim o marinheiro deve sim se preocupar, pois a probabilidade de que ele seja o verdadeiro pai é
baixa.
207
22) Os depósitos efetuados no Banco B, num determinado mês, têm distribuição normal com média
R$ 9000 e desvio padrão R$ 1500. Um depósito é selecionado ao acaso dentre todos os referentes ao
mês em questão. A probabilidade de que o depósito exceda R$ 6000 é de
a) ( ) 97,72% c) ( ) 68,21% e) ( ) 34,17%
b) ( ) 94,50% d) ( ) 47,71%
Seja X: “valor do depósito”. Queremos determinar P [X > 6000]
6000 9000 −2 0
X − 9000 6000 − 9000

P [X > 6000] = P [X − 9000 > 6000 − 9000] = P >
1500 1500
6000 − 9000 −3000

= P Z> =P Z> = P [Z > −2]
1500 1500
= P [−2 < Z < 0] + P [Z ≥ 0]
= P [0 < Z < 2] + 0, 5 = 0, 4772 + 0, 5
= 0, 9772.
Dessa maneira, a probabilidade de que o valor do depósito exceda R$ 6000 é 0,9772, sendo a resposta
correta a letra a).
208
23) Um avião de turismo de 4 lugares pode levar uma carga útil de 360 kg. Supondo que os passageiros
têm massa normalmente distribuída com média de 70 kg e desvio padrão de 20 kg e que a bagagem
de cada passageiro também é normalmente distribuída com média 12 kg e desvio padrão de 5 kg.
Calcule a probabilidade de:
a) Haver sobrecarga se o piloto não mensurar a massa dos passageiros e respectivas bagagens.
b) Que o piloto tenha que retirar pelo menos 50 kg de gasolina para evitar sobrecarga.
Sejam
i) Xi : “massa do i−ésimo passageiro”, então Xi ∼ N (70; 400);
ii) Yi : “massa da bagagem do i−ésimo passageiro”, então Yi ∼ N (12; 25).
Se W : “massa de 4 passageiros e suas respectivas bagagens”, temos que
W = X1 + · · · + X4 + Y1 + · · · + Y4 ,
| {z } | {z }
4 vezes 4 vezes
então W ∼ N (328; 1700). De fato,
µW = 1| × 70 + 1 × 70
{z
+ · · · + 1 × 70} + |1 × 12 + 1 × 12
{z
+ · · · + 1 × 12}
4 vezes 4 vezes
= 4 × 70 + 4 × 12 = 280 + 48
= 328
e,
2
σW = 1| × 400 + 1 × 400
{z
+ · · · + 1 × 400} + |1 × 25 + 1 × 25
{z
+ · · · + 1 × 25}
4 vezes 4 vezes
= 4 × 400 + 4 × 25 = 1600 + 100
= 1700.
Em a) queremos calcular P [W > 360].
W − 328 360 − 328

" #
P [W > 360] = P [W − 328 > 360 − 328] = P √ > √
1700 1700
360 − 328 32
" # " #
= P Z> =P Z> = P [Z > 0, 78]
41, 2311 41, 2311
= 0, 5 − P [0 ≤ Z ≤ 0, 78] = 0, 5 − 0, 2823
= 0, 2177.
209
328 360 0 0.78
Dessa maneira, a probabilidade de que o massa de 4 passageiros e suas respectivas bagagens sejam
maiores que 360 quilogramas é 0,2177.
Em b) queremos calcular P [W > 410], pois se o piloto teve que retirar pelo menos 50 kg, então a
massa inicial era, pelo menos 410 kg.
328 410 0 1.99
X − 328 410 − 328

" #
P [X > 410] = P [X − 328 > 410 − 328] = P √ > √
1700 1700
410 − 328 82
" # " #
= P Z> =P Z> = P [Z > 1, 99]
41, 2311 41, 2311
= 0, 5 − P [0 ≤ Z ≤ 1, 99] = 0, 5 − 0, 4767
= 0, 0233.
Dessa maneira, a probabilidade de que o massa de 4 passageiros e suas respectivas bagagens sejam
maiores que 410 quilogramas é 0,0233.
210
24) Sabendo que a massa de coelhos (X), é uma variável aleatória normalmente distribuída com média
5 kg e variância 9 kg2 , determine:
a) a probabilidade de que um coelho, selecionado aleatoriamente, tenha massa superior a 2,5 kg.
b) a probabilidade de que um coelho, selecionado aleatoriamente, tenha massa superior a 2 kg e

inferior a 7,1 kg.
Em a) queremos determinar P [X > 2, 5];
2.5 5 x −0.83 0 z
X −5 2, 5 − 5 2, 5
" #
P [X > 2, 5] = P √ > √ =P Z>−
9 9 3
= P [Z > −0, 83] = P [−0, 83 < Z < 0] + P [Z ≥ 0]
= P [0 < Z < 0, 83] + 0, 5 = 0, 2967 + 0, 5
= 0, 7967.
Dessa maneira, a probabilidade de que o massa de um coelho seja maior que 2,5 kg é 0,7967.
Em b) queremos determinar P [2 < X < 7, 1];
2 5 7.1 x −1 0 0.7 z
211
2−5 X −5 7, 1 − 5

P [2 < X < 7, 1] = P < <
3 3 3
= P [−1 < Z < 0, 7] = P [−1 < Z < 0] + P [0 ≤ Z < 0, 7]
= P [0 < Z < 1] + P [0 ≤ Z < 0, 7] = 0, 3413 + 0, 258
= 0, 5993.
Dessa maneira, a probabilidade de que o massa de um coelho esteja entre 2 e 7,1 kg é 0,5993.
212
25) A delegacia de polícia da cidade de Atlântida recebe em média três chamadas por hora pelo
telefone 190. Calcule a probabilidade de que ela receba no mínimo duas chamadas em uma hora.
Seja X: “número dechamadas recebidas em 1 hora”, note que, X ∼ Poi (3), pois ocorrem em média
λ = 3 acidentes por mês. Desejamos determinar P [X ≥ 2]. Sabemos que
P [X ≥ 2] = 1 − P [X < 2] = 1 − (P [X = 0 + P [X = 1]])
e−3 30 0, 0498 × 1
P [X = 0] = = = 0, 0498
0! 1
e−3 31 0, 0498 × 3
P [X = 1] = = = 0, 1494,
1! 1
logo
P [X ≥ 2] = 1 − (0, 0498 + 0, 0498)
= 1 − 0, 1992
= 0, 8008.
213
26) De uma caixa com uma lata de doce de leite defeituosa e 4 perfeitas, Joana retira quatro latas
sucessivamente com reposição. Determine:
a) a probabilidade de que todas as latas sejam defeituosas.
b) a probabilidade de que pelo menos uma lata seja perfeita.
Seja X: “número de latas de doce de leite defeituosas em 4 selecionadas”, note que X é binomialmente
Em a) queremos determinar P [X = 4].
4
!
P [X = 4] = 0, 24 (1 − 0, 2)4−4 = 1 × 0, 0016 × 1 = 0, 0016.
4
Em b), note que nossa variável aleatória mede o número de latas defeituosas, entretanto, o exercício
refere-se a latas perfeitas. Se pelo menos uma lata é perfeita, então teremos no máximo 3 latas
defeituosas e, podemos então determinar P [X ≤ 3].
P [X ≤ 3] = P [X = 0] + P [X = 1] + P [X = 2] + P [X = 3]
= 1 − P [X > 3] = 1 − P [X = 4] ,
e utilizando o resultado de a) temos
P [X ≤ 3] = 1 − 0, 0016 = 0, 9984.
Outro modo de resolver b) é definir a variável Y : “número de latas de doce de leite perfeitas em 4
selecionadas”, note que Y é binomialmente distribuída, sendo que, Y ∼ Bin (4; 0, 8).
P [Y ≥ 1] = P [Y = 1] + P [Y = 2] + P [Y = 3] + P [Y = 4]
= 1 − P [Y < 1] = 1 − P [Y = 0] ,
4
!
P [Y = 0] = 0, 80 (1 − 0, 8)4−0 = 1 × 1 × 0, 0016 = 0, 0016,
0
logo
P [Y ≥ 1] = 1 − 0, 0016 = 0, 9984.
214
27) Os registros de venda da loja de Luzia indicam que, historicamente 60% das faturas diárias,
por ela emitidas, são pagas em dia. Nessa semana ela fez sete vendas independentes de um valor
consideravelmente alto, e está preocupada.
a) Determine a probabilidade de que exatamente duas faturas não sejam pagas em dia.
b) Determine a probabilidade de que pelo menos uma das faturas seja paga em dia.
Seja X: “número de faturas pagas em atraso nas 7 vendas”, note que X é binomialmente distribuída,
sendo que, X ∼ Bin (7; 0, 4).
7
!
P [X = 2] = 0, 42 (1 − 0, 4)7−2 = 21 × 0, 16 × 0, 0778 = 0, 2613.
2
Em b), note que nossa variável aleatória, definida em a), refere-se ao número de faturas pagas em
atraso, entretanto, o exercício refere-se a faturas pagas em dia. Se pelo menos uma fatura é paga em
dia, então teremos no máximo 6 faturas pagas em atraso e, podemos então determinar P [X ≤ 6].
P [X ≤ 6] = P [X = 0] + · · · + P [X = 6] = 1 − P [X > 6] = 1 − P [X = 7] ,
e como
7
!
P [X = 7] = 0, 47 (1 − 0, 4)7−7 = 1 × 0, 0016 × 1 = 0, 0016.
7
temos
P [X ≤ 6] = 1 − 0, 0016 = 0, 9984.
Outro modo de resolver b) é definir a variável Y : “número de faturas pagas em dia nas 7 vendas”,
note que Y é binomialmente distribuída, sendo que, Y ∼ Bin (7; 0, 6).
P [Y ≥ 1] = P [Y = 1] + · · · + P [Y = 7] = 1 − P [Y < 1] = 1 − P [Y = 0] ,
e
7
!
P [Y = 0] = 0, 60 (1 − 0, 6)7−0 = 1 × 1 × 0, 0016 = 0, 0016,
0
logo
P [Y ≥ 1] = 1 − 0, 0016 = 0, 9984.
215
1
28) Um motorista comprou cinco pneus novos de uma certa marca para o seu carro. Sabe-se que dos
4
pneus dessa marca costumam apresentar defeito e, torna-se importante estudar essa variável, devido
a periculosidade de que haja um acidente por causa de um pneu nesse estado. Qual a probabilidade
de que ele tenha comprado:
a) Exatamente três pneus defeituosos;
b) Todos os pneus em perfeito estado.
Seja X: “número de pneus defeituosos dentre os 5 comprados”, note que X é binomialmente distri-
buída, sendo que, X ∼ Bin (5; 0, 25).
5
!
P [X = 3] = 0, 253 (1 − 0, 25)5−3 = 10 × 0, 0156 × 0, 5625 = 0, 0879.
3
Em b) note que nossa variável aleatória mede o número de pneus defeituosos, entretanto, o exercício
refere-se a pneus perfeitos. Se todos os pneus estão em perfeito estado, então nenhum deles é
defeituoso e, podemos então determinar P [X = 0].
5
!
P [X = 0] = 0, 250 (1 − 0, 25)5−0 = 1 × 1 × 0, 2373 = 0, 2373.
0
Outro modo de resolver b) é definir a variável Y : “número de pneus perfeitos dentre os 5 comprados”,
note que Y é binomialmente distribuída, sendo que, Y ∼ Bin (5; 0, 75).
5
!
P [Y = 5] = 0, 755 (1 − 0, 75)5−5 = 1 × 0, 2373 × 1 = 0, 2373.
5
216
29) Em uma rodovia ocorrem, em média, dois acidentes por mês. Qual a probabilidade de, nos
próximos três meses, ocorrerem exatamente cinco acidentes?
Seja Y : “número de acidentes que ocorrem em 3 meses”. Sabemos que o número médio de acidentes
que ocorre por mês é 2, donde podemos determinar o número médio de acidentes que ocorrem em 3
meses através de uma regra de três, assim,
Meses Acidentes
1 2
3 λ
Desejamos determinar P [Y = 5].
e−6 65 0, 0025 × 7776

P [Y = 5] = = = 0, 162.
5! 120
217
30) Dada a população de pessoas de um município em que 60% são favoráveis a um certo projeto
municipal, qual a probabilidade de, numa amostra aleatória simples de 4 pessoas dessa população,
encontrarmos exatamente 3 pessoas favoráveis ao projeto?
Seja X: “número de pneus defeituosos dentre os 4 comprados”, note que X é binomialmente distri-
buída, sendo que, X ∼ Bin (4; 0, 6).
Queremos determinar P [X = 3].
4
!
P [X = 3] = 0, 63 (1 − 0, 6)4−3 = 4 × 0, 216 × 0, 4 = 0, 3456.
3
218
31) Numa central telefônica chegam 30 telefonemas em 60 minutos. Qual a probabilidade de que em
6 minutos cheguem 10 telefonemas?
Seja Y : “número de telefonemas recebidos em 6 minutos”. Sabemos que o número médio de telefo-
nemas por minuto é 0,5, donde podemos determinar o número médio de telefonemas ocorrem em 6
minutos através de uma regra de três,
Minutos Telefonemas
1 0,5
6 λ
logo 1 · λ = 6 · 0, 5, e assim λ = 3.
Desejamos determinar P [Y = 10], assim
e−3 310 0, 0498 × 59049

P [Y = 10] = = = 0, 0008.
10! 3628800
219
32) Acredita-se que 20% dos moradores das proximidades de uma grande indústria siderúrgica tem
alergia aos poluentes lançados ao ar. Calcule a probabilidade de que quatro moradores tenham
alergia dentre treze selecionados ao acaso.
Seja X: “número de moradores que tem alergia dentre os 13 amostrados”, note que X é binomialmente
Queremos determinar P [X = 4].
13
!
P [X = 4] = 0, 24 (1 − 0, 2)13−4 = 715 × 0, 0016 × 0, 1342 = 0, 1535.
4
220
33) Suponha que a massa dos habitantes de uma determinada cidade seja uma variável aleatória
normalmente distribuída com média 75 kg e variância 25 kg2 . Na drogaria do senhor Joaquim,
há uma balança que mensura massas de no máximo 160 kg. Se dois moradores forem escolhidos
aleatoriamente, qual a probabilidade de que eles não possam ter massa mensurada de uma só vez
pela balança por excederem o limite de quilogramas suportado pela balança?
Sejam Xi : “massa do i−ésimo morador”, então Xi ∼ N (75; 25). Se W : “massa de 2 moradores”,

temos que
W = X1 + X2
então W ∼ N (150; 50). De fato,
µW = E [X1 + X2 ] = E [X1 ] + E [X2 ]
= 75 + 75 = 2 × 75 = 150
e,
2
σW = var [X1 + X2 ] = var [X1 ] + var [X2 ]
= 25 + 25 = 2 × 25 = 50
= 50.
Queremos calcular P [W > 160].
150 160 0 1.41

221
W − 150 160 − 150

" #
P [W > 160] = P [W − 150 > 160 − 150] = P √ > √
50 50
160 − 150 10
" # " #
= P Z> =P Z> = P [Z > 1, 41]
7, 0711 7, 0711
= 0, 5 − P [0 ≤ Z ≤ 1, 41] = 0, 5 − 0, 4207
= 0, 0793.
Dessa maneira, a probabilidade de que o massa de 2 moradores sejam maiores que 160 quilogramas
é 0,0793.
222
34) Uma central telefônica recebe, em média, 90 telefonemas em 60 minutos. Qual a probabilidade
de que em 2 minutos ela receba 2 telefonemas?
Seja X : “número de ligações em um minuto”. Temos que
90 telefonemas
m= = 1, 5 telefonemas/minuto.
60 minutos
Se Y : “número de ligações em 2 minutos” temos que:
Minutos Telefonemas
1 1,5
2 λ
λ = 1, 5 × 2 = 3,
ou seja o número médio de ligações em 2 minutos é 3, donde λ = 3. Logo
e−3 32
P [Y = 2] = = 0, 224.
2!
223
35) Um empresário pretende estabelecer uma firma para montagem de um componente mecânico.
Cada peça é composta de duas partes, A e B, cada uma com uma chance específica de ser defeituosa.
Só é possível verificar a qualidade das peças depois que elas são montadas. Se ambas são defeituosas,
a peça é descartada e dá um prejuízo de R$ 15. Se a peça B é defeituosa e A é perfeita, ainda é
possível reparar a peça e obter um lucro de R$ 20. De maneira semelhante, se A é defeituosa e B é
perfeita, o reparo permite vender a peça inteira com um lucro de R$ 30. Se as duas peças são boas,
o lucro é de R$ 40. Sendo A : “a peça A é perfeita”, B : “a peça B é perfeita” e
P [Ac ∩ B] = 0, 25 P [Ac ∩ B c ] = 0, 15
P [A ∩ B] = 0, 4 P [A ∩ B c ] = 0, 2
determine:
a) a distribuição do lucro;
Seja X : “lucro obtido por peça”. Temos que os possíveis valores obtidos para X são:
• se as peças A e B são defeituosas (Ac ∩ B c ), o “lucro” é −15, o que ocorre com probabilidade
0,15;
• se a peça A é perfeita e B é defeituosa (A ∩ B c ), o lucro é 20, o que ocorre com probabilidade

0,2;
• se peça se A é defeituosa e B é perfeita (Ac ∩ B), o lucro é 30, o que ocorre com probabilidade
0,25;
• se as peças A e B são perfeitas (A ∩ B), o lucro é 40, o que ocorre com probabilidade 0,4;
dessa forma a distribuição do lucro é:
x −15 20 30 40 Total
P [X = x] 0, 15 0,2 0,25 0,4 1
b) o lucro esperado por peça produzida;
n
E [X] = xi P [X = xi ] = x1 P [X = x1 ] + x2 P [X = x2 ] + x3 P [X = x3 ] + x4 P [X = x4 ]
X
i=1
= −15 × 0, 15 + 20 × 0, 2 + 30 × 0, 25 + 40 × 0, 4 = 25, 25, (1)
c) a variância do lucro por peça produzida.

Sabemos que
h i
var [X] = E X 2 − (E [X])2 (2)
224
e, para o cálculo de var [X], encontraremos agora E [X 2 ].
h i n
E X2 = x2i P [X = xi ] = x21 P [X = x1 ] + x22 P [X = x2 ] + x23 P [X = x3 ] + x24 P [X = x4 ]
X
i=1
= (−15)2 × 0, 15 + 202 × 0, 2 + 302 × 0, 25 + 402 × 0, 4 = 978, 75. (3)
Substituindo os resultados obtidos em (1) e (3), na equação (2), temos
h i
var [X] = E X 2 − (E [X])2
= 978, 75 − (25, 25)2 = 978, 75 − 637, 5625
= 341, 1875.
225
36) A probabilidade de ocorrência de turbulência em um determinado percurso a ser feito por uma
aeronave é 0,4 em um circuito diário. Seja X : “número de voos com turbulência em um total de 7
desses voos”. Pede-se:
a) Qual a probabilidade de que haja turbulência em no máximo três voos?
Seja X: “número de voos com turbulência dentre os 7 estudados”, note que X é binomialmente
distribuída, sendo que, X ∼ Bin (7; 0, 4). Queremos determinar P [X ≤ 3] sendo que,
P [X ≤ 3] = P [X = 0] + P [X = 1] + P [X = 2] + P [X = 3]
7
!
P [X = 0] = 0, 40 (1 − 0, 4)7−0 = 1 × 1 × 0, 028 = 0, 028,
0
7
!
P [X = 1] = 0, 41 (1 − 0, 4)7−1 = 7 × 0, 4 × 0, 0467 = 0, 1306,
1
7
!
P [X = 2] = 0, 42 (1 − 0, 4)7−2 = 21 × 0, 16 × 0, 0778 = 0, 2613,
2
7
!
P [X = 3] = 0, 43 (1 − 0, 4)7−3 = 35 × 0, 064 × 0, 1296 = 0, 2903,
3
assim
P [X ≤ 3] = 0, 028 + 0, 1306 + 0, 2613 + 0, 2903
= 0, 7102
b) Qual o número esperado de voos com turbulência?
Sabemos que se X ∼ Bin (n; p) então E [X] = np, dessa forma, o número de voos com turbulência
dentre os 7 estudados é
E [X] = np = 7 · 0, 4 = 2, 8.
226
37) O gerente de uma franquia observou que o tempo de permanência de clientes na fila de pagamento
segue uma distribuição normal com média igual a 6 minutos e variância igual a 4 minutos2 . Determine
a probabilidade de que:
a) O tempo de permanência na fila seja exatamente 4 minutos.
Seja X : “tempo gasto na resolução da prova”.
Queremos determinar P [X = 4]. Note que a variável aleatória X é contínua e, assim sendo, qualquer
ponto tem probabilidade zero de acontecer, assim P [X = 4] = 0.
b) O tempo de permanência na fila seja de 4 a 8 minutos.
4 6 8 x −1 0 1 z
4−6 X −6 8−6

P [4 < X < 8] = P < <
2 2 2
= P [−1 < Z < 1] = P [−1 < Z < 0] + P [0 ≤ Z < 1]
= P [0 < Z < 1] + P [0 ≤ Z < 1] = 0, 3413 + 0, 3413
= 0, 6826.
Dessa maneira, a probabilidade de que o tempo gasto na resolução da prova esteja entre 4 e 8 minutos
é 0,6826.
c) O tempo de permanência na fila seja pelo menos 4 minutos.
X −6 4−6 2
" #
P [X ≥ 4] = P √ ≥ √ =P Z≥−
4 4 2
= P [Z ≥ −1] = P [−1 ≤ Z < 0] + P [Z ≥ 0]
= P [0 ≤ Z < 1] + 0, 5 = 0, 3413 + 0, 5
= 0, 8413.
227
4 6 x −1 0 z
é 0,8413.
228
38) A massa de uma caixa de peças é uma variável aleatória normal com média de 65 kg e desvio
padrão de 4 kg. Um carregamento de 120 caixas de peças selecionadas aleatoriamente é feito. Qual
é a probabilidade de que a carga tenha massa entre 7850 kg e 7900 kg?
Considere a variável Xi : “massa da carga”, para 1 ≤ i ≤ 120, dessa forma Xi ∼ N (65; 16). Seja Y =
X1 + X2 + · · · + X120 a variável que mede a massa das 120 caixas. Sabemos que Y ∼ N (7800; 1920),
pois
µY = 1 × 65 + 1 × 65 + · · · + 1 × 65 = 120 × 65 = 7800
e,
σY2 = 1 × 16 + 1 × 16 + · · · + 1 × 16 = 120 × 16 = 1920.
Queremos determinar P [7850 < Y < 7900], o que faremos a seguir.
7800 7850 7900 x 0 1.14 2.28 z
P [7850 < Y < 7900] = P [7850 − 7800 < Y − 7800 < 7900 − 7800]
7850 − 7800 Y − 7800 7900 − 7800
" #
= P √ < √ < √
1920 1920 1920
7850 − 7800 7900 − 7800
" #
= P <Z<
43, 8178 43, 8178
= P [0 ≤ Z < 2, 28] − P [0 ≤ Z < 1, 14]
= 0, 4887 − 0, 3729
= 0, 1158.
Dessa maneira, a probabilidade de que a massa da carga esteja entre 7850 kg e 7900 kg é 0,1158.
229
39) Em determinado setor de uma loja de departamentos, o número de produtos vendidos em um dia
pelos funcionários é uma variável aleatória discreta, com a seguinte distribuição de probabilidades:
Número de produtos 0 1 2 3 4 5 6
Probabilidade de venda 0,1 0,4 0,2 0,1 0,1 0,05 0,05
O número médio de produtos vendidos e a variância das vendas são respectivamente:
a) 2,05 e 2,55 d) 4,01 e 6,45
b) 3,10 e 6,75 e) 3,33 e 9,07
c) 2,05 e 4,02 f) n.d.r.a
E [X] = 0 × 0, 1 + 1 × 0, 4 + 2 × 0, 2 + 3 × 0, 1 + 4 × 0, 1 + 5 × 0, 05 + 6 × 0, 05
= 2, 05,
e, para o cálculo de var [X], precisamos encontrar também E [X 2 ], o que faremos a seguir.
h i
E X2 = 02 × 0, 1 + 12 × 0, 4 + 22 × 0, 2 + 32 × 0, 1 + 42 × 0, 1 + 52 × 0, 05 + 62 × 0, 05
= 6, 75.
h i
var [X] = E X 2 − (E [X])2
= 6, 75 − (2, 05)2 = 6, 75 − 4, 2
= 2, 55.
Dessa forma a resposta correta é a letra a).

230
40) Suponha que, em média, uma delegacia de uma pequena cidade prenda um indivíduo a cada dois
dias com sintomas de embriaguez. As probabilidades de que:
• em um certo dia sejam presos pelo menos dois indivíduos com sintomas de embriaguez;
• em uma semana sejam presos 4 indivíduos com sintomas de embriaguez;
são dadas respectivamente por:
a) 0,9098 e 0,1888; d) 0,0144 e 0,1888;
b) 0,2642 e 0,0912; e) 0,2642 e 0,1888;
c) 0,0902 e 0,0912; f) n.d.r.a.
Seja X : “número de indivíduos presos por dia com sintomas de embriaguez”, X ∼ Poi (0, 5) e,
queremos determinar P [X ≥ 2],
P [X ≥ 2] = 1 − P [X < 2] = 1 − P [X = 0] − P [X = 1]
e−0,5 0, 50 0, 6065 × 1
P [X = 0] = = = 0, 6065
0! 1
e−0,5 0, 51 0, 6065 × 0, 5
P [X = 1] = = = 0, 3033
1! 1
P [X ≥ 2] = 1 − 0, 6065 − 0, 3033 = 0, 0902
Dessa forma, a probabilidade de que sejam presos pelo menos dois indivíduos com sintomas de
embriaguez em um dia é 0,0902.
Seja Y : “número de indivíduos presos em uma semana com sintomas de embriaguez”, Y ∼ Poi (3, 5)
e, queremos determinar P [Y = 4],
e−3,5 3, 54 0, 0302 × 150, 0625

P [Y = 4] = = = 0, 1888
4! 24
Dessa forma, a probabilidade de que sejam presos 4 indivíduos em uma semana com sintomas de
embriaguez é 0,1888.
Assim a resposta correta é a letra f).

231
41) Com o objetivo de realizar uma análise da variação temporal e espacial dos registros de furto em
determinada cidade, foram consultados os dados fornecidos pela Gerência de Estatística e Análise
Criminal da mesma. Obteve-se a informação de que nas madrugadas de sábado, em um dos bairros
mais perigosos da cidade, 34% dos indivíduos que andam sozinhos têm seus objetos furtados. Se 9
pessoas passarem sozinhas por esse bairro na madrugada de sábado, qual a probabilidade de pelo
menos 7 delas sofrerem algum tipo de furto?
Seja X : “número de pessoas que sofreram algum furto em 9 selecionadas”. Desejamos determinar
P [X ≥ 7].
Note que
P [X ≥ 7] = P [X = 7] + P [X = 8] + P [X = 9] , (4)
assim
9
!
P [X = 7] = 0, 347 (1 − 0, 34)9−7 = 0, 0082, (5)
7
9
!
P [X = 8] = 0, 348 (1 − 0, 34)9−8 = 0, 0011, (6)
8
9
!
P [X = 9] = 0, 349 (1 − 0, 34)9−9 = 0, 0001. (7)
9
Substituindo (5), (6) e (7) em (4) temos
P [X ≥ 7] = 0, 0082 + 0, 0011 + 0, 0001 = 0, 0094.

232
42) Um estudo realizado por geógrafos e climatologistas dos Estados Unidos constatou que a categoria
4 de furacões (segundo a escala de classificação Saffir - Simpson), com ventos entre 209 a 251 km/h,
ataca o Estado da Flórida a uma taxa média de um em cada quatro anos. Nesse sentido, qual a
probabilidade da Flórida ser atingida por três furacões em uma década?
Sabemos que a média do número de furacões em 4 anos é 1, donde podemos determinar a média do
número de furacões em 10 anos através de uma regra de três, assim,
Anos Furacões
4 1
10 λ
1 × 10
e, efetuando-se a regra de três chegamos a λ = = 2, 5.
4
Seja X : “número de furacões em 10 anos”. Queremos determinar P [X = 3], dessa forma:
e−2,5 2, 53
P [X = 3] =
3!
0, 0821 × 15, 625
=
6
= 0, 2138.
233
43) A regra é clara: álcool e direção não têm espaço no mesmo jogo. O fato é que, mesmo que todo
mundo saiba disso, os acidentes de trânsito causados por pessoas embriagadas continuam aconte-
cendo. O excesso de velocidade é outro fator preocupante. Quanto maior a velocidade de um veículo
maior será a distância que ele ainda percorrerá com os freios acionados. Aliando-se excesso de álcool
e de velocidade temos um fator preocupante a ser considerado. Suponha que um indivíduo, dirigindo
sóbrio a 54 km/h, após a visualização de um obstáculo percorra, em média, 40 m até a parada total
do veículo, com variância de 16 m2 . Suponha também que um indivíduo alcoolizado a mesma velo-
cidade, após a visualização de um obstáculo percorra, em média, 65 m até a parada total do veículo,
com variância de 81 m2 . Se em ambos os casos, a distância percorrida segue distribuição normal,
determine:
a) Se um indivíduo sóbrio avistar um pedestre a 50 m de distância e imediatamente acionar os

freios, qual a probabilidade de que o pedestre seja atropelado se ele permaneceu imóvel?
Seja X : “distância percorrida pelo motorista sóbrio”, então X ∼ N (40; 16). A padronização é a
seguinte:
X − µX X − 40
Z= = ∼ N (0; 1) ,
σX 4
e queremos determinar P [X > 50].
X − 40 50 − 40

P [X > 50] = P [X − 40 > 50 − 40] = P >
4 4
50 − 40

= P Z> = P [Z > 2, 5]
4
= 0, 5 − P [0 ≤ Z ≤ 2, 5] = 0, 5 − 0, 4938
= 0, 0062.
Dessa maneira, a probabilidade de que o pedestre venha a ser atropelado pelo motorista sóbrio é
0,0062.
b) Se um indivíduo alcoolizado avistar um pedestre a 50 m de distância e imediatamente acionar os

freios, qual a probabilidade de que o pedestre seja atropelado se ele permaneceu imóvel?
Seja Y : “distância percorrida pelo motorista alcoolizado”, então Y ∼ N (65; 81). A padronização é
a seguinte:
Y − 65 Y − 65
Z= = ∼ N (0; 1) ,
9 9
234
e queremos determinar P [Y > 50];
Y − 65 50 − 65

P [Y > 50] = P [Y − 65 > 50 − 65] = P >
9 9
50 − 65

= P Z> = P [Z > −1, 6667]
9
= 0, 5 + P [0 ≤ Z ≤ 1, 6667] = 0, 5 + 0, 4525
= 0, 9525.
Dessa maneira, a probabilidade de que o pedestre venha a ser atropelado pelo motorista alcoolizado
é 0,9525.
235
44) Suponha que a quantidade de correspondências eletrônicas recebidas por dia em uma empresa é
normalmente distribuída com média de 4000 e-mails e desvio padrão de 200 e-mails. Pede-se:
a) Calcule a probabilidade de que essa empresa receba menos de 3650 e-mails.
Considere a variável X : “quantidade de correspondências eletrônicas recebidas em um dia”, então

X ∼ N (4000; 40000) e queremos determinar P [X < 3650].
3650 4000 x −1.75 0 z
X − 4000 3650 − 4000

" #
P [X < 3650] = P [X − 4000 < 3650 − 4000] = P √ < √
40000 40000
3650 − 4000 −350

= P Z< =P Z< = P [Z < −1, 75]
200 200
= P [Z > 1, 75] = 0, 5 − P [0 ≤ Z ≤ 1, 75]
= 0, 5 − 0, 4599
= 0, 0401.
Dessa maneira, o percentual de dias para as quais a quantidade de correspondências eletrônicas

recebidas em um dia é inferior a 3650 e-mails é 0,0401.
b) Se um determinado mês tem 31 dias, em quantos desses dias espera-se receber menos de 3650
e-mails?
Considere a variável Y : “número de dias em que a quantidade de correspondências eletrônicas

recebidas é inferior a 3650 dentre os 31 observados”, então Y ∼ Bin (n; p) e E [Y ] = np com n = 31
e p = 0, 0401, dessa forma,
E [Y ] = np = 31 · 0, 0401 = 1, 2418.
236
45) Sejam X e Y variáveis aleatórias independentes e com distribuição normal, sendo
X ∼ N (48; 16) e Y ∼ N (6; 9).
X
Admita a combinação linear W = − 3Y e calcule:
2
a) E [W ];
1 1 1

E [W ] = E X − 3Y = E X − E [3Y ] = E [X] − 3E [Y ]
2 2 2
1
= · 48 − 3 · 6 = 24 − 18
2
= 6
b) var [W ];
1 1 1

var [W ] = var X − 3Y = var X + var [3Y ] − 2 cov X, 3Y
2 2 2
1 1
2
= var [X] + (3)2 var [Y ] − 2 · · 3 cov [X, Y ]
2 2
1
= var [X] + 9 var [Y ] − 3 · 0
4
1
= · 16 + 9 · 9 − 0 = 4 + 81
4
= 85
c) P [12 ≤ W ≤ 21].
Utilizando o teorema da combinação linear e os resultados obtidos em a) e b), temos que W ∼

N (6; 85). Além disso, o que queremos é determinar P [12 < W < 21].
6 12 21 x 0 0.65 1.63 z
237
P [12 < W < 21] = P [12 − 6 < W − 6 < 21 − 6]

12 − 6 W −6 21 − 6
" #
= P √ < √ < √
85 85 85
12 − 6 21 − 6
" #
= P <Z<
9, 2195 9, 2195
= P [0 ≤ Z < 1, 63] − P [0 ≤ Z < 0, 65]
= 0, 4484 − 0, 2422
= 0, 2062.
Dessa maneira, P [12 < W < 21] = 0, 2062.

238
CAPÍTULO VIII
Testes de hipóteses
1) Com o objetivo de testar a influência do olfato sobre o sono dos recém nascidos, foi registrado o
tempo (em minutos) que um bebê com uma semana demora para adormecer. Foi considerado dois
grupos de bebês: grupo I (em que se colocou no berço uma peça de roupa utilizada pela mãe) e grupo
II (em que se colocou no berço uma peça de roupa utilizada por outra pessoa), sendo que é esperado
que as crianças do grupo I adormeçam mais rapidamente. Os resultados dos tempos médios obtidos
encontram-se no quadro seguinte:
n Média Desvio padrão

Grupo I 10 5,7 2,003
Grupo II 10 8,3 2,359
em que n é o número de elementos amostrados em cada grupo. Sabendo que a variável em estudo
segue uma distribuição normal, e que as variâncias populacionais são iguais, teste se existe diferença
significativa entre o tempo médio que os dois grupos de bebês levaram para adormecer, ao nível de
5% de significância.
Sejam X1 : “tempo que bebês do grupo I levam para adormecer” e X2 : “tempo que bebês do grupo
II levam para adormecer”. Então X1 ∼ N (µ1 ; σ12 ) e X2 ∼ N (µ2 ; σ22 ), além disso, as variâncias
populacionais são iguais, dessa forma podemos aplicar o teste t de Student para duas médias.

H : µ1 = µ2


0
P1) (Teste unilateral à esquerda)
: µ1 < µ2

H

1
P2) Temos que α = 0, 05 e a estatística de teste é
X̄1 − X̄2
T =s ∼ t(ν) ,
1 1
Sc2 +
n1 n2
sendo ν = n1 + n2 − 2 e,
(n1 − 1) S12 + (n2 − 1) S22
Sc2 = .
n1 + n2 − 2
239
P3) Temos que ν = 10 + 10 − 2 = 18 e ttab = t(18;5%) = 1, 7341. Assim a região crítica é:
RC = {t ∈ R| t < −1, 7341} ,
a qual é descrita em termos gráficos na Figura 1.
RRH0 RNRH0 RNRH0 RNRH0
−2,66 −1,7341 0
Figura 1: Região crítica do teste t, para duas médias, unilateral à esquerda.
P4) Temos que
X̄1 = 5, 7, X̄2 = 8, 3, S12 = 2, 0032 = 4, 012, S22 = 2, 3592 = 5, 5649,
(10 − 1) 4, 012 + (10 − 1) 5, 5649

Sc2 =
10 + 10 − 2
86, 1921
= = 4, 7885.
18
5, 7 − 8, 3
tcal = s = −2, 66.
1 1

4, 7885 +
10 10
Note que esse valor obtido já encontra-se na Figura 1, isso nos permitirá efetuarmos melhor as
conclusões necessárias no passo P5) a seguir.
P5) Como tcal ∈ RRH0 , há indícios para rejeitarmos H0 ao nível de 5% de significância. Dessa forma,
há indícios de que o tempo que bebês do grupo I levam para adormecer é inferior ao tempo que bebês
do grupo II levam para adormecer, ao nível de 5% de significância.
240
2) Um fabricante de queijo compra leite de uma série de fornecedores. Ele desconfia que alguns
desses fornecedores estão adicionando água ao leite para aumentar os seus lucros. O excesso de água
pode ser determinado pelo aumento da temperatura de congelamento do leite, que é em média de
−0, 545 ◦ C. Para testar esse fato, foram coletadas 6 amostras de lotes consecutivos de um fornecedor,
apontando uma média de −0, 5333 ◦ C com desvio padrão de 0, 0058 ◦ C. Supondo que a temperatura
de congelamento seja normalmente distribuída, podemos concluir que esse fornecedor adiciona água
ao leite, ao nível de 2,5% de significância?
Seja X : “temperatura de congelamento do leite”, então X ∼ N (µ; σ 2 ) com σ 2 desconhecido, dessa

forma, podemos aplicar o teste t de Student para uma média.

H : µ = −0, 545


0
P1) (Teste unilateral à direita)
: µ > −0, 545

H

1
X̄ − µ0
P2) Temos que α = 0, 025 e a estatística de teste é T = ∼ t(ν) sendo ν = n − 1.
SX
√
n
P3) Temos que ν = n − 1 = 6 − 1 = 5 e ttab = t(5;2,5%) = 2, 5706. Assim a região crítica é:
RC = {t ∈ R| t > 2, 5706} ,
RNRH0 RNRH0 RNRH0 RRH0
0 2,5706 4,94
Figura 2: Região crítica do teste t, para uma média, unilateral à direita.

241
P4) Temos que X̄ = −0, 5333 e SX = 0, 0058, assim
−0, 5333 − (−0, 545)

tcal = 0, 0058 = 4, 94.
√
6
P5) Como tcal ∈ RRH0 , há indícios para rejeitarmos H0 ao nível de 2, 5% de significância. Dessa
forma, há indícios de que a temperatura de congelamento do leite aumentou e, assim há indícios de
que esteja ocorrendo adicionamento de água ao leite.
242
3) Dois grupos de pacientes estão sendo estudados quanto a quantidade de colesterol “ruim” (LDL).
O primeiro grupo (X1 ) não praticava atividades físicas, enquanto que o segundo grupo (X2 ) foi
submetido a um rigoroso programa de atividades físicas. Supondo que a quantidade de colesterol
ruim é normalmente distribuída e com mesma variância populacional, determine com base na tabela
abaixo se o programa de atividades físicas foi eficaz no controle do colesterol ruim, ao nível de 1%
de significância.
n Média Desvio padrão

X1 14 162,85 8,11
X2 9 153,71 6,87
Sejam X1 : “quantidade de colesterol do grupo que não praticava exercícios físicos” e X2 : “quantidade
de colesterol do grupo que praticava exercícios físicos”. Então X1 ∼ N (µ1 ; σ12 ) e X2 ∼ N (µ2 ; σ22 ),
além disso, as variâncias populacionais são iguais, dessa forma podemos aplicar o teste t de Student
para duas médias.

H : µ1 = µ2


0
: µ1 > µ2

H

1
X̄1 − X̄2
P2) Temos que α = 0, 01 e a estatística de teste é T = s ∼ t(ν) , sendo ν = n1 + n2 − 2
1 1

2
Sc +
n1 n2
(n1 − 1) S12 + (n2 − 1) S22
e Sc2 = .
n1 + n2 − 2
RC = {t ∈ R| t > 2, 5176} ,
P4) Temos que
X̄1 = 162, 85, X̄2 = 153, 71, S12 = 8, 112 = 65, 7721, S22 = 6, 872 = 47, 1969,
(14 − 1) 65, 7721 + (9 − 1) 47, 1969

Sc2 =
14 + 9 − 2
1232, 6125
= = 58, 6958.
21
162, 85 − 153, 71
tcal = s = 2, 79.
1 1

58, 6958 +
14 9
243
0 2,5176 2,79
Figura 3: Região crítica do teste t, para duas médias, unilateral à direita.
a quantidade de colesterol do grupo que não praticava exercícios físicos é estatisticamente maior para
o primeiro grupo, portanto, o programa de testes físicos foi eficaz no controle do colesterol ruim, ao
nível de 1% de significância.
244
4) Oito alunos foram inquiridos quanto ao seu grau de satisfação (numa escala de 0 a 100) em relação
à sua Universidade, obtendo-se os seguintes resultados:
Média Variância
70,38 244,84
Sabendo que o grau de satisfação é normalmente distribuído, teste a hipótese de que o grau de
satisfação médio é igual a 72, ao nível de 5% de significância.
Seja X : “grau de satisfação em relação à sua Universidade”, então X ∼ N (µ; σ 2 ) com σ 2 desconhe-
cido, dessa forma, podemos aplicar o teste t de Student para uma média.

H : µ = 72


0
P1) (Teste bilateral)
: µ 6= 72

H

1
X̄ − µ0
SX
√
n
P3) Temos que ν = n − 1 = 8 − 1 = 7 e ttab = t(7;5%) = 2, 3646. Assim a região crítica é:
RC = {t ∈ R| t < −2, 3646 ou t > 2, 3646} ,
RRH0 RNRH0 RNRH0 RRH0
−2,3646 −0,29 0 2,3646
Figura 4: Região crítica do teste t, para uma média, bilateral.

245
√
P4) Temos que X̄ = 70, 38 e SX = 244, 84 = 15, 6474, assim
70, 38 − 72
tcal = 15, 6474 = −0, 29.
√
8
P5) Como tcal ∈ RN RH0 , não há indícios para rejeitarmos H0 ao nível de 5% de significância. Dessa
forma, não há indícios de que o grau de satisfação em relação à sua Universidade aumentou e, assim
não há indícios de que o grau de satisfação em relação à sua Universidade difira de 72.
246
5) O tempo médio de vida de uma lâmpada incandescente sob condições normais de funcionamento é
de 356 horas. Uma nova lâmpada apareceu recentemente no mercado e foi realizado um teste com dez
dessas lâmpadas e o tempo médio de vida foi de 380 horas com variância de 918,09 horas2 . Verifique
se o tempo de vida dessa lâmpada difere do tempo de vida das demais lâmpadas incandescentes.
Adote o nível de significância de 1%.
Seja X : “tempo médio de vida da nova lâmpada incandescente”, então X ∼ N (µ; σ 2 ) com σ 2
desconhecido, dessa forma, podemos aplicar o teste t de Student para uma média.

H : µ = 356


0
: µ 6= 356

H

1
X̄ − µ0
SX
√
n
RC = {t ∈ R| t < −3, 4995 ou t > 3, 4995} ,
−3,4995 0 2,24 3,4995
√
P4) Temos que X̄ = 380 e SX = 918, 09 = 30, 3, assim
380 − 356
tcal = 30, 3 = 2, 24.
√
8
247
forma, não há indícios de que o tempo médio de vida da nova lâmpada incandescente difira do tempo
médio de vida das lâmpadas padrão, ao nível de 1% de significância.
248
6) Realize um teste de qui-quadrado com os dados apresentados na tabela abaixo, para decidir se a
resposta sim ou não independe da pergunta ser a primeira ou a segunda. Utilize o nível de significância
de 5%.
Pergunta
Resposta Primeira Segunda
Sim 120 80
Não 95 105

H0 : Pergunta e Resposta são independentes


P1) 
H : Pergunta e Resposta não são independentes

1
h X
k
(Foij − Feij )2
χ =
2
∼ χ2(ν) ,
X
i=1 j=1 F eij
sendo ν = (h − 1)(k − 1).
P3) ν = (2 − 1)(2 − 1) = 1 e χ2(1;5%) = 3, 8415. A região crítica é
n o
RC = χ2 ∈ R χ2 > 3, 8415 ,
o que pode ser visto na Figura 6.
RNRH0 RRH0
0 3,8415 6,2854
Figura 6: Região crítica para o teste de χ2 .

249
Fo11 = 120, Fo12 = 80, Fo21 = 95, Fo22 = 105,
n1∗ = 200, n2∗ = 200, n∗1 = 215, n∗2 = 185,
n = 400,
200 × 215 200 × 185
Fe11 = = 107, 5, Fe12 = = 92, 5,
400 400
200 × 215 200 × 185
Fe21 = = 107, 5, Fe22 = = 92, 5.
400 400
P4) Temos que
Assim
Pergunta
Resposta Primeira Segunda Total
Sim 120(107,5) 80(92,5) (200)
Não 95(107,5) 105(92,5) (200)
Total (215) (185) (400)
Dessa forma
(120 − 107, 5)2 (80 − 92, 5)2 (95 − 107, 5)2 (105 − 92, 5)2
χ2cal = + + +
107, 5 92, 5 107, 5 92, 5
156, 25 156, 25 156, 25 156, 25
= + + +
107, 5 92, 5 107, 5 92, 5
= 1, 4535 + 1, 6892 + 1, 4535 + 1, 6892
∼
= 6, 2854
P5) Como χ2cal ∈ RRH0 há indícios para rejeitarmos H0 ao nível de 5% de significância. Dessa forma,
há indícios de que Pergunta e Resposta não são independentes, ao nível de 5% de significância.
250
7) Realizou-se uma pesquisa com os proprietários de certa marca de automóvel com o intuito de saber
a opinião deles acerca do desempenho e do consumo de combustível de seus carros. O resultado da
pesquisa de opiniões é resumido na tabela abaixo:
Desempenho
Consumo Ruim Bom
Alto 55 45
Baixo 70 30
Verificar ao nível de 1% de significância, se devemos considerar que, no consenso geral, desempenho

e consumo não guardam relação entre si.

H0 : Desempenho e Consumo são independentes


P1) 
H : Desempenho e Consumo não são independentes

1
k
h X
(Foij − Feij )2
χ2 = ∼ χ2(ν) ,
X
i=1 j=1 F eij
sendo ν = (h − 1)(k − 1).
n o
RC = χ2 ∈ R χ2 > 6, 6349 ,
P4) Temos que
Fo11 = 55, Fo12 = 45, Fo21 = 70, Fo22 = 30,
n1∗ = 100, n2∗ = 100, n∗1 = 125, n∗2 = 75,
n = 200,
100 × 125 100 × 75

Fe11 = = 62, 5, Fe12 = = 37, 5,
200 200
100 × 125 100 × 75
Fe21 = = 62, 5, Fe22 = = 37, 5.
200 200
Assim
251
RNRH0 RRH0
0 4,8 6,6349
Desempenho
Consumo Ruim Bom Total
Alto 55(62,5) 45(37,5) (100)
Baixo 70(62,5) 30(37,5) (100)
Total (125) (75) (200)
Dessa forma
(55 − 62, 5)2 (45 − 37, 5)2 (70 − 62, 5)2 (30 − 37, 5)2
χ2cal = + + +
62, 5 37, 5 62, 5 37, 5
56, 25 56, 25 56, 25 56, 25
= + + +
62, 5 37, 5 62, 5 37, 5
= 0, 9 + 1, 5 + 0, 9 + 1, 5
∼
= 4, 8
P5) Como χ2cal ∈ RN RH0 não há indícios para rejeitarmos H0 ao nível de 1% de significância. Dessa
forma, não há indícios de que Desempenho e Consumo são independentes, ao nível de 1% de signifi-
cância.
252
8) Os 36 alunos de uma turma são divididos ao acaso em dois grupos de 18. Para o primeiro grupo
o ensino de Matemática é feito usando elementos de multimídia. Enquanto isso, no segundo grupo
o ensino é feito pelo método tradicional. No final do período é aplicado um teste, comum aos dois
grupos, com os seguintes resultados:
Tamanho amostral Média Variância
Grupo 1 18 6,622 2,32
Grupo 2 18 5,744 0,74
Considerando as variâncias homogêneas, verifique se o desempenho dos alunos do grupo 1 é superior

ao desempenho dos alunos do grupo 2. Considere o nível de significância igual a 5%.
Sejam X1 : “desempenho dos alunos do primeiro grupo” e X2 : “desempenho dos alunos do segundo
grupo”. Então X1 ∼ N (µ1 ; σ12 ) e X2 ∼ N (µ2 ; σ22 ), além disso, as variâncias populacionais são iguais,
dessa forma podemos aplicar o teste t de Student para duas médias.

H0 : µ1 = µ2


P1)  (Teste unilateral à direita)
H : µ > µ

1 1 2
X̄1 − X̄2
1 1

Sc2 +
n1 n2
(n1 − 1) S12 + (n2 − 1) S22
e Sc2 = .
n1 + n2 − 2
RC = {t ∈ R| t > 1, 6909} ,
P4) Temos que
X̄1 = 6, 622, X̄2 = 5, 744, S12 = 2, 32, S22 = 0, 74,
(18 − 1) 2, 32 + (18 − 1) 0, 74
Sc2 =
18 + 18 − 2
52, 02
= = 1, 53.
34
6, 622 − 5, 744
tcal = s = 2, 13.
1 1

1, 53 +
18 18
253
0 1,6909 2,13
o desempenho dos alunos do primeiro grupo é estatisticamente maior que o desempenho do segundo
grupo, portanto, o programa de ensino com elementos de multimídia apresentou-se superior ao ensino
tradicional, ao nível de 5% de significância.
254
9) Considere a tabela abaixo, na qual estão os resultados de um estudo que investiga a efetividade
dos capacetes de segurança de bicicleta na prevenção de lesões na cabeça. Os dados consistem de
uma amostra aleatória de 793 indivíduos envolvidos em acidentes ciclísticos durante um período
especificado de um ano.
Uso de capacete
Lesão na cabeça Sim Não
Sim 17 218
Não 130 428
Para examinar a efetividade dos capacetes de segurança de bicicleta, desejamos saber se há associação
entre o incidente de lesão na cabeça e o uso dos capacetes pelos indivíduos envolvidos em acidentes.
Efetue um teste de significância ao nível de 1% de significância.

H : Uso de capacete e Lesão na cabeça são independentes


0
P1)
: Uso de capacete e Lesão na cabeça não são independentes

H

1
h X
k
(Foij − Feij )2
χ2 = ∼ χ2(ν) ,
X
i=1 j=1 F eij
sendo ν = (h − 1)(k − 1).
n o
RC = χ2 ∈ R χ2 > 6, 6349 ,

P4) Temos que
Fo11 = 17, Fo12 = 218, Fo21 = 130, Fo22 = 428,
n1∗ = 235, n2∗ = 558, n∗1 = 147, n∗2 = 646,
n = 793,
235 × 147 235 × 646

Fe11 = = 43, 5624, Fe12 = = 191, 4376,
793 793
558 × 147 558 × 646
Fe21 = = 103, 4376, Fe22 = = 454, 5624.
793 793
255
RNRH0 RRH0
0 6,6349 28,2555
Uso de capacete
Lesão na cabeça Sim Não Total
Sim 17(43,5624) 218(191,4376) (235)
Não 130(103,4376) 428(454,5624) (558)
Total (147) (646) (793)
Assim
Dessa forma
(17 − 43, 5624)2 (218 − 191, 4376)2 (130 − 103, 4376)2 (428 − 454, 5624)2
χ2cal = + + +
43, 5624 191, 4376 103, 4376 454, 5624
705, 5611 705, 5611 705, 5611 705, 5611
= + + +
43, 5624 191, 4376 103, 4376 454, 5624
= 16, 1966 + 3, 6856 + 6, 8211 + 1, 5522
∼
= 28, 2555
há indícios de que Uso de capacete e Lesão na cabeça não são independentes, ao nível de 1% de
significância.
256
10) Dois grupos de estudantes fizeram exames finais de estatística. Somente um grupo recebeu pre-
paração formal para o exame; o outro leu o texto recomendado, mas nunca compareceu às aulas. Os
resultados obtidos ao final do curso foram:
Frequência
Situação Sim Não
Aprovado 22 10
Reprovado 8 18
Os dados mostram evidências suficientes para afirmar que existe associação entre frequência às aulas
e aprovação no exame final? Use nível de significância igual a 5%.

H0 : Frequência e Situação são independentes


P1) 
H : Frequência e Situação não são independentes

1
k
h X
(Foij − Feij )2
χ2 = ∼ χ2(ν) ,
X
i=1 j=1 F eij
sendo ν = (h − 1)(k − 1).
n o
RC = χ2 ∈ R χ2 > 3, 8415 ,
P4) Temos que
Fo11 = 22, Fo12 = 10, Fo21 = 8, Fo22 = 18,
n1∗ = 32, n2∗ = 26, n∗1 = 30, n∗2 = 28,
n = 58,
32 × 30 32 × 28
Fe11 = = 16, 5517, Fe12 = = 15, 4483,
58 58
26 × 30 26 × 28
Fe21 = = 13, 4483, Fe22 = = 12, 5517.
58 58
Assim
257
RNRH0 RRH0
0 3,8415 8,287
Frequência
Situação Sim Não Total
Aprovado 22(16,5517) 10(15,4483) (32)
Reprovado 8(13,4483) 18(12,5517) (26)
Total (30) (28) (58)
Dessa forma
(22 − 16, 5517)2 (10 − 15, 4483)2 (8 − 13, 4483)2 (18 − 12, 5517)2
χ2cal = + + +
16, 5517 15, 4483 13, 4483 12, 5517
29, 684 29, 684 29, 684 29, 684
= + + +
16, 5517 15, 4483 13, 4483 12, 5517
= 1, 7934 + 1, 9215 + 2, 2073 + 2, 3649
∼
= 8, 287
há indícios de que Frequência e Situação não são independentes, ao nível de 5% de significância.
258
11) A máquina de encher garrafas de refrigerantes de uma determinada empresa está regulada para
fazê-lo sob um modelo normal, colocando 290 ml no recipiente. Para verificar se a máquina estava
regulada, selecionou-se aleatoriamente uma amostra de 8 refrigerantes obtendo-se os seguintes valores:
289 290 293 294 297 298 299 303
Há indícios, ao nível de 10% de significância que a máquina esteja desregulada?
Seja X : “quantidade de líquido colocada pela máquina na garrafa de refrigerante”, então X ∼

N (µ; σ 2 ) com σ 2 desconhecido, dessa forma, podemos aplicar o teste t de Student para uma média.

H : µ = 290


0
: µ 6= 290

H

1
X̄ − µ0
S
√X
n
RC = {t ∈ R| t < −1, 8946 ou t > 1, 8946} ,
−1,8946 0 1,8946 3,2

259
P4) Temos que

8
P
Xi
2363
X̄ = i=1
= = 6, 622
8 8
e v
u 8 2
u P
Xi
u v
(2363)2
u
u 8
uP
i=1
u
X2 − u 698129 −
u
t i=1 i 8 8
u
SX = = = 4, 7491
t
8−1 8−1
assim
295, 375 − 290
tcal = 4, 7491 = 3, 2.
√
8
P5) Como tcal ∈ RRH0 , há indícios para rejeitarmos H0 ao nível de 10% de significância. Dessa
forma, há indícios de que a quantidade de líquido colocada pela máquina na garrafa de refrigerante
difira de 290 ml, ao nível de 10% de significância.
260
12) Na tabela a seguir é apresentado um resumo de um estudo conduzido com alguns estudantes.
Foram amostrados 200 homens e esses foram categorizados quanto ao hábito de fumar e praticar
exercícios físicos. Teste a hipótese de que o hábito de fumar e o hábito de praticar exercícios físicos
são duas variáveis aleatórias independentes. Adote um nível de significância de 5% e MF=“Muito
frequente”; FR=“Frequente”; OC=“Ocasionalmente”; N=“Nunca.”
Hábito de praticar exercícios

Hábito de fumar
MF FR OC N
Sim 7 10 13 20
Ocasionalmente 24 23 25 28
Não 18 15 8 9

H : Hábito de fumar e Hábito de praticar exercícios são independentes


0
P1)
: Hábito de fumar e Hábito de praticar exercícios não são independentes

H

1
k
h X
(Foij − Feij )2
χ2 = ∼ χ2(ν) ,
X
i=1 j=1 F eij
sendo ν = (h − 1)(k − 1).
n o
RC = χ2 ∈ R χ2 > 12, 5916 ,

P4) Temos que
Fo11 = 7, Fo12 = 10, Fo13 = 13, Fo14 = 20,

Fo21 = 24, Fo22 = 23, Fo23 = 25, Fo24 = 28,
Fo31 = 18, Fo32 = 15, Fo33 = 8, Fo34 = 9,
n1∗ = 50, n2∗ = 100, n3∗ = 50, n∗1 = 49,

n∗2 = 48, n∗3 = 46, n∗4 = 57, n = 200,
Assim
261
RNRH0 RRH0
0 11,7821 12,5916

50 × 49 50 × 48 50 × 46
Fe11 = = 12, 25, Fe12 = = 12, Fe13 = = 11, 5,
200 200 200
50 × 57 100 × 49 100 × 48
Fe14 = = 14, 25, Fe21 = = 24, 5, Fe22 = = 24,
200 200 200
100 × 46 100 × 57 50 × 49
Fe23 = = 23. Fe24 = = 28, 5, Fe31 = = 12, 25,
200 200 200
50 × 48 50 × 46 50 × 57
Fe32 = = 12, Fe33 = = 11, 5, Fe34 = = 14, 25.
200 200 200
Hábito de praticar exercícios
Hábito de fumar Total
MF FR OC N
Sim 7(12,25) 10(12) 13(11,5) 20(14,25) (50)
Ocasionalmente 24(24,5) 23(24) 25(23) 28(28,5) (100)
Não 18(12,25) 15(12) 8(11,5) 9(14,25) (50)
Total (49) (48) (46) (57) (200)
Dessa forma
(7 − 12, 25)2 (10 − 12)2 (13 − 11, 5)2 (20 − 14, 25)2 (24 − 24, 5)2 (23 − 24)2
χ2cal = + + + + +
12, 25 12 11, 5 14, 25 24, 5 24
(25 − 23) 2
(28 − 28, 5)2
(18 − 12, 25)2
(15 − 12) 2
(8 − 11, 5)2
(9 − 14, 25)2
+ + + + + +
23 28, 5 12, 25 12 11, 5 14, 25
27, 5625 4 2, 25 33, 0625 0, 25 1 4 0, 25 33, 0625 9
= + + + + + + + + +
12, 25 12 11, 5 14, 25 24, 5 24 23 28, 5 12, 25 12
12, 25 27, 5625
+ +
11, 5 14, 25
= 2, 25 + 0, 3333 + 0, 1957 + 2, 3202 + 0, 0102 + 0, 0417 + 0, 1739 + 0, 0088 + 2, 699 + 0, 75
+ 1, 0652 + 1, 9342
∼
= 11, 7821
262
forma, não há indícios de que Hábito de fumar e Hábito de praticar exercícios são independentes, ao
nível de 5% de significância.
263
13) O tempo médio, por operário, para executar uma tarefa tem sido 100 minutos. Introduziu-se uma
modificação para diminuir esse tempo médio e, após certo período, sorteou-se uma amostra de 16
operários, medindo-se o tempo de execução de cada um. Nessa amostra, o tempo médio foi de 95
minutos e com desvio padrão de 12 minutos. Realize um teste de hipóteses para verificar se esses
resultados trazem evidências estatísticas da melhora desejada, ao nível de 1% de significância.
Seja X : “tempo que o operário leva para executar a tarefa”, então X ∼ N (µ; σ 2 ) com σ 2 desconhe-
cido, dessa forma, podemos aplicar o teste t de Student para uma média.

H : µ = 100


0
: µ < 100

H

1
X̄ − µ0
SX
√
n
RC = {t ∈ R| t < −2, 6025} ,
−2,6025 −1,67 0
Figura 13: Região crítica do teste t, para uma média, unilateral à esquerda.
P4) Temos que X̄ = 95 e SX = 12, assim
95 − 100
tcal = 12 = −1, 67.
√
16
264
forma, não há indícios de que o tempo que o operário leva para executar a tarefa diminuiu e, assim
não há indícios de que a modificação introduzida tenha surtido efeito.
265
14) Um estudo realizado com 609 homens, com idades entre 40 e 76 anos, forneceu os resultados
apresentados na tabela a seguir. Adote o nível de significância igual a 1% e teste a hipótese de que
o nível de catecolamina no sangue e a incidência de doença coronariana são independentes.
Nível de catecolamina
Doença coronariana
Alto Baixo
Presente 27 44
Ausente 95 443

H0 : Doença coronariana e Nível de catecolamina são independentes


P1) 
H : Doença coronariana e Nível de catecolamina não são independentes

1
h X
k
(Foij − Feij )2
χ2 = ∼ χ2(ν) ,
X
i=1 j=1 F eij
sendo ν = (h − 1)(k − 1).
n o
RC = χ2 ∈ R χ2 > 6, 6349 ,

RNRH0 RRH0
0 6,6349 16,2465
P4) Temos que
Assim
266
Fo11 = 27, Fo12 = 44, Fo21 = 95, Fo22 = 443,
n1∗ = 71, n2∗ = 538, n∗1 = 122, n∗2 = 487,
n = 609,
71 × 122 71 × 487
Fe11 = = 14, 2233, Fe12 = = 56, 7767,
609 609
538 × 122 538 × 487
Fe21 = = 107, 7767, Fe22 = = 430, 2233.
609 609
Doença coronariana
Nível de catecolamina Alto Baixo Total
Presente 27(14,2233) 44(56,7767) (71)
Ausente 95(107,7767) 443(430,2233) (538)
Total (122) (487) (609)
Dessa forma
(27 − 14, 2233)2 (44 − 56, 7767)2 (95 − 107, 7767)2 (443 − 430, 2233)2
χ2cal = + + +
14, 2233 56, 7767 107, 7767 430, 2233
163, 2441 163, 2441 163, 2441 163, 2441
= + + +
14, 2233 56, 7767 107, 7767 430, 2233
= 11, 4772 + 2, 8752 + 1, 5147 + 0, 3794
∼
= 16, 2465
há indícios de que Doença coronariana e Nível de catecolamina não são independentes, ao nível de
267
15) A tabela a seguir apresenta os resultados de um ensaio com 154 pacientes que apresentavam dor
abdominal. Ao grupo Tratamento foi administrado brometo de pinavério (dois comprimidos/dia);
ao grupo controle foi administrado um placebo (fármaco inerte).
Permanência da dor abdominal

Grupo
Sim Não
Tratamento 6 57
Controle 30 61
Teste a independência entre as variáveis, adote 5% de significância.


H : Grupo e Permanência da dor abdominal são independentes


0
P1)
: Grupo e Permanência da dor abdominal não são independentes

H

1
h X
k
(Foij − Feij )2
χ2 = ∼ χ2(ν) ,
X
i=1 j=1 Feij
sendo ν = (h − 1)(k − 1).
n o
RC = χ2 ∈ R χ2 > 3, 8415 ,

RNRH0 RRH0
0 3,8415 11,4223

268
P4) Temos que
Fo11 = 6, Fo12 = 57, Fo21 = 30, Fo22 = 61,
n1∗ = 63, n2∗ = 91, n∗1 = 36, n∗2 = 118,
n = 154,
63 × 36 63 × 118
Fe11 = = 14, 7273, Fe12 = = 48, 2727,
154 154
91 × 36 91 × 118
Fe21 = = 21, 2727, Fe22 = = 69, 7273.
154 154
Assim
Grupo
Permanência da dor abdominal Total
Sim Não
Tratamento 6(14,7273) 57(48,2727) (63)
Controle 30(21,2727) 61(69,7273) (91)
Total (36) (118) (154)
Dessa forma
(6 − 14, 7273)2 (57 − 48, 2727)2 (30 − 21, 2727)2 (61 − 69, 7273)2
χ2cal = + + +
14, 7273 48, 2727 21, 2727 69, 7273
76, 1658 76, 1658 76, 1658 76, 1658
= + + +
14, 7273 48, 2727 21, 2727 69, 7273
= 5, 1717 + 1, 5778 + 3, 5804 + 1, 0923
∼
= 11, 4223
há indícios de que Grupo e Permanência da dor abdominal não são independentes, ao nível de 5%
de significância.
269
16) Com a finalidade de verificar se o nível nutricional da mãe afeta a massa do recém-nascido, foram
observadas duas amostras de nascimentos. A primeira foi extraída de uma maternidade particular
(localidade X1 ), onde as mães são, em geral, bem nutridas. A outra amostra foi tirada de uma
maternidade pública, numa região extremamente pobre (localidade X2 ), onde acredita-se que as
mães não são bem nutridas. Os dados observados apresentaram:
Localidade Tamanho amostral Massa média (kg) Desvio padrão (kg)

X1 18 4,1 1,6
X2 20 2,7 2,4
Realize um teste de hipóteses para verificar se há evidência suficiente de que as crianças da localidade
X1 nascem em média, com massa superior aos recém nascidos da localidade X2 . Suponha que as
massas nas duas localidades são normalmente distribuídas com mesma variância e utilize o nível de
significância igual a 1%.
Sejam X1 : “massa das crianças nascidas na localidade X1 ” e X2 : “massa das crianças nascidas na
localidade X2 ”. Então X1 ∼ N (µ1 ; σ12 ) e X2 ∼ N (µ2 ; σ22 ), além disso, as variâncias populacionais
são iguais, dessa forma podemos aplicar o teste t de Student para duas médias.

H0 : µ1 = µ2


H : µ > µ

1 1 2
X̄1 − X̄2
1 1

2
Sc +
n1 n2
(n1 − 1) S12 + (n2 − 1) S22
e Sc2 = .
n1 + n2 − 2
RC = {t ∈ R| t > 2, 4345} ,
P4) Temos que
X̄1 = 4, 1, X̄2 = 2, 7, S12 = 2, 56, S22 = 5, 76,
(18 − 1) 2, 56 + (20 − 1) 5, 76
Sc2 =
18 + 20 − 2
152, 96
= = 4, 2489.
36
270
0 2,09 2,4345
4, 1 − 2, 7
tcal = s = 2, 09.
1 1

4, 2489 +
18 20
forma, não há indícios de que o massa das crianças nascidas na localidade X1 seja estatisticamente
maior que o massa das crianças nascidas na localidade X2 , ao nível de 1% de significância.
271
17) Suspeita-se que o tempo médio, por operário, para executar uma tarefa, é maior para operários
do sexo masculino. Nádia tomou duas amostras: operários do sexo masculino e do sexo feminino,
medindo o tempo de execução de cada um, tendo determinado que as variâncias são homogêneas.
Seus resultados foram: o tempo médio da amostra de 14 operários do sexo masculino foi de 94,5
minutos, e o desvio padrão foi de 10 minutos; e o tempo médio da amostra de 15 operárias do sexo
feminino foi de 89 minutos, e o desvio padrão foi de 9 minutos. Realize um teste de hipóteses para
verificar se os operários do sexo masculino são, em média, mais lentos (demoram mais) para executar
a tarefa. Adote o nível de significância 0, 025.
Sejam X1 : “tempo que os operários do sexo masculino levam para executar a tarefa” e X2 : “tempo
que as operárias do sexo feminino levam para executar a tarefa”. Então X1 ∼ N (µ1 ; σ12 ) e X2 ∼
N (µ2 ; σ22 ), além disso, as variâncias populacionais são iguais, dessa forma podemos aplicar o teste t
de Student para duas médias.

H : µ1 = µ2


0
: µ1 > µ2

H

1
X̄1 − X̄2
1 1

Sc2 +
n1 n2
(n1 − 1) S12 + (n2 − 1) S22
e Sc2 = .
n1 + n2 − 2
P3) Temos que ν = 14 + 15 − 2 = 27 e ttab = t(27;2,5%) = 2, 0518. Assim a região crítica é:
RC = {t ∈ R| t > 2, 0518} ,
P4) Temos que
X̄1 = 94, 5, X̄2 = 89, S12 = 100, S22 = 81,
(14 − 1) 100 + (15 − 1) 81

Sc2 =
14 + 15 − 2
2434
= = 90, 1481.
27
94, 5 − 89
tcal = s = 1, 56.
1 1

90, 1481 +
14 15
272
0 1,56 2,0518
P5) Como tcal ∈ RN RH0 , não há indícios para rejeitarmos H0 ao nível de 2,5% de significância. Dessa
forma, não há indícios de que o tempo que os operários do sexo masculino levam para executar a
tarefa seja estatisticamente maior que o tempo que as operárias do sexo feminino levam para executar
a tarefa, ao nível de 2,5% de significância.
273
18) Em uma determinada universidade a média em uma determinada disciplina tem distribuição
normal e a média tem sido de 64 pontos. Implantou-se um programa de monitorias e tutorias nessa
disciplina a fim de aumentar a nota média e, consequentemente diminuir a reprovação. Ao final do
semestre, 9 alunos foram selecionados observando-se suas notas, obtendo-se:
65 70 75 64 69 70 72 68 77
Realize um teste de hipóteses para verificar se há indícios, ao nível de 1% de significância que o

programa de monitorias e tutorias foi eficaz.
Seja X : “nota obtida pelos alunos”, então X ∼ N (µ; σ 2 ) com σ 2 desconhecido, dessa forma, podemos
aplicar o teste t de Student para uma média.

H0 : µ = 64


H : µ > 64

1
X̄ − µ0
S
√X
n
RC = {t ∈ R| t > 2, 8965} ,
0 2,8965 4,34
274
P4) Temos que

9
P
Xi
630, 0012
X̄ = i=1
= = 94, 5
9 9
e v
u 9 2
u P
Xi
u v
(630, 0012)2
u
u 9
uP
i=1
u
X2 − u 44237, 7018 −
u
t i=1 i 9 9
u
SX = = = 4, 1463
t
9−1 9−1
assim
70, 0001 − 64
tcal = 4, 1463 = 4, 34.
√
9
há indícios de que a nota obtida pelos alunos aumentou e, assim há indícios de que o programa de
monitorias e tutorias foi eficaz.
275
19) O técnico de uma equipe de basquete soube que, a utilização de cafeína por parte dos jogadores
pode melhorar o desempenho dos mesmos durante os jogos. Com o intuito de testar essa hipótese,
ele realizou um treino entre seus atletas e, dividiu-os aleatoriamente em dois grupos dando-lhes uma
pílula meia hora antes do treino. O primeiro grupo (X1 ), recebeu uma pílula de farinha (placebo),
enquanto que, o grupo (X2 ) recebeu uma pílula com cafeína. Em uma série de 30 lances livres de
cada atleta, ele anotou o número de acertos que cada um deles teve, obtendo:
X1 22 13 16 9 15
X2 28 23 15 15 14
Suponha que o número de cestas de cada um dos grupos seja normalmente distribuído e com mesma
variância populacional nos dois grupos, isto é, X1 ∼ N (µ1 ; σ 2 ) e X2 ∼ N (µ2 ; σ 2 ). Há indícios, ao
nível de 1% de significância, que a cafeína melhore o desempenho dos jogadores?
Sejam X1 : “desempenho do grupo de jogadores que recebeu a pílula com o placebo” e X2 : “de-
sempenho do grupo de jogadores que recebeu a pílula com cafeína”. Então X1 ∼ N (µ1 ; σ12 ) e
X2 ∼ N (µ2 ; σ22 ), além disso, as variâncias populacionais são iguais, dessa forma podemos aplicar o
teste t de Student para duas médias.

H : µ1 = µ2


0
: µ1 < µ2

H

1
X̄1 − X̄2
1 1

2
Sc +
n1 n2
(n1 − 1) S12 + (n2 − 1) S22
e Sc2 = .
n1 + n2 − 2
RC = {t ∈ R| t < −2, 8965} ,

276
−2,8965 −1,15 0
P4) Temos que
5
P
X1i
75
X̄1 = i=1
= = 15,
5 5
5
P
X2i
95
X̄2 = i=1
= = 19,
5 5
5 2
P
5 X1i
2
− i=1
P
X1i 5
2
1215 − (75)
S12 = i=1
= 5
= 17, 1915,
5−1 5−1
5
2
P
5 X2i
2
− i=1
P
X2i 5
2
1959 − (95)
S22 = i=1
= 5
= 81,
5−1 5−1
(5 − 1) 17, 1915 + (5 − 1) 81
Sc2 =
5+5−2
392, 766
= = 49, 0958.
8
15 − 19
tcal = s = −1, 15.
1 1

49, 0958 +
5 5
277
forma, não há indícios de que o desempenho do grupo de jogadores que recebeu a pílula com o placebo
seja estatisticamente inferior ao desempenho do grupo de jogadores que recebeu a pílula com cafeína,
ao nível de 1% de significância.
278
20) Em um estudo que objetivava estudar a pressão sanguínea (mmHg) e o nível de colesterol
(mg/100cm) de indivíduos adultos, obteve-se a seguinte tabela:
Pressão
Colesterol
Menos que 127 De 127 a 166 Mais que 166
Menos que 200 117 168 22
De 200 a 260 204 418 63
Mais que 260 67 145 33
Realize um teste de hipóteses, ao nível de 1% de significância, para verificar se existe independência

entre as variáveis sob estudo.

H : Colesterol e Pressão são independentes


0
P1)
: Colesterol e Pressão não são independentes

H

1
h X
k
(Foij − Feij )2
χ =
2
∼ χ2(ν) ,
X
i=1 j=1 Feij
sendo ν = (h − 1)(k − 1).
n o
RC = χ2 ∈ R χ2 > 13, 2767 ,

P4) Temos que
Fo11 = 117, Fo12 = 168, Fo13 = 22, Fo21 = 204, Fo22 = 418,
Fo23 = 63, Fo31 = 67, Fo32 = 145, Fo33 = 33,
n1∗ = 307, n2∗ = 685, n3∗ = 245, n1∗ = 388,

n2∗ = 731, n∗3 = 118, n = 1237,
307 × 388 307 × 731 685 × 118

Fe11 = = 96, 2943, Fe12 = = 181, 4204, Fe13 = = 29, 2854,
1237 1237 1237
685 × 388 685 × 731 685 × 118
Fe21 = = 214, 8585, Fe22 = = 404, 7979, Fe23 = = 65, 3436,
1237 1237 1237
307 × 388 307 × 731 685 × 118
Fe31 = = 76, 8472, Fe32 = = 144, 7817, Fe33 = = 23, 3711.
1237 1237 1237
279
RNRH0 RRH0
0 13,2767 13,5501
Pressão
Colesterol Menos que 127 De 127 a 166 Mais que 166 Total
Menos que 200 117(96,2943) 168(181,4204) 22(29,2854) (307)
De 200 a 260 204(214,8585) 418(404,7979) 63(65,3436) (685)
Mais que 260 67(76,8472) 145(144,7817) 33(23,3711) (245)
Total (388) (731) (118) (1237)
Assim
Dessa forma
(117 − 96, 2943)2 (168 − 181, 4204)2 (22 − 29, 2854)2 (204 − 214, 8585)2
χ2cal = + + +
96, 2943 181, 4204 29, 2854 214, 8585
(418 − 404, 7979) 2
(63 − 65, 3436)2
(67 − 76, 8472)2
(145 − 144, 7817)2
+ + + +
404, 7979 65, 3436 76, 8472 144, 7817
(33 − 23, 3711) 2
+
23, 3711
428, 726 180, 1071 53, 0771 117, 907 174, 2954 5, 4925 96, 9673
= + + + + + +
96, 2943 181, 4204 29, 2854 214, 8585 404, 7979 65, 3436 76, 8472
0, 0477 92, 7157
+ +
144, 7817 23, 3711
= 4, 4522 + 0, 9928 + 1, 8124 + 0, 5488 + 0, 4306 + 0, 0841 + 1, 2618 + 0, 0003 + 3, 9671
∼
= 13, 5501
há indícios de que Colesterol e Pressão não são independentes, ao nível de 1% de significância.
280
21) Em um trecho de uma rodoviária estadual, quando é utilizado o radar, são verificadas em média
7 infrações diárias por excesso de velocidade. O chefe de polícia acredita que esse número pode ter
aumentado. Para verificar isso, o radar foi mantido por 10 dias consecutivos, e em média obteve-se
8 infrações diárias com desvio-padrão de 2,11. Verifique, supondo normalidade e usando nível de
significância igual a 0, 05, se houve aumento no número de infrações.
Seja X : “número de infrações diárias por excesso de velocidade”, então X ∼ N (µ; σ 2 ) com σ 2
desconhecido, dessa forma, podemos aplicar o teste t de Student para uma média.

H : µ=7


0
: µ>7

H

1
X̄ − µ0
SX
√
n
RC = {t ∈ R| t > 1, 8331} ,
0 1,5 1,8331
P4) Temos que X̄ = 8 e SX = 2, 11, assim
8−7
tcal = 2, 11 = 1, 5.
√
10
281
forma, não há indícios de que o número de infrações diárias por excesso de velocidade aumentou e,
assim não há ao nível de 5% de significância.
282
22) O INMETRO está investigando se a quantidade de Paracetamol num dado comprimido está de
acordo com o valor nominal estampado no rótulo do medicamento (750 mg). Numa amostra de 20
comprimidos, a média encontrada foi de 738 mg com um desvio-padrão de 11,85 mg. Teste a hipótese
de que a quantidade média de Paracetamol é igual ao valor nominal informado pelo fabricante. Utilize
nível de significância igual a 0, 05 e suponha normalidade da variável estudada.
Seja X : “quantidade de Paracetamol num dado comprimido”, então X ∼ N (µ; σ 2 ) com σ 2 desco-
nhecido, dessa forma, podemos aplicar o teste t de Student para uma média.

H : µ = 750


0
: µ 6= 750

H

1
X̄ − µ0
SX
√
n
RC = {t ∈ R| t < −2, 093 ou t > 2, 093} ,
−4,53 −2,093 0 2,093
√
P4) Temos que X̄ = 738 e SX = 140, 4225 = 11, 85, assim
738 − 750
tcal = 11, 85 = −4, 53.
√
20
283
há indícios de que a quantidade de Paracetamol num dado comprimido difira do padrão, ao nível de
284
23) Num estudo comparativo do tempo médio de adaptação, uma amostra aleatória, de 28 homens e
34 mulheres de um grande complexo industrial, produziu os seguintes resultados:
Mulheres Homens
X̄ 3,7 anos 3,2 anos
S (X) 0,9 anos 0,8 anos
Determinar se há diferença entre o tempo de adaptação entre homens e mulheres. Utilize nível de
significância igual a 0,05 e suponha normalidade das variáveis estudadas e homocedasticidade das
variâncias.
Sejam X1 : “tempo de adaptação dos homens” e X2 : “tempo de adaptação das mulheres”. Então
X1 ∼ N (µ1 ; σ12 ) e X2 ∼ N (µ2 ; σ22 ), além disso, as variâncias populacionais são iguais, dessa forma
podemos aplicar o teste t de Student para duas médias.

H : µ1 = µ2


0
: µ1 6= µ2

H

1
X̄1 − X̄2
1 1

2
Sc +
n1 n2
(n1 − 1) S12 + (n2 − 1) S22
e Sc2 = .
n1 + n2 − 2
RC = {t ∈ R| t < −2, 0003 ou t > 2, 0003} ,
P4) Temos que
X̄1 = 3, 7,
X̄2 = 3, 2,
S12 = (0, 9)2 = 0, 81,
S22 = (0, 8)2 = 0, 64,

(28 − 1) 0, 81 + (34 − 1) 0, 64 42, 99
Sc2 = = = 0, 7165,
28 + 34 − 2 60
e
3, 7 − 3, 2
tcal = s = 2, 31.
1 1

0, 7165 +
28 34
285
−2,0003 0 2,0003 2,31
Figura 23: Região crítica do teste t, para duas médias, bilateral.
forma, o tempo de adaptação dos homens é estatisticamente diferente do tempo de adaptação
das mulheres, ao nível de 5% de significância.
286
24) Uma pesquisa foi desenvolvida com o intuito de avaliar a opinião sobre a qualidade do atendimento
médico em clínicas especializadas e não especializadas. Um total de 350 pessoas foram entrevistadas
quanto a opinião do atendimento (bom, regular e ruim) nos dois tipos de clínicas, e os resultados
encontram-se na tabela de frequência abaixo. Você diria que a opinião depende do tipo de clínica na
qual o paciente foi atendido? Utilize nível de significância igual a 0, 025.
Opinião
Clínica Bom Regular Ruim
Especializadas 73 37 40
Não especializadas 94 61 45

H : Clínica e Opinião são independentes


0
P1)
: Clínica e Opinião não são independentes

H

1
k
h X
(Foij − Feij )2
χ2 = ∼ χ2(ν) ,
X
i=1 j=1 F eij
sendo ν = (h − 1)(k − 1).
P3) ν = (2 − 1)(3 − 1) = 2 e χ2(2;2,5%) = 7, 3778. A região crítica é
n o
RC = χ2 ∈ R χ2 > 7, 3778 ,

RNRH0 RRH0
0 1,7043 7,3778

287
Fo11 = 73, Fo12 = 37, Fo13 = 40,

Fo21 = 94, Fo22 = 61, Fo23 = 45,
n1∗ = 150, n2∗ = 200, n1∗ = 167,

n2∗ = 98, n∗3 = 85, n = 350,
150 × 167 150 × 98 200 × 85
Fe11 = = 71, 5714, Fe12 = = 42, Fe13 = = 36, 4286,
350 350 350
200 × 167 200 × 98 200 × 85
Fe21 = = 95, 4286, Fe22 = = 56, Fe23 = = 48, 5714,
350 350 350
P4) Temos que
Assim
Opinião
Clínica Bom Regular Ruim Total
Especializadas 73(71,5714) 37(42) 40(36,4286) (150)
Não especializadas 94(95,4286) 61(56) 45(48,5714) (200)
Total (167) (98) (85) (350)
Dessa forma
(73 − 71, 5714)2 (37 − 42)2 (40 − 36, 4286)2 (94 − 95, 4286)2
χ2cal = + + +
71, 5714 42 36, 4286 95, 4286
(61 − 56) 2
(45 − 48, 5714)2
+ +
56 48, 5714
2, 0409 25 12, 7549 2, 0409 25 12, 7549
= + + + + +
71, 5714 42 36, 4286 95, 4286 56 48, 5714
∼
= 1, 7043
P5) Como χ2cal ∈ RN RH0 não há indícios para rejeitarmos H0 ao nível de 2, 5% de significância. Dessa
forma, não há indícios de que Clínica e Opinião são independentes, ao nível de 2, 5% de significância.
288
25) Suponhamos que duas técnicas de memorização X1 e X2 deverão ser comparadas medindo-se a
eficiência pelo tempo exigido para decorar certo tipo de material. O mesmo material foi apresentado a
nX1 = 18 e nX2 = 13 pessoas que o decoraram usando as técnicas X1 e X2 respectivamente. Sabendo-
se que há normalidade das variáveis estudadas e homocedasticidade das variâncias, verifique se há
diferença significativa entre as duas técnicas de memorização, adotando nível de significância igual a
5%, sabendo que os resultados amostrais obtidos foram:
n Média(min) Variância(min2 )
X1 18 20 12
X2 13 17 15
Sejam X1 : “tempo exigido para decorar certo tipo de material pelo método de memorização X1 ” e
X2 : “tempo exigido para decorar certo tipo de material pelo método de memorização X2 ”. Então
X1 ∼ N (µ1 ; σ12 ) e X2 ∼ N (µ2 ; σ22 ), além disso, as variâncias populacionais são iguais, dessa forma
podemos aplicar o teste t de Student para duas médias.

H : µ1 = µ2


0
: µ1 6= µ2

H

1
X̄1 − X̄2
1 1

2
Sc +
n1 n2
(n1 − 1) S12 + (n2 − 1) S22
e Sc2 = .
n1 + n2 − 2
RC = {t ∈ R| t < −2, 0452 ou t > 2, 0452} ,
P4) Temos que
X̄1 = 20,
X̄2 = 17,
S12 = (3, 4641)2 = 12,
S22 = (3, 873)2 = 15,

(18 − 1) 12 + (13 − 1) 15 384
Sc2 = = = 13, 2414,
18 + 13 − 2 29
e
20 − 17
tcal = s = 2, 27.
1 1

13, 2414 +
18 13
289
−2,0452 0 2,0452 2,27
forma, o tempo exigido para decorar certo tipo de material pelo método de memorização X1 é
estatisticamente diferente do tempo exigido para decorar certo tipo de material pelo método de
memorização X2 , ao nível de 5% de significância.
290
26) A marca de cigarros B, mais barata, afirma que seus cigarros apresentam teor de nicotina igual
a concorrente direta (A). A empresa A não concorda, afirmando que seus cigarros são melhores por
apresentar menor teor de nicotina, e ao realizar um estudo do conteúdo de nicotina das duas marcas
de cigarros obteve os seguintes resultados:
A 18 20 21 21 22
B 20 21 23 23 25 26
Admitindo que o conteúdo de nicotinas de cada uma das duas marcas tem distribuição normal, e que
as variâncias populacionais são iguais, adotando nível de significância igual a 1%, realize um teste
de hipóteses para saber a que conclusão a empresa A chegará.
Sejam X1 : “quantidade de nicotina dos cigarros da marca A” e X2 : “quantidade de nicotina

dos cigarros da marca B”. Então X1 ∼ N (µ1 ; σ12 ) e X2 ∼ N (µ2 ; σ22 ), além disso, as variâncias
populacionais são iguais, dessa forma podemos aplicar o teste t de Student para duas médias.

H : µ1 = µ2


0
: µ1 < µ2

H

1
X̄1 − X̄2
1 1

2
Sc +
n1 n2
(n1 − 1) S12 + (n2 − 1) S22
e Sc2 = .
n1 + n2 − 2
RC = {t ∈ R| t < −2, 8214} ,
P4) Temos que
5
P
X1i
102
X̄1 = i=1
= = 20, 4,
5 5
6
P
X2i
138
X̄2 = i=1
= = 23,
6 6
5 2
P
5 X1i
2
− i=1
P
X1i 5 2090 − (102)
2
S12 = i=1
= 5
= 140, 4225,
5−1 5−1
6
2
P
6 X2i
2
− i=1
P
X2i 6 3200 − (138)
2
S22 = i=1
= 6
= 81,
6−1 6−1
291
−2,8214 −2,17 0
(5 − 1) 140, 4225 + (6 − 1) 81
Sc2 =
5+6−2
966, 69
= = 107, 41.
9
20, 4 − 23
tcal = s = −2, 17.
1 1

107, 41 +
5 6
forma, não há indícios de que o quantidade de nicotina dos cigarros da marca A seja estatisticamente
inferior ao quantidade de nicotina dos cigarros da marca B, ao nível de 1% de significância.
292
27) Duas ilhas A e B, são completamente diferentes entre si. Enquanto que a ilha A está no Oceano
Pacífico, a ilha B encontra-se no Oceano Atlântico. Suponha que a distribuição das alturas dos
habitantes sejam independentes e normalmente distribuídas, sendo que para os habitantes da ilha A
a altura média é 1,75 m com desvio padrão de 10 cm. Para os habitantes da ilha B, temos que a
altura média é 1,70 m com desvio padrão de 5 cm. Uma amostra aleatória de habitantes de uma das
ilhas é tomada e, deseja-se testar as seguintes hipóteses:

H : “Os habitantes são da ilha A”


0
.
: “Os habitantes são da ilha B”

H

1
Procede-se então do seguinte modo:
• seleciona-se uma amostra de 16 moradores adultos de uma ilha, e determina-se a altura média
deles;
• se essa altura média for superior a 173 cm, diremos que são habitantes da ilha A; caso contrário,
diremos que são habitantes da ilha B.
Considere as seguintes assertivas:
a) afirmar que a amostra de valores não é proveniente de nenhuma das ilhas A e B;
b) β = 95%;
c) afirmar que a amostra de valores das alturas dos habitantes é proveniente da ilha A quando na
verdade origina-se da ilha B;
d) α = 5%;
e) afirmar que a amostra de valores das alturas dos habitantes é proveniente da ilha B e, de fato
origina-se da ilha B;
f) afirmar que a amostra de valores das alturas dos habitantes é proveniente da ilha B quando na
verdade origina-se da ilha A;
g) afirmar que a amostra de valores das alturas dos habitantes é proveniente da ilha A e, de fato
origina-se da ilha A;
h) afirmar que a amostra valores é de quaisquer uma das duas ilhas.
Complete corretamente a frase abaixo:
O erro de tipo I e o erro de tipo II são dados respectivamente nas letras e .
O erro de tipo I e o erro de tipo II são dados, respectivamente, nas letras f) e c).
293
28) Psicólogos têm estudado um tipo de padrão comportamental das pessoas, designado como Tipo A.
Pessoas com esse padrão tendem a ser competitivas, trabalham melhor com datas e prazos, chegam
mais cedo para as reuniões, etc. Pessoas que não exibem esse padrão são classificadas como Tipo
B. Um estudo com 20 indivíduos do sexo masculino, classificados como Tipos A e B, investigou
o consumo de oxigênio (% da capacidade aeróbica utilizada) quando eles corriam em uma esteira.
Suspeitava-se antes da realização dessas medições que as pessoas do Tipo A consomem mais oxigênio
que as pessoas do Tipo B. Adote nível de significância igual a 1%, suponha normalidade das variáveis
sob estudo e homocedasticidade das variâncias e conclua acerca dessa suspeita utilizando um teste
de hipóteses adequado. Dados:
Padrão de comportamento
Capacidade aeróbica utilizada % Tipo A Tipo B

Valor médio X̄ 91,4 82,8
Desvio padrão (SX ) 37,82 46,84
Tamanho da amostra (n) 10 10
Sejam X1 : “consumo de oxigênio quando a pessoa é do tipo A” e X2 : “consumo de oxigênio quando

a pessoa é do tipo B”;

H : µ1 = µ2


0
: µ1 > µ2

H

1
X̄1 − X̄2
T =s ∼ t(ν) ,
1 1

Sc2 +
n1 n2
sendo ν = n1 + n2 − 2 e
(n1 − 1) S12 + (n2 − 1) S22
Sc2 = .
n1 + n2 − 2
RC = {t ∈ R| t > 2, 5524} ,

294
0 0,45 2,5524
P4) Temos que
X̄1 = 91, 4,
X̄2 = 82, 8,
S12 = (37, 82)2 = 1430, 3524,
S22 = (46, 84)2 = 2193, 9856,

(10 − 1) × 1430, 3524 + (10 − 1) × 2193, 9856
Sc2 =
10 + 10 − 2
32619, 042
= = 1812, 169,
18
91, 4 − 82, 8
tcal = s = 0, 45.
1 1

1812, 169 +
10 10
P5) Como tcal ∈ RN RH0 , não há indícios para rejeitarmos H0 ao nível de 1% de significância.
Dessa forma, não há indícios de que o consumo de oxigênio quando a pessoa é do tipo A seja
estatisticamente inferior ao consumo de oxigênio quando a pessoa é do tipo B, ao nível de 1%
de significância.
295
29) Nos itens abaixo assinale V se a afirmativa for completamente verdadeira ou F, caso contrário.
( V ) A soma de distribuições normais independentes também segue distribuição normal;
( F ) Uma hipótese estatística é um procedimento, ou regra de decisão, que nos possibilita decidir
por rejeitar, ou não, a hipótese formulada, com base na informação obtida na amostra;
Um teste de uma hipótese estatística é um procedimento, ou regra de decisão, que nos possibilita
decidir por rejeitar, ou não, a hipótese formulada, com base na informação obtida na amostra;
( F ) Ao realizarmos um teste de hipóteses, e tomarmos uma decisão, favorável ou contrária a uma

hipótese, sempre cometemos dois erros, o erro de tipo I e o erro de tipo II;
Ao realizarmos um teste de hipóteses, e tomarmos uma decisão, favorável ou contrária a uma hipótese,
podemos cometer um dos dois erros, o erro de tipo I ou o erro de tipo II;
( V ) A região crítica, também chamada de região de rejeição, é o conjunto de valores assumidos

pela variável aleatória ou estatística de teste para os quais a hipótese nula é rejeitada;
( F ) O erro de tipo II consiste em rejeitarmos uma hipótese H0 , sendo essa verdadeira;
O erro de tipo I consiste em rejeitarmos uma hipótese H0 , sendo essa verdadeira;
( F ) O erro de tipo I consiste em não rejeitarmos uma hipótese H0 , sendo essa falsa;
O erro de tipo II consiste em não rejeitarmos uma hipótese H0 , sendo essa falsa;
( F ) A diferença entre o teste t de Student para uma média, e o teste Z para uma média é que no
teste Z a variância amostral é conhecida;
A diferença entre o teste t de Student para uma média, e o teste Z para uma média é que no teste
Z a variância populacional é conhecida;
( V ) A probabilidade de se cometer o erro de tipo I é conhecida como nível de significância ou α;
( F ) Ao utilizarmos o teste de qui-quadrado para testar a igualdade de duas médias, os graus de

liberdade são dados por ν = (h − 1)(k − 1);
Ao utilizarmos o teste de qui-quadrado para testar a independência de duas variáveis, os graus de

liberdade são dados por ν = (h − 1)(k − 1);
( F ) No caso do teste t de Student para a independência de duas variáveis, os graus de liberdade

são dados por ν = nX + nY − 2;
No caso do teste t de Student para a diferença de duas variáveis, os graus de liberdade são dados por
ν = nX + nY − 2.
296
30) Dois grupos distintos de estudantes fizeram um mesmo exame em uma disciplina. No entanto, so-
mente um grupo recebeu preparação formal, pois frequentavam e participavam ativamente das aulas.
O outro grupo apenas leu a apostila e estudou na véspera da prova, uma vez que não compareciam
às aulas. Adote o nível de significância de 10% e realize um teste de hipótese para verificar se existe
associação entre a situação final do aluno e a frequência às aulas. Os resultados obtidos foram.
Frequência
Situação Sim Não
Aprovado 22 10
Reprovado 8 18

H : Situação e Frequência são independentes


0
P1)
: Situação e Frequência não são independentes

H

1
k
h X
(Foij − Feij )2
χ2 = ∼ χ2(ν) ,
X
i=1 j=1 F eij
sendo ν = (h − 1)(k − 1).
P3) ν = (2 − 1)(2 − 1) = 1 × 1 = 1 e χ2(1;10%) = 2, 7055. A região crítica é
n o
RC = χ2 ∈ R χ2 > 2, 7055 ,

RNRH0 RRH0
0 2,7055 8,287

297
Fo11 = 22, Fo12 = 10, Fo21 = 8, Fo22 = 18,
n1∗ = 32, n2∗ = 26, n∗1 = 30, n∗2 = 28,
n = 58,
32 × 30 32 × 28
Fe11 = = 16, 5517, Fe12 = = 15, 4483,
58 58
26 × 30 26 × 28
Fe21 = = 13, 4483, Fe22 = = 12, 5517.
58 58
P4) Temos que
Assim
Situação
Frequência Sim Não Total
Aprovado 22(16,5517) 10(15,4483) (32)
Reprovado 8(13,4483) 18(12,5517) (26)
Total (30) (28) (58)
Dessa forma
(22 − 16, 5517)2 (10 − 15, 4483)2 (8 − 13, 4483)2 (18 − 12, 5517)2
χ2cal = + + +
16, 5517 15, 4483 13, 4483 12, 5517
29, 684 29, 684 29, 684 29, 684
= + + +
16, 5517 15, 4483 13, 4483 12, 5517
= 1, 7934 + 1, 9215 + 2, 2073 + 2, 3649
∼
= 8, 287
P5) Como χ2cal ∈ RRH0 há indícios para rejeitarmos H0 ao nível de 10% de significância. Dessa
forma, há indícios de que Situação e Frequência não são independentes, ao nível de 10% de
significância.
298
31) A associação dos proprietários de indústrias metalúrgicas realizou um estudo e constatou que a
média mensal de tempo perdido com acidentes de trabalho é de 60 horas, com desvio padrão de 20
horas. Um programa de prevenção de acidentes foi então proposto e, para avaliar a sua eficiência,
tomou-se uma amostra aleatória de 9 indústrias, isto é, mediu-se o tempo de horas perdidas com
acidentes em cada uma dessas indústrias, o que forneceu um valor médio amostral de 50 horas.
Suponha normalidade da variável estudada, adote o nível de significância de 1% e, realize um teste
de hipóteses para analisar a eficiência do programa proposto.
a) Note que nesse caso a variância populacional σ 2 é conhecida e, por esse motivo utilizaremos o

H : µ = 60


0
teste Z para uma média. (Teste unilateral à esquerda);
: µ < 60

H

1
b) Temos que α = 0, 01 e, a estatística de teste a ser utilizada é dada por,
X̄ − µ0
Z= σ ∼ N (0; 1) ;
√
n
c) Temos que ztab = z0,01 = 2, 33 e assim a região crítica é dada por RC = {z ∈ R | z < −2, 33} , a
qual é descrita em termos gráficos na Figura 29.
−2,33 −1,5 0
Figura 29: Região crítica do teste Z, para uma média, unilateral à esquerda.
299
d)
50 − 60 −10
zcal = 20 = 6, 6667 = −1, 5.
√
9
e) Como zcal ∈ RN RH0 , não há indícios para rejeitarmos H0 ao nível de 1% de significância. Dessa
maneira, não há indícios de que o tempo perdido com acidentes de trabalho difere de 60 horas.
300
32) Uma rede de hotéis conduziu uma pesquisa para avaliar a opinião (Ótimo, Regular ou Péssimo)
dos usuários quanto à qualidade de seus serviços. Os entrevistados foram escolhidos aleatoriamente
e divididos em três classes: Solteiros, Casados e Outros (divorciados, desquitados, viúvos, etc.),
conforme apresentado na tabela a seguir. Verifique, ao nível de significância de 5%, se existe algum
tipo de associação entre as variáveis Usuário e Opinião.
Opinião
Usuário
Ótimo Regular Péssimo
Solteiro 7 10 13
Casado 24 23 25
Outros 18 15 8

H0 : Usuário e Opinião são independentes


P1) 
H : Usuário e Opinião não são independentes

1
k
h X
(Foij − Feij )2
χ2 = ∼ χ2(ν) ,
X
i=1 j=1 F eij
sendo ν = (h − 1)(k − 1).
P3) ν = (3 − 1)(3 − 1) = 2 × 2 = 4 e χ2(4;5%) = 9, 4877. A região crítica é
n o
RC = χ2 ∈ R χ2 > 9, 4877 ,
P4) Temos que
Fo11 = 7, Fo12 = 10, Fo13 = 13, Fo21 = 24,
Fo22 = 23, Fo23 = 25, Fo31 = 18, Fo32 = 15,
Fo33 = 8, n1∗ = 30, n2∗ = 72 n3∗ = 41,
n∗1 = 49, n∗2 = 48, n∗3 = 46, n = 143,

301
RNRH0 RRH0
0 5,7 9,4877
Figura 30: Região crítica para o teste.
Opinião
Usuário Total
Ótimo Regular Péssimo
Solteiro 7 (10,28) 10 (10,07) 13 (9,65) (30)
Casado 24 (24,67) 23 (24,17) 25 (23,16) (72)
Outros 18 (14,05) 15 (13,76) 8 (13,19) (41)
Total (49) (48) (46) (143)
(7 − 10, 28)2 (10 − 10, 07)2 (13 − 9, 65)2

χ2cal = + +
10, 28 10, 07 9, 65
2 2
(24 − 24, 67) (23 − 24, 17) (25 − 23, 16)2
+ + +
24, 67 24, 17 23, 16
2 2
(18 − 14, 05) (15 − 13, 76) (8 − 13, 19)2
+ + +
14, 05 13, 76 13, 19
= 1, 05 + 0 + 1, 16 + 0, 02 + 0, 06 + 0, 15 + 1, 11 + 0, 11 + 2, 04
∼
= 5, 7
P5) Como χ2cal ∈ RN RH0 não há indícios para rejeitarmos H0 ao nível de 5% de significância. Dessa forma,
não há indícios para rejeitarmos a hipótese de que Usuário e Opinião são independentes.
302
33) Dez cobaias criadas em laboratório, foram separadas, aleatoriamente, em dois grupos: um foi
tratado com ração normalmente usada no laboratório (padrão) e o outro grupo foi submetido a uma
nova ração (experimental). As cobaias foram pesadas no início e no final do período de duração do
experimento. Os ganhos de massa (em gramas) observados foram os seguintes:
Ração Tamanho amostral Massa média (g) Variância (g2 )

Padrão 5 188 70
Experimental 5 212 72
Considere que as variâncias sejam homogêneas que as variáveis sob estudo sejam normalmente dis-
tribuídas, proceda a um teste de hipóteses, ao nível α = 5%, para verificar se as duas rações diferem
entre si quanto ao ganho de massa.
Sejam X1 : “ganho de massa obtido com a ração padrão” e X2 : “ganho de massa obtido com a nova
ração”. Então X1 ∼ N (µ1 ; σ12 ) e X2 ∼ N (µ2 ; σ22 ), além disso, as variâncias populacionais são iguais,
dessa forma podemos aplicar o teste t de Student para duas médias.

H : µ1 = µ2


0
: µ1 6= µ2

H

1
X̄1 − X̄2
1 1

Sc2 +
n1 n2
(n1 − 1) S12 + (n2 − 1) S22
e Sc2 = .
n1 + n2 − 2
RC = {t ∈ R| t < −2, 306 ou t > 2, 306} ,
P4) Temos que
X̄1 = 188,
X̄2 = 212,
S12 = (8, 3666)2 = 70,
S22 = (8, 4853)2 = 72,

(5 − 1) 70 + (5 − 1) 72 568
Sc2 = = = 71,
5+5−2 8
303
−4,5 −2,306 0 2,306
e
188 − 212
tcal = s = −4, 5.
1 1
71 +
5 5
forma, o ganho de massa obtido com a ração padrão é estatisticamente diferente do ganho de
massa obtido com a nova ração, ao nível de 5% de significância.
304
34) A tabela abaixo indica o número de telespectadores de duas emissoras de televisão X e Y em

cada um dos dois tipos de programação: Novela e Noticiário.
Programação
Emissora Novela Noticiário
Emissora X 26 20
Emissora Y 25 29
Ao nível de 1% de significância, teste a independência entre a escolha da emissora pelos telespecta-

dores e sua programação.

H : Emissora e Programação são independentes


0
P1)
: Emissora e Programação não são independentes

H

1
h X
k
(Foij − Feij )2
χ2 = ∼ χ2(ν) ,
X
i=1 j=1 F eij
sendo ν = (h − 1)(k − 1).
n o
RC = χ2 ∈ R χ2 > 6, 6349 ,

RNRH0 RRH0
0 1,0393 6,6349

305
Fo11 = 26, Fo12 = 20, Fo21 = 25, Fo22 = 29,
n1∗ = 46, n2∗ = 54, n∗1 = 51, n∗2 = 49,
n = 100,
46 × 51 46 × 49
Fe11 = = 23, 46, Fe12 = = 22, 54,
100 100
54 × 51 54 × 49
Fe21 = = 27, 54, Fe22 = = 26, 46.
100 100
P4) Temos que
Assim
Emissora
Programação Novela Noticiário Total
Emissora X 26(23,46) 20(22,54) (46)
Emissora Y 25(27,54) 29(26,46) (54)
Total (51) (49) (100)
Dessa forma
(26 − 23, 46)2 (20 − 22, 54)2 (25 − 27, 54)2 (29 − 26, 46)2
χ2cal = + + +
23, 46 22, 54 27, 54 26, 46
6, 4516 6, 4516 6, 4516 6, 4516
= + + +
23, 46 22, 54 27, 54 26, 46
= 0, 275 + 0, 2862 + 0, 2343 + 0, 2438
∼
= 1, 0393
forma, há indícios de que Emissora e Programação são independentes, ao nível de 1% de significância.

Apostila de Estatística Básica Com Resolução UFV

Uploaded by

Document Information

Original Title

Copyright

Available Formats

Share this document

Share or Embed Document

Sharing Options

Did you find this document useful?

Is this content inappropriate?

Copyright:

Available Formats

Apostila de Estatística Básica Com Resolução UFV

Uploaded by

Copyright:

Available Formats

UNIVERSIDADE FEDERAL DE VIÇOSA

CENTRO DE CIÊNCIAS EXATAS E TECNOLÓGICAS

Manual de soluções do roteiro de aulas - EST 103

CAPÍTULO I Introdução à Estatística . . . . . . . . . . . . . . . . . . . . . . . 6

Esse capítulo não tem exercícios

Tabela 1: Exemplo de uma tabela de números aleatórios

2080 3828 7880 0586 8482 7811 6807 3309 2729

0092 1629 0377 3590 2209 4839 6332 1490 3092

6905 7127 5933 1137 7583 6450 5658 7678 3444

7274 9512 0074 6677 8676 0222 3335 1976 1645

2402 6250 9362 7373 4757 1716 1942 0417 5921

5500 2276 6307 2346 1285 7000 5306 0414 3383

5573 9396 3464 1706 9204 3389 5678 2589 0288

2) Diferencie: amostragem aleatória simples, amostragem aleatória estratificada e amostragem siste-

Na amostragem estratificada a população não é homogênea, ela é constituída de subgrupos, denomi-

3) Em uma convenção partidária estão presentes 5 senadores, 8 prefeitos e 27 vereadores. Deseja-se

Senadores: S01 S02 S03 S04 S05

b) O tamanho amostral obtido no item anterior é próximo, ou distante, do tamanho da população?

O erro tolerável deve ser igual a E0 = 0, 06 então:

• Para o estrato da Administração devemos selecionar

• Para o estrato do Transportes devemos selecionar

• Para o estrato do Produção devemos selecionar

• Para o estrato do Outros devemos selecionar

5) Considere os 30 empregados de uma fábrica e, realize o processo de amostragem aleatória sistemá-

Temos que N = 30, n = 9 e, o salto amostral é

E01 E02 E03 E04

Dessa forma, a amostra selecionada é

X = {E2 , E6 , E10 , E14 , E18 , E22 , E26 , E30 , E4 } .

a) Qual seria o tamanho da amostra para esse erro desejado?

Temos que E0 = 0, 05; N = 70, assim

7) Em relação à questão 6) devemos numerar os servidores de 01 a 70, a fim de selecionarmos os 25

01 - Adriana 02 - Almir 03 - Ana Paula 04 - Andreza 05 - Cataline

S = {27, 06, 35, 05, 31} ,

9) Em um congresso de Medicina Veterinária, estão presentes 400 alunos de diferentes universidades,

b) Quantos alunos de cada universidade devem ser amostrados? Justifique.

Uma primeira aproximação para o tamanho amostral é dado por:

Como conhecemos o tamanho da população, N = 400, podemos corrigir, a expressão anterior da

• O número de alunos da UFV que devemos selecionar é

• O número de alunos da UFLA que devemos selecionar é

• O número de alunos da USP que devemos selecionar é

• O número de alunos da UFMG que devemos selecionar é

01 - Abel 02 - Adriana 03 - Alda 04 - Ana 05 - Andreza

S = {23, 32, 28, 16, 02, 08} ,

Como somente n2 = 271 filiados retornaram as fichas temos:

271 × 30000 + 271n0 = 30000n0

8130000 = 30000n0 − 271n0

Dessa forma o novo erro tolerável da pesquisa é de 6, 05%.

O número total de elementos a serem amostrados é 35 e, assim:

• Para o estrato dos Hipermercados devemos selecionar 2 elementos, pois

• Para o estrato dos Supermercados devemos selecionar 5 elementos, pois

• Para o estrato dos Mercados devemos selecionar 10 elementos, pois

• Para o estrato dos Açougues e Mercearias devemos selecionar 20 elementos, pois

Se arredondarmos para o inteiro mais próximo teremos

totalizando n = 35 elementos amostrados.

1) Classifique cada uma das variáveis.

2) Para as variáveis qualitativas, determine:

a) A tabela de distribuição de frequências;

Tabela 1: Distribuição de frequências da variável sexo

Para a variável “fuma”, temos que:

Tabela 2: Distribuição de frequências da variável fuma

n = 30, n1 = 20, n2 = 10,

Tabela 3: Distribuição de frequências da variável trabalha

Para a variável “time”, temos que: