You are on page 1of 306

UNIVERSIDADE FEDERAL DE VIÇOSA

CENTRO DE CIÊNCIAS EXATAS E TECNOLÓGICAS


DEPARTAMENTO DE ESTATÍSTICA

Manual de soluções do roteiro de aulas - EST 103


2019/I

VIÇOSA - MG
22 de maio de 2019
LISTA DE FIGURAS

Capítulo I . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 6
Capítulo II . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 7
Capítulo III . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 23
Figura 1 Gráfico de setores da variável sexo . . . . . . . . . . . . . . . . . . . . . . . . . . . . 29
Figura 2 Gráfico de setores da variável fuma . . . . . . . . . . . . . . . . . . . . . . . . . . . 30
Figura 3 Gráfico de setores da variável trabalha . . . . . . . . . . . . . . . . . . . . . . . . . 30
Figura 4 Gráfico de setores da variável time . . . . . . . . . . . . . . . . . . . . . . . . . . . 31
Figura 5 Gráfico de setores da variável curso . . . . . . . . . . . . . . . . . . . . . . . . . . . 32
Figura 6 Gráfico de setores da variável nomofobia . . . . . . . . . . . . . . . . . . . . . . . . 32
Figura 7 Gráfico de setores da variável presença . . . . . . . . . . . . . . . . . . . . . . . . . 33
Figura 8 Gráfico de setores da variável voto . . . . . . . . . . . . . . . . . . . . . . . . . . . . 33
Figura 9 Gráfico de setores da variável tolerância . . . . . . . . . . . . . . . . . . . . . . . . . 34
Figura 10 Gráfico de barras da variável sexo . . . . . . . . . . . . . . . . . . . . . . . . . . . . 34
Figura 11 Gráfico de barras da variável fuma . . . . . . . . . . . . . . . . . . . . . . . . . . . 35
Figura 12 Gráfico de barras da variável trabalha . . . . . . . . . . . . . . . . . . . . . . . . . . 36
Figura 13 Gráfico de barras da variável time . . . . . . . . . . . . . . . . . . . . . . . . . . . . 37
Figura 14 Gráfico de barras da variável curso . . . . . . . . . . . . . . . . . . . . . . . . . . . 38
Figura 15 Gráfico de barras da variável nomofobia . . . . . . . . . . . . . . . . . . . . . . . . 39
Figura 16 Gráfico de barras da variável presença . . . . . . . . . . . . . . . . . . . . . . . . . . 40
Figura 17 Gráfico de barras da variável voto . . . . . . . . . . . . . . . . . . . . . . . . . . . . 41
Figura 18 Gráfico de barras da variável tolerância . . . . . . . . . . . . . . . . . . . . . . . . . 42
Figura 19 Gráfico de barras da variável idade - valores absolutos . . . . . . . . . . . . . . . . . 44
Figura 20 Gráfico de barras da variável idade - valores percentuais . . . . . . . . . . . . . . . . 45
Figura 21 Gráfico de barras da variável horas de estudo - valores absolutos . . . . . . . . . . . 46
Figura 22 Gráfico de barras da variável horas de estudo - valores percentuais . . . . . . . . . . 46
Figura 23 Gráfico de barras da variável nota - valores absolutos . . . . . . . . . . . . . . . . . 47
Figura 24 Gráfico de barras da variável nota - valores percentuais . . . . . . . . . . . . . . . . 47
Figura 25 Gráfico de barras da variável período - valores absolutos . . . . . . . . . . . . . . . 48
Figura 26 Gráfico de barras da variável período - valores percentuais . . . . . . . . . . . . . . 49
Figura 27 Histograma para a variável altura . . . . . . . . . . . . . . . . . . . . . . . . . . . . 51
Figura 28 Histograma para a variável peso . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 54
Figura 29 Histograma para a variável tempo de espera . . . . . . . . . . . . . . . . . . . . . . 56
Figura 30 Histograma para a variável tempo de sobrevivência . . . . . . . . . . . . . . . . . . 58
Figura 31 Histograma para a variável número de pessoas diabéticas, que necessitam do medi-
camento . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 60
Capítulo IV . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 61
Capítulo V . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 92
Figura 1 Gráfico de dispersão de Idade versus Massa muscular . . . . . . . . . . . . . . . . . 101
Capítulo VI . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 121
Capítulo VII . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 173
Capítulo VIII . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 238
Figura 1 Região crítica do teste t, para duas médias, unilateral à esquerda. . . . . . . . . . . 239
Figura 2 Região crítica do teste t, para uma média, unilateral à direita. . . . . . . . . . . . . 240
Figura 3 Região crítica do teste t, para duas médias, unilateral à direita. . . . . . . . . . . . 243
Figura 4 Região crítica do teste t, para uma média, bilateral. . . . . . . . . . . . . . . . . . . 244
Figura 5 Região crítica do teste t, para uma média, bilateral. . . . . . . . . . . . . . . . . . . 246
Figura 6 Região crítica para o teste de χ2 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 248
Figura 7 Região crítica para o teste de χ2 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 251
Figura 8 Região crítica do teste t, para duas médias, unilateral à direita. . . . . . . . . . . . 253
Figura 9 Região crítica para o teste de χ2 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 255
Figura 10 Região crítica para o teste de χ2 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 257
Figura 11 Região crítica do teste t, para uma média, bilateral. . . . . . . . . . . . . . . . . . . 258
Figura 12 Região crítica para o teste de χ2 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 261
Figura 13 Região crítica do teste t, para uma média, unilateral à esquerda. . . . . . . . . . . . 263
Figura 14 Região crítica para o teste de χ2 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 265
Figura 15 Região crítica para o teste de χ2 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 267
Figura 16 Região crítica do teste t, para duas médias, unilateral à direita. . . . . . . . . . . . 270
Figura 17 Região crítica do teste t, para duas médias, unilateral à direita. . . . . . . . . . . . 272
Figura 18 Região crítica do teste t, para uma média, unilateral à direita. . . . . . . . . . . . . 273
Figura 19 Região crítica do teste t, para duas médias, unilateral à esquerda. . . . . . . . . . . 276
Figura 20 Região crítica para o teste de χ2 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 279
Figura 21 Região crítica do teste t, para uma média, unilateral à direita. . . . . . . . . . . . . 280
Figura 22 Região crítica do teste t, para uma média, bilateral. . . . . . . . . . . . . . . . . . . 282
Figura 23 Região crítica do teste t, para duas médias, bilateral. . . . . . . . . . . . . . . . . . 285
Figura 24 Região crítica para o teste de χ2 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 286
Figura 25 Região crítica do teste t, para duas médias, bilateral. . . . . . . . . . . . . . . . . . 289
Figura 26 Região crítica do teste t, para duas médias, unilateral à esquerda. . . . . . . . . . . 291
Figura 27 Região crítica do teste t, para duas médias, unilateral à direita. . . . . . . . . . . . 294
Figura 28 Região crítica para o teste de χ2 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 296
Figura 29 Região crítica do teste Z, para uma média, unilateral à esquerda. . . . . . . . . . . 298
Figura 30 Região crítica para o teste. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 301
Figura 31 Região crítica do teste t, para duas médias, bilateral. . . . . . . . . . . . . . . . . . 303
Figura 32 Região crítica para o teste de χ2 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 304
LISTA DE TABELAS

Capítulo I . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 6
Capítulo II . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 7
Tabela 1 Exemplo de uma tabela de números aleatórios . . . . . . . . . . . . . . . . . . . . . 8
Capítulo III . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 23
Tabela 1 Distribuição de frequências da variável sexo . . . . . . . . . . . . . . . . . . . . . . 24
Tabela 2 Distribuição de frequências da variável fuma . . . . . . . . . . . . . . . . . . . . . . 25
Tabela 3 Distribuição de frequências da variável trabalha . . . . . . . . . . . . . . . . . . . . 25
Tabela 4 Distribuição de frequências da variável time . . . . . . . . . . . . . . . . . . . . . . 26
Tabela 5 Distribuição de frequências da variável curso . . . . . . . . . . . . . . . . . . . . . . 27
Tabela 6 Distribuição de frequências da variável nomofobia . . . . . . . . . . . . . . . . . . . 28
Tabela 7 Distribuição de frequências da variável presença . . . . . . . . . . . . . . . . . . . . 28
Tabela 8 Distribuição de frequências da variável voto . . . . . . . . . . . . . . . . . . . . . . 28
Tabela 9 Distribuição de frequências da variável tolerância . . . . . . . . . . . . . . . . . . . 29
Tabela 10 Distribuição de frequências para a idade . . . . . . . . . . . . . . . . . . . . . . . . 43
Tabela 11 Distribuição de frequências para horas de estudo . . . . . . . . . . . . . . . . . . . . 43
Tabela 12 Distribuição de frequências para a nota . . . . . . . . . . . . . . . . . . . . . . . . . 43
Tabela 13 Distribuição de frequências para o período . . . . . . . . . . . . . . . . . . . . . . . 44
Tabela 14 Distribuição de frequências para a variável “altura” . . . . . . . . . . . . . . . . . . 50
Tabela 15 Distribuição de frequências para a variável “peso” . . . . . . . . . . . . . . . . . . . 53
Tabela 16 Distribuição de frequências para a variável “tempo de espera”. . . . . . . . . . . . . 56
Tabela 17 Distribuição de frequências para a variável “tempo de sobrevivência”. . . . . . . . . 58
Tabela 18 Distribuição de frequências para a variável “número de pessoas diabéticas, que
necessitam do medicamento”. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 60
Capítulo IV . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 61
Capítulo V . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 92
Capítulo VI . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 121
Capítulo VII . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 173
Capítulo VIII . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 238
SUMÁRIO

CAPÍTULO I Introdução à Estatística . . . . . . . . . . . . . . . . . . . . . . . 6


CAPÍTULO II Amostragem . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 7
CAPÍTULO III Estatística descritiva . . . . . . . . . . . . . . . . . . . . . . . . 23
CAPÍTULO IV Medidas resumo . . . . . . . . . . . . . . . . . . . . . . . . . . 61
CAPÍTULO V Regressão linear simples . . . . . . . . . . . . . . . . . . . . . . 92
CAPÍTULO VI Probabilidade . . . . . . . . . . . . . . . . . . . . . . . . . . . . 121
CAPÍTULO VII Distribuições de probabilidade . . . . . . . . . . . . . . . . . 173
CAPÍTULO VIII Testes de hipóteses . . . . . . . . . . . . . . . . . . . . . . . 238
6

CAPÍTULO I

Introdução à Estatística

Esse capítulo não tem exercícios


7

CAPÍTULO II

Amostragem
8

Tabela 1: Exemplo de uma tabela de números aleatórios


3690 2492 7171 7720 6509 7549 2330 5733 4730
0813 6790 6858 1489 2669 3743 1901 4971 8280
6477 5289 4092 4223 6454 7632 7577 2816 9202
0772 2160 8236 0812 4195 5589 0830 8261 9232
5692 9870 3583 8997 1533 6566 8830 7271 3809

2080 3828 7880 0586 8482 7811 6807 3309 2729


1039 3382 7600 1077 4455 8806 1822 1669 7501
7227 0104 4141 1521 9104 5563 1392 8238 4882
8506 6348 4612 8252 1062 1757 0964 2983 2244
5086 0303 7423 3298 3979 2831 2257 1508 7642

0092 1629 0377 3590 2209 4839 6332 1490 3092


0935 5565 2315 8030 7651 5189 0075 9353 1921
2605 3973 8204 4143 2677 0034 8601 3340 8383
7277 9889 0390 5579 4620 5650 0210 2082 4664
5484 3900 3485 0741 9069 5920 4326 7704 6525

6905 7127 5933 1137 7583 6450 5658 7678 3444


8387 5323 3753 1859 6043 0294 5110 6340 9137
4094 1957 0163 9717 4118 4276 9465 8820 4127
4951 3781 5101 1815 7068 6379 7252 1086 8919
9047 0199 5068 7447 1664 9278 1708 3625 2864

7274 9512 0074 6677 8676 0222 3335 1976 1645


9192 4011 0255 5458 6942 8043 6201 1587 0972
0554 1690 6333 1931 9433 2661 8690 2313 6999
8231 5627 1815 7171 8036 1832 2031 6298 6073
3995 9677 7765 3194 3222 4191 2734 4469 8617

2402 6250 9362 7373 4757 1716 1942 0417 5921


5295 7385 5474 2123 7035 9983 5192 1840 6176
5177 1191 2106 3351 5057 0967 4538 1246 3374
7315 3365 7203 1231 0546 6612 1038 1425 2709
5775 7517 8974 3961 2183 5295 3096 8536 9442

5500 2276 6307 2346 1285 7000 5306 0414 3383


3251 8902 8843 2112 8567 8131 8116 5270 5994
4675 1435 2192 0874 2897 0262 5092 5541 4014
3543 6130 4247 4859 2660 7852 9096 0578 0097
3521 8772 6612 0721 3899 2999 1263 7017 8057

5573 9396 3464 1706 9204 3389 5678 2589 0288


7478 7569 7551 3380 2152 5411 2647 7242 2800
3339 2854 9691 9562 3252 9848 6030 8472 2266
5505 8474 3167 8552 5409 1556 4247 4652 2953
6381 2086 5457 7703 2758 2963 8167 6712 9820
Fonte: STEVENSON, W. J. Estatística aplicada à administração. São Paulo, Harbra, 1981.
9

1) Qual a principal diferença entre uma amostra probabilística e uma amostra não probabilística?

A amostragem probabilística é aquela em que cada elemento da população tem uma chance conhecida
e diferente de zero de ser selecionado para compor a amostra.

Amostragem não probabilística é aquela em que a seleção dos elementos da população para compor
a amostra depende ao menos em parte do julgamento do pesquisador ou do entrevistador no campo.

Dessa forma a principal diferença entre as duas amostragens é a forma de se compor a amostra,
ocorrendo algum mecanismo de sorteio na amostragem probabilística, enquanto que na amostragem
não probabilística isso não ocorre.
10

2) Diferencie: amostragem aleatória simples, amostragem aleatória estratificada e amostragem siste-


mática.

A amostragem aleatória simples é utilizada quando os elementos que compõem a população são
homogêneos. Nesse tipo de processo de amostragem, todos os elementos da população tem a mesma
probabilidade de serem amostrados e, sorteia-se um a um cada elemento a fim de se compor a amostra
aleatória.

A amostragem sistemática tem os mesmos pressupostos que a amostragem aleatória simples, mas
o modo de se obter a amostra é um processo mais rápido que aquele empregado na amostragem
aleatória simples.

Na amostragem estratificada a população não é homogênea, ela é constituída de subgrupos, denomi-


nados estratos, os quais são internamente homogêneos e externamente heterogêneos.
11

3) Em uma convenção partidária estão presentes 5 senadores, 8 prefeitos e 27 vereadores. Deseja-se


estudar a média salarial da população composta pelos 40 participantes. Sendo assim, responda:

Senadores: S01 S02 S03 S04 S05


Prefeitos: P01 P02 P03 P04 P05 P06 P07 P08
Vereadores: V01 V02 V03 V04 V05 V06 V07 V08 V09 V10
V11 V12 V13 V14 V15 V16 V17 V18 V19 V20
V21 V22 V23 V24 V25 V26 V27

a) Qual o tamanho amostral indicado para que os erros amostrais não ultrapassem 5%?

1 1
& ' & '
n0 = = = 400.
2
E0 (0, 05)2
Como N = 40, podemos corrigir, a expressão anterior:

N.n0 40 × 400
   
n= = = d36, 36e = 37.
N + n0 40 + 400

b) O tamanho amostral obtido no item anterior é próximo, ou distante, do tamanho da população?


Por quê?

O tamanho amostral obtido é próximo, do tamanho da população. Isso se dá pelo fato de que o
tamanho da população é pequeno e também devido ao erro amostral admitido no estudo. Fixado um
erro amostral, quanto maior for o tamanho da população, mais distantes estarão o tamanho amostral
obtido e o tamanho da população; fixado o tamanho da população, quanto menor for o erro amostral,
mais próximos estarão o tamanho amostral obtido e o tamanho da população.

c) Qual o processo de amostragem indicado para selecionar uma amostra, a fim de estudar a média
salarial?

O processo de amostragem mais indicado seria o estratificado, pois na população em estudo percebe-
se, claramente, três subconjuntos (Senadores, Prefeitos e Vereadores) com características diferentes
entre os estratos, porém dentro de cada estrato há homogeneidade.
12

4) Uma empresa tem 3414 empregados distribuídos nos seguintes departamentos: Administração
(914), Transportes (348), Produção (1401) e Outros (751). Deseja-se extrair uma amostra entre
os empregados, para verificar o grau de satisfação, em relação à qualidade da comida servida no
refeitório. Admitindo-se um erro amostral de 6%, determine quantos empregados de cada estrato
deverão ser selecionados?

O erro tolerável deve ser igual a E0 = 0, 06 então:

1 1
& ' & '
n0 = = = d277, 78e = 278.
2
E0 (0, 06)2

Esse seria o tamanho amostral indicado se não soubéssemos o tamanho da população e, admitindo-se
um erro de 6%. Como sabemos que o número total de estudantes é N = 3414, o tamanho amostral
é dado por:
N.n0 3414 × 278
   
n= = = 258
N + n0 3414 + 278
devemos assim tomar n = 258 empregados.

Temos h = 4 estratos, quais sejam, Administração, Transportes, Produção e Outros, sendo que os
tamanhos dos estratos são N1 = 914, N2 = 348, N3 = 1401 e N4 = 751, respectivamente. Além
disso, vimos que, o número total de empregados a serem amostrados é 258 e, o número de elementos
de cada estrato que devem ser selecionados é:

• Para o estrato da Administração devemos selecionar

N1 914
   
n1 = ×n = × 258 = d69, 07e = 70,
N 3414

empregados;

• Para o estrato do Transportes devemos selecionar

N2 348
   
n2 = ×n = × 258 = d26, 3e = 27,
N 3414

empregados;

• Para o estrato do Produção devemos selecionar

N3 1401
   
n3 = ×n = × 258 = d105, 88e = 106,
N 3414

empregados;
13

• Para o estrato do Outros devemos selecionar

N4 751
   
n4 = ×n = × 258 = d56, 75e = 57,
N 3414

empregados.

Note que, nesse caso temos uma amostra de tamanho n = 70 + 27 + 106 + 57 = 260 e não 258, como
anteriormente pedia-se. Isso deve-se ao fato da impossibilidade de amostrar um número não inteiro
de elementos e, a fim de garantir o erro tolerável admitido, por vezes uma amostra um pouco maior
pode ser necessária.
14

5) Considere os 30 empregados de uma fábrica e, realize o processo de amostragem aleatória sistemá-


tica para selecionar uma amostra de tamanho n = 9.

E01 E02 E03 E04 E05 E06 E07 E08 E09 E10
E11 E12 E13 E14 E15 E16 E17 E18 E19 E20
E21 E22 E23 E24 E25 E26 E27 E28 E29 E30

Utilize a tabela de números aleatórios, iniciando na linha 04, coluna 05 e siga horizontalmente para
a esquerda. Ao chegar no início da linha vá para o final da linha de cima.

Temos que N = 30, n = 9 e, o salto amostral é

N 30
   
k= = = d3, 33e = 4.
n 9

Sabemos que k = 4, assim sendo, somente os k = 4 primeiros elementos da amostra serão considera-
dos, isto é,

E01 E02 E03 E04

Considerando-se a linha e a coluna indicadas (linha 04, coluna 05), selecionaremos primeiramente.
Os demais elementos serão obtidos somando-se o salto amostral da seguinte forma:

1◦ elemento 02
2◦ elemento 02 + 4 = 6
3◦ elemento 6 + 4 = 10
4◦ elemento 10 + 4 = 14
5◦ elemento 14 + 4 = 18
6◦ elemento 18 + 4 = 22
7◦ elemento 22 + 4 = 26
8◦ elemento 26 + 4 = 30
9◦ elemento 4

Dessa forma, a amostra selecionada é

X = {E2 , E6 , E10 , E14 , E18 , E22 , E26 , E30 , E4 } .


15

6) Uma empresa pública conta com 70 servidores. Uma pesquisa por amostragem precisa ser realizada,
sendo que, a princípio deseja-se 5% de erro.

a) Qual seria o tamanho da amostra para esse erro desejado?

Temos que E0 = 0, 05; N = 70, assim

1 1 1
& ' & ' & '
n0 = = = = 400,
2
E0 0, 052 0, 0025

n0 N 400 × 70 28000
     
logo n = = = = 60.
n0 + N 400 + 70 470
b) Devido à impossibilidade da realização de uma pesquisa desse tamanho, somente 25 serão pesqui-
sados, sendo assim, qual o novo erro da pesquisa?

n0 N n0 × 70
n= ⇒ 25 =
n0 + N n0 + 70
25 × (n0 + 70) = 70n0 ⇒ 70n0 − 25n0 = 1750
1750
45n0 = 1750 ⇒ n0 = = 38, 89.
45
Desse modo
1 1
n0 = 2
⇒ 2 = 38, 89
E0 E0
1
E02 = ⇒ E02 = 0, 0257
38, 89

E0 = 0, 0257 = 0, 1604.
16

7) Em relação à questão 6) devemos numerar os servidores de 01 a 70, a fim de selecionarmos os 25


que comporão a nossa amostra. Começando na 2ª linha e 1ª coluna da tabela de números aleatórios
(Tabela 1), seguindo horizontalmente para a direita e ao chegar ao fim da linha iniciar no começo da
linha de baixo, selecione os 25 servidores da amostra.

S = {08, 13, 67, 68, 58, 14, 26, 69, 37, 43, 19, 01, 49, 64, 52, 40, 42, 23, 54, 32, 28, 16, 02, 07, 21} ,

e ordenando-os temos

S = {01, 02, 07, 08, 13, 14, 16, 19, 21, 23, 26, 28, 32, 37, 40, 42, 43, 49, 52, 54, 58, 64, 67, 68, 69} .
17

8) Uma empresa possui 35 empregados (listados abaixo) e, ao final do ano, devido ao bom desempenho
por parte dos funcionários, o proprietário resolveu presentear 5 deles com uma semana de folga em
um resort e tudo pago pela empresa. Como todos trabalharam arduamente durante o ano todo e,
para que não houvessem injustiças, ele resolveu utilizar a amostragem aleatória simples e uma tabela
de números aleatórios para realizar o sorteio.

01 - Adriana 02 - Almir 03 - Ana Paula 04 - Andreza 05 - Cataline


06 - Débora 07 - Edna 08 - Elaine 09 - Erivaldo 10 - Erivan
11 - Jamilly 12 - Janaína 13 - Jeane 14 - Jessica 15 - João Paulo
16 - Karina 17 - Leandro 18 - Luciano 19 - Luiz 20 - Maria
21 - Mariana 22 - Marilza 23 - Mário 24 - Maytê 25 - Michell
26 - Nayara 27 - Neyber 28 - Priscila 29 - Roberta 30 - Suélen
31 - Tatiana 32 - Tatiara 33 - Thaís 34 - Thuanne 35 - Wellington

Se ele utilizar a tabela de números aleatórios e, começar na terceira linha, segunda coluna, seguindo
verticalmente para baixo e, ao chegar ao final da coluna for para o início da próxima coluna, quais
serão os empregados sorteados?

S = {27, 06, 35, 05, 31} ,

e ordenando-os temos
S = {05, 06, 27, 31, 35} .
18

9) Em um congresso de Medicina Veterinária, estão presentes 400 alunos de diferentes universidades,


conforme vê-se abaixo:

Universidade Alunos
UFV 55
UFLA 105
USP 155
UFMG 85

Deseja-se estudar a opinião dos alunos acerca do conteúdo de uma palestra, admitindo-se um erro
amostral de 10%. Assim sendo, responda às seguintes questões:

a) A amostragem estratificada é a indicada nesse caso. Justifique essa afirmação baseando-se nos
pré-requisitos para que ela seja utilizada.

A amostragem estratificada é a indicada nesse caso porque a população está dividida em estratos
(universidades), que são homogêneos internamente e, quando comparamos dois quaisquer eles são
heterogêneos.

b) Quantos alunos de cada universidade devem ser amostrados? Justifique.

Temos aqui h = 4 estratos, quais sejam, UFV, UFLA, USP e UFMG, sendo que os tamanhos dos
estratos são N1 = 55, N2 = 105, N3 = 155 e N4 = 85 respectivamente.

Uma primeira aproximação para o tamanho amostral é dado por:

1 1
& ' & '
n0 = = = 100.
2
E0 (0, 1)2

Como conhecemos o tamanho da população, N = 400, podemos corrigir, a expressão anterior da


seguinte maneira:
N.n0 400 × 100
   
n= = = d80e = 80.
N + n0 400 + 100

Assim

• O número de alunos da UFV que devemos selecionar é

N1 55
   
n1 = ×n = × 80 = 11.
N 400

• O número de alunos da UFLA que devemos selecionar é

N2 105
   
n2 = ×n = × 80 = 21.
N 400
19

• O número de alunos da USP que devemos selecionar é

N3 155
   
n3 = ×n = × 80 = 31.
N 400

• O número de alunos da UFMG que devemos selecionar é

N4 85
   
n4 = ×n = × 80 = 17.
N 400
20

10) A cárie é considerada uma doença comportamental que afeta principalmente crianças em idade
escolar. Uma cirurgiã-dentista, voluntária em um projeto social visitou algumas escolas em regiões
rurais para tentar estimar a prevalência desse mal e planejar ações futuras de tratamento. A amos-
tragem aleatória simples foi utilizada para selecionar n = 6 crianças em cada escola. A listagem a
seguir indica os nomes das N = 35 crianças de uma dessas escolas. Pede-se: Informe os seis nomes.

01 - Abel 02 - Adriana 03 - Alda 04 - Ana 05 - Andreza


06 - Cataline 07 - Débora 08 - Edna 09 - Elaine 10 - Erivan
11 - Erivaldo 12 - Jamilly 13 - Janaína 14 - Jeane 15 - Jéssica
16 - João 17 - Karina 18 - Leandro 19 - Luciano 20 - Luiz
21 - Maria 22 - Mariana 23 - Mariane 24 - Mário 25 - Mayke
26 - Michell 27 - Nayara 28 - Neyber 29 - Priscila 30 - Roberta
31 - Suélen 32 - Tatiana 33 - Tatiara 34 - Thaís 35 - Thuanne

Ponto de partida: linha 03 e coluna 08 da tabela de números aleatórios. Direção: horizontal. Sentido:
esquerda para direita. Ao chegar ao final da linha volte ao início da linha anterior.

S = {23, 32, 28, 16, 02, 08} ,

e ordenando-os temos
S = {02, 08, 16, 23, 28, 32} .
21

11) Em uma convenção partidária estão presentes 30000 filiados. Deseja-se realizar uma pesquisa de
aceitação de um certo candidato para as próximas eleições com 5% de erro tolerável. Dessa forma,
o tamanho da amostra deveria ser de 394,74 (ou seja, 395 pessoas), entretanto, somente 271 filiados
devolveram o questionário. Pergunta-se: Qual o novo erro tolerável da pesquisa?

Como somente n2 = 271 filiados retornaram as fichas temos:

30000 × n0
271 =
30000 + n0

271 × 30000 + 271n0 = 30000n0

8130000 = 30000n0 − 271n0

29729n0 = 8130000

8130000
n0 = = 273, 47.
29729
1
Assim como n0 = , logo
(E0 )2

1 1
E0 = √ = √ = 0, 0605.
n0 273, 47

Dessa forma o novo erro tolerável da pesquisa é de 6, 05%.


22

12) Uma metrópole possui 110 locais de venda de carne. Devido a uma nova lei de armazenamento,
um inspetor foi designado para verificar se as novas exigências estavam sendo cumpridas. No entanto,
por falta de tempo, o mesmo optou por inspecionar uma amostra composta por 35 locais. Dado que
o cumprimento da nova lei exige alguns investimentos, para não correr o risco de selecionar muitos
locais de maior rentabilidade e que possivelmente se adequariam à mudança, ele optou por uma
amostra estratificada, classificando cada local de acordo com o seu tamanho, da seguinte forma:
Hipermercado (6), Supermercado (14), Mercado (30), Açougues e Mercearias (60). Determine o
número de elementos que devem ser amostrados em cada estrato.

O número total de elementos a serem amostrados é 35 e, assim:

• Para o estrato dos Hipermercados devemos selecionar 2 elementos, pois

N1 6
   
n1 = ×n = × 35 = d1, 91e = 2;
N 110

• Para o estrato dos Supermercados devemos selecionar 5 elementos, pois

N2 14
   
n2 = ×n = × 35 = d4, 45e = 5;
N 110

• Para o estrato dos Mercados devemos selecionar 10 elementos, pois

N3 30
   
n3 = ×n = × 35 = d9, 55e = 10;
N 110

• Para o estrato dos Açougues e Mercearias devemos selecionar 20 elementos, pois

N4 60
   
n4 = ×n = × 35 = d19, 09e = 20.
N 110

Note que queríamos 35 elementos, mas obtivemos um total de 37. Isso deve-se ao fato de garantirmos
que o erro amostral desejado seja alcançado.

Se arredondarmos para o inteiro mais próximo teremos

n1 = 2 n2 = 4 n3 = 10 n4 = 19

totalizando n = 35 elementos amostrados.


23

CAPÍTULO III

Estatística descritiva

1) Classifique cada uma das variáveis.

Tipo Variável
Sexo: “sexo”;
Fuma: “fuma”;
Trab: “trabalha”;
Time: “time para o qual torce”;
Qualitativa nominal
Curs: “curso no qual está matriculado”;
Nomo: “viciado em celular”;
Pres: “viria a aula se a presença não fosse obrigatória”;
Voto: “teria votado na última eleição se o voto não fosse obrigatório”;
Qualitativa ordinal Tole: “tolerância ao cigarro”;
Idad: “idade em anos”;
Estu: “número de horas semanais dedicadas a disciplina”;
Quantitativa discreta
Nota: “nota pretendida nessa disciplina”;
Peri: “período que está cursando esse semestre”;
Quantitativa contínua Altu: “altura”.
24

2) Para as variáveis qualitativas, determine:

a) A tabela de distribuição de frequências;


Para a variável “sexo”, temos que:

n = 30, n1 = 21, n2 = 9,

n1 21
f1 = = = 0, 7,
n 30
n2 9
f2 = = = 0, 3,
n 30
1
fac1 = fj = f1 = 0, 7,
X

j=1
2
fac2 = fj = f1 + f2 = 0, 7 + 0, 3 = 1,
X

j=1

e, utilizando-se esses resultados obteremos a tabela de distribuição de frequências, dada pela Tabela
1.

Tabela 1: Distribuição de frequências da variável sexo


Sexo ni f i fac
Feminino 21 0,7 0,7
Masculino 9 0,3 1
Total 30 1

Para a variável “fuma”, temos que:

n = 30, n1 = 29, n2 = 1,

n1 29
f1 = = = 0, 9667,
n 30
n2 1
f2 = = = 0, 0333,
n 30
1
fac1 = fj = f1 = 0, 9667,
X

j=1
2
fac2 = fj = f1 + f2 = 0, 9667 + 0, 0333 = 1,
X

j=1

e, utilizando-se esses resultados obteremos a tabela de distribuição de frequências, dada pela Tabela
2.
Para a variável “trabalha”, temos que:
25

Tabela 2: Distribuição de frequências da variável fuma


Fuma ni fi fac
NAO 29 0,9667 0,9667
SIM 1 0,0333 1
Total 30 1

n = 30, n1 = 20, n2 = 10,

n1 20
f1 = = = 0, 6667,
n 30
n2 10
f2 = = = 0, 3333,
n 30
1
fac1 = fj = f1 = 0, 6667,
X

j=1
2
fac2 = fj = f1 + f2 = 0, 6667 + 0, 3333 = 1,
X

j=1

e, utilizando-se esses resultados obteremos a tabela de distribuição de frequências, dada pela Tabela
3.

Tabela 3: Distribuição de frequências da variável trabalha


Trabalha ni fi fac
NAO 20 0,6667 0,6667
SIM 10 0,3333 1
Total 30 1

Para a variável “time”, temos que:

n = 30, n1 = 7, n2 = 1, n3 = 1, n4 = 8, n5 = 4, n6 = 1, n7 = 8,

7 1 1 8
f1 = = 0, 2333, f2 = = 0, 0333, f3 = = 0, 0333, f4 = = 0, 2667,
30 30 30 30
4 1 8
f5 = = 0, 1333, f6 = = 0, 0333, f7 = = 0, 2667,
30 30 30
26

1
fac1 = fj = 0, 2333,
X

j=1
2
fac2 = fj = 0, 2333 + 0, 0333 = 0, 2667,
X

j=1
3
fac3 = fj = 0, 2333 + 0, 0333 + 0, 0333 = 0, 3,
X

j=1
4
fac4 = fj = 0, 2333 + 0, 0333 + 0, 0333 + 0, 2667 = 0, 5667,
X

j=1
5
fac5 = fj = 0, 2333 + 0, 0333 + 0, 0333 + 0, 2667 + 0, 1333 = 0, 7,
X

j=1
6
fac6 = fj = 0, 2333 + 0, 0333 + 0, 0333 + 0, 2667 + 0, 1333 + 0, 0333 = 0, 7333,
X

j=1
7
fac7 = fj = 0, 2333 + 0, 0333 + 0, 0333 + 0, 2667 + 0, 1333 + 0, 0333 + 0, 2667 = 1
X

j=1

e, utilizando-se esses resultados obteremos a tabela de distribuição de frequências, dada pela Tabela
4.

Tabela 4: Distribuição de frequências da variável time


Time ni fi fac
ATLETICO 7 0,2333 0,2333
BOTAFOGO 1 0,0333 0,2667
CORINTHIANS 1 0,0333 0,3
CRUZEIRO 8 0,2667 0,5667
FLAMENGO 4 0,1333 0,7
FLUMINENSE 1 0,0333 0,7333
NENHUM 8 0,2667 1
Total 30 1

Para a variável “curso”, temos que:

n = 30, n1 = 4, n2 = 5, n3 = 5, n4 = 15, n5 = 1,

4 5 5
f1 = = 0, 1333, f2 = = 0, 1667, f3 = = 0, 1667,
30 30 30
15 1
f4 = = 0, 5, f5 = = 0, 0333,
30 30
27

1
fac1 = fj = 0, 1333,
X

j=1
2
fac2 = fj = 0, 1333 + 0, 1667 = 0, 3,
X

j=1
3
fac3 = fj = 0, 1333 + 0, 1667 + 0, 1667 = 0, 4667,
X

j=1
4
fac4 = fj = 0, 1333 + 0, 1667 + 0, 1667 + 0, 5 = 0, 9667,
X

j=1
5
fac5 = fj = 0, 1333 + 0, 1667 + 0, 1667 + 0, 5 + 0, 0333 = 1,
X

j=1

e, utilizando-se esses resultados obteremos a tabela de distribuição de frequências, dada pela Tabela
5.

Tabela 5: Distribuição de frequências da variável curso


Curso ni fi fac
CIS 4 0,1333 0,1333
ECD 5 0,1667 0,3
GEO 5 0,1667 0,4667
MVT 15 0,5 0,9667
NUT 1 0,0333 1
Total 30 1

Para a variável “nomofobia”, temos que:

n = 30, n1 = 23, n2 = 7,

23 7
f1 = = 0, 7667, f2 = = 0, 2333,
30 30

1
fac1 = fj = 0, 7667,
X

j=1
2
fac2 = fj = 0, 7667 + 0, 2333 = 1,
X

j=1

e, utilizando-se esses resultados obteremos a tabela de distribuição de frequências, dada pela Tabela
6.
Para a variável “presença”, temos que:

1
fac1 = fj = 0, 0333,
X

j=1
2
fac2 = fj = 0, 0333 + 0, 9667 = 1,
X

j=1
28

Tabela 6: Distribuição de frequências da variável nomofobia


Nomofobia ni fi fac
NAO 23 0,7667 0,7667
SIM 7 0,2333 1
Total 30 1

n = 30, n1 = 1, n2 = 29,
1 29
f1 = = 0, 0333, f2 = = 0, 9667,
30 30

e, utilizando-se esses resultados obteremos a tabela de distribuição de frequências, dada pela Tabela
7.

Tabela 7: Distribuição de frequências da variável presença


Presença ni fi fac
NAO 1 0,0333 0,0333
SIM 29 0,9667 1
Total 30 1

Para a variável “voto”, temos que:

n = 30, n1 = 11, n2 = 19,

11 19
f1 = = 0, 3667, f2 = = 0, 6333,
30 30

1
fac1 = fj = 0, 3667,
X

j=1
2
fac2 = fj = 0, 3667 + 0, 6333 = 1,
X

j=1

e, utilizando-se esses resultados obteremos a tabela de distribuição de frequências, dada pela Tabela
8.

Tabela 8: Distribuição de frequências da variável voto


Voto ni fi fac
NAO 11 0,3667 0,3667
SIM 19 0,6333 1
Total 30 1

Para a variável “tolerância”, temos que:

n = 30, n1 = 9, n2 = 7, n3 = 14,
29

9 7 14
f1 = = 0, 3, f2 = = 0, 2333, f3 = = 0, 4667,
30 30 30

1
fac1 = fj = 0, 3,
X

j=1
2
fac2 = fj = 0, 3 + 0, 2333 = 0, 5333,
X

j=1
3
fac3 = fj = 0, 3 + 0, 2333 + 0, 4667 = 1,
X

j=1

e, utilizando-se esses resultados obteremos a tabela de distribuição de frequências, dada pela Tabela
9.

Tabela 9: Distribuição de frequências da variável tolerância


Tolerância ni fi fac
INDIFERENTE 9 0,3 0,3
POUCO 7 0,2333 0,5333
MUITO 14 0,4667 1
Total 30 1

b) O gráfico de setores;
Utilizando os resultados obtidos em a), para a variável sexo temos

21
g1 = 360◦ × f1 = 360◦ × = 252◦ ,
30
9
g2 = 360 × f2 = 360 ×
◦ ◦
= 108◦ ,
30

o que resultará no gráfico de setores mostrado na Figura 1.


Feminino
70 %

Masculino
30 %
Figura 1: Gráfico de setores da variável sexo
30

Utilizando os resultados obtidos em a), para a variável fuma temos

29
g1 = 360◦ × f1 = 360◦ × = 348◦ ,
30
1
g2 = 360◦ × f2 = 360◦ × = 12◦ ,
30

o que resultará no gráfico de setores mostrado na Figura 2.

NAO
96,67 %
SIM
3,33 %

Figura 2: Gráfico de setores da variável fuma

Utilizando os resultados obtidos em a), para a variável trabalha temos

20
g1 = 360◦ × f1 = 360◦ × = 240◦ ,
30
10
g2 = 360◦ × f2 = 360◦ × = 120◦ ,
30

o que resultará no gráfico de setores mostrado na Figura 3.


NAO
66,67 %

SIM
33,33 %
Figura 3: Gráfico de setores da variável trabalha
31

Utilizando os resultados obtidos em a), para a variável time temos

7
g1 = 360◦ × f1 = 360◦ × = 84◦ ,
30
1
g2 = 360◦ × f2 = 360◦ × = 12◦ ,
30
1
g3 = 360◦ × f3 = 360◦ × = 12◦ ,
30
8
g4 = 360◦ × f4 = 360◦ × = 96◦ ,
30
4
g5 = 360◦ × f5 = 360◦ × = 48◦ ,
30
1
g6 = 360◦ × f6 = 360◦ × = 12◦ ,
30
8
g7 = 360◦ × f5 = 360◦ × = 96◦ ,
30

o que resultará no gráfico de setores mostrado na Figura 4.

CORINTHIANS BOTAFOGO
3,33 % 3,33 %

ATLETICO
23,33 %
CRUZEIRO
26,67 %

FLAMENGO NENHUM
13,33 % 26,67 %
FLUMINENSE
3,33 %

Figura 4: Gráfico de setores da variável time

Utilizando os resultados obtidos em a), para a variável curso temos

4
g1 = 360◦ × f1 = 360◦ × = 48◦ ,
30
5
g2 = 360◦ × f2 = 360◦ × = 60◦ ,
30
5
g3 = 360◦ × f3 = 360◦ × = 60◦ ,
30
15
g4 = 360◦ × f4 = 360◦ × = 180◦ ,
30
1
g5 = 360◦ × f5 = 360◦ × = 12◦ ,
30

o que resultará no gráfico de setores mostrado na Figura 5.


32

ECD
16,67 %
GEO
16,67 %
CIS
13,33 %

NUT
3,33 %

MVT
50 %
Figura 5: Gráfico de setores da variável curso

Utilizando os resultados obtidos em a), para a variável nomofobia temos

23
g1 = 360◦ × f1 = 360◦ × = 276◦ ,
30
7
g2 = 360◦ × f2 = 360◦ × = 84◦ ,
30

o que resultará no gráfico de setores mostrado na Figura 6.

NAO
76,67 %

SIM
23,33 %

Figura 6: Gráfico de setores da variável nomofobia

Utilizando os resultados obtidos em a), para a variável presença temos

1
g1 = 360◦ × f1 = 360◦ × = 12◦ ,
30
29
g2 = 360◦ × f2 = 360◦ × = 348◦ ,
30

o que resultará no gráfico de setores mostrado na Figura 7.


33

NAO
3,33 %
SIM
96,67 %

Figura 7: Gráfico de setores da variável presença

Utilizando os resultados obtidos em a), para a variável voto temos

11
g1 = 360◦ × f1 = 360◦ × = 132◦ ,
30
19
g2 = 360 × f2 = 360 ×
◦ ◦
= 228◦ ,
30

o que resultará no gráfico de setores mostrado na Figura 8.

NAO
36,67 %

SIM
63,33 %

Figura 8: Gráfico de setores da variável voto

Utilizando os resultados obtidos em a), para a variável tolerância temos

9
g1 = 360◦ × f1 = 360◦ × = 108◦ ,
30
7
g2 = 360 × f2 = 360 ×
◦ ◦
= 84◦ ,
30
14
g3 = 360 × f3 = 360 ×
◦ ◦
= 168◦ ,
30
34

o que resultará no gráfico de setores mostrado na Figura 9.


INDIFERENTE
30 %
POUCO
23,33 %

MUITO
46,67 %
Figura 9: Gráfico de setores da variável tolerância

c) O gráfico de barras.
Utilizando os resultados obtidos em a), para a variável sexo temos a Figura 10.
20
15
10
5
0

Feminino Masculino

Figura 10: Gráfico de barras da variável sexo


35

Utilizando os resultados obtidos em a), para a variável fuma temos a Figura 11.
25
20
15
10
5
0

NAO SIM

Figura 11: Gráfico de barras da variável fuma


36

Utilizando os resultados obtidos em a), para a variável trabalha temos a Figura 12.
20
15
10
5
0

NAO SIM

Figura 12: Gráfico de barras da variável trabalha


37

Utilizando os resultados obtidos em a), para a variável time temos a Figura 13.
8
6
4
2
0

ATL BOT COR CRU FLA FLU NEN

Figura 13: Gráfico de barras da variável time


38

Utilizando os resultados obtidos em a), para a variável curso temos a Figura 14.
14
12
10
8
6
4
2
0

CIS ECD GEO MVT NUT

Figura 14: Gráfico de barras da variável curso


39

Utilizando os resultados obtidos em a), para a variável nomofobia temos a Figura 15.
20
15
10
5
0

NAO SIM

Figura 15: Gráfico de barras da variável nomofobia


40

25
20
15
10
5
0

NAO SIM

Figura 16: Gráfico de barras da variável presença


41

Utilizando os resultados obtidos em a), para a variável voto temos a Figura 17.
15
10
5
0

NAO SIM

Figura 17: Gráfico de barras da variável voto


42

Utilizando os resultados obtidos em a), para a variável tolerância temos a Figura 18.
14
12
10
8
6
4
2
0

IND POU MUI

Figura 18: Gráfico de barras da variável tolerância


43

3) Para as variáveis quantitativas discretas, determine

a) A tabela de distribuição de frequências;

Tabela 10: Distribuição de frequências para a idade


Idade ni fi fac
18 5 0,16667 0,1667
19 7 0,23333 0,4000
20 3 0,10000 0,5000
21 4 0,13333 0,6333
22 3 0,10000 0,7333
23 2 0,06667 0,8000
24 2 0,06667 0,8667
26 1 0,03333 0,9000
28 2 0,06667 0,9667
29 1 0,03333 1,0000
Total 30 1

Tabela 11: Distribuição de frequências para horas de estudo


Horas de estudo ni fi fac
1 1 0,03333 0,03333
2 11 0,36667 0,40000
3 5 0,16667 0,56667
4 8 0,26667 0,83333
5 2 0,06667 0,90000
6 1 0,03333 0,93333
10 1 0,03333 0,96667
30 1 0,03333 1,00000
Total 30 1

Tabela 12: Distribuição de frequências para a nota


Nota ni fi fac
60 4 0,13333 0,1333
70 6 0,20000 0,3333
75 5 0,16667 0,5000
80 8 0,26667 0,7667
85 4 0,13333 0,9000
90 2 0,06667 0,9667
95 1 0,03333 1,0000
Total 30 1
44

Tabela 13: Distribuição de frequências para o período


Período ni fi fac
3 17 0,56667 0,5667
5 3 0,10000 0,6667
7 2 0,06667 0,7333
9 8 0,26667 1,0000
Total 30 1

b) O gráfico de barras.

Faremos agora o gráfico de barras para a variável idade, utilizando as frequências absolutas na
Tabela 10 que resultarão na Figura 19; posteriormente utilizaremos os resultados obtidos nessa
mesma tabela a fim de construirmos o gráfico com as frequências relativas (Figura 20).
7
6
5
4
3
2
1
0

18 19 20 21 22 23 24 26 28 29

Figura 19: Gráfico de barras da variável idade - valores absolutos


45

0,25
0,20
0,15
0,10
0,05
0,00

18 19 20 21 22 23 24 26 28 29

Figura 20: Gráfico de barras da variável idade - valores percentuais

Faremos agora o gráfico de barras para a variável horas de estudo, utilizando as frequências
absolutas na Tabela 10 que resultarão na Figura 21; posteriormente utilizaremos os resultados
obtidos nessa mesma tabela a fim de construirmos o gráfico com as frequências relativas (Figura
22).
46

10
8
6
4
2
0

1 2 3 4 5 6 10 30

Figura 21: Gráfico de barras da variável horas de estudo - valores absolutos


0,4
0,3
0,2
0,1
0,0

1 2 3 4 5 6 10 30

Figura 22: Gráfico de barras da variável horas de estudo - valores percentuais

Faremos agora o gráfico de barras para a variável nota, utilizando as frequências absolutas na
Tabela 12 que resultarão na Figura 23; posteriormente utilizaremos os resultados obtidos nessa
47

mesma tabela a fim de construirmos o gráfico com as frequências relativas (Figura 24).
8
6
4
2
0

60 70 75 80 85 90 95

Figura 23: Gráfico de barras da variável nota - valores absolutos


0,30
0,25
0,20
0,15
0,10
0,05
0,00

60 70 75 80 85 90 95

Figura 24: Gráfico de barras da variável nota - valores percentuais


48

Faremos agora o gráfico de barras para a variável período, utilizando as frequências absolutas
na Tabela 13 que resultarão na Figura 25; posteriormente utilizaremos os resultados obtidos
nessa mesma tabela a fim de construirmos o gráfico com as frequências relativas (Figura 26).
15
10
5
0

3 5 7 9

Figura 25: Gráfico de barras da variável período - valores absolutos


49

0,6
0,5
0,4
0,3
0,2
0,1
0,0

3 5 7 9

Figura 26: Gráfico de barras da variável período - valores percentuais

4) Para as variáveis quantitativas contínuas, determine o histograma.

i) Rol.

1,55 1,56 1,57 1,58 1,58 1,59 1,60 1,60 1,60 1,61
1,62 1,63 1,63 1,65 1,65 1,65 1,66 1,66 1,67 1,68
1,68 1,69 1,69 1,69 1,70 1,72 1,73 1,80 1,82 1,86

ii) Número de classes.

Como temos 30 dados, devemos ter

h√ i
k= 30 = [5, 48] .

Devemos tomar o inteiro mais próximo de 5,48, desse modo devemos ter k = 5 classes.

iii) Comprimento de cada classe.

A amplitude é dada por


AT (X) = Xmáx − Xmin = 9 − 3 = 6,

e o comprimento das classes é

AT (X) 0, 31 0, 31
c= = = = 0, 08. (1)
k−1 5−1 4
50

iv) Determinar o limite inferior da primeira classe.

Esse limite é dado por

c 0, 08
LI1 = Xmin − =3− = 3 − 0, 04 = 2, 96. (2)
2 2

Entretanto, temos 5 classes e, portanto devemos encontrar os limites das outras classes. Isso é
feito somando-se o valor do comprimento das classess, assim:

LI1 = 1, 51;

LI2 = LI1 + c = 1, 51 + 0, 08 = 1, 59;

LI3 = LI2 + c = 1, 59 + 0, 08 = 1, 67;

LI4 = LI3 + c = 1, 67 + 0, 08 = 1, 75;

LI5 = LI4 + c = 1, 75 + 0, 08 = 1, 83.

O limite superior também é obtido somando-se c = 0, 08 ao limite inferior da última classe, isto
é,
LS = LI5 + c = 1, 83 + 0, 08 = 1, 91.

v) Com esses resultados obtemos os limites das classes e podemos construir a tabela de distribuição
de frequências, conforme a Tabela 14.

Tabela 14: Distribuição de frequências para a variável “altura”


Altura ni fi fac
1,51 ` 1,59 5 0,1667 0,1667
1,59 ` 1,67 13 0,4333 0,6
1,67 ` 1,75 9 0,3 0,9
1,75 ` 1,83 2 0,0667 0,9667
1,83 ` 1,91 1 0,0333 1
Total 30 1

Conhecendo-se a tabela de distribuição de frequências dada na Tabela 14, podemos determinar


o histograma para a variável altura, o que resultará na Figura 27 a seguir.
51

15
Frequencia absoluta

10
5
0

1,51 1,59 1,67 1,75 1,83 1,91

Altura

Figura 27: Histograma para a variável altura


52

5) Como parte de um estudo para se definir um novo cardápio mais balanceado para a merenda escolar,
os alunos de uma escola de ensino médio foram pesados, registrando-se os pesos em quilogramas. Os
dados obtidos foram:

44,2 77,1 52,6 58,2 40,8 63,4 64,5 53,2 54,6 66,6 76,3 75,5
84,6 60,2 49,0 64,0 58,0 60,3 42,1 55,0 57,9 63,2 40,6 63,2

Determine o histograma para o peso dos alunos.

i) Rol.

40,60 40,80 42,10 44,20 49,00 52,60 53,20 54,60


55,00 57,90 58,00 58,20 60,20 60,30 63,20 63,20
63,40 64,00 64,50 66,60 75,50 76,30 77,10 84,60

ii) Número de classes.

Como temos 24 dados, devemos ter


k = [ 24] = [4, 9].

Devemos tomar o inteiro mais próximo de 4,9, desse modo devemos ter k = 5 classes.

iii) Comprimento de cada classe.

A amplitude é dada por

AT (X) = Xmáx − Xmin = 84, 6 − 40, 6 = 44,

e o comprimento das classes é

AT (X) 44 44
c= = = = 11. (3)
k−1 5−1 4

iv) Determinar o limite inferior da primeira classe.

Esse limite é dado por

c 11
LI1 = Xmin − = 40, 6 − = 40, 6 − 5, 5 = 35, 1. (4)
2 2

Entretanto, temos 5 classes e, portanto devemos encontrar os limites das outras classes. Isso é feito
53

somando-se o valor do comprimento das classess, assim:

LI1 = 35, 1;

LI2 = LI1 + c = 35, 1 + 11 = 46, 1;

LI3 = LI2 + c = 46, 1 + 11 = 57, 1;

LI4 = LI3 + c = 57, 1 + 11 = 68, 1;

LI5 = LI4 + c = 68, 1 + 11 = 79, 1.

O limite superior também é obtido somando-se c = 11 ao limite inferior da última classe, isto é,

LS = LI5 + c = 79, 1 + 11 = 90, 1.

v) Com esses resultados obtemos os limites das classes e podemos construir a tabela de distribuição
de frequências, conforme a Tabela 15.

Tabela 15: Distribuição de frequências para a variável “peso”


Peso ni fi fac
35,1 ` 46,1 4 0,1667 0,1667
46,1 ` 57,1 5 0,2083 0,375
57,1 ` 68,1 11 0,4583 0,8333
68,1 ` 79,1 3 0,125 0,9583
79,1 ` 90,1 1 0,0417 1
Total 24 1

Conhecendo-se a tabela de distribuição de frequências dada na Tabela 15, podemos determinar o


histograma para a variável peso, o que resultará na Figura 28 a seguir.
54

14
12
10
Frequencia absoluta

8
6
4
2
0

35,1 46,1 57,1 68,1 79,1 90,1

Peso

Figura 28: Histograma para a variável peso


55

6) Em um estudo acerca do tempo de espera em uma fila de um grande supermercado obteve-se os


seguintes valores (em segundos):

98,31 116,81 90,73 88,98 114,72 97,84 96,59


78,23 39,78 88,14 84,80 105,84 108,43 74,11
101,39 83,74 130,22 94,57 131,17 95,25 125,66

Determine o histograma para o tempo de espera.

i) Rol.

39,78 74,11 78,23 83,74 84,80 88,14 88,98


90,73 94,57 95,25 96,59 97,84 98,31 101,39
105,84 108,43 114,72 116,81 125,66 130,22 131,17


ii) Número de classes. Como temos 21 dados, então k = [ 21] = [4, 58]. Devemos tomar o
inteiro mais próximo de 4,58, desse modo devemos ter k = 5 classes.

iii) Comprimento de cada classe. A amplitude é dada por

AT (X) = Xmáx − Xmin = 131, 17 − 39, 78 = 91, 39,

e o comprimento das classes é

AT (X) 91, 39 91, 39


c= = = = 22, 85. (5)
k−1 5−1 4

iv) Determinar o limite inferior da primeira classe. Temos que

c 22, 85
LI1 = Xmin − = 39, 78 − = 39, 78 − 11, 42 = 28, 36. (6)
2 2

Para as 5 classes temos:

LI1 = 28, 36

LI2 = LI1 + c = 28, 36 + 22, 85 = 51, 21

LI3 = LI2 + c = 51, 21 + 22, 85 = 74, 06

LI4 = LI3 + c = 74, 06 + 22, 85 = 96, 91

LI5 = LI4 + c = 96, 91 + 22, 85 = 119, 76

O limite superior também é obtido somando-se c = 22, 85 ao limite inferior da última classe,
isto é,
LS = LI5 + c = 119, 76 + 22, 85 = 142, 61.
56

v) Com esses resultados obtemos os limites das classes e podemos construir a tabela de distribuição
de probabilidades, conforme a Tabela 16.

Tabela 16: Distribuição de frequências para a variável “tempo de espera”.


Tempo de espera ni fi fac
28, 36 ` 51, 21 1 0,0476 0,0476
51, 21 ` 74, 06 0 0 0,0476
74, 06 ` 96, 91 10 0,4762 0,5238
96, 91 ` 119, 76 7 0,3333 0,8571
119, 76 ` 142, 61 3 0,1429 1
Total 21 1

Conhecendo-se a tabela de distribuição de frequências dada na Tabela 16, podemos determinar


o histograma para a variável tempo de espera, o que resultará na Figura 29 a seguir.
12
10
Frequência absoluta

8
6
4
2
0

28,36 51,21 74,06 96,91 119,76 142,61

Tempo de espera
Figura 29: Histograma para a variável tempo de espera
57

7) Nas pesquisas da área de saúde é comum o interesse por estudar o tempo até a ocorrência de
um determinado evento, em geral, o tempo até o falecimento ou o óbito de um paciente, devido a
uma determinada doença. Os dados a seguir (já em rol) apresentam informações sobre o tempo de
sobrevivência (em meses) de 20 pacientes com linfoma de Hodgkin, um tipo de câncer que afeta os
gânglios linfáticos, tendo como sintomas principais a febre, sudorese noturna, perda de peso, coceira,
cansaço e perca de apetite.

2 4 6 7 7 13 14 18 20 25 25 27 29 30 32 33 35 41 43 45

a) Agrupe os dados em uma tabela de classes de frequências (Tabela que é utilizada para fazer o
histograma);

i) Rol.

2 4 6 7 7 13 14 18 20 25 25 27 29 30 32 33 35 41 43 45


ii) Número de classes. Como temos 20 dados, então k = [ 20] = [4, 47]. Devemos tomar o inteiro
mais próximo de 4,47, desse modo devemos ter k = 4 classes.

iii) Comprimento de cada classe. A amplitude é dada por

AT (X) = Xmáx − Xmin = 45 − 2 = 43,

e o comprimento das classes é

AT (X) 43 43
c= = = = 14, 33. (7)
k−1 4−1 3

iv) Determinar o limite inferior da primeira classe. Temos que

c 14, 33
LI1 = Xmin − =2− = 2 − 7, 17 = −5, 17. (8)
2 2

Para as 4 classes temos:

LI1 = −5, 17

LI2 = LI1 + c = −5, 17 + 14, 33 = 9, 16

LI3 = LI2 + c = 9, 16 + 14, 33 = 23, 49

LI4 = LI3 + c = 23, 49 + 14, 33 = 37, 82

O limite superior também é obtido somando-se c = 14, 33 ao limite inferior da última classe, isto
58

é,
LS = LI4 + c = 37, 82 + 14, 33 = 52, 15.

v) Com esses resultados obtemos os limites das classes e podemos construir a tabela de distribuição
de probabilidades, conforme a Tabela 17.

Tabela 17: Distribuição de frequências para a variável “tempo de sobrevivência”.


Tempo de sobrevivência ni fi fac
−5, 17 ` 9, 16 5 0,25 0,25
9, 16 ` 23, 49 4 0,2 0,45
23, 49 ` 37, 82 8 0,4 0,85
37, 82 ` 52, 15 3 0,15 1
Total 20 1

b) Determine o histograma de frequências absolutas para o tempo de sobrevivência.

Conhecendo-se a tabela de distribuição de frequências dada na Tabela 17, podemos determinar o


histograma para a variável tempo de sobrevivência, o que resultará na Figura 30 a seguir.
10
8
Frequência absoluta

6
4
2
0

−5,17 9,16 23,49 37,82 52,15

Tempo de sobrevivência
Figura 30: Histograma para a variável tempo de sobrevivência
59

8) O Diabetes é uma doença crônica na qual o organismo não produz insulina suficiente, o que eleva os
níveis de glicose no sangue e causa o quadro de hiperglicemia. Adicionalmente, se não for devidamente
controlado, o Diabetes pode prejudicar o funcionamento de órgãos como rins, olhos e até mesmo o
coração. Os dados a seguir (já em rol) indicam o número de pessoas diabéticas em 20 hospitais, que
necessitam de um medicamento específico (insulina) para o controle dessa doença.

7 8 8 9 9 9 9 9 10 10 10 10 10 10 10 10 11 11 11 12

a) Agrupe os dados em uma tabela de classes de frequências;

i) Rol.

7 8 8 9 9 9 9 9 10 10 10 10 10 10 10 10 11 11 11 12


ii) Número de classes. Como temos 20 dados, então k = [ 20] = [4, 47]. Devemos tomar o inteiro
mais próximo de 4,47, desse modo devemos ter k = 4 classes.

iii) Comprimento de cada classe. A amplitude é dada por

AT (X) = Xmáx − Xmin = 12 − 7 = 5,

e o comprimento das classes é

AT (X) 5 5
c= = = = 1, 67. (9)
k−1 4−1 3

iv) Determinar o limite inferior da primeira classe. Temos que

c 1, 67
LI1 = Xmin − =7− = 7 − 0, 83 = 6, 17. (10)
2 2

Para as 4 classes temos:

LI1 = 6, 17

LI2 = LI1 + c = 6, 17 + 1, 67 = 7, 84

LI3 = LI2 + c = 7, 84 + 1, 67 = 9, 51

LI4 = LI3 + c = 9, 51 + 1, 67 = 11, 18

O limite superior também é obtido somando-se c = 1, 67 ao limite inferior da última classe, isto
é,
LS = LI4 + c = 11, 18 + 1, 67 = 12, 85.
60

v) Com esses resultados obtemos os limites das classes e podemos construir a tabela de distribuição
de probabilidades, conforme a Tabela 18.

Tabela 18: Distribuição de frequências para a variável “número de pessoas diabéticas, que necessitam
do medicamento”.
Número de pessoas diabéticas, que necessitam do medicamento ni fi fac
6, 17 ` 7, 84 1 0,05 0,05
7, 84 ` 9, 51 7 0,35 0,4
9, 51 ` 11, 18 11 0,55 0,95
11, 18 ` 12, 85 1 0,05 1
Total 20 1

b) Determine o histograma de frequências absolutas.

Conhecendo-se a tabela de distribuição de frequências dada na Tabela 18, podemos determinar o


histograma para a variável número de pessoas diabéticas, que necessitam do medicamento, o que
resultará na Figura 31 a seguir.
14
12
10
Frequência absoluta

8
6
4
2
0

6,17 7,84 9,51 11,18 12,85

Número de pessoas diabéticas, que necessitam do medicamento


Figura 31: Histograma para a variável número de pessoas diabéticas, que necessitam do medicamento
61

CAPÍTULO IV

Medidas resumo

1) João e Izabel decidiram verificar o consumo de energia elétrica (Kw/h) em sua residência. As
observações de doze meses são apresentadas a seguir.

605; 637; 305; 448; 448; 457; 534; 544; 544; 544; 544; 545
a) Determine a moda do consumo de energia elétrica nessa amostra.

A moda é Mo1 (X) = 544, sendo o conjunto unimodal.

b) Determine a mediana do consumo de energia elétrica nessa amostra.

Como nX = 12 é par quando os dados estão organizados em rol, a mediana é dada pela média dos
n n
   
elementos que ocupam as posições e + 1 , isto é:
2 2

X( 12 ) + X( 12 +1) X(6) + X(7) 544 + 544


Md(X) = 2 2
= = = 544.
2 2 2

c) Interprete o significado do resultado do item b).

Para o conjunto de valores colocados em ordem crescente ou decrescente de grandeza, a mediana 544
é o elemento que ocupa a posição central, sendo pelo menos 50% das observações da amostra valores
iguais ou superiores e, pelo menos 50% das observações da amostra valores iguais ou inferiores a ela.

d) Determine o desvio padrão amostral da média do consumo de energia elétrica.

Temos que

Assim
v
u  n 2
u P
u
uP n
Xi
i=1
v
u X2 − u 3241001 − (6155)2
u
t i=1 i n
q u
S (X) = S 2 (X) = = 12
t
n−1 12 − 1
s
83998, 9167 √
= = 7636, 2652 = 87, 3857.
11
62

Xi Xi2
605 366025
637 405769
305 93025
448 200704
448 200704
457 208849
534 285156
544 295936
544 295936
544 295936
544 295936
545 297025
12 12
Xi = 6155 Xi2 = 3241001
P P
i=1 i=1

2) Francine observou o resultado do lançamento do disco (em metros) de 27 atletas veteranos, no


último campeonato mundial de atletismo e obteve as seguintes somas:

27 27
Xi = 866, 8005, Xi2 = 29434, 1497.
X X

i=1 i=1

a) Determine a média dos resultados no lançamento do disco desses atletas.

Temos que
27
P
Xi
866, 8005
X̄ = i=1
= = 32, 1037.
27 27

b) Determine o desvio padrão dos resultados no lançamento do disco desses atletas.

v
u  n 2
u P
u
uP n
Xi
i=1
v
u X2 − u 29434, 1497 − (866,8005)2
u
t i=1 i n
q u
S (X) = S 2 (X) = = 27
t
n−1 27 − 1
s
1606, 626 √
= = 61, 7933 = 7, 8609.
26
63

3) Érica realizou a descrição estatística do comprimento (em mm) e a biomassa (em mg) em sementes
de pinhão manso (Jatropha curcas L.) (dados fictícios). Após os cálculo obteve:

Comprimento X̄ = 18, 05 mm S(X) = 1, 02 mm CV (X)% = 5, 65%


Biomassa Ȳ = 631, 98 mg S(Y ) = 55, 75 mg CV (Y )% = 8, 821%

Determine qual é a variável mais homogênea. Justifique sua resposta.

Sabemos que a amostra mais homogênea é aquela que apresenta menor coeficiente de variação e,
como
CV (X)% = 5, 65% < 8, 821% = CV (Y )%

temos que o comprimento é mais homogêneo que a biomassa para as sementes de pinhão manso.
64

4) Uma fábrica empacotava um determinado produto com as seguintes especificações:

Massa média de empacotamento (kg) Desvio padrão (kg)


X̄ = 50 SX = 2

Após ser vendida, o novo proprietário determinou que as especificações agora não seriam mais as
mesmas, ao invés disto a correção Y = 0, 9X + 4 deveria ser efetuada.

a) Determine a massa média e a variância com que a fábrica opera após ser efetuada a correção.

Temos que Y = 0, 9X + 4 e utilizando-se propriedades da média temos

Ȳ = 0, 9X̄ + 4 = 0, 9 · 50 + 4 = 49.

Utilizando-se propriedades da variância temos que

var (Y ) = var (0, 9X + 4) = var (0, 9X) = 0, 92 · var (X) = 0, 81 · 22 = 3, 24.

b) A produção da fábrica era mais homogênea antes ou após a correção efetuada?

S(X) 2
CV (X)% = × 100% = × 100% = 4%,
X̄ 50

e,

S(Y ) 3, 24 1, 8
CV (Y )% = × 100% = × 100% = × 100% = 3, 67%.
Ȳ 49 49

Sabemos que a amostra mais homogênea é aquela que apresenta menor coeficiente de variação e,
como
CV (Y )% = 3, 6735% < 4% = CV (X)%

temos que a produção da fábrica tornou-se mais homogênea após a correção efetuada.
65

5) Em duas turmas de EST 103, X e Y , os alunos que realizaram as provas obtiveram as seguintes
notas:

X 2 3 9 7 8,5 6,5 7,5 6 5 7 6,5 2,5 8 9 10 —


Y 2,5 3,5 4 4,5 5 5,5 6 6 6,5 7 7 9 9 9 9,5 10

a) Determine a nota mediana para a turma X e para a turma Y ;

Como nX = 15 é ímpar quando os dados estão organizados em rol, a mediana é dada pelo
n+1
 
elemento que ocupa a posição , isto é:
2

Md(X) = X( 15+1 ) = X(8) = 7.


2

Como nY = 16 é par quando os dados estão organizados em rol, a mediana é dada pela média
n n
   
dos elementos que ocupam as posições e + 1 , isto é:
2 2

Y( 16 ) + Y( 16 +1) Y(8) + Y(9) 6 + 6, 5


Md(Y ) = 2 2
= = = 6, 25.
2 2 2

b) Determine a(s) nota(s) modais para a turma X e para a turma Y ;

As moda são Mo1 (X) = 9, Mo2 (X) = 7, e Mo3 (X) = 6, 5, sendo o conjunto multimodal.

A moda é Mo1 (Y ) = 9, sendo o conjunto unimodal.

c) Determine a nota média para a turma X e para a turma Y ;

n
P
Xi
2 + 3 + · · · + 10 97, 5
X̄ = i=1
= = = 6, 5,
n 15 15

n
P
Yi
2, 5 + 3, 5 + · · · + 10 104
Ȳ = i=1
= = = 6, 5.
n 16 16

d) Qual turma é mais homogênea? justifique.

v
u 717, 25 − (97,5)2
u s
q 83, 5 √
S (X) = S 2 (X) = 15
= = 5, 9643 = 2, 4422,
t
15 − 1 14

v
u 755, 5 − (104)2
u s
q 79, 5 √
S (Y ) = S 2 (Y ) = 16
= = 5, 3 = 2, 3022,
t
16 − 1 15
66

S(X) 2, 4422
CV (X)% = × 100% = × 100% = 37, 57%,
X̄ 6, 5

e,

S(Y ) 2, 3022
CV (Y )% = × 100% = × 100% = 35, 42%.
Ȳ 6, 5

Como 35, 42% = CV (Y )% < CV (X)% = 37, 57% temos que a turma Y é mais homogênea que
a turma X.
67

6) Faça as devidas associações.

A Valor mediano F Estatística descritiva


B Estatística G População
C Moda H Estatística inferencial
D Variável quantitativa I Variância
E Parâmetro J Variável qualitativa

(F) Parte da estatística que visa somente resumir, descrever e apresentar os dados, sem inferir.

(I) Mede a dispersão dos valores em torno da média aritmética.

(A) Pelo menos metade dos valores são maiores ou iguais e também pelo menos metade são menores
ou iguais a esse valor.

(J) Variável cujos valores são referentes à qualidade, atributo ou categoria.

(E) É uma medida que descreve certa característica dos elementos da população.

(B) Método científico para planejar, coletar, organizar, resumir, apresentar e analisar dados. Tam-
bém inclui princípios e definições para validar resultados das análises e permitir conclusões
válidas.

(C) É o valor mais frequente do conjunto de valores observado.

(G) É o conjunto de todos os elementos ou resultados sob investigação.

(D) Variável cujos valores são numéricos, podendo ser obtidos por meio de uma contagem ou men-
suração.

(H) Conjunto de técnicas que possibilitam a extrapolação, a um grande conjunto de dados, das
informações e conclusões obtidas a partir da amostra.
68

7) Assinale (V) se a afirmativa for totalmente verdadeira, caso contrário assinale (F).

(F) Para quaisquer valores X1 , X2 , . . . , Xn temos sempre que X̄ ≤ Md(X).

Por exemplo, se X = {0, 1, 10}, temos que

3
X
Xi
11
X̄ = i=1
= = 3, 6667.
3 3

Como nX = 3 é ímpar quando os dados estão organizados em rol, a mediana é dada pelo
n+1
 
elemento que ocupa a posição , isto é:
2

Md(X) = X( 3+1 ) = X(2) = 1.


2

Note que, nesse caso, X̄ > Md(X).

(F) Para quaisquer valores X1 , X2 , . . . , Xn temos sempre que X̄ ≥ Md(X).

Por exemplo, se X = {0; 9; 10}, temos que

3
X
Xi
19
X̄ = i=1
= = 6, 3333.
3 3

Como nX = 3 é ímpar quando os dados estão organizados em rol, a mediana é dada pelo
n+1
 
elemento que ocupa a posição , isto é:
2

Md(X) = X( 3+1 ) = X(2) = 9.


2

Note que, nesse caso, X̄ < Md(X).

(F) Para quaisquer valores X1 , X2 , . . . , Xn temos sempre que Mo(X) ≤ Md(X).

Por exemplo, considere o conjunto X = {0; 1; 9; 10; 10}. A moda é Mo1 (X) = 10, sendo o
conjunto unimodal. Como nX = 5 é ímpar quando os dados estão organizados em rol, a
n+1
 
mediana é dada pelo elemento que ocupa a posição , isto é:
2

Md(X) = X( 5+1 ) = X(3) = 9.


2

Note que, nesse caso, Mo(X) > Md(X).

(V) A variância amostral mede a dispersão em torno da média aritmética e resulta sempre em um
valor não negativo.
69

(F) Em uma amostra com n observações, tem-se pelo menos n/2 observações maiores e também
pelo menos n/2 observações menores que o valor mediano.

(F) O coeficiente de variação é adimensional, isto é, não possui unidade de medida.

(F) As amostras X = {15; 13; 10; 7; 4} e Y = {105; 103; 100; 97; 94} possuem variâncias iguais, porém
os não possuem igual homogeneidade ou dispersão relativa, pois os coeficientes de variação são
diferentes.

n
P
Xi
15 + 13 + · · · + 4 49
X̄ = i=1
= = = 9, 8,
n 5 5

n
P
Yi
105 + 103 + · · · + 94 499
Ȳ = i=1
= = = 99, 8.
n 5 5

v
u 559 − (49)2
u s
q 78, 8 √
S (X) = S 2 (X) = 5
= = 19, 7 = 4, 4385,
t
5−1 4

v
u 49879 − (499)2
u s
q 78, 8 √
S (Y ) = S 2 (Y ) = 5
= = 19, 7 = 4, 4385,
t
5−1 4

S(X) 4, 4385
CV (X)% = × 100% = × 100% = 45, 29%,
X̄ 9, 8

e,

S(Y ) 4, 4385
CV (Y )% = × 100% = × 100% = 4, 45%.
Ȳ 99, 8

Como 4, 45% = CV (Y )% < CV (X)% = 45, 29% temos que a turma Y é mais homogênea que
a turma X.
70

8) A tabela a seguir apresenta os tempos de duração de chamadas telefônicas (em minutos), obtidos
em uma amostra de oito telefonemas.

Telefonema 1 2 3 4 5 6 7 8
Tempo (min.) 1 3 6 15 8 1 4 2

Calcule e interprete:

a) O tempo médio.

Temos que
n
P
Xi
1 + 3 + ··· + 2 40
X̄ = i=1
= = = 5,
n 8 8
sendo esse um valor central, em torno do qual a duração média das chamadas tendem a se concentrar.

b) O tempo mediano.

Como nX = 8 é par quando os dados estão organizados em rol, a mediana é dada pela média dos
n n
   
elementos que ocupam as posições e + 1 , isto é:
2 2

X( 8 ) + X( 8 +1) X(4) + X(5) 3+4


Md(X) = 2 2
= = = 3, 5.
2 2 2

Para o conjunto de valores colocados em ordem crescente ou decrescente de grandeza, o valor mediano
obtido é o elemento que ocupa a posição central, sendo pelo menos 50% das ligações telefônicas com
duração igual ou superior e, pelo menos 50% das ligações telefônicas com duração menor ou inferior
a ele.

c) O tempo modal.

A moda é Mo1 (X) = 1, sendo o conjunto unimodal. Dessa forma essa é a duração telefônica que
ocorre com maior frequência.
71

9) Considere a seguinte amostra,

Frequência 3 2 1 4
Valor 2 3 5 1

Determine:

a) O valor médio.

A média pode ser calculada da seguinte maneira:

k
P
ni Xi
3×2+2×3+1×5+4×1
X̄ = i=1
=
k
P 3+2+1+4
ni
i=1
21
= = 2, 1. (1)
10

b) O valor mediano.

Como nX = 10 é par quando os dados estão organizados em rol, a mediana é dada pela média dos
n n
   
elementos que ocupam as posições e + 1 , isto é:
2 2

X( 10 ) + X( 10 +1) X(5) + X(6) 2+2


Md(X) = 2 2
= = = 2.
2 2 2

c) O valor modal.

A moda é Mo1 (X) = 1, sendo o conjunto unimodal.


72

10) Sejam X = {1; 5; 12; −3; 5; 7; 8; −5; 6}, Y = X + 20, Z = 20X e W = 8X − 30. Determine:

a) A média de X;

n
P
Xi
1 + 5 + ··· + 6 36
X̄ = i=1
= = = 4.
n 9 9

b) A variância de X;

2
378 − (36) 234
S (X) =
2 9
= = 29, 25.
9−1 8

c) O coeficiente de variação de X;

q √
S (X) = S 2 (X) = 29, 25 = 5, 4083,

S(X) 5, 4083
CV (X)% = × 100% = × 100% = 135, 21%.
X̄ 4

d) A média de Y ;

n
P
Yi
21 + 25 + · · · + 26 216
Ȳ = i=1
= = = 24,
n 9 9
ou
Ȳ = X̄ + 20 = 4 + 20 = 24.

e) A variância de Y ;

2
5418 − (216) 234
S (Y ) =
2 9
= = 29, 25,
9−1 8

ou
S 2 (Y ) = S 2 (X + 20) = S 2 (X) = 29, 25.

f) O coeficiente de variação de Y ;
73

√q
S (Y ) =S 2 (Y ) = 29, 25 = 5, 4083
S(Y ) 5, 4083
CV (Y )% = × 100% = × 100% = 22, 53%.
Ȳ 24

g) O coeficiente de variação de Z;

n
P
Zi
20 + 100 + · · · + 120 720
Z̄ = i=1
= = = 80,
n 9 9
ou
Z̄ = X̄ = 20 · 4 = 80,

2
151200 − (720) 93600
S (Z) =
2 9
= = 11700,
9−1 8

ou
S 2 (Z) = S 2 (20X) = 202 S 2 (X) = 400 · 29, 25 = 11700.

√q
S (Z) =S 2 (Z) = 11700 = 108, 1665
S(Z) 108, 1665
CV (Z)% = × 100% = × 100% = 135, 21%.
Z̄ 80

h) O coeficiente de variação de W .

n
P
Wi
−22 + 10 + · · · + 18 18
W̄ = i=1
= = = 2,
n 9 9
ou
W̄ = 8X̄ − 30 = 8 · 4 − 30 = 32 − 30 = 2.

2
15012 − (18) 14976
S (W ) =
2 9
= = 1872,
9−1 8

ou
S 2 (W ) = S 2 (8X − 30) = 82 S 2 (X) = 64 · 29, 25 = 1872.
74

q √
S (W ) = S 2 (W ) = 1872 = 43, 2666
S(W ) 43, 2666
CV (W )% = × 100% = × 100% = 2163, 33%.
W̄ 2
75

11) Na tabela a seguir são informadas as notas de uma amostra de 18 alunos. Calcule as medidas de
posição e dispersão abordadas e interprete o significado do valor encontrado.

Nota 59 60 61 64 65 67 68 72 73 91 99 100
Nº de alunos 1 1 1 1 3 1 2 1 2 3 1 1

Temos que
k
P
ni Xi
1 × 59 + 1 × 60 + · · · + 1 × 100 1332
X̄ = i=1
= = = 74,
k
P 1 + 1 + ··· + 1 18
ni
i=1

sendo esse um valor central, em torno do qual a duração média das chamadas tendem a se concentrar.

Como nX = 18 é par quando os dados estão organizados em rol, a mediana é dada pela média dos
n n
   
elementos que ocupam as posições e + 1 , isto é:
2 2

X( 18 ) + X( 18 +1) X(9) + X(10) 68 + 68


Md(X) = 2 2
= = = 68.
2 2 2

Para o conjunto de valores colocados em ordem crescente ou decrescente de grandeza, o valor mediano
obtido é o elemento que ocupa a posição central, sendo pelo menos 50% das notas são iguais ou
superiores e, pelo menos 50% das notas são menores ou inferiores a ele.

As modas são Mo1 (X) = 65 e Mo2 (X) = 91, sendo o conjunto bimodal. Dessa forma essas são as
notas que ocorrem com maior frequência.

A amplitude total é,
AT (X) = Xmáx − Xmin = 100 − 59 = 41,

e, dessa forma, a diferença entre duas observações quaisquer é, no máximo, igual a 41.

A variância é dada por


!2
k
P
f i Xi
k i=1
fi Xi2 −
P
k
i=1 P
fi 101796 − (1332)
2

S (X) =
2 i=1
= 18
k 18 − 1
fi − 1
P
i=1
3228
= = 189, 8824,
17

sendo a variância uma medida de dispersão dos valores em torno da média.


76

O desvio padrão é dado por

q √
S (X) = S 2 (X) = 189, 8824 = 13, 7798,

sendo o desvio padrão uma medida de dispersão dos valores em torno da média.

O coeficiente de variação é

S (X) 13, 7798


CV (X) % = × 100% = × 100% = 18, 62%,
X̄ 74

sendo a dispersão relativa, que é a razão entre a dispersão absoluta e a média. Ele mede a homoge-
neidade de um conjunto de valores e, geralmente é utilizado quando se tem interesse em comparar
variabilidades de diferentes conjuntos de valores.
77

12) O professor de EST 103 divulgou, para as três turmas da disciplina, os resultados ao final do
semestre, os quais são apresentados abaixo. Determine a média geral de todos os alunos da disciplina.

T1 T2 T3
ni 58 58 48
X̄i 76 74 64
Si (X) 2,56 3,23 4,23

Temos que
n1
P n1
P
X1i X1i n1
• X̄1 = i=1
, logo 76 = i=1
, donde X1i = 76 · 58 = 4408;
P
n1 58
i=1
n2
P n2
P
X2i X2i n2
• X̄2 = i=1
, logo 74 = i=1
, donde X2i = 74 · 58 = 4292;
P
n2 58
i=1
n3
P n3
P
X3 i X3i n3
• X̄3 = i=1
, logo 64 = i=1
, donde X3i = 64 · 48 = 3072;
P
n3 48
i=1

n n1 n2 n3
Xi = X1i + X2i +
X X X X
X3i
i=1 i=1 i=1 i=1
= 4408 + 4292 + 3072 = 11772

além disso,
n = n1 + n2 + n3 = 58 + 58 + 48 = 164,

logo
n
P 27
P
Xi Xi
11772
X̄ = i=1
= i=1
= = 71, 78.
n 27 164
78

13) Em uma empresa, cada trabalhador recebia um salário X, sendo que o salário médio dos trabalha-
dores da empresa era R$ 1800, com desvio padrão de R$ 400. A nova diretoria da empresa resolveu
que, como estímulo aos trabalhadores, promoveria um aumento de 20% a todos os trabalhadores da
empresa, além disto, uma bonificação de R$ 300 seria instituída. Dessa forma, o salário de cada
trabalhador passa a ser Yi = 1, 2Xi + 300. Pergunta-se:

a) Qual o salário médio Ȳ após a nova diretoria ter assumido?

Temos que Yi = 1, 2Xi + 300 e queremos determinar Ȳ . Pelas propriedades da média, temos:

• ao somarmos uma constante a cada um dos valores da variável aleatória, a média final ficará
somada dessa constante;

• ao multiplicarmos cada um dos valores da variável aleatória por uma constante, a média final
ficará multiplicada dessa constante.

Logo

Ȳ = 1, 2X̄ + 300 = 1, 2 × 1800 + 300

= 2460.

Dessa forma, o salário médio após a nova diretoria ter assumido é de R$ 2460.

b) Os salários eram mais homogêneos antes ou após a nova diretoria ter assumido? justifique sua
resposta.

Temos que S 2 (X) = (400)2 = 160000 e Yi = 1, 2Xi + 300. Pelas propriedades da variância, temos:

• ao somarmos uma constante a cada um dos valores da variável aleatória, a variância final não se
altera;

• ao multiplicarmos cada um dos valores da variável aleatória por uma constante, a variância final
ficará multiplicada pelo quadrado dessa constante.

Assim

S 2 (Y ) = S 2 (1, 2Xi + 300) = S 2 (1, 2Xi )

= (1, 2)2 S 2 (Xi ) = 1, 44 × 160000 = 230400.

q √
Assim S(X) = S 2 (Y ) = 230400 = 480.

Para determinarmos o conjunto mais homogêneo, encontraremos CV (X)% e CV (Y )%, para que
possamos compará-los e, o menor coeficiente de variação estará ligado ao conjunto mais homogêneo.
79

S(X) 400
CV (X)% = × 100% = × 100% = 22, 22%,
X̄ 1800

e,

S(Y ) 480
CV (Y )% = × 100% = × 100% = 19, 51%.
Ȳ 2460

Como 19, 51% = CV (Y )% < CV (X)% = 22, 22% temos que a os salários após a nova diretoria ter
assumido (Y ) são mais homogêneos que antes dela (X).
80

14) Foram feitas 24 determinações para se avaliar a temperatura (em grau Celsius) em um certo
ambiente. Os resultados foram os seguintes:
22,0 22,9 23,3 23,6 23,9 24,0 24,1 24,2 24,5 25,2 26,0 26,8
22,6 23,0 23,4 23,6 24,0 24,0 24,2 24,3 24,8 25,2 26,0 27,0

Determine:

a) A temperatura média;

n
P
Xi
22 + 22, 9 + · · · + 27 582, 6
X̄ = i=1
= = = 24, 275.
n 24 24

b) A temperatura mediana;
Primeiramente devemos colocar os dados em rol, o qual é
22,00 22,60 22,90 23,00 23,30 23,40 23,60 23,60 23,90 24,00 24,00 24,00
24,10 24,20 24,20 24,30 24,50 24,80 25,20 25,20 26,00 26,00 26,80 27,00

Como nX = 24 é par quando os dados estão organizados em rol, a mediana é dada pela média dos
n n
   
elementos que ocupam as posições e + 1 , isto é:
2 2

X( 24 ) + X( 24 +1) X(12) + X(13) 24 + 24, 1


Md(X) = 2 2
= = = 24, 05.
2 2 2

c) A(s) temperatura(s) modais e classifique a amostra;


A moda é Mo1 (X) = 24, sendo o conjunto unimodal.

d) A variância;

2
14178, 94 − (582,6) 36, 325
S (X) =
2 24
= = 1, 5793.
24 − 1 23

e) O desvio padrão;

q √
S (X) = S 2 (X) = 1, 5793 = 1, 2567.

f) O coeficiente de variação;

S(X) 1, 2567
CV (X)% = × 100% = × 100% = 5, 18%.
X̄ 24, 275
81

g) O erro padrão da média.

  S (X) 1, 2567
S X̄ = √ = √ = 0, 2565.
n 24
82

15) Sejam X = {10; 14; 11; −3; 15; 0; 16; −1; 12; 16}, Y = 9X − 2 e W = −3X + 100. Determine:

a) A média de X;

n
P
Xi
10 + 14 + · · · + 16
X̄ = i=1
=
n 10
90
= = 9.
10

b) A variância de X;

Temos que

Xi Xi2
10 100
14 196
.. ..
. .
16 256
n n
Xi = 90 Xi2 = 1308
P P
i=1 i=1

logo
 n 2
P
n
Xi
i=1
Xi2 −
P 2
n 1308 − (90)
S (X) =
2 i=1
= 10
n−1 10 − 1
498
= = 55, 33.
9

c) O coeficiente de variação de Y ;

Temos Y = 9X − 2,

Ȳ = 9X̄ − 2 = 9 × 9 − 2 = 79

S 2 (Y ) = S 2 (9X − 2) = S 2 (9X) = (9)2 S 2 (X) = 81 × 55, 33 = 4481, 73


q √
S(Y ) = S 2 (Y ) = 4481, 73 = 66, 95

S(Y ) 66, 95
CV (Y )% = × 100% = × 100% = 84, 74%.
Ȳ 79

d) O coeficiente de variação de W .
83

Temos W = −3X + 100,

W̄ = −3X̄ + 100 = −3 × 9 + 100 = 73

S 2 (W ) = S 2 (−3X + 100) = S 2 (−3X) = (−3)2 S 2 (X) = 9 × 55, 33 = 497, 97


q √
S(W ) = S 2 (W ) = 497, 97 = 22, 32

S(W ) 22, 32
CV (W )% = × 100% = × 100% = 30, 57%.
W̄ 73

e) Qual conjunto é mais homogêneo, Y ou W ? Justifique.

Como 30, 57% = CV (W )% < CV (Y )% = 84, 74% temos que o conjunto W é mais homogêneo que
o conjunto Y .
84

16) Uma reportagem exibida revelou que no dia 18/07/2016 o estado de Santa Catarina (SC) foi o mais
castigados pelo frio rigoroso do inverno, apresentando registros de temperaturas negativas e geadas
em diversas cidades. Mais especificamente, na cidade de Urupema foi registrada uma temperatura
de −7, 1 °C e em São Joaquim de −4 °C. No entanto, para apresentar informações mais precisas
sobre o clima dessas duas cidades, um estudo mais completo seria necessário e uma análise descritiva
foi recomendada. A Tabela a seguir apresenta valores de temperatura dessas duas cidades, em um
determinado ano.
Cidades Jan. Fev. Mar. Abr. Mai. Jun. Jul. Ago. Set. Out. Nov. Dez.
Urupema 15 12 8 7 6 -7 -9 -8 3 5 6 10
São Joaquim 17 14 10 7 9 -4 -5 -2 2 9 9 —

a) Baseado no valor médio da amostra, qual cidade pode ser considerada a mais fria?

n
P
Xi
15 + 12 + · · · + 10 48
X̄U = i=1
= = = 4,
n 12 12
n
P
Yi
17 + 14 + · · · + 9 66
ȲS = i=1
= = = 6,
n 11 11

b) Obtenha a mediana e a moda para as duas amostras de temperatura.


Mo(XU ) = 6 e Mo(YS ) = 9 e assim os dois conjuntos são unimodais.
Como nU = 12 é ímpar, quando os dados estão organizados, a mediana é dada pela média dos
n n
   
elementos que ocupam as posições e + 1 , isto é:
2 2

X( 12 ) + X( 12 +1) X(6) + X(7) 6+6


Md (XU ) = 2 2
= = = 6.
2 2 2

Como nS = 11 é ímpar, a mediana é o elemento que ocupa a posição n+1


2
= 11+1
2
= 6, quando os
dados estão organizados em rol, assim:

Md (YS ) = Y( 11+1 ) = Y(6) = 9.


2

c) Qual dessas cidades possui a amostra de temperatura mais homogênea? Justifique.

v
u 882 − (48)2
u s
q 690 √
S (X) = S 2 (X) = 12
= = 62, 7273 = 7, 9201,
t
12 − 1 11
85

v
u 926 − (66)2
u s
q 530 √
S (Y ) = S 2 (Y ) = 11
= = 53 = 7, 2801,
t
11 − 1 10

S(X) 7, 9201
CV (X) % = × 100% = × 100% = 198%,
X̄ 4

e,

S(Y ) 7, 2801
CV (Y ) % = × 100% = × 100% = 121, 34%.
Ȳ 6

Como 121, 33% = CV (Y )% < CV (X)% = 198% temos que as temperaturas da cidade Y (São
Joaquim) é mais homogênea que as temperaturas da cidade X (Urupema).

d) Qual a amplitude total de cada uma das amostras?

AT (XU ) = Xmáx − Xmin = 15 − (−9) = 24,

AT (YS ) = Ymáx − Ymin = 17 − (−5) = 22,


86

17) Suponha que um geógrafo esteja interessado em comparar a quantidade de partículas suspensas
no ar em duas cidades distintas. Para tal, ele coletou dados de 10 PM (partículas de 10 micrômetros
ou menores) durante oito dias na cidade A e, devido a um problema com seu equipamento, durante
apenas 7 dias na cidade B. A Tabela a seguir apresenta os resultados.

Cidade A 22 26 27 35 38 40 52 52
Cidade B 34 41 45 49 52 56 59 —

Pede-se:

a) A quantidade média de partículas suspensas no ar em cada uma das cidades;

n
P
Xi
22 + 26 + · · · + 52 292
X̄ = i=1
= = = 36, 5,
n 8 8
n
P
Yi
34 + 41 + · · · + 59 336
Ȳ = i=1
= = = 48.
n 7 7

b) As quantidades mediana e modal(is) de partículas suspensas no ar em cada uma das cidades;

Mo(X) = 52 assim a cidade A é unimodal enquanto que a cidade B é amodal.

Como nX = 8 é ímpar, quando os dados estão organizados, a mediana é dada pela média dos
n n
   
elementos que ocupam as posições e + 1 , isto é:
2 2

X( 8 ) + X( 8 +1) X(4) + X(5) 35 + 38


Md(X) = 2 2
= = = 36, 5.
2 2 2

Como nY = 7 é ímpar, a mediana é o elemento que ocupa a posição n+1


2
= 7+1
2
= 4, quando os
dados estão organizados em rol, assim:

Md(Y ) = Y( 7+1 ) = Y(4) = 49.


2

c) Qual amostra é mais homogênea?

v
u 11566 − (292)2
u s
q 908 √
S (X) = S 2 (X) = 8
= = 129, 7143 = 11, 3892,
t
8−1 7

v
u 16584 − (336)2
u s
q 456 √
S (Y ) = S 2 (Y ) = 7
= = 76 = 8, 7178,
t
7−1 6
87

S(X) 11, 3892


CV (X)% = × 100% = × 100% = 31, 2%,
X̄ 36, 5

e,

S(Y ) 8, 7178
CV (Y )% = × 100% = × 100% = 18, 16%.
Ȳ 48

Como 18, 16% = CV (Y )% < CV (X)% = 31, 2% temos que a quantidade de partículas suspensas no
ar da cidade B é mais homogênea que a quantidade de partículas suspensas da cidade A.
88

18) A depressão ocupa uma posição de destaque entre os problemas de saúde pública, sendo consi-
derada como a principal causa de incapacidade e suicídio. A OMS estima que anualmente cerca de
850.000 novas pessoas apresentem sintomas depressivos, o que evidencia o quão sério é esse trans-
torno. Um grupo de psicólogos avaliou o nível de depressão em jovens (com idade entre 15 e 30 anos)
e adultos (com idade entre 46 e 60 anos) de uma determinada localidade. Os valores informados na
tabela a seguir representam scores, interpretados da seguinte forma: valores entre 0 e 9 indicam que
a pessoa não tem depressão, entre 10 e 18 depressão leve, entre 19 e 29 depressão moderada e entre
30 e 63 depressão severa. Essa é a escala de depressão de Beck e os scores são originados a partir de
um questionário com 21 itens de múltipla escolha. Pede-se:

Jovens 42 14 56 23 12 11 49 10
Adultos 17 3 7 21 12 10 2 24

a) Calcule a média dos dois grupos. Baseado nesse resultado, em qual grupo a depressão parece ser
mais perigosa?

Sejam X : “nível de depressão em jovens” e Y : “nível de depressão em adultos”, então

n
P
Xi
42 + 14 + · · · + 10 217
X̄ = i=1
= = = 27, 125,
n 8 8
n
P
Yi
17 + 3 + · · · + 24 96
Ȳ = i=1
= = = 12.
n 8 8

Como o nível de depressão médio é maior para os jovens com X̄ = 27, 125, enquanto que nos adultos
o nível de depressão médio é Ȳ = 12, a depressão parece ser mais perigosa no grupo de jovens.

b) Calcule a mediana e a moda para o grupo de jovens.

Primeiramente devemos colocar os dados em rol, o qual é

10 11 12 14 23 42 49 56

Como nX = 8 é par quando os dados estão organizados em rol, a mediana é dada pela média dos
n n
   
elementos que ocupam as posições e + 1 , isto é:
2 2

X( 8 ) + X( 8 +1) X(4) + X(5) 14 + 23


Md(X) = 2 2
= = = 18, 5.
2 2 2

Primeiramente devemos colocar os dados em rol, o qual é

2 3 7 10 12 17 21 24
89

Como nY = 8 é par quando os dados estão organizados em rol, a mediana é dada pela média dos
n n
   
elementos que ocupam as posições e + 1 , isto é:
2 2

Y( 8 ) + Y( 8 +1) Y(4) + Y(5) 10 + 12


Md(Y ) = 2 2
= = = 11.
2 2 2

c) Qual dos dois grupos é mais homogêneo? justifique.

v
u 8391 − (217)2
u s
q 2504, 875 √
S (X) = S 2 (X) = 8
= = 357, 8393 = 18, 9166,
t
8−1 7

v
u 1612 − (96)2
u s
q 460 √
S (Y ) = S 2 (Y ) = 8
= = 65, 7143 = 8, 1064,
t
8−1 7

S(X) 18, 9166


CV (X)% = × 100% = × 100% = 69, 74%,
X̄ 27, 125

e,

S(Y ) 8, 1064
CV (Y )% = × 100% = × 100% = 67, 55%.
Ȳ 12

Como 67, 55% = CV (Y )% < CV (X)% = 69, 74% temos que o nível de depressão Y é mais homo-
gênea que o nível de depressão X, assim o nível de depressão é mais homogêneo entre os adultos do
que entre os jovens.

d) Estime o erro padrão da média para o grupo de adultos.

  S (Y ) 8, 1064
S Ȳ = √ = √ = 2, 866.
n 8
90

19) Em uma turma de EST 103, as notas obtidas ao final do semestre foram:

Nota 75 97 69 60 40 23
Número de alunos 8 13 11 4 11 13
a) Determine a(s) nota(s) modal(is).

As modas são Mo1 (X) = 97 e Mo2 (X) = 23, sendo o conjunto bimodal.

b) Determine a nota mediana.

O rol é dado por Como nX = 60 é par quando os dados estão organizados em rol, a mediana é dada

Nota Número de alunos


23 13
40 11
60 4
69 11
75 8
97 13

n n
   
pela média dos elementos que ocupam as posições e + 1 , isto é:
2 2

X( 60 ) + X( 60 +1) X(30) + X(31) 69 + 69


Md(X) = 2 2
= = = 69.
2 2 2

c) Determine a nota média.

Temos que
6
P
ni Xi
8 × 75 + 13 × 97 + · · · + 13 × 23 3599
X̄ = i=1
= = = 59, 9833,
6
P 8 + 13 + · · · + 13 60
ni
i=1

d) Determine a variância.

Xi ni ni Xi ni Xi2
75 8 600 45000
97 13 1261 122317
69 11 759 52371
60 4 240 14400
40 11 440 17600
23 13 299 6877
6 6 6
ni = 60 ni Xi = 3599 ni Xi2 = 258565
P P P
i=1 i=1 i=1
91

A variância é dada por

 6 2
P
6
ni Xi
i=1
ni Xi2 −
P
6
i=1 P
ni 2
258565 − (3599)
S (X) =
2 i=1
= 60
6 60 − 1
ni − 1
P
i=1
42684, 9833
= = 723, 4743,
59

e) Determine o coeficiente de variação.

O desvio padrão é dado por

q √
S (X) = S 2 (X) = 723, 4743 = 26, 8975,

assim o coeficiente de variação é

S (X) 26, 8975


CV (X) % = × 100% = × 100% = 44, 84%.
X̄ 59, 9833
92

CAPÍTULO V

Regressão linear simples

1) Os dados a seguir provêm de um experimento para testar o desempenho de uma máquina industrial.
O experimento utilizou uma mistura de óleo diesel e gás, derivados de materiais destilados orgânicos.
O valor da capacidade da máquina (Y ) em cavalo vapor (HP) foi coletado a diversas velocidades (X)
medidas em rotações por minuto (rpm × 100).

X Y X Y X Y X Y
22,0 64,03 15,0 46,85 18,0 52,90 15,0 45,79
20,0 62,47 17,0 51,17 16,0 48,84 17,0 51,17
18,0 54,94 19,0 58,00 14,0 42,74 19,0 56,65
16,0 48,84 21,0 63,21 12,0 36,63 21,0 62,61
14,0 43,73 22,0 64,03 10,5 32,05 23,0 65,31
12,0 37,48 20,0 62,63 13,0 39,68 24,0 63,89

Admitindo-se que as variáveis X e Y estão relacionadas de acordo com o modelo

Yi = β0 + β1 Xi + i , pede-se:

a) Obter a equação de regressão ajustada;

(418, 5) (1255, 64)


SP DXY = 22761, 025 − = 865, 8025
24
(418, 5)2
SQDX = 7624, 25 − = 326, 6562
24
(1255, 64)2
SQDY = 68063, 8884 − = 2370, 8963
24

SPDXY 865, 8025


βb1 = = = 2, 6505
SQDX 326, 6562
1255, 64 418, 5
βb0 = Ȳ − βb1 X̄ = − (2, 6505) × = 52, 3183 − 46, 2181 = 6, 1002
24 24
Ybi = βb0 + βb1 Xi = 6, 1002 + 2, 6505Xi .

b) Calcule o coeficiente de determinação e interprete-o;


93

SQRegressão 2294, 81
r2 (%) = × 100% = × 100%
SQTotal 2370, 9
= 96, 79%.

O coeficiente de determinação r2 foi de 96,79%, dessa forma, o percentual da variabilidade observada


da capacidade da máquina, explicado pela regressão linear simples, nos valores da velocidade, em
centenas de rotações por minuto, é 96,79%.

c) Interprete a estimativa obtida para o coeficiente de regressão;

βb1 = 2, 6505 é o aumento médio estimado, em cavalo vapor (HP), da capacidade da máquina a cada
aumento da velocidade em 100rpm.

d) Determine a estimativa de Y para X = 15,5.

Para X = 15, 5 ⇒ Yb =?
Yb = 6, 1002 + 2, 6505 × 15, 5 = 47, 183.
94

2) Joana verificou que as variáveis X (anos de experiência no cargo de supervisora do refeitório de


uma grande indústria) e Y (o tempo, em minutos, gasto na execução de certa tarefa relacionada com
esse cargo) se relacionam de acordo com o modelo linear

Ybi = 9, 8 − 1, 7Xi

e, que são válidas as pressuposições usuais acerca dos erros. Ela tomou uma amostra de 15 supervi-
soras, com tempo experiência no cargo variando de zero a 5 anos, e ajustou a equação de regressão
linear com r = −0, 875. Complete corretamente as afirmações abaixo.

a) A estimativa do tempo gasto na execução dessa tarefa relacionada com o cargo, para uma super-
visora com 3 anos de experiência é de minutos.
Para X = 3 ⇒ Yb =?
Yb = 9, 8 − 1, 7 × 3 = 4, 7,

dessa forma “A estimativa do tempo gasto na execução dessa tarefa relacionada com o cargo, para
uma supervisora com 3 anos de experiência é de 4,7 minutos.”

b) A cada acréscimo de um ano de experiência no cargo de supervisora do refeitório, estima-se um


decréscimo de minutos no tempo gasto na execução dessa tarefa relacionada ao cargo.
Temos que βb1 = −1, 7, dessa forma, “A cada acréscimo de um ano de experiência no cargo de
supervisora do refeitório, estima-se um decréscimo de 1, 7 minutos no tempo gasto na execução dessa
tarefa relacionada ao cargo.”

c) A estimativa do tempo gasto na execução dessa tarefa, para uma supervisora sem experiência no
cargo (com 0 anos) é de minutos.
Para X = 0 ⇒ Yb =?
Yb = 9, 8 − 1, 7 × 0 = 9, 8,

dessa forma “A estimativa do tempo gasto na execução dessa tarefa, para uma supervisora sem
experiência no cargo (com 0 anos) é de 9,8 minutos.”.

d) A proporção da variação do tempo gasto na execução dessa tarefa relacionada com o cargo de
supervisora do refeitório, que é explicada pela equação ajustada em função do tempo de experiência
no cargo é igual a .

r2 (%) = r2 × 100% = (−0, 875)2 × 100% = 76, 56%,

dessa forma, “A proporção da variação do tempo gasto na execução dessa tarefa relacionada com o
cargo de supervisora do refeitório, que é explicada pela equação ajustada em função do tempo de
95

experiência no cargo é igual a 76,56%”.

e) A correlação foi o que indica que a relação linear entre o tempo, em minutos, gasto
na execução da tarefa relacionada ao cargo de supervisora e o tempo de experiência no cargo é
.

“A correlação foi −0, 875 o que indica que a relação linear entre o tempo, em minutos, gasto na
execução da tarefa relacionada ao cargo de supervisora e o tempo de experiência no cargo é inversa.”.
96

3) Com a finalidade de, se tentar explicar a eficiência do consumo de combustível de automóveis de


passeio através de suas massas, selecionou-se aleatoriamente quatorze automóveis do mesmo ano de
fabricação, pertencentes a uma grande empresa. Foram registrados os pesos (X) em kg, e o consumo
(Y ) em quilômetros por litro (km/l), dos automóveis durante um certo trecho de uma determinada
estrada e foram obtidos:
14
Xi = 17688; SQDX = 1341371; SQDY = 72, 8686;
P
i=1
14
Yi = 148, 8; SP DXY = −9322, 971;
P
i=1

a) Ajuste uma reta de regressão para explicar a eficiência do consumo, em termos da massa dos
veículos.

SP DXY −9322, 971


βb1 = = = −0, 007,
SQDX 1341371
148, 8 17688
βb0 = Ȳ − βb1 X̄ = − (−0, 007) × = 10, 6286 − (−8, 844) = 19, 4726,
14 14

Ybi = βb0 + βb1 Xi = 19, 4726 − 0, 007Xi .

b) Interprete o coeficiente de regressão obtido no item a).

βb1 = −0, 007 é o decréscimo médio estimado da eficiência do consumo, em quilômetros por litro, a
cada aumento de um quilograma do massa.

c) Considerando que a massa dos carros avaliados variou de 800 kg a 1200 kg. Qual a eficiência do
consumo estimada para um carro que pesa 1000 kg?

Para X = 1000 ⇒ Yb =?
Yb = 19, 4726 − 0, 007 × 1000 = 12, 4726.
97

4) Uma doença contagiosa assola uma região de um determinado país. Duas cidades A e B são as mais
infectadas e pesquisadores, após observaram o número de doentes ao longo de oito meses, obtiveram:

Cidade Equação de Regressão r2 % CV


A Ybi = 25 + 15Xi 0,96 5%
B Ybi = 30 + 10Xi 0,98 6%

em que, Ybi é o número de pessoas doentes; e Xi é o tempo em meses.

a) Em qual cidade o avanço da doença é mais preocupante? justifique sua resposta.

O avanço da doença é mais preocupante na cidade A, pois a cada mês há um aumento médio estimado
de 15 casos de doença, enquanto que na cidade B, o aumento médio mensal estimado é de 10 casos.

b) Para qual das duas cidades o modelo de regressão explica melhor o progresso da doença?

A porcentagem da variabilidade explicada pelo modelo de regressão é dado pelo coeficiente de deter-
minação, (r2 %), sendo assim, para a cidade B o modelo de regressão explica melhor o progresso da
doença, por apresentar maior coeficiente de determinação.
98

5) Em um estudo acerca da influência do tamanho da população residente em uma cidade (X, em mi-
lhares de pessoas) e a taxa de mortalidade (Y , número de mortes por mil habitantes), um pesquisador
obteve os seguintes valores para doze cidades pesquisadas:

X 101 193 42 304 42 152 55 105 68 219 129 42


Y 37 27 38 25 67 63 41 13 28 17 32 32
Com base na tabela responda:
a) Determine o coeficiente de correlação linear entre X e Y ;

b) X e Y são correlacionados, dessa forma à medida que o tamanho da população residente


tende a a taxa de mortalidade tende a .

Com base no item a), marque a alternativa que completa corretamente a frase acima:

i) positivamente, aumentar, diminuir;

ii) negativamente, aumentar, aumentar;

iii) positivamente, diminuir, diminuir;

iv) negativamente, aumentar, diminuir;

v) positivamente, diminuir, aumentar;

vi) negativamente, diminuir, diminuir.

Temos que
12 12
n = 12 Xi = 1452; Xi2 = 251538;
P P
i=1 i=1

12 12 12
Yi = 420; Yi2 = 17596; Xi Yi = 45253.
P P P
i=1 i=1 i=1

45253 − (1452)(420)
−5567
rXY = r 12
=
2 2 14820, 5943
251538 − (1452)
12
17596 − (420)
12
= −0, 3756

Dessa forma, X e Y são negativamente correlacionados, dessa forma à medida que o tamanho da
população residente tende a aumentar a taxa de mortalidade tende a diminuir.

Equivalentemente, temos que X e Y são negativamente correlacionados, dessa forma à medida que
o tamanho da população residente tende a diminuir a taxa de mortalidade tende a aumentar.

Vemos assim que a única solução é a letra iv).


99

6) Uma empresa está estudando como varia a demanda de certo produto (em unidades) em função de
seu preço de venda que varia de R$ 160,00 a R$ 200,00. Para isso levantou as seguintes informações:
n n n n n
n = 12, Xi = 2130, Xi2 = 379440, Yi = 2658, Yi2 = 593812, Xi Yi = 471133.
P P P P P
i=1 i=1 i=1 i=1 i=1

Utilizando essas informações, responda às seguintes questões:

a) Obter a equação da regressão linear simples;

(2130) (2658)
SPDXY = 471133 − = −662
12
(2130)2
SQDX = 379440 − = 1365
12
(2658)2
SQDY = 593812 − = 5065
12

SPDXY −662
βb1 = = = −0, 485
SQDX 1365
2658 2130
βb0 = Ȳ − βb1 X̄ = − (−0, 485) × = 221, 5 + 86, 0875 = 307, 5875
12 12
Ybi = βb0 + βb1 Xi = 307, 5875 − 0, 485Xi .

b) Qual a interpretação da estimativa obtida para a constante de regressão?

βb0 = 307, 5875 é número médio estimado, em unidades, da demanda do produto quando o produto é
dado ao consumidor (preço de venda é R$ 0, 00). Note que esse valor trata-se de uma extrapolação,
haja vista que, no estudo o preço de venda variou de R$ 160,00 a R$ 200,00 e, assim, essa estimativa
não é confiável.

c) Qual a interpretação da estimativa obtida para o coeficiente da regressão?

βb1 = −0, 485 é o decréscimo médio estimado, em unidades, da demanda do produto a cada aumento
de R$ 1,00 no preço de venda.

d) Calcule o coeficiente de determinação e interprete o valor obtido;


100

 2
(SPDXY ) 2 471133 − 2130×2658
12
SQRegressão = = ,
SQDX 379440 − (2130)2
12
(−662)2
= = 321, 06
1365
(2658)2
SQTotal = SQDY = 593812 − = 5065.
12
SQRegressão 321, 06
r2 (%) = × 100% = × 100%
SQTotal 5065
= 6, 34%.

O coeficiente de determinação r2 foi de 6,34%, dessa forma, o percentual da variabilidade observada


da demanda do produto, explicado pela regressão linear simples, nos valores do preço de venda, em
reais, é 6,34%.

e) Para um artigo que custa R$ 180, qual o número estimado de unidades a serem vendidas?

Para X = 180 ⇒ Yb =?
Yb = 307, 5875 − 0, 485 × 180 = 220, 2875.

Para um artigo que custa R$ 180, o número estimado de unidades a serem vendidas é 220,2875.

f) Para um artigo que custa R$ 280, qual o número estimado de unidades a serem vendidas? o que
você pode dizer acerca dessa estimativa?

Para X = 280 ⇒ Yb =?
Yb = 307, 5875 − 0, 485 × 280 = 171, 7875.

Para um artigo que custa R$ 280, qual o número estimado de unidades a serem vendidas é 171,7875.
Note que esse valor trata-se de uma extrapolação, haja vista que, no estudo o preço de venda variou
de R$ 160,00 a R$ 200,00 e, assim, essa estimativa não é confiável.
101

7) É esperado que a massa muscular de uma pessoa diminua com a idade. Para estudar essa relação,
uma nutricionista selecionou 18 mulheres, com idade entre 43 e 78 anos, e observou em cada uma
delas a idade (X) e a massa muscular (Y ).

X 71 64 43 67 56 73 68 56 76 65 45 58 45 53 49 78 73 68
Y 82 91 100 68 87 73 78 80 65 84 116 76 97 100 105 77 73 78

a) Construa o diagrama de dispersão.


110


100

● ●
Massa muscular


90



80





70

45 50 55 60 65 70 75

Idade

Figura 1: Gráfico de dispersão de Idade versus Massa muscular

b) Calcule o coeficiente de correlação linear entre X e Y .

Temos que
18 18
n = 18 Xi = 1108; Xi2 = 70362;
P P
i=1 i=1

18 18 18
Yi = 1530; Yi2 = 133300; Xi Yi = 91964.
P P P
i=1 i=1 i=1

91964 − (1108)(1530)
−2216
rXY = r 18
=
2  2 
2648, 574
70362 − (1108)
18
133300 − (1530)
18
= −0, 8367
102

Dessa forma, X e Y são negativamente correlacionados, dessa forma à medida que a idade tende a
aumentar a massa muscular tende a diminuir.

Equivalentemente, temos que X e Y são negativamente correlacionados, dessa forma à medida a


idade tende a diminuir a massa muscular tende a aumentar.

c) Qual das duas variáveis é mais homogênea?

n
P
Xi
71 + 64 + · · · + 68 1108
X̄ = i=1
= = = 61, 5556.
n 18 18

n
P
Yi
82 + 91 + · · · + 78 1530
Ȳ = i=1
= = = 85.
n 18 18

v
u 70362 − (1108)2
u s
q 2158, 4444 √
S (X) = S 2 (X) = 18
= = 126, 9673 = 11, 268,
t
18 − 1 17

v
u 133300 − (1530)2
u s
q 3250 √
S (Y ) = S 2 (Y ) = 18
= = 191, 1765 = 13, 8267,
t
18 − 1 17

S(X) 11, 268


CV (X)% = × 100% = × 100% = 18, 31%,
X̄ 61, 5556

e,

S(Y ) 13, 8267


CV (Y )% = × 100% = × 100% = 16, 27%.
Ȳ 85

Como 16, 27% = CV (Y )% < CV (X)% = 18, 31% temos que a variável Y é mais homogênea que a
variável X.

d) Ajuste a reta de regressão para a relação linear entre as variáveis Y e X.

(1108) (1530)
SPDXY = 91964 − = −2216
18
(1108)2
SQDX = 70362 − = 2158, 4444
18
(1530)2
SQDY = 133300 − = 3250
18
103

SPDXY −2216
βb1 = = = −1, 0267
SQDX 2158, 4444
1530 1108
βb0 = Ȳ − βb1 X̄ = − (−1, 0267) × = 8563, 1991 = 148, 1991
18 18
Ybi = βb0 + βb1 Xi = 148, 1991 − 1, 0267Xi .

e) Considerando a reta estimada dada no item d), estime a massa muscular média de mulheres com
50 anos.

Para X = 50 ⇒ Yb =?
Yb = 148, 1991 − 1, 0267 × 50 = 96, 8641.
104

8) A tabela abaixo apresenta dados relativos ao nível de escolaridade (medido pelo número de anos
de estudo) e o salário (em R$) de 10 indivíduos. Suponha que o salário médio de um indivíduo esteja
linearmente relacionado à escolaridade do mesmo.

X 4 7 8 9 11 12 13 14 15 16
Y 420 450 600 620 700 1000 1200 1600 2000 2500

Pede-se:

a) O aumento de um ano de estudo gera um aumento médio esperado de R$ no salário.

Temos que
10 10
n = 10; Xi = 109; Xi2 = 1321;
P P
i=1 i=1

10 10 10
Yi = 11090; Yi2 = 16863300; Xi Yi = 142910.
P P P
i=1 i=1 i=1

(109) (11090)
SPDXY = 142910 − = 22029
10
(109)2
SQDX = 1321 − = 132, 9
10
(11090)2
SQDY = 16863300 − = 4564490
10

SPDXY 22029
βb1 = = = 165, 7562
SQDX 132, 9
11090 109
βb0 = Ȳ − βb1 X̄ = − (165, 7562) × = 1109 − 1806, 7426 = −697, 7426
10 10
Ybi = βb0 + βb1 Xi = −697, 7426 + 165, 7562Xi .

Dessa forma, “O aumento de um ano de estudo gera um aumento médio esperado de R$ 165,76 no
salário.”.

b) é a estimativa da constante da regressão.

Como βb0 = −697, 7426, temos que “−697, 7426 é a estimativa da constante da regressão”.

c) R$ é uma estimativa do salário médio para um indivíduo que estudou 10 anos.

Para X = 10 ⇒ Yb =?
Yb = −697, 7426 + 165, 7562 × 10 = 959, 82,

assim “R$ 959,82 é uma estimativa do salário médio para um indivíduo que estudou 10 anos”.

d) é o coeficiente de correlação linear entre os anos de estudo e o salário.


105

Temos que

142910 − (109)(11090)
22029
rXY = r 10
=
2 2 24629, 6716
1321 − (109)
10
16863300 − (11090)
10
= 0, 8944

Dessa forma “0, 8944 é o coeficiente de correlação linear entre os anos de estudo e o salário.”.

e) O percentual da variação observada nos valores de salário que é explicado pela regressão linear
simples nos valores de anos de estudo é igual a %.

 2
(SPDXY ) 2 142910 − 109×11090
10
SQRegressão = = ,
SQDX 1321 − (109)2
10
(22029)2
= = 3651443, 5
132, 9
(11090)2
SQTotal = SQDY = 16863300 − = 4564490.
10
SQRegressão 3651443, 5
r2 (%) = × 100% = × 100%
SQTotal 4564490
= 80%.

O coeficiente de determinação r2 foi de 80%, dessa forma, “O percentual da variação observada nos
valores de salário que é explicado pela regressão linear simples nos valores de anos de estudo é igual
a 80%.”

f) O desvio da regressão para 11 anos de estudo é .

Para X = 11 ⇒ Yb =?

Yb = −697, 7426 + 165, 7562 × 11 = 1125, 58,

b5 = Y5 − Yb5 = 700 − 1125, 58 = −425, 58.

Assim “O desvio da regressão para 11 anos de estudo é −425, 58”.

g) Estimar que o salário médio de um indivíduo com 20 anos de estudo seja igual a R$
seria uma do modelo.

Para X = 20 ⇒ Yb =?
Yb = −697, 7426 + 165, 7562 × 20 = 2617, 38,

assim “Estimar que o salário médio de um indivíduo com 20 anos de estudo seja igual a R$ 2617,38
seria uma extrapolação do modelo.”.
106

9) Francine verificou que as variáveis X (anos de experiência no cargo de supervisora do refeitório


de uma grande indústria) e Y (o tempo, em minutos, gasto na execução de certa tarefa relacionada
com esse cargo) se relacionam de acordo com o modelo linear Y = β0 + β1 X + ε e que são válidas
as pressuposições usuais sobre o erro ε. Ela tomou uma amostra de 15 supervisoras, com tempo
experiência no cargo variando de zero a 5 anos, e ajustou a equação de regressão linear Ybi = 9, 8 −
1, 7Xi , com rXY = −0, 875. Complete corretamente as afirmações abaixo

a) A estimativa do tempo gasto na execução dessa certa tarefa relacionada com o cargo, para uma
supervisora com 3 anos de experiência no mesmo é de min.

Para X = 3 ⇒ Yb =?
Yb = 9, 8 − 1, 7 × 3 = 4, 7,

assim: “A estimativa do tempo gasto na execução dessa certa tarefa relacionada com o cargo, para
uma supervisora com 3 anos de experiência no mesmo é de 4,7 min.”

b) A cada acréscimo de um ano de experiência no cargo de supervisora do refeitório, estima-se um


decréscimo de min. no tempo gasto na execução dessa certa tarefa relacionada
com o cargo.

Como Ybi = 9, 8−1, 7Xi , temos que βb1 = −1, 7, assim: “A cada acréscimo de um ano de experiência no
cargo de supervisora do refeitório, estima-se um decréscimo de 1,7 min. no tempo gasto na execução
dessa certa tarefa relacionada com o cargo.”

c) A estimativa do tempo gasto na execução dessa certa tarefa relacionada com o cargo de supervisora,
para uma supervisora sem experiência no cargo (com 0 anos) é de min.

Para X = 0 ⇒ Yb =?
Yb = 9, 8 − 1, 7 × 0 = 9, 8,

assim: “A estimativa do tempo gasto na execução dessa certa tarefa relacionada com o cargo de
supervisora, para uma supervisora sem experiência no cargo (com 0 anos) é de 9,8 min.”

d) O grau de associação dos pontos observados e a reta foi de .

Como rXY = −0, 875 temos que “O grau de associação dos pontos observados e a reta foi de 87,5%.”

e) A proporção da variação do tempo gasto na execução dessa certa tarefa relacionada com o cargo de
supervisora do refeitório, que é explicada pela equação ajustada em função do tempo de experiência
no cargo é igual a .

Temos que r2 = (rXY )2 = (−0, 875)2 = 76, 56%, dessa forma, “ A proporção da variação do tempo
gasto na execução dessa certa tarefa relacionada com o cargo de supervisora do refeitório, que é
explicada pela equação ajustada em função do tempo de experiência no cargo é igual a 76,56%.”
107

f) O sinal do coeficiente de correlação linear indica que a relação linear entre


o tempo, em minutos, gasto na execução de certa tarefa relacionada com o cargo de supervisora do
refeitório de uma grande indústria e o tempo de experiência no cargo é .

O sinal negativo do coeficiente de correlação linear indica que a relação linear entre o tempo, em
minutos, gasto na execução de certa tarefa relacionada com o cargo de supervisora do refeitório de
uma grande indústria e o tempo de experiência no cargo é inversa.
108

10) O consumo máximo de oxigênio (VO2máx ) é considerado um parâmetro fisiológico que permite
avaliar o nível da capacidade funcional do sistema cardiorrespiratório. Um pesquisador decidiu
ajustar uma equação de regressão com a finalidade de predição do VO2máx em função do desempenho
em um teste de 1600 m, para a população de brasileiros jovens fisicamente ativos. A partir de X
= velocidade do indivíduo em teste de 1600 m (em m/min) e Y = consumo máximo de oxigênio
(em ml/(kg·min)), ele obteve a equação de regressão: Ybi = 8, 15 + 0, 18Xi , com um coeficiente
de determinação igual r2 = 0, 79. Os valores de X variaram de 200 a 270 m/min. Complete
CORRETAMENTE as afirmações abaixo.

a) A proporção da variação do VO2máx (consumo máximo de oxigênio) que não é explicada pela
equação de regressão ajustada em função velocidade do indivíduo em teste de 1600 m (em m/min)
é igual a %.

O coeficiente de determinação r2 = 0, 79 é a proporção da variação do VO2máx (consumo máximo de


oxigênio) que é explicada pela equação de regressão ajustada em função velocidade do indivíduo em
teste de 1600 m (em m/min), dessa forma,“A proporção da variação do VO2máx (consumo máximo de
oxigênio) que não é explicada pela equação de regressão ajustada em função velocidade do indivíduo
em teste de 1600 m (em m/min) é igual a 21%.”

b) A estimativa do VO2máx (consumo máximo de oxigênio) para um indivíduo com velocidade de 276
m/min em teste de 1600 m é igual a ml/(kg·min). Entretanto essa estimativa
deve ser analisada com cautela em razão de essa velocidade não pertencer ao .

Para X = 276 ⇒ Yb =?
Yb = 8, 150, 18 × 276 = 57, 83,

assim: “A estimativa do VO2máx (consumo máximo de oxigênio) para um indivíduo com velocidade
de 276 m/min em teste de 1600 m é igual a 57,83 ml/(kg·min). Entretanto essa estimativa deve ser
analisada com cautela em razão de essa velocidade não pertencer ao intervalo pesquisado que variou
de 200 a 270 m/min.”
109

11) Érica supõe que as variáveis: comprimento do corpo em cm (X) de Bothrops moojeni - um tipo
de jararaca - e comprimento de sua cauda em cm (Y ) se relacionam de acordo com o modelo linear e
que são válidas as pressuposições usuais sobre o erro. Érica toma uma amostra de Bothrops moojeni
e obtém os seguintes resultados para a amostra escolhida:

X 124 125 135 135 140 140 143 148 150


Y 5 4 6 5 7 7 8 7 9

Determine:

a) Os somatórios;
n n
n= Xi = Xi2 =
P P
i=1 i=1
n n n
Yi = Yi2 = Xi Yi =
P P P
i=1 i=1 i=1

n n
n=9 Xi = 1240 Xi2 = 171504
P P
i=1 i=1
n n n
Yi = 58 Yi2 = 394 Xi Yi = 8095
P P P
i=1 i=1 i=1

b) Ajuste a equação de regressão para o modelo linear.

(1240) (58)
SPDXY = 8095 − = 103, 8889
9
(1240)2
SQDX = 171504 − = 659, 5556
9
(58)2
SQDY = 394 − = 20, 2222
9

SPDXY 103, 8889


βb1 = = = 0, 1575
SQDX 659, 5556
58 1240
βb0 = Ȳ − βb1 X̄ = − (0, 1575) × = 6, 4444 − 21, 7 = −15, 2556
9 9
Ybi = βb0 + βb1 Xi = −15, 2556 + 0, 1575Xi .

c) Determine (e interprete) o coeficiente de determinação da regressão.


110

 2
(SPDXY ) 2 8095 − 1240×58
9
SQRegressão = = ,
SQDX 171504 − (1240)2
9
(103, 8889)2
= = 16, 3639
659, 5556
(58)2
SQTotal = SQDY = 394 − = 20, 2222.
9
SQRegressão 16, 3639
r2 (%) = × 100% = × 100%
SQTotal 20, 2222
= 80, 92%.

O coeficiente de determinação r2 foi de 80,92%, dessa forma, o percentual da variabilidade observada


do comprimento da cauda, explicado pela regressão linear simples, nos valores do comprimento do
corpo, é 80,92%.
111

12) Considere as afirmações a seguir a respeito do coeficiente de correlação entre duas variáveis X e
Y.

I - Se rXY = −1, as observações estão todas sobre uma linha reta no diagrama de dispersão.

II - Se rXY > 0, a variável X tende a aumentar quando a variável Y tende a aumentar.

III - Se rXY < 0, a variável X tende a decrescer quando a variável Y tende a decrescer.

IV - rXY varia de −1 a 1, sendo que, quanto mais próximo de −1 menos correlacionadas são as
variáveis e, quanto mais próximo de 1, mais correlacionadas elas estão.

São corretas APENAS as afirmações

a) I e II; c) I, II e III; e) II, III e IV;

b) I e III; d) I, II e IV; f) n.d.r.a.

I - Verdadeiro.

II - Verdadeiro.

III - Falso. Se X e Y estão negativamente correlacionadas, isto é, −1 < rXY < 0 então as variáveis
caminham em sentido contrário e, dessa forma:

• À medida que uma variável tende a crescer a outra tende a diminuir;

• À medida que uma variável tende a diminuir a outra tende a aumentar.

IV - Falso. Quanto mais próximo de −1 e 1, maior a correlação entre as variáveis, no primeiro caso elas
estão negativamente correlacionadas e no segundo positivamente correlacionadas. Uma correlação
próxima a zero indica que as duas variáveis não estão linearmente relacionadas.

Opção correta letra a).


112

13) Considere a tabela abaixo:

Y 2 -1 5 1 6
X 0 0 3 -1 4

O valor do coeficiente de determinação, da constante da regressão, do coeficiente de correlação e do


coeficiente da regressão são dados respectivamente por:

a) 0,9671; −1, 5273; 0,9834 e 0,9091; d) 0,8966; 1,1702; 0,8039 e 1,1915;

b) 0,7289; 0,125; 0,8538 e 1,375; e) 1,1915; 1,1702; 0,8966 e 0,8039;

c) 0,8039; −0, 5542; 0,8966 e 0,6747; f) n.d.r.a.

Temos que

n n n n n
Xi = 6; Xi2 = 26; Yi = 13; Yi2 = 67; Xi Yi = 38;
P P P P P
i=1 i=1 i=1 i=1 i=1
SQDX = 18, 8; SQDY = 33, 2; SPDXY = 22, 4.

38 − (6)(13)
22, 4
rXY = r 5
=√ = 0, 8966.
2 2 18, 8 × 33, 2
26 − (6)
5
67 − (13)
5

r2 (%) = (0, 8966)2 × 100% = 80, 3896% = 0, 8039


22, 4
βb1 = = 1, 1915
18, 8
βb0 = 2, 6 − 1, 1915 × 1, 2 = 1, 1702

Assim a opção correta teria respectivamente os valores:

r2 (%) = 0, 8039; βb0 = 1, 1702; rXY = 0, 8966 e βb1 = 1, 1915.

Como não há nenhum item dessa maneira a resposta é a letra f)


113

14) Com o objetivo de verificar, em certa região, a relação existente entre o nível de escolaridade
médio dos pais e o nível de escolaridade dos filhos, observou-se uma amostra de 9 indivíduos adultos,
verificando-se o número de anos que esses frequentaram (e tiveram aprovação) em escolas regulares
(Y ) e, o número médio de anos que os seus pais frequentaram (e tiveram aprovação) em escolas
regulares (X), sendo que a escolaridade dos pais variou de três a doze anos de estudo. Nesse estudo
obteve-se:
rXY = 0, 9475 e Ybi = −1, 6964 + 1, 447Xi .

Pode-se afirmar que:

a) 1, 447 é o aumento médio estimado, em anos, da escolaridade dos pais quando aumenta-se em um
ano a escolaridade média dos filhos;

b) 1, 6964 é o decréscimo médio estimado, em anos, da escolaridade dos pais quando aumenta-se em
um ano a escolaridade média dos filhos;

c) 1, 6964 é o decréscimo médio estimado, em anos, da escolaridade dos pais quando diminui-se em
um ano a escolaridade média dos filhos;

d) O percentual da variabilidade observada do nível de escolaridade médio dos pais, explicado pela
regressão linear simples, nos valores do nível de escolaridade médio dos filhos é 94,75%;

e) O percentual da variabilidade observada do nível de escolaridade médio dos filhos, explicado pela
regressão linear simples, nos valores do nível de escolaridade médio dos pais é 89,78%.

f) 1, 447 é o aumento médio estimado, em anos, da escolaridade dos pais quando diminui-se em um
ano a escolaridade média dos filhos;

Temos que

n n n n n
Xi = 61; Xi2 = 491; Yi = 73; Yi2 = 773; Xi Yi = 607.
P P P P P
i=1 i=1 i=1 i=1 i=1

(61) (73)
SPDXY = 607 − = 112, 2222
9
(61)2
SQDX = 491 − = 77, 5556
9
(73)2
SQDY = 773 − = 180, 8889
9

SPDXY 112, 2222


βb1 = = = 1, 447
SQDX 77, 5556
73 61
βb0 = Ȳ − βb1 X̄ = − (1, 447) × = 8, 1111 − 9, 8075 = −1, 6964
9 9
114

Ybi = βb0 + βb1 Xi = −1, 6964 + 1, 447Xi .

607 − (61)(73)
112, 22
rXY = r 9
=√ = 0, 9475.
2 2 77, 56 × 180, 89
491 − (61)
9
773 − (73)
9

r2 (%) = (0, 9475)2 × 100% = 89, 78% = 0, 8978.

Assim, a única alternativa correta é a letra e).


115

15) O Departamento de Economia da UFV através do CENSUS (Centro de Promoção do Desenvolvi-


mento Sustentável) disponibiliza boletins semestrais acerca de vários assuntos nas áreas social, urba-
nística, ambiental e de gestão pública. No boletim de 2015, dentre diversas variáveis disponibilizadas
estavam o IPC-VIÇOSA (Índice de Preço ao Consumidor da cidade de Viçosa, em porcentagem), o
qual denotaremos por X e a variação dos empregos (diferença entre as Admissões e Demissões de
trabalhadores em Viçosa-MG), a qual denotaremos pos Y . Na tabela abaixo temos os valores obtidos
para o ano de 2012.

Mês Jan. Fev. Mar. Abr. Mai. Jun. Jul. Ago. Set. Out. Nov. Dez.
Y −29 115 84 −8 169 74 −107 −43 75 23 −2 7
X 2, 32 1, 19 −0, 46 0, 38 0, 02 0, 8 0, 63 0, 9 1, 43 1, 26 1, 29 1, 15
Fonte: http://www.censusvicosa.com.br/images/publicacoes/475/boletim-estatstico-de-viosa-15-de-janeiro-de-2013-3pdf.pdf

Considerando quatro casas decimais nos cálculos, indique a seguir a única resposta correta:

a) 34, 9747 é o aumento médio estimado, em unidades, da variação dos empregos quando aumenta-se
em uma unidade o índice de preços ao consumidor da cidade de Viçosa;

b) A reta de regressão estimada e o coeficiente de correlação são dados respectivamente por:


Ybi = 1, 0021 − 0, 0031Xi e rXY = −0, 33;
c) A reta de regressão estimada e o coeficiente de determinação são dados respectivamente por:
Ybi = 66, 2072 − 36, 0733Xi e rX,Y
2
= 7, 6%;
d) A reta de regressão estimada e o coeficiente de determinação são dados respectivamente por:
Ybi = 61, 6311 − 34, 9747Xi e rX,Y
2
= −0, 33;
e) O percentual da variabilidade observada da variação dos empregos, explicado pela regressão linear
simples, nos valores do índice de preços ao consumidor da cidade de Viçosa é 10,89%;

f) n.d.r.a.

Temos que
126, 06 − (10,91)(358)
rXY = r 12
= −0, 33.
(10,91)2 (358)2
 
15, 6209 − 12
74728 − 12

126, 06 − 10,91×358
−199, 4217
βb1 = 12
= = −34, 9747,
15, 6209 (10,91)2
− 12 5, 7019

358 10, 91
βb0 = − (−34, 9747) × = 61, 6311,
12 12
Ybi = 61, 6311 − 34, 9747Xi .

r2 (%) = (−0, 33)2 × 100% = 10, 89%.

O coeficiente de determinação r2 foi de 10,89%, dessa forma, o percentual da variabilidade observada


da variação dos empregos, explicado pela regressão linear simples, nos valores do índice de preços ao
116

consumidor da cidade de Viçosa é 10,89%.

A única resposta correta é a letra e).


117

16) Uma forma para avaliar a capacidade reprodutiva de um touro é medindo o seu índice de con-
centração sérica de testosterona. Há evidências de que animais com altos valores desse índice são
também melhores reprodutores. Portanto, existe o interesse em descobrir possíveis fatores que provo-
cam o aumento desse índice e, consequentemente, da fertilidade do touro. Nesse sentido, estudou-se
via Regressão Linear Simples (RLS) como a massa corporal dos animais (X) influenciaria o índice
de concentração sérica de testosterona (Y ), através de uma amostra de 10 touros da raça Guzerá,
com idade entre 24 e 34 meses. A Tabela a seguir apresenta os valores de X e Y , sendo que ng/ml
representa nanogramas/mililitro.

Massa (kg) 305 541 579 388 422 755 599 693 392 659
Testosterona (ng/ml) 0, 1 2, 2 2, 6 0, 74 1, 02 3, 45 2, 47 3, 24 0, 85 3, 6
a) Determine a equação ajustada de regressão linear simples;

Temos que
n n
n = 10; Xi = 5333; Xi2 = 3046595;
P P
i=1 i=1

n n n
Yi = 20, 27; Yi2 = 55, 3815; Xi Yi = 12478, 86.
P P P
i=1 i=1 i=1

(5333) (20, 27)


SPDXY = 12478, 86 − = 1668, 869
10
(5333)2
SQDX = 3046595 − = 202506, 1
10
(20, 27)2
SQDY = 55, 3815 − = 14, 2942
10

SPDXY 1668, 869


βb1 = = = 0, 0082
SQDX 202506, 1
20, 27 5333
βb0 = Ȳ − βb1 X̄ = − (0, 0082) × = 2, 027 − 4, 3731 = −2, 3461
10 10
Ybi = βb0 + βb1 Xi = −2, 3461 + 0, 0082Xi .

Olhando-se direto na calculadora obteremos: Ybi = −2, 3680 + 0, 0082Xi .

b) Interprete a estimativa do coeficiente da regressão;

βb1 = 0, 0082 é o aumento médio estimado, em nanogramas/mililitro, do índice de concentração sérica


de testosterona quando aumenta-se em um quilograma o massa corporal dos animais;

c) Estime o índice de concentração sérica de testosterona e o desvio da regressão para um touro com
massa de 541 kg;

Para X2 = 541 ⇒ Yb2 =?


Yb2 = −2, 3461 + 0, 0082 × 541 = 2, 0901.
118

O desvio da regressão é b2 = Y2 − Yb2 = 2, 2 − 2, 0901 = 0, 1099.

Com os valores da calculadora obteremos

Yb2 = −2, 368 + 0, 0082 × 541 = 2, 0682.

assim b2 = Y2 − Yb2 = 2, 2 − 2, 0682 = 0, 1318

ou ainda olhando-se diretamente teremos Yb2 = 2, 0905. Logo b2 = Y2 − Yb2 = 2, 2 − 2, 0905 = 0, 1095.

d) Obtenha o coeficiente de correlação linear;

SPDXY 12478, 86 − (5333)(20,27)


rXY = √ = r 10
SQDX SQDY (5333)2

(20,27)2

3046595 − 10
55, 38 − 10
1668, 87
= √ = 0, 9809.
202506, 1 × 14, 29

e) Obtenha o coeficiente de determinação e interprete-o.

Temos que

(SPDXY )2 (1668, 869)2


SQRegressão = = = 13, 7533,
SQDX 202506, 1
SQTotal = SQDY = 14, 2942,
SQRegressão 13, 7533
r2 (%) = × 100% = × 100%
SQTotal 14, 2942
= 96, 22%.

O coeficiente de determinação r2 (%) foi de 96,22%, dessa forma, o percentual da variabilidade ob-
servada do índice de concentração sérica de testosterona, explicado pela regressão linear simples, nos
valores do massa corporal dos animais é 96,22%.
119

17) Investigou-se, via regressão linear simples (RLS), como a idade dos consumidores (X, em anos)
poderia influenciar a intenção de compra de produtos de uma determinada linha. Para tal, n = 8
indivíduos foram apresentados a fotografias que ilustravam alguns desses produtos. As notas de
preferência (Y ), definidas em uma escala contínua de 1 a 6, foram atribuídas a cada imagem, conforme
apresentado na tabela a seguir:

Xi 18 19 20 23 24 25 26 27
Yi 5,4 5,6 5,3 4,7 3,9 4,0 3,7 3,3

Pede-se:

a) A equação de regressão linear simples (RLS) ajustada e a interpretação da estimativa do coeficiente


da regressão.
Temos que
n n
n = 8; Xi = 182; Xi2 = 4220;
P P
i=1 i=1

n n n
Yi = 35, 9; Yi2 = 166, 49; Xi Yi = 796, 6.
P P P
i=1 i=1 i=1

(182) (35, 9)
SPDXY = 796, 6 − = −20, 125
8
(182)2
SQDX = 4220 − = 79, 5
8
(35, 9)2
SQDY = 166, 49 − = 5, 3888
8

SPDXY −20, 125


βb1 = = = −0, 2531
SQDX 79, 5
35, 9 182
βb0 = Ȳ − βb1 X̄ = − (−0, 2531) × = 4, 4875 + 5, 758 = 10, 2455
8 8
Ybi = βb0 + βb1 Xi = 10, 2455 − 0, 2531Xi .

βb1 = −0, 2531 é o decréscimo médio estimado, da nota de preferência quando aumenta-se em um
ano a idade do consumidor;

b) A nota de preferência média estimada e o desvio da regressão para um consumidor com 20 anos;
Para X = 20 ⇒ Yb =?

Yb = 10, 2455 − 0, 2531 × 20 = 5, 1835,

b3 = Y3 − Yb3 = 5, 3 − 5, 1835 = 0, 1165.

Assim “o desvio da regressão para um indivíduo com 20 anos é 0, 1165”.


120

c) Estime a nota de preferência média para um consumidor com idade de 10 anos. Comente sobre
esse resultado.

Para X = 10 ⇒ Yb =?

Yb = 10, 2455 − 0, 2531 × 10 = 7, 7145.

Essa estimativa obtida trata-se de uma extrapolação, haja vista que no estudo em questão, a idade
do consumidor variou de 18 a 27 anos, dessa forma, essa estimativa não é confiável.

d) Calcule e interprete o coeficiente de determinação do modelo de RLS ajustado.

Temos que

(SPDXY )2 (−20, 125)2


SQRegressão = = = 5, 0945,
SQDX 79, 5
SQTotal = SQDY = 5, 3888,
SQRegressão 5, 0945
r2 (%) = × 100% = × 100%
SQTotal 5, 3888
= 94, 54%.

O coeficiente de determinação r2 (%) foi de 94,54%, dessa forma, o percentual da variabilidade ob-
servada da nota de preferência, explicado pela regressão linear simples, nos valores da idade do
consumidor é 94,54%.
121

CAPÍTULO VI

Probabilidade

1) De 100 estudantes, 30 frequentam um curso de natação, 20 frequentam um curso de computação


e 10 frequentam tanto o curso de natação quanto o de computação. Um estudante é selecionado ao
acaso.

a) Determine a probabilidade de que ele frequente pelo menos um dos dois cursos.
Sejam A:“o aluno frequenta o curso de natação” e, B:“o aluno frequenta o curso de computação”.
Temos que
30 20 10
P [A] = = 0, 3, P [B] = = 0, 2 e P [A ∩ B] = = 0, 1.
100 100 100

assim

P [A ∪ B] = P [A] + P [B] − P [A ∩ B]

= 0, 3 + 0, 2 − 0, 1
A 0, 2 0, 1 0, 1 B
= 0, 4

0, 6

b) Determine a probabilidade de que ele frequente apenas o curso de natação.



P [A ∩ B ] = P [A] − P [A ∩ B]
c

= 0, 3 − 0, 1

= 0, 2 A 0, 2 0, 1 0, 1 B

0, 6
122

2) Dentre 10 pessoas que estão na sala de espera de um médico, 3 praticam alguma atividade física.
Duas pessoas são selecionadas aleatoriamente, uma após a outra sem reposição, para serem atendidas
gratuitamente.

a) Determine a probabilidade de que a segunda pessoa escolhida pratique atividade física, sabendo
que a primeira pessoa a ser escolhida pratica atividade física.

Sejam A:“a primeira pessoa pratica atividade física” e, B:“a segunda pessoa pratica atividade física”.

B
2
9

3 7
10 9
Bc

2
P [B|A] = = 0, 2222 •
9

7
B
3
10 9

Ac
6
9
Bc
b) Determine a probabilidade de que a segunda pessoa escolhida pratique atividade física, sabendo
que a primeira pessoa a ser escolhida não pratica atividade física.

3
P [B|Ac ] = = 0, 3333
9

c) Determine a probabilidade de que a primeira pessoa escolhida pratique atividade física, sabendo
que a segunda pessoa a ser escolhida não pratica atividade física.

P [A ∩ B c ] P [B c |A] P [A]
P [A|B c ] = =
P [B c ] P [B c |A] P [A] + P [B c |Ac ] P [Ac ]
7 3
· 0, 2333
= 7 39 106 7 =
· + · 0, 7
9 10 9 10
= 0, 3333
123

3) Numa usina nuclear somente em um a cada 100 dias há algo errado com o reator. Em 99% dos dias
em que há algo errado com o reator o alarme dessa usina dispara e, por outro lado, ele também dispara
em 1% dos dias em que não há nada de errado com o reator. Qual é a probabilidade condicional de
haver algo errado com o reator se o alarme disparou?

Sejam A:“há algo errado com o reator” e, B:“o alarme diparou”.

B
0,99

1 0,01
100
Bc

99
B
100 0,01

Ac

0,99
Bc

P [A ∩ B] P [B|A] P [A]
P [A|B] = =
P [B] P [B|A] P [A] + P [B|Ac ] P [Ac ]
0, 99 · 0, 01 0, 0099
= =
0, 99 · 0, 01 + 0, 01 · 0, 99 0, 0198
= 0, 5
124

4) Um estudante em uma certa manhã, sai de casa apressado para a escola e apanha na cozinha
aleatoriamente uma das 3 sacolas iguais que estão em cima da mesa. Uma delas contém o seu lanche:
dois sanduíches de queijo e manteiga. Outra sacola contém o lanche de sua irmã: um sanduíche de
queijo e manteiga e outro de presunto, (que ele detesta). A terceira sacola contém restos de comida
que serão dados ao gato. Pensando em ter ou não, pegado a sacola errada, no meio do caminho, ele
abre a sacola e tira um sanduíche e verifica que é de queijo e manteiga. (Fica aliviado, pelo menos
não é a sacolinha da comida do gato). Pergunta-se: Nessas condições, qual a probabilidade dele ter
apanhado a sacola correta?

Sejam A:“ele apanhou sua sacola”, B:“ele apanhou a sacola de sua irmã”, C:“ele apanhou a sacola
com restos de comida” e D:“A sacola contém um sanduíche de queijo e manteiga”. Temos que assim
1 1 1
P [A] = = 0, 3333, P [B] = = 0, 3333 P [C] = = 0, 3333
3 3 3
P [D | A] = 1, P [D | B] = 0, 5 P [D | C] = 0
P [Dc | A] = 0, P [Dc | B] = 0, 5 P [Dc | C] = 1

D
1

0
Dc
0,3333

D
0,5

• 0,3333
B

0,5
Dc
0,3333

D
0

1
Dc

P [A ∩ D] P [A] P [D|A]
P [A|D] = =
P [D] P [A] P [D|A] + P [B] P [D|B] + P [C] P [D|C]
0, 3333 × 1
=
0, 3333 × 1 + 0, 3333 × 0, 5 + 0, 3333 × 0
0, 3333
= = 0, 6667
0, 5
125

5) Extraem-se aleatoriamente duas cartas de um baralho comum de 52 cartas. Determine a probabi-


lidade de serem ambas ases, se:

a) a primeira carta é reposta;

Sejam A:“a primeira carta retirada é um ás” e, B:“a segunda carta retirada é um ás”.

B
4
52

4 48
52
P [A ∩ B] = P [B | A] · P [A] 52
Bc
4 4 16
= · =
52 52 2704 •
= 0, 0059

48
B
4
52 52

Ac
48
52
Bc
b) a primeira carta não é reposta.

B
3
P [A ∩ B] = P [B | A] · P [A] 51

3 4 12 A
= · =
51 52 2652
= 0, 0045 4 48
52 51
Bc

48
B
4
52 51

Ac
47
51
Bc
126

6) Sejam duas urnas I e II. A urna I contém três fichas vermelhas e duas fichas azuis, e a urna II
contém duas fichas vermelhas e oito fichas azuis. Joga-se uma moeda honesta. Se a moeda resultar
em cara, extrai-se uma ficha da urna I; se resultar em coroa, extrai-se uma ficha da urna II. Pede-se:

a) Determine a probabilidade de escolha de uma ficha vermelha.

Urna I Urna II
3 Vermelhas 2 Vermelhas
2 Azuis 8 Azuis

Sejam A:“a moeda resulta em cara” e, B:“a ficha extraída é vermelha”. Temos que
3
P [A] = 0, 5, P [Ac ] = 0, 5 P [B | A] = = 0, 6
5
2 2 8
P [B c | A] = = 0, 4, P [B | Ac ] = = 0, 2 P [B c | Ac ] = = 0, 8
5 10 10

B
3
5

A
2
0,5 5
Bc

P [B] = P [B | A] P [A] + P [B | Ac ] P [Ac ]



= 0, 6 · 0, 5 + 0, 2 · 0, 5

= 0, 4 0,5 2
B
10

Ac
8
10
Bc
b) Dado que a ficha é vermelha, qual é a probabilidade condicional de ter vindo da urna I?

P [A ∩ B] P [B|A] P [A]
P [A|B] = =
P [B] P [B|A] P [A] + P [B|Ac ] P [Ac ]
0, 6 · 0, 5 0, 3
= =
0, 6 · 0, 5 + 0, 2 · 0, 5 0, 4
= 0, 75
127

7) Em uma fábrica de peças, as máquinas A, B e C respondem por 40, 50 e 10 por cento do total
produzido, respectivamente. Da produção de cada máquina 3%, 5% e 2%, respectivamente, são peças
defeituosas. Escolhida ao acaso uma peça da produção conjunta das três máquinas, pede-se:

a) Qual a probabilidade da peça escolhida ser defeituosa?


Sejam A:“a peça foi produzida pela máquina A”, B:“a peça foi produzida pela máquina B”, C:“a
peça foi produzida pela máquina C” e D:“ a peça produzida é defeituosa”. Temos que

P [A] = 0, 4, P [B] = 0, 5 P [C] = 0, 1


P [D | A] = 0, 03, P [D | B] = 0, 05 P [D | C] = 0, 02
P [Dc | A] = 0, 97, P [Dc | B] = 0, 95 P [Dc | C] = 0, 98

D
assim 0,03

0,97
Dc
0,4

D
0,05

• 0,5
B

0,95
Dc
0,1

D
0,02

0,98
Dc

P [D] = P [A] P [D|A] + P [B] P [D|B] + P [C] P [D|C]

= 0, 4 × 0, 03 + 0, 5 × 0, 05 + 0, 1 × 0, 02

= 0, 039.
b) Sabendo-se que a peça escolhida é defeituosa, qual a probabilidade condicional de ter vindo da
máquina B?

P [B ∩ D] P [B] P [D|B]
P [B|D] = =
P [D] P [A] P [D|A] + P [B] P [D|B] + P [C] P [D|C]
0, 5 × 0, 05
=
0, 4 × 0, 03 + 0, 5 × 0, 05 + 0, 1 × 0, 02
0, 025
= = 0, 641.
0, 039
128

8) Uma caixa contém 20 peças, das quais 5 são defeituosas. Extraem-se sucessivamente duas peças
ao acaso. Qual a probabilidade de:

a) Ambas serem perfeitas?


Sejam A: “a primeira peça é perfeita” e, B: “a segunda peça é perfeita”.
Temos que
15 5 14
P [A] = = 0, 75, P [Ac ] = = 0, 25, P [B |A ] = = 0, 7368,
20 20 19
5 15 4
P [B c |A] = = 0, 2632, P [B |Ac ] = = 0, 7895, P [B c |Ac ] = = 0, 2105.
19 19 19

B
14
P [A ∩ B] = P [B | A] · P [A] 19

14 15 210 A
= · =
19 20 380
= 0, 5526 15 5
20 19
Bc

5
B
15
20 19

Ac
4
19
Bc
b) Ambas serem defeituosas?

P [Ac ∩ B c ] = P [B c | Ac ] · P [Ac ]
4 5 20
= · =
19 20 380
= 0, 0526

c) Uma ser perfeita e outra defeituosa?

P [(A ∩ B c ) ∪ (Ac ∩ B)] = P [A ∩ B c ] + P [Ac ∩ B]

= P [B c | A] · P [A] + P [B | Ac ] · P [Ac ]
5 15 15 5 75 75
= · + · = +
19 20 19 20 380 380
= 0, 1974 + 0, 1974 = 0, 3948
129

9) Certa firma utilizava um teste para classificar os funcionários em categorias; ao final eles eram
classificados em: 25% bons (B), 50% médios (M) e 25% fracos (F). Um novo teste é proposto, de tal
forma a classificar os funcionários como aprovado (A) ou reprovado (R). Com base em informações
do antigo teste, foram obtidas as seguintes probabilidades condicionais com o novo teste:

Categorias do Aprovados pelo


antigo teste novo teste (%)
B 80
M 50
F 20

Pede-se: qual é a probabilidade condicional de um funcionário aprovado no novo teste, ser classificado
como fraco pelo antigo teste?

Sejam

• B : “o funcionário é classificado como bom pelo antigo teste”;

• M : “o funcionário é classificado como médio pelo antigo teste”;

• F : “o funcionário é classificado como fraco pelo antigo teste”;

• A : “o funcionário é aprovado no novo teste”.


Ac
Temos que 0,2

B
0,8
P [B]=0,25, P [A|B]=0,8, 0,25
A

0,5 Ac

P [M ]=0,5, P [A|M ]=0,5, • 0,5


M
0,5
A
0,25
P [F ]=0,25, P [A|F ]=0,2. 0,8 Ac
F
0,2
A

P [F ∩ A] P [A|F ] P [F ]
P [F |A] = =
P [A] P [A|B] P [B] + P [A|M ] P [M ] + P [A|F ] P [F ]
0, 2 × 0, 25
=
0, 8 × 0, 25 + 0, 5 × 0, 5 + 0, 2 × 0, 25
0, 05
=
0, 2 + 0, 25 + 0, 05
0, 05
= = 0, 1.
0, 5

Dessa forma, sabendo-se que o aluno foi aprovado no novo teste, a probabilidade de que ele tenha
sido classificado como fraco pelo antigo teste é 0,1.
130

10) Considerando o espaço amostral de um experimento constituído do lançamento de dois dados


perfeitamente simétricos, pede-se:

a) Qual a probabilidade de que o primeiro dado mostre a face 2 e o segundo a face 3?

Determinemos primeiramente o espaço amostral, para isso consideremos a tabela auxiliar que se
segue.

HHD2
HH
1 2 3 4 5 6
D1 HH
1 (1, 1) (1, 2) (1, 3) (1, 4) (1, 5) (1, 6)
2 (2, 1) (2, 2) (2, 3) (2, 4) (2, 5) (2, 6)
3 (3, 1) (3, 2) (3, 3) (3, 4) (3, 5) (3, 6)
4 (4, 1) (4, 2) (4, 3) (4, 4) (4, 5) (4, 6)
5 (5, 1) (5, 2) (5, 3) (5, 4) (5, 5) (5, 6)
6 (6, 1) (6, 2) (6, 3) (6, 4) (6, 5) (6, 6)

Note que Ω = {(1, 1), (1, 2), · · · , (6, 6)} constituído de n = 36 pontos amostrais.

Considere o evento A : “o primeiro dado mostre a face 2 e o segundo a face 3”. Perceba que esse
evento só ocorre uma vez nos 36 resultados possíveis do espaço amostral, pois A = {(2, 3)}, e assim
n (A) = 1. Dessa maneira
n (A) 1
P [A] = = .
n 36

b) Qual a probabilidade de que ambos os dados mostrem a mesma face?

Considere o evento B : “ambos os dados mostrem a mesma face”. Perceba que esse evento ocorre 6 ve-
zes nos 36 resultados possíveis do espaço amostral, pois B = {(1, 1); (2, 2); (3, 3); (4, 4); (5, 5); (6, 6)},
e assim n (B) = 6. Dessa maneira

n (B) 6 1
P [B] = = = .
n 36 6

c) Qual a probabilidade de que o segundo dado mostre um número par?

Considere o evento c : “o segundo dado mostra um número par”. Perceba que esse evento ocorre 18
vezes nos 36 resultados possíveis do espaço amostral, pois

C = {(1, 2); (2, 2); (3, 2); (4, 2); (5, 2); (6, 2); (1, 4); (2, 4); (3, 4); (4, 4);
(5, 4); (6, 4); (1, 6); (2, 6); (3, 6); (4, 6); (5, 6); (6, 6)} ,

e assim n (C) = 18. Dessa maneira

n (C) 18 1
P [C] = = = .
n 36 2
131

11) Uma moeda perfeita é lançada 3 vezes e observado o número de caras. Qual é a probabilidade de
ocorrer?

a) Exatamente uma cara?

Considere os eventos

• A1 : “ocorre cara no primeiro lançamento”;

• A2 : “ocorre cara no segundo lançamento”;

• A3 : “ocorre cara no terceiro lançamento”;

• A : “ocorre exatamente uma cara nos três lançamentos”;

então
1 A3 ⇒ 3 caras
2

1 A2 1
Ac3 ⇒ 2 caras
2
2

A1 1 A3 ⇒ 2 caras
2
1
2 1
2 Ac2 1
Ac3 ⇒ 1 caras
2

1

1 A2 2
A3 ⇒ 2 caras
1 2
2
1
Ac1 2 Ac3 ⇒ 1 cara
1
1
1 cara
2
2 Ac2 A3 ⇒
1
2 Ac3 ⇒ 0 cara
e

P [A] = P [(A1 ∩ Ac2 ∩ Ac3 ) ∪ (Ac1 ∩ A2 ∩ Ac3 ) ∪ (Ac1 ∩ Ac2 ∩ A3 )]

= P [A1 ∩ Ac2 ∩ Ac3 ] + P [Ac1 ∩ A2 ∩ Ac3 ] + P [Ac1 ∩ Ac2 ∩ A3 ]

= P [ Ac3 | A1 ∩ Ac2 ] P [ Ac2 | A1 ] P [A1 ] + P [ Ac3 | Ac1 ∩ A2 ] P [ A2 | Ac1 ] P [Ac1 ]

+ P [ A3 | Ac1 ∩ Ac2 ] P [ Ac2 | Ac1 ] P [Ac1 ]


1 1 1 1 1 1 1 1 1 1 1 1 3
= · · + · · + · · = + + =
2 2 2 2 2 2 2 2 2 8 8 8 8

b) Pelo menos uma cara?

Seja B : “ocorre pelo menos uma cara nos três lançamentos”, nesse caso B c : “ocorre menos que uma
cara nos três lançamentos”, ou seja, B c = {Ac1 ∩ Ac2 ∩ Ac3 } é o evento em que não ocorrem caras nos
três lançamentos.
132

P [B] = 1 − P [B c ] = 1 − P [Ac1 ∩ Ac2 ∩ Ac3 ]

= 1 − P [ Ac3 | Ac1 ∩ Ac2 ] P [ Ac2 | Ac1 ] P [Ac1 ]


1 1 1 1 8−1 7
= 1− · · =1− = = .
2 2 2 8 8 8

c) Somente cara ou somente coroa?

Seja C : “ocorrem três ou três coroas caras nos três lançamentos”.

P [C] = P [(A1 ∩ A2 ∩ A3 ) ∪ (Ac1 ∩ Ac2 ∩ Ac3 )] = P [A1 ∩ A2 ∩ A3 ] + P [Ac1 ∩ Ac2 ∩ Ac3 ]

= P [ A3 | A1 ∩ A2 ] P [ A2 | A1 ] P [A1 ] + P [ Ac3 | Ac1 ∩ Ac2 ] P [ Ac2 | Ac1 ] P [Ac1 ]


1 1 1 1 1 1 1 1 2 1
= · · + · · = + = =
2 2 2 2 2 2 8 8 8 4
133

12) Das 10 alunas de uma classe, 3 têm olhos azuis. Se duas alunas da classe são escolhidas aleatori-
amente, qual é a probabilidade de:

a) Ambas terem olhos azuis?

Sejam A:“a primeira aluna tem olhos azuis” e, B:“a segunda aluna tem olhos azuis”.

Temos que
3 7 2
P [A] = = 0, 3, P [Ac ] = = 0, 7, P [B |A ] = = 0, 2222,
10 10 9
7 3 6
P [B c |A ] = = 0, 7778, P [B |Ac ] = = 0, 3333, P [B c |Ac ] = = 0, 6667.
9 9 9

B
2
P [A ∩ B] = P [B | A] · P [A] 9

2 3 6 A
= · =
9 10 90
= 0, 0667 3 7
10 9
Bc

7
B
3
10 9

Ac
6
9
Bc
b) Nenhuma ter olhos azuis?

P [Ac ∩ B c ] = P [B c | Ac ] · P [Ac ]
6 7 42
= · =
9 10 90
= 0, 4667

c) Pelo menos uma ter olhos azuis?

P [A ∪ B] = 1 − P [(A ∪ B)c ] = 1 − P [Ac ∩ B c ]

= 1 − 0, 4667 = 0, 5333
134

13) Um homem possui duas moedas, uma comum e outra cunhada com duas caras. Ele apanhou uma
moeda aleatoriamente e a lançou, se ocorreu a face cara, qual é a probabilidade condicional de que
a moeda lançada tenha sido a de duas caras?

Sejam A:“a moeda lançada é a de duas caras” e, B:“a moeda resulta em cara”. Temos que
2
P [A] = 0, 5, P [Ac ] = 0, 5 P [B | A] = =1
2
0 1 1
P [B c | A] = = 0, P [B | Ac ] = = 0, 5 P [B c | Ac ] = = 0, 5
2 2 2

B
2
2

P [A ∩ B] 0,5
0
2
P [A|B] = Bc
P [B]
P [B|A] P [A]
=
P [B|A] P [A] + P [B|Ac ] P [Ac ] •
1 · 0, 5 0, 5
= =
1 · 0, 5 + 0, 5 · 0, 5 0, 75 B
0,5
= 0, 6667
1
2

Ac
1
2
Bc
135

14) Jogam-se dois dados de seis faces honestos.

a) Se as duas faces mostram números diferentes, qual é a probabilidade condicional de que uma das
faces seja o 4?
Note que Ω = {(1, 1), (1, 2), · · · , (6, 6)} constituído de n = 36 pontos amostrais, conforme mostra a
tabela a seguir.
HH
D2
H 1 2 3 4 5 6
D1 HHH
1 (1, 1) (1, 2) (1, 3) (1, 4) (1, 5) (1, 6)
2 (2, 1) (2, 2) (2, 3) (2, 4) (2, 5) (2, 6)
3 (3, 1) (3, 2) (3, 3) (3, 4) (3, 5) (3, 6)
4 (4, 1) (4, 2) (4, 3) (4, 4) (4, 5) (4, 6)
5 (5, 1) (5, 2) (5, 3) (5, 4) (5, 5) (5, 6)
6 (6, 1) (6, 2) (6, 3) (6, 4) (6, 5) (6, 6)

Se A : “as duas faces mostram números diferentes” e B : “uma das faces mostradas é o número
quatro”. Desejamos encontrar P [B | A]. Temos que

A = {(1, 2); (1, 3); (1, 4); (1, 5); (1, 6); (2, 1); (2, 3); (2, 4); (2, 5); (2, 6);

(3, 1); (3, 2); (3, 4); (3, 5); (3, 6); (4, 1); (4, 2); (4, 3); (4, 5); (4, 6);

(5, 1); (5, 2); (5, 3); (5, 4); (5, 6); (6, 1); (6, 2); (6, 3); (6, 4); (6, 5)} ,

B = {(1, 4); (2, 4); (3, 4); (4, 4); (5, 4); (6, 4), (4, 1); (4, 2); (4, 3); (4, 5); (4, 6)} ,

A ∩ B = {(1, 4); (2, 4); (3, 4); (4, 1); (4, 2); (4, 3); (4, 5); (4, 6); (5, 4); (6, 4)}

então

n (A) 30 5
P [A] = = = = 0, 8333
n 36 6
n (A ∩ B) 10 5
P [A ∩ B] = = = = 0, 2778
n 36 18

e
P [A ∩ B] 5
5 6 1
P [B | A] = = 18
= · = = 0, 3333.
P [A] 5
6
18 5 3

b) Qual a probabilidade da soma das faces seja maior do que 8?


As somas das faces são dadas na tabela abaixo e, note que, se C : “soma das faces voltadas para
cima é maior que 8”, então

C = {(3, 6), (4, 5), (4, 6), (5, 4), (5, 5), (5, 6), (6, 3), (6, 4), (6, 5), (6, 6)}

e n(C) = 10,
136

H
E2
1 2 3 4 5 6
HH
E1 HHH
1 2 3 4 5 6 7
2 3 4 5 6 7 8
3 4 5 6 7 8 9
4 5 6 7 8 9 10
5 6 7 8 9 10 11
6 7 8 9 10 11 12

dessa forma
n(C) 10 5
P [C] = = = .
n 36 18
137

15) Considere dois tipos de caixas de bombons, I e II. O tipo I contém 65% de bombons doces e 35%
de bombons amargos, enquanto no tipo II essas percentagens de sabor são inversas. Além disso, 45%
de todas as caixas de bombons são do tipo I e as restantes do tipo II. Escolhe-se, aleatoriamente,
uma caixa e dela retira-se um bombom; se for constatado que ele é doce, qual é a probabilidade
condicional de ter vindo de uma caixa do tipo II?

Sejam A: “as caixas de bombons são do tipo I” e, B: “os bombons são doces”.

Temos que

P [A] = 0, 45, P [Ac ] = 0, 55, P [B |A ] = 0, 65,


P [B c |A ] = 0, 35, P [B |Ac ] = 0, 35, P [B c |Ac ] = 0, 65.

B
0,65

0,35
0,45
Bc

0,55
B
0,35

Ac

0,65
Bc

P [Ac ∩ B] P [B | Ac ] P [Ac ]
P [Ac | B] = =
P [B] P [B | A] P [A] + P [B | Ac ] P [Ac ]
0, 35 · 0, 55 0, 1925 0, 1925
= = =
0, 65 · 0, 45 + 0, 35 · 0, 55 0, 2925 + 0, 1925 0, 485
= 0, 3969.
138

16) Considere dois eventos, A = {atirador A acerta o alvo} e B = {atirador B acerta o alvo}, com
probabilidades P [A] = 0, 51 e P [B] = 0, 32. Pede-se, se os atiradores A e B atiram simultaneamente
em um alvo, qual é a probabilidade do alvo ser atingido quando os eventos A e B:

a) são independentes.

Note que o alvo é atingido se um dos dois atiradores acertar o alvo, dessa forma desejamos encontrar
P [A ∪ B]. Além disso, em sendo os eventos A e B independentes, temos que P [A ∩ B] = P [A] P [B]
e dessa maneira

P [A ∪ B] = P [A] + P [B] − P [A ∩ B]

= P [A] + P [B] − P [A] P [B]

= 0, 51 + 0, 32 − 0, 51 · 0, 32

= 0, 6668.

b) são mutuamente exclusivos.

Note que o alvo é atingido se um dos dois atiradores acertar o alvo, dessa forma desejamos encontrar
P [A ∪ B]. Além disso, em sendo os eventos A e B mutuamente exclusivos, temos que A ∩ B = ∅ e
dessa maneira

P [A ∪ B] = P [A] + P [B] − P [A ∩ B]

= P [A] + P [B] − P [∅]

= 0, 51 + 0, 32 − 0

= 0, 83.
139

17) Dois eventos A e B pertencentes a um mesmo espaço amostral possuem probabilidades P [A] = 1/5
e P [B] = 1/6. Se A e B são eventos independentes calcule a probabilidade de ocorrência de pelo
menos um dos dois eventos.

P [A ∪ B] = P [A] + P [B] − P [A ∩ B]

= P [A] + P [B] − P [A] P [B]


1 1 1 1
= + − ·
5 6 5 6
1 1 1
= + −
5 6 30
6+5−1 10
= =
30 30
= 0, 3333

ou pelo diagrama de Venn


1 1 2
A 6 30 15 B

2
3

1 1 2
P [A ∪ B] = + +
6 30 15
= 0, 1667 + 0, 0333 + 0, 1333

= 0, 3333.
140

18) Um réu foi a julgamento acusado de homicídio. Numa tentativa de inocentar seu cliente o advo-
gado de defesa alega que ele é esquizofrênico e, portanto, deve ser tratado e não preso. O advogado
se baseia no resultado do exame de tomografia computadorizada (CAT) do réu que acusou atrofia
cerebral. Um neurologista especialista em exames CAT informa que 30% dos esquizofrênicos são
diagnosticados com atrofia cerebral enquanto que somente 2% dos indivíduos normais recebem o
mesmo diagnóstico. Se 1,5% da população são esquizofrênicos, calcule a probabilidade condicional
do réu ser um esquizofrênico, dado que seu exame CAT revelou atrofia cerebral.

Sejam A:“o indivíduo é esquizofrênico” e, B:“o exame detectou atrofia cerebral”. Temos que

P [A] = 0, 015, P [Ac ] = 0, 985 P [B | A] = 0, 3


P [B c | A] = 0, 7, P [B | Ac ] = 0, 02 P [B c | Ac ] = 0, 98

B
0,3

P [A ∩ B] 0,015
0,7
P [A|B] = Bc
P [B]
P [B|A] P [A]
=
P [B|A] P [A] + P [B|Ac ] P [Ac ] •
0, 3 · 0, 015 0, 0045
= =
0, 3 · 0, 015 + 0, 02 · 0, 985 0, 0242 B
0,985
= 0, 186 0,02

Ac

0,98
Bc
141

19) Em uma grande empresa 60% do total de funcionários são homens. Sabe-se também que 10% dos
homens e 25% das mulheres, trabalham no setor de recursos humanos dessa empresa. Pede-se: Se
aleatoriamente for selecionado um funcionário do setor de recursos humanos, qual é a probabilidade
condicional de que seja uma mulher?

Sejam A:“o indivíduo é do sexo feminino” e, B:“o indivíduo trabalha no setor de recursos humanos
da empresa”. Temos que

P [A] = 0, 4, P [Ac ] = 0, 6 P [B | A] = 0, 25
P [B c | A] = 0, 75, P [B | Ac ] = 0, 1 P [B c | Ac ] = 0, 9

B
0,25

P [A ∩ B] 0,4
0,75
P [A|B] = Bc
P [B]
P [B|A] P [A]
=
P [B|A] P [A] + P [B|Ac ] P [Ac ] •
0, 25 · 0, 4 0, 1
= =
0, 25 · 0, 4 + 0, 1 · 0, 6 0, 16 B
0,6
= 0, 625 0,1

Ac

0,9
Bc
142

20) Numa espécie de inseto sabe-se que a população é formada por 70% de fêmeas e 30% de machos.
Sabe-se também que 90% das fêmeas e 60% dos machos são estéreis. Calcule a probabilidade de se
amostrar aleatoriamente um inseto não estéril dessa espécie.

Sejam A:“o inseto é fêmea” e, B:“o inseto é estéril”. Temos que

P [A] = 0, 7, P [Ac ] = 0, 3 P [B | A] = 0, 9
P [B c | A] = 0, 1, P [B | Ac ] = 0, 6 P [B c | Ac ] = 0, 4

B
0,9

0,1
0,7
P [B ] = P [B |A] P [A] + P [B |A ] P [A ]
c c c c c
Bc
= 0, 1 · 0, 7 + 0, 4 · 0, 3 = 0, 07 + 0, 12

= 0, 19

0,3
B
0,6

Ac

0,4
Bc
143

21) Uma indústria inspeciona os itens que fabrica por amostragem, antes de serem enviados aos
compradores. Observações anteriores demonstraram que 8% dos itens inspecionados apresentam
defeito do tipo A, 6% apresentam defeito do tipo B, e 4% apresentam defeito do tipo C. Somente
um defeito pode ocorrer em cada item. Érica seleciona aleatoriamente, um item de um lote a ser
entregue amanhã. Determine a probabilidade de esse item apresentar pelo menos um desses três
defeitos.

Sejam

• A : “o item apresenta defeito do tipo A”;

• B : “o item apresenta defeito do tipo B”;

• C : “o item apresenta defeito do tipo C”.

Como somente um defeito pode ocorrer em cada item, temos que A ∩ B = ∅, A ∩ C = ∅, B ∩ C = ∅,


A ∩ B ∩ C = ∅, além disso, um defeito ocorrerá se A ∪ B ∪ C ocorrer, assim

P [A ∪ B ∪ C] = P [A] + P [B] + P [C] − P [A ∩ B]

− P [A ∩ C] − P [B ∩ C] + P [A ∩ B ∩ C]

= P [A] + P [B] + P [C] − P [∅] − P [∅] − P [∅] + P [∅]

= 0, 08 + 0, 06 + 0, 04 − 0 − 0 − 0 + 0

= 0, 18
144

22) A probabilidade de a cadela Nana ganhar massa na próxima semana é de 0,1, e a probabilidade
de sua massa manter-se inalterada é 0,83. Determine a probabilidade de a massa de Nana diminuir
na próxima semana.

Sejam

• A : “a massa aumentará na próxima semana”;

• B : “a massa se manterá na próxima semana”;

• C : “a massa diminuirá na próxima semana”.

Note que uma, e apenas uma, das três possibilidades ocorrerá, ou seja, A ∩ B = ∅, A ∩ C = ∅,
B ∩ C = ∅, A ∩ B ∩ C = ∅. Além disso,P [A ∪ B ∪ C] = P [Ω] = 1, logo

1 = P [A ∪ B ∪ C] = P [A] + P [B] + P [C] − P [A ∩ B]

− P [A ∩ C] − P [B ∩ C] + P [A ∩ B ∩ C]

= P [A] + P [B] + P [C] − P [∅] − P [∅] − P [∅] + P [∅]

= 0, 1 + 0, 83 + P [C] = 0, 93 + P [C] ,

dessa maneira P [C] + 0, 93 = 1 e finalmente temos que P [C] = 1 − 0, 93 = 0, 07.

Ou por diagrama de Venn

A B

0,1 0,83

0,07

C Ω

Assim
P [C] = 0, 07.
145

23) A probabilidade de sobrevivência nos próximos 30 anos de Nádia é de 0,9 e de seu marido é de
0,8. [A sobrevivência de um não depende da sobrevivência do outro]. Determine a probabilidade de
nenhum dos dois sobreviver aos próximos 30 anos.

Sejam

• A : “Nádia sobrevive aos próximos 30 anos”;

• B : “o marido de Nádia sobrevive aos próximos 30 anos”.

Sabemos que P [A] = 0, 9, P [B] = 0, 8 e queremos determinar P [(A ∪ B)c ].

Como a sobrevivência de um não depende da sobrevivência do outro temos que

P [A ∩ B] = P [A] P [B] = 0, 9 · 0, 8 = 0, 72.

Assim

P [Ac ∩ B c ] = P [(A ∪ B)c ] = 1 − P [A ∪ B]

= 1 − (P [A] + P [B] − P [A ∩ B])

= 1 − (0, 9 + 0, 8 − 0, 72) = 1 − 0, 98

= 0, 02.

A 0, 18 0, 72 0, 08 B

0, 02

Assim
P [Ac ∩ B c ] = 0, 02.
146

24) Dentre 20 garotas em uma sala de aula, 8 têm olhos azuis. Marcelo escolhe três garotas, simulta-
neamente, ao acaso. Determine a probabilidade de que duas delas possuam olhos azuis [a outra não
têm olhos azuis].

Considere os eventos

• A1 : “a primeira garota tem olhos azuis”;

• A2 : “a segunda garota tem olhos azuis”;

• A3 : “a terceira garota tem olhos azuis”;

• A : “exatamente duas das três têm olhos azuis”;

então
6
18
A3
7
19
A2 12
Ac3
18
A1 7
18
A3
8
20 12
19 Ac2 11
Ac3
18

7
18
12
8
19
A2 A3
20
11
Ac1 18 Ac3
8
11 18
19 Ac2 A3
10
18 Ac3
e

A = (A1 ∩ A2 ∩ Ac3 ) ∪ (A1 ∩ Ac2 ∩ A3 ) ∪ (Ac1 ∩ A2 ∩ A3 )

então

P [A] = P [A1 ∩ A2 ∩ Ac3 ] + P [A1 ∩ Ac2 ∩ A3 ] + P [Ac1 ∩ A2 ∩ A3 ]


8 7 12 8 12 7 12 8 7
= · · + · · + · ·
20 19 18 20 19 18 20 19 18
672 672 672 2016
= + + =
6840 6840 6840 6840
28
=
95
147

25) Uma urna contém seis cartões numerados de 1 a 6. Esther retira dois cartões ao acaso dessa urna.
Determine a probabilidade de que a soma dos números dos dois cartões seja par, sabendo que um
dos cartões está numerado com o número 4.

Determinemos primeiramente o espaço amostral, para isso consideremos a tabela auxiliar que se
segue.

H C2
HH
1 2 3 4 5 6
C1 HHH
1 −−− (1, 2) (1, 3) (1, 4) (1, 5) (1, 6)
2 (2, 1) −−− (2, 3) (2, 4) (2, 5) (2, 6)
3 (3, 1) (3, 2) −−− (3, 4) (3, 5) (3, 6)
4 (4, 1) (4, 2) (4, 3) −−− (4, 5) (4, 6)
5 (5, 1) (5, 2) (5, 3) (5, 4) −−− (5, 6)
6 (6, 1) (6, 2) (6, 3) (6, 4) (6, 5) −−−

Note que Ω = {(1, 2), (1, 3), · · · , (6, 5)} constituído de n = 30 pontos amostrais.

Sejam A : “a soma dos números mostrados é par” e B : “um dos cartões está numerado com o número
4”. Queremos determinar P [A | B].

Como

A = {(1, 3), (1, 5), (2, 4), (2, 6), (3, 1), (3, 5), (4, 2), (4, 6), (5, 1), (5, 3), (6, 2), (6, 4)}

B = {(1, 4), (2, 4), (3, 4), (5, 4), (6, 4), (4, 1), (4, 2), (4, 3), (4, 5), (4, 6)}

e
A ∩ B = {(2, 4), (4, 2), (4, 6), (6, 4)} ,

temos que n (A) = 12, n (B) = 10 e n (A ∩ B) = 4, donde

n(A ∩ B) 4
P [A ∩ B] = = ,
n 30
n(B) 10
P [B] = = ,
n 30

dessa maneira

4
4 30 120 2
P [A | B] = 30
= · = = .
10
30
30 10 300 5
148

26) Comparando o resultado de dois experimentos, E1 : “lançar dois dados de seis faces não-viciados
e anotar a soma das faces superiores” e E2 : “lançar um dado não viciado de 12 faces e anotar a face
superior, em qual existe a maior probabilidade de um resultado igual a 4”.

Ao lançarmos dois dados não viciados, obtemos o seguinte espaço amostral

HH D2
H
1 2 3 4 5 6
D1 HHH
1 (1, 1) (1, 2) (1, 3) (1, 4) (1, 5) (1, 6)
2 (2, 1) (2, 2) (2, 3) (2, 4) (2, 5) (2, 6)
3 (3, 1) (3, 2) (3, 3) (3, 4) (3, 5) (3, 6)
4 (4, 1) (4, 2) (4, 3) (4, 4) (4, 5) (4, 6)
5 (5, 1) (5, 2) (5, 3) (5, 4) (5, 5) (5, 6)
6 (6, 1) (6, 2) (6, 3) (6, 4) (6, 5) (6, 6)

Note que Ω1 = {(1, 1), (1, 2), · · · , (6, 6)} constituído de n1 = 36 pontos amostrais.

As somas das faces são dadas na tabela abaixo


HH
E2
H 1 2 3 4 5 6
E1 HH
H
1 2 3 4 5 6 7
2 3 4 5 6 7 8
3 4 5 6 7 8 9
4 5 6 7 8 9 10
5 6 7 8 9 10 11
6 7 8 9 10 11 12

e note que se A : “soma das faces voltadas para cima é quatro”, então A = {(1, 3), (2, 2), (3, 1)} e
n(A) = 4, dessa forma
n(A) 4 1
P [A] = = = .
n1 36 9

No segundo experimento temos que Ω2 = {1, 2, · · · , 12} constituído de n2 = 12 pontos amostrais e


se B : “a face voltada para cima é quatro”, então B = {4} e n(B) = 1, dessa forma

n(B) 1
P [B] = = .
n2 12

Como 1
9
= 0, 1111 > 0, 0833 = 1
12
, a probabilidade de que a soma de dois dados de seis faces resulte
em quatro é maior que a probabilidade de que observe-se o número quatro ao lançarmos um dado
não viciado de 12 faces.
149

27) Francisca realizou uma pesquisa com 680 eleitores, de várias categorias econômicas, a respeito do
seu candidato de preferência. Parte dessa pesquisa revela que

• 102 dos eleitores são da classe A;

• 136 votarão no candidato B;

• 68 são da classe A e votarão no candidato B.

Francisca seleciona uma pessoa aleatoriamente. Determine a probabilidade de que essa pessoa não
ser da classe A e votar no candidato B.

Sejam

• A : “o eleitor é da classe A”;

• B : “o eleitor votará no candidato B”.

Queremos determinar P [Ac ∩ B]. Sabemos que

P [Ac ∩ B] = P [B] − P [A ∩ B] ,

além disso,

n(B) 136
P [B] = = = 0, 2
n 680
n (A ∩ B) 68
P [A ∩ B] = = = 0, 1
n 680

logo
P [Ac ∩ B] = 0, 2 − 0, 1 = 0, 1.

A 0, 1 0, 1 B
150

28) Em um estudo das necessidades futuras do bairro em que pretende residir, Joana determina dois
eventos fundamentais: A : “haverá investimento público suficiente para evitar enchentes” e B :
“haverá investimento suficiente para a conservação das vias públicas”. Ela estima que P [A ∩ B c ] =
0, 17; P [Ac ∩ B] = 0, 23; P [Ac ∩ B c ] = 0, 07. Determine a probabilidade de “haver investimento
público suficiente para evitar enchentes e também haver investimento suficiente para a conservação
das vias públicas”.

Queremos determinar P [A ∩ B].

1 = P [Ω] = P [A ∩ B] + P [Ac ∩ B] + P [A ∩ B c ] + P [Ac ∩ B c ]

= P [A ∩ B] + 0, 23 + 0, 17 + 0, 07

= P [A ∩ B] + 0, 47,

logo
P [A ∩ B] = 1 − 0, 47 = 0, 53.

A 0, 17 0, 53 0, 23 B

0, 07
151

29) Dentre os 120 alunos que participam da Semana Acadêmica do curso de Ciências Sociais, 40 alunos
presentes se interessam pelo tema “Políticas Públicas e Educação”. Martha seleciona ao acaso três
alunos um após o outro, sem reposição, para participarem de uma ONG que se dedica a melhorar a
educação no país. Determine a probabilidade de o primeiro e o segundo alunos, selecionados, serem
interessados pelo tema “Políticas Públicas e Educação”, e o terceiro aluno não ser interessado nesse
tema.

Considere os eventos

• A1 : “o primeiro aluno se interessa pelo tema Políticas Públicas e Educação”;

• A2 : “o segundo aluno se interessa pelo tema Políticas Públicas e Educação”;

• A3 : “o terceiro aluno se interessa pelo tema Políticas Públicas e Educação”;

• A : “o primeiro e o segundo alunos, selecionados, serem interessados pelo tema “Políticas Pú-
blicas e Educação”, e o terceiro aluno não ser interessado nesse tema”;

então
38
118
A3
39
119
A2 80
Ac3
118
A1 39
118
A3
40
120 80
119 Ac2 79
Ac3
118

39
118
80
40
119
A2 A3
120
79
Ac1 118 Ac3
40
79 118
119 Ac2 A3
78
118 Ac3
e
A = A1 ∩ A2 ∩ Ac3

então

P [A] = P [A1 ∩ A2 ∩ Ac3 ]


40 39 80 124800
= · · =
120 119 118 1685040
520
=
7021
152

30) Márcio realizou uma pesquisa sobre os fatores considerados necessários para se ter qualidade de
vida, com 500 indivíduos [metade com mais de 60 anos e metade com idade de 25 a 60 anos]. Ele
encontrou:

• Dentre os indivíduos com mais de 60 anos: 100 consideram a saúde e 150 consideram a atividade
física como o fator necessário para se ter qualidade de vida.

• Dentre os indivíduos com idade de 25 a 60 anos: 50 consideram a saúde e 200 consideram a


atividade física como o fator necessário para se ter qualidade de vida.

Márcio seleciona um desses indivíduos aleatoriamente. Determine a probabilidade de que esse indi-
víduo tenha considerado saúde como fator necessário para se ter qualidade de vida.

Sejam A:“o indivíduo tem mais de 60 anos” e, B:“o indivíduo considera saúde como o fator necessário
para se ter qualidade de vida”. Queremos determinar P [B], assim

P [A] = 250
500
= 0, 5, P [Ac ] = 1 − P [A] = 1 − 250
500
= 0, 5,

P [B | A] = 100
250
= 0, 4, P [B c | A] = 1 − P [B | A] = 0, 6,

P [B | Ac ] = 50
250
= 0, 2, P [B c | Ac ] = 1 − P [B | Ac ] = 0, 8.

B
0,4

0,6
0,5
P [B] = P [B|A] P [A] + P [B|A ] P [A ] c c
Bc
= 0, 4 · 0, 5 + 0, 2 · 0, 5

= 0, 3

0,5
B
0,2

Ac

0,8
Bc
153

31) Luana tem dois fisioterapeutas empregados no Studio Pilates. Os atendimentos são divididos
da seguinte maneira: o fisioterapeuta A atende 20% dos pacientes, o fisioterapeuta B atende 30%,
enquanto ela atende os demais (50%) pacientes. A metade dos pacientes do fisioterapeuta A é de
convênios de saúde; um terço dos pacientes do fisioterapeuta B é de convênios de saúde; e também
a metade dos pacientes da Luana é de convênios de saúde. Um paciente é selecionado ao acaso.
Determine a probabilidade de ele ser de convênios de saúde.

Sejam

• A : “o fisioterapeuta A atende os pacientes”;

• B : “o fisioterapeuta B atende os pacientes”;

• C : “Lilian atende os pacientes”;

• D : “o paciente é de convênios de saúde”.


Dc
Temos que 0,5

A
0,5
P [A] = 0, 2, P [D|A] = 0, 5, 0,2
D

0,6667 Dc

P [B] = 0, 3, P [D|B] = 1
= 0, 3333, • 0,3
B
3
0,3333
D
0,5
P [C] = 0, 5, P [D|C] = 0, 5. 0,5 Dc
C
0,5
D
Queremos determinar P [D],

P [D] = P [D|A] P [A] + P [D|B] P [B] + P [D|C] P [C]

= 0, 5 × 0, 2 + 0, 3333 × 0, 3 + 0, 5 × 0, 5

= 0, 1 + 0, 1 + 0, 25

= 0, 45.

Dessa forma, a probabilidade de que o paciente seja de convênios da saúde é 0,45.


154

32) Uma pesquisa realizada junto a 450 médicos veterinários mostrou que: 220 desses profissionais
gostam de tomar decisões financeiras, 190 estão dispostos a assumir riscos sérios, e 110 gostam
de tomar decisões financeiras e estão dispostos a assumir riscos sérios. Um médico veterinário é
selecionado ao acaso. Determine a probabilidade de ele estar disposto a assumir riscos, sabendo que
ele gosta de tomar decisões financeiras.

Sejam

• A : “o médico veterinário gosta de tomar decisões financeiras”;

• B : “o médico veterinário está disposto a assumir riscos sérios”.

Queremos determinar P [B | A]. Temos que


n = 450, n (A) = 220, n (B) = 190,

n (A ∩ B) = 110, P [A] = 220


450
= 0, 4889, P [B] = 190
450
= 0, 4222,

P [A ∩ B] = n(A∩B)
n
= 110
450
= 0, 2444.
Note que

P [Ac ∩ B] = P [B] − P [A ∩ B] = 0, 4222 − 0, 2444 = 0, 1778

P [A ∩ B c ] = P [A] − P [A ∩ B] = 0, 4889 − 0, 2444 = 0, 2444

P [Ac ∩ B c ] = 1 − (P [A] + P [B] − P [A ∩ B]) = 1 − (0, 4889 + 0, 4222 − 0, 2444) = 1 − 0, 6667

= 0, 3333

A 0, 2444 0, 2444 0, 1778 B

0, 3333

P [A ∩ B] 0, 2444
P [B | A] = =
P [A] 0, 4889
= 0, 5.
155

33) Uma pesquisa realizada entre 100 consumidores registrou que:

• 20 deles trabalham somente com cartões de crédito da bandeira MasterCard;

• 30 deles trabalham somente com cartões de crédito da bandeira VISA;

• 40 deles trabalham com cartões de crédito de ambas as bandeiras.

Um consumidor é escolhido ao acaso desse grupo. Determine a probabilidade de esse consumidor


não trabalhar com cartões de crédito dessas duas bandeiras.

Sejam

• A : “o consumidor trabalha com cartões de crédito da bandeira MasterCard”;

• B : “o consumidor trabalha com cartões de crédito da bandeira VISA”.

Queremos determinar P [Ac ∩ B c ]. Temos que

n = 100, n (A ∩ B c ) = 20, n (Ac ∩ B) = 30, n (A ∩ B) = 40,

P [A ∩ B c ] = 20
100
= 0, 2, P [Ac ∩ B] = 30
100
= 0, 3, P [A ∩ B] = n(A∩B)
n
= 40
100
= 0, 4.

Como A = (A ∩ B) ∪ (A ∩ B c ) e B = (A ∩ B) ∪ (Ac ∩ B) temos que

n (A) = n (A ∩ B) + n (A ∩ B c ) = 40 + 20 = 60,

n (B) = n (A ∩ B) + n (Ac ∩ B) = 40 + 30 = 70,

logo P [A] = n(A)


n
= 60
100
= 0, 6 e P [B] = n(B)
n
= 70
100
= 0, 7. Assim

P [Ac ∩ B c ] = 1 − (P [A] + P [B] − P [A ∩ B]) = 1 − (0, 6 + 0, 7 − 0, 4) = 1 − 0, 9

= 0, 1

A 0, 2 0, 4 0, 3 B

0, 1
156

34) Em um dos hospitais da cidade de Vila Viçosa em Portugal, 10% dos pacientes são portadores
do vírus H1N1 [e os demais 90% não são portadoras do vírus]. Suponha que exista um teste para
detectar o vírus H1N1 com a seguinte propriedade: 75% das pessoas portadoras do vírus e 5% das
pessoas que não são portadoras do vírus reagem positivamente ao teste. Um paciente desse hospital
é escolhido aleatoriamente. Determine a probabilidade de esse paciente não seja portador do vírus
H1N1, sabendo que ele reagiu positivamente ao teste.

Sejam A:“o paciente é portador do vírus H1N1” e, B:“o teste detecta o vírus H1N1”. Queremos
determinar P [Ac |B], assim

P [A] = 0, 1, P [Ac ] = 1 − P [A] = 0, 9,

P [B | A] = 0, 75, P [B c | A] = 1 − P [B | A] = 0, 25,

P [B | Ac ] = 0, 05, P [B c | Ac ] = 1 − P [B | Ac ] = 0, 95.

B
0,75

P [Ac ∩ B] 0,1
0,25
P [Ac |B] = Bc
P [B]
P [B|Ac ] P [Ac ]
=
P [B|A] P [A] + P [B|Ac ] P [Ac ] •
0, 05 · 0, 9 0, 045
= =
0, 75 · 0, 1 + 0, 05 · 0, 9 0, 12 B
0,9
= 0, 375 0,05

Ac

0,95
Bc
157

35) Um quartel possui dois tipos de fuzis, os da classe I e os da classe II. Os fuzis da classe I são
modernos e possuem mira melhor, acertando o alvo em 91% das vezes em que se atira com ele. Os
fuzis da classe II são mais antigos e possuem mira pior, acertando o alvo em apenas 55% das vezes
em que se atira com ele. Entretanto, o fuzil II é bem mais barato e 75% dos fuzis do quartel são dessa
classe, enquanto que apenas 25% são da classe I. O soldado João pegou um fuzil, atirou e acertou o
alvo. Determine a probabilidade condicional de que ele tenha utilizado um fuzil da classe I.

Sejam A:“o fuzil é da classe I” e, B:“acerta-se o alvo”. Temos que

P [A] = 0, 25, P [Ac ] = 0, 75 P [B | A] = 0, 91


P [B c | A] = 0, 09, P [B | Ac ] = 0, 55 P [B c | Ac ] = 0, 45

B
0,91

P [A ∩ B] 0,25
0,09
P [A|B] = Bc
P [B]
P [B|A] P [A]
=
P [B|A] P [A] + P [B|Ac ] P [Ac ] •
0, 91 · 0, 25 0, 2275
= =
0, 91 · 0, 25 + 0, 55 · 0, 75 0, 64 B
0,75
= 0, 3555 0,55

Ac

0,45
Bc
158

36) Um piloto de Fórmula um (F1) tem 50% de probabilidade de vencer determinada corrida, quando
essa se realiza sob chuva. Caso não chova durante a corrida, sua probabilidade de vitória é de 25%.
Se o serviço de meteorologia estimar em 30% a probabilidade de que chova durante a corrida, qual
é a probabilidade de que esse piloto ganhe a corrida?

Sejam A:“a corrida é realizada sob chuva” e, B:“o piloto vence a corrida”. Queremos determinar
P [B] e temos que

P [A] = 0, 3, P [Ac ] = 0, 7 P [B | A] = 0, 5
P [B c | A] = 0, 5, P [B | Ac ] = 0, 25 P [B c | Ac ] = 0, 75

B
0,5

0,5
0,3
P [B] = P [B|A] P [A] + P [B|Ac ] P [Ac ] Bc
= 0, 5 · 0, 3 + 0, 25 · 0, 7

= 0, 325

0,7
B
0,25

Ac

0,75
Bc
159

37) Uma disciplina é constituída de duas turmas, sendo que 39% dos alunos são da turma 01 e os
restantes da turma 02. As turmas são constituídas de alunos de Medicina Veterinária, Geografia,
Ciências Sociais e Economia Doméstica, sendo assim distribuídas:

Turma 01 Turma 02
Ciências Sociais 14% 43%
Economia Doméstica 12% 22%
Geografia 23% 5%
Medicina Veterinária 51% 30%

a) Um aluno de Ciências Sociais é selecionado, determine a probabilidade de que ele seja da Turma
02.

b) Um aluno é selecionado aleatoriamente, determine a probabilidade de que ele curse Economia


Doméstica ou Ciências Sociais.

c) Um aluno da Medicina Veterinária é selecionado, determine a probabilidade de que ele seja da


Turma 01.

Sejam

• A : “o aluno é da turma 01”;

• C : “O aluno cursa Ciências Sociais”;

• E : “o aluno cursa Economia Doméstica”;

• G : “o aluno cursa Geografia”;

• M : “o aluno cursa Medicina Veterinária”.

Temos que

P [A] = 0, 39; P [C|A] = 0, 14; P [E|A] = 0, 12;

P [G|A] = 0, 23; P [M |A] = 0, 51; P [C|Ac ] = 0, 43;

P [E|Ac ] = 0, 22; P [G|Ac ] = 0, 05; P [M |Ac ] = 0, 3.

Essas probabilidades nos permitem montar o seguinte diagrama de árvores:


160

0,14 E
0,12
A 0,23 G
0,51
0,39 M


0,61 C
0,43
Ac 0,22 E
0,05
0,3 G

Em a) queremos determinar P [Ac |C].

P [Ac ∩ C] P [C|Ac ] P [Ac ]


P [A |C] =
c
=
P [C] P [C|A] P [A] + P [C|Ac ] P [Ac ]
0, 43 × 0, 61
=
0, 14 × 0, 39 + 0, 43 × 0, 61
0, 2623 0, 2623
= =
0, 0546 + 0, 2623 0, 3169
= 0, 8277

Em b) queremos determinar P [E ∪ C]. Sabemos que

P [E ∪ C] = P [E] + P [C] − P [E ∩ C] ,

e como E ∩ C = ∅, pois não há alunos cursando os dois cursos simultaneamente, temos

P [E ∪ C] = P [E] + P [C] , (1)

além disso,

P [E] = P [E ∩ A] + P [E ∩ Ac ] = P [E|A] P [A] + P [E|Ac ] P [E|Ac ]

= 0, 12 × 0, 39 + 0, 22 × 0, 61

= 0, 181 (2)
161

P [C] = P [C ∩ A] + P [C ∩ Ac ] = P [C|A] P [A] + P [C|Ac ] P [C|Ac ]

= 0, 14 × 0, 39 + 0, 43 × 0, 61

= 0, 3169 (3)

Substituindo (2) e (3) em (1), temos:

P [E ∪ C] = 0, 181 + 0, 3169 = 0, 4979.

Dessa maneira, a probabilidade de que ele curse economia doméstica ou ciências sociais é 0,4979.

Em c) queremos determinar P [A|M ].

P [A ∩ M ] P [M |A] P [A]
P [A|M ] = =
P [M ] P [M |A] P [A] + P [M |Ac ] P [Ac ]
0, 51 × 0, 39
=
0, 51 × 0, 39 + 0, 3 × 0, 61
0, 1989 0, 1989
= =
0, 1989 + 0, 183 0, 3819
= 0, 5208
162

38) Considere o experimento aleatório E: “lançar um dado não viciado uma vez e observar a face
superior” e os eventos:

A = “sair uma face par”; D = “não sair uma face superior a 2”;
B = “sair uma face maior que dois”; F = “sair uma face superior a 6”.
C = “sair uma face que é um número primo”;

Pode-se afirmar que:

a) P [F ] = 1; d) A e D são independentes;
4
b) A e D são mutuamente exclusivos; e) P [C] = ;
6
c) B e C são mutuamente exclusivos; f) n.d.r.a.

Temos que

Ω = {1, 2, 3, 4, 5, 6} e n (Ω) = B = {3, 4, 5, 6} e n (B) = 4; D = {1, 2} e n (D) = 2;


n = 6; F = {} = ∅ e n (F ) = 0;
A = {2, 4, 6} e n (A) = 3; C = {2, 3, 5} e n (C) = 3;

logo

P [A] = 36 ; P [C] = 36 ; P [F ] = 0
6
= 0.

P [B] = 64 ; P [D] = 62 ;

Desse modo

a) Falso. P [F ] = 0;

b) Verdadeiro. P [A ∩ D] = 1
6
= 3
6
· 2
6
= P [A] · P [D], logo A e D são independentes;

c) Falso. A ∩ D = {2} =
6 ∅, logo A e D não são mutuamente exclusivos;

d) Falso. B ∩ C = {3, 5} =
6 ∅, logo B e C não são mutuamente exclusivos;
3
e) Falso. P [C] = ;
6
f) Falso. d) é verdadeira.
163

39) Sejam A e B dois eventos em Ω. Marque V se a assertiva for verdadeira e F caso contrário e
justifique sua resposta.

a) Se A e B são independentes e P [A] > 0, então P [B | A] = P [B];

b) Se A e B são mutuamente exclusivos, então P [A ∩ B] = 0;

c) P [A ∩ B] ≤ P [A];

d) Se P [A] ≤ P [B] então A ⊂ B;

e) 0 ≤ P [A ∪ B] ≤ 1;

a) Verdadeiro. Essa é exatamente a definição de independência

b) Verdadeiro. Se A e B são mutuamente exclusivos, então A ∩ B = ∅, logo P [A ∩ B] = P [∅] = 0;

c) Verdadeiro. Pelo fato de que A ∩ B ⊂ A, temos que P [A ∩ B] ≤ P [A];

d) Falso. Considere o experimento aleatório E: “lançar um dado uma vez e observar a face superior”
e os eventos:

• A : “não sair uma face superior a 2”;

• B : “sair uma face par”.

Note que P [A] = 2


6
e P [B] = 36 . Assim P [A] ≤ P [B], mas {1, 2} = A 6⊂ B = {2, 4, 6} ;

e) Verdadeiro. Sabemos que a probabilidade de qualquer evento é sempre um número de zero a um,
assim 0 ≤ P [A ∪ B] ≤ 1.
164

40) Uma pesquisa ouviu 10000 habitantes de uma cidade e, verificou que 4087 aprovam as medidas
adotadas pelo vereador A e 3076 aprovam as medidas tomadas pelo vereador B, sendo que 1024 apro-
varam as medidas tomadas por ambos. Selecionado um habitante qualquer dessa cidade, determine:

a) Qual a probabilidade de que ele aprove as medidas tomadas apenas por um vereador? (somente
de A ou somente de B).

Sejam

• A : “o habitante aprova as medidas tomadas pelo vereador A”;

• B : “o habitante aprova as medidas tomadas pelo vereador B”.

Temos que
4087 3076 1024
P [A] = = 0, 4087, P [B] = = 0, 3076 e P [A ∩ B] = = 0, 1024.
10000 10000 10000

P [(A ∩ B c ) ∪ (Ac ∩ B)] = P [A ∩ B c ] + P [Ac ∩ B] − P [(A ∩ B c ) ∩ (Ac ∩ B)]

= P [A] − P [A ∩ B] + P [B] − P [A ∩ B] − 0

= P [A] + P [B] − 2P [A ∩ B]

= 0, 4087 + 0, 3076 − 2 · 0, 1024

= 0, 5115

ou pelo diagrama de Venn


A 0, 3063 0, 1024 0, 2052 B

0, 3861

P [(A ∩ B c ) ∪ (Ac ∩ B)] = 0, 3063 + 0, 2052 = 0, 5115

b) Qual a probabilidade de que ele não aprove as medidas tomadas por nenhum dos vereadores?
165

P [Ac ∩ B c ] = P [(A ∪ B)c ] = 1 − P [A ∪ B]

= 1 − (P [A] + P [B] − P [A ∩ B])

= 1 − (0, 4087 + 0, 3076 − 0, 1024)

= 1 − 0, 6139 = 0, 3861

ou

A B

0, 3063 0, 1024 0, 2052

0, 3861

Assim

P [Ac ∩ B c ] = 0, 3861
166

41) Os eventos a seguir representam os principais defeitos causadores de problemas em computadores:


A = {Aquecimento}, M = {Mau-contato em componentes eletrônicos} e V = {Vírus}. Em uma
empresa de manutenção foi verificado que esses defeitos aparecem com as seguintes probabilidades:
P [A] = 12%, P [M ] = 18% e P [V ] = 30%. Admita que esses eventos são mutuamente independentes
e determine a probabilidade de que um computador selecionado aleatoriamente apresente apenas os
defeitos M e V e não apresente o defeito A.

P [M ∩ V ∩ Ac ] = P [M ] P [V ] P [Ac ] = 0, 12 · 0, 18 · 0, 3 = 0, 0065.

Ou por diagrama de Venn

A M

0,0151
0,0689 0,1109

0,0065
0,0295 0,0475

0,2165

0,5051
V Ω

Assim
P [M ∩ V ∩ Ac ] = 0, 0475.
167

42) Uma pesquisa política social constatou que em certa localidade o percentual de eleitores que se
declaram independentes, liberais e conservadores é de 46%, 30% e 24%, respectivamente. Admita
que 35% dos eleitores independentes, 62% dos eleitores liberais e 58% dos eleitores conservadores
votaram na última eleição. Se um eleitor for escolhido aleatoriamente, dado que ele votou na última
eleição, qual a probabilidade condicional de que ele se declare liberal?

Sejam

• I: “eleitores que se declaram independentes”;

• L: “eleitores que se declaram liberais”;

• C: “eleitores que se declaram conservadores”;

• V : “eleitor votou na última eleição”.

Temos que

P [I] = 0, 46 P [L] = 0, 3 P [C] = 0, 24


P [V | I] = 0, 35 P [V | L] = 0, 62 P [V | C] = 0, 58

P [L ∩ V ] 0, 62 · 0, 3 0, 186
P [L | V ] = = =
P [V ] 0, 35 · 0, 46 + 0, 62 · 0, 3 + 0, 58 · 0, 24 0, 4862
= 0, 3826.

V
0,35

I
0,65
Vc
0,46

V
0,62

• 0,3
L
0,38
Vc
0,24
V
0,58

C
0,42
Vc
168

43) Sejam os eventos C = {o time do São Paulo é rebaixado para a série B do Campeonato Brasileiro}
e V = {o time do Vasco é novamente rebaixado para a série B do Campeonato Brasileiro}, tal que
P [C] = 0, 49 e P [V ] = 0, 67. Admita também que esses dois times podem ser rebaixados juntos
nesse mesmo ano, com probabilidade de 0,33. Determine a probabilidade de:

a) Pelo menos um desses dois times ser rebaixado.

Sejam

• C : “o time do São Paulo é rebaixado para a série B do Campeonato Brasileiro”;

• V : “o time do Vasco é novamente rebaixado para a série B do Campeonato Brasileiro”.

Temos que

P [C] = 0, 49, P [V ] = 0, 67 e P [C ∩ V ] = 0, 33.

P [C ∪ V ] = P [C] + P [V ] − P [C ∩ V ]

= 0, 49 + 0, 67 − 0, 33

= 0, 83,

ou pelo diagrama de Venn


C 0, 16 0, 33 0, 34 V

0, 17

P [C ∪ V ] = 0, 16 + 0, 33 + 0, 34

= 0, 83.

b) Exatamente um dos dois times ser rebaixado.


169

P [(C ∩ V c ) ∪ (C c ∩ V )] = P [C ∩ V c ] + P [C c ∩ V ] − P [(C ∩ V c ) ∩ (C c ∩ V )]

= P [C] − P [C ∩ V ] + P [V ] − P [C ∩ V ] − 0

= P [C] + P [V ] − 2P [C ∩ V ]

= 0, 49 + 0, 67 − 2 · 0, 33

= 0, 5

ou pelo diagrama de Venn


C 0, 16 0, 33 0, 34 V

0, 17

P [(C ∩ V c ) ∪ (C c ∩ V )] = 0, 16 + 0, 34 = 0, 5
170

44) Um veículo pode ter problemas mecânicos ou elétricos. Se ele tiver problemas mecânicos, não para,
mas se tiver problemas elétricos para imediatamente. A probabilidade de o veículo ter problemas
mecânicos é 0,2. A probabilidade do mesmo veículo ter problemas elétricos é de 0,15 se não houve
problema mecânico precedente, e de 0,25 se houve problema mecânico precedente. Nesse sentido,
dado que o veículo parou em certo dia, qual a probabilidade de que tenha ocorrido defeito mecânico?

a) 0,05 d) 0,29

b) 0,63 e) 0,72

c) 0,13 f) n.d.r.a.

Sejam A : “O carro tem problemas mecânicos” e B : “o carro tem problemas elétricos”. Temos que

P [A] = 0, 2 P [B |A ] = 0, 25 P [B|Ac ] = 0, 15
P [Ac ] = 0, 8 P [B c |A ] = 0, 75 P [B c |A c ] = 0, 85

conforme mostrado no diagrama de árvore:

B
0,25

0,75
0,2
Bc

0,8
B
0,15

Ac

0,85
Bc

0, 25 × 0, 2 0, 05
P [A |B ] = = = 0, 29.
0, 25 × 0, 2 + 0, 15 × 0, 8 0, 17

Dessa forma a resposta correta é a letra d).


171

45) Um baralho comum contém 52 cartas, das quais 4 são ases, sendo um de cada naipe. Se são
retiradas aleatoriamente três cartas desse baralho, qual a probabilidade de saírem exatamente dois
ases se:

a) as retiradas forem feitas com reposição.

Considere os eventos

• A1 : “a primeira carta retirada é um ás”;

• A2 : “a segunda carta retirada é um ás”;

• A3 : “a terceira carta retirada é um ás”;

• A : “saem exatamente dois ases”;

então
4
52
A3
4
52
A2 48
Ac3
52
A1 4
52
A3
4
52 48
52 Ac2 48
Ac3
52

4
52
48
4
52
A2 A3
52
48
Ac1 52 Ac3
4
48 52
52 Ac2 A3
48
52 Ac3
e

A = (A1 ∩ A2 ∩ Ac3 ) ∪ (A1 ∩ Ac2 ∩ A3 ) ∪ (Ac1 ∩ A2 ∩ A3 )

então

P [A] = P [A1 ∩ A2 ∩ Ac3 ] + P [A1 ∩ Ac2 ∩ A3 ] + P [Ac1 ∩ A2 ∩ A3 ]


4 4 48 4 48 4 48 4 4
= · · + · · + · ·
52 52 52 52 52 52 52 52 52
768 768 768 2304
= + + =
140608 140608 140608 140608
36
= = 0, 0164.
2197

b) as retiradas forem feitas sem reposição.


172

2
50
A3
3
51
A2 48
Ac3
50
A1 3
50
A3
4
52 48
51 Ac2 47
Ac3
50

3
50
48
4
51
A2 A3
52
47
Ac1 50 Ac3
4
47 50
51 Ac2 A3
46
50 Ac3
e

A = (A1 ∩ A2 ∩ Ac3 ) ∪ (A1 ∩ Ac2 ∩ A3 ) ∪ (Ac1 ∩ A2 ∩ A3 )

então

P [A] = P [A1 ∩ A2 ∩ Ac3 ] + P [A1 ∩ Ac2 ∩ A3 ] + P [Ac1 ∩ A2 ∩ A3 ]


4 3 48 4 48 3 48 4 3
= · · + · · + · ·
52 51 50 52 51 50 52 51 50
576 576 576 1728
= + + =
132600 132600 132600 132600
72
= = 0, 013.
5525
173

CAPÍTULO VII

Distribuições de probabilidade

1) Se 20% dos parafusos produzidos por uma máquina são defeituosos, determinar a probabilidade
de, entre 4 parafusos escolhidos ao acaso, no máximo 2 deles serem defeituosos.

Seja X: “número de parafusos defeituosos produzidos entre 4 amostrados”, note que X é binomial-
mente distribuída, sendo que, X ∼ Bin (4; 0, 2). Desejamos determinar P [X ≤ 2].

Observemos que
P [X ≤ 2] = P [X = 0] + P [X = 1] + P [X = 2] ,

4
!
P [X = 0] = 0, 20 (1 − 0, 2)4−0 = 1 × 1 × 0, 4096 = 0, 4096;
0
4
!
P [X = 1] = 0, 21 (1 − 0, 2)4−1 = 4 × 0, 2 × 0, 512 = 0, 4096;
1
4
!
P [X = 2] = 0, 22 (1 − 0, 2)4−2 = 6 × 0, 04 × 0, 64 = 0, 1536.
2

Dessa forma,

P [X ≤ 2] = P [X = 0] + P [X = 1] + P [X = 2]

= 0, 4096 + 0, 4096 + 0, 1536

= 0, 9728.
174

2) Um fabricante garante que uma caixa de suas peças conterá no máximo 2 itens defeituosos. Se a
caixa contém 20 peças e a experiência tem demonstrado que esse processo de fabricação produz 2
por cento de itens defeituosos, qual a probabilidade de que uma caixa de suas peças não vá satisfazer
a garantia?

As peças do fabricante não satisfarão a garantia se o número de peças defeituosas na caixa for
superior a 2. Seja X: “número de peças defeituosos na caixa que contém 20 peças”, note que X é
binomialmente distribuída, sendo que, X ∼ Bin (20; 0, 02). Desejamos determinar P [X > 2].

Observemos que

P [X > 2] = 1 − P [X ≤ 2] = 1 − (P [X = 0] + P [X = 1] + P [X = 2]) ,

20
!
P [X = 0] = 0, 020 (1 − 0, 02)20−0 = 1 × 1 × 0, 6676 = 0, 6676;
0
20
!
P [X = 1] = 0, 021 (1 − 0, 02)20−1 = 20 × 0, 02 × 0, 6812 = 0, 2725;
1
20
!
P [X = 2] = 0, 022 (1 − 0, 02)20−2 = 190 × 0, 0004 × 0, 6951 = 0, 0528.
2

Dessa forma,

P [X > 2] = 1 − (P [X = 0] + P [X = 1] + P [X = 2])

= 1 − (0, 6676 + 0, 2725 + 0, 0528)

= 1 − 0, 9929 = 0, 0071.
175

3) Numa indústria ocorrem, em média, 2 acidentes por mês.

a) Qual a probabilidade de ocorrerem 2 acidentes no próximo mês?


Seja X: “número de acidentes em 1 mês”, note que, X ∼ Poi (2), pois ocorrem em média λ = 2
acidentes por mês. Desejamos determinar P [X = 2].

e−2 22 0, 1353 × 4
P [X = 2] = =
2! 2
= 0, 2707.

b) Qual a probabilidade de ocorrerem 10 acidentes nos próximos 3 meses?


Sejam Y : “número de acidentes em 3 meses”. Sabemos que o número médio de acidentes que ocorre
por mês é 2, donde podemos determinar o número médio de acidentes que ocorrem em 3 meses
através de uma regra de três, assim,

Meses Acidentes
1 2

3 λ

assim λ1 = 3×2
1
= 6 e Y ∼ Poi (6).

e−6 610 0, 0025 × 60466176


P [Y = 10] = =
10! 3628800
= 0, 0413.
176

4) Determine a probabilidade de que, em 5 lançamentos de um dado honesto, apareça a face três:

a) Duas vezes;
Seja X: “número de vezes que aparece a face três em 5 lançamentos”, note que X é binomialmente
 
distribuída, sendo que, X ∼ Bin 5; 61 , pois p = 1
6
= 0, 1667. Desejamos determinar P [X = 2].

5
!
P [X = 2] = 0, 16672 (1 − 0, 1667)5−2 = 10 × 0, 0278 × 0, 5787 = 0, 1608.
2

b) No máximo uma vez;

P [X ≤ 1] = P [X = 0] + P [X = 1] ,

5
!
P [X = 0] = 0, 16670 (1 − 0, 1667)5−0 = 1 × 1 × 0, 4019 = 0, 4019;
0
5
!
P [X = 1] = 0, 16671 (1 − 0, 1667)5−1 = 5 × 0, 1667 × 0, 4823 = 0, 4019.
1

Dessa forma,

P [X ≤ 1] = P [X = 0] + P [X = 1]

= 0, 4019 + 0, 4019

= 0, 8038.

c) Ao menos duas vezes.

P [X ≥ 2] = 1 − P [X < 2] = 1 − (P [X = 0] + P [X = 1]) ,

Utilizando os resultados anteriormente obtidos teremos:

P [X ≥ 2] = 1 − (P [X = 0] + P [X = 1])

= 1 − (0, 4019 + 0, 4019)

= 1 − 0, 8038 = 0, 1962.
177

5) Considere a amostragem de 3 peças que saem de uma linha de produção. Sabe-se que são produzidas
20% de peças defeituosas. Determine

a) a probabilidade de se amostrar exatamente 2 peças defeituosas;

b) a probabilidade de se amostrar exatamente 2 peças não defeituosas;

c) Quantas peças defeituosas espera-se amostrar?

Seja X: “número de peças defeituosas em 3 produzidas”, note que X é binomialmente distribuída,


sendo que, X ∼ Bin (3; 0, 2), pois p = 0, 2.

Em a) temos que determinar P [X = 2].

3
!
P [X = 2] = 0, 22 (1 − 0, 2)3−2 = 3 × 0, 04 × 0, 8 = 0, 096.
2

Em b) temos que determinar P [X = 1], pois se temos 2 peças defeituosas em 3 amostradas, então 1
peça é defeituosa.

3
!
P [X = 1] = 0, 21 (1 − 0, 2)3−1 = 3 × 0, 2 × 0, 64 = 0, 384.
1

Em c) devemos determinar o número esperado de peças defeituosas. Sabemos que se X ∼ Bin (n; p)
então E [X] = np, dessa forma, o número esperado de peças defeituosas em 3 peças amostradas é

E [X] = np = 3 · 0, 2 = 0, 6.
178

6) Sabe-se que 24% dos indivíduos que recebem o medicamento X sofrem certos efeitos colaterais. Se
o medicamento X for ministrado a quatro pacientes, qual a probabilidade de que:

a) Nenhum sofra efeitos colaterais; c) Exatamente três não sofram efeitos colaterais.
b) Pelo menos um sofra efeitos colaterais;

Seja X: “número de indivíduos que sofrem efeitos colaterais em 4 amostrados”, note que X é bino-
mialmente distribuída, sendo que, X ∼ Bin (4; 0, 24), pois p = 0, 24.

Em a) temos que determinar P [X = 0].

4
!
P [X = 0] = 0, 240 (1 − 0, 24)4−0 = 1 × 1 × 0, 3336 = 0, 3336.
0

Em b) temos que determinar P [X ≥ 1].

P [X ≥ 1] = 1 − P [X < 1] = 1 − P [X = 0] ,

Utilizando o resultado obtido em a) teremos:

P [X ≥ 1] = 1 − P [X = 0]

= 1 − 0, 3336

= 0, 6664.

Em c) temos que determinar a probabilidade de que três não sofram efeitos colaterais. Entretanto,
como nossa variável aleatória só conta o número de indivíduos que sofrem efeitos colaterais, e se temos
3 indivíduos que não sofram efeitos colaterais em 4 amostrados, então 1 sofrerá efeitos colaterais.

4
!
P [X = 1] = 0, 241 (1 − 0, 24)4−1 = 4 × 0, 24 × 0, 439 = 0, 4214.
1
179

7) Se amostrarmos 500 casais (marido e esposa) com quatro filhos cada um, quantos casais nós
esperamos que tenham:

a) Pelo menos um filho homem; b) Exatamente 2 filhos homens.

Para a resolução de a), utilizaremos duas variáveis aleatórias: X, a qual contará o número de filhos
do sexo masculino e, Y a qual contará o número de famílias com pelo menos um filho homem.

Seja X: “número de homens em uma família com 4 filhos”, note que X é binomialmente distribuída,
sendo que, X ∼ Bin (4; 0, 5), pois p = 0, 5.

P [X ≥ 1] = 1 − P [X < 1] = 1 − P [X = 0] ,

4
!
P [X = 0] = 0, 50 (1 − 0, 5)4−0 = 1 × 1 × 0, 0625 = 0, 0625.
0

Dessa forma,

P [X ≥ 1] = 1 − P [X = 0] = 1 − 0, 0625

= 0, 9375.

Seja Y : “número de famílias com pelo menos um filho em 500 amostradas”, note que Y é binomial-
mente distribuída, sendo que, Y ∼ Bin (500; 0, 9375).

Sabemos que se Y ∼ Bin (nY ; pY ) então E [Y ] = nY pY , dessa forma, o número esperado de famílias
com pelo menos um homem em 500 famílias amostradas é

E [Y ] = nY pY = 500 · 0, 9375 = 468, 75 ≈ 469.

Em b), precisamos primeiramente determinar P [X = 2].

4
!
P [X = 2] = 0, 52 (1 − 0, 5)4−2 = 6 × 0, 25 × 0, 25 = 0, 375.
2

Seja T : “número de famílias com dois filhos em 500 amostradas”, note que T é binomialmente
distribuída, sendo que, T ∼ Bin (500; 0, 375).

Sabemos que se T ∼ Bin (nT ; pT ) então E [T ] = nT pT , dessa forma, o número esperado de famílias
com exatamente dois homens em 500 famílias amostradas é

E [T ] = nT pT = 500 · 0, 375 = 187, 5 ≈ 188.


180

8) Numa prova com 10 questões de múltipla escolha, cada uma com 5 alternativas e somente uma
correta. Um aluno não estudou e assinala todas as questões inteiramente ao acaso, pede-se:

a) Quantas questões acerta, em média, esse aluno?

b) Qual a probabilidade de que ele acerte exatamente 5 questões?

Seja X: “número de questõs marcadas corretamente em 10 marcadas aleatoriamente”, note que X é


 
binomialmente distribuída, sendo que, X ∼ Bin 10; 15 , pois p = 1
5
= 0, 2.

Em a) desejamos determinar o número esperado de questões marcadas corretamente. Sabemos que se


X ∼ Bin (n; p) então E [X] = np, dessa forma, o número esperado de questões marcadas corretamente
em 10 marcadas é
E [X] = np = 10 · 0, 2 = 2.

Em b) desejamos determinar P [X = 5]

10
!
P [X = 5] = 0, 25 (1 − 0, 2)10−5 = 252 × 0, 0003 × 0, 3277 = 0, 0264.
5
181

9) Suponha que a probabilidade de pais terem filhos com distúrbio de atenção seja 0,25. Se selecio-
narmos 6 crianças ao acaso, pede-se:

a) Qual é a probabilidade de que no máximo 2 tenham distúrbio de atenção?


b) Qual é a probabilidade de que pelo menos 3 tenham distúrbio de atenção?
c) Qual o número esperado de crianças com distúrbio de atenção? E a variância?

Seja X: “número de filhos com distúrbio de atenção em 6 selecionados”, note que X é binomialmente
distribuída, sendo que, X ∼ Bin (6; 0, 25).

Em a) queremos determinar

P [X ≤ 2] = P [X = 0] + P [X = 1] + P [X = 2] .

6
!
P [X = 0] = 0, 250 (1 − 0, 25)6−0 = 1 × 1 × 0, 178 = 0, 178;
0
6
!
P [X = 1] = 0, 251 (1 − 0, 25)6−1 = 6 × 0, 25 × 0, 2373 = 0, 356;
1
6
!
P [X = 2] = 0, 252 (1 − 0, 25)6−2 = 15 × 0, 0625 × 0, 3164 = 0, 2966;
2
P [X ≤ 2] = P [X = 0] + P [X = 1] + P [X = 2] = 0, 178 + 0, 356 + 0, 2966

= 0, 8306.

Em b) devemos determinar

P [X ≥ 3] = 1 − P [X < 3] = 1 − (P [X = 0] + P [X = 1] + P [X = 2]) .

Utilizando os resultados obtidos em a) temos

P [X ≥ 3] = 1 − (P [X = 0] + P [X = 1] + P [X = 2])

= 1 − (0, 178 + 0, 356 + 0, 2966)

= 1 − 0, 8306 = 0, 1694

Em c) devemos determinar o valor esperado e a variância do número de filhos com distúrbio de


atenção. Sabemos que se X ∼ Bin (n; p) então E [X] = np e var [X] = npq, dessa forma,

E [X] = np = 6 · 0, 25 = 1, 5,

var [X] = npq = 6 · 0, 25 · (1 − 0, 25) = 1, 125.


182

10) Suponha que a renda familiar em uma comunidade, seja uma distribuição normal com média igual
a R$ 15000 e desvio padrão igual a R$ 2500. Numa amostra de 5 famílias, qual a probabilidade de
que a soma das rendas seja inferior a R$ 60000?

Sejam X : “renda familiar de uma família” e Y : “renda familiar das 5 famílias”. Queremos determinar
P [Y < 60000].

Temos que Xi ∼ N (15000; 6250000). Seja Y = X1 + X2 + · · · + X5 a variável que mede a renda


familiar das 5 famílias e, pelo teorema da combinação linear, sabemos que Y ∼ N (75000; 31250000),
pois
µY = |1 × 15000 + 1 × 15000
{z
+ · · · + 1 × 15000} = 5 × 15000 = 75000
5 vezes

e,
σY2 = |1 × 6250000 + 1 × 6250000
{z
+ · · · + 1 × 6250000} = 5 × 6250000 = 31250000.
5 vezes

60000 µY y

Y − 75000 60000 − 75000


" #
P [Y < 60000] = P [Y − 75000 < 60000 − 75000] = P √ < √
156250000 156250000
60000 − 75000 −15000
   
= P Z< =P Z< = P [Z < −1, 2]
12500 12500
= P [Z > 1, 2] = 0, 5 − P [0 ≤ Z ≤ 1, 2]

= 0, 5 − 0, 3849

= 0, 1151.

Dessa maneira, a probabilidade de que a renda familiar das 5 famílias seja menor que R$ 60000 é
0,1151.
183

11) Suponha que o tempo de estudo de adultos de certo país apresente distribuição normal com média
de 11 anos e desvio padrão de 2 anos. Determine:

a) a probabilidade de que um adulto, escolhido aleatoriamente, tenha entre 9 e 14 anos de tempo de


estudo;
b) a probabilidade de que um adulto tenha mais de 15 anos de tempo de estudo;
c) a probabilidade de que um adulto tenha mais de 8 anos de tempo de estudo.

Seja X : “tempo de estudo dos adultos”.

Em a) queremos determinar P [9 < X < 14];

9 11 14 x −1 0 1.5 z

9 − 11 X − 11 14 − 11
 
P [9 < X < 14] = P < <
2 2 2
= P [−1 < Z < 1, 5] = P [−1 < Z < 0] + P [0 ≤ Z < 1, 5]

= P [0 < Z < 1] + P [0 ≤ Z < 1, 5]

= 0, 3413 + 0, 4332

= 0, 7745.

Dessa maneira, a probabilidade de que o tempo de estudo dos adultos esteja entre 9 e 14 anos é
0,7745.

Em b) queremos determinar P [X > 15];

X − 11 15 − 11
 
P [X > 15] = P [X − 11 > 15 − 11] = P >
2 2
15 − 11 4
   
= P Z> =P Z> = P [Z > 2]
2 2
= 0, 5 − P [0 ≤ Z ≤ 2] = 0, 5 − 0, 4772

= 0, 0228.
184

11 15 x 0 2 z

Dessa maneira, a probabilidade de que o tempo de estudo dos adultos seja maior que 15 anos é
0,0228.

Em c) queremos determinar P [X > 8];

8 11 x −1.5 0 z

X − 11 8 − 11 3
" #  
P [X > 8] = P √ > √ =P Z>−
4 4 2
= P [Z > −1, 5] = P [−1, 5 < Z < 0] + P [Z ≥ 0]

= P [0 < Z < 1, 5] + 0, 5

= 0, 4332 + 0, 5

= 0, 9332.

Dessa maneira, a probabilidade de que o tempo de estudo dos adultos seja maior que 8 anos é 0,9332.
185

12) O tempo que os alunos gastam para fazer uma prova é normalmente distribuído com média de 72
minutos e desvio padrão de 5 minutos. Determine a probabilidade de um aluno gastar:

a) exatamente 72 minutos; d) entre 62 e 83 minutos;


b) mais de 84 minutos; e) entre 60 e 67 minutos.
c) mais de 66 minutos;

Seja X : “tempo gasto na resolução da prova”.

Em a) queremos determinar P [X = 72]. Note que a variável aleatória X é contínua e, assim sendo,
qualquer ponto tem probabilidade zero de acontecer, assim P [X = 72] = 0.

Em b) queremos determinar P [X > 84];

72 84 x 0 2.4 z

X − 72 84 − 72
 
P [X > 84] = P [X − 72 > 84 − 72] = P >
5 5
84 − 72 12
  
= P Z> =P Z> = P [Z > 2, 4]
5 5
= 0, 5 − P [0 ≤ Z ≤ 2, 4] = 0, 5 − 0, 4918

= 0, 0082.

Dessa maneira, a probabilidade de que o tempo gasto na resolução da prova seja maior que 84 minutos
é 0,0082.

Em c) queremos determinar P [X > 66];


186

66 72 x −1.2 0 z

X − 72 66 − 72 6
" #  
P [X > 66] = P √ > √ =P Z>−
25 25 5
= P [Z > −1, 2] = P [−1, 2 < Z < 0] + P [Z ≥ 0]

= P [0 < Z < 1, 2] + 0, 5

= 0, 3849 + 0, 5

= 0, 8849.

Dessa maneira, a probabilidade de que o tempo gasto na resolução da prova seja maior que 66 minutos
é 0,8849.

Em d) queremos determinar P [62 < X < 83];

62 72 83 x −2 0 2.2 z
187

62 − 72 X − 72 83 − 72
 
P [62 < X < 83] = P < <
5 5 5
= P [−2 < Z < 2, 2] = P [−2 < Z < 0] + P [0 ≤ Z < 2, 2]

= P [0 < Z < 2] + P [0 ≤ Z < 2, 2]

= 0, 4772 + 0, 4861

= 0, 9633.

Dessa maneira, a probabilidade de que o tempo gasto na resolução da prova esteja entre 62 e 83 anos
é 0,9633.

Em e) queremos determinar P [60 < X < 67];

60 67 72 x −2.4 −1 0 z

60 − 72 X − 72 67 − 72
 
P [60 < X < 67] = P < <
5 5 5
= P [−2, 4 < Z < −1] = P [1 < Z < 2, 4]

= P [0 < Z < 2, 4] − P [0 ≤ Z < 1]

= 0, 4918 − 0, 3413

= 0, 1505.

Dessa maneira, a probabilidade de que o tempo gasto na resolução da prova esteja entre 60 e 67
minutos é 0,1505.
188

13) O conteúdo líquido das garrafas de um refrigerante é normalmente distribuído com média de
300 ml e desvio padrão de 2 ml.

a) Determine o percentual de garrafas cujo conteúdo é inferior a 302 ml.

b) Se 5 garrafas forem amostradas, qual a probabilidade de que o conteúdo médio das 5 garrafas seja
inferior a 302 ml?

Seja X : “conteúdo líquido das garrafas de refrigerante”, então Xi ∼ N (300; 4). Em a) queremos
determinar P [X < 302].

300 302 x 0 1 z

X − 300 302 − 300


" #
P [X < 302] = P [X − 300 < 302 − 300] = P √ < √
4 4
302 − 300 2
   
= P Z< =P Z< = P [Z < 1]
2 2
= P [Z ≤ 0] + P [0 < Z < 1] = 0, 5 + P [0 < Z < 1]

= 0, 5 + 0, 3413

= 0, 8413.

Dessa maneira, o percentual de garrafas para as quais o conteúdo líquido das garrafas de refrigerante
é inferior a 302 ml é 0,8413.

Seja Y : “conteúdo líquido médio das 5 garrafas de refrigerante”. Em b) queremos determinar


P [Y < 302].

Seja Y = X1 + X2 + · · · + X5 a variável que mede a conteúdo líquido médio das 5 garrafas de


refrigerante e, pelo teorema da combinação linear, sabemos que Y ∼ N (1500; 20), pois

X 1 + · · · + X5 1
 
µY = E = (E [X1 ] + · · · + E [X5 ])

5 5 
1 5 × 300
= 300 + 300 {z + · · · + 300} = = 300
5 | 5
5 vezes
189

e,

X1 + · · · + X 5 1
 
σY2 = var = 2 (var [X1 ] + · · · + var [X5 ])

5 
5
1  1
= 4| + 4 +{z· · · + 4} = × 20 = 0, 8.
25 25
5 vezes

300 302 y 0 2.24 z

Y − 300 302 − 300


" #
P [Y < 302] = P [Y − 300 < 302 − 300] = P √ < √
0, 8 0, 8
302 − 300 2
" # " #
= P Z< =P Z< = P [Z < 2, 24]
0, 8944 0, 8944
= 0, 5 + P [0 ≤ Z ≤ 2, 24]

= 0, 5 + 0, 4875

= 0, 9875.

Dessa maneira, o percentual de garrafas para as quais o conteúdo líquido médio das 5 garrafas de
refrigerante é inferior a 302 ml é 0,9875.
190

14) Numa indústria, ocorrem em média 3 acidentes de trabalho por mês.

a) Encontre a probabilidade de que ocorram pelo menos 2 acidentes de trabalho, em um período de


um mês.

b) Encontre a probabilidade de que ocorra no máximo 1 acidente de trabalho, em um período de dois


meses.

Seja X: “número de acidentes de trabalho em 1 mês”, note que, X ∼ Poi (3), pois ocorrem em média
λ = 3 acidentes por mês. Em a) desejamos determinar P [X ≥ 2]. Sabemos que

P [X ≥ 2] = 1 − P [X < 2] = 1 − (P [X = 0 + P [X = 1]])

e−3 30 0, 0498 × 1
P [X = 0] = = = 0, 0498
0! 1
e−3 31 0, 0498 × 3
P [X = 1] = = = 0, 1494,
1! 1

logo

P [X ≥ 2] = 1 − (0, 0498 + 0, 0498)

= 1 − 0, 1992

= 0, 8008

Em b) seja Y : “número de acidentes de trabalho em 2 meses”. Sabemos que o número médio de


acidentes que ocorre por mês é 3, donde podemos determinar o número médio de acidentes que
ocorrem em 2 meses através de uma regra de três, assim,

Meses Acidentes
1 3

2 λ

Desejamos determinar P [Y ≤ 1]. Sabemos que

P [Y ≤ 1] = P [Y = 0] + P [Y = 1]
191

e−6 60 0, 0025 × 1
P [Y = 0] = = = 0, 0025
0! 1
e−6 61 0, 0025 × 6
P [Y = 1] = = = 0, 0149
1! 1

assim

P [Y ≤ 1] = 0, 0025 + 0, 0149 = 0, 0174.


192

15) A massa de estudantes é normalmente distribuído com média de 65,3 kg e desvio padrão de 5,5 kg.
Determine a probabilidade de que a massa de um estudante seja:

a) 54,3 kg; c) mais de 57,2 kg;

b) entre 60 e 70 kg; d) menos de 71 kg.

Seja X : “massa de um estudante”.

Em a) queremos determinar P [X = 54, 3]. Note que a variável aleatória X é contínua e, assim sendo,
qualquer ponto tem probabilidade zero de acontecer, assim P [X = 54, 3] = 0.

Em b) queremos determinar P [60 < X < 70];

60 65.3 70 x −0.96 0 0.85 z

60 − 65, 3 X − 65, 3 70 − 65, 3


" #
P [60 < X < 70] = P < <
5, 5 5, 5 5, 5
= P [−0, 96 < Z < 0, 85] = P [−0, 96 < Z < 0] + P [0 ≤ Z < 0, 85]

= P [0 < Z < 0, 96] + P [0 ≤ Z < 0, 85]

= 0, 3315 + 0, 3023

= 0, 6338.

Dessa maneira, a probabilidade de que o massa de um estudante esteja entre 60 e 70 kg é 0,6338.

Em c) queremos determinar P [X > 57, 2];

X − 65, 3 57, 2 − 65, 3 8, 1


" # " #
P [X > 57, 2] = P √ > √ =P Z>−
30, 25 30, 25 5, 5
= P [Z > −1, 47] = P [−1, 47 < Z < 0] + P [Z ≥ 0]

= P [0 < Z < 1, 47] + 0, 5 = 0, 4292 + 0, 5

= 0, 9292.
193

57.2 65.3 x −1.47 0 z

Dessa maneira, a probabilidade de que o massa de um estudante seja maior que 57,2 kg é 0,9292.

Em d) queremos determinar P [X ≤ 71].

65.3 71 x 0 1.04 z

X − 65, 3 71 − 65, 3
" #
P [X ≤ 71] = P [X − 65, 3 ≤ 71 − 65, 3] = P √ ≤ √
30, 25 30, 25
71 − 65, 3 5, 7
" # " #
= P Z≤ =P Z≤ = P [Z ≤ 1, 04]
5, 5 5, 5
= P [Z < 0] + P [0 ≤ Z ≤ 1, 04] = 0, 5 + P [0 ≤ Z ≤ 1, 04]

= 0, 5 + 0, 3508

= 0, 8508.

Dessa maneira, o percentual de massa de um estudante que é inferior a 71 pontos é 0,8508.


194

16) Suponha que as notas da disciplina de Estatística estejam normalmente distribuídas com média
5 pontos e variância 4 pontos2 . Pede-se:

a) Determine a probabilidade dos estudantes obterem no máximo 3,2 pontos de nota.

b) Determine a probabilidade dos estudantes obterem pelo menos 3 pontos de nota.

c) Determine a probabilidade dos estudantes obterem exatamente 6 pontos de nota.

d) Determine a probabilidade dos estudantes obterem notas entre 6 e 8 pontos de nota.

Seja X : “notas da disciplina de Estatística”.

Em a) queremos determinar P [X ≤ 3, 2].

3.2 5 x −0.9 0 z

X −5 3, 2 − 5
" #
P [X ≤ 3, 2] = P [X − 5 ≤ 3, 2 − 5] = P √ ≤ √
4 4
3, 2 − 5 −1, 8
   
= P Z≤ =P Z≤ = P [Z ≤ −0, 9]
2 2
= P [Z ≥ 0, 9] = 0, 5 − P [0 ≤ Z < 0, 9] = 0, 5 − 0, 3159

= 0, 1841.

Dessa maneira, o percentual de notas da disciplina de Estatística que é inferior a 3,2 pontos é 0,1841.

Em b) queremos determinar P [X > 3];

X −5 3−5 2
" #  
P [X > 3] = P √ > √ =P Z>−
4 4 2
= P [Z > −1] = P [−1 < Z < 0] + P [Z ≥ 0]

= P [0 < Z < 1] + 0, 5 = 0, 3413 + 0, 5

= 0, 8413.
195

3 5 x −1 0 z

Dessa maneira, a probabilidade de que o notas da disciplina de Estatística seja maior que 3 pontos
é 0,8413.

Em c) queremos determinar P [X = 6]. Note que a variável aleatória X é contínua e, assim sendo,
qualquer ponto tem probabilidade zero de acontecer, assim P [X = 6] = 0.

Em d) queremos determinar P [6 < X < 8];

5 6 8 x 0 0.5 1.5 z

6−5 X −5 8−5
 
P [6 < X < 8] = P < < = P [0, 5 < Z < 1, 5]
2 2 2
= P [0 ≤ Z < 1, 5] − P [0 < Z < 0, 5] = 0, 4332 − 0, 1915

= 0, 2417.

Dessa maneira, a probabilidade de que as notas da disciplina de Estatística esteja entre 6 e 8 pontos
é 0,2417.
196

17) As notas em um teste padronizado seguem distribuição normal com média igual a 100 pontos e
desvio padrão de 10 pontos. Determine a probabilidade de que um indivíduo submetido ao teste
tenha nota:

a) 100 pontos; d) entre 85 e 115 pontos;

b) maior que 120 pontos; e) inferior a 110 pontos;

c) maior que 80 pontos; f) maior que 100 pontos.

Seja X : “notas no teste padronizado”.

Em a) queremos determinar P [X = 100]. Note que a variável aleatória X é contínua e, assim sendo,
qualquer valor tem probabilidade zero de acontecer, assim P [X = 100] = 0.

Em b) queremos determinar P [X > 120].

100 120 x 0 2 z

X − 100 120 − 100


 
P [X > 120] = P [X − 100 > 120 − 100] = P >
10 10
120 − 100 20
   
= P Z> =P Z> = P [Z > 2]
10 10
= 0, 5 − P [0 ≤ Z ≤ 2] = 0, 5 − 0, 4772

= 0, 0228.

Dessa maneira, a probabilidade de que o notas no teste padronizado seja maior que 120 pontos é
0,0228.

Em c) queremos determinar P [X > 80];


197

80 100 x −2 0 z

X − 100 80 − 100 20
" #  
P [X > 80] = P √ > √ =P Z>−
100 100 10
= P [Z > −2] = P [−2 < Z < 0] + P [Z ≥ 0]

= P [0 < Z < 2] + 0, 5 = 0, 4772 + 0, 5

= 0, 9772.

Dessa maneira, a probabilidade de que o notas no teste padronizado seja maior que 80 pontos é
0,9772.

Em d) queremos determinar P [85 < X < 115];

85 100 115 x −1.5 0 1.5 z

85 − 100 X − 100 115 − 100


 
P [85 < X < 115] = P < <
10 10 10
= P [−1, 5 < Z < 1, 5] = P [−1, 5 < Z < 0] + P [0 ≤ Z < 1, 5]

= P [0 < Z < 1, 5] + P [0 ≤ Z < 1, 5] = 0, 4332 + 0, 4332

= 0, 8664.

Dessa maneira, a probabilidade de que o notas no teste padronizado esteja entre 85 e 115 pontos é
198

0,8664.

Em e) queremos determinar P [X < 120].

100 110 x 0 1 z

X − 100 110 − 100


" #
P [X < 110] = P [X − 100 < 110 − 100] = P √ < √
100 100
110 − 100 10
   
= P Z< =P Z< = P [Z < 1]
10 10
= P [Z ≤ 0] + P [0 < Z < 1] = 0, 5 + P [0 < Z < 1]

= 0, 5 + 0, 3413

= 0, 8413.

Dessa maneira, o percentual de notas no teste padronizado que é inferior a 110 pontos é 0,8413.

Em f) queremos determinar P [X > 100];

100 x 0 z

X − 100 100 − 100 0


" #  
P [X > 100] = P √ > √ =P Z>−
100 100 10
= P [Z > 0] = 0, 5.
199

Dessa maneira, a probabilidade de que o notas no teste padronizado seja maior que 100 pontos é 0,5.
200

18) Suponha que os diâmetros dos parafusos produzidos por uma fábrica sejam normalmente distri-
buídos com média de 0,25 polegadas e desvio padrão de 0,02 polegadas. Um parafuso é considerado
defeituoso se o seu diâmetro for menor que 0,2 polegadas ou maior que 0,28 polegadas. Encontre a
porcentagem de parafusos defeituosos produzidos pela fábrica.

Seja X: “notas no teste padronizado”. Queremos determinar P [X ≤ 0, 2] + P [X ≥ 0, 28];

0.2 0.25 0.28 x −2.5 0 1.5 z

X − 0, 25 0, 2 − 0, 25 X − 0, 25 0, 28 − 0, 25
" # " #
P [X ≤ 0, 2] + P [X ≥ 0, 28] = P ≤ +P ≥
0, 02 0, 02 0, 02 0, 02
−0, 05 0, 03
" # " #
= P Z≤ +P Z ≥
0, 02 0, 02
= P [Z ≤ −2, 5] + P [Z ≥ 1, 5] = P [Z ≥ 2, 5] + P [Z ≥ 1, 5]

= (0, 5 − P [0 ≤ Z < 2, 5]) + (0, 5 − P [0 ≤ Z < 1, 5])

= (0, 5 − 0, 4938) + (0, 5 − 0, 4332)

= 0, 0062 + 0, 0668

= 0, 073.

Dessa maneira, a probabilidade de que as notas no teste padronizado seja menor que 0,2 ou maior
que 0,28 pontos é 0,073.
201

19) Suponha que as notas de um exame são normalmente distribuídas com média 76 pontos e desvio
padrão de 15 pontos. Os estudantes que ficarem entre as 15% melhores notas, receberão conceito
A e os estudantes que ficarem entre as 10% piores notas, receberão conceito F . Determine a nota
mínima para um estudante:

a) receber conceito A; b) não receber conceito F .

Seja X: “notas no teste padronizado”. Devemos encontrar as notas xA e xF tais que P [X ≤ xF ] = 0, 1


e P [X ≥ xA ] = 0, 15.

0.15 0.15
0.1 0.1

xF 76 xA x zF 0 zA z

X − 76 xF − 76 xF − 76
" # " #
0, 1 = P [X ≤ xF ] = P √ ≤ √ =P Z≤ √
225 225 225
xF − 76 xF − 76
" # " #
= P Z≥− √ = 0, 5 − P 0 ≤ Z < − √
225 225

assim

xF − 76
" #
0, 5 − P 0 ≤ Z < − √ = 0, 1
225
xF − 76
" #
P 0≤Z<− √ = 0, 5 − 0, 1
225
xF − 76
" #
P 0≤Z<− √ = 0, 4
225
202

logo da tabela da distribuição normal temos que

xF − 76
− √ = 1, 28
225
xF − 76
√ = −1, 28
225

xF − 76 = −1, 28 · 225

xF = 76 − 19, 2

xF = 56, 8.

X − 76 xA − 76 xA − 76
" # " #
0, 15 = P [X ≥ xA ] = P √ ≥ √ =P Z≥ √
225 225 225
xA − 76
" #
= 0, 5 − P 0 ≤ Z < √
225

assim

xA − 76
" #
0, 5 − P 0 ≤ Z < √ = 0, 15
225
xA − 76
" #
P 0≤Z< √ = 0, 5 − 0, 15
225
xA − 76
" #
P 0≤Z< √ = 0, 35
225

logo da tabela da distribuição normal temos que

xA − 76
√ = 1, 04
225
xA − 76
√ = 1, 04
225

xA − 76 = 1, 04 · 225

xA = 76 + 15, 6

xA = 91, 6.
203

20) Uma fábrica de carros sabe que os motores por ela fabricadas tem duração normal com média de
150000 km e desvio padrão de 5000 km.

a) Qual a probabilidade de que um carro tenha motor que dure mais que 150000 km?

b) Qual a probabilidade de que um carro tenha motor que dure menos que 158000 km?

c) Qual a probabilidade de que um carro tenha motor que dure entre 140000 e 159000 km?

d) Se a fábrica substitui o motor que apresente duração inferior a garantia, qual deve ser essa garantia,
para que a porcentagem de motores substituídos seja de 2%?

Seja X: “duração do motor”.

Em a) queremos determinar P [X > 150000];

150000 x 0 z

X − 150000 150000 − 150000 0


" #  
P [X > 150000] = P √ > √ =P Z>−
25000000 25000000 5000
= P [Z > 0] = 0, 5.

Dessa maneira, a probabilidade de que a duração do motor seja maior que 150000 quilômetros é 0,5.

Em b) queremos determinar P [X < 158000].

150000 158000 x 0 1.6 z


204

X − 150000 158000 − 150000


" #
P [X < 158000] = P [X − 150000 < 158000 − 150000] = P √ < √
25000000 25000000
158000 − 150000 8000
   
= P Z< =P Z< = P [Z < 1, 6]
5000 5000
= P [Z ≤ 0] + P [0 < Z < 1, 6] = 0, 5 + P [0 < Z < 1, 6]

= 0, 5 + 0, 4452

= 0, 9452.

Dessa maneira, o percentual de duração do motor que é inferior a 158000 km é 0,9452.

Em c) queremos determinar P [140000 < X < 159000];

140000 150000 159000 x −2 0 1.8 z

140000 − 150000 X − 150000 159000 − 150000


 
P [140000 < X < 159000] = P < <
5000 5000 5000
= P [−2 < Z < 1, 8] = P [−2 < Z < 0] + P [0 ≤ Z < 1, 8]

= P [0 < Z < 2] + P [0 ≤ Z < 1, 8] = 0, 4772 + 0, 4641

= 0, 9413.

Dessa maneira, a probabilidade de que a duração do motor esteja entre 140000 e 159000 km é 0,9413.

Devemos encontrar o quilômetro xG tal que P [X ≤ xG ] = 0, 02.

X − 150000 xG − 150000 xG − 150000


" # " #
0, 02 = P [X ≤ xG ] = P √ ≤ √ =P Z≤ √
25000000 25000000 25000000
xG − 150000 xG − 150000
" # " #
= P Z≥− √ = 0, 5 − P 0 ≤ Z < − √
25000000 25000000
205

0.02 0.02
xG 150000 x zG 0 z

assim

xG − 150000
" #
0, 5 − P 0 ≤ Z < − √ = 0, 02
25000000
xG − 150000
" #
P 0≤Z<− √ = 0, 5 − 0, 02
25000000
xG − 150000
" #
P 0≤Z<− √ = 0, 48
25000000

logo da tabela da distribuição normal temos que

xG − 150000
−√ = 2, 05
25000000
xG − 150000
√ = −2, 05
25000000

xG − 150000 = −2, 05 · 25000000

xG = 150000 − 10250

xG = 139750.
206

21) Um marinheiro recebe um telegrama avisando que sua esposa ainda não deu a luz. Ele não lembra
a data exata que esteve em casa, e refletindo um pouco chegou a conclusão de que tem pelo menos
308 dias que isso ocorreu. Se os prazos de gravidez têm distribuição normal com média de 268 dias
e desvio padrão de 15 dias, pergunta-se: o marinheiro deve se preocupar?

Seja X: “prazos de gravidez”. Queremos determinar P [X > 308]

268 308 0 2.67

X − 268 308 − 268


 
P [X > 308] = P [X − 268 > 308 − 268] = P >
15 15
308 − 268 40
   
= P Z> =P Z> = P [Z > 2, 67]
15 15
= 0, 5 − P [0 ≤ Z ≤ 2, 67] = 0, 5 − 0, 4962

= 0, 0038.

Dessa maneira, a probabilidade de que o prazos de gravidez sejam maiores que 308 dias é 0,0038, e
assim o marinheiro deve sim se preocupar, pois a probabilidade de que ele seja o verdadeiro pai é
baixa.
207

22) Os depósitos efetuados no Banco B, num determinado mês, têm distribuição normal com média
R$ 9000 e desvio padrão R$ 1500. Um depósito é selecionado ao acaso dentre todos os referentes ao
mês em questão. A probabilidade de que o depósito exceda R$ 6000 é de

a) ( ) 97,72% c) ( ) 68,21% e) ( ) 34,17%

b) ( ) 94,50% d) ( ) 47,71%

Seja X: “valor do depósito”. Queremos determinar P [X > 6000]

6000 9000 −2 0

X − 9000 6000 − 9000


 
P [X > 6000] = P [X − 9000 > 6000 − 9000] = P >
1500 1500
6000 − 9000 −3000
   
= P Z> =P Z> = P [Z > −2]
1500 1500
= P [−2 < Z < 0] + P [Z ≥ 0]

= P [0 < Z < 2] + 0, 5 = 0, 4772 + 0, 5

= 0, 9772.

Dessa maneira, a probabilidade de que o valor do depósito exceda R$ 6000 é 0,9772, sendo a resposta
correta a letra a).
208

23) Um avião de turismo de 4 lugares pode levar uma carga útil de 360 kg. Supondo que os passageiros
têm massa normalmente distribuída com média de 70 kg e desvio padrão de 20 kg e que a bagagem
de cada passageiro também é normalmente distribuída com média 12 kg e desvio padrão de 5 kg.
Calcule a probabilidade de:

a) Haver sobrecarga se o piloto não mensurar a massa dos passageiros e respectivas bagagens.

b) Que o piloto tenha que retirar pelo menos 50 kg de gasolina para evitar sobrecarga.

Sejam

i) Xi : “massa do i−ésimo passageiro”, então Xi ∼ N (70; 400);

ii) Yi : “massa da bagagem do i−ésimo passageiro”, então Yi ∼ N (12; 25).

Se W : “massa de 4 passageiros e suas respectivas bagagens”, temos que

W = X1 + · · · + X4 + Y1 + · · · + Y4 ,
| {z } | {z }
4 vezes 4 vezes

então W ∼ N (328; 1700). De fato,

µW = 1| × 70 + 1 × 70
{z
+ · · · + 1 × 70} + |1 × 12 + 1 × 12
{z
+ · · · + 1 × 12}
4 vezes 4 vezes
= 4 × 70 + 4 × 12 = 280 + 48

= 328

e,

2
σW = 1| × 400 + 1 × 400
{z
+ · · · + 1 × 400} + |1 × 25 + 1 × 25
{z
+ · · · + 1 × 25}
4 vezes 4 vezes
= 4 × 400 + 4 × 25 = 1600 + 100

= 1700.

Em a) queremos calcular P [W > 360].

W − 328 360 − 328


" #
P [W > 360] = P [W − 328 > 360 − 328] = P √ > √
1700 1700
360 − 328 32
" # " #
= P Z> =P Z> = P [Z > 0, 78]
41, 2311 41, 2311
= 0, 5 − P [0 ≤ Z ≤ 0, 78] = 0, 5 − 0, 2823

= 0, 2177.
209

328 360 0 0.78

Dessa maneira, a probabilidade de que o massa de 4 passageiros e suas respectivas bagagens sejam
maiores que 360 quilogramas é 0,2177.

Em b) queremos calcular P [W > 410], pois se o piloto teve que retirar pelo menos 50 kg, então a
massa inicial era, pelo menos 410 kg.

328 410 0 1.99

X − 328 410 − 328


" #
P [X > 410] = P [X − 328 > 410 − 328] = P √ > √
1700 1700
410 − 328 82
" # " #
= P Z> =P Z> = P [Z > 1, 99]
41, 2311 41, 2311
= 0, 5 − P [0 ≤ Z ≤ 1, 99] = 0, 5 − 0, 4767

= 0, 0233.

Dessa maneira, a probabilidade de que o massa de 4 passageiros e suas respectivas bagagens sejam
maiores que 410 quilogramas é 0,0233.
210

24) Sabendo que a massa de coelhos (X), é uma variável aleatória normalmente distribuída com média
5 kg e variância 9 kg2 , determine:

a) a probabilidade de que um coelho, selecionado aleatoriamente, tenha massa superior a 2,5 kg.

b) a probabilidade de que um coelho, selecionado aleatoriamente, tenha massa superior a 2 kg e


inferior a 7,1 kg.

Em a) queremos determinar P [X > 2, 5];

2.5 5 x −0.83 0 z

X −5 2, 5 − 5 2, 5
" #  
P [X > 2, 5] = P √ > √ =P Z>−
9 9 3
= P [Z > −0, 83] = P [−0, 83 < Z < 0] + P [Z ≥ 0]

= P [0 < Z < 0, 83] + 0, 5 = 0, 2967 + 0, 5

= 0, 7967.

Dessa maneira, a probabilidade de que o massa de um coelho seja maior que 2,5 kg é 0,7967.

Em b) queremos determinar P [2 < X < 7, 1];

2 5 7.1 x −1 0 0.7 z
211

2−5 X −5 7, 1 − 5
 
P [2 < X < 7, 1] = P < <
3 3 3
= P [−1 < Z < 0, 7] = P [−1 < Z < 0] + P [0 ≤ Z < 0, 7]

= P [0 < Z < 1] + P [0 ≤ Z < 0, 7] = 0, 3413 + 0, 258

= 0, 5993.

Dessa maneira, a probabilidade de que o massa de um coelho esteja entre 2 e 7,1 kg é 0,5993.
212

25) A delegacia de polícia da cidade de Atlântida recebe em média três chamadas por hora pelo
telefone 190. Calcule a probabilidade de que ela receba no mínimo duas chamadas em uma hora.

Seja X: “número dechamadas recebidas em 1 hora”, note que, X ∼ Poi (3), pois ocorrem em média
λ = 3 acidentes por mês. Desejamos determinar P [X ≥ 2]. Sabemos que

P [X ≥ 2] = 1 − P [X < 2] = 1 − (P [X = 0 + P [X = 1]])

e−3 30 0, 0498 × 1
P [X = 0] = = = 0, 0498
0! 1
e−3 31 0, 0498 × 3
P [X = 1] = = = 0, 1494,
1! 1

logo

P [X ≥ 2] = 1 − (0, 0498 + 0, 0498)

= 1 − 0, 1992

= 0, 8008.
213

26) De uma caixa com uma lata de doce de leite defeituosa e 4 perfeitas, Joana retira quatro latas
sucessivamente com reposição. Determine:

a) a probabilidade de que todas as latas sejam defeituosas.

b) a probabilidade de que pelo menos uma lata seja perfeita.

Seja X: “número de latas de doce de leite defeituosas em 4 selecionadas”, note que X é binomialmente
distribuída, sendo que, X ∼ Bin (4; 0, 2).

Em a) queremos determinar P [X = 4].

4
!
P [X = 4] = 0, 24 (1 − 0, 2)4−4 = 1 × 0, 0016 × 1 = 0, 0016.
4

Em b), note que nossa variável aleatória mede o número de latas defeituosas, entretanto, o exercício
refere-se a latas perfeitas. Se pelo menos uma lata é perfeita, então teremos no máximo 3 latas
defeituosas e, podemos então determinar P [X ≤ 3].

P [X ≤ 3] = P [X = 0] + P [X = 1] + P [X = 2] + P [X = 3]

= 1 − P [X > 3] = 1 − P [X = 4] ,

e utilizando o resultado de a) temos

P [X ≤ 3] = 1 − 0, 0016 = 0, 9984.

Outro modo de resolver b) é definir a variável Y : “número de latas de doce de leite perfeitas em 4
selecionadas”, note que Y é binomialmente distribuída, sendo que, Y ∼ Bin (4; 0, 8).

P [Y ≥ 1] = P [Y = 1] + P [Y = 2] + P [Y = 3] + P [Y = 4]

= 1 − P [Y < 1] = 1 − P [Y = 0] ,

4
!
P [Y = 0] = 0, 80 (1 − 0, 8)4−0 = 1 × 1 × 0, 0016 = 0, 0016,
0

logo

P [Y ≥ 1] = 1 − 0, 0016 = 0, 9984.
214

27) Os registros de venda da loja de Luzia indicam que, historicamente 60% das faturas diárias,
por ela emitidas, são pagas em dia. Nessa semana ela fez sete vendas independentes de um valor
consideravelmente alto, e está preocupada.

a) Determine a probabilidade de que exatamente duas faturas não sejam pagas em dia.
b) Determine a probabilidade de que pelo menos uma das faturas seja paga em dia.

Seja X: “número de faturas pagas em atraso nas 7 vendas”, note que X é binomialmente distribuída,
sendo que, X ∼ Bin (7; 0, 4).

Em a) queremos determinar P [X = 2].

7
!
P [X = 2] = 0, 42 (1 − 0, 4)7−2 = 21 × 0, 16 × 0, 0778 = 0, 2613.
2

Em b), note que nossa variável aleatória, definida em a), refere-se ao número de faturas pagas em
atraso, entretanto, o exercício refere-se a faturas pagas em dia. Se pelo menos uma fatura é paga em
dia, então teremos no máximo 6 faturas pagas em atraso e, podemos então determinar P [X ≤ 6].

P [X ≤ 6] = P [X = 0] + · · · + P [X = 6] = 1 − P [X > 6] = 1 − P [X = 7] ,

e como
7
!
P [X = 7] = 0, 47 (1 − 0, 4)7−7 = 1 × 0, 0016 × 1 = 0, 0016.
7

temos

P [X ≤ 6] = 1 − 0, 0016 = 0, 9984.

Outro modo de resolver b) é definir a variável Y : “número de faturas pagas em dia nas 7 vendas”,
note que Y é binomialmente distribuída, sendo que, Y ∼ Bin (7; 0, 6).

P [Y ≥ 1] = P [Y = 1] + · · · + P [Y = 7] = 1 − P [Y < 1] = 1 − P [Y = 0] ,

e
7
!
P [Y = 0] = 0, 60 (1 − 0, 6)7−0 = 1 × 1 × 0, 0016 = 0, 0016,
0

logo

P [Y ≥ 1] = 1 − 0, 0016 = 0, 9984.
215

1
28) Um motorista comprou cinco pneus novos de uma certa marca para o seu carro. Sabe-se que dos
4
pneus dessa marca costumam apresentar defeito e, torna-se importante estudar essa variável, devido
a periculosidade de que haja um acidente por causa de um pneu nesse estado. Qual a probabilidade
de que ele tenha comprado:

a) Exatamente três pneus defeituosos;

b) Todos os pneus em perfeito estado.

Seja X: “número de pneus defeituosos dentre os 5 comprados”, note que X é binomialmente distri-
buída, sendo que, X ∼ Bin (5; 0, 25).

Em a) queremos determinar P [X = 3].

5
!
P [X = 3] = 0, 253 (1 − 0, 25)5−3 = 10 × 0, 0156 × 0, 5625 = 0, 0879.
3

Em b) note que nossa variável aleatória mede o número de pneus defeituosos, entretanto, o exercício
refere-se a pneus perfeitos. Se todos os pneus estão em perfeito estado, então nenhum deles é
defeituoso e, podemos então determinar P [X = 0].

5
!
P [X = 0] = 0, 250 (1 − 0, 25)5−0 = 1 × 1 × 0, 2373 = 0, 2373.
0

Outro modo de resolver b) é definir a variável Y : “número de pneus perfeitos dentre os 5 comprados”,
note que Y é binomialmente distribuída, sendo que, Y ∼ Bin (5; 0, 75).

5
!
P [Y = 5] = 0, 755 (1 − 0, 75)5−5 = 1 × 0, 2373 × 1 = 0, 2373.
5
216

29) Em uma rodovia ocorrem, em média, dois acidentes por mês. Qual a probabilidade de, nos
próximos três meses, ocorrerem exatamente cinco acidentes?

Seja Y : “número de acidentes que ocorrem em 3 meses”. Sabemos que o número médio de acidentes
que ocorre por mês é 2, donde podemos determinar o número médio de acidentes que ocorrem em 3
meses através de uma regra de três, assim,

Meses Acidentes
1 2

3 λ

Desejamos determinar P [Y = 5].

e−6 65 0, 0025 × 7776


P [Y = 5] = = = 0, 162.
5! 120
217

30) Dada a população de pessoas de um município em que 60% são favoráveis a um certo projeto
municipal, qual a probabilidade de, numa amostra aleatória simples de 4 pessoas dessa população,
encontrarmos exatamente 3 pessoas favoráveis ao projeto?

Seja X: “número de pneus defeituosos dentre os 4 comprados”, note que X é binomialmente distri-
buída, sendo que, X ∼ Bin (4; 0, 6).

Queremos determinar P [X = 3].

4
!
P [X = 3] = 0, 63 (1 − 0, 6)4−3 = 4 × 0, 216 × 0, 4 = 0, 3456.
3
218

31) Numa central telefônica chegam 30 telefonemas em 60 minutos. Qual a probabilidade de que em
6 minutos cheguem 10 telefonemas?

Seja Y : “número de telefonemas recebidos em 6 minutos”. Sabemos que o número médio de telefo-
nemas por minuto é 0,5, donde podemos determinar o número médio de telefonemas ocorrem em 6
minutos através de uma regra de três,

Minutos Telefonemas
1 0,5

6 λ

logo 1 · λ = 6 · 0, 5, e assim λ = 3.

Desejamos determinar P [Y = 10], assim

e−3 310 0, 0498 × 59049


P [Y = 10] = = = 0, 0008.
10! 3628800
219

32) Acredita-se que 20% dos moradores das proximidades de uma grande indústria siderúrgica tem
alergia aos poluentes lançados ao ar. Calcule a probabilidade de que quatro moradores tenham
alergia dentre treze selecionados ao acaso.

Seja X: “número de moradores que tem alergia dentre os 13 amostrados”, note que X é binomialmente
distribuída, sendo que, X ∼ Bin (13; 0, 2).

Queremos determinar P [X = 4].

13
!
P [X = 4] = 0, 24 (1 − 0, 2)13−4 = 715 × 0, 0016 × 0, 1342 = 0, 1535.
4
220

33) Suponha que a massa dos habitantes de uma determinada cidade seja uma variável aleatória
normalmente distribuída com média 75 kg e variância 25 kg2 . Na drogaria do senhor Joaquim,
há uma balança que mensura massas de no máximo 160 kg. Se dois moradores forem escolhidos
aleatoriamente, qual a probabilidade de que eles não possam ter massa mensurada de uma só vez
pela balança por excederem o limite de quilogramas suportado pela balança?

Sejam Xi : “massa do i−ésimo morador”, então Xi ∼ N (75; 25). Se W : “massa de 2 moradores”,


temos que
W = X1 + X2

então W ∼ N (150; 50). De fato,

µW = E [X1 + X2 ] = E [X1 ] + E [X2 ]

= 75 + 75 = 2 × 75 = 150

e,

2
σW = var [X1 + X2 ] = var [X1 ] + var [X2 ]

= 25 + 25 = 2 × 25 = 50

= 50.

Queremos calcular P [W > 160].

150 160 0 1.41


221

W − 150 160 − 150


" #
P [W > 160] = P [W − 150 > 160 − 150] = P √ > √
50 50
160 − 150 10
" # " #
= P Z> =P Z> = P [Z > 1, 41]
7, 0711 7, 0711
= 0, 5 − P [0 ≤ Z ≤ 1, 41] = 0, 5 − 0, 4207

= 0, 0793.

Dessa maneira, a probabilidade de que o massa de 2 moradores sejam maiores que 160 quilogramas
é 0,0793.
222

34) Uma central telefônica recebe, em média, 90 telefonemas em 60 minutos. Qual a probabilidade
de que em 2 minutos ela receba 2 telefonemas?

Seja X : “número de ligações em um minuto”. Temos que

90 telefonemas
m= = 1, 5 telefonemas/minuto.
60 minutos

Se Y : “número de ligações em 2 minutos” temos que:

Minutos Telefonemas
1 1,5

2 λ

λ = 1, 5 × 2 = 3,

ou seja o número médio de ligações em 2 minutos é 3, donde λ = 3. Logo

e−3 32
P [Y = 2] = = 0, 224.
2!
223

35) Um empresário pretende estabelecer uma firma para montagem de um componente mecânico.
Cada peça é composta de duas partes, A e B, cada uma com uma chance específica de ser defeituosa.
Só é possível verificar a qualidade das peças depois que elas são montadas. Se ambas são defeituosas,
a peça é descartada e dá um prejuízo de R$ 15. Se a peça B é defeituosa e A é perfeita, ainda é
possível reparar a peça e obter um lucro de R$ 20. De maneira semelhante, se A é defeituosa e B é
perfeita, o reparo permite vender a peça inteira com um lucro de R$ 30. Se as duas peças são boas,
o lucro é de R$ 40. Sendo A : “a peça A é perfeita”, B : “a peça B é perfeita” e

P [Ac ∩ B] = 0, 25 P [Ac ∩ B c ] = 0, 15

P [A ∩ B] = 0, 4 P [A ∩ B c ] = 0, 2

determine:

a) a distribuição do lucro;
Seja X : “lucro obtido por peça”. Temos que os possíveis valores obtidos para X são:

• se as peças A e B são defeituosas (Ac ∩ B c ), o “lucro” é −15, o que ocorre com probabilidade
0,15;

• se a peça A é perfeita e B é defeituosa (A ∩ B c ), o lucro é 20, o que ocorre com probabilidade


0,2;

• se peça se A é defeituosa e B é perfeita (Ac ∩ B), o lucro é 30, o que ocorre com probabilidade
0,25;

• se as peças A e B são perfeitas (A ∩ B), o lucro é 40, o que ocorre com probabilidade 0,4;

dessa forma a distribuição do lucro é:

x −15 20 30 40 Total
P [X = x] 0, 15 0,2 0,25 0,4 1

b) o lucro esperado por peça produzida;

n
E [X] = xi P [X = xi ] = x1 P [X = x1 ] + x2 P [X = x2 ] + x3 P [X = x3 ] + x4 P [X = x4 ]
X

i=1
= −15 × 0, 15 + 20 × 0, 2 + 30 × 0, 25 + 40 × 0, 4 = 25, 25, (1)

c) a variância do lucro por peça produzida.


Sabemos que
h i
var [X] = E X 2 − (E [X])2 (2)
224

e, para o cálculo de var [X], encontraremos agora E [X 2 ].

h i n
E X2 = x2i P [X = xi ] = x21 P [X = x1 ] + x22 P [X = x2 ] + x23 P [X = x3 ] + x24 P [X = x4 ]
X

i=1
= (−15)2 × 0, 15 + 202 × 0, 2 + 302 × 0, 25 + 402 × 0, 4 = 978, 75. (3)

Substituindo os resultados obtidos em (1) e (3), na equação (2), temos

h i
var [X] = E X 2 − (E [X])2

= 978, 75 − (25, 25)2 = 978, 75 − 637, 5625

= 341, 1875.
225

36) A probabilidade de ocorrência de turbulência em um determinado percurso a ser feito por uma
aeronave é 0,4 em um circuito diário. Seja X : “número de voos com turbulência em um total de 7
desses voos”. Pede-se:

a) Qual a probabilidade de que haja turbulência em no máximo três voos?

Seja X: “número de voos com turbulência dentre os 7 estudados”, note que X é binomialmente
distribuída, sendo que, X ∼ Bin (7; 0, 4). Queremos determinar P [X ≤ 3] sendo que,

P [X ≤ 3] = P [X = 0] + P [X = 1] + P [X = 2] + P [X = 3]

7
!
P [X = 0] = 0, 40 (1 − 0, 4)7−0 = 1 × 1 × 0, 028 = 0, 028,
0
7
!
P [X = 1] = 0, 41 (1 − 0, 4)7−1 = 7 × 0, 4 × 0, 0467 = 0, 1306,
1
7
!
P [X = 2] = 0, 42 (1 − 0, 4)7−2 = 21 × 0, 16 × 0, 0778 = 0, 2613,
2
7
!
P [X = 3] = 0, 43 (1 − 0, 4)7−3 = 35 × 0, 064 × 0, 1296 = 0, 2903,
3

assim

P [X ≤ 3] = 0, 028 + 0, 1306 + 0, 2613 + 0, 2903

= 0, 7102

b) Qual o número esperado de voos com turbulência?

Sabemos que se X ∼ Bin (n; p) então E [X] = np, dessa forma, o número de voos com turbulência
dentre os 7 estudados é
E [X] = np = 7 · 0, 4 = 2, 8.
226

37) O gerente de uma franquia observou que o tempo de permanência de clientes na fila de pagamento
segue uma distribuição normal com média igual a 6 minutos e variância igual a 4 minutos2 . Determine
a probabilidade de que:

a) O tempo de permanência na fila seja exatamente 4 minutos.

Seja X : “tempo gasto na resolução da prova”.

Queremos determinar P [X = 4]. Note que a variável aleatória X é contínua e, assim sendo, qualquer
ponto tem probabilidade zero de acontecer, assim P [X = 4] = 0.

b) O tempo de permanência na fila seja de 4 a 8 minutos.

4 6 8 x −1 0 1 z

4−6 X −6 8−6
 
P [4 < X < 8] = P < <
2 2 2
= P [−1 < Z < 1] = P [−1 < Z < 0] + P [0 ≤ Z < 1]

= P [0 < Z < 1] + P [0 ≤ Z < 1] = 0, 3413 + 0, 3413

= 0, 6826.

Dessa maneira, a probabilidade de que o tempo gasto na resolução da prova esteja entre 4 e 8 minutos
é 0,6826.

c) O tempo de permanência na fila seja pelo menos 4 minutos.

X −6 4−6 2
" #  
P [X ≥ 4] = P √ ≥ √ =P Z≥−
4 4 2
= P [Z ≥ −1] = P [−1 ≤ Z < 0] + P [Z ≥ 0]

= P [0 ≤ Z < 1] + 0, 5 = 0, 3413 + 0, 5

= 0, 8413.
227

4 6 x −1 0 z

Dessa maneira, a probabilidade de que o tempo gasto na resolução da prova seja maior que 4 minutos
é 0,8413.
228

38) A massa de uma caixa de peças é uma variável aleatória normal com média de 65 kg e desvio
padrão de 4 kg. Um carregamento de 120 caixas de peças selecionadas aleatoriamente é feito. Qual
é a probabilidade de que a carga tenha massa entre 7850 kg e 7900 kg?

Considere a variável Xi : “massa da carga”, para 1 ≤ i ≤ 120, dessa forma Xi ∼ N (65; 16). Seja Y =
X1 + X2 + · · · + X120 a variável que mede a massa das 120 caixas. Sabemos que Y ∼ N (7800; 1920),
pois
µY = 1 × 65 + 1 × 65 + · · · + 1 × 65 = 120 × 65 = 7800

e,
σY2 = 1 × 16 + 1 × 16 + · · · + 1 × 16 = 120 × 16 = 1920.

Queremos determinar P [7850 < Y < 7900], o que faremos a seguir.

7800 7850 7900 x 0 1.14 2.28 z

P [7850 < Y < 7900] = P [7850 − 7800 < Y − 7800 < 7900 − 7800]
7850 − 7800 Y − 7800 7900 − 7800
" #
= P √ < √ < √
1920 1920 1920
7850 − 7800 7900 − 7800
" #
= P <Z<
43, 8178 43, 8178
= P [0 ≤ Z < 2, 28] − P [0 ≤ Z < 1, 14]

= 0, 4887 − 0, 3729

= 0, 1158.

Dessa maneira, a probabilidade de que a massa da carga esteja entre 7850 kg e 7900 kg é 0,1158.
229

39) Em determinado setor de uma loja de departamentos, o número de produtos vendidos em um dia
pelos funcionários é uma variável aleatória discreta, com a seguinte distribuição de probabilidades:

Número de produtos 0 1 2 3 4 5 6
Probabilidade de venda 0,1 0,4 0,2 0,1 0,1 0,05 0,05

O número médio de produtos vendidos e a variância das vendas são respectivamente:

a) 2,05 e 2,55 d) 4,01 e 6,45

b) 3,10 e 6,75 e) 3,33 e 9,07

c) 2,05 e 4,02 f) n.d.r.a

E [X] = 0 × 0, 1 + 1 × 0, 4 + 2 × 0, 2 + 3 × 0, 1 + 4 × 0, 1 + 5 × 0, 05 + 6 × 0, 05

= 2, 05,

e, para o cálculo de var [X], precisamos encontrar também E [X 2 ], o que faremos a seguir.

h i
E X2 = 02 × 0, 1 + 12 × 0, 4 + 22 × 0, 2 + 32 × 0, 1 + 42 × 0, 1 + 52 × 0, 05 + 62 × 0, 05

= 6, 75.

h i
var [X] = E X 2 − (E [X])2

= 6, 75 − (2, 05)2 = 6, 75 − 4, 2

= 2, 55.

Dessa forma a resposta correta é a letra a).


230

40) Suponha que, em média, uma delegacia de uma pequena cidade prenda um indivíduo a cada dois
dias com sintomas de embriaguez. As probabilidades de que:

• em um certo dia sejam presos pelo menos dois indivíduos com sintomas de embriaguez;

• em uma semana sejam presos 4 indivíduos com sintomas de embriaguez;

são dadas respectivamente por:

a) 0,9098 e 0,1888; d) 0,0144 e 0,1888;

b) 0,2642 e 0,0912; e) 0,2642 e 0,1888;

c) 0,0902 e 0,0912; f) n.d.r.a.

Seja X : “número de indivíduos presos por dia com sintomas de embriaguez”, X ∼ Poi (0, 5) e,
queremos determinar P [X ≥ 2],

P [X ≥ 2] = 1 − P [X < 2] = 1 − P [X = 0] − P [X = 1]
e−0,5 0, 50 0, 6065 × 1
P [X = 0] = = = 0, 6065
0! 1
e−0,5 0, 51 0, 6065 × 0, 5
P [X = 1] = = = 0, 3033
1! 1
P [X ≥ 2] = 1 − 0, 6065 − 0, 3033 = 0, 0902

Dessa forma, a probabilidade de que sejam presos pelo menos dois indivíduos com sintomas de
embriaguez em um dia é 0,0902.

Seja Y : “número de indivíduos presos em uma semana com sintomas de embriaguez”, Y ∼ Poi (3, 5)
e, queremos determinar P [Y = 4],

e−3,5 3, 54 0, 0302 × 150, 0625


P [Y = 4] = = = 0, 1888
4! 24

Dessa forma, a probabilidade de que sejam presos 4 indivíduos em uma semana com sintomas de
embriaguez é 0,1888.

Assim a resposta correta é a letra f).


231

41) Com o objetivo de realizar uma análise da variação temporal e espacial dos registros de furto em
determinada cidade, foram consultados os dados fornecidos pela Gerência de Estatística e Análise
Criminal da mesma. Obteve-se a informação de que nas madrugadas de sábado, em um dos bairros
mais perigosos da cidade, 34% dos indivíduos que andam sozinhos têm seus objetos furtados. Se 9
pessoas passarem sozinhas por esse bairro na madrugada de sábado, qual a probabilidade de pelo
menos 7 delas sofrerem algum tipo de furto?

Seja X : “número de pessoas que sofreram algum furto em 9 selecionadas”. Desejamos determinar
P [X ≥ 7].

Note que
P [X ≥ 7] = P [X = 7] + P [X = 8] + P [X = 9] , (4)

assim

9
!
P [X = 7] = 0, 347 (1 − 0, 34)9−7 = 0, 0082, (5)
7
9
!
P [X = 8] = 0, 348 (1 − 0, 34)9−8 = 0, 0011, (6)
8
9
!
P [X = 9] = 0, 349 (1 − 0, 34)9−9 = 0, 0001. (7)
9

Substituindo (5), (6) e (7) em (4) temos

P [X ≥ 7] = 0, 0082 + 0, 0011 + 0, 0001 = 0, 0094.


232

42) Um estudo realizado por geógrafos e climatologistas dos Estados Unidos constatou que a categoria
4 de furacões (segundo a escala de classificação Saffir - Simpson), com ventos entre 209 a 251 km/h,
ataca o Estado da Flórida a uma taxa média de um em cada quatro anos. Nesse sentido, qual a
probabilidade da Flórida ser atingida por três furacões em uma década?

Sabemos que a média do número de furacões em 4 anos é 1, donde podemos determinar a média do
número de furacões em 10 anos através de uma regra de três, assim,

Anos Furacões
4 1

10 λ

1 × 10
e, efetuando-se a regra de três chegamos a λ = = 2, 5.
4
Seja X : “número de furacões em 10 anos”. Queremos determinar P [X = 3], dessa forma:

e−2,5 2, 53
P [X = 3] =
3!
0, 0821 × 15, 625
=
6
= 0, 2138.
233

43) A regra é clara: álcool e direção não têm espaço no mesmo jogo. O fato é que, mesmo que todo
mundo saiba disso, os acidentes de trânsito causados por pessoas embriagadas continuam aconte-
cendo. O excesso de velocidade é outro fator preocupante. Quanto maior a velocidade de um veículo
maior será a distância que ele ainda percorrerá com os freios acionados. Aliando-se excesso de álcool
e de velocidade temos um fator preocupante a ser considerado. Suponha que um indivíduo, dirigindo
sóbrio a 54 km/h, após a visualização de um obstáculo percorra, em média, 40 m até a parada total
do veículo, com variância de 16 m2 . Suponha também que um indivíduo alcoolizado a mesma velo-
cidade, após a visualização de um obstáculo percorra, em média, 65 m até a parada total do veículo,
com variância de 81 m2 . Se em ambos os casos, a distância percorrida segue distribuição normal,
determine:

a) Se um indivíduo sóbrio avistar um pedestre a 50 m de distância e imediatamente acionar os


freios, qual a probabilidade de que o pedestre seja atropelado se ele permaneceu imóvel?

Seja X : “distância percorrida pelo motorista sóbrio”, então X ∼ N (40; 16). A padronização é a
seguinte:
X − µX X − 40
Z= = ∼ N (0; 1) ,
σX 4
e queremos determinar P [X > 50].

X − 40 50 − 40
 
P [X > 50] = P [X − 40 > 50 − 40] = P >
4 4
50 − 40
 
= P Z> = P [Z > 2, 5]
4
= 0, 5 − P [0 ≤ Z ≤ 2, 5] = 0, 5 − 0, 4938

= 0, 0062.

Dessa maneira, a probabilidade de que o pedestre venha a ser atropelado pelo motorista sóbrio é
0,0062.

b) Se um indivíduo alcoolizado avistar um pedestre a 50 m de distância e imediatamente acionar os


freios, qual a probabilidade de que o pedestre seja atropelado se ele permaneceu imóvel?

Seja Y : “distância percorrida pelo motorista alcoolizado”, então Y ∼ N (65; 81). A padronização é
a seguinte:
Y − 65 Y − 65
Z= = ∼ N (0; 1) ,
9 9
234

e queremos determinar P [Y > 50];

Y − 65 50 − 65
 
P [Y > 50] = P [Y − 65 > 50 − 65] = P >
9 9
50 − 65
 
= P Z> = P [Z > −1, 6667]
9
= 0, 5 + P [0 ≤ Z ≤ 1, 6667] = 0, 5 + 0, 4525

= 0, 9525.

Dessa maneira, a probabilidade de que o pedestre venha a ser atropelado pelo motorista alcoolizado
é 0,9525.
235

44) Suponha que a quantidade de correspondências eletrônicas recebidas por dia em uma empresa é
normalmente distribuída com média de 4000 e-mails e desvio padrão de 200 e-mails. Pede-se:

a) Calcule a probabilidade de que essa empresa receba menos de 3650 e-mails.

Considere a variável X : “quantidade de correspondências eletrônicas recebidas em um dia”, então


X ∼ N (4000; 40000) e queremos determinar P [X < 3650].

3650 4000 x −1.75 0 z

X − 4000 3650 − 4000


" #
P [X < 3650] = P [X − 4000 < 3650 − 4000] = P √ < √
40000 40000
3650 − 4000 −350
   
= P Z< =P Z< = P [Z < −1, 75]
200 200
= P [Z > 1, 75] = 0, 5 − P [0 ≤ Z ≤ 1, 75]

= 0, 5 − 0, 4599

= 0, 0401.

Dessa maneira, o percentual de dias para as quais a quantidade de correspondências eletrônicas


recebidas em um dia é inferior a 3650 e-mails é 0,0401.

b) Se um determinado mês tem 31 dias, em quantos desses dias espera-se receber menos de 3650
e-mails?

Considere a variável Y : “número de dias em que a quantidade de correspondências eletrônicas


recebidas é inferior a 3650 dentre os 31 observados”, então Y ∼ Bin (n; p) e E [Y ] = np com n = 31
e p = 0, 0401, dessa forma,
E [Y ] = np = 31 · 0, 0401 = 1, 2418.
236

45) Sejam X e Y variáveis aleatórias independentes e com distribuição normal, sendo

X ∼ N (48; 16) e Y ∼ N (6; 9).

X
Admita a combinação linear W = − 3Y e calcule:
2
a) E [W ];

1 1 1
   
E [W ] = E X − 3Y = E X − E [3Y ] = E [X] − 3E [Y ]
2 2 2
1
= · 48 − 3 · 6 = 24 − 18
2
= 6

b) var [W ];

1 1 1
     
var [W ] = var X − 3Y = var X + var [3Y ] − 2 cov X, 3Y
2 2 2
1 1
 2
= var [X] + (3)2 var [Y ] − 2 · · 3 cov [X, Y ]
2 2
1
= var [X] + 9 var [Y ] − 3 · 0
4
1
= · 16 + 9 · 9 − 0 = 4 + 81
4
= 85

c) P [12 ≤ W ≤ 21].

Utilizando o teorema da combinação linear e os resultados obtidos em a) e b), temos que W ∼


N (6; 85). Além disso, o que queremos é determinar P [12 < W < 21].

6 12 21 x 0 0.65 1.63 z
237

P [12 < W < 21] = P [12 − 6 < W − 6 < 21 − 6]


12 − 6 W −6 21 − 6
" #
= P √ < √ < √
85 85 85
12 − 6 21 − 6
" #
= P <Z<
9, 2195 9, 2195
= P [0 ≤ Z < 1, 63] − P [0 ≤ Z < 0, 65]

= 0, 4484 − 0, 2422

= 0, 2062.

Dessa maneira, P [12 < W < 21] = 0, 2062.


238

CAPÍTULO VIII

Testes de hipóteses

1) Com o objetivo de testar a influência do olfato sobre o sono dos recém nascidos, foi registrado o
tempo (em minutos) que um bebê com uma semana demora para adormecer. Foi considerado dois
grupos de bebês: grupo I (em que se colocou no berço uma peça de roupa utilizada pela mãe) e grupo
II (em que se colocou no berço uma peça de roupa utilizada por outra pessoa), sendo que é esperado
que as crianças do grupo I adormeçam mais rapidamente. Os resultados dos tempos médios obtidos
encontram-se no quadro seguinte:

n Média Desvio padrão


Grupo I 10 5,7 2,003
Grupo II 10 8,3 2,359

em que n é o número de elementos amostrados em cada grupo. Sabendo que a variável em estudo
segue uma distribuição normal, e que as variâncias populacionais são iguais, teste se existe diferença
significativa entre o tempo médio que os dois grupos de bebês levaram para adormecer, ao nível de
5% de significância.

Sejam X1 : “tempo que bebês do grupo I levam para adormecer” e X2 : “tempo que bebês do grupo
II levam para adormecer”. Então X1 ∼ N (µ1 ; σ12 ) e X2 ∼ N (µ2 ; σ22 ), além disso, as variâncias
populacionais são iguais, dessa forma podemos aplicar o teste t de Student para duas médias.

H : µ1 = µ2


0
P1) (Teste unilateral à esquerda)
: µ1 < µ2

H

1

P2) Temos que α = 0, 05 e a estatística de teste é

X̄1 − X̄2
T =s   ∼ t(ν) ,
1 1
Sc2 +
n1 n2

sendo ν = n1 + n2 − 2 e,
(n1 − 1) S12 + (n2 − 1) S22
Sc2 = .
n1 + n2 − 2
239

P3) Temos que ν = 10 + 10 − 2 = 18 e ttab = t(18;5%) = 1, 7341. Assim a região crítica é:

RC = {t ∈ R| t < −1, 7341} ,

a qual é descrita em termos gráficos na Figura 1.

RRH0 RNRH0 RNRH0 RNRH0

−2,66 −1,7341 0

Figura 1: Região crítica do teste t, para duas médias, unilateral à esquerda.

P4) Temos que

X̄1 = 5, 7, X̄2 = 8, 3, S12 = 2, 0032 = 4, 012, S22 = 2, 3592 = 5, 5649,

(10 − 1) 4, 012 + (10 − 1) 5, 5649


Sc2 =
10 + 10 − 2
86, 1921
= = 4, 7885.
18

5, 7 − 8, 3
tcal = s  = −2, 66.
1 1

4, 7885 +
10 10
Note que esse valor obtido já encontra-se na Figura 1, isso nos permitirá efetuarmos melhor as
conclusões necessárias no passo P5) a seguir.

P5) Como tcal ∈ RRH0 , há indícios para rejeitarmos H0 ao nível de 5% de significância. Dessa forma,
há indícios de que o tempo que bebês do grupo I levam para adormecer é inferior ao tempo que bebês
do grupo II levam para adormecer, ao nível de 5% de significância.
240

2) Um fabricante de queijo compra leite de uma série de fornecedores. Ele desconfia que alguns
desses fornecedores estão adicionando água ao leite para aumentar os seus lucros. O excesso de água
pode ser determinado pelo aumento da temperatura de congelamento do leite, que é em média de
−0, 545 ◦ C. Para testar esse fato, foram coletadas 6 amostras de lotes consecutivos de um fornecedor,
apontando uma média de −0, 5333 ◦ C com desvio padrão de 0, 0058 ◦ C. Supondo que a temperatura
de congelamento seja normalmente distribuída, podemos concluir que esse fornecedor adiciona água
ao leite, ao nível de 2,5% de significância?

Seja X : “temperatura de congelamento do leite”, então X ∼ N (µ; σ 2 ) com σ 2 desconhecido, dessa


forma, podemos aplicar o teste t de Student para uma média.

H : µ = −0, 545


0
P1) (Teste unilateral à direita)
: µ > −0, 545

H

1

X̄ − µ0
P2) Temos que α = 0, 025 e a estatística de teste é T = ∼ t(ν) sendo ν = n − 1.
SX

n
P3) Temos que ν = n − 1 = 6 − 1 = 5 e ttab = t(5;2,5%) = 2, 5706. Assim a região crítica é:

RC = {t ∈ R| t > 2, 5706} ,

a qual é descrita em termos gráficos na Figura 2.

RNRH0 RNRH0 RNRH0 RRH0

0 2,5706 4,94

Figura 2: Região crítica do teste t, para uma média, unilateral à direita.


241

P4) Temos que X̄ = −0, 5333 e SX = 0, 0058, assim

−0, 5333 − (−0, 545)


tcal = 0, 0058 = 4, 94.

6

Note que esse valor obtido já encontra-se na Figura 2, isso nos permitirá efetuarmos melhor as
conclusões necessárias no passo P5) a seguir.

P5) Como tcal ∈ RRH0 , há indícios para rejeitarmos H0 ao nível de 2, 5% de significância. Dessa
forma, há indícios de que a temperatura de congelamento do leite aumentou e, assim há indícios de
que esteja ocorrendo adicionamento de água ao leite.
242

3) Dois grupos de pacientes estão sendo estudados quanto a quantidade de colesterol “ruim” (LDL).
O primeiro grupo (X1 ) não praticava atividades físicas, enquanto que o segundo grupo (X2 ) foi
submetido a um rigoroso programa de atividades físicas. Supondo que a quantidade de colesterol
ruim é normalmente distribuída e com mesma variância populacional, determine com base na tabela
abaixo se o programa de atividades físicas foi eficaz no controle do colesterol ruim, ao nível de 1%
de significância.

n Média Desvio padrão


X1 14 162,85 8,11
X2 9 153,71 6,87

Sejam X1 : “quantidade de colesterol do grupo que não praticava exercícios físicos” e X2 : “quantidade
de colesterol do grupo que praticava exercícios físicos”. Então X1 ∼ N (µ1 ; σ12 ) e X2 ∼ N (µ2 ; σ22 ),
além disso, as variâncias populacionais são iguais, dessa forma podemos aplicar o teste t de Student
para duas médias.

H : µ1 = µ2


0
P1) (Teste unilateral à direita)
: µ1 > µ2

H

1

X̄1 − X̄2
P2) Temos que α = 0, 01 e a estatística de teste é T = s  ∼ t(ν) , sendo ν = n1 + n2 − 2
1 1

2
Sc +
n1 n2
(n1 − 1) S12 + (n2 − 1) S22
e Sc2 = .
n1 + n2 − 2
P3) Temos que ν = 14 + 9 − 2 = 21 e ttab = t(21;1%) = 2, 5176. Assim a região crítica é:

RC = {t ∈ R| t > 2, 5176} ,

a qual é descrita em termos gráficos na Figura 3.

P4) Temos que

X̄1 = 162, 85, X̄2 = 153, 71, S12 = 8, 112 = 65, 7721, S22 = 6, 872 = 47, 1969,

(14 − 1) 65, 7721 + (9 − 1) 47, 1969


Sc2 =
14 + 9 − 2
1232, 6125
= = 58, 6958.
21

162, 85 − 153, 71
tcal = s  = 2, 79.
1 1

58, 6958 +
14 9
243

RNRH0 RNRH0 RNRH0 RRH0

0 2,5176 2,79

Figura 3: Região crítica do teste t, para duas médias, unilateral à direita.

Note que esse valor obtido já encontra-se na Figura 3, isso nos permitirá efetuarmos melhor as
conclusões necessárias no passo P5) a seguir.

P5) Como tcal ∈ RRH0 , há indícios para rejeitarmos H0 ao nível de 1% de significância. Dessa forma,
a quantidade de colesterol do grupo que não praticava exercícios físicos é estatisticamente maior para
o primeiro grupo, portanto, o programa de testes físicos foi eficaz no controle do colesterol ruim, ao
nível de 1% de significância.
244

4) Oito alunos foram inquiridos quanto ao seu grau de satisfação (numa escala de 0 a 100) em relação
à sua Universidade, obtendo-se os seguintes resultados:

Média Variância
70,38 244,84

Sabendo que o grau de satisfação é normalmente distribuído, teste a hipótese de que o grau de
satisfação médio é igual a 72, ao nível de 5% de significância.

Seja X : “grau de satisfação em relação à sua Universidade”, então X ∼ N (µ; σ 2 ) com σ 2 desconhe-
cido, dessa forma, podemos aplicar o teste t de Student para uma média.

H : µ = 72


0
P1) (Teste bilateral)
: µ 6= 72

H

1

X̄ − µ0
P2) Temos que α = 0, 05 e a estatística de teste é T = ∼ t(ν) sendo ν = n − 1.
SX

n
P3) Temos que ν = n − 1 = 8 − 1 = 7 e ttab = t(7;5%) = 2, 3646. Assim a região crítica é:

RC = {t ∈ R| t < −2, 3646 ou t > 2, 3646} ,

a qual é descrita em termos gráficos na Figura 4.

RRH0 RNRH0 RNRH0 RRH0

−2,3646 −0,29 0 2,3646

Figura 4: Região crítica do teste t, para uma média, bilateral.


245


P4) Temos que X̄ = 70, 38 e SX = 244, 84 = 15, 6474, assim

70, 38 − 72
tcal = 15, 6474 = −0, 29.

8

Note que esse valor obtido já encontra-se na Figura 4, isso nos permitirá efetuarmos melhor as
conclusões necessárias no passo P5) a seguir.

P5) Como tcal ∈ RN RH0 , não há indícios para rejeitarmos H0 ao nível de 5% de significância. Dessa
forma, não há indícios de que o grau de satisfação em relação à sua Universidade aumentou e, assim
não há indícios de que o grau de satisfação em relação à sua Universidade difira de 72.
246

5) O tempo médio de vida de uma lâmpada incandescente sob condições normais de funcionamento é
de 356 horas. Uma nova lâmpada apareceu recentemente no mercado e foi realizado um teste com dez
dessas lâmpadas e o tempo médio de vida foi de 380 horas com variância de 918,09 horas2 . Verifique
se o tempo de vida dessa lâmpada difere do tempo de vida das demais lâmpadas incandescentes.
Adote o nível de significância de 1%.

Seja X : “tempo médio de vida da nova lâmpada incandescente”, então X ∼ N (µ; σ 2 ) com σ 2
desconhecido, dessa forma, podemos aplicar o teste t de Student para uma média.

H : µ = 356


0
P1) (Teste bilateral)
: µ 6= 356

H

1

X̄ − µ0
P2) Temos que α = 0, 01 e a estatística de teste é T = ∼ t(ν) sendo ν = n − 1.
SX

n
P3) Temos que ν = n − 1 = 8 − 1 = 7 e ttab = t(7;1%) = 3, 4995. Assim a região crítica é:

RC = {t ∈ R| t < −3, 4995 ou t > 3, 4995} ,

a qual é descrita em termos gráficos na Figura 5.

RRH0 RNRH0 RNRH0 RRH0

−3,4995 0 2,24 3,4995

Figura 5: Região crítica do teste t, para uma média, bilateral.


P4) Temos que X̄ = 380 e SX = 918, 09 = 30, 3, assim

380 − 356
tcal = 30, 3 = 2, 24.

8
247

Note que esse valor obtido já encontra-se na Figura 5, isso nos permitirá efetuarmos melhor as
conclusões necessárias no passo P5) a seguir.

P5) Como tcal ∈ RN RH0 , não há indícios para rejeitarmos H0 ao nível de 1% de significância. Dessa
forma, não há indícios de que o tempo médio de vida da nova lâmpada incandescente difira do tempo
médio de vida das lâmpadas padrão, ao nível de 1% de significância.
248

6) Realize um teste de qui-quadrado com os dados apresentados na tabela abaixo, para decidir se a
resposta sim ou não independe da pergunta ser a primeira ou a segunda. Utilize o nível de significância
de 5%.

Pergunta
Resposta Primeira Segunda
Sim 120 80
Não 95 105


H0 : Pergunta e Resposta são independentes


P1) 
H : Pergunta e Resposta não são independentes

1

P2) Temos que α = 0, 05 e a estatística de teste é

h X
k
(Foij − Feij )2
χ =
2
∼ χ2(ν) ,
X

i=1 j=1 F eij

sendo ν = (h − 1)(k − 1).

P3) ν = (2 − 1)(2 − 1) = 1 e χ2(1;5%) = 3, 8415. A região crítica é

n o
RC = χ2 ∈ R χ2 > 3, 8415 ,

o que pode ser visto na Figura 6.

RNRH0 RRH0

0 3,8415 6,2854

Figura 6: Região crítica para o teste de χ2 .


249

Fo11 = 120, Fo12 = 80, Fo21 = 95, Fo22 = 105,

n1∗ = 200, n2∗ = 200, n∗1 = 215, n∗2 = 185,

n = 400,
200 × 215 200 × 185
Fe11 = = 107, 5, Fe12 = = 92, 5,
400 400
200 × 215 200 × 185
Fe21 = = 107, 5, Fe22 = = 92, 5.
400 400

P4) Temos que

Assim

Pergunta
Resposta Primeira Segunda Total
Sim 120(107,5) 80(92,5) (200)
Não 95(107,5) 105(92,5) (200)
Total (215) (185) (400)

Dessa forma

(120 − 107, 5)2 (80 − 92, 5)2 (95 − 107, 5)2 (105 − 92, 5)2
χ2cal = + + +
107, 5 92, 5 107, 5 92, 5
156, 25 156, 25 156, 25 156, 25
= + + +
107, 5 92, 5 107, 5 92, 5
= 1, 4535 + 1, 6892 + 1, 4535 + 1, 6892

= 6, 2854

P5) Como χ2cal ∈ RRH0 há indícios para rejeitarmos H0 ao nível de 5% de significância. Dessa forma,
há indícios de que Pergunta e Resposta não são independentes, ao nível de 5% de significância.
250

7) Realizou-se uma pesquisa com os proprietários de certa marca de automóvel com o intuito de saber
a opinião deles acerca do desempenho e do consumo de combustível de seus carros. O resultado da
pesquisa de opiniões é resumido na tabela abaixo:

Desempenho
Consumo Ruim Bom
Alto 55 45
Baixo 70 30

Verificar ao nível de 1% de significância, se devemos considerar que, no consenso geral, desempenho


e consumo não guardam relação entre si.

H0 : Desempenho e Consumo são independentes


P1) 
H : Desempenho e Consumo não são independentes

1

P2) Temos que α = 0, 01 e a estatística de teste é

k
h X
(Foij − Feij )2
χ2 = ∼ χ2(ν) ,
X

i=1 j=1 F eij

sendo ν = (h − 1)(k − 1).

P3) ν = (2 − 1)(2 − 1) = 1 e χ2(1;1%) = 6, 6349. A região crítica é

n o
RC = χ2 ∈ R χ2 > 6, 6349 ,

o que pode ser visto na Figura 7.

P4) Temos que

Fo11 = 55, Fo12 = 45, Fo21 = 70, Fo22 = 30,

n1∗ = 100, n2∗ = 100, n∗1 = 125, n∗2 = 75,

n = 200,

100 × 125 100 × 75


Fe11 = = 62, 5, Fe12 = = 37, 5,
200 200
100 × 125 100 × 75
Fe21 = = 62, 5, Fe22 = = 37, 5.
200 200

Assim
251

RNRH0 RRH0

0 4,8 6,6349

Figura 7: Região crítica para o teste de χ2 .

Desempenho
Consumo Ruim Bom Total
Alto 55(62,5) 45(37,5) (100)
Baixo 70(62,5) 30(37,5) (100)
Total (125) (75) (200)

Dessa forma

(55 − 62, 5)2 (45 − 37, 5)2 (70 − 62, 5)2 (30 − 37, 5)2
χ2cal = + + +
62, 5 37, 5 62, 5 37, 5
56, 25 56, 25 56, 25 56, 25
= + + +
62, 5 37, 5 62, 5 37, 5
= 0, 9 + 1, 5 + 0, 9 + 1, 5

= 4, 8

P5) Como χ2cal ∈ RN RH0 não há indícios para rejeitarmos H0 ao nível de 1% de significância. Dessa
forma, não há indícios de que Desempenho e Consumo são independentes, ao nível de 1% de signifi-
cância.
252

8) Os 36 alunos de uma turma são divididos ao acaso em dois grupos de 18. Para o primeiro grupo
o ensino de Matemática é feito usando elementos de multimídia. Enquanto isso, no segundo grupo
o ensino é feito pelo método tradicional. No final do período é aplicado um teste, comum aos dois
grupos, com os seguintes resultados:
Tamanho amostral Média Variância
Grupo 1 18 6,622 2,32
Grupo 2 18 5,744 0,74

Considerando as variâncias homogêneas, verifique se o desempenho dos alunos do grupo 1 é superior


ao desempenho dos alunos do grupo 2. Considere o nível de significância igual a 5%.

Sejam X1 : “desempenho dos alunos do primeiro grupo” e X2 : “desempenho dos alunos do segundo
grupo”. Então X1 ∼ N (µ1 ; σ12 ) e X2 ∼ N (µ2 ; σ22 ), além disso, as variâncias populacionais são iguais,
dessa forma podemos aplicar o teste t de Student para duas médias.

H0 : µ1 = µ2


P1)  (Teste unilateral à direita)
H : µ > µ

1 1 2

X̄1 − X̄2
P2) Temos que α = 0, 05 e a estatística de teste é T = s  ∼ t(ν) , sendo ν = n1 + n2 − 2
1 1

Sc2 +
n1 n2
(n1 − 1) S12 + (n2 − 1) S22
e Sc2 = .
n1 + n2 − 2
P3) Temos que ν = 18 + 18 − 2 = 34 e ttab = t(34;5%) = 1, 6909. Assim a região crítica é:

RC = {t ∈ R| t > 1, 6909} ,

a qual é descrita em termos gráficos na Figura 8.

P4) Temos que

X̄1 = 6, 622, X̄2 = 5, 744, S12 = 2, 32, S22 = 0, 74,

(18 − 1) 2, 32 + (18 − 1) 0, 74
Sc2 =
18 + 18 − 2
52, 02
= = 1, 53.
34

6, 622 − 5, 744
tcal = s  = 2, 13.
1 1

1, 53 +
18 18
Note que esse valor obtido já encontra-se na Figura 8, isso nos permitirá efetuarmos melhor as
conclusões necessárias no passo P5) a seguir.
253

RNRH0 RNRH0 RNRH0 RRH0

0 1,6909 2,13

Figura 8: Região crítica do teste t, para duas médias, unilateral à direita.

P5) Como tcal ∈ RRH0 , há indícios para rejeitarmos H0 ao nível de 5% de significância. Dessa forma,
o desempenho dos alunos do primeiro grupo é estatisticamente maior que o desempenho do segundo
grupo, portanto, o programa de ensino com elementos de multimídia apresentou-se superior ao ensino
tradicional, ao nível de 5% de significância.
254

9) Considere a tabela abaixo, na qual estão os resultados de um estudo que investiga a efetividade
dos capacetes de segurança de bicicleta na prevenção de lesões na cabeça. Os dados consistem de
uma amostra aleatória de 793 indivíduos envolvidos em acidentes ciclísticos durante um período
especificado de um ano.

Uso de capacete
Lesão na cabeça Sim Não
Sim 17 218
Não 130 428

Para examinar a efetividade dos capacetes de segurança de bicicleta, desejamos saber se há associação
entre o incidente de lesão na cabeça e o uso dos capacetes pelos indivíduos envolvidos em acidentes.
Efetue um teste de significância ao nível de 1% de significância.

H : Uso de capacete e Lesão na cabeça são independentes


0
P1)
: Uso de capacete e Lesão na cabeça não são independentes

H

1

P2) Temos que α = 0, 01 e a estatística de teste é

h X
k
(Foij − Feij )2
χ2 = ∼ χ2(ν) ,
X

i=1 j=1 F eij

sendo ν = (h − 1)(k − 1).

P3) ν = (2 − 1)(2 − 1) = 1 e χ2(1;1%) = 6, 6349. A região crítica é

n o
RC = χ2 ∈ R χ2 > 6, 6349 ,

o que pode ser visto na Figura 9.

P4) Temos que

Fo11 = 17, Fo12 = 218, Fo21 = 130, Fo22 = 428,

n1∗ = 235, n2∗ = 558, n∗1 = 147, n∗2 = 646,

n = 793,

235 × 147 235 × 646


Fe11 = = 43, 5624, Fe12 = = 191, 4376,
793 793
558 × 147 558 × 646
Fe21 = = 103, 4376, Fe22 = = 454, 5624.
793 793
255

RNRH0 RRH0

0 6,6349 28,2555

Figura 9: Região crítica para o teste de χ2 .

Uso de capacete
Lesão na cabeça Sim Não Total
Sim 17(43,5624) 218(191,4376) (235)
Não 130(103,4376) 428(454,5624) (558)
Total (147) (646) (793)

Assim

Dessa forma

(17 − 43, 5624)2 (218 − 191, 4376)2 (130 − 103, 4376)2 (428 − 454, 5624)2
χ2cal = + + +
43, 5624 191, 4376 103, 4376 454, 5624
705, 5611 705, 5611 705, 5611 705, 5611
= + + +
43, 5624 191, 4376 103, 4376 454, 5624
= 16, 1966 + 3, 6856 + 6, 8211 + 1, 5522

= 28, 2555

P5) Como χ2cal ∈ RRH0 há indícios para rejeitarmos H0 ao nível de 1% de significância. Dessa forma,
há indícios de que Uso de capacete e Lesão na cabeça não são independentes, ao nível de 1% de
significância.
256

10) Dois grupos de estudantes fizeram exames finais de estatística. Somente um grupo recebeu pre-
paração formal para o exame; o outro leu o texto recomendado, mas nunca compareceu às aulas. Os
resultados obtidos ao final do curso foram:

Frequência
Situação Sim Não
Aprovado 22 10
Reprovado 8 18

Os dados mostram evidências suficientes para afirmar que existe associação entre frequência às aulas
e aprovação no exame final? Use nível de significância igual a 5%.

H0 : Frequência e Situação são independentes


P1) 
H : Frequência e Situação não são independentes

1

P2) Temos que α = 0, 05 e a estatística de teste é

k
h X
(Foij − Feij )2
χ2 = ∼ χ2(ν) ,
X

i=1 j=1 F eij

sendo ν = (h − 1)(k − 1).

P3) ν = (2 − 1)(2 − 1) = 1 e χ2(1;5%) = 3, 8415. A região crítica é

n o
RC = χ2 ∈ R χ2 > 3, 8415 ,

o que pode ser visto na Figura 10.

P4) Temos que

Fo11 = 22, Fo12 = 10, Fo21 = 8, Fo22 = 18,

n1∗ = 32, n2∗ = 26, n∗1 = 30, n∗2 = 28,

n = 58,

32 × 30 32 × 28
Fe11 = = 16, 5517, Fe12 = = 15, 4483,
58 58
26 × 30 26 × 28
Fe21 = = 13, 4483, Fe22 = = 12, 5517.
58 58

Assim
257

RNRH0 RRH0

0 3,8415 8,287

Figura 10: Região crítica para o teste de χ2 .

Frequência
Situação Sim Não Total
Aprovado 22(16,5517) 10(15,4483) (32)
Reprovado 8(13,4483) 18(12,5517) (26)
Total (30) (28) (58)

Dessa forma

(22 − 16, 5517)2 (10 − 15, 4483)2 (8 − 13, 4483)2 (18 − 12, 5517)2
χ2cal = + + +
16, 5517 15, 4483 13, 4483 12, 5517
29, 684 29, 684 29, 684 29, 684
= + + +
16, 5517 15, 4483 13, 4483 12, 5517
= 1, 7934 + 1, 9215 + 2, 2073 + 2, 3649

= 8, 287

P5) Como χ2cal ∈ RRH0 há indícios para rejeitarmos H0 ao nível de 5% de significância. Dessa forma,
há indícios de que Frequência e Situação não são independentes, ao nível de 5% de significância.
258

11) A máquina de encher garrafas de refrigerantes de uma determinada empresa está regulada para
fazê-lo sob um modelo normal, colocando 290 ml no recipiente. Para verificar se a máquina estava
regulada, selecionou-se aleatoriamente uma amostra de 8 refrigerantes obtendo-se os seguintes valores:

289 290 293 294 297 298 299 303

Há indícios, ao nível de 10% de significância que a máquina esteja desregulada?

Seja X : “quantidade de líquido colocada pela máquina na garrafa de refrigerante”, então X ∼


N (µ; σ 2 ) com σ 2 desconhecido, dessa forma, podemos aplicar o teste t de Student para uma média.

H : µ = 290


0
P1) (Teste bilateral)
: µ 6= 290

H

1

X̄ − µ0
P2) Temos que α = 0, 1 e a estatística de teste é T = ∼ t(ν) sendo ν = n − 1.
S
√X
n
P3) Temos que ν = n − 1 = 8 − 1 = 7 e ttab = t(7;10%) = 1, 8946. Assim a região crítica é:

RC = {t ∈ R| t < −1, 8946 ou t > 1, 8946} ,

a qual é descrita em termos gráficos na Figura 11.

RRH0 RNRH0 RNRH0 RRH0

−1,8946 0 1,8946 3,2

Figura 11: Região crítica do teste t, para uma média, bilateral.


259

P4) Temos que


8
P
Xi
2363
X̄ = i=1
= = 6, 622
8 8
e v
u  8 2
u P
Xi
u v
(2363)2
u
u 8
uP
i=1
u
X2 − u 698129 −
u
t i=1 i 8 8
u
SX = = = 4, 7491
t
8−1 8−1
assim
295, 375 − 290
tcal = 4, 7491 = 3, 2.

8
Note que esse valor obtido já encontra-se na Figura 11, isso nos permitirá efetuarmos melhor as
conclusões necessárias no passo P5) a seguir.

P5) Como tcal ∈ RRH0 , há indícios para rejeitarmos H0 ao nível de 10% de significância. Dessa
forma, há indícios de que a quantidade de líquido colocada pela máquina na garrafa de refrigerante
difira de 290 ml, ao nível de 10% de significância.
260

12) Na tabela a seguir é apresentado um resumo de um estudo conduzido com alguns estudantes.
Foram amostrados 200 homens e esses foram categorizados quanto ao hábito de fumar e praticar
exercícios físicos. Teste a hipótese de que o hábito de fumar e o hábito de praticar exercícios físicos
são duas variáveis aleatórias independentes. Adote um nível de significância de 5% e MF=“Muito
frequente”; FR=“Frequente”; OC=“Ocasionalmente”; N=“Nunca.”

Hábito de praticar exercícios


Hábito de fumar
MF FR OC N
Sim 7 10 13 20
Ocasionalmente 24 23 25 28
Não 18 15 8 9


H : Hábito de fumar e Hábito de praticar exercícios são independentes


0
P1)
: Hábito de fumar e Hábito de praticar exercícios não são independentes

H

1

P2) Temos que α = 0, 05 e a estatística de teste é

k
h X
(Foij − Feij )2
χ2 = ∼ χ2(ν) ,
X

i=1 j=1 F eij

sendo ν = (h − 1)(k − 1).

P3) ν = (3 − 1)(4 − 1) = 6 e χ2(6;5%) = 12, 5916. A região crítica é

n o
RC = χ2 ∈ R χ2 > 12, 5916 ,

o que pode ser visto na Figura 12.

P4) Temos que

Fo11 = 7, Fo12 = 10, Fo13 = 13, Fo14 = 20,


Fo21 = 24, Fo22 = 23, Fo23 = 25, Fo24 = 28,
Fo31 = 18, Fo32 = 15, Fo33 = 8, Fo34 = 9,

n1∗ = 50, n2∗ = 100, n3∗ = 50, n∗1 = 49,


n∗2 = 48, n∗3 = 46, n∗4 = 57, n = 200,

Assim
261

RNRH0 RRH0

0 11,7821 12,5916

Figura 12: Região crítica para o teste de χ2 .


50 × 49 50 × 48 50 × 46
Fe11 = = 12, 25, Fe12 = = 12, Fe13 = = 11, 5,
200 200 200
50 × 57 100 × 49 100 × 48
Fe14 = = 14, 25, Fe21 = = 24, 5, Fe22 = = 24,
200 200 200
100 × 46 100 × 57 50 × 49
Fe23 = = 23. Fe24 = = 28, 5, Fe31 = = 12, 25,
200 200 200
50 × 48 50 × 46 50 × 57
Fe32 = = 12, Fe33 = = 11, 5, Fe34 = = 14, 25.
200 200 200
Hábito de praticar exercícios
Hábito de fumar Total
MF FR OC N
Sim 7(12,25) 10(12) 13(11,5) 20(14,25) (50)
Ocasionalmente 24(24,5) 23(24) 25(23) 28(28,5) (100)
Não 18(12,25) 15(12) 8(11,5) 9(14,25) (50)
Total (49) (48) (46) (57) (200)

Dessa forma

(7 − 12, 25)2 (10 − 12)2 (13 − 11, 5)2 (20 − 14, 25)2 (24 − 24, 5)2 (23 − 24)2
χ2cal = + + + + +
12, 25 12 11, 5 14, 25 24, 5 24
(25 − 23) 2
(28 − 28, 5)2
(18 − 12, 25)2
(15 − 12) 2
(8 − 11, 5)2
(9 − 14, 25)2
+ + + + + +
23 28, 5 12, 25 12 11, 5 14, 25
27, 5625 4 2, 25 33, 0625 0, 25 1 4 0, 25 33, 0625 9
= + + + + + + + + +
12, 25 12 11, 5 14, 25 24, 5 24 23 28, 5 12, 25 12
12, 25 27, 5625
+ +
11, 5 14, 25
= 2, 25 + 0, 3333 + 0, 1957 + 2, 3202 + 0, 0102 + 0, 0417 + 0, 1739 + 0, 0088 + 2, 699 + 0, 75

+ 1, 0652 + 1, 9342

= 11, 7821
262

P5) Como χ2cal ∈ RN RH0 não há indícios para rejeitarmos H0 ao nível de 5% de significância. Dessa
forma, não há indícios de que Hábito de fumar e Hábito de praticar exercícios são independentes, ao
nível de 5% de significância.
263

13) O tempo médio, por operário, para executar uma tarefa tem sido 100 minutos. Introduziu-se uma
modificação para diminuir esse tempo médio e, após certo período, sorteou-se uma amostra de 16
operários, medindo-se o tempo de execução de cada um. Nessa amostra, o tempo médio foi de 95
minutos e com desvio padrão de 12 minutos. Realize um teste de hipóteses para verificar se esses
resultados trazem evidências estatísticas da melhora desejada, ao nível de 1% de significância.

Seja X : “tempo que o operário leva para executar a tarefa”, então X ∼ N (µ; σ 2 ) com σ 2 desconhe-
cido, dessa forma, podemos aplicar o teste t de Student para uma média.

H : µ = 100


0
P1) (Teste unilateral à esquerda)
: µ < 100

H

1

X̄ − µ0
P2) Temos que α = 0, 01 e a estatística de teste é T = ∼ t(ν) sendo ν = n − 1.
SX

n
P3) Temos que ν = n − 1 = 16 − 1 = 15 e ttab = t(15;1%) = 2, 6025. Assim a região crítica é:

RC = {t ∈ R| t < −2, 6025} ,

a qual é descrita em termos gráficos na Figura 13.

RRH0 RNRH0 RNRH0 RNRH0

−2,6025 −1,67 0

Figura 13: Região crítica do teste t, para uma média, unilateral à esquerda.

P4) Temos que X̄ = 95 e SX = 12, assim

95 − 100
tcal = 12 = −1, 67.

16
264

Note que esse valor obtido já encontra-se na Figura 13, isso nos permitirá efetuarmos melhor as
conclusões necessárias no passo P5) a seguir.

P5) Como tcal ∈ RN RH0 , não há indícios para rejeitarmos H0 ao nível de 1% de significância. Dessa
forma, não há indícios de que o tempo que o operário leva para executar a tarefa diminuiu e, assim
não há indícios de que a modificação introduzida tenha surtido efeito.
265

14) Um estudo realizado com 609 homens, com idades entre 40 e 76 anos, forneceu os resultados
apresentados na tabela a seguir. Adote o nível de significância igual a 1% e teste a hipótese de que
o nível de catecolamina no sangue e a incidência de doença coronariana são independentes.

Nível de catecolamina
Doença coronariana
Alto Baixo
Presente 27 44
Ausente 95 443


H0 : Doença coronariana e Nível de catecolamina são independentes


P1) 
H : Doença coronariana e Nível de catecolamina não são independentes

1

P2) Temos que α = 0, 01 e a estatística de teste é

h X
k
(Foij − Feij )2
χ2 = ∼ χ2(ν) ,
X

i=1 j=1 F eij

sendo ν = (h − 1)(k − 1).

P3) ν = (2 − 1)(2 − 1) = 1 e χ2(1;1%) = 6, 6349. A região crítica é

n o
RC = χ2 ∈ R χ2 > 6, 6349 ,

o que pode ser visto na Figura 14.

RNRH0 RRH0

0 6,6349 16,2465

Figura 14: Região crítica para o teste de χ2 .

P4) Temos que

Assim
266

Fo11 = 27, Fo12 = 44, Fo21 = 95, Fo22 = 443,

n1∗ = 71, n2∗ = 538, n∗1 = 122, n∗2 = 487,

n = 609,
71 × 122 71 × 487
Fe11 = = 14, 2233, Fe12 = = 56, 7767,
609 609
538 × 122 538 × 487
Fe21 = = 107, 7767, Fe22 = = 430, 2233.
609 609
Doença coronariana
Nível de catecolamina Alto Baixo Total
Presente 27(14,2233) 44(56,7767) (71)
Ausente 95(107,7767) 443(430,2233) (538)
Total (122) (487) (609)

Dessa forma

(27 − 14, 2233)2 (44 − 56, 7767)2 (95 − 107, 7767)2 (443 − 430, 2233)2
χ2cal = + + +
14, 2233 56, 7767 107, 7767 430, 2233
163, 2441 163, 2441 163, 2441 163, 2441
= + + +
14, 2233 56, 7767 107, 7767 430, 2233
= 11, 4772 + 2, 8752 + 1, 5147 + 0, 3794

= 16, 2465

P5) Como χ2cal ∈ RRH0 há indícios para rejeitarmos H0 ao nível de 1% de significância. Dessa forma,
há indícios de que Doença coronariana e Nível de catecolamina não são independentes, ao nível de
1% de significância.
267

15) A tabela a seguir apresenta os resultados de um ensaio com 154 pacientes que apresentavam dor
abdominal. Ao grupo Tratamento foi administrado brometo de pinavério (dois comprimidos/dia);
ao grupo controle foi administrado um placebo (fármaco inerte).

Permanência da dor abdominal


Grupo
Sim Não
Tratamento 6 57
Controle 30 61

Teste a independência entre as variáveis, adote 5% de significância.



H : Grupo e Permanência da dor abdominal são independentes


0
P1)
: Grupo e Permanência da dor abdominal não são independentes

H

1

P2) Temos que α = 0, 05 e a estatística de teste é

h X
k
(Foij − Feij )2
χ2 = ∼ χ2(ν) ,
X

i=1 j=1 Feij

sendo ν = (h − 1)(k − 1).

P3) ν = (2 − 1)(2 − 1) = 1 e χ2(1;5%) = 3, 8415. A região crítica é

n o
RC = χ2 ∈ R χ2 > 3, 8415 ,

o que pode ser visto na Figura 15.

RNRH0 RRH0

0 3,8415 11,4223

Figura 15: Região crítica para o teste de χ2 .


268

P4) Temos que

Fo11 = 6, Fo12 = 57, Fo21 = 30, Fo22 = 61,

n1∗ = 63, n2∗ = 91, n∗1 = 36, n∗2 = 118,

n = 154,

63 × 36 63 × 118
Fe11 = = 14, 7273, Fe12 = = 48, 2727,
154 154

91 × 36 91 × 118
Fe21 = = 21, 2727, Fe22 = = 69, 7273.
154 154

Assim

Grupo
Permanência da dor abdominal Total
Sim Não
Tratamento 6(14,7273) 57(48,2727) (63)
Controle 30(21,2727) 61(69,7273) (91)
Total (36) (118) (154)

Dessa forma

(6 − 14, 7273)2 (57 − 48, 2727)2 (30 − 21, 2727)2 (61 − 69, 7273)2
χ2cal = + + +
14, 7273 48, 2727 21, 2727 69, 7273
76, 1658 76, 1658 76, 1658 76, 1658
= + + +
14, 7273 48, 2727 21, 2727 69, 7273
= 5, 1717 + 1, 5778 + 3, 5804 + 1, 0923

= 11, 4223

P5) Como χ2cal ∈ RRH0 há indícios para rejeitarmos H0 ao nível de 5% de significância. Dessa forma,
há indícios de que Grupo e Permanência da dor abdominal não são independentes, ao nível de 5%
de significância.
269

16) Com a finalidade de verificar se o nível nutricional da mãe afeta a massa do recém-nascido, foram
observadas duas amostras de nascimentos. A primeira foi extraída de uma maternidade particular
(localidade X1 ), onde as mães são, em geral, bem nutridas. A outra amostra foi tirada de uma
maternidade pública, numa região extremamente pobre (localidade X2 ), onde acredita-se que as
mães não são bem nutridas. Os dados observados apresentaram:

Localidade Tamanho amostral Massa média (kg) Desvio padrão (kg)


X1 18 4,1 1,6
X2 20 2,7 2,4

Realize um teste de hipóteses para verificar se há evidência suficiente de que as crianças da localidade
X1 nascem em média, com massa superior aos recém nascidos da localidade X2 . Suponha que as
massas nas duas localidades são normalmente distribuídas com mesma variância e utilize o nível de
significância igual a 1%.

Sejam X1 : “massa das crianças nascidas na localidade X1 ” e X2 : “massa das crianças nascidas na
localidade X2 ”. Então X1 ∼ N (µ1 ; σ12 ) e X2 ∼ N (µ2 ; σ22 ), além disso, as variâncias populacionais
são iguais, dessa forma podemos aplicar o teste t de Student para duas médias.

H0 : µ1 = µ2


P1)  (Teste unilateral à direita)
H : µ > µ

1 1 2

X̄1 − X̄2
P2) Temos que α = 0, 01 e a estatística de teste é T = s  ∼ t(ν) , sendo ν = n1 + n2 − 2
1 1

2
Sc +
n1 n2
(n1 − 1) S12 + (n2 − 1) S22
e Sc2 = .
n1 + n2 − 2
P3) Temos que ν = 18 + 20 − 2 = 36 e ttab = t(36;1%) = 2, 4345. Assim a região crítica é:

RC = {t ∈ R| t > 2, 4345} ,

a qual é descrita em termos gráficos na Figura 16.

P4) Temos que

X̄1 = 4, 1, X̄2 = 2, 7, S12 = 2, 56, S22 = 5, 76,

(18 − 1) 2, 56 + (20 − 1) 5, 76
Sc2 =
18 + 20 − 2
152, 96
= = 4, 2489.
36
270

RNRH0 RNRH0 RNRH0 RRH0

0 2,09 2,4345

Figura 16: Região crítica do teste t, para duas médias, unilateral à direita.

4, 1 − 2, 7
tcal = s  = 2, 09.
1 1

4, 2489 +
18 20
Note que esse valor obtido já encontra-se na Figura 16, isso nos permitirá efetuarmos melhor as
conclusões necessárias no passo P5) a seguir.

P5) Como tcal ∈ RN RH0 , não há indícios para rejeitarmos H0 ao nível de 1% de significância. Dessa
forma, não há indícios de que o massa das crianças nascidas na localidade X1 seja estatisticamente
maior que o massa das crianças nascidas na localidade X2 , ao nível de 1% de significância.
271

17) Suspeita-se que o tempo médio, por operário, para executar uma tarefa, é maior para operários
do sexo masculino. Nádia tomou duas amostras: operários do sexo masculino e do sexo feminino,
medindo o tempo de execução de cada um, tendo determinado que as variâncias são homogêneas.
Seus resultados foram: o tempo médio da amostra de 14 operários do sexo masculino foi de 94,5
minutos, e o desvio padrão foi de 10 minutos; e o tempo médio da amostra de 15 operárias do sexo
feminino foi de 89 minutos, e o desvio padrão foi de 9 minutos. Realize um teste de hipóteses para
verificar se os operários do sexo masculino são, em média, mais lentos (demoram mais) para executar
a tarefa. Adote o nível de significância 0, 025.

Sejam X1 : “tempo que os operários do sexo masculino levam para executar a tarefa” e X2 : “tempo
que as operárias do sexo feminino levam para executar a tarefa”. Então X1 ∼ N (µ1 ; σ12 ) e X2 ∼
N (µ2 ; σ22 ), além disso, as variâncias populacionais são iguais, dessa forma podemos aplicar o teste t
de Student para duas médias.

H : µ1 = µ2


0
P1) (Teste unilateral à direita)
: µ1 > µ2

H

1

X̄1 − X̄2
P2) Temos que α = 0, 025 e a estatística de teste é T = s  ∼ t(ν) , sendo ν = n1 + n2 − 2
1 1

Sc2 +
n1 n2
(n1 − 1) S12 + (n2 − 1) S22
e Sc2 = .
n1 + n2 − 2
P3) Temos que ν = 14 + 15 − 2 = 27 e ttab = t(27;2,5%) = 2, 0518. Assim a região crítica é:

RC = {t ∈ R| t > 2, 0518} ,

a qual é descrita em termos gráficos na Figura 17.

P4) Temos que

X̄1 = 94, 5, X̄2 = 89, S12 = 100, S22 = 81,

(14 − 1) 100 + (15 − 1) 81


Sc2 =
14 + 15 − 2
2434
= = 90, 1481.
27

94, 5 − 89
tcal = s  = 1, 56.
1 1

90, 1481 +
14 15
Note que esse valor obtido já encontra-se na Figura 17, isso nos permitirá efetuarmos melhor as
conclusões necessárias no passo P5) a seguir.
272

RNRH0 RNRH0 RNRH0 RRH0

0 1,56 2,0518

Figura 17: Região crítica do teste t, para duas médias, unilateral à direita.

P5) Como tcal ∈ RN RH0 , não há indícios para rejeitarmos H0 ao nível de 2,5% de significância. Dessa
forma, não há indícios de que o tempo que os operários do sexo masculino levam para executar a
tarefa seja estatisticamente maior que o tempo que as operárias do sexo feminino levam para executar
a tarefa, ao nível de 2,5% de significância.
273

18) Em uma determinada universidade a média em uma determinada disciplina tem distribuição
normal e a média tem sido de 64 pontos. Implantou-se um programa de monitorias e tutorias nessa
disciplina a fim de aumentar a nota média e, consequentemente diminuir a reprovação. Ao final do
semestre, 9 alunos foram selecionados observando-se suas notas, obtendo-se:

65 70 75 64 69 70 72 68 77

Realize um teste de hipóteses para verificar se há indícios, ao nível de 1% de significância que o


programa de monitorias e tutorias foi eficaz.

Seja X : “nota obtida pelos alunos”, então X ∼ N (µ; σ 2 ) com σ 2 desconhecido, dessa forma, podemos
aplicar o teste t de Student para uma média.

H0 : µ = 64


P1)  (Teste unilateral à direita)
H : µ > 64

1

X̄ − µ0
P2) Temos que α = 0, 01 e a estatística de teste é T = ∼ t(ν) sendo ν = n − 1.
S
√X
n
P3) Temos que ν = n − 1 = 9 − 1 = 8 e ttab = t(8;1%) = 2, 8965. Assim a região crítica é:

RC = {t ∈ R| t > 2, 8965} ,

a qual é descrita em termos gráficos na Figura 18.

RNRH0 RNRH0 RNRH0 RRH0

0 2,8965 4,34

Figura 18: Região crítica do teste t, para uma média, unilateral à direita.
274

P4) Temos que


9
P
Xi
630, 0012
X̄ = i=1
= = 94, 5
9 9
e v
u  9 2
u P
Xi
u v
(630, 0012)2
u
u 9
uP
i=1
u
X2 − u 44237, 7018 −
u
t i=1 i 9 9
u
SX = = = 4, 1463
t
9−1 9−1
assim
70, 0001 − 64
tcal = 4, 1463 = 4, 34.

9
Note que esse valor obtido já encontra-se na Figura 18, isso nos permitirá efetuarmos melhor as
conclusões necessárias no passo P5) a seguir.

P5) Como tcal ∈ RRH0 , há indícios para rejeitarmos H0 ao nível de 1% de significância. Dessa forma,
há indícios de que a nota obtida pelos alunos aumentou e, assim há indícios de que o programa de
monitorias e tutorias foi eficaz.
275

19) O técnico de uma equipe de basquete soube que, a utilização de cafeína por parte dos jogadores
pode melhorar o desempenho dos mesmos durante os jogos. Com o intuito de testar essa hipótese,
ele realizou um treino entre seus atletas e, dividiu-os aleatoriamente em dois grupos dando-lhes uma
pílula meia hora antes do treino. O primeiro grupo (X1 ), recebeu uma pílula de farinha (placebo),
enquanto que, o grupo (X2 ) recebeu uma pílula com cafeína. Em uma série de 30 lances livres de
cada atleta, ele anotou o número de acertos que cada um deles teve, obtendo:

X1 22 13 16 9 15
X2 28 23 15 15 14

Suponha que o número de cestas de cada um dos grupos seja normalmente distribuído e com mesma
variância populacional nos dois grupos, isto é, X1 ∼ N (µ1 ; σ 2 ) e X2 ∼ N (µ2 ; σ 2 ). Há indícios, ao
nível de 1% de significância, que a cafeína melhore o desempenho dos jogadores?

Sejam X1 : “desempenho do grupo de jogadores que recebeu a pílula com o placebo” e X2 : “de-
sempenho do grupo de jogadores que recebeu a pílula com cafeína”. Então X1 ∼ N (µ1 ; σ12 ) e
X2 ∼ N (µ2 ; σ22 ), além disso, as variâncias populacionais são iguais, dessa forma podemos aplicar o
teste t de Student para duas médias.

H : µ1 = µ2


0
P1) (Teste unilateral à esquerda)
: µ1 < µ2

H

1

X̄1 − X̄2
P2) Temos que α = 0, 01 e a estatística de teste é T = s  ∼ t(ν) , sendo ν = n1 + n2 − 2
1 1

2
Sc +
n1 n2
(n1 − 1) S12 + (n2 − 1) S22
e Sc2 = .
n1 + n2 − 2
P3) Temos que ν = 5 + 5 − 2 = 8 e ttab = t(8;1%) = 2, 8965. Assim a região crítica é:

RC = {t ∈ R| t < −2, 8965} ,

a qual é descrita em termos gráficos na Figura 19.


276

RRH0 RNRH0 RNRH0 RNRH0

−2,8965 −1,15 0

Figura 19: Região crítica do teste t, para duas médias, unilateral à esquerda.

P4) Temos que

5
P
X1i
75
X̄1 = i=1
= = 15,
5 5
5
P
X2i
95
X̄2 = i=1
= = 19,
5 5
 5 2
P
5 X1i
2
− i=1
P
X1i 5
2
1215 − (75)
S12 = i=1
= 5
= 17, 1915,
5−1 5−1
 5
2
P
5 X2i
2
− i=1
P
X2i 5
2
1959 − (95)
S22 = i=1
= 5
= 81,
5−1 5−1

(5 − 1) 17, 1915 + (5 − 1) 81
Sc2 =
5+5−2
392, 766
= = 49, 0958.
8

15 − 19
tcal = s  = −1, 15.
1 1

49, 0958 +
5 5
Note que esse valor obtido já encontra-se na Figura 19, isso nos permitirá efetuarmos melhor as
conclusões necessárias no passo P5) a seguir.
277

P5) Como tcal ∈ RN RH0 , não há indícios para rejeitarmos H0 ao nível de 1% de significância. Dessa
forma, não há indícios de que o desempenho do grupo de jogadores que recebeu a pílula com o placebo
seja estatisticamente inferior ao desempenho do grupo de jogadores que recebeu a pílula com cafeína,
ao nível de 1% de significância.
278

20) Em um estudo que objetivava estudar a pressão sanguínea (mmHg) e o nível de colesterol
(mg/100cm) de indivíduos adultos, obteve-se a seguinte tabela:

Pressão
Colesterol
Menos que 127 De 127 a 166 Mais que 166
Menos que 200 117 168 22
De 200 a 260 204 418 63
Mais que 260 67 145 33

Realize um teste de hipóteses, ao nível de 1% de significância, para verificar se existe independência


entre as variáveis sob estudo.

H : Colesterol e Pressão são independentes


0
P1)
: Colesterol e Pressão não são independentes

H

1

P2) Temos que α = 0, 01 e a estatística de teste é

h X
k
(Foij − Feij )2
χ =
2
∼ χ2(ν) ,
X

i=1 j=1 Feij

sendo ν = (h − 1)(k − 1).

P3) ν = (3 − 1)(3 − 1) = 4 e χ2(4;1%) = 13, 2767. A região crítica é

n o
RC = χ2 ∈ R χ2 > 13, 2767 ,

o que pode ser visto na Figura 20.

P4) Temos que

Fo11 = 117, Fo12 = 168, Fo13 = 22, Fo21 = 204, Fo22 = 418,
Fo23 = 63, Fo31 = 67, Fo32 = 145, Fo33 = 33,

n1∗ = 307, n2∗ = 685, n3∗ = 245, n1∗ = 388,


n2∗ = 731, n∗3 = 118, n = 1237,

307 × 388 307 × 731 685 × 118


Fe11 = = 96, 2943, Fe12 = = 181, 4204, Fe13 = = 29, 2854,
1237 1237 1237
685 × 388 685 × 731 685 × 118
Fe21 = = 214, 8585, Fe22 = = 404, 7979, Fe23 = = 65, 3436,
1237 1237 1237
307 × 388 307 × 731 685 × 118
Fe31 = = 76, 8472, Fe32 = = 144, 7817, Fe33 = = 23, 3711.
1237 1237 1237
279

RNRH0 RRH0

0 13,2767 13,5501

Figura 20: Região crítica para o teste de χ2 .

Pressão
Colesterol Menos que 127 De 127 a 166 Mais que 166 Total
Menos que 200 117(96,2943) 168(181,4204) 22(29,2854) (307)
De 200 a 260 204(214,8585) 418(404,7979) 63(65,3436) (685)
Mais que 260 67(76,8472) 145(144,7817) 33(23,3711) (245)
Total (388) (731) (118) (1237)

Assim

Dessa forma

(117 − 96, 2943)2 (168 − 181, 4204)2 (22 − 29, 2854)2 (204 − 214, 8585)2
χ2cal = + + +
96, 2943 181, 4204 29, 2854 214, 8585
(418 − 404, 7979) 2
(63 − 65, 3436)2
(67 − 76, 8472)2
(145 − 144, 7817)2
+ + + +
404, 7979 65, 3436 76, 8472 144, 7817
(33 − 23, 3711) 2
+
23, 3711
428, 726 180, 1071 53, 0771 117, 907 174, 2954 5, 4925 96, 9673
= + + + + + +
96, 2943 181, 4204 29, 2854 214, 8585 404, 7979 65, 3436 76, 8472
0, 0477 92, 7157
+ +
144, 7817 23, 3711
= 4, 4522 + 0, 9928 + 1, 8124 + 0, 5488 + 0, 4306 + 0, 0841 + 1, 2618 + 0, 0003 + 3, 9671

= 13, 5501

P5) Como χ2cal ∈ RRH0 há indícios para rejeitarmos H0 ao nível de 1% de significância. Dessa forma,
há indícios de que Colesterol e Pressão não são independentes, ao nível de 1% de significância.
280

21) Em um trecho de uma rodoviária estadual, quando é utilizado o radar, são verificadas em média
7 infrações diárias por excesso de velocidade. O chefe de polícia acredita que esse número pode ter
aumentado. Para verificar isso, o radar foi mantido por 10 dias consecutivos, e em média obteve-se
8 infrações diárias com desvio-padrão de 2,11. Verifique, supondo normalidade e usando nível de
significância igual a 0, 05, se houve aumento no número de infrações.

Seja X : “número de infrações diárias por excesso de velocidade”, então X ∼ N (µ; σ 2 ) com σ 2
desconhecido, dessa forma, podemos aplicar o teste t de Student para uma média.

H : µ=7


0
P1) (Teste unilateral à direita)
: µ>7

H

1

X̄ − µ0
P2) Temos que α = 0, 05 e a estatística de teste é T = ∼ t(ν) sendo ν = n − 1.
SX

n
P3) Temos que ν = n − 1 = 10 − 1 = 9 e ttab = t(9;5%) = 1, 8331. Assim a região crítica é:

RC = {t ∈ R| t > 1, 8331} ,

a qual é descrita em termos gráficos na Figura 2.

RNRH0 RNRH0 RNRH0 RRH0

0 1,5 1,8331

Figura 21: Região crítica do teste t, para uma média, unilateral à direita.

P4) Temos que X̄ = 8 e SX = 2, 11, assim

8−7
tcal = 2, 11 = 1, 5.

10
281

Note que esse valor obtido já encontra-se na Figura 21, isso nos permitirá efetuarmos melhor as
conclusões necessárias no passo P5) a seguir.

P5) Como tcal ∈ RN RH0 , não há indícios para rejeitarmos H0 ao nível de 5% de significância. Dessa
forma, não há indícios de que o número de infrações diárias por excesso de velocidade aumentou e,
assim não há ao nível de 5% de significância.
282

22) O INMETRO está investigando se a quantidade de Paracetamol num dado comprimido está de
acordo com o valor nominal estampado no rótulo do medicamento (750 mg). Numa amostra de 20
comprimidos, a média encontrada foi de 738 mg com um desvio-padrão de 11,85 mg. Teste a hipótese
de que a quantidade média de Paracetamol é igual ao valor nominal informado pelo fabricante. Utilize
nível de significância igual a 0, 05 e suponha normalidade da variável estudada.

Seja X : “quantidade de Paracetamol num dado comprimido”, então X ∼ N (µ; σ 2 ) com σ 2 desco-
nhecido, dessa forma, podemos aplicar o teste t de Student para uma média.

H : µ = 750


0
P1) (Teste bilateral)
: µ 6= 750

H

1

X̄ − µ0
P2) Temos que α = 0, 05 e a estatística de teste é T = ∼ t(ν) sendo ν = n − 1.
SX

n
P3) Temos que ν = n − 1 = 20 − 1 = 19 e ttab = t(19;5%) = 2, 093. Assim a região crítica é:

RC = {t ∈ R| t < −2, 093 ou t > 2, 093} ,

a qual é descrita em termos gráficos na Figura 22.

RRH0 RNRH0 RNRH0 RRH0

−4,53 −2,093 0 2,093

Figura 22: Região crítica do teste t, para uma média, bilateral.


P4) Temos que X̄ = 738 e SX = 140, 4225 = 11, 85, assim

738 − 750
tcal = 11, 85 = −4, 53.

20
283

Note que esse valor obtido já encontra-se na Figura 22, isso nos permitirá efetuarmos melhor as
conclusões necessárias no passo P5) a seguir.

P5) Como tcal ∈ RRH0 , há indícios para rejeitarmos H0 ao nível de 5% de significância. Dessa forma,
há indícios de que a quantidade de Paracetamol num dado comprimido difira do padrão, ao nível de
5% de significância.
284

23) Num estudo comparativo do tempo médio de adaptação, uma amostra aleatória, de 28 homens e
34 mulheres de um grande complexo industrial, produziu os seguintes resultados:

Mulheres Homens
X̄ 3,7 anos 3,2 anos
S (X) 0,9 anos 0,8 anos

Determinar se há diferença entre o tempo de adaptação entre homens e mulheres. Utilize nível de
significância igual a 0,05 e suponha normalidade das variáveis estudadas e homocedasticidade das
variâncias.

Sejam X1 : “tempo de adaptação dos homens” e X2 : “tempo de adaptação das mulheres”. Então
X1 ∼ N (µ1 ; σ12 ) e X2 ∼ N (µ2 ; σ22 ), além disso, as variâncias populacionais são iguais, dessa forma
podemos aplicar o teste t de Student para duas médias.

H : µ1 = µ2


0
P1) (Teste bilateral)
: µ1 6= µ2

H

1

X̄1 − X̄2
P2) Temos que α = 0, 05 e a estatística de teste é T = s  ∼ t(ν) , sendo ν = n1 + n2 − 2
1 1

2
Sc +
n1 n2
(n1 − 1) S12 + (n2 − 1) S22
e Sc2 = .
n1 + n2 − 2
P3) Temos que ν = 28 + 34 − 2 = 60 e ttab = t(60;5%) = 2, 0003. Assim a região crítica é:

RC = {t ∈ R| t < −2, 0003 ou t > 2, 0003} ,

a qual é descrita em termos gráficos na Figura 23.

P4) Temos que

X̄1 = 3, 7,

X̄2 = 3, 2,

S12 = (0, 9)2 = 0, 81,

S22 = (0, 8)2 = 0, 64,


(28 − 1) 0, 81 + (34 − 1) 0, 64 42, 99
Sc2 = = = 0, 7165,
28 + 34 − 2 60

e
3, 7 − 3, 2
tcal = s  = 2, 31.
1 1

0, 7165 +
28 34
285

RRH0 RNRH0 RNRH0 RRH0

−2,0003 0 2,0003 2,31

Figura 23: Região crítica do teste t, para duas médias, bilateral.

Note que esse valor obtido já encontra-se na Figura 23, isso nos permitirá efetuarmos melhor as
conclusões necessárias no passo P5) a seguir.

P5) Como tcal ∈ RRH0 , há indícios para rejeitarmos H0 ao nível de 5% de significância. Dessa
forma, o tempo de adaptação dos homens é estatisticamente diferente do tempo de adaptação
das mulheres, ao nível de 5% de significância.
286

24) Uma pesquisa foi desenvolvida com o intuito de avaliar a opinião sobre a qualidade do atendimento
médico em clínicas especializadas e não especializadas. Um total de 350 pessoas foram entrevistadas
quanto a opinião do atendimento (bom, regular e ruim) nos dois tipos de clínicas, e os resultados
encontram-se na tabela de frequência abaixo. Você diria que a opinião depende do tipo de clínica na
qual o paciente foi atendido? Utilize nível de significância igual a 0, 025.

Opinião
Clínica Bom Regular Ruim
Especializadas 73 37 40
Não especializadas 94 61 45


H : Clínica e Opinião são independentes


0
P1)
: Clínica e Opinião não são independentes

H

1

P2) Temos que α = 0, 025 e a estatística de teste é

k
h X
(Foij − Feij )2
χ2 = ∼ χ2(ν) ,
X

i=1 j=1 F eij

sendo ν = (h − 1)(k − 1).

P3) ν = (2 − 1)(3 − 1) = 2 e χ2(2;2,5%) = 7, 3778. A região crítica é

n o
RC = χ2 ∈ R χ2 > 7, 3778 ,

o que pode ser visto na Figura 24.

RNRH0 RRH0

0 1,7043 7,3778

Figura 24: Região crítica para o teste de χ2 .


287

Fo11 = 73, Fo12 = 37, Fo13 = 40,


Fo21 = 94, Fo22 = 61, Fo23 = 45,

n1∗ = 150, n2∗ = 200, n1∗ = 167,


n2∗ = 98, n∗3 = 85, n = 350,
150 × 167 150 × 98 200 × 85
Fe11 = = 71, 5714, Fe12 = = 42, Fe13 = = 36, 4286,
350 350 350
200 × 167 200 × 98 200 × 85
Fe21 = = 95, 4286, Fe22 = = 56, Fe23 = = 48, 5714,
350 350 350

P4) Temos que

Assim

Opinião
Clínica Bom Regular Ruim Total
Especializadas 73(71,5714) 37(42) 40(36,4286) (150)
Não especializadas 94(95,4286) 61(56) 45(48,5714) (200)
Total (167) (98) (85) (350)

Dessa forma

(73 − 71, 5714)2 (37 − 42)2 (40 − 36, 4286)2 (94 − 95, 4286)2
χ2cal = + + +
71, 5714 42 36, 4286 95, 4286
(61 − 56) 2
(45 − 48, 5714)2
+ +
56 48, 5714
2, 0409 25 12, 7549 2, 0409 25 12, 7549
= + + + + +
71, 5714 42 36, 4286 95, 4286 56 48, 5714

= 1, 7043

P5) Como χ2cal ∈ RN RH0 não há indícios para rejeitarmos H0 ao nível de 2, 5% de significância. Dessa
forma, não há indícios de que Clínica e Opinião são independentes, ao nível de 2, 5% de significância.
288

25) Suponhamos que duas técnicas de memorização X1 e X2 deverão ser comparadas medindo-se a
eficiência pelo tempo exigido para decorar certo tipo de material. O mesmo material foi apresentado a
nX1 = 18 e nX2 = 13 pessoas que o decoraram usando as técnicas X1 e X2 respectivamente. Sabendo-
se que há normalidade das variáveis estudadas e homocedasticidade das variâncias, verifique se há
diferença significativa entre as duas técnicas de memorização, adotando nível de significância igual a
5%, sabendo que os resultados amostrais obtidos foram:
n Média(min) Variância(min2 )
X1 18 20 12
X2 13 17 15

Sejam X1 : “tempo exigido para decorar certo tipo de material pelo método de memorização X1 ” e
X2 : “tempo exigido para decorar certo tipo de material pelo método de memorização X2 ”. Então
X1 ∼ N (µ1 ; σ12 ) e X2 ∼ N (µ2 ; σ22 ), além disso, as variâncias populacionais são iguais, dessa forma
podemos aplicar o teste t de Student para duas médias.

H : µ1 = µ2


0
P1) (Teste bilateral)
: µ1 6= µ2

H

1

X̄1 − X̄2
P2) Temos que α = 0, 05 e a estatística de teste é T = s  ∼ t(ν) , sendo ν = n1 + n2 − 2
1 1

2
Sc +
n1 n2
(n1 − 1) S12 + (n2 − 1) S22
e Sc2 = .
n1 + n2 − 2
P3) Temos que ν = 18 + 13 − 2 = 29 e ttab = t(29;5%) = 2, 0452. Assim a região crítica é:

RC = {t ∈ R| t < −2, 0452 ou t > 2, 0452} ,

a qual é descrita em termos gráficos na Figura 25.

P4) Temos que

X̄1 = 20,

X̄2 = 17,

S12 = (3, 4641)2 = 12,

S22 = (3, 873)2 = 15,


(18 − 1) 12 + (13 − 1) 15 384
Sc2 = = = 13, 2414,
18 + 13 − 2 29

e
20 − 17
tcal = s  = 2, 27.
1 1

13, 2414 +
18 13
289

RRH0 RNRH0 RNRH0 RRH0

−2,0452 0 2,0452 2,27

Figura 25: Região crítica do teste t, para duas médias, bilateral.

Note que esse valor obtido já encontra-se na Figura 25, isso nos permitirá efetuarmos melhor as
conclusões necessárias no passo P5) a seguir.

P5) Como tcal ∈ RRH0 , há indícios para rejeitarmos H0 ao nível de 5% de significância. Dessa
forma, o tempo exigido para decorar certo tipo de material pelo método de memorização X1 é
estatisticamente diferente do tempo exigido para decorar certo tipo de material pelo método de
memorização X2 , ao nível de 5% de significância.
290

26) A marca de cigarros B, mais barata, afirma que seus cigarros apresentam teor de nicotina igual
a concorrente direta (A). A empresa A não concorda, afirmando que seus cigarros são melhores por
apresentar menor teor de nicotina, e ao realizar um estudo do conteúdo de nicotina das duas marcas
de cigarros obteve os seguintes resultados:

A 18 20 21 21 22
B 20 21 23 23 25 26

Admitindo que o conteúdo de nicotinas de cada uma das duas marcas tem distribuição normal, e que
as variâncias populacionais são iguais, adotando nível de significância igual a 1%, realize um teste
de hipóteses para saber a que conclusão a empresa A chegará.

Sejam X1 : “quantidade de nicotina dos cigarros da marca A” e X2 : “quantidade de nicotina


dos cigarros da marca B”. Então X1 ∼ N (µ1 ; σ12 ) e X2 ∼ N (µ2 ; σ22 ), além disso, as variâncias
populacionais são iguais, dessa forma podemos aplicar o teste t de Student para duas médias.

H : µ1 = µ2


0
P1) (Teste unilateral à esquerda)
: µ1 < µ2

H

1

X̄1 − X̄2
P2) Temos que α = 0, 01 e a estatística de teste é T = s  ∼ t(ν) , sendo ν = n1 + n2 − 2
1 1

2
Sc +
n1 n2
(n1 − 1) S12 + (n2 − 1) S22
e Sc2 = .
n1 + n2 − 2
P3) Temos que ν = 5 + 6 − 2 = 9 e ttab = t(9;1%) = 2, 8214. Assim a região crítica é:

RC = {t ∈ R| t < −2, 8214} ,

a qual é descrita em termos gráficos na Figura 26.

P4) Temos que

5
P
X1i
102
X̄1 = i=1
= = 20, 4,
5 5
6
P
X2i
138
X̄2 = i=1
= = 23,
6 6
 5 2
P
5 X1i
2
− i=1
P
X1i 5 2090 − (102)
2

S12 = i=1
= 5
= 140, 4225,
5−1 5−1
 6
2
P
6 X2i
2
− i=1
P
X2i 6 3200 − (138)
2

S22 = i=1
= 6
= 81,
6−1 6−1
291

RRH0 RNRH0 RNRH0 RNRH0

−2,8214 −2,17 0

Figura 26: Região crítica do teste t, para duas médias, unilateral à esquerda.

(5 − 1) 140, 4225 + (6 − 1) 81
Sc2 =
5+6−2
966, 69
= = 107, 41.
9

20, 4 − 23
tcal = s  = −2, 17.
1 1

107, 41 +
5 6
Note que esse valor obtido já encontra-se na Figura 26, isso nos permitirá efetuarmos melhor as
conclusões necessárias no passo P5) a seguir.

P5) Como tcal ∈ RN RH0 , não há indícios para rejeitarmos H0 ao nível de 1% de significância. Dessa
forma, não há indícios de que o quantidade de nicotina dos cigarros da marca A seja estatisticamente
inferior ao quantidade de nicotina dos cigarros da marca B, ao nível de 1% de significância.
292

27) Duas ilhas A e B, são completamente diferentes entre si. Enquanto que a ilha A está no Oceano
Pacífico, a ilha B encontra-se no Oceano Atlântico. Suponha que a distribuição das alturas dos
habitantes sejam independentes e normalmente distribuídas, sendo que para os habitantes da ilha A
a altura média é 1,75 m com desvio padrão de 10 cm. Para os habitantes da ilha B, temos que a
altura média é 1,70 m com desvio padrão de 5 cm. Uma amostra aleatória de habitantes de uma das
ilhas é tomada e, deseja-se testar as seguintes hipóteses:

H : “Os habitantes são da ilha A”


0
.
: “Os habitantes são da ilha B”

H

1

Procede-se então do seguinte modo:

• seleciona-se uma amostra de 16 moradores adultos de uma ilha, e determina-se a altura média
deles;

• se essa altura média for superior a 173 cm, diremos que são habitantes da ilha A; caso contrário,
diremos que são habitantes da ilha B.

Considere as seguintes assertivas:

a) afirmar que a amostra de valores não é proveniente de nenhuma das ilhas A e B;

b) β = 95%;

c) afirmar que a amostra de valores das alturas dos habitantes é proveniente da ilha A quando na
verdade origina-se da ilha B;

d) α = 5%;

e) afirmar que a amostra de valores das alturas dos habitantes é proveniente da ilha B e, de fato
origina-se da ilha B;

f) afirmar que a amostra de valores das alturas dos habitantes é proveniente da ilha B quando na
verdade origina-se da ilha A;

g) afirmar que a amostra de valores das alturas dos habitantes é proveniente da ilha A e, de fato
origina-se da ilha A;

h) afirmar que a amostra valores é de quaisquer uma das duas ilhas.

Complete corretamente a frase abaixo:

O erro de tipo I e o erro de tipo II são dados respectivamente nas letras e .

O erro de tipo I e o erro de tipo II são dados, respectivamente, nas letras f) e c).
293

28) Psicólogos têm estudado um tipo de padrão comportamental das pessoas, designado como Tipo A.
Pessoas com esse padrão tendem a ser competitivas, trabalham melhor com datas e prazos, chegam
mais cedo para as reuniões, etc. Pessoas que não exibem esse padrão são classificadas como Tipo
B. Um estudo com 20 indivíduos do sexo masculino, classificados como Tipos A e B, investigou
o consumo de oxigênio (% da capacidade aeróbica utilizada) quando eles corriam em uma esteira.
Suspeitava-se antes da realização dessas medições que as pessoas do Tipo A consomem mais oxigênio
que as pessoas do Tipo B. Adote nível de significância igual a 1%, suponha normalidade das variáveis
sob estudo e homocedasticidade das variâncias e conclua acerca dessa suspeita utilizando um teste
de hipóteses adequado. Dados:

Padrão de comportamento
Capacidade aeróbica utilizada % Tipo A Tipo B
 
Valor médio X̄ 91,4 82,8
Desvio padrão (SX ) 37,82 46,84
Tamanho da amostra (n) 10 10

Sejam X1 : “consumo de oxigênio quando a pessoa é do tipo A” e X2 : “consumo de oxigênio quando


a pessoa é do tipo B”;

H : µ1 = µ2


0
P1) (Teste unilateral à direita)
: µ1 > µ2

H

1

P2) Temos que α = 0, 01 e a estatística de teste é

X̄1 − X̄2
T =s  ∼ t(ν) ,
1 1

Sc2 +
n1 n2

sendo ν = n1 + n2 − 2 e
(n1 − 1) S12 + (n2 − 1) S22
Sc2 = .
n1 + n2 − 2

P3) Temos que ν = 10 + 10 − 2 = 18 e ttab = t(18;1%) = 2, 5524. Assim a região crítica é:

RC = {t ∈ R| t > 2, 5524} ,

a qual é descrita em termos gráficos na Figura 27.


294

RNRH0 RNRH0 RNRH0 RRH0

0 0,45 2,5524

Figura 27: Região crítica do teste t, para duas médias, unilateral à direita.

P4) Temos que

X̄1 = 91, 4,

X̄2 = 82, 8,

S12 = (37, 82)2 = 1430, 3524,

S22 = (46, 84)2 = 2193, 9856,


(10 − 1) × 1430, 3524 + (10 − 1) × 2193, 9856
Sc2 =
10 + 10 − 2
32619, 042
= = 1812, 169,
18

91, 4 − 82, 8
tcal = s  = 0, 45.
1 1

1812, 169 +
10 10
Note que esse valor obtido já encontra-se na Figura 27, isso nos permitirá efetuarmos melhor as
conclusões necessárias no passo P5) a seguir.

P5) Como tcal ∈ RN RH0 , não há indícios para rejeitarmos H0 ao nível de 1% de significância.
Dessa forma, não há indícios de que o consumo de oxigênio quando a pessoa é do tipo A seja
estatisticamente inferior ao consumo de oxigênio quando a pessoa é do tipo B, ao nível de 1%
de significância.
295

29) Nos itens abaixo assinale V se a afirmativa for completamente verdadeira ou F, caso contrário.

( V ) A soma de distribuições normais independentes também segue distribuição normal;

( F ) Uma hipótese estatística é um procedimento, ou regra de decisão, que nos possibilita decidir
por rejeitar, ou não, a hipótese formulada, com base na informação obtida na amostra;

Um teste de uma hipótese estatística é um procedimento, ou regra de decisão, que nos possibilita
decidir por rejeitar, ou não, a hipótese formulada, com base na informação obtida na amostra;

( F ) Ao realizarmos um teste de hipóteses, e tomarmos uma decisão, favorável ou contrária a uma


hipótese, sempre cometemos dois erros, o erro de tipo I e o erro de tipo II;

Ao realizarmos um teste de hipóteses, e tomarmos uma decisão, favorável ou contrária a uma hipótese,
podemos cometer um dos dois erros, o erro de tipo I ou o erro de tipo II;

( V ) A região crítica, também chamada de região de rejeição, é o conjunto de valores assumidos


pela variável aleatória ou estatística de teste para os quais a hipótese nula é rejeitada;

( F ) O erro de tipo II consiste em rejeitarmos uma hipótese H0 , sendo essa verdadeira;

O erro de tipo I consiste em rejeitarmos uma hipótese H0 , sendo essa verdadeira;

( F ) O erro de tipo I consiste em não rejeitarmos uma hipótese H0 , sendo essa falsa;

O erro de tipo II consiste em não rejeitarmos uma hipótese H0 , sendo essa falsa;

( F ) A diferença entre o teste t de Student para uma média, e o teste Z para uma média é que no
teste Z a variância amostral é conhecida;

A diferença entre o teste t de Student para uma média, e o teste Z para uma média é que no teste
Z a variância populacional é conhecida;

( V ) A probabilidade de se cometer o erro de tipo I é conhecida como nível de significância ou α;

( F ) Ao utilizarmos o teste de qui-quadrado para testar a igualdade de duas médias, os graus de


liberdade são dados por ν = (h − 1)(k − 1);

Ao utilizarmos o teste de qui-quadrado para testar a independência de duas variáveis, os graus de


liberdade são dados por ν = (h − 1)(k − 1);

( F ) No caso do teste t de Student para a independência de duas variáveis, os graus de liberdade


são dados por ν = nX + nY − 2;

No caso do teste t de Student para a diferença de duas variáveis, os graus de liberdade são dados por
ν = nX + nY − 2.
296

30) Dois grupos distintos de estudantes fizeram um mesmo exame em uma disciplina. No entanto, so-
mente um grupo recebeu preparação formal, pois frequentavam e participavam ativamente das aulas.
O outro grupo apenas leu a apostila e estudou na véspera da prova, uma vez que não compareciam
às aulas. Adote o nível de significância de 10% e realize um teste de hipótese para verificar se existe
associação entre a situação final do aluno e a frequência às aulas. Os resultados obtidos foram.

Frequência
Situação Sim Não
Aprovado 22 10
Reprovado 8 18


H : Situação e Frequência são independentes


0
P1)
: Situação e Frequência não são independentes

H

1

P2) Temos que α = 0, 1 e a estatística de teste é

k
h X
(Foij − Feij )2
χ2 = ∼ χ2(ν) ,
X

i=1 j=1 F eij

sendo ν = (h − 1)(k − 1).

P3) ν = (2 − 1)(2 − 1) = 1 × 1 = 1 e χ2(1;10%) = 2, 7055. A região crítica é

n o
RC = χ2 ∈ R χ2 > 2, 7055 ,

o que pode ser visto na Figura 28.

RNRH0 RRH0

0 2,7055 8,287

Figura 28: Região crítica para o teste de χ2 .


297

Fo11 = 22, Fo12 = 10, Fo21 = 8, Fo22 = 18,

n1∗ = 32, n2∗ = 26, n∗1 = 30, n∗2 = 28,

n = 58,
32 × 30 32 × 28
Fe11 = = 16, 5517, Fe12 = = 15, 4483,
58 58
26 × 30 26 × 28
Fe21 = = 13, 4483, Fe22 = = 12, 5517.
58 58

P4) Temos que

Assim

Situação
Frequência Sim Não Total
Aprovado 22(16,5517) 10(15,4483) (32)
Reprovado 8(13,4483) 18(12,5517) (26)
Total (30) (28) (58)

Dessa forma

(22 − 16, 5517)2 (10 − 15, 4483)2 (8 − 13, 4483)2 (18 − 12, 5517)2
χ2cal = + + +
16, 5517 15, 4483 13, 4483 12, 5517
29, 684 29, 684 29, 684 29, 684
= + + +
16, 5517 15, 4483 13, 4483 12, 5517
= 1, 7934 + 1, 9215 + 2, 2073 + 2, 3649

= 8, 287

P5) Como χ2cal ∈ RRH0 há indícios para rejeitarmos H0 ao nível de 10% de significância. Dessa
forma, há indícios de que Situação e Frequência não são independentes, ao nível de 10% de
significância.
298

31) A associação dos proprietários de indústrias metalúrgicas realizou um estudo e constatou que a
média mensal de tempo perdido com acidentes de trabalho é de 60 horas, com desvio padrão de 20
horas. Um programa de prevenção de acidentes foi então proposto e, para avaliar a sua eficiência,
tomou-se uma amostra aleatória de 9 indústrias, isto é, mediu-se o tempo de horas perdidas com
acidentes em cada uma dessas indústrias, o que forneceu um valor médio amostral de 50 horas.
Suponha normalidade da variável estudada, adote o nível de significância de 1% e, realize um teste
de hipóteses para analisar a eficiência do programa proposto.

a) Note que nesse caso a variância populacional σ 2 é conhecida e, por esse motivo utilizaremos o

H : µ = 60


0
teste Z para uma média. (Teste unilateral à esquerda);
: µ < 60

H

1

b) Temos que α = 0, 01 e, a estatística de teste a ser utilizada é dada por,

X̄ − µ0
Z= σ ∼ N (0; 1) ;

n

c) Temos que ztab = z0,01 = 2, 33 e assim a região crítica é dada por RC = {z ∈ R | z < −2, 33} , a
qual é descrita em termos gráficos na Figura 29.

RRH0 RNRH0 RNRH0 RNRH0

−2,33 −1,5 0

Figura 29: Região crítica do teste Z, para uma média, unilateral à esquerda.
299

d)
50 − 60 −10
zcal = 20 = 6, 6667 = −1, 5.

9
e) Como zcal ∈ RN RH0 , não há indícios para rejeitarmos H0 ao nível de 1% de significância. Dessa
maneira, não há indícios de que o tempo perdido com acidentes de trabalho difere de 60 horas.
300

32) Uma rede de hotéis conduziu uma pesquisa para avaliar a opinião (Ótimo, Regular ou Péssimo)
dos usuários quanto à qualidade de seus serviços. Os entrevistados foram escolhidos aleatoriamente
e divididos em três classes: Solteiros, Casados e Outros (divorciados, desquitados, viúvos, etc.),
conforme apresentado na tabela a seguir. Verifique, ao nível de significância de 5%, se existe algum
tipo de associação entre as variáveis Usuário e Opinião.

Opinião
Usuário
Ótimo Regular Péssimo
Solteiro 7 10 13
Casado 24 23 25
Outros 18 15 8


H0 : Usuário e Opinião são independentes


P1) 
H : Usuário e Opinião não são independentes

1

P2) Temos que α = 0, 05 e a estatística de teste é

k
h X
(Foij − Feij )2
χ2 = ∼ χ2(ν) ,
X

i=1 j=1 F eij

sendo ν = (h − 1)(k − 1).

P3) ν = (3 − 1)(3 − 1) = 2 × 2 = 4 e χ2(4;5%) = 9, 4877. A região crítica é

n o
RC = χ2 ∈ R χ2 > 9, 4877 ,

o que pode ser visto na Figura 30.

P4) Temos que

Fo11 = 7, Fo12 = 10, Fo13 = 13, Fo21 = 24,

Fo22 = 23, Fo23 = 25, Fo31 = 18, Fo32 = 15,

Fo33 = 8, n1∗ = 30, n2∗ = 72 n3∗ = 41,

n∗1 = 49, n∗2 = 48, n∗3 = 46, n = 143,


301

RNRH0 RRH0

0 5,7 9,4877

Figura 30: Região crítica para o teste.

Opinião
Usuário Total
Ótimo Regular Péssimo
Solteiro 7 (10,28) 10 (10,07) 13 (9,65) (30)
Casado 24 (24,67) 23 (24,17) 25 (23,16) (72)
Outros 18 (14,05) 15 (13,76) 8 (13,19) (41)
Total (49) (48) (46) (143)

(7 − 10, 28)2 (10 − 10, 07)2 (13 − 9, 65)2


χ2cal = + +
10, 28 10, 07 9, 65
2 2
(24 − 24, 67) (23 − 24, 17) (25 − 23, 16)2
+ + +
24, 67 24, 17 23, 16
2 2
(18 − 14, 05) (15 − 13, 76) (8 − 13, 19)2
+ + +
14, 05 13, 76 13, 19
= 1, 05 + 0 + 1, 16 + 0, 02 + 0, 06 + 0, 15 + 1, 11 + 0, 11 + 2, 04

= 5, 7

P5) Como χ2cal ∈ RN RH0 não há indícios para rejeitarmos H0 ao nível de 5% de significância. Dessa forma,
não há indícios para rejeitarmos a hipótese de que Usuário e Opinião são independentes.
302

33) Dez cobaias criadas em laboratório, foram separadas, aleatoriamente, em dois grupos: um foi
tratado com ração normalmente usada no laboratório (padrão) e o outro grupo foi submetido a uma
nova ração (experimental). As cobaias foram pesadas no início e no final do período de duração do
experimento. Os ganhos de massa (em gramas) observados foram os seguintes:

Ração Tamanho amostral Massa média (g) Variância (g2 )


Padrão 5 188 70
Experimental 5 212 72

Considere que as variâncias sejam homogêneas que as variáveis sob estudo sejam normalmente dis-
tribuídas, proceda a um teste de hipóteses, ao nível α = 5%, para verificar se as duas rações diferem
entre si quanto ao ganho de massa.

Sejam X1 : “ganho de massa obtido com a ração padrão” e X2 : “ganho de massa obtido com a nova
ração”. Então X1 ∼ N (µ1 ; σ12 ) e X2 ∼ N (µ2 ; σ22 ), além disso, as variâncias populacionais são iguais,
dessa forma podemos aplicar o teste t de Student para duas médias.

H : µ1 = µ2


0
P1) (Teste bilateral)
: µ1 6= µ2

H

1

X̄1 − X̄2
P2) Temos que α = 0, 05 e a estatística de teste é T = s  ∼ t(ν) , sendo ν = n1 + n2 − 2
1 1

Sc2 +
n1 n2
(n1 − 1) S12 + (n2 − 1) S22
e Sc2 = .
n1 + n2 − 2
P3) Temos que ν = 5 + 5 − 2 = 8 e ttab = t(8;5%) = 2, 306. Assim a região crítica é:

RC = {t ∈ R| t < −2, 306 ou t > 2, 306} ,

a qual é descrita em termos gráficos na Figura 31.

P4) Temos que

X̄1 = 188,

X̄2 = 212,

S12 = (8, 3666)2 = 70,

S22 = (8, 4853)2 = 72,


(5 − 1) 70 + (5 − 1) 72 568
Sc2 = = = 71,
5+5−2 8
303

RRH0 RNRH0 RNRH0 RRH0

−4,5 −2,306 0 2,306

Figura 31: Região crítica do teste t, para duas médias, bilateral.

e
188 − 212
tcal = s   = −4, 5.
1 1
71 +
5 5
Note que esse valor obtido já encontra-se na Figura 31, isso nos permitirá efetuarmos melhor as
conclusões necessárias no passo P5) a seguir.

P5) Como tcal ∈ RRH0 , há indícios para rejeitarmos H0 ao nível de 5% de significância. Dessa
forma, o ganho de massa obtido com a ração padrão é estatisticamente diferente do ganho de
massa obtido com a nova ração, ao nível de 5% de significância.
304

34) A tabela abaixo indica o número de telespectadores de duas emissoras de televisão X e Y em


cada um dos dois tipos de programação: Novela e Noticiário.

Programação
Emissora Novela Noticiário
Emissora X 26 20
Emissora Y 25 29

Ao nível de 1% de significância, teste a independência entre a escolha da emissora pelos telespecta-


dores e sua programação.

H : Emissora e Programação são independentes


0
P1)
: Emissora e Programação não são independentes

H

1

P2) Temos que α = 0, 01 e a estatística de teste é

h X
k
(Foij − Feij )2
χ2 = ∼ χ2(ν) ,
X

i=1 j=1 F eij

sendo ν = (h − 1)(k − 1).

P3) ν = (2 − 1)(2 − 1) = 1 e χ2(1;1%) = 6, 6349. A região crítica é

n o
RC = χ2 ∈ R χ2 > 6, 6349 ,

o que pode ser visto na Figura 32.

RNRH0 RRH0

0 1,0393 6,6349

Figura 32: Região crítica para o teste de χ2 .


305

Fo11 = 26, Fo12 = 20, Fo21 = 25, Fo22 = 29,

n1∗ = 46, n2∗ = 54, n∗1 = 51, n∗2 = 49,

n = 100,
46 × 51 46 × 49
Fe11 = = 23, 46, Fe12 = = 22, 54,
100 100
54 × 51 54 × 49
Fe21 = = 27, 54, Fe22 = = 26, 46.
100 100

P4) Temos que

Assim

Emissora
Programação Novela Noticiário Total
Emissora X 26(23,46) 20(22,54) (46)
Emissora Y 25(27,54) 29(26,46) (54)
Total (51) (49) (100)

Dessa forma

(26 − 23, 46)2 (20 − 22, 54)2 (25 − 27, 54)2 (29 − 26, 46)2
χ2cal = + + +
23, 46 22, 54 27, 54 26, 46
6, 4516 6, 4516 6, 4516 6, 4516
= + + +
23, 46 22, 54 27, 54 26, 46
= 0, 275 + 0, 2862 + 0, 2343 + 0, 2438

= 1, 0393

P5) Como χ2cal ∈ RN RH0 não há indícios para rejeitarmos H0 ao nível de 1% de significância. Dessa
forma, há indícios de que Emissora e Programação são independentes, ao nível de 1% de significância.

You might also like