Prob Introdução

UNIVERSIDADE FEDERAL DE CAMPINA GRANDE - Campus I
UNIDADE ACADÊMICA DE MATEMÁTICA E ESTATÍSTICA

Disciplina: Introdução à Probabilidade Período 2012.1
Professora: Amanda dos Santos Gomes
Aluno(a): .
1a NOTA DE AULA
1 Introdução à Probabilidade
Nesta disciplina, serão abordados tópicos referentes à Teoria das Probabilidades, a
qual tem como principal objetivo construir modelos matemáticos que procuram explicar
fenômenos não-determinísticos ou probabilísticos; isto é; fenômenos que estão sujeitos à
fatores casuais. A Teoria das Probabilidades também é de fundamental importância para a
solução de problemas relacionados à Inferência Estatística.
1.1 Introdução
Ao lançar uma moeda e observar a face superior, de modo geral, não podemos afirmar
se ocorrerá cara ou coroa. Da mesma forma, quando lançamos um dado não sabemos qual
das faces 1, 2, 3, 4, 5, ou 6 ocorrerá. No campo dos negócios e do governo há numerosos
exemplos de tais situações. Por exemplo, a incerteza existe quando desejamos realizar uma
previsão sobre a procura de um novo produto, a opinião pública em relação a determinado
assunto, o sucesso de um novo plano econômico, etc - tudo isso contém algum elemento
de acaso.
Na Estatística, a incerteza existe quando se quer fazer alguma afirmação a respeito de
alguma característica populacional baseada em informações extraídas de dados amostrais.
Neste caso, a aplicação da Teoria das Probabilidades é de fundamental importância
para a solução de problemas de Inferência Estatística.
Independente de qual seja a aplicação em particular, a utilização das probabilidades
indica que existe um elemento de acaso, ou de incerteza, quanto à ocorrência ou não de um
possível resultado. Assim é que em muitos casos, pode ser virtualmente impossível afirmar
com antecipação o que ocorrerá. No entanto, é possível dizer o que pode ocorrer.
O ponto central em todas essas situações é a possibilidade de quantificar quão provável
é determinado evento.
Em suma, podemos dizer que, as probabilidades são utilizadas para exprimir a chance
de ocorrência de determinado evento.
1
1.1.1 Definições Básicas
Definição 1.1 (Experimentos Aleatórios ou Fenômenos Aleatórios). São aqueles onde

o processo de experimentação está sujeito a influências de fatores casuais e conduz a
resultados incertos.
Notação: E.
Exemplos:
E1 : Lançar uma moeda e observar a face superior.
E2 : Lançar um dado e observar o número da face superior.
E3 : Ao fabricar uma lâmpada, observar o tempo de vida útil da mesma.
Observações:
a) Cada experimento poderá ser repetido um grande número de vezes sob as mesmas
condições;
b) Não podemos afirmar que resultado particular ocorrerá, porém podemos descrever
o conjunto de todos os possíveis resultados do experimento;
c) Quando o experimento é repetido um grande número de vezes, surgirá uma regular-
idade nos resultados. Esta regularidade, chamada de regularidade estatística, é que torna
possível construir um modelo matemático preciso com o qual se analisará o experimento.
Definição 1.2 (Espaço Amostral). É um conjunto que contém todos os possíveis re-
sultados de um experimento aleatório.
Notação: S
Exemplos:
Alguns espaços amostrais associados aos experimentos aleatórios E1 , E2 e E3 são:
S1 =
S2 =
S3 =
2
Definição 1.3 (Evento). Dado um espaço amostral S associado a um experimento E,
definimos como evento, qualquer subconjunto desse espaço amostral, ou seja, é qualquer
coleção de resultados do experimento E.
Notação: A, B, C, D, etc.
Exemplos:
1 - Considerando o espaço amostral S2 , exemplos de eventos seriam:

A: Ocorre face par;
B: Ocorre um número menor que 4;
C: Ocorre um número maior que 0;
D: Ocorre o número 10;
2 - Considerando o espaço amostral S3 , um exemplo de evento seria:

A: A vida útil de uma lâmpada é menor que 10 horas.
Observação:
Como os eventos de um espaço amostral são conjuntos, todas as operações da teoria

dos conjuntos são válidas para obter novos eventos. Considere, por exemplo, dois eventos
A e B, então o evento:
a) A ∪ B ocorrerá se, e somente se, A ocorrer, ou B ocorrer, ou ambos ocorrerem;

b) A ∩ B ocorrerá se, e somente se, A e B ocorrerem simultaneamente;
c) A ocorrerá se, e somente se, A não ocorrer;
d) Se A1 , A2 , ..., An for qualquer coleção finita de eventos, então, ∪ni=1 Ai será o evento
que ocorrerá se, e somente se, ao menos um dos eventos Ai ocorrer;
e) Se A1 , A2 , ..., An for qualquer coleção finita de eventos, então, ∩ni=1 Ai será o evento
que ocorrerá se, e somente se, todos os eventos Ai ocorrerem;
f) Suponha que S represente o espaço amostral associado a algum experimento E, e
que nós executemos E duas vezes. Então S × S pode ser utilizado para representar todos
os resultados dessas duas repetições;
Podemos considerar o par (s1 , s2 ) ∈ S × S como sendo um elemento do experimento
final.
g) O exemplo anterior pode ser, obviamente, generalizado;
Um recurso gráfico, conhecido como Diagrama de Venn, poderá ser vantajosamente

empregado quando estivermos combinando conjuntos. Para ilustrar, vejamos como fica
este diagrama representando os eventos descritos nos itens a, b e c:
3
(Desenhar os Diagramas de Venn, para cada evento)
Definição 1.4 (Eventos Mutuamente Excludentes). Dois eventos, A e B, são denomi-

nados, mutuamente excludentes, se eles não puderem ocorrer simultaneamente, ou seja,
A ∩ B = φ.
Exercício: Esboce um Diagrama de Venn, representando dois eventos mutuamente exclu-

dentes.
Exemplos:
1 - Lança-se um dado e observa-se o número da face superior. Considerando este expe-

rimento aleatório e os eventos:
A: Ocorre face par;
B: Ocorre um número menor que 4;
C: ocorre face menor que 7;
D: ocorre face cujo valor é maior que 6.
Determine em notação de conjuntos os seguintes eventos:
a) C d) B g) A j) A ∩ B m) B − A
b) D e) A ∪ B h) B k) A ∪ B n) A − B
c) A f) A ∩ B i) A ∪ B l) A ∩ B
Observação: Leis de D’Morgan
(i) A ∪ B = A ∩ B
(ii) A ∩ B = A ∪ B
4
1.2 Abordagens para Definir Probabilidade
1.2.1 Aproximação da Probabilidade pela Freqüência Relativa - (Lei dos
Grandes Números)
Definição 1.5 (Freqüência Relativa). Suponha que um experimento é repetido n vezes.

Seja A um evento associado ao experimento e nA o número de vezes que o evento A
ocorre nas n repetições. A freqüência relativa do evento A, representada por fA , é
definida como
nA
fA = .
n
Propriedades:
(i) 0 ≤ fA ≤ 1;
(ii) fA = 1, se, e somente se, A ocorrer em todas as n repetições;
(iii) fA = 0, se, e somente se, A nunca ocorrer nas n repetições;
(iv) Se A e B forem eventos mutuamente excludentes, e se fA∪B for a freqüência
relativa associada ao evento A ∪ B, então,
fA∪B = fA + fB .
Teorema 1.1 (Lei dos Grandes Números). Ao repetir um experimento um grande

número de vezes, a probabilidade de um evento A é aproximada pela freqüência relativa,
isto é,
nA
P (A) ∼= fA = , quando n → ∞.
n
Observação: Esta aproximação será tanto melhor quanto maior for o número de
repetições do experimento.
Exemplos:
1 - Ao lançar uma moeda honesta 5 vezes, ocorreram 4 caras. Baseado neste resultado,
qual a probabilidade (aproximada) do evento A : ocorrer cara?
2 - Considere as seguintes situações:
(i) Numa pesquisa de mercado, 5 pessoas foram entrevistadas das quais 4 disseram
que comprariam um novo produto a ser lançado.
(ii) Numa outra pesquisa de mercado, 300 pessoas foram entrevistadas das quais
140 disseram que comprariam um novo produto a ser lançado.
a) Para cada pesquisa, determine a probabilidade de que uma pessoa qualquer

compre o novo produto.
b) Em qual das duas medidas de probabilidade calculadas no item ’a’ você confia
mais?
5
1.2.2 Definição Clássica de Probabilidade
Definição 1.6 (Evento Simples e Evento Composto). Cada um dos possíveis resulta-
dos que compõe o espaço amostral e1 , e2 , ... é um evento simples, enquanto um evento
composto, A, é uma coleção de eventos simples.
Exemplo: Ao lançar um dado, os eventos simples serão: {1}, {2}, {3}, {4}, {5} e {6}
e um evento composto seria A : número par = {2, 4, 6}.
Definição 1.7 (Definição Clássica de Probabilidade). Suponha que um experimento

tenha n eventos simples diferentes, cada um dos quais pode ocorrer com a mesma
chance. Se r eventos simples são favoráveis (implicam) à ocorrência do evento A,
então
Número de maneiras como A pode ocorrer #A r
P (A) = = = .
Número total de resultados possíveis #S n
Observações:
(1) Nesta definição é fundamental que os eventos simples sejam igualmente prováveis,
e, neste caso, é evidente que:
(i) P (e1 ) = P (e2 ) = . . . = P (en ) = n1 , e

1 1 1
(ii) P (e1 ) + P (e2 ) + · · · + P (en ) = n
+ n
+ ··· + n
= n. n1 = 1.
(2) Espaços amostrais com as características acima descritas são conhecidos como
Espaços Amostrais Finitos e Equiprováveis.
Exemplos:
1 - Considere o experimento E: lançar um dado equilibrado. Considere também, os

seguintes eventos:
. A: Ocorre face par;
. B: Ocorre um número menor que 4;
. C: ocorre face menor que 7;
. D: ocorre face cujo valor é maior que 6
. A∪B
. A∩B
. B
Determine a probabilidade de ocorrência de cada um dos eventos acima definidos.
6
1.2.3 Definição Axiomática de Probabilidade
Definição 1.8 (Definição Axiomática de Probabilidade). Seja E um experimento

aleatório e S um espaço amostral associado a E. A cada evento A associaremos um
número real representado por P (A) e denominado probabilidade de A, que satisfaça
aos seguintes axiomas:
(i) 0 ≤ P (A) ≤ 1;
(ii) P (S) = 1;
(iii) Se A e B forem mutuamente excludentes (A ∩ B = φ), então
P (A ∪ B) = P (A) + P (B) .
(iv) Se A1 , A2 , ..., An forem, dois a dois, eventos mutuamente excludentes, então,

Ã∞ ! ∞
[ X
P Ai = P (A1 ) + P (A2 ) + · · · + P (An ) + · · · = P (Ai ) .
i=1 i=1
Observações:
1) A probabilidade de um evento A, denotada por P (A) , indica a chance de ocorrência
do evento A. Quanto mais próxima de 1 é P (A), maior é a chance de ocorrência do evento
A, e quanto mais próxima de zero, menor é a chance de ocorrência do evento A.
2) Do axioma iii, decorre imediatamente que, para qualquer n finito,

Ãn ! n
[ X
P Ai = P (Ai ) .
i=1 i=1
Principais Propriedades:
P1. Se φ denota o conjunto vazio (evento impossível), então

P (φ) = 0.
P2. Se A é o evento complementar de A, então

P (A) = 1 − P (A) .
P3. Se A e B são dois eventos quaisquer, então

P (A ∪ B) = P (A) + P (B) − P (A ∩ B) .
P4. Se A, B e C forem três eventos quaisquer, então

P (A∪B ∪C) = P (A)+P (B)+P (C)−P (A∩B)−P (A∩C)−P (B ∩C)+P (A∩B ∩C).
P5. Se A ⊂ B, então P (A) ≤ P (B).
Demonstrações:
7
1.3 Métodos de Enumeração ou Técnicas de Contagem
Nem sempre a tarefa de calcular a probabilidade de um evento aleatório, da forma
P (A) = r/n, é simples. Em algumas situações é necessário alguns procedimentos sis-
temáticos de contagem ou enumeração para se obter o número de maneiras, r, pelas quais
A pode ocorrer, bem como o número total de maneiras, n, pelas quais o espaço amostral
S pode ocorrer.
É no contexto descrito acima, que as técnicas de contagem são de fundamental im-
portância. Neste curso, veremos algumas das principais técnicas.
1.3.1 Princípio Fundamental de Contagem (PFC) - Regra da Multiplicação
Suponha que um experimento possa ser realizado em k etapas, de modo que, para a
primeira etapa existem n1 resultados possíveis, para a segunda etapa n2 resultados possíveis,
e assim sucessivamente, até que para a k − ésima etapa existem nk resultados possíveis.
Então, existe um total de
n1 × n2 × .... × nk
resultados possíveis para este experimento.
Exemplos:
1 - Ao lançar um dado e uma moeda, quantos resultados possíveis podem ser obtidos?
2 - Uma companhia produz fechaduras que usam segredos numéricos para serem abertas.
Se cada segredo consiste de três números distintos, escolhidos dentre os inteiros de
0 a 9, quanto segredos diferentes poderão ser fabricados?
1.3.2 Regra da Adição
Suponha que um procedimento, designado por 1, possa ser realizado de n1 maneiras.

Adimita-se que um segundo procedimento, designado por 2, possa ser realizado de n2
maneiras. Além disso, suponha-se que não seja possível a realização de ambos os proced-
imentos simultaneamente. Então, o número de maneiras possíveis de realizar ou 1 ou 2
será
n1 + n2 .
Exemplo: Suponha-se que estejamos planejando uma viagem e devamos escolher

entre o transporte por ônibus ou por trem. Se existirem três rodovias e duas ferrovias, de
quantas maneiras poderá ser feita a viagem?
8
1.3.3 Permutação e Arranjo
Suponha que tenhamos n objetos diferentes. Permutar os n objetos equivale a colocá-

los dentro de uma caixa com n compartimentos, em alguma ordem. Assim, o número de
permutações de n objetos distintos é dado por
nPn = n!
Considerem-se novamente n objetos distintos. Agora desejamos escolher r desses

objetos, 0 ≤ r ≤ n e permutar os r escolhidos. Denotaremos o número de maneira de se
fazer isso (arranjos) por nAr . Assim
n!
nAr = .
(n − r)!
Exemplos:
1 - Se não são permitidas repetições,
a) quantos números de 3 dígitos podem ser formados dos seis dígitos 2, 3, 5, 6, 7

e 9?
b) Quantos destes são menores que 400?
c) Quantos são pares?
d) Quantos são ímpares?
e) Quantos são múltiplos de 5?
2 - De quantas maneiras diferentes podemos escolher, sucessivamente, 3 cartas de um

baralho de 52:
a) com reposição;
b) sem reposição.
Obs.: Os problemas abordados nos itens a e b do exemplo 2, correspondem ao que

se conhece por Amostras Ordenadas com e sem Reposição, respectivamente.
1.3.4 Combinação
Considere, novamente, n objetos diferentes. Agora, trataremos da contagem do

número de maneiras de escolher r dentre esses n objetos sem considerarmos a ordem.
Denotaremos por nCr o número de combinações possíveis. Para isto, basta aplicar o
princípio fundamental de contagem de acordo com o seguinte raciocínio:
1o ) Existem nCr maneiras de se escolher r objetos quaisquer, sem considerar a ordem;
2o ) Existem r! maneiras de se permutar os r objetos escolhidos no primeiro procedi-
mento; ou seja; existem r! sequências possíveis ao escolher r objetos.
9
Agora, note que o número de maneiras possíveis para realizar simultaneamente os
procedimentos 1 e 2 é igual ao número de arranjos, de modo que, pelo PFC, tem-se
n!
nCr × r! = nAr = .
(n − r)!
Dessa forma, o número de combinações possíveis é dado por

n!
nCr = .
r!(n − r)!
Exemplo: Em um congresso científico existem 15 Matemáticos e 12 Estatísticos.

Qual é a probabilidade de se formar uma comissão com 5 membros, na qual figurem 3
Matemáticos e 2 Estatísticos?
1.4 Eventos Independentes

A probabilidade da ocorrência de dois eventos simultaneamente, P (A ∩ B), depende
da natureza dos eventos, ou seja, se eles são independentes ou não.
Dois ou mais eventos são independentes quando a ocorrência ou não-ocorrência de um
não influencia a ocorrência do(s) outro(s).
Definição 1.9 (Eventos Independentes). Seja S um espaço amostral. Os eventos

aleatórios A e B são (estocasticamente) independentes se, e somente se
P (A ∩ B) = P (A)P (B).
Proposição 1: A é independente de si mesmo se, e somente se, P (A) = 0 ou 1.
Proposição 2: Se A e B são independentes, então A e B também são independentes

(e também A e B, e ainda A e B).
Exercício: Prove as proposições 1 e 2.
Definição 1.10 (Eventos Independentes Dois a Dois). Os eventos aleatórios Ai , i =

1, 2, ..., n são independentes 2 a 2 se
P (Ai ∩ Aj ) = P (Ai )P (Aj ), ∀i, j; i 6= j.
Definição 1.11 (Eventos Mutuamente Independentes). Os eventos aleatórios Ai , i =

1, 2, ..., n são mutuamente independentes se forem independentes 2 a 2 e além disso,
P (A1 ∩ A2 ∩ ... ∩ An ) = P (A1 )P (A2 )...P (An ).
10
1a LISTA DE EXERCÍCIOS
1 - Uma caixa com N lâmpadas contém r lâmpadas (r < N ) com filamento partido.
Essas lâmpadas são verificadas uma a uma, até que uma lâmpada defeituosa seja en-
contrada. Descreva um espaço amostral para este experimento. Suponha agora, que
as lâmpadas são verificadas até que todas as defeituosas sejam encontrdas. Descreva
um espaço amostral para este experimento.
2 - O seguinte grupo de pessoas está numa sala: 5 homens maiores de 21 anos; 4 homens
com menos de 21 anos de idade; 6 mulheres maiores de 21 anos, e 3 mulheres menores.
Uma pessoa é escolhida ao acaso. Definem-se os seguintes eventos:
A: A pessoa é maior de 21 anos
B: A pessoa é menor de 21 anos
C: A pessoa é homem
D: A pessoa é mulher
Calcule:
a) P (B ∪ D)
b) P (A ∩ C)
3 - Um inteiro é escolhido ao acaso, dentre os números 1, 2, ..., 50. Qual a probabilidade

de que o número escolhido seja divisível por 6 ou por 8?
4 - A urna 1 contém x bolas brancas e y bolas vermelhas. A urna 2 contém z bolas

brancas e v bolas vermelhas. Uma bola é escolhida ao acaso da urna 1 e posta na
urna 2. A seguir, uma bola é escolhida ao acaso da urna 2. Qual a probabilidade de
que esta bola seja branca?
5 - Suponha que A e B sejam eventos independentes associados a um experimento. Se

a probabilidade de A ou B ocorrerem for igual a 0,6, enquanto a probabilidade da
ocorrência de A for igual a 0,4, determine a probabilidade da ocorrência de B.
6 - Um estudante se submete a um exame de múltipla escolha no qual cada questão tem

4 respostas possíveis das quais exatamente uma é correta. O estudante seleciona a
resposta correta se ele sabe a resposta. Caso contrário, ele seleciona ao acaso uma
resposta entre as 4 possíveis. Suponha que o estudante saiba a resposta de 60% das
questões. Se o estudante escolhe a resposta correta para uma dada questão, qual a
probabilidade de que ele sabia a resposta?
7 - Mostre que, se os eventos A e B são independentes, então também o serão Ā e B.
8 - Um dado é viciado de tal forma que a probabilidade de sair um certo ponto é propor-
cional ao seu valor (por exemplo, o ponto 6 é 3 vezes mais provável de sair do que o
ponto 2). Calcular a probabilidade de tirar um número par, sabendo-se que saiu um
número maior que 3.
11
9 - Mostre que se A, B e C são eventos tais que P (A ∩ B ∩ C) 6= 0 e P (C | A ∩ B) =
P (C | B), então P (A | B ∩ C) = P (A | B).
10 - Uma caixa tem três moedas: uma não viciada, outra com duas caras e uma terceira
viciada, de modo que a probabilidade de ocorrer cara nesta moeda é de 15 . Uma
moeda é selecionada ao acaso na caixa. Saiu cara. Qual a probabilidade de que a
moeda viciada tenha sido a selecionada?
11 - Uma urna contém 4 bolas brancas e 6 bolas vermelhas; outra urna contém 3 bolas
brancas e 6 vermelhas. Passa-se uma bola, escolhida ao acaso, da primeira para a
segunda urna, e em seguida, retiram-se três bolas desta última, sem reposição. Qual
a probabilidade de que ocorram três bolas da mesma cor?
12 - A probabilidade de que A resolva um problema é de 23 e a probabilidade de que

B resolva é de 34 . Se ambos tentarem independentemente, qual a probabilidade do
problema ser resolvido?
13 - Uma companhia de seguros analisou a freqüência com que 2000 segurados usaram o
hospital. Os resultados são apresentados na tabela:
homens mulheres
usaram o hospital 100 150
não usaram o hospital 900 850
Qual a probabilidade de que uma pessoa segurada não use o hospital?
14 - Os colégios A, B e C têm as seguintes percentagens de rapazes, respectivsmente:

40%, 20% e 10%. Um desses colégios é selecionado ao acaso e 8 alunos são escolhi-
dos, com reposição. Se obtemos RRRMMMMM (R para rapaz e M para moça) qual
a probabilidade de ter sido selecionado o colégio B?
15 - Sabe-se que a ocorrência simultânea dos eventos A1 e A2 necessariamente força a

ocorrência do evento A. Prove que
P (A) ≥ P (A1 ) + P (A2 ) − 1.
16 - Quantos números naturais de 4 algarismos podem ser formados usando-se apenas os

algorismos 2, 3, 4 e 5, de forma que sejam menores do que 5000 e divisíveis por 5?
17 - Considere que as pessoas possam nascer de forma equiprovável em qualquer um dos

dias de um certo ano com 365 dias. Se numa sala existem r pessoas que nasceram
neste ano, qual é a probabilidade de que existam, pelo menos dois aniversários num
mesmo dia? Interprete esta probabilidade para r = 23.
18 - Calcule a probabilidade de se obter exatamente 3 caras e 2 coroas em 5 lances de

uma moeda honesta.
12
19 - João e Maria marcam um encontro no Iguatemi entre 17 horas e 18 horas com a
seguinte condição: Um espera pelo outro no máximo 15 minutos. Qual a probabili-
dade de que o encontro aconteça?
20 - Uma caixa contém 40 fusíveis bons e 10 defeituosos. Supondo que se seleciona

ao acaso 10 fusíveis, qual é a probabilidade de que não mais que 8 fusíveis sejam
defeituosos?
21 - Ao escolher entre diversos fornecedores de computadores, um comprador deseja saber

a probabilidade de um computador falhar durantes os dois primeiros anos. Sabendo-se
que só existem duas possibilidades; ou o computador falha durante os dois primeiros
anos ou não falha, qual é essa probabilidade? Agora se você conhecesse o resultado
de uma pesquisa do PC World feita com 4000 usuários de computadores, na qual
revela que 992 computadores falham durantes os dois primeiros anos, qual será a
probabilidade estimada?
22 - Jogam-se duas moedas equilibradas. Qual a probabilidade de ambas darem cara?
23 - Suponhamos agora que queiramos estender este resultado ao caso de três moedas.
Qual a probabilidade de três caras?
24 - Pedro tem dois automóveis velhos. Se nas manhãs frias, há 20% de probabilidade de
um deles não funcionar e 30% de outro não funcionar,
a) qual a probabilidade de nenhum funcionar?

b) qual a probabilidade dos dois funcionarem?
c) qual a probabilidade de pelo menos um funcionar?
d) qual a probabilidade de exatamente um funcionar?
25 - Considere o lançamento de dois dados equilibrados com o interesse de observar o

número das faces superiores.
a) Calcule a probabilidade dos eventos:

i) A: sair face par nos dois dados
ii) B: sair face par no primeiro dado
iii) C: sair face par no segundo dado
d) Os eventos B e C são independentes?
26 - De 120 estudantes, 60 estudam Francês, 50 Espanhol e 20 estudam Francês e Es-

panhol. Se um estudante é escolhido ao acaso, encontre a probabilidade de que
ele:
a) estude Francês e Espanhol?

b) estude pelo menos uma das línguas?
c) não estude nem Francês nem Espanhol?
13
27 - Ao escolher entre diversos fornecedores de computadores, um comprador deseja saber
a probabilidade de um computador falhar durantes os dois primeiros anos. Sabendo-se
que só existem duas possibilidades; ou o computador falha durante os dois primeiros
anos ou não falha, qual é essa probabilidade? Agora se você conhecesse o resultado
de uma pesquisa do PC World feita com 4000 usuários de computadores, na qual
revela que 992 computadores falham durantes os dois primeiros anos, qual será a
probabilidade estimada?
28 - Um terço dos eleitores de certa comunidade é constituido de mulheres, e 40% dos

eleitores votaram na última eleição presidencial. Supondo que esses dois eventos
sejam independentes, determine a probabilidade de escolher um eleitor da lista geral,
que seja mulher e que tenha votado na última eleição presidencial.
29 - Uma urna contém duas bolas brancas e cinco pretas. Qual a probabilidade de sair
duas bolas pretas supondo que os sorteios são feitos com reposição?
30 - Se cada carta de um baralho de 52 cartas tem a mesma chance de ser escolhida,

então qual é a probabilidade de:
a) se extrair cada uma delas?

b) de se extrair uma dama?
31 - Qual a probabilidade de se obter três ou menos pontos no lançamento de um dado?
32 - Uma urna contém duas bolas brancas, três pretas e cinco azuis.
a) Qual a probabilidade de se extrair uma bola branca?

b) Qual a probabilidade de se extrair uma bola preta ou uma azul?
33 - No lançamento de dois dados qual a probabilidade de sair o par (5,2)?
14
Aluno(a): .
2a NOTA DE AULA
2 Probabilidade Condicional, Teorema da Multipli-

cação de Probabilidades, Teorema da Probabilidade
Total e de Bayes
2.1 Probabilidade Condicional

Em algumas situações, a probabilidade de ocorrência de um certo evento pode ser
afetada se tivermos alguma informação sobre a ocorrência ou não de um outro evento.
Considere, por exemplo, o seguinte experimento:
E : Dois dados são lançados, registrando-se o resultado como (x1 , x2 ), onde xi é o
resultado do i-ésimo dado, i = 1, 2.
O espaço amostral, S, associado a este experimento, pode ser representado pela
seguinte lista de 36 possíveis resultados igualmente prováveis:
S=
Considere, agora, os dois eventos seguintes:

A = {(x1 , x2 ); x1 + x2 = 10}
B = {(x1 , x2 ); x1 > x2 }
Assim,
A=
B=
E, portanto,
P (A) =
P (B) =
15
Suponha, agora, que soubéssemos da ocorrência de B e que quiséssemos calcular a
probabilidade de A. Iremos denotar essa probabilidade como P (A | B). Assim,
P (A | B) =
De maneira análoga, suponha que soubéssemos da ocorrência de A e que quiséssemos

calcular a probabilidade de B. Então, esta probabilidade denotada por P (B | A), será dada
por
P (B | A) =
Note que, no cálculo das probabilidades condicionais, o espaço amostral foi reduzido
ao evento B e A, respectivamente.
Formalmente definimos probabilidade condicional da maneira a seguir.
Definição 2.1 (Probabilidade Condicional).

P (A ∩ B)
P (A | B) = ,
P (B)
desde que P (B) > 0.
Da definição acima, podemos dizer que
P (A ∩ B) = P (B)P (A | B), ou equivalentemente,
P (A ∩ B) = P (A)P (B | A).
Este último resultado é muitas vezes mencionado como o Teorema da Multiplicação

de Probabilidades.
O Teorema da Multiplicação de Probabilidades pode ser generalizado para mais
de dois eventos da seguinte maneira:
P (A1 ∩ A2 ∩ · · · ∩ An ) = P (A1 ) P (A2 | A1 ) P (A3 | A1 ∩ A2 ) · · · P (An | A1 ∩ A2 ∩ · · · ∩ An−1 )
Observação:
Note que, se A e B são independentes, então
P (A ∩ B) P (A)P (B)
P (A | B) = = = P (A).
P (B) P (B)
Exercício: Mostre que A e B são independentes se, e somente se,

P (A | B) = P (A) ou P (B | A) = P (B).
16
2.2 Teorema da Probabilidade Total
Definição 2.2 (Partição do Espaço Amostral). Dizemos que os eventos B1 , B2 , ..., Bk
representam uma partição do espaço amostral S, quando
a) Bi ∩ Bj = φ, para todo i 6= j,
b) ∪ki=1 Bi = S,
c) P (Bi ) > 0, para todo i.
Teorema 2.1 (Teorema da Probabilidade Total). Considere um evento A referente a

S, e B1 , B2 , ..., Bk uma partição de S. Assim, podemos escrever
A = (A ∩ B1 ) ∪ (A ∩ B2 ) ∪ (A ∩ B3 ) ∪ ... ∪ (A ∩ Bk ).
Logo,
P (A) = P (A ∩ B1 ) + P (A ∩ B2 ) + P (A ∩ B3 ) + ... + P (A ∩ Bk ).
Então, como P (A∩Bj ) = P (Bj )P (A | Bj ), obteremos o que se denomina Teorema

da Probabilidade Total:
P (A) = P (B1 )P (A | B1 ) + P (B2 )P (A | B2 ) + ... + P (Bk )P (A | Bk ).
2.3 Teorema de Bayes

Teorema 2.2 (Teorema de Bayes). Sob as mesmas hipóteses do teorema da probabi-
lidade total, podemos calcular a probabilidade de Bi dada a ocorrência de A da seguinte
forma
P (Bi ∩ A) P (Bi )P (A | Bi )
P (Bi | A) = =P .
P (A) j P (Bj )P (A | Bj )
Este resultado é o que chamamos de Teorema de Bayes. Esse teorema é útil quando
conhecemos as probabilidades dos Bi ’s e a probabilidade condicional de A dado Bi , mas
não conhecemos diretamente a probabilidade de A.
17
1 - Suponha que a probabilidade de que ambas crianças gêmeas sejam meninos é 0,30 e
que a probabilidade de que sejam meninas é 0,26. Dado que a probabilidade de uma
criança seja menino é 0.52, qual é a probabilidade de que:
a) A segunda criança seja um menino, sabendo-se que o primeiro é um menino?

b) A segunda criança seja uma menina, sabendo-se que a primeira é uma menina?
2 - A proporção de peças produzidas pelas máquinas I, II e III é 30%, 30% e 40%, re-
spectivamente. Dentre estas peças, 4%, 3% e 2%, respectivamente, são defeituosas.
Uma peça escolhida aleatoriamente, foi testada e verificou-se ser defeituosa. Qual é
a probabilidade de que a peça tenha sido produzida pela máquina I? E pela máquina
II? E pela III?
3 - As probabilidades de que três homens atinjam um alvo são, respectivamente, 16 , 14 e 13 .

Cada um atira uma vez em direção ao alvo.
a) Determine a probabilidade p de que exatamente um deles atinja o alvo.

b) Se apenas um atinge o alvo, qual a probabilidade de ele ser o primeiro homem?
4 - Em um teste de múltipla escolha, a probabilidade do aluno saber a resposta é p.

Havendo m escolhas, se ele sabe a resposta, ele responde corretamente com proba-
bilidade 1; se não sabe ele responde com probabilidade m1 .
a) Qual a probabilidade de que ele sabia a resposta dado que a pergunta foi re-
spondida corretamente?
b) Calcule o limite da probabilidade do item anterior quando m → ∞ com p fixo.
Interprete este resultado.
5 - Uma urna contém duas bolas brancas, três verdes e cinco azuis. Se três bolas são
retiradas ao acaso, sem reposição, determine a probabilidade de:
a) três bolas verdes ocorrerem.

b) exatamente uma bola verde ocorrer.
6 - A probabilidade de que um time de futebol vença seu próximo oponente é estimada

em 0,7 se não chover, mas só em 0,5 se chover. Se os registros meteorológicos
mostrarem que choveu 40 por cento das vezes, na data do jogo, nos anos passados,
qual a probabilidade de que o time vença seu próximo oponente? Resp.: 0,62.
7 - Suponhamos que seja de 0,005 a probabilidade de que o motor de um monomotor de

combate falhe na decolagem e que a taxa de falha técnica do motor de um bimotor
de combate seja de 0,003. Se o bimotor não puder decolar a não ser que ambos os
motores estejam operando adequadamente, que avião é mais seguro na decolagem?
Resp.: P (bimotor falhar na decolagem) = 0, 006.
18
8 - Empregados de certa firma são submetidos a um teste de aptidão quando empregados
pela primeira vez. A experiência mostrou que dos 60 por cento que passaram no teste,
80 por cento deles eram bons trabalhadores, enquanto dos 40 por cento dos que não
conseguiram passar só 30 por cento foram avaliados como bons trabalhadores. Qual
a probabilidade de que um empregado escolhido ao acaso seja um bom trabalhador?
Use aqui a técnica da árvore. Resp.: 0,60.
9 - Suponhamos que seja p a probabilidade de que o tempo (com sol ou nublado) seja o
mesmo do dia anterior. Se hoje for dia de sol, qual a probabilidade de que depois de
amanhã tenhamos também um dia de sol? Resp.: 2p2 − 2p + 1
19
Aluno(a): .
3a NOTA DE AULA
3 Variáveis Aleatórias: Discretas e Contínuas
3.1 Introdução
Ao descrever um espaço amostral S associado a um experimento E, podemos obser-
var que os resultados possíveis não são, necessariamente, núméricos. Consideremos, por
exemplo, o seguinte experimento:
E1 : Lançar duas moedas e observar a face superior de cada uma.
Neste experimento, temos S = {CC, CK, KC, KK} e, na prática, o que realmente
podemos estar interessados em observar é, por exemplo, o número de vezes que ocorre
cara (K), ou seja, temos interesse num número real que está associado a cada resultado do
espaço amostral S.
Definição 3.1 (Variável Aleatória). Seja E um experimento aleatório e S um es-

paço amostral associado ao experimento. Dizemos que a função X é uma variável
aleatória quando associa a cada elemento do espaço amostral, s ∈ S, um número real,
x = X(s).
Esquematicamente, temos:
(Esboçar a função (ou variável aleatória) que associa a cada elemento

do espaço amostral, s ∈ S, um número real, x = X(s) )
20
Exemplo: Mostre (esquematicamente) que: Se X é o número de vezes que ocorre
cara(K) ao lançar duas moedas, então, X é uma variável aleatória.
Definição 3.2 (Eventos Equivalentes). Sejam um experimento E e seu espaço amostral

S. Seja X uma variável aleatória definida em S e seja RX seu contradomínio. Seja B
um evento definido em relação a RX , isto é, B ⊂ RX . Defina o evento A como
A = {s ∈ S; X(s) ∈ B}.
Neste caso dizemos que A e B são eventos equivalentes.
Definição 3.3 (Probabilidade de Eventos Equivalentes). Seja B um evento no con-

tradomínio RX . Nesse caso, definimos P (B) da seguinte maneira:
P (B) = P (A), onde A = {s ∈ S; X(s) ∈ B}.
Exemplo: A partir do exemplo anterior, temos RX = {0, 1, 2}, onde cada um desses
valores ocorre com as seguintes probabilidades:
21
3.2 Variáveis Aleatórias Discretas
Definição 3.4 (Variável Aleatória Discreta). Dizemos que uma variável aleatória é
discreta se o conjunto formado pelos possíveis valores que essa variável assume for
finito ou infinito enumerável, de maneira que podemos listar todos os resultados como
x1 , x2 , x3 , ....
Definição 3.5 (Função de Probabilidade). Seja X uma variável aleatória assumindo

os valores x1 , x2 , x3 , .... A função p(xi ) = P (X = xi ), ∀i = 1, 2, ... é uma função de
probabilidade se:
1. p(xi ) ≥ 0, ∀i;
2. Σ∞
i=1 p(xi ) = 1
O conjunto de todos os pares [xi , p(xi )], i = 1, 2, ..., n, ... é definido como a Dis-
tribuição de Probabilidades da variável aleatória X.
Exemplos:
1 ) Se definimos a v.a. X: o número de ocorrência de cara ao lançar duas moedas,

encontre a distribuição de probabilidades de X e represente-a através de um gráfico.
2 ) Uma urna contém duas bolas brancas (B) e três vermelhas (V). Suponha que duas
bolas sejam retiradas ao acaso, sem reposição. Se a v.a. X é o número de bolas
vermelhas nas duas retiradas, qual é a distribuição de X? Represente graficamente
a distribuição de X.
3 ) Considerando a variável aleatória (v.a.) X cuja função de probabilidade é dada por:

1
P (X = x) = , x = 1, 2, 3, ...
2x
a ) Mostre que X tem realmente uma distribuição de probabilidades.
b ) Faça um gráfico representando o comportamento desta distribuição.
c ) Obtenha:
i . P (X ser par)
ii . P (X ≥ 3)
iii . P (X ser múltiplo de 3)
22
3.3 Variáveis Aleatórias Contínuas
Definição 3.6 (Variável Aleatória Contínua). A variável aleatória X é contínua se
existir uma função f , denominada função densidade de probabilidade (f.d.p.) de X
que satisfaça às seguintes condições:
a) f (x) ≥ 0 para todo x;
R +∞
b) −∞ f (x)dx = 1.
Observações: Se X é uma variável aleatória contínua, então:
(i) P (X = k) = 0, onde k é qualquer valor real.

(ii) Para quaisquer a, b, com −∞ < a < b < +∞, teremos
P (a ≤ X ≤ b) = P (a < X ≤ b)
= P (a ≤ X < b)
= P (a < X < b)
Z b
= f (x)dx.
a
Probabilidade essa, que pode ser representada pela área sob o gráfico da função f no
intervalo [a, b], tal como ilustrado abaixo:
Rb
(Esboçar o gráfico representando a área definida por P (a < X < b) = a
f (x)dx)
Exemplos:
1 - Suponha que estamos atirando dardos em um alvo circular de raio de 10 cm, e seja
X a distância do ponto atingido pelo dardo ao centro do alvo. A f.d.p. de X é
½
kx, 0 ≤ x ≤ 10
f (x) =
0, c.c
a) Qual a probabilidade de acertar a mosca, se ela é um círculo de raio 1 cm?
b) Mostre que a probabilidade de acertar qualquer círculo concêntrico é propor-
cional a sua área.
2 - Uma variável aleatória contínua X é dita ter distribuição uniforme se a sua f.d.p. é
da forma ½
k, se a < x < b
f (x) =
0, caso contrário
23
a) Encontre o valor de k para que a função f seja realmente uma f.d.p.
b) Esboce o gráfico da distribuição de X.
3 - Mostre que a seguinte função é uma f.d.p.:

1
f (x) = , x ∈ <.
π(1 + x2 )
3.4 Função de Distribuição Acumulada

Definição 3.7 (Função de Distribuição Acumulada - f.d.a.). A função de distribuição
acumulada F , ou simplesmente função de distribuição (f.d.) de uma variável
aleatória X qualquer é definida como
F (x) = P (X ≤ x), ∀ x ∈ <.
Observação:
a) Se a variável aleatória X for discreta, então a função de distribuição será dada por
X
F (x) = P (X ≤ x) = p(xi ),
i ; xi ≤x
b) Se a variável aleatória X for contínua, então a função de distribuição será dada por
Z x
F (x) = P (X ≤ x) = f (t)dt.
−∞
Exemplos:
1 - Suponhamos que a variável aleatória X tome os três valores 0,1 e 2, com proba-
bilidades 1/3, 1/6 e 1/2, respectivamente. Encontre a função de distribuição F e
represente-a graficamente.
2 - Encontre a função de distribuição de X cuja f.d.p. é dada por

½
2x, 0 < x < 1,
f (x) =
0, c.c.
Esboçe os gráficos da f.d.p., f (x), e da função de distribuição F .
3 - Se a variável aleatória X tem distribuição uniforme obtenha a função de distribuição

de X e represente-a graficamente.
24
3.4.1 Propriedades da Função de Distribuição
A seguir veremos algumas propriedades importantes da função de distribuição acumu-

lada F de uma variável aleatória X qualquer:
(i) A função F é não decrescente.

(ii) F é contínua à direita.
(iii)
F (−∞) ≡ lim F (x) = 0
x→−∞
F (+∞) ≡ lim F (x) = 1.

x→+∞
Alguns Teoremas importantes relacionados à função de distribuição acumulada, tam-

bém são apresentados a seguir:
Teorema 3.1. Seja X uma variável aleatória discreta, com valores possíveis x1 , x2 , ...,
e suponha-se que esses valores tenham sido indexados de modo que x1 < x2 < .... Seja
F a função de distribuição de X. Então,
p(xi ) = P (X = xi ) = F (xi ) − F (x−

i ),
onde F (x−
i ) ≡ limh→0− F (xi + h).
Teorema 3.2. Seja F a função de distribuição de uma variável aleatória contínua,

com f.d.p. f . Então,
dF (x)
f (x) = ,
dx
para todo x no qual F seja derivável.
Observações:
1) Se X for uma variável aleatória discreta, o gráfico da função de distribuição será

constituído por segmentos de reta horizontais. Além disso, a função F é contínua, exceto
nos valores possíveis de X: x1 , ..., xn , ...; pois, para cada valor xi o gráfico apresenta um
salto de magnitude p(xi ) = P (X = xi ).
2) Se X for uma variável aleatória contínua, então

(i) P (a < X < b) = F (b) − F (a).
(ii) P (X > a) = 1 − F (a).
25
Exemplos:
1 - Sabendo-se que a v.a. X assume os valores 1,2 e 3 e que sua função de distribuição
F (x) é tal que
F (1) − F (1− ) = 1/4,
F (2) − F (2− ) = 1/2,
F (3) − F (3− ) = 1/4.
Obter a distribuição de X, a função de distribuição acumulada e seu respectivo
gráfico.
2 - Dada a seguinte função de distribuição

½
0, x < 0,
F (x) = −x
1 − e , x > 0.
a ) Encontre a probabilidade da variável X assumir os seguintes valores:

i . P (X = 1);
ii . P (0.5 < X < 1);
iii . P (X > 1);
d ) Esboçe um gráfico ilustrando cada uma das situações descritas acima.
e ) Determine o valor de α tal que F (α) = 1/4.
f ) Encontre a f.d.p. da variável X.
26
1 - Considere uma urna contendo três bolas vermelhas e cinco pretas. Retire três bolas,
sem reposição, e defina a v.a. X igual ao número de bolas pretas. Obtenha a
distribuição de X.
2 - Repita o problema anterior, mas considerando extrações com reposição.
3 - Generalize o problema 1, considerando uma urna contendo N bolas, dentre as quais
k são pretas e as demais são vermelhas, e, além disso, considerando a retirada, sem
reposição, de n bolas. Descreva o conjunto de valores que a variável aleatória X
pode assumir.
Obs.: A variável aleatória X, neste caso, é dita ter Distribuição Hipergeométrica
com parâmetros N , r e n.
4 - Uma moeda perfeita é lançada quatro vezes. Seja Y o número de caras obtidas.
Calcule a distribuição de Y .
5 - Repita o problema anterior, considerando agora que a moeda é viciada, sendo a
probabilidade de cara dada por p, 0 < p < 1, p 6= 1/2.
6 - Generalize o problema 5, para n lançamentos da moeda.
Obs.: A variável aleatória Y , neste caso, é dita ter Distribuição Binomial com
parâmetros n e p.
7 - Suponhamos que uma válvula eletrônica seja posta em um soquete e ensaiada. Ad-
mitamos que a probabilidade de que o teste seja positivo seja 34 ; daí, a probabilidade
de que seja negativo é igual a 14 . Adimitamos também que estejamos ensaiando uma
partida grande dessas válvulas. Os ensaios continuam até que a primeira válvula
positiva apareça. Considere a variável aleatória X: no de testes necessários para
concluir o experimento. Assim
S=
P (X = n) =
8 - Dada a função ½
2e−2x , x ≥ 0
f (x) =
0, x < 0,
a) Mostre que esta função é uma f.d.p. e represente-a através de um gráfico.
b) Obtenha a função de distribuição de X e calcule a probabilidade de X > 10.
9 - Seja X o tempo até a desintegração de alguma partícula radioativa e suponha que a
função de distribuição de X seja dada por
½
0, x < 0,
F (x) = −λx
1 − e , x > 0.
Suponha que λ seja tal que P (X ≥ 0, 01) = 1/2. Obtenha um número t tal que
P (X ≥ t) = 0, 9.
27
Aluno(a): .
4a NOTA DE AULA
4 Caracterização Adicional das Variáveis Aleatórias
4.1 Introdução
No estudo de variáveis aleatórias algumas características numéricas podem nos
fornecer uma idéia sobre o comportamento da distribuição de probabilidades. Estas
características são conhecidas como parâmetros da distribuição.
4.2 O Valor Esperado ou Esperança Matemática de Uma

Variável Aleatória
Definição 4.1 (Valor Esperado de uma Variável Aleatória).
Caso 1: Variável Aleatória Discreta

Seja X uma variável aleatória discreta, com valores possíveis x1 , x2 , ..., xn , ... e con-
sidere p(xi ) = P (X = xi ), i = 1, 2, ..., n, ... Então, o valor esperado de X (ou esperança
matemática de X), denotado por E(X) é definido como
E(X) = Σ∞
i=1 xi p(xi ),
se a série definida acima convergir absolutamente, isto é, se

Σ∞
i=1 |xi | p(xi ) < ∞.
Este número é também denominado o valor médio de X, ou expectância de X.

Caso 2: Variável Aleatória Contínua
Seja X uma variável aleatória contínua com f.d.p. f . Então, o valor esperado de X
é definido como Z +∞
E(X) = xf (x)dx.
−∞
Pode acontecer que esta integral (imprópria) não convirja. Conseqüentemente, diremos
que E(X) existirá se, e somente se,
Z +∞
|x| f (x)dx < ∞.
−∞
28
Exemplos:
1 - Um fabricante produz peças tais que 10% delas são defeituosas e 90% delas são
não-defeituosas. Se uma peça defeituosa for produzida, o fabricante perde R$ 1,00,
enquanto uma peça não-defeituosa lhe dá um lucro de R$ 5,00. Se X for o lucro
líquido por peça, qual o valor esperado de X?
2 - Uma variável aleatória contínua X definida num intervalo [a, b] é dita ter distribuição
uniforme se possui a seguinte f.d.p.
½ 1
b−a
, a ≤ x ≤ b,
f (x) =
0, c.c.
Encontre a esperança dessa variável aleatória.
3 - Suponha que a variável aleatória X represente o tempo (em minutos) durante o qual
um equipamento elétrico é utilizado em carga máxima. Suponha ainda, que X seja
uma variável aleatória contínua com a seguinte f.d.p.:
 x
 15002 , 0 ≤ x ≤ 1500,
−(x−3000)
f (x) = , 1500 < x ≤ 3000,
 15002
0, c.c.
Encontre o tempo médio (em minutos) que o equipamento elétrico é utilizado em

carga máxima.
4.3 Esperança de uma Função de uma Variável Aleatória
É intuitivamente evidente a idéia de que qualquer função de uma variável aleatória X,

Y = H(X), também é uma variável aleatória; pois qualquer resultado aleatório, X(s) = x,
resultará num resultado também aleatório Y = H(X(s)) = H(x) = y. Desta forma, terá
sentido calcular E(Y ).
Existem duas maneiras equivalentes para se obter o valor esperado de Y = H(X). A
primeira requer que se obtenha primeiramente a distribuição de Y , - problema este que será
abordado posteriormente. Uma segunda maneira requer, simplesmente, o conhecimento da
distribuição de probabilidade de X. É neste sentido que veremos a seguinte definição e
teorema.
Definição 4.2 (Esperança de uma Função de Variável Aleatória). Seja X uma variável
aleatória e seja Y = H(X) uma função contínua. Então,
(a) Se Y for uma variável aleatória discreta com valores possíveis y1 , y2 , ... e se
p(yi ) = P (Y = yi ), o valor esperado de Y é definido por
E(Y ) = Σ∞
i=1 yi p(yi ).
29
(b) Se Y for uma variável aleatória contínua com f.d.p. fY , o valor esperado de
Y é definido por Z +∞
E(Y ) = yfY (y)dy.
−∞
Teorema 4.1. Seja X uma variável aleatória e seja Y = H(X). Então,

(a) Se X for uma variável aleatória discreta e p(xi ) = P (X = xi ), tem-se que o
valor esperado de Y será dado por
E(Y ) = E[H(X)] = Σ∞
j=1 H(xj )p(xj ).
(b) Se X for uma variável aleatória contínua com f.d.p. fX , tem-se que o valor
esperado de Y será dado por
Z +∞
E(Y ) = E[H(X)] = H(x)fX (x)dx.
−∞
4.4 Propriedades do valor esperado

Se X é uma v.a. e k é uma constante qualquer, então:
1. E[k] = k.
2. E[X + k] = E(X) + k.
3. E[kX] = kE(X).
4. E[X − µ] = 0, onde µ = E(X).
Demonstrações:
30
Exemplos:
1 - Um fabricante produz peças tais que 10% delas são defeituosas e 90% delas são
não-defeituosas. Se uma peça defeituosa for produzida, o fabricante perde R$ 1,00,
enquanto uma peça não-defeituosa lhe dá um lucro de R$ 5,00. Se X for o lucro
líquido por peça, determine:
a) O valor esperado de X?
b) Se houver um aumento de 10% nos valores de X, qual será o lucro líquido
esperado?
c) E Se houver um acréscimo de R$ 0,10 nos valores de X, em média, quanto será
o lucro líquido?
2 - Suponhamos que X seja uma variável aleatória com a seguinte f.d.p.

½ ex
2
, se x ≤ 0,
f (x) = e−x
2
, se x > 0.
Se Y = |X|, qual será o valor de E(Y )?
4.5 A Variância de uma Variável Aleatória

Definição 4.3 (Variância de uma Variável Aleatória).
Caso 1: Variável Aleatória Discreta

Dada a variável aleatória discreta X e a respectiva função de probabilidade p(xi ), a
variância de X é dada por
V ar(X) = E[(X − µ)2 ] = Σ∞ 2

i=1 (xi − µ) p(xi ),
onde µ = E(X).
Caso 2: Variável Aleatória Contínua

Seja X uma variável aleatória contínua com f.d.p. f . Então, a variância de X é dada
por R +∞
V ar(X) = E[(X − µ)2 ] = −∞
(x − µ)2 f (x)dx
A raiz quadrada da variância de X é denominada Desvio Padrão de X, ou seja,

p
DP (X) = V ar(X).
31
Exercício:
1 - Mostre que
V ar(X) = E(X 2 ) − E 2 (X).

Onde:
 ∞ 2
 Σi=1 xi p(xi ), no caso discreto;
E(X 2 ) =
 R +∞
−∞
x2 f (x)dx, no caso contínuo.
Exemplos:
1 - Se X é uma variável aleatória uniforme num intervalo [a, b], ou seja, X ∼ U (a, b),
qual é o valor de V ar(X)?
2 - Seja V a velocidade do vento (em milhas por hora) e suponha que V seja uniforme-
mente distribuída sobre o intervalo [0, 10]. A pressão, digamos W (em libras/pé
quadrado), na superfície da asa de um avião é dada pela relação W = 0, 003V 2 .
Encontre o valor esperado de W .
3 - Se X é uma variável aleatória contínua com f.d.p.

½
1 + x, −1 ≤ x ≤ 0,
f (x) =
1 − x. 0 ≤ x ≤ 1.
Obtenha a variância de X.
4.6 Propriedades da variância

Se X é uma v.a. e k é uma constante qualquer, então:
1. V ar(k) = 0.
2. V ar(X + k) = V ar(X).
3. V ar(kX) = k 2 V ar(X).
Demonstrações:
32
1 - O serviço de meteorologia classifica o tipo de céu que é visível, em termos de

“graus de nebulosidade”. Uma escala de 11 categorias é empregada: 0,1,2,...,10,
onde 0 representa um céu perfeitamente claro, 10 representa um céu completamente
encoberto, enquanto os outros valores representam as diferentes condições inter-
mediárias. Suponha que tal classificação seja feita em uma determinada estação
meteorológica, em um determinado dia e hora. Seja X a variável aleatória que pode
tomar um dos 11 valores acima. Admita que a distribuição de probabilidade de X
seja
X=x 0 1 2 3 4 5 6 7 8 9 10
P (X = x) 0,05 0,15 0,15 0,06 0,06 0,06 0,06 0,06 0,15 0,15 0,05
Encontre E(X), E(X 2 ) e V ar(X).
2 - Uma urna contém 4 bolas brancas e 6 pretas. 3 bolas são retiradas com reposição.
Seja X : o número de bolas brancas. Calcular E(X) e V ar(X). Resp.: E(X) = 1, 2
e V ar(X) =?.
3 - A função de probabilidade da variável aleatória X é: P (X = x) = 15 , para x =

1, 2, 3, 4, 5. Calcular E(X) e E(X 2 ). A partir desses resultados calcular:
a) E(X + 3)2 ;
b) V ar(3X − 2).
Resp.: a) 38 b) 18.
4 - Um banco pretende aumentar a eficiência de seus caixas. Para isto, o banco está
oferecendo um prêmio de R$ 150,00 para cada cliente atendido, além de 42 clientes
por dia. O banco tem um ganho operacional de R$ 100,00 para cada cliente atendido
além de 41. As probabilidades de atendimento são:
no de clientes Até 41 42 43 44 45 46
Probabilidade 0,88 0,06 0,04 0,01 0,006 0,004
Qual o ganho esperado do banco, se este novo sistema for implantado? O sistema é
vantajoso para o banco? Resp.: E(X) = 7, 30.
5 - Suponhamos que dez cartas estejam numeradas de 1 até 10. Das dez cartas, retira-se
uma de cada vez, ao acaso e sem reposição, até retirar-se o primeiro número par. Se
X é uma variável aleatória que expressa o número de retiradas necessárias.
a) Qual é a função de probabilidade de X?

b) Em quantas retiradas espera-se obter o primeiro número par? Resp.: .
33
6 - Um vendedor de equipamentos pesado pode visitar, num dia, um ou dois clientes,
com probabilidade de 1/3 ou 2/3, respectivamente. De cada contato, pode resultar
a venda de um equipamento por R$ 50.000,00(com probalidade 1/10) ou nenhuma
venda (com probabilidade 9/10). Indicando por Y o valor total de vendas diárias
desse vendedor:
a) Escreva a função de probabilidade de Y ;

b) Qual é o valor total esperado de vendas diárias?
Resp.: a) Y = 0, 50.000, 100.000 com probabilidades 126/150, 23/150, 1/150. b)

E(Y ) = 8.333.33.
7 - Calcule a variância da variável Y , do problema anterior.
8 - O tempo T , em minutos, necessário para um operário processar certa peça é uma

v.a. com a seguinte distribuição de probabilidade.
T =t 2 3 4 5 6 7
P (T = t) 0,1 0,1 0,3 0,2 0,2 0,1
a) Calcule o tempo médio de processamento.

b) Para cada peça processada, o operário ganha um fixo de R$ 2,00, mas, se ele
processa a peça em menos de seis minutos, ganha R$ 0,50 em cada minuto
poupado. Por exemplo, se ele processa a peça em quatro minutos, recebe a
quantia adicional de R$ 1,00.
Encontre a distribuição, a média e a variância da v.a. G: quantia ganha por
peça.
Resp.: a) E(T ) = 4, 6. b) E(G) = 2, 75 e V ar(G) = 0, 4125.
9 - A percentagem de álcool (100X) em certo composto pode ser considerada uma va-
riável aleatória, onde X, tem a seguinte função densidade:
f (x) = 2x3 (1 − x), 0 < x < 1.
a) Obtenha a função de distribuição acumulada de X;

b) Calcule P (X ≤ 2/3);
c) Suponha que o preço de venda desse composto dependa do conteúdo de ál-
cool. Especificadamente, se 1/3 < X < 2/3, o composto é vendido por
C1 u.m/galão; caso contrário, é vendido por C2 u.m/galão, determine o lu-
cro líquido médio por galão.
10 - Num teste de digitação, o tempo em minutos (T ) que os candidatos levam para

digitar um texto é modelado, de forma aproximada, pela seguinte distribuição de
probabilidade:
34
T 3 4 5 6 7 8 9
pi 0,1 0,1 0,2 0,2 0,2 0,1 0,1
O candidato recebe 4 pontos se terminar a digitação em 9 minutos, 5 se terminar em

8 minutos e assim por diante. Determine a média e a variância do número de pontos
obtidos no teste.
11 - Suponha que a demanda por certa peça, numa loja de autopeças, siga o seguinte
modelo:
a2k
P (X = k) = , k = 1, 2, 3, 4.
k!
a) Encontre o valor de a.
b) Calcule a F.d.a de X.
c) Calcule a demanda esperada.
d) Qual é a variabilidade da demanda?
12 - A função de probabilidade da variável aleatória X é P (X = k) = 1/5, k = 1, 2, ..., 5.

Calcule E(X), E(X 2 ), V ar(X), E[(X + 3)2 ] e V ar(3X − 2).
13 - Suponha que a variável aleatóriaX tenha valores possíveis 1,2,..., e P (X = j) = 1/2j ,

j = 1, 2, ...
a) Calcule P (X ser par).
b) Calcule P (X ≥ 5).
c)Calcule P (X ser divisível por 3).
14 - Considere uma variável aleatória X com resultados possíveis: 0,1,2,... Suponha que
P (X = j) = (1 − a)aj , j = 0, 1, 2, ...
a) Para que valores de a o modelo acima tem sentido?
b) Verifique que essa expressão representa uma legítima distribuição de probabilidade.
c) Mostre que, para quaisquer dois inteiros positivos s e t,
P (X > s + t | X > s) = P (X ≥ t).
15 - Verifique se as expressões abaixo são funções densidade de probabilidade (assuma

que elas se anulam fora dos intervalos especificados).
a) f (x) = 3x, se 0 ≤ x ≤ 1.
x2
b) f (x) = 2
, se x ≥ 0.
(x−3)
c) f (x) = 2
, se 3 ≤ x ≤ 5.
d) f (x) = 2, se 0 ≤ x ≤ 2.
½
1 + x, se − 1 ≤ x ≤ 0
e)f (x) =
1 − x, se 0 < x ≤ 1.
f)f (x) = −π, se −π < x < 0.
35
16 - A variável aleatória contínua tem f.d.p. f (x) = 3x2 , −1 ≤ x ≤ 0. Se b for um
número que satisfaça a −1 < b < 0, calcule P (X > b | X < b/2).
17 - Suponham que f e g sejam f.d.p. no mesmo intervalo a ≤ x ≤ b.

a) Verifique que f + g não é uma f.d.p. nesse intervalo.
b) Verifique que, para todo número β, 0 < β < 1, βf (x) + (1 − β)g(x) é uma f.d.p.
nesse intervalo.
18 - O diâmetro X de um cabo elétrico supõe-se ser uma variável aleatória contínua com
f.d.p. f (x) = 6x(1 − x), 0 ≤ x ≤ 1.
a) Verifique que essa expressão é uma f.d.p. e esboce seu gráfico.
b) Obtenha uma expressão par a F.d.a. da variável X.
c) Determine um número b tal que P (X < b) = 2P (X > b).
d) Calcule P (X ≤ 1/2 | 1/3 < X < 2/3).
19 - Uma variável aleatória X pode tomar quatro valores, com probabilidades (1+3x)/4, (1−
x)/4, (1 + 2x)/4 e (1 − 4x)/4. Para que valores de x é essa uma distribuição de
probabilidade?
20 - Uma variável aleatória X tem F.d.a dada por


 0, se x ≤ 0
F (x) = x5 , se 0 < x < 1

1, se x ≥ 1.
Calcule E(X) e V ar(X).
21 - Numa certa região, fósseis de pequenos animais são freqüentemente encontrados e

um arqueólogo estabeleceu o seguinte modelo de probabilidade (f.d.p) para o com-
primento, em centímetros, desses fósseis.
 x
 40
, se 4 ≤ x ≤ 8
−x
f (x) = + 3 , se 8 < x ≤ 10
 201 5
10
, se 10 < x ≤ 11.
a)Calcule a F.d.a.
b) Para um fóssil encontrado nessa região, determine a probabilidade do comprimento
ser inferior a 6 cm? E de ser superior a 5 mas inferior a 10,5 cm.
c)Encontre o valor esperado para o comprimento dos fósseis da região.
36
Aluno(a): .
5a NOTA DE AULA
5 Alguns Modelos de Variáveis Aleatórias
5.1 Variáveis Aleatórias Discretas

5.1.1 Modelo Uniforme Discreto
Definição: Seja X uma variável aleatória cujos possíveis valores são representados por
x1 , x2 , ..., xk . Dizemos que X segue o modelo Uniforme Discreto se atribui a mesma pro-
babilidade 1/k a cada um desses k valores, isto é, sua função de probabilidade é dada por
1
P (X = xj ) = , ∀j = 1, 2, ..., k.
k
Exemplo: Uma rifa tem 100 bilhetes numerados de 1 a 100. Tenho 5 bilhetes consec-
utivos numerados de 21 a 25, e meu colega tem outros 5 bilhetes, com os números 1, 11,
29, 68 e 93. Quem tem maior possibilidade de ser sorteado?
Propriedades
É fácil verificar que: Pk
xi
E(X) = i=1 ,
k
" k P #
1 X 2 ( ki=1 xi )2
V ar(X) = x − .
k i=1 i k
5.1.2 Modelo de Bernoulli
Definição: Consideremos uma única tentativa de um experimento aleatório de forma que

tenhamos sucesso ou fracasso nessa tentativa.
Seja p a probabilidade de sucesso, logo 1 − p será a probabilidade de fracasso.
Defina a variável aleatória X da seguinte forma: X = 0, se não ocorre sucesso, ou 1,
se ocorre sucesso. Onde
P (X = 0) = 1 − p
P (X = 1) = p.
37
Nessas Condições a variável aleatória X segue o modelo de Bernoulli, e sua função de
probabilidade é dada por:
P (X = x) = px (1 − p)1−x , x = 0, 1.
Note que, E(X) = p e V ar(X) = p(1 − p).

Exemplo: Lança-se um dado e observa-se ocorrência da face 6.
5.1.3 Modelo Binomial
Consideremos n tentativas independentes de um mesmo experimento aleatório. Cada ten-

tativa adimitindo apenas dois resultados: sucesso com probabilidade p e fracasso com
probabilidade 1 − p. As probabilidades de sucesso e fracasso são as mesmas para cada
tentativa.
Seja X: número de sucessos em n tentativas.
A variável aleatória X associada a esse experimento é dita ser uma Variável aleatória
Binomial com parâmetros n e p, que denotaremos por X : b(n, p). Sua função de proba-
bilidade é dada pelo teorema seguinte:
Teorema 5.1. Seja X uma variável aleatória binomial com parâmetros n e p. Então
µ ¶
n
P (X = k) = pk (1 − p)n−k
k
Teorema 5.2. Seja X uma variável aleatória binomial com parâmetros n e p. Então
E(X) = np e V ar(X) = np(1 − p).
Exemplos: Sabe-se que a eficiência de uma vacina é de 80%. Um grupo de três

indivíduos é sorteado dentre a população vacinada, e submetidos a testes para averiguar se
a imunização foi efetiva. Construa a distribuição de probabilidade da variável X = número
de indivíduos imunes na amostra.
5.1.4 Distribuição Geométrica
Considere um experimento cujos resultados podem ser classificados como sucesso ou fra-
casso. Seja p a probabilidade de sucesso, logo 1−p é a probabilidade de fracasso. Considere
a variável aleatória X: número de ensaios até ocorrer o primeiro sucesso. Suponha que os
ensaios são independentes. Dessa forma,
P (X = x) = (1 − p)x−1 p, x = 1, 2, ...
A variável definida acima é chamada de Distribuição geométrica com parâmetro p.

Notação: X : Geométrica(p).
Teorema 5.3. Se X : Geométrica(p), então
38
1
(i) E(X) = p
1−p
(ii) V ar(X) = p2
Exemplo: Se a probablidade de que um certo ensaio dê reação positiva for igual a 0,4,
qual será a probabilidade de que menos de 5 reações negativas ocorram antes da primeira
positiva?
Teorema 5.4. Se X :Geométrica(p) então, para dois quaisquer inteiros positivos s e
t,
P (X ≥ s + t | X > s) = P (X > t)
5.1.5 Distribuição Hipergeométrica
Consideremos uma população com N elementos, dos quais r têm uma determinada carac-
terística (sucesso). Retiramos dessa população, sem reposição, uma amostra de tamanho
n.
Seja X: número de sucessos na amostra.
Dessa forma a distribuição de probabilidade da variável aleatória X é dada por
µ ¶µ ¶
r N −r
k n−k
P (X = k) = µ ¶ , 0 ≤ k ≤ n, k ≤ r.
N
n
A variável X assim definida tem distribuição Hipergeométrica.

Teorema 5.5. Se X tem distribuição Hipergeométrica com parâmetros N, n e p, onde
p = r/N . Então
E(X) = np
e
(N − n)
V ar(X) = np(1 − p) .
(N − 1)
Exemplo: Pequenos motores são guardados em caixas com 50 unidades. Um inspetor

de qualidade examina cada caixa, antes da posterior remessa, testando 5 motores. Se
nenhum motor for defeituoso, a caixa é aceita. Se pelo menos um for defeituoso, todos os
50 motores são testados. Há 6 motores defeituosos numa caixa. Qual a probabilidade de
que seja necessário examinar todos os motores dessa caixa?
5.1.6 Distribuição de Poisson
Uma variável aleatória X tem distribuição de Poisson com parâmetro λ > 0, se sua função
de probabilidade é dada por
e−λ λk
P (X = k) = , k = 0, 1, 2, ...,
k!
39
com o parâmetro λ sendo usualmente referido como a taxa de ocorrência. A notação
utilizada será X : P o(λ).
Teorema 5.6. Se X : P o(λ) então:
E(X) = λ
e
V ar(X) = λ.
Exemplo 1: Num livro de 800 páginas há 800 erros de impressão. Qual a probabilidade
de que uma página contenha pelo menos 3 erros?
Exemplo 2: Numa central telefônica chegam 300 telefonemas por hora. Qual a prob-
abilidade de que:
a) num minuto não haja nenhum chamado;
b) em 2 minutos haja 2 chamados;
c) em t minutos não haja chamados.
5.2 Variáveis Aleatórias Contínuas

5.2.1 Modelo Uniforme
Definição: Uma variável aleatória contínua X tem distribuição uniforme no intervalo [a, b],
se sua f.d.p. for dada por:
½ 1
b−a
, a ≤ x ≤ b,
f (x) =
0, c.c.
Notação: X : U [a, b].

Propriedades: Se X : U [a, b], então
a+b
(i) E[X] = 2
;
(b−a)2
(ii) V ar[X] = 12
.
Exemplo: Com o objetivo de verificar a resistência à pressão de água, os técnicos de

qualidade de uma empresa inspecionam os tubos de PVC produzidos. Os tubos produzidos
têm 6 metros de comprimento e são submetidos a grandes pressões até o aparecimento do
primeiro vazamento, cuja distância a uma das extremidades (fixada à priori) é anotada para
fins de análise posterior. Escolhe-se um tubo ao acaso para ser inspecionado. Queremos
calcular a probabilidade de que o vazamento esteja, no máximo, a 1 metro das extremidades.
Seja X a variável aleatória que indica a distância correspondente ao vazamento. Admita
que a probabilidade de ocerrência de vazamento em todos os pontos são iguais.
40
5.2.2 Distribuição Exponencial
Definição: Uma variável aleatória contínua X, assumindo valores não negativos, terá dis-
tribuição exponencial com parâmetro α > 0, se sua f.d.p. é dada por
½
αe−αx , x > 0
f (x) =
0, c.c.
Notação: X : Exp(α).
Propriedades:
1 1
a) E (X) = α
e V ar (X) = α2
.
b) (Falta de memória) Para todo s, t > 0, teremos
P (X > s + t | X > s) = P (X > t) .
Exemplos:
1) O intervalo de tempo em minutos entre emissões consecutivas de uma fonte radioa-
tiva é uma variável aleatória com distribuição exponencial de parâmetro α = 0, 2. Vamos
calcular a probabilidade de haver uma emissão em um intervalo inferior a 2 minutos.
2) Considerando a distribuição do exemplo anterior, calculemos agora, a probabilidade
do intervalo ser superior ou igual a 7, sabendo-se que ele é superior ou igual a 5 minutos.
5.2.3 Distribuição Normal
Definição: Dizemos que a variável aleatória X tem distribuição normal com parâmetros µ
e σ 2 , −∞ < µ < ∞ e 0 < σ 2 < ∞, se sua f.d.p. é dada por
1 1 x−µ 2
f (x) = √ e− 2 ( σ ) , −∞ < x < ∞.
σ 2π
Notação: X : N (µ, σ 2 ) .
Propriedades
(i) Gráfico: tem a forma de sino;
(ii) f (x) assume valor máximo no ponto x = µ;
(iii) A curva normal é simétrica em relação a µ;
(iv) E (X) = µ e V ar (X) = σ 2 ;
41
(v) Seja X : N (µ, σ 2 ), considere a variável Z = X−µ
σ
. Mostra-se que Z também tem
distribuição normal. Z é chamada de variável normal padrão ou reduzida. É fácil ver
que E(Z) = 0 e V ar(Z) = 1. Logo, a f.d.p. de Z é dada por
1 1 2
f (z) = √ e 2 z , −∞ < z < ∞.
2π
Portanto, se X : N (µ, σ 2 ) ⇒ Z : N (0, 1). A distribuição de Z se encontra tabelada;

(vide tabela em anexo)
(vi) A tabela nos dá a probabilidade P (0 ≤ Z ≤ z), para diversos valores de z. Dessa

forma, podemos calcular probabilidades envolvendo qualquer distribuição normal,
através da transformação Z = X−µ
σ
.
Exemplos:
1. Considere X : N (100, 25), calcular:
a) P (100 ≤ X ≤ 106)
b) P (89 ≤ X ≤ 107)
c) P (112 ≤ X ≤ 116)
d) P (X ≥ 108)
2. Sendo X : N (50, 16), determinar xα , tal que:
a) P (X ≤ xα ) = 0, 05
b) P (X ≥ xα ) = 0, 99
42
1 - Seja X : b(10, 25 ). Calcular:

a) P (X = 3);
b) P (X ≤ 2);
c) P (X − 2 < 1);
d) P (|X − 2| ≤ 1);
e) P (|X − 3| > 1);
f) E(X) e V ar(X);
2 - Seja X : b(n, p). Sabendo-se que E(X) = 12 e V AR(X) = 4, determinar

n, p, E(Z), V ar(Z), sendo Z = X−6
3
.
3 - Numa cidade, é selecionada uma amostra de 60 adultos e a esses indivíduos é pedido

para opinarem se são a favor ou contra determinado projeto. Como resultado obtido,
observou-se 40 a favor. Se na realidade as opiniões pró e contra são igualmente
divididas, qual a probabilidade de ter obtido tal resultado?
4 - O número de partículas Gama emitidas por segundo, por certa substância radioativa,
é uma variável aleatória com distribuição de Poisson com parâmetro λ = 3. Se
um instrumento registrador torna-se inoperante quando há mais de 4 partículas por
segundo, qual a probabilidade de isto acontecer em qualquer dado segundo?
5 - Em um pronto-socorro o número de atendimentos de emrgência segue uma dis-

tribuição de Poisson com média de 60 atendimentos por hora. Calcular:
a) A probabilidade do pronto-socorro não efetuar nenhum atendimento num intervalo
de 5 minutos.
b) A probabilidade do pronto-socorro efetuar pelo menos 2 atendimentos num inter-
valo de 10 minutos.
6 - Uma moeda não viciada é lançada sucessivamente, de modo independente, até que
ocorra a primeira cara. Seja X a variável aleatória que conta o número de lançamentos
anteriores à ocorrência de cara. Determine:
a) P (X ≤ 2);
b) P (X > 1);
c) E(X) e V ar(X)
d) Quantas vezes deve, no mínimo, ser lançada a moeda para garantir a ocorrência
de cara com pelo menos 0,8 de probabilidade?
7 - Numa urna há 40 bolas brancas e 60 bolas pretas. Retiram-se 20 bolas. Qual a

probabilidade de que ocorram no mínimo 2 bolas brancas, considerando as extrações:
a) Sem reposição;
b) Com reposição.
43
8 - Uma urna tem 10 bolas brancas e 40 pretas.
a) Qual a probabilidade de que a sexta bola retirada com reposição seja a primeira
branca?
b) Qual a probabilidade de que em 16 bolas retiradas sem reposição ocorram 3
brancas?
c) Qual a probabilidade de que em 30 bolas retiradas com reposição ocorram no
máximo 2 brancas?
9 - Sendo X : U [0, 4] , calcule:

a) P (X > 2) Resp. 1/2
b) P (X ≥ 2) Resp. 1/2
c) P (1 < X < 2) Resp. 1/4
d) P (1 < X < 2 | X < 3) Resp. 1/3
e) P (X < 3 | 1 < X < 2) Resp. 1
10 - Admite-se que uma pane pode ocorrer em qualquer ponto de uma rede elétrica de 10
km com a mesma probabilidade.
a) Qual a probabilidade da pane ocorrer nos primeiros 500 metros? E de ocorrer nos
3 quilômetros centrais da rede? Resp. 1/20 e 3/10
b) O custo de reparo da rede depende da distância do centro de serviço ao local da
pane. Considere que o centro de serviço está na origem da rede e que o custo é de
R$ 200,00 para distâncias até 3quilômetros, de R$400,00 entre 3 e 8 quilômetros e
de R$ 1000,00 para as distâncias acima de 8 quilômetros. Qual é o custo médio do
conserto? Resp. 460
11 - Suponha que o valor esperado de uma variável aleatória com distribuição uniforme é
1 e a variância é igual a 1/12. Encontre a probabilidade da variável assumir valores
menores que 3/4. Resp. 1/4
12 - Sendo X : Exp(1), determine:

a) P (0 < X < 2) Resp. 0,865
b) P (X < 2) Resp. 0,865
c) P (1 < X < 4) Resp. 0,350
d) P (X > 3) Resp. 0,05
e) P (X < 2 | X > 1) Resp. 0,633
13 - Suponha que o tempo de vida T de um vírus exposto ao meio ambiente segue uma
distribuição Exponencial com parâmetro λ = 1/20 s. Calcule a probabilidade condi-
cional P (T > 15 | T > 10) . Resp. 0,779
14 - Seja X : N (4, 1) , determine:

a) P (X ≤ 4) Resp. 0,5
44
b) P (4 < X < 5) Resp. 0,3413
c) P (2 ≤ X < 5) Resp. 0,8187
d) P (5 ≤ X < 7) Resp. 0,1574
e) P (X ≤ 1) Resp. 0,0013
f) P (0 < X < 2) Resp. 0,0228
15 - Seja X : N (90, 100) , determine:

a) P (X ≤ 115) Resp. 0,9938
b) P (X ≥ 80) Resp. 0,8413
c) P (X ≤ 75) Resp. 0,0668
d) P (85 ≤ X ≤ 110) Resp. 0,6687
e) P (|X − 90| ≤ 10) Resp. 0,6826
f) O valor de a tal que P (90 − a ≤ X ≤ 90 + a) = 0, 95. Resp. a = 19, 6
16 - Para X : N (−5, 10) , calcule:

a) P (−5 < X ≤ −2) Resp. 0,3289
b) P (X ≤ 0) Resp. 0,9429
c) P (X > −6) Resp. 0,6255
d) P (−7 ≤ X ≤ −6) Resp. 0,1102
e) P (|X + 5| > 2) . Resp. 0,4286
17 - Uma clínica de emagrecimento recebe pacientes adultos com peso seguindo uma
distribuição normal de média 130 kg e desvio padrão 20 kg. Para efeito de determinar
o tratamento mais adequado, os 25% pacientes de menor peso são classificados de
“magros”, enquanto os 25% de maior peso de “obesos”. Determine os valores que
delimitam cada uma dessas classificações. Resp. Magros: 116,6 kg Obesos: 143,4
kg
18 - Um teste de aptidão feito por pilotos de aeronaves em treinamento inicial requer

que uma série de operações seja realizada em uma rápida sucessão. Suponha que o
tempo necessário para completar o teste seja distribuído de acordo com uma normal
de média 90 minutos e desvio padrão 20 minutos.
a) Para passar no teste, o candidato deve completá-lo em menos de 80 minutos. Se
65 candidatos tomam o teste, quantos são esperados passar?
b) Se os 5% melhores candidatos serão alocados para aeronaves maiores, quão rápido
deve ser o candidato para que obtenha essa posição?
45
Aluno(a): .
6a NOTA DE AULA
6 Introdução à Estatística
6.1 A Ciência Estatística

O conceito de Estatística pode ser considerado de duas maneiras. O primeiro conceito,
logo relaciona a Estatística com tabelas e gráficos nos quais os dados obtidos são represen-
tados, ou melhor, relaciona à números específicos. Ouvimos, assim, falar em estatísticas
do IBGE, estatísticas relacionadas à saúde e educação, índices econômicos, pesquisas de
opinião, etc. Um segundo conceito refere-se ao conjunto de processos ou técnicas em-
pregadas na investigação e análise de fenômenos. Neste caso, a Estatística é a ciência
ou método científico que estuda os fenômenos aleatórios e, procura inferir as leis que os
mesmos obedecem. Assim, um conceito mais abrangente e absoluto deve englobar tanto o
primeiro conceito, o qual é o mais popular, quanto o segundo, o qual normalmente escapa
à noção corrente.
Definição 6.1 (Estatística). A Estatística é uma ciência que se preocupa com a coleta,
organização, descrição, análise e interpretação dos dados, a fim de extrair informações
a respeito de uma população.
Dentro dessa idéia, podemos considerar a Ciência Estatística como dividida basica-
mente em duas partes:
1. Estatística Descritiva - que se preocupa com a organização e descrição dos dados

experimentais;
2. Estatística Inferencial - que, a partir da observação de alguns dados experimentais,
realiza a análise e interpretação de dados com o objetivo de generalizar e prever
resultados, utilizando-se para isto da Teoria das Probabilidades.
Nesta disciplina, serão abordados tópicos referentes à estatística descritiva, conceitos

fundamentais de probabilidade e os modelos probabilísticos mais importantes para o estudo
da inferência estatística. Serão abordados também alguns índices importantes na área de
economia, tais como: Índices de Gini, Relativo de Preço e de Qualidade, dentre outros.
6.2 Conceitos Fundamentais

Um dos principais conceitos utilizados na estatística é o de população.
46
6.2.1 População e Amostra
Definição 6.2 (População). A população é um conjunto de todos os elementos (pes-

soas, objetos, etc) que possuem pelo menos uma característica em comum, a(s) qual(is)
os relacionam ao problema que está sendo estudado.
Exemplo 6.1. Se o problema a ser pesquisado está relacionado com a qualidade de um
certo produto produzido numa indústria, a população pode ser composta por todas as
peças produzidas numa determinada hora, turno, dia ou mês, dependendo dos objetivos;
Exemplo 6.2. Se o objetivo de um estudo é pesquisar o nível de renda familiar de uma
certa cidade, a população seria todas as famílias desta população. Mas, se o objetivo
fosse pesquisar apenas a renda mensal do chefe da família, a população a ser pesquisada
seria composta por todos os chefes de família desta cidade.
A População pode ser:
1. Finita - quando o número de unidades de observação pode ser contado e é limitado;

2. Infinita - quando a quantidade de unidades de observação é ilimitada;
Podemos citar como exemplo de população finita o conjunto formado pelos alunos
que cursam a disciplina de estatística num determinado semestre da UFCG. Um exemplo de
população infinita seria o conjunto formado por todos os alunos de estatística do Brasil,
pois este conjunto é composto por um número incontável de elementos.
Definição 6.3 (Amostra). A amostra é apenas uma parte da população, ou seja, é um
subconjunto da população.
Vários motivos levam a necessidade de se observar apenas uma parte da população,

como, por exemplo: a falta de tempo, recursos financeiros e/ou humanos. A amostra deve
ser obtida através de técnicas de amostragem, as quais tem como objetivo principal
garantir a representatividade da população, ou seja, fazer com que a amostra seja um
retrato fiel da população.
Exemplos de amostra podem ser considerados por conjuntos formados por apenas uma
parte dos elementos populacionais descritos nos exemplos 1 e 2.
6.2.2 Parâmetro e Estatística
Dois novos conceitos estreitamente relacionados com os de população e amostra são

os de Parâmetro e Estatística, tendo em vista que:
Definição 6.4 (Parâmetro). é uma medida numérica que descreve uma característica
da população.
Definição 6.5 (Estatística). é uma medida numérica que descreve uma característica
da amostra.
Exemplos de algumas medidas numéricas são: proporção, média, moda, índices, etc.
47
6.2.3 Variáveis (ou Dados) e Tipos de Variáveis
Definição 6.6 (Variável). Uma Variável nada mais é que uma característica (ou dado)
associada a cada elemento da população ou amostra. A variável apresenta diferentes
valores, quando sujeita a mensurações sucessivas, e, em geral, é denotada pelas letras
maiúsculas: X, Y ou Z.
Antes de realizar qualquer tratamento estatístico de um conjunto de dados, é impor-

tante identificar qual é o tipo de dado (ou variável) que será analisado, pois, é mediante a
este conhecimento que o pesquisador poderá ou não adotar determinadas técnicas estatís-
ticas para a resolução de problemas. Por exemplo, será que é possível calcular o peso médio
de lutadores de boxe, quando os dados são coletados segundo a categoria de peso (Leve,
Médio e Pesado)?
Tipos de Variáveis
Basicamente, as variáveis podem ser classificadas como sendo Qualitativas ou Quan-
titativas.
1. Variáveis Qualitativas - quando os valores que elas podem receber são referentes
à qualidade, atributo ou categoria. Exemplos são:
• Raça: podendo assumir os valores Branco ou Negro;

• Resultado de um teste: aprovado ou reprovado;
• Escolaridade: 1 ◦ grau completo, 2 ◦ grau completo, superior, pós-graduado;
• Conceito de qualidade: péssima qualidade, regular ou boa qualidade.
As variáveis qualitativas podem, ainda, ser classificadas como: Nominais ou Ordi-

nais.
(a) As variáveis qualitativas nominais - são caracterizadas por dados que se

apresentam apenas sob o aspecto qualitativo (Ex: raça e resultado de um teste).
(b) As variáveis qualitativas ordinais - são caracterizadas por categorias que
aprentam uma ordenação natural. Por exemplo: escolaridade e conceito de
qualidade.
2. Variáveis Quantitativas - quando os valores que ela pode assumir são numéricos,
os quais podem ser obtidos através de uma contagem ou mensuração.
As variáveis quantitativas podem ser classificadas de acordo com o processo de
obtenção; podendo ser: Discreta ou Contínua.
(a) As variáveis quantitativas discretas - são variáveis numéricas obtidas a partir

de procedimento de contagem. Por exemplo: Quantidade de pessoas numa
família, quantidade de acidentes numa indústria, etc.
48
(b) As variáveis quantitativas contínuas - são variáveis numéricas cujos valores
são obtidos por um procedimento de mensuração, podendo assumir quaisquer
valores num intervalo dos números reais, como por exemplo, a temperatura,
altura, salário, etc..
Observação 1. O fato de uma variável ser expressa por números não significa que ela
seja necessariamente quantitativa, por que a classificação da variável depende de como
foi medida, e não do modo como se manifesta. Por exemplo, para a variável peso de
um lutador de boxe, se for anotado o peso marcado na balança, a variável é quantitativa
contínua; por outro lado, se esse peso for classificado segundo as categorias do boxe, a
variável é qualitativa ordinal.
6.3 Fases do Método Estatístico

Assim como qualquer ciência, a estatística utiliza o método científico, que consiste das
cinco etapas básicas seguintes:
1. Definir cuidadosamente o problema.

Nesta etapa o pesquisador deve certificar-se de que é clara a finalidade de um estudo
ou análise. Ao definir o que se quer estudar, ou seja, o problema, é necessário que
se faça um levantamento sobre quais estudos já realizados no campo de pesquisa
abordado. Deve-se também especificar quem ou o quê será observado no estudo, ou
seja, a população a ser pesquisada.
2. Formular um plano para a coleta dos dados adequados.

Nesta fase, o pesquisador deverá listar as variáveis (características ou dados) que se-
jam relevantes para se atingir os objetivos propostos pela pesquisa. Além disso, deve-
se decidir se a coleta dos dados será realizada através de um censo ou amostragem,
ou seja, se todos os elementos da população serão observados ou se apenas uma
parte da população é que será observada.
Os dados podem ser classificados quanto à forma de coleta, como:
a. Dados primários - quando o próprio pesquisador é quem elabora e aplica os
instrumentos necessários para a coleta dos dados, ou seja, quando a Coleta é Direta;
b. Dados secundários - quando o pesquisador utiliza informações já colhidas por
outrem, retirando-as de livros, revistas, mapas anuários, etc.
3. Coligir ou apurar os dados.

Esta fase consiste em resumir os dados, através de sua contagem e agrupamento.
4. Analisar e interpretar os dados.
5. Relatar as conclusões de maneira que sejam facilmente entendidas por quem as for
usar na tomada de decisões.
49
1 - Defina e/ou explique com suas próprias palavras, o que você entende por Ciência
Estatística e quais os principais ramos (partes) da Estatística.
2 - Através de um exemplo, defina: População e Amostra.
3 - Considere as seguintes situações:
1) Em uma pesquisa, feita pela EMPETUR com 1015 pousadas escolhidas aleato-
riamente, 269 (ou 26,5%) possuíam Home-page na Internet para divulgação e
prestação de serviços ao turista.
2) Outra pesquisa feita entre as 50 Agências de Viagens de uma certa localidade
mostra que 42 (ou 84%) prestam serviços pela Internet.
Identifique em qual das situações nós temos um exemplo de Parâmetro e outro de
Estatística (no sentido de medida). Justifique sua resposta.
4 - O que você entende por variável? Justifique a sua resposta por intermédio de um
exemplo.
5 - Como você diferencia uma variável discreta de uma variável contínua? Utilize um
exemplo para melhor ilustrar.
6 - Defina e/ou explique com suas próprias palavras, o que você entende por amostragem.
7 - Qual é o principal objetivo de qualquer plano de amostragem?
8 - As estatísticas geradas por intermédio de uma amostra devem ser representativas
desta amostra ou da população de origem? Justifique a sua resposta.
9 - Para que uma amostra seja representativa, é necessário apenas que a mesma tenha
um tamanho apropriado? Justifique a sua resposta.
10 - A Revista dos Eventos, N 13, tentando sanar, ao menos parcialmente, a carência
de informações precisas sobre a indústria de eventos, promoveu a 1a PESQUISA -
O Mercado de Congressos no Brasil. Os resultados desta pesquisa se baseiam em
40 questionários respondidos sobre um total de 1000, os quais foram encaminhados
por entrega pessoal a dirigentes de entidades integrantes do cadastro da própria
Revista dos Eventos. Qual é o problema ou a limitação desta pesquisa? Pelo menos
teoricamente, qual seria o melhor procedimento para este tipo de pesquisa, já que a
empresa possui um cadastro das entidades?
11 - Classifique cada uma das informações (variáveis) abaixo, de acordo com os tipos de
variáveis.
a) Nome
b) Nível de satisfação
c) Idade
d) Número de dias hospedado
50
Aluno(a): .
7a NOTA DE AULA
7 Estatística Descritiva
7.1 Introdução
A estatística pode ser considerada como um instrumento ou um conjunto de métodos
matemáticos que devem ser utilizados quando se pretende transformar dados em informação.
Para ilustrar este processo, veja a Figura 1:
12 15 18 Média
15 12 18 Moda
18 15 18 ⇒ Mediana
17 19 20 Proporção
Quantis
Conjunto de dados
Conjunto de informações
Figura 1:
No primeiro retângulo, tem-se um conjunto de observações da variável idade de um
grupo de 12 pessoas e, no segundo retângulo, as estatísticas (informações) que podem
representar esses números.
7.2 Organização de dados: Tabelas e Gráficos

7.2.1 Distribuição de Frequências
O primeiro passo para se resumir um conjunto de dados é ordená-los em ordem cres-

cente ou decrescente, e proceder a contagem do número de ocorrência (freqüência) de cada
dado. À ordenação dos dados denominamos de Rol. Assim, o rol para o conjunto de dados
da Figura 1 fica:
Rol de dados:
12 12 15 15 15
17 18 18 18 18
19 20
Desta maneira, fica fácil verificar a freqüência com que cada um dos dados foi obser-
vado, por exemplo: o valor 12 ocorreu 2 vezes; o valor 15 ocorreu 3 vezes, e assim por
diante.
51
Uma maneira adequada de apresentar os dados e suas respectivas freqüências é através
de uma Tabela de Freqüências, a qual é constituída por uma coluna referente aos
dados e outra referente às freqüências associadas a cada valor observado (ni ). Veja
como fica para o conjunto de dados da Figua 1:
Tabela 1: Tabela de Freqüências da variável

idade, para um grupo de 12 pessoas.
Idade Frequência (ni )
12 2
15 3
17 1
18 4
19 1
20 1
Total de observações (n) 12
Uma medida bastante útil na interpretação de tabelas de freqüências é a freqüência

relativa (fri ), a qual é dada pela razão entre a freqüência do i-ésimo valor observado, ni e
o total de dados observados, n. Pode-se, ainda, representar a freqüência relativa em termos
de porcentagem, bastando para isso multiplicar a freqüência relativa fri por 100.
Para alguns tipos de variáveis, tais como a qualitativa ordinal e as quantitativas (disc-
reta ou contínua), pode ser útil também, a informação de quantas observações apresentam
valores menores ou iguais a um certo valor fixado. Este tipo de informação é denominado
de freqüência acumulada, fac , a qual também pode ser expressa em termos relativos ou
por porcentagens.
Vejamos, agora, como fica a tabela de freqüências anterior com estas informações
adicionadas:
Tabela 2: Tabela de Freqüências da variável

idade, para um grupo de 12 pessoas.
Idade ni fri fri × 100 (%) fac (%)
12 2 0,1667 16,67 16,67
15 3 0,2500 25,00 41,67
17 1 0,0833 8,33 50,00
18 4 0,3333 33,33 83,33
19 1 0,0833 8,33 91,67
20 1 0,0833 8,33 100,00
Total (n) 12 1,0000 100,00
Observação: Ao conjunto de todos os pares de valores, referentes a cada dado obser-

vado e sua respectiva freqüência, denominamos de Distribuição de Freqüências. Desta
forma, os pares (12, 2), (15, 3), (17, 1), (18, 4), (19, 1) e (20, 1) representam a distribuição
de freqüências da variável idade para esse grupo de pessoas.
52
Representação Gráfica
Uma representação gráfica da distribuição de freqüências de uma variável tem a van-

tagem de, numa maneira rápida e concisa, informar sobre a variabilidade da mesma.
Gráfico de Colunas - é mais adequado para variáveis discretas mas também pode ser
utilizado para variáveis qualitativas ordinais, ou ainda, para variáveis qualitativas nominais
cujos nomes das categorias são pequenos.
Neste gráfico, cada valor observado é representado por retângulos de mesma base
e alturas proporcionais às freqüências. Para ilustrar, veja como fica este gráfico para a
distribuição de freqüências da variável idade, utilizando a freqüência absoluta e relativa em
termos de porcentagem:
Figura 1:
Distribuição de freqüências da variável idade

4.5
4
4
3.5
Freqüência (n_i)
3
3
2.5
2
2
1.5
1 1 1
1
0.5
0
12 15 17 18 19 20
Idade (anos)
Figura 2:
Distribuição de freqüências da variável idade

50.0%
45.0%
40.0%
Freqüência (%)
35.0% 33.3%
30.0%
25.0%
25.0%
20.0% 16.7%
15.0%
10.0% 8.3% 8.3% 8.3%
5.0%
0.0%
12 15 17 18 19 20
Idade (anos)
53
Exercício de Fixação
1 - O seguinte conjunto de dados é referente ao número de acidentes por dia em certo

trecho de rodovia no mês de setembro de certo ano:
2 0 1 2 3 1 6 1 0 0
1 2 2 1 2 0 1 4 2 3
0 1 0 2 1 2 4 1 1 1
Responda as seguintes questões:
a) Qual o número mínimo de acidentes, num certo dia? E o número máximo?

b) Freqüêntemente, ocorreram quantos acidentes por dia? Isto ocorreu em quantos
dias? E o que isso representa em termos de percentuais?
c) Represente graficamente a distribuição de frequência da variável número de
acidentes por dia, no mês de setembro.
d) Faça um gráfico de colunas para o percentual acumulado.
54
7.2.2 Distribuição de Frequências para Dados Agrupados em Classes
Em algumas situações, é necessário o agrupamento de dados em categorias ou classes

para se proceder a construção de uma tabela de freqüências. Por exemplo, em um conjunto
de dados contínuos, um mesmo valor não ocorrerá com grande freqüência, ou até mesmo,
não se repetirá por mais de uma vez. Uma vantagem em agrupar os dados em classes
consiste na organização de grandes conjuntos de dados de forma mais clara e objetiva.
Por outro lado, uma desvantagem, consiste na perda de informações por não se saber
exatamente quais os valores ocorridos dentro de cada classe.
Para ilustrar como proceder a construção de uma tabela de freqüências em classes,
considere o seguinte conjunto de dados:
Tabela 2: Dados referentes às notas no 1o estágio de 20 estudantes de estatística.
Código do aluno 1 2 3 4 5 6 7 8 9 10
Nota 7,5 8,0 9,0 7,3 6,0 5,8 10,0 3,5 4,0 6,0
Código do aluno 11 12 13 14 15 16 17 18 19 20
Nota 7,5 7,0 8,5 6,8 9,5 9,8 10,0 4,8 5,5 7,0
Note que, não haverá vantagem alguma se organizarmos estes dados numa tabela de
freqüências, uma vez que os dados pouco se repetem. Assim, torna-se útil o agrupamento
dos dados, que, de um modo geral, pode ser feito de acordo com os seguintes passos:
1. Organizar os dados num Rol.

2. Estabelecer o Número de Intervalos (categorias ou classes) para se dividir o con-
junto de dados.
A escolha do número de classes é arbitrária, a qual pode ser estabelecida de acordo
com o bom senso do pesquisador ou obtido por alguma fórmula matemática
construída para este fim. Uma sugestão prática é a escolha entre 5 e 15 classes com
a mesma amplitude e duas fórmulas matemáticas que podem orientar na escolha do
número de classes, são:
√
(a) k = n
(b) k = 1 + 3, 3 × log(n)
Onde k é o número de classes e n é o número total de observações.

3. Calcular a Amplitude Total:
AT ot = xmáx − xmín
Onde xmáx e xmín é o valor máximo e mínimo observado no conjunto de dados.
4. Determinar a Amplitude de Classe:
AT ot
h=
k
55
5. A partir do menor valor observado no conjunto de dados, ou de algum valor imediata-
mente inferior e adequadamente escolhido, delimitar as classes, ou seja, determinar
os limites inferiores e superiores de cada classe.
Neste momento, os seguintes símbolos são úteis:
(a) li − |Li - para indicar que o valor extremo inferior (li ) não pertence à i − sima
classe, enquanto que o valor extremo superior (Li ) pertence.
(b) li |−Li - para indicar que o valor extremo inferior (li ) pertence à i−sima classe,
enquanto que o valor extremo superior (Li ) não pertence.
6. Após todos estes passos, só resta proceder a contagem do número de observações

pertencentes à cada uma das classes e organizar estas informações numa tabela de
freqüências para dados agrupados.
De acordo com estes passos, o conjunto de dados anterior pode ser organizado como:
(Construir a tabela de freqüências para dados agrupados)
Representação Gráfica de uma Variável Quantitativa Contínua - Histograma
Para a representação gráfica de variáveis quantitativas contínuas é necessário alguma

adaptação do gráfico de colunas, uma vez que, em geral, é necessário agrupar os dados em
classes e conseqüentemente há perda de informações.
Histograma - é um gráfico indicado para representar dados agrupados em classes.

Este gráfico é uma adaptação do gráfico de colunas, onde as bases correspondem aos
intervalos de classe e as alturas são proporcionais às freqüências de classe. Veja como fica
o histograma para a distribuição das notas:
(Construir o histograma para a distribuição de freqüências em classes)
56
Aluno(a): .
8a NOTA DE AULA
7.3 Medidas Resumo para Variáveis Quantitativas

Nesta seção veremos algumas medidas que tem como objetivo resumir um conjunto
de dados em um único valor o qual possa fornecer informações sobre o comportamento dos
dados, ou seja, sobre a distribuição de freqüências da variável.
7.3.1 Medidas de Tendência Central
As medidas de tendência central são bastante utilizadas e representam o centro ou o

meio de um conjunto de dados. As principais são: a mediana, a moda, e a média aritmética.
A seguir estas medidas são definidas e obtidas para os dois seguintes conjuntos de
dados que representam o número de gols registrados em cada partida de futebol, durante
5 e 6 jogos, respectivamente:
Conjunto de dados 1: Número de gols por partida de futebol, em 5 jogos.
3 2 1 2 5
Conjunto de dados 2: Número de gols por partida de futebol, em 6 jogos.
5 3 2 1 2 5
1. Mediana - é o valor que divide o conjunto de dados ordenados em duas partes

iguais, ou seja, 50% das unidades observadas possuem valores menores ou iguais ao
valor mediano e as demais 50% possuem valores acima da mediana.
Para se obter o valor da mediana é necessário os seguintes passos:
1 ◦ ) Ordenar o conjunto de dados em ordem crescente (ou descrescente);
2 ◦ ) Identificar a posição central do conjunto de dados, ou seja, a posição onde
se encontra o valor da mediana. Esta(s) posição(ões) pode(m) ser verificada(s)
utilizando-se as seguintes fórmulas:
(a) PM d = n+12
, se o total de observações, n, é ímpar. Assim, a mediana será
o valor observado na posição PM d ;
(b) P 1M d = n2 e P 2M d = n2 + 1, se o total de observações, n, é par. Pois, neste
caso, existem duas posições centrais e a mediana será a média aritmética dos
valores observados nestas duas posições.
Notação: M d ou M d(X).
57
Exemplo 1: A partir do conjunto de dados 1, pode-se obter o seguinte rol de dados:
1 2 2
|{z} 3 5
mediana
Note que, o número de observações, n = 5, é ímpar, logo o valor da mediana (valor

central) está na posição PM d = n+1
2
= 5+1
2
= 3, que é igual a M d = 2.
Exemplo 2: Ordenando em ordem crescente o conjunto de dados 2, teremos o
seguinte rol de dados:
1 2 2|{z}3 5 5
dois valores centrais
Agora, neste caso, o número de observações, n = 6, é par, e, portanto, existem dois

valores centrais localizados nas posições P 1M d = n2 = 62 = 3 e P 2M d = n2 + 1 =
3 + 1 = 4. Assim, a mediana será a média aritmética dos valores que se encontram
nestas duas posições, dada por:
xP1M d + xP2M d 2+3

Md = = = 2, 5.
2 2
Observação:
Pode-se, também, obter a posição da mediana através dos seguintes passos:
1 ◦ ) Obter o valor que representa a metade do total de observações: PM d = n2 ;
2 ◦ ) Utilizar a seguinte regra:
(a) Se PM d for um número não inteiro, então, arredonda-se o valor de PM d para

o maior inteiro mais próximo, e, assim, o valor da mediana estará nesta nova
posição obtida.
(b) Se PM d for um número inteiro, então o valor da mediana será a média aritmética
dos valores que estão nas posições PM d e PM d + 1.
Exemplo 3: Utilizando-se os procedimentos descritos na observação acima, temos

que, para o conjunto de dados 1, PM d = n2 = 52 = 2, 5 (não inteiro), logo o valor da
mediana estará na posição PM d = 3 (maior inteiro mais próximo), que é dado por
M d = 2.
Exemplo 4: No conjunto de dados 2, temos PM d = n2 = 62 = 3 (inteiro), assim, de
acordo com o procedimento descrito na observação acima, temos que a mediana é
dada pela média aritmética dos valores observados nas posições PM d = 3 e PM d +1 =
3 + 1 = 4:
xP1M d + xP2M d 2+3

Md = = = 2, 5.
2 2
58
2. Moda - é o valor (ou os valores) no conjunto de dados que ocorre(m) com maior
freqüência.
Notação: Mo ou Mo (X).
Exemplo 5: O primeiro conjunto de dados, 1 2 2 3 5, é dito ser unimodal,
tendo em vista que um único valor ocorre com maior frequência. Assim, a moda é
Mo = 2.
Exemplo 6: O segundo conjunto de dados, 1 2 2 3 5 5, é dito ser bimodal,
tendo em vista que, neste caso, dois valores ocorrem com maior frequência, assim,
os valores modais são: Mo = 2 e Mo = 5.
3. Média Aritmética (Média) - é obtida a partir da razão entre a soma dos valores
observados e o total de observações:
soma dos valores

Média =
total de observações (n)
Notação: M e, M e(X) ou x.
Exemplo 7: A partir do conjunto de dados 1, a média é obtida por:
soma dos valores 1+2+2+3+5

M e(X) = x = = = 2, 6.
total de observações (n) 5
Observação:
1)
P A média aritmética pode ser expressa através do uso do símbolo de somatório
(sigma). Por exemplo, se x1 , x2 , . . . , xk são k valores distintos da variável X,
podemos escrever:
k
x1 + x2 + . . . + xk 1X
M e(X) = x = = xi
k k i=1
Agora, se, de um total de n valores observados (ou observações), x1 ocorreu n1 vezes,

x2 ocorreu n2 vezes, etc., xk ocorreu nk vezes, então a média de X pode ser reescrita
como:
k
x1 .n1 + x2 .n2 + . . . + xk .nk 1X
M e(X) = x = = xi .ni (1)
n n i=1
k
X ni
= xi . (2)
i=1
n
Xk
= xi .fi . (3)
i=1
Onde:
59
• ni é freqüência absoluta do valor observado xi ,
P
• n = ki=1 ni é o total de observações, e,
• fi é freqüência relativa do valor observado xi .
Exemplo 8: A partir do segundo conjunto de dados, 1 2 2 3 5 5, temos:
k
1X 1 18
M e(X) = x = xi .ni = (1 × 1 + 2 × 2 + 3 × 1 + 5 × 2) = = 3.
n i=1 6 6
Exercício: Dado o seguinte conjunto de dados:
12 12 15 15 15 17 18 18 18 18 19 20
Determine a média, moda e mediana.

Solução:
7.3.2 Medidas de Tendência Central para Dados Agrupados
Sabemos que ao agrupar um conjunto de dados em classes, perde-se informação sobre

cada valor individual e, no caso em que seja impossível recuperar cada valor observado,
pode-se supor que todos os dados dentro de uma classe tenham seus valores iguais ao
ponto médio desta classe. Assim, pode-se, por exemplo, utilizar os pontos médios das
classes e suas respectivas freqüências para calcular a média aritmética de maneira análoga
ao exposto anteriormente. Da mesma forma, pode-se adotar como valor modal, o ponto
médio da classe modal e como mediana, o ponto médio da classe mediana.
Exemplo: Dada a seguinte distribuição de freqüência da variável S=salário (dados
agrupados em classes):
Salário Frequência Absoluta

4, 00| − 8, 00 10
8, 00| − 12, 00 12
12, 00| − 16, 00 8
16, 00| − 20, 00 8
20, 00| − 24, 00 2
Determine o valor (aproximado) da média, moda e mediana.
60
Solução:
7.3.3 Medidas de Dispersão ou de Variabilidade
Na sumarização de um conjunto de dados, uma única medida representativa da posição

central, esconde toda a informação sobre a variabilidade dos dados. Veja, por exemplo, os
seguintes dados:
Variável X : 3 4 5 6 7
Variável Y : 3 5 5 7
Note que a média M e(X) = M e(Y ) = 5, a qual nada informa sobre a variação dos
valores nos dois grupos. Assim, torna-se importante o conhecimento de uma medida que
forneça este tipo de informação.
Na prática, existem várias medidas que expessam a variabilidade de um conjunto de
dados, sendo que as mais utilizadas baseam-se na idéia que consiste em verificar a distância
de cada valor observado em relação à média. Estas distâncias são denominadas de desvios
em relação à média.
Definição 7.1 (Variância). - é uma medida que representa a variabilidade de um

conjunto de dados e, é obtida pelo cálculo da média dos quadrados dos desvios em
relação à média:
V ar(X) = s2
k
1X
= (xi − x)2 × ni
n i=1
k
X ni
= (xi − x)2 ×
i=1
n
61
k
X
= (xi − x)2 × fi
i=1
Observação: Para o cálculo da variância, quando os dados estão agrupados em

classes, basta substituir os verdadeiros valores observados pelo ponto médio da i-ésima
classe.
Definição 7.2 (Desvio Padrão). - é a raiz quadrada da variância.

v
u k
√ uX
D.P.(X) = s = s2 = t (xi − x)2 × fi
i=1
O uso do desvio padrão como medida de variabilidade é preferível pelo fato de ser
expresso na mesma unidade de medida dos valores observados. Pois, a variância pode
causar problemas de interpretação por ser expressa em termos quadráticos.
Definição 7.3 (Coeficiente de Variação). - O coeficiente de variação (CV) é uma me-

dida relativa de variabilidade. O seu valor é determinado por intermédio do quociente
entre o desvio padrão e a média aritmética dos dados.
s
CV (X) = × 100 (expresso em porcentagem (%))
x
A utilidade imediata do coeficiente de variação é a possibilidade de avaliar o grau

de representatividade da média. Esta medida também é bastante útil na comparação
entre conjunto de dados, em relação à variabilidade; ainda que as unidades de medida nos
conjuntos de dados sejam distintas. Por exemplo, comparar a variabilidade das distribuições
da variável peso expressa em quilogramas (Kg) e altura expressa em metros (m).
Um critério de decisão sobre a representatividade ou não da média, pode ser dada pela
seguinte linha de corte:
Se CV ≥ 50%, a média não é representativa.

Se CV < 50%, a média é representativa.
Exemplos:
√
a) O desvio padrão das variáveis X e Y é DP (X) = DP (Y ) = s = 2 = 1, 41.
b) Considere os quilômetros rodados por 3 carros: 30 Km, 40 Km e 50 Km. Calcule

a média, a variância, o desvio padrão e o CV. Interprete essas medidas.
62
7.3.4 Medidas de Posição: Quartis, Decis e Percentis
Assim como a mediana divide os dados em duas partes iguais, os três quartis, denota-
dos por Q1 , Q2 e Q3 , dividem as observações ordenadas (em ordem crescente) em quatro
partes iguais. A grosso modo:
- Q1 separa os 25% inferiores dos 75% superiores dos valores ordenados;
- Q2 separa os 50% inferiores dos 50% superiores, ou seja, é a mediana; e
- Q3 separa os 75% inferiores dos 25% superiores dos dados;
Analogamente, há nove decis, denotados por D1 , D2 , . . . , D9 , que dividem os dados
em 10 grupos com cerca de 10% deles em cada grupo. Finalmente, há 99 percentis que
dividem os dados em 100 grupos com cerca de 1% em cada grupo.
Basicamente, dois passos são necessários para se encontrar as medidas em questão.
Primeiro deve-se identificar a sua posição, e, em seguida, determinar o seu valor.
Veja a seguir, como obter os valores referentes aos percentis, quando se está traba-
lhando com dados brutos ou em distribuição de freqüências para dados não agrupados:
1 ◦ ) Identificar a posição do percentil que se deseja encontrar, através da seguinte
expressão: µ ¶
k
L= ×n
100
Onde:
- L é o valor que indica a posição do percentil de interesse;
- k é o k − ésimo percentil; e
- n é o total de dados observados.
2 ◦ ) Utilizar a seguinte regra:
1. Se L for um número não inteiro, então, arredonda-se o valor de L para o maior

inteiro mais próximo, e, assim, o valor do k − ésimo percentil, Pk , é dado pelo valor
que ocupa esta nova posição obtida.
2. Se L for um número inteiro, então o valor do k − ésimo percentil, Pk , será a média

aritmética dos valores que estão nas posições L e L + 1.
Uma vez dominados os cálculos para os percentis, pode-se seguir o mesmo processo
para calcular
¡ ¢ os quartis e decis, tendo-se
¡ k ¢ o cuidado de calcular o valor de L, pelas fórmulas
L = k4 × n, k = 1, 2, 3 e L = 10 × n, k = 1, 2, . . . , 9, respectivamente. Pode-se,
ainda, obter os quartis e decis pelas seguintes relações existentes entre estas medidas e os
percentis:
63
Quartis Decis
Q1 = P25 D1 = P10
Q2 = P50 D2 = P20
..
Q3 = P75 .
D9 = P90
Além das medidas de tendência central e de variação já introduzidas, costuma-se definir

outras estatísticas utilizando quartis, decis ou percentis, tais como:
Intervalo interquartil = Q3 − Q1
Intervalo semi-interquartil = (Q3 − Q1 )/2
Amplitude de percentis 10-90 = P90 − P10
Eis as fórmulas para os cálculos dos quartis, decis e percentis para o caso de variáveis
agrupadas em classes.
Determinação do Q1 :
Passo 1: Calcula-se n4 .
Passo 2: Identifica-se a classe Q1 pela Ni .
Passo 3: Aplica-se a fórmula:
P
( n4 − f )h
Q1 = lQ1 +
nQ1
em que
lQ1 = limite inferior da classe Q1
n = tamanho da amostra ou número de elementos
P
f = soma das frequências anteriores à classe Q1
h = amplitude da classe Q1
nQ1 = frequência da classe Q1 .
Determinação do Q2 (ou mediana):

Passo 1: Calcula-se n2 .
P
( n2 − f )h
Q2 = lQ2 +
nQ2
Determinação do Q3 :
3n
Passo 1: Calcula-se 4
.
64
P
( 3n
4
− f )h
Q3 = lQ3 +
nQ3
Determinação de um Decil:
in
, em que i = 1, 2, 3, 4, 5, 6, 7, 8 e 9
Passo 2: Identifica-se a classe Di pela Ni .
in
P
( 10 − f )h
Di = lDi +
nDi
Determinação de um percentil:
in
, em que i = 1, 2, 3, . . . , 98 e 99
Passo 2: Identifica-se a classe Pi pela Ni .
in
P
( 100 − f )h
Pi = lPi +
n Pi
Observação:
No caso de dados agupados em classes o histograma pode ser utilizado para se
obter o k − ésimo quartil, dercil ou percentil .
7.4 Outra Estratégia de Análise de Dados

Em algumas situações a média e o desvio padrão podem não ser adequados para
representar um conjunto de dados, pois:
i - São afetadas, de forma exagerada, por valores extremos;

ii - Apenas com estes dois valores não temos a idéia da assimetria dos valores, ou seja,
sobre o quanto os dados se distribuem em torno dos valores inferiores, medianos e
superiores.
Para contornar estes problemas, 5 medidas foram sugeridas por Tukey (1977):
1 ◦ ) A mediana (M d);
2 ◦ ) Os extremos: o menor e o maior valor observado no conjunto de
dados (xmín e xmáx , respectivamente);
3 ◦ ) O primeiro e o terceiro quartil (ou junta).
65
7.4.1 Desenho Esquemático - Diagrama em Caixa ("Box-Plot")
As informações obtidas pelas 5 medidas podem ser representadas por um gráfico co-
nhecido por "Box-Plot"ou diagrama em caixa. Para construir este diagrama, consideremos
um retângulo onde estão representados a mediana e os quartis. A partir do retângulo, para
cima, segue uma linha até o ponto mais remoto que não exceda LS = Q3 + (1, 5)dp ,
chamado limite superior. De modo similar, da parte inferior do retângulo, para baixo, segue
uma linha até o ponto mais remoto que não seja menor do que LI = Q1 −(1, 5)dp , chamado
limite inferior. Os valores compreendidos entre esses dois limites são chamados valores
adjacentes. As observações que estiverem acima do limite superior ou abaixo do limite
inferior estabelecidos serão chamadas pontos exteriores e representadas por asteriscos.
Essas são observações destoantes das demais e podem ou não ser o que chamamos de
outliers ou valores atipicos.
O boxplot dá uma idéia da posição, dispersão, assimetria, caudas e dados discrepantes.
A posição central é dada pela mediana e a dispersão por dq . As posições relativas de q1 , q2 , q3
dão uma noção da assimetria da distribuição.
Veja, como fica o box-plot da variável Peso
Figura 3: Box-plot para a variável Peso
Gráficos tipo box-plot também são úteis para detectar, descritivamente, diferenças
nos comportamentos de grupos de variáveis. Por exemplo, podemos considerar gráficos da
variável Peso para cada sexo. O resultado é apresentado na figura abaixo, em que podemos
notar que os homens apresentam peso mediano superior ao das mulheres, além de uma
maior variabilidade.
66
Figura 4: Box-plot da variável Peso para cada sexo
67
1 - Considere uma distribuição de freqüências qualquer representada por
(x1 , n1 ), (x2 , n2 ), . . . , (xk , nk ).
Mostre
Pk que a soma dos desvios em relação à média é igual zero, ou seja, que
i=1 i − x) × ni = 0.
(x
2 - Obtenha a média e a mediana para o seguinte conjunto de dados:
20 30 40
a) Se substituímos o valor 40 por 70, os valores da média e da mediana serão os

mesmos? Justifique?
b) Analisando os resultados acima, ressalte uma característica vantajosa da medi-
ana em relação à média.
3 - Mostre que:
³P ´2
k
k
X k
X i=1 xi ni k
X
2
(xi − x) × ni = x2i ni − = x2i ni − nx2
i=1 i=1
n i=1
E, por isso, a variância também pode ser obtida pela seguinte fórmula:
k
1X 22
V ar(X) = s = xi n i − x 2
n i=1
4 - O seguinte conjunto de dados representa a pulsação de 22 fumantes:
52 52 60 60 60 60 63 63 66 67
68 69 71 72 73 75 78 80 82 83
84 90
Usando os dados brutos, determine:
a) A média, a moda e o desvio padrão;

b) O primeiro, segundo e terceiro quartil;
c) Construa uma tabela de frequências para os dados agrupados em 7 classes;
d) Construa o histograma e o diagrama em caixa;
Agora, utilizando a distribuição de frequências obtida acima, obtenha:
a) A média, a moda e o desvio padrão;

b) O primeiro, segundo e terceiro quartil utilizando o histograma;
68
5 - O ROL de 50 notas de alunos de Estatística (dadas em créditos), estão relacionadas
abaixo:
33 35 35 39 41 41 42 45 47 48
50 52 53 54 55 55 57 59 60 60
61 81 71 67 63 64 53 73 81 50
67 68 53 75 65 58 80 60 63 53
Baseado nestes dados, determine:
a) A distribuição de frequências (Sugestão: iniciar por 30);

b) As frequências relativas (fi ) e suas respectivas porcentagens ((100 ∗ fi )%);
c) O histograma;
6 - Dados os conjuntos de números: A = {1000; 1001; 1002; 1003; 1004; 1005} e B =

{0, 1, 2, 3, 4, 5} podemos afirmar que:
a) o desvio-padrão de A é igual a 100 vezes o desvio-padrão de B.
b) o desvio-padrão de A é igual ao desvio-padrão de B.
c) o desvio-padrão de A é igual ao desvio-padrão de B multiplicado pelo quadrado de
1000.
d) o desvio-padrão de A é igual ao desvio-padrão de B dividido por 1000.
e) o desvio-padrão de A é igual ao quadrado do desvio-padrão de B.
7 - Em uma granja foi observada a distribuição do frangos em relação ao peso, que era
a seguinte:
P eso(gramas) ni
0960| − 0980 60
0980| − 1000 160
1000| − 1020 280
1020| − 1040 260
1040| − 1060 160
1060| − 1080 80
a) Construa o histograma;
b) Queremos dividir os frangos em quatro categorias, em relação ao peso, de modo
que: os 20% mais mais leves sejam da categoria D; os 30% seguintes sejam da
categoria C; os 30% seguintes sejam da categoria B; os 20% seguintes sejam da
categoria A. Quais os limites de peso entre as categorias A, B, C e D?
8 - Estudando-se o consumo diário de leite, verificou-se que, em certa região, 20% das
famílias consomem até um litro, 50% consomem entre um litro e dois litros, 20%
consomem entre dois e três litros e o restante consome entre três e cinco litros. Para
a variável em estudo:
69
a) Escreva as informações acima na forma de uma tabela de frequências.
b) Construa o histograma.
70
Aluno(a): .
9a NOTA DE AULA
8 Análise Bidimensional
8.1 Introdução
Em algumas situações, em análise de dados, surge a necessidade de um estudo sobre o
comportamento conjunto de duas ou mais variáveis. Para isso, a distribuição conjunta de
frequência será de grande utilidade. Iremos estudar apenas no caso de duas variáveis ou
dois conjuntos de dados. Nestes casos poderemos ter três situações:
1. as duas variáveis são qualitativas;
2. as duas variáveis são quantitativas; e
3. uma variável á qualitativa e outra quantitativa.
As técnicas de análise de dados nas três situações são diferentes. Estudaremos apenas
os dois primeiros casos
8.2 Associação entre duas Variáveis Qualitativas

Vejamos como se comportam as variáveis: região de procedência (X) e grau de instrução
(Y ), cuja distribuição de frequência pode ser representada por uma tabela de dupla entrada.
Tabela 1: Distribuição de frequência conjunta das variáveis X e Y .
Y Basico Medio Superior Total marginal de X

X
Capital 4 5 2 11
Interior 3 7 2 12
Outra 5 6 2 13
Total marginal de Y 11 18 6 36
Observações:
71
1. Cada célula do corpo da tabela apresenta o número de ocorrência simultânea dos
valores (x, y) de X e Y , constituindo a distribuição conjunta;
2. A coluna dos totais (frequências marginais de X) constitui a distribuição marginal de

X;
3. A linha dos totais (frequências marginais de Y ) constitui a distribuição marginal de

Y;
4. Assim como no caso de uma única variável, as frequências absolutas podem ser
expressas em termos de frequências relativas e/ou porcentagens, sendo que, de acordo
com o objetivo de cada análise, estas medidas podem ser obtidas em relação
(a) ao total geral; Tabela 2-Distribuição de frequência conjunta das variáveis X e

Y.
X
Capital
Interior
Outra
Total marginal de Y 100%
(b) ao total de cada linha; Tabela 3-Frequências percentuais da distribuição con-
junta das variáveis
X e Y, em relação ao total de linha (frequência marginal de X)
X
Capital 100%
Interior 100%
Outra 100%
Total marginal de Y 100%
(c) ao total de cada coluna Tabela 4-Frequências percentuais da distribuição con-
junta das variáveis
X e Y, em relação ao total de coluna (frequência marginal de Y)
X
Capital
Interior
Outra
Total marginal de Y 100% 100% 100% 100%
A construção de tabelas de dupla entrada contendo as frequências relativas em termos

de porcentagem, tendo como referência o total geral, os totais de cada linha ou coluna
responde as seguintes perguntas:
1. Qual o percentual de pessoas que possuem o Ensino Médio e que são do interior?
72
2. Dentre os que possuem o Ensino Médio, qual é o percentual de pessoas provenientes
do interior?
3. Sabendo-se que uma pessoa veio do interior, qual é a probabilidade, em termos

percentuais de ter o Ensino Médio?
8.3 Independência entre Variáveis

Ocorre com bastante frequência em análises de distribuição conjunta o questionamento
sobre a existência de dependência ou não entre as variáveis, além da necessidade de se
saber o grau de dependência entre elas, caso exista.
Uma regra prática, consiste em:
(i) Verificar a distribuição das proporções marginais da variável X ou Y (linha ou
coluna de totais) e compará-la com as distribuições das proporções referentes a cada uma
das categorias da variável Y ou X, respectivamente;
(ii) Assim, se observarmos proporções em cada uma das categorias de Y ou X próxi-
mas as proporções marginais, temos como evidência a não dependência entre as variáveis;
Tabela 5-Distribuição conjunta das frequências e proporções, segundo sexo X
e curso escolhido Y.
Y Masculino Feminino Total marginal de X
X
Economia 85(61%) 35(58%) 120(60%)
Administracao 55(39%) 25(42%) 80(40%)
Total marginal de Y 140(100%) 60(100%) 200(100%)
caso contrário; a evidência é de que as variáveis sejam dependentes.
Tabela 6-Distribuição conjunta das frequências e proporções, segundo sexo X
e curso escolhido Y.
Y Masculino Feminino Total marginal de X
X
Fisica 100(71%) 20(33%) 120(60%)
Ciencias Sociais 40(29%) 40(67%) 80(40%)
Total marginal de Y 140(100%) 60(100%) 200(100%)
Uma vez identificado a relação de dependência entre as variáveis, como podemos
quantificar o grau de dependência?
8.4 Medidas de Associação entre duas Variáveis Qualitativas

De um modo geral, o grau de dependência entre as duas variáveis é quantificado pelos
coeficientes de associação ou correlação. Usualmente, esses coeficientes variam de zero até
um, sendo que, as vezes, variam de -1 a 1. Desta maneira, valores próximos de zero dão
indícios de independência entre as variáveis e, valores próximos de um (ou -1) indicam um
alto grau de dependência positiva (ou negativa).
73
Uma medida de dependência bastante utilizada para variáveis nominais é o coeficiente
de contingência, o qual é dado por:
s
χ2
C=
χ2 + n
onde n é o número de observações e χ2 é uma medida conhecida por qui-quadrado, a

qual é obtida a partir da seguinte soma
Xr X s
2 (oij − eij )2
χ =
i=1 j=1
eij
onde o somatário é estendido a todas as caselas de frequências conjuntas em uma

tabela de dupla entrada, e:
oij - é a frequência observada na i-ésima casela;
eij - é a frequência esperada na i-ésima casela, caso houvesse independência entre
as variáveis, ou seja, quando a proporção em cada categoria de uma variável (fixada o total
em linha ou coluna) é igual ou próxima a proporção marginal.
No entanto, o valor máximo de C depende de r e s. Para evitar esse inconveniente,
costuma-se definir um outro coeficiente, que varia entre 0 e 1, dado por
s
χ2 /n
T =
(r − 1)(s − 1)
que atinje o valor máximo igual a 1 se r = s.

Para exemplificar, vejamos qual seria o coeficiente de contingência para as variáveis
apresentadas na Tabela 3.
8.5 Medidas de Associação entre duas Variáveis Quantitativas

Neste caso, procedimento análogo ao realizado para a análise de variáveis nominais pode
ser aplicado. E, por se tratar de variáveis quantitativas, antes de construir uma tabela
de dupla entrada, os dados marginais podem ser agrupados em intervalos de classe, assim
como no caso de uma única variável.
Em análises de associação entre variáveis quantitativas, procedimentos analíticos mais
refinados são possíveis, como veremos a seguir.
8.5.1 Diagrama de Dispersão
O diagrama ou gráfico de dispersão nada mais é que a representação de pares dos valores
observados (x, y) num sistema cartesiano. Vejamos a ilustração de alguns gráficos que
podem surgir na prática:
74
40
35
30
Y
25
20
15
10
4 6 8 10 12
Figura 5: Diagrama de dispersão entre as variáveis X e Y .

−10
−20
Z
−30
−40
4 6 8 10 12
Figura 6: Diagrama de dispersão entre as variáveis X e Z.

15
10
W
5
0
4 6 8 10 12
Figura 7: Diagrama de dispersão entre as variáveis X e W .
8.5.2 Coeficiente de correlação
Ao ser observada uma associação entre as variáveis quantitativas, seria muito útil sabermos
sobre a intensidade desta associação e, como percebemos anteriormente (ver Gráficos de
75
800
600
V
400
200
0
4 6 8 10 12
Figura 8: Diagrama de dispersão entre as variáveis X e V .
5 a 8), existem vários tipos de associação. Aqui, veremos apenas uma medida referente
ao tipo de associação linear, ou seja, ao tipo de relação em que os pontos do gráfico de
dispersão aproximam-se de uma reta.
Definição - Dados n pares de valores (x1 , y1 ), (x2 , y2 ), ..., (xn , yn ), chama-se de coe-
ficiente de correlação entre as variáveis X e Y o valor obtido por
n
1 X xi − x y i − y
Corr(X, Y ) = ( )( ),
n i=1 dp(X) dp(Y )
ou seja, a média dos produtos dos valores reduzidos (ou padronizados) das variáveis.
Enquanto o coeficiente de contingência só assume valores entre 0 e 1, o coeficiente de
correlação pode assumir qualquer valor entre -1 e 1.
Uma fórmula alternativa e mais operacional para a correlação é dada por:
P
xi yi − nxy
Corr(X, Y ) = p P P .
( xi − nx2 )( yi2 − ny 2 )
2
O numerador da expressão assima dá origem a covariância, medida bastante usada.
Definição - Dados n pares de valores (x1 , y1 ), (x2 , y2 ), ..., (xn , yn ), chamaremos de

covariância entre as variáveis X e Y a
Pn
(xi − x)(yi − y)
cov(X, Y ) = i=1 ,
n
ou seja, a média dos produtos dos valores centrados das variáveis.
O coeficiente de correlação pode ser escrito como
cov(X, Y )
corr(X, Y ) =
dp(X)dp(Y )
76
1 - Numa amostra de cinco operários de uma dada empresa foram observadas duas va-
riáveis: X: anos de experiência num dado cargo e Y : tempo, em minutos, gasto na
execução de uma certa tarefa relacionada a esse cargo. As observações são apresen-
tadas na tabela abaixo:
X 1 2 3 4 5
Y 7 8 3 2 2
Construa o diagrama de dispersão e calcule uma medida de dependência entre as
variáveis.
2 - No estudo de uma certa comunidade verificou-se que:

I) A proporção de indivíduos solteiros é de 0, 4.
II) A proporção de indivíduos que recebem até 10 salários mínimos é de 0, 2.
III) A proporção de indivíduos que recebem até 20 salários mínimos é de 0, 7.
IV) A proporção de indivíduos casados entre os que recebem mais de 20 salários
míninos é de 0, 7.
V) A proporção de indivíduos que recebem até 10 salários mínimos entre os solteiros
é de 0, 3.
a) Construa a distribuição conjunta das variáveis estado civil e faixa salarial e as

respectivas distribuições marginais.
b) Você diria que existe relação entre as duas variáveis consideradas?
3 - A tabela a seguir lista os números de assassinatos e os tamanhos das populações (em

centenas de milhares) em grandes cidades americanas durante um ano recente (com
base em dados do New York Times). Calcule uma medida de dependência entre
as variáveis. O que você conclui?
Homicidios 258 264 402 253 111 648 288 654 256 60 590
Populacao 4 6 9 6 3 29 15 38 20 6 81
4 - O número de horas (X) que 13 estudantes passam estudando para um teste e suas
notas (Y ) são mostrados na tabela abaixo. Calcule uma medida de dependência entre
as variáveis. O que você conclui? Explique.
X 0 1 2 4 4 5 5 5 6 6 7 7 8
Y 40 41 51 48 64 69 73 75 68 93 84 90 95
77

Prob Introdução

Uploaded by

Document Information

Original Title

Copyright

Available Formats

Share this document

Share or Embed Document

Sharing Options

Did you find this document useful?

Is this content inappropriate?

Copyright:

Available Formats

Prob Introdução

Uploaded by

Copyright:

Available Formats

UNIVERSIDADE FEDERAL DE CAMPINA GRANDE - Campus I

UNIDADE ACADÊMICA DE MATEMÁTICA E ESTATÍSTICA

Definição 1.1 (Experimentos Aleatórios ou Fenômenos Aleatórios). São aqueles onde

1 - Considerando o espaço amostral S2 , exemplos de eventos seriam:

2 - Considerando o espaço amostral S3 , um exemplo de evento seria:

Como os eventos de um espaço amostral são conjuntos, todas as operações da teoria

a) A ∪ B ocorrerá se, e somente se, A ocorrer, ou B ocorrer, ou ambos ocorrerem;

Um recurso gráfico, conhecido como Diagrama de Venn, poderá ser vantajosamente

Definição 1.4 (Eventos Mutuamente Excludentes). Dois eventos, A e B, são denomi-

Exercício: Esboce um Diagrama de Venn, representando dois eventos mutuamente exclu-

1 - Lança-se um dado e observa-se o número da face superior. Considerando este expe-

Observação: Leis de D’Morgan

Definição 1.5 (Freqüência Relativa). Suponha que um experimento é repetido n vezes.

Teorema 1.1 (Lei dos Grandes Números). Ao repetir um experimento um grande

a) Para cada pesquisa, determine a probabilidade de que uma pessoa qualquer

Definição 1.7 (Definição Clássica de Probabilidade). Suponha que um experimento

(i) P (e1 ) = P (e2 ) = . . . = P (en ) = n1 , e

1 - Considere o experimento E: lançar um dado equilibrado. Considere também, os

Definição 1.8 (Definição Axiomática de Probabilidade). Seja E um experimento

(iv) Se A1 , A2 , ..., An forem, dois a dois, eventos mutuamente excludentes, então,

2) Do axioma iii, decorre imediatamente que, para qualquer n finito,

P1. Se φ denota o conjunto vazio (evento impossível), então

P2. Se A é o evento complementar de A, então

P3. Se A e B são dois eventos quaisquer, então

P4. Se A, B e C forem três eventos quaisquer, então

P5. Se A ⊂ B, então P (A) ≤ P (B).

1.3.1 Princípio Fundamental de Contagem (PFC) - Regra da Multiplicação

1.3.2 Regra da Adição

Suponha que um procedimento, designado por 1, possa ser realizado de n1 maneiras.

Exemplo: Suponha-se que estejamos planejando uma viagem e devamos escolher

Suponha que tenhamos n objetos diferentes. Permutar os n objetos equivale a colocá-

Considerem-se novamente n objetos distintos. Agora desejamos escolher r desses

1 - Se não são permitidas repetições,

a) quantos números de 3 dígitos podem ser formados dos seis dígitos 2, 3, 5, 6, 7

2 - De quantas maneiras diferentes podemos escolher, sucessivamente, 3 cartas de um

Obs.: Os problemas abordados nos itens a e b do exemplo 2, correspondem ao que

Considere, novamente, n objetos diferentes. Agora, trataremos da contagem do

Dessa forma, o número de combinações possíveis é dado por

Exemplo: Em um congresso científico existem 15 Matemáticos e 12 Estatísticos.

1.4 Eventos Independentes

Definição 1.9 (Eventos Independentes). Seja S um espaço amostral. Os eventos

Proposição 1: A é independente de si mesmo se, e somente se, P (A) = 0 ou 1.

Proposição 2: Se A e B são independentes, então A e B também são independentes

Exercício: Prove as proposições 1 e 2.

Definição 1.10 (Eventos Independentes Dois a Dois). Os eventos aleatórios Ai , i =

P (Ai ∩ Aj ) = P (Ai )P (Aj ), ∀i, j; i 6= j.

Definição 1.11 (Eventos Mutuamente Independentes). Os eventos aleatórios Ai , i =

P (A1 ∩ A2 ∩ ... ∩ An ) = P (A1 )P (A2 )...P (An ).

3 - Um inteiro é escolhido ao acaso, dentre os números 1, 2, ..., 50. Qual a probabilidade

4 - A urna 1 contém x bolas brancas e y bolas vermelhas. A urna 2 contém z bolas

5 - Suponha que A e B sejam eventos independentes associados a um experimento. Se

6 - Um estudante se submete a um exame de múltipla escolha no qual cada questão tem

7 - Mostre que, se os eventos A e B são independentes, então também o serão Ā e B.

12 - A probabilidade de que A resolva um problema é de 23 e a probabilidade de que

Qual a probabilidade de que uma pessoa segurada não use o hospital?

14 - Os colégios A, B e C têm as seguintes percentagens de rapazes, respectivsmente:

15 - Sabe-se que a ocorrência simultânea dos eventos A1 e A2 necessariamente força a

P (A) ≥ P (A1 ) + P (A2 ) − 1.

16 - Quantos números naturais de 4 algarismos podem ser formados usando-se apenas os

17 - Considere que as pessoas possam nascer de forma equiprovável em qualquer um dos

18 - Calcule a probabilidade de se obter exatamente 3 caras e 2 coroas em 5 lances de

20 - Uma caixa contém 40 fusíveis bons e 10 defeituosos. Supondo que se seleciona

21 - Ao escolher entre diversos fornecedores de computadores, um comprador deseja saber