Professional Documents
Culture Documents
Professor:
Gecirlei Francisco da Silva
gecirlei@yahoo.com
Setembro/2016
ii
iii
Sum
ario
1 Introdu
cao 1
1.1 O que e Estatstica? . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 3
1.2 Como se divide a Estatstica? . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 3
1.3 Estatstica e Computac
ao . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 4
2 Probabilidades 7
2.1 Resenha Hist
orica . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 7
2.2 Introduc
ao . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 8
2.3 Revisao das Tecnicas de Contagem . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 9
2.3.1 Principio Fundamental da Contagem . . . . . . . . . . . . . . . . . . . . . . . . 10
2.3.2
Diagrama da Arvore . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 11
2.3.3 Arranjo e/ou Permutac
ao . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 11
2.3.4 Combinac
ao . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 13
2.4 Definic
ao e Propriedades . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 14
2.5 Probabilidade Condicional e Independencia . . . . . . . . . . . . . . . . . . . . . . . . 18
2.5.1 Probabilidade Condicional e Teorema da multiplicacao . . . . . . . . . . . . . . 18
2.5.2 Independencia . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 22
2.6 Teorema de Bayes . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 24
3 Vari
aveis Aleat
orias 27
3.1 Variaveis Aleat
orias . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 27
3.2 Funcao de Distribuic
ao Acumulada . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 27
3.3 Variavel Aleat
oria Discreta . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 30
3.4 Relacao entre a Func
ao de Distribuicao Acumulada e a Distribuicao de Probabilidade
Discreta . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 32
3.5 Variavel Aleat
oria Contnua . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 33
3.6 Relacao entre a Func
ao de Distribuicao Acumulada e a Funcao Densidade de Probabi-
lidade Contnua . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 33
iv Sum
ario
6 Organiza
cao, Descri
cao e Explora
cao dos Dados 67
6.1 Definic
oes Importantes . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 67
6.2 Classificac
ao dos Dados . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 69
6.3 Variavel Qualitativa Nominal . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 70
6.3.1 Gr
aficos Circulares (Gr
aficos de Setores, ou Pizza, ou Torta) . . . . . . . . . . 71
6.3.2 Gr
afico de Barras (ou Diagrama de Barras) . . . . . . . . . . . . . . . . . . . . 73
Sumario v
6.3.3 Gr
afico de Barras Compostas ou Remontadas . . . . . . . . . . . . . . . . . . . 73
6.3.4 Gr
afico de Pareto . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 74
6.4 Variavel Qualitativa Ordinal . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 76
6.5 Variavel Quantitativa Discreta . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 78
6.6 Variavel Quantitativa Contnua . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 82
6.7 Exerccios sobre representac
ao grafica e tabular de dados qualitativos e quantitativos . 83
6.8 Medidas de Localizac
ao e Variacao . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 87
6.8.1 Medidas de Localizac
ao . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 87
6.8.2 Medidas de Variac
ao . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 90
6.9 Analise Gr
afica de Vari
aveis Quantitativas . . . . . . . . . . . . . . . . . . . . . . . . . 95
6.9.1 Histograma . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 95
6.9.2 Gr
afico de Pontos . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 97
6.9.3 Box Plot ou Esquema dos cnco n
umeros . . . . . . . . . . . . . . . . . . . . . 98
6.9.4 Gr
afico de Dispers
ao . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 99
6.10 Exerccios . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 100
vi Sum
ario
1
Captulo 1
Introdu
c
ao
8. etc..
2 1. Introduc
ao
M
etodo cientfico e a ferramentautilizada pelos cientistas para separarem as verdades das
mentiras e das ilus
oes. O metodo cientfico permite que os cientistas resolvam problemas com-
plicados fazendo uso de uma serie de etapas menores:
1. Observar algo do universo e com isso, identificar o problema, ou seja, identificar o que
precisa ser estudado;
5. Organizar e an
alisar os dados coletados usando cartas, graficos e tabelas.
6. Concluir fazendo um teste das predicoes atraves de experiencias e/ou por observac
oes
adicionais e modificar a hip
otese com base nos resultados.
7. Repitir as etapas 3 e 4 ate que nao haja nenhuma discrepancia entre a teoria e a experiencia
e/ou a observac
ao.
os equipamentos utilizados;
etc..
Exemplo 1.2. Um engenheiro de materiais, foi contratado por uma industria para estudar os tipos de
polmeros adequados para a confecc
ao de canos pl
asticos(PVC), procurando aumentar a durabilidade
com menor custo.
Ent
ao `
a partir desse momento, o objetivo e buscar as condico
es ideais para se ter um produto
com grande durabilidade e menor custo. Neste caso, temos um trabalho de investigac
ao, em que as
informac
oes s
ao obtidas nas pecas(corpos de prova) e no ambiente relacionado, e o investigador e o
engenheiro.
1.1 O que
e Estatstica?
Metodos estatsticos podem ser usados para resumir ou descrever uma colecao de dados: isto e chamado
de estatstica descritiva. Alem disso, padroes de comportamento observados nos dados podem ser
modelados de modo a quantificar a aleatoriedade e incerteza dos dados, para inferir sobre o processo
ou populacao que est
a sendo estudada: isto e chamado inferencia estatstica. De modo geral, podemos
dizer que a estatstica pode ser dividida em tres areas:
Infer
encia Estatstica: e o estudo de tecnicas que possibilitam a extrapolacao, a um grande
conjunto de dados (populac
ao), das informacoes e conclusoes obtidas a partir de subconjuntos
de valores, usualmente de dimens
ao muito menor (Amostra).
4 1. Introduc
ao
Em seu artigo Computers - The Second Revolution in Statistics, Yates (1966) revela que, para ele,
a primeira revoluc
ao na Estatstica veio com a introducao das maquinas de calcular. De fato, tanto
as contribuicoes de Karl Pearson como as de R. A. Fisher, no desenvolvimento teorico da Estatstica,
nao teriam ocorrido n
ao fosse o precioso auxlio prestado pelas maquinas de calcular. Nas decadas de
40 e de 50, as m
aquinas de calcular manuais e eletricas tornaram-se comuns. Entretanto, faltava qual-
quer capacidade de programac
ao, s
o trazida pelos computadores eletronicos que acarretaram grande
economia de tempo e de m
ao-de-obra.
Atualmente, um estatstico que n
ao usa o computador e como uma especie em extincao, cada vez
mais raro de ser encontrado. Contudo, a realizacao de qualquer operacao com um computador requer
a existencia de um programa apropriado, como por exemplo, o Statistical Analysis System (SAS), o
Statistical Package for Social Siences (SPSS), o Genstat, poderoso programa orientado primaria-
mente para a an
alise de dados de experimentos planejados e para tecnicas de analise multidimensional,
o R (Um software estatstico livre)e v
arios outros.
A chegada de computadores pessoais cada vez mais poderosos foi decisiva e fez com que a Es-
tatstica se tornasse mais acessvel aos pesquisadores dos diferentes campos de atuacao. Atualmente,
os equipamentos e softwares permitem a manipulacao de grande quantidade de dados, o que veio a
dinamizar o emprego dos metodos estatsticos. Hoje, a utilizacao da estatstica esta disseminada nas
universidades, nas empresas privadas e p
ublicas. Graficos e tabelas sao apresentados na exposic
ao de
1. Introducao 5
resultados das empresas. Dados numericos sao usados para aprimorar e aumentar a producao. Censos
demograficos auxiliam o governo a entender melhor sua populacao e a organizar seus gastos com sa
ude,
educacao, saneamento b
asico, infraestrutura etc. Com a velocidade da informacao, a estatstica passou
a ser uma ferramenta essencial na producao e disseminacao do conhecimento. O grau de import
ancia
atribudo `a estatstica e t
ao grande que praticamente todos os governos possuem organismos oficiais
destinados `a realizac
ao de estudos estatsticos.
Os cerebros eletr
onicos, como foram chamados inicialmente os computadores, tem feito verda-
deiras maravilhas, a ponto dos entusiastas da Inteligencia Artificial acreditarem que, com o tempo,
sera possvel duplicar qualquer atividade da mente humana, ja que esta e tambem uma maquina.
Entretanto, outros argumentam que o processo criativo da mente humana e de natureza diferente e
jamais sera reproduzido numa m
aquina. O uso intensivo dos computadores afastou o estatstico do
escrutnio inteligente dos dados, com conseq
uencias maleficas, se nao forem utilizados com sabedoria,
pois como diz Yates os computadores s
ao bons serventes, mas, maus mestres.
Como referencia citada, segue: YATES, F. Computers-the second revolution in statistics. Biome-
trics, Washington, DC, v. 22, p. 223-251, 1966.
6 1. Introduc
ao
7
Captulo 2
Probabilidades
As probabilidades nasceram na Idade Media com os tradicionais jogos de azar e apostas que se efetu-
avam na Corte.
Os algebristas Italianos Pacioli, Cardano e Tartaglia (sec.XVI) fizeram as primeiras observac
oes
matematicas relativas `
as apostas nos jogos de azar.
Porem, a verdadeira teoria relativa `
as probabilidades surgiu atraves da correspondencia entre Blaise
Pascal e seu amigo Pierre De Fermat, chegando estes `a mesma solucao do celebre problema da divis
ao
das apostas em 1654, embora tivessem seguido caminhos diferentes.
Este problema foi posto a Pascal pelo Cavaleiro De Mere. Este Cavaleiro era considerado por
alguns um jogador inveterado, por outros um filosofo e homem de letras.
Um fato curioso e que este problema era o mesmo que, sensivelmente, um seculo antes havia retido
a atencao de Pacioli, Tartaglia e Cardano.
Gerolano Cardano, medico e matem
atico Italiano, nascido em Pavia (1501-1576) escreveu o pri-
meiro livro relativo `
as probabilidades Liber de Ludo Alex (Livro dos jogos do azar), embora este
so tenha sido publicado em 1663.
Laplace publicou a obra da Teoria Analtica das Probabilidades, em 1812. Esta obra foi um
importante tributo para o desenvolvimento dos conhecimentos nesta area, uma vez que reuniu as
ideias descobertas ate ent
ao, donde se salienta a famosa Lei de Laplace.
Laplace comentou as teorias de Pascal do seguinte modo:
A teoria das probabilidades, no fundo, nao e mais do que o bom senso traduzido em calculo;
permite calcular com exatid not
ao aquilo que as pessoas sentem por uma especie de instinto... E avel
que tal ciencia, que comecou nos estudos sobre jogos de azar, tenha alcancado os mais altos nveis do
conhecimento humano.
A teoria das probabilidades evoluiu de tal forma que no seculo XX possui uma axiomatica pr
opria
8 2. Probabilidades
2.2 Introdu
c
ao
a) Lancar um dado e observar a face que cair para cima. O espaco amostral e S = {1, 2, 3, 4, 5, 6}.
c) Contar o n
umero de defeitos em uma peca pintada (por exemplo). Neste caso, os possveis resul-
ao S = {0, 1, 2, 3, }.
tados s
Relacionado a um experimento, como acima, uma serie de sentencas podem ser formuladas. Estas
sentencas sao denominadas Eventos.
De uma forma geral, qualquer subconjunto de um espaco amostral sera denominado Evento. Os
eventos sao denotados por letras mai
usculas (A, B, C, ...). Outro aspecto importante da teoria de
probabilidade est
a na manipulac
ao de eventos. Do ponto de vista pratico, os eventos sao as sentencas
(perguntas) que podemos formular sobre nosso experimento. Assim, desejamos definir formas de
manipular, ou seja, de operar estas sentencas. As tres operacoes basicas sao:
ao ( ) : A uni
Uni ao de dois conjuntos quaisquer E e F contera todos os elementos de E e de F
, incluindo os elementos que sejam comum aos dois ou nao.
Intersec
cao ( ) : A intersecc
ao de dois conjuntos quaisquer E e F contera os elementos comuns
a E e F.
Complementar (Ac ) : O evento complementar ao evento A e o conjunto dos elementos do espaco
amostral que n
ao pertencem a A.
a) A B = {1, 2, 3, 4, 5, 6}
b) A B = {} = conjunto vazio
c) A C = {4, 6} e A C = {2, 4, 5, 6}
d) C c = {1, 2, 3}
2.3 Revis
ao das T
ecnicas de Contagem
Nesta secao, faremos uma breve revisao das tecnicas de contagem: Principio Fundamental da
Contagem, Arranjo e Combinac
ao.
10 2. Probabilidades
Se um evento pode ocorrer de n1 maneiras distintas e, a seguir, um segundo evento pode ocorrer de
n2 maneiras distintas, e assim sucessivamente, ate um k-esimo evento que pode ocorrer de nk maneiras
distintas, entao o n
umero de maneiras distintas em que os k eventos podem ocorrer sucessivamente e
n1 .n2 .....nk .
Solu
cao
S = {(a, c); (a, d); (a, e); (b, c); (b, d); (b, e)} ,
#S = 2 3 = 6
2.3.2
Diagrama da Arvore
um esquema utsado para enumerar todas os resultados possveis de uma sequencia de experi-
E
mentos, onde cada um pode ocorrer em um n
umero finito de maneiras.
Exemplo 2.5. Considere que um lote de 100 sacas de sojas deve ser inspecionado, e que 3 sacas foram
observadas e classificadas em boas e runs. Quantifique os possveis resultados desse experimento.
A figura 2.5 ilustra a a
rvore de possibilidades.
(B, B, B) (R, R, R)
(B, B, R)
(R, R, B)
S=
(B, R, B) (R, B, R)
(B, R, R) (R, B, B)
n!
An,r =
(n r)!
OBS.: A notac
ao n! representa um n
umero, o qual chamamos de fatorial de n. O calulo de n! e
dado por:
n! = n (n 1) (n 2) , 3 2 1.
Exemplo 2.7. a) 3! = 3 * 2 * 1 = 6
b) 10! = 10 * 9 * 8 * 7 * 6 * 5 * 4 * 3 * 2 * 1 = 3628800
c) 0! = 1 (Definic
ao)
Solu
cao
A primeira letra pode ser escolhida de 6 maneiras diferentes; seguindo isto, a segunda letra pode ser
escolhida de 5 maneiras diferentes; e, ainda, a u
ltima letra pode ser escolhida de 4 maneiras diferentes.
Com isso, o n
umero de palavras e dado por: 6 * 5 * 4 = 120.
Utilizando a f
ormula, temos que n = 6 e r = 3, logo:
6!
A6,3 =
(6 3)!
654321
=
321
= 6 5 4 = 120
10!
a) 5!
8!
b) 5!2!
(n+1)!
c) (n1)!
2. Probabilidades 13
Exerccio 2.9. Em uma corrida com 12 participantes, de quantas maneiras distintas podemos ter as
tres primeiras colocac
oes?
Exerccio 2.10. Com oito pessoas que sabem dirigir, de quantas maneiras distintas conseguimos
colocar 5 delas em um fusca?
Exerccio 2.11. Um banco pede que cada cliente crie uma senha para se utilizar de seu sistema
informatizado. Como essa senha deve ter 5 algarismos distintos, quantos s
ao as possveis senhas? E
se pudesse haver repetic
ao?
a) Com reposic
ao;
b) Sem reposic
ao;
2.3.4 Combinac
ao
n!
Cn,r =
r!(n r)!
Exemplo 2.9. De quantas maneiras podemos selecionar um subconjunto com 3 elementos, do conjunto
formado pelas letras a, b, c e d?
Solu
cao
4!
A4,3 = = 24
(4 3)!
4!
C4,3 = =4
3!(4 3)!
14 2. Probabilidades
Combina
coes Arranjos
abc abc acb bac bca cab cba
h! abd abd adb bad bda dab dba
acd acd adc cad cda dac dca
bcd bcd bdc cbd cdb dbc dcb
Tabela 2.1:
Exerccio 2.13. Com 10 especies de frutas, quantos tipos de salada, contendo 6 especies diferentes
podem ser feitas?
Exerccio 2.16. De quantas maneiras pode um professor escolher um ou mais estudantes dentre seis
elegveis?
2.4 Defini
c
ao e Propriedades
A probabilidade e uma forma de atribuirmos pesos relativo a ocorrencia dos eventos. A pro-
babilidade, que denotaremos por P, e uma funcao que tem domnio na classe de eventos e tem como
imagem n
umeros (pesos) entre 0 e 1, veja figura 2.4. Com isso, sejam S um espaco amostral, a classe
de eventos e P uma func
ao de valor real definida em . Entao, P e chamada de funcao de probabilidade
e P (A), de probabilidade do evento A, se os seguintes axiomas valem:
2. P (S) = 1;
T S
3. Se A1 , , An , s
ao mutuamente exclusivos, isto e, Ai Aj = , i 6= j, entao P ( i=1 Ai ) =
P
i=1 P (Ai ).
1
P ({ei }) =
n
Neste caso, podemos definir a probabilidade de um evento E = {e1, , ek}, composto por k (com
k menor ou igual que n) elementos, como sendo:
2. Probabilidades 15
n
umero de casos favoraveis a E k
P (E) = =
n
umero de casos possveis de S n
Exemplo 2.10. Considere o lancamento de um dado honesto. Neste caso, os elementos do espaco
amostral S = {1, 2, 3, 4, 5, 6} s
ao equiprov
aveis, pois cada resultado tem a mesma chance de ocorrer,
isto e,
1
P ({1}) = P ({2}) = P ({3}) = P ({4}) = P ({5}) = P ({6}) =
6
1 1 1 3
P (A) = P ({2, 4, 6}) = P ({2}) + P ({4}) + P ({6}) = + + =
6 6 6 6
3 3 3
P (A) = , P (B) = , P (C) =
6 6 6
6 0
P (A B) = = 1 , P (A B) = = 0
6 6
4 2
P (A C) = , P (A C) =
6 6
16 2. Probabilidades
P (E F ) = P (E) + P (F ) P (E F )
3 3 2 4
P (A C) = P (A) + P (C) P (A C) = + =
6 6 6 6
3. Se A B, ent
ao P (A) P (B);
Solu
cao
Sejam
20000
P (A) = = 0, 00667
3000000
40000
P (B) = = 0, 01334
3000000
5000
P (A B) = = 0, 001667
3000000
Queremos saber
P (A B) = P (A) + P (B) P (A B)
= 0, 0183
Exerccio 2.18. O experimento consiste em lancar dois dados e observar a diferenca dos pontos das
faces superiores. Determine o espaco amostral do experimento.( Sugest
ao: Use o diagrama de
arvore).
Exerccio 2.19. O experimento consiste em lancar tres moedas e observar a difernca entre o n
umero
de caras e o n
umero de coroas obtidos no lancamento. ( Sugest
ao: Use o diagrama de
arvore).
Exerccio 2.20. O experimento consiste em retirar duas cartas de um baralho comum e anotar orde-
nadamente os naipes destas cartas. Determine o espaco amostral do experimento. ( Sugest
ao: Use o
diagrama de
arvore).
Exerccio 2.21. Uma urna contem duas pecas defeituosas e tres pecas boas. Uma a uma as pecas
ser
ao retiradas sem reposic
ao, e analisadas. O experimento ser
a encerrado quando as pecas defeituosas
forem identificadas. Determine o espaco amostral do experimento. ( Sugest
ao: Use o diagrama de
arvore).
Exerccio 2.22. Com base no experimento realizado no exerccio 2.18, calcule a probabilidade da
diferenca estar enre -3 e 3, inclusive.
Exerccio 2.23. Com base no experimento realizado no exerccio 2.19, calcule a probabilidade da
diferenca estar enre -3 e 3, exclusive.
Exerccio 2.24. Com base no experimento realizado no exerccio 2.20, calcule a probabilidade de
retirar um naipe de copas na segunda retirada ou dois naipes de espada.
18 2. Probabilidades
Exerccio 2.25. Com base no experimento realizado no exerccio 2.21, calcule a probabilidade das
pecas defeituosas serem identificadas na terceira retirada.
Exerccio 2.26. Se h
a tres pneus defeituosos em um lote de 20, e se escolhem quatro pneus do lote
para uma inspec
ao, qual e a probabilidade de que um dos pneus defeituosos seja includo?
a) Dois ases;
Exerccio 2.29. Seja A o evento um estudante fica em casa para estudar, e B o evento ele vai ao
cinema, com P (A) = 0, 64 e P (B) = 0, 21. Determine:
a) P (AC );
b) P (A B);
c) P (A B);
c) P (AC B C ).
P (E F )
P (E / F ) =
P (F )
A figura 2.1 ilustra os conjuntos envolvidos no calculo da Probabilidade Condicional. Observe que
ao considerar o c
alculo da condicional, mudamos o espaco amostral, antes era S, depois passa a ser F!
Exemplo 2.12. Na tabela 2.2 temos dados referentes a alunos matriculados nos cursos de computaca
o
e agronomia, da UFG.
Diante disso, se escolhermos ao acaso uma pessoa, calcule:
Figura 2.1:
Sexo total
Homens Mulheres
Curso Computacao 150 80 230
Agronomia 185 120 305
Total 335 200 535
Tabela 2.2: N
umero de Alunos Matriculados nos cursos de agronomia e computacao, da UFG
Solu
cao
Item a):
Temos que o n
umero de elementos do espaco amostral e 535 alunos. Seja A o evento aluno e do
curso de computac
ao, o qual possui 230 elementos (alunos). Com isso,
n
umero de elementos do conjunto A 230
P (A) = = = 0, 43
n
umeros de elementos do espaco amostral 535
Item b):
Neste caso, queremos calcular a probabilidade de escolher uma pessoa do sexo feminino sabendo
que ela e do curso de computac
ao. Sejam A o evento pessoa e do curso de computac
ao, e B o
20 2. Probabilidades
P (B A)
P (B / A) =
P (A)
temos que:
n
umero de elementos do conjunto A 230
P (A) = = = 0, 43
n
umeros de elementos do espaco amostral 535
P (B A) 0, 15
P (B / A) = = = 0, 35
P (A) 0, 43
Item c):
Temos que o n
umero de elementos do espaco amostral e 535 alunos. Seja A o evento aluno e do
sexo feminino, o qual possui 200 elementos (alunos). Com isso,
n
umero de elementos do conjunto A 200
P (A) = = = 0, 37
n
umeros de elementos do espaco amostral 535
A partir da f
ormula utilizada para calcular a probabilidade condicional, obtemos o teorema da
multiplica
cao, que e dado por
P (E F ) = P (F ) P (E / F )
Com isso, conclumos que a probabilidade de ocorrencia simultanea dos eventos E e F e igual a
probabilidade de ocorrencia do evento F (ou E) vezes a probabilidade de ocorrencia do evento E (ou
F) dado que ocorreu o evento F (ou E).
Solu
cao
2. Probabilidades 21
3 2 6
P (D1 D2 ) = P (D1 ) P (D2 / D1 ) = =
10 9 90
Figura 2.2:
Exerccio 2.32. Um j
uri consiste de nove pessoas naturais do local e tres naturais de outros estados.
Se dois dos jurados s
ao selecionados, aleatoriamente, para uma entrevista, qual e a probabilidade de
serem ambos naturais de outro estado?
Tabela 2.3:
Qual a probabilidade de escolher um comerciante do pneu firestonne, dado que o selecionado presta
bons servicos dentro da garantia?
Exerccio 2.37. Considere um processo composto por duas etapas. A etapa I apresenta 5% de pecas
defeituosas, enquanto que a etapa II apresenta 9% de pecas defeituosas. Qual a probabilidade do
processo fornecer uma peca sem defeito?
2.5.2 Independ
encia
Dois eventos s
ao independentes quando a ocorrencia de um evento nao influencia na ocorrencia
ou nao do outro evento. Do ponto de vista probabilstico, definimos:
Independ
encia: Dois eventos E e F sao ditos independentes se
P (E F ) = P (E) P (F )
Exemplo 2.14. Uma caixa contem 10 pecas, sendo 7 boas (B) e 3 defeituosas (D). Retiramos duas
pecas, ao acaso e com reposic
ao, para inspec
ao. Qual a probabilidade de se obter duas pecas defeitu-
osas?
Resposta:
O experimento de realizar a primeira retirada tem como espaco amostral S1 = {D1 ; B1 } e a
segunda retirada tem como espaco amostral S2 = {D2 ; B2 }, onde Di significa que retiramos uma
2. Probabilidades 23
peca Defeituosa na i-esima retirada e Bi significa que retiramos uma peca Boa na i-esima retirada,
para i = 1, 2. Alem disso, temos que
3 7
P (D1 ) = P (D2 ) = e P (B1 ) = P (B2 ) =
10 10
3 3 9
P [(D1 ; D2 )] = P (D1 D2 ) = P (D1 ) P (D2 ) = =
10 10 100
Exerccio 2.40. As probabilidades de chover ou nevar em determinada cidade no dia de Natal (C),
ao P (C) = 0, 60, P (N ) = 0, 60 e P (C N ) = 0, 42,
no dia de Ano Novo (N) ou em ambos os dias s
respectivamente. Verifique se os eventos C e N s
ao independentes.
Exerccio 2.41. Extraindo-se duas cartas de um baralho comum de 52 cartas, qual a probabilidade
de serem ambas de ouros, se a extrac
ao e feita:
a) Com reposic
ao;
b) Sem reposic
ao?
Exerccio 2.42. Uma loja de departamentos que fatura mensalmente as compras de seus clientes
constatou que, se um cliente paga pontualmente em determinado mes, h
a 0,90 de probabilidade de ser
pontual tambem no mes seguinte; entretanto, se um cliente n
ao paga pontualmente em determinado
24 2. Probabilidades
mes, a probabilidade de ele ser pontual no mes seguinte e de apenas 0,40. Considerando uma an
alise
em tres meses, calcule:
b) a probabilidade de um cliente n
ao pagar pontualmente nos dois primeiros meses e, em seguida,
pagar pontualmente?
B = S B = (A1 A2 An ) B
onde os Ai B s
ao tambem mutuamente exclusivos.
Figura 2.3:
Consequentemente,
Por outro lado, para qualquer i, a probabilidade condicional de Ai dado B e definida como
P (Ai B)
P (Ai /B) =
P (B)
P (Ai ) P (B/Ai )
P (Ai /B) =
P (A1 ) P (B/A1 ) + P (A2 ) P (B/A2 ) + + P (An ) P (B/An )
b) Dado que a peca selecionada e defeituosa, qual e a probabilidade dela ter sido produzida pela
m
aquina A?
Solu
cao
Item a)
= (0, 50) (0, 03) + (0, 30) (0, 04) + (0, 20) (0, 05) = 0, 037
Item b)
P (A) P (D/A)
P (A/D) =
P (A) P (D/A) + P (B) P (D/B) + P (C) P (D/C)
P (A) P (D/A)
=
P (D)
0, 50) (0, 03)
= = 0, 4054
0, 037
26 2. Probabilidades
Exerccio 2.44. Num certo colegio, 4% dos homens e 1% das mulheres tem mais do que 1,60 m de
altura. Alem disso, 60% dos estudantes s
ao mulheres. Ora, se um estudante e selecionado aleatoria-
mente e tem mais do que 1,60 m de altura, qual e a probabilidade de o estudante ser uma mulher?
Exerccio 2.46. S
ao dadas tres urnas com as seguintes composic
oes: a urna um tem tres bolas
brancas e cinco vermelhas, a urna dois tem quatro bolas brancas e duas vermelhas e a urna tres uma
bola branca e tres vermelhas. Escolhe-se uma das tres urnas de acordo com as seguintes probabilidades:
2 3 1
urna um com probabilidade 6, urna dois com probabilidade 6 e urna tres com probailidade 6. Uma
bola e retirada de uma urna e verificou-se ser de cor branca, qual a probabilidade dela ter vindo da
urna dois?
Captulo 3
Vari
aveis Aleat
orias
3.1 Vari
aveis Aleat
orias
Defini
cao 3.1.1. Vari
avel Aleat
oria
Consideremos um exeperimento e S o espaco amostral associado a esse experimento. Uma func
ao
X, que associa a cada elemento s S um n
umero real, X(s), e denominada vari
avel aleat
oria (v.a.).
Ou seja, vari
avel aleat
oria e um carecterstico numerico do resultado de um experimento.
3.2 Fun
cao de Distribui
c
ao Acumulada
A funcao de distribuic
ao acumulada nos da uma maneira de descrever como as probabilidades s
ao
associadas aos valores ou aos intervalos de valores de uma variavel aleatoria.
28 3. Variaveis Aleat
orias
Defini
cao 3.2.1. Fun
cao de Distribui
cao Acumulada
A func
ao de distribuic
ao acumulada de uma vari
avel aleat
oria X e uma func
ao que a cada n
umero
real x associa o valor:
F (x) = P [X x].
A notacao [X x] e usada para designar o conjunto { S : X() x}, isto e, denota a imagem
inversa do intervalo (, x] pela vari
avel aleatoria X.
O conhecimento da func
ao de distribuicao permite obter qualquer informacao sobre a vari
avel.
Mesmo que a vari
avel assuma valores apenas num subconjunto dos reais, a funcao de distribuic
ao
e definida em toda a reta. Ela e chamada de funcao de distribuicao acumulada pois acumula as
probabilidades dos valores inferiores ou iguais a x.
1 1 1 1
P (X = 0) = P ({KKK}) = = .
2 2 2 8
3
P (X = 1) = P ({KCC}) + P ({CKC}) + P ({CCK}) = .
8
3
P (X = 2) = P ({KKC}) + P ({KCK}) + P ({CKK}) = .
8
1
P (X = 3) = P ({KKK}) = .
8
A funcao de distribuic
ao acumulada de X e dada por
3. Variaveis Aleat
orias 29
0, se x < 6;
F (x) = (x 6)/2, se 6 x < 8;
1, se x 8.
Proposi
cao 3.2.1. Propriedades da Fun
cao de Distribui
cao Acumulada
A funcao de distribuic
ao acumulada de uma variavel aleatoria X satisfaz as seguintes condic
oes:
1. 0 F (x) 1
Exemplo 3.4. Para o lancamento de uma moeda, temos que S = {cara, coroa} e que P (cara) =
P (coroa) = 1/2. Definimos uma func
ao X, vari
avel aleat
oria, de S em R da seguinte forma:
1, se = cara;
X() =
0, se = coroa.
Encontrar a func
ao de distribuic
ao acumulada de X.
0, se x < 0;
F (x) = 1/2, se 0 x < 1;
1, se x 1.
30 3. Variaveis Aleat
orias
A classificac
ao das vari
aveis aleat
orias e feita de acordo com os valores que assumem. Veremos
agora dois tipos de vari
aveis aleat
orias: variavel aleatoria discreta e variavel aleatoria contnua.
3.3 Vari
avel Aleat
oria Discreta
Defini
cao 3.3.1. Vari
avel Aleat
oria Discreta
Seja X uma vari
avel aleat
oria (v.a.). Se o n
umero de valores possveis de X for finito ou infinito
enumer
avel, denominaremos X de vari
avel aleat
oria discreta. Isto e, os possveis valores de X podem
ser postos em lista como x1 , x2 , . . . , xn . No caso finito, a lista acaba, e no caso infinito numer
avel, a
lista continua indefinidamente.
Nosso interesse e saber quantas pecas defeituosas foram encontradas, nao interessando a ordem
que tenham ocorrido. Isto e, desejamos estudar a variavel aleatoria X, a qual atribui a cada resultado
s S o n uentemente, o conjunto dos possveis valores de X e {0,
umero de pecas defeituosas. Conseq
1, 2, 3}, ou seja, X e uma vari
avel aleat
oria discreta.
Defini
cao 3.3.2. Fun
cao de Probabilidade
Seja X uma vari
avel aleat
oria discreta. A cada possvel resultado xi associaremos um n
umero
p(xi ) = P [X = xi ], denominado probabilidade de xi . Os n
umeros p(xi ), i = 1, 2, . . ., devem satisfazer
`
as seguintes condic
oes:
P
b) i=1 p(xi ) = 1.
A func
ao p e denominada func
ao de probabilidade da vari
avel aleat
oria X.
Defini
cao 3.3.3. Distribui
cao de Probabilidade
A colec
ao de pares [xi , p(xi )], i = 1, 2, . . . e algumas vezes denominada distribuica
o de probabilidade
de X. Assim, podemos falar que a distribuic
ao de probabilidades de uma vari
avel aleat
oria discreta X,
definida em um espaco amostral (S), e uma tabela que associa a cada valor de X sua probabilidade.
3. Variaveis Aleat
orias 31
Exemplo 3.6. Considere que uma moeda e lancada duas vezes. Seja X a func
ao definida no espaco
amostral que e igual ao n
umero de caras nos dois lancamentos (C - Cara e C - Coroa).
1
P [X = 0] = P (CC) =
4
1
P [X = 1] = P (CC) + P (CC) =
2
1
P [X = 2] = P (CC) = .
4
O grafico da distribuic
ao de probabilidade e ilustrado na figura 3.1. A figura 3.2 ilustra a func
ao
distribuicao acumulada.
Figura 3.1: Gr
afico da distribuicao de probabilidade
32 3. Variaveis Aleat
orias
3.4 Rela
c
ao entre a Fun
cao de Distribuic
ao Acumulada e a Distri-
bui
c
ao de Probabilidade Discreta
x1 , x2 , . . . , xn
as respectivas probabilidades
P [X = x1 ], P [X = x2 ], . . . , P [X = xn ].
Como os valores de X s
ao mutuamente exclusivos, temos que a funcao de distribuicao acumulada
e dada por
X
F (x) = P [X = xi ], com Ax = {i : xi x}.
iAx
Exemplo 3.7. Considere dois lancamentos independentes de uma moeda equilibrada. Com o espaco
de probabilidade usual, defina X como sendo o n
umero de caras nos dois lancamentos. Determine a
func
ao de distribuic
ao acumulada de X.
X 0 1 2
p(xi ) 1/4 1/2 1/4
0, se x < 0;
1/4, se 0 x < 1;
F (x) =
3/4, se 1 x < 2;
1, se x 2.
3.5 Vari
avel Aleat
oria Contnua
Defini
cao 3.5.1. Vari
avel Aleat
oria Contnua
Seja X uma vari
avel aleat
oria. Suponha-se que o contradomnio (Rx ) de X seja um intervalo ou
uma coleca
o de intervalos. Ent
ao diremos que X e uma vari
avel aleat
oria contnua.
Exemplo 3.8. Um v
alvula eletr
onica e instalada em um circuito e X, o perodo de tempo em que
funcione, e obervado.
Defini
cao 3.5.2. Fun
cao Densidade de Probabilidade
Seja X uma vari
avel aleat
oria contnua. A func
ao densidade de probabilidade f , indicada abrevi-
amente por fdp, e uma func
ao que satisfaz `
as seguintes condic
oes:
Z d
P (c < X < d) = f (x)dx.
c
3.6 Rela
c
ao entre a Fun
cao de Distribuic
ao Acumulada e a Func
ao
Densidade de Probabilidade Contnua
Z x
F (x) = P [X x] = f (y)dy.
34 3. Variaveis Aleat
orias
Se a densidade f (x) for contnua no seu campo de definicao, entao decorre do teorema fundamental
do calculo que:
F 0 (x) = f (x).
Portanto, a func
ao de distribuic
ao acumulada e dada por
0, se x 0;
x
Z
F (x) = 2s ds = x2 , se 0 < x 1;
0
1, se x > 1.
3.7 Esperan
ca de Vari
aveis Aleat
orias
Defini
cao 3.7.1. Valor Esperado para Vari
aveis Discretas
X
E(X) = X = xi P [X = xi ]. (3.1)
i=1
Este n
umero e tambem denominado valor medio ou expect
ancia ou esperanca de X.
Observac
ao: 1) Se X tomar apenas um n
umero finito de valores, a expressao 3.1 se torna E(X) =
Pn
i=1 xi P [X = xi ]. Isto pode ser considerado como uma media ponderada dos possveis valores
x1 , . . . , xn . Se todos esses valores possveis forem igualmente provaveis, E(X) = (1/n) ni=1 xi que
P
2) E(X 2 ) = 2
P
i=1 xi P [X = xi ].
3
X
E(X) = xi P (X = xi ) = 1P (X = 1) + 2P (X = 2) + 3P (X = 3)
i=1
3 3 1 5
= +2 +3 = .
8 8 8 4
Ja vimos que os valores possveis de X sao {1, 2, 3, 4, 5, 6} e que esses valores sao equiprov
aveis.
Assim,
1 7
E(X) = (1 + 2 + 3 + 4 + 5 + 6) = .
6 2
Observac
ao: Este exemplo ilustra claramente que E(X) nao e o resultado que podemos esperar
quando X for observado uma u
nica vez. E(X) = 7/2 nem e mesmo um valor possvel de X! Esse
valor na verdade significa que se jog
assemos o dado um grande n
umero de vezes e depois calculassemos
a media aritmetica dos v
arios resultados, esperaramos que essa media ficasse mais proxima de 7/2
quanto maior n
umero de vezes o dado fosse jogado.
Defini
cao 3.7.2. Valor Esperado para Vari
aveis Contnuas
Seja X uma vari
avel aleat
oria contnua com func
ao densidade de probabilidade f . Definimos valor
esperado ou esperanca matem
atica ou media de X por
Z
E(X) = xf (x) dx, (3.2)
36 3. Variaveis Aleat
orias
Observac
ao: 1) Se a vari
avel e limitada, o calculo e feito sem ambiguidade e a existencia do valor
ao limitado, podem aparecer situacoes indefinidas do tipo ,
esperado esta assegurada. No caso n
em que diremos que a esperanca n
ao existe. Assim, temos que E(X) vai estar bem definida se a
integral, em pelo menos um desses intervalos, for finita; isto e
Z 0 Z
xf (x) dx < ou xf (x) dx < .
0
2) A interpretac
ao de E(X) para o caso contnuo e similar ao mencionado para variaveis discretas.
3) E(X 2 ) = x2 f (x) dx.
R
Exemplo 3.13. Seja X o tempo (em minutos) durante o qual um equipamento eletrico e utilizado
em carga m
axima, em um certo perodo de tempo especificado. Ent
ao, X e uma vari
avel aleat
oria
contnua e sua fdp e dada por
1
x, 0 x 1500;
(1500)2
1
f (x) = (x 3000), 1500 x 3000;
(1500)2
0, para quaisquer outros valores.
Calular a esperanca de X.
Z Z 1500 Z 3000
1 2
E(x) = xf (x) dx = x dx x(x 3000) dx = 1500 minutos.
(1500)(1500) 0 1500
Distribuicao de Probabilidade
Veremos agora algumas importantes propriedades do valor esperado de uma variavel aleatoria. Em
cada caso, admitimos que todos os valores esperados mencionados, existem.
E(CX) = CE(X).
E(XY ) = E(X)E(Y ).
3.8 Vari
ancia de Vari
aveis Aleat
orias
tambem que as l
ampadas s
ao formadas por dois tipos muito diferentes: cerca da metade sao de muita
boa qualidade e durar
ao aproximadamente 1400, enquanto que a outra metade sao de muito m
a
qualidade e durar
ao aproximadamente 600.
Assim, existe uma necessidade
obvia de se introduzir uma medida que possa distinguir entre essas
duas situacoes.
Defini
cao 3.8.1. Vari
ancia
Seja X a vari
avel aleat ancia de X, denotada por V ar(X) ou 2 por
oria. Definimos a vari
Observac
ao: O n
umero V ar(X) e expresso por unidades quadradas de X. Isto e, se X for medido
em horas, entao V ar(X) e expressa em (horas)2 .
Proposi
cao 3.8.1.
V ar(X) = E(X 2 ) (E(X))2 .
Calcular V ar(X).
3 3 1 24
E(X 2 ) = P (X = 1) + 22 P (X = 2) + 32 P (X = 3) = +4 +9 = = 3.
8 8 8 8
Assim, 2
5
V ar(X) = E(X 2 ) [E(X)]2 = 3 = 3 1, 56 = 1, 44.
4
Temos pelo Exemplo 3.14 que E(X) = 10, 65. Alem disso,
Portanto, a vari
ancia de X e dada por
Existem varias propriedades importantes para a variancia de uma variavel aleatoria, em parte analogas
`aquelas expostas para o valor esperado.
Observac
ao: Esta propriedade e intuitivamente evidente, porque somar uma constante a um
resultado X n
ao altera sua variabilidade, que e aquilo que a variancia mede.
Observac importante compreender que a variancia nao e, em geral, aditiva, como o valor
ao: E
esperado. Com a hip
otese complementar de independencia, a P3 fica valida.
3.9 Exerccios
Exerccio 3.1. De um lote que contem 25 pecas, das quais 5 sao defeituosas, 4 sao esolhidas ao
acaso. Seja X o n
umero de defeituosas encontradas. Estabeleca a distribuicao de probabilidade de X,
quando:
Exerccio 3.2. O di
ametro de um cabo eletrico supoe-se ser uma variavel aleatoria contnua X, como
fdp f (x) = 6x(1 x), 0 x 1.
(c) Determine um n
umero b tal que P (X < b) = 2P (X > b).
d 1 2 3 4 5
P (D = d) 0,1 0,1 0,3 0,3 0,2.
Captulo 4
Agora iremos apresentar alguns dos principais modelos probabilsticos utilizados para descrever v
arios
fenomenos ou situac
oes que encontramos na natureza ou ainda experimentos por nos construdos.
Na pratica, nossos experimentos consistem em medir etapas de um processo. Como resultados
destas medicoes obtemos valores numericos ou atributos, que caracterizam a performance do processo.
Os resultados das medic
oes, como j
a vimos, sao denominados variaveis aleatorias.
Uma variavel aleat
oria fica completamente caracterizada pela sua funcao de distribuicao acumu-
lada. No caso discreto, podemos tambem usar a funcao de probabilidade com o mesmo objetivo. Por
essa razao, nos modelos para vari
aveis discretas que iremos apresentar, estaremos sempre indicando,
na definicao sua func
ao de probabilidade.
4.1 Distribui
c
ao Binomial
Quando queremos classificar pecas de um lote com 20 pecas em defeituosas ou nao, podemos contar
o n
umero de pecas defeituosas e associar uma variavel aleatoria X que represente este n
umero.
Esta variavel pode assumir os seguintes valores: 0, 1, 2, , 20. Associamos estes valores a uma
variavel aleatoria X, que e discreta, pois assume um n
umero finito de valores. Definimos a func
ao
de probabilidade da vari
avel aleat
oria X, como a probabilidade da variavel X assumir o valor x. A
funcao de probabilidade ser
a denotada por P [X = x].
Como o leitor deve ter notado, no exemplo dado cada elemento da populacao e classificado como
defeituosaou n
ao-defeituosa. Generalizando, este modelo se aplica a situacoes em que os elementos
observados sao classificados como possuindo ou nao determinada caracterstica.
Primeiramente, para construir o modelo binomial vamos introduzir uma seq
uencia de ensaios de
Bernoulli.
Uma seq
uencia de Bernoulli e definida por meio das seguintes condicoes:
sera denominado sucesso (S) e cuja nao-ocorrencia sera denominada fracasso (F).
ii. Os ensaios s
ao independentes.
iii. A probabilidade de sucesso, que denotaremos por p, e a mesma para cada ensaio. A probabilidade
de fracasso ser
a denotada por 1 - p.
Para um experimento que consiste na realizacao de n ensaios de Bernoulli, o espaco amostral pode
ser considerado como o conjunto de n-uplas, em que cada posicao ha um sucesso (S) ou uma falha
(F).
Pelas condic
oes ii e iii vemos que a probabilidade de um ponto amostral com sucessos nos k
primeiros ensaios e falhas nos n k ensaios seguintes e pk (1 p)nk . De fato, temos que
= P [S; S; . . . ; S ; F ; . . . ; F ] = P (S S . . . S F . . . F ) =
| {z } | {z }
k nk
Defini
cao 4.1.1. Distribui
cao Binomial
Seja X o n
umero de sucessos obtidos na realizac
ao de n ensaios de Bernoulli independentes.
Diremos que X tem distribuic
ao binomial com par
ametros n e p, onde p e a probabilidade de sucesso em
cada ensaio, se sua func ao X Binomial(n, p).
ao de probabilidade for dada por 4.1. Usamos a notac
O n
umero de sucessos X em n ensaios de Bernoulli pode ser representado por meio de vari
aveis
aleatorias associadas a cada ensaio, que assumem valores 0 ou 1.
Seja Xi = 1 se ocorre sucesso no i-esimo ensaio e Xi = 0 se ocorre falha, para i = 1, 2, . . . , n.
4. Modelos Probabilsticos Discretos 43
X = X1 + X2 + + Xn .
Como motivac
ao, suponha que estamos interessados em retirar o n
umero 4 ao lancar um dado. Se
ocorrer o n
umero 4 diremos que ocorreu sucesso, caso contrario, diremos que ocorreu fracasso.
Assim, temos que
1 5
P (sucesso) = e P (fracasso) = .
6 6
2 3
1 1 5 5 5 1 5
4 4 0 0 0 com probabilidade = .
6 6 6 6 6 6 6
5 5!
= = 10
2 2!(5 2)!
Agora vamos generalizar esse resultado. Suponha um experimento com apenas dois resultados
possveis: sucessoe fracasso, tal que P (sucesso) = p e P (fracasso) = 1 p = q. Vamos repetir
uentemente, n k
esse experimento n vezes. Estamos interessados em obter k sucessos e, conseq
44 4. Modelos Probabilsticos Discretos
fracassos. O n
umero de sucessos a serem obtidos e uma variavel aleatoria X. Com isso,
n
P (X = k) = pk (1 p)nk
k
onde k = 0, 1, 2, , n e
n n!
= .
k k!(n k)!
e) No m
aximo duas pecas defeituosas?
10 10!
a) P (X = 1) = (0, 1)1 (1 0, 1)101 = 0, 1(0, 9)9 = 0, 3874
1 1!(10 1)!
10 10!
b) P (X = 0) = (0, 1)0 (1 0, 1)100 = (0, 9)10 = 0, 3486
0 0!(10 0)!
10 10!
c) P (X = 2) = (0, 1)2 (1 0, 1)102 = (0, 1)2 (0, 9)8 = 0, 1937
2 2!(10 2)!
d) P (X 2) = P (X = 2) + P (X = 3) + . . . + P (X = 9) + P (X = 10)
e) P (X 2) = P (X = 0) + P (X = 1) + P (X = 2) = 0, 9298.
4. Modelos Probabilsticos Discretos 45
Seja X um vari
avel aleat
oria com distribuicao Binomial (n,p). O valor esperado representa o n
umero
medio de sucessos. Por definic
ao, temos que
n n
X X n
E(X) = kP (X = k) = k pk (1 p)nk = np.
k=0 k=0 k
E(X) = np
E(X) = np = 10.0, 1 = 1
V ar(X) = np(1 p)
e o desvio padr
ao e
p
x = x2 = 0, 9487.
4.1.2 Exerccios
c) n
ao mais de cinco terem sido imunizadas.
Exerccio 4.2. Em deterninado trecho de rodovia, sabe-se que 30 % dos carros excedem o limite de
velocidade de 100 km/h. Quinze carros passaram por uma c
amera da polcia que estava escondida.
Calcule a probabilidade de 7 carros ou mais estarem acima do limite de velocidade?
46 4. Modelos Probabilsticos Discretos
a) 10 sejam defeituosos;
b) no m
aximo 5 sejam defeituosos.
Exerccio 4.6. Em uma famlia de 6 criancas, qual a probabilidade de que 5 delas sejam do sexo
feminino?
4.2 Distribui
c
ao de Poisson
e k
P (X = k) = (4.2)
k!
Defini
cao 4.2.1. Distribui
cao de Poisson
Uma vari
avel X segue o modelo de Poisson de par
ametro , > 0, se sua func
ao de probabilidade
ao X P oisson(). O par
for dada por 4.2. Usamos a notac ametro indica a taxa de ocorrencia por
unidade de medida.
4. Modelos Probabilsticos Discretos 47
X X e k
E(X) = kP (X = k) = k =
k!
k=0 k=0
E(X) =
V ar(X) =
Exemplo 4.2. Considere um processo que tem uma taxa de 0,2 defeitos por unidade. Qual a proba-
bilidade de uma unidade qualquer apresentar:
a. dois defeitos?
b. um defeito?
c. zero defeito?
Esse u
ltimo valor, P (X = 0), e chamado de rendimento do processo (ou produto).
4.2.2 Exerccios
Exerccio 4.10. Sabe-se que a media de consumo de determinada peca em um estoque e de 6 pecas
por mes. Calcule a probabilidade de em determinado mes serem consumidas 4 pecas. Calcule a
probabilidade de serem consumidas mais de 4 pecas, em determinado mes.
b) a probabilidade de que n
ao ocorram mais de 5 acidentes em determinada quinzena;
Exerccio 4.12. Em media 17 pessoas compram um computador por mes em determinada loja. Para
realizar seu planejamento, o gerente de vendas tem interesse de saber:
Exerccio 4.13. Ap
os a fabricac
ao e montagem de um carro, o mesmo e passado por testes de
qualidade. Em media s
ao encontrados, entre defeitos simples e complexos, 7 defeitos. O gerente do
setor de qualidade deseja saber:
4.3 Distribui
c
ao Geom
etrica
Defini
cao 4.3.1. Distribui
cao Geom
etrica
Seja X a vari
avel aleat
oria que d
a o n
umero de falhas ate o primeiro sucesso. A vari
avel X tem
distribuic
ao Geometrica com par
ametro p, 0 < p < 1, se sua func
ao de probabilidade e dada por:
P [X = j] = (1 p)j p , j = 0, 1, . . . . (4.3)
ao X Geo(p).
Usaremos a notac
O evento [X = j] ocorre se, e somente se, ocorrem somente falhas nos j primeiros ensaios e sucesso
no ensaio (j + 1). A express
ao 4.3 segue da independencia dos ensaios.
A distribuic
ao geometrica tem uma propriedade que serve para caracteriza-la no conjunto das
distribuicoes discretas, que e expressa pela seguinte proposicao:
Proposi
cao 4.3.1. Se X e vari
avel aleat
oria discreta com distribuicao geometrica, entao, para todo
j, k = 1, 2, . . . tem-se:
P [X j + k|X j] = P [X k].
d X X 1
xi = ix(i1) = . (4.5)
dx (1 x)2
i=1 i=1
X X X p(1 p)
E(X) = j(1 p)j p = p j(1 p)j = p(1 p) j(1 p)j1 = .
p2
j=0 j=0 j=0
Simplificando vem:
1p
E(X) =
p
1p
V ar(X) =
p2
Durac
ao em horas(centenas) Probabilidade Acumulada
0 0,8000 0,8000
1 0,1600 0,9600
2 0,0320 0,9920
3 0,0064 0,9984
4 0,0013 0,9997
5 0,0003 0,9999
a. Assim,
P [X 400 horas] = P [X = 0] + P [X = 1] + P [X = 2] + P [X = 3]
b. Ja neste caso,
P [X 500 horas] = 1 P [X = 5] = 1 (1 0, 8)5 (0, 8)
= 1 0, 999936 = 0, 000064.
4.3.2 Exerccios
Exerccio 4.18. Joga-se uma moeda para cima e observa-se o resultado. Calcule a probabilidade de
obter-se uma cara somente na quarta jogada.
Exerccio 4.19. A probabilidade de uma caixa de litro de leite conter uma partcula grande de con-
taminac
ao e de 0,01. Se for considerado que as caixas de leite sejam independentes, qual ser
a a
probabilidade de que exatamente 125 caixas necessitem ser analisadas antes que uma partcula grande
de contaminac
ao seja detectada.
Resp.: 0,0029
4.4 Distribui
c
ao Hipergeom
etrica
A distribuicao que iremos ver agora representa um modelo para amostragem sem reposicao de uma
populacao com um n
umero finito de elementos, em que cada um pode ser de um de dois tipos. Se a
populacao tem N elementos, ter ao M elementos de um tipo e N M de outro. Assim, podemos
a ent
52 4. Modelos Probabilsticos Discretos
Defini
cao 4.4.1. Distribui
cao Hipergeom
etrica
Diremos que uma vari
avel aleat
oria X tem distribuica
o Hipergeometrica de par
ametros M, N e n
se sua func ao 4.6. Denotamos, X Hgeo(M, N, n)
ao de probabilidade for dada pela express
Por exemplo, consideremos uma urna contendo M bolas brancas e N M bolas vermelhas. Retira-
se da urna n bolas sem reposic
ao, isto e, apos cada retirada a bola selecionada nao e reposta na urna.
Vamos designar X como sendo o n
umero de bolas brancas entre as n bolas retiradas da urna. Para
justificar os limites, notemos que o n
umero de bolas brancas na amostra k e menor ou igual ao n
umero
de bolas brancas (M ) e tambem menor ou igual ao n
umero de bolas na amostra n, portanto menor
ou igual ao menor deles. Se o tamanho da amostra n e menor ou igual ao n
umero de bolas vermelhas
N M , entao na amostra todas podem ser vermelhas e portanto k = 0. Se n (N M ), ent
ao
mesmo que todas as N M vermelhas pertencam `a amostra, havera n (N M ) brancas na amostra.
Por isso, max{0, n (N M )} k min{M, n}.
O espaco amostral para esse experimento e formado pelo conjunto das amostras nao ordenadas de
n bolas retiradas das N , ou o que e o mesmo, pelo conjunto das combinacoes de N elementos tomados
n a n, cuja representac
ao e igual a:
N
.
n
M N M
Existem combinac
oes de k bolas brancas retiradas das M existentes e
k nk
combinacoes de n k vermelhas retiradas das N M vermelhas. Assim o n
umero de combinac
oes
com k brancas e n k vermelhas e o produto:
M N M
k nk
10 5
3 4 120 5
P [X = 3] = = = 0, 20
3003
15
10
M
E(X) = n
N
P [aceitar o lote] = P [D 2] = P [D = 0] + P [D = 1] + P [D = 2]
7 25 7 7 25 7 7 25 7
0 80 1 81 2 82
= + + = 0, 0010069.
25 25 25
8 8 8
4.4.2 Exerccios
Exerccio 4.20. Uma batelada de pecas contem 100 pecas de tubo vindos de um fornecedor local e
200 pecas de um fornecedor de tubos de um estado vizinho. Se quatro pecas forem selecionadas, ao
acaso e sem reposic
ao, calcule:
54 4. Modelos Probabilsticos Discretos
a) a probabilidade de que elas sejam todas provenientes do fornecedor local; Resp.: 0,0119
b) a probabilidade de que duas ou mais pecas na amostra sejam proveniente do fornecedor local; Resp.:
0,408
c) a probabilidade de que no mnimo, um peca na amostra seja proveniente do fornecedor local. Resp.:
0,804
Exerccio 4.22. De um baralho com52 cartas, retiram-se 8 cartas ao acaso, sem reposic
ao. Qual a
probabilidade de que 4 sejam figuras.
Resp.: 0,0601
Captulo 5
Agora apresentaremos os modelos probabilsticos descritos por variaveis aleatorias que possuem uma
densidade de probabilidade, ou seja, vari
aveis aleatorias contnuas. Cada modelo corresponde a uma
famlia de distribuic
ao de probabilidade, expressa por uma densidade de probabilidade que depende
de um ou mais par
ametros.
5.1 Distribui
c
ao Uniforme
Defini
cao 5.1.1. Distribui
cao Uniforme
Uma vari
avel aleat
oria X tem distribuic
ao Uniforme no intervalo [a, b] se sua func
ao densidade de
probabilidade for dada por: 1
, a x b;
f (x) = ba
0, caso contr
ario ;
Vamos descrever um experimento cujo resultado nos da uma variavel com distribuicao Uniforme
no intervalo (0, 2). Consideremos um segmento de comprimento 2. Vamos unir as duas pontas
desse segmento e formar um crculo de raio unitario. O comprimento desse crculo e precisamente
2. Vamos fixar um ponteiro no centro desse crculo e vamos entao gira-lo, observando ate que ele
venha parar. Por raz
oes de simetria, vemos que a chance do ponteiro parar de girar em qualquer arco
do crculo e a mesma para qualquer arco de um comprimento dado. Seja X o comprimento do arco
determinado pela origem e pelo ponto onde o ponteiro parar. Assim, temos que X e uma vari
avel
aleatoria com distribuic
ao Uniforme no intervalo (0, 2).
ao Uniforme no intervalo [a, b] basta fazermos b a = 2r, construir
Se quisermos obter a distribuic
ba
um crculo de raio r = e proceder da maneira descrita.
2
Exemplo 5.1. A ocorrencia de panes em qualquer ponto de uma rede telef
onica de 7 km foi modelada
por uma distribuica
o Uniforme no intervalo [0, 7]. Qual e a probabilidade de que uma pane venha a
ocorrer nos primeiros 800 metros? E qual a probabilidade de que ocorra nos 3 km centrais da rede?
56 5. Modelos Probabilsticos Contnuos
Figura 5.1: Gr
afico da func
ao densidade de probabilidade da distribuicao Uniforme.
0,8
0, 8 0
Z
P [X 0, 8] = f (x)dx = = 0, 1142.
0 7
5
52
Z
5 2
P [2 x 5] = f (x)dx = P [X 5] P [X 2] = = = 0, 4285.
2 7 7 7
Z
1 a+b
E(X) = x dx = (5.1)
ba 2
a+b
E(X) =
2
b
a2 + ab + b2
Z
2 1
E(X ) = x2 dx = . (5.2)
ba a 3
(b a)2
V ar(X) = E(X 2 ) (E(X))2 = . (5.3)
12
(b a)2
V ar(X) =
12
5.1.2 Exerccios
Exerccio 5.1. V
arias linguagens de programaca
o de computadores tem func
oes que geram n
umeros
pseudo-aleat
orios cuja distribuic
ao e basicamente uniforme. Se uma func
ao desse tipo gera n
umeros
entre 0 e 2, qual a probabilidade de um n
umero gerado estar entre 1 e 1,5? Qual a media esperada e
o respectivo desvio padr
ao?
5.2 Distribui
c
ao Normal
Defini
cao 5.2.1. Distribui
cao Normal
Uma vari
avel aleat
oria contnua X tem distribuic
ao Normal se sua fuca
o densidade de probabili-
dade for dada por:
" 2 #
1 1 x
f (x) = exp , x (, +)
2 2 2
ao X N (, 2 ).
Usaremos a notac
Figura 5.2: Gr
afico de uma func
ao densidade de uma variavel com distribuicao Normal.
Para achar a
area sob a curva normal devemos conhecer dois valores numericos (tambem chamados
de parametros), a media e o desvio padrao . O grafico 5.3 mostra algumas areas importantes:
Figura 5.3: Areas sob a Curva Normal
Uma caracterstica importante de uma variavel aleatoria X com distribuicao Normal, com media e
desvio padrao quaisquer, e que podemos reduz-la a uma variavel aleatoria Z com distribuicao Normal
com media zero e vari
ancia 1. Ou seja, a partir de
X N (, 2 )
obtemos
X X
N (0, 1) Z = N (0, 1).
2
Exemplo 5.3. A
area sob a curva para Z maior do que 1,00 e 0,1587. Ou seja, a probabilidade de Z
ser maior do que 1 e 15,87%. Veja o gr
afico na Figura 5.5
Exemplo 5.4. A
area sob a curva para Z maior do que 1,19 e 0,1170, ou seja, a probabilidade de Z
ser maior do que 1,19 e 11,70%. Veja o gr
afico na Figura 5.6
60 5. Modelos Probabilsticos Contnuos
Figura 5.5: Area sob a curva normal
Figura 5.6: Area sob a curva normal
Exemplo 5.5. A a
rea sob a curva para Z menor do que 2,00 n
ao e fornecida diretamente pela tabela.
Ent
ao devemos encontrar a
area para Z maior do que 2,00. Em seguida fazemos 1 menos a
area
encontrada e temos a
area desejada.
Aa area desejada e 1 0, 0228 = 0, 9772.
rea sob a curva para Z maior do que 2,00 e 0,0228. A
Ou seja, a probabilidade de Z ser menor do que 2,00 e 97,72%. Veja o gr
afico na Figura 5.7
5. Modelos Probabilsticos Contnuos 61
Figura 5.7: Area sob a curva normal
Temos que encontrar dois pontos da distribuicao normal padronizada. O primeiro ponto e:
8, 70 11, 15
Z1 = = 1, 09
2, 238
Ou seja, a porcentagem de arruelas com espessura entre 8,70 e 14,70 (limites de tolerancia da es-
pecificacao) e somente de 80,50%. Portanto, cerca de 19,50% das arruelas nao atendem aos limites
de especificacoes. Anteriormente, havamos calculado esta porcentagem diretamente do histograma
e o valor encontrado foi de 22%. A diferenca entre os dois calculos fica por conta da suposic
ao de
normalidade que fizemos.
62 5. Modelos Probabilsticos Contnuos
Figura 5.8: Area sob a curva normal
Figura 5.9: Area sob a curva normal
Se X tem distribuic
ao Normal, a media e dada por
Z
= E(X) = f (x)dx e (, +).
Quando e s
ao desconhecidos, como geralmente acontece, sao substitudos por X e s, respecti-
5. Modelos Probabilsticos Contnuos 63
X1 + X2 + . . . + Xn
X= .
n
v
u n
u 1 X
s=t (Xi X)2 .
n1
i=1
5.2.2 Exerccios
Exerccio 5.4. O tempo gasto no exame vestibular de uma universidade tem distribuic
ao Normal,
com media 120 min e desvio padr
ao 15 min. Sorteando um aluno ao acaso, qual e a probabilidade que
ele termine o exame antes de 100 minutos? (Resp.: 0,0918) Qual deve ser o tempo de prova de modo
a permitir que 95% dos vestibulandos terminem no prazo estipulado? (Resp.: 144,6 min.) Qual e o
intervalo central de tempo, tal que 80% dos estudantes consigam completar o exame? (Resp.: 100,8
min. e 139,2 min.)
Exerccio 5.5. Temos que a media de altura entre os homens, em determinado grupo de pessoas, e
de 1,753 metros com desvio padr
ao de 0,07. calcule a probabilidade de selecionar de forma aleat
oria
um homem e este ter a altura entre 1,7 e 1,9 metros. Calcule ainda a probabilidade dele ter ao menos
1,85 metros de altura.
Exerccio 5.6. Uma empresa distribuidora de arroz, envaza sacos com peso medio de 5 kg de arroz,
com vari
ancia de 0,01. Calcule:
b) a probabilidade de selecionarmos um saco, e este conter mais de 4,9 Kg e menos de 5,15 kg;
Exerccio 5.10. O consumo de gasolina por km rodado, para certo tipo de carro, em determinadas
condic
oes de teste, tem uma distribuic
ao normal de media 100 ml e desvio padr
ao 5 ml. Calcular a
probabilidade de um carro gastar de 95 a 110 ml (Resp : 0, 8186). Calcule tambem, a probabilidade de
consumir mais de 93 ml (Resp : 0, 9192).
Captulo 6
Organiza
c
ao, Descri
cao e Explora
c
ao
dos Dados
Neste captulo, vamos supor que a pesquisa ja tenha passado pelos passos: Definicao dos objetivos,
Formulacao de Quest
oes ou Hip
oteses, Planejamento da Pesquisa e Coleta dos Dados. Os dados foram
coletados, por um estudo observacional(amostragem) ou por um estudo experimental, e se encontram
em alguma planilha. Na grande maioria das vezes se trata de uma massa de dados incompreensvel,
sem uma aparente estrutura, e precisam ser urgentemente entendidos. Para que os mesmos sejam
organizados, descritos formalmente de modo que se possa explora-los procurando indcios de padr
oes
ou caractersticas interessantes que possivelmente indiquem possveis tendencias, e mesmo relatar ou
expor caractersticas dos mesmos a outras pessoas, utilizamos as ferramentas da Estatstica descritiva
ou analise explorat
oria de Dados. Tais ferramentas consistem da leitura e resumo dos dados utilizando
tabelas, graficos, estatsticas e esquemas. As ferramentas descritivas devem fornecer resultados simples,
atrair a atencao, ser auto-explicativas, de facil compreensao e confiaveis. O maior interesse, depois de
obtidos os dados, e saber como os dados estao se comportando. Uma descricao dos mesmos com tais
propriedades, deve dar uma ideia global, sobre o conjunto de dados, de como os valores das vari
aveis
observadas estao se distribuindo entre os indivduos, e se houver, indicar tendencias.
6.1 Defini
coes Importantes
1. FENOMENO
ALEATORIO: e a situacao ou acontecimento cujos resultados nao podem ser
previstos com certeza. Por exemplo, as condicoes climaticas do proximo domingo nao podem
ser estabelecidas com total acerto;
a fase operacional. E
2. COLETA DE DADOS: E o registro sistematico de dados, com um
68 6. Organizacao, Descricao e Exploracao dos Dados
(c) Coleta Direta: quando e obtida diretamente da fonte. Ex: Empresa que realiza uma
pesquisa para saber a preferencia dos consumidores pela sua marca. Se divide em:
coleta peri
odica: recenseamento demografico, censo industrial;
3. APURAC
AO
DOS DADOS: Resumo dos dados atraves de sua contagem e agrupamento. E
a condensac
ao e tabulac
ao de dados;
5. ANALISE E INTERPRETAC DOS DADOS: A u
AO ltima fase do trabalho estatstico e
a mais importante e delicada. Est
a ligada essencialmente ao calculo de medidas e coeficientes,
cuja finalidade principal e descrever o fenomeno (estatstica descritiva);
6. DADO ESTAT
ISTICO: e um ou mais conjuntos de valores numericos ou nao, e e considerado
a materia-prima sobre a qual iremos aplicar os metodos estatsticos;
7. POPULAC
AO: e o conjunto total de elementos portadores de, pelo menos, uma caracterstica
comum;
9. PARAMETROS: S
ao valores singulares que existem na populacao e que servem para carac-
teriza-la. Para definirmos um par
ametro devemos examinar toda a populacao. Ex: Os alunos
do 3o perodo do curso de computacao da UFG - Campus Jata tem em media 1,73 metros de
um smbolo que representa uma caracaterstica da populacao. No caso do exemplo,
altura. E
o smbolo que que representa a media da populacao e . Os parametros sao representados por
letras gregas, tais como, , , , e etc.;
10. ESTIMADOR: S
ao valores singulares que existem na amostra e que servem para caracteriz
a-
uma combinac
la. E ao dos elementos da amostra, construda com a finalidade de representar,
ou estimar, um par um smbolo que representa uma cara-
ametro de interesse na populacao. E
caterstica da amostra. O smbolo que representa a media amostral da altura dos alunos do 3o
perodo de computac
ao e
=x
. Os parametros sao representados por letras gregas, acrescidas
de um chapeu, tais como,
, , ,
e etc.;
6.2 Classifica
c
ao dos Dados
Caracterstica como peso, idade, sexo, altura, entre outras, sao definidas variaveis. Assim, a
variavel altura assume os valores (em metros) 1,60; 1,58; ... e a variavel sexo assume valores masculino
e feminino. Claramente tais vari
aveis tem naturezas diferentes no que tange aos possveis valores que
podem assumir. Dessa forma, a figura 6.1 apresenta os varios tipos de variaveis.
Figura 6.1:
Definimos:
70 6. Organizacao, Descricao e Exploracao dos Dados
Vari
avel Qualitativa: e quando os possveis valores assumidos representam atributos e/ou
qualidades;
Vari
avel Quantitativa: e quando os possveis valores assumidos representam n
umeros;
6.3 Vari
avel Qualitativa Nominal
Uma variavel Qualitativa e dita Nominal quando nao e possvel estabelecer uma ordem natural
entre seus valores. Como exemplos, temos:
etc..
Considere o exemplo 6.1 e observe o procedimento utilizado para resumir os dados, o que de certa
forma, melhora a apresentac
ao dos mesmos, bem como facilita sua interpretacao.
Exemplo 6.1. Suponha uma pesquisa de mercado para estudar a aceitabilidade de um possvel produto
a ser lancado; registrando-se entre muitas vari
aveis, o Tipo de Ocupac
ao do entrevistado. Considerando-
se como possveis resultados dessa vari
avel: Empregado / Desempregado / Patr
ao / Aut
onomo /
Estudante / outros .
Considere que a amostra coletada foi de 18 indivduos, com os seguintes resultados: Des , Aut ,
Est , Emp , Emp , Des , Pat , Aut , Emp , Des , Est , Emp , Out , Aut , Emp , Est , Emp , Emp.
O que fazer diante desses dados?
Solu
cao
OCUPAC
AO
FREQUENCIA = ni
Autonomo 3
Desempregado 3
Empregado 7
Estudante 3
Patrao 1
Outros 1
TOTAL 18 = n
Tabela 6.1:
Tabela 6.2:
Os metodos gr
aficos mais usados quando tratamos com variaveis qualitativas Nominais sao,
Graficos de barras;
Graficos Pict
oricos;
Grafico de Pareto.
6.3.1 Gr
aficos Circulares (Gr
aficos de Setores, ou Pizza, ou Torta)
ni 360
i =
n
Exemplo 6.2. Suponha uma amostra de 13 gerentes de grandes empresas, em que se tenha perguntado
qual o tipo de formac
ao ideal para um profissional da
area de computac
ao. Assim, para os 13 gerentes
entrevistados, a tabela 6.3 resume a frequencia para os tipos de formac
oes.
Formacao ni angulo ( )
Graduado 7 1 = 193,84
Tecnico 4 1 = 110,77
Indiferente 2 1 = 55,39
Total 13 360
Tabela 6.3:
Os
angulos foram calculados da seguinte forma:
7 360
1 = = 193, 84
13
4 360
2 = = 110, 77
13
2 360
3 = = 55, 39
13
Figura 6.2:
6.3.2 Gr
afico de Barras (ou Diagrama de Barras)
Para a confecc
ao de um gr
afico de barras, constroi-se um eixo horizontal ou vertical, e em inter-
valos apropriados, nesse eixo, coloca-se retangulos cujas alturas representam, proporcionalmente, as
frequencias das caractersticas observadas da variavel em estudo.
Figura 6.3:
6.3.3 Gr
afico de Barras Compostas ou Remontadas
Tabela 6.4:
Faca um gr
afico de barras para representar a produc
ao de trigo e milho.
Figura 6.4:
a) A tabela de distribuic
ao de frequencia desses dados;
b) Sua representac
ao gr
afica.
6.3.4 Gr
afico de Pareto
um grafico de barras verticais que dispoe a informacao de forma a tornar evidente e visual
E
a priorizacao de temas. A informac
ao assim disposta tambem permite o estabelecimento de metas
numericas viaveis de serem alcancadas.
6. Organizacao, Descric
ao e Explorac
ao dos Dados 75
Problemas relativos `
a qualidade aparecem sob a forma de perdas (itens defeituosos e seus custos). E
extremamente importante esclarecer o modo de distribuicao destas perdas. O Grafico de Pareto surge
exatamente como ferramenta ideal para identificar quais itens sao responsaveis pela maior parcela das
perdas onde quase sempre s
ao poucas as vitaise muitas as triviais(Princpio de Pareto). Ent
ao, se
os recursos forem concentrados na identificacao das perdas vitais, e estas puderem ser identificadas,
torna-se possvel a eliminac
ao de quase todas as perdas, deixando as triviaispara solucao posterior.
O princpio de Pareto estabelece que se forem identificados, por exemplo, cinq
uenta problemas
relacionados `a qualidade, a soluc
ao de apenas cinco ou seis destes problemas ja podera representar
uma reducao de 80 ou 90 % das perdas que a empresa vem sofrendo devido `a ocorrencia de todos os
problemas existentes.
Construindo um Diagrama de Pareto
Utilizac
ao de dados existentes - Exemplo: Verificar os registros da qualidade do departa-
mento de compras ao longo do u
ltimo mes.
2. Selecione um padr
ao de comparac
ao com unidade de medida - Exemplo: Custo mensal, frequencia
de ocorrencia;
3. Especificar o perodo de tempo em que os dados serao coletados - Exemplo: Uma semana, um
mes;
5. Compare a frequencia ou custo de cada categoria com relacao a todas as outras categorias -
Exemplo: Defeito A ocorreu 75 vezes, defeito B ocorreu 107 vezes, defeito C ocorreu 42 vezes
ou defeito A custa 75 reais mensalmente, defeito B custa 580 reais mensalmente;
6. Liste as categorias da esquerda para direita no eixo horizontal em ordem decrescente de frequencia
ou custo. Os itens de menor import
ancia podem ser combinados na categoria outros, que e co-
locada no extremo direito do eixo, com a u
ltima barra;
7. Acima de cada categoria desenhe um retangulo cuja a altura representa a frequencia ou custo
daquela categoria;
8. A partir do topo da maior barra e da esquerda para a direita, ascendendo, uma linha pode ser
adiciona representando a frequencia acumulada das categorias.
76 6. Organizacao, Descricao e Exploracao dos Dados
Tabela 6.5:
Figura 6.5:
6.4 Vari
avel Qualitativa Ordinal
Uma variavel Qualitativa e dita Ordinal quando e possvel estabelecer uma ordem natural entre
seus valores. Como exemplos, temos:
6. Organizacao, Descric
ao e Explorac
ao dos Dados 77
etc..
Exemplo 6.6. Suponha uma pesquisa de mercado para estudar a aceitabilidade de um possvel produto
a ser lancado; registrando-se entre muitas vari
aveis, a escolaridade do entrevistado. Considerando-se
avel: Analfabeto / 1o grau / 2o grau / superior.
como possveis resultados dessa vari
Considere que a amostra coletada foi de 18 indivduos, com os seguintes resultados: 2grau , analf
, analf , 2grau , 1grau , 1grau , 1grau , 2grau , sup , 1grau , 1grau , 2grau , 2grau , 2grau , 1grau,
analf , 2grau , 2grau.
O que fazer diante desses dados?
Solu
cao
Escolaridade
FREQUENCIA = ni
Analfabeto 3
1o Grau 6
2o Grau 8
Superior 1
Tabela 6.7:
Tabela 6.8:
Os metodos gr
aficos mais usados quando tratamos com variaveis qualitativas Nominais sao,
Graficos Pict
oricos
Figura 6.6:
6.5 Vari
avel Quantitativa Discreta
Uma variavel Quantitativa e dita Discreta quando seus valores sao provenientes de contagens,
diante disso, assume valores numericos inteiros. Como exemplos, temos:
Variavel N
umero de Filhos: apresenta como valores 0, 1, 2 e etc.;
6. Organizacao, Descric
ao e Explorac
ao dos Dados 79
Figura 6.7:
Variavel N
umero de alunos presentes `as aulas de estatstica : apresenta como valores 0, 1, 2,
etc.;
Variavel N
umero de caminh
oes de cargas que passam por determinada rodovia: apresenta como
valores 0, 1, 2, etc.;
etc..
um
Um dos caminhos mais utilizados para resumir os dados brutos e a tabela de frequencias. E
tipo de tabela que condensa uma colec
ao de dados conforme as freq
uencias ou repeticoes dos valores
das variaveis.
Diante da necessidade de se utilizar uma tabela de frequencia, vamos apresentar algumas in-
formacoes u
teis para sua confecc
ao.
1. Distribui
cao de freq
u a simples condensac
encia SEM INTERVALOS DE CLASSE: E ao
dos dados conforme as repetic
oes de seu valores. Para um tamanho razoavel de categorias esta
distribuic
ao de freq
uencia e inconveniente, ja que exige muito espaco. Veja exemplo abaixo:
Dados Freq
uencia
41 3
42 2
43 1
44 1
45 1
46 2
50 2
51 1
52 1
54 1
57 1
58 2
60 2
Total 20
2. Distribui
cao de freq
uencia COM INTERVALOS DE CLASSE: Quando o tamanho da
amostra e elevado, e mais racional efetuar o agrupamento dos valores em varios intervalos de
classe.
80 6. Organizacao, Descricao e Exploracao dos Dados
Classes Freq
uencias
41 ` 45 7
45 ` 49 3
49 ` 53 4
53 ` 57 1
57 ` 61 5
Total 20
3. CLASSE: s
ao os intervalos de variacao da variavel e e simbolizada por i e o n
umero total de
classes simbolizada por k. Ex: na tabela anterior k = 5 e 49 ` 53 e a 3a classe, onde i = 3;
4. LIMITES DE CLASSE: s
ao os extremos de cada classe. O menor n
umero e o limite inferior
umero, limite superior de classe ( Li ). Ex: em 49 ` 53, temos que
de classe ( li ) e o maior n
l3 = 49 e L3 = 53. O smbolo ` representa um intervalo fechado `a esquerda e aberto `a direita.
Com isso, dizemos que o valor 53 nao pertence a classe 3 e sim a classe 4 representada por
53 ` 57;
8. PONTO MEDIO DE CLASSE: e o ponto que divide o intervalo de classe em duas partes
iguais. Ex: em 49 ` 53 o ponto medio x3 = (53 + 49)/2 = 51, ou seja x3 = (l3 + L3 )/2.
M
etodo pr
atico para constru
cao de uma Distribui
cao de Freq
uencias
3o ) Calcule o n
umero de classes atraves da Regra de Sturges:
6. Organizacao, Descric
ao e Explorac
ao dos Dados 81
4o ) Decidido o n
umero de classes, calcule entao a amplitude do intervalo de classe h > AA/k. No
nosso exemplo: AA/k = 19/5 = 3, 8 . Obs: Como h > AA/k e um valor ligeiramente superior
para haver folga na u
ltima classe, entao vamos Utilizar h = 4;
5o ) Nosso primeiro intervalo de classe possui como limite inferior (li ) o menor elemento da amostra, e
o limite superior (Li ) e calculado da seguinte forma: Li = li + h. Portanto, para nosso exemplo,
a representada por li = 41 e Li = 41 + 4 = 45, ou seja, 41 ` 45. As classes
a primeira classe ser
seguintes respeitar
ao o mesmo procedimento. O primeiro elemento das classes seguintes sempre
serao formadas pelo u
ltimo elemento da classe anterior.
Exerccio 6.3. A tabela 6.9 apresenta os dados referentes ao capital de giro mensal (em mil reais)
de 81 empresas do mesmo setor. Diante disso,
8 10 15 23 33 34 35 37 42 45 45 47 48 48 50 50 50 51
53 54 54 55 57 58 58 60 60 60 60 60 61 61 61 62 62 63
63 64 64 64 65 65 66 66 66 66 66 66 67 67 67 68 69 70
70 70 71 71 71 71 73 73 74 74 75 75 75 75 76 76 77 77
79 81 81 83 85 85 86 88 92
Tabela 6.10:
6.6 Vari
avel Quantitativa Contnua
Caractersticas mensur
aveis que assumem valores em uma escala contnua (na reta real), para as
quais valores fracionais fazem sentido. Usualmente devem ser medidas atraves de algum instrumento.
Exemplos: peso (balanca), altura (regua), tempo (relogio), pressao arterial, idade. Como valores
temos,
Variavel Idade: apresenta como valores 5,65; 12,9; 32,5 anos e etc.;
etc..
Tabela 6.11:
Solu
cao
6. Organizacao, Descric
ao e Explorac
ao dos Dados 83
Classe fi f ri % % acumulada
4,00 ` 7,5 8 0,2222 22,22 22,22
7,50 ` 11 12 0,3333 33,33 55,56
11,0 ` 14,5 7 0,1944 19,44 75,00
14,5 ` 18 6 0,1667 16,67 91,67
18,0 ` 21,5 2 0,0556 5,56 97,22
21,5 ` 25 1 0,0278 2,78 100,00
Total 36 1,0000 100,00
Tabela 6.12:
Nesta secao, apresentamos alguns exerccios sobre a representacao grafica e tabular de dados qualita-
tivos e quantitativos.
marcas de computadores;
capacidade do HD;
Exerccio 6.6. Uma pesquisa foi realizada com 64 consumidores de produtos de inform
atica. O obje-
tivo e verificar qual a opc
ao de marca de monitores dentre cinco marcas dadas como opc
ao. A tabela
abaixo apresenta os resultados da pesquisa. Faca uma representac
ao tabular e gr
afica do resultados e
apresente uma interpretac
ao.
Exerccio 6.8. Uma pesquisa foi realizada com empresas de faturamento de ate R$ 500.000,00. Um
dos objetivo e verificar o n
umero de computadores existentes nessas empresas. A tabela abaixo apre-
6. Organizacao, Descric
ao e Explorac
ao dos Dados 85
senta o resultados da pesquisa. Qual a porcentagem de empresas que tem ate 4 computadores? Faca
uma representac
ao gr
afica dos resultados. Faca uma interpretac
ao geral.
2 1 2 2 1 1 1 1 2 4 7
2 2 1 2 1 2 3 1 2 6 6
1 5 1 2 1 1 4 1 2 7 5
2 3 4 3 1 1 3 1 3 1 4
1 2 3 3 2 3 2 2 2 2 3
1 4 2 5 3 4 2 2 2 2 2
Exerccio 6.10. Uma pesquisa foi realizada junto a 30 empresas que realizam a distribuic
ao de pro-
dutos na cidade de Jata. A classificac
ao e feita da seguinte forma: MB representa Muito Bom,
Brepresenta Bom, MMrepresenta mais ou menos e Rrepresenta Ruim. Essa classificac
ao e
dada considerando produtos entregues dentro do prazo. Os dados est
ao apresentados na tabela 6.13.
MB R B MM MM R
B MM B MM MM R
MB MM B R R MB
MM R MM R MM B
R R MB MB MM B
Tabela 6.13:
De a classificac
ao desta vari
avel, organize os dados em uma tabela de distribuic
ao de freq
uencia,
faca um gr
afico e apresente uma interpretac
ao.
Exerccio 6.11. Uma pesquisa foi realizada junto aos alunos do curso de computac
ao da UFG campus
jatai. Dos 100 alunos matriculados, foi retirada uma amostra de 30 e feita a seguinte pergunta:
Voce vai atuar como profissional da
area de computac
ao quando concluir o curso?. Os dados est
ao
apresentados na tabela 6.14.
86 6. Organizacao, Descricao e Exploracao dos Dados
Tabela 6.14:
De a classificac
ao desta vari
avel, organize os dados em uma tabela de distribuic
ao de freq
uencia,
faca um gr
afico e apresente uma interpretac
ao. Sua opni
ao est
a entre a maioria?
Exerccio 6.12. A empresa submarino montou uma central de relacionamento com o cliente de modo
a verificar o nvel de servico prestado. A intenc
ao e verificar dentre outras coisas, o prazo de entrega,
suporte p
os-venda, tempo de entrega e qualidade do produto. Diante disso, acompanhou 50 entregas e
para a caracterstica qualidade dos produtos entreguestemos os dados apresentados na tabela 6.15.
Sem defeito Com defeito Com defeito Sem defeito Sem defeito Sem defeito Sem defeito Com defeito
Sem defeito Com defeito Sem defeito Sem defeito Sem defeito Com defeito Sem defeito
Sem defeito Com defeito Sem defeito Com defeito Sem defeito Sem defeito Sem defeito
Sem defeito Com defeito Sem defeito Sem defeito Sem defeito Com defeito Com defeito
Sem defeito Com defeito Sem defeito Sem defeito Sem defeito Sem defeito Sem defeito
Sem defeito Sem defeito Sem defeito Sem defeito Sem defeito Sem defeito Com defeito
Sem defeito Sem defeito Sem defeito Sem defeito Com defeito Com defeito Sem defeito
Tabela 6.15:
De a classificac
ao desta vari
avel, organize os dados em uma tabela de distribuic
ao de freq
uencia,
faca um gr
afico e apresente uma interpretac
ao.
Exerccio 6.13. Uma pesquisa foi realizada por uma operadora logstica, em 56 empresas de grande
porte, afim de verificar em qual setor da empresa o custo era mais elevado. Dentre as opc
oes no
question
ario temos: Trepresenta a
area de transporte, Irepresenta o nvent
ario, Arepreseta
Armazenagem e T&Arepresenta a
area de processamento e administraca
o. Os dados est
ao apresen-
tados na tabela 6.16.
T I P&A I P&A A A A
I T A T T I T I
A A A A I A T A
P&A I T P&A A T T T
I T I P&A T A T A
I A P&A A A A A A
I P&A T A P&A I A I
Tabela 6.16:
De a classificac
ao desta vari
avel, organize os dados em uma tabela de distribuic
ao de freq
uencia,
faca um gr
afico e apresente uma interpretac
ao.
Exerccio 6.14. Uma empresa produz 24 horas por dia, 7 dias na semana, utilizando 10 m
aquinas.
No entanto, existem problemas que fazem com que as m
aquinas parem de produzir. Ao longo de uma
6. Organizacao, Descric
ao e Explorac
ao dos Dados 87
semana de trabalho foram observadas 48 paradas e 7 defeitos foram identificados. Os defeitos foram
codificados e enumerados de 1 ate 7, e dessa forma transcritos na tabela 6.17.
1 5 3 3 6 5 2 1
1 4 4 5 2 5 3 4
3 3 3 6 2 4 4 2
2 5 7 5 3 4 4 5
3 5 6 5 3 3 6 4
4 3 7 6 3 4 5 3
De a classificac
ao desta vari
avel, organize os dados em uma tabela de distribuic
ao de freq
uencia,
faca um gr
afico de pareto e apresente uma interpretac
ao.
M
edia Aritm
etica
A media aritmetica, ou simplesmente Media, e obtida dividindo-se a soma das observacoes pelo
n um quociente geralmente representado pela letra ou pelo smbolo X.
umero delas. E Se tivermos
(X1 + X2 + X3 + X4 + ... + XN )
= Media da Populacao
N
= (X1 + X2 + X3 + X4 + ... + Xn )
X Media da Amostra
n
Exemplo 6.8. Um aluno tirou as notas 5, 7, 9 e 10 em quatro provas. A sua media ser
a (5 + 7 +
9 + 10) / 4 = 7.75.
M
edia Ponderada
Exemplo 6.9. Um aluno fez um teste (peso 2) e uma prova (peso 3), tirando 10 no teste e 4 na
prova. A sua media (ponderada) ser
a (10*2 + 4 *3) / (2+3) = 6,4.
88 6. Organizacao, Descricao e Exploracao dos Dados
OBS.: Se o teste e a prova tivessem mesmo peso (e nao importa qual o valor do peso, importa
apenas a relacao entre os pesos), a media seria 7.
Mediana - M d
Moda - M o
Exemplo 6.16. A serie 11,5; 33,1; 21,5; 55,1; 21,5; 21,5 e 9 apresenta como moda o valor 21,5.
Quantis ou Quartis
Muitas medidas que resumem as propriedades do conjunto de dados usam os chamados QUAN-
TIS AMOSTRAIS, (quantilesem ingles, ou tambem chamados de fractiles). Estes termos s
ao
essencialmente equivalentes ao termo tambem comum PERCENTIL. Um quantil amostral qp e um
n
umero tendo a mesma unidade que o dado, o qual excede a proporcao do dado dada pelo subscrito
p, com 0 p 1. O quantil amostral qp pode ser interpretado aproximadamente como aquele valor
do dado que excede um membro escolhido aleatoriamente do conjunto de dado, com probabilidade p.
6. Organizacao, Descric
ao e Explorac
ao dos Dados 89
Analogamente, o quantil amostral qp poderia ser interpretado como o (p100) e-simo percentil do con-
junto de dados. A determinac
ao dos quantis requer primeiro que os dados sejam ordenados. A notac
ao
utilizada comumente para designar os dados ordenados e a seguinte (x(1) , x(2) , x(3) , x(4) , ..., x(n) ), onde
x(1) e o valor mais baixo e x(n) o mais alto.
ao utilizados mais comumente como a mediana (ou q0,5 ) ou o 50o percentil. Este
Alguns quantis s
e o valor do centro do conjunto de dados, no sentido que uma igual proporcao de dados cai acima e
ao comum quanto as medianas ( 2o quartil) sao os quartis q0,25 e q0,75 .
abaixo deste valor. Outro uso t
Usualmente, sao chamados de primeiro quartil e terceiro quartil. Estao localizados a meio caminho
entre a mediana e os extremos x(1) e x(n)
Resumindo, dizemos que o primeiro quartil e o elemento da posicao (n + 1)/4 do conjunto de dados
ordenados e o terceiro quartil e o elemento da posicao 3(n + 1)/4, veja os exemplos.
Solu
cao
Os dados ordenados s
ao: 1, 2, 3, 5, 7, 8 e 9. A posic
ao do primeiro quartil e (7+1)/4 = 2. Logo, o
elemento que ocupa essa posica
o e 2, o primeiro Quartil. A posic
ao do terceiro quartil e 3(7+1)/4 = 6.
Logo, o elemento que ocupa essa posic
ao e 8, o terceiro quartil. A mediana, neste caso e 5.
Visualiza
cao das medidas
A figura 6.8 apresenta visualmente as medidas de localizacao para um certo conjunto de dados.
Neste caso, as medidas Media, Moda e Mediana sao coincidentes, e o caso particular de um conjunto
de dados com distribuic
ao Normal (Gauss).
Figura 6.8:
90 6. Organizacao, Descricao e Exploracao dos Dados
Distancia Interquartlica;
Desvio Medio;
Variancia;
Desvio Padr
ao;
Coeficiente de Variac
ao.
a diferenca entre o maior e o menor valor dos dados, mostrando o quanto os extremos est
E ao
representado pelo c
espalhados. E alculo
At = Vmax Vmin
onde Vmax representa o maior valor dos dados e Vmin representa o menor valor dos dados. Esta
medida leva em conta apenas dois valores e e muito sensvel `a valores extremos.
6. Organizacao, Descric
ao e Explorac
ao dos Dados 91
Exemplo 6.19. considere o conjunto de dados A = {12, 15, 16, 17, 20, 21}. A amplitude dos dados e
dada por:
At = Vmax Vmin = 21 12 = 9
Dist
ancia Interquartlica
a diferenca entre o terceiro e o primeiro quartil. Mostra a amplitude levando em conta 50% dos
E
dados centrais, e n
ao s
o os extremos. A figura 6.9 ilustra essa diferenca.
Figura 6.9:
Exemplo 6.20. J
a vimos que, o primeiro e terceiro quartil da serie 1, 3, 2, 5, 8, 7, 9 s
ao dados por:
Q1 = 2 e Q3 = 8. Com isso, a dist
ancia interquartlica e dada por
Q3 Q1 = 8 2 = 6
Desvio M
edio
O desvio de um valor observado e a sua distanciada medida central, ou seja, a diferenca entre
seu valor e a media.
di = xi x
A soma de todos os desvios e sempre zero. O desvio absoluto e o modulo do desvio (valor do
desvio sem o sinal). O desvio medio e o somatorio dos desvios absolutos divididos pelo n
umero de
observacoes, ou seja: Pn Pn
i=1 |di | i=1 |xi x
|
dm = =
n n
92 6. Organizacao, Descricao e Exploracao dos Dados
Medic
oes (xi ) di = (xi media) |di |
11 -3,7 3,7
12 -2,7 2,7
13 -1,7 1,7
15 0,3 0,3
16 1,3 1,3
14 -0,7 0,7
13 -1,7 1,7
16 1,3 1,3
17 2,3 2,3
18 3,3 3,3
15 0,3 0,3
16 1,3 1,3
Tabela 6.18:
Figura 6.10:
6. Organizacao, Descric
ao e Explorac
ao dos Dados 93
Vari
ancia
N
2
X )2
(xi x
= Populacao (viciada)
N
i=1
N
X )2
(xi x
2 = Populacao (Nao viciada)
N 1
i=1
n
X )2
(xi x
s2 = Amostra (viciada)
n
i=1
n
2
X )2
(xi x
s = Amostra (Nao viciada)
n1
i=1
n
2
X )2
(xi x
s =
n1
i=1
(3, 7)2 + (2, 7)2 + + (0, 3)2 + (1, 3)2
=
12 1
48, 7
= = 4, 42
11
Desvio Padr
ao
a raiz da Vari
E ancia, tendo a mesma unidade dos dados medidos. Podemos calcular o desvio
padrao da populac
ao e da amostra, da seguinte forma:
v
uN
)2
uX (xi x
= t Populacao (viciada)
N
i=1
v
uN
)2
uX (xi x
= t Populacao (Nao viciada)
N 1
i=1
v
u n
)2
uX (xi x
s = t Amostra (viciada)
n
i=1
v
u n
)2
uX (xi x
s = t Amostra (Nao viciada)
n1
i=1
94 6. Organizacao, Descricao e Exploracao dos Dados
Coeficiente de Varia
cao
Uma pergunta que pode surgir e: O desvio padrao calculado e grande ou pequeno? Esta quest
ao
e relevante por exemplo, na avaliac
ao da precisao de metodos.
Um desvio padr
ao pode ser considerado grande ou pequeno dependendo da ordem de grandeza da
variavel. Uma maneira de se expressar a variabilidade dos dados tirando a influencia da ordem de
grandeza da vari
avel e atraves do coeficiente de variacao, definido por:
s
CV =
x
O CV e:
Interpretado como a variabilidade dos dados em relacao `a media. Quanto menor o CV mais
homogeneo e o conjunto de dados;
Adimensional, isto e, um n
umero puro, que sera positivo se a media for positiva; sera zero quando
nao houver variabilidade entre os dados, ou seja, s = 0;
Vari
avel x
s
pulsac
ao 68,7 8,7
acido u
rico 5,46 1,03
6. Organizacao, Descric
ao e Explorac
ao dos Dados 95
8,7 1,03
Os coeficientes de variac
ao s
ao: CVp = 68,7 = 0, 127 e CVa.u. = 5,46 = 0, 232, o que evidencia que
a pulsac
ao e mais est
avel do que o
acido u
rico.
Metodo (unidade) x
s CV
6.9 An
alise Gr
afica de Vari
aveis Quantitativas
6.9.1 Histograma
O histograma e um gr
afico composto por retangulos justapostos em que a base de cada um deles
corresponde ao intervalo de classe e a sua altura `a respectiva freq
uencia. Quando o n
umero de dados
aumenta indefinidamente e o intervalo de classe tende a zero, a distribuicao de freq
uencia passa para
uma distribuicao de densidade de probabilidades. A construcao de histogramas tem carater preliminar
em qualquer estudo e e um importante indicador da distribuicao de dados. Podem indicar se uma
distribuicao aproxima-se de uma func
ao normal, como pode indicar mistura de populacoes quando se
apresentam bimodais.
Figura 6.11:
A figura 6.12 apresenta alguns modelos de histogramas com suas respectivas interpretacoes.
6. Organizacao, Descric
ao e Explorac
ao dos Dados 97
Figura 6.12:
6.9.2 Gr
afico de Pontos
Uma representac
ao alternativa ao histograma para a distribuicao de freq
uencias de uma vari
avel
quantitativa e o diagrama de pontos, como mostra a figura 6.13.
Figura 6.13:
Neste grafico, cada ponto representa uma observacao com determinado valor da variavel. Ob-
servacoes com mesmo valor s
ao representadas com pontos empilhados neste valor.
98 6. Organizacao, Descricao e Exploracao dos Dados
a representac
O Box Plot foi inventado em 1977 pelo estatstico americano John Tukey. E ao de
um conjunto de valores, considerando apenas as seguintes medidas
calculado por
1. Limite Superior (LS): E
3
LS = Q3 + (Q3 Q1
2
calculado por
2. Limite inferior (LI): E
3
LI = Q1 (Q3 Q1
2
Figura 6.14:
Em adicao, o Box Plot pode indicar quais observacoes, se existir, sao consideradas nao usuais
ou outliers. Aqueles valores que aparecerem acima ou abaixo do LS e LI sao considerados valores
estranhos e devem ser observados com mais carinho, pois, podem ser tanto pecas importantes na
interpretacao dos dados quanto valores com problemas ao transcrever os dados!
O Box Plot tambem auxilia na verificacao da dispersao e assimetria dos dados. Quanto maior a
caixa central dos gr
afico, maior ser
a a variabilidade. Se a linha central estiver com uma tendencia
tanto para o lado do terceiro quartil quanto para o primeiro, podemos dizer que os dados tem uma
tendencia para serem assimetricos.
6. Organizacao, Descric
ao e Explorac
ao dos Dados 99
Figura 6.15:
6.9.4 Gr
afico de Dispers
ao
Um grafico de dispers
ao constitui a melhor maneira de visualizar a relacao entre duas vari
aveis
uma das sete ferramentas da qualidade. Coleta dados aos pares de duas vari
quantitativas. E aveis
(causa/efeito) para checar a existencia real da relacao entre essas variaveis.
A figura 6.16 apresenta a relac
ao entre as variaveis Tempo e Temperatura.
100 6. Organizacao, Descricao e Exploracao dos Dados
Figura 6.16:
Um grafico de dispers
ao tem dois eixos de valores, mostrando um conjunto de dados numericos ao
longo do eixo horizontal (eixo X) e outro ao longo do eixo vertical (eixo Y). Ele combina esses valores
em pontos de dados u
nicos e os exibe a intervalos irregulares, ou agrupamentos. Graficos de dispers
ao
sao comumente usados para exibir e comparar valores numericos, como dados cientficos, estatsticos
e de engenharia.
6.10 Exerccios
31,1 31,7 33,9 33,4 34,2 34,5 35,2 34,3 34,7 34,7
32,0 31,9 35,7 33,8 35,1 33,9 35,5 34,6 34,7 34,6
35,4 32,1 35,0 32,6 31,8 33,6 35,7 34,7 35,4 33,9
32,8 33,6 34,2 30,7 31,3 32,3 32,8 34,8 35,2 34,0
Tabela 6.19:
De a classificac
ao desta vari
avel, organize os dados em uma tabela de distribuic
ao de freq
uencia e
faca um gr
afico. Depois, considerando todos os dados, calcule a media, o desvio padr
ao, a moda, a me-
diana, a amplitude, o 1o quartil, o 3o quartil, o coeficiente de variac
ao e apresente uma interpretac
ao.
Apresente ainda um gr
afico de boxplot e reforce sua interpretac
ao.
Exerccio 6.16. Os n
umeros apresentados na tabela 6.20 representam as notas de 30 alunos matri-
culados na disciplina Estatstica aplicada.
De a classificac
ao desta vari
avel, organize os dados em uma tabela de distribuic
ao de freq
uencia e
faca um gr
afico. Depois, considerando todos os dados, calcule a media, o desvio padr
ao, a moda, a me-
diana, a amplitude, o 1o quartil, o 3o quartil, o coeficiente de variac
ao e apresente uma interpretac
ao.
6. Organizacao, Descric
ao e Explorac
ao dos Dados 101
Tabela 6.20:
Apresente ainda um gr
afico de boxplot e reforce sua interpretac
ao.
Exerccio 6.17. A tabela 6.21 apresenta uma amostra de tarifas de transporte, realizadas por ca-
minh
oes, para cargas de 2000 a 5000 kg, com origem em Jata e tendo como destino v
arias cidades
no brasil. A partir dos dados, construa um gr
afico de dispers
ao e interprete-o. Existe algum relacio-
namento linear entre as vari
aveis?
Tarifa em R$ Dist
ancia em Km
4,15 169
16,2 2220
9,11 1108
6,81 427
13,53 2197
9,84 1226
15,28 2685
6,92 465
9,51 936
8,03 751
7,8 848
12,77 1923
11,28 1004
7,8 657
8,24 955
8,4 801
13,38 1753
12,77 1998
10,69 1337
8,5 799
Tabela 6.21:
Como complemento ao gr
afico, inclua uma reta vertical e outra horizontal nas respectivas medias
das vari
aveis.
Tabela 6.22:
varejista 1 218 188 225 217 176 187 221 212 210 203 188 185
varejista 2 101 87 123 101 95 97 93 131 76 101 87 114
varejista 3 268 296 321 312 301 294 285 305 289 303 324 332
Tabela 6.23: