Livro PDF - Estatística e Probabilidade - Prof MSC Uanderson Rebula

-1-
-2-
UANDERSON REBULA DE OLIVEIRA

https://br.linkedin.com/in/uandersonrebula
http://lattes.cnpq.br/1039175956271626
Doutorando em Engenharia-Universidade Estadual Paulista-UNESP
Mestrado em Engenharia de Produção-Universidade Estadual Paulista-UNESP
Pós-graduado em Controladoria e Finanças-Universidade Federal de Lavras-UFLA
Pós-graduado em Logística Empresarial-Universidade Estácio de Sá-UNESA
Graduado em Ciências Contábeis-Universidade Barra Mansa-UBM
Técnico em Metalurgia-Escola Técnica Pandiá Calógeras-ETPC
Técnico em Segurança do Trabalho-ETPC
Operador Siderúrgico e Industrial-ETPC
Pesquisador pelo ITL/SEST/SENAT. Professor na UNIFOA no curso de Pós graduação em Engenharia de Segurança
do Trabalho. Professor da Universidade Estácio de Sá - UNESA nas disciplinas de Gestão Financeira de Empresas,
Fundamentos da Contabilidade e Matemática Financeira, Probabilidade e Estatística para o curso de Engenharia de
Produção, Análise Estatística para o curso de Administração, Ergonomia, Higiene e Segurança do Trabalho, Gestão
de Segurança e Análise de Processos Industriais (Gestão Ambiental), Gestão da Qualidade: programa 5S (curso de
férias). Professor na Associação Educacional Dom Bosco para os cursos de Administração e Logística. Ex-professor
na Universidade Barra Mansa – UBM nos cursos de Engenharia de Produção e de Petróleo. Ex-professor
Conteudista na UNESA (elaboração de Planos de Ensino e de Aula, a nível nacional). Ex-professor em escolas
técnicas nas disciplinas de Estatística Aplicada, Estatística de Acidentes do Trabalho, Probabilidades, Contabilidade
Básica de Custos, Metodologia de Pesquisa Científica, Segurança na Engenharia de Construção Civil e Higiene do
Trabalho. Ex-professor do SENAI. Ex-consultor interno, desenvolvedor e instrutor de cursos corporativos na CSN,
a níveis Estratégicos, Táticos e Operacionais. Ex-Membro do IBS–Instituto Brasileiro de Siderurgia.
ESTATÍSTICA
EMENTA:
Conceito e fases de estudo. Variáveis. População e amostra. Séries estatísticas:
conceitos, tabelas, distribuição de frequência e representação gráfica.
Medidas de Posição. Medidas Separatrizes. Medidas de Dispersão. Medidas
de Assimetria e Curtose. Probabilidade e seus eventos. Bayes. Distribuição
Binomial.
OBJETIVO:
Refletir a partir da Estatística Básica sobre as ferramentas consolidadas pelo
uso e pela ciência, disponíveis a todos, que auxiliam na tomada de decisão.
Resende - RJ – 2017
“Atualmente, todos – estudantes e professores – procuram o Udemy porque é a
plataforma onde todos estão”.
Fonte: Jornal do Brasil
Faça o curso online na Udemy

Estatística I (para leigos):
aprenda fácil e rápido!
Com o Prof. MSc. Uanderson Rébula
"O livro digital Estatística I para leigos possui uma linguagem fácil e ao mesmo tempo dinâmica. O
conteúdo do livro está ordenado de forma a facilitar a aprendizagem dos alunos, mesmo aquelas
pessoas que não tenham noção nenhuma de estatística aprenderão com esse livro. Você pode
estudar sozinho para concursos pois o livro é auto explicativo ou até mesmo em grupos, no meu
caso faço isso com meus alunos. Eu super recomendo esse livro!!! NOTA 1000"
Maria Eunice Souza Madriz
Professora de estatística da rede estadual de ensino da Bahia
Avaliação do livro pelo cliente na amazon.com.br
Saiba
mais
Clique aqui
www.udemy.com
Junte-se a milhões de estudantes na maior plataforma on-line
de cursos curtos e práticos do mundo.
Com mais de 45.000 cursos virtuais disponíveis, o Udemy é uma plataforma global de
ensino on-line onde 15 milhões de alunos estão dominando novas habilidades.
O foco do Udemy são os conhecimentos práticos e úteis para o mercado de trabalho. Há

cursos gratuitos e pagos. São cursos curtos e com valores bem acessíveis.
Prof. MSc. Uanderson Rébula de Oliveira
Uma mensagem do Prof. MSc Uanderson Rébula. CLIQUE NO VÍDEO
CLIQUE AQUI E INSCREVA-SE NO CURSO JÁ
Sumário
-5-
SUMÁRIO
1 – CONCEITOS PRELIMINARES 4 – PROBABILIDADE
1.1 CONCEITO E IMPORTÂNCIA DA ESTATÍSTICA, 7 4.1 CONCEITOS BÁSICOS DE PROBABILIDADES, 44
1.2 FASES DO ESTUDO ESTATÍSTICO, 12 Experimento aleatório, 44
1.3 VOCABULÁRIO BÁSICO DE ESTATÍSTICA, 13 Espaço amostral, 44
1.4 POPULAÇÃO E AMOSTRA, 15 Eventos, 45
1.5 ESTATÍSTICA DESCRITIVA E INFERENCIAL , 17 4.2 CÁLCULOS DE PROBABILIDADES, 45
Probabilidade , 45
Eventos complementares, 46
2 – SÉRIES ESTATÍSTICAS Eventos mutuamente exclusivos, 47
2.1 CONCEITOS E TIPOS DE SÉRIES ESTATÍSTICAS, 19 Eventos não mutuamente exclusivos, 47
Tabelas, 19 Probabilidade condicional e multiplicação de
Gráficos, 20 probabilidades, 48
Probabilidade com eventos dependentes, 48
2.2 DISTRIBUIÇÃO DE FREQUÊNCIA, 23 Multiplicação de probabilidades com
Frequência absoluta e histograma, 23 eventos dependentes, 50
Frequência relativa, absoluta acumulada e Multiplicação de probabilidades com
relativa acumulada, 24 eventos independentes, 51
Agrupamento em classes, 25 Teorema de Bayes, 52
Polígono de frequência e ogiva, 26 Distribuição Binomial, 53
3 – MEDIDAS RESUMO REFERÊNCIAS BIBLIOGRÁFICAS, 55
3.1 MEDIDAS DE POSIÇÃO, 28
ANEXO I – LIVROS RECOMENDADOS, 56
MÉDIA, 28 ANEXO II – Software BIOESTAT , 57
Média simples e Média ponderada, 28 ANEXO I II– Estatística no Excel, 58
Média de distribuição de frequência, 29
MEDIANA, 30
MODA, 31
RELAÇÃO ENTRE MÉDIA, MEDIANA E MODA, 33
3.2 MEDIDAS DE ORDENAMENTO (OU SEPARATRIZES), 34
Quartil, 34
Decil e Percentil, 35
3.3 MEDIDAS DE VARIAÇÃO (OU DISPERSÃO), 36
Introdução, 36
Variância e Desvio Padrão, 37
Coeficiente de Variação, 39
Desvio padrão de Distribuição de frequência, 39
3.4 MEDIDAS DE ASSIMETRIA E CURTOSE, 41
Assimetria e coeficiente de assimetria, 41
Curtose e coeficiente de curtose, 42
-6-
1
CONCEITOS PRELIMINARES
-7-
1.1 CONCEITO E IMPORTÂNCIA DA ESTATÍSTICA

ESTATÍSTICA NA PRÁTICA
Analise as informações abaixo para melhor compreensão do conceito de Estatística.
ACIDENTES DO TRABALHO NO BRASIL – 1970 a 2005
Conceito de Acidente: Lesão corporal ou doença, relacionada com o exercício do trabalho. (Lei 8.213/91 – art. 19 a 21)
INSS: Órgão público responsável pela coleta, organização e representação dos dados.
 Coleta: Por meio de um formulário eletrônico denominado “CAT – Comunicação de Acidente do Trabalho”, enviado
pelas empresas quando da ocorrência, conforme determina o art. 22 da Lei 8.213/91.
 Organização: Através de um grande banco de dados do INSS.
 Representação: Através de um documento denominado “Anuário Estatístico de Acidentes do Trabalho”, contendo
tabelas, gráficos e diversas análises. Disponível no site www.previdencia.gov.br, na seção “Estatística”.
Motivo: Quando o trabalhador se afasta por motivo de acidente, o INSS concede benefícios acidentários, como auxílio
doença acidentário, auxílio acidente, aposentadoria por invalidez, pensão por morte, reabilitação entre outros.
COMPILAÇÃO E ANÁLISE DE DADOS (INFORMAÇÕES) sobre acidentes do trabalho, de 1970 a 2005:

33.238.617
35.000.000 31.407.576
Evolução da QUANTIDADE de TRABALHADORES
29.544.927
no Brasil - 1970 a 2005. 28.683.913
30.000.000 27.189.614
26.228.629
24.491.635
23.661.57923.198.656 23.667.24123.830.312

25.000.000 22.163.827 22.272.843
19.476.36219.673.915
18.686.355
20.000.000 16.638.799
14.945.489
15.000.000
11.537.024
8.148.987

10.000.000 7.284.022
5.000.000
0
1970 1972 1974 1976 1978 1980 1982 1984 1986 1988 1990 1992 1994 1996 1998 2000 2001 2002 2003 2004 2005
FONTE: Revista Proteção Anos
Observa‐se ao longo dos anos o aumento gradativo da quantidade de trabalhadores no Brasil, de 7.284.022 chegando a 33.238.617,
reflexo do crescimento econômico do País. Essas informações (dados) são importantes para fins de comparação com a evolução da
quantidade de acidentes do trabalho no mesmo período, como segue abaixo:
2.000.000 1.796.671
1.743.825 Aprovação das NR’s Involução da QUANTIDADE de ACIDENTES DO
1.750.000 1.551.461
TRABALHO no Brasil - 1970 a 2005.
1.504.723 1.464.211
1.500.000
1.220.111 1.178.472 1.207.859
1.250.000
961.575 991.581
1.000.000
693.572
750.000 532.514
465.700 491.711
388.304 395.455414.341 363.868 393.071 399.077
500.000 340.251
250.000
0
1970 1972 1974 1976 1978 1980 1982 1984 1986 1988 1990 1992 1994 1996 1998 2000 2001 2002 2003 2004 2005
Anos
FONTE: Revista Proteção
No período de 1970 a 1976 a quantidade de acidentes foi alta, comparando‐se com a pequena quantidade de trabalhadores no
mesmo período. Somente a partir de 1978 os acidentes começaram a reduzir, em razão da aprovação das Normas
Regulamentadoras – NR’s (disponível no www.mte.gov.br), tornando‐se de aplicação obrigatória em todo o País. Esta redução pode
ser vista como positiva, entretanto, não podemos comemorar esses números, pois a quantidade de acidentes ainda é alarmante e
está praticamente estagnada, desde 1994.
-8-
E as regiões? Como esses acidentes estão distribuídos nas regiões do país? Qual a pior região? Vejamos abaixo em um
Cartograma (mapa com dados), REFERENTE AO ANO DE 2005 (491.711 acidentes):
Distribuição da quantidade e porcentagem de acidentes de trabalho no Brasil por Regiões,
correlacionados com o Produto Interno Bruto ‐ PIB ‐ ano 2005.

NORTE

• PIB: 5% de participação
• Acidentes: 19.117 (4% do total)
NORDESTE

• PIB: 13,1% de participação
CENTRO‐OESTE

SUDESTE

SUL
Espírito Santo ‐ 11.039 acidentes
Minas Gerais ‐ 52.335 acidentes
Rio de Janeiro ‐ 34.610 acidentes
São Paulo ‐ 181.705 acidentes

É campeão de acidentes no Brasil, participando com
181.705, o que corresponde a 37% do total; por conseguinte
o seu PIB também é o maior do País, com 33,9% de
participação.
FONTE: Adaptado da Revista Proteção e do IBGE (www.ibge.gov.br)

Observa‐se que a região em 1° lugar em número de acidentes é a Sudeste, em 2° está a região Sul, em 3° a região Nordeste, em 4° a região
Centro‐Oeste e por último a Norte. Ao analisarmos este gráfico podemos tomar diversas conclusões, porém, tais conclusões somente são
possíveis através de um estudo, o que demanda tempo. Todavia, observa‐se que a quantidade de acidentes acompanha a porcentagem da
participação do PIB da região. Esta correlação pode ser resultado do reflexo da economia da região. Ora, a região Sudeste, por exemplo,
corresponde a 56,5% do PIB do País. Logicamente esta região possui um maior número de empresas e, consequentemente, maior número de
mão‐de‐obra e atividades produtivas, fato que pode justificar a enorme quantidade de acidentes comparada com as demais regiões. Esses
dados também podem estar relacionados com as políticas dos estados e das empresas, a atuação das fiscalizações do Ministério do Trabalho,
as culturas das regiões, os investimentos empresariais, a capacitação de mão de obra (treinamentos) entre outros fatores. Entende‐se por
Produto Interno Bruto (PIB) a soma, em valores monetários, de todos os bens e serviços finais produzidos em uma determinada região.

Tradicionalmente, no Brasil, as políticas de desenvolvimento têm se restringido aos aspectos econômicos e vêm sendo traçadas
de maneira paralela ou pouco articuladas com as políticas sociais, cabendo a estas últimas arcarem com os ônus dos possíveis
danos gerados sobre a saúde da população, dos trabalhadores em particular e a degradação ambiental. Para que o Estado
cumpra seu papel para a garantia desses direitos, é mister a formulação e implementação de políticas e ações de governo.
POSSÍVEIS SOLUÇÕES PARA REDUZIR OS ACIDENTES

A partir da análise dos dados podemos concluir que a política de segurança do trabalho adotada no País está estagnada. A
simples aplicação da norma regulamentadora não está sendo suficiente para reduzir o índice de acidentes. Os dados nos
mostram que não haverá mudanças significativas se não forem feitas alterações nessa política.

Para contornar a situação, os Ministérios do Trabalho, da Saúde e da Previdência Social publicaram, para consulta pública, em
29.12.2004 a PNSST ‐ POLÍTICA NACIONAL DE SEGURANÇA E SAÚDE DO TRABALHADOR, com a finalidade de promover a
melhoria da qualidade de vida e da saúde do trabalhador.

Os Ministérios reconheceram a deficiência da segurança do trabalho no país, carecendo de mecanismos que:
 Incentivem medidas de prevenção;
 Responsabilizem os empregadores;
 Propiciem o efetivo reconhecimento dos direitos do trabalhador;
 Diminuam a existência de conflitos institucionais;
 Tarifem de maneira mais adequada as empresas e
 Possibilite um melhor gerenciamento dos fatores de riscos ocupacionais.
-9-
Face ao exposto, a PNSST propõe, dentre outras, as seguintes ações a serem desenvolvidas pelos três Ministérios:
Área Ações
 Estabelecer política tributária que privilegie empresas com menores índices de acidentes e que
invistam na melhoria das condições de trabalho;
 Criar linhas de financiamento para a melhoria das condições de trabalho, incluindo máquinas e
Tributos1, equipamentos, em especial para as pequenas e médias empresas;
financiamentos  Incluir requisitos de SST para concessão de financiamentos públicos e privados;
e licitações.  Incluir requisitos de SST nos processos de licitação dos órgãos públicos;
 Instituir a obrigatoriedade de publicação de balanço de SST para as empresas, a exemplo do que já
ocorre com os dados contábeis;
 Incluir conhecimentos básicos em SST no currículo do ensino fundamental e médio;
 Incluir disciplinas em SST no currículo de ensino superior, em especial nas carreiras de profissionais
de saúde, engenharia e administração;
Educação e  Estimular a produção de estudos e pesquisas na área de interesse desta Política;
pesquisa  Articular instituições de pesquisa e universidades para a execução de estudos e pesquisas em SST,
integrando uma rede de colaboradores para o desenvolvimento técnico ‐ cientifico na área;
 Desenvolver um amplo programa de capacitação dos profissionais, para o desenvolvimento das
ações em segurança e saúde do trabalhador;
Ambientes  Eliminar as políticas de monetarização dos riscos (adicionais de riscos).
nocivos  Outras ações
 Compatibilizar os instrumentos de coleta de dados e fluxos de informações.
Coleta de dados  Incluir nos Sistemas e Bancos de Dados as informações contidas nos relatórios de intervenções e
análises dos ambientes de trabalho, elaborados pelos órgãos de governo envolvidos nesta Política.
CONSIDERAÇÕES FINAIS SOBRE O ESTUDO DE ACIDENTES.

O que acabamos de ver é um estudo estatístico. Como vimos, os dados sobre acidentes do trabalho no Brasil são controladas
pelo INSS. A comunicação de acidentes permite ao INSS estimar e acompanhar o real impacto do trabalho sobre a saúde e a
segurança da população brasileira. O INSS coleta, organiza, apresenta e publica as estatísticas de acidentes do trabalho no
Brasil. Conforme observado, quando ocorre um acidente, a empresa, por força de lei, é obrigada a
enviar a CAT ao INSS, alimentando, assim, o seu grande banco de dados.

É importante ressaltar que os dados de acidentes de trabalho não se constituem, tão somente, num
importante registro histórico, mas sim numa ferramenta inestimável para os profissionais que
desempenham atividades nas áreas de saúde e segurança do trabalhador, assim como
pesquisadores e demais pessoas interessadas no tema. A análise desses dados possibilita a
construção de um diagnóstico mais preciso acerca da epidemiologia dos acidentes, propiciando,
assim, a elaboração de políticas mais eficazes para as áreas relacionadas com o tema.
TÓPICO PARA REFLEXÃO Acidente do Trabalho: o problema do Brasil.
Os acidentes de trabalho afetam a produtividade econômica, são responsáveis por um impacto substancial sobre o sistema de proteção
social e influenciam o nível de satisfação do trabalhador e o bem estar geral da população.

Estima‐se que a ausência de segurança nos ambientes de trabalho no Brasil tenha gerado, no ano de 2003, um custo de cerca de R$32,8
bilhões para o país. Deste total, R$ 8,2 bilhões correspondem a gastos com benefícios acidentários e aposentadorias especiais, equivalente a
30% da necessidade de financiamento do Regime Geral de Previdência Social ‐ RGPS verificado em 2003, que foi de R$ 27 bilhões. O restante
da despesa corresponde à assistência à saúde do acidentado, indenizações, retreinamento, reinserção no mercado de trabalho e horas de
trabalho perdidas.

Isso sem levar em consideração o sub‐dimensionamento na apuração das contas da Previdência Social, que desembolsa e contabiliza como
despesas não acidentárias os benefícios por incapacidade, cujas CAT não foram emitidas. Ou seja, sob a categoria do auxílio doença não
ocupacional, encontra‐se encoberto um grande contingente de acidentes que não compõem as contas acidentárias.

Parte deste “custo segurança no trabalho” afeta negativamente a competitividade das empresas, pois ele aumenta o preço da mão‐de‐obra,
o que se reflete no preço dos produtos. Por outro lado, o incremento das despesas públicas com previdência, reabilitação profissional e
saúde reduz a disponibilidade de recursos orçamentários para outras áreas ou induz o aumento da carga tributária sobre a sociedade.

De outro lado, algumas empresas afastam trabalhadores, e muitas vezes os despedem logo após a concessão do beneficio. Com isso, o
trabalhador se afasta, já sendo portador de doença crônica contraída no labor, e o desemprego poderá se prolongar na medida em que, para
obter o novo emprego, será necessária a realização do exame admissional, no qual serão eleitos apenas aqueles considerados como “aptos”
e, portanto, não portadores de enfermidades.

Fonte: RESOLUÇÃO CNPS Nº 1.269, DE 15 DE FEVEREIRO DE 2006
_________________
1. Tributo: Impostos; taxas e contribuições de melhoria, devida ao poder público.
- 10 -
CONCEITO DE ESTATÍSTICA

É A CIÊNCIA QUE SE DEDICA EM COLETAR, ORGANIZAR, APRESENTAR, ANALISAR E INTERPRETAR DADOS
(INFORMAÇÕES) PARA TOMADA DE DECISÃO.

 Estatística é a ciência dos dados. A Estatística lida com a coleta, o
processamento e disposição de dados (informações), atuando como
ferramenta crucial nos processos de soluções de problemas. A Estatística
facilita o estabelecimento de conclusões confiáveis sobre algum fenômeno
que esteja sendo estudado (WERKEMA, 1995).

 É por meio da análise e interpretação dos dados estatísticos que é possível o
conhecimento de uma realidade, de seus problemas, bem como, a
formulação de soluções apropriadas por meio de um planejamento objetivo
da ação, para além dos “achismos” e “casuismos” comuns.

 No uso diário o termo “estatística” refere‐se a fatos numéricos. Tenha em
mente, entretanto, que estatística é bem diferente de matemática. Estatística
é, antes de qualquer coisa, um método científico que determina questões de
pesquisa; projeta estudos e experimentos; coleta, organiza, resume e analisa dados; interpreta resultados e esboça
conclusões. Ou seja, utiliza‐se dados como evidências para responder a interessantes questões sobre o mundo. A
matemática só é utilizada para calcular a estatística e realizar algumas das análises, mais isso é apenas uma pequena parte
do que realmente é a estatística. Portanto, a estatística mantém com a matemática uma relação de dependência,
solicitando‐lhe auxílio, sem o qual não poderia desenvolver‐se.

 A Estatística é uma ciência interdisciplinar, ou seja, é comum a duas ou mais disciplinas ou ramos de conhecimento.
Assim, a Estatística é aplicada na Medicina, Administração, Engenharias, Economia, Contabilidade, Direito, Segurança do
Trabalho, Qualidade, Marketing entre outras áreas. Veja abaixo.

Medicina. Estudos de epidemiologia, *Engenharia de Produção. Estudos de Segurança do Trabalho. Estudos de
inter‐relações dos determinantes da um conjunto de dados de todas as acidentes e doenças, suas causas,
freqüência e distribuição de doenças fases de um processo produtivo. quantidade, parte atingida, setores, %
populacionais de afastamentos etc.
Contabilidade. Estudos das Finanças. Estudos de uma série de Economia. Estudos de taxas de
informações financeiras das empresas informações estatísticas para orientar inflação, índice de preços, taxa de
públicas e privadas. investimentos. desemprego, futuro da economia.

*Engenharia de Produção – A aplicação da Estatística na produção merece especial atenção. A atual ênfase na qualidade
torna o controle da qualidade uma importante aplicação da estatística na área da produção. Usa‐se uma série de mapas
estatísticos de controle de qualidade para monitorar o resultado (output) de um processo de produção. Suponha, por
exemplo, que uma máquina preencha recipientes com 2 litros de determinado refrigerante. Periodicamente, um operador
do setor de produção seleciona uma quantidade de recipientes e verifica a exatidão, ou seja, se não há desvios. A
Estatística também é usada na Engenharia de Produção para Estratificação, que consiste no agrupamento da informação
(dados) sob vários pontos de vista, de modo a focalizar a ação, considerando os fatores equipamento, tempo entre outros.
Exemplo:

Roupas danificadas Tipo de dano: Operador: Máquina de lavar:
em uma lavanderia Tipo de roupa: Marca do sabão: Máquina de secar:
- 11 -
UM POUCO DE HISTÓRIA E ATUALIDADE

O termo “Estatística” provém da palavra “Estado” e foi utilizado originalmente
para denominar levantamentos de dados (riquezas, impostos, nascimentos,
mortalidade, batizados, casamentos, habitantes etc.), cuja finalidade era
orientar o Estado em suas decisões.

 Segundo Costa (2005, p. 5) em 1085, Guilherme “O Conquistador”,
ordenou que se fizesse um levantamento na Inglaterra, que deveria
incluir informações sobre terras, proprietários, uso da terra,
empregados, animais e serviria, também, de base para cálculo de
impostos. Tal levantamento originou um volume intitulado “domesday book”.

 No século XVIII o estudo dos dados foi adquirindo, aos poucos, feição
verdadeiramente científica. A palavra Estatística apareceu pela primeira
vez no século XVIII e foi sugerida pelo alemão Godofredo Achenwall (1719‐
1772), onde determinou o seu objetivo e suas relações com as ciências.

 Desde essa época, a Estatística deixou de ser a simples catalogação de dados numéricos coletivos e se
tornou o estudo de como chegar a conclusões sobre o todo, partindo da observação e análise de partes
desse todo. Essa é sua maior riqueza.

Atualmente a sociedade está completamente tomada pelos números. Eles
aparecem em todos os lugares para onde você olha, de outdoors mostrando as
últimas estatísticas sobre aborto, passando pelos programas de esporte que
discutem as chances de um time de futebol chegar à final do campeonato, até o
noticiário da noite, com reportagens focadas no índice de criminalidade, na
expectativa de vida de uma pessoa que não come alimentos saudáveis e no índice
de aprovação do presidente.

Em um dia comum, você pode se deparar com cinco, dez ou, até mesmo, vinte diferentes estatísticas (ou até
muito mais em um dia de eleição). Se você ler todo o jornal de domingo, irá se deparar com centenas de
estatísticas em reportagens, propagandas e artigos sobre todo tipo de assunto: desde sopa (quanto em média uma
pessoa consome por ano?) até castanhas (quantas castanhas você precisa comer para aumentar seu QI?).
Nas empresas a Estatística desempenha um papel cada vez mais importante para os Gerentes. Esses
responsáveis pela tomada de decisão utilizam a estatística para:

 Apresentar e descrever apropriadamente dados e informações sobre
a empresa;
 Tirar conclusões sobre grandes populações, utilizando informações
coletadas a partir de amostras;
 Realizar suposições confiáveis sobre a atividade da empresa;
 Melhorar os processos da empresa.

A estatística é um instrumento eficiente para a compreensão e interpretação da realidade e não
deve ser subestimada. Realmente existem pesquisas feitas de forma incorreta e que, por isso, não
são confiáveis. Mas, em geral, quando um estudo estatístico é feito com critério, seus resultados
permitem obter conclusões e prever tendências sobre fatos e fenômenos. Um estudo bem feito
não elimina o erro, mas limita‐o a uma margem, procurando torná‐la o menor possível.

- 12 -
1.2 FASES DO ESTUDO ESTATÍSTICO

Um estudo estatístico confiável depende do planejamento e da correta execução das seguintes etapas:
1. Definir o que será estudado e a natureza dos dados, como exemplo:

ESTUDO NATUREZA DOS DADOS

 Quantidade e período
 Por regiões, estados ou municípios
Acidentes do  Por atividade econômica Defina com clareza os objetivos da
Trabalho no Brasil  Por idade dos acidentados pesquisa, ou seja, o que se pretende
 Por parte do corpo atingida apurar, que tipo de problema
 Por causas dos acidentes etc. buscará detectar.
 Tipo de peça | Tipo de defeito
 Quantidade
Peças danificadas na
 Período e Turnos
linha A  Máquinas e Operadores
 Matéria prima etc.

2. Coletar dados
Após definir o que será estudado e o estabelecimento do planejamento do trabalho (forma de coleta dos dados,
cronograma das atividades, custos envolvidos, levantamento das informações disponíveis), o passo seguinte é o
da coleta de dados, que consiste na busca ou compilação dos dados, componentes do fenômeno a ser
estudado. Nessa etapa recolhem‐se os dados tendo o cuidado de controlar a qualidade da informação.
O sucesso de uma pesquisa depende muito da qualidade dos dados recolhidos. Podem ser por meio
de Criação de Softwares, a exemplo da CAT; Uso de Softwares da empresa; Dados históricos
da empresa (físicos); Pesquisas com questionários etc.
3. Organizar e contar dados

À procura de falhas e imperfeições, os dados devem ser cuidadosamente organizados e contados, a fim de não incorrermos
em erros grosseiros que possam influenciar nos resultados. No exemplo da “Estatística na prática”, após a coleta da quantidade
de acidentes por meio da CAT, organiza‐os por período, regiões etc. Da mesma maneira, se você usa um questionário para
coletar dados na empresa, organiza‐os da forma necessária à pesquisa, além da contagem a ser feita.
4. Apresentação de dados
2.000 .000 1.796.671 Aprovação das NR’s Involução da QUANTIDADE de ACIDENTES DO
1.743.825
TRABALHO no Brasil - 1970 a 2005.
Os dados devem ser 1.750 .000 1.551.461
1.504. 723 1.464.211
apresentados sob a 1.500 .000
1. 207.859
forma de tabelas ou 1.220. 111 1.178. 472
1.250 .000
gráficos, a fim de 961. 575 991.581
tornar mais fácil e 1.000 .000

693. 572
rápido o exame 750 .000 532.514
daquilo que está 414.341 465.700 491.711
388.304 395. 455 363. 868 393.071 399.077
500 .000 340.251
sendo estudado.
250 .000
0
1970 1972 1974 19 76 1978 19 80 1982 1 984 1986 1 988 1990 1992 1994 1996 199 8 2000 20 01 2002 20 03 2004 2 005
Anos
FONTE: Revista Proteção
5. Análise dos dados e tomada de decisão

Chegamos à fase mais complexa do processo estatístico, que consiste na análise dos dados. Por fim, a
partir da análise realizada, poderemos chegar a uma tomada de decisão. Observe o estudo
“Estatística na prática”. O que resultou a análise dos acidentes no Brasil, no período de 1970 a
2005? Veja que os Ministérios do Trabalho, Previdência Social e da Saúde se mobilizaram para
resolverem essa questão de saúde pública, com diversas ações a serem implementadas no país. A
partir dessa discussão, fica claro que um profissional com conhecimentos de Estatística terá maior
facilidade em identificar um problema em sua área de atuação, determinar os tipos de dados que
irão contribuir para sua análise, coletar esses dados e a seguir estabelecer conclusões e determinar
um plano de ação para a solução do problema detectado.
- 13 -
1.3 VOCABULÁRIO BÁSICO DE ESTATÍSTICA

O vocabulário utilizado em estudos estatísticos teve sua origem nos primeiros estudos feitos pela humanidade e que eram
relativos à demografia (estudo estatístico das populações). Por isso a Estatística emprega termos próprios dessa área de
conhecimento, mas com um sentido diferenciado. Assim, para dar prosseguimento, é de extrema importância destacar alguns
termos utilizados no jargão estatístico.

VARIÁVEL – É o termo usado para aquilo que você está pesquisando, estudando, analisando.
,
 No estudo representado no gráfico abaixo a variável é o acidente do trabalho. Utilizada como um adjetivo do
vocabulário do dia‐a‐dia, variável sugere que alguma coisa se modifica ou varia.

2.000.000 1.796.671
1.743.825 Involução da QUANTIDADE de ACIDENTES
1.750.000 1.551.461
DO TRABALHO no Brasil - 1970 a 2005.
1.504.723 1.464.211
1.500.000
1.220.111 1.178.472 1.207.859
1.250.000
VARIÁVEL
961.575 991.581
1.000.000
693.572
750.000 532.514
465.700 491.711
388.304 395.455414.341 363.868 393.071 399.077
500.000 340.251
250.000
0
1970 1972 1974 1976 1978 1980 1982 1984 1986 1988 1990 1992 1994 1996 1998 2000 2001 2002 2003 2004 2005
FONTE: Revista Proteção Anos
São exemplos de Variáveis

Doenças, Sexo, Estaturas, Peso, Idade, Renda, Natalidade, Mortalidade, PIB, Inflação, Exportações brasileiras,
Produção de café, Alimentação, Peças produzidas por hora, Paradas de produção no mês, Rotatividade de
estoque por ano, Poluição, Clima na região sudeste, Consumo de energia no mês, Vendas mensais de uma
empresa, Produção diária de automóveis etc.

EXEMPLO DE APLICAÇÃO:
A associação dos moradores de um bairro queria traçar um perfil dos frequentadores de um parque ali situado.
Uma equipe de pesquisa elaborou questões a fim de reunir as informações procuradas. Numa manhã de quarta‐
feira, 6 pessoas foram entrevistadas e cada uma respondeu a questões para identificar idade, número de vezes
que freqüenta o parque por semana, estado civil, meio de transporte utilizado para chegar ao parque, tempo de
permanência no parque e renda familiar mensal. Os resultados são mostrados na tabela a seguir:
Variáveis

Cada um dos aspectos investigados — os quais permitirão fazer a análise desejada — é denominado variável.

- 14 -
TIPOS DE VARIÁVEIS

Há, pois, uma divisão principal para as variáveis estatísticas, que consiste em considerá‐las como Variáveis Quantitativas
(discretas ou contínuas) e Variáveis Qualitativas (nominal ou ordinal). Esta divisão é de facílima compreensão!
Inteiros Quando as variáveis forem em números

inteiros, obtido por contagem:
DISCRETA 0 1 2 3 4 55 77 987 etc.
Números
Ex.: Idade (anos), gols de futebol, etc
QUANTITATIVA
Não inteiros
Quando as variáveis forem em números
CONTÍNUA não inteiros, assumem qualquer valor:
0,2 1,12 3,77 4,768 etc.

Ex.: Altura (cm), peso (kg), tempo (hh:mm)
VARIÁVEL
Quando é possível ordenas as categorias.
Ordenável
Pesquisa de alimentação:
ORDINAL [1] Ótimo [2] Bom [3] Regular [4] ruim
Grau de instrução de funcionários de uma empresa
Nomes 1º grau 2º grau Superior Mestrado Doutorado
QUALITATIVA
Quando não é possível ordenar as categorias.
Não é ordenável
Ex.: sexo (masculino ou feminino), Cor dos olhos (preto ou verde),
NOMINAL campo de estudo (Engenharia, Direito etc)
Não é possível estabelecer uma ordem, uma gradação, o mais ou
menos importante, prioritário etc.
Então, os tipos de Variáveis da pesquisa do parque serão:
Qualitativa nominal
Quantitativa discreta Quantitativa contínua

PARA LEITURA
Se a dúvida persiste, você pode observar no quadro abaixo mais esclarecimentos sobre esses conceitos.
Tipo de VARIÁVEL Resposta fornecida à pesquisa
Será Quantitativa a variável para a qual se possa atribuir um valor numérico. Se a resposta fornecida à pesquisa estiver expressa
por um número, então a variável é quantitativa. Por exemplo: quantos livros você lê por ano? A resposta é um número? Então,
Quantitativa
variável quantitativa. Quantas pessoas moram em sua casa? A resposta é um número? Então, novamente, variável quantitativa.
(Em números)
No caso do estudo “ACIDENTE DO TRABALHO, é uma variável quantitativa, pois estudamos a quantidade de acidentes no período
de 1970 a 2005
Variável Quantitativa Discreta é a variável quantitativa que assume somente números inteiros. Resulta, geralmente, de
contagem. Esta variável não pode assumir qualquer valor, dentro de um intervalo de valores de resultados possíveis. Por
 Discreta exemplo, se eu pergunto quantos irmãos você tem, a resposta jamais poderia ser “tenho 3,75 irmãos”, ou “tenho 4,8 irmãos”, ou
(números inteiros) seja, a resposta não poderia assumir todos os valores de um intervalo! Este acima é o conceito formal de variável discreta! O
(contagem) conceito para memorizar é o seguinte: aquela variável obtida por meio de uma contagem. Em outras palavras: a variável
discreta você conta!. Exemplos: quantas pessoas moram na sua casa? Quantos livros você tem? Quantos carros você tem? Se,
para responder à pergunta, você faz uma contagem, então está diante de uma variável quantitativa discreta.
Variável Quantitativa Contínua é aquela que pode assumir qualquer valor dentro de um intervalo de resultados possíveis. Se eu
 Contínua pergunto quantos quilos você pesa, a resposta pode ser 65,35kg. Se eu pergunto qual a temperatura na cidade hoje, a resposta
(Números não inteiros) pode ser 27,35°C. Para facilitar a memorização, basta lembrar que a variável quantitativa contínua pode ser obtida por uma
(medição) medição, ou seja, a variável contínua você mede! Exemplos: peso, altura, duração de tempo para resolução de uma prova,
pressão, temperatura etc.
Qualitativa Se a pergunta é “qual a sua cor preferida?”, logicamente a resposta não será um número, daí estaremos tratando de uma
(nomes, atributos) variável qualitativa, ou seja, aquela para a qual não se atribui um valor numérico. Exemplos: Sexo: masculino ou feminino
- 15 -
1.4 POPULAÇÃO E AMOSTRA

Quando você quer saber se a sopa ficou boa, o que você faz? Mexe a panela, retira um pouco com
uma colher e prova. Depois tira uma conclusão sobre todo o conteúdo da panela sem, na verdade,
ter provado tudo. Portanto, é possível ter uma idéia de como a sopa está sem ter que comer tudo.
Isso é o que se faz em estatística.

A estatística deixou de ser a simples catalogação de dados numéricos e se tornou o estudo de como
chegar a conclusões sobre o todo (população), partindo da observação e análise de partes desse
todo (amostra). Essa é sua maior riqueza. Assim, podemos conceituar população e amostra como:

POPULAÇÃO É UM CONJUNTO DE TODOS OS ELEMENTOS EM ESTUDO.
AMOSTRA É UMA PARTE DA POPULAÇÃO (ou subconjunto).

AMOSTRA
(uma parte da população)

Podemos visualizar o conceito
de população
e amostra na “n”
figura ao lado.
POPULAÇÃO

Quando pesquisamos toda a

população, damos o nome de (todos os elementos em estudo)
censo.
“N”

A precisão depende do
tamanho da amostra, e
quanto maior
é o tamanho
amostral, maior será a
precisão das informações.

N é designado para População

n é designado para Amostra

 Muitas vezes quando queremos fazer um estudo estatístico, não é possível analisar toda a população
envolvida com o fato que pretendemos investigar, como exemplo o sangue de uma pessoa ou a poluição
de um rio. É impossível o teste do todo. Há situações também em que é inviável o estudo da população,
por exemplo, a pesquisa com todos os torcedores em um estádio de futebol durante uma partida.
Nesses casos, o estatístico recorre a uma amostra que, basicamente, constitui uma redução da
população a dimensões menores, sem perda das características essenciais.

 Os resultados fundamentados em uma amostra não serão exatamente os mesmos que você encontraria
se estudasse toda a população, pois, quando você retira uma amostra, você não obtém informações a
respeito de todos em uma dada população. Portanto, é importante entender que os resultados da
amostra fornecem somente estimativas dos valores das características populacionais. Com métodos de
amostragens apropriados, os resultados da amostra produzirão “boas” estimativas da população, ou
seja, um estudo bem feito não elimina o erro, mas limita‐o a uma margem, procurando torná‐la o menor
possível. Quando aprendemos estatística inferencial, também aprendemos técnicas para controlar esses
erros de amostragem.

4 razões para selecionar uma amostra
O número de elementos em uma população é muito grande;
Demanda menos tempo do que selecionar todos os itens de uma população;
É menos dispendioso (caro) do que selecionar todos os itens de uma população;
Uma análise amostral é menos cansativa e mais prática do que uma análise da população inteira.
- 16 -
São exemplos de População e Amostra:

MEDICINA. Pretende‐se estudar o efeito de um novo medicamento para curar determinada doença. É
selecionado um grupo de 50 doentes, administrando‐se o novo medicamento a 10 desses doentes escolhidos ao
acaso e o medicamento habitual aos restantes.
População: Todos os 50 doentes com a doença que o medicamento a estudar pretende tratar.
Amostra: Os 10 doentes selecionados.
CONTROLE DE QUALIDADE. O Gerente de Produção de uma fábrica de parafusos pretende assegurar‐se de que
a porcentagem de peças defeituosas não excede um determinado valor, a partir do qual determinada
encomenda poderia ser rejeitada.
População: Todos os parafusos fabricados ou a fabricar, utilizando o mesmo processo.
Amostra: Parafusos escolhidos ao acaso entre os lotes produzidos.
ESTUDOS DE MERCADO. O gerente de uma fábrica de produtos desportivos pretende lançar uma nova linha de
esquis, pelo que encarrega uma empresa especialista em estudos de mercado de “estimar“ a porcentagem de
potenciais compradores desse produto.
População: conjunto de todos os praticantes de desportos de neve.
Amostra: conjunto de alguns praticantes inquiridos pela empresa.
SISTEMAS DE PRODUÇÃO. Um fabricante de pneus desenvolveu um novo tipo de pneu e quer saber o aumento
da durabilidade em termos de kilometragem em relação à atual linha da empresa. Produz diariamente 1000
pneus e selecionou 120 para testes.
População: 1000 pneus.
Amostra: 120 pneus.

OUTROS EXEMPLOS DE AMOSTRAS:

- 17 -
1.5 ESTATÍSTICA DESCRITIVA E ESTATÍSTICA INFERENCIAL

Estatística descritiva – É o ramo da estatística
AMOSTRA
(uma parte da população) que envolve a organização, o resumo e a
representação dos dados para tomada de
decisão.
POPULAÇÃO
(todos os elementos em estudo)

Estatística Inferencial – É o ramo da estatística
que envolve o uso da amostra para chegar a
conclusões sobre a população. Uma
ferramenta básica no estudo da estatística
inferencial é a probabilidade.
Algumas ferramentas aplicadas à

Estatística Inferencial:

Probabilidades
Uma Probabilidade é uma medida numérica que representa a chance de um evento ocorrer. Ex.:
Ao lançar um dado, qual a probabilidade de obter o valor 4? R = 1/6 = 16%

Estimação, margem de erro e intervalo de confiança
Suponha que o tempo médio que você leva para chegar ao trabalho de carro é de 35’, com uma margem de erro
de 5’ para mais ou para menos. A estimativa é de que o tempo médio gasto até
chegar ao trabalho fica em algum ponto entre 30’ e 40’. Esta estimativa é um
intervalo de confiança, pois leva em consideração o fato de que os resultados da
amostra irão variar e dá uma indicação de uma variação esperada.
A margem de erro é uma medida

de quão próximo você espera que
seus resultados representem toda a
população que está sendo
estudada. Vários fatores
influenciam a amplitude de um
intervalo de confiança, tais como o
tamanho amostral, a variabilidade da população e o quanto você espera obter de precisão. A maioria dos pesquisadores contenta‐se com 95%
de confiança em seus resultados. Estar 95% confiante indica que se você coletar muitas, mas muitas amostras e calcular o intervalo de
confiança para todas, 95% dessas amostras terão intervalos de confiança que abrangerão o alvo.

Teste de hipótese
Teste de hipótese é um procedimento estatístico em que os dados são coletados e medidos para comprovar uma
alegação feita sobre uma população. Por exemplo, se uma pizzaria alega entregar as pizzas dentro de 30’ a partir
do pedido, você pode testar se essa alegação é verdadeira, coletando uma amostra aleatória do tempo de
entrega durante um determinado período de tempo e observar o tempo médio de entrega para essa amostra.

- 18 -

2

SÉRIES ESTATÍSTICAS

- 19 -
2.1 CONCEITOS E TIPOS DE SÉRIES

As tabelas e gráficos constituem um importante instrumento de análise e interpretação de um conjunto de dados.
Diariamente é possível encontrar tabelas e gráficos nos mais variados veículos de comunicação (jornais, revistas, televisão,
Internet), associadas a assuntos diversos do nosso dia‐a‐dia, como resultados de pesquisas de opinião, saúde e
desenvolvimento humano, economia, esportes, cidadania, etc. A importância das tabelas e dos gráficos está ligada sobretudo à
facilidade e rapidez na absorção e interpretação das informações por parte do leitor e também às inúmeras possibilidades de
ilustração e resumo dos dados apresentados.

TABELAS

São quadros que resumem um conjunto de dados.

Título – conjunto de informações sobre o estudo.
Cabeçalho –especifica o conteúdo das colunas
Coluna indicadora –especifica o conteúdo das linhas
Coluna numérica ‐–especifica a quantidade das linhas
Linhas – retas imaginárias de dados
Célula – espaço destinado a um só número
Rodapé – simplesmente a fonte dos dados

Tipos de Tabelas

SÉRIE HISTÓRICA SÉRIE GEOGRÁFICA SÉRIE ESPECÍFICA
Descreve os valores da variável, Descreve os valores da variável, Descreve os valores da variável,
discriminados por TEMPO (anos, discriminados por REGIÕES (países, discriminados por temas
meses, dias, horas, etc. cidades, bairros, ruas, layout, etc) ESPECIFICOS.

SÉRIE CONJUGADA
É utilizado quando temos a necessidade de apresentar em uma única
tabela a variação de valores DE MAIS DE UMA VARIÁVEL, isto é,
fazer de forma conjugada de duas ou mais séries.

Esta série, por exemplo, é GEOGRÁFICA – HISTÓRICA

- 20 -
GRÁFICOS

A importância dos gráficos está ligada à facilidade e rapidez na absorção e interpretação das informações e
também às inúmeras possibilidades de ilustração e resumo dos dados apresentados. Eis os mais usados:

Gráfico em Linha (para séries históricas)
É a representação dos valores por meio de linhas. Usamos quando precisamos de uma informação rápida de um
valor ao longo do tempo.

ACIDENTES DO TRABALHO
SÃO PAULO: 1989 ‐ 1994

10000
8658 9578
8000 7265
6325 6254
Quantidade
6000

5458
4000

2000

0
1989 1990 1991 1992 1993 1994
Anos
FONTE: Dados fictícios

ACIDENTES DO TRABALHO EM
SÃO PAULO: 1989 ‐ 1991
2500

São Paulo
2000
Guarulhos

Quantidade
1500 Campinas

Osasco
1000 Santos

500

0
1989 1990 1991
FONTE: Dados fictícios anos

Gráfico em Colunas
É a representação dos valores por meio de retângulos, dispostos verticalmente. Utiliza‐se muito quando
necessitamos saber a quantidade de valor.

QUANTIDADE DE ACIDENTES DO TRABALHO
SÃO PAULO: 1989 ‐ 1994
12000
9578
10000
8658
7265
8000
Quantidade
6325 6254
6000 5458
4000
2000

0
1989 1990 1991 1992 1993 1994

FONTE: Dados fictícios Anos

- 21 -
Gráfico em Barras
É o mesmo conceito que o de Colunas, porém utiliza‐se sempre que os dizeres a serem inscritos são extensos.

QUANTIDADE DE ACIDENTES DO TRABALHO
EM SÃO PAULO ‐ POR TIPO ‐ 1989

Corte 598
Queda 3578

Tipo
Atrito 698

Perfuração 55
Impacto 1396

0 1000 2000 3000 4000
Quantidade

Gráfico em Setores
Este gráfico é construído com base em um círculo, e é empregado sempre que desejamos ressaltar a participação
de um dado no total, geralmente na forma de porcentagem.

SÃO PAULO ‐ 1989


Gráfico Polar
É o gráfico ideal para representar séries temporais cíclicas, isto é, séries temporais que apresentam em seu
desenvolvimento determinada periodicidade, por exemplo, o mês de janeiro a dezembro.


SÃO PAULO ‐ 1989

- 22 -
Gráfico de Pareto
É um gráfico de colunas na qual a altura de cada barra representa os dados, porém na ordem de altura
decrescente, com a coluna mais alta posicionada à esquerda. Tal posicionamento ajuda a enfatizar dados
importantes e é frequentemente usado nos negócios.

Os cinco veículos mais vendidos Os cinco veículos mais vendidos
no Brasil em janeiro de 1995 no Brasil em janeiro de 1995
40
Quantidade
Quantidade (milhões)
34
Veículo 30
(milhões) 30
25 22
Ômega 34
20 15
Monza 30
Gol 25 10
Corsa 22
Fusca 15 0
Ômega Monza Gol Corsa Fusca

FONTE: dados fictícios
FONTE: Dados fictícios Veículos

Gráfico de Dispersão
É usado para representar a relação entre duas variáveis quantitativas, por meio de pontos e linhas. Aprendemos a
utilizar esse gráfico quando estudamos “Correlação e Regressão”.

Investimentos versus vendas
no setor da empresa X

Anos Investimentos Vendas
1999 500 1000
2000 1000 2000
2001 1500 3000
2002 2000 4000
FONTE: dados fictícios

Gráfico Cartograma
Este gráfico é empregado quando o objetivo é o de figurar os dados estatísticos diretamente relacionados com
áreas geográficas ou políticas (mapas), corpo humano entre outras figuras.

Número de cada
Delegacia

FONTE: SSP/SP
- 23 -
2.2 DISTRIBUIÇÃO DE FREQUÊNCIA

Frequência absoluta e Histograma

Ao se trabalhar com grandes conjuntos de dados, em geral é útil organizá-los e resumi-los em uma

tabela, chamada Distribuição de frequência.
 Na distribuição de frequência listamos todos os valores coletados, um em cada linha, marcam‐se as vezes em que eles
aparecem, incluindo as repetições, e conta‐se a quantidade de ocorrências de cada valor. Por este motivo, tabelas
que apresentam valores e suas ocorrências denominam‐se distribuição de freqüências.
 O termo “freqüência” indica o número de vezes que um dado aparece numa observação estatística.

EXEMPLO

Um professor organizou os resultados obtidos em uma prova com 25 alunos da seguinte forma:

Notas dos 25 alunos Comentário
4,0 5,0 7,0 9,0 9,0 Agora ele pode fazer uma representação gráfica para analisar o
4,0 5,0 7,0 9,0 9,0 desempenho da turma. Em primeiro lugar, o professor pode fazer uma
4,0 5,0 7,0 9,0 9,0 tabulação dos dados, ou seja, organizá‐los de modo que a consulta a eles
seja simplificada. Então, faremos a distribuição de freqüência destas
4,0 6,0 8,0 9,0 9,0
notas, por meio da contagem de dados.
4,0 6,0 8,0 9,0 9,0

Distribuição de freqüência Comentário
Freqüência, f Esta forma de organizar dados é conhecida como distribuição de
Nota (nº de alunos) frequência, e o número de vezes que um dado aparece é chamado de
4,0 5 frequência absoluta, representado por f. Exemplos:

5,0 3  A frequência absoluta da nota 4,0 é 5.
6,0 2  A freqüência absoluta da nota 9,0 é 10.

7,0 3
O símbolo grego  “sigma” significa “somatório”, muito usado em
8,0 2
Estatística. Portanto, f=25 significa a soma de 5+3+2+3+2+10.
9,0 10
f=25 Representamos a freqüência por um gráfico, chamado Histograma.

HISTOGRAMA Comentário
Quando os dados numéricos são organizados, eles geralmente são
Desempenho dos alunos na prova ordenados do menor para o maior, divididos em grupos de tamanho
12 razoável e, depois, são colocados em gráficos para que se examine sua
Número de alunos
10
10 forma, ou distribuição (no exemplo: 4,0 – 5,0 – 6,0 – 7,0 – 8,0 – 9,0). Este
8 gráfico é chamado de Histograma.

6 5 Um histograma é um gráfico de colunas juntas. Em um histograma não
4 3 3
existem espaços entre as colunas adjacentes, como ocorre em um gráfico
2 2 de colunas. No exemplo, a escala horizontal (→) representa as notas e a
2
escala vertical (↑) as freqüências.
0
4,0 5,0 6,0 7,0 8,0 9,0 O histograma ao lado indica que cinco alunos tiraram a nota 4,0; três alunos tiraram

a nota 5,0; dois alunos tiraram a nota 6,0; três alunos tiraram a nota 7,0; dois alunos
Nota tiraram 8,0 e dez alunos tiraram 9,0.

ESTA FREQUÊNCIA QUE ACABAMOS DE ESTUDAR É DENOMINADA FREQUENCIA
ABSOLUTA (f), QUE É SIMPLESMENTE A CONTAGEM DOS DADOS.

 Em Estatística não trabalhamos somente com frequência absoluta (f), mas também com outros tipos de freqüências,
que são: freqüência relativa (fr), frequência absoluta acumulada (Fa) e frequência relativa acumulada (FRa).

 Estudaremos agora cada uma delas.

- 24 -
Frequência Relativa fr (%)

Conceito. Representado por fr(%), significa a relação existente entre a frequência absoluta f e a soma das freqüências f. É a
porcentagem (%) do número de vezes que cada dado aparece em relação ao total.

EXEMPLO
5
/25 * 100 = 20%.
freqüência relativa fr (%) Comentários aos cálculos
Nota f fr(%) f
A frequência relativa fr(%) é obtida por /f * 100, conforme abaixo:
4,0 5 20%
5
 A fr(%) da nota 4,0 é /25 * 100 = 20%.
5,0 3 12% 3
 A fr(%) da nota 5,0 é /25 * 100 = 12%
6,0 2 8% 2
 A fr(%) da nota 6,0 é /25 * 100 = 8%
7,0 3 12% 3
 A fr(%) da nota 7,0 é /25 * 100 = 12%
8,0 2 8% 2
 A fr(%) da nota 8,0 é /25 * 100 = 8%
9,0 10 40% 10
 A fr(%) da nota 9,0 é /25 * 100 = 40%.
f=25 100%

Frequência Absoluta Acumulada Fa

Conceito. Representado por Fa, significa a soma das freqüências absolutas até o elemento analisado.

EXEMPLO
Fa2=5+3 = 8
frequência absoluta acumulada (Fa) Comentários aos cálculos
Nota f fr(%) Fa A frequência absoluta acumulada Fa é obtida conforme abaixo:
4,0 5 20% 5
 A Fa da nota 4,0 é 5 (sempre repete a primeira).
5,0 3 12% 8
 A Fa das notas 4,0 e 5,0 é 5+3=8.
6,0 2 8% 10  A Fa das notas 4,0, 5,0 e 6,0 é 5+3+2=10.
7,0 3 12% 13  A Fa das notas 4,0, 5,0, 6,0 e 7,0 é 5+3+2+3=13.
8,0 2 8% 15  A Fa das notas 4,0, 5,0, 6,0, 7,0 e 8,0 é 5+3+2+3+2=15.
9,0 10 40% 25  A Fa das notas 4,0, 5,0, 6,0, 7,0, 8,0 e 9,0 é 5+3+2+3+2+10=25

f=25 100% ‐

Frequência Relativa Acumulada FRa (%)

Conceito. Representado por FRa (%), significa a soma das freqüências relativas fr(%) até o elemento analisado.

EXEMPLO
20% + 12% = 32%
frequência relativa acumulada (FRa) Comentários aos cálculos
Nota f fr(%) Fa FRa(%) A frequência relativa acumulada FRa(%) é obtida conforme abaixo:
4,0 5 20% 5 20%
 A FRa(%) de 4,0 é 20% (sempre repete a primeira).
5,0 3 12% 8 32%
 A FRa(%) de 4,0 e 5,0 é 20+12 = 32%
6,0 2 8% 10 40%  A FRa(%) de 4,0, 5,0 e 6,0 é 20+12+8 = 40%
7,0 3 12% 13 52%  A FRa(%) de 4,0, 5,0, 6,0 e 7,0 é 20+12+8+12 = 52%
8,0 2 8% 15 60%  A FRa(%) de 4,0, 5,0, 6,0, 7,0 e 8,0 é 20+12+8+12+8 = 60%
9,0 10 40% 25 100%  A FRa(%) de 4,0, 5,0, 6,0, 7,0, 8,0 e 9,0 é 20+12+8+12+8+40=100%
f=25 100% ‐ ‐

NOTA IMPORTANTE SOBRE DISTRIBUIÇÃO DE FREQUÊNCIA:

Nota f fr(%) Fa FRa(%) Para saber se o desenvolvimento da distribuição de freqüência por completo está
25 100% correto, os valores ao lado, em vermelho, deverão coincidir.
f=25 100% ‐ ‐

- 25 -
Agrupamento em Classes

Em uma distribuição de frequência, ao se trabalhar com grandes conjuntos de dados e com valores
dispersos, podemos agrupá-los em classes.

 Se um conjunto de dados for muito disperso, uma representação melhor seria através do agrupamento dos dados
com a construção de classes de frequência. Caso isso não ocorresse, a tabela ficaria muito extensa. Veja abaixo:

EXEMPLO

Um radar instalado na Dutra registrou a velocidade (em Km/h) de 40 veículos, indicadas abaixo:

Velocidade de 40 veículos (Km/h) Distribuição de frequência com classes
Limite Limite
70 90 100 110 123 inferior i Velocidade (Km/h) f superior
71 93 102 115 123 1 70  80 4
73 95 103 115 123 Classes 2 80  90 4
76 97 105 115 123 3 90  100 8
80 97 105 117 124 4 100  110 8
81 97 109 117 124 5 6
110  120
83 99 109 121 128
6 120  130 10
86 99 109 121 128
f=40

Distribuição de frequência
A distribuição em ”classes” é como se fosse uma compressão dos dados. Imagine se
Nota f fizéssemos uma distribuição de frequência de todas velocidades (de 70 a 128). A tabela

70 1 ficaria imensa! Por este motivo existe a distribuição de frequência com classes.

71 1 Como criar uma Distribuição de Freqüência com classes

73 1
1. Calcule a quantidade de classes (i), pela raiz da quantidade de dados. São
76 1
40 veículos. Então, 40 = 6,3  i = 6 classes.

80 1

81 1 2. Calcule a amplitude de classe (h) que é o tamanho da classe, sendo:

83 1 Maior valor – Menor valor = 128 – 70 = 9,6  h=10
86 1 quantidade de classes (i) 6
90 1
Nota: o Maior valor (128) e o Menor valor (70) são obtidos da lista dos registros das
93 1 velocidades dos 40 veículos.

95 1

3. Montar as classes a partir do Menor valor (70), somando com a
97 3 amplitude de classe (10) até que se chegue na 6ª classe, assim:

99 2
100 1 i Velocidade (Km/h)

1 70 +10 80
102 1
2... 80 +10 90
103 1
...6 120 +10 130
105 2

109 3 TIPOS DE INTERVALOS DE CLASSE
110 1

Tipo Representação Dados do intervalo
115 3
Aberto 70  80 70, 71, 72, 73, 74, 75, 76, 77, 78, 79, 80
117 2
Fechado à esquerda 70  80 70, 71, 72, 73, 74, 75, 76, 77, 78, 79, 80

121 2 Fechado 70  80 70, 71, 72, 73, 74, 75, 76, 77, 78, 79, 80
Fechado à direita 70  80 70, 71, 72, 73, 74, 75, 76, 77, 78, 79, 80

123 4
124 2 No Brasil usa‐se o intervalo  (Resolução 866/66 do IBGE). Já na literatura estrangeira

utiliza‐se comumente com intervalo fechado.
128 2
CONCEITOS IMPORTANTES

f=40
LIMITES DE CLASSE ‐ São os valores extremos de cada classe. No exemplo 70  80,
temos que o limite inferior é 70 e o limite superior 80.
É fácil ver que a distribuição de frequências
diretamente obtida a partir desses dados é AMPLITUDE TOTAL DA DISTRIBUIÇÃO (AT) – É a diferença entre o limite superior da
dada uma tabela razoavelmente extensa. última classe e o limite inferior da primeira classe, no exemplo 130 – 70 = 60.

AMPLITUDE AMOSTRAL (AA) – É a diferença entre o valor máximo e o valor mínimo
da amostra, no exemplo 128 – 70 = 58.

- 26 -
Abaixo vemos as distribuições de frequências absoluta f, relativa fr(%), absoluta acumulada Fa e relativa acumulada FRa(%),
bem como o Histograma desta distribuição.

Distribuição de freqüência com classes f, fr(%), Fa e FRa (%)
Resultados dos registros
12 de um radar

Quantidade de veículos
10
i Velocidade (Km/h) f Fr(%) Fa FRa(%) 10
1 70  80 4 10% 4 10% 8 8
8
2 80  90 4 10% 8 20% 6
3 90  100 8 20% 16 40% 6
4 4
4 100  110 8 20% 24 60% 4
5 110  120 6 15% 30 75%
2
6 120  130 10 25% 40 100%
0
f=40 100%
70 80 90 100 110 120 130

Velocidade (Km/h)

OUTRAS REPRESENTAÇÕES GRÁFICAS DE UMA DISTRIBUIÇÃO DE FREQUÊNCIA

Polígono de frequência – É um gráfico em linha que representa os pontos centrais dos intervalos de classe.

Para construir este gráfico, você deve calcular o ponto central de classe (xi), que é o ponto que divide o intervalo de classe em
duas partes iguais. Por exemplo, a velocidade dos veículos da 1ª classe pode ser representada por 70 + 80 = 75Km/h
2

i Velocidade (Km/h) f xi
12 de um radar
1 70  80 4 75
10
2 80  90 4 85
Ponto central
3 90  100 8 95 8

75Km/h
4 100  110 8 105 6
6 115
5 110  120
4
6 120  130 10 125
70  80
 2
f=40
0
A construção de um polígono de frequências é muito simples. Primeiro, 70 75 80 85 90 95 100 105 110 115 120 125 130

construímos um histograma; depois marcamos no “telhado” de cada
Velocidade (Km/h)
coluna o ponto central e unimos sequencialmente esses pontos.

Ogiva – (pronuncia‐se o’jiva). Conhecida também por polígono de frequência acumulada. É um gráfico em linha que
representa as freqüências acumuladas (Fa), levantada nos pontos correspondentes aos limites superiores dos intervalos de
classe. Para construí‐la, você deve elaborar o histograma de freqüência f em uma escala menor, considerando o último valor a
freqüência acumulada da última classe, no caso, 40.

40 40
i Velocidade (Km/h) f Fa de um radar
35
1 70  80 4 4 30

30
2 80  90 4 8 24
25
3 90  100 8 16 20 16
4 100  110 8 24
15
5 110  120 6 30 8 8 8 10
10 6
6 120  130 10 40 4 4 4
5
f=40
0
70 80 90 100 110 120 130
Velocidade (Km/h)

Sumário
- 27 -

3

MEDIDAS RESUMO
O que dizer se um professor quer saber sobre as notas dos 110 alunos de uma disciplina? Poderíamos, talvez,
utilizar para resposta uma tabela com as frequências das notas. Porém, o professor gostaria de uma resposta
rápida, que sintetize a informação que se tem, e não uma distribuição de frequência das notas coletadas.

Para resumir a quantidade de informação contida em um conjunto de dados, utilizamos, em estatística, medidas
que descrevem, POR MEIO DE UM SÓ NÚMERO, características desses dados. Veja exemplo abaixo.

NOTAS DE ESTATÍSTICA DE 110 ALUNOS DA ESCOLA A
5.6 8.3 4.5 8.7 3.9 9 5.5 7.9 9.5 10
9.6 6.6 5.3 3 9.5 3.9 9 5.6 7 5.9
7 8.9 2 8.7 9 3 8 6.7 4.2 6.5
6.5 4.6 9.5 5.3 3.9 9 3 8.8 9 8.9
7.1 6.5 3.9 4.9 9.4 5.3 9.5 2 5.3 7.5
9.2 9.8 9.5 5.9 5.5 5 7 8.3 5.6 9
6.1 5.6 4.9 6.5 9 9.6 7.5 7 9 4.5
4.2 8.9 9.6 9.8 8 6.5 7.9 2 5 5.3
7.3 8 9 5.6 1 9.8 4 9.5 3.6 5
8.6 4.2 9.6 8.9 5.9 4.2 6 5.3 8 2.8
9.2 9 9.8 3.9 8 9.5 3.3 8.4 5.3 4.5

Para uma conclusão rápida, qual foi o desempenho desses alunos? Isto pode ser respondido com as medidas abaixo.

Medidas resumo Valor Interpretação

Média 6,5 Valor que representa o ponto de equilíbrio das notas (como uma gangorra).
Mediana 7,0 50% dos alunos tiraram abaixo de 7,0.
Moda 9,0 Nota que mais se repetiu.
Desvio padrão ‐ DP 2,3 A maioria das notas está variando entre ±2,3 em torno da média 6,5 (4,2‐‐‐‐8,8)
Coeficiente variação 34% Há variação de 34% das notas em torno da média (complementa o DP).
1º Quartil 5,0 25% dos alunos tiraram abaixo de 5,0.
3º Quartil 9,0 75% dos alunos tiraram abaixo de 9,0.

Através dessas informações é possível analisar o desempenho desses alunos.

- 28 -
3.1 MEDIDAS DE POSIÇÃO

São medidas que utilizamos para obter um número que represente o valor central de um conjunto de dados. As Medidas de
Tendência Central mais utilizadas são: Média, Mediana e Moda.

MÉDIA

MÉDIA SIMPLES - É uma medida que representa um valor típico ou normal num conjunto de dados.

 A média simples serve como um “ponto de equilíbrio” em um conjunto de dados (como o ponto de apoio de uma
gangorra). Cada dado tem igual importância e peso. Sofre a influência de todos os dados.

A Média simples é obtida pela seguinte equação:
x = x → soma dos valores dos dados A Média é representada por x

n → quantidade de dados (lê‐se “x barra”)

EXEMPLO. Supondo que uma escola adote como critério de aprovação a Média 7,0 e, considerando as quatro
notas de João e Maria durante o ano, informe se foram aprovados.

Média das notas de João
Notas de João: 3,5 | 6,0 | 9,5 | 9,0 | 10.0 9.5 9.0

8.0 7,0 Média de João
x = x 3,5 + 6,0 + 9,5 + 9,0 6.0
Notas
6.0
n 4
4.0 3.5

x = 7,0 → aprovado 2.0
0.0
1º Bim 2º Bim Média 3º Bim 4º Bim
Bimestres
MÉDIA PONDERADA. Semelhante a Média simples, porém, atribuindo-se a cada dado um peso que
retrate a sua importância.

 O termo “ponderação” é sinônimo de peso, importância, relevância. Sugere, então, a atribuição de um peso a um determinado dado.
Em alguns casos, os valores variam em grau de importância, de modo que podemos querer ponderá‐los apropriadamente. É calculada
multiplicando‐se um peso por cada valor, fazendo com que alguns valores influenciem mais fortemente a média do que outros.

A Média ponderada é obtida pela seguinte equação: Vamos representar a

Média ponderada por
xp = (x . p) → soma dos valores . pesos
xp
 p → soma
dos pesos

EXEMPLO Supondo que uma escola adote como critério de aprovação a Média 7,0, sendo que as provas bimestrais
são ponderadas com pesos 1, 2, 3 e 4, respectivamente para o 1º bim, 2º bim, 3º bim e 4º bim. Considerando as
notas de João (na ordem bimestral crescente), informe se foi aprovado.
Notas de João: | 9,0 | 8,0 | 6,0 | 5,0 Média ponderada das notas de João

10,0 9,0
x p = (x . p) 8,0
8,0
Notas e pesos
 p 6,3 Média ponderada

6,0
6,0 5,0
xp = (9,0 . 1) + (8,0 . 2) + (6,0 . 3) + (5,0 . 4) 4,0
1+2+3+4 4
2,0 3

1 2
x p = 6,3 → reprovado 0,0
1º Bim 2º Bim Média 3º Bim 4º Bim
Nota. Em uma média simples ele seria aprovado por 7,0. Bimestres

A atribuição de pesos visa fazer com que certos valores tenham mais influência no resultado do que outros. Também pode ser
aplicado em cálculos de índices de inflação, atribuindo pesos para setor de vestuário, alimentação, etc.
- 29 -
MÉDIA DE DISTRIBUIÇÃO DE FREQUÊNCIA – aplica-se quando não se tem a lista original dos dados
Quando trabalhamos com uma distribuição de frequência, não sabemos os valores exatos que caem em
determinada classe. Para tornar possíveis os cálculos, consideramos que, em cada classe, todos os valores
amostrais sejam iguais ao ponto central de classe. Por exemplo, considere o intervalo de classe 70  80, com
uma frequência de 4. Admitimos que todos os 4 valores sejam iguais a 75 (o ponto central de classe). Com o total
de 75 repetido 4 vezes, temos um total de 75 x 4 = 300. Podemos, então, somar esses produtos obtidos de cada
classe para encontrar o total de todos os valores, os quais, então, dividimos pela quantidade de dados.

É importante salientar que a distribuição de frequência resulta em uma aproximação da média
porque não se baseia na lista original exata dos valores amostrais.

CALCULANDO A MÉDIA DE DISTRIBUIÇÃO DE FREQUÊNCIA COM INTERVALO DE CLASSE
Ponto central de classe

Procedimento:
i Velocidade (Km/h) f x f . x
1. Multiplicar as frequências f pelos pontos centrais
1 70  80 4 x =
75 300 de classe x e adicionar os produtos.
2 80  90 4 85 340 2. Somar as frequências f;
3 90  100 8 95 760 3. Somar os produtos (f.x);
4 100  110 8 105 840 4. Aplicar a fórmula abaixo:

5 110  120 6 115 690
6 120  130 10 125 1250 x = (f.x) → 4180 = 104,5 Km/h
f 40
f=40 ‐ (f.x) = 4180

Média a partir de um HISTOGRAMA COM INTERVALOS DE CLASSE:

R e s u lta d o s d o s re g is tro s d e u m ra d a r Não é necessário montar tabela. Veja na figura ao lado

12
10 que basta multiplicar a freqüência pelo ponto médio e

10
(4*75)+(4*85) ... adicionar os produtos. Depois, divida pela soma das
8 8
8 freqüências.
6
6
+ (4*75)+(4*85)+(8*95)+(8*105)+(6*115)+(10*125)
4 4
4
4+4+8+8+6+10
2 x x
0 x = (f.x) → 4180 = 104,5 Km/h
75 85 95 105 115 125
70 80 90 100 110 120 130

f 40
Velocidade (Km/h)

CALCULANDO A MÉDIA DE DISTRIBUIÇÃO DE FREQUÊNCIA SEM INTERVALO DE CLASSE

Nota (x) f f . x Quando a distribuição não tem agrupamento de classes,

(nº de alunos) consideraremos as frequências como sendo os pesos
4,0 5
X = 20 dos elementos correspondentes:
5,0 3 15
6,0 2 12 (5*4,0)+(3*5,0)+(2*6,0)+(3*7,0)+(2*8,0)+(10*9,0)
7,0 3 21 5+3+2+3+2+10
8,0 2 16
9,0 10 90 x =(f.x) → 174 = 6,96
f=25 (f.x) = 174 f 25

Média a partir de um HISTOGRAMA SEM INTERVALO DE CLASSE Multiplique a freqüência por “x” (notas) e adicione os
produtos. Depois, divida pela soma das freqüências.
Desempenho dos alunos na prova
12 (5*4,0)+(3*5,0)+(2*6,0)+(3*7,0)+(2*8,0)+(10*9,0)
10
Número de
10 5+3+2+3+2+10
alunos
8
6 5
4 3 3
x =(f.x) → 174 = 6,96
2 2
2 x f 25
0
4.0 5.0 6.0 7.0 8.0 9.0
Nota
- 30 -
MEDIANA

Medida que representa o valor que está no MEIO de um conjunto de dados.

Uma desvantagem da média simples é que ela é sensível a qualquer valor, de modo que um valor 0% 50% 100%
excepcional (alto ou baixo) pode afetar drasticamente a média. A Mediana supera grandemente
essa desvantagem, pois não é afetada por valores extremos, de tal modo que você pode utilizar a
mediana quando estão presentes valores extremos. Mediana

Como achar a mediana de um conjunto de dados
Para quantidade ÍMPAR de valores Para quantidade PAR de valores
n
1
n 2

P
P1
 As posições dos termos
2
A Posição do termo central é dada por:   e P2 = a que sucede P1
centrais são dadas por:

Ex.: 12, 78, 69, 75, 80, 71, 82, 73, 785. n=9 Ex.: 12, 78, 69, 75, 80, 71, 82, 73, 785, 995. n=10
1 2
0
9
1

P1
P
 = 5 → 5ª posição  = 5ª posição e P2 = 6ª posição

2


A Md é o valor da 5º posição. Ordenando os dados, temos: A Md é o valor entre a 5º e 6ª posição. Ordenando os dados, temos:

12, 69, 71, 73, 75 ,78, 80, 82, 785 12, 69, 71, 73, 75, 78 80, 82, 785, 995
1ª 2ª 3ª 4ª 5ª 6ª 7ª 8ª 9ª 1ª 2ª 3ª 4ª 5ª 6ª 7ª 8ª 9ª 10ª
Mediana Mediana
7
5
7
8
M
d
A Md é a Média dos dois termos centrais.  = 76,5
2


MEDIANA de uma distribuição de frequência e Histograma SEM INTERVALOS DE CLASSE

Desempenho dos alunos na prova
Nota
f f = n = 25 → ímpar
12
Fa Observações 11
n
1
2
5 2
1

Número de alunos
P
 →  = 13ª 10
2
4,0 4 4 Da 1ª até a 4ª  Fa 13ª

8
5,0 3 7 Da 5ª até a 7ª
6
6,0 2 9 Da 8ª até a 9ª 4
Os dados já estão ordenados. Então a 4 3 3
7,0 3 12 Da 10ª até a 12ª Md é o valor da 13ª posição. Através da 2 2
2
8,0 2 14 Da 13ª até a 14ª Fa fica fácil identificar a posição central:
0
9,0 11 25 Da 15ª até a 25ª Então, a nota Md = 8,0 4.0 5.0 6.0 7.0 8.0 9.0
f=25 Nota Md = 8,0

MEDIANA de uma distribuição de frequência e Histograma COM INTERVALOS DE CLASSE

Acumule Fa e ache a posição da Md n 40
Independente se n é ímpar ou par usa‐se a equação /2. Então, /2 = 20
A Md está na 20ª posição e será algum valor da classe mediana 100  110. A
i Velocidades f Fa partir da equação abaixo podemos achar uma aproximação da Md.

1 70  80 4 4
n  Resolvendo a equação, temos:
 2 ‐ Fa ant  * h

2 80  90 4 8
3 90  100 8 16 Md  l inf     40 

 2 ‐ 16 * 10

4 100  110 8 24 20ª f

Md  100 
5 110  120 6 30 l inf = limite inferior da classe mediana 8
6 120  130 10 40 Faant = Fa da classe anterior
h = amplitude do intervalo de classe
f=40 f = freqüência da classe mediana
Md = 105 Km/h, aproximadamente

Resultados dos registros O total das frequências é 40. Então, a Md será 40/2 = 20ª posição. Observe
12 de um radar Fa pelo Fa que a classe mediana é 100  110. Também é possível
10
10 Fa ant = 16 20ª determinar l inf, Fa ant, h e f. Então, aplicando a equação, temos:
8 8 8
(4+4+8)
f = 8 6  40 
6  2 ‐ 16 * 10
4
4 4
Md  100  = 105 km/h, aproximadamente
2
← h → 8
10
l inf
0
70 80 90 100 110 120 130

Velocidade (Km/h)
- 31 -
NOTA SOBRE A MEDIANA. A mediana é menos utilizada do que a média simples. A mediana pode ser aplicada quando existem valores

discrepantes em um conjunto de dados. Por exemplo, se a renda per capita de sete famílias fosse: $240; $370; $410; $520; $630; $680 e $820,
a mediana seria $520 e a média $524. Essas duas medidas poderiam representar este conjunto de dados. Mas se a renda de sete famílias fosse:
$240; $370; $410; $520; $630; $680 e $10.000, o valor da mediana manter‐se‐ia o mesmo, enquanto a média simples passaria a ser $1.836,
pois foi influenciada pelo valor discrepante ($10.000), que não é uma medida ideal para representar este conjunto de dados. A medida ideal
seria a mediana. Note que os valores discrepantes tem, pois, muito menor influência sobre a mediana do que sobre a média.

Em relação à mediana na distribuição de freqüência com intervalos de classe, admite‐se que as velocidades dos veículos se distribuem
40
continuamente. Nesse caso, a mediana é a velocidade para o qual a metade da freqüência total /2 = 20 fica situada abaixo e a outra acima
dele. Ora, a soma das três primeiras freqüências de classe é 4+4+8 = 16. Então, para obter a 20ª velocidade desejada, são necessários mais 4
4
dos 8 casos existentes na 4ª classe. Como o quarto intervalo de classe, 100  110, a mediana situa‐se a 4/8 de distância, e é: 100 + /8 (110 –
100) = 105 km/h. Com a equação fica mais fácil encontrar a mediana pois não exige este tipo de raciocínio.

MODA
Medida que representa o valor que mais se REPETE em um conjunto de dados.
Na linguagem coloquial, moda é algo que está em evidência, ou seja, algo que se vê bastante! Em estatística a moda é o valor que detém
o maior número de observações, ou seja, o valor ou valores mais frequentes em uma série de dados. A moda não é necessariamente
única, ao contrário da média simples ou da mediana. É especialmente útil quando os valores ou observações não são numéricos, uma vez
que a média e a mediana podem não ser bem definidas.

A série {1, 3, 5, 5, 5, 6, 6, 7} apresenta moda = 5, pois é o número que mais se repete.
Exemplos: A série {1, 3, 5, 5, 6, 6, 7, 8} apresenta duas modas (Bimodal): 5 e 6, pois são os que mais se repetem.
A série {1, 3, 5, 5, 6, 6, 7, 7} apresenta mais do que duas modas (Polimodal): 5, 6 e 7
A série {1, 3, 2, 5, 8, 7, 9, 10} não apresenta moda = amodal, pois nenhum número se repete.

MODA de uma distribuição de freqüência e Histograma SEM INTERVALOS DE CLASSE

Notas dos alunos Desempenho dos alunos na prova
4,0 5,0 8,0 9,0 f
Nota 12
(nº de alunos)
Número de alunos
4,0 6,0 9,0 9,0 10 Moda

4,0 5 10
4,0 6,0 9,0 9,0 Nota
4,0 7,0 9,0 9,0 5,0 3 8
9,0
4,0 7,0 9,0 6,0 2 6 5
5,0 7,0 9,0 7,0 3 4 3 3
5,0 8,0 9,0 8,0 2 2 2
2
9,0 10
A Moda será a nota 9,0, pois é 0
f=25
a que mais se repete no 4,0 5,0 6,0 7,0 8,0 9,0
conjunto de dados Nota

MODA de uma distribuição de frequência e Histograma COM INTERVALOS DE CLASSE
120+130 = 125Km/h
a) Moda Bruta 2
A Moda Bruta será o ponto 12 de um radar
f médio de classe modal, que é a 10

i Velocidade (Km/h) 10
classe que apresenta a maior 8
4 8
1 70  80 8
frequência. Então: 6
2 80  90 4

6
3 90  100 8 Mo = 120 + 130 = 125Km/h 4 4
4
4 100  110 8 2
2
5 110  120 6
0
6 120  130 10
Classe modal (tem maior frequência)
f=40 70 80 90 100 110 120 130

Velocidade (Km/h)

NOTAS SOBRE A MODA. Na distribuição de freqüência em classes, o método utilizado para encontrar a moda por meio do ponto médio

de classe é chamado de moda bruta, e é apenas uma aproximação pois não foi baseada na lista original de dados. Existem outros métodos para
encontrar a Moda de uma distribuição de freqüência com intervalo de classe: Método de Czuber, Método de King e Método de Pearson,
normalmente exigidos em concursos públicos.

- 32 -

b) Moda de czuber

  limite inferior da classe modal f* = frequência da classe modal
D1 f(ant) = frequência da classe anterior à classe modal
Mo Czuber    *h D1 = f* – f(ant)
D1  D 2 D2 = f* – f(post) f(post) = frequência da classe posterior à classe modal
h = amplitude da classe modal

Exemplo de cálculo da Moda de Czuber (pela Distribuição de Freqüência e pelo Histograma)
Registro das velocidades de

veículos em uma rodovia Resultados dos registros
12 de um radar
f*
i Velocidade (Km/h) f
10

1 70  80 4 10
8 8 f(ant) f(post)
2 80  90 4 8
3 90  100 8 6
6
4 100  110 8 4 4
4
5 110  120 6
2
h*
6 120  130 10
Classe modal

(tem maior frequência)
f=40 0
Classe
70 80 90 100 110 120 130 modal

Velocidade (Km/h)

(10 - 6)

D1 4
Mo  l  * h → Mo  120  * 10 Mo  122,85
D1  D 2 4  10
(10 - 6) (10 - 0)

Nota: Como não existe frequência simples da classe posterior à classe modal, então f‐ f(post) = 10 ‐ 0.
- FUNDAMENTOS DA EQUAÇÃO DE CZUBER –

Pode‐se determinar graficamente a posição da Moda no histograma representativo de uma distribuição de frequências. O
método descrito abaixo é o equivalente geométrico da equação de Czuber.
1º ‐ A partir dos vértices superiores do retângulo correspondente à classe modal (A e B), traçamos os seguimentos concorrentes
AC e BD, ligando cada um deles ao vértice superior adjacente do retângulo correspondente a uma classe vizinha, conforme
ilustrado na figura acima.
2º ‐ A partir da interseção dos segmentos AC e BD, baixamos uma perpendicular ao eixo horizontal, determinando o ponto que
indica a Moda, que é 122,85.
- 33 -
RELAÇÃO ENTRE MÉDIA, MEDIANA E MODA.

Pelo formato da distribuição dos dados, sempre existirá uma relação empírica (baseado na experiência) entre a
média, mediana e a moda. Através dessa relação podemos saber, aproximadamente, onde se encontram essas
medidas, sem necessidade de cálculos.

Quando a Média, Mediana e Moda se coincidem, chamamos a distribuição dos dados de Simétrica ou Normal.

Média = mediana = moda SIMÉTRICA ou NORMAL ou FORMA DE SINO

Quando a distribuição tem a forma de sino (linha tracejada), a
quantidade de dados vai aumentando, atinge um pico, e depois
10 Média diminui. Se dividíssemos em duas metades, a partir do centro,
de um radar
Mediana note que os dois lados seriam iguais. O calculo abaixo confirma a
8 7 Moda afirmativa que numa distribuição normal a média, mediana e

moda se coincidem.
6

4 4
4 3 3 Média = 70(3) + 80(4) + 90(7) + 100(4) + 110(3) = 90 Km/h
3+4+7+4+3
2

0 Mediana = 90 Km/h
70 80 90 100 110 90=90=90

Velocidade (Km/h)
Moda = 90 Km/h

Quando a Média, Mediana e Moda não se coincidem, chamamos a distribuição dos dados de assimétrica.

Média < mediana < moda Assimétrica à esquerda (ou negativa)
Resultados dos registros Neste tipo de distribuição, a média, mediana e a moda estarão
12 de um radar Mediana aproximadamente conforme gráfico ao lado. A média será menor
que a mediana e a moda. O cálculo abaixo confirma a afirmativa:
10 9 Moda
Média
8 Média = 70(1) + 80(3) + 90(6) + 100(9) + 110(2) = 94 Km/h
6
6 1+3+6+9+2

4 3
Mediana = 100 Km/h
2
2 1 Me Md Mo
0
94 < 100 ≤ 100
70 80 90 100 110 Moda = 100 Km/h
Velocidade (Km/h)

Média > mediana > moda Assimétrica à direita (ou positiva)
Neste tipo de distribuição, a média, mediana e a moda estarão
Resultados dos registros aproximadamente conforme gráfico ao lado. A média será maior
12 que a mediana e a moda. O cálculo abaixo confirma a afirmativa:
de um radar

10 Mediana 9 Média
Média = 70(2) + 80(9) + 90(6) + 100(3) + 110(1) = 86Km/h
Moda
8 2+9+6+3+1
6
6
Mediana = 80 Km/h
4 3
Me Mo Md
2
2 1 86 > 80 ≥ 80
0
Moda = 80 Km/h
70 80 90 100 110
Velocidade (Km/h)
- 34 -

3.2 MEDIDAS DE ORDENAMENTO (ou separatrizes).
São medidas que "separam" o conjunto de dados em um certo número de partes iguais.
As medidas usadas são a Mediana, o Quartil, Decil e o Percentil. A mediana já conhecemos. Estudaremos as outras medidas.
QUARTIL (4 PARTES) 0% 25% 50% 75% 100%
Divide um conjunto de dados em quatro |----------|---------|----------|---------|
partes iguais. Precisamos, portanto, de 3 Q1 Q2 Q3

2º quartil 3º quartil
quartis (Q1 , Q2 e Q3 ) para dividir a série 1º quartil
Coincide com a deixa 75% dos dados
deixa 25% dos dados
em quatro partes iguais. abaixo dele. mediana. abaixo dele.

O método mais prático é utilizar o princípio do cálculo da mediana para os 3 quartis. Na realidade serão calculadas "3
medianas" em uma mesma série.

Determine Q1, Q2 e Q3. dos salários de 9 empregados da uma empresa, abaixo
1º 2º Q1 3º 4º 5º 6º 7º Q3 8º 9º
$500 $550 | $600 $650 $700 $750 $800 | $850 $900
$575 Q2 $825
Q1 será a média da 2ª e 3ª posição Md Q3 será a média da 7ª e 8ª posição

QUARTIL de uma distribuição de freqüência SEM INTERVALOS DE CLASSE n
1
4
5 4
1

i Velocidades f Fa 1º quartil Q1 =  =  = 11,5 ≈ 12ª posição = 95Km/h

4
1 85 4 4
2 90 4 8 Interpretação: 25% dos veículos tiveram velocidades abaixo de 95 Km/h
← 1º quartil
3 95 8 16
3
4 4
5
1

3
n 4
1
) =( ) = 34,5 ≈ 35ª posição =110Km/h
4 100 8 24
3º quartil Q3 = (
5 105 6 30
6 110 15 45 ← 3º quartil
Interpretação: 75% dos veículos tiveram velocidades abaixo de 110 Km/h
f=45

QUARTIL de uma distribuição de freqüência COM INTERVALOS DE CLASSE

Usa‐se a mesma técnica do cálculo da i Velocidades f Fa

mediana, bastando adaptar a sua equação,
1 70  80 4 4
conforme mostrado abaixo.
2 80  90 4 8

1º quartil 3º quartil 3 90  100 8 16 ← 1º quartil
n 2
n 4
n 2
3 4
n
4 100  110 8 24
por por
5 110  120 6 30 ← 3º quartil
6 120  130 10 40
Acumule Fa e ache as posições Q1 e Q3. f=40

1º quartil Q1 3º quartil Q3

Independente se n é ímpar ou par usa‐se somente a Independente se n é ímpar ou par usa‐se somente a
n 40 3n 3*40
equação /4. Então, /4 = 10. O Q1 está na 10ª posição equação /4. Então, /4 = 30. O Q3 está na 30ª
e será algum valor da classe Q1 90  100. Logo: posição e será algum valor da classe Q3 110  120. Logo:

n  Resolvendo a equação:  3n  Resolvendo a equação:
 4 ‐ Fa ant * h  4 ‐ Fa ant * h
   
Q1  l inf   40  Q3  l inf  3*40 
f  4 ‐ 8 *10 f
 4 ‐ 24 *10
   
l inf = limite inferior da classe Q1 Q1  90  l inf = limite inferior classe Q3
Q3  110 
Faant = Fa da classe anterior 8 Faant = Fa da classe anterior 6
H = amplitude intervalo classe h = amplitude intervalo classe
Q1 = 92,5 Km/h Q3 = 120 Km/h
f = freqüência da classe Q1 f = freqüência da classe Q3

Interpretação: aproximadamente 25% dos veículos registrados Interpretação: aproximadamente 75% dos veículos registrados
tiveram velocidades abaixo de 92,5 Km/h tiveram velocidades abaixo de 120 Km/h
- 35 -
DECIL (10 PARTES) 0% 10% 20% 30% 40% 50% 60% 70% 80% 90% 100%

Divide um conjunto de dados em dez partes |---|---|---|---|---|---|---|---|---|---|
iguais, como mostrado ao lado. D1 D2 D3 D4 D5 D6 D7 D8 D9
Coincide com a mediana.

DECIL de uma distribuição de freqüência i Velocidades f Fa

Usa‐se a mesma técnica do cálculo da mediana, 1 70  80 4 4

bastando adaptar a sua equação, conforme abaixo: 2 80  90 4 8
3 90  100 8 16 ← Classe D3
n 2
D 1
n 0
por
D = decil procurado 4 100  110 8 24
n = quantidade de dados
5 110  120 6 30

6 120  130 10 40 ← Classe D8
Acumule Fa e ache as posições.
f=40

Ache o 3º Decil (D3) da distribuição de frequência Ache o 8º Decil (D8) da distribuição de frequência

Dn 3*40 Dn 8*40
Usando /10 temos /10 = 12. O D3 está na 12ª Usando a equação /10 temos /10 = 32. O D8 está na
posição e será algum valor da classe D3 90  100: 32ª posição e será algum valor da classe D8 120  130:

 Dn  Resolvendo a equação:  Dn  Resolvendo a equação:
 10 ‐ Fa ant * h  10 ‐ Fa ant * h
   
D3  l inf  3* 40  D8  l inf  8*40 
f  10 ‐ 8 *10 f  10 ‐ 30 *10

l inf = limite inferior da classe D4
D3  90  
l inf = limite inferior da classe D8 D8  120 
 
8 10
Faant = Fa da classe anterior Faant = Fa da classe anterior
h = amplitude intervalo classe D3 = 95 Km/h h = amplitude intervalo classe D8 = 122 Km/h
f = freqüência da classe D4 f = freqüência da classe D8

tiveram velocidades abaixo de 95 Km/h tiveram velocidades abaixo de 122 Km/h.

PERCENTIL (100 PARTES) 0% 5% 10% ... 17% ... 33% ... 42% 50% 57% 63% 70% 80% 93% 100%
Divide um conjunto de dados em cem |-|-|---|---|---|---|--|--|--|---|---|---|
partes iguais, como mostrado ao lado. P5 P1 0 P17 P33 P42 P50 P57 P63 P70 P80 P93

PERCENTIL de uma distribuição de freqüência i Velocidades f Fa

Usa‐se a mesma técnica do cálculo da mediana, 1 70  80 4 4

bastando adaptar a sua equação, conforme abaixo. 2 80  90 4 8
n 2
P 1
n 0
3 90  100 8 16 ← Classe P27

por P = percentil procurado
0
n = quantidade de dados 4 100  110 8 24

5 110  120 6 30 ← Classe P72

Acumule Fa e ache as posições. 6 120  130 10 40
f=40

Ache o 27º Percentil (P27) da distribuição de frequência Ache o 72º Percentil (P72) da distribuição de frequência

Pn 27*40 Pn 72*40
Usando /100 temos /100 = 10,8 ≈ 11. O P27 está na Usando /100 temos /100 = 28,8 ≈ 29. O P72 está na
11ª posição e será algum valor da classe P27 90  100: 29ª posição e será algum valor da classe P29 110  120:

 Pn  Resolvendo a equação:  Pn  Resolvendo a equação:
 100 ‐ Fa ant * h  100 ‐ Fa ant * h
P27  l inf     
27* 40  P72  l inf  72* 40 
f  100 ‐ 8 * 10 f  100 ‐ 24 *10
P27  90   
D8  110   

l inf = limite inferior classe P27 8 l inf = limite inferior classe P72 6
Faant = Fa da classe anterior Faant = Fa da classe anterior
h = amplitude intervalo classe P27 = 93,5 Km/h h = amplitude intervalo classe P72 = 118 Km/h
f = freqüência da classe P27 f = freqüência da classe P72

tiveram velocidades abaixo de 93,5 Km/h. tiveram velocidades abaixo de 118 Km/h.
- 36 -
3.3 MEDIDAS DE VARIAÇÃO (OU DISPERSÃO)

INTRODUÇÃO

O termo “variação” sugere tornar vário ou diverso; alterar, diversificar; mudar; ser inconstante; não ser conforme,
discrepar. Na maioria dos casos existirá variação em um conjunto de dados, independente da característica que
você esteja medindo, pois nem todos os indivíduos terão o mesmo exato valor para todas as variáveis.
EXEMPLO

Durante o ano letivo a Média das notas de João, Mário, Maria e José foi 7,0. Se considerarmos apenas a
Média, não notaremos qualquer diferença entre os quatro alunos. No entanto, observa‐se que as notas são
muito diferentes em relação a Média. Há variação de notas e, no caso de João e José, é bem discrepante:

Grande variação
Média das notas de João a partir da Média Média das notas de Mário Sem variação a
10,0 9,5 10,0 partir da Média
9,0

8,0 7,0 8,0 7,0 7,0 7,0 7,0 7,0
6,0
Notas
Notas
6,0 6,0
4,0 3,5 4,0

2,0 2,0
0,0 0,0
1º Bim 2º Bim Média 3º Bim 4º Bim 1º Bim 2º Bim Média 3º Bim 4º Bim
Bimestres
Bimestres
Pequena variação a Grande variação a

Média das notas de Maria
partir da Média Média das notas de José partir da Média
10,0 10,0 9,5
8,5
8,0 7,0 7,5 7,5 8,0 7,0
6,5 6,5
6,0
Notas
Notas
6,0 6,0
4,0
4,0 4,0
2,0 2,0
0,0 0,0
1º Bim 2º Bim Média 3º Bim 4º Bim 1º Bim 2º Bim Média 3º Bim 4º Bim
Bimestres Bimestres
Diante deste contexto, podemos questionar: qual o aluno é mais estável? Qual teve melhor
desempenho? Qual o aluno com pior desempenho? Notadamente o aluno de melhor desempenho é o
Mário, pois todas as suas notas foram 7,0 e, portanto, não houve nenhuma variação em relação a Média.
Já José e João tiveram o pior desempenho pois suas notas estiveram muito distantes da Média.

Neste capítulo vamos desenvolver maneiras específicas de realmente medirmos a variação, de modo
que possamos usar números específicos em lugar de julgamento subjetivo.
Outros exemplos de variações:

 Os preços das casas variam de casa para casa, de ano para ano e de estado para estado.
 Os preços de um produto variam de supermercado para supermercado.
 O tempo que você leva para chegar ao trabalho varia dia a dia.
 O tamanho das peças produzidas em uma empresa também varia.
 A renda familiar varia de família para família, de país para país e de ano para ano.
 Os resultados das partidas de futebol, de temporada para temporada, variam.
 As notas que você tira nas provas, não diferente, também variam.
 Seu saldo bancário também varia, podendo ser de hora em hora, dia a dia, mês a mês.

Estudaremos alguns tipos de medidas de variação: variância, desvio padrão e coeficiente de variação.

- 37 -
VARIÂNCIA E DESVIO PADRÃO (amostral)
São medidas que representam “um valor médio de variação” em torno da média.

O desvio padrão é um modo que se usa para medir a variabilidade entre os números em um conjunto de dados. Assim como o termo
sugere, um desvio padrão é um padrão (ou seja, algo típico) de desvio (ou distância) da média. O desvio padrão é uma estatística
importante, mas, frequentemente, é omitida quando os resultados são relatados. Sem ele, você está recebendo apenas uma parte da
história sobre os dados. Os estatísticos gostam de contar a história do homem que estava com um dos pés em um balde de água gelada e
o outro em um balde de água fervendo. O homem dizia que, na média, ele estava se sentindo ótimo! Mas imagine a variabilidade da
temperatura para cada um dos pés. Agora, colocando os pés no chão, o preço médio de uma casa, por exemplo, não lhe diz nada sobre a
variedade de preços de casas com a qual você pode se deparar enquanto estiver procurando uma casa para comprar. A média dos salários
pode não representar o que realmente está se passando em sua empresa se os salários forem extremamente discrepantes.
Entendendo a Variância e o Desvio Padrão Calculando a Variância e o Desvio Padrão
Desvios em torno da Média das notas de João O problema da soma dos desvios foi resolvido pelos
matemáticos: basta elevar cada desvio ao quadrado antes
10,0 9,5 9,0 de somá‐los. Um número ao quadrado é sempre positivo,

portanto a soma não se anula mais, e a média dos desvios ao

+ 2,5 +2,0
8,0
7,0 quadrado pode ser calculada:

6,0 ‐1,0 Notas Média Desvios Desvios elevado ao

Notas
‐3,5 6,0 (x) ( x ) (x ‐ x ) quadrado (x ‐ x )2

4,0 3,5 7,0 ‐3,5 (‐3,5)2 = 12,25
3,5 6,0 7,0 ‐1,0 (‐1,0)2 = 1
2,0 9,5 7,0 2,5 (2,5)2 = 6,25
0,0
9,0 7,0 2,0 (2,0)2 = 4
1º Bim 2º Bim Média 3º Bim 4º Bim n=4 ‐ =0  =23,5
Bimestres
Variância amostral
No gráfico percebemos que o desvio determina o quanto Agora, podemos calcular a média dos quadrados dos
2
cada elemento do conjunto de dados se distancia da desvios, chamada de Variância, representada por S :

média 7,0. No 1º Bim. faltam ‐3,5 para se chegar a Média

2
e no 2º Bim. ‐1,0. Já nos 3º e 4º Bim. temos +2,5 e +2,0 S2 = ( x  x) → 23,5 = 7,8
acima da média, respectivamente. Transpondo essas 4 ‐ 1
informações para uma tabela, temos: n ‐ 1
A divisão por n−1 aparece por fornecer um melhor resultado do
que a divisão por n.
Notas Média Desvios
Desvio padrão amostral
(x) ( x ) (x ‐ x ) Mas, se elevamos os desvios ao quadrado para poder
3,5 7,0 ‐3,5 calcular sua média, não seria correto que agora fizéssemos a
6,0 7,0 ‐1,0 raiz quadrada dessa média, para desfazer a potenciação?
9,5 7,0 2,5 Sim, e o valor dessa raiz é chamado Desvio padrão,
9,0 7,0 2,0 representado por S:

‐ ‐ =0
Desvio padrão → S = 7,8 = 2,8

Interpretação: O desvio padrão indica que a maioria das notas de
Perceba que a soma dos desvios é igual a zero. Esta
João está concentrada dentro dos limites de  2,8 em torno da
característica não é exclusiva deste exemplo. Ela sempre média 7,0. Ou seja, se concentrando entre 4,2 e 9,8:
ocorre e prende‐se ao fato de que a média é o ponto de
equilíbrio em um conjunto de dados. 4,2 ‐2,8 +2,8 9,8

Como os desvios indicam o grau de variação dos valores
7,0

em relação à média, seria interessante poder encontrar
um único número que o representasse. Algo como a
média dos desvios. Mas, para fazer essa média, Equação da Variância e Desvio padrão
precisamos somar os desvios e acabamos de ver que essa Podemos concluir, então, o uso das equações:

soma é sempre igual a zero. da Variância do Desvio padrão


2 2
S = ( x  x )
S = S 2
n ‐ 1

- 38 -
Calculando a Variância e o Desvio padrão das notas de Maria, José e Mário – passo a passo.
Notas de Maria: 6,5 6,5 7,5 7,5
1º Calcular a Média 2º Calcular a Variância 3º Calcular o Desvio padrão

x   x S2 =  ( x  x) 2

S = S2 → 0 , 33

n n 1

x = 6,5+6,5+7,5+7,5 = 7,0 S2 = (6,5 – 7,0)2 + (6,5 – 7,0)2 + (7,5 – 7,0)2 + (7,5 – 7,0)2 = 0,33 S = 0,5
4 4 – 1
Interpretação: O resultado indica que a maioria das notas de Maria 6,5 ‐0,5 +0,5 7,5
está concentrada dentro dos limites de  0,5 em torno da Média
7,0. Ou seja, se concentrando entre 6,5 e 7,5. 7,0
Notas de José: 4,0 9,5 8,5 6,0

x   x S2 =  ( x  x) 2

S = S2 → 6 ,16

n n 1

x = 4,0+9,5+8,5+6,5 = 7,0 S2 = (4,0 – 7,0)2 + (9,5 – 7,0)2 + (8,5 – 7,0)2 + (6,0 – 7,0)2 = 6,16 S = 2,5
4 4 ‐ 1
Interpretação: O resultado indica que a maioria das notas de Maria 4,5 ‐2,5 +2,5 9,5
está concentrada dentro dos limites de  2,5 em torno da Média
7,0. Ou seja, se concentrando entre 4,5 e 9,5. 7,0
Notas de Mário: 7,0 7,0 7,0 7,0

x   x S2 =  ( x  x) 2

S = S2 → S = 0

n n 1

x = 7,0+7,0+7,0+7,0 = 7,0 S2 = (7,0 – 7,0)2 + (7,0 – 7,0)2 + (7,0 – 7,0)2 + (7,0 – 7,0)2 = 0
4 4 ‐ 1
O resultado indica que todas as notas de Mário estão dentro dos limites de  0 em torno da Média 7,0. Ou seja, se
concentrando exatamente na média 7,0. Portanto, sem variação.

NOTAS SOBRE O DESVIO PADRÃO. O desvio padrão é

sempre um valor que está na mesma unidade dos dados originais. desvios
Um desvio padrão pequeno, basicamente, significa que os valores do
conjunto de dados estão, na média, próximos do centro desse
conjunto, enquanto um desvio padrão grande significa que os
valores do conjunto de dados estão, na média, mais afastados do média
centro. Então, quanto mais espalhados ou dispersos forem os dados,
maior será o desvio padrão e, quanto mais concentrados ou
homogêneos forem os dados, menor será o desvio padrão. Se os
valores forem iguais, ou seja, sem variação, o desvio padrão será Desvio padrão
zero.

Um desvio padrão pequeno pode ser um bom objetivo em
determinadas situações, onde os resultados são restritos, como exemplo, na produção e no controle de qualidade de uma indústria. Uma
determinada peça de carro que deve ter centímetros de diâmetro para encaixar perfeitamente não pode apresentar um desvio padrão grande,
nesse caso, significaria que acabariam sendo jogadas fora, pois ou não se encaixariam adequadamente ou os carros teriam problemas.

Observe que o desvio padrão das notas de João indica que estão concentradas dentro dos limites de  2,8 em torno da média 7,0. Ou seja, se
concentrando entre 4,2 e 9,8. Isto representa um desvio padrão grande.
- 39 -
COEFICIENTE DE VARIAÇÃO - CV
É a medida relativa de variação que é sempre expressa sob a forma de porcentagem (%).
Em algumas situações, podemos estar interessados em uma estatística que indique qual é o tamanho do desvio padrão em relação à
média. A melhor forma de representá‐la é através do coeficiente de variação por ser expressa na forma de porcentagem.
O coeficiente de variação, representado Exemplo: Considerando a Média 7,0 de João com Desvio padrão de 2,8,

por Cv, é calculado da seguinte maneira: temos:

Cv = S x 100 Cv = 2,8 x 100 → 40%
Cv = S x 100
x 7,0
x

O resultado indica que a Média 7,0 de João teve um Desvio padrão em
Ou seja: Cv = Desvio padrão x 100
torno de 40%.
Média
Fazendo a Distribuição de Variabilidade das notas de João, Maria, José e Mário, temos:
Alunos Média ( x ) Desvio padrão (S) Cv (%) Cálculo do Cv (%) Assim, podemos concluir que o

João 7,0 2,8 40%
2,8
→ /7,0 x 100 desempenho dos alunos será:
0,5 1º ‐ Mário
Maria 7,0 0,5 7% → /7,0 x 100
2,5 2º ‐ Maria
José 7,0 2,5 36% → /7,0 x 100 3º ‐ José

Mário 7,0 0 0% ‐ 4º ‐ João
Interpretação do Cv: Cv < 15% = pouca variação | 15% < Cv < 30% = moderada variação | Cv > 30% = muita variação
DESVIO PADRÃO DE DISTRIBUIÇÃO DE FREQUÊNCIA

Quando não temos a lista original dos dados, da mesma forma que a média, podemos encontrar o desvio padrão aproximado
de uma distribuição de freqüência. Neste caso, usamos a equação do desvio padrão estudado, adicionado de f, como abaixo.
Desvio padrão SEM INTERVALO DE CLASSE

*
i Velocidade (Km/h) f f . xi (xi – x ) 2 f
2
1 60 x 4 = 240 (60 – 72,5) * 4 = 625
2 65 6 390 (65 – 72,5)2 * 6 = 337
3 70 11 770 (70 – 72,5)2 * 11 = 69
4 75 8 600 (75 – 72,5)2 * 8 = 50
5 80 7 560 (80 – 72,5)2 * 7 = 394
6 85 4 340 (85 – 72,5)2 * 4 = 625
f=40 (f.xi) = 2.900  = 2.100
Cálculo da média Cálculo do desvio padrão
x = (f.x) → 2.900 = 72,5 Km/h S=  (x  x)2 * f → 2100 = 7,3 km/h

f 40  f  1 40 ‐ 1
Desvio padrão COM INTERVALO DE CLASSE
*
i Velocidade (Km/h) f xi f . xi (xi – x ) 2 f
1 70  80 4 x 75 = 300 (75 – 104,5)2 * 4 = 3.481
2 80  90 4 85 340 (85 – 104,5)2 * 4 = 1.521
3 90  100 8 95 760 (95 – 104,5)2 * 8 = 722
4 100  110 8 105 840 (105 – 104,5)2 * 8 = 2
5 110  120 6 115 690 (115 – 104,5)2 * 6 = 661
6 120  130 10 125 1250 (125 – 104,5)2 * 10 = 4.202
f=40 ‐ (f.xi) = 4180  = 10.589
Cálculo da média Cálculo do desvio padrão
x = (f.x) → 4180 = 104,5 Km/h S=  (x  x)2 * f → 10.589 = 16,47 km/h

f 40  f  1 40 ‐ 1
- 40 -
Cálculo do Desvio padrão a partir de um Histograma em classes
R e s u l t a d o s d o s r e g i s t r o s d e u m r a d a r

12
10
10 (4*75)+(4*85) ...

8
8 8 Primeiramente, você deve calcular a média:
6
6
+ (75*4) + (85*4) + ... + (125*10) = 104,5 Km/h
4
4
4 4 + 4 + 8 + ... + 10

2 x x
0
75 85 95 105 115 125
70 80 90 100 110 120 130

Velocidade (Km/h)

S=  (x  x)2 * f
 f  1

Depois, calcule o Desvio padrão, observando os dados circulados no gráfico acima:

(75‐104,5)2 * 4 + (85‐104,5)2 * 4 + ... + (125‐104,5)2 * 10 = 16,47Km/h
40‐1

- 41 -
3.4 MEDIDAS DE ASSIMETRIA E CURTOSE.

ASSIMETRIA. A assimetria já foi estudada na “Relação entre média, mediana e moda”, quando vimos que a distribuição é simétrica
quando a média, mediana e moda se coincidem; assimétrica à direita quando a média é maior que a mediana e a moda; assimétrica à esquerda
quando a média é menor que a mediana e a moda. Este raciocínio é importante pois é a base para o estudo de probabilidades e inferência.
A assimetria mede o grau de afastamento de uma distribuição em relação ao eixo central,

geralmente representado pela média.
10 Média Grau de
de um radar afastamento Simétrica
Mediana Assimétrica à
8
Assimétrica à
7 Moda esquerda
direita
(negativa)
6 (positiva)
4 4
4 3 3
.
2

0 Média
70 80 90 100 110

Velocidade (Km/h) Importante
Positiva Resultados dos registros
Negativa Sempre que a curva da distribuição

12 Mediana de um radar Resultados dos registros se afastar do eixo central, no caso,
12 de um radar Mediana da média, será considerada como

10 Moda Média
9
10 9 Moda tendo um certo grau de
8 Média afastamento, chamado de assimetria
6 8
6 6 da distribuição. Este afastamento
6
pode acontecer do lado esquerdo ou
4 3 4
2 3 do lado direito da distribuição,
2
2 1 2 1 chamado de assimetria negativa ou
0 0 positiva, respectivamente.
70 80 90 100 110 70 80 90 100 110
Velocidade (Km/h) Velocidade (Km/h)
x ‐ Mo
Coeficiente de Assimetria (Coeficiente de Pearson)

O grau de assimetria de uma distribuição de freqüências pode ser calculado por meio do Coeficiente de Pearson, abaixo:
A
s
x
M S
o
A
s
3
x S
M
d

 
x = média Se As = 0, será simétrica (  ) Você pode usar
Mo = moda Se As < 0, será assimétrica esquerda (negativa) esta equação
S = desvio padrão Se As > 0, será assimétrica direita (positiva) também.

Velocidade Esta distribuição tem: Velocidade Esta distribuição tem:

f f
(Km/h) ‐ média de 83,8 Km/h (Km/h) ‐ média de 85,7 Km/h
1 75 6 ‐ moda de 80Km/h 1 75 10 ‐ moda de 90Km/h
2 80 30 ‐ desvio padrão de 5,2 Km/h. 2 80 14 ‐ desvio padrão de 6,2 Km/h.
3 85 24 Qual o coeficiente de assimetria? 3 85 20 Qual o coeficiente de assimetria?

4 90 12 4 90 23
As  83,8  80 = 0,730 As  85,7  90 = ‐ 0,693
5 95 6 5 95 11
f=78 5,2 f=78 6,2

Interpretação: a distribuição é assimétrica positiva (à direita) e Interpretação: a distribuição é assimétrica negativa (à

moderada, pois está entre 0,15 e 1. (veja próxima pág. o motivo) esquerda) e moderada, pois está entre ‐ 0,15 e ‐1.

Ao construir o histograma podemos comparar com uma Ao construir o histograma podemos comparar com uma
distribuição simétrica. Perceba o quanto a média desta distribuição simétrica. Perceba o quanto a média desta
distribuição se afasta do eixo central, simétrico. distribuição se afasta do eixo central, simétrico.

Grau de afastamento 0,730

Resultados dos registros de um radar

Result ados dos regist ros de um radar Grau de
35 35 afastamento ‐0,693
Quantidade veículos
30
30 30
25 24 25 23
20
20 20
15 12 15 14
10 11
10 10
6 6
5 5
0 0
75 80 85 90 95 75 80 85 90 95
Velocidade (Km/h) Velocidade (Km/h)
- 42 -
Interpretação da assimetria. Quanto mais As se afasta de zero, mais assimétrica será a distribuição, podendo ser fraca (se
situada até |0,15|), moderada (se situada de |0,15| a |1|) ou forte (se maior que |1|). Forte, nesse caso, não é algo
necessariamente bom, pois indica que a distribuição está fortemente (muito) distante do eixo central, no caso, da média.
Portanto, para efeitos de inferência estatística, melhor é que a As se aproxime de zero, no caso, de uma distribuição simétrica.

Simétrica
. Assimétrica à direita Assimétrica à esquerda

(positiva) (negativa)

Média

forte moderada Fraca Fraca moderada forte

1 0,15 0 ‐0,15 ‐1

A barra | | indica, matematicamente, que o sinal negativo é desprezado.

CURTOSE. A análise da Curtose também é importante, pois é a base do estudo de probabilidades e inferência estatística.
A curtose mede o grau de achatamento ou alongamento de uma distribuição, em relação a uma
distribuição padrão, denominada curva normal
(a) Leptocúrticas (a) Curvas alongadas, com alta curtose, são chamadas de
(b) Mesocúrticas leptocúrticas. Observe que tem um pico relativamente alto.
(c) Platicúrticas
(b) Curvas nem alongadas nem achatadas e de curtose
mediana são chamadas de mesocúrticas.

(c) Curvas achatadas apresentam menor curtose e são
denominadas platicúrticas. Observe que tem o topo
achatado.

Coeficiente de Curtose
O grau de curtose de uma distribuição de freqüências pode ser calculado por meio da equação abaixo:
C
Q P
Q 1

3 9
  Q1 = 1º quartil Relativamente à curva normal: Esta equação é denominada

2
-
P
Q3 = 3º quartil Se C < 0, 263 → curva leptocúr ca

0
Coeficiente percentílico de
( ) P90 = 90º percentil Se C = 0, 263 → curva mesocúr ca curtose
P10 = 10º percentil Se C > 0, 263 → curva pla cúr ca

Portanto, para encontrar o coeficiente de curtose é necessário conhecimento e aplicação das medidas de ordenamento, no
caso, do quartil e percentil. Neste exemplo não calcularemos essas medidas uma vez que já estudamos no título “3.2 Medidas
de ordenamento”. Vamos direto ao assunto.

Exemplo
Calcule o coeficiente de curtose e informe o seu tipo.
C
Q P
Q P
i Velocidades f Fa Esta distribuição tem:

C
1
2
0
-
9
2
,
5
3 9
1 70  80 4 4 Q1 = 92,5 Km/h   
2
2
1
2
6
-
8
0
→ = 0,298
0
1
0
2 80  90 4 8 Q3 = 120 Km/h ( ) ( )
3 90  100 8 16 P90 = 126 Km/h
P10 = 80 Km/h
4 100  110 8 24
Como 0,298 > 0,263, dizemos que a curva é platicúrtica

5 110  120 6 30
6 120  130 10 40
f=40
É importante ressaltar que o conhecimento e aplicação da Assimetria e Curtose será complementado com o estudo da
distribuição normal, base da inferência estatística. Somente com todos esses conceitos estudados é que entenderemos
realmente a assimetria e curtose.
- 43 -
4
PROBABILIDADE
É possível quantificar o
acaso?

Saiba
mais
Clique aqui
www.udemy.com

- 44 -
4.1 CONCEITOS BÁSICOS DE PROBABILIDADES

Probabilidade é uma medida numérica que representa a chance de um evento ocorrer.
Dois exemplos clássicos (por sua simplicidade) do conceito de Probabilidade são:

Ao lançar um dado, qual a probabilidade de obter “4”? Ao lançar a moeda, qual a probabilidade de dar “cara”?

Como representar numericamente as chances desses eventos?

Conhecidas certas condições, é possível responder a essas duas perguntas, antes mesmo da realização desses
experimentos. A teoria da probabilidade surgiu para tentar calcular a “chance” de ocorrência de um resultado
imprevisível, porém, pertencente a um conjunto de resultados possíveis. Todos os dias somos confrontados com
situações, que nos conduzem a utilizar a teoria de probabilidade:
Dizemos que existe uma pequena probabilidade de ganhar na loteria;
Dizemos que existe uma grande probabilidade de não chover num dia de verão;
O gerente quer saber a probabilidade de o projeto ser concluído no prazo;
O analista financeiro quer saber a chance de um novo investimento ser lucrativo;
O gerente de marketing quer saber as chances de queda de vendas se aumentar os preços;
O eng. produção quer saber a probabilidade de um novo método de montagem aumentar a produtividade.
É POSSÍVEL QUANTIFICAR O ACASO. Desse modo, se houver probabilidades disponíveis, podemos determinar a
possibilidade de cada um dos eventos ocorrer. Para continuar o estudo de probabilidades, três conceitos são
importantes: Experimento aleatório, espaço amostral e eventos.
Experimento aleatório

Experimento cujo resultado é imprevisível, porém pertencente a um conjunto de resultados possíveis.

É o fenômeno que estamos interessados em observar, e cada resultado dele é uma experiência. Embora não
saibamos qual o resultado que irá ocorrer, conseguimos descrever todos os resultados possíveis. Exemplos:

EXPERIMENTO Resultados possíveis
Jogar uma moeda Cara ou Coroa
Lançar um dado 1, 2, 3, 4, 5, 6
Jogar uma partida de futebol Ganhar, empatar, perder
Fazer um contato de vendas Comprar, não comprar
Selecionar uma peça para inspeção Defeituosa, não defeituosa
Nascimento de uma criança Masculino, feminino

A principal característica do experimento é ser casual, no sentido de que, apesar de conhecermos seus possíveis
resultados, não podemos dizer com certeza o que vai ser obtido. Quantas e quais as possibilidades de resultados
desses experimentos são questões que tentamos responder para avaliar as chances de eles acontecerem.
Espaço amostral

É o conjunto de todos os resultados possíveis de um experimento aleatório.

Note que, ao especificar todos os resultados possíveis, identificamos o espaço amostral, representado por S.
São exemplos de espaços amostrais:

EXPERIMENTO ALEATÓRIO Espaço amostral
Jogar uma moeda S = { Cara, Coroa}
Lançar um dado S = {1, 2, 3, 4, 5, 6}
Jogar uma partida de futebol S = {Ganhar, Empatar, Perder}
Fazer um contato de vendas S = {Comprar, Não comprar}
Selecionar uma peça para inspeção S = {Defeituosa, Não defeituosa}
Nascimento de uma criança S = {Masculino, Feminino}
- 45 -
Eventos

É o resultado possível dentro de um espaço amostral.

Evento A → {sair número dois} → A={2}.
Lançar um dado e
observar sua face

Evento B → {sair número maior que 4} → B={5,6}.

Evento C → {sair número par} →C={2,4,6}.

S = {1,2,3,4,5,6} Evento D → {sair número menor que 2} → D={1}.

O Diagrama de Venn pode representar graficamente o espaço amostral e o evento.

Evento A → {sair número dois} → A={2}. Evento C → {sair número par} → C={2,4,6}.

Espaço
A S amostral S Espaço
1 C amostral
Evento 1
2 Evento
2
3 4
3

5 S = {1,2,3,4,5,6} 6
4 5 S = {1,2,3,4,5,6}

6 A = {2}
C = {2,4,6}

A área do círculo representa o Evento e a área do retângulo representa todos os elementos de um espaço amostral.
4.2 CÁLCULOS DE PROBABILIDADES
Probabilidade

n( A ) nº elementos no evento A
A probabilidade é dada por: P
S Espaço amostral

Exemplos:

1) No lançamento de um dado, qual a probabilidade de o resultado ser o número 2?
A = {2} → A = 1 P(A) = 1 = 0,1666 ou 16,66% a probabilidade de o resultado ser o “2” é
S = {1,2,3,4,5,6} → S = 6 6 de 1 chance em 6 ou 0,1666 ou 16,66%.
2) No lançamento de uma moeda, qual a probabilidade de o resultado ser Cara?
A = {Ca} → A = 1 P(A) = 1 = 0,50 ou 50%
S = {Ca,Co} → S = 2 2
3) Uma urna tem 10 bolas, sendo 8 pretas e 2 brancas. Pegando‐se uma bola, qual a probabilidade de ela ser branca?
A = {B,B} → A = 2 P(A) = 2 = 0,20 ou 20%
S = {P,P,P,P,P,P,P,P,B,B} → S = 10 10

4) Em um lote de 200 peças, 25 são defeituosas e 175 são boas. Se um Analista Industrial retira uma peça, qual a
probabilidade de essa peça ser defeituosa?
A = {D,D,D,D,D...} → A = 25 P(A) = 25 = 0125 ou 12,5%
S = {B,B,B,B,B,B...D,D} → S = 200 200

5) Das 120 notas fiscais emitidas por uma empresa, 16 tem erros de impressão. Se um Auditor seleciona uma nota fiscal,
qual a probabilidade de essa nota apresentar erros de impressão?
A = {NE, NE, NE ...} → A = 16 P(A) = 16 = 0125 ou 12,5%
S = {NB,NB, NB...NE,NE} → S = 120 120

NE = Nota com erro ; NB = Nota boa
- 46 -

figuras
Observe as cartas de um baralho de 52 cartas, abaixo:
Naipes Valete Dama Reis Ás
(Paus)
(preta)
13 cartas

(ouros)
(vermelha)
13 cartas
(Espadas)
(preta)
13 cartas
(Copas)
(vermelha)
13 cartas

Quando retiramos uma carta de um baralho de 52 cartas, qual a probabilidade de o resultado:

Sair um Ás de Ouros: temos 1 Ás de Ouros no baralho, então: Sair um Reis: temos 4 Reis no baralho. Então:

A = {Ás} → A = 1 P(A) = 1 = 0,019 A = {R,R,R,R} → A = 4 P(A) = 4 = 0,076
S= {52 cartas} → S = 52 52

S= {52 cartas} → S = 52 52

Interpretação de valores probabilísticos

As probabilidade são sempre são atribuídos em uma escala de 0 a 1 (ou 0% a 100%)

0 0,5 (50%) 1 (100%) Números que não podem
Impossível pouco provável provável Certo representar probabilidade:

10/5 120% ‐0,4
Chance 50‐50

Eventos complementares

É a probabilidade com os resultados que não fazem parte do evento (A).

Eventualmente queremos saber a probabilidade de um evento não ocorrer. Portanto, é o evento formado pelos resultados que não
pertencem ao evento A. Sendo P( A ) a probabilidade de que ele não ocorra e P(A) a probabilidade que ocorra, temos:
Probabilidade com Evento complementar
Probabilidade do P( A ) = 1 – P(A)
evento não ocorrer Probabilidade evento (A)

Exemplo. No lançamento de um dado, qual a probabilidade de o resultado:

Pela probabilidade (A) Probabilidade com evento complementar
ser o número 2 não ser o número 2

A={2} → A = 1 P(A) = 1 = 0,1666 P( A ) = 1 – P(A)

S={1,2,3,4,5,6} → S = 6 6 = 1 – 0,1666 → 0,8333 ou 83,33%

O “Diagrama de Venn” abaixo ilustra a relação entre o espaço amostral, o evento A e seu complemento A :

P(A) = 16,66%
P( A ) = 83,33%
Probabilidade (A) S Probabilidade
A 1 Complementar

2 3
5
6
4 A equação 1‐ P( A ) fundamenta‐se na
A
interpretação dos valores probabilísticos:
0 1
0,1666 A = 0,8333
- 47 -
Eventos mutuamente exclusivos

É a probabilidade com eventos que não ocorrem ao mesmo tempo. Ou ocorre A ou ocorre B (A ou B).
A ocorrência de um evento impossibilita a ocorrência do outro.

Dois eventos são mutuamente exclusivos quando a ocorrência de um evento exclui a ocorrência de outro. É impossível ocorrer os eventos A
e B ao mesmo tempo. Então, o termo “ou” indicará “adição de probabilidades”. Para encontrar a probabilidade de um evento ou outro
ocorrer, adicionamos as probabilidades de cada evento: P(A ou B) = P(A) + P(B).

Exemplo 1. Ao lançar um dado, a probabilidade de se tirar o 2 ou 5 é:

3 S
A
B 6 “ou” indica Adição de probabilidades. P(A ou B) = P(A) + P(B)
5
2 ou 4 A = {2} → A = 1 P(A ou B) = 1 + 1 = 2 = 0,3333
1 B = {5} → B = 1 6 6 6
S = {1,2,3,4,5,6} → S = 6

Exemplo 2. Ao retirar uma carta de um baralho de 52 cartas, a Exemplo 3. Numa urna estão 10 bolas, sendo 2 pretas
probabilidade de sair um Rei ou uma Dama é: (P), 5 amarelas (A) e 3 verdes (V). Pegando‐se uma bola,

qual a probabilidade de ela ser preta ou verde?

A = {R,R,R,R } → A = 4 P(AouB) = 4 + 4 = 8 = 0,1538
A = {P,P } → A = 2 P(AouB) = 2 + 3 = 5 = 0,5
B = {D,D,D,D} → B = 4 52 52 52 B= {V,V,V} → B = 3 10 10 10
S = {52 cartas → S = 52

S = {10} → S = 10

Eventos NÃO mutuamente exclusivos

É a probabilidade com Eventos que podem ocorrer ao mesmo tempo. Ou ocorre A ou B ou AMBOS (A e B).
A ocorrência de um NÃO impossibilita a ocorrência do outro.

Dois eventos NÂO são mutuamente exclusivos quando a ocorrência de um evento não exclui a ocorrência de outro. É possível ocorrer os
eventos A e B ao mesmo tempo. O termo “ou”, indicará “adição” e “e” indicará “ambos”

Exemplo 1 Ao lançar um dado, a probabilidade de obter um número ímpar ou menor que 3 é:

ímpar Menor que 3 Os eventos A e B não são mutuamente exclusivos, pois “1” ocorre em A e B (ambos).
B S
A 3 2 5
Se aplicarmos P(AouB) = P(A) + P(B) teremos: /6 + /6 = /6. Observe no diagrama que
3 4
este resultado está incorreto, pois P(AouB) = /6. Este erro foi provocado pela dupla
1 6
5 2 contagem de “1”.
4
Neste caso, ajustaremos a regra da soma para evitar a dupla contagem. A equação será:

A e B (Ambos) P(AouB) = P(A) + P(B) – P(A e B)

Então, a probabilidade de lançar um número ímpar ou menor que 3 será:

A = {1,3,5} → A = 3

B = {1,2} → B = 2 P(AouB) = 3 + 2 ‐ 1 = 4 = 0,6666
A e B = {1} → A e B = 1 6 6 6 6
S = {1,2,3,4,5,6} → S = 6

Exemplo 2 Numa pesquisa sobre a preferência de dois jornais, consultamos 470 pessoas, sendo que 250 lêem o jornal A, 180
lêem o jornal B e 60 lêem os jornais A e B. Escolhendo uma pessoa ao acaso, qual a probabilidade de que seja:

Jornal a) Leitor dos jornais A ou B? P(A ou B) = P(A) + P(B) – P(A e B)
Jornal A B
A = {250} 250 + 180 – 60 = 370 = 0,7872
B = {180} 470 470 470 470
A e B = {60}
60
S = {470}

AeB

- 48 -
PROBABILIDADE CONDICIONAL E MULTIPLICAÇÃO DE PROBABILIDADES

Probabilidade com Eventos dependentes

É a probabilidade do Evento B ocorrer, dado que o evento A já tenha ocorrido.

 Diz‐se probabilidade condicional quando a ocorrência de um evento está condicionada à ocorrência do outro.
Portanto, os eventos são dependentes. A probabilidade de um é alterada pela existência do outro.

A probabilidade condicional do Evento B, dado que A ocorreu é denotada por:
ocorreu (lê‐se “probabilidade de B, dado que A ocorreu”)
P(B|A) = P(A e B)
P(A) → espaço amostral de A, “reduzido”
Ao calcular P(B|A) tudo se passa como se P(A) fosse o novo espaço amostral “reduzido” dentro do qual, queremos
calcular a probabilidade de B. Não utilizamos o espaço amostral original.
Exemplo 1. Ao lançar um dado, observou‐se um número maior que 2 (evento A ocorreu). Qual a probabilidade de esse
número ser o “5” (evento B)?

Ser o 5 O evento A ocorreu e queremos saber o B (dentro de A):
Maior que 2
A B A = {3, 4, 5, 6}

4 3

B = {5}
5

Novo espaço 6 P(B|A) será a probabilidade de ocorrer o número 5 no novo espaço
amostral
amostral reduzido de A. Então:
A e B = {5} → 1 P(B|A) = P(A e B) → 1 = 0,25
1
A = {3,4,5,6} → 4 P(A) 4
2

Espaço amostral original S = {1,2,3,4,5,6} Observe que não usamos o espaço amostral original S.
EXEMPLO 2 Ao lançar um dado, observou‐se um número maior que 1 (evento A ocorreu). Qual é a probabilidade de esse
número ser ímpar (Evento B)?

ímpar O evento A ocorreu e queremos saber o B (dentro de A):
Maior que 1
A B A = {2, 3, 4, 5, 6}
2
4 B = {3, 5}
3

Novo espaço 6 5 P(B|A) será a probabilidade de ocorrer número ímpar no novo espaço
amostral
amostral reduzido de A. Então:
A e B = {3,5} → 2 P(B|A) = P(A e B) → 2 = 0,40
1 A = {2,3,4,5,6} → 5 P(A) 5

Observe que não usamos o espaço amostral original S

Espaço amostral original S = {1,2,3,4,5,6}
EXEMPLO 3 Duas cartas são selecionadas em sequência em um baralho. Qual a probabilidade de que a 2ª
carta seja uma dama, dado que a 1ª seja um rei. (assuma que o rei está sem reposição).

Solução. Em razão de a primeira carta ser um rei e não ser a resposta, P (B|A) = 4 = 0,078
o baralho restante tem 51 cartas, 4 das quais são dama. Então: 51

EXEMPLO 4 Cinco cartas são selecionadas em sequência em um baralho. Qual a probabilidade de que a 5ª carta seja uma
dama. Dado que a 1ª = rei; 2ª = dama; 3ª = 8 ; 4ª = Ás. (assuma que não há reposição).

Solução. Em razão de a 1ª = rei; 2ª = dama; 3ª = 8 ; 4ª = Ás, o baralho P (E|A,B,C,D) = 3 = 0,062
restante tem 48 (52‐4) cartas, 3 das quais são dama. Então: 48
Note que o espaço amostral original foi reduzido

- 49 -
EXEMPLO 5 Numa pesquisa sobre a preferência de dois jornais, consultamos 470 pessoas e o resultado foi o seguinte: 250
lêem o jornal A, 180 lêem o jornal B, 60 lêem os jornais A e B. Escolhendo uma pessoa ao acaso, qual a probabilidade de:

a) Um leitor do jornal A, também ser leitor do B? b) Um leitor do jornal B, também ser leitor do A?

Jornal Jornal
Jornal A B Jornal A B
Novo espaço
190 190 amostral

Novo espaço 60 60
amostral
120 120

O evento A ocorreu e queremos saber o B. Então, denotamos O evento B ocorreu e queremos saber o A. Então, denotamos
P(B|A). Dentre os leitores do Jornal A, devemos destacar os que P(A|B). Dentre os leitores do Jornal B, devemos destacar os que
lêem B; logo, o espaço amostral desse evento é A (190+60=250). lêem A; logo, o espaço amostral desse evento é B (120+60=180).
Então, a probabilidade é: Então, a probabilidade é:

A e B = {60} → 60 P(B|A)=P(A e B) → 60 = 0,24
A= {190+60} → 250 P(A) 250

EXEMPLO 6. O quadro abaixo mostra os resultados de um estudo no qual os pesquisadores examinaram o QI de uma criança
e a presença de um gene específico nela.
Gene Gene não A probabilidade de que a criança tenha um QI alto (Evento B), dado que
presente presente a criança tenha o gene (Evento A) é?

QI alto 33 19 52 Solução. Há 72 crianças que têm o gene. Então, o espaço amostral consiste
QI normal 39 11 50 dessas 72 crianças. Dessas, 33 tem QI alto. Então:

72 30 102 P (B|A) = 33 = 0,458
72

EXEMPLO 7 Em um lote de 12 peças, 8 são de “qualidade” e 4 são “defeituosas”. Ao selecionar duas peças em sequência, sem
reposição, qual a probabilidade de:

a 2ª peça ser “defeituosa”, dado que a 1ª é “defeituosa”.
Solução. Em razão de a 1ª peça ser defeituosa, o lote restante tem 11 P (B|A) = 3 = 0,2727
peças, 3 das quais são defeituosas. Então: 11
a 2ª peça ser “defeituosa”, dado que a 1ª é de “qualidade”.
Solução. Em razão de a 1ª peça ser de qualidade, o lote restante tem 11 P (B|A) = 4 = 0,3636
peças, 4 das quais são defeituosas. Então: 11
a 2ª peça ser de “qualidade”, dado que a 1ª é “defeituosa”.
Solução. Em razão de a 1ª peça ser defeituosa, o lote restante tem 11 P (B|A) = 8 = 0,7272
peças, 8 das quais são de qualidade 11
- 50 -
Multiplicação de probabilidade com eventos dependentes ...ache P(A e B) , dado P(B|A) e P(A)
Uma consequência matemática importante da definição de probabilidade condicional é a seguinte:
P(B|A) = P(A e B) se quero achar: P(B|A) = ? então → P(A e B) = P(A) x P(B|A)
P(A) P(A e B) P(A)
Isto é, a probabilidade dos eventos (A e B) é o produto da probabilidade de um deles pela probabilidade do outro, dado o primeiro.

EXEMPLO 1 Duas cartas são selecionadas em sequência em um baralho de 52 cartas. Qual a probabilidade de
selecionar um Rei e uma Dama? (não há reposição).
A probabilidade de a 1ª carta ser um Rei é /52. A P(A e B) = ?
4
4
P(A e B) = P(A) x P(B|A)
2ª carta ser uma Dama é /51, pois o baralho P(A) = /452 4 x 4 → 16 = 0,006
4
restante tem 51 cartas, 4 das quais são dama. P(B|A) = /51 52 51 2652

EXEMPLO 2 Em um lote de 12 peças, 8 são de “qualidade” e 4 são “defeituosas”. Sendo retiradas duas peças em sequência,
qual a probabilidade de que: (não há reposição)

a) Ambas sejam “defeituosas” b) Ambas sejam de “qualidade”
P(A e B) = ? P(A e B) = ?
4 4 x 3 = 0,090 8 8 x 7 = 0,4242
P(A) = /12 P(A) = /12
3 12 11 7 12 11
P(B|A) = /11 P(B|A) = /11
4 3 8 7
A probabilidade de a 1ª peça ser defeituosa é /12 e a 2ª é /11, pois o A probabilidade de a 1ª peça ser de qualidade é /12 e a 2ª é /11,
lote restante tem 11 peças, 3 das quais são defeituosas. pois o lote restante tem 11 peças, 7 das quais são de qualidade.

EXEMPLO 3 Uma urna contém 7 bolas brancas (B) e 3 pretas (P). Extraindo‐se três bolas em sequência, qual a probabilidade
de que: (não há reposição).

a) As duas primeiras sejam brancas e a terceira seja preta (ou seja, BBP)

7 6 7
A probabilidade de a 1ª bola ser branca é /10 e a 2ª é /9. A P(A) = /10
3 6 7 x 6 x 3 = 0,175
probabilidade de a 3ª bola ser preta é /8, pois a urna restante P(B|A) = /9
3 10 9 8
tem 8 peças, 3 das quais são pretas. P(C|B) = /8

b) Duas sejam brancas e uma seja preta (ou seja: BBP, BPB ou PBB) = 3[BBP]

O evento sair “duas brancas e uma preta” pode ocorrer de três maneiras que 7
P(A) = /10
diferem apenas pela ordem de aparecimento das bolas: (BBP, BPB, PBB). Logo, a  7 6 3
probabilidade será a soma dessas maneiras. Então, basta calcular a probabilidade de
6
P(B|A) = /9 3   x x  = 0,525
3
P(C|B) = /8  10 9 8 
uma dessas maneiras (por exemplo, a primeira) e multiplicar por 3. Então: 3(BBP).

c) Pelo menos duas sejam brancas (ou seja: 3[BBP] + [BBB])
2 brancas 3 brancas

3[BBP] [BBB]
“Pelo menos duas brancas“ é a mesma coisa que “no 7
P(A) = /10
7
P(A) = /10  7 6 3  7 6 5
mínimo duas brancas”, ou seja, duas ou três brancas. 6 6 3   x x  +  x x  = 0,8166
Então, calculamos duas brancas + três brancas.
P(B|A) = /9
3
P(B|A) = /9
5
 10 9 8   10 9 8 
P(C|B) = /8 P(C|B) = /8

d) No máximo uma seja branca (ou seja: [PPP] + 3[PPB])
0 branca 1 branca

[PPP] 3[PPB]
No máximo uma branca é a mesma coisa que “ou 3
P(A) = /10
3
P(A) = /10  3 2 1  3 2 7
nenhuma branca ou uma branca”. Então, calculamos 2 2  x x  + 3   x x  = 0,1833
nenhuma branca (todas pretas) + uma branca.
P(B|A) = /9
1
P(B|A) = /9
7
 10 9 8   10 9 8 
P(C|B) = /8 P(C|B) = /8

e) Pelo menos uma seja preta. (ou seja: 3[PBB] + 3[PPB] + [PPP])
1 preta 2 pretas 3 pretas

3[PBB] 3[PPB] [PPP]
3 3 3
P(A) = /10 P(A) = /10 P(A) = /10  3 7 6  3 2 7  3 2 1
7
P(B|A) = /9
2
P(B|A) = /9
2
P(B|A) = /9
3   x x  + 3   x x  +  x x  = 0,7083
6 7 1  10 9 8   10 9 8   10 9 8 
P(C|B) = /8 P(C|B) = /8 P(C|B) = /8

MÉTODO ALTERNATIVO: [BBB]
7
É mais prático usar o P(A) = /10  7 6 5
evento complementar: 6
P(B|A) = /9
1   x x  = 0,7083
5  10 9 8 
1 – BBB (nenhuma preta) P(C|B) = /8
f) Todas sejam da mesma cor:
[PPP]+[BBB] = 0,30
- 51 -
Multiplicação de Probabilidade com Eventos independentes

É quando a ocorrência do Evento A não afeta a probabilidade da ocorrência do B. Não existe dependência.
A e B podem ocorrer simultaneamente (ao mesmo tempo). São independentes.

 A regra da multiplicação é usada para achar P(A e B) para eventos independentes. Aqui associaremos a palavra “e”
com “multiplicação”. O termo chave usado é “simultâneo”. A equação é : P(A e B) = P(A) x P(B). Existe reposição

1 ( 1, 1 )
2 ( 1, 2 ) Exemplo 1. Ao lançar dois dados simultaneamente, qual a
1 3 ( 1, 3 ) probabilidade de:
4 ( 1, 4 )
5 ( 1, 5 ) Obter o número 2 e ímpar ?

6 ( 1, 6 )

1 ( 2, 1 )
Pelo Diagrama de árvore: Então, a probabilidade é:

2 ( 2, 2 )
3 ( 2, 3 ) (2,1), (2,3), (2,5) 3 = 8,33%
2
4 ( 2, 4 )

36
5 ( 2, 5 ) Se aplicarmos a regra da multiplicação, temos:
6 ( 2, 6 )

1 ( 3, 1 ) A={2} → A = 1 P(A e B) = P(A) x P(B)

2 ( 3, 2 ) B={1,3,5} → B = 3 1 x 3 = 3 = 8,33%
3 3 ( 3, 3 )
Lançar dois dados 4 ( 3, 4 ) S={1,2,3,4,5,6} → S = 6 6 6 36
5 ( 3, 5 )

6 ( 3, 6 ) Obter um número par e ímpar ?

1 ( 4, 1 ) Pelo Diagrama de árvore Então, a probabilidade é:
2 ( 4, 2 )
4 3 ( 4, 3 ) 9 = 25%
4 ( 4, 4 )
(2,1), (2,3), (2,5)
5 ( 4, 5 ) (4,1), (4,3), (4,5) 36
6 ( 4, 6 )
(6,1), (6,3), (6,5)

1 ( 5, 1 )
2 ( 5, 2 ) Aplicando a regra da multiplicação, temos:

5 3 ( 5, 3 )
4 ( 5, 4 ) A={2,4,6} → A = 3 P(A e B) = P(A) x P(B)
5 ( 5, 5 ) B={1,3,5} → B = 3 3 x 3 = 9 = 25%
6 ( 5, 6 )
S={1,2,3,4,5,6} → S = 6 6 6 36
1 ( 6, 1 )
2 ( 6, 2 )
3 ( 6, 3 ) Esta regra pode ser estendida para qualquer número de eventos
6
4 ( 6, 4 ) independentes: P (A e B e C) = P(A) x P(B) x P(C)...
5 ( 6, 5 )
6 ( 6, 6 ) O resultado do evento B independe do resultado de A.
Evento A e Evento B “São independentes”
S = {36}

Exemplo 2. Cirurgias de microfraturas no joelho têm 75% de chance de Sucesso em pacientes com joelhos
degenerativos (25% é de fracasso). A cirurgia é realizada em 3 pacientes. Calcule a probabilidade de que:
Nota: A probabilidade de que cada cirurgia seja um sucesso é de 0,75. A chance de um sucesso para uma cirurgia é
independente das chances para as outras cirurgias. Portanto, os eventos são independentes.

a) As três cirurgias sejam um sucesso. ou seja:[SSS] b) As três cirurgias sejam um fracasso. ou seja:[FFF]

[SSS] P (A e B e C) = P(A) x P(B) x P(C) [FFF] P (A e B e C) = P(A) x P(B) x P(C)
P(A) = 0,75 P(A) = 0,25
P(B) = 0,75 0,75 x 0,75 x 0,75 = 0,4218 P(B) = 0,25 0,25 x 0,25 x 0,25 = 0,0156

P(C) = 0,75 P(C) = 0,25

c) Duas cirurgias sejam um sucesso (ou seja: SSF, SFS, FSS) = 3[SSF]

O evento “Duas cirurgias” pode ocorrer de três maneiras que diferem apenas pela
P(A) = 0,75
ordem dos resultados das cirurgias: (SSF, SFS, FSS). Logo, a probabilidade será a
soma dessas maneiras. Então, basta calcular a probabilidade de uma dessas
P(B) = 0,75 3 * (0,75*0,75*0,25) = 0,4218
P(C) = 0,25
maneiras (por exemplo, a primeira) e multiplicar por 3. Então: 3(SSF).

- 52 -
Teorema de Bayes (THOMAZ BAYES – 1701-1761 – MATEMÁTICO)

É uma extensão da probabilidade condicional, que procura responder a pergunta: sabendo-se que o
evento A ocorreu, qual a probabilidade de que esse evento tenha provindo de X?

 Usamos o Teorema de Bayes para rever probabilidades com base em informação adicional obtida posteriormente. Uma idéia‐chave
para se entender a essência do teorema é reconhecer que estamos trabalhando com eventos sequenciais, pelos quais novas
informações são obtidas para se rever a probabilidade do evento inicial. Nesse contexto, os termos probabilidade a priori e
probabilidade a posteriori são comumente usados.
 Uma probabilidade a priori é um valor de probabilidade inicial originalmente obtido antes que seja obtida qualquer informação
adicional. Uma probabilidade a posteriori é um valor de probabilidade que foi revisto usando‐se informação adicional obtida
posteriormente. O teorema de Bayes pode ser obtido por meio de tabelas, diagrama de árvore e pela equação de Bayes.

Exemplo 1. Usando um Diagrama de Árvore e a Equação de Bayes
As máquinas A e B são responsáveis por 65% e 35%, respectivamente, da produção de uma empresa. Os índices de
peças defeituosas na produção destas respectivas máquinas valem 2% e 5%. Se uma peça defeituosa foi selecionada
da produção desta empresa, qual é a probabilidade de que tenha sido produzida pela máquina A?
Resolução: Portanto, ao selecionar uma peça, atribuímos as probabilidades iniciais: P(A) = 0,65 e P(B) = 0,35, incluindo as peças
perfeitas e defeituosas. Denotamos P = peça perfeita e D = peça defeituosa
A probabilidade da peça sair defeituosa,

Pelo Diagrama de Árvore Peça seja da máquina A ou B, é 0,0305
0,98 perfeita P(A) * (P|A) = 0,6370 (0,0130+0,0175), que é a probabilidade
total da peça sair defeituosa.
máquina
A Se queremos saber a probabilidade de a
0,65 0,02 peça defeituosa ter sido produzida pela
Peça máquina A, será:
Peça defeituosa P(A) *(D|A) = 0,0130
0,0130 = 0,4262
fabricada
0,0305
Peça
P(B) * (P|B) = 0,3325 Enquanto que ter sido produzida pela
0,35 0,95 perfeita
máquina + máquina B será:
B
0,05 0,0175 = 0,5738
Peça 0,0305
defeituosa P(B) * (D|B) = 0,0175
Pela equação de Bayes

A equação de Bayes é dada por Usando a equação de Bayes e as probabilidades do exemplo 1,
referente ao cálculo da peça defeituosa ter sido produzida pela
P(A1) . P(B|A1) máquina A, temos:
P(x) =
P(A1) . P(B|A1) + P(A2) . P(B|A2)
P(A1) = 0,65 (peça ser produzida pela máquina A)
Sendo o numerador a probabilidade condicionada P(B|A1) = 0,02 (peça ser defeituosa, dado ser produzida pela máquina A)
procurada, o denominador a probabilidade total P(A2) = 0,35 (peça ser produzida pela máquina B)
condicionada, podendo estender a P(An) . P(B|An). P(B|A2) = 0,05 (peça ser defeituosa, dado ser produzida pela máquina B)
(0,65) . (0,02)
P(x) = = 0,4262
(0,65) . (0,02) + (0,35) . (0,05)
Exemplo 2. As máquinas A e B são responsáveis por 400 e 150, respectivamente, da produção de peças de uma
empresa. A quantidade de peças defeituosas produzidas pelas respectivas máquinas são 10 e 20. Se uma peça
defeituosa foi selecionada da produção, qual a probabilidade de que tenha sido produzida pela máquina B?
O total de peças produzidas é igual a 550 (400+150), logo:

P(A1) = 0,727 (400/550) (peça ser produzida pela máquina A)
A
P(B|A1) = 0,025 (10/400) (peça ser defeituosa, dado ser produzida pela máquina A)
P(A2) = 0,272 (150/550) (peça ser produzida pela máquina B)
B
P(B|A2) = 0,133 (20/150) (peça ser defeituosa, dado ser produzida pela máquina B)
Logo, a probabilidade da peça ser defeituosa e ter sido produzida pela máquina B será:
P(A2) . P(B|A2) (0,272) . (0,133)

P(x) = P(x) = = 0,6661
P(A2) . P(B|A2) + P(A1) . P(B|A1) (0,272) . (0,133) + (0,727) . (0,025)
- 53 -
DISTRIBUIÇÃO BINOMIAL (JAKOB BERNOULLI 1654‐1705)
É um experimento de probabilidades para os quais os resultados de cada tentativa podem ser
reduzidos a dois resultados: SUCESSO ou FRACASSO.
 Sucesso corresponde à probabilidade procurada enquanto que Fracasso à probabilidade não procurada, ou seja, o
evento complementar. A palavra sucesso como usada aqui é arbitrária e não representa, necessariamente, algo bom.
 A probabilidade Binomial é aplicada para Eventos independentes.
Revisão de FATORIAL (O fatorial é usado na equação binomial, por isso a importância da revisão)
FATORIAL é um procedimento matemático utilizado para calcular o produto de uma multiplicação cujos
fatores são números naturais consecutivos, denotado por x!. Exemplos:
5! = 5.4.3.2.1 = 120 5! = 5.4.3! = 20 5! = 5.4.3! = 5 5! = 5.4.3! = 10

30! = 30.29.28 . ... .1 3! 3! 3! 4 3! 4 3! (5-3)! 3! (2)!
0! = 1
Para calcular 5! use a calculadora na tecla x! . Procedimento: Introduza 5 x! = 120
Há várias formas de encontrar probabilidade Binomial. Uma forma é usar um Diagrama de Árvore e a regra de multiplicação.
Outra forma é usar a equação de probabilidade Binomial, onde usamos Fatorial. Podemos também usar tabelas.

EQUAÇÃO DA PROBABILIDADE BINOMIAL
P(x) = n! . S x . F n-x
x! (n - x)!
F = probabilidade de Fracasso
n tamanho da amostra (evento complementar)
x nº sucessos na amostra
S = probabilidade de Sucesso
Nota: p e q foram substituídos por S e F por fins didáticos. (evento procurado)

Exemplo 1. Usando um Diagrama de Árvore (evento independente) e a equação da probabilidade Binomial
Cirurgias de microfaturas no joelho têm 75% de chance de sucesso em pacientes com joelhos degenerativos. A
cirurgia é realizada em 3 pacientes. Encontre a probabilidade de a cirurgia ser um sucesso em 2 pacientes.
Pelo Diagrama de Árvore ou Pela equação Binomial
1ª 2ª 3ª Resultado Sucessos Probabilidade (ev. indepen)

0,75 S (S,S,S) 3 0,75 . 0,75 . 0,75 = 0,422 P(x) = n! . S x . F n - x
0,75
x! (n - x)!
0,75 S 0,25 F (S,S,F) 2 0,75 . 0,75 . 0,25 = 0,141 +
S n=3
0,25 S (S,F,S) 2 0,75 . 0,25 . 0,75 = 0,141 + x=2
F S = 0,75
(S,F,F) 1 0,75 . 0,25 . 0,25 = 0,047 F = 0,25 (evento complementar)
F
S (F,S,S) 2 0,25 . 0,75 . 0,75 = 0,141 + P(x)= 3! . 0,75 2 . 0,25 3 - 2
0,75
0,25 S F (F,S,F) 1 0,25 . 0,75 . 0,25 = 0,047
2! (3-2)!
F
0,25 S (F,F,S) 1 0,25 . 0,25 . 0,75 = 0,047 P(x)= 0,422
F
F (F,F,F) 0 0,25 . 0,25 . 0,25 = 0,016
Há três resultados que têm dois sucessos e cada um tem uma probabilidade de Usando a equação Binomial obtemos
0,141. Aplicando a Regra da Adição, a probabilidade de a cirurgia ser um sucesso o mesmo resultado pelo método do
com dois pacientes é 0,422. (0,141 + 0,141 + 0,141) Diagrama de árvore, de 0,422.
A probabilidade de sucesso em 1 paciente será: A probabilidade de não ter sucesso será:
P(x)= 3! . 0,75 1 . 0,25 3 – 1 ≈ 0,141 P(x)= 3! . 0,75 0 . 0,25 3 – 0 ≈ 0,016

1! (3-1)! 0! (3-0)!
Pelo Diagrama será (0,047+0,047+0,047)
Nota: x0 = 1
- 54 -
Exemplo 2. Um levantamento estatístico realizado pelo IBGE constatou que a taxa de desemprego na cidade de
Resende é da ordem de 13%. Ao tomarmos uma amostra de 30 pessoas, com reposição, qual a probabilidade de:
a) 5 estarem desempregados 13% desemprego(Sucesso) 87% emprego(Fracasso)
b) 28 estarem empregados Sucesso é o que se deseja estudar;
c) 27 estarem empregados 87% emprego(Sucesso) 13% desemprego(Fracasso) Fracasso é o que não se deseja estudar
P(x) = n! . S x . F n-x
x! (n - x)!
a) 5 estarem desempregados b) 28 estarem empregados c) 27 estarem empregados
n = 30 n = 30 n = 30
x=5 x = 28 x = 27
S = 0,13 S = 0,87 S = 0,87
F = 0,87 F = 0,13 F = 0,13
P(x)= 30! . 0,13 5 . 0,87 30 - 5 P(x)= 30! . 0,87 28 . 0,13 30-28 P(x)= 30! . 0,87 27 . 0,13 30-27
5! (30-5)! 28! (30-28)! 27! (30-27)!
P(x)= 142506 . 0,000037 . 0,0307 P(x)= 435 . 0,0202 . 0,0169 P(x)= 4060 . 0,0232 . 0,0021
P(x) ≈ 0,1627 P(x) ≈ 0,1489 P(x) ≈ 0,1978
Para calcular 0,135 use a tecla Xy ou ^. Introduza 0,13 Xy 5 = 3,7‐05 que é o mesmo que 0,000037

Exemplo 3. Uma caixa contém 50 bolas, sendo 40 brancas e 10 pretas. Ao tirar 5 bolas, qual probabilidade de saírem:
a) 2 bolas pretas b) 4 bolas brancas
n=5 n=5
x=2 x=4 P = 5! . 0,804 . 0,205 –4 ≈ 0,4096
10 P = 5! . 0,202 . 0,805–2 ≈ 0,2048 40
S = 0,20 ( /50) S = 0,80 ( /50) 4! (5-4)!
2! (5-2)!
F = 0,80 (40/50) F = 0,20 (10/50)
Exemplo 4. Uma moeda é lançada 5 vezes. Qual a probabilidade de obter “3 caras” nessas cinco provas?

n = 5 (tamanho da amostra)
x = 3 (nº sucessos da amostra) P(x) = 5! __ . 0,503 . 0,505–3 ≈ 0,3125
S = 0,50 ( = ½ a p de obter cara) 3! (5-3)!
F = 0,50 (= ½ a p de obter coroa)

Exemplo 5. Um dado é lançado 6 vezes. Qual a probabilidade de que a “face 4” apareça 2 vezes?

1
S = 0,17 ( = /6 a p de obter “4”) 2! (6-2)!
F = 0,83 (= 5/6 a p de não obter “4”)

Exemplo 6. Dois times de futebol, A e B, jogam entre si 6 vezes. Qual a probabilidade de o time A ganhar 4 jogos?

S = 0,33 ( = 1/3 a p de ganhar)* 4! (6-4)!
F = 0,66 (= 2/3 a p de não ganhar)
* 1/3 o time A pode ganhar, empatar ou perder. Logo, a probabilidade para cada evento é de 1/3
Exemplo 7. Em uma fábrica, 3 em cada 10 peças são defeituosas. Uma remessa a um determinado cliente possui 5
peças. Determine a probabilidade de que, nessa remessa:
2 estejam defeituosas 4 estejam perfeitas

n = 5 (tamanho da amostra) n = 5 (tamanho da amostra)
x = 2 (nº sucessos da amostra) x = 4 (nº sucessos da amostra)
3 7
S = 0,30 ( = /10 a p peça ser defeituosa) S = 0,70 ( = /10 a p peça ser perfeita)
7 3
F = 0,70 (= /10 a p peça ser perfeita) F = 0,30 (= /10 a p peça ser defeituosa)
P(x) = 5! __ . 0,302 . 0,705–2 ≈ 0,3087 P(x) = 5! __ . 0,704 . 0,305–4 ≈ 0,3602

2! (5-2)! 4! (5-4)!
- 55 -
REFERÊNCIAS BIBLIOGRÁFICAS

ANDERSON, David R.; SWEENEY, Dennis J.; WILLIANS, Thomas A. Estatística aplicada à administração e economia. 2
ed. São Paulo: Cengage Learning, 2009. 597 p.
BRUNI, Adriano Leal. Estatística para concursos. São Paulo: Atlas, 2008. 197p.
COSTA, Sérgio Francisco. Introdução ilustrada à estatística. 4 ed. São Paulo: Harbra, 2005. 399 p.
CRESPO, Antônio Arnot. Estatística fácil. 17 ed. São Paulo: Saraiva, 1999. 224 p.
FARIAS, Alfredo Alves et al. Introdução à estatística. 2 ed. Rio de Janeiro: LTC, 2003, 320 p.
GIOVANNI José Ruy; BONJORNO, José Roberto; GIOVANNI JR., José Rui. Matemática fundamental: uma nova
abordagem – volume único. São Paulo: FTD, 2002. 712 p.
HAZZAN, Samuel. Fundamentos da matemática elementar: Matemática financeira, comercial e estatística descritiva.
Volume 11. 1 ed. São Paulo: Atual editora, 2004. 230p.
HELP! Sistema de consulta interativa. Matemática. Rio de Janeiro: O globo, 1997. 319 p.
Instituto Brasileiro de Geografia e Estatística – IBGE. A instituição. Disponível em

<http://www.ibge.gov.br/home/disseminacao/eventos/missao/default.shtm>. Acesso em 06 abr 2010.
LAPPONI, Juan Carlos. Estatística usando o Excel. 4 ed. Rio de Janeiro: Elsevier, 2005. 476 p.
LARSON, Ron; FARBER, Betsy. Estatística aplicada. 4 ed. São Paulo: Pearson, 2010. 637 p.
LEVINE, David M. et al. Estatística: teoria e aplicações. 5 ed. Rio de Janeiro: LTC, 2008. 752 p.
LOPES, Paulo Afonso. Probabilidade e estatística: conceitos, modelos e aplicações em Excel. Ernesto Reichmann, 1999.
174 p.
MANDIN, Daniel. Estatística descomplicada. 9 ed. Brasília: Vestcon, 2002. 227 p.
MONTGOMERY, Douglas C.; RUNGER, George C. Estatística aplicada e probabilidade para engenheiros. 2 ed. Rio de
Janeiro: LTC, 2003. 465 p.
OLIVEIRA, Uanderson Rebula de. Ergonomia, higiene e segurança do trabalho. Resende-RJ: Apostila. Universidade
Estácio de Sá, 2009. 199 p.
Resumão – estatística. 2 ed. São Paulo: Barros, fischer & Associados, novembro 2006. 6 p.
RUMSEY, Deborah. Estatística para leigos. Rio de Janeiro: Alta books, 2009. 350 p.
SILVA, Ermes Medeiros et al. Estatística: para os cursos de Economia, Administração e Ciências Contábeis - volume 1. 2
ed. São Paulo: Atlas, 1996. 189 p.
SMOLE, Kátia Stocco; DINIZ, Maria Ignez. Matemática–ensino médio. 5 ed. São Paulo: Saraiva, 2005. 558p.
SPIEGEL, Murray R. Estatística: resumo da teoria, 875 problemas resolvidos, 619 problemas propostos. São Paulo:
McGraw-Hill do Brasil, 1977. 580 p.
TRIOLA, Mario F. Introdução à estatística. 10 ed. Rio de Janeiro: LTC, 2008. 696 p.
URBANO, João. Estatística: uma nova abordagem. Rio de Janeiro: Ciência moderna, 2010. 530p.
VASCONCELLOS, Maria José Couto; SCORDAMAGLIO, Maria Terezinha; CÂNDIDO, Suzana Laino. Coleção
Matemática. 1ª e 3ª série do ensino médio. São Paulo: Editora do Brasil, 2004. 232 p.
WERKEMA, Maria Cristina Catarino. As ferramentas da qualidade no gerenciamento dos processos. Belo Horizonte:
EDG, 1995. 128 p.
- 56 -
SITES PARA CONSULTA

www.brasilescola.com
Instituto de pesquisa econômica aplicada - http://www.ipea.gov.br
Instituto brasileiro de geografia e estatística - http://www.ibge.gov.br
Associação Brasileira de Estatística - http://www.ime.usp.br/~abe/
www.ibope.com.br
ANEXO I - LIVROS RECOMENDADOS
Um livro introdutório de estatística que inclui um estilo de escrita Este livro diferencia-se dos tradicionais livros,
amigável, conteúdo que reflete as características importantes de um materiais de referência e manuais de estatísticas,
curso introdutório moderno de estatística, o uso da tecnologia pois possui: Explicações intuitivas e práticas sobre
computacional mais recente, de conjuntos de dados interessantes e conceitos estatísticos, ideias, técnicas, fórmulas e
reais, e abundância de componentes pedagógicos. O CD-ROM inclui cálculos. Passo a passo conciso e claro de
os conjuntos de dados do Apêndice B do livro. Esses conjuntos de procedimentos que intuitivamente explicam
dados encontram-se armazenados em formato texto, planilhas do como lidar com problemas estatísticos. Exemplos
Minitab, planilhas do Excel e uma aplicação para a calculadora TI-83. interessantes do mundo real relacionados ao
Inclui também programas para a calculadora gráfica TI-83 Plus®, o cotidiano pessoal e profissional. Respostas
Programa Estatístico STATDISK (Versão 9.1) e um suplemento do honestas e sinceras para perguntas como “O que
Excel, desenvolvido para aumentar os recursos dos programas isso realmente significa?” e “Quando e como eu
estatísticos do Excel. vou usar isso?”
Neste livro você encontrará:
Explicações em português de fácil entendimento.
Informações fáceis de localizar e passo-a-passo.
Ícones e outros recursos de identificação e
memorização. Folha de cola para destacar com
informações práticas. Listas dos 10 melhores
relacionados ao assunto. Um toque de humor e
diversão.
Onde comprar: www.submarino.com.br
- 57 -
ANEXO II - SOFTWARE BIOESTAT
Texto extraído da tese de doutorado em Engenharia de Ualison Rebula de Oliveira

Existem inúmeros recursos tecnológicos para a análise estatística de dados, que vão desde
calculadoras, a exemplo da TI – 83 PLUS, a aplicativos específicos, tais como o STATDISK e o
MINITAB (TRIOLA, 2005). Assim, buscando‐se recursos computacionais que facilitassem o
tratamento de dados, vários aplicativos e softwares estatísticos foram pesquisados, dos quais se
destacam a planilha Excel, o STATDISK, o MINITAB, o BioEstat, o SPSS e algumas páginas na
Internet que oferecem programas em Javascript para cálculos on‐line, a exemplo da página na
Internet www.stat.ucla.edu.

Após análise de pós e contras de cada aplicativo pesquisado, selecionou‐se o pacote estatístico
BioEstat, disponível para download no site www.mamiraua.org.br, por possuir as seguintes
características positivas: i) serventia tanto para a Estatística descritiva como para testes estatísticos
não‐paramétricos; ii) ser em português; iii) possuir manual em PDF com diversos exemplos; iv) ser
de fácil utilização; v) ser gratuito; vi) ser referenciado em vários livros, sites e entidades de
pesquisa – conforme Siegel & Castellan Junior (2006), o BioEstat é o melhor programa disponível
na atualidade para o cálculo do qui‐quadrado; vii) possuir apoio do CNPQ; e viii) estar na versão 5.0
e possuir mais de 20 anos de criação.

INTERFACE BIOESTAT

Baixar software:
www.mamiraua.org.br
- 58 -
Anexo III - ESTATÍSTICA NO EXCEL

O Excel dispõe da função “Estatística”. Assim, tudo que vimos poderá ser desenvolvido pelo
excel, bastando inserir os valores da variável de interesse.
Para saber mais, basta adquirir o livro “Estatística usando o excel”, de Juan Carlos
Lapponi. WWW.SUBMARINO.COM.BR

4ª Edição, Edição 2005, 496 págs. Editora Elsevier Campus ‐ Acompanha CD‐ROM com Planilhas, Modelos,
Simuladores etc. para Excel.

O conteúdo deste livro é útil para: Estudantes que cursam Estatística nas diversas áreas do conhecimento e
em diferentes níveis de graduação como, em ordem alfabética, Administração, Biologia, Contabilidade,
Economia, Engenharia, Finanças, Marketing, Medicina, etc. Estudantes que necessitam aprimorar ou
complementar seus conhecimentos de Estatística utilizando o Excel. Profissionais das diversas áreas que
utilizam os conceitos de Estatística e necessitam, ou gostariam, de utilizar as funções estatísticas, as
ferramentas de análise, planilhas, modelos e simuladores de estatística em Excel. Todos aqueles que poderão
utilizar as planilhas, modelos e simuladores de estatística em Excel da forma como estão no CD‐Rom, ou
modificando‐os, para atender às suas necessidades. Alunos de áreas correlatas que utilizarão estatística e
desejam antecipar seu aprendizado e agregar valor ao seu conhecimento visando o mercado de trabalho. Usuários de Excel que desejam
conhecer e aprender a utilizar os recursos de Estatística disponíveis.

TÓPICOS
• DADOS, VARIÁVEIS E AMOSTRAS
• DESCRIÇÃO DE AMOSTRAS COM TABELAS E GRÁFICOS
• MEDIDAS DE TENDÊNCIA CENTRAL
• MEDIDAS DE DISPERSÃO/VARIAÇÃO
• PROBABILIDADE
• CORRELAÇÃO
• VARIÁVEIS ALEATÓRIAS E DISTRIBUIÇÕES DISCRETAS
• DISTRIBUIÇÕES CONTÍNUAS
• COMBINAÇÃO LINEAR DE VARIÁVEIS ALEATÓRIAS
• DISTRIBUIÇÃO AMOSTRAL
• ESTIMAÇÃO
• TESTE DE HIPÓTESES
• TESTES DE HIPÓTESES COM DUAS AMOSTRAS
• ANÁLISE DA VARIÂNCIA
• REGRESSÃO LINEAR
• AJUSTE NÃO LINEAR
LIVROS PUBLICADOS POR
Uanderson Rébula de Oliveira
QUERO Esses ebooks estão disponíveis na livraria Saraiva por
COMPRAR preços bem acessíveis.
OS LIVROS Além disso, você pode imprimir, desenhar,

esquematizar ou usar qualquer leitor pdf,
pois a maioria deles encontra-se
desbloqueado.
Prof. Uanderson Rébula. Doutorando em

Ver amostras Engenharia. Professor universitário. Vivência
de 21 anos em ambiente industrial.
dos livros
uanderson.rebula@yahoo.com.br
http://lattes.cnpq.br/1039175956271626
https://br.linkedin.com/in/uandersonrebula

Saiba
mais
Clique aqui
www.udemy.com

Sumário

Livro PDF - Estatística e Probabilidade - Prof MSC Uanderson Rebula

Uploaded by

Document Information

Original Title

Copyright

Available Formats

Share this document

Share or Embed Document

Sharing Options

Did you find this document useful?

Is this content inappropriate?

Copyright:

Available Formats

Livro PDF - Estatística e Probabilidade - Prof MSC Uanderson Rebula

Uploaded by

Copyright:

Available Formats

-1-

UANDERSON REBULA DE OLIVEIRA

Faça o curso online na Udemy

O foco do Udemy são os conhecimentos práticos e úteis para o mercado de trabalho. Há

Uma mensagem do Prof. MSc Uanderson Rébula. CLIQUE NO VÍDEO

CLIQUE AQUI E INSCREVA-SE NO CURSO JÁ

1.1 CONCEITO E IMPORTÂNCIA DA ESTATÍSTICA

COMPILAÇÃO E ANÁLISE DE DADOS (INFORMAÇÕES) sobre acidentes do trabalho, de 1970 a 2005:

FONTE: Adaptado da Revista Proteção e do IBGE (www.ibge.gov.br)

POSSÍVEIS SOLUÇÕES PARA REDUZIR OS ACIDENTES

CONSIDERAÇÕES FINAIS SOBRE O ESTUDO DE ACIDENTES.

UM POUCO DE HISTÓRIA E ATUALIDADE

1.2 FASES DO ESTUDO ESTATÍSTICO

ESTUDO NATUREZA DOS DADOS

3. Organizar e contar dados

tornar mais fácil e 1.000 .000

5. Análise dos dados e tomada de decisão

1.3 VOCABULÁRIO BÁSICO DE ESTATÍSTICA

FONTE: Revista Proteção Anos

São exemplos de Variáveis

Inteiros Quando as variáveis forem em números

1.4 POPULAÇÃO E AMOSTRA

São exemplos de População e Amostra:

1.5 ESTATÍSTICA DESCRITIVA E ESTATÍSTICA INFERENCIAL

Algumas ferramentas aplicadas à

A margem de erro é uma medida

2.1 CONCEITOS E TIPOS DE SÉRIES

FONTE: Dados fictícios

Ômega Monza Gol Corsa Fusca

2.2 DISTRIBUIÇÃO DE FREQUÊNCIA

4,0 5,0 6,0 7,0 8,0 9,0 O histograma ao lado indica que cinco alunos tiraram a nota 4,0; três alunos tiraram

Frequência Relativa fr (%)

Uma mensagem do Prof. MSc Uanderson Rébula. CLIQUE NO VÍDEO

CLIQUE AQUI E INSCREVA-SE NO CURSO JÁ

Medidas resumo Valor Interpretação

3.1 MEDIDAS DE POSIÇÃO

 p 6,3 Média ponderada

R e s u lta d o s d o s re g is tro s d e u m ra d a r Não é necessário montar tabela. Veja na figura ao lado

10 que basta multiplicar a freqüência pelo ponto médio e

Medida que representa o valor que está no MEIO de um conjunto de dados.

 = 5 → 5ª posição  = 5ª posição e P2 = 6ª posição

4,0 4 4 Da 1ª até a 4ª  Fa 13ª

3 90  100 8 16 Md  l inf     40 

4 100  110 8 24 20ª f

NOTA SOBRE A MEDIANA. A mediana é menos utilizada do que a média simples. A mediana pode ser aplicada quando existem valores

4,0 6,0 9,0 9,0 10 Moda

f médio de classe modal, que é a 10

NOTAS SOBRE A MODA. Na distribuição de freqüência em classes, o método utilizado para encontrar a moda por meio do ponto médio

Registro das velocidades de

- FUNDAMENTOS DA EQUAÇÃO DE CZUBER –

RELAÇÃO ENTRE MÉDIA, MEDIANA E MODA.

8 7 Moda afirmativa que numa distribuição normal a média, mediana e

i Velocidades f Fa 1º quartil Q1 =  =  = 11,5 ≈ 12ª posição = 95Km/h

Usa‐se a mesma técnica do cálculo da i Velocidades f Fa

DECIL (10 PARTES) 0% 10% 20% 30% 40% 50% 60% 70% 80% 90% 100%

Usa‐se a mesma técnica do cálculo da mediana, 1 70  80 4 4

Usa‐se a mesma técnica do cálculo da mediana, 1 70  80 4 4

3 90  100 8 16 ← Classe P27

n = quantidade de dados 4 100  110 8 24

3.3 MEDIDAS DE VARIAÇÃO (OU DISPERSÃO)

Pequena variação a Grande variação a

VARIÂNCIA E DESVIO PADRÃO (amostral)

6,0 ‐1,0 Notas Média Desvios Desvios elevado ao

P(x) = 5! . 0,302 . 0,705–2 ≈ 0,3087 P(x) = 5! . 0,704 . 0,305–4 ≈ 0,3602