You are on page 1of 125

ESTATÍSTICA BÁSICA

Professor: Narcelio de Araújo Pereira


narcelioap@yahoo.com.br

2010
SUMÁRIO

INTRODUÇÃO ............................................................................................ 03

UNIDADE 1: A NATUREZA DA ESTATÍSTICA ................................... 05

UNIDADE 2: GENERALIDADES E CONCEITOS BÁSICOS .............. 10

UNIDADE 3: SÉRIES ESTATÍSTICAS.................................................... 15

UNIDADE 4: GRÁFICOS ........................................................................... 24

UNIDADE 5: DISTRIBUIÇÃO DE FREQUENCIA ................................ 34

UNIDADE 6: MEDIDAS DE POSIÇÃO ................................................... 46

UNIDADE 7: MEDIDAS DE DISPERSÃO OU VARIABILIDADE....... 70

UNIDADE 8: PROBABILIDADE .............................................................. 80

UNIDADE 9: DISTRIBUIÇÃO BINOMIAL E NORMAL ..................... 87

REFERENCIAS ......................................................................................... 102

ANEXOS ..................................................................................................... 103

EXERCÍCIOS DE FIXAÇÃO .................................................................. 108

2
INTRODUÇÃO

Na antiguidade os povos já registravam o número de habitantes, nascimentos,


óbitos. Faziam "estatísticas". Na idade média as informações eram tabuladas
com finalidades tributárias e bélicas.
No século XVI surgem as primeiras análises sistemáticas, as primeiras tabelas
e os números relativos.
No século XVIII a estatística com feição científica é batizada por
GODOFREDO ACHENWALL. As tabelas ficam mais completas, surgem as
primeiras representações gráficas e os cálculos de probabilidades. A estatística
deixa de ser uma simples tabulação de dados numéricos para se tornar "O
estudo de como se chegar a conclusão sobre uma população, partindo da
observação de partes dessa população (amostra)".
Ao longo do século XX, os métodos estatísticos foram desenvolvidos como
uma mistura de ciência, tecnologia e lógica para a solução e investigação de
problemas em várias áreas do conhecimento humano (Stigler, 1986). Ela foi
reconhecida como um campo da ciência neste período, mas sua história tem
início bem anterior a 1900.

A estatística moderna é uma tecnologia quantitativa para a ciência


experimental e observacional que permite avaliar e estudar as incertezas e os
seus efeitos no planejamento e interpretação de experiências e de observações
de fenômenos da natureza e da sociedade.

A estatística não é uma caixa-preta, nem bola de cristal, nem mágica.


Tampouco é um conjunto de técnicas úteis para algumas áreas isoladas ou
restritas da ciência. Por exemplo, ao contrário do que alguns imaginam, a
estatística não é um ramo da matemática onde se investigam os processos de
obtenção, organização e análise de dados sobre uma determinada população.
A estatística também não se limita a um conjunto de elementos numéricos
relativos a um fato social, nem a números, tabelas e gráficos usados para o
resumo, à organização e apresentação dos dados de uma pesquisa, embora este
seja um aspecto da estatística que pode ser facilmente percebido no cotidiano
(basta abrir os jornais e revistas para ver o "bombardeio" de estatísticas). Ela é
uma ciência multidisciplinar: um mesmo programa de computador que
permite a análise estatística de dados de um físico poderia também ser usado
por um economista, agrônomo, químico, geólogo, matemático, biólogo,
sociólogo, psicólogo e cientista político. Mesmo que as interpretações dessas
análises sejam diferentes por causa das diferenças entre as áreas do

3
conhecimento, os conceitos empregados, as limitações das técnicas e as
conseqüências dessas interpretações são essencialmente as mesmas.

Segundo Rao (1999), a estatística é uma ciência que estuda e pesquisa sobre: o
levantamento de dados com a máxima quantidade de informação possível para
um dado custo; o processamento de dados para a quantificação da quantidade
de incerteza existente na resposta para um determinado problema; a tomada de
decisões sob condições de incerteza, sob o menor risco possível. Finalmente, a
estatística tem sido utilizada na pesquisa científica, para a otimização de
recursos econômicos, para o aumento da qualidade e produtividade, na
otimização em análise de decisões, em questões judiciais, previsões e em
muitas outras áreas.

4
I - A NATUREZA DA ESTATÍSTICA

MÉTODO ESTATÍSTICO

O Método Científico

Muitos dos conhecimentos que temos foram obtidos na antiguidade por acaso
e, outros, por necessidades práticas, sem aplicação de um método.
Atualmente, quase todo acréscimo de conhecimento resulta da observação e
do estudo. Se bem que muito desse conhecimento possa ter sido observado
inicialmente por acaso, a verdade é que desenvolvemos processos científicos
para seu estudo e para adquirirmos tais conhecimentos. Podemos então dizer
que:

 Método: é um conjunto de meios dispostos convenientemente para se


chegar a um fim que se deseja, ou seja, é um meio mais eficaz para atingir
determinada meta.

Dos métodos científicos, vamos destacar o Método experimental e Método


estatístico.
O Método Experimental - É o método preferido pela física, Química, etc.

 Método experimental: consiste em manter constantes todas as causas


(fatores), menos uma, e variar esta causa de modo que o pesquisador
possa descobrir seus efeitos, caso existam.

O Método Estatístico

Muitas vezes temos necessidade de descobrir fatos em um campo em que o


método experimental não se aplica (nas ciências sociais), já que os vários
fatores que afetam o fenômeno em estudo não podem permanecer constantes
enquanto fazemos variar a causa que, naquele momento, nos interessa.
Nesses casos, lançamos mão de outro método, embora mais difícil e menos
preciso, denominado método estatístico.

 Método estatístico: diante da impossibilidade de manter as causas


constantes, admitem todas essas causas presentes variando-as,
registrando essas variações e procurando determinar, no resultado final,
que influências cabem a cada uma delas.

5
A ESTATÍSTICA

Exprimindo por meio de números as observações que se fazem de elementos


com, pelo menos, uma característica comum (por exemplo: os alunos do sexo
masculino de uma comunidade), obtemos os chamados dados referentes a
esses elementos.
Podemos dizer, então, que:

A Estatística é uma parte da matemática aplicada que fornece métodos para a


coleta, organização, descrição, análise e interpretação de dados e para a
utilização dos mesmos na tomada de decisões.

 A Estatística Descritiva se encarrega de fazer a coleta, organização e


descrição dos dados.

 A Estatística Indutiva ou Inferencial se encarrega de fazer a análise e


interpretação dos dados.

O aspecto essencial da Estatística é o de proporcionar métodos


inferênciais, que permitam conclusões que transcendam os dados obtidos
inicialmente.

Fases do Método estatístico:

Podemos distinguir no método estatístico as seguintes fases:

1 – Definição do Problema

Saber exatamente aquilo que se pretende pesquisar é o mesmo que definir


corretamente o problema.

2 – Planejamento

Como levantar informações? Que dados deverão ser obtidos? Qual


levantamento a ser utilizado? Censitário? Por amostragem? E o cronograma
de atividades? Os custos envolvidos? etc.

6
3 – Coleta de Dados

Após cuidadoso planejamento e a devida determinação das características


mensuráveis do fenômeno coletivamente típico que se quer pesquisar, damos
início à coleta dos dados numéricos necessários à sua descrição. Fase
operacional. É o registro sistemático de dados, com um objetivo determinado.

A coleta de dados pode ser direta ou indireta.

3.1 – Direta:

Quando é feita sobre elementos informativos de registro obrigatório


(nascimentos, casamentos, óbitos, importação, exportação, etc.), elementos
pertinentes aos prontuários dos alunos de uma escola ou, ainda, quando os
dados são coletados pelo próprio pesquisador através de inquéritos e
questionários, como é o caso das notas de verificação e de exames, do censo
demográfico, etc.

A coleta direta de dados pode ser classificada relativamente ao fator tempo


em:

 Contínua (registro): quando feita continuamente, tal como a de


nascimento, óbitos e a freqüência dos alunos às aulas;
 Periódica: quando feita em intervalos constantes de tempo, como os
censos (de 10 em 10 anos) e as avaliações periódicas; recenseamento
demográfico, censo industrial;
 Ocasional: quando feita esporadicamente, a fim de atender a uma
conjuntura ou a uma emergência, como no caso de epidemias.

3.2 – Indireta:

Quando é inferida de elementos conhecidos (coleta direta) e/ou conhecimento


de outros fenômenos relacionados com o fenômeno estudado.
Ex: pesquisa sobre mortalidade infantil, que é feita através de dados colhidos
por uma coleta direta.

7
4 – Crítica dos Dados

Obtidos os dados, eles devem ser cuidadosamente criticados, à procura de


possíveis falhas e imperfeições, a fim de não incorrermos em erros grosseiros
ou de certo vulto, que possam influir sensivelmente nos resultados.

A crítica dos dados se divide em: externa e interna

 Crítica externa – quando visa às causas dos erros por parte do


informante, por distração ou má interpretação das perguntas que lhe
foram feitas.

 Crítica interna – quando visa observar os elementos originais dos dados


da coleta.

5 – Apuração dos Dados

Nada mais é do que a soma e o processamento dos dados obtidos e a


disposição mediante critérios de classificação. Resumo dos dados através de
sua contagem e agrupamento. É a condensação e tabulação de dados.

Pode ser manual, eletromecânica ou eletrônica.

6 – Exposição ou Apresentação dos Dados

Por mais diversa que seja a finalidade que se tenha em vista, os dados devem
ser apresentados sob forma de tabelas e gráficos (unidade 4), pois tornam mais
fácil o exame daquilo que está sendo objeto de tratamento estatístico e ulterior
obtenção de medidas de dispersão (unidade 6).

7 – Análise dos Dados

Como já dissemos, o objetivo último da estatística é tirar conclusões sobre o


todo (população) a partir de informações fornecidas por parte representativa
do todo (amostra). Assim, realizadas as etapas anteriores (estatística
descritiva), fazemos uma análise dos resultados obtidos, através dos métodos
da Estatística Indutiva ou Inferencial, que tem por base a indução ou
inferência, e tiramos desses resultados conclusões e previsões.

8
A ESTATÍSTICA NAS EMPRESAS

No mundo atual, a empresa é uma das vigas-mestras da economia dos povos.

A direção de uma empresa, de qualquer tipo, incluindo as estatais e


governamentais, exige de seu administrador a importante tarefa de tomar
decisões, e o conhecimento e o uso da estatística facilitarão seu tríplice
trabalho de organizar, dirigir e controlar a empresa.

Por meio de sondagem, de coleta de dados e de recenseamento de opiniões,


podemos conhecer a realidade geográfica e social, os recursos naturais,
humanos e financeiros disponíveis, as expectativas da comunidade sobre a
empresa, e estabelecer suas metas, seus objetivos com maior possibilidade de
serem alcançados a curto, médio ou longo prazo.
A estatística ajudará em tal trabalho, como também na seleção e organização
da estratégia a ser adotada no empreendimento e, ainda, na escolha das
técnicas de verificação e avaliação da quantidade e da qualidade do produto e
mesmo dos possíveis lucros e/ou perdas.

Tudo isso que se pensou, se planejou, precisa ficar registrado, documentado


para evitar esquecimentos, a fim de garantir o bom uso do tempo, da energia e
do material e, ainda, para controle eficiente do trabalho.

O esquema do planejamento é o plano, que pode ser resumido, com auxílio da


estatística, em tabelas e gráficos, que facilitarão a compreensão visual dos
cálculos matemático-estatísticos que lhes deram origens.

9
II - GENERALIDADES E CONCEITOS BÁSICOS

1 – VARIÁVEL

A cada fenômeno corresponde um número de resultados possíveis. Assim, por


exemplo:
- para um fenômeno “sexo” são dois os resultados possíveis:
masculino e feminino;
- para o fenômeno “número de filhos” há um número de
resultados possíveis expressos através dos números naturais: 0,1,2,3,....,n;
- para o fenômeno “estatura” temos uma situação diferente, pois
os resultados podem tomar um número infinito de valores numéricos dentro de
um determinado intervalo.

 Variável: é, convencionalmente, o conjunto de resultados possíveis de


um fenômeno.

Uma variável pode ser: qualitativa ou quantitativa

 Qualitativa: quando seus valores são expressos por atributos; ex: sexo,
cor da pele, etc;

 Quantitativa: quando seus valores são expressos em números; ex:


salários, idade, altura, etc. Divide-se em discreta e contínua

 Discreta ou descontínua: seus valores são expressos geralmente


através de números inteiros não negativos. Resulta normalmente
de contagens.
Ex: números de alunos presentes as aulas: ontem = 20, hoje = 23;
Nº de alunos presentes às aulas de introdução à estatística no 1º
semestre de 1997: mar = 18, abr = 30, mai = 35, jun = 36.

 Contínua: resulta normalmente de uma mensuração, e a escala


numérica de seus possíveis valores corresponde ao conjunto R
dos números reais, ou seja, podem assumir, teoricamente,
qualquer valor entre dois limites.

10
Exercício resolvido:

Classifique as variáveis em qualitativas e quantitativas (contínuas ou


discretas):
a) Cor dos olhos – Qualitativa
b) Índice de liquidez nas Indústrias Cearenses – Quantitativa contínua
c) Produção de café no Brasil – Quantitativa contínua
d) Número de defeitos em aparelhos de TV – Quantitativa discreta
e) Comprimento dos pregos produzidos por uma empresa – Quantitativa
contínua
f) O ponto obtido em cada jogada de um dado – quantitativa discreta

2 – POPULAÇÃO E AMOSTRA

Dois conceitos devem estar bem claros: o de população e o de amostra, pois é


delas que são extraídos os dados que dão origem às diversas relações
estatísticas, como a média, desvio-padrão, etc., e que, em última análise,
possibilitam descreve-las sob os mais diversos aspectos.

População: coleção completa de todos os elementos que são objeto de um


estudo; conjunto de entes portadores de, pelo menos, uma característica
comum. A população estatística também é conhecida como universo
estatístico.
Exemplo: pessoas que possuem automóvel

Amostras: são subconjuntos finitos representativos de uma dada população.


Exemplo: pessoas que possuem automóvel da marca Fiat.

Censo: exame de todos os elementos da população.

A amostra deve ser representativa da população da qual foi extraída, ser


parecida com ela (quantitativa e quantitativamente), devendo obedecer a dois
princípios básicos:
 Deve ser suficientemente grande;
 Seus constituintes devem ter sido selecionados ao acaso.

Nem sempre é possível estudar exaustivamente todos os elementos da


população!

11
- Pode a população ter dimensão infinita
Exemplo: População constituída pelas pressões atmosféricas, nos diferentes
pontos de uma cidade.

- Pode o estudo da população levar à destruição da população


Exemplo: População dos fósforos de uma caixa.

- Pode o estudo da população ser muito dispendioso


Exemplo: Sondagens exaustivas de todos os eleitores, sobre determinado
candidato.

Quando não é possível estudar, exaustivamente, todos os elementos da


população, estudam-se só alguns elementos, a que damos o nome de Amostra.

É importante a fase de escolha da amostra?

Sim, pois a amostra deve ser tão representativa quanto possível da População
que se pretende estudar, uma vez que vai ser a partir do estudo da amostra,
que vamos tirar conclusões para a População.

Quando a amostra não representa corretamente a população diz-se


destorcida e a sua utilização pode dar origem a interpretações erradas,
como nos seguintes exemplos:

- Utilizar uma amostra constituída por 10 flamenguistas, para prever o


vencedor do próximo Flamengo X Vasco.
- Utilizar uma amostra constituída pelos leitores habituais de determinada
revista especializada, para tirar conclusões sobre a população geral.

3 – AMOSTRAGEM

 Conceito: é uma técnica especial para recolher amostras que garante,


tanto quanto possível, o acaso na escolha.

Dessa forma, cada elemento da população passa a ter a mesma chance de ser
escolhido, o que garante à amostra o caráter de representatividade, e isto é
muito importante, pois, como vimos, nossas conclusões relativas à população
vão estar baseadas nos resultados obtidos nas amostras dessa população.

12
Daremos, a seguir, três das principais técnicas de amostragem.

3.1 – Amostragem casual ou aleatória simples

Esta técnica de amostragem é equivalente a um sorteio lotérico:


Na prática esta amostragem pode ser realizada da seguinte maneira:

 Enumera-se a população de 1 a n;
 Sorteia-se K números dessa seqüência, que representarão a amostra.

Exemplo: Vamos obter uma amostra representativa para a pesquisa de peso de


80 (oitenta) alunos de uma escola:

 Numeramos os alunos de 01 a 80 (população);


 Colocamos os oitenta números, em pedaços iguais de um mesmo papel,
dentro de uma caixa. Agitamos e realizamos o sorteio de 8 alunos, que
representa uma amostra de 10% desta população.

Quando o número de elementos da amostra é grande, esse tipo de sorteio


torna-se muito trabalhoso. A fim de facilitá-lo, foi elaborada uma tabela –
Tabela de Números Aleatórios -, construída de modo que os dez algarismos
(de 0 a 9) são distribuídos ao acaso nas linhas e colunas (ver anexo).

3.2 – Amostragem proporcional estratificada

Muitas vezes a população se divide em subpopulações – estratos

Como é provável, que a variável em estudo apresente, de estrato em estrato,


um comportamento heterogêneo e, dentro de cada estrato, um comportamento
homogêneo, convém que o sorteio dos elementos da amostra leve em
consideração tais estratos.

É exatamente isso que fazemos quando empregamos a amostragem


proporcional estratificada, que, além de considerar a existência de estratos,
obtém elementos da amostra proporcional ao número de elementos desses
estratos.

Exemplo: Vamos obter uma amostra proporcional estratificada, de 10 % do


exemplo anterior, supondo que dos 80 alunos, temos 44 meninos e 36
meninas.

13
São, portanto dois estratos, (sexo masculino e sexo feminino). Temos:

SEXO POPULAÇÃO 10 % AMOSTRA


MASCULINO 44 10 x 44 = 4,4 4
100
FEMININO 36 10 x 36 = 3,6 4
100
TOTAL 80 10 x 80 = 8 8
100

3.3 – Amostragem sistemática

Quando os elementos da população já se acham ordenados, não há


necessidade de construir o sistema de referência. São exemplos os prontuários
médicos de um hospital, os números de uma rua, uma linha de produção, etc.
Nestes casos, a seleção dos elementos que constituirão a amostra pode ser
feita por um sistema imposto pelo pesquisador. A esse tipo de amostragem
denominamos sistemática.

Assim, no caso de uma linha de produção, podemos, a cada dez itens


produzidos, retirar um para pertencer a uma amostra da produção diária. Neste
caso, estaríamos fixando o tamanho da amostra em 10% da população.

Exemplo: Supomos uma rua com 500 casas, das quais desejamos obter uma
amostra formada por 20 casas para uma pesquisa de opinião.

Neste caso, podemos usar o seguinte procedimento:

 Como 500/20 = 25, escolhemos por sorteio casual um número de 01 a


25;
 Este número indicará a primeira casa da amostra, vamos supor a casa de
número 6;
 Os demais elementos da amostra seriam considerados de 25 em 25;
 Assim, as demais casas da amostra seriam as casas de números 31
(6+25), 56 (31+25), 81 (56+25), etc.

14
III - SÉRIES ESTATÍSTICAS

TABELAS

Um dos objetivos da estatística é sintetizar os valores que uma ou mais


variáveis podem assumir, para que tenhamos uma visão global da variação
dessa ou dessas variáveis. Depois dos dados organizados, faz-se necessário
que essas informações sejam apresentadas em formato de tabelas, pois irão
nos fornecer rápidas e seguras informações a respeito das variáveis em estudo,
permitindo-nos determinações administrativas e pedagógicas mais coerentes e
científicas.
 TABELA: é um quadro que resume um conjunto de dados dispostos
segundo linhas e colunas de maneira sistemática.
Uma tabela compõe-se de: corpo, cabeçalho, coluna indicadora, linhas, casa
ou célula e título. Deste modo, uma tabela deve apresentar o seguinte esquema
de representação:
1. Corpo: conjunto de linhas e colunas que contém informações
sobre a variável em estudo;
2. Cabeçalho: parte superior da tabela que especifica o conteúdo
das colunas;
3. Coluna indicadora: parte da tabela que especifica o conteúdo
das linhas;
4. Linhas: retas imaginárias que facilitam a leitura, no sentido
horizontal, de dados que se inscrevem nos seus cruzamentos com
as colunas;
5. Casa ou célula: cruzamento de uma coluna com uma linha,
destinado a um só número (nunca deve ficar em branco);
6. Título: designação do fato observado, local e época;
Há ainda que se considerar os elementos complementares, que são a fonte, as
notas e as chamadas, colocadas, de preferência, no seu rodapé.
Rodapé: espaço reservado, em seguida ao fecho da tabela, para inserção de
notas de natureza informativa;

15
Fonte: entidade responsável pelo levantamento dos dados ou pela elaboração
da tabela;
Notas: são informações de natureza geral, destinada a conceituar ou esclarecer
o conteúdo das tabelas, ou indicar a metodologia adotada;
Chamadas: informações de natureza específica sobre determinada parte da
tabela, destinada a conceituar ou esclarecer dados.

De acordo com a Resolução 886 do IBGE, nas casas ou células da tabela


devemos colocar:
 Um traço horizontal (-) quando o valor é nulo;
 Três pontos (...) quando não temos a informação;
 Zero (0) quando o valor é muito pequeno para ser expresso pela
unidade utilizada. Se os valores são expressos em numerais decimais,
precisamos acrescentar à parte decimal um número correspondente de
zeros (0,0; 0,00; 0,000; .....);
 Um ponto de interrogação (?) quando temos dúvida quanto à exatidão
de determinado valor;
 A letra “x” quando o dado for omitido, a fim de evitar individualização
das informações.
Obs: Os lados direito e esquerdo de uma tabela oficial devem ser abertos.

16
Ex: Levantamento Epidemiológico no Estado do Rio de Janeiro - 1970
Especificação Nº de Casos Nº de óbitos
Sarampo (1) 115 15
Varíola ... 10
Cólera - -
Meningite 35 5
Total 150 30
Fonte: Departamento Nacional de Endemias Rurais
Nota: As atividades da campanha de vacinação abrangeram as áreas de maior
incidência.

(1) inclusive a área urbana.

SÉRIES ESTATÍSTICAS:
Denominamos séries estatísticas toda tabela que apresenta a distribuição de
um conjunto de dados estatísticos em função da época, do local ou da espécie.
Dividem-se em séries homógradas e conjugadas.
 Séries Homógradas: são aquelas em que a variável descrita apresenta
variação discreta ou descontínua. Podem ser do tipo temporal,
geográfica ou específica.
a) Série Temporal: Identifica-se pelo caráter variável do fator cronológico. O
local e a espécie (fenômeno) são elementos fixos. Esta série também é
chamada de histórica, cronológica, marcha ou evolutiva.
ABC VEÍCULOS LTDA.
Vendas no 1º bimestre de 1996
PERÍODO UNIDADES
VENDIDAS (mil)
JAN/96 20
FEV/96 10
TOTAL 30
b) Série Geográfica: Apresenta como elemento variável o fator geográfico. A
época e o fato (espécie) são elementos fixos. Também é chamada de espacial,
territorial ou de localização.

17
ABC VEÍCULOS LTDA.
Vendas no 1º bimestre de 1996
FILIAIS UNIDADES
VENDIDAS (mil)
SÃO PAULO 13
RIO DE JANEIRO 17
TOTAL 30
c) Série Específica: O caráter variável é apenas o fato ou espécie. Também é
chamada de série categórica.
ABC VEÍCULOS LTDA.
Vendas no 1º bimestre de 1996
MARCA UNIDADES
VENDIDAS (mil)
FIAT 18
GM 12
TOTAL 30
 Séries conjugadas: Também chamadas de tabelas de dupla entrada. São
apropriadas à apresentação de duas ou mais séries de maneira
conjugada, havendo duas ordens de classificação: uma horizontal e
outra vertical. O exemplo abaixo é de uma série geográfica-temporal.
ABC VEÍCULOS LTDA.
Vendas no 1º bimestre de 1996 (em mil unidades)
FILIAIS JANEIRO FEVEREIRO
SÃO PAULO 10 3
RIO DE JANEIRO 12 5
TOTAL 22 8

18
DADOS ABSOLUTOS E DADOS RELATIVOS

 Dados absolutos: são dados resultantes da coleta direta da fonte, sem


outra manipulação senão a contagem ou medida.

A leitura dos dados absolutos é sempre enfadonha e inexpressiva; embora


esses dados traduzam um resultado exato e fiel, não têm a virtude de ressaltar
de imediato as suas conclusões numéricas. Daí o uso imprescindível que faz a
Estatística dos dados relativos.

 Dados relativos: são os resultados de comparações por quocientes


(razões) que se estabelecem entre dados absolutos e têm por finalidade
realçar ou facilitar as comparações entre quantidades.

Traduzem-se os dados relativos, em geral, por meio de percentagens, índices,


coeficientes e taxas.

1 – Percentagens

Considere a série:

MATRÍCULAS NAS ESCOLAS DA CIDADE A – 1995


CATEGORIAS Nº. DE ALUNOS
1º Grau 19286
2º Grau 1681
3º Grau 234
TOTAL 21201
Dados fictícios.

Calculemos as percentagens dos alunos da cada grau:

1º grau – 19286 x 100 = 90,96 = 91,0


21201

2º grau – 1681 x 100 = 7,92 = 7,9


21201

3º grau – 234 x 100 = 1,10 = 1,1


21201

19
Com esses dados, podemos formar uma nova coluna na série em estudo:

MATRÍCULAS NAS ESCOLAS DA CIDADE A – 1995


CATEGORIAS Nº. DE ALUNOS %
1º Grau 19286 91,0
2º Grau 1681 7,9
3º Grau 234 1,1
TOTAL 21201 100
Dados fictícios.

Os valores dessa nova coluna nos dizem que, de cada 100 alunos da cidade A,
91 estão matriculados no 1º grau, 8 aproximadamente no 2º grau e 1 no 3º
grau.

O emprego da porcentagem é de grande valia quando é nosso intuito destacar


a participação da parte no todo.

NOTAS:

 Do mesmo modo que tomamos 100 para base de comparação, também


podemos tomar outro número qualquer, entre os quais destacamos o
número 1. É claro que, supondo o total igual a 1, os dados relativos das
parcelas serão todos menores que 1.
 Em geral, quando usamos 100 para base, os dados são arredondados até
a primeira casa decimal; e quando tomamos 1 por base, são
arredondados até a terceira casa decimal.

Exercício: Complete a tabela abaixo

ESCOLAS Nº. DE ALUNOS DADOS RELATIVOS


POR 1 POR 100
A 175 0,098 9,8
B 222
C 202
D 362
E 280
F 540
TOTAL 1781 1,000 100,0

20
2 – Índices

Os índices são razões entre duas grandezas tais que uma não inclui a outra.

São exemplos de índices:

Índice cefálico = diâmetro transversal do crânio x 100


diâmetro longitudinal do crânio

Quociente intelectual = idade mental x 100


idade cronológica

Densidade demográfica = população


superfície

Índice econômicos:

Produção per capta = valor total da produção


população

Consumo per capta = consumo do bem


população

Renda per capta = renda____


população

Receita per capta = receita__


população

3 – Coeficientes

Os coeficientes são razões entre o número de ocorrências e o número total


(número de ocorrências e número de não-ocorrências).

21
São exemplos de coeficientes:

Coeficiente de natalidade = número de nascimentos


população total
Coeficiente de mortalidade = número de óbitos__
população total

Coeficiente educacionais:

Coeficiente de evasão escolar = nº. de alunos evadidos__


nº. inicial de matrículas

Coeficiente de aproveitamento escolar = nº. de alunos aprovados


nº. final de matrículas

Coeficiente de recuperação escolar = nº. de alunos recuperados_


nº. de alunos em recuperação

4 – Taxas
As taxas são os coeficientes multiplicados por uma potência de 10 (10, 100,
1000 etc.) para tornar o resultado mais inteligível.

São exemplos de taxas:

Taxa de natalidade = Coeficiente de natalidade X 1000


Taxa de mortalidade = Coeficiente de mortalidade X 1000
Taxa de evasão escolar = Coeficiente de evasão escolar X 100

22
Exercícios:
1 – Considere a série estatística:

SÉRIES ALUNOS MATRIC. %


1º 546
2º 328
3º 280
4º 120
TOTAL 1274
Complete-a, determinando as percentagens com uma casa decimal e fazendo a
compensação, se necessário.

2 – Uma escola apresentava, no final do ano, o seguinte quadro:

SÉRIES MATRICULAS
MARÇO NOVEMBRO
1º 480 475
2º 458 456
3º 436 430
4º 420 420
TOTAL 1794 1781

a. Calcule a taxa de evasão por série


b. Calcule a taxa de evasão da escola

3 – Considerando que Minas Gerais, em 1992, apresentou (dados fornecidos


pelo IBGE):
 População: 15.957,6 mil habitantes;
 Superfície: 586.624 Km2;
 Nascimentos: 292036;
 Óbitos: 99281.

Calcule:
a. o índice da densidade demográfica;
b. a taxa de natalidade;
c. a taxa de mortalidade;

23
IV - GRÁFICOS ESTATÍSTICOS

1- Conceito:
O gráfico é um método de representação de dados estatísticos em forma
visual, por meio de figuras geométricas. Devem corresponder, mas nunca
substituir as tabelas estatísticas.
É uma forma de apresentação dos dados estatísticos, cujo objetivo é o de
produzir, no investigador ou no público em geral, uma impressão mais rápida
e viva do fenômeno em estudo, já que os gráficos falam mais à compreensão
que as séries.
Para tornarmos possível uma representação gráfica, estabelecemos uma
correspondência entre os termos da série e determinada figura geométrica, de
tal modo que cada elemento da série seja representado por uma figura
proporcional.
A representação gráfica deve obedecer a certos requisitos fundamentais como:
 Simplicidade – deve proporcionar que o observador analise
rapidamente o fenômeno apresentado;

 Clareza – deve proporcionar que o observador tenha uma correta leitura


dos valores representativos do fenômeno;

 Veracidade – deve expressar a verdade sobre o fenômeno estatístico


representado.

2 - Características:
Gráficos de informação: São gráficos destinados principalmente ao público
em geral, objetivando proporcionar uma visualização rápida e clara. São
gráficos tipicamente expositivos, dispensando comentários explicativos
adicionais. As legendas podem ser omitidas, desde que as informações
desejadas estejam presentes.
Gráficos de análise: São gráficos que se prestam melhor ao trabalho
estatístico, fornecendo elementos úteis à fase de análise dos dados, sem deixar
de ser também informativos. Os gráficos de análise freqüentemente vêm

24
acompanhados de uma tabela estatística. Inclui-se, muitas vezes um texto
explicativo, chamando a atenção do leitor para os pontos principais revelados
pelo gráfico.
Uso indevido de Gráficos: Podem trazer uma idéia falsa dos dados que estão
sendo analisados, chegando mesmo a confundir o leitor. Trata-se, na realidade,
de um problema de construção de escalas.
3 - Classificação dos gráficos:
Os principais gráficos são os Diagramas, Estereogramas, Pictogramas e
Cartogramas.
3.1 - Diagramas:
São gráficos geométricos dispostos, no máximo, em duas dimensões. São os
mais usados na representação de séries estatísticas. Eles podem ser em linhas,
em barras horizontais, em barras verticais (colunas), e em setores.
 Gráficos em linhas ou lineares
O gráfico em linha constitui uma aplicação do processo de representação das
funções num sistema de coordenadas cartesianas.
Como sabemos, nesse sistema fazemos uso de duas retas perpendiculares; as
retas são os eixos coordenados e o ponto de intersecção, a origem. O eixo
horizontal é denominado eixo das abscissas (ou eixo dos x) e o vertical, eixo
das ordenadas (ou eixo dos y). Para exemplificar considere a série:

25
Determinamos, graficamente, todos os pontos da série, usando as
coordenadas, ligamos todos esses pontos, dois a dois, por segmentos de reta, o
que irá nos dar uma poligonal, que é o gráfico em linha ou em curva
correspondente a série do exemplo.

São freqüentemente usados para representação de séries cronológicas com um


grande número de períodos de tempo. As linhas são mais eficientes do que as
colunas, quando existem intensas flutuações nas séries ou quando há
necessidade de se representarem várias séries em um mesmo gráfico.
Quando representamos, em um mesmo sistema de coordenadas, a variação de
dois fenômenos, a parte interna da figura formada pelos gráficos desses
fenômenos é denominada de área de excesso.

26
 Gráficos em colunas ou barras
É a representação de uma série por meio de retângulos, dispostos
verticalmente (em colunas) ou horizontalmente (em barras).
Quando em colunas, os retângulos têm a mesma base e as alturas são
proporcionais aos respectivos dados.
Quando em barras, os retângulos têm a mesma altura e os comprimentos são
proporcionais aos respectivos dados.
Exemplo: Gráfico em colunas

27
Exemplo: Gráfico em barras

NOTAS:
 Quando as legendas não são breves usa-se de preferência os gráficos em
barras horizontais;
 A ordem a ser observada é a cronológica, se a série for histórica, e a
decrescente, se for geográfica ou categórica;
 A distância entre as colunas (ou barras), por questões estéticas, não
deverá ser menor que a metade nem maior que os dois terços da largura
(ou da altura) dos retângulos.
 Gráficos em barras ou colunas múltiplas

28
Eles diferem dos gráficos em barras ou colunas convencionais apenas pelo
fato de apresentar cada barra ou coluna segmentada em partes componentes.
Servem para representar comparativamente dois ou mais atributos.

 Gráficos em setores
Este gráfico é construído com base em um círculo, e é empregado sempre que
desejamos ressaltar a participação do dado no total.
O total é representado pelo círculo, que fica dividido em tantos setores quantas
são as partes.
Os setores são tais que suas áreas são respectivamente proporcionais aos
dados da série. Obtemos cada setor por meio de uma regra de três simples e
direta, lembrando que o total da série corresponde a 360º.

29
O gráfico em setores só deve ser empregado quando há, no máximo, sete
dados.
Obs: As séries temporais geralmente não são representadas por este tipo de
gráfico.

30
3.2 - Estereogramas:
São gráficos geométricos dispostos em três dimensões, pois representam
volume. São usados nas representações gráficas das tabelas de dupla entrada.
Em alguns casos este tipo de gráfico fica difícil de ser interpretado dada a
pequena precisão que oferecem.
3.3 - Pictogramas:
São construídos a partir de figuras representativas da intensidade do
fenômeno. Este tipo de gráfico tem a vantagem de despertar a atenção do
público leigo, pois sua forma é atraente e sugestiva. Os símbolos devem ser
auto-explicativos. A desvantagem dos pictogramas é que apenas mostram uma
visão geral do fenômeno, e não de detalhes minuciosos. Veja o exemplo
abaixo:

31
3.4 - Cartogramas: São ilustrações relativas a cartas geográficas (mapas). O
objetivo desse gráfico é o de figurar os dados estatísticos diretamente
relacionados com áreas geográficas ou políticas.
Distinguimos duas aplicações:
a. representar os dados absolutos (população) – neste caso,
lançamos mão, em geral, dos pontos, em número
proporcional aos dados.
b. representar dados relativos (densidade) - neste caso,
lançamos mão, em geral, de hachuras ou cores.

32
33
V - DISTRIBUIÇÃO DE FREQUENCIA

1 – Tabela Primitiva e Rol


Considere a coleta de dados a seguir de uma variável qualquer relativa a uma
pesquisa com vinte pessoas:
Ex: 45, 41, 42, 41, 42, 43, 44, 41, 50, 46, 50, 46, 60, 54, 52, 58, 57, 58, 60, 51.
Esse tipo de tabela é chamada de tabela primitiva, ou seja:
Tabela primitiva ou dados brutos: é uma tabela ou relação de elementos que
não foram numericamente organizados.
Assim, conhecidos os valores de uma variável, é difícil formarmos uma idéia
exata do comportamento do grupo como um todo, a partir de dados não
ordenados. Em razão disso, pouca informação se consegue obter
inspecionando os dados anotados. Mesmo uma informação tão simples como a
de saber o valor máximo e mínimo requer certo exame dos dados da tabela.
ROL: é a tabela obtida após a ordenação dos dados, em ordem crescente ou
decrescente.
Para o exemplo acima temos:
Rol: 41, 41, 41, 42, 42, 43, 44, 45, 46, 46, 50, 50, 51, 52, 54, 57, 58, 58, 60,
60.
Essa classificação dos dados proporciona algumas vantagens concretas com
relação à sua forma original:
- é possível visualizar de forma ampla as variações de consumo;
- os valores extremos são percebidos de imediato;
- é possível observar a tendência de concentração dos valores.

Apesar de o rol propiciar ao analista mais informações e com menos esforço


de concentração do que os dados brutos, ainda assim persiste o problema de a
análise ter que se basear nas 20 observações. O problema se agravará quando
o número de dados for muito grande.

34
2 – Distribuição de Frequência
É um tipo de tabela que condensa uma coleção de dados conforme as
freqüências (repetições de seus valores). A forma pela qual podemos
descrever os dados estatísticos resultantes de variáveis quantitativas, como é o
caso de notas obtidas pelos alunos de uma classe, estaturas de um conjunto de
pessoas, salários recebidos pelos operários de uma fábrica etc.
Frequência: é a quantidade que fica relacionada a um determinado valor da
variável.
Distribuição de frequência sem intervalos de classe: é a simples
condensação dos dados conforme as repetições de seus valores. Para um ROL
de tamanho razoável esta distribuição de frequência é inconveniente, já que
exige muito espaço. Veja exemplo abaixo:
Dados Frequência
41 3
42 2
43 1
44 1
45 1
46 2
50 2
51 1
52 1
54 1
57 1
58 2
60 2
TOTAL 20

35
Distribuição de frequência com intervalos de classe: Quando o tamanho da
amostra é elevado é mais racional efetuar o agrupamento dos valores em
vários intervalos de classe.
Classes Frequências
41 |------- 45 7
45 |------- 49 3
49 |------- 53 4
53 |------- 57 1
57 |------- 61 5
Total 20

3 – Elementos de uma Distribuição de Frequência com Intervalos de Classe:


3.1 – Classe
Classe de frequência ou, simplesmente, classes são os intervalos de variação
da variável.

As classes são representadas simbolicamente por i, sendo i = 1, 2, 3, ..., k


(onde K é o número total de classes da distribuição).
Na tabela do exemplo anterior, a distribuição é formada por cinco classes,
então temos k = 5 e o intervalo de classe 49 |------- 53 representa a 3ª classe,
ou seja, i = 3.
3.2 – Limites de classe

Limites de classe são os extremos de cada classe.

O menor número é o limite inferior de classe (li) e o maior número, limite


superior de classe (Li).
Na classe 49 |------- 53, temos:,l3 = 49 e L3 = 53.
O símbolo |------- representa um intervalo fechado à esquerda e aberto à
direita. O dado 53 do ROL não pertence a classe 3 e sim a classe 4, que é
representada por 53 |------- 57.

36
3.3 – Amplitude do intervalo de classe

Amplitude do intervalo de classe ou, simplesmente, intervalo é a medida do


intervalo que define a classe.

Ela é obtida através da diferença entre o limite superior e inferior da classe e é


simbolizada por:
hi = Li - li

Na tabela do exemplo anterior hi = 53 - 49 = 4. Obs: Na distribuição de


frequência com classes o hi será igual em todas as classes, como mostrado a
seguir:
hi = 57 - 53 = 4
hi = 49 - 45 = 4
3.4 – Amplitude total da distribuição

Amplitude total da distribuição (AT) é a diferença entre o limite superior da


última classe e o limite inferior da primeira classe.
AT = Lmax - lmin.

Na tabela anterior AT = 61 - 41= 20


Nota: É evidente que, se as classes possuem o mesmo intervalo, verificamos a
relação:
AT = k
hi

3.5 – Amplitude amostral

Amplitude amostral (AA) é a diferença entre o valor máximo e o valor mínimo


da amostra (obtidos através do ROL).
AA = Xmax - Xmin

Em nosso exemplo AA = 60 - 41 = 19.


Obs: AT sempre será maior que AA.

37
3.6 – Ponto médio da classe

Ponto médio da classe (xi) é, como o próprio nome indica, o ponto que divide
o intervalo de classe em duas partes iguais.

Para obtermos o ponto médio de uma classe, calculamos a semi-soma dos


limites da classe (média aritmética):
xi = li + Li
2

No intervalo da 3ª classe 49 |------- 53 o ponto médio x3 é calculado:


x3 = (l3 + L3)/2 = (53 + 49)/2 = 51
Obs.: O ponto médio da classe é o valor que a representa para efeito de
cálculos de medidas de posição e dispersão ou variabilidade.
3.7 – Frequência simples ou absoluta
Frequência simples ou frequência absoluta ou simplesmente, frequência de
uma classe ou de um valor individual é o número de observações
correspondentes a essa classe ou a esse valor.

A frequência simples é simbolizada por fi (lemos f índice i ou frequência da


classe i).
Assim, considerando o exemplo abaixo, temos:
ESTATURAS DE 40 ALUNOS NA ESCOLA A
ESTATURA (cm) FREQUÊNCIA
150 |------- 154 4
154 |------- 158 9
158 |------- 162 11
162 |------- 166 8
166 |------- 170 5
170 |------- 174 3
TOTAL 40
f1 = 4; f2 = 9; f3 = 11; f4 = 8; f5 = 5 e f6 = 3.
A soma das freqüências é sempre igual ao total da amostra.

38
Exercício 1: As notas obtidas por 50 alunos de uma classe foram:
1; 2; 3; 4; 5; 6; 6; 7; 7; 8; 2; 3; 3; 4; 5; 6; 6; 7; 8; 8; 2; 3; 4; 4; 5; 6; 6; 7; 8; 9;
2; 3; 4; 5; 5; 6; 6; 7; 8; 9; 2; 3; 4; 5; 5; 6; 7; 7; 8; 9;
a) Complete a distribuição de frequência abaixo:
i Notas xi fi
1 0 |--- 2
2 2 |--- 4
3 4 |--- 6
4 6 |--- 8
5 8 |--- 10
Total 50

b) Agora, responda:

1. Qual a amplitude amostral?


2. Qual a amplitude da distribuição?
3. Qual o número de classes da distribuição?
4. Qual o limite inferior da quarta classe?
5. Qual o limite superior da classe de ordem 2?
6. Qual a amplitude do segundo intervalo de classe?
7. Qual a frequência da terceira classe?

c) Complete:

1. h3 = .......
2. n = ........
3. l1 = ........
4. L3 = ........
5. x2 = ........
6. f5 = ........

39
4 – Tipos de Freqüências

Frequência simples ou absolutas (fi) são os valores que realmente


representam o número de dados de cada classe.

A soma das freqüências simples é igual ao número total de dados da


distribuição.
Frequências relativas: são os valores das razões entre as freqüências
absolutas de cada classe e a frequência total da distribuição.

A soma das frequências relativas é igual a 1 ou 100 %.


Logo, para o exemplo da página 36 a frequência da terceira classe é:
fr3 = f3/n ; fr3 = 11/40 = 0,275
O propósito das frequências relativas é o de permitir a análise ou facilitar as
comparações.

Frequência acumulada de uma classe (F i): é o total das frequências de todos


os valores inferiores ao limite superior do intervalo de uma determinada
classe:
Fk = f1 + f2 + f3 + ...... + fK

Assim, no exemplo, a frequência acumulada correspondente à terceira classe


é:
F3 = f1 + f2 + f3 = 4 + 9 + 11 = 24
O que significa existirem 24 alunos com estatura inferior a 162 cm (limite
superior do intervalo da terceira classe).

Frequência acumulada relativa (Fri) de uma classe: é a frequência


acumulada da classe, dividida pela frequência total da distribuição.
Fri = Fi / Σ fi

Assim, no exemplo, para a terceira classe, temos:


Fr3 = F3 / Σ fi = 24/40 = 0,600

40
Exercício 2: Complete o quadro com as frequência que se pede.

CLASSE xi fi Fi fri (%) Fri (%)


50 |----- 54 52 4
54 |----- 58 56 9
58 |----- 62 60 11
62 |----- 66 64 8
66 |----- 70 68 5
70 |----- 74 72 3
Total -- 40 -- 100 --
Sendo xi = ponto médio de classe; fi = frequência simples; Fi = frequência
Acumulada; fri (%) = frequência percentual e Fri (%) = frequência percentual
acumulada.
5 - Método Prático para Construção de uma Distribuição de Freqüências com
Classes:
1º - Organize os dados brutos em um ROL.
2º - Calcule a amplitude amostral AA. Para o exemplo da página 32, temos:
AA = 60 - 41 = 19
3º - Calcule o número de classes através da:
a) Regra de Sturges:
n i = nº de classes
3 ---- 5 3
6 ---- 11 4
12 ---- 22 5
23 ---- 46 6
47 ---- 90 7
91 ---- 181 8
182---- 362 9
b) Raiz quadrada de n. (usa-se somente a parte inteira do número quando a
raiz não for exata).
Obs: Qualquer regra para determinação do nº de classes da tabela não nos leva
a uma decisão final; esta vai depender na realidade de um julgamento pessoal,
que deve estar ligado à natureza dos dados.

41
No nosso exemplo: n = 20 dados, então, a regra sugere a adoção de 5 classes
pela regra de Sturges e de 4 classes pela regra da raiz quadrada, ficando a
critério de quem vai fazer a distribuição de frequência.
4º - Decidido o nº de classes, calcule então a amplitude do intervalo de classe
h > AA / i.
No nosso exemplo: AA / i = 19/4 = 4,75. Obs: Como h > AA / i é um valor
ligeiramente superior para haver folga na última classe. Utilizaremos então
h = 5.
5º - Temos então o menor nº da amostra, o nº de classes e a amplitude do
intervalo. Podemos montar a tabela, com o cuidado para não aparecer classes
com frequência = 0 (zero).
No nosso exemplo: o menor nº da amostra = 41 + h = 46, logo a primeira
classe será representada por 41 |------- 46. As classes seguintes respeitarão o
mesmo procedimento.
O primeiro elemento da classe seguinte sempre será formado pelo último
elemento da classe anterior.
6 - Representação Gráfica de uma Distribuição
Uma distribuição de frequência pode ser representada graficamente pelo
Histograma, pelo Polígono de frequência e pelo Polígono de frequência
acumulada (alguns autores denominam de ogiva de Galton).
Em todos os gráficos acima utilizamos o primeiro quadrante do sistema de
eixos coordenados cartesianos ortogonais. Na linha horizontal (eixo das
abscissas) colocamos os valores da variável e na linha vertical (eixo das
ordenadas), as frequências.

6.1 - Histograma

O Histograma é formado por um conjunto de retângulos justapostos, cujas


bases se localizam sobre o eixo horizontal, de tal modo que seus pontos
médios coincidam com os pontos médios dos intervalos de classe.

A área de um histograma é proporcional à soma das frequências simples ou


absolutas.

42
Para o exemplo a seguir, temos o seguinte histograma:

ESTATURAS DE 40 ALUNOS NA ESCOLA A


ESTATURA FREQUÊNCIA
(cm)
150 |------- 154 4
154 |------- 158 9
158 |------- 162 11
162 |------- 166 8
166 |------- 170 5
170 |------- 174 3
TOTAL 40

6.2 – Polígono de Frequência

O Polígono de frequência é um gráfico em linha, sendo as frequências


marcadas sobre perpendiculares ao eixo horizontal, levantadas pelos pontos
médios dos intervalos de classe.

Para realmente obtermos um polígono (linha fechada), devemos completar a


figura, ligando os extremos da linha obtida aos pontos médios da classe
anterior à primeira e da posterior à última, da distribuição.

43
Para o exemplo anterior temos o seguinte Polígono de frequência:

6.3 – Polígono de Frequência Acumulada

O Polígono de frequência acumulada é traçado marcando-se as frequências


acumuladas sobre perpendiculares ao eixo horizontal, levantadas nos pontos
correspondentes aos limites superiores dos intervalos de classe.

Para o exemplo em estudo temos o seguinte Polígono de frequência


acumulada:

44
Uma distribuição de frequência sem intervalos de classe é representada
graficamente por um diagrama onde cada valor da variável é representado por
um segmento de reta variável e de comprimento proporcional à respectiva
frequência.

Exercício 3: Complete o quadro com as frequência que se pede e com base


nele construa o histograma, polígono de frequência e polígono de frequência
acumulada.

CLASSE xi fi Fi fi (%) Fi (%)


50 |----- 54 52 4
54 |----- 58 56 9
58 |----- 62 60 11
62 |----- 66 64 8
66 |----- 70 68 5
70 |----- 74 72 3
Total -- 40 -- 100 --
Sendo xi = ponto médio de classe; fi = frequência simples; Fi = frequência
Acumulada; fi (%) = frequência percentual; Fi(%) = frequência percentual
acumulada.

45
VI - MEDIDAS DE POSIÇÃO

1 – Introdução
O estudo que fizemos sobre distribuições de frequência, até agora, permite-nos
descrever, de modo geral, os grupos dos valores que uma variável pode
assumir. Dessa forma, podemos localizar a maior concentração de valores de
uma dada distribuição, isto é, se ela se localiza no início, no meio ou no final,
ou ainda, se há uma distribuição por igual.
Porém, para ressaltar as tendências características de cada distribuição,
isoladamente, ou em confronto com outras, necessitamos introduzir conceitos
que se expressam através de números, que nos permitam traduzir essas
tendências. Esses conceitos são denominados elementos típicos da
distribuição e são as:
a. medidas de posição;
b. medidas de variabilidade ou dispersão;
c. medidas de assimetria;
d. medidas de curtose.
Dentre os elementos típicos, destacamos, neste capítulo, as medidas de
posição - estatísticas que representam uma série de dados orientando-nos
quanto à posição da distribuição em relação ao eixo horizontal do gráfico da
curva de freqüência.
As medidas de posições mais importantes são as medidas de tendência
central ou promédias, que recebem tal denominação pelo fato de os dados
observados tenderem, em geral, a se agruparem em torno dos valores centrais.
Dentre as medidas de tendência central, destacamos:
a. a média aritmética;
b. a moda;
c. a mediana.
Outras promédias menos usados são as médias: geométrica, harmônica,
quadrática, cúbica e biquadrática.

46
As outras medidas de posição são as separatrizes, que englobam: a própria
mediana, os decis, os quartis e os percentis.

2 – Média Aritmética ( )
Em um conjunto de dados, podemos definir vários tipos de médias. Porém, em
nossos estudos iremos nos limitar à mais importante: a média aritmética.

Média Aritmética é quociente entre a soma dos valores da variável pelo


número deles:

onde xi são os valores da variável e n o número de valores.


2.1 – Dados não - agrupados
Quando desejamos conhecer a média dos dados não-agrupados em tabelas de
freqüências, determinamos a média aritmética simples.
Exemplo: Sabendo-se que a venda diária de arroz tipo A, durante uma semana,
foi de 10, 14, 13, 15, 16, 18 e 12 kg, temos, para venda média diária na
semana de:

.= (10+14+13+15+16+18+12) / 7 = 14 kg

Logo: .= 14 Kg
Às vezes, a média pode ser um número diferente de todos os da série de dados
que ela representa. É o que acontece quando temos os valores 2, 4, 6 e 8, para
os quais a média é 5. Esse será o número representativo dessa série de valores,
embora não esteja representado nos dados originais. Neste caso, costumamos
dizer que a média não tem existência concreta.
2.2 – Desvio em relação à média

Denominamos Desvio em relação à média a diferença entre cada elemento de


um conjunto de valores e a média aritmética.

47
Designando o desvio por di, temos:.di = Xi -
No exemplo anterior temos sete desvios:...
d1 = 10 - 14 = - 4;
d2 = 14 - 14 = 0;
d3 = 13 - 14 = - 1;
d4 = 15 - 14 = 1;
d5 = 16 - 14 = 2;
d6 = 18 - 14 = 4;
d7 = 12 - 14 = - 2.
2.3 –.Propriedades da média
1ª propriedade: A soma algébrica dos desvios em relação à média é nula.
Ou seja:

No exemplo anterior: d1 + d2 + d3 + d4 + d5 + d6 + d7 = 0
2ª propriedade: Somando-se (ou subtraindo-se) uma constante (c) a todos
os valores de uma variável, a média do conjunto fica aumentada (ou
diminuída) dessa constante.

Se no exemplo anterior, somarmos a constante 2 a cada um dos valores da


variável temos:
Y = (12+16+15+17+18+20+14) / 7 = 16 kg

Ou seja, Y = .+ 2 = 14 +2 = 16 kg

48
3ª propriedade: Multiplicando-se (ou dividindo-se) todos os valores de
uma variável por uma constante (c), a média do conjunto fica
multiplicada (ou dividida) por essa constante.

Se no exemplo anterior multiplicarmos a constante 3 a cada um dos valores da


variável temos:
Y = (30+42+39+45+48+54+36) / 7 = 42 kg

Ou seja, Y = x 3 = 14 x 3 = 42 kg
2.4 – Dados Agrupados
 A média aritmética sem intervalos de classe
Consideremos a distribuição relativa a 34 famílias de quatro filhos, tomando
para variável o número de filhos do sexo masculino. Calcularemos a
quantidade média de meninos por família:
Nº de meninos Freqüência = fi
0 2
1 6
2 10
3 12
4 4
Σ = 34

Neste caso, como as freqüências são números indicadores da intensidade de


cada valor da variável, elas funcionam como fatores de ponderação, o que nos
leva a calcular a média aritmética ponderada, dada pela fórmula:

49
O modo mais prático de obtenção da média ponderada é abrir, na tabela, uma
coluna correspondente aos produtos xifi:
xi fi xi . fi
0 2 0
1 6 6
2 10 20
3 12 36
4 4 16
Σ =34 Σ =78
Temos, Σ xifi = 78 e Σf i = 34
Logo Σ xifi / Σf i = 78 / 34 = 2,3
Portanto a média é de 2,3 meninos por família
Nota:
- Sendo x uma variável discreta, como interpretar o resultado obtido, 2
meninos e 3 décimos de menino?
O valor médio de 2,3 meninos sugere, neste caso, que o maior número de
famílias tem 2 meninos e 2 meninas, sendo, porém, a tendência geral de uma
leve superioridade numérica em relação ao número de meninos.

 A média aritmética com intervalos de classe


Neste caso, convencionamos que todos os valores incluídos em um
determinado intervalo de classe coincidem com o seu ponto médio, e
determinamos a média aritmética ponderada por meio da fórmula:

Onde xi é o ponto médio da classe.

50
Exemplo: Considere a distribuição de frequência abaixo, relativo a estaturas
em cm de bebês. Calcular a estatura média de bebês conforme a tabela abaixo.

i Estaturas (cm) fi
1 50 |------- 54 4
2 54 |------- 58 9
3 58 |------- 62 11
4 62 |------- 66 8
5 66 |------- 70 5
6 70 |------- 74 3
Σ = 40

Pela mesma razão do caso anterior, vamos, inicialmente, abrir uma coluna
para os pontos médios (xi) e outra para os produtos xifi:

i Estaturas (cm) fi xi xi.fi


1 50 |------- 54 4 52 208
2 54 |------- 58 9 56 504
3 58 |------- 62 11 60 660
4 62 |------- 66 8 64 512
5 66 |------- 70 5 68 340
6 70 |------- 74 3 72 216
Σ = 40 Σ = 2.440

Temos, Σ xifi = 2440 e Σf i = 40; Logo Σ xifi / Σf i = 2440 / 40 = 61


Portanto, a estatura média dos bebês é de 61 cm.
2.5 – Emprego da média
A média é utilizada quando:
a. desejamos obter a medida de posição que possui a maior estabilidade;
b. houver necessidade de um tratamento algébrico ulterior.

51
3 – Moda

Denominamos Moda o valor que ocorre com maior freqüência em uma série
de valores.

Mo é o símbolo da moda.
Desse modo, o salário modal dos empregados de uma fábrica é o salário mais
comum, isto é, o salário recebido pelo maior número de empregados dessa
fábrica.
3.1 – Dados não - agrupados
Quando lidamos com dados não-agrupados, a moda é facilmente reconhecida:
basta, de acordo com definição, procurar o valor que mais se repete.
Exemplo: Na série de dados {7, 8, 9, 10, 10, 10, 11, 12} a moda é igual a 10.
Há séries nas quais não exista valor modal, isto é, nas quais nenhum valor
apareça mais vezes que outros.
Exemplo: {3 , 5 , 8 , 10 , 12 } não apresenta moda. A série é amodal.
.Em outros casos, pode haver dois ou mais valores de concentração. Dizemos,
então, que a série tem dois ou mais valores modais.
Exemplo: {2 , 3 , 4 , 4 , 4 , 5 , 6 , 7 , 7 , 7 , 8 , 9 } apresenta duas modas: 4 e 7.
A série é bimodal.
3.2 – Dados agrupados
 Sem intervalos de classe
Uma vez agrupados os dados, é possível determinar imediatamente a moda:
basta fixar o valor da variável de maior freqüência.
Exemplo: Qual a temperatura mais comum medida no mês abaixo:
Temperaturas (º C) Freqüência
0 3
1 9
2 12
3 6
Resp: 2º C é a temperatura modal, pois é a de maior freqüência (12 vezes).

52
 Com intervalos de classe
A classe que apresenta a maior freqüência é denominada classe modal. Pela
definição, podemos afirmar que a moda, neste caso, é o valor dominante que
está compreendido entre os limites da classe modal.
O método mais simples para o cálculo da moda consiste em tomar o ponto
médio da classe modal. Damos a esse valor a denominação de moda bruta.

Onde: l* = limite inferior da classe modal;


L*= limite superior da classe modal.
Exemplo: Calcule a estatura modal conforme a tabela abaixo.
Classes
Freqüência
(cm)
54 |-------- 58 9
58 |-------- 62 11
62 |-------- 66 8
66 |-------- 70 5
Resposta: A classe modal é 58 |------ 62, pois é a de maior frequência.
l* = 58 e L* = 62
Mo = (58+62) / 2 = 60 cm (este valor é estimado, pois não conhecemos o
valor real da moda).

Há, para o cálculo da moda, outros métodos mais elaborados, como, por
exemplo, o que faz uso da fórmula de Czuber:

Na qual:
l* é o limite inferior da classe modal;

53
h* é a amplitude da classe modal;
D1 = f* - f (ant.);
D2 = f* - f (post.);
Sendo:
f* a frequencia simples da classe modal;
f (ant.) a frequencia simples da classe anterior à classe modal;
f (post.) a frequencia simples da classe posterior à classe modal.

Exemplo: Considere a distribuição a seguir


Classes fi
150 |------ 154 4
154 |------ 158 9
158 |------ 162 11
162 |------ 166 8
166 |------ 170 5
170 |------ 174 3
Total 40
Temos:
D1 = 11 – 9 = 2 e D2 = 11 – 8 = 3;
Mo = 158 + 2 x 4 = 159,6 cm
2+3
3.3 – Emprego da moda
A moda é utilizada quando:
a. desejamos obter uma medida rápida e aproximada de posição;
b. quando a medida de posição deva ser o valor mais típico da
distribuição.

54
4 – Mediana

A Mediana de um conjunto de valores, dispostos segundo uma ordem


(crescente ou decrescente), é o valor situado de tal forma no conjunto que o
separa em dois subconjuntos de mesmo número de elementos.

Símbolo da mediana: Md
4.1 – Dados não-agrupados
Dada uma série de valores como, por exemplo:
{5, 2, 6, 13, 9, 15, 10}
De acordo com a definição de mediana, o primeiro passo a ser dado é o da
ordenação (crescente ou decrescente) dos valores:
{2, 5, 6, 9, 10, 13, 15}
Em seguida, tomamos aquele valor central que apresenta o mesmo número de
elementos à direita e à esquerda. Neste caso o valor que divide a série acima
em duas partes iguais é o 9, logo a Md = 9.
Se, porém, a série dada tiver um número par de termos, a mediana será, por
definição, qualquer dos números compreendidos entre os dois valores centrais
da série. Convencionou-se utilizar o ponto médio.
 .Método prático para o cálculo da Mediana
a) Se a série dada tiver número ímpar de termos:
O valor mediano será o termo de ordem dado pela fórmula:
(n+1)/2

Exemplo: Calcule a mediana da série {1, 3, 0, 0, 2, 4, 1, 2, 5}


1º - ordenar a série {0, 0, 1, 1, 2, 2, 3, 4, 5}
n = 9, logo (n + 1)/2 é dado por (9 + 1) / 2 = 5, ou seja, o 5º elemento da série
ordenada será a mediana.
A mediana será o 5º elemento = 2

55
b) Se a série dada tiver número par de termos:
O valor mediano será dado pela fórmula:

. [( n/2 ) +( n/2+ 1 )] / 2
Obs.: n/2 e (n/2 + 1) serão termos de ordem e devem ser substituídos pelo valor
correspondente.

Exemplo: Calcule a mediana da série {1, 3, 0, 0, 2, 4, 1, 3, 5, 6}


1º - ordenar a série {0, 0, 1, 1, 2, 3, 3, 4, 5, 6 }
n = 10, logo a fórmula ficará: [(10/2 ) + (10/2 + 1)] / 2
[(5 + 6)] / 2, será na realidade (5º termo+ 6º termo) / 2
5º termo = 2 e 6º termo = 3
A mediana será = (2 + 3) / 2, ou seja, Md = 2,5. A mediana no exemplo será a
média aritmética do 5º e 6º termos da série.
Notas:
 Quando o número de elementos da série estatística for ímpar, haverá
coincidência da mediana com um dos elementos da série.
 Quando o número de elementos da série estatística for par, nunca haverá
coincidência da mediana com um dos elementos da série. A mediana
será sempre a média aritmética dos 2 elementos centrais da série.
 Em uma série a mediana, a média e a moda não têm, necessariamente, o
mesmo valor.
 A mediana depende da posição e não dos valores dos elementos na série
ordenada. Essa é uma da diferenças marcantes entre mediana e média
(que se deixa influenciar, e muito, pelos valores extremos). Vejamos:
Em {5, 7, 10, 13, 15}; a média = 10 e a mediana = 10
Em {5, 7, 10, 13, 65}; a média = 20 e a mediana = 10
Isto é, a média do segundo conjunto de valores é maior do que a do primeiro,
por influência dos valores extremos, ao passo que a mediana permanece a
mesma.

56
4.2 – Dados agrupados
Se os dados se agrupam em uma distribuição de frequência, o cálculo da
mediana se processa de modo muito semelhante àquele dos dados não-
agrupados, implicando, porém, a determinação prévia das frequências
acumuladas.
Ainda aqui, temos que determinar um valor tal que divida a distribuição em
dois grupos que contenham o mesmo número de elementos.
 Sem intervalos de classe
Neste caso, é o bastante identificar a frequência acumulada imediatamente
superior à metade da soma das frequências. A mediana será aquele valor da
variável que corresponde a tal frequência acumulada.
- Quando o somatório das frequências for ímpar o valor mediano será o termo
de ordem dado pela fórmula:

Exemplo – considere a distribuição abaixo:

Variável xi fi Fi
0 2 2
1 6 8
2 9 17
3 13 30
4 5 35
Total 35 --
Como o somatório das frequências Σfi = 35, a fórmula para calcular a mediana
será:
(35+1) / 2 = 18º termo
Pela distribuição temos a mediana igual ao valor da variável correspondente
ao 18º termo, ou seja, igual a 3.

57
- Quando o somatório das frequências for par o valor mediano será o termo de
ordem dado pela fórmula:

Exemplo - Calcule Mediana da tabela abaixo:

Variável xi fi Fi
12 1 1
14 2 3
15 1 4
16 2 6
17 1 7
20 1 8
Total 8 --
Aplicando fórmula acima teremos:
[(8/2)+ (8/2+1)]/2 = (4º termo + 5º termo) / 2 = (15 + 16) / 2 = 15,5
Logo, o valor da mediana para esta distribuição será igual a 15,5.

 Com intervalos de classe


Neste caso, o problema consiste em determinar o ponto do intervalo em que
está compreendida a mediana.
Para tanto, temos inicialmente que determinar a classe na qual se acha a
mediana – classe mediana.
Devemos seguir os seguintes passos:

58
Exemplo: Considere a distribuição a seguir
Classes fi Fi
50 |------- 54 4 4
54 |------- 58 9 13
58 |------- 62 11 24
62 |------- 66 8 32
66 |------- 70 5 37
70 |------- 74 3 40
Total 40 --

Temos: = 40 / 2 =.20
Logo,.a classe mediana será a terceira classe, ou seja, 58 |------ 62 e com base
nesta classe temos ainda:
l* = 58........... F(ant) = 13........... f* = 11........... h* = 4
Substituindo esses valores na fórmula acima, obtemos:
Md = 58 + [(20 - 13) x 4] / 11 = 58 + (28/11) = 58 + 2,54 = 60,54
Obs.: Este valor (Md = 60,54) é estimado, pois não temos os 40 valores da
distribuição.
NOTA: No caso de existir uma frequência acumulada exatamente igual a Σfi/2, a
mediana será o limite superior da classe correspondente.

59
Exemplo: Considere a distribuição a seguir

i Classes fi Fi
1 0 |------ 10 1 1
2 10 |------ 20 3 4
3 20 |------ 30 9 13
4 30 |------ 40 7 20
5 40 |------ 50 4 24
6 50 |------ 60 2 26
Total 26 --

Temos: = 26 / 2 =.13
Logo,.Md = L* = 30
4.3 - Emprego da Mediana
A mediana é usada quando:
a. desejamos obter o ponto que divide a distribuição em duas partes iguais;
b. há valores extremos que afetam de maneira acentuada a média
aritmética;
c. a variável em estudo é salário.

5 – Posição Relativa da Média, Moda e Mediana


Quando uma distribuição é simétrica, as três medidas coincidem. Porém, a
assimetria torna-as diferentes e essa diferença é tanto maior quanto maior é a
assimetria. Assim, em uma distribuição em forma de sino, temos:
Media = Mediana = Moda, no caso da curva simétrica;
Moda < Mediana < Media, no caso da curva assimétrica positiva;
Media < Mediana < Moda, no caso da curva assimétrica negativa;

60
6 – As Separatrizes
Como vimos, a mediana caracteriza uma série de valores devido à sua posição
central. No entanto, ela apresenta uma característica, tão importante quanto a
primeira: ela separa a série em dois grupos que apresentam o mesmo
número de valores.
Assim, além das medidas de posição que estudamos, há outras que,
consideradas individualmente, não são medidas de tendência central, mas
estão ligadas à mediana relativamente à sua segunda característica, já que se
baseiam em posição na série. Essas medidas – os quartis, os percentis e os
decis – são, juntamente com a mediana, conhecidas pelo nome genérico de
separatrizes.
6.1 – Os quartis

Denominamos quartis os valores de uma série que a divide em quatro


partes iguais.

61
Há, portanto, três quartis:
a. O primeiro quartil (Q1) – valor situado de tal modo na série que uma
quarta parte (25%) dos dados é menor que ele e as três quartas partes
restantes (75%) são maiores.
b. O segundo quartil (Q2) – evidentemente, coincide com a mediana (Q2
= Md).
c. O terceiro quartil (Q3) – valor situado de tal modo na série que as três
quartas partes (75%) dos termos são menores que ele e uma quarta parte
restante (25%) é maior.
Quando os dados são agrupados, para determinar os quartis usamos a
mesma técnica do cálculo da mediana, bastando substituir, na fórmula da
mediana, por:

Sendo K o número de ordem do quartil. Assim temos:

62
Exemplo:

Classes fi Fi
150 |------- 154 4 4
154 |------- 158 9 13 (Q1)
158 |------- 162 11 24
162 |------- 166 8 32 (Q3)
166 |------- 170 5 37
170 |------- 174 3 40
Total 40 --

Exercício:
1. Complete os esquemas para o cálculo do primeiro e do terceiro quartis
da distribuição de frequência:

63
6.2 – Os Decis

Denominamos decis os nove valores que separam uma série em 10 partes


iguais.

Indicamos:
D1, D2, D3, ............, D9
É evidente que:
D5= Q2 = Md

64
O cálculo de um decil segue a mesma técnica do cálculo da mediana, porém, a
fórmula será substituída por:

10

Sendo K o número de ordem do decil. Assim temos:

10
D1

10
D3
Exemplo: Calcule o sétimo decil

Classes fi Fi
150 |------- 154 4 4
154 |------- 158 9 13
158 |------- 162 11 24
162 |------- 166 8 32 (D7)
166 |------- 170 5 37
170 |------- 174 3 40
Total 40 --

Sétimo Decil:

7 x ∑fi/10 = 7 x 40/10 = 28

D7 = 162 + (28 -24).4


8
D7 = 162 + 2 = 164

65
6.3 – Os Percentis

Denominamos percentis os noventa e nove valores que separam uma série


em 100 partes iguais.

Indicamos:
P1, P2, P3, ............, P99
É evidente que:
P50= D5= Q2 = Md, P25= Q1, P75= Q3
O cálculo de um percentil segue a mesma técnica do cálculo da mediana,
porém, a fórmula será substituída por:

Sendo K o número de ordem do percentil. Assim para o 27º percentil, temos:

Exemplo:
Considerando a distribuição de frequência, temos para o oitavo percentil:

Classes fi Fi
(P8)
150 |------- 154 4 4
154 |------- 158 9 13
158 |------- 162 11 24
162 |------- 166 8 32
166 |------- 170 5 37
170 |------- 174 3 40
Total 40 --

66
67
Exercício:

1. Complete o esquema para o cálculo do vigésimo percentil da distribuição:

68
2. Calcule a média aritmética das distribuições de frequência abaixo:

3. Calcule a mediana de cada uma das distribuições de frequência do exercício


anterior.

4. Calcule a moda de cada uma das distribuições de frequência do exercício


anterior.

5. Calcule o primeiro e o terceiro quartis de cada uma das distribuições de


frequência do exercício anterior.

5. Calcule o quarto e o nono decil de cada uma das distribuições de frequência


do exercício anterior.

6. Calcule o 1º, o 10º, o 15º, o 23º e o 90º percentiis de cada uma da


distribuição b) do exercício anterior.

69
VII – MEDIDAS DE DISPERSÃO OU VARIABILIDADE

1 – Dispersão ou variabilidade
Vimos anteriormente que um conjunto de valores pode ser convenientemente
sintetizado, por meio de procedimentos matemáticos, em poucos valores
representativos – média aritmética, moda e mediana. Tais valores podem
servir de comparação para dar a posição de qualquer elemento do conjunto.
No entanto, quando se trata de interpretar dados estatísticos, mesmo aqueles já
convenientemente simplificados, é necessário ter-se uma idéia retrospectiva de
como se apresentavam esses mesmos dados nas tabelas.
Assim, não é o bastante dar uma das medidas de posição para caracterizar
perfeitamente um conjunto de valores. Vemos, então, que a média – ainda que
considerada como um número que tem a faculdade de representar uma série de
valores – não pode, por si mesma, destacar o grau de homogeneidade que
existe entre os valores que compõem o conjunto.
Consideremos os seguintes conjuntos de valores das variáveis x, y e z:
X: 70, 70, 70, 70, 70
Y: 68, 69, 70, 71, 72
Z: 5, 15, 50, 120, 160
Calculando a média aritmética de cada um desses conjuntos, obtemos:
média da variável x = 70;
média da variável y = 70;
média da variável z = 70;
Vemos, então, que os três conjuntos apresentam a mesma média aritmética: 70
Entretanto, é fácil notar que o conjunto X é mais homogêneo que os
conjuntos Y e Z, já que todos os valores são iguais à média. O conjunto Y,
por sua vez, é mais homogêneo que o conjunto Z, pois há menor
diversificação entre cada um de seus valores e a média representativa.
Chamando de dispersão ou variabilidade a maior ou menor diversificação
dos valores de uma variável em torno de um valor de tendência central tomado
como ponto de comparação, podemos dizer que o conjunto X apresenta

70
dispersão ou variabilidade nula e que o conjunto Y apresenta uma dispersão
ou variabilidade menor que o conjunto Z.
Portanto, para qualificar os valores de uma dada variável, ressaltando a maior
ou menor dispersão ou variabilidade entre esses valores e a sua medida de
posição, a Estatística recorre às medidas de dispersão ou de variabilidade.
Dessas medidas, estudaremos a amplitude total, o Desvio-padrão, a
Variância e o Coeficiente de variação.

2 – Amplitude Total
2.1 – Dados não-agrupados

A Amplitude total á a diferença entre o maior e o menor valor observado:


AT = X (max) - X (min)

Exemplo: para os valores: 40, 45, 48, 52, 54, 62 e 70


Temos: AT = 70 – 40 = 30, logo AT = 30.
Quando dizemos que a amplitude total dos valores é 30, estamos afirmando
alguma coisa do grau de sua concentração. É evidente que, quanto maior a
amplitude total, maior a dispersão ou variabilidade dos valores da variável.
Relativamente aos três conjuntos de valores (X, Y e Z) mencionados no início
deste capítulo, temos:
ATX = 70 – 70 = 0, (dispersão nula)
ATY = 72 – 68 = 4
ATZ = 160 – 5 = 155
2.2 – Dados agrupados
2.2.1 – Sem intervalos de classe
Neste caso, ainda temos:

AT = X (max) - X (min)

71
Exemplo:
Considerando a tabela abaixo:

Xi fi
0 2
1 6
2 12
3 7
4 3
Total 30
Temos: AT = 4 –0 = 4, logo AT = 4.

2.2.2 – Com intervalos de classe


Neste caso, a amplitude total é a diferença entre o limite superior da última
classe e o limite inferior da primeira classe:

AT = L (max) - l (min)

Exemplo:
Considerando a distribuição de frequência abaixo:

Classes fi
150 |------- 154 4
154 |------- 158 9
158 |------- 162 11
162 |------- 166 8
166 |------- 170 5
170 |------- 174 3
Total 40
Temos:
AT = 174 – 150 = 24, logo: AT = 24 cm.
A amplitude total tem o inconveniente de só levar em conta os dois valores
extremos da série, descuidando do conjunto de valores intermediários, o que
quase sempre invalida a idoneidade do resultado. Ela é apenas uma indicação
aproximada da dispersão ou variabilidade.

72
3 – Variância e Desvio-padrão
3.1 – Introdução:
A variância e o desvio-padrão levam em consideração a totalidade dos valores
da variável em estudo, o que faz delas índices de variabilidade bastante
estáveis e, por isso mesmo, os mais geralmente empregados.
A variância é uma medida que tem pouca utilidade como estatística descritiva,
porém é extremamente importante na inferência estatística e em combinações
de amostras.

A variância baseia-se nos desvios em torno da média aritmética, porém


determinando média aritmética dos quadrados dos desvios. Assim,
representando a variância por s2, temos:

Quando se tratar de uma amostra devemos usar no denominador n – 1.


Sendo a variância calculada a partir dos quadrados dos desvios, ela é um
número em unidade quadrada em relação à variável em questão, o que, sob o
ponto de vista prático é inconveniente.

Por isso mesmo, imaginou-se uma nova medida que tem utilidade e
interpretações práticas, denominada desvio-padrão, definida como a raiz
quadrada da variância e representada por S.

Quando se tratar de uma amostra devemos usar no denominador n – 1.


NOTA:

73
 Tanto o desvio-padrão como a variância são usados como medidas de
dispersão ou variabilidade. O uso de uma ou de outra dependerá da
finalidade que se tenha em vista.
Outra fórmula bastante utilizada para calcular o desvio-padrão de uma
população é:

3.2 – Propriedades do desvio-padrão


O desvio padrão é uma medida que só pode assumir valores não negativos e
quanto maior for o seu valor, maior será a dispersão dos dados.
Algumas propriedades do desvio padrão, que resultam imediatamente da
definição, são:
 Somando-se (ou subtraindo-se) uma constante a todos os valores de
uma variável, o desvio padrão não se altera.
yi = xi ± c → sy = sx
 Multiplicando-se (ou dividindo-se) todos os valores de uma variável por
uma constante (diferente de zero), o desvio padrão fica multiplicado
(ou dividido) por essa constante.
yi = xi . c → sy = c . sx
 O desvio padrão é sempre não negativo e será tanto maior, quanta mais
variabilidade houver entre os dados.
 Se s = 0, então não existe variabilidade, isto é, os dados são todos
iguais.
Essas propriedades nos permitem introduzir, no cálculo do desvio padrão
simplificações úteis.
Para o cálculo do desvio-padrão, consideremos os seguintes casos:

74
3.3 – Dados não-agrupados
Devemos empregar uma das duas fórmulas mostradas para cálculo do desvio-
padrão.
Exemplo: Calcular o desvio padrão da população representada por:
População = {10, 6, 1, 3, 5}
xi
10 5 5 25
6 5 1 1
1 5 -4 16
3 5 -2 4
5 5 0 0
-- -- ∑ = 46

Usando a fórmula:

Sabemos que n = 5 e que ∑ / n = 46 / 5 = 9,2.


Logo, a raiz quadrada de 9,2 é o desvio padrão, S = 3,03
Obs.: Podemos também calcular utilizando a outra fórmula possível.
Quando nosso interesse não se restringe à descrição dos dados, mas, partindo
da amostra, visamos tirar inferências válidas para a respectiva população,
convém efetuar uma modificação, que consiste em usar o divisor (n – 1) em
lugar de n. A fórmula ficará então:

Exemplo: Se os dados 10, 6, 1, 3 e 5 representassem uma amostra o desvio


padrão amostral seria a raiz quadrada de 46 / (5 -1) = 3,39

75
3.4 – Dados agrupados
Quando os dados estão agrupados (temos a presença de frequências) a fórmula
do cálculo do desvio padrão para uma população ficará:

Quando se trata de uma amostra devemos usar a seguinte fórmula:

Podemos também calcular o desvio-padrão populacional pela seguinte


fórmula:

Exemplo:
Calcule o desvio padrão populacional da tabela abaixo:
xi fi xi . f i .fi
0 2 0 2,1 -2,1 4,41 8,82
1 6 6 2,1 -1,1 1,21 7,26
2 12 24 2,1 -0,1 0,01 0,12
3 7 21 2,1 0,9 0,81 5,67
4 3 12 2,1 1,9 3,61 10,83
Total 30 63 -- Somatório 32,70

Sabemos que ∑ fi = 30 e ∑ . f i / n = 32,7 / 30 = 1,09.


A raiz quadrada de 1,09 é o desvio padrão, ou seja, s = 1,044

76
Se considerarmos os dados como sendo de uma amostra o desvio padrão seria:
A raiz quadrada de 32,7 / (30 -1) = 1,062
Obs: Nas tabelas de frequências com intervalos de classe a fórmula a ser
utilizada é a mesma do exemplo anterior.
No exemplo anterior a variância é igual a:
a) Para a população
S2 = (1,044)2 = 1,09
b) Para a amostra: S2 = (1,062)2 = 1,13

3.5 – Entendendo o significado do desvio-padrão:


Em termos simples, desvio-padrão é um modo de representar a dispersão dos
dados ao redor da média. Se os dados obedecerem a uma distribuição normal,
todos estarão compreendidos por uma curva em forma de sino; eles se
distribuirão simetricamente ao redor da média.
O quadro a seguir mostra os dados contidos entre desvio-padrão para ambos
os lados da média.

Média + ou – ( ) desvio- % da população incluída Grosseiramente


padrão
1 68,3 2/3 da população
1,96 95,0
2 95,5 95 % da população
2,58 99,0
3 99,7 100 % da população

77
1 - Aproximadamente 68% dos dados estão no intervalo

2 - Aproximadamente 95% dos dados estão no intervalo

78
4 – Coeficiente de Variação

O desvio padrão por si só não nos diz muita coisa. Assim, um desvio padrão
de duas unidades pode ser considerado pequeno para uma série de valores cujo
valor médio é 200; no entanto, se a média for igual a 20, o mesmo não pode
ser dito. Além disso, o fato de o desvio padrão ser expresso na mesma unidade
dos dados limita o seu emprego quando desejamos comparar duas ou mais
séries de valores, relativamente à sua dispersão ou variabilidade, quando
expressas em unidades diferentes.
Para contornar essas dificuldades e limitações, podemos caracterizar a
dispersão ou variabilidade dos dados em termos relativos a seu valor médio,
medida essa denominada coeficiente de variação (CV):

Exemplo:
Tomemos os resultados das medidas das estaturas e dos pesos de um mesmo
grupo de indivíduos:
S

Estaturas 175 cm 5,0 cm


Pesos 68 Kg 2,0 Kg
Temos:
CVE = 5/175 x 100 = 2,85%
CVP = 2/68 x 100 = 2,94%
Logo, nesse grupo de indivíduos, os pesos apresentam maior grau de dispersão
que as estaturas.

79
VIII - PROBABILIDADE
1 - Introdução:
O cálculo das probabilidades pertence ao campo da Matemática, entretanto a
maioria dos fenômenos de que trata a Estatística são de natureza aleatória ou
probabilística. O conhecimento dos aspectos fundamentais do cálculo da
probabilidade é uma necessidade essencial para o estudo da Estatística
Indutiva ou Inferencial.

2 - Experimento Aleatório

São fenômenos que, mesmo repetidos várias vezes sob condições semelhantes,
apresentam resultados imprevisíveis. O resultado final depende do acaso.

Exemplo:
Da afirmação "é provável que o meu time ganhe a partida hoje" pode resultar:
- que ele ganhe - que ele perca - que ele empate
Este resultado final pode ter três possibilidades.

3 - Espaço Amostral
No experimento aleatório "lançamento de uma moeda" temos o espaço
amostral: {cara, coroa}.
No experimento aleatório "lançamento de um dado" temos o espaço
amostral: {1, 2, 3, 4, 5, 6}.
No experimento aleatório "dois lançamentos sucessivos de uma moeda" temos
o espaço amostral:
{(ca,ca) ; (co,co) ; (ca,co) ; (co,ca)}

Ao conjunto desses resultados possíveis de um experimento aleatório damos o


nome de espaço amostral ou conjunto universo, representado por S.
.

80
Obs.: cada elemento do espaço amostral que corresponde a um resultado
recebe o nome de ponto amostral. No primeiro exemplo: cara pertence ao
espaço amostral {cara, coroa}.

4 - Eventos

É qualquer subconjunto do espaço amostral S de um experimento aleatório.

Se considerarmos S como espaço amostral e E como evento: Assim, qualquer


que seja E, se E está contido em S, então E é um evento de S.
Se E = S, E é chamado de evento certo.
Se E está contido em S e E é um conjunto unitário, E é chamado de evento
elementar.
Se E = Ø, E é chamado de evento impossível.

5 - Probabilidade
Dado um experimento aleatório, sendo S o seu espaço amostral, vamos
admitir que todos os elementos de S tenham a mesma chance de acontecer, ou
seja, que S é um conjunto equiprovável.

Exemplos:
1- No lançamento de uma moeda qual a probabilidade de obter “cara” em um
evento A?
S = {ca, co} = 2 A = {ca} = 1 P (A) = 1/2 = 0,5 = 50%

81
2- No lançamento de um dado qual a probabilidade de obter um “número par”
em um evento A?
S = {1,2,3,4,5,6} = 6 A = {2,4,6} = 3 P (A) = 3/6 = 0,5 = 50%
3- No lançamento de um dado qual a probabilidade de obter um “número
menor ou igual a 6” em um evento A?
S = {1,2,3,4,5,6} = 6 A = {1,2,3,4,5,6} = 6 P (A) = 6/6 = 1,0 = 100%
Obs: a probabilidade de todo evento certo é igual a 1 ou 100%.
4- No lançamento de um dado qual a probabilidade de obter um “número
maior que 6” em um evento A?
S = {1,2,3,4,5,6} = 6 A={ }=0 P (A) = 0/6 = 0 = 0%
Obs: a probabilidade de todo evento impossível é igual a 0 ou 0%

6 - Eventos Complementares
Sabemos que um evento pode ocorrer ou não. Sendo p a probabilidade de que
ele ocorra (sucesso) e q a probabilidade de que ele não ocorra (insucesso),
para um mesmo evento existe sempre a relação:

p+q=1

Obs.: Numa distribuição de probabilidades o somatório das probabilidades


atribuídas a cada evento elementar é igual a 1.
Logo temos: p1 + p2 + p3 + ... + pn = 1.
Exemplos:
1 - Sabemos que a probabilidade de tirar o nº 4 no lançamento aleatório de um
dado é p = 1/6. Logo, a probabilidade de não tirar o nº 4 no lançamento de um
dado é: q = 1 - p ou q = 1 - 1/6 = 5/6.
2 - Calcular a probabilidade de um piloto de automóveis vencer uma dada
corrida, onde as suas "chances", segundo os entendidos, são de "3 para 2".
Calcule também a probabilidade dele perder:

82
O termo "3 para 2" significa : De cada 5 corridas ele ganha 3 e perde 2. Então
p = 3/5 (ganhar) e q = 2/5 (perder).

7 - Eventos Independentes
Dizemos que dois eventos são independentes quando a realização ou a não-
realização de um dos eventos não afeta a probabilidade da realização do outro
e vice-versa.
Por exemplo, quando lançamos dois dados, o resultado obtido em um deles
independe do resultado obtido no outro.
Se dois eventos são independentes, a probabilidade de que eles se realizem
simultaneamente é igual ao produto das probabilidades de realização dos dois
eventos.
Assim, se p1 a probabilidade de realização do primeiro evento e a p2 a
probabilidade de realização do segundo evento, a probabilidade de que tais
eventos se realizem simultaneamente é dada por:

p = p1 x p2

Exemplo: Lançamos dois dados.


A probabilidade de obtermos 1 no primeiro dado é: p = 1/6
A probabilidade de obtermos 5 no segundo dado é: p = 1/6
Logo, a probabilidade de obtermos, simultaneamente, 1 no primeiro e 5 no
segundo é:
p = 1/6 x 1/6 = 1/36

8 - Eventos Mutuamente Exclusivos


Dizemos que dois ou mais eventos são mutuamente exclusivos quando a
realização de um dos eventos exclui a realização do(s) outro(s).
Assim, quando lançamos uma moeda, o evento “tirar cara” e o evento “tirar
coroa” são mutuamente exclusivos, já que, ao se realizar um deles, o outro não
se realiza.

83
Se dois eventos são mutuamente exclusivos, a probabilidade de que um ou
outro se realize é igual à soma das probabilidades de que cada um deles se
realize:

p = p1 + p2

Exemplo: Lançamos um dado. A probabilidade de se tirar 3 ou 5 é:


p = 1/6 + 1/6 = 1/3, pois como vimos, os dois eventos são mutuamente
exclusivos.

Exercícios Resolvidos
1 – Qual a probabilidade de sair o ás de ouros quando retirarmos uma carta de
um baralho de 52 cartas?
Resposta: Como só há um ás de ouros, o número de elementos do evento é 1;
logo: p = 1/52.
2 – Qual a probabilidade de sair um rei quando retirarmos uma carta de um
baralho de 52 cartas?
Resposta: Como há quatro reis no baralho, o número de elementos do evento
é 4; logo: p = 4/52 = 1/13.
3 – Em um lote de 12 peças, 4 são defeituosas. Sendo retirada uma peça,
calcule:
a. a probabilidade de essa peça ser defeituosa
Resposta: Temos p = 4/12 = 1/3.
b. a probabilidade de essa peça não ser defeituosa
Resposta: Temos p = 1 - 1/3 = 2/3.
4 – No lançamento de dois dados, calcule a probabilidade de se obter soma
igual a 5.
Resposta: O evento é formado pelos elementos (1,4), (2,3), (3,2) e (4,1). Como
o número de elementos de S é 36, temos: p = 4/36 = 1/9.

84
5 – De dois baralhos de 52 cartas retiram-se, simultaneamente, uma carta do
primeiro baralho e uma carta do segundo. Qual a probabilidade de a carta do
primeiro baralho ser um rei e a do segundo ser o 5 de paus?
Resposta: Como há quatro reis no baralho, o número de elementos do evento
é 4; logo: p1 = 4/52 = 1/13 e p2 = 1/52. Como esses dois acontecimentos são
independentes e simultâneos, vem: p = 1/13 x 1/52 = 1/676.
6 – Uma urna A contém: 3 bolas brancas, 4 pretas, 2 verdes; uma urna B
contém: 5 bolas brancas, 2 pretas, 1 verde; uma urna C contém: 2 bolas
brancas, 3 pretas e 4 verdes. Uma bola é retirada de cada urna. Qual a
probabilidade de as bolas retiradas da primeira, segunda e terceira urnas
serem, respectivamente, branca, preta e verde?
Resposta: Temos: p1 = 3/9 = 1/3; p2 = 2/8= 1/4 e p3 = 4/9. Como esses três
acontecimentos são independentes e simultâneos, vem: p = 1/3 x 1/4 x 4/9 =
1/27.
7 – De um baralho de 52 cartas retiram-se, ao acaso, duas cartas sem
reposição. Qual a probabilidade de a primeira carta ser o ás de paus e a
segunda ser o rei de paus?
Resposta: A probabilidade de sair o ás de paus na primeira carta é p1 = 1/52.
Após a retirada da primeira carta, restam 51 cartas no baralho, já que a
carta retirada não foi reposta. Assim, a probabilidade de a segunda carta ser
o rei de paus é p2 = 1/51. Como esses dois eventos são independentes, temos:
p = 1/52 x 1/51= 1/2652.
8 – Qual a probabilidade de sair uma figura quando retiramos uma carta de um
baralho de 52 cartas?
Resposta: Temos pR = 4/52 = 1/13, pD = 1/13 pV = 1/13. Como esses eventos
são mutuamente exclusivos, vem: p = 1/13 + 1/13 + 1/13 = 3/13.
9 – Qual a probabilidade de sair uma carta de copas ou de ouros quando
retiramos uma carta de um baralho de 52 cartas?
Resposta: Temos pC = 13/52 = 1/4, pO = 1/4. Como esses eventos são
mutuamente exclusivos, vem: p = 1/4 + 1/4 = 1/2.
10 – No lançamento de um dado, qual a probabilidade de se obter um número
não-inferior a 5?

85
Resposta: A probabilidade de se ter um número não-inferior a 5 é a
probabilidade de se obter 5 ou 6. Assim, p = 1/6 + 1/6 = 1/3.
11 – São dados dois baralhos de 52 cartas. Tiramos, ao mesmo tempo, uma
carta do primeiro baralho e uma carta do segundo. Qual é a probabilidade de
tirarmos uma dama e um rei, não necessariamente nesta ordem?
Resposta: A probabilidade de tirarmos uma dama do primeiro baralho é p =
4/52 = 1/13 e um rei do segundo é p = 4/52 = 1/13, de acordo com o
problema: p1 = 1/13 x 1/13= 1/169.
A probabilidade de tirarmos um rei do primeiro baralho e uma dama do
segundo é: p2 = 1/13 x 1/13= 1/169.
Como esses dois eventos são mutuamente exclusivos, temos: p = 1/169 +
1/169= 2/169.
12 – Dois dados são lançados conjuntamente. Determine a probabilidade de a
soma ser 10 ou maior que 10.
Resposta: A soma deverá ser então 10, 11 ou 12. Para que a soma seja 10, a
probabilidade é (4,6); (5,5) e (6,4), logo: p = 3/36. Para que a soma seja 11,
a probabilidade é (5,6) e (6,5), logo: p = 2/36. Para que a soma seja 12, a
probabilidade é (6,6), logo: p = 1/36.
Como esses três eventos são mutuamente exclusivos, temos: p = 3/36 + 2/36
+ 1/36 = 6/36 = 1/6.

86
IX – DISTRIBUIÇÕES BINOMIAL E NORMAL

Neste capítulo apresentaremos dois modelos teóricos de distribuição de


probabilidade, aos quais um experimento aleatório estudado possa ser
adaptado, o que permitirá a solução de grande número de problemas práticos.

1 - Experimento Aleatório

Suponhamos um espaço amostral S e que cada ponto amostral seja atribuído


um número. Fica, então, definida uma função chamada variável aleatória,
indicada por uma letra maiúscula, sendo seus valores indicados por letras
minúsculas.

Assim, se o espaço amostral relativo ao “lançamento de duas moedas” é S =


{(Ca, Ca), (Ca, Co), (Co, Ca), (Co, Co)} e se X representa “o número de
caras” que aparecem, a cada ponto amostral podemos associar um número
para X, de acordo com a tabela abaixo:

PONTO
X
AMOSTRAL
(Ca, Ca) 2
(Ca, Co) 1
(Co, Ca) 1
(Co, Co) 0

2 – Distribuição de Probabilidade
Consideremos a distribuição de freqüências relativa ao número de acidentes
diários em um estacionamento:

Nº DE
FREQUENCIAS
ACIDENTES
0 22
1 5
2 2
3 1
TOTAL 30

87
Em um dia, a probabilidade de:
- não ocorrer acidente é: p = 22/30 = 0,73
- ocorrer um acidente é: p = 5/30 = 0,17
- ocorrerem dois acidentes é: p = 2/30 = 0,07
- ocorrerem três acidentes é: p = 1/30 = 0,03
Podemos, então, escrever:

Nº DE
PROBABILIDADES
ACIDENTES
0 0,73
1 0,17
2 0,07
3 0,03
TOTAL 1,00
Essa tabela é denominada distribuição de probabilidade.

Seja X uma variável aleatória que pode assumir os valores x1, x2, x3, ....., xn. A
cada valor xi correspondem a probabilidade pi de ocorrência de tais pontos no
espaço amostral.
Assim, temos:
∑ pi = 1
Os valores x1, x2, x3, ....., xn e seus correspondentes p1, p2, p3, ....., pn definem
uma distribuição de probabilidade.

Assim, voltando a tabela inicial. Temos:

88
Logo, podemos escrever:

Nº DE CARAS (X) P(X)


0 1/4
1 2/4
2 1/4
∑=1

Ao definir a distribuição de probabilidade, estabelecemos uma


correspondência unívoca entre os valores da variável aleatória X e os valores
da variável P. Esta correspondência define uma função; os valores xi (i = 1, 2,
3, ...., n) formam o domínio da função e os valores de pi (i = 1, 2, 3, ...., n), o
seu conjunto imagem.
Essa função, assim definida, é denominada função probabilidade e
representada por:

f(x) = P(X = xi)

A função P(X = xi) determina a distribuição de probabilidade de variável


aleatória X.
Assim, ao lançarmos um dado, a variável aleatória X, definida por “pontos de
um dado”, pode tomar os valores 1, 2, 3, ........., 6.
Como a cada um destes valores está associada uma e uma só probabilidade de
realização e ∑ P(xi) = 1, fica definida uma função de probabilidade, da qual
resulta a seguinte distribuição de probabilidade:

X P(X)
1 1/6
2 1/6
3 1/6
4 1/6
5 1/6
6 1/6
∑=1

89
3 – Distribuição Binomial
Eventos binomiais são marcados pela existência de duas categorias,
mutuamente excludentes e coletivamente exaustivos. Mutuamente excludentes
significa que uma categoria implica a possibilidade da não-ocorrência
simultânea da outra categoria. Por coletivamente exaustivas entende-se que a
união de ambos os eventos resulta no espaço amostral.
Exemplos de eventos binomiais podem ser fornecidos por meio de números
pares e ímpares no lançamento de um dado honesto, e por meio da extração de
cartas vermelhas e pretas de um baralho.
Geralmente, em análises estatísticas, os exemplos mais comuns de eventos
binomiais são aqueles que estabelecem situações de sucesso e fracasso.
Situações de sucesso correspondem àquilo que se deseja estudar. Situações de
fracasso correspondem ao complemento. Ou seja, àquilo que não se deseja
estudar.
Vamos, neste item, considerar experimentos que satisfaçam a seguintes
condições:
a. O experimento deve ser repetido, nas mesmas condições, um número
finito de vezes (n).
b. As provas repetidas devem ser independentes, isto é, o resultado de uma
não deve afetar os resultados das sucessivas.
c. Em cada prova deve aparecer um dos dois possíveis resultados: sucesso
e insucesso.
d. No decorrer do experimento, a probabilidade p do sucesso e a
probabilidade q (q = 1 – p) do insucesso manter-se-ão constantes.
Resolveremos problemas do tipo: determinar a probabilidade de se obterem k
sucessos em n tentativas.
O experimento “obtenção de caras em cinco lançamentos sucessivos e
independentes de uma moeda” satisfaz essas condições. Sabemos que, quando
da realização de um experimento qualquer em uma única tentativa, se a
probabilidade de realização de um evento (sucesso) é p, a probabilidade de
não-realização desse mesmo evento (insucesso) é 1 – p = q.

90
Suponhamos, agora, que realizemos a mesma prova n vezes sucessivas e
independentes. A probabilidade de que um evento se realize k vezes nas
provas é dada pela função:

Na qual:
P(X = k) é a probabilidade de que o evento se realize k vezes em n provas;
p é a probabilidade de que o evento se realize em uma só prova – sucesso;
q é a probabilidade de que o evento não se realize no decurso dessa –
insucesso;

Essa função, denominada lei binomial, define a distribuição binomial.

Exercícios Resolvidos
1 – Uma moeda é lançada 5 vezes seguidas e independentes. Calcule a
probabilidade de serem obtidas 3 caras nessas 5 provas.

91
2 – Dois times de futebol, A e B, jogam entre si 6 vezes. Encontre a
probabilidade de o time A ganhar 4 jogos.

3 – Uma moeda honesta, que apresenta a mesma probabilidade de cara ou


coroa, é jogada quatro vezes. Deseja-se calcular a probabilidade de sair cara:
(a) uma vez; (b) três vezes, (c) pelo menos uma vez.
Neste caso, sabe-se que n é igual a 4 (número de lances da moeda); a
probabilidade de sair cara é igual a meio, ou p = 0,50. A probabilidade de sair
coroa também é igual a meio, ou q = 1 – p = 1 – 0,50 = 0,50.
A variável x varia para cada situação:
(a) Para calcular a probabilidade de ocorrer apenas uma cara, x = 1.
P(x = 1) = C4,1(0,50)1(0,50)4-1 = 0,25 ou 25%
(b) Para calcular a probabilidade de ocorrerem três caras, x = 3.
P(x = 3) = C4,3(0,50)3(0,50)4-3 = 0,25 ou 25%
(c) Pelo menos uma vez implica na aceitação do número de caras igual a 1,
2, 3 ou 4, ou na probabilidade de x = 1, ou x = 2, ou x = 3, ou x = 4. Ou,
de forma mais fácil, pelo menos uma vez implica na aceitação de
qualquer resultado menos o resultado x = 0.
P(x ≥ 1) = P(x = 1) + P(x = 2) + P(x = 3) + P(x = 4) = 1 - P(x = 0)
P(x ≥ 1) = 1 - C4,0(0,50)0(0,50)4-0 = 1 - 0,0625 = 0,9375 ou 93,75%

92
4 – A probabilidade de uma duplicata ser paga em dia é de 70%. Escolhemos
ao acaso seis duplicatas para uma auditoria. Deseja-se calcular a probabilidade
de: (a) todas serem pagas em atraso; (b) Apenas uma ser paga em dia; (c)
todas serem pagas em dia.
(a) Para calcular a probabilidade de todas serem pagas em atraso, ou
nenhuma ser paga em dia, temos x = 0.
P(x = 0) = C6,0(0,70)0(0,30)6-0 = 0,001 ou 0,1%
(b) Para calcular a probabilidade de apenas uma duplicata ser paga em dia,
temos x = 1.
P(x = 1) = C6,1(0,70)1(0,30)6-1 = 0,01 ou 1%
(c) Para calcular a probabilidade de todas as duplicatas serem pagas em
dia, temos x = 6.
P(x = 6) = C6,6(0,70)6(0,30)6-6 = 0,118 ou 11,8%
Exercícios propostos
1 – Determine a probabilidade de obtermos exatamente 3 caras em 6 lances de
uma moeda.
2 – Jogando-se um dado três vezes, determine a probabilidade de se obter um
múltiplo de 3 duas vezes.
3 – Dois times de futebol, A e B, jogam entre si 6 vezes. Encontre a
probabilidade de o time A:
a. Ganhar dois ou três jogos;
b. Ganhar pelo menos um jogo.
4 – A probabilidade de um atirador acertar o alvo é 2/3. Se ele atirar 5 vezes,
qual a probabilidade de acertar exatamente 2 tiros?
5 – Seis parafusos são escolhidos ao acaso da produção de certa máquina, que
apresenta 10% de peças defeituosas. Qual a probabilidade de serem
defeituosos dois deles?

93
4 – Distribuição Normal
Entre as distribuições teóricas de variável aleatória contínua, uma das mais
empregadas é a distribuição normal. Consiste em uma distribuição contínua
de probabilidades, onde a apresentação da distribuição de frequências f(x) de
uma variável qualitativa x costuma apresentar-se em forma de sino e simétrica
em relação à média.
O estudo da distribuição normal recebeu contribuições de matemáticos
importantes, como De Moivre, Laplace e Gauss. Alguns estudos revelam que
medições repetidas de uma mesma grandeza, como o diâmetro de uma esfera
ou o peso de determinado objeto, nunca forneciam os mesmos valores. Porém,
a apresentação das frequências dos inúmeros números coletados sempre
resultava em uma curiosa curva em forma de sino. Das observações surgiu o
nome curva “normal” dos erros.
Muitas das variáveis analisadas na pesquisa socioeconômica correspondem à
distribuição normal ou dela se aproximam.
O aspecto gráfico da distribuição normal é o da figura abaixo:

Os conceitos associados à distribuição Normal são simples. Em torno da


média, valor central, registra-se alta concentração de frequências ou
probabilidade maior de ocorrência. À medida que nos afastamos da média, as
frequências são reduzidas. A probabilidade de encontrarmos valores mais
distantes da média diminui. Quanto mais longe da média e dos valores
centrais, menores as frequências e as probabilidades.

94
Para uma perfeita compreensão da distribuição normal, observe a figura e
procure visualizar as seguintes propriedades:

1ª) A variável aleatória X pode assumir todo e qualquer valor real.


2ª) A representação gráfica da distribuição normal é uma curva em forma de
sino, que recebe o nome de curva normal ou de Gauss ou de Moivre.

3ª) A distribuição é simétrica em torno da média ( )


4ª) A área total limitada pela curva e pelo eixo das abscissas é igual a 1 ou à
percentagem de 100%, já que essa área corresponde à probabilidade de a
variável aleatória X assumir qualquer valor real.
5ª) A curva normal é assintótica em relação ao eixo das abscissas, isto é,
aproxima-se indefinidamente do eixo das abscissas sem, contudo, alcançá-lo.

6ª) Como a curva é simétrica em torno de , a probabilidade de ocorrer valor


maior do que a média é igual à probabilidade de ocorrer valor menor do que a
média, isto é, ambas as probabilidades são iguais a 0,5. Escrevemos:
P(X > ) = P(X < ) = 0,5.

Quando temos em mãos uma variável aleatória com distribuição normal,


nosso principal interesse é obter a probabilidade de essa variável aleatória
assumir um valor em um determinado intervalo. Vejamos como proceder, por
meio de um exemplo concreto.
A distribuição Normal de variável aleatória X depende dos parâmetros da
media e do desvio padrão, proveniente da variância. Então, pode ser também
representada desta maneira: X: N ( ,S2), ou seja, X segue uma distribuição
Normal de media e variância S2.
Seja X a variável aleatória que representa os diâmetros dos parafusos
produzidos por certa máquina. Vamos supor que essa variável tenha
distribuição normal com média = 2 cm e desvio padrão s = 0,04 cm.
Pode haver interesse em conhecer a probabilidade de um parafuso ter um
diâmetro com valor entre 2 e 2,05 cm.

95
É fácil notar que essa probabilidade, indicada por: P(2 < X < 2,05)
corresponde à área hachurada na figura:

O cálculo direto dessa probabilidade exige um conhecimento de Matemática


mais avançado do que aquele que dispomos no curso de ensino médio.
Entretanto, podemos contornar facilmente esse problema. Basta aceitar, sem
demonstração, que, se X é uma variável aleatória com distribuição normal de
média e desvio padrão s, e então a variável z:

tem distribuição normal reduzida, isto é, tem distribuição normal de média


0 e desvio padrão 1.
As probabilidades associadas à distribuição normal padronizada são
encontradas em tabelas, não havendo necessidade de serem calculadas.
Em anexo, é apresentada uma tabela de distribuição normal reduzida, que nos
dá a probabilidade de Z tomar qualquer valor entre a média 0 e um dado valor
z, isto é:
P(0 < Z < z)
Temos, então, que se X é uma variável aleatória com distribuição normal de
média e desvio padrão s, podemos escrever:

P( < X < x) = P(0 < Z < z), com

96
Voltemos, então, ao nosso problema.
Queremos calcular P(2 < X < 2,05). Para obter essa probabilidade,
precisamos, em primeiro lugar, calcular o valor de z que corresponde a
variável x = 2,05 (x = 2 → z = 0, pois = 2). Temos então:
Z = 2,05 – 2 / 0,04 = 1,25,
donde:
P(2 < X < 2,05) = P(0 < Z < 1,25)
Procuremos, agora, na tabela Z em anexo, o valor de z = 1,25.
Na primeira coluna encontramos o valor 1,2. Em seguida, encontramos, na
primeira linha, o valor 5, que corresponde ao último algarismo do número
1,25. Na intersecção da linha e coluna correspondentes encontramos o valor
0,3944, o que nos permite escrever:
P(0 < Z < 1,25) = 0,3944
Assim, a probabilidade de um parafuso fabricado por essa máquina apresentar
um diâmetro entre a média = 2 e o valor x = 2,05 é 0,3944.
Escrevemos, então:
P(2 < X < 2,05) = P(0 < Z < 1,25) = 0,3944 ou 39,44%.

97
Exercícios Resolvidos
1 – Determine as probabilidades:
a. P(-1,25 < Z < 0)
A probabilidade procurada corresponde à parte hachurada da figura:

Sabemos que: P(0 < Z < 1,25) = 0,3944


Pela simetria da curva, temos:
P(-1,25 < Z < 0) = P(0 < Z < 1,25) = 0,3944
b. P(-0,5 < Z < 1,48)
A probabilidade procurada corresponde à parte hachurada da figura:

Temos que:
P(-0,5 < Z < 1,48) = P(-0,5 < Z < 0) + P(0 < Z < 1,48)
Como:
P(-0,5 < Z < 0) = P(0 < Z < 0,5) = 0,1915 e P(0 < Z < 1,48)= 0,4306
Obtemos:
P(-0,5 < Z < 1,48) = 0,1915 + 0,4306 = 0,6221

98
c. P(0,8 < Z < 1,23)
A probabilidade procurada corresponde à parte hachurada da figura:

Temos que:
P(0,8 < Z < 1,23) = P(0 < Z < 1,23) - P(0 < Z < 0,8)
Como:
P(0 < Z < 1,23)= 0,3907 e P(0 < Z < 0,8)= 0,2881
Obtemos:
P(0,8 < Z < 1,23) = 0,3907 - 0,2881 = 0,1026

d. P(Z > 0,6)


A probabilidade procurada corresponde à parte hachurada da figura:

Temos que:
P(Z > 0,6) = P(Z > 0) - P(0 < Z < 0,6)
Como: P(Z > 0)= 0,5 e P(0 < Z < 0,6)= 0,2258
Obtemos:
P(Z > 0,6) = 0,5 - 0,2258 = 0,2742

99
e. P(Z < 0,92)
A probabilidade procurada corresponde à parte hachurada da figura:

Temos que:
P(Z < 0,92) = P(Z < 0) + P(0 < Z < 0,92)
Como:
P(Z < 0)= 0,5 e P(0 < Z < 0,92)= 0,3212,
Obtemos:
P(Z < 0,92) = 0,5 + 0,3212 = 0,8212

2 – Os salários semanais dos operários industriais são distribuídos


normalmente, em torno da média de R$ 500,00, com desvio padrão de R$
40,00. Calcule a probabilidade de um operário ter um salário semanal situado
entre R$ 490,00 e R$ 520,00.
Devemos inicialmente, determinar os valores da variável de
distribuição normal reduzida.
Assim,
Z1 = 490 – 500 = - 0,25 e Z2 = 520 – 500 = 0,5
40 40
Como:
P(490 < X < 520) = P(- 0,25 < Z < 0,5) = P(- 0,25 < Z < 0) +
P( 0 < Z < 0,5)= 0,0987 + 0,1915 = 0,2902
É, pois, de se esperar que, em média, 29,02% dos operários tenham
salários entre R$ 490,00 e R$ 520,00.

100
Exercícios Propostos

1 – Sendo Z uma variável com distribuição normal reduzida, calcule:


a. P(0 < Z < 1,44)
b. P(-0,85 < Z < 0)
c. P(- 1,48 < Z < 2,05)
d. P(0,72 < Z < 1,89)
e. P(Z > - 2,03)
f. P(Z > 1,08)
g. P(Z < - 0,66)
h. P(Z < 0,60)

2 – Um teste padronizado de escolaridade tem distribuição normal com média


100 e desvio padrão 10. Determine a probabilidade de um indivíduo
submetido ao teste ter nota:
a. Maior que 120
b. Maior que 80
c. Entre 85 e 115
d. Maior que 100
e. Qual a nota que apresenta 83,40% de probabilidade de acontecer

3 – No exercício anterior, qual a nota que apresenta 93,70% de probabilidade


de um aluno tirar acima dela?
4 – Os pesos de 600 estudantes são normalmente distribuídos com média 65,3
kg e desvio padrão 5,5 kg. Determine o número de estudantes que pesam:
a. Entre 60 e 70 kg
b. Mais que 63,2 kg
c. Menos que 68 kg

5 – A duração de um certo componente eletrônico tem média de 850 dias e


desvio padrão de 40 dias. Sabendo que a duração é normalmente distribuída,
calcule a probabilidade de esse componente durar:
a. Entre 700 e 1.000 dias
b. Mais de 800 dias
c. Menos de 750 dias

101
REFERENCIAS

Bruni, Adriano Leal. Estatística aplicada à gestão empresarial. 1.ed. São


Paulo: Editora Atlas, 2007.

Crespo, Antonio Arnot. Estatística fácil. 17.ed. São Paulo: Saraiva, 2002.

Hoffmann, Ronaldo; Ovalle, Vieira Sonia. Elementos de estatística. 4.ed.


São Paulo: Editora Atlas, 2003.

Morettin, Pedro A. Estatística básica. 5.ed. São Paulo: Saraiva, 2002.

Pinheiro, João Ismael D. Estatística básica: a arte de trabalhar com dados.


Rio de Janeiro: Elsevier, 2009.

Silva, Ermes Medeiro da; Silva, Elio Medeiro da; Gonçalves; Valter; Murolo,
Afrânio Carlos. Estatística: Para os cursos de economia, Administração e
Ciências Contábeis - 1. 3.ed. São Paulo: Editora Atlas, 1999.

Toledo, Geraldo Luciano; Ovalle, Ivo Izidoro. Estatística básica. 2.ed. São
Paulo: Editora Atlas, 1985.

102
ANEXOS:
 Arredondamentos;
 Compensações;
 Tabela de Números Aleatórios;
 Tabela de Distribuição Normal.

103
ARREDONDAMENTO DE DADOS

Muitas vezes, é necessário ou conveniente suprimir unidades inferiores às de


determinada ordem. Esta técnica é denominada arredondamento de dados.
De acordo com a resolução 886/66 do IBGE, o arredondamento é feito da
seguinte maneira:
1 - Quando o primeiro algarismo a ser abandonado é 0, 1, 2, 3 ou 4, fica
inalterado o último algarismo a permanecer.
Ex: 53,24 passa a 53,2
44,03 passa a 44,0
2 - Quando o primeiro algarismo a ser abandonado é 6, 7, 8 ou 9, aumenta-se
de uma unidade o algarismo a permanecer.
Ex: 53,87 passa a 53,9
44,08 passa a 44,1
44,99 passa a 45,0
3 - Quando o primeiro algarismo a ser abandonado é 5, há duas soluções:
a) Se ao 5 seguir em qualquer casa um algarismo diferente de zero, aumenta-
se uma unidade ao algarismo a permanecer.
Ex: 2,352 passa a 2,4
25,6501 passa a 25,7
76,250002 passa a 76,3

b) Se o 5 for o último algarismo ou se ao 5 só se seguirem zeros, o último


algarismo a ser conservado só será aumentando de uma unidade se for
ímpar.

104
Exemplos:
 24,75 passa a 24,8

 24,65 passa a 24,6

 24,75000 passa 24,8

 24,6500 passa a 24,6

Obs: Não devemos nunca fazer arredondamentos sucessivos.


Exemplo: 17,3452 passa a 17,3 e não para 17,35 e depois para 17,4.

COMPENSAÇÃO

Suponhamos os dados abaixo, aos quais aplicamos as regras do


arredondamento:
25,32 + 17,85 + 10,44 + 31,17 = 84,78
25,3 + 17,8 + 10,4 + 31,2 = 84,7
Verificamos que houve uma pequena discordância: a soma é exatamente 84,7
quando, pelo arredondamento, deveria ser 84,8. Entretanto, para a
apresentação dos resultados, é necessário que desapareça tal diferença, o que é
possível pela prática do que denominamos compensação, conservando o
mesmo número de casas decimais.
Usamos "descarregar" a diferença na (s) maior (es) parcela (s). Veja:
25,3 + 17,8 + 10,4 + 31,3 = 84,8
Obs: Se a maior parcela é igual ou maior que o dobro de qualquer outra
parcela, "descarregamos" a diferença apenas na maior parcela.

105
TABELA DE NÚMEROS ALEATÓRIOS

C1 C2 C3 C4 C5 C6 C7 C8 C9 C10 C11 C12 C13 C14 C15 C16 C17 C18 C19 C20 C21 C22 C23 C24 C25 C26 C27 C28 C29
L1 4 1 6 1 6 1 0 2 3 5 7 6 2 0 9 9 8 1 0 3 4 7 2 1 0 8 7 8 4
L2 3 0 7 2 6 3 9 5 5 3 4 8 8 0 9 3 0 1 7 0 4 0 8 3 1 2 0 1 2
L3 2 2 5 3 7 5 0 1 9 8 7 6 3 0 0 1 2 1 4 3 2 4 5 6 7 7 4 3 0
L4 1 9 8 4 7 7 8 6 5 2 7 8 1 0 0 7 5 3 2 2 5 8 1 9 0 3 2 3 4
L5 0 3 4 5 8 9 0 2 0 3 1 0 1 1 2 4 3 1 9 5 6 8 5 0 2 3 4 9 0
L6 0 8 9 6 8 1 7 2 2 2 2 8 6 1 9 4 5 2 0 0 1 3 1 0 9 2 3 4 1
L7 8 3 3 7 9 0 6 3 7 6 4 0 7 1 2 1 0 1 2 8 9 7 5 3 2 1 1 8 2
L8 8 8 0 8 9 2 3 6 3 7 3 7 8 9 4 3 9 2 3 2 3 0 0 4 4 2 3 1 3
L9 5 4 1 9 0 0 2 0 3 7 5 0 9 7 6 5 7 8 0 8 4 5 2 3 0 7 4 3 6
L10 6 7 2 0 0 3 1 1 1 2 6 0 2 0 8 0 9 7 7 7 3 6 7 2 9 0 3 1 0
L11 4 4 0 5 1 9 1 9 4 1 8 4 2 1 3 3 2 7 6 4 4 3 8 9 0 7 2 2 9
L12 3 5 1 4 3 3 0 3 2 3 7 0 3 4 5 8 9 3 5 2 4 0 1 7 9 1 8 1 3
L13 2 6 9 3 5 8 2 3 6 5 0 2 6 3 6 7 0 1 7 9 6 8 3 5 3 3 5 7 2
L14 0 1 2 2 7 4 0 7 0 7 9 0 0 6 5 2 7 8 1 0 0 7 5 3 0 9 1 1 3
L15 9 0 8 1 9 8 3 8 3 9 4 0 1 9 5 2 2 0 0 2 1 2 4 7 6 3 2 1 5
L16 7 2 2 0 2 5 0 5 3 2 1 3 5 8 9 1 2 3 9 6 5 2 7 8 1 0 0 7 0
L17 8 9 3 9 4 7 4 1 1 4 2 4 6 7 0 2 3 7 8 5 3 1 2 5 6 9 0 7 9
L18 6 3 0 8 6 6 0 1 4 6 2 2 3 3 0 1 5 4 5 1 1 3 4 7 8 1 2 8 8
L19 5 8 1 7 8 7 5 9 4 8 0 0 2 3 6 9 6 4 3 6 7 2 1 9 7 0 1 8 5
L20 3 4 0 6 0 1 9 8 4 0 2 9 2 3 2 5 3 5 7 2 7 8 2 5 6 2 2 9 4
L21 8 7 2 1 1 3 5 2 4 1 7 5 7 3 0 0 9 1 2 0 3 4 9 3 0 4 4 9 1
L22 1 4 9 1 3 2 8 6 1 2 0 2 0 1 3 5 4 6 4 3 2 0 0 3 9 6 6 0 2
L23 2 7 3 2 5 4 6 5 8 4 0 8 0 1 9 6 9 5 0 8 0 2 4 9 8 8 8 0 3
L24 4 3 8 2 7 3 7 8 0 3 0 9 2 2 6 7 6 4 9 8 9 4 7 7 7 0 0 2 4
L25 5 0 3 3 9 5 7 0 4 5 8 7 4 2 2 3 8 2 1 2 2 0 7 0 6 1 1 2 5
L26 2 5 7 3 0 4 2 2 6 6 1 1 0 3 9 9 1 0 3 4 3 9 6 3 5 3 3 4 8
L27 1 1 4 4 2 6 3 2 0 8 9 2 3 3 7 7 4 0 5 6 8 8 5 2 4 5 5 4 0
L28 0 2 7 4 3 6 4 3 1 7 1 0 2 0 9 6 4 3 7 9 0 7 6 1 3 7 5 5 8
L29 9 1 5 5 6 8 5 6 9 8 2 0 2 3 0 1 4 3 3 7 7 5 6 7 4 3 4 0 1

106
107
EXERCÍCIOS
DE
FIXAÇÃO

108
GENERALIDADES E CONCEITOS BÁSICOS
1 - Num estudo feito numa escola recolheram-se dados referentes às seguintes
variáveis:
(A) Idade, (B) Ano de escolaridade, (C) Sexo, (D) Nota da disciplina de
estatística, (E) Tempo gasto diariamente nos estudos, (F) Distância da casa à
escola, (G) Local de estudo, (H) Número de irmãos.
a) Das variáveis indicadas, quais são as quantitativas e quais são as
qualitativas?
b) Das variáveis quantitativas, quais são contínuas.
2 - Quais são os objetivos da Estatística descritiva?
3 - Pretendia-se fazer um estudo sobre o número de irmãos dos alunos do 10º
ano de escolaridade de uma Escola Secundária. Para isso, efetuou-se um
inquérito ao qual responderam 60 alunos.
a) Qual a população em estudo;
b) Qual a amostra em estudo;
c) Qual a variável em estudo e classifique-a.
4 - Diga por que as seguintes situações representam más amostras:
a) Para saber qual o candidato mais votado para a Câmara de determinada
cidade, ouviu-se a opinião dos clientes de determinado supermercado.
b) Para conhecer a situação financeira das empresas têxteis portuguesas,
verificou-se a situação das empresas que tiveram maior volume de
exportações, no último ano.

109
DISTRIBUIÇÃO DE FREQUENCIA E GRÁFICOS
1 - As alturas, em centímetros, dos alunos de uma turma do 10º ano são as
seguintes:
150 169 174 155 165 170 172
152 158 163 158 166 158 166
170 171 162 171 161 154 168
161 164 166 164 162 156 167

a) Construa uma tabela de frequências, agrupando os dados em classes.


b) Represente graficamente os dados, utilizando o tipo de gráfico que achar
mais conveniente.
2 - Num determinado teste realizado em 50 estudantes obteve-se as seguintes
pontuações:

Depois de ordenada a amostra faça a distribuição de frequência e determine:


a) A classe que contém a nota N na qual 50% dos alunos tenham nota menor
ou igual a N;
b) Qual a percentagem P de alunos com nota menor ou igual a 81
3 - Apresente os dados a seguir em uma distribuição de freqüência em classes
das idades dos funcionários da firma A. Os dados coletados destas idades
foram os seguintes:

43 - 34 -28 -19 - 54 - 32 -27 - 32 - 42 – 21 -18 - 23 - 34 - 31 - 26 - 25 - 32 - 46


- 21 - 19 - 23 - 25 - 26 - 32 - 31 - 39 - 43 - 42 - 47 – 50

Pede-se:
a) Ponto médio das classes, freq. Acumulada crescente, freq. acumulada
decrescente (absoluta e percentual). Justificar o objetivo do cálculo do ponto
médio das classes.

110
4 - Tempo em segundos para produzir uma unidade do produto A

61 65 43 53 55 51 58 55 59 56
52 53 62 49 68 51 50 67 62 64
53 56 48 50 61 44 64 53 54 55
48 54 57 41 54 71 57 53 46 48
55 46 57 54 48 63 49 55 52 51

a) Apresente os dados em uma distribuição de freqüência.


b) Faça um Histograma de freq. simples

5 - Considere a distribuição de freqüência transcrita a seguir:

PESO (Kg) FREQUÊNCIA


SIMPLES
2|---4 9
4|---6 12
6|---8 6
8|---10 2
10|---12 1

(a) 65% das observações têm peso não inferior a 4 Kg e inferior a 10 Kg.
(b) Mais de 65% das observações têm peso maior ou igual a 4 Kg.
(c) Menos de 20 observações têm peso igual ou superior a 4 Kg.
(d) A somados pontos médios dos intervalos de classe é inferior ao tamanho
da população.
(e) 8% das observações têm peso no intervalo de classe 8 |----10.

6 - Os dados abaixo se referem ao salário (em salários mínimos) de 20


funcionários administrativos em uma indústria.

10,1 - 7,3 - 8,5 - 5,0 - 4,2 - 3,1 - 2,2 - 9,0 - 9,4 - 6,1 - 3,3 - 10,7 - 1,5 - 8,2 -
10,0 - 4,7 - 3,5 - 6,5 - 8,9 - 6,1

a) construa uma tabela de freqüência agrupando os dados em intervalos de


amplitude 2 a partir de 1;
b) construa o histograma.

111
7 - Nas Tabelas 1 e 2 identifique a amplitude dos intervalos de classe e os
pontos médios de cada classe.

1) 2)

Ausências Freq. Ausências Freq.


0 |--- 6 39 0 |--- 10 22
6 |--- 12 41 10 |--- 20 40
12 |--- 18 38 20 |--- 30 71
18 |--- 24 40 30 |--- 40 44
24 |--- 30 42 40 |--- 50 23
Total 200 Total 200

8 - Construa a tabela de freqüências relativas, percentual e acumulada para


baixo para cada tabela do exercício 7.

9 - Compare e distribuição de dados da Tabela 1 com a distribuição de dados


da Tabela 2 do exercício 7. Qual é a diferença básica?

10 - Um conjunto de dados consiste em pesos de metal coletados de lares em


uma semana; esses pesos variam de 0,26 lb a 4,95 lb. Desejamos construir
uma Tabela de freqüências com 10 classes. Qual será o limite superior e
inferior da 1ª classe?

11 - A tabela abaixo apresenta a distribuição de freqüência dos salários


mensais em reais, de 65 empregados da companhia P & R:

Salários (R$) Nº de
Empregados
[5.000 - 6.000 [ 8
[6.000 - 7.000 [ 10
[7.000 - 8.000 [ 16
[8.000 - 9.000 [ 14
[9.000 - 10.000 [ 10
[10.000 - 11.000 [ 5
[11.000 - 12.000 [ 2
Total 65

112
Determinar:
a) O limite inferior da 6ª classe;
b) O limite superior da 4ª classe;
c) O ponto médio da 3ª classe;
d) A amplitude do 5º intervalo de classe;
e) A freqüência da 3ª classe;
f) A freqüência relativa da 3ª classe;
g) O intervalo de classe que tem a maior freqüência;
h) A percentagem de empregados que ganham menos de R$ 8.000 por mês;
i) A percentagem de empregados que ganham menos de R$ 10.000 e pelo
menos R$ 6.000 por mês;
j) Fazer um histograma;

MEDIDAS DE POSIÇÃO
1 - Num laboratório verifica-se que o peso médio das 20 cobaias utilizadas
para os ensaios clínicos era de 257 gramas. Posteriormente, verificou-se que a
balança estava mal calibrada, pelo que para todas as cobaias o peso indicado
era superior em 5 gramas ao peso verdadeiro. Então qual era efetivamente a
média dos pesos das cobaias?
2 - Se as medidas que utilizam para calcular a média dos pesos estivessem em
kg, como se refletiria este fato na média?
3 - O governo e o sindicato sentam-se à mesa das negociações para discutirem
os salários da função pública. Uma destas entidades quer que um dos pontos
de referência para o aumento dos salários seja a média, enquanto que a outra
pretende que seja a mediana. Qual destas medidas é a reivindicada pelo
sindicato?
4 – Marque a alternativa correta:
a) Em uma prova de Estatística, 3 alunos obtiveram a nota 8,2 ; outros 3
obtiveram a nota 9,0 ; 5 obtiveram a nota 8,6 ; 1 obteve a nota 7,0 e 1 a nota
8,9. Tirando a média aritmética, esta será:
1. - uma média aritmética simples com valor 8,0;
2. - uma média aritmética simples com valor 8,7;
3. - uma média aritmética ponderada com valor 8,0;
4. - uma média aritmética ponderada com valor 8,5;

113
5. - Nenhuma das anteriores
b) Um professor, após verificar que toda a classe obteve nota baixa, eliminou
as questões que não foram respondidas pelos alunos. Com isso, as notas de
todos os alunos foram aumentadas de 3 pontos. Então:
1. - a média aritmética ficou alterada, assim como a mediana.
2. - apenas a média aritmética ficou alterada.
3. - apenas a mediana ficou alterada.
4. - não houve alteração nem na média nem na mediana.
5. - nada podemos afirmar sem conhecer o número total de alunos.
c) Na tabela primitiva: {6, 2, 7, 6, 5, 4} a soma dos desvios em relação à
média aritmética é igual a:
1. - ao número - 4
2. - ao número 8
3. - ao número 0
4. - ao número 25
5. - ao número 4
d) A mediana da série {1, 3, 8, 15, 10, 12, 7} é:
1. - igual a 15
2. - igual a 10
3. - igual a 7
4. - igual a 3,5
5. Nenhuma das anteriores
e) Numa pesquisa de opinião, 80 pessoas são favoráveis ao divórcio, 50 são
desfavoráveis, 30 são indiferentes e 20 ainda não têm opinião formada a
respeito do assunto. Então a média aritmética será:
1. - igual a 180, porque todos opinaram somente uma vez.
2. - igual a 40, porque é a média entre os valores 50 e 30.

114
3. - igual a 45.
4. - igual a 1, porque todos opinaram somente uma vez.
5. - não há média aritmética.

5 - Registrou-se o número de assoalhadas de 100 apartamentos vendidos num


bairro residencial:
0; 0; 0; 1; 2; 0; 0; 1; 5; 1; 3; 1; 2; 0; 0; 0; 0;
4; 3; 5; 0; 4; 2; 2; 2; 1; 1; 1; 0; 3; 3; 4; 0; 1;
1; 0; 0; 2, 0; 0; 1; 3, 3; 4; 0; 1; 4; 4; 4; 5; 1;
2; 4; 1; 3; 3; 2; 5; 0; 5; 0; 2; 1; 2; 2; 3; 0; 3;
3; 2; 2; 2; 0; 0; 1; 3; 2; 2; 2; 2; 0; 0; 1; 0; 1;
0; 1; 1; 0; 0; 0; 1; 1; 1; 2; 1; 1; 0; 2; 1;

Elabore o quadro estatístico (de frequências) respectivo, desenhe o histograma


e calcule a média, mediana e a moda.

6 - Consideremos a distribuição salarial de 16 funcionários de uma certa


empresa que ocupam o mesmo cargo:
Salários (em R$) 70 74 82 91 95
Nº de funcionários 3 5 4 3 1
a) Desenhe o diagrama de barras, o polígono de frequências e o diagrama das
frequências acumuladas.
b) Calcule em R$ o salário médio, o salário mediano e o salário modal.

7 - Depois de examinar as encomendas feitas nos últimos meses a uma


companhia, o auditor escolhe aleatoriamente 20 das encomendas não pagas.
As dívidas dessas encomendas eram (em milhares de R$):
4 18 11 7 7 10 5 33 9 12
3 11 10 6 26 37 15 18 10 21

a) Calcule (em milhares de R$) a média, a mediana e a moda.

115
b) Suponha que há no total 350 encomendas não pagas. Use a média para
estimar (em milhares de R$) a dívida total à companhia.

8 - Para os seguintes dados, relativos às notas (de 0 a 10) dos alunos de 3


classes de um curso de Inglês, construa o diagrama de frequências acumuladas
e calcule a mediana.

Classe A 3 4 4 5 6 7 8 8 9
Classe B 3 4 4 4 5 5 5 6
Classe C 3 4 4 5 5 5 5 6

9 - Uma agência imobiliária vendeu 90 casas nos últimos 6 meses. Os dados


constam na tabela seguinte:

Preços (em mil R$) Nº de casas


0 |------- 50 11
50 |------- 75 15
75 |------- 90 38
90 |------- 105 14
105 |------- 120 8
120 |------- 135 3
135 |------- 150 1

a) Construa o histograma, o polígono de frequências e o polígono de


frequências acumuladas.
b) Calcule a média, a moda e a mediana.

10 - No quadro seguinte apresenta-se a distribuição das pensões de 100


inválidos dentro do regime de segurança social dos trabalhadores da
Administração Pública.

116
Pensões (em mil R$) Nº de pensionistas
14 |------- 16 10
16 |------- 18 14
18 |------- 20 15
20 |------- 22 22
22 |------- 24 17
24 |------- 26 14
26 |------- 28 8

a) Construa o histograma.
b) Calcule a média, a moda e a mediana.
11 - Considerar várias representações gráficas (por ex. histogramas referentes
a notas de várias turmas)

a) Comparar posição relativa das medianas das notas das 2 turmas;


b) Considere a 1ª classe. Espera que a média e a mediana das notas dessa
turma, estejam próximas?
c) Considere os dados da 2ª classe. Espera que a mediana seja superior à
média ou inferior?
DESVIO PADRÃO E VARIÂNCIA
1- Considere os seguintes conjuntos de números:
A = {10, 20, 30, 40, 50} B = {100, 200, 300, 400, 500}
Que relação existe entre os desvios padrões dos dois conjuntos de números?
2- Dados os conjuntos de números:
A = {220, 230, 240, 250, 260} B = {20, 30, 40, 50, 60}
Que relação existe entre os desvios padrões dos dois conjuntos de números?
3- Dados os conjuntos de números:
A = {-2, -1, 0, 1, 2 } B = {220, 225, 230, 235, 240}

117
Podemos afirmar, de acordo com as propriedades do desvio padrão, que o
desvio padrão de B é igual:
a) ao desvio padrão de A;
b) ao desvio padrão de A, multiplicado pela constante 5;
c) ao desvio padrão de A, multiplicado pela constante 5, e esse resultado
somado a 230;
d) ao desvio padrão de A mais a constante 230.

118
PROBABILIDADE
1- No lançamento de um dado temos S = {1,2,3,4,5,6}. Formule os eventos
definidos pelas sentenças:
a) Obter um número par na face superior do dado;
b) Obter um número menor ou igual a 6 na face superior;
c) Obter o número 4 na face superior;
d) Obter um número maior que 6 na face superior.

2 - No lançamento de duas moedas (uma de 10 centavos e outra de 5 centavos)


a) Qual é o espaço amostral?
b) Formule os eventos definidos pelas sentenças:
 Obter uma cara:
 Obter pelo menos uma cara:
 Obter apenas um cara:
 Obter no máximo duas caras:
 Obter uma cara e uma coroa:
 Obter uma cara ou uma coroa:
3- Um dado foi fabricado de tal forma que num lançamento a probabilidade de
ocorrer um número par é o dobro da probabilidade de ocorrer número ímpar
na face superior, sendo que os três números pares ocorrem com igual
probabilidade, bem como os três números ímpares. Determine a probabilidade
de ocorrência de cada evento elementar:
4- Seja S = {a,b,c,d}. Consideremos a seguinte distribuição de
probabilidades: P(a) = 1/8; P(b) = 1/8; P(c) = 1/4 e P(d) = x. Calcule o valor
de x:
5- As chances de um time de futebol T ganhar o campeonato que está
disputando são de "5 para 2". Determinar a probabilidade de T ganhar e a
probabilidade de T perder:

119
6- Três cavalos C1, C2 e C3 disputam um páreo, onde só se premiará o
vencedor. Um conhecedor dos 3 cavalos afirma que as "chances" de C1 vencer
são o dobro das de C2, e que C2 tem o triplo das "chances" de C3. Calcule as
probabilidades de cada cavalo vencer o páreo:

120
DISTRIBUIÇÃO BINOMIAL
1- Uma moeda é lançada 20 vezes. Qual a probabilidade de saírem 8 caras?
2 – Numa criação de coelhos, 40 % são machos. Qual a probabilidade de que
nasçam pelo menos 2 coelhos machos num dia em que nasceram 20 coelhos?
3 – Uma prova tipo teste tem 50 questões independentes. Cada questão tem 5
alternativas. Apenas uma das alternativas é a correta. Se um aluno resolve a
prova respondendo a esmo as questões, qual a probabilidade de tirar nota 5?
4 – Uma urna tem 20 bolas pretas e 30 brancas. Retiram-se 25 bolas com
reposição. Qual a probabilidade de que:
a. 2 sejam pretas?
b. Pelo menos 3 sejam pretas?
c. 10 sejam brancas?
5 – A probabilidade de um arqueiro acertar o alvo com uma única flecha é
0,20. Lança 30 flechas no alvo. Qual a probabilidade de que:
a. Exatamente 4 acertem o alvo?
b. Pelo menos 3 acertem o alvo?
6 – Considere 10 tentativas independentes de um experimento. Cada tentativa
admite sucesso com probabilidade 0,05. Seja X o número de sucessos, calcular
P (1 < x ≤ 4).
7 – Uma urna tem 10 bolas brancas e 40 pretas. Qual a probabilidade de que
em 30 bolas retiradas com reposição ocorram no máximo 2 brancas?
8 – A probabilidade de um atirador acertar no alvo num único tiro é 1/4. O
atirador atira 20 vezes no alvo. Qual a probabilidade de acertar:
a. Exatamente 5 vezes?
b. Pelo menos 3 vezes?
c. Nenhuma vez?
d. No máximo 4 vezes?

121
9 – Uma urna contém 8 bolas brancas e 12 pretas. Retiram-se 10 bolas com
reposição. Qual a probabilidade de que:
a. No máximo 2 sejam brancas?
b. 3 sejam brancas?
10 – A probabilidade de uma máquina produzir uma peça defeituosa, num dia,
é de 0,1. Qual a probabilidade de que em 20 peças produzidas pela máquina
num dia, ocorram 3 defeituosas?

122
DRISTIBUIÇÃO NORMAL
1 – Use a tabela Z para encontrar as seguintes probabilidades:
a. P (Z > 0,34)
b. P (Z < 1,85)
c. P (Z < - 1,24)
d. P (1,56 < Z < 2,37)
e. P (-0,37 < Z < 3,4)
f. P (Z > 1,08)
g. P (Z < - 0,66)
h. P (Z < -2,30 ou Z > 1,29)
2 – seja X: N (100,25). Calcular
a. P (100 ≤ X ≤ 106)
b. P (89 ≤ X ≤ 107)
c. P (112 ≤ X ≤ 116)
d. P ( X ≥ 108)
e. P ( X ≤ 90)
3 – Sendo X: N (50,16), determinar Xα, tal que:
a. P ( X ≥ Xα) = 0,05
b. P ( X ≤ Xα) = 0,99
4 – Um fabricante de baterias sabe, por experiência passada, que as baterias de
sua fabricação têm vida média de 600 dias e desvio padrão de 100 dias, sendo
que a duração tem aproximadamente distribuição Normal. Oferece uma
garantia de 312 dias, isto é, troca as baterias que apresentarem falhas nesse
período. A fábrica produz mensalmente 10.000 baterias. Quantas deverá trocar
mensalmente pelo uso da garantia?
5 – Uma fábrica de carros sabe que os motores de sua fabricação têm duração
normal com média de 150.000 km e desvio padrão de 5.000 km. Qual a

123
probabilidade de que um carro, escolhido ao acaso, dos fabricados por essa
firma, tenha um motor que dure:
a. Menos de 170.000 km?
b. Entre 140.000 e 165.000 km?
c. Se a fábrica substitui o motor que apresenta duração inferior à garantia,
qual deve ser esta garantia para que a porcentagem de motores
substituídos seja inferior a 0,2%?
6 – As pontuações de QI seguem uma distribuição normal com uma pontuação
média de 100 e desvio padrão de 15, isto é, X ~ N (100,225). Encontre a
porcentagem de pessoas que se espera possuir uma pontuação de QI:
a. De menos de 70?
b. Entre 80 e 120?
c. De mais de 50?
7 – Os salários dos diretores das empresas de São Paulo distribuem-se
normalmente com média de R$ 8.000,00 e desvio padrão de R$ 500,00. Qual
a percentagem de diretores que recebem:
a. Menos de R$ 6.470,00?
b. Entre R$ 8.920,00 e R$ 9.380,00?
8 – A quantidade de óleo contida em cada lata fabricada por uma indústria tem
peso distribuído normalmente, com média de 990 g e desvio padrão de 10 g.
Uma lata é rejeitada no comércio se tiver peso9 menor que 976 g.
a. Qual a probabilidade de que em 10 latas observadas, uma seja rejeitada?
b. Nas condições do item a, qual a probabilidade de que em 20 latas
observadas, 3 sejam rejeitadas?
9 – Foi feito um estudo sobre a altura dos alunos da IFCE. Observou-se que
ela se distribui normalmente com média de 1,72 m e desvio padrão de 5 cm.
Qual a porcentagem dos alunos com altura:
a. Entre 1,57 e 1,87 m?
b. Acima de 1,90 m?

124
10 – Um estudo das modificações dos preços, no atacado, de produtos
industrializados, mostrou que há distribuição normal com média de 50% e
desvio padrão de 10%. Qual a porcentagem dos artigos que:
a. Sofreram aumentos superiores a 75%?
b. Sofreram aumentos entre 30% e 80%?
11 – O volume de correspondência recebido por uma firma quinzenalmente
tem distribuição normal com média de 4000 cartas e desvio padrão de 200
cartas. Qual a percentagem de quinzenas em que a firma recebe:
a. Entre 3600 e 4250 cartas?
b. Mais de 4636 cartas?
c. Menos de 3400 cartas?
12 – Numa fábrica foram instaladas 1000 lâmpadas novas. Sabe-se que a
duração média das lâmpadas é de 800 horas e desvio padrão de 100 horas,
com distribuição normal. Determinar a quantidade de lâmpadas que durarão:
a. Menos de 500 horas?
b. Mais de 700 horas?
c. Entre 516 e 684 horas?
13 – Um fabricante de máquinas de lavar sabe, por longa experiência, que a
duração tem duração de suas máquinas tem distribuição normal com média de
1000 dias e desvio padrão de 200 dias. Oferece uma garantia de 1 ano (365
dias). Produz mensalmente 2000 máquinas. Quantas espera trocar
mensalmente pelo uso da garantia dada?

125

You might also like