You are on page 1of 148

PROBABILIDADE E

ESTATSTICA

autor do original

VALRIA APARECIDA FERREIRA

1 edio
SESES
rio de janeiro 2015

Conselho editorial sergio cabral, claudete veiga, claudia regina de brito


Autor do original Amir Abdala
Projeto editorial roberto paes
Coordenao de produo rodrigo azevedo de oliveira
Projeto grfico paulo vitor bastos
Diagramao fabrico
Reviso lingustica aderbal torres bezerra
Imagem de capa nome do autor shutterstock

Todos os direitos reservados. Nenhuma parte desta obra pode ser reproduzida ou transmitida
por quaisquer meios (eletrnico ou mecnico, incluindo fotocpia e gravao) ou arquivada em
qualquer sistema ou banco de dados sem permisso escrita da Editora. Copyright seses, 2015.

Dados Internacionais de Catalogao na Publicao (cip)


F383p

Ferreira, Valria

Probabilidade e estatstica / Valria Ferreira.

Rio de Janeiro : SESES, 2015.

128 p. : il.

ISBN 978-85-5548-091-1

1. Estatstica. 2. Estatstica aplicada. 3. Matemtica. 4. Probabilidades.

I. SESES. II. Estcio.


CDD 519.5

Diretoria de Ensino Fbrica de Conhecimento


Rua do Bispo, 83, bloco F, Campus Joo Ucha
Rio Comprido Rio de Janeiro rj cep 20261-063

Sumrio
Prefcio 7

1. Introduo Estatstica:
Anlise Exploratria de Dados

10

Breve histrico
Definio de Estatstica
Distribuio de frequncias
Mtodos grficos

11
11
14
20

2. Medidas de Posio

34

Mdia 34
Mediana (Md)
36
Moda (Mo)
37
Medidas Separatrizes: Quartis, Decis e Percentis
46

3. Medidas de Disperso

64

Exemplo Introdutrio
64
Amplitude Total (R)
65
Amplitude interquartil
66
Desvio-Padro (s)
66
Varincia (s2) 68
Coeficiente de Variao (cv)
69

Exemplo de aplicao das medidas de disperso


para dados no tabulados
Desvio-padro para dados tabulados
Varincia para dados tabulados
Exemplo de aplicao das medidas de disperso para dados tabulados

4. Noes de Probabilidade

69
72
73
74

86

Princpio Fundamental da Contagem (PFC)


87
Fatorial de um nmero natural
89
Arranjo 90
Permutao 91
Combinao 92
Breve histrico
93
Experimento Aleatrio, Espao Amostral, Evento
94
Operaes com Eventos
95
Probabilidade 98
Regras Bsicas de Probabilidade
100
Probabilidade Condicional
104
Independncia de eventos
107
Teorema de Bayes
109

5. Variveis aleatrias
Varivel Aleatria
Funo discreta de probabilidade
Valor esperado e varincia de uma varivel aleatria discreta
Modelos probabilsticos para variveis aleatrias Discretas

118
118
118
124
130

Prefcio
Prezados(as) alunos (as)
Estatstica uma palavra de origem latina, que significou por muito tempo cincia dos negcios do Estado. Ela pode ser vista como uma Matemtica
Aplicada, uma disciplina da rea das cincias exatas que tem aplicao em praticamente todas as reas de estudo. Esse fato serve para desmistificar o temor
vivido pelos alunos com relao ao ensino da matemtica em si (aquela que
ns aprendemos at o ensino mdio). As dificuldades enfrentadas e a falta de
conexo com a prtica so talvez os fatores que mais contribuem para que este
temor ocorra.
No entanto, o ensino da Estatstica, mesmo provocando sentimentos semelhantes aos estudantes, proporciona a esses uma viso prtica do contedo que
est sendo abordado. Mais que isso, ele possibilita, a quem o est aplicando, a
obteno de importantes informaes do fato que est sendo estudado. O conhecimento mnimo em Estatstica se tornou pr-requisito para ler um jornal
ou uma revista conceituada, pois muitas informaes se encontram resumidas
em tabelas ou grficos que grande parte da populao no tem condies de interpretar e por isso ignoram (ou no entendem) reportagens importantes para a
formao de uma pessoa esclarecida social, econmica e politicamente.
Procuramos, aqui, apresentar a Estatstica de forma clara e prtica. No com
o intuito de formar especialistas nessa rea, mas sim de proporcionar a voc,
futuro gestor, uma compreenso dos elementos bsicos que compem essa
cincia, visando a aplicao na sua rea de atuao. No tivemos a inteno de
esgotar o assunto, mas sim de apresentar os elementos necessrios para que
voc realize uma leitura satisfatria da realidade que o cerca e das informaes
que tm a sua volta.
Estudaremos duas reas da Estatstica: Estatstica Descritiva e a Probabilidade. No Captulo 1 apresentaremos os conceitos bsicos da Estatstica bem
como descrio de tcnicas para organizao e apresentao dos dados. Nos
Captulos 2 e 3 aprenderemos a calcular e interpretar as medidas de posio e
disperso. E, introduziremos, nos Captulos 4 e 5, conceitos de Probabilidade.
Abordaremos o clculo de probabilidades atravs do mtodo clssico e frequencial e estudaremos a distribuio de probabilidade Binomial.

Muitos dos exemplos aqui apresentados so hipotticos. So exemplos de


situaes que ocorrem de forma semelhante na realidade, mas os dados apresentados no so reais, foram criados apenas para ilustrar a aplicao do contedo apresentado.

1
Introduo
Estatstica: Anlise
Exploratria de Dados

1 Introduo Estatstica:
Anlise Exploratria de Dados
Neste primeiro captulo, apresentaremos alguns conceitos bsicos utilizados
pela Estatstica, alm de fornecer recursos de organizao, resumo e apresentao de dados atravs de tabelas e grficos.
Quando realizamos uma coleta de dados, geralmente estamos lidando com
uma quantidade muito grande de informaes. Portanto, torna-se imprescindvel a utilizao de certas tcnicas visando simplificar a leitura de tais informaes. Para que se tenha uma viso do todo (sobre o fenmeno que est sendo
estudado) precisamos, por exemplo, dispor as informaes em tabelas ou apresent-las em grficos. o que estaremos abordando num primeiro momento.
Logicamente, h mais tcnicas que podem ser aplicadas, mas elas sero vistas
nos prximos captulos.

OBJETIVOS
Aps o estudo dos conceitos e tcnicas apresentados neste captulo, esperamos que voc
consiga identificar os diferentes tipos de variveis que podem estar presentes em uma pesquisa, bem como, organizar, resumir e apresentar, atravs de tabelas e grficos de frequncias, as informaes contidas em grandes conjuntos de dados.

REFLEXO
Voc se lembra de j ter visto tabelas em jornais, livros ou revistas, em que eram utilizados
percentuais para indicar as frequncias de ocorrncias de respostas em uma pesquisa? Ou
com os percentuais referentes avaliao de um governo? Neste captulo, veremos como
(e para qu) construir tabelas dessa natureza, alm de elaborar grficos que representam os
resultados dessas tabelas.

10

captulo 1

1.1 Breve histrico


O interesse por levantamento de dados no algo que surgiu somente nos dias
atuais. H indcios de que 3000 anos A.C. j se faziam censos na Babilnia, China e Egito. Havia interesse dos governantes das grandes civilizaes antigas
por informaes sobre suas populaes e riquezas. Usualmente estas informaes eram utilizadas para taxao de impostos e alistamento militar.
A palavra Estatstica surgiu, pela primeira vez, no sc. XVIII. Alguns autores
atribuem esta origem ao alemo Gottfried Achemmel (1719-1772), que teria utilizado pela primeira vez o vocbulo Estatstica, em 1746.
Na sua origem, a Estatstica estava ligada ao Estado. Na atualidade, a Estatstica no se limita apenas ao estudo de dados demogrficos e econmicos. Ela
empregada em praticamente todas as reas do conhecimento, sempre que
estiverem envolvidas coleta e anlise de dados.

CONEXO
Para saber um pouco sobre a evoluo histrica da Estatstica, assista ao vdeo Histria da
Estatstica produzido pela Fundao Universidade de Tocantins, disponvel em: http://www.
youtube.com/watch?v=jCzMPL7Ub2k&feature=related

1.2 Definio de Estatstica


A Estatstica uma cincia que trata de mtodos cientficos para a coleta, organizao, descrio, anlise e interpretao (concluso) de um conjunto de
dados, visando a tomada de decises.
Podemos dividir a aplicao da Estatstica basicamente em trs etapas, que
so descritas resumidamente a seguir:
1. Refere-se coleta de dados, na qual devemos utilizar tcnicas estatsticas que garantiro uma amostra representativa da populao.
2. Depois dos dados coletados, devemos resumi-los em tabelas de frequncias e/ou grficos e, posteriormente, encontrar as medidas de posio e variabilidade (quantidades). Esta etapa tambm conhecida
como Estatstica Descritiva ou Dedutiva.

captulo 1

11

3. Esta etapa envolve a escolha de um possvel modelo que explique o comportamento dos dados para posteriormente se fazer a inferncia dos
dados para a populao de interesse. Esta etapa tambm chamada de
Estatstica Inferencial ou Indutiva. Nesta etapa, se faz necessrio um
conhecimento mais aprofundado, principalmente no que se refere aos
tpicos de probabilidades.
A probabilidade fornece mtodos para quantificar a incerteza existente em determinada situao, usando ora um nmero ora uma
funo matemtica.
Podemos citar inmeros exemplos da Estatstica em vrias reas do conhecimento, mas s para convenc-lo da importncia das tcnicas estatsticas, vamos dar alguns exemplos:
1. Se estamos interessados em abrir um supermercado em um determinado
local precisamos saber se fatores como sexo, grau de escolaridade, idade,
estado civil, renda familiar, entre outros, interferem na abertura deste supermercado e os tipos de produtos que devem ser priorizados nesse estabelecimento, alm de definir as estratgias de marketing mais eficientes.
2. Uma empresa, quando est interessada em lanar um novo produto no
mercado, precisa saber as preferncias dos consumidores. Para isso,
necessrio realizar uma pesquisa de mercado.
3. O gestor precisa saber escolher uma amostra representativa de uma populao de interesse para no perder muito tempo e, consequentemente, dinheiro da empresa em que trabalha.
4. Para se lanar um novo medicamento no mercado farmacutico, necessrio a realizao de vrias experincias. O medicamento deve ser
testado estatsticamente quanto sua eficincia no tratamento a que
se destina e quanto aos efeitos colaterais que pode causar, antes de ser
lanado no mercado.
5. Para uma empresa, muito importante fazer previses de demanda de
seus produtos. Para isto existem vrias tcnicas estatsticas como regresso linear, regresso logstica, anlise de sries temporais, etc.
6. Controles estatsticos de qualidade (ou controles estatsticos do processo) so indispensveis em todos os tipos de empresas. Eles so realizados
atravs de um conjunto de tcnicas estatsticas, geralmente aplicadas
por engenheiros de produo e administradores, para garantir o nvel de
qualidade exigido para a produo (ou servio) dentro de uma indstria.

12

captulo 1

So inmeras e diversificadas as aplicaes de tcnicas estatsticas que o


gestor pode utilizar. No conseguiremos falar sobre todas elas, mas apresentaremos os principais conceitos e tcnicas que quando utilizados podem auxiliar na tomada de decises. Comearemos por apresentar alguns conceitos
elementares bastante utilizados no processo estatstico.
Populao: o conjunto total de elementos (objetos, itens, medidas, etc.)
que tm determinada caracterstica que se deseja estudar.
Amostra: uma parte da populao de interesse que se tem acesso para desenvolver o estudo estatstico. Se a amostra no for fornecida no estudo, devemos retir-la da populao atravs de tcnicas de amostragem adequadas, para
que os resultados fornecidos sejam confiveis.
Estatstica Descritiva: a parte da estatstica que trata da organizao e do
resumo do conjunto de dados por meio de grficos, tabelas e medidas descritivas (quantidades).
Estatstica Indutiva: a parte que se destina a encontrar mtodos para tirar
concluses (ou tomar decises) sobre a populao de interesse, geralmente, baseado em informaes retiradas de uma amostra desta populao.
Varivel: a caracterstica de interesse no estudo. Vamos estudar dois tipos
de variveis: quantitativas e qualitativas.
Variveis quantitativas: so aquelas cujas respostas da varivel so expressas por nmeros (quantidades). Podemos distinguir dois tipos de variveis
quantitativas: quantitativa contnua e discreta.
Variveis quantitativas contnuas: so aquelas que podem assumir, teoricamente, infinitos valores entre dois limites (num intervalo), ou seja, podem assumir valores no inteiros. Por exemplo: altura (em metros) de alunos de uma
determinada faixa etria, peso (em kg), salrio, etc.
Variveis quantitativas discretas: so aquelas que s podem assumir valores
inteiros. Por exemplo: nmero de filhos por casal, nmero de livros em uma
biblioteca, nmero de carros vendidos, etc.
Variveis qualitativas: so as variveis cujas respostas so expressas por um atributo. Podemos distinguir dois tipos de variveis qualitativas: nominal e ordinal.
Variveis qualitativas nominais: definem-se como aquelas em que as respostas so expressas por um atributo (nome) e esse atributo no pode ser ordenado. Por exemplo: tipo sanguneo, religio, estado civil, etc.
Variveis qualitativas ordinais: tm suas respostas expressas por um atributo
(nome) e esse atributo pode ser ordenado. Por exemplo: grau de instruo, classe
social, etc.
captulo 1

13

1.3 Distribuio de frequncias


Para entendermos a ideia de distribuio de frequncias, vamos analisar a seguinte situao: quando um pesquisador termina de coletar os dados para sua
pesquisa, geralmente fica com muitos questionrios em mos (respondidos
pelas pessoas que foram sorteadas para pertencer a sua amostra) ou com os
dados digitados em alguma planilha eletrnica. O fato que os dados brutos
(sem tratamento) no trazem as informaes de forma clara, por isso devemos
tabular esses dados. Quando tabulamos os dados estamos resumindo as informaes para melhor compreenso da varivel em estudo. A esta tabulao damos o nome de distribuio de frequncias (ou tabela de frequncias).
Distribuio de frequncias uma tabela em que se resumem grandes quantidades de dados, determinando o nmero de vezes que cada dado ocorre (frequncia) e a porcentagem com que aparece (frequncia relativa).
Para facilitar a contagem do nmero de vezes que cada dado ocorre, podemos ordenar os dados. A uma sequncia ordenada (crescente ou decrescente)
de dados brutos damos o nome de Rol.
Os tipos de frequncias com os quais iremos trabalhar so:
Frequncia absoluta ou simplesmente frequncia (f): o n de vezes que
cada dado aparece na pesquisa.
Frequncia relativa ou percentual (fr): o quociente da frequncia absoluta
pelo nmero total de dados. Esta frequncia pode ser expressa em porcentagem. O valor de (fr x100) definido como fr (%).
Frequncia acumulada (fa): a soma de cada frequncia com as que lhe so
anteriores na distribuio.
Frequncia relativa acumulada (fra): o quociente da frequncia acumulada
pelo nmero total de dados. Esta frequncia tambm pode ser expressa em
porcentagem. O valor de (fra x100) definido como fra (%).
Exemplo 1.1: Dada a tabela abaixo, vamos definir qual a varivel em estudo e qual o tipo de varivel. Depois, completaremos a tabela de distribuio de
frequncias encontrando a frequncia relativa (%).

14

captulo 1

FAIXA DE
RENDA (EM
SALRIOS
MNIMOS)

NMERO DE
OPERRIOS (f)

FREQUNCIA
RELATIVA
(%) (fr)

0 | 2

43

39,09

2 | 4

39

35,45

4 | 6

16

14,55

6 | 8

7,27

8 | 10

3,64

Total

110

100

Tabela 1.1 Distribuio de renda de operrios de uma determinada empresa.

Em todos os nossos exemplos, na distribuio de frequncias construda com intervalos


de classes, vamos considerar que o intervalo de classe fechado esquerda e aberto
direita. Por exemplo, no caso dessa tabela, considerando a terceira classe de frequncia, podemos dizer que os 16 operrios que esto nesta classe recebem de 4 a menos
que 6 salrios mnimos por ms.

Resoluo
A varivel em estudo a renda dos operrios de uma determinada empresa. Esta varivel classificada como quantitativa contnua, pois pode assumir
qualquer valor dentro de um intervalo numrico.
As frequncias absolutas (f) so fornecidas no problema. As frequncias relativas (fr(%)) so encontradas dividindo cada frequncia absoluta (de cada classe de
frequncia) pelo total de operrios (110) e multiplicando por 100.

captulo 1

15

Uma distribuio de frequncias apresenta, basicamente, as 3 colunas


apresentadas na tabela 1.1. Desta maneira, conseguimos organizar de forma
resumida um conjunto de dados.
Em alguns estudos podemos ter interesse em outras quantidades relacionadas tabela, como, por exemplo, a frequncia acumulada ou a frequncia
acumulada (%). Veremos mais adiante que a frequncia acumulada utilizada
na construo de um grfico denominado Ogiva. A tabela 1.2 apresenta a frequncia acumulada e a frequncia relativa acumulada (%).

FAIXA DE
RENDA (EM
SALRIOS
MNIMOS)

NMERO
DE
OPERRIOS
(f)

0 | 2

fr(%)

FREQUNCIA
ACUMULADA
(fa)

fra (%)

43

39,09

43

39,09

2 | 4

39

35,45

82

75,55

4 | 6

16

14,55

98

89,09

6 | 8

7,27

106

96,36

8 | 10

3,64

110

100,00

Total

110

100

Tabela 1.2 Distribuio das frequncias acumuladas da varivel faixa de renda.

A coluna frequncia acumulada (fa) de cada classe obtida somando a frequncia da respectiva classe com as que lhe so anteriores e a fra (%) obtida
dividindo a fa pelo nmero total de dados e multiplicando por 100.
Exemplo 1.2: Uma determinada empresa resolveu traar o perfil socioeconmico de seus empregados. Uma das variveis estudadas foi o nmero de filhos, com idade inferior a 18 anos, de cada um dos empregados. A tabela 1.3
fornece a frequncia e a frequncia relativa (%) para cada valor obtido.

16

captulo 1

NMERO DE FILHOS

NMERO DE
OPERRIOS (f)

fr (%)

13,33

11

24,44

13

28,89

15,56

11,11

NMERO DE FILHOS

NMERO DE
OPERRIOS (f)

fr (%)

2,22

4,44

Total

45

100,00

Tabela 1.3 Distribuio de frequncias dos empregrados, segundo o nmero de filhos.

Para encontrarmos a fa e a fra (%) seguimos o mesmo procedimento que foi


utilizado na Tabela 1.2.
1.3.1 Agrupamento em classes
Como vimos no exemplo 1.1, para representar a varivel contnua renda, organizamos os dados em classes. Portanto, podemos dizer que a varivel renda
foi dividida em 5 classes de frequncias.
Quando agrupamos em classes de frequncias perdemos informaes, pois
no sabemos exatamente quais so os valores que esto contidos em cada uma das
classes (a no ser que seja possvel pesquisar esta informao no conjunto de dados brutos). Na anlise das tabelas de frequncias com intervalos de classes podemos identificar os seguintes valores:

captulo 1

17

Limite inferior (Li): o menor valor que a varivel pode assumir em uma
classe de frequncia.
Limite superior (Ls): serve de limite para estabelecer qual o maior valor que a
varivel pode assumir em uma classe de frequncia, mas, geralmente, os valores
iguais ao limite superior no so computados naquela classe e sim na seguinte.
Ponto mdio (Pm): a mdia aritmtica entre o Li e o Ls da mesma classe, ou
seja, Pm

Li + Ls
2

Amplitude (h): a diferena entre o Ls e o Li da classe, ou seja, h = Ls Li.


Amplitude total (ht): a diferena entre o LS da ltima classe de frequncia e
o Li da primeira classe, ou seja: ht = Ls Li.
Na construo de uma distribuio de frequncias com intervalos de classes devemos determinar o nmero de classes que uma tabela deve ter e qual o
tamanho (ou a amplitude) destas classes. Podemos usar o bom senso e escolher
arbitrariamente quantas classes e qual a amplitude que estas classes devem ter.
Em algumas situaes, iremos tabular dados para comparar os resultados com
informaes de outras tabelas. Nesse caso, melhor considerar as mesmas
classes das tabelas que iremos comparar.
Quando no tivermos nenhuma referncia sobre qual deve ser o nmero de
classes a se trabalhar, podemos utilizar o critrio que sugerido por vrios autores. Chama-se regra da raiz e ser apresentado a seguir
Considere:

k n e h

R
k

onde k o nmero de classes que vamos construir na tabela de frequncias;


n o tamanho da amostra que estamos trabalhando; h a amplitude de cada
uma das classes e R a amplitude total dos dados.

18

captulo 1

Os valores de k e h devem ser arredondados sempre para o maior valor. Por exemplo,
para uma amostra de tamanho n = 50 cujo menor valor 4 e o maior valor 445
temos que R = 441 (maior valor menor valor). O nmero de classes seria dado por

n = 50 = 7, 07106 8 (maior inteiro depois de 7) e a amplitude (tamanho)

de cada uma das 8 classes acima dever ser h

R 441
=
= 55,125 56 (maior
k
8

inteiro depois de 55). Ou seja, deveramos, para este exemplo, montar uma tabela com
8 classes e de amplitude 56. A tabela pode ser iniciada pelo menor valor do conjunto
de dados.

Resumindo, para montar uma tabela de frequncias com intervalos de classes devemos:
Achar o mnimo e o mximo dos dados.
Determinar as classes de frequncias, o que na verdade nada mais do que
escolher intervalos de mesmo comprimento que cubra a amplitude entre
o mnimo e o mximo. Para determinar o nmero de classes, usaremos
k n e para determinar o tamanho das classes usaremos h R .

Contar o nmero de observaes que pertencem a cada intervalo de classe. Esses nmeros so as frequncias observadas da classe.
Calcular as frequncias relativas e acumuladas de cada classe.
De modo geral, a quantidade de classes no deve ser inferior a 5 e nem
superior a 25.
Um outro critrio utilizado para construir distribuio de frequncias com
intervalos de classes a regra de Sturges.
Neste critrio, o nmero de classes a serem construdas obtido utilizando
a seguinte frmula:

k 1 + 3, 3 log n
onde:
k:nmero de classes
n:total da amostra
log n: logaritmo na base 10 de n

captulo 1

19

A amplitude de cada intervalo de classe obtida por:

=
h

amplitude total R
=
k
k

Devemos arredondar o valor de k para o nmero inteiro mais prximo, pois o nmero
de classes deve ser sempre inteiro. O arredondamento de h deve ser sempre efetuado
para cima usando o mesmo nmero de casas decimais dos elementos da amostra para
que nenhum elemento fique fora da tabela.

1.4 Mtodos grficos


O objetivo da utilizao de grficos em anlise de dados o de facilitar a compreenso do fenmeno estatstico por meio do efeito visual imediato que os
grficos proporcionam.
1.4.1 Tipos de grficos
Existem vrios tipos de grficos. Os mais usados so: grfico em linhas, diagramas de rea (como por exemplo: grfico em colunas, grfico em barras e grfico
em setores) e grficos para representar as distribuies de frequncias construdas com intervalos de classes (como por exemplo: polgono de frequncias,
histograma e ogiva).
Vamos saber um pouco quando usar e como construir cada um destes grficos.

CONEXO
Vamos refletir um pouco sobre a necessidade de abordagens pedaggicas para o ensino e
a aprendizagem de grficos acessando o endereo http://www.ufrrj.br/emanped/paginas/
conteudo_producoes/docs_22/carlos.pdf.

20

captulo 1

1.4.1.1 Grfico em linhas


Sempre que os dados estiverem distribudos segundo uma varivel no tempo
(meses, anos, etc.), assim como sucede com os dados do exemplo 1.3 figura
1.1, os dados podem, tambm, ser descritos atravs de um grfico em linhas.
Esse tipo de grfico retrata as mudanas nas quantidades com respeito ao tempo atravs de uma srie de segmentos de reta. muito eficiente para mostrar
possveis tendncias no conjunto de dados.
Exemplo 1.3: A tabela 1.4 fornece uma lista do nmero de assinantes de
telefones celulares, em milhes, de 1997 a 2007, do pas X. Construa um grfico
para resumir os dados da tabela a seguir.

ANO

ASSINANTES (EM MILHES)

1997

1,1

1998

1,3

1999

1,5

2000

1,9

2001

2,4

2002

2,6

2003

3,1

2004

7,4

2005

18,6

2006

21,5

2007

29

Tabela 1.4 Assinantes de telefones celulares, em milhes, de 1997 a 2007.

captulo 1

21

O grfico que melhor representa este conjunto de dados o grfico em linhas, j que os dados se reportam a uma srie no tempo (srie temporal). O
grfico est ilustrado na figura 1.1.
35
29

Assistentes (em milhes)

30
25

21,5
18,6

20
15
10
5
0

7,4
1,1

1996

1,3
1998

1,5

1,9
2000

2,4

2,6
2002
Anos

3,1

2004

2006

2008

Figura 1.1 Grfico em linha para os dados de assinantes de telefones celulares.

1.4.1.2 Grfico (ou Diagrama) em Barras (ou Colunas)


Os diagramas em barras (ou colunas) so bastante utilizados quando trabalhamos
com variveis qualitativas (dados categricos). No eixo horizontal especificamos os
nomes das categorias e no eixo vertical construmos uma escala com a frequncia
ou a frequncia relativa. As barras tero bases de mesma largura e alturas iguais
frequncia ou frequncia relativa. O grfico em barras, quando as barras esto
dispostas no sentido vertical, tambm chamado de grfico em colunas.

ATENO
Quando construmos o grfico de barras para variveis qualitativas e as barras so arranjadas em ordem descendente de altura, a partir da esquerda para a direita, com o atributo que
ocorre com maior frequncia aparecendo em primeiro lugar, denominamos este grfico de
barras de Diagrama de Pareto.

22

captulo 1

Exemplo 1.4: Uma grande indstria de materiais de construo, com diversas lojas espalhadas pelo pas, fez um levantamento das principais causas de
perda de ativos durante o ano de 2007 e as informaes esto dispostas na tabela seguinte.

CAUSAS

VALOR PERDIDO (MILHES DE


REAIS)

M administrao

5,2

Roubos de funcionrios

3,9

Fraudes nas vendas

5,5

Assaltos s lojas

1,8

Perda do estoque

1,6

Atendimento ruim

0,8

Tabela 1.5 Causas de perda de ativos durante o ano de 2007.

6
4

Atendimento ruim

Perda de estoque

Assaltos s lojas

Fraudes nas vendas

Roubos de funcionrios

M administrao

Valor Perdido (milhes de reais)

Graficamente, podemos representar este conjunto de dados de trs formas


diferentes: grfico em colunas, grfico em barras e o grfico em setores (ou pizza ou circular), que ser apresentado no prximo item.

Figura 1.2a Grfico em colunas para a varivel Causas de perdas de ativos.

captulo 1

23

Atendimento ruim
Perda do estoque

Causas

Assalto s lojas
Fraudes nas vendas

Roubos de funcionrios
M administrao
0

1
2
3
4
Valor perdido (milhes de reais)

Figura 1.2b Grfico em barras para a varivel Causas de perdas de ativos.

1.4.1.3 Grfico (ou Diagrama) em Setores


O diagrama em setores, tambm conhecido como grfico de pizza, um dos
grficos mais utilizados para representar variveis qualitativas (ou categricas)
e bastante apropriado quando se deseja visualizar a proporo que cada categoria representa do total.
Vamos utilizar os dados do Exemplo 1.4 para mostrar um grfico em setores.
Valor Perdido (milhes de reais)
Perda de estoque
8%

Atendimento ruim

M administrao

Assaltos s lojas
10%

Fraudes nas vendas


29%

Roubos de
Funcionrios
21%

Figura 1.3 Grfico em setores para a varivel Causas de perdas de ativos.

24

captulo 1

Os grficos que sero apresentados a seguir so grficos construdos segundo uma distribuio de frequncias com intervalos de classes. So eles: o histograma, o polgono de frequncias e a ogiva.
1.4.1.4 Histograma
Um histograma semelhante ao diagrama de barras, porm refere-se a uma
distribuio de frequncias para dados quantitativos contnuos. Por isso,
apresenta uma diferena: no h espaos entre as barras. Os intervalos de
classes so colocados no eixo horizontal enquanto as frequncias so colocadas no eixo vertical. As frequncias podem ser absolutas ou relativas.
Exemplo 1.5: A tabela a seguir apresenta o salrio de funcionrios de uma
empresa no interior de Minas Gerais.

SALRIO (R$)

FREQ. ABSOLUTA (f)

FREQ. ACUMULADA
(fa)

400,00 | 800,00

38

38

800,00 | 1.200,00

18

56

1.200,00 | 1.600,00

12

68

1.600,00 | 2.000,00

76

2.000,00 | 2400,00

84

2.400,00 | 2.800,00

89

2.800,00 | 3.200,00

92

3.200,00 | 3.600,00

92

3.600,00 | 4.000,00

94

4.000,00 | 4.400,00

94

4.400,00 | 4.800,00

95

Total

95

Tabela 1.6 Distribuio de frequncias dos salrios dos funcionrios de uma empresa no
interior de Minas Gerais.

captulo 1

25

4400,00 | 4800,00

4000,00 | 4400,00

3600,00 | 4000,00

3200,00 | 3600,00

2800,00 | 3200,00

2400,00 | 2800,00

2000,00 | 2400,00

1600,00 | 2000,00

1200,00 | 1600,00

800,00 | 1200,00

40
35
30
25
20
15
10
5
0

400,00 | 800,00

Frequncia

Como os dados da tabela 1.6 esto apresentados em intervalos de classes podemos represent-los graficamente atravs de um histograma ou do polgono de
frequncias, como mostram as figuras 1.4 e 1.5, respectivamente.

Salrio (R$)

Figura 1.4 Histograma dos salrios dos funcionrios de uma empresa no interior de Minas
Gerais.

1.4.1.5 Polgono de Frequncias


Podemos dizer que o polgono de frequncias um grfico de linha de uma
distribuio de frequncias. No eixo horizontal so colocados os pontos mdios de cada intervalo de classe e no eixo vertical so colocadas as frequncias
absolutas ou relativas (como no histograma). Para se obter as interseces do
polgono com o eixo das abscissas, devemos encontrar o ponto mdio da classe
anterior primeira e o ponto mdio da classe posterior ltima.

CONEXO
Para se ter uma ideia da importncia da organizao dos dados em tabelas de frequncias e
da construo do histograma, leia A Estatstica na Prtica em: ANDERSON, David R.; SWEENEY, Denis J.; WILLIAMS, Thomas A. Estatstica aplicada administrao e economia. So
Paulo: Pioneira Thomson Learning, 2003, pp. 37 e 38.

26

captulo 1

O histograma e o polgono de frequncias so grficos alternativos e contm a mesma informao. Fica a critrio de quem est conduzindo o estudo a
escolha de qual deles utilizar.
Considerando os dados do exemplo 1.5, temos o polgono de frequncias
representado pela figura 1.5.
40

38

35

30

Frequncia

25
20

18

15
12
10
8

0
200

600

1000

1400

1800

2200

2600

3000

3400

0
3800

4200

4600

0
5000

Ponto mdio das faixas salariais (R$)

Figura 1.5 Polgono de frequncias dos salrios dos funcionrios de uma empresa no
interior de Minas Gerais.

Para finalizarmos o estudo de grficos, vamos apresentar um grfico denominado ogiva.


1.4.1.6 Ogiva
Uma ogiva um grfico para uma distribuio de frequncias acumuladas. Utilizando o exemplo 1.5, a terceira coluna traz a frequncia acumulada dos dados
e a ogiva fica representada pela figura 1.6.

captulo 1

27

Para construir um grfico de ogiva, devemos usar o limite superior de cada intervalo
no eixo horizontal e a frequncia acumulada no eixo vertical. A frequncia acumulada
relacionada com o limite inferior da primeira classe sempre zero.

100
90
80
Frequncia Acumulada

70
60
50
40
30
20
10
0
400 800 1200 1600 2000 2400 2800 3200 3600 4000 4400 4800
Salrio (R$)

Figura 1.6 Ogiva dos salrios dos funcionrios de uma empresa no interior de Minas Gerais.

ATIVIDADE
1. Classifique as variveis a seguir em quantitativas (discretas ou contnuas) ou qualitativas
(nominal ou ordinal).
a) Cor dos olhos.
b) Nmero de peas produzidas por hora.
c) Dimetro externo.
d) Nmero de pontos em uma partida de futebol.
e) Produo de algodo.
f) Salrios dos executivos de uma empresa.
g) Nmero de aes negociadas na bolsa de valores.
h) Sexo dos filhos.
i) Tamanho de pregos produzidos por uma mquina.
j) Quantidade de gua consumida por uma famlia em um ms.

28

captulo 1

k) Grau de escolaridade.
l) Nvel social.
m) Tipo sanguneo.
n) Estado civil.
2. A seguir temos as idades dos funcionrios de uma determinada empresa. Fazer uma
distribuio de frequncias, agrupando os dados em classes. OBS.: A tabela de distribuio de frequncias deve ser completa com f, fr e fa.
Idades (dados brutos)
48

28

37

26

29

59

27

28

30

40

42

35

23

22

31

21

51

19

27

28

36

25

40

36

49

28

26

27

41

29

Baseado na tabela de frequncias construda, responda:


a) Quantos so os funcionrios com idade inferior a 33 anos?
b) Que porcentagem de funcionrios tem idade igual ou superior a 47 anos?
c) Quantos so os funcionrios com idade maior ou igual a 26 anos e no tenham
mais que 40 anos?
d) Qual a porcentagem de funcionrios com idade abaixo de 40 anos?
e) Qual a porcentagem de funcionrios que tm no mnimo 40 anos?
3. Uma agncia de turismo est interessada em saber o perfil dos seus clientes com relao
varivel estado civil. Para isso, o gerente desta agncia pediu ao funcionrio do setor de vendas para fazer um grfico que resuma estas informaes. Construa o grfico e interprete-o.

ESTADO CIVIL

NMERO DE CLIENTES

Solteiro

2600

Casado

900

Vivo

345

Separado

1200

Outros

1020

Total

6065

captulo 1

29

4. Um consultor estava interessado em saber quanto, geralmente, cada pessoa gastava em um


determinado supermercado no primeiro sbado aps receberem seus pagamentos (salrios). Para isso ele entrevistou 50 clientes que passaram pelos caixas entre 13h e 18h, e
anotou os valores gastos por cada um deles. Estes valores esto listados a seguir:
4,89

11,00

5,60

73,85

24,83

98,00

186,00

234,87

58,00

198,65

223,86

341,42

94,76

445,76

82,80

35,00

455,00

371,00

398,60

234,00

64,90

54,98

48,80

68,90

120,32

126,98

76,43

6,35

9,98

12,68

243,00

18,65

134,90

11,10

321,09

290,76

74,00

48,80

74,52

138,65

26,00

210,13

15,78

197,45

75,00

76,55

32,78

166,09

105,34

99,10

Analisando o conjunto de dados, responda os seguintes itens:


a) Qual a varivel em estudo? Classifique-a.
b) Construa uma tabela de frequncias a partir do conjunto de dados brutos.
c) Construa um histograma e um polgono de frequncias para a tabela construda no
item b).

45

17

1700| 2100

2
2400| 2700

2100| 2400

4
1400| 1700

1100| 1400

12

800| 1100

50
45
40
35
30
25
20
15
10
5
0

500| 800

Frequncia

5. Analise o grfico a seguir e responda:

Salrio (R$)

d) Qual a varivel em estudo? Classifique-a.


a) Quantos

funcionrios

ganham

entre

R$

800,00

(inclusive)

R$ 1.100,00 (exclusive)?
b) Qual o nmero de funcionrios total desta empresa?
c) Qual a porcentagem de funcionrios que ganham R$ 1.700,00 ou mais?

30

captulo 1

d) Qual a porcentagem de funcionrios que ganham entre R$ 500,00 (inclusive) e no


mais que R$ 1.100,00?
e) A partir do histograma, monte uma tabela de distribuio de frequncias.

REFLEXO
Estamos encerrando nosso primeiro captulo. Vimos, aqui, alguns conceitos que sero fundamentais na compreenso do restante do contedo de Estatstica. J deve ter dado para
perceber que, mesmo estando no incio da disciplina, as aplicaes prticas que voc poder
fazer na sua rea de atuao sero muitas. A compreenso e interpretao das mais variadas
informaes, com as quais nos deparamos em nosso cotidiano, dependem, em parte, do conhecimento de certos elementos estatsticos.
Estamos apenas no comeo. Muitas tcnicas (muito interessantes!) ainda sero abordadas.
E lembre-se que o conhecimento e o domnio da Estatstica certamente levaro voc, futuro
gestor, s decises mais acertadas.

LEITURA
Recomendamos a leitura do texto Como analisar de forma simples um grande nmero de
dados?, disponvel no endereo:
< http://www.klick.com.br/materia/20/display/0,5912,POR-20-91-931-,00.html >
Este texto aborda de maneira clara alguns procedimentos que podem ser utilizados quando
nos deparamos com situaes em que precisamos resumir as informaes de grandes
conjuntos de dados.

REFERNCIAS BIBLIOGRFICAS
ANDERSON, David R.; SWEENEY, Denis J.; WILLIAMS, Thomas A. Estatstica aplicada
administrao e economia. So Paulo: Pioneira Thomson Learning, 2003.
COSTA NETO, Pedro Luiz de Oliveira. Estatstica, So Paulo: Edgard Blucher, 2002.
DOWNING, Douglas; CLARK, Jeffrey. Estatstica aplicada. So Paulo: Saraiva, 2002.

captulo 1

31

FARIAS, Alfredo Alves de; SOARES, Jos Francisco; CSAR, Cibele Comini. Introduo
estatstica. Rio de Janeiro: LTC, 2003.
MEMRIA, Jos M. P. Breve Histria da Estatstica. Disponvel em: <http://www.im.ufrj.
br/~lpbraga/prob1/historia_estatistica.pdf>. Acesso em: 25 setembro 2014.
TRIOLA, Mario F.. Introduo estatstica. Rio de Janeiro: LTC, 1999.
VIEIRA, Sonia. Elementos de estatstica. So Paulo: Atlas, 2003.

NO PRXIMO CAPTULO
Se at agora vimos como organizar, resumir e apresentar os dados (informaes) em tabelas
e grficos, no prximo captulo iremos incrementar esse processo atravs da insero das
medidas de posio e disperso. So medidas que iro, de certa forma, representar o conjunto como um todo. Um exemplo bem conhecido de medida de posio (ou de tendncia
central) a mdia e com relao medida de disperso podemos citar o desvio-padro. No
so raras as situaes em que a mdia utilizada para representar a tendncia central dos
dados e o desvio-padro para representar a variabilidade do conjunto de dados.
Alm destas, veremos outras tambm importantes e com larga aplicao no estudo dos dados.

32

captulo 1

2
Medidas de Posio

2 Medidas de Posio
Nesse captulo, aprenderemos como caracterizar um conjunto de dados atravs
de medidas numricas que sejam representativas de todo o conjunto.
As medidas de posio, tambm chamadas de medidas de tendncia central,
tm o objetivo de representar o ponto central de um conjunto de dados. As mais
conhecidas so a mdia, a mediana e a moda. Alm dessas medidas, podemos
citar outras medidas de posio importantes, que no necessariamente so
centrais. So ela os quartis, os decis e os percentis. Vamos estudar cada uma
dessas medidas de posio (estatsticas).
Primeiramente, vamos fazer um estudo para os dados no tabulados, ou seja,
quando os dados no estiverem na forma de distribuio de frequncia. Em seguida, as mesmas medidas sero calculadas com base em dados tabulados.

OBJETIVOS
Por meio do estudo deste captulo, esperamos que voc seja capaz de calcular e de interpretar as medidas de posio aplicadas a conjuntos de dados.

REFLEXO
Voc se lembra das situaes para as quais j calculou uma mdia? Que tipo de informao
essa medida fornece? Para que serve? Para aplicar e interpretar medidas como ela, necessrio conhec-las bem. Vamos, ento, realizar um estudo detalhado da mdia e de outras
medidas de mesma natureza.

2.1 Mdia
A mdia aritmtica a mais comum e mais simples de ser calculada dentre todas as medidas de posio mencionadas.

34

captulo 2

Para calcul-la, basta fazer a diviso da soma de todos os valores (x1, x2, ..., xn )
da varivel pelo nmero deles (n):
n

x=

xi
i =1

(2.1)

em que:
x = a mdia aritmtica;
xi = os valores da varivel;
n = o nmero de valores.
Outro tipo de mdia que podemos encontrar a mdia geomtrica. Ela muito
utilizada no clculo da taxa mdia de retorno de investimentos.
A mdia geomtrica entre nmeros reais x1 x2,,xn definida como sendo a
raiz n-sima do produto dos n termos (ou, alternativamente) o produto dos n termos elevado ao inverso do nmero de termos, ou seja:

G=

x1 x 2 x 3 ... x n
ou
1
n

(x1 x 2 x 3... x n )

n
i =1

xi

1
n

em que i = 1 x i indica o produtrio de xi, para i variando de 1 a n.


Em algumas circunstncias no faz sentido calcular a mdia geomtrica:
Quando um dos valores do conjunto de dados for zero. Neste caso, o produto dos valores ser zero e, consequentemente, G = 0.
Quando o produto dos valores for negativo e o nmero total de observaes for par. Neste caso, teramos que calcular uma raiz de ndice de par de
um nmero negativo, o que impossvel no conjunto dos nmeros reais.
n

A mdia geomtrica ser sempre menor ou igual a mdia aritmtica.

captulo 2

35

2.2 Mediana (Md)


A mediana outra medida de posio, dita mais robusta que a mdia, pois, da
forma como ela determinada, no permite que alguns valores muito altos ou
muito baixos interfiram de maneira significativa em seu valor. Desta forma, se
o conjunto de dados apresentar alguns poucos valores discrepantes em relao
maioria dos valores do conjunto de dados, em geral, aconselhvel usar a
mediana em vez da mdia.

ATENO
A mediana a medida de posio mais frequentemente usada quando a varivel em estudo
for renda (R$), pois algumas rendas extremamente elevadas podem inflacionar a mdia.
Neste caso, a mediana uma melhor medida de posio central.

A mediana encontrada ordenando os dados do menor para o maior valor e


em seguida identificando o valor central destes dados ordenados. uma medida que divide o conjunto de dados ao meio, deixando a mesma quantidade de
valores abaixo dela e acima.
A determinao da mediana difere no caso do tamanho (n) do conjunto de
dados ser par ou mpar. Vejamos a seguir.
Se o nmero de elementos do conjunto de dados for mpar, ento a mediana
ser exatamente o valor do meio, ou seja:

Md = x n +1

(2.2)

Se o nmero de elementos do conjunto de dados for par, ento a mediana


ser exatamente a mdia dos dois valores do meio, isto :

Md =

36

captulo 2

x n + x n


+1

(2.3)

onde

x n , x n + 1 x n
e +1 indicam

2

2

as posies onde os dados

se encontram.

2.3 Moda (Mo)


A moda de um conjunto de dados o valor (ou valores) que ocorre com maior
frequncia. A moda, diferentemente das outras medidas de posio, tambm
pode ser encontrada quando a varivel em estudo for qualitativa. Existem conjuntos de dados em que nenhum valor aparece mais vezes que os outros. Neste
caso, dizemos que o conjunto de dados no apresenta moda.
Em outros casos, podem aparecer dois ou mais valores de maior frequncia
no conjunto de dados. Nestes casos, dizemos que o conjunto de dados bimodal e multimodal, respectivamente.
Por conta das definies diferentes, a mdia, a mediana e a moda fornecem,
muitas vezes, informaes diferentes sobre o centro de um conjunto de dados,
embora sejam todas medidas de tendncia central.
No exemplo 2.1 apresentaremos os clculos das medidas de posio para
dados no tabelados (dados brutos).
Exemplo 2.1: Um gerente de banco quis estudar a movimentao de pessoas em sua agncia na segunda semana de determinado ms. Ele constatou
que no primeiro dia entraram 1.348 pessoas, no segundo dia, 1.260 pessoas, no
terceiro, 1.095, no quarto, 832 e no ltimo dia do levantamento, 850 pessoas.
Encontre a mdia aritmtica, a mediana e a moda para este conjunto de dados
e interprete os resultados.
Resoluo
A mdia aritmtica dada por:
n

x=

xi
i =1

1.348 + 1.260 + 1.095 + 832 + 850 5.385


=
= 1.077
5
5

captulo 2

37

O nmero mdio de pessoas que entraram na agncia bancria na segunda


semana do ms foi 1.077 pessoas. Isto quer dizer que, alguns dias entraram menos que 1.077 e outros dias entraram mais, ou seja, 1.077 um valor em torno
do qual o nmero de pessoas que entraram na agncia, durante a segunda semana de cada ms, se concentra.
Para encontrar a mediana, devemos, primeiramente, ordenar os dados em
ordem crescente (pode ser decrescente tambm):
832, 850, 1095, 1260, 1348
Como a quantidade de dados (n) um nmero mpar, a mediana exatamente o valor que se encontra no meio do conjunto de dados. Nesse caso, a
mediana Md = 1095 pessoas. Isto significa que temos o mesmo nmero de
observaes menores ou iguais ao valor da mediana e o mesmo nmero de observaes maiores ou iguais ao valor da mediana.
Este conjunto de dados no possui moda, pois no existe nenhum valor que
aparece com mais frequncia que os outros.
Agora, vamos fazer um estudo para os dados tabulados, ou seja, quando os
dados estiverem na forma de uma distribuio de frequncias.
Quando os dados estiverem tabulados, ou seja, na forma de distribuio
de frequncias, a maneira de se calcular a mdia aritmtica muda um pouco.
Como as frequncias so nmeros que indicam quantas vezes aparece determinado valor ou quantos valores tm em cada classe de frequncia, elas funcionaro como fatores de ponderao. Estas situaes sero apresentadas nos
exemplos 2.2 e 2.3, respectivamente.

Mdia Aritmtica
No caso de dados tabulados, o clculo da mdia aritmtica dada por:
k

x=

x i fi
i =1

fi
i =1

38

captulo 2

(2.4)

Onde:
xi o valor da varivel (ou o ponto mdio de uma classe de frequncia).
fi a frequncia referente a cada valor (ou classe).
k

a soma dos valores das frequncias.

i =1

A expresso (2.4) apresentada anteriormente tambm conhecida como


frmula da mdia ponderada.
No caso de distribuies de frequncias que no apresentam intervalos de
classes, a mediana e a moda so encontradas da maneira descrita nos itens 2.2
e 2.3, respectivamente.
Exemplo 2.2
Em um determinado ms, foi computado o nmero x de faltas ao trabalho,
por motivos de sade, que cada funcionrio de uma determinada empresa teve.
Os dados esto apresentados na tabela abaixo:

NMERO DE FALTAS

31

20

Total

63

Tabela 2.1: Nmero de faltas ao trabalho, por motivos de sade.

captulo 2

39

Resoluo
Mdia Aritmtica
k

x i fi (0 31)+ (1 20)+ (2 8)+ (3 2)+ (4 0)+ (5 1)+ (6 1) 53


x = i =1
=
=
@ 0, 84
k

63

fi

63

i =1

ou seja, nesta empresa ocorreram, em mdia, 0,84 faltas por funcionrio,


por motivo de sade.
Mediana
Como os dados esto tabelados, eles j se encontram ordenados. Para ficar
mais fcil encontrar o valor da mediana, vamos incluir na distribuio de frequncias uma coluna com as frequncias acumuladas.

40

NMERO DE FALTAS

fa

31

31

20

51

59

61

61

62

63

Total

63

captulo 2

Agora, identificaremos a frequncia acumulada imediatamente superior


metade do somatrio das frequncias simples:
k

fi
i =1

63
= 3,15
2

A frequncia acumulada imediatamente superior a 31,5 fa = 51. Portanto, o


valor da mediana o valor da varivel associado fa = 51, ou seja,
Md = 1 falta
Ento, pelo menos 50% das observaes so maiores ou iguais a 1 falta.
k

No caso do valor i = 1

fi
ser exatamente igual a uma das frequncias acumuladas fa, o

clculo da mediana ser a mdia aritmtica entre dois valores da varivel: xi e x(i+1).
k

O valor da varivel xi ser aquele cujo i = 1

fi
= fa e o valor da varivel xi+1 ser aquele

que est imediatamente aps xi na distribuio de frequncia.

Moda
O valor que tem a maior frequncia para este conjunto de dados de x = 0,
ou seja, mais frequente encontrar funcionrios que no faltam.
No caso do Exemplo 2.3 veremos que os dados esto agrupados em intervalos de classes. Quando o conjunto de dados for apresentado sob a forma agrupada perdemos a informao dos valores das observaes. Neste caso, vamos
supor que todos os valores dentro de uma classe tenham seus valores iguais ao
ponto mdio desta classe.
Os clculos da mdia, da moda e da mediana para tabelas de frequncias
agrupadas em classes esto apresentados a seguir.

captulo 2

41

Vale ressaltar que, sempre que possvel, as medidas de posio e disperso


devem ser calculadas antes dos dados serem agrupados.

ATENO
As medidas resumo calculadas quando os dados estiverem agrupados em intervalos de classes so apenas aproximaes dos verdadeiros valores, pois substitumos os valores das observaes pelo ponto do mdio do intervalo de classe.

Exemplo 2.3
A tabela abaixo apresenta a distribuio de frequncias do tempo de vida de
60 componentes eletrnicos (medido em dias) submetidos experimentao
num laboratrio especializado. Calcular as medidas de posio.

TEMPO DE VIDA
(DIAS)

PONTO MDIO (XI)

3 18

10,5

18 33

25,5

33 48

40,5

48 63

55,5

63 78

10

70,5

78 93

28

85,5

93 108

100,5

108 123

115,5

Total

60

Tabela 2.2: Tempo de vida de componentes eletrnicos.

42

captulo 2

Resoluo
Neste tipo de tabela, como temos classes de frequncias, devemos encontrar um valor que represente cada classe, para que possamos efetuar os clculos. Por exemplo, considerando a primeira classe de frequncia,

TEMPO DE VIDA
(DIAS)

PONTO MDIO (XI)

3 18

10,5

sabemos que 3 componentes eletrnicos tiveram tempo de vida entre 3 e 18


dias, porm, no sabemos exatamente qual foi o tempo de vida de cada um. Se
considerarmos o limite inferior da classe (3) para efetuarmos os clculos, estaremos subestimando as estimativas. Por outro lado, se considerarmos o limite
superior da classe (18) estaremos superestimando as estimativas. Portanto, vamos utilizar o ponto mdio de cada classe para podermos fazer os clculos sem
grandes prejuzos. A terceira coluna da tabela apresentada contm os pontos
mdios calculados para cada intervalo de classe. O valor do ponto mdio passa
a ser o nosso valor xi a ser utilizado nos clculos. Vamos aprender como se faz:
Mdia Aritmtica
k

x=

x i fi
i =1

fi

i =1

(10, 5 3)+ (25, 5 4)+ (40, 5 4)+ (55, 5 8)+ (70, 5 10)+ (85, 5 28)+ (100, 5 2)+ (115, 5 1)
=
60

4155
=
= 69, 25
60

Podemos dizer, atravs da mdia aritmtica, que os componentes eletrnicos tm uma durao mdia de 69 dias e 6 horas (69,25 dias).

captulo 2

43

Mediana
Como os dados esto tabelados em classes de frequncias, o clculo da mediana fica um pouquinho mais complicado. Agora, teremos que encontrar a
mediana atravs da seguinte frmula:

Md = linf md +

A md
Fmd

fi

- Fmd -1 (2.5)

onde:
linfmd o limite inferior da classe que contm a mediana;

fi o nmero total de observaes da distribuio de frequncias;

Fmd1 a frequncia acumulada da classe anterior classe que contm a mediana;


fmd o nmero de observaes da classe que contm a mediana;
Amd a amplitude do intervalo de classe que contm a mediana.
No clculo da mediana para os dados da tabela 2.2 temos que primeiramente encontrar a classe que contm a mediana. Esta classe corresponde classe
associada frequncia acumulada imediatamente superior

Como

fi

captulo 2

fi

60
= 30 , temos que a classe que contm a mediana de
2

78 93 (pois fa = 57).

44

Classe que
contm a
mediana

Tempo
de vida

PM
x1

fa

3|18

10,5

18|33

21,5

33|48

40,5

11

48|63

55,5

19

63|78

10

70,5

29

78|93

28

85,5

57

93|108

10,5

59

108|123

115,5

60

Total

60

N de observaes
da classe que
contm a mediana
fa da classe
anterior classe
que contm a
Md

fi
Alm disso, temos:

fi = nmero total de observaes da distribuio de frequncias.

Portanto,

fi = 60 .

Fmd1 = frequncia acumulada da classe anterior classe que contm a mediana.


Portanto, Fmd1 = 29.
fmd = nmero de observaes da classe que contm a mediana.
Portanto, fmd = 28.
Amd = amplitude do intervalo da classe que contm a mediana.
Portanto, Amd = 93 78=15.
Agora, basta substituirmos todos os valores encontrados na frmula 2.5
para encontrarmos o valor da mediana:

Md = 78 +

15 60
15

29 = 78 + ( 30 29 ) = 78 + 0, 54 78, 5
28 2
28

captulo 2

45

Atravs da mediana podemos dizer que pelo menos 50% dos componentes
eletrnicos avaliados tm durao igual ou inferior a 78 dias e 12 horas.
Moda
No clculo da moda para dados agrupados devemos primeiramente identificar a classe modal, ou seja, a classe que apresenta a maior frequncia.
Aps a identificao da classe modal, utilizaremos a seguinte frmula para
calcular a moda bruta:

Mo =

l+L
(2.6)
2

onde:
l:limite inferior da classe modal
L:limite superior da classe modal

CONEXO
Sugerimos os vdeos: Novo Telecurso E. Fundamental Matemtica Aula 34 (parte 1) e
Novo Telecurso E. Fundamental Matemtica Aula 34 (parte 2) disponveis, respectivamente em http://www.youtube.com/watch?v=SyWbYOtAIYc&NR=1 e http://www.youtube.
com/watch?v=ejMyWfuSO5k que apresenta de modo bem prtico a utilizao das medidas
de posio.

Agora, vamos comentar sobre outras medidas de posio, menos utilizadas,


porm importantes em algumas situaes. So elas: quartis, decis e percentis.

2.4 Medidas Separatrizes: Quartis, Decis e Percentis


Os quartis, decis e percentis so muito similares mediana, uma vez que tambm subdividem a distribuio de dados de acordo com a proporo das frequncias observadas.

46

captulo 2

ATENO
Perceba que o 2 quartil, o 5 decil e o 50 percentil representam a prpria mediana, ou seja,
todas estas medidas separatrizes (Q2, D5, e P50), dividem a distribuio dos dados ao meio,
deixando 50% dos dados abaixo delas e 50% acima.

J vimos que a mediana divide a distribuio em duas partes iguais, ento, os


quartis (Q1, Q2 e Q3), como o prprio nome sugere, divide a distribuio dos dados
ordenados em quatro partes, sendo, Q1 o quartil que separa os 25% valores inferiores dos 75% superiores, Q2 o que divide o conjunto ao meio ( igual mediana)
e Q3 o que separa os 75% valores inferiores dos 25% superiores. No h um consenso universal sobre um procedimento nico para o clculo dos quartis, e diferentes programas de computador muitas vezes produzem resultados diferentes.
Os decis, por sua vez, dividem a distribuio dos dados em 10 partes (Di, i =
1, 2, ..., 9) e os percentis dividem a distribuio em 100 partes (Pi, i = 1, 2, ..., 99)
As medidas separatrizes, geralmente, s so calculadas para grandes quantidades de dados.
No Excel, por exemplo, temos a opo de pedir o clculo de tais medidas.
Com os clculos dos quartis, juntamente com os valores mnimo e mximo do conjunto de dados, podemos construir um grfico chamado desenho
esquemtico ou boxplot. A anlise deste grfico bastante til no sentido de
informar, entre outras coisas, a variabilidade e a simetria dos dados.

CONEXO
Para se entender quais so os procedimentos utilizados na construo de um boxplot, bem
como sua interpretao, leia o texto: Diagrama de Caixa (Boxplots) em: TRIOLA, Mario F..
Introduo estatstica. 10.ed.Rio de Janeiro: LTC, 2008, pp.98 a 102

captulo 2

47

2.4.1 Clculo dos quartis e dos percentis para dados no agrupados em classes
Como os quartis so medidas separatrizes precisamos, primeiramente, ordenar o conjunto de dados.

O primeiro quartil (Q1) ser o valor da varivel que ocupar a posio

gundo quartil (Q2) ser o valor da varivel que ocupar a posio

quartil (Q3) ser o valor da varivel que ocupar a posio

n
. O se4

2n e o terceiro
4

3n
. Quando fazemos
4

estas divises para encontrar as posies dos quartis, pode acontecer do resultado ser um nmero inteiro ou um nmero fracionrio. Ento, adotaremos a
seguinte conveno:
Se a diviso resultar num nmero fracionrio, arredonde-o para cima e
o valor do quartil ser a resposta da varivel encontrada nesta posio.
Se a diviso for um nmero inteiro, o quartil ser a mdia aritmtica da
resposta da varivel que ocupar a posio encontrada com a resposta da
varivel que ocupar a posio seguinte.
Exemplo 2.4
Um escritrio que presta consultoria em administrao levantou os tempos
de espera de pacientes que chegam a uma clnica de ortopedia para atendimento de emergncia. Foram coletados os seguintes tempos, em minutos, durante
uma semana. Encontre os quartis.
2 5 10 11 3 14 8 8 7 12 3 4 7 3 4 2 6 7

48

captulo 2

Resoluo:
Para encontrarmos os quartis, precisamos ordenar o conjunto de dados.
Ento:
2 2 3 3 3 4 4 5 6 7 7 7 8 8 10 11 12 14
Posio do primeiro quartil (Q1):

n 18
= = 4, 5
4 4

Como a diviso resultou em um valor fracionrio, vamos arredondar para 5.


Portanto, o primeiro quartil o valor que est na quinta posio.
Q1 = 3
Ento, pelo menos 25% das observaes so menores ou iguais a 3 minutos.

2xn
4

Posio do segundo quartil (Q2 ): =

2 x 18
= 9
4

Como a diviso resultou em um valor inteiro, o segundo quartil ser o resultado da mdia aritmtica entre o valor que est na nona posio e o valor que
est na dcima posio.

Q2 =

6+7
= 6, 5
2

Temos que pelo menos 50% das observaes so maiores ou iguais a 6,5 minutos.
Posio do terceiro quartil (Q3 ):

3 x n 3 x 18
= = 13, 5
4
4

Como a diviso resultou em um valor fracionrio, vamos arredondar para


14. Portanto, o terceiro quartil o valor que est na dcima quarta posio.
Q3 = 8
Neste conjunto de dados, pelo menos 25% das observaes so maiores ou
iguais a 8 minutos.

captulo 2

49

Agora que j aprendemos a calcular e interpretar os quartis para dados no


agrupados, vamos passar para o conceito de percentis.
Da mesma forma que nos quartis, o conjunto de dados deve estar ordenado.
Quando dividimos o conjunto de dados em 100 partes, obtemos 99 percentis.
O percentil pk ser a resposta da varivel que ocupar a posio

(k x n)
100

Adotaremos a seguinte conveno:


Se a diviso resultar num nmero fracionrio, arredonde-o para cima e
o valor do percentil ser a resposta da varivel encontrada nesta posio.
Se a diviso for um nmero inteiro, o percentil ser a mdia aritmtica da
resposta da varivel que ocupar a posio encontrada com a resposta da
varivel que ocupar a posio seguinte.
Exemplo 2.5
Vamos encontrar o trigsimo quinto percentil do conjunto de dados do
exemplo 2.4.
2 2 3 3 3 4 4 5 6 7 7 7 8 8 10 11 12 14
Resoluo
( 35 x 18) = 6, 3 .
O percentil p35 ser a resposta da varivel que ocupar a posio
100

Como a diviso resultou em um valor fracionrio, vamos arredondar para


7. Portanto, o trigsimo quinto percentil o valor que est na stima posio.
P35 = 4
Ento, aproximadamente 35% das observaes so menores ou iguais a 4
minutos.

50

captulo 2

2.4.2 Clculo dos quartis e dos percentis para dados agrupados em classes
Para calcular os quartis quando os dados esto organizados em intervalos de
classes, utilizaremos o mesmo procedimento descrito para o clculo da mediana (Q2) para dados agrupados em classes.
Para o clculo do Q1 utilizamos a seguinte frmula:

Q1 = linf q1 +

A q1 fi


Fq11 (2.7)
f q1 4

onde:
linf o limite inferior da classe que contm o primeiro quartil;
q1

fi o nmero total de observaes da distribuio de frequncias;

Fq11 a frequncia acumulada da classe anterior classe que contm o primeiro quartil;
fq1 o nmero de observaes da classe que contm o primeiro quartil;
Aq1 a amplitude do intervalo de classe que contm o primeiro quartil.
De maneira semelhante, o clculo do Q3 ser feito utilizando a seguinte frmula:

Q3 = linf q3 +

A q3 3 x fi


Fq3 1 (2.8)
f q3
4

onde:
linf o limite inferior da classe que contm o terceiro quartil;
q3

fi o nmero total de observaes da distribuio de frequncias;

Fq31 a frequncia acumulada da classe anterior classe que contm o terceiro quartil;
fq3 o nmero de observaes da classe que contm o terceiro quartil;
Aq3 a amplitude do intervalo de classe que contm o terceiro quartil.

captulo 2

51

Exemplo 2.6
Vamos utilizar os dados do exemplo 2.3 para encontrar o primeiro e o terceiro quartil.

TEMPO DE VIDA

PM
xI

fa

3 18

10,5

18 33

25,5

33 48

40,5

11

48 63

55,5

19

63 78

10

70,5

29

78 93

28

85,5

57

93 108

100,5

59

108 123

115,5

60

Total

60

Resoluo
Primeiramente, temos que encontrar a classe que contm o primeiro quartil. Esta classe corresponde classe associada frequncia acumulada imediatamente superior

52

captulo 2

fi
4

Como

fi = 60 , temos que a classe que contm o primeiro quartil de


4

4863 (pois fa = 19).


Alm disso, temos:
fi = nmero total de observaes da distribuio de frequncias. Por-

tanto,

fi =60.

Fq1 = frequncia acumulada da classe anterior classe que contm o primeiro quartil. Portanto, fq1 = 11.
fq1 = nmero de observaes da classe que contm o primeiro quartil. Portanto, fq1 = 8.
Aq1 = amplitude do intervalo da classe que contm o primeiro quartil. Portanto, Aq1 = 63 48 = 15.
Agora, basta substituirmos todos os valores encontrados na frmula 2.7 e
encontrar o valor do primeiro quartil:

Q1 = 48 +

15 60
15

11 = 48 + (15 11) = 18 + 7, 5 = 55, 5


8 4
8

De acordo com o resultado obtido podemos esperar que aproximadamente


25% dos dados so menores ou iguais a 55,5, ou seja, aproximadamente 25%
dos componentes eletrnicos tm durao inferior a 55 dias e 12 horas.
Agora, vamos encontrar a classe que contm o terceiro quartil. Esta classe
corresponde classe associada frequncia acumulada imediatamente superior

3 x fi

4
Como

3 x fi
4

3 x 60 , temos que a classe que contm o terceiro quar4

til de 7893 (pois f_a=57).

captulo 2

53

Alm disso, temos:

fi = nmero total de observaes da distribuio de frequncias. Por-

fi = 60.
tanto,
Fq3= frequncia acumulada da classe anterior classe que contm o terceiro
quartil. Portanto, Fq3 = 29.
fq3= nmero de observaes da classe que contm o terceiro quartil. Portanto, fq3 = 28.
Aq3 = amplitude do intervalo da classe que contm o terceiro quartil. Portanto, Aq3 = 93 78 = 15.
Agora, basta substituirmos todos os valores encontrados na frmula 2.8 e
encontrar o valor do terceiro quartil:

Q3 = 78 +

15 3 x 60
15

29 = 78 + ( 45 29 ) = 78 + 8, 57 86, 57
28 4
28

De acordo com o resultado obtido podemos esperar que aproximadamente


75% dos dados so menores ou iguais a 86,57, ou seja, aproximadamente 75%
dos componentes eletrnicos tm durao inferior a 86 dias e 14 horas.
Agora, vamos passar para o clculo dos percentis.
No caso dos dados estarem organizados em intervalos de classes, os percentis so calculados utilizando a seguinte frmula:

Pk = linf pk +

A pk k x fi


Fpk 1
f pk 100
(2.9)

em que k = 1,2,,99.
O procedimento para encontrar as quantidades que devem ser substitudas na
frmula 2.9 so os mesmos que utilizamos para encontrar os quartis.

54

captulo 2

Exemplo 2.7
Vamos utilizar os dados do exemplo 2.3 para encontrar o dcimo quinto
percentil.

TEMPO DE VIDA

PM
xI

fa

3 18

10,5

18 33

25,5

33 48

40,5

11

48 63

55,5

19

63 78

10

70,5

29

78 93

28

85,5

57

93 108

100,5

59

108 123

115,5

60

Total

60

Primeiramente, temos que encontrar a classe que contm o dcimo quinto


percentil. Esta classe corresponde classe associada frequncia acumulada
imediatamente superior

15 x

fi .

100
Como

15 x

fi = 15 x 60 = 9 , temos que a classe que contm o dci-

100

100

mo quinto percentil de 3348 (pois fa = 11).

captulo 2

55

Alm disso, temos:


fi = nmero total de observaes da distribuio de frequncias. Por-

fi = 60.
tanto,
Fp15 = frequncia acumulada da classe anterior classe que contm o dcimo quinto percentil. Portanto, Fp15 = 7.
fp15 = nmero de observaes da classe que contm o dcimo quinto percentil. Portanto,fp15 = 4.
Ap15= amplitude do intervalo da classe que contm o dcimo quinto percentil. Portanto, Ap15 = 48 33=15.
Agora, basta substituirmos todos os valores encontrados na frmula 2.9 e
encontrar o valor do dcimo quinto percentil:

P15 = 33 +

15 15 x 60
15

7 = 33 + ( 9 7 ) = 33 + 7, 5 = 40, 5
4 100
4

De acordo com o resultado obtido podemos esperar que aproximadamente


15% dos dados so menores ou iguais a 40,5, ou seja, aproximadamente 15%
dos componentes eletrnicos tm durao inferior a 40 dias e 12 horas.

CONEXO
Agora que j abordamos como se calcula os quartis e percentis, faa uma leitura do texto:
Decis (Dk) em TIBONI, Conceio G.R. Estatstica bsica - para os cursos de Administrao, Cincias Contbeis, Tecnolgicos e de Gesto. So Paulo: Atlas, 2010.

56

captulo 2

ATIVIDADE
1. Quais as vantagens e desvantagens do modelo linear?Os dados abaixo referem-se ao
nmero de horas extras de trabalho de uma amostra de 64 funcionrios de uma determinada empresa localizada na capital paulista.
10

10

12

14

14

14

15

16

18

18

18

18

18

19

20

20

20

20

20

21

22

22

22

22

22

22

22

22

22

22

22

22

23

23

24

24

24

24

24

24

24

25

25

25

25

26

26

26

26

26

26

27

27

27

28

28

29

30

30

32

35

36

40

41

Pede-se:
a) Calcule e interprete as seguintes medidas descritivas calculadas para os dados brutos (dados no tabulados): mdia aritmtica; mediana; moda.
b) Construir uma distribuio de frequncias completa (com freq. absoluta, freq. relativa,
freq. acumulada e ponto mdio).
c) Com a tabela construda no item b), encontre as seguintes medidas: mdia aritmtica;
mediana; moda; 1 quartil; 7 decil; 99 percentil. Interprete os resultados.
d) Construa o histograma para este conjunto de dados.

captulo 2

57

2. Os dados abaixo representam as vendas mensais (em milhes de reais) de vendedores


de gnero alimentcios de uma determinada empresa.

VENDAS MENSAIS (EM MILHES DE


REAIS)

NMERO DE VENDEDORES

01

12

12

23

20

34

48

45

14

56

10

Total

110

a) Qual a varivel em estudo? Que tipo de varivel esta?


b) Encontre a mdia, a mediana e a moda e interprete os resultados.
c) Encontre as medidas separatrizes Q3, D1, e P80 e interprete os resultados.
d) Qual a porcentagem de vendedores com vendas mensais inferiores a 2 milhes
de reais?
e) Qual a porcentagem de vendedores com vendas mensais superiores a 4 milhes
de reais?
f) Qual a porcentagem de vendedores com vendas mensais entre 3 (inclusive) e 5 (exclusive) milhes de reais?
g) Qual a porcentagem de vendedores que vendem, pelo menos, 3 milhes de reais
mensais?

58

captulo 2

3. Numa pesquisa realizada com 91 famlias, levantaram-se as seguintes informaes com


relao ao nmero de filhos por famlia:

NMERO DE FILHOS

FREQUNCIA DE FAMLIAS

19

22

28

16

Calcule e interprete os resultados da:


a) mdia aritmtica
b) mediana
c) moda
4. O histograma abaixo representa a distribuio das idades dos funcionrios de uma agn-

Frequncia

cia bancria. Com base no histograma abaixo, responda:


Histograma

16
15
14
13
12
11
10
9
8
7
6
5
4
3
2
1
0
20 | 25

25 | 30

30 | 35

35 | 40

40 | 45

45| 50

Idade

a) Qual a varivel em estudo?


b) Quantos funcionrios trabalham nesta agncia bancria?
c) Quais so a mdia, a mediana e a moda para a idade dos funcionrios desta agncia? Interprete os resultados.
d) Qual o valor do primeiro quartil? Interprete o resultado.
e) Quantos funcionrios tm menos que 30 anos?
f) Qual a porcentagem de funcionrios com mais de 45 anos?
g) Qual a porcentagem de funcionrios com no mnimo 30 anos?

captulo 2

59

5. Define-se a mdia aritmtica de n nmeros dados como o resultado da diviso por n da


soma dos n nmeros dados. Sabe-se que 4,2 a mdia aritmtica de 2.7; 3.6; 6.2; e x.
Determine o valor de x.

REFLEXO
Que a mdia a medida de posio mais utilizada em nosso dia a dia talvez nem seria necessrio dizer. Mas preciso tomar certo cuidado quando utilizamos a mdia como parmetro
de um conjunto de dados. Voc sabe que, se a mdia de sua turma em Estatstica for igual
a 7,0 (por exemplo), no quer dizer que toda ela, ou a maioria, teve bom desempenho nem
que metade da turma teve desempenho igual ou superior a 7,0. Outras medidas, como vimos,
podem complementar as informaes dadas pela mdia.

LEITURA
Como a mdia uma medida descritiva muito utilizada no dia a dia, sugerimos que voc oua
o udio Mdias que interessam, da Srie: Problemas e Solues. H dois mdulos cujos
contedos alertam par ao cuidado que se deve ter na interpretao da mdia, mostram uma
aplicao da mdia ponderada e fazem uma anlise crtica da utilizao da mdia como uma
informao nica. O endereo para acesso : http://m3.ime.unicamp.br/recursos/1315.

REFERNCIAS BIBLIOGRFICAS
ANDERSON, David R.; SWEENEY, Denis J.; WILLIAMS, Thomas A. Estatstica aplicada
administrao e economia. So Paulo: Pioneira Thomson Learning, 2003.
BUSSAB, Wilton de O.; MORETTIN, Pedro A. Estatstica bsica. So Paulo: Saraiva, 2003.
COSTA NETO, Pedro Luiz de Oliveira. Estatstica. So Paulo: Edgard Blucher, 2002.
DOWNING, Douglas; CLARK, Jeffrey. Estatstica aplicada. So Paulo: Saraiva, 2002.

60

captulo 2

FARIAS, Alfredo Alves de; SOARES, Jos Francisco; CSAR, Cibele Comini. Introduo
estatstica. Rio de Janeiro: LTC, 2003.
TIBONI, Conceio G. Rebelo. Estatstica Bsica - para os cursos de Administrao, Cincias Contbeis, Tecnolgicos e de Gesto. So Paulo: Atlas, 2010.

NO PRXIMO CAPTULO
Abordaremos no prximo captulo aspectos especficos do desenho departamental, assim como
as diversas formas de departamentalizao utilizadas pelas organizaes, tais como a departamentalizao funcional, divisional e suas diversas categorias, tais como projetos, produtos ou
servios, territorial, por clientes etc.

captulo 2

61

3
Medidas de
Disperso

3 Medidas de Disperso
Estas medidas servem para indicar o quanto os dados se apresentam dispersos em
torno da regio central. Fornecem, portanto, o grau de variao existente no conjunto de dados. Dois ou mais conjuntos de dados podem, por exemplo, ter a mesma mdia, porm os valores podero estar muito mais dispersos num conjunto do
que no outro. Ou seja, podem ter maior ou menor grau de homogeneidade.

OBJETIVOS
Por meio do estudo deste captulo, esperamos que voc seja capaz de calcular e interpretar
as medidas de disperso aplicadas a conjuntos de dados, com o objetivo de avaliar o grau
de homogeneidade.

REFLEXO
Voc se lembra de alguma vez em que saiu de casa tendo quase certeza de que ficaria preso
em um engarrafamento no trnsito? No preciso ser muito observador para perceber que,
em determinadas horas do dia, dependendo do dia da semana, o trnsito (nas grandes e nas
mdias cidades) estar congestionado. Talvez o melhor seria deixar para sair outra hora (se
isto for possvel). O fluxo de veculos, nesses momentos, apresenta certa homogeneidade,
ou seja, quase sempre est intenso. Dificilmente, num dia como esses, voc ter um fluxo
acentuadamente menor (ou maior) do que o que voc verifica todos os dias. Vamos estudar
situaes como essas, em que a informao sobre o grau de homogeneidade (ou heterogeneidade) nos ajudar a tomar a deciso mais adequada.

3.1 Exemplo Introdutrio


Vamos analisar um exemplo bem simples que nos d a ideia da importncia de
se conhecer as medidas de disperso para a tomada de algumas decises.
Exemplo 3.1: Imagine que estamos interessados em fazer uma viagem para
Honolulu (Hava) ou Houston (Texas) e para arrumar as malas necessitamos saber se a localidade a ser visitada faz calor, faz frio ou ambos. Se tivssemos ape-

64

captulo 3

nas a informao de que a temperatura mdia diria (medida durante um ano)


das duas localizaes fosse igual a25 C, poderamos colocar na mala apenas
roupas de vero? A resposta no. Por exemplo, se estivssemos interessados
em viajar para o Hava (em Honolulu), poderamos levar apenas roupas de vero, pois a temperatura mnima observada durante um ano foi de 21 C e a mxima foi de 29 C. Porm, se resolvermos ir ao Texas (Houston), devemos tomar
cuidado com a poca, pois as temperaturas, durante um ano, variaram de 4 C
(mnima) a 38 C (mxima). Com estas informaes, conclumos que as temperaturas em Honolulu variam pouco em torno da mdia diria, ou seja, podemos
levar uma mala apenas com roupas leves. Porm, em Houston, as temperaturas
variam muito, com perodos de muito frio ou muito calor. Portanto, para ir
Houston sem perigo de sofrer com a temperatura, devemos analisar o perodo
do ano para saber se a temperatura estar alta ou baixa.

ATENO
As medidas de disperso indicam o grau de variabilidade das observaes. Estas medidas
possibilitam que faamos distino entre conjuntos de observaes quanto sua homogeneidade. Quanto menor as medidas de disperso, mais homogneo o conjunto de dados.

Percebemos, atravs desse exemplo bem simples, que uma simples medida
de disperso (a amplitude, por exemplo) j ajudaria muito a tomar certos cuidados com a arrumao das bagagens.
Veremos, nos prximos itens, como calcular e interpretar as seguintes medidas de disperso: amplitude, amplitude interquartil, desvio-padro, varincia e coeficiente de variao.
Primeiramente, vamos apresentar os clculos das medidas de disperso
para dados no-tabulados, ou seja, quando os dados no estiverem na forma de
distribuio de frequncias.

3.2 Amplitude Total (R)


A amplitude total a diferena entre o maior e o menor valor observado no conjunto de dados, ou seja:

R = x ( mximo) - x ( mnimo)

(3.1)

captulo 3

65

A amplitude no uma medida muito utilizada, pois s leva em conta dois


valores de todo o conjunto de dados e muito influenciada por valores extremos. No prximo item estudaremos uma medida de disperso mais resistente
a valores extremos.

3.3 Amplitude interquartil


A amplitude interquartil, ou distncia interquartil, uma medida de variabilidade que no facilmente influenciada por valores discrepantes no conjunto
de dados. Ela engloba 50% das observaes centrais do conjunto de dados e seu
clculo definido como:

Amplitude interquartil = Q3 Q1

(3.2)

Agora, vamos estudar uma medida de disperso muito utilizada e que leva
em conta todos os valores do conjunto de dados: o desvio-padro.

3.4 Desvio-Padro (s)


Primeiramente, vamos entender qual a definio da palavra desvio em estatstica. Desvio nada mais do que a distncia entre qualquer valor do conjunto de
dados em relao mdia aritmtica deste mesmo conjunto de dados.
Existem vrias medidas de disperso que envolvem os desvios. So elas: o
desvio-padro (mais utilizada), a varincia e o coeficiente de variao.

ATENO
O valor do desvio-padro nunca negativo. zero apenas quando todos os valores do conjunto
de dados so os mesmos. A unidade do desvio-padro a mesma unidade dos dados originais.

O desvio-padro a medida mais utilizada na comparao de diferenas


entre grupos, por ser mais precisa e estar na mesma medida do conjunto de
dados. Matematicamente, sua frmula dada pela raiz quadrada da mdia aritmtica aproximada dos quadrados dos desvios, ou seja:

66

captulo 3

s=

( x i - x )2
i =1

n -1

( x1 - x ) 2 + ( x 2 - x ) 2 + + ( x n - x ) 2
n -1

(3.3)

onde xi cada uma das observaes do conjunto de dados, x a mdia do


conjunto de dados e n o nmero total de observaes do conjunto de dados.
Desenvolvendo a frmula (3.3) chegamos a frmula (3.4) que, para alguns
casos, tornam os clculos mais simples e rpidos.

( x )
-

s=

x i2

n -1

(3.4)

onde:

x i2 a soma de cada valor da varivel ao quadrado;

( x ) o quadrado da soma de todos os valores da varivel;


2

n o nmero total de valores do conjunto de dados.


Como o desvio-padro uma medida de disperso e mede a variabilidade
entre os valores, temos que valores muito prximos resultaro em desvios-padres pequenos, enquanto que valores mais espalhados resultaro em desvios-padres maiores.
3.4.1 Uma regra prtica para interpretar o desvio-padro
Depois que calculamos o desvio-padro, surge uma pergunta: como interpret-lo?

CONEXO
Para se entender um pouco mais sobre o conceito de variabilidade, acesse o endereo
http://www.gaussconsulting.com.br/si/site/05072.

captulo 3

67

Para conjuntos de dados que tenham distribuio em forma de sino, valem


as seguintes consideraes:
Cerca de 68% das observaes do conjunto de dados ficam a 1 desvio-padro da mdia, ou seja, ( x s) e ( x + s).
Cerca de 95% das observaes do conjunto de dados ficam a 2 desvios-padres da mdia, ou seja, ( x 2s) e ( x + 2s) .
Cerca de 99,7% das observaes do conjunto de dados ficam a 3 desvios-padres da mdia, ou seja, ( x 3s) e ( x + 3s) .

3.5 Varincia (s2)


A varincia de um conjunto de dados nada mais do que o valor do desvio-padro elevado ao quadrado, ou seja,
n

s2 =

( x i - x )2
i =1

(3.5)

n -1

ou

( x )
-

s2 =

x i2

n -1

(3.6)

A varincia no uma medida muito utilizada para mostrar a disperso de


um conjunto de dados, pois, expressa o seu resultado numa medida ao quadrado, no sendo possvel interpretar o seu valor. Portanto, na anlise descritiva
dos dados, no vamos trabalhar com esta medida constantemente. Se um determinado problema fornecer a varincia do conjunto de dados, basta calcularmos a raiz quadrada deste valor (varincia) e obteremos o desvio-padro, que
facilmente interpretado por estar na mesma medida do conjunto de dados.

68

captulo 3

3.6 Coeficiente de Variao (cv)


O coeficiente de variao (cv) definido como o quociente entre o desvio-padro e a mdia, e frequentemente expresso em porcentagem. Ele mede o grau
de variabilidade do conjunto de dados. Quando calculamos o desvio-padro,
obtemos um valor que pode ser grande ou pequeno, dependendo da varivel
em estudo. O fato de ele ser um valor considerado alto relativo, pois dependendo da varivel que est sendo estudada e da mdia, esta variao dos dados
pode ser relativamente pequena. Ento, o coeficiente de variao serve para calcular o grau de variao dos dados em relao mdia aritmtica. E obtido
atravs do seguinte clculo:

cv =
onde s o desvio-padro e

s
100
x

(3.7)

x a mdia aritmtica.

Alguns autores consideram a seguinte regra emprica para a interpretao


do coeficiente de variao:
Baixa disperso: C.V 15%
Mdia: C.V . 15% 30%
Alta: C.V 30%
Em geral, o coeficiente de variao uma estatstica til para comparar a
variao para valores originados de diferentes variveis (por exemplo: peso, em
Kg e altura, em cm), pois ele adimensional.

3.7 Exemplo de aplicao das medidas de disperso para dados


no tabulados
Vamos exemplificar o clculo da amplitude, da amplitude interquartil, do desvio-padro, da varincia e do coeficiente de variao utilizando o exemplo 2.1,
que apresenta o conjunto de dados brutos.

captulo 3

69

Exemplo 3.2: Um gerente de banco quis estudar a movimentao de pessoas em sua agncia na segunda semana de determinado ms. Ele constatou
que no primeiro dia entraram 1.348 pessoas, no segundo dia, 1.260 pessoas, no
terceiro, 1.095, no quarto, 832 e no ltimo dia do levantamento, 850 pessoas.
Encontre a amplitude, o desvio-padro, a varincia e o coeficiente de variao
para este conjunto de dados e interprete os resultados.
Resoluo
A amplitude dada por:

R = x (mximo) - x (mnimo) = 1.348 - 832 = 516 pessoas.


A diferena, no nmero de pessoas que entram na agncia, entre o dia de
maior movimento e o dia de menor movimento de 516 pessoas.
Para encontrarmos a amplitude interquartil, precisamos calcular o primeiro e o terceiro quartil. Para isto, vamos seguir os procedimentos descritos no
item 2.4.1.
Posio do primeiro quartil (Q1):

n 5
= = 1, 25
4 4

Como a diviso resultou em um valor fracionrio, vamos arredondar para 2.


Portanto, o primeiro quartil o valor que est na segunda posio do conjunto
de dados ordenados.
Q1 = 850
Posio do terceiro quartil (Q3 ):

3xn 3x5
= = 3, 75 .
4
4

Como a diviso resultou em um valor fracionrio, vamos arredondar para 4.


Portanto, o terceiro quartil o valor que est na quarta posio.
Q3 = 1260

70

captulo 3

Ento:
Amplitude interquartil = Q3 Q1
=1260 850
=410 pessoas
Ento, a amplitude do intervalo que contm 50% das observaes centrais
410 pessoas.
O desvio-padro obtido atravs das frmulas (3.3) ou (3.4). Como a mdia
aritmtica um nmero inteiro e existem poucos dados, a frmula (3.3) mais
rpida de ser calculada. Porm, fica a critrio de cada um a utilizao de uma ou
de outra. Lembrando que a mdia aritmtica encontrada anteriormente igual
a 1.077 e utilizando a frmula (3.3), temos:
n

s=

( x i - x )2
i =1

n -1

(1.348 -1.077)2 + (1.260 -1.077)2 + (1.095 -1.0777)2 + (832 -1.077)2 + (850 -1.077)2

(271)2 + (183)2 + (18)2 + (-245)2 + (-227)2

(73.441)+ (33.489)+ (324)+ (60.025)+ (51.529) =

218.808
= 54.702 @ 233 , 88 pessoas
4

5 -1

Neste exemplo, entram na agncia, em mdia, 1.077 pessoas por dia. O nmero de pessoas que entra na agncia varia, mas, tipicamete, a diferena em
relao mdia foi de aproximadamente 234 pessoas.
A varincia, como vimos, obtida atravs das frmulas (3.5) ou (3.6), ou simplestemente, como j temos o desvio-padro, basta elevarmos o valor encontrado ao quadrado. Para o nosso exemplo, temos:
s2= (233,88 pessoas)2 = 54699,85 pessoas2

captulo 3

71

Nesse caso, no h como interpretar a expresso pessoas2. Por esse motivo,


utilizamos o desvio-padro no lugar da varincia.
O coeficiente de variao, dado pela frmula (3.7), muito fcil de ser obtido desde que j conheamos os valores da mdia aritmtica e do desvio-padro.
Pela frmula podemos observar que basta fazermos uma simples diviso. Para
este exemplo, temos que:

cv =

s 233, 88
=
@ 0, 2172 ou 21, 72%
1.077
x

Utilizando a regra emprica, podemos dizer que o conjunto de dados apresenta uma mdia disperso.
Agora, vamos aprender a calcular as medidas de disperso atravs de dados
tabulados.
Quando os dados estiverem na forma tabulada, haver uma pequena diferena no clculo das mdias de disperso, pois agora ser necessrio considerar as frequncias, que funcionaro como fatores de ponderao, referentes
a cada valor da varivel.

3.8 Desvio-padro para dados tabulados


Se os dados estiverem tabulados, o desvio-padro pode ser encontrado da seguinte forma:
k

s=

( x i - x )2 fi
i =1

(3.8)

n -1

Desenvolvendo a frmula (3.8) chegamos frmula (3.9) que tambm utilizada para o clculo do desvio-padro:

( x f )
f -

s=

72

captulo 3

x i2

n -1

(3.9)

onde, para ambas as frmulas (3.8) e (3.9), xi representa cada uma das observaes do conjunto de dados ou, se os dados estiverem agrupados em classes de
frequncias, xi representa o ponto mdio da classe, x a mdia do conjunto de
dados, fi a frequncia associada a cada observao (ou classe de observaes) do
conjunto de dados e n o nmero de total de observaes no conjunto de dados.

3.9 Varincia para dados tabulados


A varincia de um conjunto de dados agrupados dada por:
k

s2 =

( x i - x )2 fi
i =1

(3.10)

n -1
ou

( x f )
f -

s2 =

x i2

n -1

(3.11)

A amplitude, a amplitude interquartil e o coeficiente de variao no sofrem


modificaes significativas. A amplitude continua sendo a diferena entre o
maior e o menor valor (se os dados estiverem em classes de frequncias, R ser a
diferena entre o limite superior da ltima classe e o limite inferior da primeira
classe). A amplitude interquartil continua sendo a diferena entre o terceiro e o
primeiro quartil e o clculo do coeficiente de variao feito utilizando a frmula
(3.7), porm, se os dados estiverem em classes de frequncias, o desvio-padro e a
mdia aritmtica so obtidos utilizando xi como o ponto mdio da classe.

captulo 3

73

3.10 Exemplo de aplicao das medidas de disperso para dados


tabulados
Para demonstrao dos clculos para dados tabelados, vamos continuar utilizando os exemplos desenvolvidos no item 2.3 (Exemplos 2.2 e 2.3).
Exemplo 3.3: Em um determinado ms, foi computado o nmero x de faltas
ao trabalho, por motivos de sade, que cada funcionrio de uma determinada
empresa teve. Os dados esto apresentados na tabela a seguir:

NMERO DE FALTAS

31

20

Total

63

Tabela 3.1 Nmero de faltas ao trabalho, por motivos de sade.

Encontre a amplitude, o desvio-padro, a varincia e o coeficiente de variao para este conjunto de dados e interprete os resultados.

74

captulo 3

Resoluo
A amplitude para este conjunto de dados dada por:
R = x(mximo) X(mnimo) = 6 0 = 6 faltas
A maior diferena entre os nmeros de faltas ao trabalho, por motivo de sade, que funcionrios de uma determinada empresa tiveram no perodo de um
ms, 6 faltas.
A amplitude interquartil dada por:
Amplitude interquartil = Q3 Q1 = 1 0 = 1 falta
O desvio-padro obtido atravs das frmulas (3.8) ou (3.9). Para exemplificar, vamos trabalhar com a frmula (3.9). Para facilitar, vamos montar um quadro com os resultados que nos interessa para aplicar tal expresso.

NMERO DE
FALTAS X1

fi

Xi X fi

Xi - fi

31

20

20

20

16

32

18

25

36

Total ()

63

53

131

captulo 3

75

Substituindo os valores encontrados no quadro acima na frmula 3.9, obtemos:

( x f )
f -

s=

x i2

n -1

2
53)
(
131 -

63 =
63 -1

2809
63 @ 131 - 44, 59 @
62
62

131 -

@ 1, 3938 @ 1,18 faltas


Podemos dizer que, em mdia, ocorre aproximadamente 1 falta por funcionrio, por ms. Na verdade, sabemos que esse nmero de faltas por funcionrio
varia em torno da mdia, mas, tipicamente, a diferena em relao mdia
de, aproximadamente, 1 falta.
A varincia obtida atravs das frmulas (3.10) ou (3.11), porm, como j
temos o desvio-padro, basta elevarmos o valor encontrado ao quadrado. Portanto, temos:
s2 = (1,18 faltas)2 = 1,3924 faltas2
Como 1,3924 faltas2 no tem interpretao, utilizamos o desvio-padro em
vez da varincia para interpretar o comportamento dos dados.
O coeficiente de variao para este exemplo dado por:

cv =

s 1,18
=
@ 1, 4048 ou 140,48%
x 0, 84

O coeficiente de variao nos diz que este conjunto de dados apresenta uma
alta disperso.
Para finalizarmos, vamos fazer os clculos para os dados agrupados em
classes de frequncias. Para isto, vamos utilizar o exemplo 2.3 que se encontra
no item 2.3.

76

captulo 3

Exemplo 3.4: A tabela a seguir apresenta a distribuio de frequncias do


tempo de vida de 60 componentes eletrnicos (medido em dias) submetidos
experimentao num laboratrio especializado.

TEMPO DE VIDA (DIAS)

PONTO MDIO (Xi)

3 18

10,5

18 33

25,5

33 48

40,5

48 63

55,5

63 78

10

70,5

78 93

28

85,5

93 108

100,5

108 123

115,5

Total

60

Tabela 3.2 Tempo de vida de componentes eletrnicos.

Calcule a amplitude, o desvio-padro, a varincia e o coeficiente de variao


para este conjunto de dados e interprete os resultados.
Resoluo
A amplitude para este conjunto de dados dada por:
R = x(mximo) X(mnimo) = 123 3 = 120 dias.
A maior diferena entre os tempos de vida (em dias) dos componentes eletrnicos foi de 120 dias, ou seja, o componente com maior sobrevivncia durou
120 dias a mais do que o componente que durou menos tempo.

captulo 3

77

Para o clculo da amplitude interquartil vamos utilizar os resultados obtidos no exemplo 2.6. Portanto:
Amplitude interquartil = Q3 Q1 = 86,57 55,5 = 31,07 dias
De acordo como valor obtido, conclumos que 50% das observaes centrais do
conjunto de dados esto contidas em um intervalo cuja amplitude 31,07 dias.
Para o clculo do desvio-padro, podemos utilizar as frmulas (3.8) ou (3.9),
onde o termo xi o ponto mdio de cada classe de frequncia. Como a mdia
aritmtica envolve valores decimais, mais simples efetuar os clculos atravs
da frmula (3.9). Como no exemplo anterior, vamos construir um quadro acrescentando as colunas que fornecero os valores que precisamos para substituir
na frmula 3.9.

CLASSES DE
FREQUNCIAS

PM (Xi)

Xi - fi

Xi - fi

3 18

10,5

31,5

330,75

18 33

25,5

102

2601

33 48

40,5

162

6561

48 63

55,5

444

24642

63 78

10

70,5

705

49702,5

78 93

28

85,5

2394

204687

93 108

100,5

201

20200,5

108 123

115,5

115,5

13340,25

Total

60

4155

322065

78

captulo 3

Com os valores obtidos, temos:

( x f )
f -

s=
@

x i2

n -1

322065 -

(4155)2

60 -1

60

17264025
60
@
59

322065 -

322065 - 287733, 75
@ 581, 89 @ 24,12 dias
59

Em mdia, os componentes eletrnicos tm durao de 69 dias e 6 horas


com uma variao de, aproximadamente, 24 dias e 3 horas para mais ou para
menos com relao mdia.
A varincia, como j sabemos, o desvio-padro ao quadrado. Assim, temos:
s2 = (24,12 dias)2 = 581,77 dias2
Como 581,77 dias2 no tem interpretao, utilizamos o desvio-padro para
interpretar o comportamento dos dados.
O coeficiente de variao para este exemplo :

cv =

s 24,12
=
@ 0, 3483 ou 34,83%
x 69, 25

o que indica uma variabilidade alta no conjunto de dados.

captulo 3

79

ATIVIDADE
1. Vamos utilizar, entre outros exerccios, os mesmos da captulo 2, porm encontrando as
medidas de disperso.
Os dados abaixo referem-se ao nmero de horas extras de trabalho de uma amostra de
64 funcionrios de uma determinada empresa localizada na capital paulista.

10

10

12

14

14

14

15

16

18

18

18

18

18

19

20

20

20

20

20

21

22

22

22

22

22

22

22

22

22

22

22

22

23

23

24

24

24

24

24

24

24

25

25

25

25

26

26

26

26

26

26

27

27

27

28

28

29

30

30

32

35

36

40

41

a) Calcule e interprete as seguintes medidas de disperso, calculadas para os dados


brutos (dados no tabulados): amplitude, desvio-padro, varincia e coeficiente de
variao e interprete os resultados.
b) Por meio da distribuio de frequncias (dados tabulados) construda para este conjunto de dados (no captulo anterior), encontre a amplitude, o desvio-padro, a varincia e o coeficiente de variao e interprete os resultados.

80

captulo 3

2. Os dados abaixo representam as vendas mensais (em milhes de reais) de vendedores


de gnero alimentcios de uma determinada empresa.

VENDAS MENSAIS (EM MILHES


DE REAIS)

NMERO DE VENDEDORES

0 | 1

1 | 2

12

2 | 3

20

3 | 4

48

4 | 5

14

5 | 6

10

Total

110

Encontre a amplitude, o desvio-padro, a varincia e o coeficiente de variao e interprete os resultados


3. Os dados a seguir representam as notas de 5 disciplinas de um determinado candidato
em um concurso pblico. So elas:
2, 5, 8, 8, 9
Calcule a amplitude, o desvio-padro, a varincia e o coeficiente de variao. Interprete
os resultados.

captulo 3

81

4. Numa pesquisa realizada com 91 famlias, levantaram-se as seguintes informaes com


relao ao nmero de filhos por famlia:

NMERO DE FILHOS

FREQUNCIA DE
FAMLIAS

19

22

28

16

Calcule e interprete os resultados:


a) da amplitude;
b) do desvio-padro;
c) do coeficiente de variao.
5. O histograma abaixo representa a distribuio das idades dos funcionrios de uma agncia bancria. Com base no histograma abaixo, responda:

Frequncia

Histograma
16
15
14
13
12
11
10
9
8
7
6
5
4
3
2
1
0

20 | 25

25 | 30

30 | 35

35 | 40

40 | 45

45| 50

Idade

Quais so a amplitude, o desvio-padro, a varincia e o coeficiente de variao para as


idades dos funcionrios? Interprete os resultados.

82

captulo 3

6. Um fabricante de caixas de cartolina fabrica trs tipos de caixa. Testa-se a resistncia


de cada caixa, tomando-se uma amostra de 100 caixas e determinando-se a presso
necessria para romper cada caixa. Seguem os resultados dos testes:

TIPOS DE CAIXAS

Presso mdia de ruptura (bria)

15

20

30

Desvio-padro das presses (bria)

a) Que tipo de caixa apresenta a menor variao absoluta na presso de ruptura?


b) Que tipo de caixa apresenta a maior variao relativa na presso de ruptura?

REFLEXO
Vimos, neste captulo, que to importante quanto conhecer a mdia de um conjunto de dados
determinar o seu grau de variabilidade (ou disperso).
Por exemplo, num bairro nobre da capital paulista est uma das maiores favelas de So Paulo. Se analisarmos somente o valor da renda mdia do bairro certamente vamos concluir que
o valor obtido comparvel s melhores economias do mundo. Porm, devemos levar em
conta que a discrepncia entre os diversos valores da renda deve ser muito grande. Ento,
para quantificar a variabilidade dos valores da varivel em estudo fundamental calcular as
medidas de disperso, particularmente o desvio-padro.

LEITURA
Aqui, sugerimos a leitura do artigo E se todos fossem ao mesmo cinema ao mesmo tempo?
do professor Luiz Barco, disponvel em http://super.abril.com.br/ciencia/lei-regularidade-estatistica-se-todos-fossem-ao-mesmo-cinema-ao-mesmo-tempo-439499.shtml. Ele retrata,
de forma bem interessante, a questo da regularidade dos fenmenos relacionados ao comportamento social.

captulo 3

83

REFERNCIAS BIBLIOGRFICAS
ANDERSON, David R.; SWEENEY, Denis J.; WILLIAMS, Thomas A. Estatstica aplicada
administrao e economia. So Paulo: Pioneira Thomson Learning, 2003.
BUSSAB, Wilton de O.; MORETTIN, Pedro A. Estatstica bsica. So Paulo: Saraiva, 2003.
COSTA NETO, Pedro Luiz de Oliveira. Estatstica. So Paulo: Edgard Blucher, 2002.
DOWNING, Douglas; CLARK, Jeffrey. Estatstica aplicada. So Paulo: Saraiva, 2002.
FARIAS, Alfredo Alves de; SOARES, Jos Francisco; CSAR, Cibele Comini. Introduo
estatstica. Rio de Janeiro: LTC, 2003.

NO PRXIMO CAPTULO
Nos captulos j vistos, estudamos formas de organizar e resumir dados por meio de distribuies de frequncias e de medidas descritivas. So processos que, geralmente, nos passam
informaes sobre algo que j ocorreu. Tais informaes tambm so de fundamental importncia para que possamos prever o que ir acontecer no futuro. Para isso, no prximo captulo,
estudaremos a teoria de probabilidades, que, entre outras coisas, auxilia-nos na determinao
de ocorrncia de eventos futuros, tais como: vai chover amanh, qual ser minha receita no
prximo ms, qual o nvel de demanda de meu produto no prximo ano, entre muitos outros.

84

captulo 3

4
Noes de
Probabilidade

4 Noes de Probabilidade
Nos captulos anteriores vimos como organizar e descrever conjuntos de dados
atravs de grficos, tabelas e medidas resumo, tais como: medidas de posio
e disperso. Observamos que os resultados obtidos nos auxiliam na anlise e
interpretao dos dados.
Neste captulo estudaremos conceitos bsicos de probabilidade.

OBJETIVOS
Com o estudo dos conceitos abordados neste captulo, voc ser capaz de identificar experimentos aleatrios e calcular as probabilidades de ocorrncia de determinados eventos,
atravs da definio de probabilidade e de suas propriedades.

REFLEXO
Voc se lembra do significado da palavra probabilidade? Sabe qual o seu real sentido? E
qual a sua importncia em nosso dia a dia? Certamente voc j deve ter feito perguntas cujas
respostas dependiam do clculo de probabilidades. Por exemplo:
Qual a probabilidade de chover no prximo final de semana prolongado?
Qual a probabilidade de se ganhar na Mega - Sena jogando um volante com seis nmeros?
Qual a probabilidade das vendas de determinado produto decrescer se aumentarmos o
preo do produto?
O clculo destas e outras probabilidades nos auxiliam na tomada de decises.

Introduo
O clculo efetivo de uma probabilidade depende frequentemente do uso dos
resultados da anlise combinatria. A anlise combinatria a parte da Matemtica que desenvolve tcnicas e mtodos de contagem.
Apresentaremos, nos itens a seguir, um resumo dos principais resultados
dessa rea da Matemtica elementar.

86

captulo 4

4.1 Princpio Fundamental da Contagem (PFC)


Para entendermos este conceito, vamos analisar o exemplo a seguir.
Exemplo 4.1
Um quiosque de praia no Rio de Janeiro lanou a seguinte promoo durante uma temporada de vero:
Combinado de sanduche natural e suco a R$ 10,00
O cliente pode escolher trs opes de sanduche (frango, atum e queijo
branco) e duas opes de suco (laranja e uva).
Considerando estas opes, de quantas formas distintas o cliente pode escolher seu combinado?
O cliente poder optar por trs sabores do lanche: frango (F), atum (A) e
queijo branco (Q).
Para cada uma das possibilidades anteriores, a escolha do suco pode ser
feita de duas maneiras: laranja (L) e uva (U).
A representao dessas possibilidades pode ser feita por meio de um diagrama conhecido como diagrama de rvore.
Temos:

1 Etapa (escolha do
sanduche)

2 Etapa (escolha do
suco)

Resultado combinado

laranja

(F,L)

uva

(F,U)

laranja

(A,L)

uva

(A,U)

laranja

(Q,L)

uva

(Q,U)

Frango

Atum

Queijo branco

captulo 4

87

Podemos observar que o nmero de combinados possveis 32=6.


Este exemplo nos ajuda a entender a definio a seguir.
Suponha que uma sequncia ordenada seja formada por k elementos (a1,a2,
,ak ), em que:
a1 pode ser escolhido de n1 maneiras distintas;
a2 pode ser escolhido de n2 maneiras distintas, a partir de cada uma das
possibilidades anteriores;

ak pode ser escolhido de nk maneiras distintas, a partir das escolhas anteriores;
Ento, o nmero de possibilidades para se construir a sequncia (a1, a2,,ak ) :
n1 n2 ... nk
Esse resultado conhecido como Princpio Fundamental da Contagem
(PFC) e serve de base para a resoluo de problemas de contagem.

Exemplo 4.2
Quantos nmeros de trs algarismos podemos formar com os algarismos
0,1,2,3,4,5 e 6?
Resoluo:
O primeiro algarismo pode ser escolhido de seis maneiras distintas, pois o
nmero que ser formado no pode comear por zero. Observe que 021 = 21;
O segundo algarismo pode ser escolhido de sete maneiras distintas, pois
pode haver repetio de algarismo;
O terceiro algarismo tambm pode ser escolhido de sete maneiras distintas.
Ento, pelo PFC, a quantidade de nmeros que podemos formar :
6 7 7 = 294

88

captulo 4

Agora, passaremos ao conceito de fatorial de um nmero. Tal conceito


uma ferramenta de clculo importante em Anlise Combinatria.

4.2 Fatorial de um nmero natural


Definimos fatorial de um nmero natural n, n 2, e indicamos por n! (lemos
fatorial de n ou n fatorial), o produto obtido pela multiplicao de n por
todos os seus antecessores naturais positivos, ou seja:
n! = n (n 1) (n 2) ... 321,para n 2
Observao: Consideremos 0! = 1
Assim, temos, por exemplo:
3! = 3 2 1 = 6
6! = 6 5 4 3 2 1 = 720

7 ! = 7 6 5 4 3 2 1 = 7 6!

6!

Exemplo 4.3
Vamos encontrar o valor de

12 !
.
8!

Resoluo
Para encontrar o valor de 12!/8!, podemos desenvolver o fatorial do nmero
maior (12) at chegarmos ao fatorial do nmero menor (8).
Ento:

12! 12 11 10 9 8!
=
= 11880
8!
8!
Podemos dividir o 8! do numerador com o 8! do denominador, obtendo
como resultado 1. Ento, o resultado final ser a multiplicao de 12 11 10 9.
Agora, vamos estudar mtodos de contagem de determinados agrupamentos, baseados no PFC, que simplificaro a resoluo de muitos problemas.

captulo 4

89

4.3 Arranjo
Dado um conjunto com n elementos distintos, chamamos arranjo dos n elementos, tomados k a k, a qualquer sequncia ordenada de k elementos distintos escolhidos entre os n existentes.
Expressamos a definio acima da seguinte maneira:

A n ,k =

n!
,nk
(n - k )!

Exemplo 4.4
Dado o conjunto A={1,2,3,4,5,6}, quantos arranjos desses seis elementos
tomados dois a dois podemos formar?
Resoluo
Vamos escrever todas as sequncias ordenadas de dois elementos distintos
escolhidos entre os seis elementos do conjunto A:
(1,2) (1,3) (1,4) (1,5) (1,6) (2,1) (2,3) (2,4) (2,5) (2,6)
(3,1) (3,2) (3,4) (3,5) (3,6) (4,1) (4,2) (4,3) (4,5) (4,6)
(5,1) (5,2) (5,3) (5,4) (5,6) (6,1) (6,2) (6,3) (6,4) (6,5)
Da sequncia descrita acima, observamos que cada arranjo difere dos demais:
pela natureza dos elementos escolhidos:
(1,3) (3,5)
pela ordem dos elementos escolhidos:
(1,3) (3,1)
J sabemos que a quantidade de arranjos que pode ser formada 30. Utilizando a frmula, obtemos:

A 6, 2 =

6!
6! 6 5 4!
= =
= 30
4!
( 6 2 )! 4!

Na resoluo do exemplo, listamos todos os possveis arranjos somente


para facilitar a compreenso do conceito.

90

captulo 4

A quantidade de arranjos que pode ser formada tambm pode ser obtida atravs do PFC:

6 5 = 30
n de opes para a
escolha do 1 elemento do par

n de opes para a
escolha do 2 elemento do par

4.4 Permutao
H situaes em que devemos escolher n elementos distintos, entre os n disponveis, para formar uma sequncia ordenada (arranjo). Nestas situaes, o
nome dado a estes arranjos permutao.
Assim, o nmero de permutaes de n elementos distintos dado por:
Pn = n!
Podemos observar que a permutao um caso particular do arranjo, pois:

Exemplo 4.5
Quantos so os anagramas (diferentes disposies das letras de uma palavra) da palavra PAZ?
Resoluo
Vamos listar todos os anagramas:
PAZ

PZA

APZ

AZP

ZPA

ZAP

O nmero de anagramas que pode ser formado :


P3 = 3! = 3 2 1 = 6

captulo 4

91

4.4.1 Permutao com elementos repetidos


Em uma permutao com elementos repetidos, a troca de posio desses elementos repetidos no altera o resultado do anagrama.
Ento, se temos n elementos, dos quais n1 so iguais a a1 (a1 representa, por
exemplo, uma letra), n2 so iguais a a2 (a2 representa outra letra), ..., nr so iguais
a ar, o nmero de permutaes possveis dado por:

P nn1,n 2 ,...,n r =

n!
n1 !n 2 !...n r !

Para ficar mais claro este conceito, vamos analisar o exemplo a seguir.
Exemplo 4.6
Vamos determinar o nmero de anagramas formados com a palavra ARITMTICA.
Resoluo
A palavra ARITMTICA possui 10 letras, sendo 2 letras iguais a A, 2 iguais a
I e 2 letras T. Ento, temos um caso de permutao com elementos repetidos.
O nmero de anagramas que podemos formar :

P102,2,2 =

10 9 8 7 6 5 4 3 2! 1814400
=
= 453600
2!2!2!
4

4.5 Combinao
Na definio de arranjo vimos que, quando tomamos k elementos distintos de
n existentes, formamos uma sequncia ordenada.
H casos em que s interessam os elementos que compem a
sequncia, no importando a ordem em que ali figuram. Nestes casos, temos,
ento, o que se chama de combinao de n elementos tomado k a k:

Cn ,k =

92

captulo 4

n!
k !( n k )!

Exemplo 4.7
Maria quer escolher dois sabores de torta doce para servir em sua festa de
final de ano. A doceria oferece os seguintes sabores: limo (L), chocolate (C),
morango (M) e floresta negra (F). De quantas formas distintas Maria poder
fazer essa escolha?
Resoluo
Neste exemplo conseguimos perceber que no importa a ordem em que os
sabores so escolhidos. Escolher, por exemplo, torta de chocolate e morango
{C,M} o mesmo que escolher torta de morango e chocolate {M,C}. Cada possvel escolha de Maria representa, portanto, uma combinao de quatro sabores tomados dois a dois.
O nmero de formas distintas de Maria escolher os sabores :

C 4, 2 =

4!
4 3 2!
=
=6
2 !( 4 2 )!
2!2

Vamos listar as possveis formas para melhor entendimento do conceito de


combinao:
{L,C}
{L,M}
{L,F}
{C,M}
{C,F}
{M,F}
Agora que j relembramos conceitos da anlise combinatria que so uteis
no clculo de probabilidades, vamos estudar como se calcula probabilidades
em diversas situaes. Antes disto, vamos conhecer brevemente um pouco da
histria da probabilidade.

4.6 Breve histrico


Quando estudamos a histria da probabilidade, o nome de Gerolamo Cardano
sempre citado. Ele foi o primeiro homem na histria a sistematizar dados e a
entender a lgica de alguns processos que at ento eram tidos como aleatrios
para grande parte da humanidade.
A probabilidade que conhecemos e estudamos nos dias atuais surgiu em
meados do sculo XVII, a partir dos estudos de De Mre, Blaise Pascal e Pierre
de Fermat. Segundo BRUNI (2010), os estudos feitos por Pascal e Fermat sobre
vrias situaes de jogos deram origem ao desenvolvimento da Teoria de Probabilidades as Leis do Acaso.
captulo 4

93

Com o desenvolvimento das teorias de probabilidades, houve uma evoluo da


cincia atuarial e das aplicaes no mercado de seguros. Bernoulli, em 1730, pesquisou, com base em estudos com recm-nascidos, um novo modo de se calcular
o nmero esperado de sobreviventes aps n anos.
A etapa moderna da Teoria das Probabilidades teve incio em 1933, com Andrei
Kolmogorov. Ele lanou as bases axiomticas da probabilidade, baseada na Teoria
dos Conjuntos, reduzindo a Teoria das Probabilidades Teoria da Integrao.

CONEXO
Para voc conhecer um pouco mais sobre a histria da probabilidade sugerimos ouvir o
udio Histria da Probabilidade, disponvel em http://m3.ime.unicamp.br/recursos/1253.

4.7 Experimento Aleatrio, Espao Amostral, Evento


Antes de passarmos definio de probabilidade vamos apresentar alguns conceitos bsicos necessrios para efetuar seu clculo.
Experimento Aleatrio: uma situao ou acontecimento cujo resultado
no pode ser previsto com certeza. Cada experimento poder ser repetido inmeras vezes sob condies essencialmente inalteradas. Embora
no possamos afirmar qual ser o resultado de um particular experimento, podemos descrever o conjunto dos possveis resultados.
Espao Amostral: o conjunto formado por todos os resultados do experimento aleatrio. Indicamos este conjunto pela letra grega mega .
Cada elemento do espao amostral denominado ponto amostral.
Evento: um subconjunto do espao amostral (indicado por letras maisculas do nosso alfabeto). O evento que possui somente um elemento
denominado evento simples.
Exemplo 4.8
Considere o experimento aleatrio que consiste no lanamento de um
dado. Neste experimento, o espao amostral definido como {1,2,3,4,5,6}.

94

captulo 4

Alguns dos eventos que podem ser definidos neste experimento so:
A: sada de face par
A = {2,4,6}
B: sada de face mpar
B = {1,3,5}
C: sada de face maior que 6
C = . Neste caso indica o conjunto vazio. Este evento denominado evento impossvel.
D: sada de face menor que 2
D = {1}, que denominado evento simples.
E: sada de face menor ou igual a 6
E = {1,2,3,4,5,6}, que o prprio espao amostral . Este evento denominado evento certo.
Podemos observar, pelos eventos definidos anteriormente, que um evento pode no conter elementos (conjunto vazio), conter somente um elemento
(evento simples), conter mais de um elemento e, finalmente, pode ser constitudo por todos os elementos do espao amostral, ou seja, o evento o prprio .

4.8 Operaes com Eventos


4.8.1 Unio
Dados dois eventos A e B, temos que a unio destes dois eventos o evento
que contm os pontos amostrais pertencentes a A, ou a B ou a ambos. Denotamos a unio por A B. O diagrama de Venn, na figura 4.1, descreve a unio dos
eventos A e B.

Figura 4.1 Unio de dois eventos

captulo 4

95

4.8.2 Interseco
A interseco de dois eventos A e B, denotado por A B, o evento que contm
os pontos amostrais que pertencem simultaneamente aos eventos A e B.

Figura 4.2 Interseco de dois eventos

Se A B = temos que A e B so eventos mutuamente exclusivos, ou seja,


quando um ocorre o outro no pode ocorrer.

Figura 4.3 Eventos mutuamente exclusivos

Observao
Quando estamos interessados na interseco de dois eventos utilizamos
a conjuno e, ou seja, queremos encontrar os elementos que pertencem ao
evento A e ao evento B. No caso da unio de dois eventos utilizamos a conjuno ou, ou seja, so elementos que pertencem ao evento A, ou ao B ou a ambos.

96

captulo 4

4.8.3 Complementao
O complemento do evento A, denotado por Ac , definido como o evento que contm todos os pontos amostrais que no pertencem ao evento A, ou seja, Ac = W A

AC

Figura 4.4 Complementar do evento A

Exemplo 4.9
Considerando o experimento aleatrio do exemplo 4.8 temos que W
={1,2,3,4,5,6}.
Definindo os eventos A e B como:
A: sada de face par
A = {2,4,6}
B: sada de face menor ou igual a 4
B = {1,2,3,4}
Determinar A B, A B, Ac ,Bc , Ac Bc, Ac Bc , Ac B , Bc A
Resoluo
A B = {1,2,3,4,6}
A B = {2,4}
Ac = {1,3,5}
Bc = {5,6}
Ac Bc = {1,3,5,6}
Ac Bc = {5}
Ac B = {1,3}
Bc A = {6}

captulo 4

97

4.9 Probabilidade
A probabilidade um nmero que mede a possibilidade de ocorrncia de um
evento. O clculo da probabilidade pode ser efetuado de trs maneiras: atravs
da definio clssica de probabilidade, atravs da definio frequencial de probabilidade e atravs do mtodo subjetivo.
Vamos concentrar nossos estudos na definio clssica e frequencial. No
mtodo subjetivo, a probabilidade estimada com base no conhecimento de
circunstncias relevantes. Por exemplo, dado o estado de sade do paciente e
a extenso dos ferimentos, um mdico pode sentir que esse paciente tem uma
chance de 95% de se recuperar completamente.
4.9.1 Definio Clssica
Aplicamos esta definio quando os pontos amostrais do espao amostral so
equiprovveis, ou seja, tm a mesma probabilidade de ocorrer. Por exemplo,
quando jogamos um dado equilibrado todas as faces tm a mesma probabilidade de ocorrer, ou seja, 1/6.
Dado um evento A, a probabilidade de A, representada por P(A), obtida
atravs da definio clssica por:

P (A )=

nmero de resultados favorveis ao evento A


nmero total de resultados possveis

(4.1)

Exemplo 4.10
Retira-se uma carta de um baralho completo de 52 cartas. Qual a probabilidade de sair um rei?
Resoluo
O espao amostral deste experimento :

W = {A O ,..., K O , A E ,..., K E , A P ,..., K P , A C ,..., K C }


ou seja, temos 52 pontos amostrais igualmente provveis de ocorrer. O
evento A: sair um rei o subconjunto A = {ko, KE, Kp, Kc}.

98

captulo 4

Utilizando a definio clssica de probabilidade temos:

P (A )=

4
52

Podemos expressar os resultados das probabilidades em forma de fraes, decimais


ou percentuais. Nesse caso, podemos indicar o resultado por P ( A ) =
ainda, 7,69%.

4
, 0, 0769, ou,
52

4.9.2 Definio Frequencial


Vimos que a definio clssica de probabilidade s pode ser aplicada quando
os pontos amostrais so igualmente provveis de ocorrer. Em situaes em que
isto no ocorre podemos determinar a probabilidade atravs da definio frequencial. Esta definio baseia-se em observaes repetidas do experimento
aleatrio. Seja A o evento de interesse. A probabilidade P(A) obtida atravs da
definio frequencial dada por:

P(A) =

nmero vezes que o evento A ocorreu


nmero de repeties do exp erimento aleatrio

(4.2)

em que o nmero de repeties deve ser grande.


A ideia utilizada nesta definio a mesma da frequncia relativa definida
no primeiro captulo.
Exemplo 4.11
Uma loja de varejo tem registrado em seus arquivos que dos
2.000 televisores, de determinada marca, vendidas em certo perodo,
400 precisaram de reparos dentro da garantia de um ano. Qual a probabilidade de que um consumidor que compre uma televiso dessa marca no precise
utilizar a garantia?

captulo 4

99

Resoluo
Pelas informaes, temos que 1.600 televisores no precisaram de reparos
durante a garantia. Sendo o evento A: a televiso no precisa de reparo durante
a garantia e utilizando a teoria frequencial, temos:

P(A) =

1.600 4
= = 0, 8
2.000 5

Ou seja, o consumidor tem uma probabilidade 0,8 de no precisar usar


a garantia.
Utilizamos aqui o conhecimento histrico para fazer uma previso, ou seja, utilizamos a
frequncia relativa do evento, obtida de dados coletados, para estimar a probabilidade.

4.10 Regras Bsicas de Probabilidade


Sejam A e B dois eventos do espao amostral W. Ento:
c)
d)
e)
f)
g)

0 P(A) 1
P(W) = 1
P (A B) = P(A) + P(B) P(A B)
Se A e B forem mutuamente exclusivos, ento P (A B) = P(A) + P(B)
P(Ac) = 1 P(A)

Exemplo 4.12
Retira-se uma carta de um baralho completo de 52 cartas. Qual a probabilidade de sair um nove ou uma carta de paus?
Resoluo
Neste experimento aleatrio, temos que o espao amostral formado por
52 pontos amostrais, ou seja, W = {Ao,...,Ko, AE,... KE, AP,...KP,AC,...,Kc}. Vale relembrar que todos os pontos amostrais so equiprovveis, com isso podemos
utilizar a definio clssica de probabilidade. Devemos observar tambm que o

100

captulo 4

enunciado nos pede para encontrar a probabilidade do evento sair nove ou do


evento sair carta de paus, o que caracteriza a unio de dois eventos.
Portanto devemos utilizar P(A B) = P(A) + P(B) P(A B).
Os eventos definidos pelo exerccio so:

A: sada de uma carta nove


A: {9O , 9E , 9C , 9P }, por tan to , P (A )=

4
52

B: sada de uma carta de paus


B:{A P , 2P ,..., K P }, por tan to, P (B)=

13
52
1
A B = {9P }, por tan to, P (A B)=
52
Assim,

P (A B)= P (A )+ P (B)- P (A B)
4 13 1
+ 52 52 52
16
P (A B)=
52
P (A B)=

Exemplo 4.13
Uma urna contm 30 bolas vermelhas, 12 bolas azuis e 7 bolas pretas. Extraindo-se aleatoriamente uma bola, qual a probabilidade de ser:
a) vermelha

P (V )=

30
49

b) azul

P (A )=

12
49
captulo 4

101

c) azul ou preta

P (A P )= P (A )+ P (P )=

12 7 19
+
=
49 49 49

( ) () (

Aqui no utilizamos P A P = P A + P P - P A P , pois no h


a interseco A P (uma bola no pode ser azul e preta), ou seja, A e B so
eventos mutuamente exclusivos.
d) nem azul nem vermelha

P (P )=

7
49

Exemplos 4.14
Em um congresso cientfico existem 25 administradores e 17 matemticos.
Qual a probabilidade de ser formar uma comisso com 8 membros, na qual
figurem 5 administradores e 3 matemticos?
Resoluo
Vamos definir o evento A como: a comisso formada por 5 administradores e 3 matemticos.
O nmero total de comisses que conseguimos formar com 8 membros :

42
= 118.030.185
8
Agora, o nmero de comisses que conseguimos formar com 5 administradores e 3 matemticos :

25 17
= 36.128.400
5 3

102

captulo 4

Portanto:

P (A) =

36.128.400
= 0, 3061 x 100 = 30, 61%
118.030.185

O clculo das combinaes foi feito utilizando uma calculadora cientfica.


Exemplo 4.15
Em uma prova caram dois problemas. Sabe-se que 132 alunos acertaram o
primeiro, 86 erraram o segundo, 120 acertaram os dois e 54 acertaram apenas
um problema. Qual a probabilidade de que um aluno, escolhido ao acaso:
a) no tenha acertado nenhum problema?
b) tenha acertado apenas o segundo problema?
Resoluo
Este exemplo um exerccio tpico de clculo de probabilidades envolvendo
teoria dos conjuntos.
Do enunciado, temos:
120 acertaram os dois problemas;
Se 120 acertaram os dois, 132 120 = 12 acertaram somente o primeiro;
Se 54 acertaram apenas um e 12 acertaram somente o primeiro, 54 12 =
42 acertaram somente o segundo;
A informao de que 86 erraram o segundo significa que esta quantidade
acertou somente o primeiro ou no acertou nenhum deles. Se temos 12
que s acertaram o primeiro, 86 12 = 74 erraram os dois;
Com esta anlise conseguimos encontrar o nmero total de alunos que
fizeram a prova: 120 + 12 + 42 + 74 = 248.
Podemos colocar estas informaes no diagrama de Venn:

P1

P2
12

120 42
74
captulo 4

103

Ento:
a) Definindo o evento A: o aluno no acertou nenhum problema, temos:

P (A) =

74
= 29, 84%
248

b) Definindo o evento B: o aluno acertou apenas o segundo problema, temos:

P (A) =

42
= 16, 94%
248

4.11 Probabilidade Condicional


Em muitas situaes, podemos ter interesse em encontrar a probabilidade de
ocorrncia de um evento levando em conta que outro evento j ocorreu. Esta probabilidade recebe o nome de Probabilidade Condicional e definida a seguir.
4.11.1 Definio de Probabilidade Condicional
Dados dois eventos A e B, a probabilidade condicional de A, dado que B ocorreu, representada por P(A|B) e calculada por:

P (A / B)=

P (A B)
,
P (B)

com P (B)> 0

(4.3)

Lemos a notao P(A|B) como a probabilidade de A ocorrer sabendo que


B ocorreu.
Da definio apresentada obtemos a regra da multiplicao, de grande aplicao no clculo de probabilidades, dada por:

P (A B)= P (B).P (A | B)

104

captulo 4

(4.4)

Exemplo 4.16
H 100 candidatos para uma vaga numa empresa multinacional. Alguns
tm curso superior, outros no. Alguns tm experincia no ramo, outros no.
Os dados so:

Com experincia
anterior
Sem experincia
anterior
Total

POSSUI
CURSO
SUPERIOR

NO POSSUI
CURSO
SUPERIOR

TOTAL

35

45

80

15

20

50

50

100

Considerando que o candidato escolhido para a vaga possui curso superior,


qual a probabilidade de ele ter experincia anterior no ramo?
Resoluo
Este exemplo se refere a um caso de probabilidade condicional, pois j sabemos que o candidato escolhido possui curso superior. Definindo os eventos
e analisando o quadro temos:
A: ter experincia no ramo (definimos desta maneira, pois a pergunta do
exerccio).
B: possui curso superior (definimos desta maneira, pois o evento que sabemos que ocorreu).

captulo 4

105

P(B) =

50
100

e
P (A B)=

35
100

Por tan to:


P (A | B)=

35 / 100 35
=
= 0,, 7
50 / 100 50

Note que o valor que aparece no denominador o total de casos do evento que sabemos que ocorreu. Neste exemplo sabamos que o candidato escolhido tinha curso
superior e o total de candidatos com este perfil 50, justamente o valor que aparece no
denominador do clculo da probabilidade condicional.

Conforme TRIOLA (2008, pp. 138),


[...] acreditar incorretamente que P(B|A) e P(A|B) sejam iguais ou usar um valor no lugar
do outro , s vezes, chamado confuso do inverso. Estudos mostram que mdicos fornecem informaes bastante enganosas quando eles confundem os inversos. Com base
em estudos reais, eles tenderam a confundir P(cncer|teste positivo) com P(teste positivo|cncer). Cerca de 95% dos mdicos estimaram P(cncer|teste positivo) como cerca
de 10 vezes mais alta, com a consequncia de que os pacientes receberam diagnsticos
enganosos e ficaram desnecessariamente angustiados pela informao incorreta.

106

captulo 4

4.12 Independncia de eventos


Sejam A e B dois eventos do espao amostral W, com P(B) > 0. O evento A dito
independente do evento B se

P (A | B)= P (A )

(4.5)

ou seja, o evento A independente do evento B se a probabilidade de A no


afetada pela ocorrncia ou no de B.
Se A e B so independentes temos que:

P (A B)= P (A ).P (B)

(4.6)

Exemplo 4.17
Numa caixa com 20 lmpadas, 4 so defeituosas. Extraindo-se aleatoriamente duas lmpadas, sem reposio, qual a probabilidade de:
a) nenhuma ser defeituosa;
b) ambas serem defeituosas.
c) considerando a extrao das duas lmpadas, com reposio, encontre a
probabilidade de nenhuma delas ser defeituosa.
Resoluo
Neste exemplo os eventos so dependentes, pois no h reposio das lmpadas na caixa, ou seja, o resultado obtido na extrao da segunda lmpada
afetado pelo resultado obtido na primeira extrao.
a) Nenhuma lmpada ser defeituosa significa que as duas so perfeitas.
Vamos indicar por P1 primeira lmpada ser perfeita e por P2 segunda
lmpada ser perfeita. Como queremos encontrar a probabilidade da primeira ser perfeita e da segunda ser perfeita tambm devemos utilizar o
conceito da regra da multiplicao,

P (P1 P2 )= P (P1 ).P (P2 | P1 )


P (P1 P2 )=

16 15 240
. =
= 0, 6316
20 19 380

captulo 4

107

b) Indicando por D1 primeira lmpada ser defeituosa e por D2 segunda lmpada ser defeituosa temos:

P (D1 D 2 )= P (D1 ).P (D 2 | D1 )


P (D1 D 2 )=

4 3
12
. =
= 0, 0316
20 19 380

c) Vamos indicar por primeira lmpada ser perfeita e por segunda lmpada ser perfeita. Neste caso, as duas extraes so independentes, pois
o resultado da segunda extrao no afetado pelo primeiro resultado.
Ento:

P ( P1 P2 ) = P ( P1 ) ( P2 )
P ( P1 P2 ) =

16 16

= 64%
20 20

Exemplo 4.18:
Para testar se um sistema especialista responde satisfatoriamente a um usurio, foram feitas cinco perguntas, cada uma com quatro alternativas de resposta.
Se o sistema escolhe as alternativas aleatoriamente, qual a probabilidade de ele
responder corretamente a todas as cinco perguntas?
Resoluo
Definindo os eventos:
P1: acertar a pergunta 1
P2 :acertar a pergunta 2
P3: acertar a pergunta 3
P4: acertar a pergunta 4
P5: acertar a pergunta 5
Como o sistema escolhe as alternativas aleatoriamente, a probabilidade de
ele acertar a pergunta

108

captulo 4

1 (pois de 4 alternativas, somente 1 correta).


4

O fato do sistema ter escolhido uma alternativa (correta ou errada) em determinada pergunta no afeta as probabilidades de escolhas das outras perguntas. Portanto, os eventos so independentes. Ento:

1 1 1 1 1
P ( P1 P2 P3 P4 P5 ) = P ( P1 ) P ( P2 ) P ( P3 ) P ( P4 ) P ( P5 ) =
4 4 4 4 4
1
=
= 0, 0977%
1024
Estudaremos, no prximo item, uma das relaes mais importantes envolvendo probabilidades condicionais. A ideia central atualizarmos valores prvios de probabilidades calculando as probabilidades adicionais, denominadas
probabilidades posteriores.

4.13 Teorema de Bayes


Antes de apresentarmos a frmula do teorema de Bayes, vamos analisar o exemplo a seguir.
Exemplo 4.19
Um certo programa pode ser usado com uma entre duas sub-rotinas A e
B, dependendo do problema. A experincia tem mostrado que a sub-rotina A
usada 40% das vezes e B usada 60% das vezes. Se A usada, existe 75% de
chance de que o programa chegue a um resultado dentro do limite de tempo.
Se B usada, a chance de 50%. Se o programa foi realizado dentro do limite
de tempo, qual a probabilidade de que a sub-rotina A tenha sido a escolhida?
Resoluo
A probabilidade que temos que encontrar uma probabilidade condicional, pois j sabemos que o programa foi realizado dentro do limite de tempo.
Ento, de acordo com o que estudamos no item 4.11.1, podemos definir os
seguintes eventos:
A: sub-rotina A foi a escolhida.
R: o programa foi realizado dentro do limite de tempo.
Pela frmula da probabilidade condicional, queremos encontrar:

captulo 4

109

P (A | R ) =

P (A R )
P (R )

Agora, a interpretao da probabilidade que est no denominador fundamental para o entendimento deste teorema.
A probabilidade do evento R ocorrer est associada utilizao de duas sub-rotinas.
Sabemos que o programa foi realizado dentro do limite de tempo, mas no
sabemos qual sub-rotina foi utilizada. Com isto, precisamos considerar estas
duas situaes:
R A foi realizado dentro do limite de tempo e utilizada a rotina A;
R B foi realizado dentro do limite de tempo e utilizada a rotina B.
Ento, o clculo de P(R) dado por:
P(R) = P(R A) + P(R B)
ou seja, a probabilidade do evento R ocorrer a soma das duas situaes
possveis.
As probabilidades informadas no enunciado so:
P(A) = 0,40 probabilidade obtida atravs da definio frequencial;
P(B) = 0,60 probabilidade obtida atravs da definio frequencial;
P(R|A)=0,75 probabilidade do programa ser realizado dentro do tempo,se (sabendo que) A usada;
P(R|B) = 0,50 probabilidade do programa ser realizado dentro do tempo,se (sabendo que) B usada.
Como vamos encontrar P(R A) e P(R B)? Utilizaremos a regra da multiplicao, abordada no item 4.11.1.

110

captulo 4

Esta regra nos diz que a probabilidade da interseco dos dois eventos pode
ser obtida da seguinte maneira:
P(R A) = P(R|A) P(A)
e
P(R B) =P (R|B) P(B)
As probabilidades que esto do lado direito da igualdade so fornecidas no
enunciado. Ento:
P(R A) = P(R A) P(A) = 0,75 0,40 = 0,30
e
P(R B) = P(R B) P(B) = 0,50 0,60 = 0,30
Finalmente, conseguiremos calcular a probabilidade procurada:

P (A | R ) =

P (A R )
P (A R )
P (R | A) P (A)
=
=
P (R )
P ( R A ) + P ( R B) P ( R | A ) P ( A ) + P ( R | B) P ( B)

P (A | R ) =

0, 30
0, 30
=
= 0, 5 = 50%
0, 30 + 0, 30 0, 60

No Teorema de Bayes, a quantidade do numerador sempre ser um dos termos que


est no denominador. Vale ressaltar tambm que P(A B) = P(B A).

Agora, vamos formalizar o Teorema de Bayes.


Seja C1,C2,,Cn uma partio do espao amostral , isto ,
Ci Cj= ,
sempre que i j,
C1 C2 Cn = .

captulo 4

111

Considere um evento qualquer A em . Supomos conhecidas as probabilidades P(Ci) e P(ACi ),i = 1,2,,n. A probabilidade de ocorrncia do evento Ci,
supondo-se a ocorrncia do evento A, dada por:

P (Ci | A )=

P (Ci )P (A | Ci )

j =1 P (C j )P (A | C j )
n

para todo i = 1,2,,n.

ATIVIDADE
1. Uma biblioteca acaba de receber, por doao, 40 novos livros, inclusive 15 romances histricos. Se 3 desses livros so escolhidos aleatoriamente, sem reposio, qual a probabilidade de:
a) nenhum ser um romance histrico;
b) todos serem romances histricos;
c) pelo menos um ser romance histrico.
2. Como parte de uma campanha de promoo em So Paulo e no Rio de Janeiro, uma indstria de produtos de limpeza oferecer um prmio de R$ 50.000,00 a quem enviar seu
nome em um formulrio, com a opo de incluir um rtulo de um dos produtos da indstria.
A distribuio dos 200.000 formulrios recebidos est a seguir:

COM RTULO

SEM RTULO

So Paulo

100.000

40.000

Rio de Janeiro

45.000

15.000

Escolhendo aleatoriamente um dos formulrios e definindo os eventos A: o formulrio


escolhido de So Paulo e B: o formulrio escolhido tem um rtulo do produto, determine as seguintes probabilidades:
a) P(A)
b) P(B)

112

captulo 4

c) P(A | B)
d) P(Ac | Bc)
e) P(Ac | Bc)
f) P(B | Ac)
3. Uma loja de cosmticos tem os seguintes dados sobre a idade e o estado civil de
150 clientes.

ESTADO CIVIL

IDADE

SOLTEIRO

CASADO

30

70

20

MAIS DE 30

30

30

Selecionando aleatoriamente a ficha de um cliente, determinar:


a) probabilidade deste cliente ser solteiro;
b) probabilidade deste cliente ter mais de 30 anos;
c) se na ficha consta que o cliente solteiro, qual a probabilidade de ele ter mais de
30 anos;
d) probabilidade deste cliente ser casado sabendo que ele tem menos de 30 anos.
4. Uma agncia de locao de carros fez um levantamento sobre o perfil dos seus clientes e
obteve os seguintes resultados: 45% haviam alugado um carro no ltimo ano por razes de
negcios, 50% haviam alugado um carro no ltimo ano por razes pessoais e 20% haviam
alugado um carro no ltimo ano tanto por razes de negcios como por razes pessoais.
a) Qual a probabilidade de que um cliente tenha alugado um carro durante o ltimo ano
por razes pessoais ou por razes de negcios?
b) Qual a probabilidade de que um cliente no tenha alugado um carro durante o ltimo
ano nem por razes pessoais nem por razes de negcios?

captulo 4

113

5. Um satlite em rbita tem trs painis solares, e todos eles devem permanecer ativos a fim
de garantir o bom desempenho do aparelho. Os painis funcionam independentemente uns
dos outros. A chance de falha de cada um 0,01. Qual a probabilidade de o satlite funcionar
perfeitamente durante a misso? (Essa probabilidade a chamada confiabilidade do sistema
Farias, Soares e Csar, pg. 65)
6. Uma rede local de computadores composta por um servidor e cinco clientes (A, B, C, D e
E). Registros anteriores indicam que dos pedidos de determinado tipo de processamento,
realizados atravs de uma consulta, cerca de 10% vm do cliente A, 15% do B, 15% do C,
40% do D e 20% do E. Se o pedido no for feito de forma adequada, o processamento
apresentar erro. Usualmente, ocorrem os seguintes percentuais de pedidos inadequados:
1% do cliente A, 2% do cliente B, 0,5% do cliente C, 2% do cliente D e 8% do cliente E.
a) Qual a probabilidade de o sistema apresentar erro?
b) Qual a probabilidade de que o processo tenha sido pedido pelo cliente E, sabendo-se que apresentou erro?

REFLEXO
O estudo de probabilidades, que iniciamos neste captulo, tem muitas aplicaes no dia a dia
do gestor. At o momento, nos preocupamos em apresentar a teoria referente ao assunto. No
entanto, as aplicaes que podemos fazer do clculo de probabilidades so muito diversificadas: determinar a margem de erro e o grau de confiana de uma pesquisa, fazer previses
(com certo grau de confiana) de eventos futuros, auxiliar na tomada de decises, calcular
riscos de certos investimentos, etc.
Procure assimilar bem todos os procedimentos e conceitos apresentados neste captulo para
que possa acompanhar o desenvolvimento dos mtodos que sero apresentados mais adiante..

LEITURA
Recomendamos a leitura do texto possvel quantificar o acaso?, disponvel no endereo
http://www.klick.com.br/materia/20/display/0,5912,POR-20-89-957-,00.html, que apresenta uma interessante situao sobre o estudo de probabilidades.

114

captulo 4

REFERNCIAS BIBLIOGRFICAS
ANDERSON, David R.; SWEENEY, Denis J.; WILLIAMS, Thomas A. Estatstica aplicada
administrao e economia. So Paulo: Pioneira Thomson Learning, 2003.
BARBETTA, Pedro A.; REIS, Marcelo M.; BORNIA, Antonio C. Estatstica: para os cursos de
engenharia e informtica. So Paulo: Atlas, 2004.
BUSSAB, Wilton de O.; MORETTIN, Pedro A.. Estatstica bsica. So Paulo: Saraiva, 2003.
FARIAS, Alfredo Alves de; SOARES, Jos Francisco; CSAR, Cibele Comini. Introduo
estatstica. Rio de Janeiro,: LTC, 2003.
FARBER, Larson. Estatstica aplicada. So Paulo: Pearson Prentice Hall, 2004.
IEZZI, Gelson; DOLCE, Osvaldo; DEGENSZAJN David; PRIGO, Roberto. Matemtica: volume nico. So Paulo: Atual, 2007.
MORETTIN, Luiz G. Estatstica Bsica Volume I Probabilidade. 7.ed. So Paulo: Makron
Books, 1999.
TOMAZ, Priscilla S.S. Anais do IX Seminrio Nacional de Histria da Matemtica. Disponvel
em: <http://www.each.usp.br/ixsnhm/Anaisixsnhm/Comunicacoes/1_Tomaz_P_S_S_Gerolamo_Cardano.pdf>. Acesso em: 30 set. 2014..

NO PRXIMO CAPTULO
No prximo captulo apresentaremos as variveis aleatrias, que so uma forma de associar
valores aos resultados do experimento aleatrio. Isso ir nos permitir ampliar a capacidade de
aplicao da teoria de probabilidades.

captulo 4

115

5
Variveis aleatrias

5 Variveis aleatrias
O espao amostral, em muitos experimentos, no consiste s em nmeros
como, por exemplo, o espao amostral referente ao lanamento de uma moeda,
que tem como pontos amostrais cara ou coroa. Em Estatstica, muitas vezes, estamos interessados em resultados numricos. Para transformar os resultados
do espao amostral em nmeros utilizamos o conceito de varivel aleatria.

OBJETIVOS
Que voc seja capaz calcular o valor esperado e o desvio padro de uma varivel aleatria
discreta e que consiga identificar as situaes nas quais podemos aplicar o modelo de probabilidade binomial, bem como calcular as probabilidades associadas a tal modelo.

REFLEXO
Voc se lembra dos conceitos de mdia e desvio-padro apresentados nos captulos 2 e 3?
E dos conceitos de probabilidade abordados no captulo 4? Neste captulo, combinaremos
aqueles conceitos ao desenvolvermos as distribuies de probabilidade, que descrevem o
que provavelmente acontecer, ao invs do que realmente aconteceu.

5.1 Varivel Aleatria


Uma varivel aleatria (v.a.) uma varivel que associa um valor numrico a
cada ponto do espao amostral. Ela denominada discreta quando pode assumir apenas um nmero finito ou infinito enumervel de valores e dita contnua quando assume valores num intervalo da reta real.
comum utilizarmos letras latinas para representarmos variveis aleatrias.

5.2 Funo discreta de probabilidade


Funo Discreta de Probabilidade a funo que atribui a cada valor da v.a. sua
probabilidade, ou seja,
P(X = xi) = p(xi), i = 1, 2, ...., n
(5.1)

118

captulo 5

Vamos considerar aqui que a v.a. discreta tem um nmero finito de valores
possveis.
A distribuio de probabilidade de uma v.a. discreta X uma tabela que associa a cada valor de X sua probabilidade.

p(x)

x1

p(x1)

x2

p(x2)

x3

p(x3)

xn

p(xn)

Tabela 5.1 Distribuio de probabilidade da v.a. X

Na tabela 5.1, os valores x1, x2, x3,..., xn so aqueles que a v.a. pode assumir e
p(x1) , p(x2), p(x3),..., p(xn) suas respectivas probabilidades.
Uma distribuio de probabilidade deve satisfazer as seguintes condies:
0 p(xi) 1,

i = 1,2,...,n

Exemplo 5.1: Vamos considerar o experimento aleatrio que consiste no


lanamento de trs moedas. O espao amostral deste experimento :
W = {(c, c, c), (c, c, r), (c, r, c), (c, r, r), (r, c, c), (r, c, r), (r, r, c), (r, r,r)}
onde c = cara e r = coroa.
Podemos definir a varivel aleatria de interesse como sendo o nmero de
coroas obtidas no lanamento das trs moedas, ou seja, X: nmero de coroas.

captulo 5

119

De acordo com a definio da varivel aleatria podemos associar a cada ponto


amostral um nmero, como mostra o quadro seguinte:

RESULTADOS

c,c,c

c,c,r

c,r,c

c,r,r

r,c,c

r,c,r

r,r,c

r,r,r

Vemos que a cada resultado do experimento est associado um valor da v.a.


X, a saber, 0, 1, 2 e 3. Temos que:
X = 0, com probabilidade 1/8 se, e somente se, ocorre o resultado
c,c,c;
X = 1, com probabilidade 1/8 + 1/8 +1/8 = 3/8 se, e somente se, ocorrem
os resultados c,c,r ou c,r,c ou r,c,c, que so mutuamente exclusivos;
X = 2 com probabilidade 1/8 + 1/8 + 1/8 = 3/8 se, e somente se, ocorrem
os resultados c,r,r ou r,c,r ou r,r,c, que so mutuamente exclusivos;
X = 3 com probabilidade 1/8 se, e somente se, ocorre o resultado
r,r,r.

120

captulo 5

Na tabela 5.2 apresentamos a distribuio de probabilidade da v.a. X.

p(x)

1/8

3/8

3/8

1/8

Tabela 5.2 Distribuio de probabilidade da v. a. X = nmero de coroas

A distribuio de probabilidade satisfaz as condies 0 p(xi) 1 e


, para i = 1, 2, 3, 4.

Exemplo 5.2: Uma companhia analisa diariamente o nmero de vendas de


seus novos funcionrios durante um perodo de experincia de 90 dias. Os resultados para um novo funcionrio so apresentados a seguir.

VENDAS POR DIA

NMERO DE DIAS

15

17

12

18

captulo 5

121

VENDAS POR DIA

NMERO DE DIAS

10

Tabela 5.3: Distribuio do nmero de vendas do novo funcionrio

c) Obtenha a probabilidade de cada resultado


d) Organize os dados em uma distribuio de probabilidade.
Resoluo
a) Para encontrarmos a probabilidade de cada resultado, vamos usar a definio frequencial de probabilidade, ou seja, as probabilidades nada
mais so que as frequncias relativas de cada resultado:

VENDAS POR DIA

NMERO DE DIAS

PROBABILIDADE

15

0,1667

17

0,1889

12

0,1333

18

0,2000

0,0889

10

0,1111

0,1000

0,0111

122

captulo 5

A primeira probabilidade foi encontrada fazendo


dade
e assim por diante.

, a segunda probabili-

b) Uma distribuio de frequncia uma tabela que contm os resultados


da varivel aleatria com suas respectivas probabilidades, ou seja:

VENDAS POR DIA

PROBABILIDADE

0,1667

0,1889

0,1333

0,2000

0,0889

0,1111

0,1000

0,0111

Total

Tabela 5.4: Distribuio de probabilidade do nmero de vendas por dia.

captulo 5

123

5.3 Valor esperado e varincia de uma varivel aleatria discreta


Para as distribuies de probabilidade podemos definir as mesmas medidas de
tendncia central e de disperso estudadas nas distribuies de frequncias.
A mdia de uma v.a. X tambm chamada de valor esperado ou esperana
matemtica representada por E(X) e definida como:

(5.2)

Observamos, pela definio de E(X), que para se calcular a mdia de uma


v.a. precisamos multiplicar cada valor da v.a. por sua correspondente probabilidade e somar os produtos resultantes.
Podemos interpretar o valor esperado de uma v.a. como uma mdia ponderada dos xi, onde os pesos so as probabilidades associadas.
Propriedades da mdia
Sejam a e b constantes e X uma varivel aleatria. Ento:
i) E(a) = a
ii) E(bX) = bE(X)
iii) E(X + a) = E(X) + a
iv) E(a + bX) = a + bE(X)
A varincia de uma v.a. X definida como:

(5.3)

J vimos anteriormente que o desvio-padro (s) a raiz quadrada da varincia, portanto:


(5.4)

124

captulo 5

Propriedades da varincia
Sejam a e b constantes e X uma varivel aleatria. Ento:
i) Var(a) = 0
ii) Var(bX) = b2Var(X)
iii) Var(X + a) = Var(X)
iv) Var(a + bX) = b2Var(X)
Observao: Indicaremos a mdia e a varincia de uma v.a. X por:
E(X) = m
Var(X) = s2
Exemplo 5.3: Utilizando os dados do exemplo 5.1, vamos calcular a mdia e
a varincia da v.a. X: nmero de coroas.

p(x)

x p(x)

x2 p(x)

1/8

3/8

3/8

3/8

3/8

6/8

12/8

1/8

3/8

9/8

Total

12/8

24/8

Resoluo
Substituindo os valores do quadro apresentado nas respectivas frmulas
temos:

captulo 5

125

Portanto, temos que o valor esperado do nmero de coroas, obtido no lanamento de 3 moedas, 1,5 e o desvio-padro 0,866

Exemplo 5.4
Num teste de digitao, o tempo em minutos (T) que os candidatos levam
para digitar um texto modelado, de forma aproximada, pela seguinte funo
de probabilidade:

126

captulo 5

P(T)

0,1

0,1

0,2

0,2

0,2

0,1

0,1

O candidato recebe 4 pontos se faz em 9 minutos, 5 se faz em 8 minutos e


assim por diante. Determine a mdia e a varincia do nmero de pontos obtidos no teste.
Resoluo
Como o exerccio est pedindo a mdia e a varincia do nmero de pontos
obtidos, precisamos definir uma nova varivel aleatria:
P: nmero de pontos obtidos no teste
O nmero de pontos obtidos depende do tempo que o candidato leva para digitar o texto. De acordo com o texto, se o candidato digitar o texto em 3 minutos, ele
recebe 10 pontos. E, a probabilidade dele receber 10 pontos a mesma probabilidade dele digitar em 3 minutos, ou seja, 0,1. Portanto:

P(T)

10

0,1

0,1

0,2

0,2

0,2

0,1

0,1

captulo 5

127

Definida a funo distribuio de probabilidade da varivel P, encontramos


a mdia e a varincia acrescentando duas colunas no quadro acima:

P(P)

PP(P)

P2 P(P)

10

0,1

10

0,1

0,9

8,1

0,2

1,6

12,8

0,2

1,4

9,8

0,2

1,2

7,2

0,1

0,5

2,5

0,1

0,4

1,6

Total

52

Agora, basta substituirmos os valores encontrados nas respectivas frmulas:

Ento, o nmero mdio de pontos obtidos no teste 7 e a varincia 3 pontos2.


Para encontrarmos o desvio padro, basta extrairmos a raiz quadrada da varincia.

128

captulo 5

Exemplo 5.5
Na produo de uma pea so empregadas duas mquinas. A primeira utilizada para efetivamente produzir as peas, e o custo de produo de R$ 50,00 por
unidade. Das peas produzidas nessa mquina, 90% so perfeitas. As peas defeituosas (produzidas na primeira mquina) so colocadas na segunda mquina
para a tentativa de recuperao (torn-las perfeitas). Nessa segunda mquina o
custo por pea de R$ 25,00, mas apenas 60% das peas so de fato recuperadas.
Sabendo que cada pea perfeita vendida por R$ 90,00, e que cada pea defeituosa vendida por R$ 20,00, calcule o lucro por pea esperado pelo fabricante.
Resoluo
Neste exemplo, a varivel aleatria de interesse :
X: lucro
Para entendermos melhor as informaes contidas no enunciado, vamos
montar um quadro:

CUSTO

VENDA

X
(LUCRO)

P(X)

50

90

40

0,9

50+25

90

15

0,06

50+25

20

-55

0,04

peas perfeitas na 1
mquina
peas perfeitas na 2
mquina
peas defeituosas

As informaes contidas na primeira linha nos indicam que o lucro ser de


R$ 40,00, pois Lucro = Venda Custo. Noventa por cento das peas produzidas
na primeira mquina so perfeitas. Ento, a probabilidade do lucro assumir o
valor R$ 40,00 de 0,9.

captulo 5

129

Na segunda linha esto as informaes das peas que precisaram ir para a segunda mquina e que tornaram-se perfeitas. O custo, nesta situao, ser de R$
75,00, pois o custo por pea na segunda mquina de R$ 25,00, adicionados aos
R$ 50,00 de custo da primeira mquina. Agora, vamos entender o porqu do valor
da probabilidade ser 0,06. Se 90% das peas produzidas pela primeira mquina so
perfeitas, 10% so defeituosas.
Destas 10% de peas defeituosas, apenas 60% so recuperadas pela segunda
mquina. Portanto, 0,10*0,6 = 0,06. Ento, a probabilidade do lucro assumir o
valor R$ 15,00 de 0,06.
E, na terceira linha, temos a informao das peas defeituosas. Neste caso,
a empresa ter prejuzo, pois o custo continuar sendo de R$ 75,00, e a pea
ser vendida por R$ 20,00. A probabilidade do lucro (que ser um prejuzo) assumir o valor de R$ 55,00 0,04, pois das peas defeituosas, 40% no so recuperadas pela segunda mquina. Portanto, 0,10*0,4 = 0,04.
Agora, com os valores obtidos no quadro, conseguimos encontrar o lucro
por pea esperado pelo fabricante.

CUSTO

VENDA

X P(x)

40

0,9

40 0,9 = 36,00

15

0,06

15 0,06 = 0,90

-55

0,04

55 0,04= 2,20

Total

34,70

O lucro esperado, por pea, R$ 34,70.

5.4 Modelos probabilsticos para variveis aleatrias Discretas


Algumas variveis aleatrias aparecem com frequncia em muitas situaes prticas do nosso dia a dia. Um estudo detalhado dessas variveis muito importante para a construo de modelos probabilsticos com o objetivo de estimar seus
parmetros e calcular probabilidades. Uma das distribuies discretas de probabilidade mais importante a distribuio binomial que ser descrita a seguir.

130

captulo 5

5.4.1 Distribuio Binomial


Uma v.a. tem distribuio binomial se o experimento aleatrio consiste em:
n tentativas sob condies idnticas;
cada tentativa independente de todas as outras;
h somente dois resultados possveis em cada tentativa designados por
sucesso(S) e fracasso(F);
a probabilidade de sucesso a mesma em cada tentativa.
Na distribuio binomial a v.a. X corresponde ao nmero de sucessos em n
tentativas do experimento aleatrio.
A funo de probabilidade definida como:

(5.5)

onde:
n o nmero de tentativas do experimento aleatrio;
p = P(S) a probabilidade de sucesso em uma nica tentativa;
q = P(F) a probabilidade de fracasso em uma nica tentativa;
p + q = 1.

denominado nmero binomial e dado pela frmula


Os termos n! e k! so denominados n fatorial e k fatorial e so dados pela multiplicao de todos os valores inteiros positivos entre entre 1 e n e entre 1 e k. Por exemplo,
5! = 5 4 3 2 1 = 120.

Quando a v.a. X tiver distribuio binomial, com parmetros n e p, indicaremos por X ~ b(n,p).

captulo 5

131

O valor esperado e a varincia de uma v.a. binomial, com parmetros n e p


so, respectivamente, dados por:

(5.6)

Exemplo 5.6: Uma pesquisa mostrou que 60% das famlias residentes na
grande So Paulo tm pelo menos dois carros. Determine a probabilidade de
que dentre 15 famlias selecionadas aleatoriamente nesta regio:
a) exatamente 5 tenham pelo menos dois carros;
b) de 8 a 10 tenham pelo menos dois carros.
Neste exemplo vamos definir a v.a. como tendo distribuio binomial, pois:
o experimento est sendo realizado 15 vezes, ou seja, 15 famlias foram
selecionadas para o estudo;
h somente dois resultados possveis: sucesso, se a famlia tem pelo menos dois carros e fracasso, se a famlia no tem pelo menos dois carros;
as respostas so independentes umas das outras, ou seja, uma famlia
ter pelo menos dois carros no afeta a probabilidade das outras famlias
terem ou no pelo menos dois carros.
O primeiro passo para iniciar a resoluo de problemas deste tipo definir
a v.a.. Neste caso, como estamos interessados no nmero de famlias com pelo
menos dois carros, a v.a. definida como:
X: nmero de famlias com pelo menos dois carros.
A v.a. X pode assumir os valores 0,1,2,...,15, pois, das 15 famlias selecionadas, pode acontecer de nenhuma ter pelo menos dois carros, 1 pode ter pelo
menos dois carros, 2 podem ter pelo menos dois carros , assim por diante, at
as 15 famlias com pelo menos dois carros.

132

captulo 5

a) Este item pede a probabilidade de que exatamente 5 tenham pelo


menos dois carros, ou seja,

e o nmero de tentativas n = 15 famlias selecionadas. com P(sucesso) =


0,60, pois o enunciado nos informa que 60% das famlias tm pelo menos dois
carros, P(fracasso) = 0,40
Fazendo os clculos chegamos que

b) A probabilidade pedida neste item pode ser escrita como:

Observao: Estes clculos so facilmente efetuados com o auxlio de uma


calculadora cientfica.
Exemplo 5.7
Se 7% das peas produzidas por uma mquina so defeituosas, qual a probabilidade de que em dez peas escolhidas aleatoriamente:
a) no haja peas defeituosas;
b) pelo menos 3 peas sejam defeituosas;
c) exatamente 5 peas sejam defeituosas;
d) entre 2 e 4 peas sejam defeituosas.

captulo 5

133

Resoluo
Temos aqui um experimento binomial com:
X: nmero de peas defeituosas
X = 0,1,2,3,...,10.
n = 10 peas
P(Sucesso) = p = 0,07
P(Fracasso) = q = 0,93
Note que a probabilidade de sucesso que a pea seja defeituosa, pois a varivel aleatria est definida como o nmero de peas defeituosas.
a)

b) )
Neste caso podemos simplificar os clculos utilizando o complementar do
evento, isto ,

c)

d)

134

captulo 5

CONEXO
O clculo de probabilidades para variveis aleatrias cuja distribuio binomial tambm
pode ser feita no Excel. Para compreender a funo que deve ser utilizada, leia Utilizando
o Microsoft Excel para Obter Probabilidades Binomiais, que se encontra no livro Estatstica:
Teoria e Aplicaes Usando Microsoft Excel em Portugus, pp. 196.

ATIVIDADE
1. Uma urna contm 3 bolas brancas e 7 bolas verdes. Trs bolas so retiradas com reposio. Seja X: nmero de bolas verdes. Calcule E(X) e Var(X).
2. Uma companhia area tem as probabilidades

0,05

0,20

0,35

0,15

0,10

0,15

de receber 0, 1, 2, 3, 4 ou 5 reclamaes sobre desvio de bagagem por dia. Quantas


reclamaes a companhia espera (valor esperado ou mdia) receber por dia?
3. Um comerciante tem a oportunidade de adquirir um embarque de seda pura por R$
30.000,00. A probabilidade de ele vender essa seda por R$ 26.000,00 de 0,40 e a
probabilidade de ele vend-la por R$ 35.000,00 de 0,60. Qual o lucro bruto esperado do comerciante?

4. O tempo T, em minutos, necessrio para um operrio processar certa pea uma v.a.
com a seguinte distribuio de probabilidade:

p(T)

0,1

0,1

0,3

0,2

0,2

0,1

captulo 5

135

Fonte: Bussab e Morettin, pag. 140.

a) Calcule o tempo mdio de processamento.


Para cada pea processada, o operrio ganha um fixo de R$ 2,00, mas, se ele processa a pea em menos de seis minutos, ganha R$ 0,50 em cada minuto poupado.
Por exemplo, se ele processa a pea em quatro minutos, recebe a quantia adicional
de R$ 1,00.
b) Encontre a distribuio, a mdia e a varincia da v.a. G: quantia em R$ ganha por
pea.
5. Um curso de treinamento aumenta a produtividade dos funcionrios da rea de atendimento ao consumidor em 80% dos casos. Se quinze funcionrios participam desse
curso, qual a probabilidade de:
a) exatamente quatro funcionrios aumentarem a produtividade;
b) de 5 a 7 funcionrios aumentarem a produtividade;
c) pelo menos dois funcionrios no aumentarem a produtividade.
6. Um lote com mquinas digital recebida por uma empresa. 30 aparelhos so inspecionados. O lote rejeitado se pelo menos 3 mquinas apresentarem defeito. Sabendo-se que
1% das mquinas defeituosa, calcule a probabilidade da empresa rejeitar todo o lote.
7. Um vendedor de seguros vende aplices a 5 homens, todos da mesma idade e de boa
sade. De acordo com as tabelas atuariais, a probabilidade de um homem, dessa idade
particular, estar vivo daqui a 30 anos de 2/3. Determinar a probabilidade de estarem
ainda vivos daqui a 30 anos:
a) todos os 5 homens;
b) pelo menos 3;
c) apenas 2;
d) pelo menos 1 homem.
8. A probabilidade de um estudante, que ingressa em uma universidade, graduar-se, de 0,4.
Determinar a probabilidade de, entre 5 estudantes:
a) nenhum graduar-se;
b) um graduar-se;
c) pelo menos um graduar-se.

136

captulo 5

9. Um aluno marca ao acaso as respostas em um teste mltipla escolha com 10 questes e


cinco alternativas por questo. Qual a probabilidade dele acertar exatamente 4 questes?
10. Uma pesquisa concluiu que 30% das mulheres brasileiras consideram a leitura sua atividade favorita de lazer. Voc seleciona ao acaso seis mulheres e pergunta a elas se a
leitura sua atividade favorita de lazer. Obtenha a probabilidade de que:
a) exatamente duas delas respondam sim.
b) menos do que duas respondam sim.

REFLEXO
Neste captulo vimos que a varivel aleatria fornece uma descrio numrica de um experimento aleatrio. Com os resultados que uma varivel aleatria pode assumir juntamente com
suas respectivas probabilidade obtemos a distribuio de probabilidade e podemos calcular o
valor esperado (mdia) e o desvio padro para a varivel aleatria. Podemos interpretar o valor
esperado como uma mdia ponderada dos valores que a varivel aleatria pode assumir. Os
pesos so as probabilidades. Estudamos, tambm, uma distribuio discreta de probabilidade
que tem muitas aplicaes: distribuio binomial. Desde que o experimento em estudo satisfaa os requisitos necessrios para que a varivel aleatria tenha distribuio binomial, encontramos facilmente, com o auxlio de uma calculadora cientfica, as probabilidades de interesse.

LEITURA
Sugerimos que voc assista ao vdeo Revendo a Moratria, da srie: Matemtica na Escola.
Ele apresenta uma aplicao do conceito de valor esperado. O endereo para acesso http://
m3.ime.unicamp.br/recursos/1170. Vale a pena conferir!

REFERNCIAS BIBLIOGRFICAS
ANDERSON, David R.; SWEENEY, Denis J.; WILLIAMS, Thomas A. Estatstica aplicada
administrao e economia. So Paulo: Pioneira Thomson Learning, 2003.

captulo 5

137

BUSSAB, Wilton de O.; MORETTIN, Pedro A.. Estatstica bsica. So Paulo: Saraiva, 2003.
FARIAS, Alfredo Alves de; SOARES, Jos Francisco; CSAR, Cibele Comini. Introduo
estatstica. Rio de Janeiro,: LTC, 2003.
FARBER, Larson. Estatstica aplicada. So Paulo: Pearson Prentice Hall, 2004.
LEVINE, David M.; BERENSON, Mark L.; STEPHAN, David. Estatstica: Teoria e Aplicaes
Usando Microsoft Excel em Portugus. Rio de Janeiro: LTC, 2000.
MAGALHES, Marcos Nascimento; LIMA, Antnio Carlos Pedroso de. Noes de probabilidade e estatstica. So Paulo: Editora da Universidade de So Paulo, 2004.
SPIEGEL Murray R. Estatstica. 3.ed. So Paulo: Makron Books, 1993.

EXERCCIO RESOLVIDO
Captulo 1
1.
a) qualitativa nominal
b) quantitativa discreta
c) quantitativa contnua
d) quantitativa discreta
e) quantitativa contnua
f) quantitativa contnua
g) quantitativa discreta
h) qualitativa nominal
i) quantitativa contnua
j) quantitativa contnua
k) qualitativa ordinal
l) qualitativa ordinal
m) qualitativa nominal
n) qualitativa nominal

138

captulo 5

2.
K 6 classes e amplitude da classe h 7
Tabela 1 Distribuio de frequncias das idades dos funcionrios.

IDADES

fr

fa

19| 26

0,1667

26| 33

13

0,4333

18

33| 40

0,1333

22

40| 47

0,1333

26

47| 54

0,1000

29

54| 61

0,0333

30

Total

30

a) 18
b) 13,33%
c) 17
d) 73,33%
e) 26,67%

captulo 5

139

3.

Outros
16,82%
Solteiro
42,87%
Separado
19,79%

Vivo
5,69

Casado
14,84%

Atravs do grfico, podemos dizer que aproximadamente 43% dos clientes desta agncia de turismo so solteiros, 20% so separados, 17% tm outro tipo de estado civil,
15% so casados e apenas 5% so vivos. Esta informao importante na hora de
lanar pacotes de viagens. A agncia deve se lembrar que grande parte de seus clientes
so solteiros. Tambm pode criar estratgias para trazer mais clientes casados ou vivos,
que provavelmente devem ter outro tipo de perfil.

4.
a) Valores gastos com supermercado. Varivel quantitativa contnua.
b) Tabela 1: Distribuio de frequncias para a varivel Valores gastos com supermercado.

CLASSES (GASTOS EM R$)

fr

fa

4,89| 61,89

17

0,34

17

61,89| 118,89

13

0,26

30

118,89| 175,89

0,10

35

140

captulo 5

CLASSES (GASTOS EM R$)

fr

fa

175,89| 232,69

0,10

40

232,89| 289,89

0,06

43

289,89| 346,89

0,06

46

346,89| 403,89

0,04

48

403,89| 460,89

0,04

50

Total

50

c)

403,89 | 460,89

346,89 | 403,89

289,89 | 346,89

232,89 | 289,89

118,89 | 175,89

61,89 | 118,89

4,98 | 61,89

175,89 | 232,89

Histograma

18
16
14
12
10
8
6
4
2
0

Gastos (R$)

captulo 5

141

18

17

16

Frequncia

14

Polgono de Frequncias

13

12
10
8
6

2
2

5
2

0
0

33,39 90,38 147,39 204,39 261,39 318,39 375,39 432,39 489,39


Ponto mdio das classes Gastos (R$)

5.
a) Salrio de funcionrios de uma empresa. Esta varivel classificada como quantitativa
contnua.
b) 45 funcionrios
c) 86 funcionrios
d) 9,30%
e) 72,09%
f)

SALRIO (R$)

fr

fa

500,00| 800,00

17

19,77

17

800,00| 1.100,00

45

52,33

62

1.100,00| 1.400,00

12

13,95

74

1.400,00| 1.700,00

4,65

78

142

captulo 5

1.700,00| 2.100,00

3,49

81

2.100,00| 2.400,00

3,49

84

2.400,00| 2.700,00

2,33

86

Total

86

100,00

Tabela 1 Distribuio de frequncias dos salrios dos funcionrios de uma empresa.

Captulo 2
Antes das respostas, gostaramos de deixar claro que as interpretaes das questes ficam
a cargo do estudante. Se ocorrerem dvidas, entrar em contato com o tutor.

1.
a)

x 23,1, Md = 22,5 e Mo = 22

b)

CLASSES

fr

fa

Pm

10 14

0,0469

12

14 18

0,0781

16

18 22

12

0,1875

20

20

captulo 5

143

25

0,3906

45

24

26 30

12

0,1875

57

28

30 34

0,0469

60

32

34 38

0,0313

62

36

38 42

0,0313

64

40

Total

64

1,0000

x 24,6

Md 23,9 Md = 24 Q1 = 20,7 D1 26 P99 = 40,7

d)

N de horas

2.
a) Vendas mensais. Varivel quantitativa contnua.
b)

x 3,2

Md = 3,4 Mo = 3,5

c) Q3 20,7 D1 1,4 P80 = 4,1


d) 16,36%
e) 21,82%
f) 56,36%
g) 65,45%

144

captulo 5

42
|
38

34

38

34

30
30

22
22

18
18

14

|
10

26

24
22
20
18
16
14
12
10
8
6
4
2
0

14

Frequncia

Histograma

26

c)

22 26

3.
a)

x 17,1

b) Md = 2
c) Mo = 2

4.
a) Idade dos funcionrios
b) 48
c)

x 30,9

Md 29,7 Mo 27,8

d) Q1 25,7
e) 25
f) 4,17%
g) 47,9%

5. 4,3

Captulo 3

As interpretaes das questes ficam a cargo do estudante. Se ocorrerem dvidas,


entrar em contato com o tutor.
1.
a) R =

31s 6,1 s2 37,2

b) R =

32

cv 0,2633

s 5,8 s2 33,6

ou

26,33%

cv 0,2358

2. R = 6

s 1,24 s2 1,54

cv 0,3875

ou

3. R = 7

s 2,88 s2 8,29

cv0,45 ou

45%

4. R = 5

s 1,29 cv 0,7588

ou

ou 23,58%

38,75%

75,88%

captulo 5

145

5. R = 30

s 6,9 s2 47,6

6.
a) Caixa A (menor variao absoluta (s))
b) Caixa A (maior variao relativa (cv))

Captulo 4

1.
a) 0,2328
b) 0,0461
c) 0,7672

2.
a) 0,7
b) 0,725
c) 0,6897
d) 0,7143
e) 0,2727
f) 0,75

3.
a) 0,6667
b) 0,4
c) 0,3
d) 0,2222

4.
a) 0,75

146

captulo 5

b) 0,25

cv 0,2233

ou

22,33%

5. 5. 0,9703

6.
a) 0,02875

b) 0,5565

Captulo 5

1. E(X) = 2,1

Var(X) = 0,63

2. 2,5

3. R$ 1.400,00

4.
a) 4,6

b) E(G) = 2,75

Var(G) = 0,4125

5.
a) 0,000011

b) 0,0042

c) 0,8329

6. 0,0033

7.
a) 0,1317

c) 0,1646

b) 0,7901

d) 0,9959

captulo 5

147

8.
a) 0,0778

b) 0,2592

9.
a) 0,0881

10.
a) 0,324135

148

captulo 5

b) 0,420175

c) 0,9222

You might also like