You are on page 1of 37

1 INTRODUO

1.1 - O que Estatstica?


A Estatstica um ramo cientfico relacionado obteno de informaes a partir
de dados numricos e ao emprego dessas informaes para efetuar inferncias a
respeito de uma populao, a partir da qual os dados so coletados. O estatstico
estuda procedimentos inferenciais, sempre visando obter o melhor processo de
realizar previses ou tomar decises a respeito de uma dada situao e, mais
importante que isso, o estatstico obtm informaes a respeito da boa qualidade
de um procedimento inferencial.
Ou resumindo: a Estatstica uma metodologia de coleta, sistematizao,
descrio, anlise, apresentao e interpretao de dados, para a tomada de
decises. Basicamente, temos dois ramos de Estatstica:
Estatstica Descritiva ou Dedutiva: conjunto de tcnicas destinadas sntese
dos dados.
Estatstica Inerencia! ou Indutiva: tcnicas segundo as quais so tomadas
decises sobre uma populao com base na observao de uma amostra.
1." - # Estatstica nas E$%resas e nas &i'ncias Econ($icas
A empresa uma das vigas-mestra da Economia globalizada. A direo de uma
empresa, de qualquer tipo, incluindo as estatais e governamentais, exige de seu
administrador a importante tarefa de tomar decises. O conhecimento e o uso da
Estatstica facilitaro seu trplice trabalho de organizar, dirigir e controlar a
empresa.
Por meio de sondagem, de coleta de dados e de recenseamento de opinies,
podemos conhecer a realidade geogrfica e social, os recursos naturais, humanos e
financeiros disponveis, alm das expectativas da comunidade. Esse conhecimento
fundamental para uma anlise de conjuntura estruturada e fundamentada.
As Cincias Econmicas tem fundamentos quantitativos e a Estatstica contribui
para a formulao matemtica das teorias econmicas.
1.) - &onceitos *+sicos
,o%u!a-.o: conjunto de elementos portadores de, pelo menos, uma
caracterstica comum. Exemplos: os estudantes da universidade X, os
candidatos ao concurso Y, as crianas de at 5 anos de idade de So Paulo
etc..Quanto ao nmero de elementos, a populao pode ser finita ou infinita. A
primeira aquela que apresenta um nmero limitado de indivduos. Muitas
vezes, no entanto, o nmero de ob servaes infinito. A populao ser,
ento, infinita. Esta ltima normalmente est associada a processos. Ex: se um
tcnico de laboratrio quisesse pesar um certo material, por maior que fosse o
cuidado na experimentao ele poderia, em cada pesagem, obter uma leitura de
certo modo diferente. Qualquer nmero de observaes que ele realizasse no
constituiria uma populao completa, pois os resultados poderiam no ser
uniformes. O nmero de tais medies (observaes) tenderia a ser infinito,
dando origem a uma populao infinita. Uma populao infinita dever, ento,
ser concebida apenas como um esquema conceitual e terico. Geralmente, por
problemas financeiros ou temporais, limitamos as observaes referentes a uma
determinada pesquisa a apenas uma parte da populao.
1
1
/ari+ve!: uma propriedade de um elemento que est sendo medido,
assumindo diferentes valores ou atributos.
/ari+ve! 0ua!itativa: seus valores se expressam atravs de atributos ou
nomes. uma forma mais rudimentar de varivel, ou de nvel mais baixo. Pode
ser de dois tipos: nominal ou ordinal.
a) Nominal: no apresenta uma ordenao. Exemplos: religio, cor dos
cabelos.
b) Ordinal: tem uma ordenao explcita. Exemplos: conceitos de alunos em
escolas pblicas, nvel de renda, nvel de instruo.
/ari+ve! 0uantitativa: seus valores se expressam atravs de nmeros. Pode
ser de dois tipos:
a) Discreta: resulta da contagem, por isso seus valores geralmente so expressos
atravs de nmeros inteiros no negativos. Ex: n
o
de livros de uma biblioteca, n
o
de
filhos, etc.
b) Contnua: diz-se que uma varivel contnua se, ao passar de um valor real a
para um valor real b qualquer, ela assume todos os valores intermedirios entre a e
b. Exemplos: temperatura, peso, altura, etc.
#$ostra: um subconjunto finito de uma populao. Quando as observaes
so feitas sobre a totalidade da populao, temos um censo. Para que as
inferncias sejam corretas, necessrio garantir que a amostra seja
representativa da populao, isto , a amostra deve possuir as mesmas
caractersticas bsicas da populao no que diz respeito aos fenmenos que
desejamos pesquisar.
#$ostra1e$: conjunto de tcnicas para a escolha das amostras, que
procuram garantir o tanto quanto possvel a sua representatividade, bem como
o acaso na escolha dos seus elementos.
1.2 #rredonda$ento de dados
O correto arredondamento fundamental para que possamos fazer um estudo
preciso da varivel. O resultado do arredondamento de um nmero como 72,8 para
o inteiro mais prximo 73, posto que 72,8 est mais prximo de 73 do que de 72.
Assim, 72,8146 arredondado para o centsimo mais prximo 72,81, pois est
mais prximo de 72,81 do que de 72,82. Para o caso em que a primeira casa
decimal a ser desprezada apresenta o nmero 5, temos os seguintes casos:
a) ao 5 sucede-se algum nmero diferente de zero: o arredondamento feito para
cima. Ex: arredondando para o dcimo: 43,256 43,3 ; 17,8501 17,9
b) o 5 a ltima casa decimal, ou a ele s se sucedem zeros: neste caso temos
duas hipteses:
b1) o ltimo algarismo a permanecer par: desprezamos o 5 e fica o ltimo
algarismo par: Ex: arredondando para o dcimo: 13,25 13,2 ; 7,6500 7,6
b2) o ltimo algarismo a permanecer mpar: neste caso aumentamos uma
unidade a este algarismo, transformando-o em um nmero par. Ex: arredondando
para o dcimo: 61,35 61,4 ; 92,5500 92,6
2
2
Ao arredondar os nmeros em uma sequncia de soma, comum o resultado da
soma arredondada ser diferente do resultado da soma se fizssemos o
arredondamento somente no final. Quando isso ocorrer, deve-se descarregar a
diferena no maior nmero somado, indicando posteriormente que este nmero foi
arredondado por compensao. Ex:
25,32 + 17,85 + 10,44 + 31,17 = 84,78 arredondando para o dcimo, temos:
25,3 + 17,8 + 10,4 + 31,2 = 84,7
Note que o segundo resultado (84,7) diferente do resultado que obtivemos
(84,78) arredondado para o dcimo, que 84,8. Sabemos ento que o resultado
mais prximo do real 84,8 e no 84,7. Essa diferena (0,1) deve ser acrescentada
ao maior nmero somado, para que o resultado correto seja obtido. Assim temos o
arredondamento final:
25,3 + 17,8 + 10,4 + 31,3* = 84,8
* arredondado por compensao
Obs: essas regras esto em conformidade com a resoluo 886/66 da Fundao
IBGE.
E3erccios
1) Populao :
a) conjunto de pessoas.
b) conjunto de indivduos apresentando uma caracterstica especial.
c) conjunto de todos os elementos apresentando uma caracterstica comum objeto
de estudo.
d) conjunto de todos os resultados possveis de um experimento aleatrio.
e) subconjunto finito do conjunto universo.
2) Classifique as variveis abaixo em Quantitativa Discreta (QD), Quantitativa
Contnua (QC) ou Qualitativa (QL):
a) ( ) salrio
b) ( ) temperatura
c) ( ) idade
d) ( ) hierarquia militar
e) ( ) peso
3) Assinale V ou F:
a) ( ) Estatstica Inferencial compreende um conjunto de tcnicas destinadas
sntese de dados numricos.
b) ( ) O processo utilizado para se medir as caractersticas de todos os membros
de uma dada populao recebe o nome de censo.
c) ( ) A Estatstica Descritiva compreende as tcnicas por meio das quais so
tomadas decises sobre uma populao com base na observao de uma amostra.
d) ( ) Uma populao s pode ser caracterizada se forem observados todos os
seus componentes.
4) Arredonde os dados abaixo para o dcimo:
234,7832 45,09 12,35 78,84
28,255 125,4500 48,85001 299,951
5) Efetue a soma, arredonde os dados para o centsimo e compense, se
necessrio.
0,060 + 0,119 + 0,223 + 0,313 + 0,164 + 0,091 + 0,030 =
3
3
" #,RE4ENT#O DO4 D#DO4
Por mais diversa que seja a finalidade que se tenha em vista, os dados devem ser
apresentados sob a forma adequada (tabelas ou grficos), tornando mais fcil o
exame daquilo que est sendo objeto de tratamento estatstico.
".1 - Ta5e!a:
um quadro que resume um conjunto de observaes. Uma tabela compe-se de:
Corpo: conjunto de linhas e colunas que contm informaes sobre a varivel
em estudo;
Cabealho: parte superior da tabela que especifica o contedo das colunas;
Coluna indicadora: parte da tabela que especifica o contedo das linhas;
Linhas: retas imaginrias que facilitam a leitura no sentido horizontal dos dados
que se inscrevem nos seus cruzamentos com as colunas;
Casa ou Clula: espao destinado a um s nmero;
Ttulo: conjunto de informaes, as mais completas possveis, respondendo s
perguntas: o qu?, quando?, onde?, localizado no topo da tabela;
Elementos Complementares: fonte, notas e chamadas, colocados no rodap.
Exemplo:
TTULO PRODUO DE CAF
CABEALHO BRASIL 1991 - 1995

COLUNA
COLUNA NUMRICA
INDICADORA
CORPO

LINHAS
CASA OU CLULA

RODAP FONTE: IBGE
De acordo com a Resoluo 886 da Fundao IBGE, nas casas ou
clulas devemos colocar:
um trao horizontal () quando o valor zero, no s quanto natureza das
coisas, como quanto ao resultado do inqurito;
4
ANOS PRODUO
(1.000 t)
1991 2.535
1992 2.666
1993 2.122
1994 3.75
1995 2.7
4
trs pontos (...) quando no temos os dados;
um ponto de interrogao (?) quando temos dvida quanto exatido de
determinado valor;
zero (0) quando o valor muito pequeno para ser expresso pela unidade
utilizada. Se os valores so expressos um numerais decimais, precisamos
acrescentar parte decimal um nmero correspondente de zeros (0,0; 0,00;
0,000; ...).
Observaes:
a tabela no dever ser fechada lateralmente;
a linha dos totais deve ser inserida no corpo da tabela.
4ries Estatsticas6 denominamos srie estatstica toda tabela que apresenta a
distribuio de um conjunto de dados estatsticos em funo da poca, do local ou
da espcie.
a) Srie histrica, cronolgica ou temporal: a varivel discriminada em intervalos
de tempo:
PREO DO ACM NO VAREJO
SO PAULO 199!-99
ANOS PREO MDIO (US")
1994 2!24
1995 2!73
1996 2!12
1997 1!"9
199" 2!4
1999 2!62
#$%&': APA
b) Srie geogrfica, espacial, territorial ou de localizao: a varivel discriminada
segundo regies.
DURAO MDIA DOS
ESTUDOS SUPERIORES - 199#
PA$SES N%MERO DE ANOS
I&()*+ 7!5
A)',+%-+ 7!
#.+%/+ 7!
H$)+%0+ 5!9
I%1)+&'..+ ,'%$2 0' 4
#$%&': R'3*2&+ Veja
c) Srie especfica ou categrica: discrimina a varivel segundo especificaes ou
categorias.
REBAN&OS BRASILEIROS - 199#
ESPCIES
'UANTIDADE
(1.000 ()*+,)-)
B$3*%$2 154.441
B45+)*%$2 1.423
5
5
E64*%$2 549
A2*%*%$2 47
M4+.'2 2"
S47%$2 34.532
O3*%$2 19.955
C+8.*%$2 12.159
C$')-$2 6
#$%&': IBGE
d) Sries conjugadas - Tabelas de dupla entrada: a conjugao de duas sries
em uma nica tabela. Numa tabela desse tipo, ficam criadas duas ordens de
classificao: uma horizontal (linha) e uma vertical (coluna).
TERMINAIS TELEF.NICOS EM SERVIO
1991 - 199/
RE0I1ES 1991 1992 199/
N$.&' 342.93" 375.65" 43.494
N$.0'2&' 1.2"7."13 1.379.11 1.4"6.649
S40'2&' 6.234.51 6.729.467 7.231.634
S4) 1.497.315 1.6".9"9 1.746.232
C'%&.$9O'2&' 713.357 77".925 ""4."22
#$%&': M*%*2&:.*$ 0+2 C$,4%*;+/<'2
Esta conjugao mostra uma srie histrico-geogrfica ou vice-versa.
e) Distribuio de frequncia: um conceito estatstico muito importante dentro do
estudo descritivo dos dados, e ser abordado com mais detalhes em captulos
posteriores. Abaixo, apresentamos um exemplo, a ttulo de ilustrao.
E4T#TUR#4 DE 177 #8UNO4 D#
E4&O8# 9 1::;
Estaturas <c$= N
o
de a!unos
140 | 145 2
145 | 150 5
150 | 155 11
155 | 160 39
160 | 165 32
165 | 170 10
170 | 175 1
Tota! 100
Dados fictcios
"." - >r+icos
A apresentao grfica um complemento importante da apresentao tabular. A
principal vantagem de um grfico sobre a tabela prende-se ao fato de que ele
permite conseguir uma visualizao imediata da distribuio dos valores
observados. Os grficos propiciam uma idia preliminar mais satisfatria da
concentrao e disperso dos valores, uma vez que atravs deles os dados
6
6
estatsticos se apresentam em termos de grandezas visualmente interpretveis. Ao
mesmo tempo que temos, no grfico, uma viso global da distribuio dos dados,
perdemos em detalhes. Apresentaremos aqui os tipos de grficos mais significativos
para nosso estudo.

>r+ico e$ &o!unas ou e$ *arras: a representao de uma srie por meio
de retngulos, dispostos horizontalmente (em barras) ou verticalmente (em
colunas).
Exemplos:
VASI0LASS S.A.
VENDAS DE VASIL&AS3 POR TIPO3 E4PRESSAS COMO PERCENTA0EM DAS
VENDAS TOTAIS3 1952
TIPOS DE =ASILHAS 5 1 15 2 25 3 35 4>
8+.+ +)*,'%&$2 ?5$;+ )+.1+@
A+.,(;*+ ' ;$2,:&*;$2
4&*)*0+0' 1'.+)
1+..+A+2 0' ;'.3'B+
)*;$.'2
+)*,'%&$2 ?5$;+ '2&.'*&+@
1+..+A+2 0' .'A.*1'.+%&'2
3+2*)-+2 ;+2'*.+2
7
7
Fonte: Toledo & Ovalle (1995, p. 79)
Fonte: Toledo & Ovalle (1995, p. 84 - adaptado)
>r+ico e$ 4etores: ou grfico tipo torta ou pizza. construdo com base em
um crculo, e empregado sempre que desejamos ressaltar a participao do
dado no total. Exemplo:
PRODUO AGRCOLA DO ESTADO X - 1972
Fonte: Toledo & Ovalle (1995, p. 92)
O total representado pelo crculo, que fica dividido em tantos setores quantas so
as partes. Os setores so tais que suas reas so respectivamente proporcionais
aos dados da srie. Obtemos cada setor por meio de uma regra de trs simples e
direta, lembrando que o total da srie (100%) corresponde a 360. Com recursos
grficos mais sofisticados comum a construo de grficos de setores em
perspectiva ou com destaque para uma ou mais "fatias.
"
VENDAS DA EMPRESA Y
VENDAS INTERNAS X VENDAS EXTERNAS - 1990 - 1993
MILHARES DE DLARES
0
100
200
300
400
500
600
700
1990 1991 1992 1993
VENDAS EXTERNAS
VENDAS INTERNAS
UANTIDADE !"#
CAF
55%
ACAR
28%
FEIJO
3%
MI!O
14%
P$%&'()% T%"*+, 720-000 "
.REA PLANTADA DO ESTADO X
"
>r+icos e$ 8in?as: as linhas so particularmente mais eficientes do que as
colunas, quando existem intensas flutuaes nas sries ou quando h
necessidade de se representarem vrias sries em um mesmo grfico. Exemplo:
/$%&'()% 0$*12+32$* &3 4+3% &3 &35&6 1977-92
0
10
20
30
40
50
60
70
80
1987 1988 1989 1990 1991 1992
*5%1
82+ "%53+*&*1
#$%&': A1.$8+),+ ?+840 C.'28$! 2@
Os grficos em linhas so particularmente interessantes para se destacar uma
tendncia. comum tambm a sobreposio de linhas quando se quer comparar
dados de duas sries. Existem muitos outros tipos de grficos. Nos interessar
principalmente o histograma de frequncia e os polgonos e ogivas, que
detalharemos mais adiante.
Comparativo Grfico x Tabela
R+(+6t) (78-796:):) :7 07;+<87 F+:+<)9 =7< R+>6?+- - 1999
N)t@<+A)
V)97< (1.000 R")
B<)-69
0<)8:+- R+>6?+-
N7<t+ N7<:+-t+ S@:+-t+ S@9 C+8t<7-O+-t+
T7t)9 :)-
<+(+6t)-
2#/.5B9.!/! !.595.525 1B.0!0.9!1 15/.00/.#19 29.5/!.51# #0.19!.#29
T7t)9 :7-
<+(@<-7-
B/9.!1!.150 !.595.0#! 1B.555./#9 15/./95.1B5 29.5!!./50 !/!.500.1B1
#$%&': IBGE! D*.'&$.*+ 0' P'264*2+2! D'8+.&+,'%&$ 0' C$%&+2 N+;*$%+*2! R'1*$%+)*C+/D$ 0+2 T.+%2+/<'2
0$ S'&$. PE5)*;$ 1999
9
9
R3932"* 9%51%+2&*&* &% G%:3$5% ;3&3$*+ /%$
R3<2=31 - 1999
2>
?>
@A>
10>
27>
N"#$%
N"#&%'$%
S(&%'$%
S()
C%*$#"+O%'$%
R+(+6t) T7t)9C R" 2#/.5B9.!/!.000300
#$%&': IBGE! D*.'&$.*+ 0' P'264*2+2! D'8+.&+,'%&$ 0' C$%&+2 N+;*$%+*2! R'1*$%+)*C+/D$ 0+2 T.+%2+/<'2
0$ S'&$. PE5)*;$ 1999
A leitura da tabela mais difcil, enquanto o grfico apresenta um entendimento
bem mais fcil e agradvel. Se for possvel usar o recurso de cores no grfico, fica
melhor ainda. Entretanto, no grfico perdemos os detalhes, ficamos apenas com
uma idia visual comparativa.
Existem muitos outros tipos de grficos, tais como os pictricos e o cartograma.
aconselhvel que os grficos sejam produzidos com o auxlio de softwares
adequados. O mais comumente usado o Excel.
".) - Distri5ui-.o de requ'ncias
#1ru%a$ento dos Dados
Dados *rutos: feita a coleta, os dados originais ainda no se encontram prontos
para anlise, por no estarem numericamente organizados. Por essa razo,
costuma-se cham-los de dados brutos.
Ro!: uma lista na qual os valores esto dispostos em uma determinada ordem,
crescente ou decrescente.
Exemplo:
&onsu$o $ensa! de ener1ia e!trica@ %or A7 usu+rios %articu!ares - BC?
dados brutos:
5" 62 " 57 " 126 136 96 144 19
9 "6 3" 94 "2 75 14" 114 131 2"
66 95 121 15" 64 15 11" 73 "3 "1
5 92 6 52 "9 5" 1 9 94 74
3 75 72 157 125 76 "" 7" "4 36
rol crescente:
3 5" 75 "9 11"
" 5" 76 9 121
1
1
1 6 7" 9 125
19 62 " 92 126
2" 64 "1 94 131
36 66 "2 94 136
3" 72 "3 95 144
5 73 "4 96 14"
52 74 "6 15 157
57 75 "" 114 15"
Ta5e!as de requ'ncia: so representaes nas quais os valores se
apresentam em correspondncia com suas repeties, evitando-se assim
que eles apaream mais de uma vez na tabela, como ocorre com o rol.
Distri5ui-.o de requ'ncia de dados ta5u!ados n.o-a1ru%ados e$ c!asses:
uma tabela onde os valores da varivel aparecem individualmente. Este tipo de
apresentao utilizado para representar uma varivel discreta. Exemplo:
Xi a varivel, ou seja, a nota.
fi a frequncia absoluta simples das notas, que so os resultados numricos
provenientes da contagem. A soma das frequncias sempre igual ao nmero total
de valores observados.
n = fi = 130
Distri5ui-.o de requ'ncia de dados a1ru%ados e$ c!asses: uma tabela
onde os valores no mais aparecero individualmente, mas agrupados em classes.
Quando a varivel do estudo for contnua, ser sempre conveniente agrupar os
valores observados em classes. Se, por outro lado, a varivel for discreta e o
nmero de valores representativos dessa varivel for muito grande, recomenda-se
o agrupamento dos dados em classes.
Exemplo: um teste de estatstica, contendo 100 perguntas do tipo certo-errado, foi
aplicado em uma turma de 500 estudantes. A tabela abaixo apresenta os resultados
do teste.
11
N7t)- :7- )9@87- :) E-(79) D 8) =<7;) :+ &6-tE<6)
46
F6
5
1 "
2 9
3 12
4 14
5 17
6 23
7 1"
" 13
9 7
1 4
A* F 13
11
Smbolos:
GHH : inclui o limite inferior, exclui o limite superior
GHI : inclui os limites inferior e superior
HHI : exclui o limite inferior, inclui o superior
: exclui os limites inferior e superior
Obs: a resoluo 886/66 do IBGE recomenda a utilizao do smbolo GHH
E!e$entos de u$a Distri5ui-.o de Drequ'ncias
#$%!itude Tota! <#t=: a diferena entre o maior e o menor valor observado da
varivel em estudo. Se, por exemplo, no teste que deu origem tabela anterior a
maior nota tivesse sido 97 e a menor 1, a amplitude total do conjunto de valores
observados seria: At = 97 - 1 = 96
&!asse: cada um dos grupos de valores em que se subdivide a amplitude total do
conjunto de valores observados da varivel. O nmero de classes representado
por k. importante que a distribuio tenha um nmero adequado de classes.
8i$ite 4u%erior e 8i$ite Inerior <84 e 8I= : so os valores extremos das
classes. Para a construo de tabelas , recomendvel que os limites sejam
nmeros inteiros.
#$%!itude do Interva!o de &!asse <?= : determinado o valor de k, devemos
determinar a amplitude do intervalo de classe, o que conseguido dividindo-se a
amplitude total pelo nmero de classes:
k
A
h
t

Podemos tambm saber a amplitude do intervalo verificando a diferena entre o


limite superior e o limite inferior de cada classe. Assim: h = L
S
L
I (usamos esta
12
N7t)- F<+G@H8(6)- (F6)
J 1 5
1 J 2 15
2 J 3 2
3 J 4 45
4 J 5 1
5 J6 13
6 J 7 1
7 J" 6
" J 9 15
9 JJ 1 1
A* F 5
12
relao quando a tabela j dada e queremos apenas saber o valor da amplitude
das classes).
Exerccio:
1) Construir as classes para 250 dados, menor valor = 80, maior valor = 640.
,onto Edio de &!asse <3i= : o valor que representa a classe para efeito do
clculo de certas medidas. Na distribuio de frequncias com valores agrupados
em classes, considera-se que os resultados includos em cada classe distribuem-se
uniformemente por seu intervalo, por isso escolhemos o ponto mdio para
represent-la. Para obter o ponto mdio de uma classe, basta acrescentar ao seu
limite inferior a metade da amplitude do intervalo de classe:
2
h
L x
i i
+
.
Quando o limite superior de uma classe for igual ao limite inferior da classe
seguinte, o ponto mdio poder ser calculado como a mdia aritmtica dos limites
do intervalo:
2
s i
i
L L
x
+

Drequ'ncia Re!ativa 4i$%!es: obtida quando dividimos a frequncia absoluta


simples pelo nmero total de dados (n). Desejando-se expressar o resultado em
porcentagem, basta multiplicar o quociente obtido por 100.
A soma das frequncias relativas sempre igual a 1 ou 100%.
Drequ'ncia #5so!uta #cu$u!ada F#5ai3o deG: a soma da frequncia absoluta
simples de uma classe com as frequncias absolutas simples das classes anteriores.
Toda vez que se procura saber quantas observaes existem at uma determinada
classe, recorre-se frequncia acumulada "abaixo de.
Drequ'ncia Re!ativa #cu$u!ada F#5ai3o deG: a soma da frequncia relativa
simples de uma classe com as frequncias relativas simples das classes anteriores.
Tambm pode ser obtida pelo quociente entre a frequncia absoluta acumulada
"abaixo de e o nmero total de dados.
Drequ'ncia #5so!uta #cu$u!ada F#ci$a deG: a soma da frequncia absoluta
simples de uma classe com as frequncias absolutas simples das classes
posteriores.
Drequ'ncia Re!ativa #cu$u!ada F#ci$a deG: a soma da frequncia relativa
simples de uma classe com as frequncias relativas simples das classes posteriores.
Obs: as frequncias acumuladas tambm podem ser calculadas em distribuies de
dados no-agrupados em classes.
Exemplo: a tabela abaixo representa os salrios pagos a 100 operrios da empresa
XYZ ltda.
13
13
1
n
f
fr
i
i


D+0$2 A*;&7;*$2
a) Determinar as frequncias simples e acumuladas (absolutas e relativas) e os
pontos mdios.
b) Quantos operrios ganham abaixo de 6 salrios mnimos?
c) Qual a porcentagem de operrios com salrio entre 6 e 8 salrios mnimos?
d) Qual a porcentagem de operrios com salrio equivalente a 4 salrios
mnimos ou superior?
Soluo:
a)
C)+22'2 A* K* A.* ?>@ A+; A.+; A+; A.+;
J 2 22 1 2! 22 2! 11 1!
2 J 4 2" 3 25!5 5 45!5 "" "!
4 J 6 31 5 2"!1L "1 73!6 6 54!5
6 J " 17 7 15!5 9" "9!1 29 26!4
" J 1 12 9 1!9 11 1! 12 1!9
F 11 F 1!
*arredondado com compensao
b) 81 operrios
c) 15,5%
d) 54,5%
Histo1ra$as: so grficos formados por um conjunto de retngulos
justapostos, de forma que a rea de cada retngulo seja proporcional
frequncia da classe que ele representa. Assim sendo, a soma dos valores
correspondentes s reas dos retngulos ser sempre igual frequncia total.
No eixo horizontal so anotados os valores individuais da varivel em estudo ou
os limites das classes e no eixo vertical as frequncias da varivel. possvel
utiliz-lo para representar as frequncias absolutas ou relativas, simples ou
acumuladas. O histograma pode ser utilizado para representar a distribuio de
variveis quantitativas do tipo discreta ou contnua. Exemplo: para a tabela
anterior, o histograma :
14
N
$
0' 2+)(.*$2 ,7%*,$2 N
$
0' $8'.(.*$2
J 2 22
2 J 4 2"
4 J 6 31
6 J " 17
" J 1 12
T$&+) 11
14

S*+B$2%1 &* 38/$31* XYC +"&*-
0
5
10
15
20
25
30
35
0 , 2 2 , 4 4 , 6 6 , 8 8 , 10
1*+B$2%1 8D528%1
5
%
-

&
3

E
'
5
9
2
%
5
B
$
2
%
1
,o!1ono de Drequ'ncia: um grfico em linha, obtido unindo-se por
segmentos os pontos mdios das bases superiores dos retngulos do
histograma. Pode referir-se s frequncias absolutas ou relativas, conforme a
escala utilizada no eixo vertical. O polgono feito sobre o histograma de
frequncia acumulada chamado de Ogiva de Galton.
Exemplo:

1*+B$2%1 &* 38/$31* XYC +"&*
0
5
10
15
20
25
30
35
0 , 2 2 , 4 4 , 6 6 , 8 8 , 10
1*+B$2%1 8D528%1
5
%
-

&
3

E
'
5
9
2
%
5
B
$
2
%
1
Exemplo:
15
&urvas de Drequ'ncia: so polgonos de frequncia polidos, apresentando um
formato caracterstico, assemelhando-se ao contorno de um sino, evidenciando
uma forte concentrao dos valores em torno do centro da distribuio. Mesmo
que a semelhana com um sino seja muito grande, bem provvel que, na
prtica, a curva apresente uma certa deformao (distoro) para a esquerda
ou para a direita. Podemos dizer que, enquanto o polgono de frequncia nos
d a imagem real do fenmeno, a curva de frequncia nos d a imagem
tendencial.
15
E3erccios
1) Os dados seguintes representam 40 observaes relativas ao ndice
pluviomtrico em determinados municpios do estado:
M*)7,'&.$2 0' ;-43+
144 152 159 16 136 144 152 153
16 151 157 146 137 155 159 154
154 145 141 15 139 14 145 15"
142 146 142 141 144 147 15 149
141 15 143 15" 159 162 151 151
a) Construir a tabela de frequncias absolutas simples.
b) Determinar as frequncias absolutas acumuladas "abaixo de.
c) Determinar as frequncias simples relativas
d) Determinar as frequncias relativas acumuladas "abaixo de.
e) Obter os pontos mdios das classes.
f) Construir o histograma e o polgono de frequncias.

2) Frequncia simples absoluta de um valor da varivel :
a) o nmero de repeties desse valor.
b) a porcentagem de repeties de valor.
c) o nmero de observaes acumuladas at esse valor.
d) o somatrio das frequncia simples.
e) quociente entre o nmero de repeties desse valor e o nmero total de casos.
3) Um conjunto de 100 notas de Matemtica, de alunos do sexo masculino, tiradas
dos arquivos da secretaria da escola, constitui:
a) um rol
b) uma relao de dados brutos
c) uma tabela
d) uma distribuio de frequncia
e) uma populao
16
16
4) Considere distribuio de frequncias abaixo e assinale a opo correta.
M* A*
4 J 6 6
6 J " "
" J 1 12
1 J 12 1
12 J 14 4
a) A soma dos pontos mdios dos intervalos de classe inferior soma das
frequncias absolutas simples.
b) 28% das observaes esto no quarto intervalo de classe.
c) Menos de 25 observaes tm valor abaixo de 10.
d) Mais de 85% das observaes tem valor no inferior a 6.
e) 75% das observaes esto no intervalo entre 6 e 12.
6) Os grficos prprios de uma distribuio de frequncia so:
a) colunas, curva de frequncia e histograma.
b) polgono de frequncia e histograma.
c) colunas, curva de frequncia e polgono de frequncia.
d) grfico em setores, grfico em barras, curva de frequncia e curva normal.
e) colunas, barras, setores e curva de frequncia.
7) Grficos so instrumentos teis na anlise estatstica. Assinale a
definio/afirmao incorreta.
a) Um histograma representa uma distribuio de frequncias para variveis do tipo
quantitativa contnua ou discreta.
b) O grfico de barras representa, por meio de uma srie de barras, quantidades ou
frequncias para variveis categricas.
c) O grfico de setores apropriado, quando se quer representar as divises de um
montante total.
d) Um histograma pode ser construdo utilizando-se, indistintamente, as
frequncias absolutas ou relativas.
e) Uma ogiva pode ser obtida ligando-se os pontos mdios dos topos dos
retngulos em um histograma de frequncia absoluta simples.
8) Na construo dos grficos - histograma e polgono de frequncia - usamos,
obrigatoriamente as frequncias acumuladas:
a) s no primeiro.
b) s no segundo.
c) em ambos.
d) em nenhum.
e) no primeiro, s vezes, dependendo do tipo de varivel.
9) Das afirmaes:
I. Tanto o histograma como o polgono de frequncia, que so grficos
prprios da distribuio de frequncia, so grficos de anlise, os quais
devem ser feitos s quando a varivel for discreta.
17
17
II. Tanto o polgono de frequncia como o histograma, que so grficos
prprios da distribuio de frequncia, podem ser feitos para qualquer tipo
de varivel, desde que ela seja quantitativa.
III. O histograma um grfico em colunas, mas qualquer grfico em colunas
no necessariamente um histograma.
a) todas so verdadeiras
b) todas so falsas
c) apenas I falsa
d) apenas I e II so falsas
e) apenas II e III so falsas
) EEDID#4 DE ,O4IO
So medidas que caracterizam a distribuio. Conhecendo-se algumas destas
medidas podemos fazer uma idia geral da distribuio. Ex: sabendo que a mdia
de uma classe numa prova foi de 8,5, podemos concluir que a maioria dos alunos
teve um bom desempenho na prova, mesmo sem saber a nota de cada um. So
medidas de posio: as mdias, a mediana, a moda, os quartis, decis, centis, etc.
Eedidas de Tend'ncia &entra!: so as medidas de posio mais importantes.
Tambm chamadas de promdias, elas caracterizam o centro da distribuio e so
utilizadas para resumir o conjunto de valores representativos do fenmeno que se
deseja estudar. Ex: mdias, mediana, moda. Dentre as mdias, estudaremos a
aritmtica, a geomtrica e a harmnica. Existem outras, como a quadrtica, de
menor aplicao.
).1 - Edia #rit$tica: smbolo:
K
Pode ser simples ou ponderada.
a) Simples: usada para dados brutos: X = {x1, x2, ... , x
n
}

n
x
n
x x x
x
i
n

+ + +

....
2 1
Ex: X = {1, 3, 8, 10, 12}

5
12 1 " 3 1 + + + +
x
" ! 6 x

na HP 12-C:
f REG
f Z
1 Z+ 3 Z+ 8 Z+ 10 Z+ 12 Z+
g x ( a tecla 0)
1"
1"
b) Ponderada: usada para dados tabulados. Cada valor x
i
da varivel ponderado
pela sua frequncia f
i
. Temos ento:

x
x f x f x f
f
k k
i

+ + +

1 1 2 2
. . ... .
x
x f
f
i i
i

.
Lembrando que se os dados estiverem agrupados em classes, cada valor de xi o
ponto mdio da classe correspondente.
Veja o exemplo seguinte, observando que a coluna x
i
traz o ponto mdio de cada
classe e que abrimos uma coluna x
i
. f
i
para facilitar o clculo.
35
5
175

i
i i
f
f x
x
A mdia aritmtica utilizada principalmente quando desejamos obter a medida de
posio central que possui a maior estabilidade. Entretanto, devemos lembrar que a
mdia fortemente influenciada pelos extremos, fato que pode descaracteriz-la
como principal medida de tendncia central.
Nos casos em que as medidas extremas forem bastante afastadas das demais, a
mdia ser tendenciosa, e por isso deveremos optar por outra medida de posio,
que no sofra esse tipo de influncia.
A mdia aritmtica sozinha no deve ser tomada como espelho da distribuio.
necessrio compor outras medidas de posio para podermos fazer uma completa
avaliao dos dados.
E3erccios
1) Uma empresa fabrica um componente e, para isso, precisa importar trs itens A,
B e C. Sabe-se que ela comprou 3.000 unidades do item A, pagando alquota de
8% de imposto; 4.500 unidades do item B, com alquota de 12% e 5.000 unidades
do item C, com alquota e 15%. Qual foi a alquota mdia paga pela empresa?
2) Uma empresa comprou 400 unidades de um item A, pagando R$14,30 a
unidade. Entretanto, ela recebeu uma proposta de outro fornecedor, que lhe
19
Classes f
i
x
i
x
i
. f
i
10 | 20 6 15 90
20 | 30 11 25 275
30 | 40 15 35 525
40 | 50 13 45 585
50 | 60 5 55 275
f
i
= 50 = n x
i
.f
i
= 1.750
19
ofereceu o mesmo item por R$13,20. A empresa decidiu ento comprar mais 300
unidades desse novo fornecedor. Qual o preo mdio pago por essa empresa pelo
item A?
3) Calcule a mdia aritmtica da distribuio abaixo.
)." - Eoda: smbolo: Mo ou xN
Tambm chamada de norma, valor dominante ou valor tpico. Pode-se definir
moda como o valor mais frequente, quando comparada sua frequncia com a dos
valores contguos de um conjunto ordenado. Quando afirmamos que o salrio
modal de uma empresa de R$1.200,00, queremos dizer que esse o salrio
percebido pelo maior nmero de pessoas dessa empresa. O termo moda foi
utilizado primeiramente por Karl Pearson em 1895, talvez como uma associao a
sua concepo na linguagem comum.
a) Dados No-Tabulados: considerando um conjunto ordenado de valores, a moda
ser o valor mais frequente desse conjunto.
Exemplo: calcular a moda dos conjuntos: X ={4, 5, 5, 6, 6, 6, 7, 7, 8, 8}
Y = {4, 4, 5, 5, 6, 6}
Z = {1, 2, 2, 2, 3, 3, 4, 5, 5, 5, 6, 6}
W = {1, 2, 3, 4, 5}
A moda de cada um dos conjuntos ser:
X: xN = 6 (unimodal) ; Y: amodal; Z: 2 N
1
x e 5 N
2
x (bimodal); W: amodal
Obs: para mais de duas modas, a srie classificada como plurimodal.
b) Dados Tabulados: para dados no agrupados, a moda ser o valor de xi
correspondente maior frequncia, tirado direto da tabela, sem a necessidade
de clculos. Se os valores estiverem agrupados em classes, temos vrios
mtodos de clculo, como a moda bruta (ponto mdio da classe de maior
frequncia) e o mtodo de King
1
, mas o mais elaborado o mtodo de Czuber,
que leva em considerao a frequncia modal e as frequncias adjacentes
classe modal (classe modal a classe de maior frequncia).
1
O ,:&$0$ 0' O*%1 %D$ )'3+ ', ;$%2*0'.+/D$ + A.'64P%;*+ 0+ ;)+22' ,$0+)! +8'%+2 +2 A.'64P%;*+2
+%&'.*$. ' 8$2&'.*$..
2
C$%24,$ ?QR-@ %
$
0' 424(.*$2
5 J 25 4
25 J45 6
45 J65 14
65 J"5 26
"5 J15 16
15 J125 7
125 J145 5
145 J165 2
"
2
Frmula de Czuber:
( )
( ) fp fa fm
fa fm h
L x
i
+

+
2
N
onde:
Li = limite inferior da classe modal
h = amplitude da classe modal
fm = frequncia absoluta simples da classe modal
fa = frequncia absoluta simples da classe anterior modal
fp = frequncia absoluta simples da classe posterior modal
Exemplo: calcular a moda da distribuio ao lado, pelo mtodo de Czuber:
Temos:
classe modal: 4
a
classe: 65 | 85 (classe de maior frequncia)
Li = 65 ; h = 20 ; fm = 26 ; fa = 14 ; fp = 16
utilizando a frmula, temos:
A moda corresponder ao ponto mdio da classe modal, quando as frequncias
anterior e posterior modal forem iguais.
Podemos tambm identificar as expresses grficas da moda. Na curva de
frequncia, a moda o valor correspondente, no eixo das abscissas, ao ponto de
ordenada mxima.
curva modal curva no-modal
21
C$%24,$ ?QR-@ %
$
0' 424(.*$2
5 J 25 4
25 J45 6
45 J65 14
65 J"5 26
"5 J15 16
15 J125 7
125 J145 5
145 J165 2
"
( )
( )
9 ! 75 9 ! 1 65
22
24
65
3 52
12 2
65
16 14 26 2
14 26 2
65 N + +

+
+

+ x
21
curva antimodal
curva bimodal
E3erccios
4) calcular a moda para a distribuio abaixo:
;)+22'2 A*
1 J 2 1
2 J 3 2
3 J 4 35
4 J 5 42
5 J 6 25
6 J 7 1"
A* F 15
5) Dados obtidos no stio da revista VEJA na internet (www.veja.com.br) mostram
que 28% da populao brasileira de origem africana, 32% de origem portuguesa,
20% de origem italiana e 20% de outras origens. Qual a moda quanto origem?
).) - Eediana: smbolo: Md ou
S
K
.
o valor que divide uma srie ordenada de tal forma que pelo menos a metade ou
50% dos itens sejam iguais ou maiores do que ela, e que haja pelo menos outra
metade ou 50% de itens menores do que ela.
22
22
a) Dados No-Tabulados: podem ocorrer duas hipteses:
o n
o
de observaes mpar: o elemento mediano dado por: Emd =
% +1
2
.
O passo seguinte localizar a mediana na lista de valores, de acordo com o
resultado obtido no clculo do elemento mediano.
Exemplo: calcular a mediana do conjunto X = {2, 3, 6, 12, 15, 23, 30}
Soluo: sendo n = 7 (mpar), temos ento: Emd =
7 1
2
4
+
. A mediana ser, pois,
o 4
o
elemento da srie, ou seja, 12.
o n
o
de observaes par: o elemento mediano dado por: Emd =
% 2
Exemplo: calcular a mediana do conjunto X = {3, 6, 9, 12, 14, 15, 17, 20}
Soluo: sendo n par, temos ento Emd =
" 2 4
. A mediana ser, pois, o 4
o
elemento da srie, ou seja, 12.
Entretanto, este valor contraria a definio, uma vez que no teramos a mesma
proporo de valores menores e maiores que o valor 12. A mediana dever ento
ser calculada como a mdia aritmtica dos valores centrais, ou seja,
12 14
2
13
+
.
Agora, percebe-se a ocorrncia de igual nmero de valores maiores e menores do
que
S
x
. Nesse exemplo verificamos tambm que a mediana no tpica.
b) Dados Tabulados no Agrupados em Classes: o procedimento a ser adotado
praticamente idntico ao anterior. Em primeiro lugar deve-se verificar se o nmero
de observaes mpar ou par e, conforme o caso, aplicar as frmulas adotadas na
alnea (a) para o clculo do elemento mediano. Em seguida, acrescentamos
tabela a coluna com as frequncias acumuladas "abaixo de. Comparando o
resultado obtido no clculo do elemento mediano com os valores dessa coluna,
determinaremos a mediana.
Exemplos: calcular a mediana dos valores apresentados nas tabelas:
n par, ento Emd = n/2 = 50/2 = 25
A mediana dever ser a mdia aritmtica entre o 25
o
e o 26
o
elementos, que esto
na 3
a
classe, portanto:
4
S
x
23
K* A* A+;
2 5 5
3 1 15
4 15 3
5 12 42
6 " 5
% F 5
K* A* A+;
3 3 3
4 6 9
5 9 1"
6 " 26
7 9 35
% F 35
23
n mpar, ento Emd =
% +

+

1
2
35 1
2
36
2
1"
A mediana dever ser o 18
o
elemento, que est na
3
a
classe, portanto: 5
S
x

c) Dados Tabulados Agrupados em Classes: inicialmente determinamos a classe
mediana, sendo que esta aquela qual corresponde frequncia acumulada
"abaixo de imediatamente superior a
2
i
f
. Feito isso, um problema de
interpolao resolve a questo, admitindo-se que os valores se distribuam
uniformemente no intervalo de classe.
Assim:
onde:
Li = limite inferior da classe mediana
Faa = freq. acumulada "abaixo de anterior
classe mediana
h = amplitude da classe mediana
fmd = freq. absoluta simples da classe mediana
.
Exemplo: calcule a mediana para os dados da tabela:
150/2 = 75 a classe mediana a 4
a
classe.

4 ! 42
42
1
4
42
1 65
2
15
4
S
+

1
]
1

+ x

Obs: Se existir uma fac com valor igual a
2
i
f
, ento a mediana ser o limite
superior da classe correspondente a essa fac, sem a necessidade de usar a frmula.
E3erccio
5) Calcular a mediana para a distribuio abaixo.
C$%24,$ ?QR-@ %
$
0' 424(.*$2
5 J 25 4
25 J45 6
24
;)+22'2 A* A+;
1 J 2 1 1
2 J 3 2 3
3 J 4 35 65
4 J 5 42 17
5 J 6 25 132
6 J 7 1" 15
A* F 15
24
md
f
Faa
fi
h
Li x

,
_

+
2
S
45 J65 14
65 J"5 26
"5 J15 16
15 J125 7
125 J145 5
145 J165 2
"
).2 - &onsidera-Ies #dicionais 4o5re Edia #rit$tica@ Eediana e Eoda
Dentre as vrias medidas de tendncia central, seguramente a mdia aritmtica
a mais utilizada por ser mais estvel.
Em termos de uma curva de distribuio de frequncia, percebe-se melhor o
posicionamento dessas medidas:
curva normal (simtrica)
assimtrica esquerda assimtrica direita
25
25
A mdia aritmtica prefervel s demais medidas, para estimar a tendncia
central, quando se trata de muitas classes de populaes, por haver menos
variabilidade entre as mdias aritmticas calculadas a partir de vrias amostras
aleatrias do que entre as medianas e as modas.
A mediana prefervel mdia quando se est interessado em conhecer
exatamente o ponto mdio da distribuio, aquele valor que a divide em duas
partes exatamente iguais. prefervel ainda, quando os resultados extremos so
tais que podem afetar sensivelmente o valor da mdia.
A moda utilizada essencialmente quando pretendemos apenas uma medida
rpida e aproximada da tendncia central. A moda tambm bastante til quando
desejamos que este valor seja tpico da distribuio.
Tanto a mdia aritmtica quanto a mediana e a moda so dadas na mesma unidade
da varivel.
Obs: um promdio no deve ser usado como um resumo da distribuio de
frequncias, quando o interesse estiver concentrado na distribuio completa.
E3erccios
7) Calcule a mdia aritmtica, a mediana e a moda para a tabela abaixo.
8) O levantamento de dados sobre os salrios de 100 funcionrios de uma
determinada empresa forneceu os seguintes resultados:
T4+%&*0+0' 0' S+)(.*$2 M7%*,$2 T4+%&*0+0' 0' #4%;*$%(.*$2
2 J 4 25
4 J 6 35
6 J " 2
" J 1 15
1 J 12 5
&$&+) 1
Calcule a mdia aritmtica, a mediana e a moda para esses dados.
26
N7t)- F<+G@H8(6)- (F6)
J 1 6
1 J 2 16
2 J 3 23
3 J 4 41
4 J 5 1
5 J6 13
6 J 7 9"
7 J" 57
" J 9 19
9 JJ 1 1
A* F 5
26
2 EEDID#4 DE DI4,ER4O
A anlise completa dos dados no requer apenas a sua apresentao, atravs de
grficos e tabelas, ou do clculo de promdios ou outras medidas de posio.
Caracterizar um conjunto de valores apenas atravs de uma mdia, por exemplo,
descrev-lo inadequadamente, uma vez que os dados diferem entre si, em maior
ou menor grau. Para avaliar o grau de variabilidade ou disperso dos valores de um
conjunto de nmeros, lanaremos mo das estatsticas denominadas medidas de
disperso. Estas nos proporcionaro um conhecimento mais completo do fenmeno
a ser analisado, permitindo estabelecer comparaes entre fenmenos de mesma
natureza e mostrando at que ponto os valores se distribuem acima ou abaixo da
tendncia central.
2.1 - Desvio-%adr.o: (S) a medida de disperso mais usada, tendo em comum
com o desvio mdio o fato de em ambos serem considerados os desvios com
relao a
K
. S que, no clculo do desvio-padro, em lugar de serem usados os
valores absolutos das discrepncias ou desvios calculam-se os quadrados desses. O
desvio-padro a mdia quadrtica dos desvios em relao mdia aritmtica de
um conjunto de nmeros, ou seja, a raiz quadrada da mdia aritmtica dos
quadrados dos desvios, tomados a partir da mdia aritmtica.
a) Dados Brutos: o desvio-padro calculado por:
( )
n
x x
S
i

2

Obs: alguns autores afirmam que quando o desvio-padro representar uma
descrio da amostra e no da populao, caso mais frequente em estatstica, o
denominador das expresses acima deve ser
% 1
, em vez de n. A razo desse
procedimento reside no fato de que, utilizando o divisor
% 1
, obtm-se uma
estimativa melhor do parmetro de populao. Para valores grandes de n (n > 30)
no h grande diferena entre os resultados proporcionados pela utilizao de
qualquer dos dois divisores. Daremos preferncia para a frmula que proporciona
um clculo mais simples e rpido, e que mais utilizado em provas de concursos
pblicos (denominador n).
Exemplo: calcular o desvio-padro do conjunto abaixo:
X = {1, 3, 8, 10, 12}
" ! 6 x
5
4 ! 27 24 ! 1 44 ! 1 44 ! 14 64 ! 33
5
@ " ! 6 12 ? @ " ! 6 1 ? @ " ! 6 " ? @ " ! 6 3 ? @ " ! 6 1 ?
2 2 2 2 2
+ + + +

+ + + +
S
166533 ! 4 36 ! 17
5
" ! "6
S
Na HP 12-C, o clculo do desvio padro pode ser feito com a seguinte sequncia de
teclas:
com denominador n - 1 com denominador n
f REG f REG
f U f U
1 UV 1 UV
3 UV 3 UV
27
27
8 UV " UV
10 UV 1 UV
12 UV 12 UV
g S (tecla ponto) g x (tecla 0)
UV
visor: 4,65833 visor: 4,166533
b) Dados Tabulados: utilizando o divisor n, temos:

( )
fi
f x x
S
i i


2

Exemplo: calcular o desvio-padro da tabela abaixo:
( )
99"99 ! 3 9375 ! 96
"
"75 . 76
2


fi
f x x
S
i i
QR-
Observaes:
(i) O desvio-padro dado na mesma unidade da varivel.
(ii) A mdia aritmtica desta distribuio 78,75 (j calculada).
E3erccio
1) Calcular o desvio padro para a distribuio abaixo:
P'2$ ?Q1@ #.'6. A52. S*,8)'2
2 J 4 7
4 J 6 9
6 J " 1"
" J 1 1
1 J 12 6
&$&+) 5
2." - /ariJncia: (S
2
) o quadrado do desvio-padro. Dessa forma, pode-se dizer
que a frmula da varincia igual expresso do desvio-padro, sem o sinal do
radical. Utilizaremos, tambm neste caso, o denominador n. A varincia uma
2"
C$%24,$ ?QR-@ %
$
0' 424(.*$2 ?A*@ K*
K K
*

( ) K K
*

2
( ) K K A
* *

2
.
5 J 25 4 15 963!75 4.64!625 16.256!25
25 J45 6 35 943!75 1.914!625 11.4"4!375
45 J65 14 55 923!75 564!625 7.94!75
65 J"5 26 75 93!75 14!625 365!625
"5 J15 16 95 16!25 264!625 4.225!
15 J125 7 115 36!25 1.314!625 9.19"!4375
125 J145 5 135 56!25 3.164!625 15."2!3125
145 J165 2 155 76!25 5."14!625 11.62"!125
" 76."75!
2"
medida que tem pouca utilidade como estatstica descritiva, porm extremamente
importante na inferncia estatstica e em combinaes de amostras.
2.) - Eedida de Dis%ers.o Re!ativa - &oeiciente de /aria-.o de ,earson: o
desvio-padro por si s no nos diz muita coisa. Assim, um desvio-padro de duas
unidades pode ser considerado pequeno para uma srie de valores cuja mdia
200; no entanto, se a mdia for igual a 20, o mesmo no pode ser dito. Alm disso,
o fato de o desvio-padro ser expresso na mesma unidade dos dados limita o seu
emprego, quando desejamos comparar duas ou mais sries de valores
relativamente sua disperso. Para contornar essas dificuldades e limitaes,
podemos caracterizar a disperso ou variabilidade dos dados em termos relativos a
seu valor mdio, medida essa denominada coeficiente de variao de Pearson:
1
x
S
CV
No exemplo anterior temos:
> 36 ! 39 1
75 ! 7"
99"99 ! 3
CV
Quanto menor for o CV, mais homogneo ser o conjunto de dados.
E3erccios
2) O que o desvio padro e o qu ele mede?
3) Complete a tabela abaixo com os dados que julgar necessrios para determinar:
a) desvio mdio;
b) desvio padro;
c) varincia;
d) coeficiente de variao.
4) Realizou-se uma prova de estatstica para duas turmas, cujos resultados foram
os seguintes:
Turma A:
K 5
e S = 2,5 Turma B:
K 4
e S = 2
Esses resultados permitem afirmar que:
a) a turma B apresenta maior disperso absoluta;
b) a disperso absoluta igual para ambas as turmas;
c) a disperso relativa igual disperso absoluta;
d) a disperso relativa e a absoluta para a turma B so iguais;
e) a disperso relativa da turma A igual da turma B.
A EEDID#4 DE #44IEETRI# E &URTO4E
29
M* A.'64P%;*+2 ?A*@
2 J 6 5
6 J 1 1
1 J 14 1"
14 J 1" 14
1" J 22 3
5
29
So as que faltam para complementarmos o quadro das estatsticas descritivas, que
proporcionam, juntamente com as medidas de posio e de disperso, a descrio
e compreenso completas da distribuio de frequncias estudada. As distribuies
de frequncia no diferem apenas quanto ao valor mdio e variabilidade, como
tambm quanto sua forma. Do ponto de vista desse ltimo aspecto, as
caractersticas mais importantes so o grau de deformao ou assimetria e o grau
de achatamento ou afilamento da curva de frequncias ou do histograma.
&oeiciente de #ssi$etria: Smbolo: (s, e ou Sk). Como j vimos, se a
mdia aritmtica coincidir com a moda, temos uma distribuio simtrica dos
valores estudados. A diferena entre a mdia e a moda j nos d uma boa idia
da assimetria da distribuio, mas essa medida absoluta, o que no
adequado, pois no permite comparaes com as medidas de outras
distribuies. Por esse motivo, d-se preferncia ao Coeficients de Assimetria de
Pearson , dado por:
( )
S
x x
As
S
. 3

Obs: Se o mdulo de s estiver entre 0,15 e 1, a assimetria considerada


moderada. Acima de 1 (em mdulo), forte.
Exemplo: Considerando a distribuio de frequncias abaixo, determine o tipo de
assimetria e o seu grau.
K
4
6
6!67
( )
S
.
.
! x L
h
fi
Faa
f
i
Md
+

_
,

+

+

2
6
2 3 24
15
6
12
15
6 "

( )
99 ! 2 9567 ! "
6
4 ! 537
2


n
f x x
S
i i
assimetria fraca
esquerda
&urtose: smbolo: (C). Denomina-se curtose o grau de achatamento de uma
distribuio em relao a uma distribuio padro, denominada curva normal
3
Xi fi xi
Fac xi . fi K K
*

( ) K K
*

2
( ) K K A
* *

2
0 | 2 5 1 5 5 -5,67 32,15 160,75
2 | 4 7 3 12 21 -3,67 13,47 94,29
4 | 6 12 5 24 60 -1,67 2,79 33,48
6 | 8 15 7 39 105 0,33 0,11 1,65
8 | 10 11 9 50 99 2,33 5,43 59,73
10 | 12 10 11 60 110 4,33 18,75 187,50
= 60 400 537,40
13 !
99 ! 2
39 !
99 ! 2
@ 13 ! ? 3
99 ! 2
@ " ! 6 67 ! 6 ? 3 @
S
?
3


S
x x
As
3
(curva correspondente a uma distribuio terica de probabilidade), qual tem
ndice de curtose igual a 0,263. Tem-se ento:
A curtose (C) se define como a razo entre a amplitude semi-interquartlica (Q) e a
amplitude declica - Curtose Declica.
( )
C
T T
D D

3 1
9 1
2
Os quartis (Q1 e Q3) so medidas de posio, calculadas como a mediana, que
dividem a distribuio em quatro partes com a mesma quantidade de elementos.
Assim:
( )
T L
Q %
#++ -
A
Q *
*
+

1
]
1
1
.
4
Os decis (D9 e D1) tambm so medidas de posio, semelhantes aos quartis, que
dividem a distribuio em dez partes com a mesma quantidade de elementos.
Assim:
( )
D L
Q %
#++ -
A
Q *
*
+

1
]
1
1
.
1
no qual:
fi = frequncia absoluta simples da classe quartlica / declica
Li = limite inferior da classe quartlica / declica
h = amplitude da classe quartlica / declica
n = nmero total de observaes ( fi)
Faa = frequncia acumulada anterior classe quartlica / declica
k = ordem do quartil / decil.
Exemplo: determinar o ndice de curtose e da distribuio abaixo:
31
Xi fi
fac
0 | 2 5 5
2 | 4 7 12
4 | 6 12 24
6 | 8 15 39
8 | 10 11 50
10 | 12 10 60
60
31
1
o
Quartil:
1
4
1 6
4
15

%
15
a
posio (3
a
classe)
3
o
Quartil:
3
4
3 6
4
45

%
45
a
posio (5
a
classe)
1
o
Decil:
1
1
1 6
1
6

%
6
a
posio (2
a
classe)

9
o
Decil:
9
1
9 6
1
54

%
54
a
posio (6
a
classe)
Assim:
( )
( )
C
T T
D D


3 1
9 1
2
9 9 4 5
2 1 " 2 29
4 59
2 " 51
4 59
17 2
27
! !
! !
!
!
!
!
!
A distribuio que tende ao achatamento (platicrtica).
E3erccios
Para as questes 1 e 2, considere a tabela de frequncias abaixo.
Pesos (kg) fi
fac xi xi . fi K K
*

( ) K K
*

2
( ) K K A
* *

2
50 | 58 10 10 54 540 -20,08 403,206 4032,06
58 |66 15 25 62 930 -12,08 145,926 2188,89
66 | 74 25 50 70 1750 -4,08 16,646 416,15
32
( )
( )
5 ! 4
12
6
4
12
2 12 15
4
4
. 1
1
+
1
]
1


+
1
1
]
1


+
i
i
f
h Faa
n
L Q
( ) ( )
T L
%
#++ -
A
*
*
3
3
4
"
45 39 2
11
"
12
11
9 9 +

1
]
1
1
+

1
]
1
+
.
!
( ) ( )
D L
%
#++ -
A
*
*
1
1
1
2
6 5 2
7
2
2
7
2 +

1
]
1
1
+

1
]
1
+
.
!29
( )
( )
" ! 1
1
"
1
1
2 5 54
1
1
. 9
9
+
1
]
1


+
1
1
]
1


+
i
i
f
h Faa
n
L D
32
74 | 82 24 74 78 1872 7,92 62,726 1551,02
82 | 90 16 90 86 1376 11,92 142,086 2273,38
90 | 98 10 100 94 940 19,92 396,806 3968,06
10
0
7408 14429,6
1) O ndice de curtose e a sua classificao so, respectivamente:
a) 0,26 mesocrtica
b) 0,258 platicrtica
c) 0,258 leptocrtica
d) 25,8% fortemente crtica
e) 25,8% moderadamente crtica
2) O segundo coeficiente de assimetria de Pearson e sua classificao so,
respectivamente:
a) 0,258 assimtrica esquerda
b) 0,258 assimtrica direita
c) praticamente 0 simtrica
d) 0,02 assimtrica direita
e) 20% assimtrica direita
K - ,RO*#*I8ID#DE
&onceitos *+sicos
E3%eri$entos #!eatLrios: ou fenmenos aleatrios so aqueles que, mesmo
repetidos vrias vezes sob as mesmas condies, apresentam resultados
imprevisveis.
Es%a-o #$ostra!: Consideremos uma experincia onde pode ocorrer qualquer
um de n resultados possveis. Cada um dos n resultados possveis ser
chamado de %onto a$ostra!, e o conjunto S de todos os resultados possveis,
ou seja, o conjunto S de todos os pontos amostrais, ser chamado de es%a-o
a$ostra!, es%a-o de %rova ou conMunto universo da experincia. Nos
espaos amostrais equiprobabilsticos ou laplacianos, todos os pontos amostrais
tem a "mesma chance de ocorrer.
Evento: Chama-se evento a qualquer subconjunto do espao amostral S.
Ex: No lanamento de um dado, considerar a ocorrncia de um n
o
mpar. Temos:
Espao amostral S = {1, 2, 3, 4, 5, 6}
Evento n
o
mpar A = {1, 3, 5}
Evento certo - o prprio conjunto universo S. Intuitivamente, o fato que
ocorre sempre, com certeza.
Evento i$%ossve! - o conjunto vazio tambm subconjunto de S, portanto
tambm um evento, chamado de impossvel porque nunca ocorre.
Ex: No lanamento de um dado, o evento "n
o
maior ou igual a 7 um evento
impossvel e o evento "n
o
menor ou igual a 6 um evento certo.
33
33
,ro5a5i!idade: Dado um espao amostral S, com n(S) elementos, e um evento
A de S, com n(A) elementos, A probabilidade do evento A o nmero P(A) tal
que:
P A
n A
n S
? @
? @
? @

Exemplos:
a) Considerando o lanamento de uma moeda e o evento A "obter cara, temos:
S = {Ca, Co} n(S) = 2
A = {Ca} n(A) = 1
Logo: P(A) = = 0,5 ou 50%
b) Considerando o lanamento de um dado, vamos calcular a probabilidade do
evento B "obter o nmero 4 na face superior. Temos:
S = {1, 2, 3, 4, 5, 6} n(S) = 6
A = {4} n(A) = 1
Logo: P(A) = 1/6 = 0,1666... ou aprox. 16,7%
Eventos &o$%!e$entares - Sabemos que um evento pode ocorrer ou no.
Sendo % a probabilidade de que ele ocorra (sucesso) e q a probabilidade de que
ele no ocorra (insucesso), para um mesmo evento existe sempre a relao:
! " # = 1
Assim, se a probabilidade de se realizar um evento p = 1/5, a probabilidade de
que ele no ocorra :
q = 1 - 1/5 = 4/5
Exemplo: sabemos que a probabilidade de tirar quatro no jogo de um dado 1/6.
Assim, a probabilidade de no tirar 4 :
q = 1 - 1/6 = 5/6.
Eventos inde%endentes - dizemos que dois eventos so independentes
quando a realizao ou a no-realizao de um dos eventos no afeta a
probabilidade da realizao do outro e vice-versa. Por exemplo, quando
lanamos dois dados, o resultado obtido em um deles independe do resultado
obtido no outro. Se dois eventos so independentes, a probabilidade de que eles
se realizem simultaneamente igual ao produto das probabilidades de
realizao dos dois eventos. Assim, sendo p1 a probabilidade de realizao do
primeiro evento e p2 a probabilidade de realizao do segundo evento, a
probabilidade de que tais eventos se realizem simultaneamente dada por:
! = !1 . !2
Exemplo: lanamos dois dados. A probabilidade de obtermos 1 no primeiro dado
p1 = 1/6. A probabilidade de obtermos 5 no segundo dado p2 = 1/6. Logo, a
probabilidade de obtermos, simultaneamente, 1 no primeiro e 5 no segundo :
p = 1/6 . 1/6 = 1/36.
Eventos $utua$ente e3c!usivos - dizemos que dois ou mais eventos so
mutuamente exclusivos quando a realizao de um exclui a realizao do outro.
Assim, no lanamento de uma moeda, o evento "tirar cara e o evento "tirar
coroa so mutuamente exclusivos, j que, ao se realizar um deles o outro no
se realiza. Se dois eventos so mutuamente exclusivos, a probabilidade de que
34
34
um ou outro se realize igual soma das probabilidades de que cada um deles
se realize:
! = !1 " !2
Exemplo: lanamos um dado. A probabilidade de se tirar o 3 ou o 5 :
p = 1/6 + 1/6 = 2/6 = 1/3
Se dois eventos A e B no forem mutuamente exclusivos, a probabilidade de
ocorrer A ou B dada por:
P(A ou B) = P(A) + P(B) - P(AB)
AB significa A e B, ou seja, P(AB) = P(A) . P(B)
Exemplo: ao retirar uma carta de um baralho de 52 cartas, qual a probabilidade da
carta ser um s ou carta de ouros?
P(s) = 4/52 = 1/13 P(ouros) = 13/52 = 1/4
P(s de ouros) = 1/13 * 1/4 = 1/52
P(s ou ouros) = 1/13 + 1/4 - 1/52 = 16/52
,ro5a5i!idade condicionada
Sejam A e B dois eventos associados ao experimento E. Denotaremos por P(B/A) a
probabilidade condicionada do evento B, quando A tiver ocorrido.
Sempre que calculamos P(B/A), estaremos essencialmente calculando P(B) em
relao ao espao amostral reduzido A, em lugar de faz-lo em relao ao espao
amostral original S.
Exemplo: dois dados equilibrados so lanados, registrando-se o resultado.
Considere os eventos:
A = soma igual a 10
B = resultado do primeiro dado maior que o resultado do segundo
Calcular a probabilidade de ocorrer B, sabendo que ocorreu A.
Resoluo: O espao amostral :
S = { (1,1) (1,2) (1,3) (1,4) (1,5) (1,6)
(2,1) (2,2) (2,3) (2,4) (2,5) (2,6)
(3,1) (3,2) (3,3) (3,4) (3,5) (3,6)
(4,1) (4,2) (4,3) (4,4) (4,5) (4,6)
(5,1) (5,2) (5,3) (5,4) (5,5) (5,6)
(6,1) (6,2) (6,3) (6,4) (6,5) (6,6) }
Os eventos so:
A = { (4,6) (5,5) (6,4) } B = { (6,4) }
Observe que aqui usamos o evento A para espao amostral de B.
Assim, P(B/A) = 1/3
Poderamos tambm calcular a probabilidade de ocorrer A sabendo que ocorreu B.
Nesse caso, primeiro construmos o evento B.
35
35
B = { (2,1) (3,1) (4,1) (5,1) (6,1) (3,2) (4,2) (5,2) (6,2) (4,3) (5,3) (6,3) (5,4)
(6,4) (6,5) }
A = { (6,4) }
Assim, P(A/B) = 1/15
Exerccios resolvidos
1) Qual a probabilidade de sair um rei quando retiramos uma carta de um baralho
de 52 cartas?
R: como h 4 reis, o nmero de elementos do evento 4, logo p = 4/52 = 1/13
2) Em um lote de 12 peas, 4 so defeituosas. Sendo retirada uma pea, calcule:
a) a probabilidade de essa pea ser defeituosa.
R: temos p = 4/12 = 1/3
b) a probabilidade de essa pea no ser defeituosa.
R: este evento e o anterior so complementares, logo: p = 1 - 1/3 = 2/3
3) Lanando dois dados, calcule a probabilidade de se obter soma igual a 5.
R: O evento formado pelos elementos (1,4), (2,3), (3,2) e (4,1). Como o nmero
de elementos de S 36, temos: p = 4/36 = 1/9
4) Qual a probabilidade de sair uma figura quando retiramos uma carta do
baralho?
R: prei=4/52 = 1/13 ; pdama = 1/13 ; pvalete=1/13
Sendo os eventos mutuamente exclusivos, temos: p = 1/13 + 1/13 + 1/13 = 3/13
E3erccios
1) De dois baralhos de 52 cartas retiram-se, simultaneamente, uma carta do
primeiro baralho e uma carta do segundo. Qual a probabilidade de a carta do
primeiro baralho ser um rei e a do segundo ser o 5 de paus?
2) Um urna A contm: 3 bolas brancas, 4 pretas, 2 verdes; uma urna B contm: 5
bolas brancas, 2 pretas, 1 verde; uma urna C contm: 2 bolas brancas, 3
pretas, 4 verdes. Uma bola retirada de cada urna. Qual a probabilidade de
as trs bolas retiradas da primeira, segunda e terceira urnas serem,
respectivamente, branca, preta e verde?
3) De um baralho de 52 cartas, retiram-se ao acaso duas cartas sem reposio.
Qual a probabilidade de a primeira carta ser o s de paus e a segunda ser o
rei de paus?
4) Qual a probabilidade de sair uma carta de copas ou ouros quando retiramos
uma carta de um baralho de 52 cartas?
5) No lanamento de um dado, qual a probabilidade de se obter um nmero no
inferior a 5?
6) Dois dados so lanados ao mesmo tempo. Determine a probabilidade de a
soma ser 10 ou maior que 10.
7) Lana-se um par de dados. Aparecendo dois nmeros diferentes, encontre a
probabilidade de que:
a) a soma seja 6;
b) o 1 aparea;
c) a soma seja 4 ou menor que 4.
36
36
8) Um casal planeja ter trs filhos. Determine a probabilidade de nascerem:
a) trs homens;
b) dois homens e uma mulher.
9) Numa caixa com 40 moedas, 5 apresentam duas caras, 10 so normais (cara e
coroa) e as demais apresentam duas coroas. Uma moeda retirada ao acaso e a
face observada mostra uma coroa. A probabilidade de a outra face desta moeda
tambm apresentar uma coroa :
a) 7/8 b) 8/7 c) 5/8 d) 3/5 e) 3/7
10) Na prova de Lngua Estrangeira de um concurso, 60% dos candidatos optaram
por Ingls e os demais, por Espanhol. Destes, 5% foram classificados e daqueles,
10% foram classificados. Escolhendo-se ao acaso um candidato classificado, qual
a probabilidade de ele haver optado por Ingls?
a)0,06 b) 0,40 c) 0,50 d) 0,60 e) 0,75
11) Em um jogo de cara-ou-coroa, foram realizados dois lances independentes de
uma moeda no viciada. Sabe-se que pelo menos um dos resultados foi cara.
Assim sendo, a probabilidade de que os dois resultados tenham sido cara :
a) 1/4 b) 1/3 c) 1/2 d) 2/3 e) 3/4
37
37

You might also like