Professional Documents
Culture Documents
Estatstica Descritiva
2
Definio de Estatstica
3
reas da Estatstica
4
ESTATSTICA DESCRITIVA
5
PROBABILIDADE
6
INFERENCIA ESTATISTICA
7
Etapas da Analise
Estatstica
8
AMOSTRAGEM
Uma rea importante em muitas aplicaes Estatsticas a da Tecnologia de
Amostragem.
Exemplos de Aplicao:
Pesquisa de mercado,
Pesquisa de opinio,
Avaliao do processo de produo,
Praticamente em todo experimento.
9
Amostragem Aleatria
Cada elemento da populao tem a
mesma chance de ser escolhido.
Amostragem Estratificada
Classificar a populao em, ao
menos dois estratos e extrair uma
amostra de cada um.
Amostragem Sistemtica
Escolher cada elemento de ordem k.
10
Amostragem por Conglomerados
Dividir em sees a rea populacional,
selecionar aleatoriamente algumas dessas
sees e tomar todos os elementos das
mesmas.
Amostragem de Convenincia
Utilizar resultados de fcil acesso.
11
Exemplo 1
12
Na eleio Presidencial
Os Institutos de Pesquisa de opinio
colhem periodicamente amostras de
eleitores para obter as estimativas de
inteno de voto da populao. As
estimativas so fornecidas com um valor e
uma margem de erro.
O quadro do Instituto Toledo &
Associados, a seguir refere-se inteno
de voto no 1 turno das eleies para o
governo em 2002.
13
Inteno de voto para presidente do Brasil-2002
Voto estimulado,em % do total de votos.A ultima pesquisa
ouviu 2.202 eleitores- Margem de erro de 2,09%
4 6 ,3 %
3 4 ,9 % 4 0 ,5 %
L u la (P T ) 3 4 ,3 %
3 3 ,6 %
2 2 ,8 % 2 3 ,3 %
S e rr a ( P S D B ) 1 7 ,6 %
1 3 ,8 % 1 4 ,8 %
1 3 ,8 % 1 2 ,1 %
C iro (P P S )
9 ,0 %
G a ro tin h o (P S B ) 1 2 ,6 % 1 0 ,5 %
1 1 ,3 %
M aio Ju n i o Ju l /A g o S e t/O u t
14
Confronto no segundo turno.
15
Tabela 1.1 Informao do estado civil, grau de instruo, nmero de filhos, idade e procedncia de 36
funcionrios sorteados ao acaso da empresa MB.(Bussab e Morettin)
16
17
Varivel
Qualquer caracterstica associada a uma populao
Classificao de variveis
{
Nominal sexo, cor dos olhos
Qualitativa
Ordinal Classe social, grau de instruo
{
Contnua Peso, altura,salario
Quantitativa
Discreta Nmero de filhos, numero de
carros
18
Medidas Resumo
Variveis Quantitativas
19
Medidas de Posio
Variavel
Ex: 4,5,4,6,5,8,4,4 qualitativa
Mo = 4
20
Mdia
n
x + x + x + ... + x x i
x = 1 2 3 n
= i=1
n n
Ex:2,5,3,7,8
Mdia = [(2+5+3+7+8)/5]=5
21
Mediana
A mediana o valor da varivel que ocupa a
posio central de um conjunto de n dados
ordenados.
Posio da mediana: (n+1)/2
Ex: 2,5,3,7,8
Dados ordenados: 2,3,5,7,8 => (5+1)/2=3
=> Md = 5
Ex: 3,5,2,1,8,6
Dados ordenados:1,2,3,5,6,8 =>
(6+1)/2=3,5 => Md=(3+5)/2=4
22
Percentis
O percentil de ordem px100 (0<p<1), em um
conjunto de dados de tamanho n, o valor da
varivel que ocupa a posio px(n+1) do conjunto
de dados ordenados.
O percentil de ordem p (ou p-quantil) deixa
px100% das observaes abaixo dele na amostra
ordenada.
Casos Particulares:
Percentil 50=mediana, segundo quartil(md,Q2,q(0,5))
Percentil 25= primeiro quartil (Q1), q(0,25)
Percentil 75= terceiro quartil (Q3) , q(0,75)
23
O p-quantil, 0<p<1, pode ser calculado como:
i 0 .5
x (i) , se p = p i = , i = 1,..., n
n
q ( p ) = (1 - f i ) q ( p i ) + f i q ( p i + 1 ), se p i < p < p i + 1
x (1) , se p < p 1
x (n), se p > p n
Onde:
Estatisticas de ordem
p pi i 0.5
f i= , pi =
p i+1 p i n
x ( 1 ) x ( 2 ) x ( 3 ) ...... x (n)
24
Exemplos
Ex(1): 15,5,3,8,10,2,7,11,12
=>n=9
=> ordenamos: 2<3<5<7<8<10<11<12<15
P1=1/18; p2=3/18; p3=5/18; p4=7/18; p5=1/2;
p6=11/18; p7=13/18; p8=15/18; p9=17/18
Posio Md : q(0.5)=8
Posio de Q1: q(0.25)=4,5
Posio de Q3: q(0.75)=11,25
25
Exemplo 2: Considere as notas de um teste de 3 grupos de alunos:
0 10
G1
10
0
G2
0 10
G3
5
Temos : x 1 = x 3 = x 3 = 5 Md 1 = Md 3 = Md 3 = 5
26
Medidas de Disperso
Grupo 1, A=4
Grupo 2, A=8
Grupo 3, A=0
27
Intervalo-Interquartil (d)
Ex(1): 15,5,3,8,10,2,7,11,12
Q1=4,5 e Q3=11,25
d =Q3-Q1=4,9-2,05=2,85
Max,Min,Q1,Q3,Q2: importantes para se ter uma boa ideia da
forma dos dados (simetrica ou assimetrica) e construir box-plots
28
Varincia
n
(x1x)
2
+ (x x) + ...+ (x x)
2
2
n
2
i
(
i=1
x x ) 2
S 2
= =
n 1 n 1
Desvio padro S
29
Clculo da varincia para o grupo 1:
(35)2
+(45)2
+(5 5)2
+(65)2
+(75)2
10
S2 = = =2,5
51 4
G1 : S 2
= 2 ,5 S = 1,58
G2 :S 2
= 10 S = 3,16
G3 :S 2
=0 S =0
30
Coeficiente de Variao (CV)
) uma medida de disperso relativa;
31
Exemplo 4: Altura e peso de alunos
32
ORGANIZAO E REPRESENTAO DOS DADOS
33
Exemplo 1: Considere ao varivel grau de Instruo dos dados da
tabela 1.(Varivel qualitativa)
Tabela de freqncia
Grau de
Contagem fi f ri f ri %
instruo
1o Grau 12 0,3333 33,3%
2o Grau 18 0,5000 50 %
Superior 6 0,1667 16.7%
60,00%
50,00%
50,00%
40,00%
33,33%
30,00%
20,00% 16,70%
10,00%
0,00%
1o Grau 2o Grau Superior
35
Diagrama circular para a variavel grau de instruo
Diagrama circular para a varivel grau de
1oGrau (33.3%)
instruo
Superior
17% 1o Grau
33%
2o Grau
50%
36
2. Organizao e representao de variveis quantitativas
37
Observao 1: A partir da tabela 2.1 podemos recuperar as 20
observao da tabela 1.1, ou seja, aqui no temos perda de
informao dos dados originais.
Mo=2
35%
35
25%
%de funcionrios
25
20%
15%
15
5%
5
0 1 2 3 4 5
Nmero
de filhos
38
Determinao das medidas de posio e medidas de disperso para
variveis quantitativas discretas agrupados em tabela de freqncias:
Mdia: X 1 f1 + X 2 f 2 + L + X k f k
X
i =1
i fi
X = =
n n
( X 1 X ) 2 f1 + ( X 2 X ) 2 f 2 + L + ( X k X ) 2 f k
i =1
(X i X )2 fi
S =
2
=
n 1 n 1
Clculo da varincia para os dados da tabela 2.1
4 ( 0 1, 65 ) 2
+ 5 (1 1, 65 ) 2
+ 7 ( 2 1, 65 ) 2
+ 3( 3 1, 65 ) 2
+ ( 5 1, 65 ) 2
S2 =
19
16,3125
= = 0,858553
19
Desvio padro:
S= S 2 = 0,858553 = 0,927
40
2.2 Quantitativas continuas: Os seus valores podem ser qualquer
nmero real e ainda geralmente existe um grande nmero de
valores diferentes. Como proceder a construir uma tabela de
frequncia nestes casos?
NOTAO: 4,0|----7,0
41
2.2 Procedimento de construo de tabelas de freqncia para
variveis contnuas:
PRIMEIRO INTERVALO :
Limite inferior : LI 1 = MIN
Limite superior : LS 1 = LI 1 + h
42
SEGUNDO INTERVALO :
Limite inferior : LI 2 = LS 1
Limite superior : LS 2 = LI 2 + h
k - SIMO INTERVALO :
Limite inferior : LI k = LS k 1
Limite superior : LS k = LI k + h
43
Ponto mdio (ou marca de classe) de cada intervalo de classe:
LSi + LI i
X =
2
Contagem dos dados pertencentes a cada intervalo.
Freqncias absolutas de cada intervalo de classe.
Freqncias relativas de cada intervalo de classe.
Freqncias acumuladas absolutas de cada intervalo de classe.
i
Fi = f1 + f 2 + L + f i = j =1
f j
Fi
Fri = f r1 + f r2 + L+ f ri = f rj ; ou Fri =
j =1 n
44
Exemplo: Considere a varivel salrio da empresa comercializadora de
produtos de informtica.
Procedimento:
1. Considere k=5.
2. MIN=4; MAX=23,30.
3. A=MAX-MIN=23,30-4=19,30
4. h=19,3/5=3,86
5. h3,9
6. Clculo dos limites de cada intervalo:
PRIMEIRO INTERVALO
LI 1 = 4
LS 1 = 4 + 3 ,9 = 7 ,9
SEGUNDO INTERVALO
LI 2 = 7 , 9
LS 2 = 7 , 9 + 3 , 9 = 11 , 8
Os demais limites dos intervalos foram gerados seguindo o
procedimento anterior.
45
=
(4 + 7,9)
= 5,95; =
(7,9 + 11,8)
= 9,85.....
Ponto mdio:X
1 X 2
2 2
De forma similar obtm-se os outros pontos mdios.
46
Representao grfica:
Histograma de freqncias relativas (em %) para a varivel salrio
33,33%
30 27,78%
%de funcionrios
20 19.44%
16,67%
10
2,7%
0
4.0 7.9 11.8 15.7 19.6 23.5
Salrio
47
til para encontrar os percentis: Exemplo Q2 ou Md
11 ,8 7 ,9 Md 7 ,9
= Md = 10 ,5
33 ,33 % 22 , 22
22.22%
Assimtrica a direita
33,33%
30 27,78%
%de funcionrios
20 19.44%
16,67%
10
2,7%
0
Md
4.0 7.9 11.8 15.7 19.6 23.5
Salrio
48
. Histograma usando densidade de frequncia (mais comum!)
rea=1
7,1%*3,9=27,6
49
Histograma de freqncia acumulada relativa (em %)
80,56%
61,11%
50
27,78%
4 00 56
5 25 73
6 26 66 86
7 39 44 59
8 12 46 74 95
9 13 35 77 80 Valores concentrados entre 4 e 19
10 53 76
11 06 59 Leve assimetria na direo dos valores
12
13
00 79
23 60 85
grandes( assimtrica direita)
14
15
69 71
99
Destaque do valor 23.30
16 22 61
17 26
18 75
19 40
20
21
22
23 30
51
Medidas de posio e medidas de disperso para variveis
contnuas agrupadas em tabela de freqncias.
k
Mdia: X i f i
X f1 + X
f2 + L X
fk i =1
X = 1 2 k
=
n n
Exemplo: Considere a tabela 2.2
5 , 95 10 + 9 ,85 12 + 13 , 75 7 + 17 , 65 6 + 21 , 55 1
X =
36
401,4
= = 11,15
35
Se calculamos a mdia para dados no agrupados apresentadas
anteriormente resulta:
X1 + X +L + X 4 + 4 , 36 + L + 23 , 30
X = 2 36
= = 11,122
36 36
52
Moda (mo): d1
mo = LIi + h
d1 + d 2
i : Classe modal ( aquela classe que tem maior frequncia absoluta (f i ))
LI i : o limite inferior da classe modal.
d 1 = f i f i 1
d 2 = f i f i +1
h : comprimento do intervalo de classe.
Exemplo: Considere a tabela 2.2. TDF
d1 12 10
mo = LI 2 + h = 7,9 + 3,9 = 9,014
d1 + d 2 (12 10) + (12 7)
53
Mediana (Md) 0,5n Fi 1
Md = LI i + h
fi
i : a classe mdiana ( o intervalo de classe onde a coluna dos Fi na TDF
superou o 50% dos dados)
LI i : Limite inferior da classe mediana.
Fi-1 : a frequncia acumulada absoluta da classe anterior a classe mediana
f i : frequncia absoluta da classe mediana.
h : compriment o do intervalo de classe.
Exemplo: Considere a tabela 2.2
0,5n F1 18 10
Md = LI 2 + h = 7,9 + 3,9 = 8,55
f 1 12
54
2
f (X )
k
X
Varincia:
i i
i =1
S2 =
n 1
Exemplo: Considere a tabela 2.2. Vimos que X = 11 ,15
i Intervalos
de classe
Xi fi (
f i X i X )
2
f (X )
5
i
i X
i =1 699,66
S2 = = = 19,99029 S = 4,47105 (Desvio Padro)
36 1 35
55
Esquema dos cinco nmeros
x(1) Q1 Q2 Q3 x(n)
Total Observaes n
Mediana Q2
Quartis Q1 Q3
56
Boxplot
O BOXPLOT representa os dados atravs de um retngulo
construdo com os quartis e fornece informao sobre valores
extremos. (veja o esquema embaixo)
57
Exemplo de construo de um Boxplot. Com a finalidade de
aumentar o peso (em Kg) um regime alimentar foi aplicado em 12
pessoas. Os resultados (ordenados) foram:
-0,7 2,5 3,0 3,6 4,6 5,3 5,9 6,0 6,2 6,3 7,8 11,2.
58
11.2
Observao
exterior
(discrepante
ou atipica)
59
Boxplot de Salrio por educao Boxplot de Salrio por educao
25
3
Salario
Grau Instrucao
15
2
1
5
1 2 3
5 15 25
Grau de Instrucao
Salario
B o x p lo t d e S a l r i o p o r r e g i o d e p r o c e d n c i a
Regio de Procedncia
O u t ro
C a p i ta l
I n t e ri o r
5 15 25
S a la r io
60