You are on page 1of 21

UNIVERSIDADE DO CONTESTADO – UnC

CURSO DE SISTEMAS DE INFORMAÇÃO

PROBABILIDADE E ESTATÍSTICA
2a PARTE

PROFa ARLENE GUAREZI P. DE OLIVEIRA

CONCÒRDIA
ABRIL /2007
2

1 GRÁFICOS

1.1 INTRODUÇÃO

A organização e descrição de dados podem ser feitas por meio da


construção de gráficos e tabelas. Os gráficos assumem papel fundamental em qualquer
campo da ciência.
O gráfico pode retratar fases históricas nas análises de situações atuais e até
mesmo nas previsões futuras.
Sua utilização na estatística é de suma importância, visto que, praticamente, todo
e qualquer relatório analítico vem acompanhado de gráficos ilustrativos. Isto facilita a
interpretação rápida do fenômeno que ora se analisa.
Mas, para esta afirmação se torne válida, é necessário seguir certas normas para
elaboração correta e precisa deles. Se assim não se fizer, poder-se-á ter uma visão
distorcida, ou mesmo errônea, do fenômeno estudado.
Basicamente, devemos levar em consideração três características para a construção de
um gráfico: simplicidade, clareza e veracidade.

1.2 DESCRIÇÃO GRÁFICA DE VARIÁVEIS QUALITATIVAS

Os gráficos de colunas e barras (horizontais e verticais) e também os em forma


de pizza são os gráficos mais comuns para a descrição de dados oriundos de variáveis
qualitativas. Basicamente eles mostram as freqüências de observações para cada nível,
ou categoria, da variável que se deseja escrever.

Exemplo 1:
Vamos construir os gráficos de colunas, barras e de pizza para os dados da seguinte
tabela.
Tabela 1.1 Automóveis nacionais mais vendidos: janeiro/agosto de 2004

Veículos Quantidades Vendidas

Gol 166.158
Uno 58.556
Palio 86.776
Astra 22.006
Corsa 66.065
Vectra 23.162
Palio Weekend 18.997
Fiesta 24.586
Corsa Sedan 55.334
Parati 18.765

Fonte: Jornauto, São Paulo, agosto 2004


3

Quantida

180.000

160.000

140.000

120.000
Quantidades Vendidas

100.000

Parati
80.000

Corsa Sedan
60.000

Fiesta
40.000

Palio Weekend
20.000
Qu
0 Vectra
Veiculos

Gol Uno Palio Astra C


Corsa
3%

Astra 10% Q

Palio
5%
Uno
4

1.3 DESCRIÇAÕ GRÁFICA DE VARIÁVEIS QUANTITATIVAS

Os histogramas são os gráficos mais adequados para a descrição de dados


oriundos de variáveis quantitativas. Basicamente, eles mostram as freqüências de
observações para cada valor ou conjunto de valores da variável que se deseja descrever.
Com base em uma tabela de distribuição de freqüências é construído o histograma –
trata-se de uma representação gráfica adequada para o tratamento de conjuntos de dados
quantitativos com elevada quantidade de elementos.

Tabela 1.2 Idades de 50 funcionários da empresa XPTO


Intervalos das
Classes Classes fi fri Fi Fri xi
1 [18 ; 25 [ 6 0,12 6 0,12 21,5
2 [25 ; 32[ 10 0,20 16 0,32 28,5
3 [32 ; 39[ 13 0,26 29 0,58 35,5
4 [39 ; 46[ 8 0,16 37 0,74 42,5
5 [46 ; 53[ 6 0,12 43 0,86 49,5
6 [53 ; 60[ 5 0,10 48 0,96 56,5
7 [60 ; 66[ 2 0,04 50 1,00 63,5
50 1

Fre

14

12

10
Frequência Relativa

6
5

Fre

0,3

0,26

0,25

1.3.1 DESCRIÇAÕ GRÁFICA DE VARIÁVEIS QUANTITATIVAS


CONTÍNUAS
0,20
Os gráficos lineares é um dos gráficos mais adequados para a descrição de
dados oriundos0,2
de variáveis quantitativas contínuas.
Tabela 3 Produção de Pneumáticos – 1997/2002 – Brasil
Anos Pneumáticos (1000 peças)
1997 9.393
1998 10.710
1999 13.466
0,152000
fri

16.238
2001 16.704
2002 19.149
0,12

0,1
Produção de P

0,05
25.000

0
20.000 [18 ; 25[ [25 ; 32[ [32 ; 3
0 peças)

15.000
6

2 MEDIDAS DE POSIÇÃO OU TENDÊNCIA CENTRAL

2.1 INTRODUÇÃO
De um modo geral, qualquer conjunto de dados estatísticos – agrupados ou não
-, dependendo do estudo a que se propõe, ocupa uma posição específica dentro de uma
distribuição. As medidas de tendência central dão valor do ponto em torno do qual os
dados se distribuem.
Vejamos a seguir o cálculo das medidas de posição ou de tendência central. Elas
representam os conjuntos de dados pelos seus valores médios, em torno dos quais esses
dados tendem a concentrar-se.
Essas medidas são:
a) Medidas de tendência central.
b) Medidas de dispersão.
As primeiras mostram a magnitude (por um valor central e um valor médio) e as
segundas mostram variações ou concentrações dos dados em torno daquele valor.
Primeiramente, vamos estudar as principais medidas de tendência central, assim
subdivididas:
1. Média (aritmética, ponderada).
2. Mediana.
3. Moda
2.2 MÉDIA ARITMÉTICA ( x )
É uma das principais medidas de posição, cuja aplicação é seguramente a mais
usada, sendo que podem ser simples (dados não agrupados em classe) e ponderadas
(dados agrupados em classe)
2.2.1 Média Aritmética simples ( x )
A média aritmética simples de um conjunto de números é igual ao quociente
entre a soma dos valores do conjunto e o número total de valores.
Genericamente podemos escrever:

n
x = ∑
i =1
xi , onde x1 = valor genérico da observação
n n = nº de observação
Exemplo:
a) Durante um determinado mês de verão, os nove vendedores de uma firma de
calefação central e ar-condicionado venderam os seguintes números de unidades de ar-
condicionado centra: 8, 11, 5, 14, 8, 11, 16, 11, 16 considerando este mês como uma
população estatística de interesse, o nº médio de unidades vendidas é:
8
x = ∑xi
i =1
= 8 + 11 + 5 + 14 + 8 + 11 + 16 + 11 + 16 = 100

n 9 9
x = 11 unidades

2.2. 2 Média Aritmética Ponderada

A média aritmética é considerada ponderada quando os valores do conjunto


tiverem pesos diferentes. Tratando-se de média simples, todos os valores apresentam
7

igual peso. Obtém-se uma média aritmética ponderada através do quociente entre o
produto dos valores da variável pelos respectivos pesos e a soma dos pesos.
Assim, por exemplo, um professor pode realizar quatro provas por ano em sua
matéria, atribuindo a cada uma delas os seguintes pesos: 1, 2, 3, 4. Se um aluno tiver
recebido as notas 8, 7; 9 e 9, nessa ordem, sua nota final será a média aritmética
ponderada 8,5, obtida da seguinte maneira:
Média Final = (8 x 1) + (7 x 2) + (9 x 3) + (9 x 4) = 8 + 14 + 27 + 36 = 85 = 8,5
1+2+3+4 10 10

Para o cálculo da média aritmética ponderada utilizaram uma tabela que facilita
em muito a visualização dos valores.
Tabela 4
xi fi xi fi
1 2 1x2=2
2 2 2x2=4
3 3 3x3=9
5 3 5 x 3 = 15
4 4


i =1
fi = 10 ∑
i =1
xi fi = 30
4

∑ xi fi
X = n =1
= 30 = 3,0
4

∑ i =1
fi 10

2.2.2.1 Média aritmética para dados contínuos (ponderada)


É definido como sendo o quociente entre a soma dos produtos das freqüências,
pelos pontos médios de cada classe, e a soma de todas as freqüências. Assim,
n


i =1
fi Pmi
X = n

∑ i =1
fi

Ex: Tomemos a tabela abaixo, relativa as estaturas dos alunos da UnC – Ano 2001:
Estaturas (cm) Nº de alunos (fi) FiPmi = xi fiPmi
150 |---- 156 5 153 765
156 |---- 162 4 159 636
162 |---- 168 19 165 3.135
168 |---- 174 18 171 3.078
174 |---- 180 14 177 2.478
180 |---- 186 12 183 2.196
186 |---- 192 4 189 756
7 7


i =1
fi = 76 ∑
i =1
fi Pmi = 13.044
8

7
= ∑
i =1
fi Pmi
X = = 13.044 ≅ 171,63 cm
7 76

i =1 fi

Exercícios propostos
1) Calcule a média aritmética da série:
(a) X: 1, 2, 8, 10, 12, 16, 21, 30.
(b) Y: 5, 6, 6, 10, 11, 11, 20.
A seguir é dada a distribuição da quantidade de defeitos por microcomputador para uma
amostra de 100 aparelhos.

Quantidade de defeitos por micro 0 1 2 3 4 5 6


Números de aparelhos 15 28 20 14 10 7 6

2) Um produto é acondicionado em lotes contendo cada um deles 10 unidades. O lote só


é aprovado se apresentar um peso superior a 40 quilos.
Se as unidades que compõem determinado lote pesam: 3; 4; 3,5; 5,0; 3,5; 4; 5; 5,5;
4;5, este lote será aprovado? Qual o peso médio do produto?

3) Uma loja vende cinco produtos básicos A, B, C, D, E. O lucro por unidade


comercializada destes produtos vale respectivamente R$ 200,00; R$ 300,00; R$
500,00; R$ 1.000,00; R$ 5.000,00. a loja vendeu em determinado mês 10; 30; 20;
10; 5 unidades respectivamente. Qual foi o lucro médio por unidade comercializada
por esta loja?

4) Um caminhão cujo peso vazio é 3.000Kg será carregado com 480 caixas de 10 kg
cada, 350 caixas de 8kg cada, 500 caixas de 4 kg cada e 800 caixas de 5kg cada. O
motorista do caminhão pesa 80 kg e a lona de cobertura da carga pesa 50 kg. (a) Se
este caminhão tem que passar por uma balança que só permite passagens a
caminhões com peso máximo de 15 toneladas, este caminhão passará pela balança?
(b) Qual o peso médio das caixas carregadas no caminhão?

5) Calcule o número médio de acidentes por dia em uma determinada esquina.


Nº de acidentes Nº de dias
por dia: xi fi
0 30
1 5
2 3
3 1
4 1

6) O salário de 40 funcionários de um escritório está distribuído segundo o quadro


abaixo. Calcule o salário médio destes funcionários.
9

Classes Salários $ Nº de funcionários


fi
1 400,00 |---- 500,00 12
2 500,00 |---- 600,00 15
3 600,00 |---- 700,00 8
4 700,00 |---- 800,00 3
5 800,00 |---- 900,00 1
6 900,00 |---- 1.000,00 1

7) Uma imobiliária gerencia o aluguel de residências particulares, segundo o quadro


abaixo:
Classes Aluguel $ Nº de casas
fi
1 0 |---- 200,00 30
2 200,00 |---- 400,00 52
3 400,00 |---- 600,00 28
4 600,00 |---- 800,00 7
5 800,00 |---- 1.000,00 3
Calcule o aluguel médio para essas residências.

2. 3 MEDIANA (Md)

Mediana é um valor central de um rol, ou seja, a mediana de um conjunto de


valores ordenados (crescente ou decrescente) é a medida que divide este conjunto em
duas partes iguais, cuja valor está sucedido de 50% e antecedido 50% desse conjunto de
observações.

2.3.1 Cálculo da mediana – variável discreta

Dado um conjunto qualquer de valores, o primeiro passo é ordenar estes valores.


Isto poderá ser feito tanto em ordem crescente quanto decrescente. E, como segundo
passo, verificar se o número de elementos que compõe este conjunto é par ou ímpar.
Se o número de elementos for ímpar, o elemento mediano será dado pela seguinte
expressão: Em = N + 1 ,
2

onde, Em = elementos mediano, e N = número de elementos do conjunto. Caso o


número de elementos for par, a medida será dada pela média aritmética, expressa por
N + N + 2
2 2

Exemplo 1: X = { 2, 5, 7, 9, 13, 15, 22 }

Em = 7 + 1 = 4.
2
Md = 9

Exemplo 2: X = {2, 5, 7, 9, 10, 16}


10

Cálculos do elemento mediano

N + N + 2 6 + 6 + 2
2 2 = 2 2 = 3,5
2 2
O valor “3,5” corresponde à posição do elemento mediano dentro deste rol.
Portanto, a mediana corresponde à média aritmética entre os valores centrais 7 e 9,ou
seja ,

7 + 9 = 8 (Mediana)
2

Exemplo 3:
Xi fi Fi
2 2 2
4 5 7
5 8 15
7 6 21
8 4 25
5
∑ fi = 25
i=1

Em = N +1 = 25 + 1 = 13
2 2

Md = 5

Exemplo 4:

Xi Fi Fi
2 5 5
4 4 9
5 6 15
7 8 23
8 3 26
5
∑ fi = 26
i =1

N + N + 2 26 + 26 + 2
Em = 2 2 = 2 2 = 13,5
2 2
Md = 6
2. 3. 2 Cálculo da mediana – variável contínua
11

Em se tratando de cálculo da mediana para variável contínua, independente


se n é par ou impar, devemos:
1o Passo: Calcula-se a ordem n .
2
o
2 Passo : Pela Fi (frequência acumulada) identifica-se a classe que contém a mediana
(classe Md).

3o Passo
Md = li + Em - F(ant) x h
fi classe
Em que:

li = limite inferior da classe mediana


Em = elemento mediano
F(ant) = freqüência acumulada até a classe anterior á classe mediana.
fi classe = freqüência simples ou absoluta da classe mediana.
h = amplitude do intervalo da classe mediana.

Exemplo 1: Dada a distribuição amostral, calcular a mediana:

Notas da Classe fi Fi
0 |---- 2 27 27
2 |---- 4 16 43
4 |---- 6 34 77
6 |---- 8 17 94
8 |---- 10 16 110
5
∑ fi = 110
i =1

Exemplo 2: Com os dados da distribuição amostral, calcular a mediana.


Intervalo das classes Fi Fi
35 |----45 5 5
45 |----55 12 17
55 |----65 18 35
65 |----75 14 49
75 |----85 6 55
85 |----95 3 58
∑ 58

Exercícios :
1) Calcule a mediana da seqüência :
a) X: 2 ,5, 8, 10, 12, 15, 8, 5, 1
b) Y: 3,4; 5,2; 4,7; 6; 8,4; 9,3; 2,1; 4,8
c) Interprete os valores obtidos.

2) Calcule a mediana da distribuição.


12

xi fi
2 5
4 20 3) Calcule a mediana da distribuição do número
5 32 de acidentes por dia, observando em determinado
6 40 cruzamento , durante 40 dias.
8 2
No de acidentes por dia Número de dias
0 30
1 5
2 3
3 1
4 1

4) O consumo de energia elétrica verificada em 250 residências de família da classe


média, com dois filhos, revelou a distribuição.
Classes Consumo Kwh No de famílias
1 0 │------ 50 2
2 50 │------- 100 15
3 100 │-------150 32
4 150 │------- 200 47
5 200 │------- 250 50
6 250 │------- 300 80
7 300 │------- 350 24

a) Calcule a mediana da distribuição


b) Interprete o valor obtido.

2.4 QUARTIS

Os quartis dividem um conjunto de dados em quatro partes iguais. Assim:

0% 25% 50% 75% 100%


│----------------------│---------------------│----------------------│----------------------│
Q1 Q2 = Md Q3

Q1 = 1o quartil, deixa 25% dos elementos.


Q2 = 2o quartil, coincide com a mediana, deixa 50% dos elementos.
Q3 = 3o quartil, deixa 75% dos elementos.

2.4.1 Cálculos para os quartis – variável discreta

2.4.1.1 Quando o número de observações for par

A posição do elemento quartil o conjunto ordenado é identificado pela seguinte


expressão:
Eqi = i( N +1) , onde,
4
13

Eqi = posição do elemento desejado, i = { 1,2,3 } e N = número de observações

Exemplo1: Dado o conjunto X = { 10, 12, 12, 16, 20, 23, 25, 28 }, calcular o primeiro
quartil ( Q1 ) e o terceiro ( Q3 ).
Eqi = 1. (8 +1) = 9 = 2,25 ( posição do 1o elemento quartil no conjunto )
4 4

Q1 = 12

Eq3 = 3( 8 +1 ) = 27 = 6,75 ( posição do 3o elemento quartil no conjunto)


4 4

O 3o quartil Q3 = 24,5
Ou seja, o conjunto X, a 6o posição corresponde ao valor 1o ao 3o posição
corresponde ao valor 25. Portando, a posição 6,75 corresponde a 75% da diferença
entre os valores 25 e 23, cujo resultado é adicionado ao valor que ocupa a 6a posição,
assim,
25 – 23 = 2 x 0,75 = 1,5 ; Logo,
Q3 = 23 + 1,5 = 24,5

Exemplo 2: Determinar a faixa salarial (distância que vai do 1o ao 3o quartil) de 6


funcionários de certa Empresa, que ocupam o mesmo cargo. Salários: R$ 5.500,00; R$
5.780,00; R$ 6.120,00; R$ 6.150,00; R$ 6.620,00; R$ 7.120,00.

Exemplo3:
Sendo:

Salário (R$) N o de funcionários (fi)


2.300,00 3
3.200,00 5
4.600,00 4
5.785,00 3
6.890,00 1
5
∑ fi = 16
i=1
Calcular a fixa salarial .

2.4.1.2 Quando o N º de observações for impar.

Exemplo1: Dados X = { 185, 196, 207, 305, 574, 597, 612 . Calcular o primeiro quartil
(Q1) e o terceiro quartil (Q3).
Eqi = i( N +1)
4

Exemplo2:
Dado:
Idades (anos) N º de observações (fi)
20 10
23 26
14

25 8
29 4
32 3
35 3
36 1
7
∑ fi = 55
i=1
Calcular a faixa de idade (Q1 a Q3)

2.4.1.3 Cálculos para os quartis – variável contínua

Determinação do 1o quartil:
o
1 passo: Calcular-se a ordem n
4
2o passo: Identifica-se a classe Q1 pela fi.

3o passo: Aplica-se a fórmula:

n - F(ant) xh
4
Q1 = lQ1 + -------------------------------------------
fQ1

Determinação do 3o quartil:
1o passo: calcula-se a ordem 3n
4
2o passo: Identificar-se a classe Q3 pela fi.

3o passo: Aplica-se a fórmula

3n - F(ant) xh
4
Q3 = lQ3 + -------------------------------------------
fQ3

Exemplo 1: Dada a distribuição, determinar os quartis ( Q1 e Q3 ) e mediana.


Classes fi Fi
7 │------- 17 6 6
17 │------- 27 15 21
27 │------- 37 20 41
37 │------- 47 10 51
47 │------- 57 5 56
∑ 56

Exercícios
1) Calcule o primeiro e o terceiro quartis da distribuição de freqüência abaixo:
Custos 450│----- 550 │-----650 │----- 750 │-----850 │-----950│-----1050│----- 1150
fi 8 10 11 16 13 5 1
15

2) Dada a série X: 3, 15, 6, 9, 10, 4, 12,15, 17, 20, 29, calcule:


a) Q1 b) Q2 c) Q3

3)A distribuição de freqüência abaixo representa idade de 50 alunos de uma classe de


primeiro ano de faculdade.
Idade No de alunos
17 3
18 18
19 17
20 8
21 4
Calcule:
a) Q1 b) Q3

4 . 5 Moda (Mo)

Dentre as principais medidas de posição, destaca-se a Moda. É o valor


mais freqüente da distribuição. Para distribuição simples (sem agrupamento em classes), a
identificação da Moda é facilitada pela simples observação de elementos que apresenta
maior freqüência. Assim, para a distribuição:

xi 243 245 248 251 307

fi 7 17 23 20 8

A moda será 248. Indica-se: Mo = 248

Para dados agrupados em classes (variáveis contínuas), há diversas fórmulas


para o cálculo da Moda. Destacamos o cálculo da moda por meio da fórmula de Czuber.

1o Passo: Identifica-se a classe modal (classe com maior freqüência).

2o Passo: Aplica-se a fórmula:


Mo = lM o + ∆1 . h
∆1 +∆2

em que: lM o = limite inferior da classe modal


∆ 1 = diferença entre a freqüência da classe modal e a frequência
imediatamente anterior
∆ 2 = diferença entre a freqüência da classe modal e a frequência
imediatamente posterior
h = amplitude da classe modal

Exemplo 1: Determinar a moda para a distribuição:

Classes 0 │----- 1 1 │----- 2 2 │----- 3 3 │----- 4 4│----- 5 ∑

fi 3 10 17 8 5 43

1o Passo: Identifica-se a classe modal. No caso, trata-se da 3a classe: 2 │----- 3.


16

2o Passo: Aplica-se a fórmula, onde:


Mo = lM o + ∆1 . h
∆1 +∆2

Exemplo 2: Calcular a moda para a distribuição:

Salários (US$) 80 │----- 180 180 │----- 250 250 │----- 300 300 │----- 500

No de empregados 70 140 140 60

Observe que as amplitudes das classes não são iguais. Nesse caso, é preciso calcular as
densidades das classes: fi ÷ h, para identificar qual classe modal (aquela com maior
densidade). Assim:

Salários (US$) fi fi / h

80 │----- 180 70 70 / 100 = 0,7

180 │----- 250 140 140 / 70 = 2,0

250 │----- 300 140 140 / 50 = 2,8

250 │----- 300 60 60 / 200 = 0,3

1o Passo: Identifica-se a classe modal. No caso, trata-se da 3a classe: 250│----- 300.

2o Passo: Aplica-se a fórmula, onde:

Exercícios

1) Desejando lançar uma nova pasta dental, uma indústria pesquisou sobre os valores
cobrados por nove marcas concorrentes e obteve os seguintes valores, em reais: 1,12;
1,00 ;1,07; 1,18; 1,60;1,90;0,92;2,02;1,70;1,12. Calcule a média aritmética, a moda e a
mediana.

2) Para uma amostra de clientes de um pequeno mercado, foram observados os


seguintes montantes de vendas, ordenados em ordem crescente:$ 0,10; 0,10; 0,25; 0,25;
0,25; 0,35; 0,40; 0,53; 0,90; 1,25; 1,35; 2,45; 2,71; 3,09; 4,10.
Determinar:
a) a média
b) a mediana
c) a moda para esses valores de venda

3) A seguir, temos a distribuição do número de acidentes diários, durante 53 dias, em


certa rodovia:
No de acidentes 0 1 2 3 4
17

No de dias 20 15 10 5 3

Pede-se:
a) Determinar a média.
b) Determinar a mediana.
c) Calcular a moda.
d) Qual a porcentagem de dias em que tivemos dois ou mais acidentes por dia?

4) Sendo:
Idade 10│--- 14 10│--- 14 10│--- 14 10│--- 14 10│--- 14 10│--- 14 10│--- 14 10│--- 14
(anos)
No de 15 28 40 30 20 15 10 5
pessoas

3 MEDIDAS DE DISPERSÃO OU DE VARIABILIDADE

3.1 INTRODUÇÃO

São mediadas estatísticas utilizadas para avaliar o grau de variabilidade, ou


dispersão, dos valores em torno da média. Servem para medir a representatividade da
media.

Dispersão

_______________________________________________
x

Sejam as séries: (a ) 20, 20, 20 (b) 15, 10, 20, 25, 30


Tem –se: x a = 20 e x b = 20

Observe: apesar de as séries terem médias iguais, a série a não apresenta dispersão em
torno da média: x a = 20, enquanto os valores da série b apresentam dispersão em
torno da média: x b = 20. Nesta seção são apresentadas medidas estatísticas que
avaliam o grau de dispersão, ou variabilidade, de uma variável.

3.2 AMPLITUDE TOTAL

É uma medida de dispersão dada pela diferença entre o maior e o menor valor da série.
R = xmáx – x mín
Exemplo: Para a série: 10, 12, 20, 22, 25, 33, 38

R = 38 – 10 = 28
A utilização da amplitude total como mediada de dispersão é limitada, pois,
sendo uma medida que depende apenas dos valores externos, não capta possíveis
variações entre esses limites.
]
18

3.3 DESVIO MÉDIO: (dm)


Considerando que num conjunto de dados cada valor apresenta em relação à
média aritmética um afastamento, o desvio médio será a média aritmética destes
afastamentos, levando-se em conta os valores absolutos desses desvios.
Fórmula: dm = ∑ |x – x |
n
Exemplo 1: Para o conjunto de observações, calcular o desvio médio.
{2, 5, 11, 14, 25}

Exemplo 2: A tabela mostra o total de pontos obtidos por dois times de futebol no
período de 1996 a 2000.
1996 1997 1998 1999 2000
TIME A 7 12 20 16 10
TIME B 18 16 15 9 12
a) Qual o desvio médio de cada um desses times?
b) Qual o time mais regular nesse período?

3.4 VARIÂNCIA AMOSTRAL

Como se deseja medir a dispersão dos dados em relação à média, é interessante


analisar os desvios de cada (xi) em relação à média x isto é di = (xi - x ).
Se os di forem baixos, teremos pouca dispersão, ao contrário, se os desvios forem
altos, teremos elevada dispersão. É fácil constatar que a soma dos desvios em torno da
média é zero. Isto é: ∑di = 0. Para o cálculo da variância consideram-se os quadrados
dos desvios: di2.

A variância, S2, de uma amostra de n medidas é igual à soma dos quadrados dos
desvios: ∑d2i , dividida por (n - 1), assim:

S2 = ∑ d2 = ∑( xi – x )2
n–1 n–1
para dados agrupados , tem-se:

S2 = ∑ di2 Fi = ∑( xi – x )2. Fi
n–1 n–1

Desenvolvendo-se o quadrado das diferenças: (xi - x )2, somando-se os termos


comuns, encontram-se as seguintes fórmulas práticas para o cálculo da variância
amostral:

S2 = 1 ∑x2i – ( ∑xi )2
n–1 n
Quando maior o valor de S2, maior a dispersão dos dados amostrais.

Exemplo 1: Calcular a variância para as medidas amostrais: 3, 7, 2, 1, 8.


19

Solução: Vamos determinar S2 pela fórmula básica. Para tanto, é interessante a


construção da seguinte tabela:

xi di = (xi - x ) di2 = (xi - x )2


3 (3 - 4,2) = -1,2 1,44
7 2,8 7,84
2 -2,2 4,84
1 -3,2 10,24
8 3,8 14,44
∑ 21 0 38,80

A média amostral será: x = ∑ xi = 21 = 4,2


n 5
Logo, a variância amostral será:

S2 = ∑ ( xi – x )2 = 38,80 = 9,7
n -1 4

Agora, vamos determinar S2 pela aplicação da fórmula prática. Para tanto, é


interessante a construção da seguinte tabela:

xi x2i
3 9
7 49
2 4
1 1
8 64
∑21 127

Então, a variância amostral será:

S2 = 1 ∑x2i – ( ∑xi )2 = = 1 [ 127 – ( 21 )2 ] = 9,7


n–1 n 4 5

3.5 DESVIO PADRÃO AMOSTRAL

Como explicado no item acima, o cálculo da variância é obtido pela soma dos
quadrados dos desvios em relação à media. Assim é que, se a variável sob análise for
medida em metros, a variância deverá ser expressa em m2 ( metros ao quadrado). Ou
seja, a variância é expressa pelo quadrado da unidade de medida da variável que está
sendo estudada. Para melhor interpretar a dispersão de uma variável, calcula-se a raiz
quadrada da variância, obtendo-se o desvio padrão que será expresso na unidade da
mediada original. Assim:

S = √ S2

O desvio padrão das cincos medidas amostrais do exemplo 1 acima é dado por:
20

S = √S2 = √9.7 = 3,1

Exemplo 2: As velocidades máximas das cinco voltas dadas em um teste de fórmula 1,


em Km/h foram: 190; 196; 204 e 202. Nessas condições, determine:
a) a média das velocidades;
b) a variância
c) o desvio padrão.

Exercícios:
1) Calcular a variância e o desvio padrão da seguinte distribuição amostral:
xi 5 7 8 9 11
fi 2 3 5 4 2

2) A tabela a seguir mostra o número de votos por classe de dois candidatos que estão
concorrendo a uma vaga para o centro acadêmico do curso.

Fases/ 1a fase 3a fase 5a fase 7a fase 8a fase 9a fase


Candidatos
Vítor 12 15 12 16 14 15
Rafael 12 11 18 9 19 15

a) Calcular o desvio padrão de cada um desses candidatos.


b) Qual dos dois candidatos é o mais regular?

3. 6 COEFICIENTE DE VARIAÇÃO (C.V)

Em trabalhos experimentais, através deste parâmetro, comprovamos a precisão


alcançada, embora não seja apenas esta a sua finalidade. Este coeficiente é expresso em
percentagem, sendo utilizado em trabalhos científicos. É calculado utilizando–se a
fórmula:

C.V = s. 100 s - desvio padrão


x x - média aritmética

Verificamos, portanto, o que é a relação existente entre o desvio padrão e a


média aritmética. Quanto maior a for a dispersão no conjunto de observações, maior
será o seu valor. Até 10%-- ótimo; de 11% a 20%-- bom; de e 21% a 30% -- regular.
Exemplo: considerando-se a amostra abaixo, conclui-se que, neste caso o nível de
dispersão --20%--é bom.
x = 40 e s = 8

C.V = 8 .100
x
C.V = 8 . 100 = 20%
40
21

Exercícios:
1) Determine a média aritmética e o desvio padrão e o coeficiente de variação
dos valores apresentados na tabela seguinte:

xi 2 3 4 5 6 7
fi 5 10 15 12 5 3

2) O quadro mostra a distribuição das idades de 400 funcionários de uma empresa.


Classes f;
20 │--- 25 14
25 │--- 30 80
30 │--- 35 46
35 │--- 40 120
40 │--- 45 100
45 │--- 50 32
50 │--- 55 8

Nessas condições, calcule:


a) a média das idades
b) o desvio padrão
c) o coeficiente de variação

2) O quadro nos mostra o número de defeitos por carro de uma determinada


marca, numa frota de 40 carros

Defeito por carro Freqüência


xi fi
0 6
1 9
2 7
3 4
4 9
5 5
Nessas condições determine:
a) a média aritmética
b) o desvio padrão
c) a variância
d) C.V

You might also like