You are on page 1of 6

População e Amostra

População: é uma coleção completa de todos os elementos a serem estudados. Ex: conhecer
a altura de todos os habitantes do Brasil.

Amostra: é uma sub-coleção de elementos extraídos de uma população. Ex: conhecer a altura
de um conjunto de habitantes do Brasil.
Quando o estudo trata de dados meteorológicos, temos em mãos uma amostra, pois não
conhecemos a população, devido não haver o registro contínuo dos dados desde a origem do
planeta.

É importante determinar se um conjunto de dados se trata de uma amostra ou de uma


população, pois a metodologia de análise muitas vezes é diferente e, também, as conclusões a
que devemos chegar.

Quando trabalhamos com amostras, os resultados obtidos nos cálculos estatísticos são
utilizados para fazer inferências (generalizações) sobre a população. Vejamos um exemplo:
selecionamos os dados horários de temperatura do ar do verão de 2004 medidos numa cidade
X, com isto teremos uma amostra.

Calculamos a média aritmética deste conjunto e a partir do resultado obtido podemos inferir
que a média da temperatura daquela cidade no verão (no caso todos os verões - população)
corresponde àquele determinado valor.

Distribuição de Freqüências

Quando estamos trabalhando com uma grande quantidade de dados, estes devem ser
organizados de tal forma a facilitar o trabalho do investigador do fenômeno. Se possuímos um
conjunto de dados, por exemplo, de temperaturas médias diárias de uma estação
meteorológica do mês de dezembro de 2004, devemos dispô-los de forma que consigamos
extrair de maneira fácil informações como: maior e menor temperatura, quantos dias tiveram
temperaturas acima ou abaixo de um determinado valor, etc. Para tanto, é elaborada uma
distribuição de freqüências.

A distribuição de freqüências é uma tabela que relaciona categorias ou classes de valores,


juntamente com contagens ou freqüências do número de valores que se enquadram em cada
categoria. A distribuição de freqüências pode ser representada através de um histograma, que
é um gráfico cujas bases são os limites das classes e as alturas são as freqüências.

Abaixo temos uma distribuição de freqüências (tabela 1) juntamente com um histograma (figura
1) da temperatura média diária do mês de dezembro de 2004 da estação meteorológica. Na
tabela o símbolo ├ indica que o limite de classe inclui o valor da esquerda e exclui o da direita.
Elaboração de uma Distribuição de Freqüências

De posse de um conjunto de dados, neste caso, de dados de temperatura média diária do mês
de dezembro de 2004 da estação meteorológica (tabela 2), devemos seguir alguns passos
para a construção de uma distribuição de freqüências.

Passo 1: Ordenar os elementos dos dados brutos em ordem crescente, indicando a freqüência
absoluta de cada elemento.

Dados brutos: dados que ainda não foram numericamente organizados. São as observações.
Freqüência absoluta: número de vezes que um valor aparece num conjunto de dados.
Passo 2: Determinar o número de intervalos de classe (K).

Possibilidade 1:

O número de intervalos de classe pode ser obtido pela regra de Sturges:

K = 1 + 3,3 (log10 n)

onde n é o número total de elementos do conjunto de dados.


K = 1+3,3 (log10 31)
K = 1+3,3 (1,49)
K = 5,9 ≅ 6

Com esta regra, a distribuição de freqüências será constituída de 6 intervalos de classe.

Possibilidade 2:

O número de intervalos de classe também pode ser obtido pela raiz quadrada da quantidade
de dados.

K = √
K ≅ 5,57 ≅ 6

Com esta regra, a distribuição de freqüências será constituída de 6 intervalos de classe.

Passo 3: Determinar a amplitude dos intervalos de classe (h):

[ á −   ]
ℎ =

onde K é o número de intervalos de classe e ximáx e ximin são respectivamente o maior e o menor
valor do conjunto de dados.

[25,1 − 16,1]
ℎ =
6

ℎ = 1,5

Após a obtenção da amplitude dos intervalos de classe (passo 3), basta organizar os dados
conforme a distribuição de freqüências apresentada na tabela 1. Para tanto, pega-se o menor
valor do conjunto de dados e soma-se a amplitude dos intervalos de classe. Então, o primeiro
intervalo da distribuição de freqüências vai do menor valor do conjunto até a soma deste com o
valor da amplitude dos intervalos de classe.

Após verifica-se quantos elementos (freqüências) encontram-se neste intervalo. Este


procedimento é feito tantas vezes conforme indica o cálculo do número de intervalos de classe.

Também pode ser elaborado o histograma da distribuição de freqüências (figura 1).


Medidas de Posição ou Tendência Central

Normalmente, quando estamos estudando um fenômeno, seja ele de qualquer natureza, é


basicamente impossível manipularmos todos os elementos da seqüência de dados, a não ser
que a quantidade seja pequena. Entretanto, é importante sabermos onde os valores da
seqüência se concentram, facilitando assim a análise. A estatística, por sua vez, fornece
medidas que podem caracterizar o comportamento dos elementos de uma série. Essas
medidas são chamadas de medidas de posição ou de tendência central, que na prática,
possibilitam determinar um valor compreendido entre o menor e o maior valor da série
numérica, ou seja, o valor localizado no centro ou no meio de um conjunto de dados. Há
diferentes maneiras de definir o centro de um conjunto de dados, assim, há diferentes
definições de medidas de tendência central como: média, mediana, moda e ponto médio.

Média

Média Aritmética: a média aritmética de um conjunto de dados é o valor obtido somando-se


todos os elementos do conjunto e dividindo-se a soma pelo número total de elementos.

Observe:

onde é a média aritmética, xi os dados do conjunto amostral e n o número de valores.

A média aritmética calculada para os dados fornecidos na tabela 1 corresponde a:

Observação: quando ao invés de , que denota a média aritmética de uma amostra, temos
µ, que significa que a média aritmética é de uma população.

A média aritmética depende de todos os valores da série e qualquer alteração de um deles


altera seu valor. Esta medida é influenciada por valores extremos, podendo, em alguns casos,
não representar a série. Além da média aritmética, há a média harmônica, geométrica e
quadrática.

Média Harmônica: costuma ser usada como medida de tendência central para conjuntos de
dados que consistem em taxas de variação como, por exemplo, velocidades. Obtém-se a
média harmônica dividindo-se o número n de valores pela soma dos inversos de todos os
valores. É expressa como:

Para os dados da tabela 1, temos a média harmônica igual a:


Média Geométrica: é usada na administração e na economia para achar taxas médias de
variação, de crescimento, ou razões médias. Dados n valores (todos positivos), a média
aritmética é a raiz nésima do seu produto. Por exemplo, determina-se a média geométrica de 2, 4,
10 multiplicando-se os três valores – o que dá 80, e tomando-se a raiz cúbica do resultado
(porque há três valores). O resultado é 4,3. Desta forma para os dados da tabela 1, temos:

Média Quadrática: é utilizada em geral em experimentos físicos. Em sistemas de distribuição


de energia, por exemplo, as tensões e correntes são em geral dadas em termos de sua média
quadrática. Obtém-se a média quadrática de um conjunto de valores elevando-se cada um ao
quadrado, somando-se os resultados, dividindo-se o total pelo número n de valores e tomando-
se a raiz quadrada do resultado. Por exemplo, a média quadrática de 2, 4, 10 é 6,3. Agora,
calculando para os dados da tabela 1, temos:

Mediana

A mediana é o elemento que ocupa a posição central de uma série de dados. Para encontrá-la
os dados devem estar dispostos em ordem crescente ou decrescente. Se a série tiver um
número ímpar de dados o valor que estiver ocupando o meio da série será a mediana. Se tiver
um número par de dados deve-se extrair a média aritmética dos dois valores centrais, uma vez
que, o valor correspondente a mediana acha-se entre eles. A mediana dos dados fornecidos na
tabela 1 corresponde a 20,9ºC.

Moda

A moda é o valor que ocorre com maior freqüência em uma série de dados. Pode ser
identificada apenas observando-se a série nos casos de dados não agrupados. Quando a série
possuir dois valores com a mesma freqüência máxima, cada um deles é uma moda, e o
conjunto diz-se bimodal. Se mais de dois valores ocorrerem com a mesma freqüência máxima,
o conjunto é multimodal. Quando nenhum valor é repetido, o conjunto não tem moda. A série
de dados fornecida na tabela 1 é multimodal, pois cinco valores (18,3; 18,9; 21,2; 22,4 e 23,2)
aparecem com a mesma freqüência máxima.

Ponto Médio

O ponto médio é o valor que está a meio caminho entre o maior e o menor valor da série de
dados. Para obtê-lo, somamos esses valores extremos e dividimos o resultado por 2, como na
expressão a seguir:

O ponto médio dos dados da tabela 1 é:

You might also like