Professional Documents
Culture Documents
População: é uma coleção completa de todos os elementos a serem estudados. Ex: conhecer
a altura de todos os habitantes do Brasil.
Amostra: é uma sub-coleção de elementos extraídos de uma população. Ex: conhecer a altura
de um conjunto de habitantes do Brasil.
Quando o estudo trata de dados meteorológicos, temos em mãos uma amostra, pois não
conhecemos a população, devido não haver o registro contínuo dos dados desde a origem do
planeta.
Quando trabalhamos com amostras, os resultados obtidos nos cálculos estatísticos são
utilizados para fazer inferências (generalizações) sobre a população. Vejamos um exemplo:
selecionamos os dados horários de temperatura do ar do verão de 2004 medidos numa cidade
X, com isto teremos uma amostra.
Calculamos a média aritmética deste conjunto e a partir do resultado obtido podemos inferir
que a média da temperatura daquela cidade no verão (no caso todos os verões - população)
corresponde àquele determinado valor.
Distribuição de Freqüências
Quando estamos trabalhando com uma grande quantidade de dados, estes devem ser
organizados de tal forma a facilitar o trabalho do investigador do fenômeno. Se possuímos um
conjunto de dados, por exemplo, de temperaturas médias diárias de uma estação
meteorológica do mês de dezembro de 2004, devemos dispô-los de forma que consigamos
extrair de maneira fácil informações como: maior e menor temperatura, quantos dias tiveram
temperaturas acima ou abaixo de um determinado valor, etc. Para tanto, é elaborada uma
distribuição de freqüências.
Abaixo temos uma distribuição de freqüências (tabela 1) juntamente com um histograma (figura
1) da temperatura média diária do mês de dezembro de 2004 da estação meteorológica. Na
tabela o símbolo ├ indica que o limite de classe inclui o valor da esquerda e exclui o da direita.
Elaboração de uma Distribuição de Freqüências
De posse de um conjunto de dados, neste caso, de dados de temperatura média diária do mês
de dezembro de 2004 da estação meteorológica (tabela 2), devemos seguir alguns passos
para a construção de uma distribuição de freqüências.
Passo 1: Ordenar os elementos dos dados brutos em ordem crescente, indicando a freqüência
absoluta de cada elemento.
Dados brutos: dados que ainda não foram numericamente organizados. São as observações.
Freqüência absoluta: número de vezes que um valor aparece num conjunto de dados.
Passo 2: Determinar o número de intervalos de classe (K).
Possibilidade 1:
K = 1 + 3,3 (log10 n)
Possibilidade 2:
O número de intervalos de classe também pode ser obtido pela raiz quadrada da quantidade
de dados.
K = √
K ≅ 5,57 ≅ 6
[ á −
]
ℎ =
onde K é o número de intervalos de classe e ximáx e ximin são respectivamente o maior e o menor
valor do conjunto de dados.
[25,1 − 16,1]
ℎ =
6
ℎ = 1,5
Após a obtenção da amplitude dos intervalos de classe (passo 3), basta organizar os dados
conforme a distribuição de freqüências apresentada na tabela 1. Para tanto, pega-se o menor
valor do conjunto de dados e soma-se a amplitude dos intervalos de classe. Então, o primeiro
intervalo da distribuição de freqüências vai do menor valor do conjunto até a soma deste com o
valor da amplitude dos intervalos de classe.
Média
Observe:
Observação: quando ao invés de , que denota a média aritmética de uma amostra, temos
µ, que significa que a média aritmética é de uma população.
Média Harmônica: costuma ser usada como medida de tendência central para conjuntos de
dados que consistem em taxas de variação como, por exemplo, velocidades. Obtém-se a
média harmônica dividindo-se o número n de valores pela soma dos inversos de todos os
valores. É expressa como:
Mediana
A mediana é o elemento que ocupa a posição central de uma série de dados. Para encontrá-la
os dados devem estar dispostos em ordem crescente ou decrescente. Se a série tiver um
número ímpar de dados o valor que estiver ocupando o meio da série será a mediana. Se tiver
um número par de dados deve-se extrair a média aritmética dos dois valores centrais, uma vez
que, o valor correspondente a mediana acha-se entre eles. A mediana dos dados fornecidos na
tabela 1 corresponde a 20,9ºC.
Moda
A moda é o valor que ocorre com maior freqüência em uma série de dados. Pode ser
identificada apenas observando-se a série nos casos de dados não agrupados. Quando a série
possuir dois valores com a mesma freqüência máxima, cada um deles é uma moda, e o
conjunto diz-se bimodal. Se mais de dois valores ocorrerem com a mesma freqüência máxima,
o conjunto é multimodal. Quando nenhum valor é repetido, o conjunto não tem moda. A série
de dados fornecida na tabela 1 é multimodal, pois cinco valores (18,3; 18,9; 21,2; 22,4 e 23,2)
aparecem com a mesma freqüência máxima.
Ponto Médio
O ponto médio é o valor que está a meio caminho entre o maior e o menor valor da série de
dados. Para obtê-lo, somamos esses valores extremos e dividimos o resultado por 2, como na
expressão a seguir: