You are on page 1of 42

Distribuição de Frequências

Distribuição de Frequências
Quando estudamos uma variável, nosso maior interesse é conhecer o
comportamento dessa variável, analisando a ocorrência das suas possíveis
realizações.
Nesta aula, veremos uma maneira de dispor um conjunto de dados, para se
ter uma ideia global sobre eles, ou seja, de sua distribuição.
Tabela de dados
Suponha que uma empresa tenha
coletado dados com respeito ao
estado civil, grau de instrução,
número de filhos, salário, idade e
região de procedência de 36
funcionários.
Tais dados encontram-se na tabela ao
lado.
Esta tabela é conhecida como tabela
de dados, pois nela estão dispostos os
dados brutos, exatamente da maneira
como foram coletados.
Tabela de dados
Observe que a tabela não pode ser fechada dos lados. Isso é norma do IBGE!
A primeira coluna é uma indicadora do funcionário (observação), e serve apenas para
organizar os dados.
As demais colunas apresentam os dados sobre as variáveis de interessem definidas
previamente.
Tabela de dados
Antes de começar a trabalhar com os dados, precisamos classificar as variáveis.
Estado Civil:
Grau de instrução:
Número de filhos:
Salário:
Idade (considerando apenas os anos):
Região de procedência:
Tabela de dados
Antes de começar a trabalhar com os dados, precisamos classificar as variáveis.
Estado Civil: Qualitativa Nominal
Grau de instrução: Qualitativa Ordinal
Número de filhos: Quantitativa Discreta
Salário: Quantitativa Contínua
Idade (considerando apenas os anos): Quantitativa Discreta
Região de procedência: Qualitativa Nominal
Distribuição de frequências para variáveis
qualitativas

Uma distribuição de frequências é uma tabela na qual dispomos as


possíveis realizações de uma variável e verificamos com qual frequência
cada uma destas apareceu no conjunto de dados.
Vamos considerar como exemplo a variável estado civil.
Distribuição de frequências para variáveis
qualitativas
Tabela: Distribuição de frequências do Título
estado civil dos funcionários
Frequência Frequência
Variável Estado Civil
absoluta (𝒇𝒊 ) relativa (𝒇𝒓𝒊 )
Níveis da Solteiro
variável Casado
Total
Distribuição de frequências para variáveis
qualitativas
Quantidade de vezes que Quantidade de vezes
apareceu aquela resposta que apareceu aquela
resposta em relação
Frequência Frequência ao total.
Estado Civil
absoluta (𝒇𝒊 ) relativa (𝒇𝒓𝒊 ) Se multiplicarmos
Solteiro por 100, obtemos a
Casado porcentagem.
Total

Porcentagens são muito úteis quando queremos comparar grupos, ou


resultados de pesquisas diferentes.
Distribuição de frequências para variáveis
qualitativas
Como obtivemos
esse 0,44?
Frequência Frequência
Estado Civil
absoluta (𝒇𝒊 ) relativa (𝒇𝒓𝒊 )
16
Solteiro 16 0,44 Fazendo = 0,44
36
Casado 20 0,55
Total 36 1
Da mesma forma,
20
= 0,55
36

Aqui sempre vai somar 1, pois


é uma soma de proporções.
Distribuição de frequências para variáveis
qualitativas
Se multiplicarmos
Frequência Frequência
Estado Civil esses valores por
absoluta (𝒇𝒊 ) relativa (𝒇𝒓𝒊 )
100, temos as
Solteiro 16 44%
porcentagens.
Casado 20 55%
Total 36 100%

Concluímos que a maioria dos funcionários (55%) são casados.


Distribuição de frequências para variáveis
qualitativas

Quando temos uma variável qualitativa ordinal, o procedimento é o


mesmo, mas além de calcular as frequências absoluta e relativa,
também conseguimos calcular essas mesmas acumuladas.
Distribuição de frequências para variáveis
qualitativas
Tabela: Distribuição de frequências do grau de instrução dos funcionários

Frequência Frequência
Grau de Frequência Frequência absoluta relativa
instrução absoluta (𝒇𝒊 ) relativa (𝒇𝒓𝒊 ) Acumulada (𝑭𝒊 ) acumulada (𝑭𝒓𝒊 )

Fundamental
Médio
Superior
Total
Distribuição de frequências para variáveis
qualitativas
Tabela: Distribuição de frequências do grau de instrução dos funcionários

Frequência Frequência
Grau de Frequência Frequência absoluta relativa
instrução absoluta (𝒇𝒊 ) relativa (𝒇𝒓𝒊 ) Acumulada (𝑭𝒊 ) acumulada (𝑭𝒓𝒊 )

Fundamental 12 0,33
Médio 18 0,50
Superior 6 0,17
Total 36 1
Distribuição de frequências para variáveis
qualitativas
Para preencher a coluna da Frequência absoluta acumulada (𝐹𝑖 ), em
cada linha vamos acumular o que tem na coluna da Frequência
absoluta (𝑓𝑖 ) ATÉ aquela linha.

Para preencher a coluna da Frequência relativa acumulada (𝐹𝑟𝑖 ),


fazemos o mesmo, mas em relação à coluna da Frequência relativa
(𝑓𝑟𝑖 ).

Nós não somamos os totais para essas colunas, pois não haveria
finalidade, nem intepretação para tais valores.
Distribuição de frequências para variáveis
qualitativas
Tabela: Distribuição de frequências do grau de instrução dos funcionários

Frequência Frequência
Grau de Frequência Frequência absoluta relativa
instrução absoluta (𝒇𝒊 ) relativa (𝒇𝒓𝒊 ) Acumulada (𝑭𝒊 ) acumulada (𝑭𝒓𝒊 )

Fundamental 12 0,33 12
Médio 18 0,50
Superior 6 0,17
Total 36 1
Distribuição de frequências para variáveis
qualitativas
Tabela: Distribuição de frequências do grau de instrução dos funcionários

Frequência Frequência
Grau de Frequência Frequência absoluta relativa
instrução absoluta (𝒇𝒊 ) relativa (𝒇𝒓𝒊 ) Acumulada (𝑭𝒊 ) acumulada (𝑭𝒓𝒊 )

Fundamental 12 0,33 12
Médio 18 0,50 30
Superior 6 0,17
Total 36 1
Distribuição de frequências para variáveis
qualitativas
Tabela: Distribuição de frequências do grau de instrução dos funcionários

Frequência Frequência
Grau de Frequência Frequência absoluta relativa
instrução absoluta (𝒇𝒊 ) relativa (𝒇𝒓𝒊 ) Acumulada (𝑭𝒊 ) acumulada (𝑭𝒓𝒊 )

Fundamental 12 0,33 12
Médio 18 0,50 30
Superior 6 0,17 36
Total 36 1 ----
Distribuição de frequências para variáveis
qualitativas
Tabela: Distribuição de frequências do grau de instrução dos funcionários

Frequência Frequência
Grau de Frequência Frequência absoluta relativa
instrução absoluta (𝒇𝒊 ) relativa (𝒇𝒓𝒊 ) Acumulada (𝑭𝒊 ) acumulada (𝑭𝒓𝒊 )

Fundamental 12 0,33 12 0,33


Médio 18 0,50 30
Superior 6 0,17 36
Total 36 1 ----
Distribuição de frequências para variáveis
qualitativas
Tabela: Distribuição de frequências do grau de instrução dos funcionários

Frequência Frequência
Grau de Frequência Frequência absoluta relativa
instrução absoluta (𝒇𝒊 ) relativa (𝒇𝒓𝒊 ) Acumulada (𝑭𝒊 ) acumulada (𝑭𝒓𝒊 )

Fundamental 12 0,33 12 0,33


Médio 18 0,50 30 0,83
Superior 6 0,17 36
Total 36 1 ----
Distribuição de frequências para variáveis
qualitativas
Tabela: Distribuição de frequências do grau de instrução dos funcionários

Frequência Frequência
Grau de Frequência Frequência absoluta relativa
instrução absoluta (𝒇𝒊 ) relativa (𝒇𝒓𝒊 ) Acumulada (𝑭𝒊 ) acumulada (𝑭𝒓𝒊 )

Fundamental 12 0,33 12 0,33


Médio 18 0,50 30 0,83
Superior 6 0,17 36 1
Total 36 1 ---- ---
Distribuição de frequências para variáveis
qualitativas
Tabela: Distribuição de frequências do grau de instrução dos funcionários

Frequência Frequência
Grau de Frequência Frequência absoluta relativa
instrução absoluta (𝒇𝒊 ) relativa (𝒇𝒓𝒊 ) Acumulada (𝑭𝒊 ) acumulada (𝑭𝒓𝒊 )

Fundamental 12 33% 12 33%


Médio 18 50% 30 83%
Superior 6 17% 36 100%
Total 36 100% ---- ---
Frequência Frequência
Grau de Frequência Frequência absoluta relativa
instrução absoluta (𝒇𝒊 ) relativa (𝒇𝒓𝒊 ) Acumulada (𝑭𝒊 ) acumulada (𝑭𝒓𝒊 )

Fundamental 12 0,33 12 0,33


Médio 18 0,50 30 0,83
Superior 6 0,17 36 1
Total 36 1 ---- ---

Quantos Qual a Quantos Qual a


funcionários porcentagem de funcionários porcentagem de
tem Ensino funcionários que tem no funcionários que
Superior? 6 tem Ensino máximo Ensino tem no máximo
Médio? 50% Médio? 30 Ensino Médio? 83%
Distribuição de frequências para variáveis
quantitativas discretas

A elaboração da distribuição de frequências para dados de variáveis


quantitativas discretas é similar ao das variáveis qualitativas ordinais.

Vejamos o exemplo da variável número de filhos.


Tabela: Distribuição de frequências do número de filhos dos funcionários
Frequência Frequência
Número de Frequência Frequência absoluta relativa
Filhos absoluta (𝒇𝒊 ) relativa (𝒇𝒓𝒊 ) Acumulada (𝑭𝒊 ) acumulada (𝑭𝒓𝒊 )

Total
Tabela: Distribuição de frequências do número de filhos dos funcionários
Frequência Frequência
Número de Frequência Frequência absoluta relativa
Filhos absoluta (𝒇𝒊 ) relativa (𝒇𝒓𝒊 ) Acumulada (𝑭𝒊 ) acumulada (𝑭𝒓𝒊 )

0
1
2
3
5
Total
Tabela: Distribuição de frequências do número de filhos dos funcionários
Frequência Frequência
Número de Frequência Frequência absoluta relativa
Filhos absoluta (𝒇𝒊 ) relativa (𝒇𝒓𝒊 ) Acumulada (𝑭𝒊 ) acumulada (𝑭𝒓𝒊 )

0 4 20% 4 20%
1 5 25% 9 45%
2 7 35% 16 80%
3 3 15% 19 95%
5 1 5% 20 100%
Total 20 100% --- ---

Como nem todos os funcionários responderam à essa questão, dizemos que temos
dados faltantes, e analisamos as frequências e porcentagens de acordo com os que
responderam.
Distribuição de frequências para variáveis
quantitativas contínuas
A elaboração da distribuição de frequências para dados de variáveis
quantitativas contínuas requer um certo cuidado
Por exemplo, a construção da distribuição de frequências para a
variável salário, usando o mesmo procedimento que usamos para o
número de filhos, não resumiria as 36 observações num grupo menor,
pois não existem salários iguais.
A solução neste caso é agrupar os dados por faixas de salário.
Tabela: Distribuição de frequências do número de filhos dos funcionários
Frequência Frequência
Frequência Frequência absoluta relativa
Classe de salários
absoluta (𝒇𝒊 ) relativa (𝒇𝒓𝒊 ) Acumulada (𝑭𝒊 ) acumulada (𝑭𝒓𝒊 )

4,00 ⊢ 8,00
8,00 ⊢ 12,00
12,00 ⊢ 16,00
16,00 ⊢ 20,00
20,00 ⊢ 24,00
Total

Usar quatro casas depois da vírgula, antes de multiplicar por 100.


Arredondar a última casa quando a próxima casa for maior que 5. Ex: 27,7777... ≈ 27,78
Tabela: Distribuição de frequências do número de filhos dos funcionários
Frequência Frequência
Frequência Frequência absoluta relativa
Classe de salários
absoluta (𝒇𝒊 ) relativa (𝒇𝒓𝒊 ) Acumulada (𝑭𝒊 ) acumulada (𝑭𝒓𝒊 )

4,00 ⊢ 8,00 10 27,78% 10 27,78%


8,00 ⊢ 12,00 12 33,33% 22 61,11%
12,00 ⊢ 16,00 8 22,22% 30 83,33%
16,00 ⊢ 20,00 5 13,89% 35 97,22%
20,00 ⊢ 24,00 1 2,78% 36 100%
Total 36 100% --- ---
Distribuição de frequências para variáveis
quantitativas contínuas
Fazendo isso, ao resumir os dados de uma variável contínua, perdemos
informação. Por exemplo, não sabemos mais quais são os 8 salários da
faixa de 12 a 16, a não ser que olhemos a tabela de dados.
Nesse tipo de situação, podemos supor que os 8 salários são iguais ao
ponto médio da classe, isto é, 14.
Note que estamos utilizando a notação a ⊢ b para o intervalo de
números que contém o extremo a, mas não contém o extremo b.
Determinação da quantidade de classes
A escolha do número de classes é arbitrária e a familiaridade do
pesquisador com os dados é que lhe indicará quantos intervalos usar.
Observar que, com um número muito pequeno de classes, perde-se
informação, e com um número muito grande, o objetivo de resumir os
dados ficar prejudicado.
Existem algumas fórmulas que ajudam a determinar o número “ideal”
de classes para dividir os dados.
Determinação do tamanho das classes
Vamos chamar o número de classes de k.
Suponha que desejamos construir 7 classes.
Então, k = 7.
Suponha que o menor dado do nosso conjunto é 10 e o maior 70.
A amplitude total (AT) dos dados é:
𝐴𝑇 = 𝑚á𝑥 − 𝑚í𝑛
𝐴𝑇 = 70 − 10 = 60
Determinação do tamanho das classes
Vamos utilizar a fórmula:
𝐴𝑇
ℎ=
𝐾
Onde h é a amplitude de cada classe (o tamanho das classes), k o
número de intervalos e AT a amplitude total.
Nesta fórmula, fixamos o número de intervalos desejado k para obter o
tamanho h destes intervalos
Determinação do tamanho classes
EX: Se no exemplo quisermos ter 7 intervalos, então a amplitude destes
será:
𝐴𝑇 60
ℎ= = = 8,57 ≈ 9
𝐾 7
E assim teremos as classes:
Determinação da quantidade de classes
2º Método: Regra de Sturges.
É a regra mais utilizada.
Se tivermos n valores (n dados), o número de classes será:

𝒌 = 𝟏 + 𝟑, 𝟑 ∙ 𝐥𝐨𝐠 𝒏
Determinação da quantidade de classes
2º Método: Regra de Sturges
Supondo que temos 200 dados, o número de classes séra:
𝒌 = 𝟏 + 𝟑, 𝟑 ∙ 𝐥𝐨𝐠 𝒏
𝒌 = 𝟏 + 𝟑, 𝟑 ∙ 𝒍𝒐𝒈 𝟐𝟎𝟎
𝒌 = 𝟏 + 𝟑, 𝟑 ∙ 𝟐, 𝟑𝟎𝟏𝟎
𝒌 = 𝟏 + 𝟕, 𝟓𝟗𝟑𝟑
𝒌 = 𝟖, 𝟓𝟗𝟑𝟑
𝒌≈𝟗
Teríamos 9 classes.
Determinação da quantidade de classes
2º Método: Regra de Sturges
O tamanho das classes seria:
𝐴𝑇 70−10
ℎ= = = 6,6 ≅ 7
𝐾 9
As classes seriam:
Determinação da quantidade de classes
3º Método: Critério da Raíz Quadrada
Nesse critério, o número de classes é dado por
𝒌= 𝒏
No nosso exemplo,
𝒌 = 𝟐𝟎𝟎 = 𝟏𝟒, 𝟏 ≅ 𝟏𝟒
Para determinar o tamanho da classe, usamos:
𝐴𝑇 70 − 10
ℎ= = = 4,3 ≅ 5
𝐾 14
Determinação da quantidade de classes
3º Método: Critério da Raíz Quadrada
Teríamos as seguintes classes:
Determinação da quantidade de classes
Apesar das fórmulas que ajudam a chegar numa quantidade ideal de
classes, o pesquisador deve usar o bom senso, e utilizar aquilo que for
mais adequado para seus objetivos e sua pesquisa.
Atividade
Faça as distribuições de frequências das variáveis Região de
procedência e Idade.
Para a variável Idade, construa intervalos que julgar apropriado.

You might also like