You are on page 1of 83

1

U P I S – FA C U L D A D E S IN TE G RA DA S
Di reto ri a d e En si no d e Pós -G rad u aç ão
Notas de aula
Projeto de pesquisa. Metodologia do trabalho científico
2

U P I S – FA C U L D A D E S IN TE G RA DA S
Di reto ri a d e En si no d e Pós -G rad u aç ão
Notas de aula
Projeto de pesquisa. Metodologia do trabalho científico

ASPECTOS GERAIS
O estudante poderá ser orientado por questionamentos para a definição das fases do projeto de pesquisa. São as
respostas, relevantes e pertinentes, as que definem, em parte essas fases, sintetizadas no Quadro 1. O método científico
permite examinar, de maneira mais ordenada, questões, tais como: por que ocorre? como ocorre? onde ocorre?, quando
ocorre? E o que ocorre? entre outras, cujas respostas ou explicações só serão possíveis por meio da pesquisa.

Quadro 1 Questões para orientar a definição do problema e outros componentes do projeto de pesquisa
3Q + OCD + 3P ELEMENTOS E DESCRIÇÕES
Aspecto relevante e prioritário do fenômeno ou fato econômico que se define como entrave para a obtenção
Que?
de determinado(s) objetivo(s) e meta(s) e que é possível solucionar mediante a pesquisa
Personagens da pesquisa: o grupo multidisciplinar que se organiza em equipes interdisciplinares afins, com
ações e estratégias específicas
Quem?
Parcerias e compartilhamento do pesquisador e cliente alvo da pesquisa auscultado sobre os problemas
passíveis e possíveis de solução tecnológica
Data em que ocorre o fenômeno econômico e datas em que ocorrerão a geração, difusão e adoção dos
Quando? resultados da pesquisa, a tecnologia.
Data dos possíveis efeitos da tecnologia: adoção, vida útil da tecnologia etc.
Local de ocorrência do fenômeno ou fato socioeconômico constituído como problema, da geração dos
Onde?
resultados de pesquisa e de aplicação dos mesmos
A forma como o fato ou fenômeno socioeconômico-físico que constitui o problema ocorre, a maneira como a
pesquisa será desenvolvida condicionada pelo meio ambiente e pelos recursos e meios disponíveis
(“estado da arte”), e as ações e estratégias para implementar as soluções consistentes com as características
Como? do meio ambiente e as necessidades/possibilidades do cliente alvo ou usuário/beneficiário da pesquisa.
O como se define em termos das teorias econômica, econométrica, matemática, estatística e sociológica, entre
outras, (metodologia de pesquisa para problemas econômicos) e se relaciona diretamente (subordina) com
os objetivos, as hipóteses e o problema de pesquisa
Procedência dos problemas para definir o como fazer? o por que fazer? e o como implementar as soluções que
Donde?
se esperam com a pesquisa?
O motivo que deu origem ao fenômeno ou fato no contexto do tema problematizado destacando a parte de
possível solução tecnológica
Por que?
Parte da resposta dessa questão poderá ser fornecida pela extensão e intensidade do problema e pela
prioridade de solução
Para que? Objetivos gerais (estruturais) ou de longo prazo propostos no projeto

Para quem? Objetivos específicos (conjunturais, táticos ...) ou de curto prazo indicados no projeto
3

U P I S – FA C U L D A D E S IN TE G RA DA S
Di reto ri a d e En si no d e Pós -G rad u aç ão
Notas de aula
Projeto de pesquisa. Metodologia do trabalho científico

1 O PROBLEMA DE PESQUISA

2 HIPÓTESE

3 OBJETIVOS

4 REVISÃO DE LITERATURA

5 METODOLOGIA
A pesquisa consiste na execução de um conjunto de ações e estratégias planejadas no projeto, integradas e
harmonizadas seqüencialmente, para a geração de inovações e conhecimentos originais. Esse processo se inicia com:

a) a caracterização do problema (que fazer?) delineado em dimensões técnicas e operacionais viáveis, delimitadas
em diversas dimensões (espacial, temporal etc.) com objetividade;

b) o estabelecimento de um conjunto de afirmações conjeturais (hipótese) sobre a relação existente entre as


variáveis, na forma de supostas e plausíveis respostas ao problema ou de explicações do mesmo, em
proposições que podem ser testadas, nunca demostradas ou provadas, a partir de dados e observações levantadas
da realidade, para servir como setas indicadoras nas fases do projeto, isto é, respostas de para que fazer?
(objetivo geral) e para quem fazer? (objetivos específicos);

d) a definição de objetivos que serão atingidos mediante a execução de ações planejadas e desenvolvidas conforme
uma metodologia científica que responde o como fazer?, de forma consistente com os cenários da pesquisa, os
recursos disponíveis para a sua execução e a finalidade ou aplicação esperada de seus resultados: informações,
tecnologias, produtos, serviços.

Metodologia significa, etimologicamente, o estudo dos caminhos, dos instrumentos usados para se fazer pesquisa
científica, os quais respondem o como faze-la de forma eficiente. Nesse contexto teórico há, por um lado, quadros
teóricos de referência (o conhecimento acadêmico) e pelo outro, embasamentos empíricos.

Quadros e embasamentos se encontram estreitamente relacionados e integrados, definidos por enunciados para
representar idéias concatenadas sobre a realidade objeto de pesquisa. Essas idéias aparecem formuladas na forma de
teses (enunciados que são aceitos com algum consenso), hipóteses e axiomas.

O conceito heurístico da pesquisa destaca a importância do problema, um plano de observações ou variáveis,


destinado a contestar determinadas hipóteses e um método científico para descrever (estudos retrospectivos),
estabelecer relações de interdependência entre as variáveis do problema (estudos diagnósticos) e fazer previsões
(estudos prospectivos), entre outras finalidades da pesquisa em economia (propósitos da econometria, neste caso).

O método, traço característico da ciência, representa um procedimento racional e ordenado (forma de pensar),
constituído por instrumentos básicos, que implica utilizar, de forma adequada, a reflexão e experimentação, para
proceder ao longo de um caminho, (significado etimológico de método) e alcançar os objetivos pré-estabelecidos no
planejamento da pesquisa (projeto). Esse procedimento se cifra na postulação de um modelo fundado nas observações
4

U P I S – FA C U L D A D E S IN TE G RA DA S
Di reto ri a d e En si no d e Pós -G rad u aç ão
Notas de aula
Projeto de pesquisa. Metodologia do trabalho científico

ou medidas experimentais, na verificação das predições desse modelo com respeito às observações do mundo real e no
ajuste do modelo conforme exijam as novas informações.

Ao responder o como fazer, o estudante deve buscar conhecer a realidade, integrando trabalhos teóricos e trabalhos
empíricos, em diferentes áreas e escalas de planejamento: macroeconômico, microeconômico e regional, ou
exploratório e analítico.

Nesta conceituação é possível destacar vários elementos, tais como os instrumentos (métodos e técnicas), os objetos
(materiais) e as referências teóricas. A harmonização e integração balanceada destes elementos define a metodologia
de pesquisa.

Metodologia, será, então, o estudo dos instrumentos de montagem de uma teoria ou, o estudo dos arcabouços
teóricos Não estuda teorias, mas o modo de armação delas com base nas observações. É oportuno salientar que esta
distinção é abstrata uma vez que existe uma adaptação (interação) mútua entre teoria e instrumentos usados para a
montagem que permite definir o problema, formular hipótese, observar fatos e fenômenos, sintetizar e analisar as
variáveis desses fatos e obter conclusões.

Assim como a investigação científica se desenvolve com a utilização de métodos que tendem a orientar o processo
de investigação, as técnicas de pesquisa se relacionam à forma de se conduzir a investigação, compreendendo várias
fases, da adoção de normas para a caracterização do problema até a manipulação e análise de dados e informações, bem
como a elaboração do relatório final da pesquisa: uma monografia, tese, relatório etc.

O método se faz acompanhar da técnica, que é o instrumento que o auxilia na procura de determinado resultado:
informação, tecnologia, serviço etc.

Dentre os vários métodos e técnicas de investigação relacionadas no projeto de pesquisa, podem ser destacadas as
seguintes (as primeiras quatro são básicas e determinantes das outras):

a) o método analítico ou merológico que procura examinar detidamente os componentes de um todo, visando
conhecer os fenômenos e fatos particulares que definiriam possíveis causas e a natureza do problema; a análise
tende a gerar sínteses dos desagregados, envolvendo um núcleo de estudos particulares, ao tratar da mensuração
de relações entre variáveis econômicas (objetivo da econometria);

b) o método indutivo feito a partir de fatos particulares, para gerar conclusões mais amplas válidas às situações
gerais; este método qualifica o processo de investigação como a aceitação da validade de generalizações e
extrapolações de comportamentos e fatos observados num campo mais restrito, isto é, possibilita o
desenvolvimento de enunciados gerais sobre as observações acumuladas de casos específicos na forma de
proposições com validade universal; nele, o estudante deverá observar cuidadosamente os diferentes
condicionamentos que poderão determinar realidades distintas em contextos aparentemente homogêneos;

c) o método dedutivo que admite para casos particulares, a validade de fatos, inferências e conclusões geradas a
partir de critérios e regras de comportamento mais gerais; procura transformar enunciados complexos e
universais, em particulares; a dedução se utiliza para obter conclusões lógicas e estabelecer abstrações do
significado dos fenômenos segundo o raciocínio do estudante-pesquisador; esta, em suas duas formas (analítica
5

U P I S – FA C U L D A D E S IN TE G RA DA S
Di reto ri a d e En si no d e Pós -G rad u aç ão
Notas de aula
Projeto de pesquisa. Metodologia do trabalho científico

e silogistica ou formal 2) tem como ponto de partida um princípio considerado a priori como verdadeiro, a tese
ou conclusão que é aquilo que se pretende provar;

d) o método Cartesiano, baseado na universalização da razão, com duas faculdades essenciais: a intuição e a
dedução; quatro regras básicas concorrem para a conceitualização deste método: a evidência que elimina a
prevenção e preconceitos; a análise que desagrega o problema; a síntese que permite a ordenação das partes
segundo o critério da relação constante entre elas; a enumeração onde o estudante-pesquisador deve selecionar
apenas o que for necessário e suficiente para a solução do problema;

e) os métodos da teoria econômica das partes microeconomia e macroeconomia, nem sempre constituem caminhos
alternativos, podendo ser utilizados conjuntamente, segundo o caso em estudo;

f) o método estatístico consistente de um conjunto de técnicas e procedimentos apoiados em teorias sistemáticas


como as da probabilidade e da informação, entre outras; este método se utiliza para obter, organizar, sintetizar,
analisar e apresentar dados de fatos e fenômenos de problemas ou de suas soluções; para o emprego conveniente
e com a maior efetividade do método estatístico, é necessário conhecer os conceitos e as pressuposições sobre as
quais tais teorias (conceitos) foram definidas, como condição indispensável para a adequada aplicação;

d) o método econométrico envolvendo outros métodos como o estatístico, o matemático e os da teoria econômica.

Técnicas de pesquisa
As técnicas de pesquisa se relacionam à forma de se conduzir a pesquisa, à maneira de percorrer o caminho de que
trata o método ou, os procedimentos práticos que devem seguir-se na pesquisa, exigindo um esforço maior do
estudante-pesquisador, bem como perspicácia para adotar os procedimentos operacionais mais adequados. Dentro
destas técnicas é possível definiras ações e estratégias de pesquisa em novos contextos dos cenários (parcerias,
descentralização, globalização etc.).

Métodos e técnicas poderão ser integradas para definir um modelo, isto é, uma representação de um fenômeno real
para explicá-lo, prognosticá-lo e controlá-lo, propósitos correspondentes aos três objetivos da econometria: a análise
estrutural, a predição ou prognóstico e a avaliação de políticas, respectivamente.

O modelo constitui um compromisso entre a realidade e a maleabilidade (adequabilidade), uma condição que o
estudante-pesquisador deverá desenvolver mediante a integração e balanceamento de condições e fatores da pesquisa.
Algumas de suas características são:

a) o modelo. Deve ser visto como uma representação razoável do sistema real e, portanto, realista ao incorporar os
principais elementos do fenômeno, fato do problema objeto de pesquisa.

b) deve ser maleável no sentido de produzir certas conclusões que não poderiam ser geradas pela observação direta;

2
A dedução na forma analítica apresenta um raciocínio formal, na qual a conclusão não fornece uma informação nova, ao contrário
da dedução, porque já está implícita. Sua forma mais importante é a do silogismo ou raciocínio composto de três proposições: duas
premissas e uma conclusão, conforme ilustra o exemplo que segue: "todos os homens são mortais - premissa maior; Pedro é homem
- premissa menor; logo Pedro é mortal
6

U P I S – FA C U L D A D E S IN TE G RA DA S
Di reto ri a d e En si no d e Pós -G rad u aç ão
Notas de aula
Projeto de pesquisa. Metodologia do trabalho científico

c) deve ser simples ao eliminar as influências estranhas e simplificar os processos e inter-relações complexas dos
elementos do problema econômico (modelo cartesiano);

Como regra geral, os primeiros modelos de um fenômeno ou fato problema propostos pelo estudante-pesquisador
devem ser simples, destacando a sua maleabilidade.

Um exemplo deste caso são os modelos “caixa preta”, onde não há intentos de reproduzir a realidade, evidenciando
apenas as entradas (elementos do problema) e as saídas do sistema (soluções: técnicas e tecnologias geradas pela
pesquisa), conforme indica a Figura 1. A seguir, procura-se a análise do que está dentro do sistema, isto é, dos
processos de transformação, produção, distribuição, apreço etc., (no tema econômico) que darão origem ao produto,
serviços e informações da pesquisa, bem como aos subprodutos (por exemplo os chamados “efeitos de segunda
geração das tecnologias) dos resultados da pesquisa.

Produtos
Serviços
Informações
SISTEMAS DE
TRANSFORMAÇÃO
ENTRADAS PRODUÇÃO
a

INPUTS DISTRIBUIÇÃO SAÍDA


CONSERVAÇÃO
Solução
m

MANEJO

RECUROS NATURAIS:
e

- Água: poluição, desperdício ...


- Solo: erosão, perdas ....
l

- Biodiversidade: perdas
OUTROS RECURSOS
b

- Capital: escasso, caro, especulativo


- Trabalho: mão-de-obra desqualificada
o

- Tecnologia /Informação não adequada


r
P

Figura 1 Representação de um sistema com modelo “caixa preta”

Mediante técnicas, métodos e modelos aplicados à investigação, prévia a adequação que cada caso possa requerer, o
pesquisador gera informações com valor científico. Essas informações integradas (ciência), com outras requeridas no
desenvolvimento sustentável, constituem-se numa poderosa ferramenta de convicção para a conservação e o manejo
racional dos recursos produtivos, pela objetividade e efetividade das mesmas.

Não existe uma fórmula universal para gerar novas informações. Todavia, o pesquisador precisa ter conhecimento
da realidade (condição necessária para definir o que pesquisar) e possuir ferramentas analíticas a serem aplicadas aos
dados (como pesquisar). Com tais ferramentas poderá gerar novas informações sobre o que acontece na “caixa preta”,
à montante dos insumos (por exemplo, efeitos que possam comprometer “estados” dos estoques ou reservatórios de
7

U P I S – FA C U L D A D E S IN TE G RA DA S
Di reto ri a d e En si no d e Pós -G rad u aç ão
Notas de aula
Projeto de pesquisa. Metodologia do trabalho científico

recursos naturais quando considerados como insumos de produção) e à jusante dos produtos (cadeias produtivas,
mercados, consumidores ...), tratando explicitamente a todas as interconexões entre insumos e produtos; estas devem
possibilitar intervir no cenário do problema de pesquisa.

As próximas seções é uma síntese de Manual de pesquisa...vol.7.

A primeira parte de postulados da ciência que a pesquisa deve considerar. Uma síntese desses postulados

Postulados da Ciência na Pesquisa


Quais são esses postulados da ciência que o estudante-pesquisador deve conhecer
e utilizar no processo de pesquisa científica? Não há um consenso quanto ao número,
mas, alguns são comuns, tais como::
a) Todo evento tem um antecedente, uma “causa” natural; este postulado é empregado na análise de
causalidade para buscar a explicação da regularidade característica ou própria do
fenômenos ou do fato motivo de pesquisa (o problema para pesquisa, p. ex.).
b) A natureza é ordenada e regular, é relativamente uniforme e “bem comportada” por leis naturais
que, para o caso da exploração de recursos naturais, p. ex., devem ser conhecidas
(resiliência, homeostase, capacidade de gerar fluxos de excedente por períodos naturais
etc.
c) A natureza objeto da ciência e pesquisa é estável e procura estabilidade; a natureza, além de bem
comportada, é estável dentro de determinados esquemas, evolucionários ou não; este
postulado não significa que não ocorram mudanças naturais e evoluções ao longo do
tempo, mas que estas são lentas o suficiente para permitir os ajuste e novos estados de
equilíbrio.
d) Outros postulados:
d.1) Todo fenômeno objetivo pode ser eventualmente conhecido, dependendo do
tempo e do esforço o suficiente despendido para tal propósito; em geral, estes são
limitados e com alto “custo de oportunidade” ou que encarece a pesquisa.
d.2) Nada é evidente por si, indicando que a realidade deve ser demonstrada
objetivamente; por este postulado, se pode rejeitar o conhecimento do “bom
senso”, entre outros que não se conformam com requisitos da ciência, um deles, o
da evidência.
d.3) O conhecimento científico é relativo (os dados, os métodos, as circunstâncias, a
interpretação e os objetivos etc.) e condicionado às características e condições da
pesquisa.
d.4) Todas as percepções são obtidas mediante os sentidos. Os elementos e
instrumentos de raciocínio são moldados pelas impressões recebidas pelos sentidos.
Este postulado assegura que a informação confiável é aquela que é verificável de
forma objetiva e empírica.
8

U P I S – FA C U L D A D E S IN TE G RA DA S
Di reto ri a d e En si no d e Pós -G rad u aç ão
Notas de aula
Projeto de pesquisa. Metodologia do trabalho científico

d.5) A base racional e empírica do conhecimento é sustentada na percepção, na


memória e na razão, sem que isso pressuponha que quaisquer e todas as
percepções, memórias e razões sejam necessariamente confiáveis, mas que o
conhecimento está baseado em regras do raciocínio e em dados percebidos pelos
sentidos. Essa percepção coloca em destaque os conceitos de dado, fato e variável,
sintetizados a seguir:

Conceito de Dado
O dado tem sua origem na observação que supõe tanto a medição quanto a
experimentação. A observação é um procedimento empírico básico da pesquisa. Nesse
procedimento, o objeto da observação é o fato, variável conforme o tipo de pesquisa,
enquanto que o resultado de uma observação é o dado, isto é, uma proposição singular
ou essencial que expressa característica (atributos) do resultado da observação. Dessa
forma se estabelece uma relação natural definida pela ordem e seqüência ilustrada na
Figura 1.

FATO
Informação potencial:
- Acontecimento OBSERVAÇÃO
- Processo Medir; experimentar
- Fenômeno DADO
- Sistema

VARIÁVEL

Figura 1 Seqüência na relação fato – observação – dado

Conceito de fato e classificação


O conceito de fato (do lat. factum; ato, ação, feito, acontecimento, episódio; o que é
verdadeiro; o que interessa, o que é essencial; Enciclopédia Larousse Cultural, 1998; p.
2365) é amplo e representa o que é, como é, e do que se trata, com fundamentação,
pertencer a realidade. Dessa forma, são fatos, p. ex., a produção e a tecnologia para
produzi-la, ou um documento e o ato de lê-lo, porém não são fatos o julgamento do
processo produtivo ou os conceitos e ideais expresso no documento. O julgamento e as
idéias se convertem em fatos quando desencadeiam ações a partir do julgamento ou das
idéias, nos exemplos ilustrados.
9

U P I S – FA C U L D A D E S IN TE G RA DA S
Di reto ri a d e En si no d e Pós -G rad u aç ão
Notas de aula
Projeto de pesquisa. Metodologia do trabalho científico

O fato, sob enfoque científico, podem ser classificados em acontecimentos,


processos, fenômenos e sistemas.
a) Acontecimento. Do ponto de vista epistemológico, os acontecimentos são considerados os elementos dos
processos, com duas funções básicas: considerados unidades em um nível superior as quais se transformam em
objeto da análise em um nível mais detalhado.
b) Processo é uma seqüência ordenada no tempo de acontecimentos conforme sua
ocorrência, de tal forma que cada elemento da seqüência determina ou influencia o
seguinte.
c) Fenômeno é uma ocorrência ou um processo tal como se apresenta a um sujeito; trata-
se “fato natural constatado, susceptível de estudo científico e que pode tornar-se
objeto de experiência”.
d) Sistema. Este conceito é fundamental para a pesquisa; relaciona-se com “entes
concretos” ou “coisas físicas” em geral dotados de massa e qualidades perceptíveis.
O conceito filosófico de sistema é neutro se comparado com o conceito de “coisa”.
Os acontecimentos e os processos de interesse para a pesquisa são os que ocorrem a
fatos, em fatos e entre as coisas e fatos concretos. Assim, os acontecimentos, os
processos, os fenômenos e as coisas concretas são fatos e classes de objetos tipificados
como ideais (conceitos, fórmulas e teorias, p. ex.) e objetos concretos (sistemas
materiais, acontecimentos, processos e fenômenos, p. ex.), com relações e propriedades
intrínsecas ao sistema e com motivações para a ciência.
Do confronto de fatos ideais e possíveis (conforme a natureza do mesmo) com fatos
reais atuais, define-se o campo da ciência experimental para pesquisar mais fatos, da
teoria que formule hipóteses sobres esses fatos e os explique e da tecnologia que elabore
“mecanismos” para a geração de fatos com valor prático. A ciência se interessa por todo
isso, mas particularmente pelos fatos que não são de domínio público: “fatos não-
ordinários” e que requerem de uma metodologia especial.
O segundo conceito importante para a pesquisa, relacionado com dado e informação, é
o de observação (Figura 1). A observação, no contexto da pesquisa, pode ser definida
como um ato ou efeito de examinar, analisar, verificar.
Na observação há elementos que o método científico trata: o objeto da observação, o
sujeito ou observador como suas percepções, as circunstâncias da observação tanto do
ambiente do objeto como do ambiente do sujeito, os meios de observação (sentidos,
instrumentos e procedimentos) e o corpo de conhecimentos no qual se encontram ou
definem os elementos da observação.
Um fator relevante para a pesquisa é o de que o fato pode ser observável somente se
existem um sujeito, um conjunto de circunstâncias (que definem a motivação para a
pesquisa, o registro do fato etc.) e um conjunto de instrumentos de observação (síntese,
análise, interpretação etc.) que permitam a sua reprodutibilidade, sempre que possível,
por outro observador (sujeito ou pesquisador) e em condições semelhantes.
10

U P I S – FA C U L D A D E S IN TE G RA DA S
Di reto ri a d e En si no d e Pós -G rad u aç ão
Notas de aula
Projeto de pesquisa. Metodologia do trabalho científico

As observações têm características específicas, algumas positivas, outras negativas.


Como vantagem ou característica positiva, se relaciona a possibilidade de registrar o
acontecimento concomitante com sua ocorrência. Por outro lado, como desvantagem, se
tem a impossibilidade de predizer a ocorrência espontânea de um acontecimento com
exatidão ou rigor científico suficiente, por causa da possibilidade de ocorrência de fatores
imprevisíveis que interferem na observação. Além disso, a possibilidade prática de
aplicação de técnicas de observação pode ser limitada pela duração do acontecimento.
As idéias que expressam o resultado de uma fase da observação são os dados (Figura
1), definidos como proposições singulares, de registros diretos ou de inferências,
conforme se ilustra no texto que segue.
Exemplo:
Em um experimento de laboratório se aplicou 5 mg / dia de substância WxRR a
cobaias durante 6 dias, sendo observado o lote durante 10 dias. A partir de 8 º
dia se observou a queda gradativa do cabelo com erupções caracterizadas por...
O informe de observação, feito pelo pesquisador, poderá ser: O grupo de
animais submetido ao tratamento (5mg / dia / animal na faixa de peso de 120 a
200 g ) desenvolveu a doença WWxR que se manifesta pela queda do cabelo e
erupções na pela, caracterizadas por....
A proposição da doença WWxR é um dado, ainda que não seja derivado da
observação direta, mas mediante análise microscópica de tecidos, sintomas
perceptíveis e outros recursos aplicados criteriosamente nessa análise de
suporte à inferência.
O tratamento estipulado no experimento é outros dado que supõe certo
conhecimento anterior ao experimento, em áreas como o da biologia.
Se o informe de observação fosse: A um grupo de animais que parecia ser
apropriado para o experimento, aplicou-se um produto provavelmente WWxR
em dose em torno de 5 mg, durante determinado período, após o qual os
animais perderam cabelo e apresentaram erupções, em princípio provocadas
pelo tratamento. O informe contem dados, porém estes não são científicos
porque não preenchem condições de rigor (repetição, verificação, consistência,
teste etc.) do método científico.
Os dados científicos que o pesquisador procura no processo de pesquisa devem
preencher determinadas condições do método científico, tais como:
a) a observação tirada do cenário da pesquisa (condições do experimento, no caso
acima exemplificado) devem referir-se a fatos objetivos (referência objetiva) e de
certa amplitude, de tal forma que dados pessoais, em que se restringe a
abrangência, poderão ser irrelevantes para esses fatos objetivos;
b) os dados que aparecem em um informe devem ser controláveis em termos de
especificações, condições de registro, testáveis, públicos etc.;
c) os dados científicos estão carregados de interpretação com suportes técnico-
científicos; são mais que dados simples, informações de um processo, com parte de
teoria utilizada para a interpretação.
11

U P I S – FA C U L D A D E S IN TE G RA DA S
Di reto ri a d e En si no d e Pós -G rad u aç ão
Notas de aula
Projeto de pesquisa. Metodologia do trabalho científico

Se aos dados científicos não forem exigidas uma referência objetiva, um controle
público e um mínimo de interpretação com base em teorias aceitáveis, então não serão
dados científicos, mas dados que poderiam ser arbitrariamente inventados, portanto,
irrelevantes para as idéias que comportam ou traduzem da realidade. Dessa forma, os
“dados sensíveis” e “os dados não-consistidos”, entre outros, não são dados científicos.
A pesquisa e a ciência se interessam por dados impessoais, que façam referência a
fatos objetivos 3 e relevantes (de percepção direta ou inferencial), carregados de
significado no contexto de uma ou mais áreas do conhecimento científico, isto é, o
interesse é pelos dados sistematizados que o pesquisador, de forma criteriosa
(metodologia científica e pragmatismo na aplicação dos resultados), gera para
determinados propósitos explícitos no projeto de pesquisa.
A evidência se coloca como um dado, porém nem todo dado é uma evidência. O
caráter de evidência do dado não é uma propriedade intrínseca dele. São evidências os
dados “consistidos” e relevantes para algum processo. Assim na pesquisa de conservação
de um ecossistema, ao interpretar uma espécie como ameaçada de extinção com base
em determinados critérios de referência científica, gera-se um dado que caracteriza a
espécie com probabilidade para ser definida em processo de extinção. Se admite que o
dado é uma evidência, com certa credibilidade, em favor de um processo de conservação.
Entretanto, ao admitir a evidência do dado se admite, também, a referência teórica que,
por sua vez, é validada pela consistência do dado à teoria. Entretanto, se a teoria é
validade por apenas determinada evidência que ela mesma sugere, então a confirmação
do dado que ali se gera carece de valor científico.
Pelo valor relativo que a confirmação empírica possui e para gerar-se um dado
científico de evidência, é necessário que o dado apresente condições específicas de
consistência com o método científico. Neste sentido se generaliza que toda evidência é
relativa a alguma hipótese com base em determinado corpo de conhecimentos. Dessa
forma, conclui-se que nenhum dado é evidente por se mesmo, mas só quando
interpretado por alguma teoria. Para a pesquisa, esse dado deve ser transformado em
variável
O termo variável é um conceito operacional fundamental na metodologia de pesquisa.
Este conceito parte da abstração derivada da observação de um conjunto de classes de
objetos (fenômeno ou atributos). Como conceito, é um substantivo que definem atributos
(desatributos) do objeto de pesquisa como por exemplo profissão, sexo, renda per capita,
produção, peso, perdas, inflação etc.
3
O fato objetivo não deve ser entendido como o contrário filosófico de “fato puro”, desprovido do objeto
no empirismo de Bacon e Comte, que o situa sem prévia formulação de hipóteses e pressupostos e,
portanto, sem a influencia de idéias de aparente e sofismada garantia. É sofisma, porque ninguém
procura nada, neste caso o dado científico, sem ter presente a possibilidade (hipóteses e pressupostos)
do que está procurando e porque não se reconheceria o que se procura ao encontrá-lo. Quanto mais se
ignora o que se busca, mais se têm que exercitar a criatividade e imaginação; e quanto mais se sabe
acerca do objeto mediante mais hipóteses, melhor é a orientação para a procura desse objeto. Trata-se de
uma posição teórico-pragmática que permita a conversão do dado em objetos do conhecimento. Assim, o
fato puro (metodologia científica) se apresenta em condições para formular hipóteses que orientarão a
procura de novos fatos acessíveis ao conhecimento (pragmatismo).
12

U P I S – FA C U L D A D E S IN TE G RA DA S
Di reto ri a d e En si no d e Pós -G rad u aç ão
Notas de aula
Projeto de pesquisa. Metodologia do trabalho científico

O conceito de variável deverá ser especificado em sua divisão mediante dimensões


que o integram. Tais dimensões podem ser deduzidas analiticamente, a partir do conceito
geral, ou empiricamente, a partir de suas inter-relações.
Para que o conceito que especifica os atributos ou características que varia de uma
entidade para outra do objeto de pesquisa seja definido é necessário que contenha um ou
mais valores ou categorias. Assim considerado, os nomes das variáveis profissão, sexo,
renda per capita, produção, peso, perdas e inflação, p. ex., deverão estar especificadas
com valores e unidades de medidas para que possam definir as variáveis: profissão:
médico, economista, agrônomo...; sexo: feminino, masculino; renda per capita: R$130,
R$3.245, R$0,56...; produção: 56t, 28t...; peso: 5kg, 8kg...; perdas: R$45, R$42; inflação:
12%, 16%, 36%, 156% ao ano.
Os termos profissão, sexo, renda per capita, produção, peso, perdas e inflação, são
conceitos, mas não constituem variáveis. Somente quando se especifica uma categoria
(médico, economista...) ou um valor (130, 3.245...) ou uma característica do atributo
(feminino, masculino), está-se fazendo alusão a uma variável. Neste caso ocorre a
transformação do conceito em variável, isto é, a partir de uma representação literária
(profissão, sexo, renda per capita, produção, peso, perda e inflação), com especificação
do conceito (divisões nas dimensões que o integram), chega-se à escolha de medida para
cada atributo. Portanto, a variável é a qualidade, magnitude, quantidade, característica
ou traço particular que define um “estado” em cada caso, suposto como variável, e que
pode variar de um para outro caso individual.
Nos conceitos anteriormente relacionados há duas características fundamentais, a
saber:
a) São aspectos observáveis de fatos, fenômenos os “estados”, representados por
variáveis, com características mensuráveis, apresentando diferentes valores, níveis
ou grupos, quantitativos ou qualitativos, como no caso da variável “produtividade”
(1.280t/ha, 1.413t/ha . . .), ou permitindo agrupamentos em categorias, como no
caso da variável “estado civil” (solteiro, casado,. . .) dos exemplos que seguem:

NOME DA VARIÁVEL PRODUTIVIDADE ESTADO CIVIL


UNIDADE DE MEDIDA (kg/ha) (Grupos)
GRUPO VALOR

1.280 Solteiro
1.413 Casado
980 Viúvo
1.536 Desquitado
13

U P I S – FA C U L D A D E S IN TE G RA DA S
Di reto ri a d e En si no d e Pós -G rad u aç ão
Notas de aula
Projeto de pesquisa. Metodologia do trabalho científico

CATEGORIA

. . . . . .

b) Devem apresentar variações em relação ao mesmo fenômeno, ao comparar


elementos entre diferentes categorias, e variações em relação a outros fenômenos,
inclusive com possíveis arranjos para dar certa uniformidade na distribuição das
variáveis.
Exemplos:

Exemplo 1 Exemplo 2
No.
No.. Freq. (%) No. Freq. (%) Inclinação do solo No. (%)
Estado civil (%)
120
- Solteiro 68 38,4 68 38,4 - Inclinado -
(90,9)
- Casado 96 54,2 96 54,2 - Plano 12 (9,1) 12 ( 9,1)
- Viúvo 8 4,5 - - Muita Inclinação - 30 (22,7)
- Desquitado 5 2,8 - - Media Inclinação - 50 (37,9)
- Outro - 13 7,3 - Pouca Inclinação - 40 (30,3)
eliminar variáveis criar variáveis desagregar variáveis

Se uma das categorias na classificação das variáveis for muito grande (inclinação do
solo, por exemplo, do caso acima), se pode considerar várias “variáveis” (desagregar),
como mostra a última coluna do exemplo 2, com as categorias “muita inclinação”, “media
inclinação” e “pouca inclinação”. 4
Condições favoráveis para definir uma variável

4
Os conceitos “muita inclinação” (ou elevada), “média inclinação” (ou mediana) e “pouca inclinação” (ou
baixa) devem ser claramente definidos por um indicador preciso e adequado, por exemplo, adotando-se
os critérios do IBGE para esse propósito. No caso exemplificado, as classes de relevo de referência para a
definir a variável desse atributo, poderiam ser: Plano, com declividades variáveis de 0 a 3%; suave
ondulado, com declividades variáveis de 3 a 8%; ondulado, com declividades variáveis de 8 a 20%; forte
ondulado, com declividades variáveis de 20 a 45%; e montanhoso, com declividades variáveis de 45 a
75%.
14

U P I S – FA C U L D A D E S IN TE G RA DA S
Di reto ri a d e En si no d e Pós -G rad u aç ão
Notas de aula
Projeto de pesquisa. Metodologia do trabalho científico

Davis (1976), citado por Richardson et alii, (1985, p 62-65), ao considerar a


importância das variações internas de uma variável, indica alguns critérios que poderão
ser úteis para o pesquisador no planejamento, obtenção e análise exploratória dos dados,
para definir as variáveis, relacionados a seguir:
a) dispor de grande número de casos (representatividade amostral) que difiram na sua
classificação, assegurando que as variáveis variem;
b) se uma das categorias for muito grande (inclinação do solo, no exemplo 2 do caso
ilustrado acima), esta se deve desagregar com base em determinada referência
técnica adequada ao caso (veja nota de rodapé);
c) se tiver um grande número de pequenas categorias, estas devem-se agrupar
formando uma nova variável, como no caso ilustrado acima, exemplo 1, com as
categorias “viúvo” e “desquitado”, constituindo-se uma nova variável, “outro”.
Princípios na operacionalização de uma variável
Richardson et alii, (op. cit., adaptado), relacionaram princípios na operacionalização
de variáveis.
a) Os valores de uma variável devem ser mutuamente excludentes, o que significa que
uma e somente uma categoria, valor ou característica do atributo em análise pode ser
atribuída a cada elemento da amostra que representa a população em estudo, dentro de
determinada classe (trata-se, portanto, de valores excludentes). Este princípio é
ilustrado com os seguintes exemplos em que aparecem, de um lado, formas incorretas
e, no outro, as formas corretas com duas alternativas:

Exemplo 1 Exemplo 2

ESTRUTURA FUNDIÁRIA RELIGIÃO


ESTRATO (ha) (Grupo)
Excludentes Excludentes
Não-excludente Não-excludente
Alternativa A Alternativa B Alternativa A Alternativa B
- Menos de 10 Menos de 10 < 10 - Católico - Católico - Católico
- De 10 a 20 De 10 a 19,99 10  20 - Presbiteriano - - Presbiteriano

- De 20 a 50 De 20 a 49,99 20  50 - Anglicano - - Anglicano

- De 50 a 100 De 50 a 99,99 50  100 - Protestante - Protestante

- De 100 a 500 De 100 a 499,99 100  500 - Evangelista - - Evangelista

- De 500 a 1000 De 500 a 1000 500  1000 - Test. de Jeová - - Test. de Jeová

- Mais de 1000 Mais de 1.000 > 1.000 - Adventista - - Adventista


Inadequada Adequadas Inadequada Adequadas
15

U P I S – FA C U L D A D E S IN TE G RA DA S
Di reto ri a d e En si no d e Pós -G rad u aç ão
Notas de aula
Projeto de pesquisa. Metodologia do trabalho científico

b) O conjunto de valores possíveis da variável deve ser exaustivo, o que significa que
todas as possibilidades empíricas devem ser incluídas na especificação ora
numérica, ora de categoria, isto é, todos os elementos da amostra devem ser
classificados com algum valor, dentro de um intervalo de valores razoáveis de
variação (domínio da variável) ou em alguma categoria claramente estabelecida e
delimitada (veja nota de rodapé 7.10.
No exemplo 2, a categoria “Protestante” inclui, entre outros, os grupos
“Presbiteriano”, “Anglicano”, “Evangelista”, “Testemunha de Jeová” e “Adventista”.
Portanto, essas categorias devem ser excluídas, especificando apenas “Católico” e
“Protestante”, sem considerar se o supergrupo “Protestante” é ou não comparável
com o grupo “Católico”. Outra possibilidade é excluir a especificação “Protestante” e
definir os grupos “Católico”, “Presbiteriano”, “Anglicano”, “Evangelista”,
“Testemunha de Jeová” e “Adventista”.
c) As variáveis, na especificação de classes e medidas, devem ser representativas do
fenômeno que se estuda, conservando certa regularidade ou simetria entre as
classes, bem como os intervalos de valores ou as categorias em que se define a
variável, devem ser consistentes com características da população em estudo. Por
exemplo, a variável “Religião” seria irrelevante no contexto de uma pesquisa
socioeconômica do Pantanal Mato-grossense, se contivesse a categoria “Budista”
mas não a categoria “Católico” ou outra predominante naquela região objeto de
pesquisa nesse atributo.

3.2.4.2 Tipos de variáveis


As possíveis categorias ou valores de uma variável determinam as características da representação do atributo
distribuída entre os elementos em estudo, reconhecendo-se que uma simples classificação como a apresentada
pelas “variáveis nominais” oferece menos informação do que uma medição numérica das variáveis
“intervalares” ou “razões”. Portanto, uma medição ou escala quantitativa representa um maior nível de
especificidade da informação do que a classificação em categorias. Em função dessa representatividade é
possível definir uma técnica apropriada para calcular as relações entre tais variáveis.
Diretamente relacionado com a escolha da técnica e método de obtenção, síntese e análise dos dados que
alimentam os modelos da pesquisa em ciências sociais tem-se o conceito de escala de medida dos dados
estatísticos. Nessa escala o pesquisador poderá observar atributos (dasatributos) qualitativos quantitativos.
Portanto têm-se variáveis qualitativas e variáveis quantitativas.
Variável qualitativa
A variável será qualitativa quando resultar de uma classificação por tipos ou
atributos. Os exemplos que seguem apresentam diversos tipos de variáveis qualitativas e
quantitativas, especificando a população, o nome da variável e suas dimensões.
Exemplos:
16

U P I S – FA C U L D A D E S IN TE G RA DA S
Di reto ri a d e En si no d e Pós -G rad u aç ão
Notas de aula
Projeto de pesquisa. Metodologia do trabalho científico

 População: moradores de um bairro, de uma cidade, de uma região, de um


Estado, de um país etc.
 Variável: cor dos alhos;
 Indicador do atributo: pretos, castanhos, azuis...

 População: peças produzidas por uma máquina em determinado período.


 Variável: qualidade de peças produzidas por dia;
 Indicador objetivo conforme determinado padrão de qualidade: p. ex., perfeita
ou defeituosa;
 Indicador conforme determinado critério: perfeita para exportação, perfeita
para consumo interno, defeituosa porém apta para consumo interno,
defeituosa para rejeição etc.;
.Indicador de aceitação: aceitável ou rejeitável.

 População: óbitos na rede hospitalar oficial do DF em 1999


 Variável: causa mortis de adultos acima de 18 anos de idade;
 Indicador: doenças cardiovascular, câncer, digestiva, infetocontagiosa etc.

 População: candidatos a um exame de seleção para o emprego...em ...


 Variável: sexo;
 Variável: idade;
 Indicador: masculino ou feminino;
 Indicador: idade na faixa de 19 a 59 anos para masculino e de 18 a 55 anos
para feminino.

Escala nominal
As variáveis qualitativas podem ser definidas numa escala nominal.
Os dados dizem-se expressos em escala nominal quando cada um deles for definido
apenas pela atribuição de um nome, categoria ou grupo que designa uma classe, a qual,
conforme anteriormente indicado, deve ser exaustiva, mutuamente exclusivas e não
ordenável. Dadas essas limitações, trata-se de um tipo de variável com escassa
informação.
Exemplos:
17

U P I S – FA C U L D A D E S IN TE G RA DA S
Di reto ri a d e En si no d e Pós -G rad u aç ão
Notas de aula
Projeto de pesquisa. Metodologia do trabalho científico

1) Classificação de pessoas pela cor do cabelo: preto, castanho, cinza, branco,


“loiro” etc.
2) Classificação dos consumidores do produto Aaa na cidade Bqq pelo sexo:
masculino ou feminino.
3) No caso de uma pesquisa que tenha como propósito conhecer a característica
profissão esperada da população constituída pelos estudantes do UniCEUB, por
exemplo, o pesquisador deverá realizar uma listagem que incluiria: direito,
economia, administração de empresa, jornalismo, computação etc. Outras
variáveis nesta categoria, poderão ser: religião, raça, cor, local de nascimento,
sexo e origem geográfica ou procedência do estudante.
Quando o pesquisador, para efeitos de processamento dos dados levantados,
atribui um código ou um valor para cada uma das características ou atributos,
dando o valor 1 ao estudante de direito, 2 ao estudante de economia, 3 ao
estudante de administração de empresa, 4 ao estudante de jornalismo etc., da
população de estudantes do UniCEUB, por exemplo, estará apenas codificando
sua informação. O número 4 não significa, neste caso, uma maior quantidade
(de conhecimento, de oportunidade ou de qualquer outra coisa) do que os
valores 1, 2 e 3. Dessa forma, os códigos numéricos são utilizados para apenas
diferenciar as categorias desta característica, não fazendo sentido calcular
indicadores quantitativos (estatísticas) como média, desvio-padrão etc., com
base nesses números.

Escala cardinal
Quando numa determinada característica nominal a ordem das categorias obedece
a uma seqüência com significado, então trata-se de uma característica definida numa
escala ordinal. Neste tipo de variável se tem a possibilidade de diferenciar e de ordenar
em relação a determinada escala, com atribuição de um significado às diferenças entre os
números, mas na a razão entre eles
Neste caso, os códigos numéricos, por exemplo 1, 2,....,5, que identificam as
categorias dos atributos, não são atribuídos de forma arbitrária mas sim de tal modo que
as categorias às quais foram assinalados os algarismos 1 e 5 são as que mais se
distanciam e mais se diferenciam entre si. Entre esses extremos encontram-se os
“códigos” 2, 3 e 4.
As escalas ordinais são úteis pata medir opiniões sobre as qualidades de certos
atributos, cuja medição objetiva é muito difícil ou impossível de realizar. Por exemplo
conhecer de um consumidor qual é a sua opinião sobre o sabor de determinado alimento,
com as opções: não gosta, gosta pouco, indiferente, gosto muito... As possíveis respostas
a esta questão podem ser resumidas numa escala ordinal com quatro ou mais opções,
conhecidas por escala de Likert. (Reis et alii, 1996, p. 24).
Exemplos:
Classificação obtida pelos alunos de metodologia de pesquisa: reprovado (< 5),
medíocre (5 a 6), regular (6 a 7), bom (7 a 8) ou muito bom (>8)
Classificação dos clientes segundo o volume de compras: cliente 1 (>10
Unidades/mês), cliente 2 (8 a 6 unidades), cliente 3 (4 a 6 unidades), cliente 4 (2
18

U P I S – FA C U L D A D E S IN TE G RA DA S
Di reto ri a d e En si no d e Pós -G rad u aç ão
Notas de aula
Projeto de pesquisa. Metodologia do trabalho científico

a 4 unidades) etc., em que cliente 1 é muito importante, cliente 2 é importante,


cliente 3 é comum, cliente 4 (menos importante) etc.

Outro exemplo é solicitar a um consumidor, de uma amostra de n consumidores,


que ordene, de maneira decrescente, numa escala de preferência de 1 a 4 (1 
excelente; 2  bom; 3  indiferente ou regular e 4  péssimo, ) três marcas (A,
B e C) de sabonetes, com possíveis respostas como: A2i, B1i e C4i , em que o i-
éssimo elemento da amostra classificou a marca A como “boa”, a marca B como
excelente e a marca C a considerou péssima.
No exemplo que segue se apresentam dados em escala nominal de uma
amostra de pigmentação de folhas de uma plantação com doença, dispostos
numa tabela de freqüência:

Categoria de Especificação da Número


pigmentação pigmentação Freqüência
0 Verde desbotada 36
1 Verde-azulada 32
2 Verde-amarelada 38
3 Verde-cinça 45
4 Azulada 12
5 Amarelada 22
6 Cinzenta 28
... ... ...
A especificação em uma ou outra categoria deve ter uma escala de referencia para definir, de maneira
excludente e exaustiva, o atributo representado pela variável objeto de estudo.

Variável quantitativa
A variável será quantitativa quando seus valores forem expressos em números
definidos em determinado domínio característico ou próprio da variável. Esse domínio
poderá ser de continuidade; neste caso, a variável pode assumir qualquer valor no
19

U P I S – FA C U L D A D E S IN TE G RA DA S
Di reto ri a d e En si no d e Pós -G rad u aç ão
Notas de aula
Projeto de pesquisa. Metodologia do trabalho científico

intervalo definido (variável quantitativa contínua; idade e peso, por exemplo) ou apenas
possuir determinados valores pertencentes ao conjunto enumerável (variável quantitativa
discreta; número de filhos, por exemplo). Os exemplos que seguem ilustram os conceitos
de variáveis quantitativas.
Variável quantitativa discreta
Exemplos de variáveis quantitativas discretas:
 População: famílias de um bairro, de uma cidade, de uma região, de um Estado
ou do país;
 Variável: número de filhos;
 Indicador: 3, 2, 6, 1 etc.;
 População: aparelhos produzidos numa linha de montagem
 Variável: número de defeitos por lote;
 Indicador: 2, 0, 4, 12, 3 etc.

Variável quantitativa continua


Exemplos de variáveis quantitativas contínuas:
 População: população de um bairro, de uma cidade, de uma região, de um
Estado ou do país;
 Variável: idade (anos, inteiro e decimal ou anos: meses: dias);
 Indicador: 24,20; 49,50; 12,13; 15,82 etc.; ou
 Indicador: 24: 2: 12; 49: 6: 0; 12: 1: 17; 15: 9: 25;

 População: industrias de uma cidade, de uma região ou de um Estado:


 Variável: índice de liquidez (receita/patrimônio);
 Indicador: 23,5%, 32,5% 5,6% etc.;

O conceito de escala de medida na variável tem especial importância na estatística


não-paramétrica, isto é, nas estatísticas em que não especificam as condições sobre as
estimativas dos parâmetros da população da qual a amostra foi obtida. É freqüente,
nesta, as seguintes escalas:
Escala nominal não-paramétrica
a) Nominal, em que o uso de números é apenas o meio para distinguir elementos ou suas propriedades em
diferentes classes ou categorias. Por exemplo, no caso de uma função discriminante para um atributo nominal,
pode ser utilizada a seguinte especificação:
20

U P I S – FA C U L D A D E S IN TE G RA DA S
Di reto ri a d e En si no d e Pós -G rad u aç ão
Notas de aula
Projeto de pesquisa. Metodologia do trabalho científico

1 para Y  5
Ai =
0 para Y < 5

Escala ordinal não-paramétrica


b) Ordinal, em que os números são utilizados somente para classificar os elementos, numa ordem crescente ou
decrescente. Também utiliza-se uma escala ordinal quando se empregam descritores como: maior do que ( > ) ;
igual a ( = ); menor do que ( < ).
As variáveis que aparecem em modelos econômicos (por exemplo nos estudos econométricos, que
freqüentemente tratam de variáveis como: preço: R$45,05; R$56,30 . . ; renda: salários mínimos 2,40, 3,50, 4,5 .
. .; produção: 12t, 15t ...etc.), são utilizadas para relacionar componentes de um sistema. Estas podem ser
classificadas como variáveis exógenas, variáveis de estado e variáveis endógenas,
agrupadas em dois grandes categorias em relação ao tempo: seções transversais e séries
temporais.
Variável exógena
São aquelas consideradas como independentes ou de entrada do modelo (fatores,
insumos...), previamente determinadas em outros ambientes e fornecidas para a
pesquisa. Estas podem ser vistas como atuantes sobre o sistema mas não sendo
influenciadas pelo mesmo, sendo a direção causa-efeito admitida apenas no sentido das
variáveis exógenas para o sistema. Elas podem ser classificadas como controláveis e não-
controláveis.
a) as variáveis exógenas controláveis ou instrumentais são aquelas que podem ser
manipuladas ou controladas como o caso de insumos aplicados (fertilizante, água
para irrigação, capital, trabalhadores contratados etc.), enquanto que as variáveis
exógenas não-controláveis são geradas pelas circunstancias nas quais o sistema
modelado existe e não pelo próprio sistema ou pelos agentes de decisão que atuam
no sistema, como é o caso de determinados fatores fixos;
b) as variáveis de estado descrevem o “estado” do sistema objeto de estudo ou de um
de seus componentes, quer no início do período, quer no seu termino ou no decorrer
do mesmo, como o dinheiro em caixa, o estoque de recursos, o nível de dívidas etc.
Estas variáveis podem interagir ora com as variáveis exógenas, ora com as
variáveis endógenas, conforme sejam definidas as relações funcionais, sendo que
seu valor poderá depender não só dos valores de uma ou mais variáveis exógenas,
como também dos valores de uma ou mais variáveis de saída do sistema.
Variáveis endógenas
21

U P I S – FA C U L D A D E S IN TE G RA DA S
Di reto ri a d e En si no d e Pós -G rad u aç ão
Notas de aula
Projeto de pesquisa. Metodologia do trabalho científico

As variáveis dependentes ou de saídas do sistema são geradas pela interação das


variáveis exógenas e das variáveis de “estado”, conforme as características funcionais e
operacionais do sistema objeto de estudo.
Enquanto as categorias de informações disponíveis, as variáveis podem
corresponder a “seções transversais” e “séries temporais”. Por exemplo, nos estudos
econométricos, ao estimar a função de produção, o pesquisador pode utilizar uma
subdivisão minuciosa do processo de produção em um período, com vários níveis de
aplicação de insumos (seção transversal). Poderá examinar como a produção total está
relacionada com as aplicações de insumos em certo período de vários anos (série
temporal) e poderá também utilizar uma combinação das duas categorias, envolvendo
variáveis exógenas, endógenas e de “estado”.
Outras tipos de variáveis
Outros aspectos básicos que o pesquisador deverá considerar quando trata e aplica corretamente o conceito de
variável são os relativos ao inter-relacionamento delas, com diversas alternativas, tais como:
a) covariação, quando as variáveis mudam de maneira conjunta;
b) associação, quando as variáveis podem mudar conjuntamente mas as mudanças de uma não produzem
necessariamente mudança(s) em outra(s);
c) causa-efeito, quando as mudanças de uma ou mais variáveis [exógena(s) ou independente(s)] produzem
mudanças em outra(s) (endógena(s) ou dependente(s).
A relação síntese do Quadro 7.1 apresenta a classificação mais freqüente de variáveis.
O objetivo primário da estatística, com suas técnicas e métodos, e da econometria, com seus modelos, é
inferir características de um conjunto de dados analisando as características de uma amostra do conjunto.
Essa generalização, proveniente da análise de uma parte do todo, requer a consideração
de importantes conceito, tais como população, amostra estatística, parâmetro (descreve
a caracterização da população) e estimativa do parâmetro (descreve a caracterização da
amostra que, sob determinadas condições, permite inferir sobre as características da
população alvo de pesquisa).
A caracterização da população objeto de investigação (clientes e áreas) é destacada
neste Manual, com a apresentação e ilustração de diversas técnicas e métodos de
prospecção de necessidades por informações e tecnológicas.
Em termos gerais, os instrumentos da metodologia (p. ex., a estatística e a
econometria são conjuntos deles) se orientam para derivar conclusões a cerca de uma ou
de um grupo de medidas de uma (ou mais) variável(eis) estudada(s). A coleção completa
de todas as variáveis a cerca da qual se quer obter conclusões é a população ou universo.
Por exemplo, um pesquisador quer fazer um estudo da resposta ao Exame Nacional de
Cursos, estabelecido pela Portaria Ministerial do Ministério da Educação n o. 1.127 de 8 de
out. de 1998, no universo de estudantes universitários brasileiros do primeiro semestre
de economia de 1999, então a totalidade dos alunos no ultimo semestre das
universidades brasileiras de economia, constitui a população alvo de pesquisa.
22

U P I S – FA C U L D A D E S IN TE G RA DA S
Di reto ri a d e En si no d e Pós -G rad u aç ão
Notas de aula
Projeto de pesquisa. Metodologia do trabalho científico

A parte que segue trata de uma das formas convencionais de obtenção de dados e
informações primárias da população, dispensando o tratamento prévio de amostragem
que o pesquisador deverá obter das fontes documentais pertinentes: amostragem
estatística.
23

U P I S – FA C U L D A D E S IN TE G RA DA S
Di reto ri a d e En si no d e Pós -G rad u aç ão
Notas de aula
Projeto de pesquisa. Metodologia do trabalho científico

4 QUESTIONÁRIO E FORMULÁRIO
O questionário contém uma lista de perguntas cuja temática pode corresponder a
uma “tradução” das hipóteses de pesquisa sob a forma interrogativa. Nessa tradução o
pesquisador deve levar em consideração o provável nível de detalhamento dos dados a
serem fornecidos pelos entrevistados e ser submetido a rigoroso controle para evitar,
reduzir ou controlar as possíveis distorções.
Na estrutura do questionário é importante observar a ordem das perguntas que
pode ser temática ou em grupos correspondentes às hipóteses ou, ainda, totalmente
arbitrária tendo em vista, neste caso, o possível “efeito de contaminação”. Este efeito
consiste no condicionamento da resposta a uma pergunta em função das perguntas
anteriores, que seguem determinada linha de raciocínio ou seqüência.
O questionário pode ser aplicado, em alguns casos, sem entrevistador, quando é
distribuído pelo correio convencional ou eletrônico (internet, p. ex.). Mas em geral, a
aplicação mais eficiente supõe o relacionamento entre um entrevistador, devidamente
treinado, e o entrevistado convenientemente informado dos propósitos da entrevista. 5
Questionário e entrevista são consideradas técnicas complementares. Após a
aplicação do questionário, ou no decorrer, podem ser realizadas outras entrevistas, com
informantes especiais, para esclarecer ou aprofundar certos aspectos de respostas, ou
determinados quadros de referências importantes para o estudo, porém não considerados
no questionário.
O levantamento de dados primários por amostragem é o método de pesquisa
planejada sobre uma amostra da população objetivo, podendo ser descritivo ou analítico,
6
realizado por questionários baseados em formulários, entre outras técnicas,
previamente elaboradas e testadas para os propósitos explícitos da pesquisa.
Para a obtenção de informações primárias o pesquisador poderá recorrer as
modernas técnicas de levantamento de dados como as de sensoreamento remoto, onde a
informação é disponibilizada em “tempo hábil”, devendo ser, em muitos casos, validada e
complementada por pesquisas de campo especiais.

5
A terminologia diferencia questionário de formulário. Na Enciclopédia Larouse Cultura (1998: p. 4868 e
2505) o questionário é definido como uma seqüência de interrogações feitas com o fim de servir de guia
a uma investigação, a uma entrevista; para o caso de formulário, trata-se de um papel padronizado em
que se inscrevem os dados nos locais a isso destinados. Witt (1973: p. 142) estabelece a diferença
considerando que o questionário é preenchido pelo próprio respondente, enquanto que o formulário é
aplicado por um entrevistador. Neste Manual se adota o conceito francês, em que o questionário é
aplicado por um por um entrevistador, enfatizando-se as condições dessa aplicação para minimizar
possíveis “contaminações” ou viés na informação obtida e registrada no formulário
6
O tipo de levantamento descritivo tem por finalidade a obtenção de determinadas informações,
enquanto o levantamento analítico procura informações para estabelecer comparações entre subgrupos
da população a fim de se formular hipóteses associadas à natureza dos dados
24

U P I S – FA C U L D A D E S IN TE G RA DA S
Di reto ri a d e En si no d e Pós -G rad u aç ão
Notas de aula
Projeto de pesquisa. Metodologia do trabalho científico

Dois métodos empíricos, um utilizado preferencialmente na pesquisa social e o


outro na pesquisa industrial, são relacionados: o estudo de casos e o estudo de
protótipos.

Quadro 7.1 Classificação mais freqüentes das variáveis na pesquisa


a
O tipo de variável mais simples e com menor informação. Os elementos são agrupados
Nominal
em classes, obedecendo determinado critério de classificação, sem indicar hierarquia

A variável resulta da operação de ordenar por posto. Assim, além de classificar os


Ordinal elementos de um conjunto, estabelece-se uma ordem hierárquica, conforme
Escalar

determinado critério

Com as características das escalas nominais e ordinais. Além disso, apresentam


Intervalar
distâncias iguais entre os intervalos que se estabelecem sobre o atributo medido.

Reúnem todas as propriedades dos números naturais: classificação, ordem, distância e


Razão
origem.

- Independente (X) Aquela que influencia, determina ou afeta a denominação da variável


dependente (Y).
Natureza Relacional

- Dependente (Y) Categorias ou valores a serem explicados ou descobertos, dado que são
influenciados, determinados ou afetados pela variável (X)

Colocada entre as variáveis X e Y tendo como finalidade anular, ampliar ou


- Interveniente (W) diminuir a influência de X sobre Y

Variável de prova com a finalidade de explicar a relação X  Y


- Antecedente (Z)

- Determinística “X causa sempre Y, ou se X ocorre sempre ocorrerá Y”


Causa - efeito Relação

- Probabilística “Se X ocorre, provavelmente - a % das vezes - ocorrerá Y”

“X causa Y. A ocorrência de X é suficiente para a subseqüente ocorrência de


- Suficiência
Y”

- Coexistência “ Se X ocorre, então também ocorrerá Y”

- Reversível “Se X ocorre, então Y ocorrerá, e se Y ocorre, então X ocorrerá”

- Necessária “Se ocorrer X, somente X, então ocorrerá Y”

- Substituível “Se X ocorre, então Y ocorre, mas se Z ocorre, então também Y ocorre”

“Se X ocorre, então Y ocorrerá, mas se Y ocorre, então nenhuma ocorrência se


- Irreversível
dará “

- Seqüencial “ Se X ocorre, então mais tarde ocorrerá Y”


25

U P I S – FA C U L D A D E S IN TE G RA DA S
Di reto ri a d e En si no d e Pós -G rad u aç ão
Notas de aula
Projeto de pesquisa. Metodologia do trabalho científico

- Contingencial “Se X ocorre, então ocorrerá Y somente se Z estiver presente”

Continuação
Quadro 7.1 Classificação mais freqüentes das variáveis na pesquisa
a
Produto-
Relação

produto

“Se X1 ocorre, Y pode ou não se produzir, dependendo de X 2 ocorrer. Daqui a


probabilidade de que Y ocorrerá quando se dá X 1 em O1 (ambiente de X1)
dependendo da probabilidade de X2 vir a ocorrer em O2. Deste modo X1 e X2
(produtores de Y) são condições probabilísticas de Y"

Correlação Pode significar dependência para alguma espécie de associação

Pode assumir um conjunto ordenado de valores dentro de determinados limites


Continuidade

Contínuas
(ordem hierárquica)

Discretas Constituída de partes ou categorias separadas e distintas

Definidas em termos de seus atributos, portanto não são mensuráveis,


nem numéricas ou não contáveis, apenas são descritas, sendo a
- Qualitativa condição qualitativa definida por escala
Natureza

Analítica

Aplicada aos fenômenos, objetos etc., que podem ser medidos, contados,
pesados etc., exigindo um sistema lógico que permita atribuir números
- Quantitativa para contagem ou mensuração formando uma escala

a
Fonte: Richardson et alii (1985); Ferrari (1982); Goode e Hatt (1979).

Estudo de casos
26

U P I S – FA C U L D A D E S IN TE G RA DA S
Di reto ri a d e En si no d e Pós -G rad u aç ão
Notas de aula
Projeto de pesquisa. Metodologia do trabalho científico

Por esta técnica, o pesquisador escolhe os “casos”, geralmente poucos (uma das
diferenças com a amostragem), com as características relevantes para os propósitos do
estudo, e o desenvolve segundo um plano preestabelecido, podendo ser orientado por
questionários e formulários que enfocam a unidade globalmente em lugar de suas partes
individuais.
Estudo de protótipos
Nesse estudo, o pesquisador monta um ou poucos protótipos (unidades em
condições controladas) com um conjunto de características escolhidas, segundo um plano
preestabelecido, para a avaliação desse conjunto, sendo muito útil para estudos
exploratórios, principalmente para prover a síntese de resultados de pesquisa analítica
mediante a sua integração em sistemas reais, e para a caracterização de problemas e
hipóteses que possam ser testadas na pesquisa analítica.
Em estudos da indústria, os protótipos são modelos físicos de máquinas ou
equipamentos compostos pelo agregado de componentes desenvolvidos de forma
independente e avaliados no conjunto pelo método.
O estudo de protótipos pressupõe a montagem da unidade especialmente para a
pesquisa, enquanto que no estudo de casos essa unidade já existe antes da investigação.

4.1 Aspectos Conceituais do Questionário e Formulário


Uma forma tradicional e muito utilizada para a obtenção de dados e informações
primárias para a investigação descritiva ou analítica social é a pesquisa de campo
mediante a aplicação de questionário orientados com base em formulários previamente
preparados e testados para esse propósito. Essa pesquisa corresponde a coleta direta de
dados, em geral no próprio local da ocorrência do fenômeno, fato ou tema problematizado
de interesse para a pesquisa.
Fazer perguntas “inteligentes” e oportunas é, em muitos casos a única forma de
obter informações relevantes e oportunas sobre comportamentos e experiências
passadas, opiniões, sentimentos, motivações, valores e atitudes sobre um conjunto de
variáveis para definir fases do processo de pesquisa especialmente socioeconômica.
Questionário
No questionário, ainda que orientado por um formulário, o investigador deverá estar atento na sua
aplicação, com atitudes e comportamentos que não venham a incidir negativamente no processo de obtenção e na
qualidade dos dados e de informações primárias obtidas por este meio.
A parte que segue relaciona conceitos da pesquisa de campo que, apesar de aparentemente simples, nem
sempre são seguidos nos levantamentos e, por vezes, são causadores de problemas de consistência e outros
que se acusam nas inferências obtidas da análises de dados com problemas de representatividade do(s)
atributo(s) objeto de investigação.
27

U P I S – FA C U L D A D E S IN TE G RA DA S
Di reto ri a d e En si no d e Pós -G rad u aç ão
Notas de aula
Projeto de pesquisa. Metodologia do trabalho científico

4.1.1 Orientações gerais na aplicação de um questionário


Não existem critérios para avaliar a adequação de questionários à população alvo
de pesquisa (estudada mediante uma amostra). Entretanto, é possível sugerir e fornecer
orientações gerais e flexíveis que poderão auxiliar o pesquisador nessa fase de
levantamento de dados primários. Essas orientações, como em casos anteriores
apresentados no Manual, vêm na forma de respostas à questões formuladas, entre elas, as seguintes:
Conteúdo e relevância das perguntas
Quanto a relevância, conteúdo ou utilidade da pergunta contida no formulário ou que se pretende formular
no questionário, é importante considerar, entre outros aspectos na forma de perguntas, os seguintes:
a) a pergunta é necessária (oportuna, relevante e como o nível de detalhes que possa ser obtido do informante)
no contexto da pesquisa?
b) qual é a utilidade ou a relação com o problema de pesquisa, com os objetivos que se pretendem e com a
teoria aplicada (em particular, com as hipóteses) ou que se espera aplicar no estudo?
c) o tema exige uma pergunta separada ou pode ser integrada a outra pergunta sem perda de objetividade ou de
diluição da importância de cada um dos assuntos tratados conjuntamente?
d) o conteúdo da pergunta não estará com viés apontando ou favorecendo determinada direção, de forma a
influenciar a resposta para esse lado?
e) a formulação da pergunta é suficientemente neutra (em seu conteúdo, redação,
apresentação, ilustração etc.) por respondentes com opiniões opostas ou
divergentes?
f) a formulação da pergunta contém algum tipo de opinião ou pré-julgamento
relacionado com o assunto tratado?
Desdobramentos do assunto principal
Diversos aspectos do desdobramento do assunto-chave do estudo com dados
obtidos por questionários podem ser colocados em evidência na forma de perguntas; a
disposição de perguntas no formulário também pode ser motivo de questionamento. Os
exemplos que seguem ilustram alguns casos dos desdobramentos:
a) qual é o nível de complexidade do assunto tratado na pergunta?
b) é possível a subdivisão com perguntas mais simples e diretas, de modo a facilitar o
entendimento e a obtenção das respostas (diferente do item a.3)?
c) a perguntas compreende o tópico na intensidade ou abrangência (especificidade)
desejável e possível de obter nas condições específicas da pesquisa?
d) quais são as possíveis alternativas de formulação (redação, ilustração, apresentação
etc., consistente com as características do respondente) da pergunta?
e) a disposição das perguntas no formulário é adequada para o respondente e para sua
formulação?
28

U P I S – FA C U L D A D E S IN TE G RA DA S
Di reto ri a d e En si no d e Pós -G rad u aç ão
Notas de aula
Projeto de pesquisa. Metodologia do trabalho científico

Expectativas quanto ao tipo de informação


É importante observar no questionário, pela complexidade e natureza do assunto e,
principalmente, pelo nível de informação (instrução, preparação para responder etc.) do
informante, si este tem condições suficientes para responder às perguntas, se tais
perguntas do formulário são oportunas no tempo e sob as condições previstas ou
planejadas. Neste sentido é importante considerar, entre outros aspectos, os seguintes:
a) é um assunto que as pessoas selecionadas na amostra podem responder, descrever
ou informar adequadamente, conforme o propósito do estudo?
b) as perguntas exigem respostas que o informante não tem condições de responder,
ou de responder de maneira precisa?
c) o assunto é de natureza particular, íntimo, experiências ou informações valiosas e
estratégicas que não podem (em hipótese) ser fornecidas, de maneira adequada ou
sem distorções (provocar resistência, evasão, omissão, constrangimento...), por
parte do informante?
d) quando se trata de informações sobre fatos do passado, será que as pessoas
respondentes têm ainda na memória tais conhecimentos para relatá-los com a
precisão e a objetividade requeridas pela pesquisa?
e) há outras fontes de informações que possam ser consultadas para testar, validar,
verificar ou complementar determinadas informações obtidas através do
questionário?
f) uma mesma versão da pergunta é suficiente para os diferentes públicos-alvo da
pesquisa?
Formas de apresentação das perguntas
Quanto à redação das questões, o pesquisador deverá procurar a clareza e objetividade necessárias que
venham a facilitar a obtenção da informação. Neste sentido, poderá ser orientado:
a) a pergunta contém termos difíceis, com significado dúbio ou desconhecido (em
hipótese) para o informante?
b) as palavras e formas de construção das frases utilizadas para redigir a pergunta são
as de domínio do público-alvo (elementos da amostra)?
c) a questão foi formulada utilizando termos técnicos, palavreado desnecessário e
formas de redação rebuscadas que possam confundir o informante ou que
eventualmente possam despertar objeções, de qualquer tipo?
d) a forma de redação da questão é suficientemente simples, curta e direta ou
objetiva?
e) a redação da pergunta está com viés, emocionalmente carregada, deformada ou
emprega termos superlativos, que possam dirigir (sugerir ou insinuar o que se
deseja...) a resposta em determinado sentido?
29

U P I S – FA C U L D A D E S IN TE G RA DA S
Di reto ri a d e En si no d e Pós -G rad u aç ão
Notas de aula
Projeto de pesquisa. Metodologia do trabalho científico

f) uma redação da pergunta mais pessoal ou menos pessoal apresentaria melhores


resultados?
g) uma redação da pergunta mais direta ou menos direta apresentaria melhores
resultados?
h) uma redação da pergunta de forma aberta apresentaria melhores resultados?
i) uma redação da pergunta fechada e pré-codificada (dicotômica, escolha múltipla,
escala em determinado intervalo, identificação numa ilustração de referência etc.)
apresentaria melhores resultados?
j) a pergunta exprime, de forma equilibrada ou conforme a importância das possíveis
respostas, todas as alternativas?
k) a pergunta deixa claro e direto o quadro de referência em que a resposta pode ser
dada?
l) a pergunta apresenta a base para a resposta ou induz, de alguma forma, para esta?
m) a pergunta utiliza frases como:

“A opinião geral das pessoas é que: “. . .”; qual é sua opinião sobre o mesmo
assunto?
“ A resposta do chefe de... [ou de pessoa(s) destacada(s) no assunto] sobre a
matéria tem sido “...” ; qual é sua opinião sobre o mesmo assunto?

4.1.1.1 Possíveis limitações da pesquisa de campo


A pesquisa documental atualizada e adequada ao texto, que se sintetiza a continuação, complementa as
informações precedentes em relação aos cuidados que o pesquisador deverá observar quando elabora um
formulário e/ou aplica um questionário testado para a obtenção de dados e informações primárias. Esses
cuidados se orientam para evitar problemas e limitações nos estudos de campo, tais como (Ferrari (1982, p.
229; complementado):
a) as atitudes endopáticas e os esquemas etnocêntricos e egocêntricos possíveis geradores de viés nas
respostas levantadas nos questionários;
b) as barreiras de linguagem (de informação e de comunicação), entre entrevistador e
entrevistado;
c) a instrumentação testada e mais adequada para a coleta de dados.

4.1.1.2 Outras sugestões e pontos de reflexão


Outras sugestões e orientações gerais e flexíveis que poderão auxiliar o pesquisador
na fase de obtenção de dados e informações primárias são relacionadas nas seguintes
observações:
30

U P I S – FA C U L D A D E S IN TE G RA DA S
Di reto ri a d e En si no d e Pós -G rad u aç ão
Notas de aula
Projeto de pesquisa. Metodologia do trabalho científico

a) Definir um número reduzido de questões relevantes e de interesse para o estudo, tal vez não mais de 20 ou
30 ( ? ) questões, aplicadas durante uma hora ou menos e em um ambiente conveniente para o respondente,
formuladas numa linguagem simples, direta e de questões objetivas e quantificáveis.

b) Favorecer a obtenção da informação de forma livre e espontânea pelo informante,


sem nenhuma intervenção ou sugestão de qualquer natureza por parte do
entrevistador.
c) Criar um ambiente de confiança, tranqüilidade e respeito entre o entrevistador e o entrevistado, o que
pressupõe um conhecimento, experiência e treinamento do primeiro, e o preparo do entrevistado,
convenientemente informado dos objetivos da pesquisa, do valor da informação de boa qualidade e do sigilo
da mesma.

d) Apesar de que em muitos casos não seja possível homogeneizar os formulários e as


questões, estas deverão ser formuladas dentro de esquemas que permitam a
integração, síntese a análise posterior das informações da amostra.
É recomendável a pré-codificação do questionário o que é facilitado com perguntas
cujas respostas são registradas em gabaritos ou alternativas de respostas pré-
codificadas;
e) O questionário deverá permitir obter informações suficientes para se testar a
consistência das mesmas, apresentando temas diversos e alternativas para um
mesmo tema.
f) A preparação da pesquisa de campo é fundamental para se atingir objetivos da técnica, tais como:
preparação do formulário, teste da eficiência e eficácia do mesmo, oportunidade da aplicação, clara e
suficiente informação para o entrevistado, adequado treinamento para o entrevistador e objetividade das
possíveis respostas obtidas das questões formuladas, entre outras.

É responsabilidade do pesquisador determinar o tamanho, a natureza e o conteúdo


do formulário para o questionário, de acordo com o problema pesquisado e as
circunstâncias em que se faz o levantamento de dados e informações (Richardson et al,
1985, ampliado e adequado ao texto).

4.1.1.3 Exemplos de perguntas difíceis e confusas


Belson, citado por Foddy (1996; p. 57; complementado), relaciona diversas
categorias de perguntas difíceis, confusas ou dispersivas, ilustradas na parte que segue:
a) Duas ou mais perguntas apresentadas como uma só.
Exemplos:

Que marca utiliza em... ou muda freqüentemente de marca?


Qual é preço médio e como poderia reduzir-se?

b) Perguntas com muitas palavras em que o sentido é relevante.


Exemplo:
31

U P I S – FA C U L D A D E S IN TE G RA DA S
Di reto ri a d e En si no d e Pós -G rad u aç ão
Notas de aula
Projeto de pesquisa. Metodologia do trabalho científico

Quantos de cada tamanho são produzidos?

c) Perguntas que incluem frases explicativas.


Exemplo:

Comprou algum sabonete nos últimos sete dias, não considerando o dia de hoje?
Em caso de requer o produto Aaa, porque ..., qual é o procedimento de compra?

d) Perguntas que compreendem mais de uma idéia ou assunto.


Exemplos:

Qual foi o produto comprado ou onde teve informação do produto?


Que tipo de tecnologia adotaria e tem alguma preferência quanto a origem da
tecnologia?

e) Perguntas que começam com palavras que procuram suavizá-la.


Exemplos:

Importa-se em informar sobre...


Por favor não interpreta a pergunta como algo pessoal...

f) Perguntas hipotéticas e rígidas.


Exemplo:

Supondo que exista o caso..., defina a causa mais importante...

g) Perguntas com palavras negativas.


Exemplo:

Não será que quando não ocorre o fato...


32

U P I S – FA C U L D A D E S IN TE G RA DA S
Di reto ri a d e En si no d e Pós -G rad u aç ão
Notas de aula
Projeto de pesquisa. Metodologia do trabalho científico

h) Perguntas invertidas.
Exemplo:

O que você comprou a última vez, o que era?

i) Perguntas que incluem expressões, tais como: se é que alguém...; se é que foi...;
j) Perguntas muito longas.
k) Perguntas que incluem simultaneamente frases no presente e frases no passado, no
singular e no plural, no geral e no específico etc.
Sugestões para o ordenamento das questões no formulário
A orientação para determinar a ordem das questões, baseia-se, de preferência, nos
possíveis efeitos que um estímulo provocado por determinada pergunta ou forma de
questionamento, possa ter sobre as subseqüentes questões.
Neste sentido e segundo Phillips (1974) e Richardson et alii (1985), poderão
observar-se as seguintes regras:
a) Perguntas gerais devem usualmente preceder perguntas específicas. Introduzir o questionário com
perguntas que não formulem problemas, depois incluir perguntas referidas à problemática, mas em
termos gerais, seguidas das perguntas chaves que formam o núcleo do questionário, e finalmente
perguntas especiais.
Exemplo:

Primeira Fase: ( ) Menor de 15 anos de idade


( ) De 15 a 20 anos
( ) De 21 a 30 anos
FAIXA DE IDADE: ( ) De 31 a 45 anos
( ) De 46 a 60 anos
( ) Mais de 60 anos
ESTADO CIVIL: ___________________________________
SEXO ( ) masculino
( ) feminino
Segunda Fase:
Formular as perguntas de opinião para preparar o informante a responder as
perguntas chave ou essenciais do questionário.
33

U P I S – FA C U L D A D E S IN TE G RA DA S
Di reto ri a d e En si no d e Pós -G rad u aç ão
Notas de aula
Projeto de pesquisa. Metodologia do trabalho científico

b) A seqüência das perguntas poderá seguir certa ordem lógica, funcional ou operacional, ou espacial,
temporal, cronológica etc., de modo a evitar-se transições bruscas, permitir a interação entre o entrevistador e
o entrevistado, e facilitar as respostas mediante uma seqüência de pensamento. Entretanto (repetindo), deve-
se cuidar, que essa lógica possa induzi ou criar determinado condicionante da resposta à resposta anterior.
c) As perguntas que poderiam comprometer a outras, deverão ser colocadas, no possível, no final do
questionário. Não se deve abusar ao refazer pergunta;
d) Devem ficar claramente diferenciados no questionário suas partes:

- instruções e gabaritos, por exemplo entre parêntesis, destaque gráfico, relação das
possíveis opções de respostas entre colchetes etc.;
- perguntas, com LETRAS MAIÚSCULAS, sublinhadas, negritadas ou outro destaque
tipográfico;
- respostas, letras minúsculas especificando o espaço necessário para escrever a
resposta, ou indicar o espaço para anotar o gabarito que mais se aproxime à
resposta, ao lado das perguntas.
Richardson et alii, (op. cit.) apresentam recomendações para a redação das perguntas,
julgadas oportunas nesta parte do Manual, e sintetizadas a seguir:
a) Não incluir uma pergunta sem ter uma idéia clara da forma como será utilizada a
sua informação e em quanto ou como contribuirá aos objetivos do estudo.
b) Usar vocabulário preciso [claro e adequado às condições do respondente, em
construções e parágrafos igualmente precisos, simples e diretos] para perguntar o
que realmente se deseja saber; evitar palavras confusa [rebuscadas] e termos
técnicos que não sejam do conhecimento população (amostrada) a ser entrevistada;
c) Evitar formular duas ou mais perguntas em uma; o exemplo que segue ilustra este caso indesejável:

O Sr(a) concorda ou não com a seguinte afirmação:


“OS PRODUTORES AGRÍCOLAS MAIS TECNIFICADOS DEVERIAM SER
ESPECIALIZADOS PARA PRODUZIR PRODUTOS PARA EXPORTAÇÃO E RECEBER
UM TRATAMENTO ESPECIAL DE CRÉDITOS E SUBSÍDIOS POR PARTE DO
GOVERNO”
O entrevistado poderá ter uma opinião favorável em relação à especialização
da produção voltada para o mercado externo, mas pode não estar de acordo
com o tratamento especial, ou vice-versa

d) As perguntas devem ajustar-se às possibilidades de resposta dos respondentes; não devem ser feitas
perguntas difíceis de serem respondidas de forma precisa.

e) É preferível usar estilos de redação curtos, diretos e que não permitam


interpretações erradas, facilitando a compreensão da pergunta e a resposta.
f) Evitar perguntas negativas que possam induzir a erros. Um exemplo ilustra o caso:
34

U P I S – FA C U L D A D E S IN TE G RA DA S
Di reto ri a d e En si no d e Pós -G rad u aç ão
Notas de aula
Projeto de pesquisa. Metodologia do trabalho científico

VOCÊ É PARTIDÁRIO DE NÃO CONTROLAR O MERCADO DE INSUMOS?


______________________________________________________
que insumos?  a pergunta pode ser mal interpretada;
não controlar,  esta construção poderá levar facilmente a erros

g) As perguntas não devem ser direcionadas, nem refletir as opiniões do pesquisador


ou entrevistador em relação a determinado assunto.
h) As perguntas devem ser objetivamente formuladas de tal forma que o entrevistador não seja pressionado
a dar respostas complementares ou fornecer esclarecimento que poderão induzir, de forma voluntária ou
não, à resposta.

i) As perguntas não devem ser muito categóricas a fim de possibilitar que o


entrevistado possa decidir-se por alguma opção, ainda que o pesquisador esteja em
desacordo com ela.
j) As perguntas devem ser cuidadosamente redigidas com base no conhecimento
prévio (nível de instrução, “amigabilidade”, comunicabilidade etc.) da população
entrevistada. Exemplo de uma questão com redação inadequada:

QUANTAS VEZES VOCÊ SONEGA IMPOSTO E UTILIZA O CRÉDITO


SUBSIDIADO PARA OUTRAS ATIVIDADES NÃO CONSIDERADAS PELO
BANCO?

A pergunta está mal formulada e desnecessariamente extensa, pois, por um


lado, supõe que o informante seja sonegador de imposto (o que cria
constrangimento) e utiliza crédito subsidiado e, por outro, se utiliza crédito
subsidiado, que o desvia para outras atividades. Finalmente a pergunta envolve
mais de uma questão, além de tratar sobre assuntos que poderão provocar
reações contra o questionamento e contra o pesquisador.

Uma possível forma alternativa de perguntar é a seguinte:


O SR(A) UTILIZA CRÉDITO SUBSIDIADO? ________________________________
EM QUE ATIVIDADES, DO ANO 1999, UTILIZOU O CRÉDITO? _____________
_________________________________________________________________________________
__________________________________________________________________

DE QUE INSTITUIÇÃO(ÕES) RECEBEU O CRÉDITO COM SUBSIDIO?_______


_________________________________________________________________________________
___________________________________________________________________
35

U P I S – FA C U L D A D E S IN TE G RA DA S
Di reto ri a d e En si no d e Pós -G rad u aç ão
Notas de aula
Projeto de pesquisa. Metodologia do trabalho científico

Em estudo/levantamento complementar o pesquisador descobrirá se o crédito


subsidiado foi ou não devidamente alocado, conforme a orientação e justificativa
do subsidio, na atividade proposta e indicada pelo informante

QUAIS FORAM OS ENCARGOS DE IMPOSTO?_____________________________


_________________________________________________________________________________
________________________________________________________________ou

QUAL FOI O MONTANTE DE IMPOSTOS PAGO EM 1998?__________________


_________________________________________________________________________________
__________________________________________________________________

QUAL FOI A ATIVIDADE TRIBUTADA NESSE ANO?____________________


_______________________________________________________________________________
_______________________________________________________________

Em outro lugar do questionário poderá aparecer uma pergunta como:


QUAL SERIA O VALOR QUE PODERIA SER TRIBUTADO? _______________
_______________________________________________________________________________
_______________________________________________________________

QUAL FOI O VALOR SUJEITO A TRIBUTAÇÃO?__________________________________


________________________________________________________________________________________
________________________________________________________________________

Em pesquisa complementar, o pesquisador poderá descobrir se houve ou não


sonegação e a magnitude da mesma

k) o pesquisador deve ter cuidados com a interpretação que ele faz das respostas do informante. Exemplo de
uma má interpretação:

COM QUE FREQÜÊNCIA O SR(A) ASSISTE ÀS REUNIÕES DA COOPERATIVA


(SINDICATO DA CLASSE ETC.)?:
( ) - Não freqüenta;
( ) - As vezes/de forma irregular/ ....
( ) - Quando o assunto em pauta é .....
( ) - Quando é convencido pelos vizinhos etc.
( ) - Quando tem tempo...
36

U P I S – FA C U L D A D E S IN TE G RA DA S
Di reto ri a d e En si no d e Pós -G rad u aç ão
Notas de aula
Projeto de pesquisa. Metodologia do trabalho científico

A freqüência às reuniões da cooperativa não reflete necessariamente a atitude


do cooperado, o entusiasmo ou motivação de participação, o pró-ativismo, o
engajamento ou à disposição de participação e envolvimento nos problemas da
comunidade e no esforço cooperado para buscar soluções etc., que o
pesquisador poderia inadvertidamente inferir com base nas respostas a esta
pergunta

4.1.1.4 Tipo de pergunta


Outros aspectos de importância no questionário se referem ao tipo de pergunta,
considerando-se três categorias principais:
Perguntas fechadas
Neste tipo de pergunta se apresentam categorias ou alternativas de respostas de
maneira fixas e preestabelecidas (códigos) indicadas ao lado da pergunta na forma de um
gabarito.
Neste tipo de perguntas se encontram:
a) Perguntas com respostas alternativas dicotômicas, as quais são fáceis e rápidas
para aplicar, processar e analisar, além de apresentar poucas possibilidades de
erros.
Exemplos:

SEXO ( ) masculino ou 1 - masculino


( ) feminino ou 2 – feminino
( ) sim ou 1 - sim
( ) não ou 2 – não
( ) correto ( ) dia
( ) errado ( ) noite
etc.

Como desvantagens das perguntas com respostas dicotômicas, relacionam-se as


seguintes:
- podem apresentar erros de medição no tema dicotomizado, quando este, na
realidade, apresentar diversas nuanças entre, por exemplo, a concordância total
e a discordância total;
- por outro lado, questões com respostas dicotômicas são susceptíveis de erros
sistemáticos, dependendo de como a pergunta foi elaborada e de como foi
entendida pelo informante.
37

U P I S – FA C U L D A D E S IN TE G RA DA S
Di reto ri a d e En si no d e Pós -G rad u aç ão
Notas de aula
Projeto de pesquisa. Metodologia do trabalho científico

Exemplo:

Você pagaria mais por um serviço melhorado (abastecimento de água,


saneamento básico, saúde preventiva, transporte coletivo ou qualquer outro
devidamente caracterizado no formulário) que fosse fornecido, pelo mesmo
preço, pelo Governo ou pela empresa privada?

( ) sim ou 1 - sim
( ) não ou 2 – não
( ) não sei ou 3 – não sei

Em quanto seria a disposição para pagar mais?


Qual seria a melhoria do serviço?

Perguntas com respostas múltiplas


Com este tipo de pergunta é possível marcar uma (excludente) ou mais alternativas
(não-excludentes), segundo seja a natureza do tema tratado pela resposta.
Ao formular as perguntas com respostas múltiplas, o pesquisador deve se
preocupar, entre outros aspectos não menos relevantes, com dois: o número de
alternativas oferecidas e os viés de posição, atitude ou forma.
Em alguns casos, as alternativas oferecidas devem atender a princípios básicos, tais
como ser coletivamente exaustivas (incluem todas as possibilidades de respostas) e
mutuamente excludentes (quando o respondente consegue facilmente identificar apenas
uma e só uma alternativa que melhor representaria a sua resposta).
Exemplo:

ONDE O SR., NA MAIORIA DAS VEZES, VENDE A


SUA PRODUÇÃO?
1 - ( ) No mercado central da cidade...
2 - ( ) Na cooperativa...
3 - ( ) Aos intermediários da região...;
4 - ( ) Aos intermediários de outras regiões...
4 - ( ) Na agroindústria local (a ser especificado no formulário)
5 - ( ) Diretamente para o consumidor final
6 - ( ) Ao Governo (Agências do Governo: especificar no formulário)
38

U P I S – FA C U L D A D E S IN TE G RA DA S
Di reto ri a d e En si no d e Pós -G rad u aç ão
Notas de aula
Projeto de pesquisa. Metodologia do trabalho científico

7 - ( ) A outros produtores da região (Especificar)

As alternativas apresentadas nesta formulação devem ser claramente definidas e


delimitadas no tempo e geograficamente, sem possibilidades de que a cooperativa, ou os
intermediários, por exemplo, se localize no mercado central da cidade...
Por outro lado, este tipo de pergunta permite obter outras informações ou detalhes,
dentro da opção especificada ou selecionada pelo respondente, numa seqüência.
Exemplo:

ONDE O SR., VENDE, NA MAIORIA DAS VEZES, E QUANTO,


(quantidade, % etc.) EM CADA OPÇÃO ESCOLHIDA, A SUA
PRODUÇÃO?

LOCAL ONDE VENDE () QUANTO


1 - ( ) Mercado central ( )%
2 - ( ) Cooperativa ( )%
3 - ( ) Intermediários da região ( )%
4 - ( ) Intermediários de outras regiões ( )%
4 - ( ) Na agroindústria local ( )%
5 - ( ) Diretamente ao consumidos final. ( )%
6 - ( ) Ao Governo ( )%
7 - ( ) A outros produtores da região. ( )%

Como principais vantagens das perguntas com respostas múltiplas, relacionam-se as seguintes: fáceis e
rápidas para aplicar, processar e analisar, com poucas possibilidades de erros.
Com principais desvantagens, têm-se: exigem tempo y conhecimento para preparar, adequadamente, todas
as opções de respostas; e podem tender a introduzir viés nos dados pelo fato de as alternativas de respostas
serem oferecidas aos respondentes.

Perguntas com possíveis alternativas de respostas hierarquizadas


O exemplo que se segue ilustre este tipo de pergunta:

COM QUE FREQUÊMCIA VOCÊ USA OS SERVIÇOS DA BIBLIOTECA PARA A


DOCUMENTAÇÃO DE SUAS PESQUISAS E ESTUDOS?
1-( ) Nunca
2-( ) Raramente
39

U P I S – FA C U L D A D E S IN TE G RA DA S
Di reto ri a d e En si no d e Pós -G rad u aç ão
Notas de aula
Projeto de pesquisa. Metodologia do trabalho científico

3-( ) De forma irregular


4-( ) Freqüentemente
5-( ) Sempre

Perguntas com respostas numa escala


Este tipo de questionamento ilustrado e objetivo têm vantagens e desvantagens. As
perguntas com respostas que podem ser localizadas numa escala são orientadas para
determinada clientela (um caso particular do anterior), em que os respondentes são
solicitados a informar que ponto dessa escala melhor corresponde a sua resposta. Essa
escala poderá ser nominal, ordinal ou intervalar.
Na escala nominal os números servem apenas para nomear, identificar ou
categorizar os atributos objeto de pesquisa, como é o caso do número da carteira de
identidade (registro geral) de uma pessoa ou o número da placa de um veículo. Esses
números não têm nenhum outro significado a não ser o de identificar a pessoa ou o objeto
associado ao número.
Exemplo:
Qual é a cor preferida (indicar com um número):
1 Amarelo
2 Azul
3 Branco
4 Preto
5 Marrão
6 Verde
7 Vermelho
8 Outra, qual? ______________________________

Na escala ordinal, os números servem para, além de nomear, identificar ou


caracterizar, ordenar, segundo seja o processo de comparação, as pessoas ou fatos
objeto de estudo, em relação a determinada característica objeto de pesquisa.
Esta escala permite concluir que o objeto A, por exemplo, é maior (ou menor, mais
confortável/menos confortável, preferido/não preferido etc.), que o objeto B, mas não
permite caracterizar a intensidade dessa preferência, na escala.
Exemplo:
40

U P I S – FA C U L D A D E S IN TE G RA DA S
Di reto ri a d e En si no d e Pós -G rad u aç ão
Notas de aula
Projeto de pesquisa. Metodologia do trabalho científico

Dos três tipos de produtos para lavar roupa (marca A “Beleza Pura”, marca B
“Qualidade na Beleza” e marca C “Saúde e Beleza”), qual é o seu preferido,
numa escala de 1o.º, 2o.º e 3o. lugar, em relação aos seguintes atributos?
Perfume preferido:
1o lugar: ______
2o lugar: ______
3o lugar: ______

Cor preferida:
1o lugar: ______
2o lugar: ______
3o lugar: ______

Amaciante preferido:
1o lugar: ______
2o lugar: ______
3o lugar: ______

Lava melhor (conserva a cor, tira a sujeira...):


1o lugar: ______
2o lugar: ______
3o lugar: ______
etc.
Na escala de intervalo os números, além de representar as categorias e a ordem,
definem o quanto que os objetos ou fatos de pesquisa estão distantes entre si em relação
a determinada característica ou atributo objeto de pesquisa. Esta caracterização, com
mais informação que as variáveis nominal e ordinal, permitem comparar diferenças entre
as medições. Exemplo:
Qual é a temperatura registrada na parte da manha, ao médio dia e na tarde, durante a estação
de verão e de inverno?
- Verão:
Manha: _____ ºC
Médio dia: _____ ºC
Tarde: _____.ºC
41

U P I S – FA C U L D A D E S IN TE G RA DA S
Di reto ri a d e En si no d e Pós -G rad u aç ão
Notas de aula
Projeto de pesquisa. Metodologia do trabalho científico

- Inverno:
Manha: _____ ºC
Médio dia: _____ ºC
Tarde: _____.ºC

Em geral, na elaboração de perguntas fechadas, o pesquisador deverá considerar,


entre outros, dois aspectos importantes, a saber:
- as alternativas devem ser exaustivas, isto é, incluir todas as possibilidades que
se podem esperar nas respostas da população em estudo;
- as alternativas devem ser excludentes, isto é, as opções de resposta não
devem apresentar margens de dúvidas quanto a uma ou outras classes que
podem ter o mesmo significado. O seguinte exemplo mostra um caso de
dúvida quanto às respostas (não excludentes):

VOCÊ SE CONSIDERA UM PRODUTOR:


1 - ( ) Tecnificado (com modernas técnicas de produção) e altos níveis de
eficiência
2-( ) De alta tecnologia no processo de produção
3-( ) Medianamente tecnificado
4-( ) Baixo nível de uso de tecnologia moderna
Várias questões críticas poderão ser indicadas nesta formulação, além das
dúvidas e da formulação dupla na primeira questão, tais como, o critério
objetivo de delimitação de uma escala para outra, o aspecto conceitual de
“moderno”, “tecnificado” e “eficiente”, e a referência para delimitar
objetivamente os intervalos ou classes da escala

Algumas das vantagens das perguntas fechadas dizem respeito à facilidade de


codificação, levantamento no campo, economia de tempo, e facilidades de tratamento,
análise e síntese. Por outro lado, se aponta como principal desvantagem a impossibilidade
de apresentar todas as alternativas de possíveis respostas e os “vícios” próprios dos
sistemas de coleta de informação auxiliados por gabaritos.

Perguntas abertas
Levam o entrevistado a responder com frases ou orações e onde o interesse do
pesquisador se centra na elaboração das opiniões, conceitos e explicações de elementos
do problema de pesquisa. Exemplo de questionário de pergunta aberta é:
42

U P I S – FA C U L D A D E S IN TE G RA DA S
Di reto ri a d e En si no d e Pós -G rad u aç ão
Notas de aula
Projeto de pesquisa. Metodologia do trabalho científico

CONFORME A SUA EXPERIÊNCIA COMO DEVERIA SER A SOLUÇÃO DO


PROBLEMA DA DÍVIDA DOS AGRICULTORES DO CRÉDITO RURAL?
_______________________________________________________________________
_______________________________________________________________________________
_______________________________________________________________________________
_______________________________________________________________________________
_______________________________________________

Este tipo de pergunta possibilita ao entrevistado responder com mais liberdade,


expondo suas idéias, experiências e apontando alternativas de solução ou de explicação
do fenômeno.
Como principais desvantagens das perguntas abertas se indicam as dificuldades de classificação e
codificação das respostas, as possíveis limitações do informante em manifestar adequadamente suas
opiniões, suas experiências e as possíveis soluções e a maior duração de tempo no preenchimento do
formulário.
Vantagens ou desvantagens de um e outro tipo de questionário, poderão ser eficientemente aproveitadas
umas ou contornadas outras quando o pesquisador elaborar o questionário com ambos os tipos de
perguntas, conforme a natureza das variáveis em estudo. Nesta elaboração conta a experiência, o
conhecimento da população e a “boa” caracterização do problema de pesquisa.
As técnicas de elaboração do questionário e as técnicas de entrevistas poderão contribuir para o sucesso
deste meio de obtenção de dados e informações primárias.

Os Quadros 2, 3 e 4 apresentam exemplos ilustrativos para orientar a elaboração de


questionários simples, objetivos, padronizáveis e com respostas pré-codificadas,
combinando vários tipos de perguntas, abertas e fechadas, escalas e técnicas de
obtenção da informação.
43

U P I S – FA C U L D A D E S IN TE G RA DA S
Di reto ri a d e En si no d e Pós -G rad u aç ão
Notas de aula
Projeto de pesquisa. Metodologia do trabalho científico

Quadro 2 Exemplo de um formulário com “perguntas fechadas” e “perguntas abertas”

ITEM ESPECIFICAÇÃO
Orientar a coleta de dados na população AAA para realizar a pesquisa visando obter soluções ao
Objetivo problema BBBB (A e B devem ser caracterizados e definidos para este propósito: informar ao público
dos objetivos da pesquisa)
Cada questão é apresentada para responder com um X no quesito que melhor defina a resposta, dentro
da seguinte escala, com duas expressões antônimas e três possíveis opções dentro de cada expressão:
POSITIVO NEGATIVO INSTRUÇÕES
Sistemática Neste campo se especificarão as opções
Extremo Leve

Médio Médio

Leve Extremo

PERGUNTAS RESPOSTAS INSTRUÇÕES


Adequados Inadequados

1 AS MÁQUINA E Aqui poderão especificar-se os critérios para cada um


EQUIPAMENTOS PARA O Modernos Obsoletos dos conceitos ou referências dos atributos, para
TRABALHO SÃO: esclarecer, sem induzir, as respostas

Claros Confusos

2 EM QUE ESCALA E QUAL É A


INTENSIDADE DENTRO DA Especificar os conceitos implícitos na definição das
Específicos Abrangentes
ESCALA, QUE VOCÊ SITUA OS variáveis
OBJETIVOS DA EMPRESA

Factíveis Impraticáveis

PERGUNTA RESPOSTA FECHADA


E S C A L A (%)
Na sua opinião, conforme a missão de
0 10 20 30 40 50 60 70 80 90 100
sua empresa, assinale com X qual
deveria ser a importância relativa dada A soma dos valores atribuídos a cada classe de critérios deve
aos seguintes aspectos:
Totalizar, na vertical, 100%

3 CRITÉRIO DE EFICIÊNCIA TÉCNICA

4 CRITÉRIO DE EFICÁCIA
ADMINISTRATIVA

5 CRITÉRIO DE QUALIDADE DO
PRODUTO E DO PROCESSO

6 CRITÉRIO ECONÔMICO DE
MAXIMIZAÇÃO DE LUCROS
44

U P I S – FA C U L D A D E S IN TE G RA DA S
Di reto ri a d e En si no d e Pós -G rad u aç ão
Notas de aula
Projeto de pesquisa. Metodologia do trabalho científico

Continuação ( b )

Quadro 2 Exemplo de um formulário com perguntas fechadas e perguntas abertas.


PERGUNTAS OPÇÕES INSTRUÇÕES
7 EM QUE PONTO DA ESCALA DA 1 - Baixa Baixa: Inferior a 800 kg/ha (?)
INSTRUÇÃO VOCÊ SITUA A PRODUÇÃO
DO ÚLTIMO PERÍODO? 2 - Média Média entre 801 a 1.200 kg/ha (?)
3 - Alta Alta: Superior a 1.200 kg/ha (?)
__________________________________________________________________________
Justifique a sua resposta: __________________________________________________________________________
__________________________________________________________________________
I M P

8.1 ( ) Uso de produtos químicos


8.2 ( ) Uso e manejo do solo
8.3 ( ) Uso manejo maq./equip.

8 ENTRE OS RECURSOS DE PRODUÇÃO 8.4 ( ) Uso manejo de recursos


AGRÍCOLA E PRÁTICAS INDICADAS, hídricos (Manejo bacias...)
ASSINALE AS TRÊS MAIS IMPORTANTES DA
REGIÃO QUE PODERÃO TER IMPACTOS, E A 8.5 ( ) Uso manejo biodiversidade
INTENSIDADE DESSES IMPACTOS SOBRE O
MEIO AMBIENTE, NA PRÓXIMA DÉCADA 8.6 ( ) Emprego de tecnologias
8.7 ( ) Desmatamento
8.8 ( ) Queimadas
I = Intensivo ou Freqüente

M = Mediano

P= Pouco ou Esporádico

9 HÁ QUANTOS ANOS É PRODUTOR DE (...) Anos


NESTA REGIÃO ?
1 - Sim, de forma regular, cada...
10 RECEBE ASSISTÊNCIA TÉCNICA? 2 - Não
3 - Recebe esporadicamente

PERGUNTAS ABERTAS ESPAÇO PARA AS RESPOSTAS


__________________________________________________________________________
__________________________________________________________________________
11 DESCREVA O PROCESSO DE __________________________________________________________________________
COMERCIALIZAÇÃO EM NÍVEL LOCAL
__________________________________________________________________________
45

U P I S – FA C U L D A D E S IN TE G RA DA S
Di reto ri a d e En si no d e Pós -G rad u aç ão
Notas de aula
Projeto de pesquisa. Metodologia do trabalho científico

a)_________________________________________________________________________
____________________________________________________;
b)_________________________________________________________________________
12 QUAIS SÃO OS TRÊS PRINCIPAIS ____________________________________________________
PROBLEMAS NO PROCESSO DE
PRODUÇÃO AGROINDUSTRIAL?

c)______________________________________________________________
_______________________________________________________________;

Quadro 3 Diversos modelos ilustrativos de formulários para a obtenção de informação primária


ESPECIFICAÇÃO ESPECIFICAÇÃO
Ma Ma NV b
(Marcar com  na coluna da esquerda) (Marcar com  na coluna da esquerda)

- Ativo - Passivo 1-2


- Comunicativo - Introvertido 3-4
- Produtivo - Recreativo 5-6
- Divertido - Triste 7-8
- Leve - Pesado 9 - 10
- Barato - Caro 11 - 12

POR FAVOR MARCAR COM  O TIPO DE SERVIÇO QUE UTILIZA

- Estacionamento interior - Estacionamento exterior 101-102


- Banheiro simples - Banheiro com . . . 103-104
- Telefone com ficha - Telefone com cartão magnético 105-106
- Segurança própria - Segurança pública 107-108
- Serviço de restaurante - Parque de diversão 109-110
- Bar - Livraria (sala de leitura, TV ..) 111-112
- Serviço de saúde - Serviço bancário (correios ... ) 113-114
- Lojas de roupa popular - Lojas de roupa especial 115-116
- lojas de eletrodomésticos - Lojas de computador 117-118

POR FAVOR MARCAR COM  A INTENSIDADE


46

U P I S – FA C U L D A D E S IN TE G RA DA S
Di reto ri a d e En si no d e Pós -G rad u aç ão
Notas de aula
Projeto de pesquisa. Metodologia do trabalho científico

BAIXO MEDIANO ALTO


ESPECIFICAÇÃO NV
BB BM MB MA AM AA

- Custo 1
- Limpeza 2
- Segurança 3
- Atendimento 4
- Espaço disponível 5
- Serviços disponíveis 6

Quadro 3 Diversos modelos ilustrativos de formulários para a obtenção de informação primária

ESPECIFICAR A IMPORTANCIA 
SEM POUCA MEDIA MUITO
DOS SEGUINTES ITENS IMPORT IMPRES NV
IMPORT IMPORT IMPORT IMPORT

- Preço (Custo...) 10
- Conforto (Moradia... ) 11
- Segurança familiar 12
- Emprego (garantia) 13
- Saúde 14
- Amizade 15
- Família 16
- Riqueza 17
- Limpeza 18
- Esporte 20
a b
M = Marcar. NV = Número da variável

Quadro 4 Dois exemplos de formulários de escalas (Likert e Stapel) para a obtenção de dados primários
47

U P I S – FA C U L D A D E S IN TE G RA DA S
Di reto ri a d e En si no d e Pós -G rad u aç ão
Notas de aula
Projeto de pesquisa. Metodologia do trabalho científico

ESCALA LIKERT
Em relação à qualidade do produto (...), assinale com  seu nível de
concordância ou de discordância, nas seguintes frases
PROPOSIÇÕES OU FRASES CT a Cb Ic Dd DT e NS f
É um produto puro
É um produto nutritivo
É feito com ingredientes de alta qualidade
A embalagem protege sua qualidade
Sua embalagem permite fácil manuseio
Permite combinar com outros produtos
Seus efeitos sobre a saúde são menores

Quadro 4 Dois exemplos de formulários de escalas (Likert e Stapel) para a obtenção de dados primários

ESCALA STAPEL
Na escala de 10 pontos, 5 negativos e 5 positivos, indique com 
sua avaliação para os seguintes atributos do produto (...)
NEGATIVA POSITIVA
ATRIBUTOS
-5 -4 -3 -2 -1 1 2 3 4 5
Pureza
Valor nutritivo
Qualidade dos ingredientes
Proteção da embalagem
Manuseio do produto embalada
Possibilidades de combinação
48

U P I S – FA C U L D A D E S IN TE G RA DA S
Di reto ri a d e En si no d e Pós -G rad u aç ão
Notas de aula
Projeto de pesquisa. Metodologia do trabalho científico

Efeitos sobre a saúde


a
Concordância total. b Concordância. c Indiferente. d
Discordância. e Discordância total
49

U P I S – FA C U L D A D E S IN TE G RA DA S
Di reto ri a d e En si no d e Pós -G rad u aç ão
Notas de aula
Projeto de pesquisa. Metodologia do trabalho científico

ESTATÍSTICAS PARA A ANÁLISE DESCRITIVA


Definição

A estatística7 descritiva (ou dedutiva) consiste na definição de que e de como coletar, classificar, ordenar,
integrar/complementar, descrever, sumarizar e caracterizar os dados e informações primárias de um certo fato ou
fenômeno objeto de estudo, sem a preocupação de obter conclusões ou inferências mais profundas acerca do
relacionamento entre esses dados com os dados de grupos maiores (estudo preliminar exploratório). Essa descrição ou
análise exploratória se faz mediante procedimentos e ferramentas de ilustração e por estatísticas descritivas adequadas
às condições da pesquisa, tais como: tabelas, quadros, gráficos, figuras, mapas (ilustrações) e indicadores numéricos
(estatísticas descritivas).

A análise exploratória (Encyclopedia of Statistical Sciences, v.2, 1982, p. 579-582) é freqüentemente utilizada
para uma análise preliminar de dados e informações primárias levantadas pelo pesquisador, com vistas a explorar o
comportamento e relacionamento destes. Esta análise compreende duas fases:

a) A primeira é a exploratória ou exame preliminar dos dados em que se trata da identificação de comportamentos e
de características destes, preparando-os para as análises mias detalhadas. Corresponde, em geral, ao primeiro
contato do pesquisador com os dados, precedendo qualquer escolha de técnica ou modelo. Parte desta análise é
indispensável para a criação de banco de dados e sistemas de informações. Uma importante característica desta
fase da análise é a sua flexibilidade, dispensando as considerações de pressupostos e estruturas de técnicas e
modelos da estatística analítica.

b) A segunda fase (confirmatória) da análise exploratória concentra-se na reprodução de efeitos e comportamentos


implícitos nos dados e que devem ser evidenciados pelos métodos da pesquisa. Esta fase está estreitamente
relacionada com a tradicional estatística inferencial, incluindo informações de outras análises.

Importância da Análise Exploratória

A importância está no fato de permitir descrever e compreender as relações e comportamentos de


atributos, num nível preliminar exploratório. Tais descrições feitas de forma rápida, objetiva e limitada a
certo grupo, fato ou fenômeno, constituem-se importantes informações para as análises inferenciais mais
detalhadas (estatística analítica) e abrangentes. Este fator deve ser destacado com o crescimento e a
complexidade dos dados e informações primárias de uma economia e atividade sociocultural mais dinâmica
e globalizada.

7
O termo estatística pode compreender dois conceitos, segundo seja utilizado o termo em singular ou plural. Quando utilizado em
plural, é sinônimo de dados numéricos, enquanto que no singular, a estatística é entendida como uma disciplina constituída por um
conjunto de princípios, técnicas e métodos objeto de estudo. É uma parte da matemática aplicada que se ocupa dos dados de
observação. Isso ocorre mediante métodos de análise e de projeções realizadas por diversos procedimentos da estatística descritiva
até os cálculos matemáticos da estatística analítica
50

U P I S – FA C U L D A D E S IN TE G RA DA S
Di reto ri a d e En si no d e Pós -G rad u aç ão
Notas de aula
Projeto de pesquisa. Metodologia do trabalho científico

Por outro lado, a estatística descritiva auxilia a tomada de decisões, de maneira mais rápida e eficaz,
para fazer as mudanças, aproveitar as oportunidades e preparar-se para enfrentar os desafios, quando se torna
possível ou é facilitado o controle de mais dados e informações primárias em mais curtos espaços de tempo e
de forma mais eficiente (sistemas de informação e banco de dados consistidos e integrados).

O uso da estatística descritiva ocorre no dia-a-dia para sumarizar dados, compreendendo grande
número de variáveis, discretas e contínuas, e nominais, ordinais, intervalares e de razão.

Na pesquisa, a análise descritiva precede as análises mais detalhadas e fundamenta a formulação de


hipóteses, bem como facilita a escolha de técnicas e métodos para especificar o inter-relacionamento
detalhado dos dados feito na análise inferencial.

A importância da estatística descritiva é destacada em muitos programas de coleta, síntese e análise 8 de


dados, que o pesquisador encontrará na literatura especializada. Neste Manual é suficiente indicar apenas
algumas dessas técnicas e ilustrações descritivas.

Objetivos da Análise Exploratória

Apresentar técnicas e métodos estatísticos utilizados na pesquisa descritiva e em estudos de


diagnósticos para ordenar, descrever e compreender as relações de comportamento e evolução das variáveis
objeto de estudo, bem como para auxiliar os cada vez mais complexos processos de tomada de decisões
quando estes estejam fundamentados em dados consistidos.

Parte dos processos de tomada de decisão, conforme se indicou no primeiro Capítulo deste Manual, se
orienta para responder que, por que, para que/para quem e como pesquisar? de forma coerente com a missão
e os recursos disponíveis e alocados no processo de pesquisa. Mediante as técnicas e métodos da estatística
descritiva caracterizam-se o problema e a solução do problema, segundo o esquema geral apresentado na
Figura 2.

8
Um desses programas (“software”) é o SAS (SAS - System for Elementary Statistical Analysis e SAS – System for Statistical
Graphics) entre muitos outros.
51

U P I S – FA C U L D A D E S IN TE G RA DA S
Di reto ri a d e En si no d e Pós -G rad u aç ão
Notas de aula
Projeto de pesquisa. Metodologia do trabalho científico

Origem Coleta dos dados


Evolução Pesquisa documental

Caracterização do
problema de pesquisa Crítica dos dados para
suprir valores, eliminar erros...

Análise descritiva:
Fatos Banco de dados para facilitar - Indicadores Numéricos: IN
Elemento análises cruzadas, integração... - Ilustrações: Gráficos,
Quadro...
- Integração (IN e GQ)

RELATÓRIO
RELATÓRIO
- Síntese
- Síntese
- Ilustrações
- Ilustrações

Figura 2 Etapas do método estatístico descritivo para a pesquisa descritiva

A identificação, delimitação e caracterização do problema de pesquisa deve ser clara e compreensível


para o estudante-pesquisador, desde o início do processo, com a utilização da análise descritiva aplicada aos
dados que definem o problema para pesquisa. Essa compreensão, aliada a outros fatores, deve orientar as
fases subseqüentes, equilibradas e inter-relacionadas da pesquisa.

Os atributos objeto de estudo (elementos do problema para pesquisa) deve ser avaliado e conformado
com o conceito de variável (introdução ao problema de pesquisa), identificando as fontes de informações e
procedendo ao tratamento dos dados primários (representatividade, consistência, deflação etc.). Esta etapa é
facilitada pela tecnologia da informação.

Após a coleta de dados primários e secundários é necessário fazer uma revisão (avaliação) crítica
destes, de modo a suprir valores, completar séries ou eliminar erros capazes de provocar distorções na
análise e interpretação da informação, bem como para facilitar a integração dos dados quando estes se
apresentam em eqüivalentes níveis de detalhamento e qualidade (resistência, análise de resíduos e
transformação, quando necessário).
52

U P I S – FA C U L D A D E S IN TE G RA DA S
Di reto ri a d e En si no d e Pós -G rad u aç ão
Notas de aula
Projeto de pesquisa. Metodologia do trabalho científico

A disposição dos dados consistidos e integráveis em sistemas de informação e banco de dados é uma
etapa cada vez mais importante nas empresas de pesquisa, a qual é facilitada pelas modernas técnicas e pelas
tecnologias da informação. Em sistemas integrados de informações o pesquisador poderá utilizar programas
como o SAS e os GIS para georeferenciar, se for o caso, e integrar dados, bem como para realizar as
correspondentes análises referidas aos atributos espaciais objeto de pesquisa.

Algumas das técnicas utilizadas para sumarizar dados da análise descritiva são apresentadas no Quadro 2.

Quadro 2 Relação entre o tipo de variável e a técnica de sumarização a


TIPO DE E S TAT Í S T I C A TA B E L A D E GRÁFICOS ANALISE
b
VA R I Á V E L D E S C R I T I VA FREQÜÊNCIA (BARRA...) EXPLORATÓRIA

Nominal NS c   NS
Ordinal  c
  NS
Intervalar    
Razão    
a
SCHLOTZHAUER , Sandra D. e LITTELL, Ramon C. SAS System for elementary satatistical analysis. Cary: SAS. 1987, p. 68.
b
A conceituação dos tipos de variáveis é apresentada em aula
c
NS= Não se aplica.  = Indicada como apropriada

Ilustrações
Na pesquisa socioeconômica, principalmente na fase de análise exploratória, é freqüente o uso de ilustrações
(tabela, quadro, figura, mapa, imagem de satélite/fotografia, gráfico, diagramas etc., dependendo da natureza dos dados,
da finalidade da ilustração e do público alvo do documento), utilizadas pelo pesquisador para colocar em evidência
visual o comportamento, evolução ou inter-relacionamento de poucas variáveis, destacando um (ou poucos) atributo(s).

O destaque do atributo pode ser feito em cores ou com recursos gráficos dos mais variados (tonalidades de cinza,
pontilhado, listrado em várias direções de forma simples ou combinada, pontilhado, com símbolos etc.) encontrados nos
editores de texto.

A análise gráfica é uma forma de comunicação que, quando utilizada de forma criteriosa pelo pesquisador,
facilita o processo de comunicação ao permitir transferir (comunicar) os resultados da pesquisa de forma simples e
objetiva, abrindo o caminho, em muitos casos, para a apresentação de resultados da parte analítica.

Em geral, a análise gráfica é utilizada para:

a) Reconhecer e ter o primeiro contato com o problema para pesquisa, especialmente quando se têm muitas
informações e é necessário uma primeira síntese de estas para orientar posteriores ações, inclusive, as de
pesquisa.
53

U P I S – FA C U L D A D E S IN TE G RA DA S
Di reto ri a d e En si no d e Pós -G rad u aç ão
Notas de aula
Projeto de pesquisa. Metodologia do trabalho científico

A representação gráfica, uma das ilustrações mais utilizadas em estudos socioeconômicos, tem como propósito,
dar uma idéia imediata dos resultados obtidos, permitindo chegar-se a conclusões rápidas sobre o fenômeno que
se estuda. Para que tal propósito seja atingido, o pesquisador ao construir um gráfico deverá ter em conta fatores
como simplicidade, clareza e veracidade.

A representação gráfica é o modo mais simples e direto de descrever a realidade em seus aspectos mensuráveis: é
um desenho que representa um ou mais (poucos) atributo(s) referentes a determinado aspecto da realidade ou
assunto que se quer destacar, tal como o valor atual de uma variável, a diferença entre dois valores, uma
tendência ou a diferença entre duas tendências (uma interação).

Esse desenho gráfico da realidade constitui também um instrumento de síntese que permite utilizar o meio visual
do leitor para apresentar, de forma objetiva, determinado atributo. Nessa apresentação o pesquisador deverá ter
especiais cuidados para não distorcer ou relevar aspectos (introduzir viés).

Na construção de um gráfico há três conceitos básicos a ter-se em conta: o eixo, a origem e a escala.

O eixo é o segmento de reta ou determinada área da base planar sobre a qual é definido o sentido de leitura das
variáveis. É em função desse sentido que se define a origem. Se o eixo é horizontal, é conveniente definir as
magnitudes ou valores positivos do atributo à direita da origem e as magnitudes ou valores negativos, à esquerda
do mesmo. Se o eixo for vertical, será positivo para cima da origem e negativo para baixo dele (Gráfico 1).

Sobre o eixo se distribuem, conforme o domínio da variável, os valores de medida que deverão ser eqüidistantes
(escalas simples aritmética) ou conforme a convenção adotada (logarítmica e semilogarítmica, por exemplo).

A escala representa a relação que existe entre a grandeza do atributo e a sua representação no eixo ou plano,
devendo ser cuidadosamente definida para não transmitir falsas impressões da magnitude ou de relações das
variáveis.

Os problemas de compreensão do fato ou fenômeno alvo de pesquisa aumentam com o aumento do número de
variáveis. Neste sentido, as técnicas de estatísticas podem são agrupadas para uma, duas ou mais escalas,
correspondendo, respectivamente às análises univariadas, bivariadas ... multivariadas, utilizando-se, em cada
escala, diversas técnicas de análise gráfica de reconhecimento.

O pesquisador pode ser orientado, para fazer seus gráficos, por referências documentais como a de Schmid e
Schmid (1979), Struk e White (1979), Schmid (1983), Chambers (1983), Cleveland (1985) e Kosslyn (1989),
entre outros autores citados por SAS (1991) que apresentam princípios básicos, detalhes de construção no
equilíbrio e harmonia, seleção de linha e padrões de estilo etc., para uma grande variedade de ilustrações,
gráficos, quadros e técnicas de cartografia.

Parte das anteriores orientações são complementadas com outras, obtidas, principalmente da ABNT (1988
xxxxxxxxx) e IBGE (1978, 1979 xxxxx) as quais são ilustradas, com exemplos, neste Manual.

Ilustrar textos com gráficos é uma das atividades que a maioria dos pesquisadores realiza, em muitos casos com
a falsa impressão de que estes não requerem instruções técnicas para a sua elaboração (Wainer e Thissen 1981,
citados por SAS, op. cit.).
54

U P I S – FA C U L D A D E S IN TE G RA DA S
Di reto ri a d e En si no d e Pós -G rad u aç ão
Notas de aula
Projeto de pesquisa. Metodologia do trabalho científico

A Q = -3 + 2x
6
Q
4 B Q = 8 – 2X + X2
Quarto Quadrante
2
Primeiro Quadrante

R$ Perdas Benefício R$
-14 -12 -10 -8 -6 -4 -2 0 2 4 6 8 10 12 (X)
(Y) -2

Terceiro Quadrante Segundo Quadrante


-4

-6

No sistema de coordenadas retangulares, a representação de uma equação linear ou de uma a equação de 2 º grau
(parábola) podem ser facilmente representadas pelas linhas A e B

X2
X1

Gráfico 1 Eixos, escalas o origem de gráficos

b) Para estudos exploratórios em que não são requeridos detalhamentos ou maiores níveis de informações entre
(para) as variáveis.
55

U P I S – FA C U L D A D E S IN TE G RA DA S
Di reto ri a d e En si no d e Pós -G rad u aç ão
Notas de aula
Projeto de pesquisa. Metodologia do trabalho científico

As ilustrações, especialmente gráficos da análise exploratória das pesquisas e estudos neste nível, auxiliam
detectar comportamento ou observações não-usuais nos dados; fazer diagnósticos das principais propriedades
destes, referidos a determinada situação problematizada; sugerir transformações nos dados que facilitem as
análise posteriores; estabelecer hipóteses; orientar a escolha e teste de métodos e modelos, entre outras
finalidades.

As técnicas de ilustrações da análise descritivo geralmente não requerem pressupostos acerca das propriedades
dos dados, mas com base no comportamento destes é possível sugerir um ou outra técnica, bem como testar a
adequabilidade da mesma a determinadas condições de pesquisa, conforme ilustra o Gráfico 2, para o caso de
regressionar salário (Y) com idade (X) de um jogador de futebol.

Nuvem de pontos das


observações salário - idade
Logaritmo de salário (Y)
8,0
7,5
7,0
6,5
6,0

16 19 22 25 28 Mais Idade (X)


a a a a a de (Anos)
18 21 24 27 30 31

Gráfico 2 Salário (R$/mês) e idade de jogador profissional de futebol no Brasil

c) Elaborar testes e construir/adequar modelos a determinada realidade ou cenário, entre outros aspectos do
planejamento da pesquisa;

d) Comunicar e persuadir, especialmente na apresentação de resultados em simpósio, congresso ou reuniões de


trabalho em que o pesquisador geralmente utiliza formas ilustrativas de comunicação para apresentar suas
informações;
56

U P I S – FA C U L D A D E S IN TE G RA DA S
Di reto ri a d e En si no d e Pós -G rad u aç ão
Notas de aula
Projeto de pesquisa. Metodologia do trabalho científico

A parte que segue apresenta exemplos ilustrativos de diversos tipos de gráficos utilizados com freqüência na
apresentação de resultados de pesquisa.

a) Gráfico de linhas, é um dos mais utilizados devido à sua facilidade de execução e de interpretação, com a
vantagem de clarificar as relações existentes entre as variáveis, em especial de séries cronológicas, apesar de não
ser tão preciso como o quadro e outras ilustrações.

b) Gráfico de barras que pode apresentar a evolução de uma variável ao longo do tempo, ou várias variáveis em um
determinado período (Gráfico 3), colocando os valores em um dos eixos (horizontal, no exemplo que segue) na
forma de um retângulo ou cubo alongado, diferenciando-se uma de outra variável por cores ou por destaques
gráficos, símbolos ou outras formas. Os gráficos de barra permitem fazer comparações simultâneas de duas ou
mais variáveis, ou entre grupos de variáveis, como no exemplo do Gráfico 3, com seis tipos de variáveis
agrupadas em três conjuntos. No gráfico de barras também é possível combinar séries temporais com duas ou
mais variáveis em cada unidade de tempo do período, permitindo fazer comparações em mais de um sentido. O
Gráfico 3 apresenta duas possíveis formas alternativas de comparações no ano e ao longo de um período, para o
caso de três variáveis.

c) Gráficos de setores em que as variáveis são representadas por setores proporcionais aos correspondentes valores
individuais num círculo. Esta representação é utilizada quando se pretende comparar cada valor com o total. O
Gráfico 4 ilustra este tipo de representação.
d) Gráfico polar, em que os dados das variáveis são representados por meio de polígonos em torno de determinados
anelos concêntricos. Os raios da circunferência delimitam os períodos e a distância do centro o valor da variável.
O Gráfico 5 representa um exemplo deste tipo de gráfico.
e) Gráfico triangular, baseado na construção de um triângulo equilátero em cujos lados são dispostos os valores das
variáveis para fazer comparações simultâneas de três características de uma mesma população, em especial,
quando esses três atributos formam um conjunto de elementos que podem ser desagrados e apresentados como
uma proporção desse conjunto. Os exemplos apresentados no Gráfico 6 mostram duas formas alternativas (I e
II) de construção deste tipo de ilustração.

Na primeira, a representação de um ponto qualquer (por exemplo P), é feita conforma as coordenadas desse
ponto, nos três eixos, que correspondem aos lados do triângulo.

No segundo tipo de representação, os eixos deixam de ser os lados do triângulo e passam a ser as bissetrizes dos
ângulos opostos. Cada uma dessas bissetrizes constitui uma escala de o a 100% na qual se localiza o valor de
cada atributo, conforme se indica no Gráfico.

f) Pictograma, é um tipo de gráfico em que os valores das variáveis são representados por figuras ou símbolos
sugestivos, relacionados com o problema de estudo e cujas dimensões deverão ser proporcionais às freqüências
observadas. (Gráfico 7).
57

U P I S – FA C U L D A D E S IN TE G RA DA S
Di reto ri a d e En si no d e Pós -G rad u aç ão
Notas de aula
Projeto de pesquisa. Metodologia do trabalho científico
Produção (t) de Trigo (T), Milho (M) e Arroz (A)

Trigo

Milho

Arroz

1980 1984 1988 1992 1996 Ano ( T )

Trigo
Produção (t) de Trigo (T), Milho (M) e Arroz (A)

Milho

Arroz

Ano ( T )
1980 1984 1988 1992 1996

Gráfico 3 Evolução da produção de trigo, milho e arroz no período 1980 a 1996


58

U P I S – FA C U L D A D E S IN TE G RA DA S
Di reto ri a d e En si no d e Pós -G rad u aç ão
Notas de aula
Projeto de pesquisa. Metodologia do trabalho científico

21%
Setor
42% Primário

Secundário

Terciário

37%

Gráfico 4 Distribuição da população economicamente ativas por setores

10 20 30

Gráfico 5 Demonstrativo de vendas médias no período 1980-96 do produto X


59

U P I S – FA C U L D A D E S IN TE G RA DA S
Di reto ri a d e En si no d e Pós -G rad u aç ão
Notas de aula
Projeto de pesquisa. Metodologia do trabalho científico

I 40% de A II
P 42% de B
28% de C
100% c
Atributo B

At r i b u t o B
100% 0

Atribut o A
10 90
Atributo A

20 80
a%
30 70
40 60
50 50 0% a 0% b
60 40 b%
70 P 30
80 20
90 10 P
100% 0
100% b 100% a
0 10 20 30 40 50 60 70 80 90 100% 0% c
c% At r i b u t o C At r i b u t o C

Gráfico 6 Duas formas alternativas de representação de atributos em gráficos triangulares

 

Gráfico 7 lustração de um pictograma


60

U P I S – FA C U L D A D E S IN TE G RA DA S
Di reto ri a d e En si no d e Pós -G rad u aç ão
Notas de aula
Projeto de pesquisa. Metodologia do trabalho científico

Estatísticas descritivas
As estatísticas (parâmetros para o caso da população e estatísticas quando se trata da amostra) devem satisfazer
determinados critérios, sintetizados a seguir:

a) Objetividade, entendida como a tendência de julgar pelos fatos e fenômenos do objeto de pesquisa sem
deixar-se influenciar pelos sentimentos ou preconceitos a cerca dos mesmos;

b) Dependência de todas as observações quando estas representam estatisticamente a população amostrada;

c) Significado preciso para a sua interpretação, facilitado quando o pesquisador tem claros e precisos conceitos
teóricos e a definição do problema de/para pesquisa é objetiva e delimitada;

d) Facilidade de estimativa e manejo no cálculo algébrico;

e) Consistência ou pouca variabilidade às variações de amostragem.

As estatísticas de uso freqüente na pesquisa socioeconômica, muitas delas utilizadas de forma conjunta com
outras e com diversas formas de ilustrações, são:

a) Medidas de localização;

b) Medidas de dispersão;

c) Medidas de assimetria;

d) Medidas de curtose;

e) Medidas de concentração.

A parte que segue descreve e ilustra com exemplos essas medidas.


61

U P I S – FA C U L D A D E S IN TE G RA DA S
Di reto ri a d e En si no d e Pós -G rad u aç ão
Notas de aula
Projeto de pesquisa. Metodologia do trabalho científico

Medidas de localização ou de tendência central


É freqüente e muito útil para descrever ou sumariar um conjunto de dados estatísticos mediante um valor
estimado (estatística de localização), escolhido de acordo com as características dos dados, tais como distribuição de
freqüência da amostra, objetivos do estudo, nível de precisão que se deseja etc.

As medidas de tendência central incluem, além da média (que pode ser aritmética, geométrica e harmônica), a
moda e a mediana. As características dessas medidas são apresentadas no Quadro 3.

Outras medidas de tendência que permitem localizar, não sua posição central, os valores da variável, são os
quantis, decis, quartis e percentis, conceitualizados e ilustrados a continuação:

a) quartis; corresponde aos valores da variável que dividem a distribuição de freqüência dos dados amostrais em
quatro partes iguais, conforme se ilustra a seguir:

100%
0% 25% 50% 75%
fi
Q1 Q2 Q3 Q4 xi

em que,
Q1 é igual ao valor da variável com um número de observações de até 25%;
Q2 terá a metade das observações, à sua direita e a outra metade, à sua esquerda, coincidindo com a mediana;
Q3 é um valor tal que à sua esquerda concentrar-se-ão 75% das observações e à sua direita os restantes 25%.
(Um exemplo de primeiro e terceiro quartil é apresentado na Tabela 3).

b) Os decis (D); são valores de localização da variável que dividem a distribuição de freqüência em dez partes
iguais. Um exemplo ilustrativo é apresentado na Tabela 6.1, com detalhamento, em nota de rodapé, sobre o
cálculo dos decis.
62

U P I S – FA C U L D A D E S IN TE G RA DA S
Di reto ri a d e En si no d e Pós -G rad u aç ão
Notas de aula
Projeto de pesquisa. Metodologia do trabalho científico

Quadro 3 Síntese das principais características das medidas de tendência central (localização)

MEDIDA CARACTERÍSTICAS

Como principais propriedades têm-se: a soma algébrica dos desvios de um conjunto de valores [x1, x2,
x3,..., xn] de uma variável, em torno da média aritmética, é zero; e a soma dos desvios ao quadrado é
mínima quando tais desvios são estimados em relação a média aritmética. Estas propriedades matemáticas
revelaram-se importantes na estatística.
Principais desvantagens: trata-se de uma medida influenciada pelos valores observados extremos. Qualquer
alteração num desses valores pode produzir uma modificação na média que poderá tomar um valor
diferente dos observados.
O valor da média poderá apresentar viés devido apenas a alguns valores extremos, podendo não ser
representativa se a distribuição for assimétrica.
Em distribuições, com classes abertas, a média poderá apresentar um viés, especialmente quando não se
tem informação acerca dos os limites dessas classes.
1 Média aritmética É a medida de tendência central mais eficiente quando se trata de inferir sobre uma população a partir de
uma amostra estatística obtida de uma população normal ou aproximadamente normal (verificada pelo
(Fórmulas 1 a 5) teste correspondente).
Para o caso de uma amostra com dados não agrupados, utiliza-se a fórmula 2. Em outros casos, as fórmulas
empregadas serão 4 e 5. As ilustrações de um e outro caso são apresentadas no texto
Como principais vantagens tem-se a facilidade de cálculo e interpretação, além de utilizar toda a
informação disponível.
A média aritmética ( x ) representa um valor artificial da característica ou atributo que se estuda,
representado por uma variável mensurável intervalar ou de razão (veja Quadro 6.1), atribuído a cada um
dos elementos [x1, x2, x3,..., xn] da população (ou amostra que a representa) em um processo de
generalização. Para que seja válida (rigor técnico) essa generalização é necessária considerar quais são as
características estatísticas da população (distribuição para o caso de uma amostra sem agrupamento, ponto
médio que representa o intervalo da classe etc.).

Como principais vantagens têm-se o fato de utilizar toda a informação disponível, desde que a variável não
apresente valores nulos ou negativos. Os valores extremos têm um menor efeito sobre a média que no
caso da média aritmética.
2 Média É especialmente recomendada para sintetizar dados de fenômenos cujas variações são proporcionais a um
geométrica valor inicial, como é o caso das taxas de variações. Por outro lado, é mais difícil de calcular e interpretar
quando, para n>2, forem utilizados logaritmos, conforme se indica pela fórmula (6).
(Fórmula 6) Como principais desvantagens relacionam-se a impossibilidade de se aplicar quando a variável toma
valores nulos ou negativos. Poderá ser um valor que não corresponde a nenhum valor da variável, a
semelhança do caso da média aritmética.
63

U P I S – FA C U L D A D E S IN TE G RA DA S
Di reto ri a d e En si no d e Pós -G rad u aç ão
Notas de aula
Projeto de pesquisa. Metodologia do trabalho científico

Continuação
Quadro 3 Síntese das principais características das medidas de tendência central (localização)

MEDIDA CARACTERÍSTICAS

3 Média É recomendada em situações em que pode-se observar certa proporcionalidade inversa nos dados como nos
harmônica casos de fenômenos de velocidade média e o custo médio de bens comprados com uma quantia fixa.
(Fórmula 7)
É fácil de calcular e de compreender. É determinada pelo número de observações e não pelo seu valor; desse
modo, os valores extremos, grandes ou pequenos, não afetam o seu valor.
Pressupõe que as freqüências se distribuem uniformemente dentro de cada classe.
4 Mediana
É muito utilizada sobretudo em distribuições assimétricas, porém, para fins de inferência, não satisfaz as
propriedades de um bom estimador.

É outra medida de localização cuja definição atende o significado semântico da palavra. Com efeito, na análise
descritiva para socioeconomia, moda é um fenômeno de massa em que certa característica comportamental
ou um fato (atributo de interesse no estudo) domina os membros de uma comunidade. Do ponto de vista
matemática, a moda pode ser traduzida pela expressão maximizante local de um determinado atributo, Esta
característica pode ser posta em evidência mediante um diagrama de barra em que a intensidade é
representada pela freqüência relativa, sendo a moda o maior valor dessas freqüências.
Como principal vantagem tem-se a facilidade de calcular e interpretar, além de não ser afetada por valores
5 Moda extremos. É de uso menos freqüentes que a média e a mediana.
Em algumas distribuições esta medida não existe, enquanto que em outras existe mais que uma moda
(multimodal).
Pode ser utilizada em qualquer situação, mesmo quando a distribuição está definida em classes abertas.
Como principal desvantagem relaciona-se não poder ser definida com rigor e o seu valor exato ser, muitas
vezes, incerto.

Se a média aritmética é uma medida de posição de um conjunto de dados que leva em consideração apenas os
valores observados de um atributo, os percentis, em contrapartida, tomam em conta a ordenação dessas
observações. Assim, para um conjunto de dados dispostos em ordem de grandeza, o valor médio (ou a média
6 Quantis:
aritmética dos dois valores médios) que divide o conjunto em duas partes iguais é a mediana, enquanto que
decis, quartis
os valores que dividem o conjunto de observações em quatro, dez ou cem partes iguais são,
e percentis
respectivamente, os quartis (Q), os decis (D)e os percentis (P), representados por [Q1, Q2, .., Q4], [D1,
D2,...,D10] e [P1, P2,...,P100]. O D5 e o P50 correspondem à mediana; o P25 e P75 correspondem a Q1 e Q3 e
assim por diante.
64

U P I S – FA C U L D A D E S IN TE G RA DA S
Di reto ri a d e En si no d e Pós -G rad u aç ão
Notas de aula
Projeto de pesquisa. Metodologia do trabalho científico

Média aritmética da população para dados desagregados:


N
xi 1
x1  x 2  x 3  ...x N
  i1
N N

Média aritmética de uma amostra da população para dados desagregados:


n
xi 2
x1  x 2  x 3  ....  x n
X  i1
n n
O preço médios de oito modelos de camisetas (T-shirt) em um shopping de Brasília, é calculado com base nos
dados apresentados na Tabela 1
Tabela 1 Preços de oito modelos de camisetas no shopping
XXX de Brasília. Dezembro 1998.
PREÇO
MODELO
R$/Unidade

1 Simples 6,50
2 Ronaldinho 11,20
3 Roberto Carlos (jogador) 10,75
4 Guga 10,00
5 Julio Iglesias 12,50
6 Madonna 12,50
7 Animais do Pantanal 16,20
8 Animais da Amazônia 14,60

Preço médio (R$) 11,78

Desvio-padrão 2,95

Amplitude total (R$) 6,20

Média aritmética ponderada (fator pi) da população para dados desagregados:


65

U P I S – FA C U L D A D E S IN TE G RA DA S
Di reto ri a d e En si no d e Pós -G rad u aç ão
Notas de aula
Projeto de pesquisa. Metodologia do trabalho científico


N
pi xi
 i1 f i x i
N 3
p i 1
N
em que, fi = pi / N

Quando os dados são apresentados em uma tabela de freqüência, os valores individuais não são conhecidos.
Neste caso, a média aritmética utiliza uma fórmula simplificada, gerando o mesmo resultado conforme se observa no
exemplo ilustrativo da Tabela 2.

A pressuposição de que o ponto médio do intervalo da classe representa adequadamente esse intervalo está
baseada na uniformidade da distribuição ao longo do intervalo. Esta pressuposição é admissível quando se tem grandes
amostras e as freqüências são numerosas. No exemplo apresentado na Tabela 2 se observa certa discrepância o que gera
um pequeno viés na estimativa da média.
Tabela 2 Dados agrupados e dados desagrupados de um levantamento Amostral, a e estimativas da média aritmética

INTERVALO FREQ. VALOR VALORES MÉDIA


(fi) (XM) (fi) (X)
(kg) ( fi ) MÉDIO (XM) INDIVIDUAIS (X)

10  20 3 15,00 45,00 11, 12, 16 13,00 39

20  30 6 25,00 150,00 21, 23, 25, 25, 28 25,17 151


e 29

30  40 3 35,00 105,00 33, 35 e 37 35,00 105

40  50 2 45,00 90,00 43 e 46 44,50 89

Total 14 390,00 384 384

Média 27,86 27,43 27,43


a
Fonte: xxxxx (19xx)

Média aritmética ponderada (fator pi) de uma amostra da população para dados desagregados:

X 
n
pi xi
 i 1 f i x i
i 1
n 4
n
em que, fi = pi / n

pi é o fator de ponderação de i-ésimo valor de X.


66

U P I S – FA C U L D A D E S IN TE G RA DA S
Di reto ri a d e En si no d e Pós -G rad u aç ão
Notas de aula
Projeto de pesquisa. Metodologia do trabalho científico

Média aritmética para dados agregados (apresentados em intervalos de freqüência):

5
 
n n
x cc j f j / n  cc jh j
j 1 j 1

em que, hj = fj / n

CCj é a média do intervalo da j-ésima classe

Média geométrica (MG) de uma amostra da população para dados desagregados:

6a

n
MG  n x1 .x2 .x3 .....xn  n
i 1
xi , para xi >0.

log.M G  log i 1 xi  n
 1
n
n
n
 n
n

 1 log i 1 xi  1 i 1 log .xi
6b

M  ant. log 1  n n
i 1
log xi  6c

Média geométrica (MG) de uma amostra da população para dados agregados:


M G  ant. log i 1 f i log xi
n
 6d
67

U P I S – FA C U L D A D E S IN TE G RA DA S
Di reto ri a d e En si no d e Pós -G rad u aç ão
Notas de aula
Projeto de pesquisa. Metodologia do trabalho científico

Tabela 3 Distribuição de freqüência da variável peso de produção de (...) registrado no Parque Agroindustrial de
Brasília para diferentes tipos de controle (...), e estimativas de quartis. 1999 a
PESO
FREQÜÊNCIA ACUMULADA
(kg “Peso Seco”) NÚMERO FREQÜÊNCIA
I N T E R VA L O PESO ( n ) ( % )
DECI S b
MÉDIO
4,04
20,00  35,00 27,50 12 4,O4
9,76
35,00  50,00 42,50 17 5,72
24,57 D1 = 50,08
D2 = 53,49
50,00  65,00 57,50 44 14,81
D3 = 56,90

46,79
65,00  80,00 72,50 66 22,22
69,69 D4 = 75,00
80,00  95,00 87,50 68 22,90 D5 = 85,12

85,18
95,00  110,00 102,50 46 15,49
95,62
110,00  125,00 117,50 31 10,44
100,00
125,00  140,00 132,50 13 4,38
 297 100,00

x ( ponderada) 82,15
a
Fonte: Dados primários obtidos do Departamento de Produção da AgroAgnia(1998)
b
O primeiro, o segundo, o terceiro, ... e o nono decis são obtidos mediante a contagem dos n/10, 2n/10, 3n/10, ... e 9n/10 casos, a partir
do menor intervalo de pesos.
No caso do primeiro decil (D1), o valor de localização da produção é obtida mediante a contagem de n/10 = 297/10 = 29,7 casos, a
partir dos primeiros estratos de produção (n1 + n2) que contém 29 casos (9,76% dos casos), devendo-se considerar 0,24 (10,00 – 9,76)
dos 44 casos registrados no terceiro estrato.
Para o segundo decil (D2), o valor da produção é obtido mediante a contagem de 2n/10 = 59,40 casos, devendo-se considerar 10,24
(20,00 – 9,76) dos 44 casos registrados no terceiro estrato.
Para o terceiro decil (D3), o valor da produção é obtido mediante a contagem de 3n/10 = 89,10 casos, devendo-se considerar 20,24
(30,00 – 9,76) dos 44 casos registrados no terceiro estrato.
Para o quarto decil (D4), o valor da produção é obtido mediante a contagem de 4n/10 = 118,80 casos. Até o terceiro estrato tem-se 74
casos. Portanto, é necessário considerar 44,00 (118,00 – 74,00) casos do quarto estrato que contém 66 elementos amostrais.
Para o quinto decil (D5), o valor da produção é obtido mediante a contagem de 5n/10 = 148,6 casos. Até o quarto estrato tem-se
registrado 139 elementos. Portanto, é necessário considerar 9,6 (148,60 – 139,00) casos dos 68 registrados no quinto estrato.
Dessa maneira e aplicando a fórmula apresentada no Quadro 6.1, tem-se:
D1 = 50,00 kg + ( 0,24/44) x (15 kg) = 50,08 kg 
D2 = 50,00 kg + (10,24/44) x (15 kg) = 53,49 kg 
D3 = 50,00 kg + (20,24/44) x (15 kg) = 56,90 kg 
D4 = 65,00 kg + (44,00/66) x (15 kg) = 75,00 kg 
D5 = 80,00 kg + ( 9,60/68) x (15 kg) = 85,12 kg 
68

U P I S – FA C U L D A D E S IN TE G RA DA S
Di reto ri a d e En si no d e Pós -G rad u aç ão
Notas de aula
Projeto de pesquisa. Metodologia do trabalho científico

Medidas de Dispersão
Nas medidas de localização considera-se apenas um aspecto da distribuição e caracterização de uma variável.

Para uma caracterização mais completa do atributo em estudo é necessário especificar, junto com uma das
medidas de localização, uma medida, apropriada ao caso de estudo, que dê uma indicação da dispersão dos valores da
variável. Com essa indicação define-se a representatividade da medida de localização pela intensidade com que os
valores observados da variável se afastam da medida de tendência central.

As medidas de dispersão podem ser agrupadas em categorias, assim:


a) Medidas de distância, com seus valores nas mesmas unidades de medida dos dados originais da variável que
representa o atributo em estudo; nesta medida não há cálculo prévio de uma medida de localização da variável
em estudo. Exemplos são o intervalo de variação e o intervalo interquartis.
a.1) O intervalo de variação (IV) é definido como a diferença entre os valores máximo (XMAX) e mínimo (XMIN)
da variável, definido pela expressão:

IV = XMAX – XMIN (7)

A utilização do IV tem como principal vantagens sua simplicidade de cálculo, e como principal desvantagem,
o fato de considerar apenas os valores extremos da variável. Portanto, esta estatística não é sensível aos
valores intermediários, isto é, não considera a variabilidade dos restantes valores assumidos pela variável.
Exemplos são mostrados na Tabela 4.

a. 2) Intervalo interquartis (IIq), definido como a diferença entre o terceiro e o primeiro quartis e corresponde a
um intervalo que compreende 50% das observações centrais da variável em estudo, definido pela expressão:

(8)
IIq = Q3 – Q1

A utilização do IIq tem como desvantagem não ser influenciado por metade dos valores observados que se
encontram nos extremos da distribuição de freqüência.
Exemplo: Com os dados apresentados na Tabela 5 foi estimado o IIq = R$1.060.
69

U P I S – FA C U L D A D E S IN TE G RA DA S
Di reto ri a d e En si no d e Pós -G rad u aç ão
Notas de aula
Projeto de pesquisa. Metodologia do trabalho científico

Tabela 4 Dispêndios em C&T no Brasil durante o período 1990 – 1995 a


DISPÊNDIO EM C&T
PIB
ANO (DC&T) DC&T/PIB
(US$ Bilhões de 1995)
(%)
1990 592,00 4,17 0,70
1991 593,40 4,11 0,69
1992 588,80 3,31 0,56
1993 613,00 4,70 0,77
1994 648,60 5,00 0,77
1995 675,80 6,00 0,88
IV 83,80 1,83 0,18
17,39 0,59 0,038
TENDÊNCIAb
(r2 = 0,82) (r2 = 0,59) (r2 = 0,45)
a
MCT (1996) [Indicadores Nacionais de Ciência & Tecnologia 1990 – 1995. Brasília: MCT/CNPq. 1996. p. 16
b
A estimativa da tendência é linear(r2=coeficiente de determinação)

Tabela 5 Distribuição de freqüência de salário dos professores da UniverTag em 1999 a


FREQÜÊNCIA
SALÁRIOS SALÁRIO NÚMERO FREQÜÊNCIA
ACUMULADA
R$ b /mês MÉDIO ( n ) ( % )
QUARTIS
800  1.200 1.000 6 6,0 6,0
1.200  1.600 1.400 10 10,0 16,0
1.600  2.000 1.800 15 15,0 31,0 1.840C
2.000  2.400 2.200 19 19,0 50,0
2.400  2.800 2.600 21 21,0 71,0 2.900d
2.800  3.200 3.000 16 16,0 87,0
3.200  3.600 3.400 9 9.0 96,0
3.600  4.000 3.800 4 4,0 100,0
 100
a
Fonte: Dados primários obtidos da Secretaria de Recursos Humanos da UniverTag (1998).
b
Os valores nominais foram ajustados pelo índice...
c
O primeiro quartil (Q1) é o salário obtido mediante a contagem de n/4 = 100/4 = 25 casos, a partir dos primeiros estratos de
salários. Como os dois primeiros estratos (n1 + n2) contém 16 casos, deve-se considerar 9 (25 – 16) dos 15 casos registrados no
terceiro estrato. Dessa maneira e aplicando a fórmula correspondente, tem-se:
Q1 = R$1.6000 + (9/15)(R$400) = R$1.840 
d
O terceiro quartil (Q3) é calculado mediante a contagem dos primeiros (3n/4 = 75) casos. Como os primeiros quatro estratos
contém 71 casos, então é necessário considerar 4 casos da amplitude do seguintes estrato (neste exemplo as amplitudes são
constantes = R$400). Dessa forma, tem-se:
Q3 = R$2.800 + (4/16) (R$400) = R$2.900 
70

U P I S – FA C U L D A D E S IN TE G RA DA S
Di reto ri a d e En si no d e Pós -G rad u aç ão
Notas de aula
Projeto de pesquisa. Metodologia do trabalho científico

É mais freqüente, como medida de dispersão, o uso da amplitude semi-inerquartílica, definida como IIq / 2.
b) Medidas de distância em que se utiliza uma medida de localização (média aritmética, mediana, moda...) como
termo de comparação ou referência. Exemplos destas são o desvio absoluto médio, a variância e o desvio-
padrão, ilustradas a seguir.
b.1) O desvio médio absoluto (DMA), utilizado nos casos em que os desvios de cada uma das observações (Xi)
são considerados em relação a média aritmética x , isto é (Xi - x ).
No Quadro 2 foi indicado que o somatório algébrico desses desvios é zero. Assim, para ter-se uma idéia do
comportamento dos desvios (Xi - x ), existem duas alternativas: a primeira, apresentar o conjunto dos
desvios em termos absolutos ou, a segunda, elevar ao quadrado tais desvios; a primeira define o desvio
absoluto médio e a segunda, a variância.
Quando os dados são desagregados, o DMA é calculado pela seguinte expressão:

DMA = [ |Xi - | ] / N 9a

DMA = [ |Xi - x | ] / n
9b
Enquanto que para dados agregados na forma de uma tabela de freqüência, o DMA é a média aritmética dos
desvios dos valores da variável relativamente à sua média, sendo definido pela seguinte expressão:

DMA =  fi |Xic - x | / n 9c

onde,
Xi é o valor da i – ésima observação;
x e  é a estimativa da média aritmética obtida de uma amostra de n elementos e a média da população
composta de N elementos, respectivamente;
Xic é o ponto médio do intervalo em que a variável foi reduzida;
Fj é a freqüência das variáveis correspondente a j - éssima classe ou intervalo.
Outra referência utilizada para o cálculo dos desvios poderia ser a mediana, gerado-se um índice com um valor
mínimo.
O DMA é uma medida de dispersão não-negativa, em que quanto maior o seu valor, maior será a dispersão da
variável
O exemplo apresentado na Tabela 6 mostra duas estatísticas de localização calculas com dois procedimentos
diferentes, com resultados diferentes, em função das pressuposições implícitas em e outra técnica de cálculo.
71

U P I S – FA C U L D A D E S IN TE G RA DA S
Di reto ri a d e En si no d e Pós -G rad u aç ão
Notas de aula
Projeto de pesquisa. Metodologia do trabalho científico

Tabela 6 Dados agrupados e dados desagrupados de um levantamento


amostral,a e estimativas da média aritmética e da variância
VALORES MÉDIA VARIANÇA
INTERVALO FREQ. VALOR
(fi) (XM) INDIVIDUAI (fi) (X)
(kg) ( fi ) MÉDIO (XM)
S
(x ) (s 2 )
10  20 3 15,00 45,00 11, 12, 16 13,00 39 -
20  30 6 25,00 150,00 21, 23, 25, 25, 25,17 151 -
28 e 29
30  40 3 35,00 105,00 33, 35 e 37 35,00 105 -
40  50 2 45,00 90,00 43 e 46 44,50 89 -
Total 14 - 390,00 384 - 384 -
Média - 27,86 27,43 - 27,43 -

Dados desagrupados (valores individuais) 113,95


Variância
Dados agrupados (valores em intervalos ou estratos) 91,85
a
Fonte: XXXXX (1998)


k
Disposição dos dados para calcular a variância a partir de dados agrupados: x 
j 1
fjx j / n = 27,857

|xi – x |
xi fi xi fi d fi x i2 x i2 fi
=d
15 3 45 12,857 38,571 225 675
25 6 150 2,857 17,141 625 3750
35 3 105 7143 21,429 1225 3675
45 2 90 17,143 34,286 2025 4050

 111,42
k
14 390 4100 12150
j1 8


n
s2  [
j1
x 2j f j ]  ( x ) 2 ] / n = 12150 / 14 – (27,857)2= 867,86 – 776,01 = 91,85

 
n n
s2  1 ( xi  x ) 2  di2 = 113,95
n 1 i 1 i 1

Analisar as pressuposições (bases teóricas) de uma e outra técnica e testar a aderência dessas técnicas às
condições de pesquisa (base prática), é uma das tarefas básicas do pesquisador na escolha apropriada de
técnicas e métodos de síntese e análise de dados.
b.2) Variância (s2) e desvio-padrão (s) de um conjunto de dados (uma amostra, por exemplo) é definida como o
quadrado dos desvio em torno da média aritmética.
Para o caso de dados desagregados a variância é calculada por uma das seguintes fórmulas alternativas (10a para
a população e 10b ou 10c para o caso de uma amostra estatística):
72

U P I S – FA C U L D A D E S IN TE G RA DA S
Di reto ri a d e En si no d e Pós -G rad u aç ão
Notas de aula
Projeto de pesquisa. Metodologia do trabalho científico

 2  I1 ( x i  ) 2 / N
N
10a

 (x  x) /(n  1)
n
s2  i
2
i 1

...   d /(n  1)
n 10b
2
i 1

n 1 
x / n  (
n n
...  (n )[ 2
i x i / n) 2 ]
i 1 i 1

em que,


n
i1
x i2 / n indica a media dos quadrados dos diferentes valores de xi, enquanto que o segundo termo,
(
n
i1
x i / n) 2 indica o quadrado da média dos diferentes valores de xi
Para o caso de amostras com n>30 elementos, a última expressão do conjunto (10b) pode ser simplificada na
seguinte forma:

 
n n
s 2  [( x12 / n)  ( x i / n) 2 ]
i 1 i 1
10c

O estimador assim calculado constitui um estimador não-tendecioso ou centrado para o verdadeiro parâmetro da
população (2), propriedade que é importante para o propósito de generalizar os resultados para a toda a
população representada por uma amostra estatística
Para o caso de dados agregados (amostra em que não se conhecem os valores individuais) e considerando que a
variação da amplitude do intervalo de cada classe seja igual, a fórmula utilizada para estimar a variância é:
isto é, a variância é definida como a diferença entre a média aritmética do quadrado dos valores da variável xj


m
s2  f j ( x j  x) 2 10d
j 1

...  
m
f j x j  ( x) 2
j 1

(f jx 2
j ) e o quadrado da média aritmética (x ) 2 .

Onde,
xj é o ponto médio do intervalo da classe cuja freqüência é dada por fj, sendo m o número total de freqüência (m=
f
m

j
j ).

O pressuposto básico é que todos os valores compreendidos em um dado intervalo ou classe tem como ponto
médio xj. Esta pressuposição, em alguns casos, não é válida, introduzindo, quando se aplica a fórmula (10d)
certo viés como se observa com as estimativas apresentadas na Tabela 2. Nos casos em que os intervalos de
73

U P I S – FA C U L D A D E S IN TE G RA DA S
Di reto ri a d e En si no d e Pós -G rad u aç ão
Notas de aula
Projeto de pesquisa. Metodologia do trabalho científico

classe dos dados agrupados sejam desiguais, o pesquisador deverá ajustar a fórmula para corrigir possíveis
distorções.
O desvio-padrão é definido como a raiz quadrada da variância, constituindo-se o menor valor quando a
referência para estimar os desvios de xi for a média aritmética.
O desvio-padrão é a medida mais utilizada, com propriedades matemáticas que a tornam apropriada para a
inferência estatística. Esta medida é afetada por todos os valores das observações da amostra. A semelhança do
que ocorre com a média aritmética, o desvio-padrão pode ser influenciado por apenas alguns valores extremos,
pelo que não é recomendado seu uso em distribuições assimétricas
b.3) Medidas de dispersão relativa. As medidas de dispersão apresentadas acima são medidas em termos absolutos,
isto é, medidas que dependem das unidades em que se expressa a variável (por exemplo, a s2 da variável peso
(kg2), cumprimento (m2), e receita (R$ 2) etc., com seus respectivos desvio-padrão: kg, m, R$ etc. Esta
característica é limitante quando se trata de comparação da dispersão de duas ou mais distribuições, sobretudo se
estas estiverem especificadas em unidades de medidas diferentes (peso: kg, lb, t etc.), ou se as mediadas forem
diferentes. Nestes casos devem utilizar-se medidas de dispersão relativa.
As medidas de dispersão relativa podem ser definidas por:
11
Dispersãorelativa  (Dispersão..absoluta)
(Média)
No caso em que a dispersão absoluta seja o desvio-padrão e a média seja a média aritmética, a dispersão relativa,
denominada coeficiente de variação (CV), é definido pela seguinte expressão:

CV  s 100 12
x

ou CV  s (%)
x

Exemplo: Numa empresa o salário médio dos homens é de R$680, com


desvio-padrão de R$120, enquanto que o das mulheres, para
iguais ou equivalentes atividades, é de $R520, com desvio-
padrão de $R105. Que se pode inferir desse caso?

Solução:
As estimativas dos CV para os trabalhadores (CVH) e para as
trabalhadoras (CVM), é:
CVH = 120 / 680 = 17,65
CVM = 105 / 520 = 20,19
74

U P I S – FA C U L D A D E S IN TE G RA DA S
Di reto ri a d e En si no d e Pós -G rad u aç ão
Notas de aula
Projeto de pesquisa. Metodologia do trabalho científico

Com estes resultados é possível concluir que os salários das


mulheres apresentam uma maior dispersão relativa que os
salários dos homens

Quais são as pressuposições implícitas nessa medida de dispersão? A definição das estatísticas s e x estão
sujeitas a determinados pressupostos, entre outros, o da normalidade da distribuição, que deverão ser observados
na definição do coeficiente. Por ser uma medida adimensional (independente das unidades de medidas adotadas)
o CV pode ser utilizado para a comparação de distribuições cujas unidades podem ser diferentes. Entretanto,
quando a medida de localização é próximo de zero, ele deixe de ser útil.
Em termos práticos, coeficientes de variação superior a 50% indicam alto grau de dispersão relativa e,
consequentemente, uma menor representatividade da média aritmética como medida estatística. Para valores do
coeficiente de variação inferiores a 50%, a média será tanto mais representativa quanto menor seja a estimativa
desse coeficiente.
Se não há nenhuma pressuposição quanto à distribuição dos dados amostrais ou da população da qual foram
obtidos esses dados e é conveniente a utilização de quantis para caracterizar a localização e a dispersão da
variável, então poderá definir uma medida de dispersão relativa. Por exemplo, a partir dos quartis, é possível
definir:

uma medida de tendência central: [½(Q1 – Q3)]


uma medida de dispersão absoluta, pela amplitude semi-interquartílica: [½(Q3 – Q1)]

Assim, a dispersão relativa DRq, com essas pressuposições, é dada por:


DRq = [Dispersão absoluta / Média] = [½ (Q3 – Q1)] / [½ (Q1 – Q3)]
13
= [(Q3 – Q1)] / [(Q1 – Q3)]
Outra medida relativa, neste caso de especial importância estatística para a comparação de distribuições, é a variável
reduzida (Z), que mede o desvio em relação à média, expressa em unidades de desvio-padrão pela seguinte equação:

14
Z  ( xi  x )
s
Exemplo. Em uma prova de econometria um estudante obteve qualificação de 75,
em que a média do grupo foi de 72 e o desvio padrão 8. Na prova de estatística,
para a qual a nota média do grupo foi 80 e o desvio-padrão 11, ele recebeu a
nota 84. Em que disciplina sua posição relativa foi mais elevada?
Solução:
A solução deste problema pode ser obtida mediante a aplicação da variável
reduzida Z que mede o desvio de X em relação a média, em termos de desvio-
75

U P I S – FA C U L D A D E S IN TE G RA DA S
Di reto ri a d e En si no d e Pós -G rad u aç ão
Notas de aula
Projeto de pesquisa. Metodologia do trabalho científico

padrão s. Para o caso considerado das disciplinas do estudante aplicado na


parte analítica, esses desvios são:
ZECONOM = (75 – 72) / 8 = 0,13
ZESTAT= (84 – 80) / 11 = 0,36
Dessa forma, conclui-se que o estudante recebeu uma qualificação
correspondente a 0,36 do desvio-padrão acima da média, na disciplina de
estatística, mas apenas o correspondente a 0,13 do desvio-padrão acima
da média, em econometria. Dessa forma, seu desempenho foi mais alto em
estatística

Medidas de Concentração
Em muitas situações da análise descritiva em que determinado atributo se pode distribuir de modo mais (até a
plena regularidade na distribuição, onde cada elemento da população detém igual parcela do atributo) ou menos (até a
concentração máxima, onde um elemento da população detém todo o atributo) uniforme é necessário utilizar uma
medida de concentração. Com essa medida pode-se avaliar a concentração de renda, de riqueza, de áreas de
exploração agrícola em determinada atividade, de salários, de meios de produção etc., mas em fatos e fenômenos
como idade, peso ou altura das pessoas não é possível aplicar essa medida.

A análise do nível de concentração da distribuição de freqüência de um atributo (representado por uma


variável) pode ser feito graficamente pela curva de Lorenz, ou mediante um indicador numérico como o Índice de
Gini. Estas duas técnicas são apresentadas e ilustradas na parte que segue.

Curva de Lorenz

Esta curva é feita com as freqüências acumuladas dos elementos da população (amostra) que possuem
determinada característica (yi acum) e da característica considerada no estudo (xj acum), conforme ilustra o Gráfico 8.

Conforme seja a natureza do problema, a distribuição do atributo dentro das classes e o rigor de precisão que
se deseja no estudo, o pesquisador poderá idealizar relações empíricas para definir ou ter aproximações quanto ao
nível de concentração do atributo em estudo. Uma das possíveis relações empíricas para uma análise preliminar, é
apresentada nos gráficos ilustrativos B, C e D do Gráfico 8.
76

U P I S – FA C U L D A D E S IN TE G RA DA S
Di reto ri a d e En si no d e Pós -G rad u aç ão
Notas de aula
Projeto de pesquisa. Metodologia do trabalho científico

0 10 20 30 40 50 60 70 80 90 100%

m
acum.f j x / fj
j 1

Curva de Lorenz

a: 50% da área plantada


Área de pertence a 18% dos
b proprietários
Concentração
b:50% dos proprietários
possuem 90% da área
plantada
a

Proprietários (x)
0 10 20 30 40 50 60 70 80 90 100%


m
acum..f j y / fj
j1

D
B C
100%
50%

L0
L1 L1 L0
L0 L1
Área Plantada (y)
0%

100%
50%
0
100%

100%
50%

50%
0

O Gráfico B apresenta No caso do Gráfico C O Gráfico D


a distribuição um pouco (quase) a concentração é mais elevada uma mostra um exemplo de elevada
uniforme: a 50% dos indivíduos vez que a 50% dos indivíduos concentração: 50% dos indivíduos
corresponde 42% do atributo em corresponde 22% do atributo em possuem apenas 8% do atributo.
estudo. Esta relação, no caso de estudo. P. ex., o setor agrícola é A relação L1 / L0 = 0,40
comparação com gráficos na abastecido em 50% de sues produtos O critério de avaliação, para esta
mesma escala, pode ser indicada por apenas 22% dos produtores, ou, relação empírica, é que quanto
por um índice. Uma primeira ainda, 88% dos produtores são mais próximo de zero seja o valor
aproximação, definido pela responsáveis por menos de 50% da estimado, maior será a
relação (L1 / L0), é estimada, produção desse setor. A relação L1 / concentração do atributo,
para este caso, em 0,84 (Não se L0 = 0,58. porquanto maior é o afastamento
trata do Índice de Gini) A relação anterior pressupõe uma da curva da reta de igual
certa simetria da desuniformidade em distribuição
relação à linha de igual distribuição

Gráfico 8 Ilustração da Curva de Lorenz


77

U P I S – FA C U L D A D E S IN TE G RA DA S
Di reto ri a d e En si no d e Pós -G rad u aç ão
Notas de aula
Projeto de pesquisa. Metodologia do trabalho científico

1.4.3.2 Índice de Gini

Baseado na observação da curva de Lorenz de que quanto maior a concentração de um atributo nos
elementos da população ou num estrato de uma amostra, mais a curva se afastará da reta de igual distribuição.

Gini propôs um índice para mediar o grau dessa concentração, definido pela seguinte expressão:

 
m 1 m 1
(p j  q j ) qj
15
j 1 j 1
IG   1
 
m 1 m 1
pj pj
j 1 j 1

em que:

IG é a estimativa do Índice de Gini;

m é o número de classes;

acum.f j .x
pj 

m 1
fj
j 1

acum.f j .y
qj 

m 1
fj
j 1

A estimativa do IG pode variar entre 0 e 1, sendo nulo quando em todas as classes houver igual distribuição
do atributo ( x ) em estudo nos elementos ( y ) da população (amostra), e com valor máximo de 1,00 quando todos
os atributos estão concentrados nos indivíduos da última classe.

Exemplo: Determinada empresa do setor industrial, produtora


de pecas, quer estudar, para auxiliar a definição de política de
marketing, como se distribuem as suas vendas, se de igual forma
entre pequenas, médias ou grandes empresas compradoras. Para tal
propósito organizou sus compradores em 11 classes conforme
aparece na Tabela 7, utilizando, como indicador, o número de
empregados e o volume de compra dessas empresas no período
1998/99.
78

U P I S – FA C U L D A D E S IN TE G RA DA S
Di reto ri a d e En si no d e Pós -G rad u aç ão
Notas de aula
Projeto de pesquisa. Metodologia do trabalho científico

Tabela 7 Dados agrupados da caracterização de empresas compradoras de peças e


estimativa de medidas de localização, dispersão e concentração a
NÚMERO VOLUME acum.f j .x acum.f j .y
NUMERO DE FREQÜÊNCIA FREQÜÊNCIA pj  q j  m 1
 
DE DE m 1
EMPREGADOS ACUMULADA ACUMULADA
(CLASSES: X)
EMPRESAS VENDA
(acum. fj - %) (acum. fj) fj fj
(Xj - fj) R$ b: Y) j 1 j 1

Menos de 25 12 6,42 38,50 12 6,42 38,50 0,064 0,027

25  50 18 9,62 72,42 30 16,04 110,92 0,160 0,077

50  75 24 12,83 98,78 54 28,88 209,70 0,289 0,146

75  100 31 16,58 156,66 85 45,45 366,36 0,454 0,256

100  125 30 16,04 256,78 115 61,50 623,14 0,615 0,435

125  150 27 14,44 312,45 142 75,94 935,59 0,759 0,654

150  175 22 11,76 189,67 164 87,70 1.125,26 0,877 0,786

175  200 16 8,56 190,66 180 96,26 1315,92 0,963 0,919

Mais de 200 7 3,74 115,50 187 100,00 1.431,42 1,000 1,000


-
Total 187 1.431,42 - - -
Média 177,35
Desvio-padrão 41,36


m
( f j .. / x j .e.y j ) 4,181 3,300
j 1

a
Fonte: xxxxxx(1998)
b
Unidades de R$1.000, deflacionado pelo índice xxxxx


m 1
qj
j 1
IG  1   1 – (3,300 / 4,181) = 0,211

m 1
pj
j 1

Solução: Pela estimativa do coeficiente de Gini de 0,21 conclui-se que as


vendas da empresa que produz peças para o mercado do setor industrial estão
relativamente bem distribuídas entre os diversas tamanhos das empresas
compradoras, com um volume médio de vendas de R$177.350, desvio-padrão de R$41.360
e coeficiente de variação de 23,23%.

Medidas de Dispersão
Nas medidas de localização considera-se apenas um aspecto da distribuição e caracterização de
uma variável.
79

U P I S – FA C U L D A D E S IN TE G RA DA S
Di reto ri a d e En si no d e Pós -G rad u aç ão
Notas de aula
Projeto de pesquisa. Metodologia do trabalho científico

Para uma caracterização mais completa do atributo em estudo é necessário especificar, junto com uma das
medidas de localização, uma medida, apropriada ao caso de estudo, que dê uma indicação da dispersão
dos valores da variável. Com essa indicação define-se a representatividade da medida de localização pela
intensidade com que os valores observados da variável se afastam da medida de tendência central. As
medidas de dispersão podem ser agrupadas em categorias, assim:
a) Medidas de distância, com seus valores nas mesmas unidades de medida dos dados originais da
variável que representa o atributo em estudo; nesta medida não há cálculo prévio de uma medida de
localização da variável em estudo. Exemplos são o intervalo de variação e o intervalo interquartis.
a.1) O intervalo de variação (IV) é definido como a diferença entre os valores máximo (XMAX) e
mínimo (XMIN) da variável, definido pela expressão:

(7)
IV = XMAX – XMIN

A utilização do IV tem como principal vantagem sua simplicidade de cálculo, e como principal
desvantagem, o fato de considerar apenas os valores extremos da variável. Portanto, esta estatística
não é sensível aos valores intermediários, isto é, não considera a variabilidade dos restantes valores
assumidos pela variável. Exemplos são mostrados na Tabela 8.
a. 2) Intervalo interquartis (IIq), definido como a diferença entre o terceiro e o primeiro quartis e
corresponde a um intervalo que compreende 50% das observações centrais da variável em estudo,
definido pela expressão:

(8)
IIq = Q3 – Q1

A utilização do IIq tem como desvantagem não ser influenciado por metade dos valores observados
que se encontram nos extremos da distribuição de freqüência.
Exemplo: Com os dados apresentados na Tabela 9 foi estimado o IIq = R$1.060.
80

U P I S – FA C U L D A D E S IN TE G RA DA S
Di reto ri a d e En si no d e Pós -G rad u aç ão
Notas de aula
Projeto de pesquisa. Metodologia do trabalho científico

Tabela 8 Dispêndios em C&T no Brasil durante o período 1990 – 1995 a


PIB DISPÊNDIO EM C&T
ANO (DC&T) DC&T/PIB
(US$ Bilhões de 1995)
(%)
1990 592,00 4,17 0,70
1991 593,40 4,11 0,69
1992 588,80 3,31 0,56
1993 613,00 4,70 0,77
1994 648,60 5,00 0,77
1995 675,80 6,00 0,88
IV 83,80 1,83 0,18
TENDÊNC 17,39 0,59 0,038
IAb (r2 = 0,82) (r2 = 0,59) (r2 = 0,45)
a
MCT (1996) [Indicadores Nacionais de Ciência & Tecnologia 1990 – 1995. Brasília: MCT/CNPq. 1996. p.
16
b
A estimativa da tendência é linear(r2=coeficiente de determinação)

Tabela 9 Distribuição de freqüência de salário dos professores da UniverTag em 1999 a


SALÁRIOS SALÁR NÚMER FREQÜÊN
FREQÜÊNCIA ACUMULADA
IO O CIA
R$ b /mês ( % ) QUARTIS
MÉDIO ( n )
800  1.200 1.000 6 6,0 6,0

1.200  1.600 1.400 10 10,0 16,0

1.600  2.000 1.800 15 15,0 31,0 1.840C

2.000  2.400 2.200 19 19,0 50,0

2.400  2.800 2.600 21 21,0 71,0 2.900d

2.800  3.200 3.000 16 16,0 87,0

3.200  3.600 3.400 9 9.0 96,0

3.600  4.000 3.800 4 4,0 100,0

 i 1 Classes
nclasses
100

a
Fonte: Dados primários obtidos da Secretaria de Recursos Humanos da UniverTag (1998). b Os valores nominais foram ajustados
pelo índice...c O primeiro quartil (Q1) é o salário obtido mediante a contagem de n/4 = 100/4 = 25 casos, a partir dos primeiros
estratos de salários. Como os dois primeiros estratos (n1 + n2) contém 16 casos, deve-se considerar 9 (25 – 16) dos 15 casos
registrados no terceiro estrato. Dessa maneira e aplicando a fórmula correspondente, tem-se:
Q1 = R$1.6000 + (9/15)(R$400) = R$1.840 
d
O terceiro quartil (Q3) é calculado mediante a contagem dos primeiros (3n/4 = 75) casos. Como os primeiros quatro estratos contém
71 casos, então é necessário considerar 4 casos da amplitude do seguintes estrato (neste exemplo as amplitudes são constantes
= R$400). Dessa forma, tem-se:
Q3 = R$2.800 + (4/16) (R$400) = R$2.900 
81

U P I S – FA C U L D A D E S IN TE G RA DA S
Di reto ri a d e En si no d e Pós -G rad u aç ão
Notas de aula
Projeto de pesquisa. Metodologia do trabalho científico

É mais freqüente, como medida de dispersão, o uso da amplitude semi-inerquartílica, definida como IIq /
2.
b) Medidas de distância em que se utiliza uma medida de localização (média aritmética, mediana,
moda...) como termo de comparação ou referência. Exemplos destas são o desvio absoluto médio, a
variância e o desvio-padrão, ilustradas a seguir.
b.1) O desvio médio absoluto (DMA), utilizado nos casos em que os desvios de cada uma das
observações (xi) são considerados em relação a média aritmética x , isto é (Xi - x ).
No Quadro 6.2 foi indicado que o somatório algébrico desses desvios é zero. Assim, para ter-se
uma idéia do comportamento dos desvios (xi - x ), existem duas alternativas: a primeira,
apresentar o conjunto dos desvios em termos absolutos ou, a segunda, elevar ao quadrado tais
desvios; a primeira define o desvio absoluto médio e a segunda, a variância.
Quando os dados são desagregados, o DMA é calculado pela seguinte expressão:

DMA  [Ni1| x i   |] / N 9

DMA  [ni1| x i  x |] / n 9a

Enquanto que para dados agregados na forma de uma tabela de freqüência, o DMA é a média
aritmética dos desvios dos valores da variável relativamente à sua média, sendo definido pela
seguinte expressão:

DMA  kj1 f j | x jc  x | / k 9c

onde,
xi é o valor da i – ésima observação;
x e  são, respectivamente, a estimativa da média aritmética obtida de uma amostra de n
elementos e a média da população composta de N elementos;
Xjc é o ponto médio do j-éssimo intervalo em que a variável foi reduzida para k classes;
fj é a freqüência de valores da variável contidos na j - éssima classe ou intervalo.
Outra referência utilizada para o cálculo dos desvios poderia ser a mediana, gerado-se um índice com
um valor mínimo.
O DMA é uma medida de dispersão não-negativa, em que quanto maior o seu valor, maior será a
dispersão da variável
O exemplo apresentado na Tabela 10 mostra duas estatísticas de localização calculas com dois
procedimentos diferentes, com resultados diferentes, em função das pressuposições implícitas em e
outra técnica de cálculo.
82

U P I S – FA C U L D A D E S IN TE G RA DA S
Di reto ri a d e En si no d e Pós -G rad u aç ão
Notas de aula
Projeto de pesquisa. Metodologia do trabalho científico

Analisar as pressuposições (bases teóricas) de uma e outra técnica e testar a aderência dessas
técnicas às condições de pesquisa (base prática), é uma das tarefas básicas do pesquisador na
escolha apropriada de técnicas e métodos de síntese e análise de dados.
b.2) Variância (s2) e desvio-padrão (s) de um conjunto de dados (uma amostra, por exemplo) é definida
como o quadrado dos desvio em torno da média aritmética.
Para o caso de dados desagregados a variância é calculada por uma das seguintes fórmulas alternativas
(10a para a população e 10b ou 10c para o caso de uma amostra estatística):

 2  I1 ( x i  ) 2 / N
N
10a

s 2  i 1 ( xi  x ) 2 /( n  1)
n

...  i 1 d 2 /( n  1)
n

n  1 i 1 i
...  ( n x 2 / n  (i 1 xi / n) 2 ]
n n
)[ 10b
em que,

n
i1
x i2 / n indica a media dos quadrados dos diferentes valores de xi, enquanto que o segundo


n
termo, ( i1
x i / n) 2 da expressão (10b) indica o quadrado da média dos diferentes valores de xi
83

U P I S – FA C U L D A D E S IN TE G RA DA S
Di reto ri a d e En si no d e Pós -G rad u aç ão
Notas de aula
Projeto de pesquisa. Metodologia do trabalho científico

Tabela 10 Dados agrupados e dados desagrupados de um levantamento


amostral,a e estimativas da média aritmética e da variância

VALORES MÉDIA VARIANÇA


INTERVALO FREQ. VALOR
(fi) (XM) INDIVIDUAI (fi) (X)
(kg) ( fi ) MÉDIO (XM)
S
(x ) (s 2 )
10  20 3 15,00 45,00 11, 12, 16 13,00 39 -
20  30 6 25,00 150,00 21, 23, 25, 25, 25,17 151 -
28 e 29
30  40 3 35,00 105,00 33, 35 e 37 35,00 105 -
40  50 2 45,00 90,00 43 e 46 44,50 89 -
Total 14 - 390,00 384 - 384 -
Média - 27,86 27,43 - 27,43 -

Dados desagrupados (valores individuais) 113,95


Variância
Dados agrupados (valores em intervalos ou estratos) 91,85
a
Fonte: XXXXX (1998)


k
Disposição dos dados para calcular a variância a partir de dados agrupados: x  f j x j / n = 27,857
j 1

xi fi xi fi |xi – x |=d d fi x i2 x i2 f i

15 3 45 12,857 38,571 225 675


25 6 150 2,857 17,141 625 3750
35 3 105 7143 21,429 1225 3675
45 2 90 17,143 34,286 2025 4050


k
14 390 111,428 4100 12150
j1


n
s2  [ x 2j f j ]  ( x ) 2 ] / n = 12150 / 14 – (27,857)2= 867,86 – 776,01 = 91,85
j1

 
n n
s2  1 ( xi  x ) 2  di2 = 113,95
n 1 i 1 i 1

You might also like