Professional Documents
Culture Documents
U P I S – FA C U L D A D E S IN TE G RA DA S
Di reto ri a d e En si no d e Pós -G rad u aç ão
Notas de aula
Projeto de pesquisa. Metodologia do trabalho científico
2
U P I S – FA C U L D A D E S IN TE G RA DA S
Di reto ri a d e En si no d e Pós -G rad u aç ão
Notas de aula
Projeto de pesquisa. Metodologia do trabalho científico
ASPECTOS GERAIS
O estudante poderá ser orientado por questionamentos para a definição das fases do projeto de pesquisa. São as
respostas, relevantes e pertinentes, as que definem, em parte essas fases, sintetizadas no Quadro 1. O método científico
permite examinar, de maneira mais ordenada, questões, tais como: por que ocorre? como ocorre? onde ocorre?, quando
ocorre? E o que ocorre? entre outras, cujas respostas ou explicações só serão possíveis por meio da pesquisa.
Quadro 1 Questões para orientar a definição do problema e outros componentes do projeto de pesquisa
3Q + OCD + 3P ELEMENTOS E DESCRIÇÕES
Aspecto relevante e prioritário do fenômeno ou fato econômico que se define como entrave para a obtenção
Que?
de determinado(s) objetivo(s) e meta(s) e que é possível solucionar mediante a pesquisa
Personagens da pesquisa: o grupo multidisciplinar que se organiza em equipes interdisciplinares afins, com
ações e estratégias específicas
Quem?
Parcerias e compartilhamento do pesquisador e cliente alvo da pesquisa auscultado sobre os problemas
passíveis e possíveis de solução tecnológica
Data em que ocorre o fenômeno econômico e datas em que ocorrerão a geração, difusão e adoção dos
Quando? resultados da pesquisa, a tecnologia.
Data dos possíveis efeitos da tecnologia: adoção, vida útil da tecnologia etc.
Local de ocorrência do fenômeno ou fato socioeconômico constituído como problema, da geração dos
Onde?
resultados de pesquisa e de aplicação dos mesmos
A forma como o fato ou fenômeno socioeconômico-físico que constitui o problema ocorre, a maneira como a
pesquisa será desenvolvida condicionada pelo meio ambiente e pelos recursos e meios disponíveis
(“estado da arte”), e as ações e estratégias para implementar as soluções consistentes com as características
Como? do meio ambiente e as necessidades/possibilidades do cliente alvo ou usuário/beneficiário da pesquisa.
O como se define em termos das teorias econômica, econométrica, matemática, estatística e sociológica, entre
outras, (metodologia de pesquisa para problemas econômicos) e se relaciona diretamente (subordina) com
os objetivos, as hipóteses e o problema de pesquisa
Procedência dos problemas para definir o como fazer? o por que fazer? e o como implementar as soluções que
Donde?
se esperam com a pesquisa?
O motivo que deu origem ao fenômeno ou fato no contexto do tema problematizado destacando a parte de
possível solução tecnológica
Por que?
Parte da resposta dessa questão poderá ser fornecida pela extensão e intensidade do problema e pela
prioridade de solução
Para que? Objetivos gerais (estruturais) ou de longo prazo propostos no projeto
Para quem? Objetivos específicos (conjunturais, táticos ...) ou de curto prazo indicados no projeto
3
U P I S – FA C U L D A D E S IN TE G RA DA S
Di reto ri a d e En si no d e Pós -G rad u aç ão
Notas de aula
Projeto de pesquisa. Metodologia do trabalho científico
1 O PROBLEMA DE PESQUISA
2 HIPÓTESE
3 OBJETIVOS
4 REVISÃO DE LITERATURA
5 METODOLOGIA
A pesquisa consiste na execução de um conjunto de ações e estratégias planejadas no projeto, integradas e
harmonizadas seqüencialmente, para a geração de inovações e conhecimentos originais. Esse processo se inicia com:
a) a caracterização do problema (que fazer?) delineado em dimensões técnicas e operacionais viáveis, delimitadas
em diversas dimensões (espacial, temporal etc.) com objetividade;
d) a definição de objetivos que serão atingidos mediante a execução de ações planejadas e desenvolvidas conforme
uma metodologia científica que responde o como fazer?, de forma consistente com os cenários da pesquisa, os
recursos disponíveis para a sua execução e a finalidade ou aplicação esperada de seus resultados: informações,
tecnologias, produtos, serviços.
Metodologia significa, etimologicamente, o estudo dos caminhos, dos instrumentos usados para se fazer pesquisa
científica, os quais respondem o como faze-la de forma eficiente. Nesse contexto teórico há, por um lado, quadros
teóricos de referência (o conhecimento acadêmico) e pelo outro, embasamentos empíricos.
Quadros e embasamentos se encontram estreitamente relacionados e integrados, definidos por enunciados para
representar idéias concatenadas sobre a realidade objeto de pesquisa. Essas idéias aparecem formuladas na forma de
teses (enunciados que são aceitos com algum consenso), hipóteses e axiomas.
O método, traço característico da ciência, representa um procedimento racional e ordenado (forma de pensar),
constituído por instrumentos básicos, que implica utilizar, de forma adequada, a reflexão e experimentação, para
proceder ao longo de um caminho, (significado etimológico de método) e alcançar os objetivos pré-estabelecidos no
planejamento da pesquisa (projeto). Esse procedimento se cifra na postulação de um modelo fundado nas observações
4
U P I S – FA C U L D A D E S IN TE G RA DA S
Di reto ri a d e En si no d e Pós -G rad u aç ão
Notas de aula
Projeto de pesquisa. Metodologia do trabalho científico
ou medidas experimentais, na verificação das predições desse modelo com respeito às observações do mundo real e no
ajuste do modelo conforme exijam as novas informações.
Ao responder o como fazer, o estudante deve buscar conhecer a realidade, integrando trabalhos teóricos e trabalhos
empíricos, em diferentes áreas e escalas de planejamento: macroeconômico, microeconômico e regional, ou
exploratório e analítico.
Nesta conceituação é possível destacar vários elementos, tais como os instrumentos (métodos e técnicas), os objetos
(materiais) e as referências teóricas. A harmonização e integração balanceada destes elementos define a metodologia
de pesquisa.
Metodologia, será, então, o estudo dos instrumentos de montagem de uma teoria ou, o estudo dos arcabouços
teóricos Não estuda teorias, mas o modo de armação delas com base nas observações. É oportuno salientar que esta
distinção é abstrata uma vez que existe uma adaptação (interação) mútua entre teoria e instrumentos usados para a
montagem que permite definir o problema, formular hipótese, observar fatos e fenômenos, sintetizar e analisar as
variáveis desses fatos e obter conclusões.
Assim como a investigação científica se desenvolve com a utilização de métodos que tendem a orientar o processo
de investigação, as técnicas de pesquisa se relacionam à forma de se conduzir a investigação, compreendendo várias
fases, da adoção de normas para a caracterização do problema até a manipulação e análise de dados e informações, bem
como a elaboração do relatório final da pesquisa: uma monografia, tese, relatório etc.
O método se faz acompanhar da técnica, que é o instrumento que o auxilia na procura de determinado resultado:
informação, tecnologia, serviço etc.
Dentre os vários métodos e técnicas de investigação relacionadas no projeto de pesquisa, podem ser destacadas as
seguintes (as primeiras quatro são básicas e determinantes das outras):
a) o método analítico ou merológico que procura examinar detidamente os componentes de um todo, visando
conhecer os fenômenos e fatos particulares que definiriam possíveis causas e a natureza do problema; a análise
tende a gerar sínteses dos desagregados, envolvendo um núcleo de estudos particulares, ao tratar da mensuração
de relações entre variáveis econômicas (objetivo da econometria);
b) o método indutivo feito a partir de fatos particulares, para gerar conclusões mais amplas válidas às situações
gerais; este método qualifica o processo de investigação como a aceitação da validade de generalizações e
extrapolações de comportamentos e fatos observados num campo mais restrito, isto é, possibilita o
desenvolvimento de enunciados gerais sobre as observações acumuladas de casos específicos na forma de
proposições com validade universal; nele, o estudante deverá observar cuidadosamente os diferentes
condicionamentos que poderão determinar realidades distintas em contextos aparentemente homogêneos;
c) o método dedutivo que admite para casos particulares, a validade de fatos, inferências e conclusões geradas a
partir de critérios e regras de comportamento mais gerais; procura transformar enunciados complexos e
universais, em particulares; a dedução se utiliza para obter conclusões lógicas e estabelecer abstrações do
significado dos fenômenos segundo o raciocínio do estudante-pesquisador; esta, em suas duas formas (analítica
5
U P I S – FA C U L D A D E S IN TE G RA DA S
Di reto ri a d e En si no d e Pós -G rad u aç ão
Notas de aula
Projeto de pesquisa. Metodologia do trabalho científico
e silogistica ou formal 2) tem como ponto de partida um princípio considerado a priori como verdadeiro, a tese
ou conclusão que é aquilo que se pretende provar;
d) o método Cartesiano, baseado na universalização da razão, com duas faculdades essenciais: a intuição e a
dedução; quatro regras básicas concorrem para a conceitualização deste método: a evidência que elimina a
prevenção e preconceitos; a análise que desagrega o problema; a síntese que permite a ordenação das partes
segundo o critério da relação constante entre elas; a enumeração onde o estudante-pesquisador deve selecionar
apenas o que for necessário e suficiente para a solução do problema;
e) os métodos da teoria econômica das partes microeconomia e macroeconomia, nem sempre constituem caminhos
alternativos, podendo ser utilizados conjuntamente, segundo o caso em estudo;
d) o método econométrico envolvendo outros métodos como o estatístico, o matemático e os da teoria econômica.
Técnicas de pesquisa
As técnicas de pesquisa se relacionam à forma de se conduzir a pesquisa, à maneira de percorrer o caminho de que
trata o método ou, os procedimentos práticos que devem seguir-se na pesquisa, exigindo um esforço maior do
estudante-pesquisador, bem como perspicácia para adotar os procedimentos operacionais mais adequados. Dentro
destas técnicas é possível definiras ações e estratégias de pesquisa em novos contextos dos cenários (parcerias,
descentralização, globalização etc.).
Métodos e técnicas poderão ser integradas para definir um modelo, isto é, uma representação de um fenômeno real
para explicá-lo, prognosticá-lo e controlá-lo, propósitos correspondentes aos três objetivos da econometria: a análise
estrutural, a predição ou prognóstico e a avaliação de políticas, respectivamente.
O modelo constitui um compromisso entre a realidade e a maleabilidade (adequabilidade), uma condição que o
estudante-pesquisador deverá desenvolver mediante a integração e balanceamento de condições e fatores da pesquisa.
Algumas de suas características são:
a) o modelo. Deve ser visto como uma representação razoável do sistema real e, portanto, realista ao incorporar os
principais elementos do fenômeno, fato do problema objeto de pesquisa.
b) deve ser maleável no sentido de produzir certas conclusões que não poderiam ser geradas pela observação direta;
2
A dedução na forma analítica apresenta um raciocínio formal, na qual a conclusão não fornece uma informação nova, ao contrário
da dedução, porque já está implícita. Sua forma mais importante é a do silogismo ou raciocínio composto de três proposições: duas
premissas e uma conclusão, conforme ilustra o exemplo que segue: "todos os homens são mortais - premissa maior; Pedro é homem
- premissa menor; logo Pedro é mortal
6
U P I S – FA C U L D A D E S IN TE G RA DA S
Di reto ri a d e En si no d e Pós -G rad u aç ão
Notas de aula
Projeto de pesquisa. Metodologia do trabalho científico
c) deve ser simples ao eliminar as influências estranhas e simplificar os processos e inter-relações complexas dos
elementos do problema econômico (modelo cartesiano);
Como regra geral, os primeiros modelos de um fenômeno ou fato problema propostos pelo estudante-pesquisador
devem ser simples, destacando a sua maleabilidade.
Um exemplo deste caso são os modelos “caixa preta”, onde não há intentos de reproduzir a realidade, evidenciando
apenas as entradas (elementos do problema) e as saídas do sistema (soluções: técnicas e tecnologias geradas pela
pesquisa), conforme indica a Figura 1. A seguir, procura-se a análise do que está dentro do sistema, isto é, dos
processos de transformação, produção, distribuição, apreço etc., (no tema econômico) que darão origem ao produto,
serviços e informações da pesquisa, bem como aos subprodutos (por exemplo os chamados “efeitos de segunda
geração das tecnologias) dos resultados da pesquisa.
Produtos
Serviços
Informações
SISTEMAS DE
TRANSFORMAÇÃO
ENTRADAS PRODUÇÃO
a
MANEJO
RECUROS NATURAIS:
e
- Biodiversidade: perdas
OUTROS RECURSOS
b
Mediante técnicas, métodos e modelos aplicados à investigação, prévia a adequação que cada caso possa requerer, o
pesquisador gera informações com valor científico. Essas informações integradas (ciência), com outras requeridas no
desenvolvimento sustentável, constituem-se numa poderosa ferramenta de convicção para a conservação e o manejo
racional dos recursos produtivos, pela objetividade e efetividade das mesmas.
Não existe uma fórmula universal para gerar novas informações. Todavia, o pesquisador precisa ter conhecimento
da realidade (condição necessária para definir o que pesquisar) e possuir ferramentas analíticas a serem aplicadas aos
dados (como pesquisar). Com tais ferramentas poderá gerar novas informações sobre o que acontece na “caixa preta”,
à montante dos insumos (por exemplo, efeitos que possam comprometer “estados” dos estoques ou reservatórios de
7
U P I S – FA C U L D A D E S IN TE G RA DA S
Di reto ri a d e En si no d e Pós -G rad u aç ão
Notas de aula
Projeto de pesquisa. Metodologia do trabalho científico
recursos naturais quando considerados como insumos de produção) e à jusante dos produtos (cadeias produtivas,
mercados, consumidores ...), tratando explicitamente a todas as interconexões entre insumos e produtos; estas devem
possibilitar intervir no cenário do problema de pesquisa.
A primeira parte de postulados da ciência que a pesquisa deve considerar. Uma síntese desses postulados
U P I S – FA C U L D A D E S IN TE G RA DA S
Di reto ri a d e En si no d e Pós -G rad u aç ão
Notas de aula
Projeto de pesquisa. Metodologia do trabalho científico
Conceito de Dado
O dado tem sua origem na observação que supõe tanto a medição quanto a
experimentação. A observação é um procedimento empírico básico da pesquisa. Nesse
procedimento, o objeto da observação é o fato, variável conforme o tipo de pesquisa,
enquanto que o resultado de uma observação é o dado, isto é, uma proposição singular
ou essencial que expressa característica (atributos) do resultado da observação. Dessa
forma se estabelece uma relação natural definida pela ordem e seqüência ilustrada na
Figura 1.
FATO
Informação potencial:
- Acontecimento OBSERVAÇÃO
- Processo Medir; experimentar
- Fenômeno DADO
- Sistema
VARIÁVEL
U P I S – FA C U L D A D E S IN TE G RA DA S
Di reto ri a d e En si no d e Pós -G rad u aç ão
Notas de aula
Projeto de pesquisa. Metodologia do trabalho científico
U P I S – FA C U L D A D E S IN TE G RA DA S
Di reto ri a d e En si no d e Pós -G rad u aç ão
Notas de aula
Projeto de pesquisa. Metodologia do trabalho científico
U P I S – FA C U L D A D E S IN TE G RA DA S
Di reto ri a d e En si no d e Pós -G rad u aç ão
Notas de aula
Projeto de pesquisa. Metodologia do trabalho científico
Se aos dados científicos não forem exigidas uma referência objetiva, um controle
público e um mínimo de interpretação com base em teorias aceitáveis, então não serão
dados científicos, mas dados que poderiam ser arbitrariamente inventados, portanto,
irrelevantes para as idéias que comportam ou traduzem da realidade. Dessa forma, os
“dados sensíveis” e “os dados não-consistidos”, entre outros, não são dados científicos.
A pesquisa e a ciência se interessam por dados impessoais, que façam referência a
fatos objetivos 3 e relevantes (de percepção direta ou inferencial), carregados de
significado no contexto de uma ou mais áreas do conhecimento científico, isto é, o
interesse é pelos dados sistematizados que o pesquisador, de forma criteriosa
(metodologia científica e pragmatismo na aplicação dos resultados), gera para
determinados propósitos explícitos no projeto de pesquisa.
A evidência se coloca como um dado, porém nem todo dado é uma evidência. O
caráter de evidência do dado não é uma propriedade intrínseca dele. São evidências os
dados “consistidos” e relevantes para algum processo. Assim na pesquisa de conservação
de um ecossistema, ao interpretar uma espécie como ameaçada de extinção com base
em determinados critérios de referência científica, gera-se um dado que caracteriza a
espécie com probabilidade para ser definida em processo de extinção. Se admite que o
dado é uma evidência, com certa credibilidade, em favor de um processo de conservação.
Entretanto, ao admitir a evidência do dado se admite, também, a referência teórica que,
por sua vez, é validada pela consistência do dado à teoria. Entretanto, se a teoria é
validade por apenas determinada evidência que ela mesma sugere, então a confirmação
do dado que ali se gera carece de valor científico.
Pelo valor relativo que a confirmação empírica possui e para gerar-se um dado
científico de evidência, é necessário que o dado apresente condições específicas de
consistência com o método científico. Neste sentido se generaliza que toda evidência é
relativa a alguma hipótese com base em determinado corpo de conhecimentos. Dessa
forma, conclui-se que nenhum dado é evidente por se mesmo, mas só quando
interpretado por alguma teoria. Para a pesquisa, esse dado deve ser transformado em
variável
O termo variável é um conceito operacional fundamental na metodologia de pesquisa.
Este conceito parte da abstração derivada da observação de um conjunto de classes de
objetos (fenômeno ou atributos). Como conceito, é um substantivo que definem atributos
(desatributos) do objeto de pesquisa como por exemplo profissão, sexo, renda per capita,
produção, peso, perdas, inflação etc.
3
O fato objetivo não deve ser entendido como o contrário filosófico de “fato puro”, desprovido do objeto
no empirismo de Bacon e Comte, que o situa sem prévia formulação de hipóteses e pressupostos e,
portanto, sem a influencia de idéias de aparente e sofismada garantia. É sofisma, porque ninguém
procura nada, neste caso o dado científico, sem ter presente a possibilidade (hipóteses e pressupostos)
do que está procurando e porque não se reconheceria o que se procura ao encontrá-lo. Quanto mais se
ignora o que se busca, mais se têm que exercitar a criatividade e imaginação; e quanto mais se sabe
acerca do objeto mediante mais hipóteses, melhor é a orientação para a procura desse objeto. Trata-se de
uma posição teórico-pragmática que permita a conversão do dado em objetos do conhecimento. Assim, o
fato puro (metodologia científica) se apresenta em condições para formular hipóteses que orientarão a
procura de novos fatos acessíveis ao conhecimento (pragmatismo).
12
U P I S – FA C U L D A D E S IN TE G RA DA S
Di reto ri a d e En si no d e Pós -G rad u aç ão
Notas de aula
Projeto de pesquisa. Metodologia do trabalho científico
1.280 Solteiro
1.413 Casado
980 Viúvo
1.536 Desquitado
13
U P I S – FA C U L D A D E S IN TE G RA DA S
Di reto ri a d e En si no d e Pós -G rad u aç ão
Notas de aula
Projeto de pesquisa. Metodologia do trabalho científico
CATEGORIA
. . . . . .
Exemplo 1 Exemplo 2
No.
No.. Freq. (%) No. Freq. (%) Inclinação do solo No. (%)
Estado civil (%)
120
- Solteiro 68 38,4 68 38,4 - Inclinado -
(90,9)
- Casado 96 54,2 96 54,2 - Plano 12 (9,1) 12 ( 9,1)
- Viúvo 8 4,5 - - Muita Inclinação - 30 (22,7)
- Desquitado 5 2,8 - - Media Inclinação - 50 (37,9)
- Outro - 13 7,3 - Pouca Inclinação - 40 (30,3)
eliminar variáveis criar variáveis desagregar variáveis
Se uma das categorias na classificação das variáveis for muito grande (inclinação do
solo, por exemplo, do caso acima), se pode considerar várias “variáveis” (desagregar),
como mostra a última coluna do exemplo 2, com as categorias “muita inclinação”, “media
inclinação” e “pouca inclinação”. 4
Condições favoráveis para definir uma variável
4
Os conceitos “muita inclinação” (ou elevada), “média inclinação” (ou mediana) e “pouca inclinação” (ou
baixa) devem ser claramente definidos por um indicador preciso e adequado, por exemplo, adotando-se
os critérios do IBGE para esse propósito. No caso exemplificado, as classes de relevo de referência para a
definir a variável desse atributo, poderiam ser: Plano, com declividades variáveis de 0 a 3%; suave
ondulado, com declividades variáveis de 3 a 8%; ondulado, com declividades variáveis de 8 a 20%; forte
ondulado, com declividades variáveis de 20 a 45%; e montanhoso, com declividades variáveis de 45 a
75%.
14
U P I S – FA C U L D A D E S IN TE G RA DA S
Di reto ri a d e En si no d e Pós -G rad u aç ão
Notas de aula
Projeto de pesquisa. Metodologia do trabalho científico
Exemplo 1 Exemplo 2
- De 500 a 1000 De 500 a 1000 500 1000 - Test. de Jeová - - Test. de Jeová
U P I S – FA C U L D A D E S IN TE G RA DA S
Di reto ri a d e En si no d e Pós -G rad u aç ão
Notas de aula
Projeto de pesquisa. Metodologia do trabalho científico
b) O conjunto de valores possíveis da variável deve ser exaustivo, o que significa que
todas as possibilidades empíricas devem ser incluídas na especificação ora
numérica, ora de categoria, isto é, todos os elementos da amostra devem ser
classificados com algum valor, dentro de um intervalo de valores razoáveis de
variação (domínio da variável) ou em alguma categoria claramente estabelecida e
delimitada (veja nota de rodapé 7.10.
No exemplo 2, a categoria “Protestante” inclui, entre outros, os grupos
“Presbiteriano”, “Anglicano”, “Evangelista”, “Testemunha de Jeová” e “Adventista”.
Portanto, essas categorias devem ser excluídas, especificando apenas “Católico” e
“Protestante”, sem considerar se o supergrupo “Protestante” é ou não comparável
com o grupo “Católico”. Outra possibilidade é excluir a especificação “Protestante” e
definir os grupos “Católico”, “Presbiteriano”, “Anglicano”, “Evangelista”,
“Testemunha de Jeová” e “Adventista”.
c) As variáveis, na especificação de classes e medidas, devem ser representativas do
fenômeno que se estuda, conservando certa regularidade ou simetria entre as
classes, bem como os intervalos de valores ou as categorias em que se define a
variável, devem ser consistentes com características da população em estudo. Por
exemplo, a variável “Religião” seria irrelevante no contexto de uma pesquisa
socioeconômica do Pantanal Mato-grossense, se contivesse a categoria “Budista”
mas não a categoria “Católico” ou outra predominante naquela região objeto de
pesquisa nesse atributo.
U P I S – FA C U L D A D E S IN TE G RA DA S
Di reto ri a d e En si no d e Pós -G rad u aç ão
Notas de aula
Projeto de pesquisa. Metodologia do trabalho científico
Escala nominal
As variáveis qualitativas podem ser definidas numa escala nominal.
Os dados dizem-se expressos em escala nominal quando cada um deles for definido
apenas pela atribuição de um nome, categoria ou grupo que designa uma classe, a qual,
conforme anteriormente indicado, deve ser exaustiva, mutuamente exclusivas e não
ordenável. Dadas essas limitações, trata-se de um tipo de variável com escassa
informação.
Exemplos:
17
U P I S – FA C U L D A D E S IN TE G RA DA S
Di reto ri a d e En si no d e Pós -G rad u aç ão
Notas de aula
Projeto de pesquisa. Metodologia do trabalho científico
Escala cardinal
Quando numa determinada característica nominal a ordem das categorias obedece
a uma seqüência com significado, então trata-se de uma característica definida numa
escala ordinal. Neste tipo de variável se tem a possibilidade de diferenciar e de ordenar
em relação a determinada escala, com atribuição de um significado às diferenças entre os
números, mas na a razão entre eles
Neste caso, os códigos numéricos, por exemplo 1, 2,....,5, que identificam as
categorias dos atributos, não são atribuídos de forma arbitrária mas sim de tal modo que
as categorias às quais foram assinalados os algarismos 1 e 5 são as que mais se
distanciam e mais se diferenciam entre si. Entre esses extremos encontram-se os
“códigos” 2, 3 e 4.
As escalas ordinais são úteis pata medir opiniões sobre as qualidades de certos
atributos, cuja medição objetiva é muito difícil ou impossível de realizar. Por exemplo
conhecer de um consumidor qual é a sua opinião sobre o sabor de determinado alimento,
com as opções: não gosta, gosta pouco, indiferente, gosto muito... As possíveis respostas
a esta questão podem ser resumidas numa escala ordinal com quatro ou mais opções,
conhecidas por escala de Likert. (Reis et alii, 1996, p. 24).
Exemplos:
Classificação obtida pelos alunos de metodologia de pesquisa: reprovado (< 5),
medíocre (5 a 6), regular (6 a 7), bom (7 a 8) ou muito bom (>8)
Classificação dos clientes segundo o volume de compras: cliente 1 (>10
Unidades/mês), cliente 2 (8 a 6 unidades), cliente 3 (4 a 6 unidades), cliente 4 (2
18
U P I S – FA C U L D A D E S IN TE G RA DA S
Di reto ri a d e En si no d e Pós -G rad u aç ão
Notas de aula
Projeto de pesquisa. Metodologia do trabalho científico
Variável quantitativa
A variável será quantitativa quando seus valores forem expressos em números
definidos em determinado domínio característico ou próprio da variável. Esse domínio
poderá ser de continuidade; neste caso, a variável pode assumir qualquer valor no
19
U P I S – FA C U L D A D E S IN TE G RA DA S
Di reto ri a d e En si no d e Pós -G rad u aç ão
Notas de aula
Projeto de pesquisa. Metodologia do trabalho científico
intervalo definido (variável quantitativa contínua; idade e peso, por exemplo) ou apenas
possuir determinados valores pertencentes ao conjunto enumerável (variável quantitativa
discreta; número de filhos, por exemplo). Os exemplos que seguem ilustram os conceitos
de variáveis quantitativas.
Variável quantitativa discreta
Exemplos de variáveis quantitativas discretas:
População: famílias de um bairro, de uma cidade, de uma região, de um Estado
ou do país;
Variável: número de filhos;
Indicador: 3, 2, 6, 1 etc.;
População: aparelhos produzidos numa linha de montagem
Variável: número de defeitos por lote;
Indicador: 2, 0, 4, 12, 3 etc.
U P I S – FA C U L D A D E S IN TE G RA DA S
Di reto ri a d e En si no d e Pós -G rad u aç ão
Notas de aula
Projeto de pesquisa. Metodologia do trabalho científico
1 para Y 5
Ai =
0 para Y < 5
U P I S – FA C U L D A D E S IN TE G RA DA S
Di reto ri a d e En si no d e Pós -G rad u aç ão
Notas de aula
Projeto de pesquisa. Metodologia do trabalho científico
U P I S – FA C U L D A D E S IN TE G RA DA S
Di reto ri a d e En si no d e Pós -G rad u aç ão
Notas de aula
Projeto de pesquisa. Metodologia do trabalho científico
A parte que segue trata de uma das formas convencionais de obtenção de dados e
informações primárias da população, dispensando o tratamento prévio de amostragem
que o pesquisador deverá obter das fontes documentais pertinentes: amostragem
estatística.
23
U P I S – FA C U L D A D E S IN TE G RA DA S
Di reto ri a d e En si no d e Pós -G rad u aç ão
Notas de aula
Projeto de pesquisa. Metodologia do trabalho científico
4 QUESTIONÁRIO E FORMULÁRIO
O questionário contém uma lista de perguntas cuja temática pode corresponder a
uma “tradução” das hipóteses de pesquisa sob a forma interrogativa. Nessa tradução o
pesquisador deve levar em consideração o provável nível de detalhamento dos dados a
serem fornecidos pelos entrevistados e ser submetido a rigoroso controle para evitar,
reduzir ou controlar as possíveis distorções.
Na estrutura do questionário é importante observar a ordem das perguntas que
pode ser temática ou em grupos correspondentes às hipóteses ou, ainda, totalmente
arbitrária tendo em vista, neste caso, o possível “efeito de contaminação”. Este efeito
consiste no condicionamento da resposta a uma pergunta em função das perguntas
anteriores, que seguem determinada linha de raciocínio ou seqüência.
O questionário pode ser aplicado, em alguns casos, sem entrevistador, quando é
distribuído pelo correio convencional ou eletrônico (internet, p. ex.). Mas em geral, a
aplicação mais eficiente supõe o relacionamento entre um entrevistador, devidamente
treinado, e o entrevistado convenientemente informado dos propósitos da entrevista. 5
Questionário e entrevista são consideradas técnicas complementares. Após a
aplicação do questionário, ou no decorrer, podem ser realizadas outras entrevistas, com
informantes especiais, para esclarecer ou aprofundar certos aspectos de respostas, ou
determinados quadros de referências importantes para o estudo, porém não considerados
no questionário.
O levantamento de dados primários por amostragem é o método de pesquisa
planejada sobre uma amostra da população objetivo, podendo ser descritivo ou analítico,
6
realizado por questionários baseados em formulários, entre outras técnicas,
previamente elaboradas e testadas para os propósitos explícitos da pesquisa.
Para a obtenção de informações primárias o pesquisador poderá recorrer as
modernas técnicas de levantamento de dados como as de sensoreamento remoto, onde a
informação é disponibilizada em “tempo hábil”, devendo ser, em muitos casos, validada e
complementada por pesquisas de campo especiais.
5
A terminologia diferencia questionário de formulário. Na Enciclopédia Larouse Cultura (1998: p. 4868 e
2505) o questionário é definido como uma seqüência de interrogações feitas com o fim de servir de guia
a uma investigação, a uma entrevista; para o caso de formulário, trata-se de um papel padronizado em
que se inscrevem os dados nos locais a isso destinados. Witt (1973: p. 142) estabelece a diferença
considerando que o questionário é preenchido pelo próprio respondente, enquanto que o formulário é
aplicado por um entrevistador. Neste Manual se adota o conceito francês, em que o questionário é
aplicado por um por um entrevistador, enfatizando-se as condições dessa aplicação para minimizar
possíveis “contaminações” ou viés na informação obtida e registrada no formulário
6
O tipo de levantamento descritivo tem por finalidade a obtenção de determinadas informações,
enquanto o levantamento analítico procura informações para estabelecer comparações entre subgrupos
da população a fim de se formular hipóteses associadas à natureza dos dados
24
U P I S – FA C U L D A D E S IN TE G RA DA S
Di reto ri a d e En si no d e Pós -G rad u aç ão
Notas de aula
Projeto de pesquisa. Metodologia do trabalho científico
determinado critério
- Dependente (Y) Categorias ou valores a serem explicados ou descobertos, dado que são
influenciados, determinados ou afetados pela variável (X)
- Substituível “Se X ocorre, então Y ocorre, mas se Z ocorre, então também Y ocorre”
U P I S – FA C U L D A D E S IN TE G RA DA S
Di reto ri a d e En si no d e Pós -G rad u aç ão
Notas de aula
Projeto de pesquisa. Metodologia do trabalho científico
Continuação
Quadro 7.1 Classificação mais freqüentes das variáveis na pesquisa
a
Produto-
Relação
produto
Contínuas
(ordem hierárquica)
Analítica
Aplicada aos fenômenos, objetos etc., que podem ser medidos, contados,
pesados etc., exigindo um sistema lógico que permita atribuir números
- Quantitativa para contagem ou mensuração formando uma escala
a
Fonte: Richardson et alii (1985); Ferrari (1982); Goode e Hatt (1979).
Estudo de casos
26
U P I S – FA C U L D A D E S IN TE G RA DA S
Di reto ri a d e En si no d e Pós -G rad u aç ão
Notas de aula
Projeto de pesquisa. Metodologia do trabalho científico
Por esta técnica, o pesquisador escolhe os “casos”, geralmente poucos (uma das
diferenças com a amostragem), com as características relevantes para os propósitos do
estudo, e o desenvolve segundo um plano preestabelecido, podendo ser orientado por
questionários e formulários que enfocam a unidade globalmente em lugar de suas partes
individuais.
Estudo de protótipos
Nesse estudo, o pesquisador monta um ou poucos protótipos (unidades em
condições controladas) com um conjunto de características escolhidas, segundo um plano
preestabelecido, para a avaliação desse conjunto, sendo muito útil para estudos
exploratórios, principalmente para prover a síntese de resultados de pesquisa analítica
mediante a sua integração em sistemas reais, e para a caracterização de problemas e
hipóteses que possam ser testadas na pesquisa analítica.
Em estudos da indústria, os protótipos são modelos físicos de máquinas ou
equipamentos compostos pelo agregado de componentes desenvolvidos de forma
independente e avaliados no conjunto pelo método.
O estudo de protótipos pressupõe a montagem da unidade especialmente para a
pesquisa, enquanto que no estudo de casos essa unidade já existe antes da investigação.
U P I S – FA C U L D A D E S IN TE G RA DA S
Di reto ri a d e En si no d e Pós -G rad u aç ão
Notas de aula
Projeto de pesquisa. Metodologia do trabalho científico
U P I S – FA C U L D A D E S IN TE G RA DA S
Di reto ri a d e En si no d e Pós -G rad u aç ão
Notas de aula
Projeto de pesquisa. Metodologia do trabalho científico
U P I S – FA C U L D A D E S IN TE G RA DA S
Di reto ri a d e En si no d e Pós -G rad u aç ão
Notas de aula
Projeto de pesquisa. Metodologia do trabalho científico
“A opinião geral das pessoas é que: “. . .”; qual é sua opinião sobre o mesmo
assunto?
“ A resposta do chefe de... [ou de pessoa(s) destacada(s) no assunto] sobre a
matéria tem sido “...” ; qual é sua opinião sobre o mesmo assunto?
U P I S – FA C U L D A D E S IN TE G RA DA S
Di reto ri a d e En si no d e Pós -G rad u aç ão
Notas de aula
Projeto de pesquisa. Metodologia do trabalho científico
a) Definir um número reduzido de questões relevantes e de interesse para o estudo, tal vez não mais de 20 ou
30 ( ? ) questões, aplicadas durante uma hora ou menos e em um ambiente conveniente para o respondente,
formuladas numa linguagem simples, direta e de questões objetivas e quantificáveis.
U P I S – FA C U L D A D E S IN TE G RA DA S
Di reto ri a d e En si no d e Pós -G rad u aç ão
Notas de aula
Projeto de pesquisa. Metodologia do trabalho científico
Comprou algum sabonete nos últimos sete dias, não considerando o dia de hoje?
Em caso de requer o produto Aaa, porque ..., qual é o procedimento de compra?
U P I S – FA C U L D A D E S IN TE G RA DA S
Di reto ri a d e En si no d e Pós -G rad u aç ão
Notas de aula
Projeto de pesquisa. Metodologia do trabalho científico
h) Perguntas invertidas.
Exemplo:
i) Perguntas que incluem expressões, tais como: se é que alguém...; se é que foi...;
j) Perguntas muito longas.
k) Perguntas que incluem simultaneamente frases no presente e frases no passado, no
singular e no plural, no geral e no específico etc.
Sugestões para o ordenamento das questões no formulário
A orientação para determinar a ordem das questões, baseia-se, de preferência, nos
possíveis efeitos que um estímulo provocado por determinada pergunta ou forma de
questionamento, possa ter sobre as subseqüentes questões.
Neste sentido e segundo Phillips (1974) e Richardson et alii (1985), poderão
observar-se as seguintes regras:
a) Perguntas gerais devem usualmente preceder perguntas específicas. Introduzir o questionário com
perguntas que não formulem problemas, depois incluir perguntas referidas à problemática, mas em
termos gerais, seguidas das perguntas chaves que formam o núcleo do questionário, e finalmente
perguntas especiais.
Exemplo:
U P I S – FA C U L D A D E S IN TE G RA DA S
Di reto ri a d e En si no d e Pós -G rad u aç ão
Notas de aula
Projeto de pesquisa. Metodologia do trabalho científico
b) A seqüência das perguntas poderá seguir certa ordem lógica, funcional ou operacional, ou espacial,
temporal, cronológica etc., de modo a evitar-se transições bruscas, permitir a interação entre o entrevistador e
o entrevistado, e facilitar as respostas mediante uma seqüência de pensamento. Entretanto (repetindo), deve-
se cuidar, que essa lógica possa induzi ou criar determinado condicionante da resposta à resposta anterior.
c) As perguntas que poderiam comprometer a outras, deverão ser colocadas, no possível, no final do
questionário. Não se deve abusar ao refazer pergunta;
d) Devem ficar claramente diferenciados no questionário suas partes:
- instruções e gabaritos, por exemplo entre parêntesis, destaque gráfico, relação das
possíveis opções de respostas entre colchetes etc.;
- perguntas, com LETRAS MAIÚSCULAS, sublinhadas, negritadas ou outro destaque
tipográfico;
- respostas, letras minúsculas especificando o espaço necessário para escrever a
resposta, ou indicar o espaço para anotar o gabarito que mais se aproxime à
resposta, ao lado das perguntas.
Richardson et alii, (op. cit.) apresentam recomendações para a redação das perguntas,
julgadas oportunas nesta parte do Manual, e sintetizadas a seguir:
a) Não incluir uma pergunta sem ter uma idéia clara da forma como será utilizada a
sua informação e em quanto ou como contribuirá aos objetivos do estudo.
b) Usar vocabulário preciso [claro e adequado às condições do respondente, em
construções e parágrafos igualmente precisos, simples e diretos] para perguntar o
que realmente se deseja saber; evitar palavras confusa [rebuscadas] e termos
técnicos que não sejam do conhecimento população (amostrada) a ser entrevistada;
c) Evitar formular duas ou mais perguntas em uma; o exemplo que segue ilustra este caso indesejável:
d) As perguntas devem ajustar-se às possibilidades de resposta dos respondentes; não devem ser feitas
perguntas difíceis de serem respondidas de forma precisa.
U P I S – FA C U L D A D E S IN TE G RA DA S
Di reto ri a d e En si no d e Pós -G rad u aç ão
Notas de aula
Projeto de pesquisa. Metodologia do trabalho científico
U P I S – FA C U L D A D E S IN TE G RA DA S
Di reto ri a d e En si no d e Pós -G rad u aç ão
Notas de aula
Projeto de pesquisa. Metodologia do trabalho científico
k) o pesquisador deve ter cuidados com a interpretação que ele faz das respostas do informante. Exemplo de
uma má interpretação:
U P I S – FA C U L D A D E S IN TE G RA DA S
Di reto ri a d e En si no d e Pós -G rad u aç ão
Notas de aula
Projeto de pesquisa. Metodologia do trabalho científico
U P I S – FA C U L D A D E S IN TE G RA DA S
Di reto ri a d e En si no d e Pós -G rad u aç ão
Notas de aula
Projeto de pesquisa. Metodologia do trabalho científico
Exemplo:
( ) sim ou 1 - sim
( ) não ou 2 – não
( ) não sei ou 3 – não sei
U P I S – FA C U L D A D E S IN TE G RA DA S
Di reto ri a d e En si no d e Pós -G rad u aç ão
Notas de aula
Projeto de pesquisa. Metodologia do trabalho científico
Como principais vantagens das perguntas com respostas múltiplas, relacionam-se as seguintes: fáceis e
rápidas para aplicar, processar e analisar, com poucas possibilidades de erros.
Com principais desvantagens, têm-se: exigem tempo y conhecimento para preparar, adequadamente, todas
as opções de respostas; e podem tender a introduzir viés nos dados pelo fato de as alternativas de respostas
serem oferecidas aos respondentes.
U P I S – FA C U L D A D E S IN TE G RA DA S
Di reto ri a d e En si no d e Pós -G rad u aç ão
Notas de aula
Projeto de pesquisa. Metodologia do trabalho científico
U P I S – FA C U L D A D E S IN TE G RA DA S
Di reto ri a d e En si no d e Pós -G rad u aç ão
Notas de aula
Projeto de pesquisa. Metodologia do trabalho científico
Dos três tipos de produtos para lavar roupa (marca A “Beleza Pura”, marca B
“Qualidade na Beleza” e marca C “Saúde e Beleza”), qual é o seu preferido,
numa escala de 1o.º, 2o.º e 3o. lugar, em relação aos seguintes atributos?
Perfume preferido:
1o lugar: ______
2o lugar: ______
3o lugar: ______
Cor preferida:
1o lugar: ______
2o lugar: ______
3o lugar: ______
Amaciante preferido:
1o lugar: ______
2o lugar: ______
3o lugar: ______
U P I S – FA C U L D A D E S IN TE G RA DA S
Di reto ri a d e En si no d e Pós -G rad u aç ão
Notas de aula
Projeto de pesquisa. Metodologia do trabalho científico
- Inverno:
Manha: _____ ºC
Médio dia: _____ ºC
Tarde: _____.ºC
Perguntas abertas
Levam o entrevistado a responder com frases ou orações e onde o interesse do
pesquisador se centra na elaboração das opiniões, conceitos e explicações de elementos
do problema de pesquisa. Exemplo de questionário de pergunta aberta é:
42
U P I S – FA C U L D A D E S IN TE G RA DA S
Di reto ri a d e En si no d e Pós -G rad u aç ão
Notas de aula
Projeto de pesquisa. Metodologia do trabalho científico
U P I S – FA C U L D A D E S IN TE G RA DA S
Di reto ri a d e En si no d e Pós -G rad u aç ão
Notas de aula
Projeto de pesquisa. Metodologia do trabalho científico
ITEM ESPECIFICAÇÃO
Orientar a coleta de dados na população AAA para realizar a pesquisa visando obter soluções ao
Objetivo problema BBBB (A e B devem ser caracterizados e definidos para este propósito: informar ao público
dos objetivos da pesquisa)
Cada questão é apresentada para responder com um X no quesito que melhor defina a resposta, dentro
da seguinte escala, com duas expressões antônimas e três possíveis opções dentro de cada expressão:
POSITIVO NEGATIVO INSTRUÇÕES
Sistemática Neste campo se especificarão as opções
Extremo Leve
Médio Médio
Leve Extremo
Claros Confusos
Factíveis Impraticáveis
4 CRITÉRIO DE EFICÁCIA
ADMINISTRATIVA
5 CRITÉRIO DE QUALIDADE DO
PRODUTO E DO PROCESSO
6 CRITÉRIO ECONÔMICO DE
MAXIMIZAÇÃO DE LUCROS
44
U P I S – FA C U L D A D E S IN TE G RA DA S
Di reto ri a d e En si no d e Pós -G rad u aç ão
Notas de aula
Projeto de pesquisa. Metodologia do trabalho científico
Continuação ( b )
M = Mediano
P= Pouco ou Esporádico
U P I S – FA C U L D A D E S IN TE G RA DA S
Di reto ri a d e En si no d e Pós -G rad u aç ão
Notas de aula
Projeto de pesquisa. Metodologia do trabalho científico
a)_________________________________________________________________________
____________________________________________________;
b)_________________________________________________________________________
12 QUAIS SÃO OS TRÊS PRINCIPAIS ____________________________________________________
PROBLEMAS NO PROCESSO DE
PRODUÇÃO AGROINDUSTRIAL?
c)______________________________________________________________
_______________________________________________________________;
U P I S – FA C U L D A D E S IN TE G RA DA S
Di reto ri a d e En si no d e Pós -G rad u aç ão
Notas de aula
Projeto de pesquisa. Metodologia do trabalho científico
- Custo 1
- Limpeza 2
- Segurança 3
- Atendimento 4
- Espaço disponível 5
- Serviços disponíveis 6
ESPECIFICAR A IMPORTANCIA
SEM POUCA MEDIA MUITO
DOS SEGUINTES ITENS IMPORT IMPRES NV
IMPORT IMPORT IMPORT IMPORT
- Preço (Custo...) 10
- Conforto (Moradia... ) 11
- Segurança familiar 12
- Emprego (garantia) 13
- Saúde 14
- Amizade 15
- Família 16
- Riqueza 17
- Limpeza 18
- Esporte 20
a b
M = Marcar. NV = Número da variável
Quadro 4 Dois exemplos de formulários de escalas (Likert e Stapel) para a obtenção de dados primários
47
U P I S – FA C U L D A D E S IN TE G RA DA S
Di reto ri a d e En si no d e Pós -G rad u aç ão
Notas de aula
Projeto de pesquisa. Metodologia do trabalho científico
ESCALA LIKERT
Em relação à qualidade do produto (...), assinale com seu nível de
concordância ou de discordância, nas seguintes frases
PROPOSIÇÕES OU FRASES CT a Cb Ic Dd DT e NS f
É um produto puro
É um produto nutritivo
É feito com ingredientes de alta qualidade
A embalagem protege sua qualidade
Sua embalagem permite fácil manuseio
Permite combinar com outros produtos
Seus efeitos sobre a saúde são menores
Quadro 4 Dois exemplos de formulários de escalas (Likert e Stapel) para a obtenção de dados primários
ESCALA STAPEL
Na escala de 10 pontos, 5 negativos e 5 positivos, indique com
sua avaliação para os seguintes atributos do produto (...)
NEGATIVA POSITIVA
ATRIBUTOS
-5 -4 -3 -2 -1 1 2 3 4 5
Pureza
Valor nutritivo
Qualidade dos ingredientes
Proteção da embalagem
Manuseio do produto embalada
Possibilidades de combinação
48
U P I S – FA C U L D A D E S IN TE G RA DA S
Di reto ri a d e En si no d e Pós -G rad u aç ão
Notas de aula
Projeto de pesquisa. Metodologia do trabalho científico
U P I S – FA C U L D A D E S IN TE G RA DA S
Di reto ri a d e En si no d e Pós -G rad u aç ão
Notas de aula
Projeto de pesquisa. Metodologia do trabalho científico
A estatística7 descritiva (ou dedutiva) consiste na definição de que e de como coletar, classificar, ordenar,
integrar/complementar, descrever, sumarizar e caracterizar os dados e informações primárias de um certo fato ou
fenômeno objeto de estudo, sem a preocupação de obter conclusões ou inferências mais profundas acerca do
relacionamento entre esses dados com os dados de grupos maiores (estudo preliminar exploratório). Essa descrição ou
análise exploratória se faz mediante procedimentos e ferramentas de ilustração e por estatísticas descritivas adequadas
às condições da pesquisa, tais como: tabelas, quadros, gráficos, figuras, mapas (ilustrações) e indicadores numéricos
(estatísticas descritivas).
A análise exploratória (Encyclopedia of Statistical Sciences, v.2, 1982, p. 579-582) é freqüentemente utilizada
para uma análise preliminar de dados e informações primárias levantadas pelo pesquisador, com vistas a explorar o
comportamento e relacionamento destes. Esta análise compreende duas fases:
a) A primeira é a exploratória ou exame preliminar dos dados em que se trata da identificação de comportamentos e
de características destes, preparando-os para as análises mias detalhadas. Corresponde, em geral, ao primeiro
contato do pesquisador com os dados, precedendo qualquer escolha de técnica ou modelo. Parte desta análise é
indispensável para a criação de banco de dados e sistemas de informações. Uma importante característica desta
fase da análise é a sua flexibilidade, dispensando as considerações de pressupostos e estruturas de técnicas e
modelos da estatística analítica.
7
O termo estatística pode compreender dois conceitos, segundo seja utilizado o termo em singular ou plural. Quando utilizado em
plural, é sinônimo de dados numéricos, enquanto que no singular, a estatística é entendida como uma disciplina constituída por um
conjunto de princípios, técnicas e métodos objeto de estudo. É uma parte da matemática aplicada que se ocupa dos dados de
observação. Isso ocorre mediante métodos de análise e de projeções realizadas por diversos procedimentos da estatística descritiva
até os cálculos matemáticos da estatística analítica
50
U P I S – FA C U L D A D E S IN TE G RA DA S
Di reto ri a d e En si no d e Pós -G rad u aç ão
Notas de aula
Projeto de pesquisa. Metodologia do trabalho científico
Por outro lado, a estatística descritiva auxilia a tomada de decisões, de maneira mais rápida e eficaz,
para fazer as mudanças, aproveitar as oportunidades e preparar-se para enfrentar os desafios, quando se torna
possível ou é facilitado o controle de mais dados e informações primárias em mais curtos espaços de tempo e
de forma mais eficiente (sistemas de informação e banco de dados consistidos e integrados).
O uso da estatística descritiva ocorre no dia-a-dia para sumarizar dados, compreendendo grande
número de variáveis, discretas e contínuas, e nominais, ordinais, intervalares e de razão.
Parte dos processos de tomada de decisão, conforme se indicou no primeiro Capítulo deste Manual, se
orienta para responder que, por que, para que/para quem e como pesquisar? de forma coerente com a missão
e os recursos disponíveis e alocados no processo de pesquisa. Mediante as técnicas e métodos da estatística
descritiva caracterizam-se o problema e a solução do problema, segundo o esquema geral apresentado na
Figura 2.
8
Um desses programas (“software”) é o SAS (SAS - System for Elementary Statistical Analysis e SAS – System for Statistical
Graphics) entre muitos outros.
51
U P I S – FA C U L D A D E S IN TE G RA DA S
Di reto ri a d e En si no d e Pós -G rad u aç ão
Notas de aula
Projeto de pesquisa. Metodologia do trabalho científico
Caracterização do
problema de pesquisa Crítica dos dados para
suprir valores, eliminar erros...
Análise descritiva:
Fatos Banco de dados para facilitar - Indicadores Numéricos: IN
Elemento análises cruzadas, integração... - Ilustrações: Gráficos,
Quadro...
- Integração (IN e GQ)
RELATÓRIO
RELATÓRIO
- Síntese
- Síntese
- Ilustrações
- Ilustrações
Os atributos objeto de estudo (elementos do problema para pesquisa) deve ser avaliado e conformado
com o conceito de variável (introdução ao problema de pesquisa), identificando as fontes de informações e
procedendo ao tratamento dos dados primários (representatividade, consistência, deflação etc.). Esta etapa é
facilitada pela tecnologia da informação.
Após a coleta de dados primários e secundários é necessário fazer uma revisão (avaliação) crítica
destes, de modo a suprir valores, completar séries ou eliminar erros capazes de provocar distorções na
análise e interpretação da informação, bem como para facilitar a integração dos dados quando estes se
apresentam em eqüivalentes níveis de detalhamento e qualidade (resistência, análise de resíduos e
transformação, quando necessário).
52
U P I S – FA C U L D A D E S IN TE G RA DA S
Di reto ri a d e En si no d e Pós -G rad u aç ão
Notas de aula
Projeto de pesquisa. Metodologia do trabalho científico
A disposição dos dados consistidos e integráveis em sistemas de informação e banco de dados é uma
etapa cada vez mais importante nas empresas de pesquisa, a qual é facilitada pelas modernas técnicas e pelas
tecnologias da informação. Em sistemas integrados de informações o pesquisador poderá utilizar programas
como o SAS e os GIS para georeferenciar, se for o caso, e integrar dados, bem como para realizar as
correspondentes análises referidas aos atributos espaciais objeto de pesquisa.
Algumas das técnicas utilizadas para sumarizar dados da análise descritiva são apresentadas no Quadro 2.
Nominal NS c NS
Ordinal c
NS
Intervalar
Razão
a
SCHLOTZHAUER , Sandra D. e LITTELL, Ramon C. SAS System for elementary satatistical analysis. Cary: SAS. 1987, p. 68.
b
A conceituação dos tipos de variáveis é apresentada em aula
c
NS= Não se aplica. = Indicada como apropriada
Ilustrações
Na pesquisa socioeconômica, principalmente na fase de análise exploratória, é freqüente o uso de ilustrações
(tabela, quadro, figura, mapa, imagem de satélite/fotografia, gráfico, diagramas etc., dependendo da natureza dos dados,
da finalidade da ilustração e do público alvo do documento), utilizadas pelo pesquisador para colocar em evidência
visual o comportamento, evolução ou inter-relacionamento de poucas variáveis, destacando um (ou poucos) atributo(s).
O destaque do atributo pode ser feito em cores ou com recursos gráficos dos mais variados (tonalidades de cinza,
pontilhado, listrado em várias direções de forma simples ou combinada, pontilhado, com símbolos etc.) encontrados nos
editores de texto.
A análise gráfica é uma forma de comunicação que, quando utilizada de forma criteriosa pelo pesquisador,
facilita o processo de comunicação ao permitir transferir (comunicar) os resultados da pesquisa de forma simples e
objetiva, abrindo o caminho, em muitos casos, para a apresentação de resultados da parte analítica.
a) Reconhecer e ter o primeiro contato com o problema para pesquisa, especialmente quando se têm muitas
informações e é necessário uma primeira síntese de estas para orientar posteriores ações, inclusive, as de
pesquisa.
53
U P I S – FA C U L D A D E S IN TE G RA DA S
Di reto ri a d e En si no d e Pós -G rad u aç ão
Notas de aula
Projeto de pesquisa. Metodologia do trabalho científico
A representação gráfica, uma das ilustrações mais utilizadas em estudos socioeconômicos, tem como propósito,
dar uma idéia imediata dos resultados obtidos, permitindo chegar-se a conclusões rápidas sobre o fenômeno que
se estuda. Para que tal propósito seja atingido, o pesquisador ao construir um gráfico deverá ter em conta fatores
como simplicidade, clareza e veracidade.
A representação gráfica é o modo mais simples e direto de descrever a realidade em seus aspectos mensuráveis: é
um desenho que representa um ou mais (poucos) atributo(s) referentes a determinado aspecto da realidade ou
assunto que se quer destacar, tal como o valor atual de uma variável, a diferença entre dois valores, uma
tendência ou a diferença entre duas tendências (uma interação).
Esse desenho gráfico da realidade constitui também um instrumento de síntese que permite utilizar o meio visual
do leitor para apresentar, de forma objetiva, determinado atributo. Nessa apresentação o pesquisador deverá ter
especiais cuidados para não distorcer ou relevar aspectos (introduzir viés).
Na construção de um gráfico há três conceitos básicos a ter-se em conta: o eixo, a origem e a escala.
O eixo é o segmento de reta ou determinada área da base planar sobre a qual é definido o sentido de leitura das
variáveis. É em função desse sentido que se define a origem. Se o eixo é horizontal, é conveniente definir as
magnitudes ou valores positivos do atributo à direita da origem e as magnitudes ou valores negativos, à esquerda
do mesmo. Se o eixo for vertical, será positivo para cima da origem e negativo para baixo dele (Gráfico 1).
Sobre o eixo se distribuem, conforme o domínio da variável, os valores de medida que deverão ser eqüidistantes
(escalas simples aritmética) ou conforme a convenção adotada (logarítmica e semilogarítmica, por exemplo).
A escala representa a relação que existe entre a grandeza do atributo e a sua representação no eixo ou plano,
devendo ser cuidadosamente definida para não transmitir falsas impressões da magnitude ou de relações das
variáveis.
Os problemas de compreensão do fato ou fenômeno alvo de pesquisa aumentam com o aumento do número de
variáveis. Neste sentido, as técnicas de estatísticas podem são agrupadas para uma, duas ou mais escalas,
correspondendo, respectivamente às análises univariadas, bivariadas ... multivariadas, utilizando-se, em cada
escala, diversas técnicas de análise gráfica de reconhecimento.
O pesquisador pode ser orientado, para fazer seus gráficos, por referências documentais como a de Schmid e
Schmid (1979), Struk e White (1979), Schmid (1983), Chambers (1983), Cleveland (1985) e Kosslyn (1989),
entre outros autores citados por SAS (1991) que apresentam princípios básicos, detalhes de construção no
equilíbrio e harmonia, seleção de linha e padrões de estilo etc., para uma grande variedade de ilustrações,
gráficos, quadros e técnicas de cartografia.
Parte das anteriores orientações são complementadas com outras, obtidas, principalmente da ABNT (1988
xxxxxxxxx) e IBGE (1978, 1979 xxxxx) as quais são ilustradas, com exemplos, neste Manual.
Ilustrar textos com gráficos é uma das atividades que a maioria dos pesquisadores realiza, em muitos casos com
a falsa impressão de que estes não requerem instruções técnicas para a sua elaboração (Wainer e Thissen 1981,
citados por SAS, op. cit.).
54
U P I S – FA C U L D A D E S IN TE G RA DA S
Di reto ri a d e En si no d e Pós -G rad u aç ão
Notas de aula
Projeto de pesquisa. Metodologia do trabalho científico
A Q = -3 + 2x
6
Q
4 B Q = 8 – 2X + X2
Quarto Quadrante
2
Primeiro Quadrante
R$ Perdas Benefício R$
-14 -12 -10 -8 -6 -4 -2 0 2 4 6 8 10 12 (X)
(Y) -2
-6
No sistema de coordenadas retangulares, a representação de uma equação linear ou de uma a equação de 2 º grau
(parábola) podem ser facilmente representadas pelas linhas A e B
X2
X1
b) Para estudos exploratórios em que não são requeridos detalhamentos ou maiores níveis de informações entre
(para) as variáveis.
55
U P I S – FA C U L D A D E S IN TE G RA DA S
Di reto ri a d e En si no d e Pós -G rad u aç ão
Notas de aula
Projeto de pesquisa. Metodologia do trabalho científico
As ilustrações, especialmente gráficos da análise exploratória das pesquisas e estudos neste nível, auxiliam
detectar comportamento ou observações não-usuais nos dados; fazer diagnósticos das principais propriedades
destes, referidos a determinada situação problematizada; sugerir transformações nos dados que facilitem as
análise posteriores; estabelecer hipóteses; orientar a escolha e teste de métodos e modelos, entre outras
finalidades.
As técnicas de ilustrações da análise descritivo geralmente não requerem pressupostos acerca das propriedades
dos dados, mas com base no comportamento destes é possível sugerir um ou outra técnica, bem como testar a
adequabilidade da mesma a determinadas condições de pesquisa, conforme ilustra o Gráfico 2, para o caso de
regressionar salário (Y) com idade (X) de um jogador de futebol.
c) Elaborar testes e construir/adequar modelos a determinada realidade ou cenário, entre outros aspectos do
planejamento da pesquisa;
U P I S – FA C U L D A D E S IN TE G RA DA S
Di reto ri a d e En si no d e Pós -G rad u aç ão
Notas de aula
Projeto de pesquisa. Metodologia do trabalho científico
A parte que segue apresenta exemplos ilustrativos de diversos tipos de gráficos utilizados com freqüência na
apresentação de resultados de pesquisa.
a) Gráfico de linhas, é um dos mais utilizados devido à sua facilidade de execução e de interpretação, com a
vantagem de clarificar as relações existentes entre as variáveis, em especial de séries cronológicas, apesar de não
ser tão preciso como o quadro e outras ilustrações.
b) Gráfico de barras que pode apresentar a evolução de uma variável ao longo do tempo, ou várias variáveis em um
determinado período (Gráfico 3), colocando os valores em um dos eixos (horizontal, no exemplo que segue) na
forma de um retângulo ou cubo alongado, diferenciando-se uma de outra variável por cores ou por destaques
gráficos, símbolos ou outras formas. Os gráficos de barra permitem fazer comparações simultâneas de duas ou
mais variáveis, ou entre grupos de variáveis, como no exemplo do Gráfico 3, com seis tipos de variáveis
agrupadas em três conjuntos. No gráfico de barras também é possível combinar séries temporais com duas ou
mais variáveis em cada unidade de tempo do período, permitindo fazer comparações em mais de um sentido. O
Gráfico 3 apresenta duas possíveis formas alternativas de comparações no ano e ao longo de um período, para o
caso de três variáveis.
c) Gráficos de setores em que as variáveis são representadas por setores proporcionais aos correspondentes valores
individuais num círculo. Esta representação é utilizada quando se pretende comparar cada valor com o total. O
Gráfico 4 ilustra este tipo de representação.
d) Gráfico polar, em que os dados das variáveis são representados por meio de polígonos em torno de determinados
anelos concêntricos. Os raios da circunferência delimitam os períodos e a distância do centro o valor da variável.
O Gráfico 5 representa um exemplo deste tipo de gráfico.
e) Gráfico triangular, baseado na construção de um triângulo equilátero em cujos lados são dispostos os valores das
variáveis para fazer comparações simultâneas de três características de uma mesma população, em especial,
quando esses três atributos formam um conjunto de elementos que podem ser desagrados e apresentados como
uma proporção desse conjunto. Os exemplos apresentados no Gráfico 6 mostram duas formas alternativas (I e
II) de construção deste tipo de ilustração.
Na primeira, a representação de um ponto qualquer (por exemplo P), é feita conforma as coordenadas desse
ponto, nos três eixos, que correspondem aos lados do triângulo.
No segundo tipo de representação, os eixos deixam de ser os lados do triângulo e passam a ser as bissetrizes dos
ângulos opostos. Cada uma dessas bissetrizes constitui uma escala de o a 100% na qual se localiza o valor de
cada atributo, conforme se indica no Gráfico.
f) Pictograma, é um tipo de gráfico em que os valores das variáveis são representados por figuras ou símbolos
sugestivos, relacionados com o problema de estudo e cujas dimensões deverão ser proporcionais às freqüências
observadas. (Gráfico 7).
57
U P I S – FA C U L D A D E S IN TE G RA DA S
Di reto ri a d e En si no d e Pós -G rad u aç ão
Notas de aula
Projeto de pesquisa. Metodologia do trabalho científico
Produção (t) de Trigo (T), Milho (M) e Arroz (A)
Trigo
Milho
Arroz
Trigo
Produção (t) de Trigo (T), Milho (M) e Arroz (A)
Milho
Arroz
Ano ( T )
1980 1984 1988 1992 1996
U P I S – FA C U L D A D E S IN TE G RA DA S
Di reto ri a d e En si no d e Pós -G rad u aç ão
Notas de aula
Projeto de pesquisa. Metodologia do trabalho científico
21%
Setor
42% Primário
Secundário
Terciário
37%
10 20 30
U P I S – FA C U L D A D E S IN TE G RA DA S
Di reto ri a d e En si no d e Pós -G rad u aç ão
Notas de aula
Projeto de pesquisa. Metodologia do trabalho científico
I 40% de A II
P 42% de B
28% de C
100% c
Atributo B
At r i b u t o B
100% 0
Atribut o A
10 90
Atributo A
20 80
a%
30 70
40 60
50 50 0% a 0% b
60 40 b%
70 P 30
80 20
90 10 P
100% 0
100% b 100% a
0 10 20 30 40 50 60 70 80 90 100% 0% c
c% At r i b u t o C At r i b u t o C
U P I S – FA C U L D A D E S IN TE G RA DA S
Di reto ri a d e En si no d e Pós -G rad u aç ão
Notas de aula
Projeto de pesquisa. Metodologia do trabalho científico
Estatísticas descritivas
As estatísticas (parâmetros para o caso da população e estatísticas quando se trata da amostra) devem satisfazer
determinados critérios, sintetizados a seguir:
a) Objetividade, entendida como a tendência de julgar pelos fatos e fenômenos do objeto de pesquisa sem
deixar-se influenciar pelos sentimentos ou preconceitos a cerca dos mesmos;
c) Significado preciso para a sua interpretação, facilitado quando o pesquisador tem claros e precisos conceitos
teóricos e a definição do problema de/para pesquisa é objetiva e delimitada;
As estatísticas de uso freqüente na pesquisa socioeconômica, muitas delas utilizadas de forma conjunta com
outras e com diversas formas de ilustrações, são:
a) Medidas de localização;
b) Medidas de dispersão;
c) Medidas de assimetria;
d) Medidas de curtose;
e) Medidas de concentração.
U P I S – FA C U L D A D E S IN TE G RA DA S
Di reto ri a d e En si no d e Pós -G rad u aç ão
Notas de aula
Projeto de pesquisa. Metodologia do trabalho científico
As medidas de tendência central incluem, além da média (que pode ser aritmética, geométrica e harmônica), a
moda e a mediana. As características dessas medidas são apresentadas no Quadro 3.
Outras medidas de tendência que permitem localizar, não sua posição central, os valores da variável, são os
quantis, decis, quartis e percentis, conceitualizados e ilustrados a continuação:
a) quartis; corresponde aos valores da variável que dividem a distribuição de freqüência dos dados amostrais em
quatro partes iguais, conforme se ilustra a seguir:
100%
0% 25% 50% 75%
fi
Q1 Q2 Q3 Q4 xi
em que,
Q1 é igual ao valor da variável com um número de observações de até 25%;
Q2 terá a metade das observações, à sua direita e a outra metade, à sua esquerda, coincidindo com a mediana;
Q3 é um valor tal que à sua esquerda concentrar-se-ão 75% das observações e à sua direita os restantes 25%.
(Um exemplo de primeiro e terceiro quartil é apresentado na Tabela 3).
b) Os decis (D); são valores de localização da variável que dividem a distribuição de freqüência em dez partes
iguais. Um exemplo ilustrativo é apresentado na Tabela 6.1, com detalhamento, em nota de rodapé, sobre o
cálculo dos decis.
62
U P I S – FA C U L D A D E S IN TE G RA DA S
Di reto ri a d e En si no d e Pós -G rad u aç ão
Notas de aula
Projeto de pesquisa. Metodologia do trabalho científico
Quadro 3 Síntese das principais características das medidas de tendência central (localização)
MEDIDA CARACTERÍSTICAS
Como principais propriedades têm-se: a soma algébrica dos desvios de um conjunto de valores [x1, x2,
x3,..., xn] de uma variável, em torno da média aritmética, é zero; e a soma dos desvios ao quadrado é
mínima quando tais desvios são estimados em relação a média aritmética. Estas propriedades matemáticas
revelaram-se importantes na estatística.
Principais desvantagens: trata-se de uma medida influenciada pelos valores observados extremos. Qualquer
alteração num desses valores pode produzir uma modificação na média que poderá tomar um valor
diferente dos observados.
O valor da média poderá apresentar viés devido apenas a alguns valores extremos, podendo não ser
representativa se a distribuição for assimétrica.
Em distribuições, com classes abertas, a média poderá apresentar um viés, especialmente quando não se
tem informação acerca dos os limites dessas classes.
1 Média aritmética É a medida de tendência central mais eficiente quando se trata de inferir sobre uma população a partir de
uma amostra estatística obtida de uma população normal ou aproximadamente normal (verificada pelo
(Fórmulas 1 a 5) teste correspondente).
Para o caso de uma amostra com dados não agrupados, utiliza-se a fórmula 2. Em outros casos, as fórmulas
empregadas serão 4 e 5. As ilustrações de um e outro caso são apresentadas no texto
Como principais vantagens tem-se a facilidade de cálculo e interpretação, além de utilizar toda a
informação disponível.
A média aritmética ( x ) representa um valor artificial da característica ou atributo que se estuda,
representado por uma variável mensurável intervalar ou de razão (veja Quadro 6.1), atribuído a cada um
dos elementos [x1, x2, x3,..., xn] da população (ou amostra que a representa) em um processo de
generalização. Para que seja válida (rigor técnico) essa generalização é necessária considerar quais são as
características estatísticas da população (distribuição para o caso de uma amostra sem agrupamento, ponto
médio que representa o intervalo da classe etc.).
Como principais vantagens têm-se o fato de utilizar toda a informação disponível, desde que a variável não
apresente valores nulos ou negativos. Os valores extremos têm um menor efeito sobre a média que no
caso da média aritmética.
2 Média É especialmente recomendada para sintetizar dados de fenômenos cujas variações são proporcionais a um
geométrica valor inicial, como é o caso das taxas de variações. Por outro lado, é mais difícil de calcular e interpretar
quando, para n>2, forem utilizados logaritmos, conforme se indica pela fórmula (6).
(Fórmula 6) Como principais desvantagens relacionam-se a impossibilidade de se aplicar quando a variável toma
valores nulos ou negativos. Poderá ser um valor que não corresponde a nenhum valor da variável, a
semelhança do caso da média aritmética.
63
U P I S – FA C U L D A D E S IN TE G RA DA S
Di reto ri a d e En si no d e Pós -G rad u aç ão
Notas de aula
Projeto de pesquisa. Metodologia do trabalho científico
Continuação
Quadro 3 Síntese das principais características das medidas de tendência central (localização)
MEDIDA CARACTERÍSTICAS
3 Média É recomendada em situações em que pode-se observar certa proporcionalidade inversa nos dados como nos
harmônica casos de fenômenos de velocidade média e o custo médio de bens comprados com uma quantia fixa.
(Fórmula 7)
É fácil de calcular e de compreender. É determinada pelo número de observações e não pelo seu valor; desse
modo, os valores extremos, grandes ou pequenos, não afetam o seu valor.
Pressupõe que as freqüências se distribuem uniformemente dentro de cada classe.
4 Mediana
É muito utilizada sobretudo em distribuições assimétricas, porém, para fins de inferência, não satisfaz as
propriedades de um bom estimador.
É outra medida de localização cuja definição atende o significado semântico da palavra. Com efeito, na análise
descritiva para socioeconomia, moda é um fenômeno de massa em que certa característica comportamental
ou um fato (atributo de interesse no estudo) domina os membros de uma comunidade. Do ponto de vista
matemática, a moda pode ser traduzida pela expressão maximizante local de um determinado atributo, Esta
característica pode ser posta em evidência mediante um diagrama de barra em que a intensidade é
representada pela freqüência relativa, sendo a moda o maior valor dessas freqüências.
Como principal vantagem tem-se a facilidade de calcular e interpretar, além de não ser afetada por valores
5 Moda extremos. É de uso menos freqüentes que a média e a mediana.
Em algumas distribuições esta medida não existe, enquanto que em outras existe mais que uma moda
(multimodal).
Pode ser utilizada em qualquer situação, mesmo quando a distribuição está definida em classes abertas.
Como principal desvantagem relaciona-se não poder ser definida com rigor e o seu valor exato ser, muitas
vezes, incerto.
Se a média aritmética é uma medida de posição de um conjunto de dados que leva em consideração apenas os
valores observados de um atributo, os percentis, em contrapartida, tomam em conta a ordenação dessas
observações. Assim, para um conjunto de dados dispostos em ordem de grandeza, o valor médio (ou a média
6 Quantis:
aritmética dos dois valores médios) que divide o conjunto em duas partes iguais é a mediana, enquanto que
decis, quartis
os valores que dividem o conjunto de observações em quatro, dez ou cem partes iguais são,
e percentis
respectivamente, os quartis (Q), os decis (D)e os percentis (P), representados por [Q1, Q2, .., Q4], [D1,
D2,...,D10] e [P1, P2,...,P100]. O D5 e o P50 correspondem à mediana; o P25 e P75 correspondem a Q1 e Q3 e
assim por diante.
64
U P I S – FA C U L D A D E S IN TE G RA DA S
Di reto ri a d e En si no d e Pós -G rad u aç ão
Notas de aula
Projeto de pesquisa. Metodologia do trabalho científico
N
xi 1
x1 x 2 x 3 ...x N
i1
N N
n
xi 2
x1 x 2 x 3 .... x n
X i1
n n
O preço médios de oito modelos de camisetas (T-shirt) em um shopping de Brasília, é calculado com base nos
dados apresentados na Tabela 1
Tabela 1 Preços de oito modelos de camisetas no shopping
XXX de Brasília. Dezembro 1998.
PREÇO
MODELO
R$/Unidade
1 Simples 6,50
2 Ronaldinho 11,20
3 Roberto Carlos (jogador) 10,75
4 Guga 10,00
5 Julio Iglesias 12,50
6 Madonna 12,50
7 Animais do Pantanal 16,20
8 Animais da Amazônia 14,60
Desvio-padrão 2,95
U P I S – FA C U L D A D E S IN TE G RA DA S
Di reto ri a d e En si no d e Pós -G rad u aç ão
Notas de aula
Projeto de pesquisa. Metodologia do trabalho científico
N
pi xi
i1 f i x i
N 3
p i 1
N
em que, fi = pi / N
Quando os dados são apresentados em uma tabela de freqüência, os valores individuais não são conhecidos.
Neste caso, a média aritmética utiliza uma fórmula simplificada, gerando o mesmo resultado conforme se observa no
exemplo ilustrativo da Tabela 2.
A pressuposição de que o ponto médio do intervalo da classe representa adequadamente esse intervalo está
baseada na uniformidade da distribuição ao longo do intervalo. Esta pressuposição é admissível quando se tem grandes
amostras e as freqüências são numerosas. No exemplo apresentado na Tabela 2 se observa certa discrepância o que gera
um pequeno viés na estimativa da média.
Tabela 2 Dados agrupados e dados desagrupados de um levantamento Amostral, a e estimativas da média aritmética
Média aritmética ponderada (fator pi) de uma amostra da população para dados desagregados:
X
n
pi xi
i 1 f i x i
i 1
n 4
n
em que, fi = pi / n
U P I S – FA C U L D A D E S IN TE G RA DA S
Di reto ri a d e En si no d e Pós -G rad u aç ão
Notas de aula
Projeto de pesquisa. Metodologia do trabalho científico
5
n n
x cc j f j / n cc jh j
j 1 j 1
em que, hj = fj / n
6a
n
MG n x1 .x2 .x3 .....xn n
i 1
xi , para xi >0.
log.M G log i 1 xi n
1
n
n
n
n
n
1 log i 1 xi 1 i 1 log .xi
6b
M ant. log 1 n n
i 1
log xi 6c
M G ant. log i 1 f i log xi
n
6d
67
U P I S – FA C U L D A D E S IN TE G RA DA S
Di reto ri a d e En si no d e Pós -G rad u aç ão
Notas de aula
Projeto de pesquisa. Metodologia do trabalho científico
Tabela 3 Distribuição de freqüência da variável peso de produção de (...) registrado no Parque Agroindustrial de
Brasília para diferentes tipos de controle (...), e estimativas de quartis. 1999 a
PESO
FREQÜÊNCIA ACUMULADA
(kg “Peso Seco”) NÚMERO FREQÜÊNCIA
I N T E R VA L O PESO ( n ) ( % )
DECI S b
MÉDIO
4,04
20,00 35,00 27,50 12 4,O4
9,76
35,00 50,00 42,50 17 5,72
24,57 D1 = 50,08
D2 = 53,49
50,00 65,00 57,50 44 14,81
D3 = 56,90
46,79
65,00 80,00 72,50 66 22,22
69,69 D4 = 75,00
80,00 95,00 87,50 68 22,90 D5 = 85,12
85,18
95,00 110,00 102,50 46 15,49
95,62
110,00 125,00 117,50 31 10,44
100,00
125,00 140,00 132,50 13 4,38
297 100,00
x ( ponderada) 82,15
a
Fonte: Dados primários obtidos do Departamento de Produção da AgroAgnia(1998)
b
O primeiro, o segundo, o terceiro, ... e o nono decis são obtidos mediante a contagem dos n/10, 2n/10, 3n/10, ... e 9n/10 casos, a partir
do menor intervalo de pesos.
No caso do primeiro decil (D1), o valor de localização da produção é obtida mediante a contagem de n/10 = 297/10 = 29,7 casos, a
partir dos primeiros estratos de produção (n1 + n2) que contém 29 casos (9,76% dos casos), devendo-se considerar 0,24 (10,00 – 9,76)
dos 44 casos registrados no terceiro estrato.
Para o segundo decil (D2), o valor da produção é obtido mediante a contagem de 2n/10 = 59,40 casos, devendo-se considerar 10,24
(20,00 – 9,76) dos 44 casos registrados no terceiro estrato.
Para o terceiro decil (D3), o valor da produção é obtido mediante a contagem de 3n/10 = 89,10 casos, devendo-se considerar 20,24
(30,00 – 9,76) dos 44 casos registrados no terceiro estrato.
Para o quarto decil (D4), o valor da produção é obtido mediante a contagem de 4n/10 = 118,80 casos. Até o terceiro estrato tem-se 74
casos. Portanto, é necessário considerar 44,00 (118,00 – 74,00) casos do quarto estrato que contém 66 elementos amostrais.
Para o quinto decil (D5), o valor da produção é obtido mediante a contagem de 5n/10 = 148,6 casos. Até o quarto estrato tem-se
registrado 139 elementos. Portanto, é necessário considerar 9,6 (148,60 – 139,00) casos dos 68 registrados no quinto estrato.
Dessa maneira e aplicando a fórmula apresentada no Quadro 6.1, tem-se:
D1 = 50,00 kg + ( 0,24/44) x (15 kg) = 50,08 kg
D2 = 50,00 kg + (10,24/44) x (15 kg) = 53,49 kg
D3 = 50,00 kg + (20,24/44) x (15 kg) = 56,90 kg
D4 = 65,00 kg + (44,00/66) x (15 kg) = 75,00 kg
D5 = 80,00 kg + ( 9,60/68) x (15 kg) = 85,12 kg
68
U P I S – FA C U L D A D E S IN TE G RA DA S
Di reto ri a d e En si no d e Pós -G rad u aç ão
Notas de aula
Projeto de pesquisa. Metodologia do trabalho científico
Medidas de Dispersão
Nas medidas de localização considera-se apenas um aspecto da distribuição e caracterização de uma variável.
Para uma caracterização mais completa do atributo em estudo é necessário especificar, junto com uma das
medidas de localização, uma medida, apropriada ao caso de estudo, que dê uma indicação da dispersão dos valores da
variável. Com essa indicação define-se a representatividade da medida de localização pela intensidade com que os
valores observados da variável se afastam da medida de tendência central.
A utilização do IV tem como principal vantagens sua simplicidade de cálculo, e como principal desvantagem,
o fato de considerar apenas os valores extremos da variável. Portanto, esta estatística não é sensível aos
valores intermediários, isto é, não considera a variabilidade dos restantes valores assumidos pela variável.
Exemplos são mostrados na Tabela 4.
a. 2) Intervalo interquartis (IIq), definido como a diferença entre o terceiro e o primeiro quartis e corresponde a
um intervalo que compreende 50% das observações centrais da variável em estudo, definido pela expressão:
(8)
IIq = Q3 – Q1
A utilização do IIq tem como desvantagem não ser influenciado por metade dos valores observados que se
encontram nos extremos da distribuição de freqüência.
Exemplo: Com os dados apresentados na Tabela 5 foi estimado o IIq = R$1.060.
69
U P I S – FA C U L D A D E S IN TE G RA DA S
Di reto ri a d e En si no d e Pós -G rad u aç ão
Notas de aula
Projeto de pesquisa. Metodologia do trabalho científico
U P I S – FA C U L D A D E S IN TE G RA DA S
Di reto ri a d e En si no d e Pós -G rad u aç ão
Notas de aula
Projeto de pesquisa. Metodologia do trabalho científico
É mais freqüente, como medida de dispersão, o uso da amplitude semi-inerquartílica, definida como IIq / 2.
b) Medidas de distância em que se utiliza uma medida de localização (média aritmética, mediana, moda...) como
termo de comparação ou referência. Exemplos destas são o desvio absoluto médio, a variância e o desvio-
padrão, ilustradas a seguir.
b.1) O desvio médio absoluto (DMA), utilizado nos casos em que os desvios de cada uma das observações (Xi)
são considerados em relação a média aritmética x , isto é (Xi - x ).
No Quadro 2 foi indicado que o somatório algébrico desses desvios é zero. Assim, para ter-se uma idéia do
comportamento dos desvios (Xi - x ), existem duas alternativas: a primeira, apresentar o conjunto dos
desvios em termos absolutos ou, a segunda, elevar ao quadrado tais desvios; a primeira define o desvio
absoluto médio e a segunda, a variância.
Quando os dados são desagregados, o DMA é calculado pela seguinte expressão:
DMA = [ |Xi - | ] / N 9a
DMA = [ |Xi - x | ] / n
9b
Enquanto que para dados agregados na forma de uma tabela de freqüência, o DMA é a média aritmética dos
desvios dos valores da variável relativamente à sua média, sendo definido pela seguinte expressão:
DMA = fi |Xic - x | / n 9c
onde,
Xi é o valor da i – ésima observação;
x e é a estimativa da média aritmética obtida de uma amostra de n elementos e a média da população
composta de N elementos, respectivamente;
Xic é o ponto médio do intervalo em que a variável foi reduzida;
Fj é a freqüência das variáveis correspondente a j - éssima classe ou intervalo.
Outra referência utilizada para o cálculo dos desvios poderia ser a mediana, gerado-se um índice com um valor
mínimo.
O DMA é uma medida de dispersão não-negativa, em que quanto maior o seu valor, maior será a dispersão da
variável
O exemplo apresentado na Tabela 6 mostra duas estatísticas de localização calculas com dois procedimentos
diferentes, com resultados diferentes, em função das pressuposições implícitas em e outra técnica de cálculo.
71
U P I S – FA C U L D A D E S IN TE G RA DA S
Di reto ri a d e En si no d e Pós -G rad u aç ão
Notas de aula
Projeto de pesquisa. Metodologia do trabalho científico
k
Disposição dos dados para calcular a variância a partir de dados agrupados: x
j 1
fjx j / n = 27,857
|xi – x |
xi fi xi fi d fi x i2 x i2 fi
=d
15 3 45 12,857 38,571 225 675
25 6 150 2,857 17,141 625 3750
35 3 105 7143 21,429 1225 3675
45 2 90 17,143 34,286 2025 4050
111,42
k
14 390 4100 12150
j1 8
n
s2 [
j1
x 2j f j ] ( x ) 2 ] / n = 12150 / 14 – (27,857)2= 867,86 – 776,01 = 91,85
n n
s2 1 ( xi x ) 2 di2 = 113,95
n 1 i 1 i 1
Analisar as pressuposições (bases teóricas) de uma e outra técnica e testar a aderência dessas técnicas às
condições de pesquisa (base prática), é uma das tarefas básicas do pesquisador na escolha apropriada de
técnicas e métodos de síntese e análise de dados.
b.2) Variância (s2) e desvio-padrão (s) de um conjunto de dados (uma amostra, por exemplo) é definida como o
quadrado dos desvio em torno da média aritmética.
Para o caso de dados desagregados a variância é calculada por uma das seguintes fórmulas alternativas (10a para
a população e 10b ou 10c para o caso de uma amostra estatística):
72
U P I S – FA C U L D A D E S IN TE G RA DA S
Di reto ri a d e En si no d e Pós -G rad u aç ão
Notas de aula
Projeto de pesquisa. Metodologia do trabalho científico
2 I1 ( x i ) 2 / N
N
10a
(x x) /(n 1)
n
s2 i
2
i 1
... d /(n 1)
n 10b
2
i 1
n 1
x / n (
n n
... (n )[ 2
i x i / n) 2 ]
i 1 i 1
em que,
n
i1
x i2 / n indica a media dos quadrados dos diferentes valores de xi, enquanto que o segundo termo,
(
n
i1
x i / n) 2 indica o quadrado da média dos diferentes valores de xi
Para o caso de amostras com n>30 elementos, a última expressão do conjunto (10b) pode ser simplificada na
seguinte forma:
n n
s 2 [( x12 / n) ( x i / n) 2 ]
i 1 i 1
10c
O estimador assim calculado constitui um estimador não-tendecioso ou centrado para o verdadeiro parâmetro da
população (2), propriedade que é importante para o propósito de generalizar os resultados para a toda a
população representada por uma amostra estatística
Para o caso de dados agregados (amostra em que não se conhecem os valores individuais) e considerando que a
variação da amplitude do intervalo de cada classe seja igual, a fórmula utilizada para estimar a variância é:
isto é, a variância é definida como a diferença entre a média aritmética do quadrado dos valores da variável xj
m
s2 f j ( x j x) 2 10d
j 1
...
m
f j x j ( x) 2
j 1
(f jx 2
j ) e o quadrado da média aritmética (x ) 2 .
Onde,
xj é o ponto médio do intervalo da classe cuja freqüência é dada por fj, sendo m o número total de freqüência (m=
f
m
j
j ).
O pressuposto básico é que todos os valores compreendidos em um dado intervalo ou classe tem como ponto
médio xj. Esta pressuposição, em alguns casos, não é válida, introduzindo, quando se aplica a fórmula (10d)
certo viés como se observa com as estimativas apresentadas na Tabela 2. Nos casos em que os intervalos de
73
U P I S – FA C U L D A D E S IN TE G RA DA S
Di reto ri a d e En si no d e Pós -G rad u aç ão
Notas de aula
Projeto de pesquisa. Metodologia do trabalho científico
classe dos dados agrupados sejam desiguais, o pesquisador deverá ajustar a fórmula para corrigir possíveis
distorções.
O desvio-padrão é definido como a raiz quadrada da variância, constituindo-se o menor valor quando a
referência para estimar os desvios de xi for a média aritmética.
O desvio-padrão é a medida mais utilizada, com propriedades matemáticas que a tornam apropriada para a
inferência estatística. Esta medida é afetada por todos os valores das observações da amostra. A semelhança do
que ocorre com a média aritmética, o desvio-padrão pode ser influenciado por apenas alguns valores extremos,
pelo que não é recomendado seu uso em distribuições assimétricas
b.3) Medidas de dispersão relativa. As medidas de dispersão apresentadas acima são medidas em termos absolutos,
isto é, medidas que dependem das unidades em que se expressa a variável (por exemplo, a s2 da variável peso
(kg2), cumprimento (m2), e receita (R$ 2) etc., com seus respectivos desvio-padrão: kg, m, R$ etc. Esta
característica é limitante quando se trata de comparação da dispersão de duas ou mais distribuições, sobretudo se
estas estiverem especificadas em unidades de medidas diferentes (peso: kg, lb, t etc.), ou se as mediadas forem
diferentes. Nestes casos devem utilizar-se medidas de dispersão relativa.
As medidas de dispersão relativa podem ser definidas por:
11
Dispersãorelativa (Dispersão..absoluta)
(Média)
No caso em que a dispersão absoluta seja o desvio-padrão e a média seja a média aritmética, a dispersão relativa,
denominada coeficiente de variação (CV), é definido pela seguinte expressão:
CV s 100 12
x
ou CV s (%)
x
Solução:
As estimativas dos CV para os trabalhadores (CVH) e para as
trabalhadoras (CVM), é:
CVH = 120 / 680 = 17,65
CVM = 105 / 520 = 20,19
74
U P I S – FA C U L D A D E S IN TE G RA DA S
Di reto ri a d e En si no d e Pós -G rad u aç ão
Notas de aula
Projeto de pesquisa. Metodologia do trabalho científico
Quais são as pressuposições implícitas nessa medida de dispersão? A definição das estatísticas s e x estão
sujeitas a determinados pressupostos, entre outros, o da normalidade da distribuição, que deverão ser observados
na definição do coeficiente. Por ser uma medida adimensional (independente das unidades de medidas adotadas)
o CV pode ser utilizado para a comparação de distribuições cujas unidades podem ser diferentes. Entretanto,
quando a medida de localização é próximo de zero, ele deixe de ser útil.
Em termos práticos, coeficientes de variação superior a 50% indicam alto grau de dispersão relativa e,
consequentemente, uma menor representatividade da média aritmética como medida estatística. Para valores do
coeficiente de variação inferiores a 50%, a média será tanto mais representativa quanto menor seja a estimativa
desse coeficiente.
Se não há nenhuma pressuposição quanto à distribuição dos dados amostrais ou da população da qual foram
obtidos esses dados e é conveniente a utilização de quantis para caracterizar a localização e a dispersão da
variável, então poderá definir uma medida de dispersão relativa. Por exemplo, a partir dos quartis, é possível
definir:
14
Z ( xi x )
s
Exemplo. Em uma prova de econometria um estudante obteve qualificação de 75,
em que a média do grupo foi de 72 e o desvio padrão 8. Na prova de estatística,
para a qual a nota média do grupo foi 80 e o desvio-padrão 11, ele recebeu a
nota 84. Em que disciplina sua posição relativa foi mais elevada?
Solução:
A solução deste problema pode ser obtida mediante a aplicação da variável
reduzida Z que mede o desvio de X em relação a média, em termos de desvio-
75
U P I S – FA C U L D A D E S IN TE G RA DA S
Di reto ri a d e En si no d e Pós -G rad u aç ão
Notas de aula
Projeto de pesquisa. Metodologia do trabalho científico
Medidas de Concentração
Em muitas situações da análise descritiva em que determinado atributo se pode distribuir de modo mais (até a
plena regularidade na distribuição, onde cada elemento da população detém igual parcela do atributo) ou menos (até a
concentração máxima, onde um elemento da população detém todo o atributo) uniforme é necessário utilizar uma
medida de concentração. Com essa medida pode-se avaliar a concentração de renda, de riqueza, de áreas de
exploração agrícola em determinada atividade, de salários, de meios de produção etc., mas em fatos e fenômenos
como idade, peso ou altura das pessoas não é possível aplicar essa medida.
Curva de Lorenz
Esta curva é feita com as freqüências acumuladas dos elementos da população (amostra) que possuem
determinada característica (yi acum) e da característica considerada no estudo (xj acum), conforme ilustra o Gráfico 8.
Conforme seja a natureza do problema, a distribuição do atributo dentro das classes e o rigor de precisão que
se deseja no estudo, o pesquisador poderá idealizar relações empíricas para definir ou ter aproximações quanto ao
nível de concentração do atributo em estudo. Uma das possíveis relações empíricas para uma análise preliminar, é
apresentada nos gráficos ilustrativos B, C e D do Gráfico 8.
76
U P I S – FA C U L D A D E S IN TE G RA DA S
Di reto ri a d e En si no d e Pós -G rad u aç ão
Notas de aula
Projeto de pesquisa. Metodologia do trabalho científico
0 10 20 30 40 50 60 70 80 90 100%
m
acum.f j x / fj
j 1
Curva de Lorenz
Proprietários (x)
0 10 20 30 40 50 60 70 80 90 100%
m
acum..f j y / fj
j1
D
B C
100%
50%
L0
L1 L1 L0
L0 L1
Área Plantada (y)
0%
100%
50%
0
100%
100%
50%
50%
0
U P I S – FA C U L D A D E S IN TE G RA DA S
Di reto ri a d e En si no d e Pós -G rad u aç ão
Notas de aula
Projeto de pesquisa. Metodologia do trabalho científico
Baseado na observação da curva de Lorenz de que quanto maior a concentração de um atributo nos
elementos da população ou num estrato de uma amostra, mais a curva se afastará da reta de igual distribuição.
Gini propôs um índice para mediar o grau dessa concentração, definido pela seguinte expressão:
m 1 m 1
(p j q j ) qj
15
j 1 j 1
IG 1
m 1 m 1
pj pj
j 1 j 1
em que:
m é o número de classes;
acum.f j .x
pj
m 1
fj
j 1
acum.f j .y
qj
m 1
fj
j 1
A estimativa do IG pode variar entre 0 e 1, sendo nulo quando em todas as classes houver igual distribuição
do atributo ( x ) em estudo nos elementos ( y ) da população (amostra), e com valor máximo de 1,00 quando todos
os atributos estão concentrados nos indivíduos da última classe.
U P I S – FA C U L D A D E S IN TE G RA DA S
Di reto ri a d e En si no d e Pós -G rad u aç ão
Notas de aula
Projeto de pesquisa. Metodologia do trabalho científico
m
( f j .. / x j .e.y j ) 4,181 3,300
j 1
a
Fonte: xxxxxx(1998)
b
Unidades de R$1.000, deflacionado pelo índice xxxxx
m 1
qj
j 1
IG 1 1 – (3,300 / 4,181) = 0,211
m 1
pj
j 1
Medidas de Dispersão
Nas medidas de localização considera-se apenas um aspecto da distribuição e caracterização de
uma variável.
79
U P I S – FA C U L D A D E S IN TE G RA DA S
Di reto ri a d e En si no d e Pós -G rad u aç ão
Notas de aula
Projeto de pesquisa. Metodologia do trabalho científico
Para uma caracterização mais completa do atributo em estudo é necessário especificar, junto com uma das
medidas de localização, uma medida, apropriada ao caso de estudo, que dê uma indicação da dispersão
dos valores da variável. Com essa indicação define-se a representatividade da medida de localização pela
intensidade com que os valores observados da variável se afastam da medida de tendência central. As
medidas de dispersão podem ser agrupadas em categorias, assim:
a) Medidas de distância, com seus valores nas mesmas unidades de medida dos dados originais da
variável que representa o atributo em estudo; nesta medida não há cálculo prévio de uma medida de
localização da variável em estudo. Exemplos são o intervalo de variação e o intervalo interquartis.
a.1) O intervalo de variação (IV) é definido como a diferença entre os valores máximo (XMAX) e
mínimo (XMIN) da variável, definido pela expressão:
(7)
IV = XMAX – XMIN
A utilização do IV tem como principal vantagem sua simplicidade de cálculo, e como principal
desvantagem, o fato de considerar apenas os valores extremos da variável. Portanto, esta estatística
não é sensível aos valores intermediários, isto é, não considera a variabilidade dos restantes valores
assumidos pela variável. Exemplos são mostrados na Tabela 8.
a. 2) Intervalo interquartis (IIq), definido como a diferença entre o terceiro e o primeiro quartis e
corresponde a um intervalo que compreende 50% das observações centrais da variável em estudo,
definido pela expressão:
(8)
IIq = Q3 – Q1
A utilização do IIq tem como desvantagem não ser influenciado por metade dos valores observados
que se encontram nos extremos da distribuição de freqüência.
Exemplo: Com os dados apresentados na Tabela 9 foi estimado o IIq = R$1.060.
80
U P I S – FA C U L D A D E S IN TE G RA DA S
Di reto ri a d e En si no d e Pós -G rad u aç ão
Notas de aula
Projeto de pesquisa. Metodologia do trabalho científico
i 1 Classes
nclasses
100
a
Fonte: Dados primários obtidos da Secretaria de Recursos Humanos da UniverTag (1998). b Os valores nominais foram ajustados
pelo índice...c O primeiro quartil (Q1) é o salário obtido mediante a contagem de n/4 = 100/4 = 25 casos, a partir dos primeiros
estratos de salários. Como os dois primeiros estratos (n1 + n2) contém 16 casos, deve-se considerar 9 (25 – 16) dos 15 casos
registrados no terceiro estrato. Dessa maneira e aplicando a fórmula correspondente, tem-se:
Q1 = R$1.6000 + (9/15)(R$400) = R$1.840
d
O terceiro quartil (Q3) é calculado mediante a contagem dos primeiros (3n/4 = 75) casos. Como os primeiros quatro estratos contém
71 casos, então é necessário considerar 4 casos da amplitude do seguintes estrato (neste exemplo as amplitudes são constantes
= R$400). Dessa forma, tem-se:
Q3 = R$2.800 + (4/16) (R$400) = R$2.900
81
U P I S – FA C U L D A D E S IN TE G RA DA S
Di reto ri a d e En si no d e Pós -G rad u aç ão
Notas de aula
Projeto de pesquisa. Metodologia do trabalho científico
É mais freqüente, como medida de dispersão, o uso da amplitude semi-inerquartílica, definida como IIq /
2.
b) Medidas de distância em que se utiliza uma medida de localização (média aritmética, mediana,
moda...) como termo de comparação ou referência. Exemplos destas são o desvio absoluto médio, a
variância e o desvio-padrão, ilustradas a seguir.
b.1) O desvio médio absoluto (DMA), utilizado nos casos em que os desvios de cada uma das
observações (xi) são considerados em relação a média aritmética x , isto é (Xi - x ).
No Quadro 6.2 foi indicado que o somatório algébrico desses desvios é zero. Assim, para ter-se
uma idéia do comportamento dos desvios (xi - x ), existem duas alternativas: a primeira,
apresentar o conjunto dos desvios em termos absolutos ou, a segunda, elevar ao quadrado tais
desvios; a primeira define o desvio absoluto médio e a segunda, a variância.
Quando os dados são desagregados, o DMA é calculado pela seguinte expressão:
DMA [Ni1| x i |] / N 9
DMA [ni1| x i x |] / n 9a
Enquanto que para dados agregados na forma de uma tabela de freqüência, o DMA é a média
aritmética dos desvios dos valores da variável relativamente à sua média, sendo definido pela
seguinte expressão:
DMA kj1 f j | x jc x | / k 9c
onde,
xi é o valor da i – ésima observação;
x e são, respectivamente, a estimativa da média aritmética obtida de uma amostra de n
elementos e a média da população composta de N elementos;
Xjc é o ponto médio do j-éssimo intervalo em que a variável foi reduzida para k classes;
fj é a freqüência de valores da variável contidos na j - éssima classe ou intervalo.
Outra referência utilizada para o cálculo dos desvios poderia ser a mediana, gerado-se um índice com
um valor mínimo.
O DMA é uma medida de dispersão não-negativa, em que quanto maior o seu valor, maior será a
dispersão da variável
O exemplo apresentado na Tabela 10 mostra duas estatísticas de localização calculas com dois
procedimentos diferentes, com resultados diferentes, em função das pressuposições implícitas em e
outra técnica de cálculo.
82
U P I S – FA C U L D A D E S IN TE G RA DA S
Di reto ri a d e En si no d e Pós -G rad u aç ão
Notas de aula
Projeto de pesquisa. Metodologia do trabalho científico
Analisar as pressuposições (bases teóricas) de uma e outra técnica e testar a aderência dessas
técnicas às condições de pesquisa (base prática), é uma das tarefas básicas do pesquisador na
escolha apropriada de técnicas e métodos de síntese e análise de dados.
b.2) Variância (s2) e desvio-padrão (s) de um conjunto de dados (uma amostra, por exemplo) é definida
como o quadrado dos desvio em torno da média aritmética.
Para o caso de dados desagregados a variância é calculada por uma das seguintes fórmulas alternativas
(10a para a população e 10b ou 10c para o caso de uma amostra estatística):
2 I1 ( x i ) 2 / N
N
10a
s 2 i 1 ( xi x ) 2 /( n 1)
n
... i 1 d 2 /( n 1)
n
n 1 i 1 i
... ( n x 2 / n (i 1 xi / n) 2 ]
n n
)[ 10b
em que,
n
i1
x i2 / n indica a media dos quadrados dos diferentes valores de xi, enquanto que o segundo
n
termo, ( i1
x i / n) 2 da expressão (10b) indica o quadrado da média dos diferentes valores de xi
83
U P I S – FA C U L D A D E S IN TE G RA DA S
Di reto ri a d e En si no d e Pós -G rad u aç ão
Notas de aula
Projeto de pesquisa. Metodologia do trabalho científico
k
Disposição dos dados para calcular a variância a partir de dados agrupados: x f j x j / n = 27,857
j 1
xi fi xi fi |xi – x |=d d fi x i2 x i2 f i
k
14 390 111,428 4100 12150
j1
n
s2 [ x 2j f j ] ( x ) 2 ] / n = 12150 / 14 – (27,857)2= 867,86 – 776,01 = 91,85
j1
n n
s2 1 ( xi x ) 2 di2 = 113,95
n 1 i 1 i 1