Professional Documents
Culture Documents
INVESTIGAO
E AVALIAO
EM PSICOLOGIA
E SADE
JOS LUS PAIS RIBEIRO
C1
placebo
EDITORA
INVESTIGAO E AVALIAO
EM PSICOLOGIA E SADE
NDICE
PRLOGO
Introduo
Iniciar a investigao
Recolha de dados
13
Apresentar os resultados
14
16
Pgina de ttulo
16
Resumo
17
Introduo
19
Mtodo
21
Resultados
25
Discusso
27
Referncias
27
28
30
Desenhos de investigao
31
Experimental
30
Observacional
30
Mtodos de investigao
32
Mtodos epidemiolgicos
32
Mtodos de sondagem
33
Mtodos experimentais
34
Mtodos clnicos
35
37
Validade interna
37
Validade externa
39
41
Porqu da amostragem
42
Tipos de amostra
42
43
Amostras probabilsticas
45
46
Anlise estatstica
49
49
50
50
51
Anlise estatstica
51
Anlise bivariada
53
Erro tipo I e II
55
56
57
tica na investigao
57
57
61
63
Introduo
63
64
64
Questionrios
65
Testes
66
Inventrios
67
Escalas
67
Entrevista
68
Observao naturalista
68
Listas de verificao
68
Listas de classificao
69
69
70
71
71
71
71
72
72
Tipo de preenchimento
72
73
73
74
Desejabilidade social
74
Resposta ao calha
74
Falsificao
74
Estilo de resposta
75
75
Inteligncia
75
Personalidade
79
87
89
90
91
Medidas nominais/categoriais
93
Medidas ordinais
93
Escalas de intervalo
93
Medidas de rcio
94
94
94
Escala de Likert
95
96
Escala de Thurstone
96
Escala de Gutman
98
Diferencial semntico
98
Escolha forada
98
Dicotmicas
99
Propriedades psicomtricas
99
99
104
104
105
105
106
106
106
107
107
107
109
Apropriabilidade
109
Economia (burden)
109
Adequabilidade
111
Interpretabilidade
111
Conformidade
112
Aceitabilidade
112
Utilidade
112
CONSTRUO DE TESTES
113
Introduo
113
113
113
114
114
114
115
126
Hiptese psicolexical
127
118
118
119
123
tica na avaliao
128
128
REFERNCIAS
131
PRLOGO
Introduo
num conjunto de regras aliceradas e fundamentadas por uma filosofia que aceite
pela cincia. Bem e de Jong (1998) explicam que h um continuo entre o senso
comum e a cincia. A cincia emergiu da necessidade das pessoas resolverem os
problemas do dia a dia. A forma como se entende hoje a cincia nasce no final da
idade mdia. O que distingue a cincia tal como comea a ser entendida o
carcter sistemtico de perguntar e responder s perguntas. Bem e de Jong listam as
seguintes caractersticas do mtodo cientfico: sistemtico no sentido que tem de
se aplicar a todos os fenmenos com as mesmas caractersticas; recorre a mtodos
claramente definidos; redutor no sentido em que ignora aspectos da realidade que
so distractores, e em que reduz os fenmenos a princpios gerais; objectivo, no
sentido em que controlvel e em que diferentes observadores que utilizassem os
mesmos procedimentos chegariam aos mesmos resultados; claro porque os
conceitos utilizados so definidos sem ambiguidade; nunca termina no sentido em
que no futuro ser aperfeioado.
O mtodo cientfico consiste num sistema de regras e de processos na qual se
baseia a investigao (Bowling, 1998). A cincia suporta a, e suporta-se na,
investigao. esta que permite afirmar aquela. O jogo regrado da cincia inclui
o jogo regrado da investigao.
O objectivo do mtodo cientfico fazer afirmaes sem erro. O que afirmado
verdade dentro das regras que a cincia estipula, deixando de parte os
aspectos irrelevantes. Sendo a investigao um processo delicado e complexo
inclui vrias fases e s investigao se o relatrio final for to detalhado que
permita a outro investigador, ou outra equipa de investigao, seguir,
exactamente, os mesmos passos e chegar, ou no, aos mesmos resultados. Tratase, pois, de um exerccio tcnico detalhado e com regras precisas.
Um aspecto que caracteriza uma investigao controlo. Com efeito, numa
investigao, todos os passos so meticulosamente controlados. Perder um
passo, saltar um passo, deixa de se poder falar em cincia, inviabiliza-se a
investigao. A fronteira entre o que cincia e o que no cincia muito
tnue e baseia-se fundamentalmente no processo como foi conduzida a
investigao e produzido o conhecimento.
Uma investigao comea por uma grande questo. O investigador, na sua
prtica diria, reparou em algo para que no conhece explicao, ou ento os
modelos ou teorias disponveis sugerem relaes entre variveis que interessa
confirmar ou desafiar. Desta questo emergem variveis e relaes entre
variveis. Num momento seguinte, o investigador procede a pesquisa em base
de dados de modo a verificar se encontra estudos que respondam sua pergunta.
Hoje, as bases de dados so cada vez maiores e mais acessveis pelo que este
exerccio fundamental simples. O problema que se coloca agora, alis, o
3
b)
c)
Iniciar a investigao
Um projecto inicia-se pela questo de investigao. Em psicologia da sade esta
surge da experincia do psiclogo e pode comear por ser muito genrica. O
passo seguinte consiste em esclarecer se ela j foi respondida.
8
Procurar as respostas que foram dadas questo genrica est muito facilitado
com a crescente disponibilidade de bases de dados onde toda a investigao
publicada e reconhecida como possuindo mrito cientfico est registada e com
acesso fcil e rpido. Para alm das bases de dados como, por exemplo, o
PsycLIT ou o MEDLINE, facilmente se encontram sites na internet em que os
assuntos so discutidos. Para alm disto os prprios autores esto acessveis
atravs do correio electrnico. Todos estes recursos permitem estabelecer redes
de comunicao e informao que facilita este primeiro passo.
Deve-se, assim, aperfeioar a questo de investigao tomando em considerao o
que j foi investigado e afirmado, o que est publicado e os modelos e teorias
disponveis. Estando a questo de investigao mais clara o passo seguinte consiste
em avaliar as possibilidades de implementao da investigao. Algumas questes
tm de ser colocadas nesta fase. A caixa 2 lista algumas dessas questes:
CAIXA 2
1. A questo de investigao tem mrito?
1.1. no viola aspectos ticos bsicos?
1.2. a autorizao para implementar a investigao vivel?
1.3. as variveis a estudar so exequveis?
5. Conhece bem as teias burocrticas que facilitam ou dificultam o acesso amostra e
ao contexto de investigao?
6. A recolha de dados vivel com garantia de validade interna e externa do desenho
de investigao?
6.1. As variveis so operacionalizveis?
6.2. As condies consideradas adequadas para recolher os dados existem e podem
ser disponibilizadas?
6.3. A recolha de dados pode ser realizada num perodo de tempo adequado?
7. Os procedimentos ticos exigidos pela profisso e pelas instituies so exequveis?
Recolha de dados
A recolha de dados pertence a uma segunda fase do projecto de investigao e
que diferente da anterior. mais prtica, que realizada no terreno. Com
efeito h um momento em que se torna necessrio passar ao terreno para recolha
de dados. Esta parte pode ser feita pelo investigador ou por assistentes treinados.
Esta parte inclui o que se vai fazer com os dados. A caixa 4 sugere algumas
aces a considerar nesta fase:
CAIXA 4
01. Obter aprovao escrita da instituio onde vai decorrer a investigao
02. Definir como se vai seleccionar os participantes
03. A populao a estudar existe?
04. A populao a estudar acessvel?
05. A relao entre variveis em estudo e o nmero de participantes a incluir na amostra
adequado?
13
Apresentar os resultados
A ltima fase de uma investigao consiste no tratamento dos dados e na
apresentao dos resultados. Uma investigao pode ter vrios destinos.
Normalmente os resultados devem ser apresentados sob forma escrita, e o destino
deste relatrio pode ser uma academia e visar a defesa perante um jri tal como
acontece nas ps- graduaes (mestrado ou doutoramento); pode visar a
apresentao entidade que subsidiou o estudo, ou pode visar a publicao em
14
Pgina de ttulo
O ttulo deve sumariar as principais ideias da investigao em 10 12 palavras.
Uma boa receita, segundo a APA, para um relatrio de investigao
experimental : (varivel dependente) em funo da (varivel independente) ou,
16
Resumo
O objectivo desta seco fornecer, em cerca de 250 palavras um sumrio
compreensivo do estudo. um elemento fundamental da investigao porque a
parte mais lida, frequentemente a nica, de uma investigao. H actualmente
revistas que publicam os sumrios seleccionados e comentados de artigos
publicados. Os sumrios so seleccionados por investigadores de entre artigos
relevantes. O sumrio do artigo reproduzido, acrescentam-se os comentrios, e
tudo junto no excede uma pgina da revista, como o caso, por exemplo, da
Evidence Based Mental Health.
Um resumo deve ser apresentado, tambm, em Ingls. A verso em Ingls
publicada nas bases de dados como o PsychLit, o MedLine, o ERIC, ou outra.
Ribeiro, J., Couto, P., Teixeira, C., Mendonca, D., & Bastos, R. (1999).
Satisfaction with treatment and acute pain in general surgery: The 13th
Conference of the European Health Psychology Society.
18
que os resumos nelas contidos se constituam como pequenos artigos. Deste modo
alguns dos principais jornais cientficos pedem um resumo organizado segundo
regras precisas, respeitando domnios especficos. A caixa 8 apresenta um exemplo
de artigo cientfico publicado segundo as regras de um Jornal Europeu3:
CAIXA 8
Objectives To develop an outcome measure of QOL (Quality Of Life) for the
Portuguese population; describe Qol in epileptics; analyse how QOL is affected by
epilepsy and analyse how QOL is affected by patients charecteristics.
Patient and methods study of a consecutive sample of 92 epiletics from an outpatient
clinic, men and women, aged 15-65, having the basic education level. Firm diagnosis of
epilepsy (with or without seizures) without other illness. A questionnaire based on ESI-55
and Health Insurance Experiment Short-Forms was used. Principal component analysis
(orthogonal varimax) showed a solution explaining 55.6 of total variance. After the
inspection, the 33 remaining itens were grouped into 5 sub-scales (dimensions).
Results Results showed that QOL was poor for people with partial seizures. The best
scores were found on patients now free from seizures.
Conclusion The QOL measure is sensitive to cultural differences, demographic and
disease variables which could explain the results found.
O The Journal of the American Medical Association (JAMA) recomenda, para
os artigos que expem resultados de investigao, a seguinte estrutura de
organizao do abstract: Context; Objectives; Design; Patients; Setting;
Intervention; Main Outcome Measures; Results; Conclusions.
Com o aumento das publicaes cientficas a tendncia ser para que a
apresentao dos resultados seja cada vez mais econmica em termos de espao.
Introduo
O principal objectivo desta seco explicar ao leitor porque que se realizou o
estudo. Deve explicar qual a questo de investigao, indicar porque que ela
importante, e o que que inovador relativamente aos estudos anteriores.
3
Esta parte deve iniciar-se por aspectos genricos que se tornam cada vez mais
especficos. Deve incluir uma reviso actual da literatura, mas evitar uma
reviso histrica exaustiva, e deve relacionar a investigao que apresentada
com a que tem sido feita. Deve incluir as hipteses, se as houver, assim como o
raciocnio que lhes deu origem.
A introduo s deve incluir assuntos que sejam relevantes para a investigao.
No se deve espraiar por assuntos que no sejam considerados no desenho de
investigao, que no sero abordados nos resultados, e que no sero
discutidos.
O ltimo pargrafo desta seco deve incluir uma afirmao que explicite,
claramente, o objectivo do estudo. No caso de se apresentarem hipteses elas
sero apresentadas aqui.
Se uma investigao deve ou no incluir a formulao de hipteses depender,
como j se referiu, da filosofia que o investigador adopta e do tipo de
investigao. Definir hipteses no expor expectativas baseadas no senso
comum do investigador. Uma hiptese uma afirmao declarativa que se
prope esclarecer as relaes entre as variveis. A hiptese deriva directamente
do problema. uma tentativa de adivinhar a soluo do problema. Para que a
adivinha seja inteligente segundo Mason e Bramble (1978), ela deve basear-se
no que se sabe acerca do problema. A reviso da literatura, a investigao
anterior e a experincia pessoal, contribuem para esse conhecimento. As
hipteses baseiam-se geralmente numa teoria ou modelo (Mason & Bramble,
1978, p. 54).
Se o problema estiver claro definir hipteses simples uma vez que a
formulao do problema sugere normalmente a natureza da hiptese. Mason e
Bramble (1978) defendem que uma boa hiptese dev possuir cinco
caractersticas:
devem ser colocadas numa fora declarativa;
devem descrever as relaes entre duas ou mais variveis;
devem ser testveis;
devem ser operacionais, de tal modo que no haja ambiguidades acerca das
variveis ou das relaes entre elas;
devem reflectir a adivinha da soluo ou resultado do problema, a qual se
deve basear no conhecimento, e na investigao anterior.
Se no se definirem hipteses ento a formulao dos objectivos da investigao
que derivam do problema devero respeitar os cinco princpios referidos acima.
20
Mtodo
O objectivo desta parte descrever em detalhe como se realizou o estudo, de tal
modo que qualquer um possa o replicar com base na informao fornecida.
Numa investigao este sector divide-se nas seguintes partes: participantes;
material, planificao; procedimento. A planificao e procedimento podem
trocar a ordem de aparecimento e por vezes fundem-se numa s.
Participantes
Indica quem participa no estudo (a populao ou universo), quantos so, e como
foram seleccionados (a amostra). Inclui todos os detalhes considerados
relevantes para o estudo, nomeadamente, por exemplo, sexo, idade, profisso,
nmero de filhos, etc. Devem ser acrescentadas as condies que os
participantes devem ter para pertencerem populao e as que, se as, tiverem,
determinam que so excludos.
Se o estudo for realizado com animais em vez de participantes deve usar o
termo sujeitos. A caixa 9 exemplifica como se pode apresentar esta seco 4:
CAIXA 9
Participantes
A populao do estudo constituda por estudantes entre o 11 ano de escolaridade
e o ltimo ano da universidade frequentando escolas da cidade do Porto. Os
participantes constituem uma amostra por cotas com 609 estudantes saudveis,
53% do sexo feminino, pertencentes a trs escolas secundrias de zonas diferentes
da cidade do Porto, e a nove escolas da Universidade do Porto, com idades entre os
16 e 30 anos, M=19,88 anos. Os estudantes do 11 ano de escolaridade foram
escolhidos de entre os que, pelo seu comportamento escolar, tal como era
percebido pelos professores, tinham alta probabilidade de aceder universidade.
Material
Descreve em detalhe o material utilizado (origem, caractersticas). Deve
apresentar exemplos dos itens de cada escala e do modo de lhes responder, as
propriedades psicomtricas e os construtos que mede. Deve ser claro porque
4
que este material foi utilizado. No deve descrever o procedimento (no utilizar
verbos de aco)5. A caixa 10 prope um exemplo:
CAIXA 10
Material
A avaliao foi feita atravs de questionrios, annimos, de auto-resposta, que
incluiam: questionrio demogrfico que incluia idade, sexo, formao, nmero de
anos de trabalho, estado civil, nmero de filhos;
Questionrio de avaliao do stress no trabalho desenvolvido para o estudo, que
focava a satisfao com reas do trabalho. O questionrio possui 39 itens,
distribudos por seis dimenses, em que a resposta dada segundo uma escala
tipo Likert entre discorda totalmente, discorda bastante, discorda
parcialmente, concorda parcialmente, concorda bastante, e concorda
totalmente. Recorrendo anlise de componentes principais com rotao
varimax verificou-se que os itens com uma carga factorial no factor a que
pertencem superior a 0,45 explicam 68% da varincia. As dimenses encontradas
foram as a seguir descritas:condies econmicas, com seis itens itens que
apresentavam um Alfa de Cronbach =0,76, e de que exemplo a minha profisso
uma profisso com segurana para o futuro; apoio da hierarquia com oito
itens que apresentavam um Alfa de Cronbach =0,88 de que exemplo o meu
chefe d-me sugestes para eu fazer melhor o meu trabalho; reconhecimento
pelo trabalho realizado com cinco itens que apresentavam um Alfa de Cronbach
= 0,76, de que exemplo as pessoas reconhecem quando fao bem as coisas;
interesse da profisso com oito itens que apresentavam um Alfa de Cronbach
=0,88, de que exemplo o meu trabalho muito rotineiro; relao com
colegas com oito itens que apresentavam um Alfa de Cronbach =0,87, de que
exemplo a minha relao com os colegas boa; condies fsicas do local de
trabalho com quatro itens que apresentavam um Alfa de Cronbach =0,87, de que
exemplo as condies de trabalho do meu servio so confortveis.
(...)
Consentimento informado Um aspecto importante na realizao de uma
investigao consiste em obter o consentimento informado dos participantes.
Uma das maneiras de o fazer atravs da folha de rosto do questionrio. De
modo geral esta pgina de rosto contm um conjunto de informaes visando
esclarecer o que se pretende do participante. A folha de rosto do questionrio
5
Ribeiro, J., Maia, P., & Paes Cardoso (1998). Fontes de Stress, Sade, e MalEstar, em Profissionais e o SCI. V Simpsio Internacional de Cuidados
Intensivos.
22
23
Planificao
Descreve o desenho e o mtodo e, se for caso disso, o modo como os participantes
foram distribudos pelos grupos. Descreve as variveis independentes e
dependentes. Descreve quais os processos de controlo utilizados.
A caixa 13 mostra como se pode apresentar o desenho e o mtodo:
CAIXA 13
O desenho do estudo descritivo de comparao entre grupos. O mtodo
experimental natural em que a varivel manipulada o transplante renal
(transplantados versus no transplantados.
Dependendo do contexto de investigao podem ser designadas de diferentes
modos; Sampaio e Ferreira (1997), no mbito de ensaios clnicos controlados,
designam por variveis primrias, aquelas que podem responder questo
inicialmente formulada e variveis secundrias, aquelas que completam a
resposta mas cuja anlise desprovida de sentido sem a resposta obtida atravs
das variveis primrias (p. 751).
As cincias sociais costumam referir dois tipos bsicos de variveis: as variveis
independentes e as variveis dependentes. Estas variveis so, como se referiu no
pargrafo anterior as variveis primrias de uma investigao. Uma questo que se
coloca com frequncia se todas as investigaes devem Ter variveis independentes e variveis dependentes. Se o desenho experimental, dado que, por
definio, uma investigao deste tipo manipula a varivel independente para
verificar o que ocorre na varivel dependente, esta terminologia tem de ser utilizada.
Em investigaes que se propem observar o que ocorre por exemplo verificar se
h diferenas entre grupos, ou se uma varivel varia quando outra varia sem
manipular as variveis, muitas vezes, difcil definir qual a varivel dependente ou
independente. Nestes casos prefervel denomin-las de variveis principais.
Outro grupo de variveis importantes em investigao so as variveis de controlo,
ou seja, aquelas variveis que a investigao ou a experincia tem demonstrado que
se relacionam com a varivel dependente e que necessrio controlar para poder
afirmar que a varivel independente influencia a dependente. Estas variveis so,
normalmente, includas no grupo das variveis secundrias.
As variveis independentes so aquelas que o investigador manipula, ou que
designa como varivel central no estudo. A varivel dependente aquela que
varia em consequncia da variao da varivel independente.
24
Repare-se que a varivel que num desenho considerada independente pode ser,
noutra investigao, com outra formulao do problema, com outro desenho, a
varivel dependente. Ser dependente ou independente no uma propriedade da
varivel , antes, uma consequncia do desenho da investigao. Todas as
variveis podem ser independentes ou dependentes. As variveis podem ser
quantitativas se a variao for na quantidade, ou categoriais se variarem no tipo.
H algumas variveis que so de difcil manipulao, por estarem fora do
controlo do investigador, e, por isso, nem so candidatas a variveis
independentes nem a variveis dependentes dado dificilmente influenciarem ou
serem influenciveis por outra varivel, como seja o sexo e a raa. Chamam-se a
estas variveis fixas (Davis, 1995). A caixa 14 exemplifica como se podem
apresentar as variveis:
CAIXA 14
As variveis principais do presente estudo so o tempo de doena diagnosticada
e a exausto vital. A primeira ser a varivel independente do estudo, e a
segunda a varivel dependente. Como variveis de controlo incluiremos as
variveis demogrficas sexo, idade, e nvel scio econmico, e as variveis de
doena, estimativa dos dias que faltou ao trabalho no ltimo ano, estimativa de
dias que passou na cama por doena, e percepo geral de sade.
Procedimento
Esta parte do estudo sumaria cuidadosamente todos os passos da execuo do
estudo. Descreve todas as fases do estudo e todas as instrues que os
participantes receberam.
Resultados
Antes de redigir esta parte observe cuidadosamente todos os nmeros
produzidos na anlise estatstica e pense na melhor maneira de os sumariar e de
melhor exibir o que saliente. Sugere-se que faa primeiro os quadros ou
figuras que pretende utilizar.
Quando apresentar os resultados saliente o significado das estatsticas. Ou seja,
descreva o que est a testar e qual o significado que o resultado tem para as
variveis envolvidas. No discuta as implicaes dos resultados nesta seco.
25
Discusso
O objectivo desta seco discutir e interpretar os resultados, sem perder de
vista a questo de investigao. Esta parte a parte criativa do relatrio. nesta
parte que se faz a sntese entre a teoria, a investigao e os resultados.
Cone e Foster (1993) sugerem que a discusso deve comear por um resumo dos
resultados, mas no em termos de apresentao dos valores da estatstica que j
foram expostos em detalhe nos resultados. Este resumo deve ser sumariado
quase em linguagem comum.
No se devem comentar os resultados que no so estatisticamente
significativos, a no ser que tal tenha algum outro significado especial que no
estatstico. Deve-se interpretar criativamente, sempre dentro do quadro da
cincia, os resultados. Porque que foram encontrados estes resultados? Est de
acordo com a investigao? contrrio ao esperado? Quais so as
consequncias dos resultados da investigao?
Referncias
A ltima parte do trabalho inclui as referncias que foram utilizadas no decorrer
do relatrio. A forma como as referncias se devem apresentar esto tipificadas
e variam com o contexto onde se pretende publicar o trabalho que se est a
escrever. Em psicologia costume recorrer-se s normas da American
Psychological Association.
Como a psicologia da sade tanto publica em revistas de psicologia como
noutros tipos de revistas deve-se consultar as recomendaes aos autores que
cada revista inclui numa das pginas iniciais ou finais.
27
encontraram variaes entre 59 e 679 pginas com uma mdia de 174. Ou seja,
parece razovel considerar que uma tese de doutoramento se deve conter em
cerca 200 pginas, incluindo referncias e anexos. Estes autores recomendam
que as teses de mestrado devero ter menos um tero do que as de
doutoramento, ou seja, limitar-se a cerca de 130 pginas.
As escolas deveriam ter definida uma poltica referente a estes aspectos: quantas
pginas incluir, os aspectos que devem ser contemplados no trabalho, etc. Na
ausncia de orientaes claras compreende-se que os estudantes tenham
dificuldade em decidir sobre o que excluir do seu trabalho, resultando relatrios
com muita informao desnecessria.
Se em vez de uma tese se tratar de um artigo que visa ser publicado numa revista
cientfica ento o que se escreve um sumrio detalhado da investigao. H
uma grande variedade revistas cientficas. Se h revistas com um grau de
exigncia muito elevado que rejeita cerca de 80% dos artigos submetidos, outras
h que publicam quase todos com muito pouca crtica.
O nmero de pginas adequado para um artigo a publicar numa revista cientfica
depender da revista e, as recomendaes aos autores explicaro eventuais
limitaes. Revistas h em que os artigos no excedem uma pgina, o que
corresponder cerca de duas pginas A4 a dois espaos. Outras, normalmente de
pendor mais terico, incluem um grande nmero de pginas. Pode dizer-se que
um artigo no dever exceder 15 pginas, lembrando que a tendncia para
reduzir.
Algumas revistas cientficas incluem uma seco que designam por short
communications que so apresentadas em uma ou duas pginas. Convm ter em
mente que a funo de um artigo cientfico explicar sumariamente a
investigao que foi feita. Num artigo nunca se pode dizer tudo. Aqueles que
esto interessados no trabalho tm sempre a possibilidade de contactar os
autores a pedir esclarecimentos adicionais.
29
Desenhos de investigao
Experimental
Num estudo que adopte um desenho experimental o investigador actua sobre a
varivel independente para identificar se esse tipo de interveno produz alteraes
na varivel dependente. Definem-se dois grupos, em que os sujeitos de
investigao so distribudos de modo aleatrio por cada grupo, intervm-se sobre
um, e no sobre o outro, e depois comparam-se as modificaes que se verificaram
aps a interveno. Num estudo deste tipo conclui-se por uma relao de
causalidade, ou seja, as mudanas ocorridas na varivel dependente so por causa
das mudanas que o investigador introduziu na varivel independente.
Observacional
Num estudo que adopte um desenho observacional o investigador no intervm.
Antes, desenvolve procedimentos para descrever os acontecimentos que
30
Mtodos de investigao
Mtodos epidemiolgicos
Os mtodos epidemiolgicos permitem identificar a distribuio das doenas e dos
factores que lhes esto asso-ciados. Fornecem indicadores tais como a prevalncia,
incidncia e risco relativo do aparecimento de uma doena.
Bishop refere as seguintes estratgias de investigao em epidemiologia: relato de
casos; estudos correlacionais; estudos de caso com grupo de controlo; estudos de
coorte:
a) relatos de casos um mtodo epidemiolgico que se caracteriza por
descries escritas e detalhadas, feitas por vrios clnicos acerca de doentes
individuais que apresentam problemas interessantes e nicos. Este tipo de
casos, dado as suas idiossincrasias, fornecem indicaes importantes acerca
de factores de riscos potenciais.
b) estudos correlacionais so mtodos epidemiolgicos em que se inspecciona
se a ocorrncia de determinadas doenas se relaciona com aspectos que se
32
Mtodos de sondagem
Os estudos epidemiolgicos focam essencialmente os aspectos relacionados com
doenas que atingem um nmero elevado de pessoas, que esto em franco
crescimento, ou que so particularmente graves, ou seja focam as epidemias.
Importa, segundo as novas perspectivas e os novos interesses de sade, identificar
aspectos tais como as atitudes e comportamentos relacionados com a sade, de
pessoas que no esto doentes, e mesmo de pessoas que so particularmente
saudveis. Ou seja, tambm importante perguntar o que que as pessoas fazem
para ser saudveis?, ao contrrio dos estudos epidemiolgicos que perguntam o
que que aconteceu para as pessoas terem esta doena?. Os mtodos de sondagem
33
Mtodos experimentais
Ao contrrio dos mtodos anteriores que apenas permitem estabelecer relaes
entre as variveis sem determinao de causalidade, os mtodos experimentais so
desenhados para verificar hipteses de causalidade. Um termo chave dos mtodos
experimentais controlo. Nos mtodos experimentais, e ao contrrio dos
anteriores, a varivel independente manipulada com vista a verificar o impacto
que tal manipulao tem sobre a varivel dependente. Numa investigao tpica
deste tipo definem-se vrios grupos, em que os participantes, com caractersticas
idnticas, so distribudos pelos grupos de modo aleatrio. Cada grupo submetido
a nveis diferentes da varivel independente, e o impacto dos diferentes nveis da
varivel independente na varivel dependente avaliado. Outro aspecto que
controlado o contexto de interveno, ou seja, para se poder garantir que o
resultado na varivel dependente tem a ver com as diferentes condies da varivel
independente, tem de se controlar rigorosamente o contexto de interveno para
que no seja possvel a existncia de variveis parasitas que, por si s, possam,
eventualmente, explicar os resultados da varivel dependente.
Tendo em conta o grau de controlo das variveis, podem-se considerar as
investigaes experimentais em; verdadeiramente experimentais (true
experiments); quase experimentais; e experimental naturais.
a) estudos verdadeiramente experimentais Os estudos verdadeiramente
experimentais so aqueles em que o investigador tem o mximo controlo. O
local onde mais provvel realizar investigao deste tipo em laboratrio.
Ora, dado que, ou por razes ticas, ou porque no possvel distribuir os
participantes pelos grupos de maneira aleatria, ou por outras razes, os
estudos verdadeiramente experimentais so reduzidos;
34
Mtodos clnicos
A lgica subjacente aos mtodos clnicos idntica subjacente aos mtodos
experimentais, pelo que o que foi dito para os mtodos experimentais se aplica
aos mtodos clnicos. A diferena provm de que o que se designa por
investigao clnica introduz problemas nicos. Nomeadamente, h aspectos que
caracterizam o que aqui se designa por investigao clnica: (a) os participantes,
geralmente, so pessoas doentes, (b) que acorreram ao sistema de sade para
pedir ajuda para o seu sofrimento, (c) e as variveis independentes so
procedimentos que visam aliviar tal sofrimento.
Neste tipo de investigao alguns aspectos devem ser tomados em considerao
e controlados. Bishop (1994) sugere os seguintes:
a) os critrios de incluso do doente no grupo seleccionado devem ser
especialmente cuidados;
35
conversa com o psiclogo. Outra variante ser um dos grupos ficar em espera
par se verificar se a interveno realizada foi eficaz.
Validade interna
Baltes et al. (1977) referem alguns aspectos que devem ser controlados para
garantir a validade interna de uma investigao, nomeadamente:
Histria
Quando se realiza uma investigao a vida continua. H sempre a possibilidade
de o resultado que encontramos ser influenciado por qualquer acontecimento
que corre ou ocorre paralelamente investigao.
Maturao
semelhante histria, mas enquanto esta se refere a acontecimentos externos a
maturao refere-se a mudanas que ocorrem internamente. Podem ocorrer
mudanas internas por causas maturacionais mais ou menos subtis. Alguns
37
Validade externa
Como j se referiu, a validade externa garante que as relaes entre um conjunto
de dados que se observaram numa investigao podem ser generalizadas a outro
conjunto de dados que no foram observados mas poderiam ter sido. Os dados
observados numa investigao constituem, geralmente, apenas uma pequena
parte dos dados que poderiam ter sido includos na investigao mas que no o
foram. Campbell e Stanley (1963) afirma que a validade externa responde
seguinte questo: a que populaes, contextos, tratamentos e avaliaes pode ser
generalizado o que foi observado? Planos de investigao com boa validade
externa permitem amplas generalizaes. Se o plano de investigao pobre
dever afirmar-se: os resultados da presente investigao devem ser
generalizados com cuidado para alm deste estudo.
Inmeros aspectos podem ameaar a validade externa, tais como: unidades
experimentais; avaliao; efeitos reactivos da avaliao; interaco com o tipo
de tratamento; reaco aos arranjos experimentais; interferncia de mltiplos
tratamentos (Baltes, Reese, & Nesselroade, 1977).
39
Unidades experimentais
Refere-se a uma dimenso importante que a amostragem. Na investigao em
psicologia frequente este aspecto ser negligenciado. O modo como a amostra
seleccionada deve ser claramente explicitado. Amostras seleccionadas de modo
inadequado comprometem a validade do estrudo.
Tipo de avaliao
Os dados recolhidos com um sistema de avaliao seriam iguais se o sistema
utilizado fosse outro? Este assunto particularmente importante dado que a falta
de instrumentos de avaliao adaptados para a nossa populao no garantem o
rigor mtrico das avaliaes feitas.
Efeitos reactivos da avaliao
frequente em investigaes proceder-se a avaliao pr experimental. Se o
grupo de controlo no submetido mesma avaliao pr experimental ento
no se pode afirmar que o resultado obtido no influenciado por essa avaliao
experimental. Baltes, Reese, e Nesselroade (1977) do o seguinte exemplo.
Imagine-se que a investigao visa experimentar o efeito de um medicamento
para emagrecer. Se o peso do grupo experimental medido em grupo antes da
experincia, poder esse acto de avaliar o peso ou das conversas que ocorrem
nesse momento aumentar a conscincia do peso que se tem e alterar o padro de
alimentao, a par da tomada de medicao e da alterao da dieta, que no era
prevista no plano de investigao? Se sim, ento no se saber se uma possvel
alterao do peso ser consequncia da alterao da dieta em vez da medicao.
O mesmo efeito poderia ocorrer em pessoas que comprassem o medicamento na
farmcia sem passarem antes pela situao de avaliao em grupo.
Interaco com o tipo de tratamento
Imagine-se uma situao em que se pretende aplicar um programa para deixar de
fumar a um grupo de pessoas. Suponha-se que os anncios para pedir
voluntrios para participar no programa so colocados em lugares onde
proibido fumar. Como os grandes fumadores, provavelmente, evitam os locais
onde proibido fumar, tais anncios pode ter como consequncia que as pessoas
que os lem os e se ofeream como voluntrios sejam fumadores moderados. Se
40
41
Porqu da amostragem
Segundo Finsterbusch, Liewellyn e Wolf (1983), a menos que uma populao
alvo tenha menos de 2000 pessoas dever, sempre, ser decidido fazer um estudo
por amostragem, e tal princpio pode aplicar-se a muitas populaes com menos
de 2000 indivduos. Estes autores defendem, que a seleco do tamanho da
amostra uma questo de julgamento, e que o nmero de sujeitos que
constituir a amostra no importante: referem que, at amostras de 40 ou 80
indivduos podem fornecer caractersticas sensveis da populao, e que uma
amostra de 100 suficiente para ser tomada a srio. Apresentam uma lista de
amostras, variando entre 50 e 1000 indivduos, sendo a moda os 200,
consideradas em vrios estudos representativos de populaes regionais.
A amostragem permite, geralmente, ao investigador reduzir custos, reduzir a
necessidade de mo-de-obra, recolher informao mais rapidamente, e obter
dados mais compreensivos (Smith, 1975). Paradoxalmente, segundo vrios
autores (Miaoulis & Michener, 1976; Smith, 1975), amostras bem seleccionadas
fornecem melhores estimativas da populao do que os censos, principalmente
porque se podem controlar melhor certos tipos de erros.
Tipos de amostra
As amostras caem em dois tipos (Dommermuth, 1975): no probabilstica e
probabilstica. Numa amostra no probabilstica, tambm chamada intencional
(Smith, 1975), a probabilidade relativa de um qualquer elemento ser includo na
amostra desconhecida. O problema principal da amostra intencional ou no
probabilstica que se desconhece quanto representativa ela de uma populao
ou universo.
42
Amostras probabilsticas
Aday (1989) prope os seguintes tipos de amostras probabilsticas.
Nmero de
unidades da
amostra
Percentagem
do universo
Nmero de
unidades da
amostra
Percentagem
do universo
200
171
85,5
105
52,5
500
352
70,4
152
30,4
1.000
543
54,3
179
17,9
2.000
745
37,2
197
9,8
5.000
960
19,2
209
4,2
10.000
1.061
10,6
213
2,1
20.000
1.121
5,6
216
1,1
50.000
1.160
2,3
217
0,4
100.000
1.173
1,2
217
0,2
020 (40) 0
030 (60) 0
040 (80) 0
040 (80) 0
090 (180)
0160 (320) 0
080 (160)
270 (540)
0640 (1280)
160 (320)
810 (1620)
2560 (5120)
48
Anlise estatstica
Anlise estatstica
Medidas de variabilidade
A par das medidas de tendncia central devem ser consideradas as medidas de
variabilidade. Com efeito, as medidas de tendncia central no nos do
informaes sobre a variabilidade das medidas. A medida mais adequada a incluir
num relatrio, quando se trata de variveis ordinais ou intervalares, so os valores
limites ou os valores extremos (range), ou seja, os valores mximos e mnimos
que se verificaram nos resultados, para aquela varivel. Os limites so o descritor
de eleio quando se trata de variveis ordinais. So um descritor pobre e, quando
se est em presena de uma varivel intervalar, devem ser considerados outros
descritores como o caso da varincia e do desvio padro. A varincia e o desvio
padro descrevem no s os limites como a distribuio de todos os valores. O
quadro 3 mostra o tipo de estatstica descritiva a utilizar consoante a natureza das
variveis.
52
QUADRO 3
Resumo da estatstica descritiva adequada consoante a natureza das variveis
Estatstica descritiva
Distribuio de
frequncias
Medida de
tendncia
central
Nominal
Grfico de
barras
Moda
Ordinal
Histograma
Intervalar
Histograma,
polgono de
frequncias
Tipo de escala
Variabilidade
Posio
individual
Mediana
Valores
extremos
(range)
Ordem ou
ordem
percentlica
Mdia
Varincia e
Notas padro
desvio padro
Anlise bivariada
Como se referiu acima neste tipo de estatstica inspeccionam-se as relaes entre
duas variveis. A relao entre duas variveis principais, ou entre uma varivel
independente e outra dependente, pode ser feita pela inspeco do modo como
elas variam em conjunto, como o caso da anlise correlacional que nos d o
grau de associao entre elas, e indica como uma varivel muda quando a outra
muda, ou ainda, a proporo da varincia de uma varivel que prevista pela
outra varivel a que est associada. Se as notas (scores) respeitam os critrios de
uma distribuio normal, como ocorre quando as variveis so intervalares, os
testes so adequados e o nmero de participantes elevado, recorre-se
estatstica paramtrica, correlao de Pearson. No caso daqueles aspectos
serem violados e a distribuio no for normal, ento recorre-se estatstica
no-paramtrica e a outras medidas de associao entre variveis. O quadro 4
mostra as estatsticas a utilizar consoante a natureza das variveis.
53
QUADRO 4
Medidas de associao consoante a natureza das variveis
Tipo de varivel
Dicotmica ou nominal
Ordinal
Correlao rs de spearman
Tau de Kendal (tau a, tau b, tau c)
Intervalar ou racio
Correlao r de Pearson
Correlao e causalidade
Em cincias humanas o estabelecimento de uma relao de causalidade entre
variveis cientificamente inadequado. Com efeito o que se pode estabelecer a
varincia conjunta ou independente de duas ou mais variveis. Nunca se pode
afirmar que no h outras variveis que correm paralelas, ou que antecedem uma
delas. No entanto h um conjunto de critrios que, se usados com cuidado,
podero permitir explorar a hiptese de causalidade. Hill (1965) sugere os
seguintes critrios para atribuio de causalidade entre variveis:
a) poder, que se refere magnitude da associao entre as duas variveis;
b) consistncia, que se refere probabilidade elevada de aquela relao tornar a
ocorrer;
c) especificidade, que se refere a que a causa d origem a um efeito simples e
no a mltiplos efeitos;
d) temporalidade, referindo-se a que a causa precede o efeito;
e) gradiente biolgico, para referir presena de um efeito de resposta
associada magnitude do estmulo, ou a um efeito de curva;
f) plausibilidade da hiptese, ou seja, coerncia da relao com outras fontes
de informao.
A ausncia de alguns destes critrios no inviabiliza a hiptese de causalidade,
no, entanto prudente garantir a presena de todos.
54
Teste de sinais
Teste de Mann-Witney
Teste de Kolmogorof-Smirnorf
Teste de Fisher
Teste de Wilcoxon
Teste de McNmar
Intervalar ou racio
Teste t
Erro tipo I e II
Diz-se que estamos na presena de erro Tipo I quando conclumos que a
varivel independente afecta a varivel dependente e na realidade tal no
acontece. Isto pode ocorrer quando, por exemplo, na definio de dois grupos
que se pretendem comparar se seleccionam participantes de tal modo diferentes
55
que num grupo permanecem os que tendem a ter nota baixa na varivel e no
outro grupo se incluem os que tm nota alta na varivel. Quando se encontram
diferenas entre os dois grupos, que se supunha espelhar a relao com a
varivel independente e tal falso, ou quando num estudo correlacional se
conclui que h correlao entre variveis quando de facto no h, diz-se que se
est em presena de erro Tipo I.
O erro Tipo II ocorre quando se conclui que a varivel independente no tem
impacto ou no se relaciona com a varivel dependente quando de facto tem. Tal
ocorre por vezes quando o nmero de participantes muito pequeno e no
espelha diferenas estatisticamente significativas.
56
tica na investigao
Os aspectos ticos so decisivos em investigao. Sem um cdigo de tica que
aponte limites oriente os passos da investigao a prpria investigao que fica
em causa.
Se os limites que governam a investigao em geral esto razoavelmente definidos
os da investigao em psicologia no esto claramente delimitados ao que no
alheia a relativa juventude da formao e da profisso. necessrio que uma
organizao da profisso estabelea de forma mandatria para proteco da prpria
psicologia.
Outras organizaes mais antigas j se debruaram e definiram estes aspectos
pelo que a nossa discusso tomar como referncia o cdigo de tica de uma
organizao centenria a APA salvaguardando no entanto a possvel
existncia de aspectos culturais que possam impor diferenas relativamente a um
cdigo de tica portugus ou europeu.
A psicologia que se exerce no campo da sade acrescenta uma nova dimenso
que deriva do facto de ser uma prtica interdisciplinar e multiprofissional por
excelncia. Swencionis e Hall (1987), explicam que a colaborao ntima entre
profisses inerente psicologia da sade acarreta problemas ticos que derivam
da existncia de cdigos diferentes. Os psiclogos necessitam conhecer as
diferenas e estar conscientes acerca do modo de lidar com elas. Dois aspectos
que estes autores referenciam dizem respeito s tcnicas de avaliao e
investigao com pessoas.
psicologias aplicadas. Swencionis e Hall (1987), explicam que uma das maiores
diferenas relativamente a outras prticas psicolgicas deriva do facto dos
participantes na avaliao estarem fragilizados pela doena.
As organizaes profissionais que definem regras de funcionamento em
investigao partilham um conjunto de preocupaes e regras comuns.
Recorreremos s regras das associaes de psicologia que, acerca de cada um
dos pontos referidos, recomendam:
62
Introduo
Toda a avaliao visa a produo de informao que seja til para tomar
decises. A avaliao psicolgica visa, portanto produzir informao psicolgica
adequada para tomar decises. Nunca se avalia s para avaliar, principalmente
em psicologia: a seguir avaliao algo deve ocorrer.
As decises podem agrupar-se nas seguintes categorias: decises de seleco se
a avaliao visa seleccionar um indivduo para alguma funo; decises de
monitorizao da interveno que visam verificar se a aco (por exemplo o
tratamento, ou o ensino) est a conseguir os resultados que eram supostos;
decises de investigao que fornecem informao acerca das hipteses que
tinham sido formuladas, ou dos objectivos da investigao e permitem escrever
o relatrio de investigao; deciso de diagnstico que visa determinar a aco
que se vai seguir. Com efeito uma das funes importantes do testes permitir o
diagnstico de uma perturbao do comportamento. O diagnstico implica valor
preditivo da tcnica de avaliao (Anastasi, 1990), ou seja, a capacidade de, a
partir do resultado, se poder inferir que o avaliado, a prazo, provavelmente, ter
um dado ajustamento. Tal capacidade diagnstica implica que a avaliao tenha
validade preditiva.
Questionrios
O termo questionrio utilizado por leigos e a expresso significa, neste caso,
que se trata de um conjunto de questes, ou como diz o dicionrio de lngua
portuguesa, srie de questes ou perguntas ordenadas sobre um assunto (Porto
Editora, 6 ed. p. 1375). Todos os procedimentos de avaliao psicolgica so
basicamente constitudos por questes. Esse conjunto de questes pode, ento
designar-se por teste, inventrio, escala, etc., de acordo com a relao que se
assume existir entre os itens, ou questes, que compem o questionrio. Mas, se
todos os testes, inventrios, escalas, so questionrios, nem todos os
questionrios so testes, inventrios ou escalas. Para o serem, como se explicar
ao longo deste texto, tm de possuir um conjunto de propriedades mtricas,
ticas, entre outras, que garantam que o so.
Com efeito, o modo como as tcnicas de avaliao so designadas tm, geralmente,
um significado tcnico: por exemplo, escala significar que os itens esto
relacionados e pertencem mesma famlia. Enquanto o termo lista significar
que os itens no esto agrupados em escalas; num teste de realizao mxima os
65
itens esto ordenados por nvel de dificuldade, enquanto nos de realizao habitual
esto distribudos aleatoriamente. No entanto o que foi dito no constitui regra e
pode haver diferenas na nomenclatura das tcnicas de avaliao.
Testes
Teste o termo nobre da avaliao psicolgica. O termo teste foi
introduzido por Cattel num artigo de 1890. Este termo difundiu-se associado
avaliao da inteligncia, embora o primeiro teste de inteligncia que, alis, viria
a constituir matriz para a avaliao deste construto a Escala Mtrica de
Inteligncia de Binet-Simon, de 1905 no utilizasse o termo teste no seu
ttulo.
No h uma definio completamente satisfatria de teste embora tenda a haver
um conjunto de aspectos que so inerentes a um teste psicolgico. Anastasi
(1990) define teste psicolgico como uma medida objectiva e padronizada de
uma amostra de comportamento. Murphy e Davidshofer (1998) explicam que
um teste psicolgico tem trs caractersticas identificatrias:
1) um teste psicolgico uma amostra de comportamento ou seja, nunca
uma avaliao exaustiva de todos os comportamentos possveis que
poderiam ser utilizados na medio ou avaliao de determinado atributo;
2) a amostra de comportamento recolhida segundo condies padronizadas
ou seja, as respostas s so vlidas se forem recolhidas segundo as condies
descritas no protocolo do teste. Se forem recolhidas noutras condies tratarse- de outro teste. Anastasi (1990) acrescenta outro aspecto padronizao,
a saber, o teste tem normas de comparao, ou seja, a realizao do
indivduo comparada com a realizao de uma amostra de outros que so
considerados como referncia e da qual este se afasta ou aproxima,
afastamento que, se acima de determinado valor pode definir deficincia do
comportamento.
3) h regras claras para avaliar as respostas, ou para produzir informao
quantitativa da amostra de comportamento ou seja, se as respostas ao teste
fossem avaliadas por qualquer outro tcnico chegaria a resultados muito
parecidos, seno iguais, acerca da realizao do sujeito.
Basicamente, e de um ponto de vista cientfico, todas as tcnicas de avaliao
psicolgica so testes embora, como j se disse, no utilizem esse termo no seu
ttulo.
66
Inventrios
Inventrio o termo que designa a maioria das tcnicas de avaliao da
personalidade. Como j se referiu, este termo pretende evitar o uso da palavra
teste, susceptvel de influenciar as respostas dos sujeitos avaliados, no sentido
em que teste sugere que o indivduo tem de fazer o melhor possvel. Ora, na
avaliao da personalidade, no h respostas certas. Todas as respostas que
possvel dar so, em princpio, correctas. Uma classificao quanto ao tipo de
resposta diria que so provas de resposta habitual, ao contrrio dos testes de
inteligncia e de capacidade em geral, que so provas de realizao mxima, e
exigem ao respondente que faa o melhor ou o mais rpido que capaz. Ao
sujeito pedido que descreva os seus sentimentos, pensamentos, atitudes,
interesses, sintomas, bem-estar, ou seja, que descreva sensaes ou sentimentos
que s ele conhece.
Este tipo de testes so, geralmente de papel e lpis (termo que hoje se pode
generalizar ao uso de computadores), de auto preenchimento, ou seja o sujeito
pode responder autonomamente sem que o psiclogo esteja a dar instrues, ao
contrrio do que acontece com os testes de realizao mxima.
Bowling (1991) afirma que este tipo de medidas assume grande variedade de
formas nomeadamente medidas com um nico item, bateria, escala. H questes
auto respondidas que recorrem unicamente a um item. Quando recorre a vrias
questes para avaliar um conceito estamos na presena de uma bateria. Por sua
vez uma bateria pode ser uma escala.
Escalas
Escalas outra designao para os testes que se propem avaliar a
personalidade (Jackson, 1970). Dawis (1987) define escala como uma coleco
de itens, cujas respostas so classificadas e combinadas para produzir uma nota
da escala. Dito de outro modo, quando um grupo grande de questes ou itens so
criados para avaliar a mesma dimenso, atributo, trao, factor, etc., que
suposto terem uma correlao elevada entre si, e que devem ser somadas para
fornecer uma nota dessa dimenso atributo, trao, factor, etc., estamos na
presena de uma escala. Idealmente uma escala deve ter, pelo menos 20 itens,
em que metade so fraseados pela negativa e a outra metade pela positiva
(Reckase, 1990). H no entanto autores que aceitam trs itens, e hoje frequente
encontrar dimenses definidas por um ou dois itens.
67
Entrevista
Tipicamente a entrevista representa o contacto inicial entre o psiclogo e o sujeito
(Turk & Kerns, 1985). Consiste num mtodo de recolher informao atravs de
conversa ou de questes colocadas directamente, e a maioria da informao
obtida atravs da entrevista dificilmente poder ser conseguida de outra maneira,
como sejam os contactos que o psiclogo estabelece com as pessoas em contexto
de sade e doenas, por exemplo com doentes acamado (Kaplan & Saccuzzo,
1993). Para estes autores em muitos aspectos a entrevista como um teste
(p226), nomeadamente nos seguintes aspectos: (a) um mtodo de recolher
dados, (b) utilizada para fazer previses, ( c) pode ser avaliada em termos de
fidelidade, (d) pode ser avaliada em termos de validade, (e) pode ser feita em
grupo ou individual, (f) pode ser estruturada ou no. Caracteriza-se por o
entrevistador ou testador, registarem os aspectos que definiram como alvos de
avaliao, e as estratgias de registo so muito variadas.
Observao naturalista
Segundo Anastasi (1990), trata-se de tcnicas de observao directa de
comportamento espontneo em contexto natural. A observao naturalista
recorre a inmeras tcnicas, a longo termo como o mtodo de dirio, a mtodos
mais breves como a amostra temporal. Pode consistir na observao da
totalidade do comportamento ou de um aspecto particular como a linguagem, a
motricidade, ou a relao interpessoal. Como qualquer teste um mtodo de
observao rigoroso que difere da situao de teste descrita acima porque na
observao naturalista, a) no se controla a situao estmulo e, b) geralmente,
abrange uma amostra de comportamento mais ampla.
Listas de verificao
Listas de verificao check list no original so tcnicas de observao
preenchidas por algum que observa outro. Consiste, normalmente, num
conjunto de itens que no tm de se relacionar uns com os outros como nas
escalas, ou cuja relao acidental (no tem de haver consistncia interna ou
homogeneidade). Uma lista de verificao prope-se verificar se determinados
comportamentos, atitudes, pensamentos, etc., existiram ou no. A resposta
dada em termos de sim ou no e cada um vale por si, ou seja, no se somam
as respostas (podendo no entanto ser somadas).
68
Listas de classificao
Listas de classificao rating scales no original so listas como as anteriores,
em que um observador treinado, atravs de observao no-sistemtica ao longo
do tempo, acumula casualmente e informalmente dados. Estas observaes so
feitas em condies naturais em que o observador no considerado um
observador, e abrangem, normalmente, um perodo longo. uma observao
retrospectiva em que o observador sumaria as observaes acumuladas ao longo
de um perodo largo de tempo. Normalmente envolve um sumrio avaliativo de
experincias presentes ou passadas em que as impresses do observador so
processadas de modo complexo e no especificado para chegar ao julgamento
final (Thorndike & Hagen, 1977). uma tcnica muito utilizada em contextos
educativos e industriais. Segundo Thorndike e Hagen (1977) o procedimento mais
comum com listas de classificao consiste em o observador com um conjunto de
atributos, cada um com uma lista de nmeros, de adjectivos, ou de descries que
representam nveis ou graus de existncia desses atributos. O observador regista
(classifica) nessa lista uma ou mais pessoas em cada atributo, atribuindo-lhe um
nmero, letra, adjectivo, ou descrio que julga melhor o descrever. Na funo
pblica o chefe de servio classifica no final do ano os funcionrios que
trabalham com ele em atributos como, por exemplo, pontualidade classificandoo, ainda como exemplo hipottico, em falta muito, raramente falta, pouco
pontual, raramente se atrasa, pontual. Para alm deste atributo inmeros
outros so susceptveis de integrar uma lista de classificao.
69
medidas de auto registo em que o sujeito descreve o que sente, suas atitudes,
crenas, interesses, etc.
Tipo de preenchimento
72
73
Desejabilidade social
Tem sido demonstrado que pessoas de diferentes nveis escolares, culturas e
nveis scio econmico tendem a concordar com as respostas que so mais
adequadas socialmente. No mbito dos testes de personalidade tem sido
designado como uma caracterstica de personalidade que pode ser avaliada. H
testes que so utilizados em conjunto para avaliar a desejabilidade social como
o caso do Escala de Desejabilidade Social de Edwards (1957), ou formas
reduzidas como a Marlow-Crowne Social Desirability Scale (Strahan & Gerbasi,
1972).
Resposta ao calha
Respostas ao calha ocorrem quando o respondente no est motivado ou quando
no capaz de responder. Neste caso ele assinala a resposta de modo quase
aleatrio, sem qualquer critrio.
Falsificao
Consiste em responder de modo a dar, intencionalmente, uma imagem oposta
realidade, em responder de modo a distorcer intencionalmente a realidade.
74
Estilo de resposta
O estilo de resposta consiste na tendncia para concordar (aquiescncia) ou para
discordar (crtico) com a resposta. Uma das maneiras de combater esta
orientao consiste em incluir na escala o mesmo nmero de itens formulados
pela negativa e pela positiva.
Inteligncia
O primeiro autor que se props avaliar a capacidade mental (ou inteligncia
termos que so equivalentes) foi Galton em meados do sculo passado que
sugeriu que a inteligncia era um trao que existia nas famlias. Foi no entanto
James McKeen Cattell que introduziu em 1890 o termo teste mental (Carror,
1982). Ainda segundo este autor a Binet que pode ser creditada a descoberta
de uma maneira apropriada de avaliar a inteligncia ou capacidade mental.
O que a inteligncia ou capacidade mental? Inmeras definies tm sido
produzidas e Sternberg e Salter (1982) sumariam uma definio de inteligncia
como comportamento adaptativo dirigido para um fim (p. 3). Binet (1890)
considerava que uma definio estreita de inteligncia inclua dois processos:
primeiro perceber o mundo externo e, segundo, trazer os acontecimentos
memria para os trabalhar ou pensar neles. Perron-Borelli e Perron (1970), com
base em Binet propem que perante um problema um indivduo, revela-se
inteligente se: (a) compreende a natureza e os dados do problema, e que se trata
realmente de um problema; (b) inventa uma ou mais solues para atingir o
objectivo; (c) durante as operaes mantm a ateno focada no objectivo a
seguir, e a direco da aco; (d) mantm a critica sobre o processo mental e os
resultados da aco.
75
inteligncia podia ser explicada por sete factores de grupo que intitulou de
Aptides Mentais Primrias e que eram: Compreenso verbal que implicava
tarefas de vocabulrio, compreenso de leitura, analogias verbais, e
equivalentes; fluncia verbal que abrangia a capacidade para gerar e manipular
rapidamente um conjunto amplo de palavras com caractersticas especficas;
nmero que se referia capacidade para realizar operaes matemticas rpida e
eficientemente; espao que se referia capacidade para apreender as relaes
espaciais e operar com figuras espaciais; memria associativa ou memria de
trabalho; velocidade de percepo que se referia velocidade para perceber os
detalhes visuais, discrepncias e semelhanas; raciocnio ou a capacidade para
realizar tarefas que implicassem deduo, induo ou raciocnio aritmtico.
Inteligncia fluida ou cristalizada Cattel (1963) considerava dois tipos de
inteligncia distintos embora relacionados. A inteligncia fluida era a
capacidade para identificar relaes e configurava numa capacidade de
raciocnio que era basicamente hereditria. A inteligncia cristalizada abrangia o
conhecimento e percias aprendidas.
Estas duas inteligncias evidenciam elevada correlao dado que as pessoas com
elevada inteligncia fluida teriam mais conhecimentos por via de possurem
maior capacidade de aprendizagem.
Inteligncia hierrquica Vernon (1960) prope um modelo integrador que
engloba as propostas de Spearman e de Thurstone. Sugere que um factor g
(como Spearman) se manifesta na realizao de qualquer teste de inteligncia e
que este subdivide em duas grandes categorias ou grupos: grupo verbaleducacional e grupo espacial-motor. Cada um destes grupos, por sua vez, se
pode subdividir em grupos de nvel mais baixo que, dalgum modo se
assemelham s capacidades mentais primrias de Thurstone. Estes grupos, por
sua vez, englobam factores menores que so especficos de cada teste e que se
assemelham aos factores especficos de Spearman.
Carroll (1993) prope um modelo de capacidade cognitiva de trs estratos
semelhante ao anterior. Baseado num largo estudo com base na anlise factorial
prope um modelo hierrquico moderno que, no entanto, vai na linha do de
Vernon. No nvel mais geral identifica um factor g. Num segundo nvel
identifica um conjunto de factores semelhante aos de Thurstone. Finalmente no
nvel seguinte identificam-se factores especficos.
Estrutura do intelecto Guilford (1967) prope um modelo tridimensional,
apresentado como um cubo, em que o cruzamento dos trs eixos ou dimenses d
origem a 180 diferentes tipos de inteligncia. Os trs eixos so (a) as operaes
que o indivduo faz, (b) os contedos ou materiais sobre os quais se realizam as
77
Personalidade
Historicamente desenvolveram-se duas formas sequenciais no tempo, e
incompatveis no mtodo: a avaliao tradicional da personalidade e a avaliao
comportamental.
Avaliao tradicional da personalidade Nesta perspectiva da avaliao da
personalidade identificam-se vrias orientaes que se exprimem nas medidas
utilizadas na avaliao, nomeadamente: (a) as que se propem avaliar a
totalidade da personalidade e (b) as que se propem avaliar aspectos (dimenses,
traos, factores, etc.) especficos. No primeiro caso os testes tendem a incluir no
ttulo o termo personalidade e no segundo recorrem ao nome da dimenso a
avaliar (ansiedade, depresso, etc.).
Por outro lado h (a) os testes (inventrios) que avaliam dimenses bsicas
estruturais, dificilmente mutveis, e (b) os que avaliam a interaco com o meio,
(c) e os que avaliam dimenses flutuantes (estados). Exemplo clssico dessa
distino o State- Trait Anxiety Inventory (Form Y) (Spielberger, Gorsuch,
Lushene, Vagg, & Jacobs, 1983).
79
81
Lersch (1954) explicava que se podiam distinguir trs tipos de traos: Os traos
de comportamento que descrevem o aspecto externo do comportamento sem se
interessar pelo que o provoca; os traos de realizao que descrevem as
maneiras caractersticas de realizar as tarefas e as realizaes objectivas sem se
interessar, tambm, pelas causas; finalmente os traos de essncia que se
interessam pelos processos e estados intra-psquicos, ou seja, pela realidade
interior.
Numa outra forma de analisar os traos, Murphy e Davidshofer (1998) h trs
modos diferentes de pensar acerca dos traos: (a) os traos provocam os
comportamentos, (b) traos s existem na cabea do investigador, e (c) os traos
so sumrios descritivos. No primeiro caso os traos explicam o
comportamento. O comportamento honesto da pessoa decorreria de o indivduo
ter um trao de honestidade. Na segunda perspectiva o trao seria uma
organizao cognitiva do investigador que, ao pretender organizar o
comportamento dos outros numa totalidade coerente construa traos; prxima
da anterior. Na terceira perspectiva o comportamento do indivduo no seria
provocado pelos traos, antes os traos seriam descries do comportamento.
Assim, quando uma pessoa fosse descrita como honesta este nome do trao
descreveria um conjunto de comportamentos que se relacionavam com a
honestidade.
A ideia que os traos so algo inerente ao indivduo, uma estrutura tal como um
esqueleto, e que todo o comportamento estaria dependente desse esqueleto, era
apelativa se se tivesse conseguido identificar ou avaliar essa estrutura. Ora o que
se verifica que h uma longa histria de discordncia acerca de quais os traos
a avaliar. Um escrutnio breve por alguns dos mais marcantes teste de
personalidade mostra, o seguinte:
O Califrnia Psychological Inventory possui 420 itens distribudos por 20
escalas, a saber: dominncia; capacidade para estatuto; sociabilidade; presena
social; auto-aceitao; independncia; empatia; responsabilidade; socializao;
auto-controlo, boa impresso; comunho; bem-estar; tolerncia; realizao via
conformidade; realizao via independncia; eficincia intelectual, mente
psicolgica, flexibilidade; masculinidade/feminilidade.
O Personality Research form uma das mais recentes medidas de
personalidade. A verso longa do teste contm 440 itens (a curta 300)
distribudos por 20 escalas de personalidade mais duas de validade, a saber:
humildade; realizao; pertena; agresso; autonomia; mudana; estrutura
cognitiva; defensivo; dominador; resistente; exibicionismo; evitamento da
ameaa; impulsividade; sustentador; ordem; jogo; atento; reconhecimento social,
procura proteco; compreenso; desejabilidade; infrequente.
82
84
Uma mxima da psicologia que permitiu a sua afirmao como cincia a par de
outras cincias duras a de que se um construto existe ele existe nalguma
quantidade, logo mensurvel. Com efeito a investigao cientfica depende de
91
Medidas nominais/categoriais
As medidas nominais ou categoriais reflectem diferenas qualitativas em vez de
diferenas quantitativas. Exemplos comuns so masculino/feminino, certo/errado
ou casado, solteiro, vivo, divorciado. Nmeros podem substituir as palavras (1
para masculino, 2 para feminino), como por vezes se faz quando se introduzem
dados no computador, sem que tal signifique que 2 mais do que 1. Os sistemas de
medida categoriais ou nominais requerem duas propriedades, mutua exclusividade
e exaustividade (Fife-Schaw,1995). Mutua exclusividade significa que cada
observao s pode caber numa categoria; exaustividade significa que o sistema de
categorias deve ter tantas categorias quantas as necessrias para todas as
observaes. Nalguns casos como o certo/errado fcil assumir que certo melhor
do que errado, no entanto as medidas nominais/ categoriais no assumem priori
que uma categoria mais ou melhor do que outra.
Medidas ordinais
Trata-se de um nvel de medio mais complexo do que o anterior. Tal como na
anterior as assunes de mutua exclusividade e exaustividade aplicam-se, e todos
os casos so agrupados numa das categorias. A grande diferena que as
categorias so ordenadas segundo um critrio definido priori, de tal modo que
pertencer a uma categoria significa ter mais ou menos do que pertencer a outra
categoria. Os resultados dos instrumentos de avaliao em psicologia so
normalmente expressos em escalas ordinais. Se numa escala que supostamente
mede a ansiedade, por exemplo, determinado indivduo difere trs pontos de
outro, sabemos que um tem mais do que o outro, mas no sabemos quanta mais
ansiedade um tem do que o outro. Uma das consequncias desta propriedade
que este tipo de escalas no deve ser tratado estatisticamente com estatstica
paramtrica, como frequente observar-se.
Escalas de intervalo
Tal como nas escalas ordinais, os nmeros significam que uns tm mais do que
outros na dimenso medida. A distino principal da medida anterior que com
93
Medidas de rcio
A diferena entre estas medidas e as de intervalo que as de racio possuem um
zero absoluto. Um bom exemplo de medidas deste tipo so escalas de
comprimento, de peso, tempo ou respostas correctas num teste. Em qualquer
destes casos possvel haver medida zero. A consequncia principal deste tipo de
medidas que se um indivduo tem 120 kg de peso pesa o dobro de outro que
pesa 60 kg, o que no ocorre se no houver zero como , por exemplo, o caso
da inteligncia.
Escala de Likert
a escala mais utilizada em avaliao de atitudes. Consiste numa srie de
afirmaes em que os respondentes devem indicar a sua concordncia ou
discordncia numa escala de intensidade, por exemplo, Concordo bastante,
concordo, indeciso, discordo, discordo bastante, ou nunca, quase
nunca, indeciso, quase sempre, ou sempre. A escala de Likert produz
uma escala ordinal que deve ser tratada com estatstica no-paramtrica.
Comea-se por produzir afirmaes ou itens acerca de um assunto a que os
sujeitos respondem assinalando uma posio numa escala do tipo que indicado
acima. Bowling (1998) exemplifica com os seguintes itens ou afirmaes:
Sinto sempre dores, sinto dores graves, sinto dores mas isso no me
incomoda, as minhas actividades esto limitadas por causa da dor, e a cada
uma das quais os sujeitos devem responder consoante o grau de concordncia
com a afirmao, de concordo bastante at discordo bastante.
As escalas de Likert incluem vrios itens que devem ser somados para produzir
uma nota, e os itens somados por pertencerem mesma escala devem ter
correlao elevada uns com os outros.
Formas mais sofisticadas da escala incluem a seleco dos itens que melhor
diferenciam os 25% de respondentes com atitudes mais positivas dos 25% com
atitudes mais negativas. Para uma afirmao ser considerada boa deve haver
diferenas estatisticamente significativas entre estes dois grupos para cada um
dos itens. Se tal no ocorrer ento o item deve ser eliminado.
95
Escala de Thurstone
Smith (1975) refere trs mtodos de construo de escalas que foram propostas
por Thurstone e que ficaram com o seu nome: (1) comparaes emparelhadas,
(2) intervalos de aparncia igual, e (3) intervalos sucessivos.
Tcnica de comparaes emparelhadas Esta escala prope-se ser uma escala
intervalar em vez de uma escala ordinal. Parte da premissa que se existir um
nmero grande de afirmaes sobre atitudes e se fizer comparaes
emparelhadas dessas afirmaes ao longo de um contnuo favorveldesfavorvel, o respondente pode expressar uma afirmao de cada par como
sendo mais favorvel ou desfavorvel do que a outra.
96
O modo de construir uma escala deste tipo comea pela produo de uma pool de
afirmaes ou itens (pelo menos 20 segundo Smith, 1975, mas podendo ir at 100)
acerca de um assunto qualquer. Todos os itens dessa pool so emparelhados de
modo a que cada item aparea emparelhado com cada um de todos os outros itens
(para 20 itens h 190 emparelhamentos). Em segundo lugar, pede-se a um grupo de
pessoas que actuam como juzes, que classifiquem em cada par qual a afirmao
mais favorvel e a menos favorvel. De seguida organiza-se uma tabela de dupla
entrada em que aparece o nmero de vezes que cada afirmao cotada como mais
favorvel do que cada uma das outras afirmaes. Os valores brutos encontrados
nesta tabela so transformados em notas z e, atravs de um procedimento estatstico
que o autor define, chega-se seleco de afirmaes que se aproximam de
intervalos iguais. Como se nota este procedimento de escolha dos itens muito
dispendioso pelo que se chegou a outro procedimento mais leve.
Tcnica dos intervalos de aparncia igual outra escala de Thurstone em que
os itens ocupam uma posio na escala que foi previamente determinada por
uma operao de classificao realizada por juizes. Prope-se ser uma escala de
resposta intervalar, ou seja, em que a distncia entre quaisquer dois nmeros
de magnitude conhecida, com a qual se pode utilizar estatstica paramtrica.
Comea-se por um nmero elevado de afirmaes ou itens como no mtodo
anterior. Solicita-se a um nmero elevado de juizes (entre 50 e 300) segundo
Miller (1970), que classifiquem de modo independente cada uma das afirmaes
em 11 grupos que variam do mais favorvel ao menos favorvel passando por
um ponto neutro. Com base na classificao dos juizes encontra-se uma mdia
para cada afirmao. As afirmaes com um desvio padro muito elevado, e que
no tenham uma distribuio normal, so eliminadas porque significa que h
grande discordncia entre os juizes. Agora cada item possui um valor mdio que
deriva da classificao dada pelos juizes. Com base nestes valores os itens so
ordenados dando origem a um coeficiente moderador na nota do indivduo. Um
item tem ndice, por exemplo, de 0,2, enquanto outro ter de 0,6 ou 1,3.
Mtodo de intervalos sucessivos O procedimento idntico ao anterior mas
acrescenta-se a identificao das distncias que cada juiz atribui a cada item de
modo a identificar, tal como na tcnica de comparaes emparelhadas, uma
escala intervalar.
A construo de escalas de Thurstone muito dispendiosa, dado a validao da
escala exigir, ou o trabalho de juizes que nem sempre esto disponveis, ou que
se comece com um nmero de itens muito elevado.
97
Escala de Gutman
O escalograma de anlise de Gutman parte da assuno que (a) um conjunto de
itens pode ser ordenado ao longo de um contnuo de dificuldade ou magnitude e
(b) este conjunto de itens mede uma varivel dimensional (Smith, 1975). uma
tcnica de classificao hierrquica (Bowling, 1998) e, portanto os itens tm de
possuir a propriedade hierrquica de quem concordar com um item tambm
concorda com os itens que esto na hierarquia mais baixa da escala. Tem sido
utilizada em sade para avaliar o funcionamento fsico. Trata-se de uma escala
unidimensional que difcil aplicar a outros domnios do comportamento que,
normalmente, no so to consistentes como o funcionamento fsico de modo
que possam ser hierarquizados.
Diferencial semntico
Este tipo de escala foca o significado que uma pessoa atribui a uma palavra ou
conceito. Refere-se medio de vrias dimenses semnticas, ou a diferentes
tipos de significado que se reflecte no adjectivo adoptado como descritor. Uma
das amplitudes mais utilizadas um descritor de sete posies em que a mdia
neutra e vale 0 e para cada um dos extremos cresce at +3 ou -3. Pede-se ao
respondente que assinale em escalas que em cada extremo mostram adjectivos
bipolares, por exemplo bom-mau, lento-rpido, quente-frio, feliz-triste,
fraco-forte, activo-passivo. A maioria dos adjectivos pode classificar-se em
trs categorias tais como avaliao (p. ex., bom-mau), potncia (p. ex., fortefraco), e actividade (p. ex., rpido- lento).
Escolha forada
Numa escalo deste tipo pede-se ao respondente que escolha entre duas
afirmaes que sejam igualmente apelativas. Uma afirmao representa um dos
atributos enquanto a outra afirmao representa o oposto, ou no representa o
atributo em estudo. Se houver mais de duas alternativas a terceira escolha
possvel consiste num item de elevada desejabilidade social. A escala de
Controlo Interno versus Externo de Rotter (1966) uma escala deste tipo.
98
Dicotmicas
As escalas de resposta dicotmica so escalas de escolha forada em que o
respondente tem de escolher entre duas respostas claramente antagnicas (ao
contrrio da anterior em que ambas so plausveis) do tipo sim no, certo errado,
verdadeiro falso, etc.
Propriedades psicomtricas
Ora, o essencial para qualquer medio ser precisa , primeiro, que mea o que
se pretende medir e no outro aspecto diferente ou parecido (validade) e,
segundo, que se a medio for repetida, nas mesmas condies, com os mesmos
respondentes, o resultado encontrado seja idntico (dentro de um erro aceitvel)
(fidelidade). Estes aspectos devem ser garantidos por todas as medidas, quer se
trate de um registo de presso sangunea, de presso atmosfrica, ou outra.
Fidelidade Fidelidade, de fiel, fivel, significa que as notas obtidas por
avaliadores (os mesmos ou outros) quando avaliam as mesmas pessoas em
diferentes ocasies, com os mesmos testes, ou com conjuntos equivalentes de
itens, so semelhantes (Anastasi, 1990). Dito de outro modo, ainda segundo a
mesma autora, a fidelidade de um teste indica a extenso em que as diferenas
individuais na realizao do teste so atribuveis a diferenas verdadeiras ou
reais, das caractersticas avaliadas.
Dado que todos os tipos de fidelidade se interessam pelo grau de consistncia ou
concordncia entre dois conjuntos de notas independentes, eles expressam-se
por um coeficiente de correlao.
Os tipos de fidelidade que podem ser identificadas num teste so: teste-reteste,
formas alternativas, imediatas ou em tempos diferentes, duas metades, alfa de
Cronbach ou Kuder-Richardson, de cotador.
Teste-reteste Na situao de teste-reteste o teste passado aos mesmos
indivduos, num momento e de novo passado algum tempo. O tempo de
intervalo considerado uma varivel importante por vrias razes. Nuns casos
devido aprendizagem, como o caso de itens dos testes de inteligncia, em
que os respondentes, em caso de o tempo entre as passagens do teste ser curta,
podem aprender a resposta. Noutros casos, porque esperado que haja
alteraes na varivel, como o caso, por exemplo, da ansiedade estado, em que
as correlaes devero, caso o tempo entre passagens seja elevado, ser
moderadas. Ou seja, os valores desejveis da correlao que expressam a
fidelidade do teste devem ser considerados caso a caso. O valor de referncia
considerado bom de r = 0,80, embora se possam aceitar valores to baixos
como de r=0,60.
Formas alternativas um procedimento parecido com o anterior. Podem ser
imediatas ou em momentos diferentes, e refere-se passagem de duas formas
equivalentes do teste (duas formas que avaliam o mesmo construto, a mesma
dimenso). Uma das vantagens deste procedimento reside na eliminao da
aprendizagem das respostas que pode ocorrer quando se passa o mesmo teste
100
104
106
Apropriabilidade
Trata-se de uma propriedade dos testes decisiva na utilizao com doentes. No
aceitvel por razes ticas violar esta propriedade. No havendo um consenso
internacional para esta definio, Bowling (1998) expe a seguinte: a considerao
que os benefcios esperados na sade, dos procedimentos utilizados excedem as
consequncias negativas por uma margem suficientemente grande que justifique a
implementao do procedimento, excluindo-se consideraes de ordem econmica.
Economia (burden)
O SAC (1995) define economia como as exigncias em termos de tempo,
energia e outras, que so feitas queles a quem os testes so administrados. A
109
avaliao psicolgica foi, durante muito tempo uma prtica privilegiada pelos
psiclogos. A partir da segunda metade do sculo XX, o desenvolvimento da
psicologia clnica enviou a avaliao para o lugar actual, ou seja, o primeiro
momento da interveno psicolgica. Desta evoluo decorre a importncia da
economia, que se torna um aspecto especialmente importante em psicologia e
sade.
O aparatus da avaliao psicolgica frequentemente difcil de utilizar, de
utilizao impraticvel, e fornece resultados que so difceis de interpretar e de
integrar pela equipa teraputica nas decises clnicas. Os instrumentos para
utilizao rotineira em cuidados de sade devem ser breves e simples de utilizar
dizem Fitzpatrick, Fletcher, Gore, Jones Spiegelhalter e Cox (1992). Estes
autores salientam, no entanto, que a brevidade pode significar que se perde
informao importante acerca da experincia do avaliado e que a validade destes
instrumentos breves tem de ser cuidadosamente verificada.
possvel e adequado utilizar tcnicas clssicas de avaliao psicolgica
como por exemplo a Wechsler Adult Inteligence Scale-Revised (WAIS-R), na
avaliao da deteriorao mental. No entanto, tcnicas deste tipo so pouco
utilizadas, nomeadamente porque so muito dispendiosas no tempo que
necessrio para as passar. Para este fim especfico outras tcnicas tm sido
desenvolvidas como, por exemplo, o Short Test of Mental Status (Kokmen,
Smith, Petersen, Tangalos, & Ivnik, 1991), que um teste de rasteio (screening)
cuja administrao demora cinco minutos, e exibe uma correlao de 0,78, 0,71
e 0,78 (numa amostra de 268 participantes), respectivamente com o QI verbal,
QI de realizao e QI total da WAIS. Ou seja, cerca de dois teros da varincia
explicada comum aos dois testes, um que demora mais de uma hora e outro
que demora cinco minutos. O mesmo se verifica com o Inventrio de Sade
Mental de cinco itens, conhecido por MHI-5, que tem, na adaptao portuguesa
(Pais-Ribeiro, 2001), uma correlao de 0,92 (de 0,95 na verso original), com a
verso longa de 38 itens. Ou seja, cerca de 90% da varincia do teste longo
explicada pela verso curta.
Numa investigao acerca da qualidade de testes com um nico item Gardner,
Cummings, Dunham, e Pierce, (1998) numa investigao em que se prope
comparar a eficincia mtrica da medida de um construto psicolgico realizada
com um item versus uma medida do mesmo construto realizada com vrios
itens, concluem que um mtodo no superior ao outro. Concluem que um bom
item pode ser mais eficaz do que escalas que agrupam itens menos bons.
No que foi dito parece resultar um paradoxo para a psicologia. Com efeito, uma
das mximas na psicometria que quanto mais itens uma medida de auto-relato
tiver acerca de um construto psicolgico melhor (Gardner, Cummings, Dunham,
110
Adequabilidade
Significa que os aspectos a avaliar so adequados para a deciso a tomar. No se
trata de aspectos de validade. Enquanto esta a garantia que o teste mede o que
se pretende medir, a adequabilidade uma caracterstica que deve ser
inspeccionada antes da escolha do instrumento, ou seja, o instrumento escolhido
deve garantir que mede aspectos que so teis para a deciso a tomar. Pode
acontecer que no haja disponvel, nenhum instrumento para avaliar o aspecto
de interesse. Devido a isto, e porque inmeras propriedades so exigidas aos
instrumentos de avaliao, o psiclogo pode decidir recorrer a instrumentos que
avaliem aspectos prximos do que interessa.
Interpretabilidade
O SAC (1995) define interpretabilidade como o grau em que possvel atribuir
um significado qualitativo aos valores quantitativos de um instrumento. Murphy
e Davidshofer (1998) descrevem a interpretabilidade como uma caracterstica
que os testes devem possuir que garanta que a informao que fornecem acerca
do indivduo interpretada de modo semelhante por vrios utilizadores. Explica
111
dizendo que testes que sejam especficos acerca do que se propem medir, tm
maiores probabilidades de ser teis do que aqueles que so vagos.
Conformidade
De Responsiveness no original refere-se capacidade do instrumento para
detectar mudanas mnimas. A utilizao de medidas em psicologia e sade,
mais do que classificar os indivduos por referncia a uma norma dever ser
sensvel a mudanas que ocorram no indivduo ao longo do tempo, quer se trate
de sensibilidade psicomtrica versus sensibilidade clnimtrica (ver noutro
local).
Por definio, conformidade, que tambm se pode designar por sensibilidade,
abrange mudanas mnimas que so consideradas importantes. Considera-se
sensibilidade da razo do sinal a mudana real que ocorre ao longo do tempo, e
sensibilidade de rudo as mudanas nas notas que ocorrem ao longo do tempo e
que no esto associadas a mudanas do estado SAC (1995).
Aceitabilidade
Refere-se propriedade que a tcnica de avaliao tem que garante que bem
recebida, que recebida sem desconfiana, pelo respondente
Utilidade
uma propriedade que garante que a tcnica utilizada til para a investigao
em causa. Por vezes recolhe-se informao suprflua que depois no utilizada
na investigao.
112
CONSTRUO DE TESTES
Introduo
Parece claro que testes escritos em ingls e traduzidos segundo regras lexicais
no mantm sentido idntico. De Raad (1998) da mesma opinio e afirma: as
lnguas diferem muito umas das outras: traos descritos numa lngua no tm
necessariamente traduo correspondente noutra lngua (p. 120). Este autor,
fazendo uma reviso crtica sobre um conhecido teste de personalidade com
verses em vrios idiomas confirmava a variedade de estruturas que esse teste
apresentava nos vrios idiomas. A nossa experincia no estudo de testes
originariamente escritos em ingls aponta no mesmo sentido (Pais-Ribeiro,
1994a,b; 1995a).
Um processo de adaptao adequado consiste num procedimento muito
semelhante ao de construo. Como afirma Bradley (1994) uma nova traduo
necessita ser submetida aos mesmos procedimentos psicomtricos, que,
suposto, a verso original ter sofrido.
Como um item traduzido com respeito pelas regras lexicais tem probabilidade
reduzida de ter o mesmo significado na lngua original e na traduzida, por vezes,
para manter o mesmo sentido, a soluo ajustar o texto. Recorrer a itens
traduzidos unicamente com respeito pelas regras lexicais e sem respeitar a
validade de contedo pode ser mais ou menos grave consoante a validade do
teste, ou dos itens, garantida com base na validade de contedo (desde que a
traduo respeite a mesma validade de contedo) ou da validade emprica (desde
que o estudo emprico seja feito para a verso traduzida).
Hiptese psicolexical
Segundo De Raad (1998) a hiptese lexical defende que todas as diferenas
individuais com alguma importncia tm expresso na linguagem. Esta leva
hiptese psicolexical da personalidade que assume que h um conjunto de
descritores universais dos traos de personalidade que seriam comuns a todos os
humanos. Os traos, entendidos imagem de peas de anatomia que tipificavam
a espcie.
Guyatt (1993) apresenta uma crtica filosofia da traduo de questionrios de
avaliao da qualidade de vida, salientando as vantagens e limitaes de tal
procedimento, e sugere uma abordagem no desenvolvimento de questionrios
que se aproxima da que foi apresentada acima como exemplo. Assume que a
simples traduo com respeito rigoroso pela verso original dar origem a
questionrios diferentes.
117
Basicamente sugere que o questionrio na lngua original seja utilizado como guia
mas no mais. Sugere trs estratgias de desenvolvimento de questionrios que
designa por estratgia Rolls-Royce, estratgia Volkswagen e estratgia Volvo,
consoante os recursos disponveis. A primeira muito semelhante ao processo de
construo do questionrio. A segunda utilizaria uma verso simplesmente
traduzida. A terceira, provavelmente a mais plausvel, comearia por assumir um
conjunto de assunes: (a) os domnios do instrumento original tambm so
domnios importantes na cultura e lngua para que se pretende traduzir; (b) a
estratgia para formular as questes tambm funciona bem nesta cultura e lngua;
(c) a estratgia para responder tambm adequada. A terceira estratgia no se
limitaria a uma traduo rigorosa com base em dimenses lexicais.
Hays, Anderson e Revicki (1993) referem quatro equivalncias que devem ser
considerados na traduo de modo a garantir que as medidas so idnticas:
Equivalncia da traduo do item; equivalncia operacional; equivalncia da
escala; e equivalncia mtrica.
1) Equivalncia da traduo do item que proporciona a equivalncia
funcional, responde a uma questo importante que a de saber se a traduo
noutra lngua mantm o mesmo significado que verso original, que intitula
de equivalncia funcional. O critrio mais rigoroso o j referido, proposto
por Brislin, Lonner e Thordike (1973).
2) Equivalncia operacional do item pretende verificar se as assumpes
referentes administrao do teste na lngua original se podem aplicar,
igualmente, no idioma em que se pretende utilizar a verso traduzida.
Aspectos que devem ser particularmente cuidados so o tempo, ou os custos
(no s temporais), com a passagem do teste, a exposio de aspectos
pessoais ntimos que o teste pode exigir e que no so sentidos da mesma
maneira em diferentes culturas, e a litercia.
3) Equivalncia da escala garante que o teste mede as mesmas dimenses nas
duas culturas. As dimenses avaliadas com tcnicas deste tipo esto
embebidas numa matriz cultural e num sistema de crenas que se
desenvolveu nessa cultura. Os itens deste tipo de instrumentos podem ter o
mesmo significado mas ser valorizados e conceptualizados de modo
diferente em populaes e culturas diferentes.
Um dos modos de avaliar a equivalncia das escalas atravs da inspeco das
propriedades psicomtricas, garantindo que elas so semelhantes nas duas
verses. Outro mtodo o de verificar, atravs da anlise factorial, se as
solues factoriais so idnticas e se a varincia de cada factor semelhante.
4) Equivalncia mtrica da escala refere-se a se a medida ordena os
indivduos num contnuo, de modo semelhante em ambas as culturas. Uma
abordagem adequada seria escalar os itens relativamente s medidas de
tendncia central da cultura estudada, ou classificar os itens de acordo com
uma escala externa que servisse de referencial, e compar-las nas duas
culturas, para ver se a distribuio seria equivalente.
Outra proposta para implementar a equivalncia entre instrumentos em culturas
diferentes proposto por Herdman, Fox-Rushby e Badia (1998), proposta que
intitulam de Abordagem Universalista. Esta, como j se referiu, salienta que h a
possibilidade de haver variaes na natureza de construtos multidimensionais em
diferentes culturas, pelo que importante investigar alguns aspectos,
120
5. Deve decidir-se, no seguimento do tipo de agrupamento dos itens por subescalas, qual a magnitude da relao entre os itens. Esta expressa-se pela
consistncia interna. Como explica Rotter (1990) podemos ter alfas muito
elevados se fizermos a mesma pergunta inmeras vezes, mas as limitaes
preditivas de tal teste so bvias (...) e um teste com um alfa de 0,90
suspeito na medida em que pode estar a medir o estilo de resposta em vez de
fornecer uma amostra representativa do comportamento e de situaes que
se desejam prever, ou pode simplesmente consistir em itens redundantes (p.
491). Relativamente Escala I-E de que autor, Rotter assume que, pelo
contrrio, o que lhe interessa nessa escala listar uma amostra de itens
representativa de muitas situaes e no um grupo de itens que representam
a mesma situao e, por isso, assume que a correlao entre tais itens deve
ser positiva mas baixa. Convm no esquecer que a escala I-E se inscreve na
teoria da aprendizagem social em que a assuno bsica que a unidade de
investigao no estudo da personalidade a interaco do indivduo com o
seu meio ambiente significativo, assumindo-se que o comportamento em
diferentes situaes varia. Ora, esta questo est dependente da teoria que
sustenta o construto, e que deve, de algum modo ser clarificada.
Como se referiu quando se falou da consistncia interna do item, esta pode
significar a) uma elevada correlao entre o item e o critrio externo, ou, b)
uma elevada correlao com a nota da escala a que pertence. Se a primeira
hiptese for a definida priori, a correlao do item com a nota da escala a
que pertence pode ser (ou no) baixa, e ento, a homogeneidade da escala
fica diminuda o que no significa que a qualidade do item ou a qualidade da
escala seja igualmente diminuda. Tudo depende do critrio definido priori.
Por outro lado deve-se clarificar a estabilidade esperada da escala. Por
exemplo, se se tratar de um trao (estvel, perene), esperado que o teste
reteste com um ms de intervalo mostre uma correlao mais elevada do que
se tratar de um atributo menos estvel, nomeadamente um estado.
6.
Num primeiro momento a escolha e incluso dos itens feita somente com
base na teoria. A seleco final dos itens deve, no entanto ser feita com base
em critrios empricos. Loevinger (1957) chama ao primeiro critrio (com
base na teoria) a componente substantiva da validade enquanto ao segundo
chama componente estrutural da validade que, segundo Jackson (1970) se
expressa pela homogeneidade dos itens.
folha de apresentao tanto mais importante se o questionrio for de autopreenchimento. Em contextos de cuidados de sade, as comisses de tica
solicitam por vezes que nesta folha de rosto exista um espao em que o
respondente assina um compromisso de que aceita participar na investigao
e que est a par do que lhe est a ser pedido e das implicaes que tem tal
participao (consentimento informado).
11. O passo seguinte consiste na verificao se a populao alvo compreende os
itens do modo que os especialistas esperam. Procede-se para isso a uma
entrevista em que o respondente, um membro (ou vrios) da populao alvo,
responde ao questionrio de forma aberta, conversando com o entrevistador
de modo a identificar se est a entender as questes do modo suposto, se as
compreende, e se acessvel o modo de responder.
12. Com base nos procedimentos anteriores produzir a verso de estudo
definitiva. D-se incio, ento, ao estudo piloto em que a verso definitiva do
questionrio deve ser passada a uma amostra da populao alvo. O estudo
piloto deve registar minuciosamente todos os acontecimentos que ocorram
desde o primeiro contacto com a populao alvo, passando por eventuais
incidentes de preenchimento, at a questes levantadas com a anlise dos
dados de modo a que se procedam s rectificaes finais.
13. Com base nos resultados passa-se explorao das propriedades mtricas do
questionrio. O primeiro passo consiste em inspeccionar a distribuio das
respostas pelos itens, nomeadamente (a) se todas as alternativas de resposta
so utilizadas pelos respondentes, (b) se a distribuio das respostas segue
um padro estatstico normal (por exemplo, utilizar o teste K-S do SPSS).
Esta inspeco pode permitir, eliminar (no caso de a distribuio no ser
normal) a possibilidade de se adoptar pelo uso de uma estatstica paramtrica
na anlise dos resultados do questionrio, (c) verificar atravs da anlise
factorial (ateno ao padro de distribuio das respostas dado que a anlise
factorial um procedimento paramtrico) se os itens se distribuem pelos
factores (dimenses) que foram definidos priori, e que so os supostos, ou
se unidimensional, (d) Inspeccionar se a consistncia interna da escala ou
das sub-escalas satisfatria, (e) inspeccionar a validade convergente
discriminante dos itens.
14. Finalmente produzir o relatrio do teste com os procedimentos e valores
psicomtricos, clinimtricos, normativos e outros, que foram encontrados, e
publicar num jornal da especialidade os resultados do estudo. Deste modo,
todos os interessados podem conhecer em sumrio o teste e solicitar ao autor
o relatrio do teste e autorizao para o utilizar.
127
tica na avaliao
130
REFERNCIAS
Berzon, R., Patrick, D., Guyatt, G., & Conley, J. (1994). Intellectual property
considerations in the development and use of HRQL measures for clinical
trial research. Quality of Life Research, 3, 273-277.
Binet, A. (1890). Perceptions denfants. Revue Philosophique, 30, 582-611.
Bishop, G. D. (1994). Health psychology: Integrating mind and body. Boston:
Allyn and Bacon.
Blanchard, E., & Schwarz, S. (1988). Clinically significant changes in
behavioral medicine. Behavioral Assessment, 10, 171-188.
Bowling, A. (1991). Measuring health: A review of quality of life measurement
scales. Milton Keines: Open University Press.
Bowling, A. (1998). Research methods in health. Buckingham: Open University
Press.
Boyle, E., & Harrison, B. (1981). Factor structure of the health locus of control
scale. Journal of Clinical Psychology, 37(4), 819-824.
Bradley, C. (1994). Translation of questionnaires for use in different languages
and cultures. In C Bradley (Ed.), Handbook of psychology and diabetes (pp.
43-55) Switzerland: Hardwood Academic Press.
Brannon, L., & Feist, J. (1992). Health psychology: An introduction to behavior
and health. Pacific Grive: Brooks/Cole Publishing.
Breakwell, G. (1995) Research: Theory and method. In G. Beakwell, S.
Hammond, & C. Fife-Schaw (Eds.), Research methods in psychology (pp. 515). London: SAGE Publications.
Brislin, R., Lonner, W., & Thorndike, R. (1973). Cross cultural research
methods. New York: Wiley and Sons.
Campbell, D., & Stanley, J. (1963). Experimental and quasi-experimental
designs for research on teaching. In N. L. Gage (Ed.), Handbook of research
on teaching. Chicago: Rand McNally.
Carroll, J. (1982). The measurement of intelligence. In R. Sternberg (Ed.),
Handbook of human intelligence (pp. 29-120). Cambridge: Cambridge
University Press.
132
Truog, R., Robinson, W., Randolph A., & Morris, A. (1999). Is informed
consent always necessary for randomized controlled trials? The New England
Journal of Medicine, 340(10), 804-807.
Turk, D. C., & Kerns, R. D. (1985). Assessment in health psychology: A
cognitive behavioral perspective. In P. Karoly (Ed.), Measurement strategies
in health psychology (pp. 335-372). New York: John Wiley & Sons.
Vernon, P. (1960). The structure of human abilities. London: Methuen.
West, S. G. (1985). Beyond the laboratory experiment: Experimental and quasiexperimental designs for interventions in naturalistic settings. In P. Karoly
(Ed.), Measurement strategies in health psychology (pp. 183-233). New
York: John Wiley & Sons.
Wijsman, D., Hekster, Y., Keyser, A., Renier, W., & Meinardi, H. (1991).
Clinimetrics and epilepsy care. Pharmacy World & Science, 13(4), 182-188.
Willard, R. (1995). Assessment of pain and pain behavior. In L. Cushman & M.
Scherer (Eds.), Psychological assessment in medical rehabilitation (pp. 237273). Washington: American Psychological Association.
140