Professional Documents
Culture Documents
de
escalas de avaliao
Rinaldo Artes 1
RESUMO
A anlise fatorial uma tcnica estatstica multivariada largamente utilizada em psiquiatria. Detalhamos,
neste trabalho, alguns aspectos de ordem prtica ligados sua aplicao. Como ilustrao da tcnica,
analisamos um conjunto de dados que consiste nos itens da forma trao do Inventrio de Ansiedade
Trao-Estado aplicados a uma amostra de universitrios.
ABSTRACT
Factor analysis is a multivariate statistical analysis widely used in psychiatry. We discuss, in this text,
some issues about the application of this technique. We illustrate it in a data set of the trait form of the
State-Trait Anxiety Inventorys items applied to a sample of college students.
Key words: Multivariate Statistical Analysis; State-Trait Anxiety Inventory (Trait form)
INTRODUO
Ao idealizarmos este texto, decidimos voltar nossas atenes aos usurios de AF que
no possuem uma forte formao em Estatstica. Desse modo, nossa inteno inicial
discutir algumas dvidas importantes sobre a aplicao da AF. Devido a escassez de
espao, priorizamos as questes que nos pareceram mais importantes. Aspectos
omitidos neste texto podem ser encontrados na literatura apresentada.
Como ilustrao da tcnica, apresentamos ao longo do texto uma AF aplicada aos itens
da forma trao do Inventrio de Ansiedade Trao-Estado (IDATE-T), Spielberger et al.
(1970), validado para o portugus por Biaggio e Natalcio (1979). Os itens dessa escala
constituem-se de frases (ver tabela 1) e so avaliados por meio da atribuio de um
escore de 1 a 4, onde 1 indica que o estado descrito na frase quase nunca ocorre e 4
indica que ocorre quase sempre. Para a anlise dos itens, esses escores foram
convertidos de modo que escore alto represente um estado negativo. Os dados em
questo correspondem a um subconjunto de uma amostra de universitrios fornecida
pelo Prof. Dr. Hlio Guerra Vieira Filho e Teng Chei Tung, que vem sendo analisada por
eles e pelas Profa. Dra. Clarice Gorenstein e Profa. Dra. Laura H. S. G. de Andrade,
alm do prprio autor. Nessa aplicao, consideramos os dados de 790 estudantes do
curso de letras da Faculdade de Filosofia, Letras e Cincias Humanas da USP.
Tabela 1
Descrio dos itens da escala IDATE
Item Descrio
1 Sinto-me bem
2 Canso-me facilmente
3 Tenho vontade de chorar
4 Gostaria de ser to feliz quanto os outros parecem ser
5 Perco oportunidades porque no consigo tomar decises rpidas
6 Sinto-me descansado
7 Sinto-me calmo, ponderado e senhor de mim mesmo
Sinto que as dificuldades esto se acumulando de tal forma que no as
8
consigo resolver
9 Preocupo-me demais com as coisas sem importncia
10 Sou feliz
11 Deixo-me afetar muito pelas coisas
12 No tenho confiana em mim mesmo
13 Sinto-me seguro
14 Evito ter que enfrentar crises e problemas
15 Sinto-me deprimido
16 Estou satisfeito
17 As vezes idias sem importncia entram na cabea e ficam me preocupando
18 Levo os desapontamentos to a srio que no consigo tir-los da cabea
19 Sou uma pessoa estvel
20 Fico tenso e perturbado quando penso em meus problemas do momento
1. O que e para que serve uma Anlise Fatorial?
A AF permite resolver esses dois problemas. Reis (1997) define a AF como "um
conjunto de tcnicas estatsticas cujo objetivo representar ou descrever um nmero de
variveis iniciais a partir de um menor nmero de variveis hipotticas". Trata-se de
uma tcnica estatstica multivariada que, a partir da estrutura de dependncia existente
entre as variveis de interesse (em geral representada pelas correlaes ou covarincias
entre essas variveis), permite a criao de um conjunto menor de variveis (variveis
latentes, ou fatores) obtidas como funo das variveis originais. Alm disso, possvel
saber o quanto cada fator est associado a cada varivel e o quanto o conjunto de fatores
explica da variabilidade geral dos dados originais. Note que isso vem de encontro
resoluo do problema (a), haja vista que, quando a AF bem-sucedida, o pesquisador
pode trabalhar com um nmero reduzido de variveis sem uma perda muito grande de
informaes. O problema (b) tambm solucionado, j que cada um desses fatores pode
representar uma caracterstica subjacente aos dados. Tome por exemplo Sperman
(1904), que interpretou o fator "g" como uma medida de inteligncia que estaria
implicitamente ligada ao desempenho de um conjunto de testes.
2. Quais so os mtodos para a obteno dos fatores? Que suposies eles exigem?
Os fatores explicam parte da variabilidade total dos dados, expressa atravs da soma das
varincias das variveis originais. As variveis com uma maior variabilidade (varincia)
podem vir a ser predominantes na construo dos fatores, mascarando, eventualmente, a
presena de variveis com menor variabilidade. Nesses casos, sugere-se trabalhar com
as variveis padronizadas, cujas varincias so iguais a um e cujas covarincias
correspondem s correlaes entre as variveis originais.
Existem outros mtodos de obteno de fatores que no sero tratados neste texto.
TABELA 2
Resumo da explicao dos fatores de uma AF obtida a partir de uma ACP
aplicada aos itens da escala IDATE - T
Explicao 6 Explicao Variao da
Fator Autovalor
(%) Acumulada 7 Explicao 8
1 6,85 34,2 34,2
2 1,66 8,3 42,5 25,9
3 1,28 6,4 48,9 1,9
4 1,01 5,1 54,0 1,3
5 0,93 4,7 58,6 0,4
6 0,83 4,2 62,8 0,5
7 0,77 3,9 66,7 0,3
8 0,71 3,6 70,2 0,3
9 0,68 3,4 73,6 0,2
10 0,65 3,2 76,8 0,2
11 0,61 3,1 79,9 0,1
12 0,57 2,8 82,7 0,3
13 0,54 2,7 85,4 0,1
14 0,51 2,5 87,9 0,2
15 0,47 2,4 90,3 0,1
16 0,44 2,2 92,5 0,2
17 0,42 2,1 94,6 0,1
18 0,41 2,0 96,7 0,1
19 0,36 1,8 98,5 0,2
20 0,30 1,5 100,0 0,3
6
100* autovalor / 20
7
soma das explicaes da linha atual e das linhas anteriores
8
diferena entre as explicaes de dois fatores consecutivos
Definido o nmero de fatores, h, grosso modo, trs informaes bsicas que podem ser
extradas de uma AF: a porcentagem de explicao da variabilidade total (discutida
anteriormente), as comunalidades e as cargas fatoriais.
TABELA 3
Comunalidades referentes a uma soluo com 4 fatores
Item Comunalidade Item Comunalidade
1 0,60 11 0,55
2 0,42 12 0,43
3 0,38 13 0,54
4 0,47 14 0,55
5 0,57 15 0,61
6 0,64 16 0,65
7 0,58 17 0,59
8 0,46 18 0,58
9 0,56 19 0,47
10 0,71 20 0,45
A interpretao dos fatores de uma AF feita por meio das cargas fatoriais, que so
parmetros de um modelo de AF que expressam as covarincias entre cada fator e as
variveis originais. No caso de utilizar variveis padronizadas (matriz de correlao),
esses valores correspondem s correlaes entre os fatores e as variveis originais. A
tabela 4 traz as cargas fatoriais de nosso exemplo. Para facilitar a interpretao dos
fatores, marcamos em negrito todos os valores superiores ou iguais a 40% 5. Note que
na soluo no rotacionada, o primeiro fator est associado a praticamente todos os itens
e o quarto fator no se associa fortemente a nenhum item; isso dificulta a identificao
de estruturas de dependncia. Quando observamos a cargas obtidas aps uma rotao
Varimax, conclumos que:
5, 8, 12 e 14 predominam no 4.
Cabe ao analista avaliar o que h de comum em cada um dos quatro conjuntos de itens
descritos acima. Essas caractersticas em comum esto ligadas s interpretaes dos
respectivos fatores, podendo ser construtos ligados ao daquele medido pela escala
IDATE-T.
TABELA 4
Cargas fatoriais para uma soluo com 4 fatores, sem e com rotao
Fatores
Soluo no rotacionada Soluo aps rotao Varimax
Item 1 2 3 4 1 2 3 4
1 0,60 -0,47 0,10 -0,09 0,72 0,01 0,25 0,09
2 0,47 -0,03 -0,21 0,39 0,09 0,16 0,59 0,17
3 0,54 0,01 -0,08 -0,28 0,43 0,43 0,08 0,00
4 0,53 -0,02 0,38 -0,19 0,52 0,22 -0,09 0,37
5 0,51 0,18 0,47 0,23 0,22 0,17 0,09 0,69
6 0,46 -0,17 -0,50 0,39 0,12 0,16 0,77 -0,09
7 0,66 -0,22 -0,23 0,20 0,41 0,22 0,60 0,07
8 0,60 0,05 0,17 0,25 0,28 0,22 0,34 0,47
9 0,54 0,47 -0,22 -0,08 0,02 0,71 0,19 0,13
10 0,67 -0,44 0,18 -0,19 0,81 0,08 0,17 0,13
11 0,60 0,39 -0,15 -0,09 0,14 0,68 0,19 0,18
12 0,57 0,16 0,18 0,21 0,21 0,29 0,26 0,48
13 0,69 -0,14 0,02 0,20 0,44 0,20 0,46 0,30
14 0,25 0,33 0,55 0,29 -0,04 0,08 -0,06 0,74
15 0,70 -0,15 0,06 -0,31 0,67 0,38 0,10 0,09
16 0,71 -0,37 0,06 -0,11 0,73 0,16 0,29 0,13
17 0,56 0,46 -0,20 -0,18 0,09 0,75 0,12 0,11
18 0,66 0,27 -0,09 -0,25 0,34 0,66 0,10 0,13
19 0,63 -0,21 -0,16 0,04 0,47 0,24 0,44 0,05
20 0,57 0,34 -0,09 -0,06 0,15 0,59 0,18 0,20
A escolha do nmero de fatores uma das tarefas mais importantes de uma AF. Hair et
al. (1995) discute que, se o pesquisador opta por um nmero muito reduzido, ele pode
no identificar estruturas importantes existentes nos dados e, por outro lado, se o
nmero excessivo, ele pode vir a ter problemas de interpretabilidade dos fatores.
Existem, na literatura, vrios critrios que auxiliam na determinao do nmero de
fatores que, invariavelmente, quando empregados em um mesmo conjunto de dados,
conduz a resultados diferentes. Como regra geral, o pesquisador deve procurar um
compromisso entre o nmero de fatores (que, a princpio, deve ser o menor possvel) e a
sua interpretabilidade. comum, em situaes prticas, simplesmente comparar
solues com um nmero diferente de fatores e fazer a escolha com base no bom senso
do pesquisador. Nesses casos, os critrios apresentados na seqncia podem ser
utilizados como ponto de partida para a obteno de uma soluo final.
Uma AF envolve a estimao de um grande nmero de parmetros e, para que isso seja
feito com um mnimo de qualidade, necessrio um tamanho amostral relativamente
grande em comparao ao nmero de variveis envolvidas. H, na literatura estatstica,
uma srie de sugestes para a escolha desse tamanho amostral. Em geral, essas opes
baseiam-se na experincia pessoal dos diversos autores que, em alguns casos, sugerem
um tamanho amostral da ordem de 20 vezes o nmero de variveis envolvidas (ver Hair
et al., 1995, p.373). Reis (1997, p. 274) e Hair et al. (1995, p. 373) sugerem que o
nmero de observaes deva ser de no mnimo 5 vezes o nmero de variveis, alm
disso, indicam que preferencialmente a anlise seja feita com pelo menos 100
observaes. Hair et al. (1995) enfatiza que ela no deve ser utilizada em amostras
inferiores a 50 observaes.
O sucesso de uma AF est diretamente ligado aos objetivos iniciais do pesquisador; por
exemplo, se a inteno a simples reduo do nmero de variveis, ela ser bem-
sucedida se for possvel determinar um pequeno conjunto de fatores, que consiga
explicar uma parte considervel da variabilidade do conjunto original de variveis. De
qualquer modo, h algumas propriedades que so desejveis para a soluo de uma AF:
b. variveis com uma fraca interdependncia por exemplo, considere uma escala
composta por itens, em que cada item mede um aspecto diferente do construto de
interesse, nesse caso possvel que uma AF no consiga identificar fatores com um grau
razovel de interpretabilidade. Hair et al. (1995) discutem que para o sucesso de uma
AF necessrio que exista um nmero razovel de correlaes superiores (em mdulo)
a 30%, caso contrrio a estrutura de interdependncia ser muito tnue para produzir
resultados satisfatrios;
O que foi dito at este ponto, aplica-se a uma modalidade de AF que poderia ser
denominada exploratria. Uma AF exploratria (AFE) no exige a formulao de
hipteses a priori a respeito da estrutura de dependncia dos dados. Essa estrutura, se
existir, ser um dos resultados da AFE.
O que diferencia uma AFE de uma AFC que na segunda o usurio indica que estrutura
ele imagina existir nos dados e, atravs da aplicao da tcnica, ter indcios objetivos
para concluir se aquela estrutura ou no aceitvel para explicar o comportamento dos
dados. Trata-se de uma tcnica mais elaborada que, por si s, j mereceria um texto
especfico. Um livro introdutrio sobre esse assunto mencionado em Long (1983).
CONCLUSO
NOTAS
2. cabe ressaltar que a rigor a AF e a anlise de componentes principais (ACP) so tcnicas multivaridas
distintas e com objetivos diferentes. A ACP, desenvolvida por Pearson em 1901, nada mais do que uma
tcnica de transformao de variveis; a partir de um conjunto de p variveis de interesse, cria-se um
novo conjunto p de variveis (componentes principais), de tal modo que a primeira componente seja
aquela com maior varincia possvel dentre todas as possveis combinaes lineares das variveis
originais, e os demais componentes so ordenados em termos de sua variabilidade. A AF apenas utiliza o
mtodo numrico da CP para a obteno dos fatores
volta ao texto
4. trata-se de uma estrutura composta pelas correlaes entre as variveis duas a duas, no caso da matriz
de correlao, ou pelas covarincias e varincias das variveis envolvidas, no caso da matriz de
covarincia
volta ao texto
5. valor arbitrrio
volta ao texto
REFERNCIAS
Burt, C. The Vector of the Mind: An Introduction to Factor Analysis in Psychology. Mc.Millan, New
York, 1941.
Hair, J.F.Jr.; Anderson, R.E.; Tatham, R.L. e Black, W.C. Multivariate Data Analysis (with
readings), 4 ed. Prentice Hall, Englewood Cliffs, 1995.
Johnson, R.A. e Wichern, D.W. Applied Multivariate Statistical Analysis. Prentice Hall, Englewood
Cliffs, 1992.
Kaiser, H.F. The Varimax Criterion for Analytic Rotation in Factor Analysis. Psychometrika 23:187-
200,1958.
Lawley, D.N. The Estimation of Factor Loadings by the Method of Maximum Likelihood. Proceedings
of the Royal Society of Edinburg, A, 60:331-338,1940.
Long, J.S. Confirmatory Factor Analysis. Sage Pub., Beverly Hills, 1983.
Reyment, R. e Jreskog, K.G. Applied Factor Analysis in the Natural Sciences. Cambridge University
Press, Cambridge, 1996.
Spielberger, C.D.; Gorsuch, R.L. e Lushene, R.E. Manual for the State-Trait Anxiety Inventory.
Consulting Psychologist Press, Palo Alto, 1970.
Thurstone, L.L. The Vectors of Mind. Univ. Chicago Press, Chicago, 1935.
Thurstone, L.L. Multiple Factor Analysis. Univ. Chicago Press, Chicago, 1947.
Revista
de
Psiquiatria
1. Departamento de Estatstica, Instituto de Matemtica e Estatstica,
Universidade de So Paulo
Clnica