You are on page 1of 29

Universidade de Braslia - Instituto de Psicologia

Programa de Ps-graduao em Psicologia Social, do Trabalho e das Organizaes.


Segundo Perodo Letivo de 2008
Disciplinas: Anlises Multivariadas e Regresso Mltipla

Roteiro para Anlise Fatorial de Dados


Elaine Rabelo Neiva
Gardnia Abbad
Bartholomeu T. Trccoli

Objetivo: O objetivo do presente trabalho descrever a rotina de comandos para realizao


de uma Anlise Fatorial utilizando o software SPSS, verso 13.0.

Antes de qualquer anlise estatstica necessrio realizar uma anlise


exploratria dos dados coletados. Esta anlise tem duas finalidades principais:
(1) descrever e explorar as caractersticas principais dos resultados sem uma
preocupao exclusiva com os objetivos ou hipteses do trabalho (o que no
significa que no possam ocorrer conjuntamente), e (2) investigar se um
conjunto de pressupostos estatsticos est presente nos dados. Neste ltimo
caso, verifica-se o ajustamento entre o conjunto de dados e pressupostos
estatsticos fundamentais para o uso correto das diversas tcnicas estatsticas
(normalidade de distribuio das variveis, presena de casos extremos,
homoscedasticidade, multicolinearidade, entre outros). Neste texto temos o
objetivo (2) como nossa atividade principal. Para tanto, vamos utilizar o banco
de dados fornecido no livro de Hair, Anderson, Tatham e Black denominado
HBAT Fatorial. Na figura abaixo est uma reproduo parcial desse banco de
dados.
Figura 1.0 Ilustrao do banco HBAT fatorial

So as seguintes as variveis relacionadas no arquivo de dados:

Definies e codificao das variveis


Nome Rtulo
JS1 All things considered, I feel very satisfied when I think about my job.
OC1 My work at HBAT gives me a sense of accomplishment.
OC2 I am willing to put in a great deal of effort beyond that normally
expected to help HBAT be successful.
EP1 I am very comfortable with my physical work environment at HBAT.
OC3 I have a sense of loyalty to HBAT.
OC4 I am proud to tell others I work for HBAT.
EP2 The place I work in is designed to help me do my job better.
EP3 There are few obstructions to make me less productive in my workplace.
SI1 I am not actively searching for another job.
SI2 I seldom look at the job listings on monster.com.
SI3 I have no interest in searching for a job in the next year.

PARTE 1 - ASPECTOS BSICOS DE ANLISE FATORIAL

CONCEITOS BSICOS
Certos conceitos das cincias sociais e comportamentais no so bem
definidos e h muitas discusses a respeito do real significado de termos como
inteligncia, personalidade, grupo social, equipes, personalidade extrovertida,
entre outros. Esses conceitos, na linguagem tcnica dos pesquisadores, so
transformados em construtos que apiam a construo de medidas, as quais, em
modelos estatsticos de investigao, freqentemente transformam-se em
variveis latentes.

Os conceitos utilizados nas cincias sociais geralmente no so tratados


como nomes de objetos, entidades ou fenmenos. Referem-se, isto sim, a um
grande nmero de disposies, caractersticas ou indicadores, os quais esto
sujeitos a variaes ao longo do tempo e das situaes. Muitos construtos so
definidos pelo pesquisador com o intuito de apoi-lo na criao de medidas de
interesse. As medidas possuem geralmente muitos exemplos que ilustram o
construto e, em situaes como as de aplicao de um teste de inteligncia ou
de personalidade, h muitos itens componentes em cada dimenso ou categoria
de contedo em foco. As variveis observadas dizem respeito aos dados empricos
obtidos pelo pesquisador. As variveis latentes so aquelas que se referem ao
construto e que resumem os achados provenientes das variveis observadas.
Nesse sentido, variveis latentes no so observadas diretamente.

Fica claro, nesse contexto, que os conceitos so transformados em


linguagem tcnica para apoiar a construo de medidas para investigao
emprica. Assim, se quisermos avaliar o preconceito racial de uma amostra de
pesquisadores e professores universitrios, teremos que definir preconceito
racial, de acordo com a literatura cientfica, a situao e o contexto da pesquisa,
observaes da realidade e dados pr-existentes a respeito do assunto.

Para medir o nvel de preconceito racial ser preciso construir medidas ou


buscar medidas existentes que relacionem um conjunto de indicadores,
comportamentos, atitudes, crenas e valores observveis e associados ao que
definimos como preconceito racial. O conceito denominado preconceito racial,
portanto, no medido diretamente. O que se faz , por exemplo, observar
quando uma pessoa aprova, ou no, alguma legislao do governo a respeito
deste assunto. Pode-se, tambm, saber de que raa so os amigos desta pessoa e
assim assumir que tais observaes so, de algum modo, indicadores de uma
varivel mais fundamental, o preconceito racial (Everitt, 1984). Alm disto,
pode-se perguntar a ele a respeito de suas atitudes em relao ao casamento de
familiares com pessoas oriundas de outras etnias, entre outros itens e situaes.

As medidas provenientes de constructos so geralmente compostas por


inmeros itens ou indicadores, o que torna complexas as explicaes dos dados
relativos aos fenmenos de interesse. Em psicologia, por exemplo, testes e
escalas costumam conter mais de cem itens!!! Como descrever de modo resumido
o perfil de uma grande amostra em todos esses quesitos? Como seria possvel
resumir essa grande quantidade de informaes?
Para obter descries parcimoniosas, nesse caso, adota-se um conjunto de
tcnicas estatsticas denominadas genericamente de Anlise Fatorial, que
investiga a dependncia de um conjunto de variveis manifestas (observadas) em
relao a um nmero menor de variveis latentes, os fatores. A anlise fatorial
uma tcnica de anlise estatstica multivariada muito utilizada por
pesquisadores, principalmente por psicometristas. Quando empregamos esse tipo
de anlise estamos freqentemente interessados no comportamento de uma
varivel ou grupos de variveis em covariao ou correlao com outras
variveis.

Na verdade, a anlise fatorial no se refere a uma nica tcnica


estatstica, mas a uma variedade de tcnicas utilizadas para facilitar a
interpretao dos dados observados diretamente. Isto feito analisando-se os
inter-relacionamentos entre as variveis observadas, de tal modo que estas
possam ser descritas convenientemente por um conjunto menor de categorias de
contedo, chamado fatores. Assim, o objetivo da anlise fatorial a parcimnia,
procurando definir o relacionamento entre as variveis de modo simples e usando
um nmero de fatores menor que o nmero original de variveis.

Mais precisamente, um fator um construto, uma entidade hipottica,


uma varivel no observada diretamente que se supe estar subjacente s
respostas das pessoas a testes, escalas, itens ou a conjunto de indicadores de um
determinado fenmeno. Como construtos, os fatores apenas explicam a
varincia de variveis observadas, tal como se revelam pelas correlaes entre as
variveis analisadas, ou seja, a nica realidade cientfica que os fatores possuem
provm das correlaes entre respostas a testes ou ao comportamento de
mltiplas variveis pesquisadas. Para que um fator seja detectado numa matriz
de respostas a um teste ou numa matriz de dados econmicos, preciso que
existam correlaes entre as variveis observadas que compem essas matrizes.
No caso dos testes psicolgicos, as respostas das pessoas aos itens devem estar
correlacionadas entre si. No caso do conjunto de variveis econmicas, esses
indicadores teriam que estar correlacionados para que se possa supor fator(es)
subjacente(s) a eles.

A anlise fatorial faz redues de dados inicialmente mais complexos a


um conjunto de tamanho manusevel para que o pesquisador possa interpretar
mais facilmente os resultados (Kerlinger,l980). Alm disto, a anlise fatorial
calcula as cargas fatoriais. Uma matriz de cargas fatoriais um dos produtos
finais da anlise fatoriaI. Uma carga fatorial um coeficiente, um nmero
decimal, positivo ou negativo, geralmente menor do que 1(um), que expressa o
quanto uma pergunta ou varivel observada est carregada de um fator. Em
outras palavras, quanto maior for a carga de um item em um fator, mais a
varivel representa esse fator (varivel latente).

Em sntese, a anlise fatorial essencialmente um mtodo para


determinar o nmero de fatores existentes em um conjunto de dados, para
determinar quais testes ou variveis pertencem a quais fatores, e em que
extenso os testes ou variveis pertencem a/ou esto saturados no fator
subjacente.

QUESTES PRTICAS E PRESSUPOSTOS DA ANLISE FATORIAL

Tamanho da Amostra e Dados Ausentes

H controvrsias quanto ao tamanho adequado da amostra para a realizao de


anlise fatorial. Uma questo chave diz respeito ao fato de que amostras
pequenas prejudicam a significncia das correlaes. Alguns autores falam em
amostras superiores a 100 ou 300 casos, contudo o nmero de itens componentes
da medida deve ser considerado. Entre 5 a 10 casos por item um nmero
considero aceitvel para a amostra da anlise fatorial.

Entretanto, no caso de grandes amostras, (no fique triste!), h a necessidade de


trabalhar vrias sub-amostras. Com elas ser possvel realizar anlises fatoriais
com vrias amostras menores, escolhidas aleatoriamente no arquivo de dados,
para comparar seus resultados, tcnica denominada validao cruzada.

Dados ausentes so prejudiciais porque diminuem o tamanho da amostra e


prejudicam ou falsificam as correlaes. A substituio por nmeros estimados
tambm pode criar correlaes ilusrias.

Normalidade

A anlise fatorial relativamente robusta a violaes de normalidade, contudo a


normalidade multivariada importante para a realizao da anlise. Como
difcil a deteco de problemas desse tipo, faz-se necessrio procurar assegurar
que as variveis individualmente apresentem uma distribuio normal.

Linearidade

A Anlise fatorial baseada no pressuposto de que os relacionamentos entre as


variveis so lineares. O procedimento da transformao poder ser usado para
eliminar varivel(is) que estiver(em) produzindo relacionamentos no lineares
com outras variveis. Para evitar multicolinearidade e singularidade, necessrio
eliminar as variveis muito correlacionadas entre si.
Outliers nos Casos e nas Variveis

Os casos de outliers produzem impacto na matriz de correlaes por diminuir ou


ampliar a magnitude dos coeficientes de correlaes. Variveis que apresentam
dados muito dspares tendem a apresentar resultados pobres, isto , so
excludas dos fatores, por no atingirem carga fatorial mnima em nenhum fator.

Multicolinearidade e Singularidade

Algum nvel de multicolinearidade desejvel uma vez que a anlise


fatorial trabalha com a matriz de correlaes. A multicolinearidade menos
problemtica na anlise dos componentes principais do que na anlise fatorial
pela necessidade de inverso da matriz para os clculos. Em geral, PCA (anlise
de componentes principais) uma tcnica distinta da Anlise Fatorial. Ela
utilizada quando se procura obter combinaes lineares no correlacionadas. PCA
transforma um conjunto de variveis correlacionadas em um conjunto de
componentes no correlacionados (componentes principais).

Fatorabilidade da matriz

O primeiro passo nas anlises a verificao da fatorabilidade da matriz de


correlaes de cada amostra, pois se as variveis no tm varincia em comum, a
anlise fatorial no faz sentido. Para verificar a fatorabilidade da matriz de
correlaes das duas amostras, vrios procedimentos precisam ser executados:
(1) inspeo da matriz de correlaes; (2) verificao do determinante da
matriz; e (3) clculo do ndice de adequao da amostra de Kaiser-Meyer-Olkin
(KMO).

Para a inspeo da matriz de correlaes devem ser seguidas as recomendaes


de Clark e Watson (1995) e Pasquali (1998), considerando o vasto tamanho da
matriz de intercorrelaes (2.154 correlaes inter-item) pelo clculo da mdia
aritmtica das correlaes inter-item. A inspeo visual da matriz indica que 50%
das correlaes devem assumir valores superiores a 0.30. Outro indicador da
fatorabilidade da matriz provm do clculo do determinante da matriz, que
precisa apresentar valores baixos, porm diferentes de zero. A partir dessas
anlises, pode-se concluir quanto pertinncia da fatorao da matriz. O clculo
do ndice de adequao da amostra, o KMO, tambm revela a possibilidade de
fatorabilidade do instrumento. Em geral, importante que o KMO seja superior a
0,80.
Confiabilidade e Validade em Anlise Fatorial

Qualquer conjunto de medidas tem uma varincia total. Na realidade, ao


obtermos um conjunto de nmeros a partir de uma srie de medidas, pode-se
calcular a mdia, o desvio padro e a varincia. Em geral, a varincia obtida a
varincia total, visto englobar varincia verdadeira (sistemtica) e a varincia de
erro (aleatria).

A definio de confiabilidade est centrada no grau de repetio e na


consistncia de medidas empricas. Uma medida confivel quando, ao ser
repetida, tem consistncia, ou seja, outros investigadores chegaro, em qualquer
medio, aos mesmos resultados.

Por outro lado, quando um teste medir coisas em comum com outros testes,
aparecer a chamada varincia compartilhada, ou varincia de fator comum, V co.
Caso um teste mea algo que outro no consiga, tem-se a varincia especifica
deste, Vesp. Teremos assim as varincias de fator comum, a varincia especfica e,
ainda, a varincia do erro.

O foco de ateno na avaliao da confiabilidade est no erro aleatrio. Caso no


existam erros envolvidos na medida de um determinado construto, a
confiabilidade ser igual a 1,0. A confiabilidade ir decrescer na medida em que
cresa a proporo de erro aleatrio, ou seja, a confiabilidade inversamente
proporcional ao erro aleatrio contido no processo de medio. Do ponto de vista
matemtico usual decompor a varincia total de uma medida.

De particular importncia na anlise fatorial, a validade do construto est


associada ao fato de um pesquisador acreditar que o seu instrumento de medio
reflete um construto particular ao qual esto relacionados certos conceitos. A
validade do construto avaliada em um dado contexto terico e, de modo
especfico, centra-se sobre a avaliao de quanto uma medida particular
relaciona-se com outras medidas de forma consistente com as hipteses tericas
derivadas e que dizem respeito aos conceitos (ou construtos) sendo medidos.

A validao do construto envolve trs etapas:

a - Especificar as relaes tericas entre os conceitos.

b- Examinar o relacionamento emprico entre as medidas dos conceitos.

c- Interpretar a evidncia emprica que possa aparecer em termos de


como ela clarifica a validade do construto particular sendo medido.

De acordo com a lgica da validade do construto, se um conceito A se relacionar


teoricamente com um conceito B, os indicadores que so escolhidos para refletir
(ou medir) tais conceitos devero se relacionar empiricamente. Caso os
indicadores de um conceito A se relacionarem diferentemente em relao aos
indicadores de um conceito B, existe a evidncia de que estes indicadores no
refletem um nico conceito.

O procedimento estatstico da anlise fatorial permite, com o uso de amostras


adequadas, por meio da diminuio da varincia do erro, e da escolha criteriosa
dos indicadores dos construtos a serem investigados, a identificao adequada
dos fatores e das cargas fatoriais.

Representao Geomtrica da Anlise Fatorial

Imaginando testes ou variveis como pontos num espao de N dimenses,


podemos verificar que as variveis que estejam alta e positivamente
correlacionadas entre si estaro prximas umas das outras neste espao e
afastadas daquelas com as quais no se relacionam. Apareceriam, deste modo,
enxames de pontos no espao. Cada um destes pontos poderia ser localizado no
espao caso eixos adequados fossem inseridos no mesmo, um eixo para cada uma
das N dimenses. Assim, o problema da anlise fatorial seria projetar eixos
atravs dos enxames de pontos vizinhos, de modo a alocar estes eixos de forma a
levar em conta, as varincias das variveis (Kerlinger,1986).

A posio ideal destes eixos no espao, a posio tima e nica, que caracteriza
a parcimnia mencionada anteriormente e almejada pela metodologia, seria
obtida por meio das rotaes dos eixos. Enfatiza-se que estas rotaes preservam
a comunalidade (o que h de comum entre os itens).
Factor Plot in Rotated Factor Space

1,0
OC4
OC1
OC2
OC3
0,5

JS1 EP2
es
Pr

gi

EP3
o
t

SI1
0,0
EP1 SI2
SI3

-0,5

-1,0

-1,0 -0,5 0,0 0,5 1,0

Renda Famliar

Para exemplificar, tomemos emprestado um exemplo citado em Lohnes e Cooley


(1971). Neste exemplo, um pesquisador est investigando respostas de um
questionrio relativo a status scio-econmico de famlias. Sejam ento X e Y
duas variveis tais como renda familiar e grau de prestgio da profisso do chefe
da famlia. Os valores de X e de Y para uma amostra de N famlias so plotados
em um grfico.

A elipse representada nesta figura contm o aspecto geral do enxame bivariado


de pontos que resultar da plotagem das respostas das N famlias. As variveis X
e Y apresentam uma alta correlao positiva neste caso

O objetivo do pesquisador consiste em produzir um escore composto que mea o


que essas variveis possuem em comum, buscando o mximo de varincia entre
as famlias. Isto pode ser conseguido projetando todos os pontos
perpendicularmente sobre o eixo principal da elipse, procedimento batizado de
anlise das componentes principais.
Como j mencionamos, uma das possibilidades do uso da anlise fatorial consiste
em reduzir a dimensionalidade de um conjunto de variveis aproveitando a
vantagem das suas intercorrelaes. Assim, diversas variveis podem ser
reduzidas a, por exemplo, duas dimenses, bastando determinar os eixos I e II de
um hiper-elipside. Ao longo do eixo I busca-se a mxima varincia. Constri-se,
depois, um segundo eixo, o eixo II, ao longo do qual maximiza-se a varincia
remanescente. O segundo eixo inicialmente perpendicular, contudo, conforme
se escolhe o nmero de fatores e se escolhe as opes de rotao, ele pode ser
ortogonal ou assumir outras posies.

De um modo geral, a determinao dos fatores possibilita agregar variveis no


espao a fim de reduzi-las a umas poucas dimenses. Em torno de cada eixo
coordenado neste espao estaro agrupadas variveis de mesma natureza. Um
vetor projetado neste espao m, de dimensionalidade menor, possui magnitude
tambm menor. O comprimento de um vetor nesse espao ser dado pela raiz
quadrada da comunalidade hj2 da varivel (HARMAN,1976).

Rotao dos Eixos

O desenvolvimento dos computadores ensejou o aparecimento de uma srie de


programas que realizam rotaes de eixos tanto ortogonais (perpendiculares)
como oblquas (assume outras posies) , empregando critrios como o VARIMAX,
o QUARTIMAX e outros descritos na literatura especializada (HARMAN,1976). A
rotao ortogonal permite que os eixos sejam perpendiculares, o que favorece a
inexistncia de correlao entre fatores. A rotao oblqua permite a existncia
de correlao entre os fatores, o que retratado graficamente por posies dos
eixos mais prximas. Merece ser mencionado que a rotao oblqua possue dois
pontos essenciais:

A rotao oblqua permite que os fatores possam mostrar mais


corretamente grupos de variveis inter-correlacionadas, embora tornando
as operaes matemticas bem mais complexas.
No mundo real as dimenses esto correlacionadas umas com as outras e,
assim, a rotao oblqua estar mais prxima da realidade.

Por outro lado, existem algumas desvantagens acentuadas no uso das rotaes
oblquas. As comunalidades das variveis no podem ser computadas diretamente
a partir dos carregamentos oblquos, uma vez que a soma dos carregamentos
fatoriais ao quadrado pode ser maior do que 1,00. Aparecem ainda, nas rotaes
oblquas, dois conjuntos de carregamentos fatoriais, as chamadas matrizes
padro e de estrutura, tornando mais difcil a interpretao dos citados
carregamentos fatoriais. Cabe realar, entretanto, que o objetivo maior da
pesquisa a parcimnia, a identificao de agrupamentos distintos e separados
de variveis, e neste sentido somos mais bem servidos pelas rotaes ortogonais
(Zeller e Carmines, 1980).

No entanto, como acentua Rummel (1970) no necessrio escolher entre um ou


outro tipo de rotao devido s facilidades proporcionadas pelos modernos
programas computacionais nossa disposio. Podem-se tentar ambos os
mtodos e escolher um deles. Mais ainda, freqentemente os resultados no iro
diferir substancialmente caso se use uma rotao oblqua ou uma ortogonal.

PARTE 2 ROTINAS DE ANLISE FATORIAL NO SPSS

Para realizao da anlise fatorial, inicialmente faz-se uma inspeo da matriz e


das possibilidades de fatorabilidade por meio de anlise dos componentes
principais. Para isto, necessrio proceder os seguintes comandos, conforme
indicado na Figura 1.1:
Analyse
Data Reduction
Factor

Figura 1.1 Comandos iniciais

A Extrao dos componentes principais (PCA)...

Inicialmente faz-se uma extrao dos componentes principais para verificar a


fatorabilidade da matriz e as indicaes de possveis fatores existentes. Ao abrir
a janela apresentada na Figura 1.2, passe todas as variveis mtricas relativas ao
questionrio de comprometimento organizacional no espao indicado direita.
Escolha a opo Descriptives para solicitar a verificao da matriz.

Figura 1.2 Janela Factor Analysis

Aps selecionar a janela, marque na tela apresentada na Figura 1.3, as opes


Inicial Solution, Determinant, KMO e Bartletts test of sphericity, Reproduced
e Anti-image. Aps marcar essas opes, clique em Continue.

Figura 1.3 Janela Factor Analysis Descriptives

Ao retornar para a janela da Figura 1.1, selecione a opo Extraction. Ao abrir a


janela da figura 1.4, deixar o mtodo Principal Components e marcar as opes
Correlation matrix, Unrotated factor solution, Scree plot. Clique em Continue.
Figura 1.4 Janela Factor Analysis Extraction

Retornando janela da Figura 1.1, selecione a opo Options. Ao abrir a janela


da Figura 1.5, deixar a opo Listwise e marcar a opo Suppress absolute
values less than, indicando o ponto de corte desejado para as cargas fatoriais.
Aqui sugerimos 0.30, ou seja, somente as cargas fatoriais maiores do que 0,30
sero consideradas. Alm disso, escolha a opo Sorted by Size que organizar os
itens dentro dos fatores em ordem decrescente de cargas fatoriais. Aps
selecionar essas opes, clique em Continue.

Figura 1.5. Janela Factor Analisys Options

A partir daqui, sero indicadas as sadas do SPSS a serem analisadas, contudo,


algumas tabelas no sero reproduzidas aqui.

PARTE 3 - ANLISE DAS TABELAS DE RESULTADOS DA ANLISE DOS


COMPONENTES PRINCIPAIS

A primeira tabela a ser analisada a matriz de correlaes entre as variveis


observadas. Na Correlation Matrix preciso examinar a magnitude dos
coeficientes de correlaes para verificar se pelo menos a metade deles
superior a 0.30. Quanto maior a quantidade de correlaes superiores a 0,30,
mais fatorvel a matriz. Observe as correlaes abaixo ou acima da diagonal da
matriz, formada por coeficientes de valor 1.00 (correlaes de cada varivel com
ela prpria). Para se obter a mdia das correlaes pode-se passar os dados para
o Excel e solicitar as mdias. A mdia das correlaes precisa ultrapassar o ndice
de 0.50 para que possamos considerar a matriz fatorvel. A matriz aqui analisada
possui muitas correlaes com coeficientes superiores a 0.30, indicando que a
matriz fatorvel.

Correlation Matrixa

OC2 - I am
willing to put
JS1 - All in a great deal EP1 - I am EP3 - There
things of effort very are few
considered, I OC1 - My work beyond that comfortable EP2 - The obstructions SI3 - I have
feel very at HBAT gives normally with my OC3 - I have OC4 - I am place I work in to make me SI1 - I am not SI2 - I seldom no interest in
satisfied me a sense of expected to physical work a sense of proud to tell is designed to less actively look at the job searching for
when I think accomplishm help HBAT be environment loyalty to others I work help me do productive in searching for listings on a job in the
about my job. ent. successful. at HBAT. HBAT. for HBAT. my job better. my workplace. another job. monster.com. next year.
Correlation JS1 - All things considered, I feel very satisfied when I think
1,000 ,061 ,141 ,065 ,158 ,161 ,123 ,103 ,114 ,115 ,047
about my job.
OC1 - My work at HBAT gives me a sense of
,061 1,000 ,524 ,112 ,444 ,484 ,229 ,122 ,182 ,189 ,135
accomplishment.
OC2 - I am willing to put in a great deal of effort beyond that
,141 ,524 1,000 ,252 ,558 ,738 ,373 ,348 ,432 ,473 ,362
normally expected to help HBAT be successful.
EP1 - I am very comfortable with my physical work
,065 ,112 ,252 1,000 ,236 ,279 ,596 ,504 ,342 ,371 ,329
environment at HBAT.
OC3 - I have a sense of loyalty to HBAT. ,158 ,444 ,558 ,236 1,000 ,566 ,370 ,315 ,226 ,280 ,201
OC4 - I am proud to tell others I work for HBAT. ,161 ,484 ,738 ,279 ,566 1,000 ,378 ,290 ,379 ,386 ,303
EP2 - The place I work in is designed to help me do my job
,123 ,229 ,373 ,596 ,370 ,378 1,000 ,614 ,349 ,390 ,347
better.
EP3 - There are few obstructions to make me less
,103 ,122 ,348 ,504 ,315 ,290 ,614 1,000 ,293 ,323 ,299
productive in my workplace.
SI1 - I am not actively searching for another job. ,114 ,182 ,432 ,342 ,226 ,379 ,349 ,293 1,000 ,733 ,580
SI2 - I seldom look at the job listings on monster.com. ,115 ,189 ,473 ,371 ,280 ,386 ,390 ,323 ,733 1,000 ,625
SI3 - I have no interest in searching for a job in the next
,047 ,135 ,362 ,329 ,201 ,303 ,347 ,299 ,580 ,625 1,000
year.
a. Determinant = ,010

A Tabela seguinte mostra o KMO e o Teste de Esfericidade de Bartletts.


Valores do KMO prximos de 1 indicam que a matriz fatorvel. O teste de
esfericidade de Bartlett usado para testar a hiptese de que a matriz
correlacional no uma matriz identidade, isto , no uma matriz onde todos
os elementos da diagonal so iguais a 1 e o restante dos coeficientes da matriz
iguais a zero. No quadro abaixo, o valor do teste de esfericidade de Bartlett
grande (valor este baseado numa transformao qui-quadrado do determinante
da matriz correlacional) e corresponde a um nvel de significncia pequeno,
indicando uma baixa probabilidade de que a matriz populacional seja uma matriz
identidade. Se o nvel de significncia observado muito grande, a hiptese de
que a matriz correlacional populacional uma matriz identidade no pode ser
rejeitada e recomenda-se reconsiderar o uso da anlise fatorial.
A medida geral de adequao de amostra Kaiser-Meyer-Olkin (tambm
apresentada no quadro acima) uma medida geral representativa das
comparaes entre os coeficientes de correlao simples e os coeficientes de
correlao parcial. Quanto maior for o coeficiente de correlao parcial, maior o
indicativo de que as respectivas variveis compartilham um fator em comum. As
correlaes parciais so estimativas das correlaes entre fatores nicos e devem
ser bem elevadas quando os pressupostos da anlise fatorial so preenchidos.
Se a soma dos quadrados dos coeficientes de correlao parcial entre
todos os pares de variveis pequena, quando comparada soma dos quadrados
dos coeficientes de correlao simples, ento a medida KMO geral assume um
valor prximo de 1. Pequenos valores para a medida KMO indicam que a anlise
fatorial das variveis pode no ser uma boa idia, j que as correlaes entre
pares de variveis no podem ser explicadas pelas outras variveis. Resultados da
medida KMO acima de .90 so classificados de maravilhosos, acima de .80 de
meritrios, na faixa dos .70 de moderados, na faixa dos .60 de medocres, na
faixa dos .50 de miserveis e abaixo de .50 de inaceitveis. O valor da medida
estatstica KMO para as variveis do exerccio encontra-se no quadro acima e
classifica-se como meritrio.

KMO and Bartlett's Test


Kaiser-Meyer-Olkin Measure of Sampling
Adequacy. ,846

Bartlett's Test of Approx. Chi-Square 1831,864


Sphericity df 55
Sig. ,000

Ainda possvel analisar a Anti-image Matrix para verificao da fatorabilidade


da matriz, cujos dados no foram reproduzidos aqui neste roteiro. interpretada
a partir dos valores constantes na diagonal. Estes valores devem ser pequenos
(poderia ser utilizada a mesma interpretao do KMO, de forma invertida), para
que a matriz R seja considerada fatorvel. Esses valores indicam os valores das
correlaes parciais entre pares de variveis, com os efeitos das outras variveis
removidos. Se R fatorvel, a maioria desses valores pequena.

A Tabela a seguir mostra os valores das comunalidades. As Comunalidades


Indicam o ndice de regresso da varivel, considerando cada uma delas uma VD
e as outras como VIs. Valores extremos (0 - 1) indicam problema. Em outras
palavras, os valores de comunalidade correspondem soma dos quadrados das
cargas da VI em todos os componentes. Indica a varincia comum entre a varivel
sendo analisada e as demais.
Communalities

Initial Extraction
JS1 - All things
considered, I feel very
1,000 ,066
satisfied when I think
about my job.
OC1 - My work at HBAT
gives me a sense of 1,000 ,610
accomplishment.
OC2 - I am willing to put in
a great deal of effort
beyond that normally 1,000 ,769
expected to help HBAT be
successful.
EP1 - I am very
comfortable with my
1,000 ,683
physical work
environment at HBAT.
OC3 - I have a sense of
1,000 ,639
loyalty to HBAT.
OC4 - I am proud to tell
1,000 ,731
others I work for HBAT.
EP2 - The place I work in
is designed to help me do 1,000 ,759
my job better.
EP3 - There are few
obstructions to make me
1,000 ,706
less productive in my
workplace.
SI1 - I am not actively
1,000 ,780
searching for another job.
SI2 - I seldom look at the
job listings on monster. 1,000 ,807
com.
SI3 - I have no interest in
searching for a job in the 1,000 ,695
next year.
Extraction Method: Principal Component Analysis.

Neste exemplo, no h valores extremos, indicando que no h problemas com as


comunalidades.
Para realizar estimativas iniciais do nmero de fatores, recorre-se
Anlise dos Componentes Principais. A proporo de varincia explicada pelos
fatores comuns, ou a comunalidade de uma varivel, 1 para todas as variveis.
Em geral, PCA uma tcnica distinta da Anlise Fatorial. Ela utilizada quando
se procura obter combinaes lineares no correlacionadas. PCA transforma um
conjunto de variveis correlacionadas em um conjunto de componentes no
correlacionados (componentes principais).
Na tabela seguinte, denominada Total Variance Explained, observa-se a
quantidade de Valores prprios ou autovalores (Eigenvalues) maiores do que 1.
Outro exame a varincia explicada pelo fator, que deve ser de, no mnimo, 3%.
Eigenvalues so a soma da coluna de cargas fatoriais ao quadrado para um fator;
tambm conhecido como raiz latente. Representa a quantia de varincia
explicada por um fator. Pela varincia explicada teramos nove fatores no
exemplo em anlise. J a anlise dos eigenvalue indica a existncia de trs
fatores.
Para ajudar na escolha do nmero de fatores necessrios para representar os
dados, deve-se examinar a porcentagem da varincia total que explicada por
cada fator. A varincia total a soma da varincia de cada varivel. Por uma
questo de simplicidade, todas as variveis e fatores so expressos em forma
padronizada, com mdia 0 e desvio padro 1.

No quadro seguinte, denominado Total Variance Explained, observa-se a


quantidade de valores prprios ou autovalores (Eigenvalues) maiores do que 1.
Outro exame a varincia explicada pelo fator, que deve ser de, no mnimo, 3%.
Eigenvalues so a soma em coluna de cargas fatoriais ao quadrado para um fator;
tambm conhecido como raiz latente.
Total Variance Explained

Initial Eigenvalues Extraction Sums of Squared Loadings


Component Total % of Variance Cumulative % Total % of Variance Cumulative %
1 4,462 40,567 40,567 4,462 40,567 40,567
2 1,552 14,111 54,677 1,552 14,111 54,677
3 1,232 11,198 65,876 1,232 11,198 65,876
4 ,971 8,828 74,703
5 ,555 5,043 79,747
6 ,487 4,428 84,175
7 ,467 4,248 88,423
8 ,425 3,860 92,283
9 ,348 3,164 95,448
10 ,272 2,469 97,917
11 ,229 2,083 100,000
Extraction Method: Principal Component Analysis.

A inspeo do grfico denominado Scree plot ajuda o pesquisador a decidir a


respeito do nmero de componentes que caracteriza a estrutura emprica da
escala. A anlise do Scree Plot indica aproximadamente 2 componentes. Deve-se
observar o ponto no qual a curva desacelera, formando um cotovelo, alm do
qual os demais componentes ficam lado-a-lado, quase numa linha horizontal,
paralela ao eixo dos X - nmero de componentes.
5
4
S
c
reP
lo
t
Elu
a
n
v
ig
ee 3
2
1
01234C
o
m
p
o
n
e
tN
5
6u
m
b
e
r89101
7
Component Matrix Indica a contribuio da varincia de cada VI em cada
componente.

Compone nt Matrixa

Component
1 2 3
JS1 - All things
considered, I feel very
satisfied when I think
about my job.
OC1 - My work at HBAT
gives me a sense of ,493 ,604
accomplishment.
OC2 - I am willing to put in
a great deal of effort
beyond that normally ,775 ,392
expected to help HBAT be
successful.
EP1 - I am very
comfortable with my
,595 -,384 ,426
physical work
environment at HBAT.
OC3 - I have a sense of
,631 ,466
loyalty to HBAT.
OC4 - I am proud to tell
,736 ,433
others I work for HBAT.
EP2 - The place I work in
is designed to help me do ,698 ,472
my job better.
EP3 - There are few
obstructions to make me
,613 ,512
less productive in my
workplace.
SI1 - I am not actively
,693 -,320 -,444
searching for another job.
SI2 - I seldom look at the
job listings on monster. ,733 -,317 -,410
com.
SI3 - I have no interest in
searching for a job in the ,632 -,382 -,387
next year.
Extraction Method: Principal Component Analysis.
a. 3 components extracted.
Esses indicadores so usados para decidir qual o nmero de fatores dever ser
extrado. Outra anlise possvel a anlise paralela, tambm disponvel no SPSS
(ver sintaxe postada no moodle na seo destinada anlise fatorial). Na Anlise
Paralela, os eigenvalues de uma matriz de correlao de dados aleatrios so
comparados com os da matriz emprica, calculada pela anlise dos componentes
principais com os dados observados na pesquisa. Esse procedimento de
comparao dos eigenvalues focaliza a magnitude de varincia explicada pelos
componentes.

Saiba mais a respeito da escolha do nmero de componentes:


Segundo Reise, Waller e Comrey (2000), pertinente reter um fator apenas na medida em que este explica maior
varincia do que o fator correspondente nos dados aleatrios. Assim, no momento em que o valor do eigenvalue dos
dados aleatrios superior ao dos dados empricos, no mais adequado reter esse fator. Para identificar o valor
dos eigenvalues aleatrios, o software RanEigen (Enzmann, 1997) foi utilizado. O software pode ser obtido no
seguinte site: http://lib.stat.cmu.edu/modules.php?
op=modload&name=Downloads&file=index&req=viewsdownload&sid=5&min=20&orderby=hitsA&s
how=10.

A anlise paralela se baseia no nmero de casos e variveis e na comparao entre os eigenvalues empricos
e os eigenvalues hipotticos. Alimenta-se a AP com o nmero de casos e de variveis que estamos estudando. De
acordo com a anlise paralela, neste exemplo, com 11 variveis e 400 casos, possvel extrair 3 fatores, pois a
partir do quarto fator, o eigenvalue emprico menor que o estimado. Ento, considerando todos os critrios,
optou-se pela extrao de trs componentes.

Eigenvalue Estimado Emprico


(aleatrio)

1 1.19137 4,462

2 1.11216 1,552

3 1.05041 1,232

4 0.99646 0,971

5 0.94356 0,555

6 0.88670 0,487

7 0.81934 0,467

A deciso final a respeito do nmero de fatores depender da adequao terica dos fatores e de sua
interpretabilidade. At aqui foram feitas anlises iniciais relativas aos componentes principais da matriz. H indcios
fortes de que a estrutura emprica da escala composta por trs componentes principais. A seguir, so feitas
anlises mais aprofundadas dessa soluo, por meio do mtodo denominado Anlise Fatorial para Fatorao dos
Eixos Principais.
Nos dados referentes s Reproduced Correlations, tabela no foi reproduzida
aqui, conveniente examinar a parte da matriz Residual.

PARTE 4 ROTINA PARA ANLISE FATORIAL


Para a extrao dos fatores usa-se o procedimento: Principal Axis Factoring.
Retorna-se aos comandos iniciais.
Analyse
Data Reduction
Factor

Figura 1.1.1 Comandos iniciais

Ao abrir a janela apresentada na Figura 1.2.1, passe todas as variveis


para o campo denominado variveis e selecione a opo Descriptives para
solicitar a verificao da matriz.
Figura 1.2.1 Janela Factor Analysis

Aps selecionar a janela, marque apenas a opo Inicial Solution.

Figura 1.3.1 Janela Factor Analysis Descriptives

Ao retornar para a janela apresentada na Figura 1.1, selecione a opo


Extraction. Ao abrir a janela da Figura 1.4.1, deixar o mtodo Principal Axis
Factoring e marcar as opes Correlation matrix. Alm disso, indique o nmero
de fatores a serem extrados na opo Number of Factors. Aps selecionar essas
opes, clique em Continue.
Figura 1.4.1 Janela Factor Analysis Extraction

Ao retornar para a janela apresentada na Figura 1.1, selecione a opo Rotation.


Ao abrir a janela da Figura 1.4.2, selecionar o mtodo Promax e marcar as
opes Rotated Solution. Aps selecionar essas opes, clique em Continue. O
ndice Kappa permanece no valor 4, que padro na anlise promax. O kappa
um ndice dos clculos da rotao.

Figura 1.4.2. Janela Factor Analisys Rotation


Ao retornar para a janela apresentada na Figura 1.1, selecione a opo Options.
Ao abrir a janela da Figura 1.5.1, deixar a opo Listwise e marcar a opo
Suppress absolute values less than. Ao solicitar para retirar os valores absolutos
menores que, indique o ponto de corte para as cargas fatoriais. Aqui sugerimos
0.30. Selecione Sorted by size para colocar na tabela os valores das cargas
fatoriais em ordem decrescente. Aps selecionar essas opes, clique em
Continue. E finalmente ok.
Figura 1.5.1 Janela Factor Analisys Options

PARTE 5 - ANLISE DAS TABELAS DE RESULTADOS DA ANLISE FATORIAL

Anlise das Sadas (considerando a rotao Promax)

Comunalities Idem ao que foi dito anteriormente, considerando, entretanto,


que as cargas das variveis, na anlise fatorial dizem respeito aos fatores e no
aos componentes principais, tal como ocorreu na anlise anteriormente
apresentada.

Factor Matrix Os resultados dessa matriz no so considerados, por


corresponderem a uma etapa intermediria (transformao) do processo de
extrao de fatores.

Pattern Matrix Diz respeito relao exclusiva que a varivel tem com o fator,
independentemente dos outros fatores comuns. expressa pela carga fatorial.
Aqui necessrio efetuar a anlise das cargas fatoriais nos fatores para cada
varivel da matriz, o que possibilita a escolha dos itens que permanecero em
cada fator. preciso escolher os itens com cargas mais altas (acima do ponto de
corte igual ou maior do que 0,30). Quando o item possuir cargas altas em dois
fatores, ele precisar de uma anlise:
Escolher o fator em que ele apresentar carga mais alta, desde que eles
no possuam cargas muito prximas.
A diferena entre as duas cargas precisa de ser de, pelo menos, 0,1.
Verificar se os itens escolhidos possuem confiabilidade (alfa de Cronbach
superior a 0,75).
Verificar se eles apresentam um sentido terico. Eles precisam se agrupar
com algum sentido que possa ser explicado no contexto da teoria de base.
Pattern Matrixa

Factor
1 2 3
JS1 - All things
considered, I feel very
satisfied when I think
about my job.
OC1 - My work at HBAT
gives me a sense of ,694
accomplishment.
OC2 - I am willing to put in
a great deal of effort
beyond that normally ,808
expected to help HBAT be
successful.
EP1 - I am very
comfortable with my
,685
physical work
environment at HBAT.
OC3 - I have a sense of
,682
loyalty to HBAT.
OC4 - I am proud to tell
,800
others I work for HBAT.
EP2 - The place I work in
is designed to help me do ,829
my job better.
EP3 - There are few
obstructions to make me
,719
less productive in my
workplace.
SI1 - I am not actively
,841
searching for another job.
SI2 - I seldom look at the
job listings on monster. ,879
com.
SI3 - I have no interest in
searching for a job in the ,687
next year.
Extraction Method: Principal Axis Factoring.
Rotation Method: Promax with Kaiser Normalization.
a. Rotation converged in 4 iterations.

Structure Matrix Diz respeito correlao entre fatores e variveis. Assim, ela
expressa tanto a relao direta quanto a indireta entre os fatores e as variveis.
(devida correlao entre os prprios fatores). A interpretao dessa tabela
complexa e no ser discutida neste roteiro.

Factor Correlation Matrix Diz respeito correlao entre os fatores.


Correlaes superiores a 0,30 indicam a presena de fatores de segunda ordem.
Factor Correlation Matrix

Factor 1 2 3
1 1,000 ,496 ,467
2 ,496 1,000 ,517
3 ,467 ,517 1,000
Extraction Method: Principal Axis Factoring.
Rotation Method: Promax with Kaiser Normalization.

IMPORTANTE a deciso final quanto quantidade de fatores s pode ser


tomada pela interpretabilidade de cada fator, a qual obtida a partir da
anlise dos itens que o compem.

PARTE 6 - ROTINA DE ANLISE DE CONSISTNCIA INTERNA OU


CONFIABILIDADE DOS ITENS (ALFA DE CRONBACH) NO SPSS

um ndice de preciso do contedo do fator. Deve ser considerado um ndice


acima de 0,75. A literatura internacional aceita ndices superiores a 0.60.

Analyse
Scale
Reliability Analysis

Figura 1.1.2 Comandos iniciais

Ao abrir a janela 1.6, indicar as variveis que compem o fator. Marque a opo
List item labels e selecione Statistics.
Figura 1.6 Janela Reliability Analysis

Ao abrir a janela 1.7, marque as opes Item, Scale, Scale if item deleted.
Pressione Continue.

Figura 1.7 Janela Janela Reliability Analysis: Statistics

A seguir sero analisadas as tabelas com os resultados da anlise de consistncia


interna.

ANLISE DAS TABELAS DE RESULTADOS DA ANLISE DE CONSISTNCIA INTERNA

Nos resultados aparecero as tabelas com o Alfa de Cronbach para os itens. No


caso, o alfa apresenta um bom ndice de 0,82.
Reliability Statistics

Cronbach's
Alpha N of Items
,823 4

A tabela seguinte mostra o que ocorre com o Alpha se cada item for retirado
da escala. Por exemplo, se o item 1 for retirado da escala, h um pequeno
acrscimo no valor do alfa. Os demais itens no podem ser retirados porque
geram diminuio do alfa.
Item-Total Statistics

Scale Corrected Cronbach's


Scale Mean if Variance if Item-Total Alpha if Item
Item Deleted Item Deleted Correlation Deleted
OC1 - My work at HBAT
gives me a sense of 25,48 27,067 ,561 ,831
accomplishment.
OC2 - I am willing to put
in a great deal of effort
beyond that normally 21,95 26,707 ,739 ,732
expected to help HBAT
be successful.
OC3 - I have a sense of
21,71 32,808 ,612 ,797
loyalty to HBAT.
OC4 - I am proud to tell
21,96 28,234 ,721 ,744
others I work for HBAT.

Esse procedimento precisa ser repetido para os trs fatores. As demais


tabelas apresentam apenas estatsticas descritivas dos itens e da escala. O
segundo fator possui um alfa de 0,79. O terceiro fator possui um alfa de 0,84.
Considerando esses resultados pode-se aceitar essa estrutura fatorial para o
instrumento. necessrio ainda verificar se esses fatores fazem sentido terico.

Vamos interpretar esses fatores? Que nomes eles recebem?

Fator 1
OC1 My work at HBAT gives me a sense of accomplishment.
OC2 I am willing to put in a great deal of effort beyond that normally
expected to help HBAT be successful.
OC3 I have a sense of loyalty to HBAT.
OC4 I am proud to tell others I work for HBAT.
Fator 2
EP1 I am very comfortable with my physical work environment at HBAT.
EP2 The place I work in is designed to help me do my job better.
EP3 There are few obstructions to make me less productive in my
workplace.
Fator 3
SI1 I am not actively searching for another job.
SI2 I seldom look at the job listings on monster.com.
SI3 I have no interest in searching for a job in the next year.

Para que as variveis originais sejam deixadas de lado, h necessidade de criao


do escore fatorial. O SPSS faz isso, contudo, pode-se fazer pela rotina Transform.
O escore fatorial comumente usado diz respeito s mdias dos fatores (mdias
dos itens somadas e divididas pelo nmero de itens). Trata-se da criao de uma
nova varivel.
Transform
Compute

Ao abrir a janela da figura 1.8, informa-se o nome do fator e apresenta-se a


frmula da mdia aritmtica dos itens. H tambm a possibilidade de obter a
funo no portflio de funes (escolha Mean).
Ao final desse procedimento, uma nova varivel aparecer no seu
banco. Ela ser sua nova varivel de trabalho. O SPSS calcula as mdias
das respostas de cada indivduo aos itens componentes de cada fator e
registra esses valores para cada sujeito. Em anlises de regresso
mltipla, as mdias fatoriais so utilizadas como variveis previsoras ou
critrio, em lugar das variveis originais observadas. Os pressupostos
das anlises estatsticas tambm devem ser testados para essas mdias
fatoriais.

You might also like