You are on page 1of 156

.

" _____ '''1111111111111111111"11111',1111'111,",1,, ;, ii', 'II' III, I'


P<irintilor mei, Viorel !?i Zorit
a
,
pentru ca m-au invatat privesc lumea f<ira ura.
PREFATA
INTRODUCERE
Capitolul1. ELEMENTE DE STATISTICA DESCRIPTIVA
1.1. Modalitati de masurare a variabilelor studiate
1.2. Analiza descriptiva univariata
1.3. Analiza descriptiva bivariata '
1.3.1. de corela\ie
1.3.2. Reprezentarea grafics a asocierii dintre variabile
CUPRINS
ix
xi
2
3
12
13
15
1.3.3. Tabele de contingents - moduri de prezentare a asocierii dinlre dalele
.'
non-numerlce .
Bibliografie
Capitolul 2. TEST AREA IPOTEZELOR
2.1. Ipoteza nula - clarificari conceptuale
2.1.1. Logica testarii ipotezelor
2.1.2. Ipoteza nula i marimeaeantionului
2.1.3. Erorile de tip I i II in testarea ipotezelor
2.2. Marimea efectului
2.2.1. Indicatori ai marimii efectului
2.2.2. Interpretarea msrimii efectului
2.2.3. Stabilirea marimii efedului
2.2.4. Limitele marimii efectului
2.3. Puterea statistics a unei cercetari
2.4. Appendix - Ce inseamna gradele de libertate?
Bibliografie
Capitolul 3. TEHNICI INTRODUCTIVE DE TESTARE A IPOTEZELOR
3.1. Testarea asocierii dintre doua variabile
3.1.1. Coeficientul de corela\ie r
Corelatia partiala
3.2. Tehnici de comparatie intre grupuri
3.2.1. Tehnicile t
3.2.2. Testele t i z de comparare a diferen\elor dintre doua medii
3.3. Managementul datelor brute
3.3.1. Managementul datelor !ipsa
3.3.2. Managemenlul dalelor neobinuite
3.3.3. Transformarea dalelor brule
Bibliografie
.'oJ'.
24
26
27
28
29
31
31
33
34
35
37
37
38
46
48
51
51
51
59
61
61
70
81
81
,82
82
85
v
Capitolul 4. TEHNICILE ANOVA
4.1. ANOVA simpla
4.1.1. Procedurile post hoc
4.1.1.1. Manmea efectului Tn cadrui proceduriJor post hoc
4.1.2. Procedurile a priori
4.1.2.1. Contraste nestandardizate
4.1.2.2. Manmea efectuh.ii Tn cazui contrastelor
4.1.2.3. Contrastele standardiza'te
4.1.2.4. Contrastele polinomiale
4.2. ANOVA factoriala .
4.2.1. Metoda efectelor simple
4.2.2. Marimea efectelor in cazul ANOVA factoriala
4.2.3. Condiiii necesare pentru aplicarea ANOVA simpla !?i
ANOVA factoriala
4.3. ANOVA cu masuratori repetate
4.3.1. Marimea efectelor in ANOVA cu masuratori repetate
4.3.2. Conditii necesare pentru aplicarea ANOVA cu masuratori repetate
. 4.4. Alte modalltati ANOVA
4.5. Exemplu de ANOVA facto'riala: cazul euristicii de accesibilitate
4.6. Tehnieile ANCOV A
4,6.1. Marimea efectului in tehnicile ANCOVA
4.6.2. Conditii suplimentare aplicarii ANCOVA
4.7. Tipuri de factori In design-urilede tip ANOVA sau ANCOVA
Bibliografie
Capitolul 5. ANALIZA FACTORIALt..
vi
5.1. Analiza factoriala exploratorie
5.1.1. Teoria analizei factoriale
5.1.2. Analiza componentelor principale vs. analiza factoriala
5.1.3. Design-ul !?i metodologia analizei factoriale
5.1.3.1. Tipun de matnce i metode de extragere a factonior
5.1.3.2. Metode de seiectare a numarului adecvat de facton
5.1.3.3. Analiza statistica a {actonior extrai
5.1.3.4. Rotirea factorilor
5.1,3.5. interpretarea naturii factorilor
5.1.3.6. AmeJiorarea structurii factoriale
5.1.3.7. Aspecte metodologice compiementare
5.1.4. Exemplu de analiza factoriala exploratorie - cazul inteligeni
ei
.
5.2. Analiza factoriala confirmatorie
5.2.1. Specificarea modelelor concurente
5.2.2. Identificarea modelelor
5.2.3. Stab iii rea gradului de adecvare a modelelor
5.2.3.1. Indica ton absoiuti
5.2.3.2. indicatori de comparare
5.2.4. Modificarea modelului
5.2.5. Aspecte metodologice ale aplicarii analizei factoriale confirmatorii
Bibliografie
,I' " I,.IIU"III.,.' ___ IIIIIU"IIII_IIIIIIIIIIIIIIII' 1111'111111111'111111111'11111111'1111'111111111'111 'III ill' II! !II III :11' :11 'III III III III illl '1111111 III illl 11111111"1111'111' ,Ii' I
87
90
92
95
97
97
101
102
104
107
111
114
115
116
121
121
124
125
128
132
133
135
137
139
140
141
143
145
146
148
153
155
160
161
163
167
170
171
173
176
176
178
180
182
183
Capitolul 6. REGRESIA LlNIAR.A.
6.1. Regresia liniara simpla
6.1.1. Principii ale regresiei Iiniare
6.1.2. Evaluarea eficien\ei unei ecua\ii de regresie
6.1.3. Testarea individual a a eficientei predictorilorin estimarea evolutiei
criteriului '
6.2. Modalitati de analiza In regresia multiliniara
6.3. Regresia multilinara In seop predictiv
6.3.1. Interpretarea coeficien\i1or de regresie
6.3.2. Rolul ecuatieLde regresie Tn interpretareadatelor cu scop predictiv
6.3.3. Instrumente complE3mentare regresiei Tn seop predietiv
6.3.3.1. Decizia organizationa/a
6.3.3.2. Contravalidarea'
6.3.3.3. Analiza cazurilor inffuente
6.4. Regresia multiliniara Tn seop explicativ
6.4.1. Logiea regresiei utilizate In seop explieativ
6.4.2. Testarea eficientei explicative a modelului propus
6.4.3. de regresie in analizele cu scop explicativ
6.4.4. manmll efectului In cazul regresiei multiple
6.5. Condlt" necesare pentru aplicarea regresiei liniare
6.5.1. Evitarea erorii de speeificare ,
6.5.2. Evitarea erorii de masurare
6.5.3. Eroarea reziduala cat mai mica
6.5.4. Evitarea multicoliniaritatii
_ 6.5.5. Existenla unor relatii de'tip liniar !?i aditiv
6.6. Exemplu de regresie multiplii liniara - cazul citirii
6.7. Directii de evolutie ale regresiei
6.7.1. Alte tipuri de regresie
6.7.2. Identificarea efectelor de interacliune in regresia multipla
6.7.3. Analiza de cale
Bibliografie
Capitolul 7. REGRESIA LOGISTIC.A.
7.1. Concepte i principii teoretiee
7.2. Modelul regresiei logistiee
7.3. Estimarea modelelor logistice
7.3.1. Testarea modelelor explicative logistiee
7.3.2. Compararea modelelor logistiee
7.3.3. Stabilirea eficien\ei explicative a modelului ales
7.3.4. !?i interpretarea coeficien\ilor logit
7.3.5. Stabilirea unor profile ideale .
7.3.6. Analiza eazurilor influente asupra modelului
7.4. Exemplu de regresie logistica binarii - cazul infidelitatii
Bibliografie '
"II'illlillllll'llllIIlllI
185
187
187
192
194
197
200
204
208
209
209
212
214
216
217
219
220
222
223
223
224
225
225
227
228
232
232
232
238
241
243
243
245
249
250
253
256
260
264
265
266
269
vii
11111111111111_1 '11111'111', 'II' 'II 1,1,1
Capitolul 8. SCALAREA MUL TIDIMENSIONALA
8.1. Modele de scalare . . _
8.2. Design-ul cercetarii In scala rea multldl.menslonala
8.2.1. Seleclarea obieclelor a numarulUl acestora
8.2.2. Metode de coleclare a datelor . .,
8.2.2.1. Compararea fiecarei perechl de sttmult
8.2.2.2. Sortarea stimulilor
8.2.2.3. lerarhizarea stimuli/or
8 2 3 Managementul datelor colectate prin SPSS .'
8.3. perceptiva. a distant
elor

8.3.1. Selectarea, numarului de dlmenslunl dlnharta perceptlva
8.3.2. Interpretarea MDS
8.3.3. INDSCAL ._
8.4. Modele de scalare multidimenslona1a conexe
8.4.1. Modele MDS constranse
8.4.2. Modele MDS extinse
8.5. Incursiune In optiunile SPSS
Bibliografie
viii
271
272
275
276
277
277
278
279
279
283
28::1
28B
293
29(;
29:;
29G
298
29B
PREFATA

o CARTE DE STA T/ST/CA PENTRU PSIHOLOGI
Cand mi s-a propus sa redactez un cuvant introductiv la cartea cole9ului meu, Florin
5ava, am fost oarecum deoarece sun! mai mult un consumator de statistica decat un
creator al acestui domeniu. Exista percep\ia, uneori falsa, ca psihologii nu sunt prea buni
'statisticieni. Mul\i chiar se complac in aceasta convingere nu fac nici un efort optim}zeze
performan\ele intr-un domeniu, care, de ce sa nu da substan\a oricarei cercetari din
domeniul psihologiei. Personal, nici nu pot con cepe 0 investiga\ie psihologica fara 0 abordare
statistica adecvata; indiferent'ca se pune problema unui demers cantitativ sau calitativ.
Psihologia este atestata ca 0 experimentala. Experimentul a fost acel element
care a conferit psihologiei calitatea de Ea este evaluata ca fiind 0 tanara, nascuta ca
o sinteza a cercetarilor lui E.H. Weber asupra senza\iilor tactile '(1849), ale lui H. Helmholtz
asupra senza\iilor vizuale 9ioptice (1862-1867) 9i studiilor de psihofizica (1860) ale lui G. Th.
Fechner, in' laboratorul lui Wilhelm Wundt de la Leipzi9, mai ales dupa publicarea manualului sau
de psihologie (1874), Aplicarea in mod consecvent a metodei experimentale ca regula in
investigarea psihologica a insemnat renuntarea 1<1 sistemele vaste filosofico-psihologice.
Psihologia in prezent 0 inser\ie talala in activita\ile practice in care deseori se reflecta
diverse categorii de probleme cu care se confrunta fiin\a umana in contextul existen\ei sale
cotidiene, In toate aceste cadre ac\ionale, psihologii dezvolta proiecte experimentale pe care Ie
fundamenteaza prin intermediul unui aparat statistic construit cu multa grija. Prin utilizarea
experimentului in psihologie s-a pus accent pe colectarea de date obiective privind
comportamentul uman, astfel fiind posibila generarea a numeroase privind senzaiiile,
percepjiile, reprezentarile, memoria etc" legita\i care au permis psihologiei sa devina 0 !?tiinia
independenta. Psihologia este 0 provocare vizavi de practicile diletante, sau abordarile
parapsihologice de genul astrologiei,' psihobioritmurilor, telepatiei, grafologiei,chiromanjiei etc.
Acestor practici cu pro fund caracter ne$tiinjific, cat adepjilor lor, psihologii Ie-au raspuns printr-o
abordare proiectand 0 serie de experimente in care ecau folosite proceduri statistice
adecvate. La timpul sau, psihologul american R. Pintner, sublinia faja de preten\iile
caracterologilor 9i ale altor ca pe ace9tia riu-i po\i combate decat cu fapte, prin aceasta
injelegandu-se argumente 9tiinjifice, rezultate ale unor investigajii. Ca atare, de-a lungul timpului
au fost proiectate 9i publicate 0 serie de investiga\ii menite sa demonstreze caracterul ne:;;tiin\ific
al astrologiei, horoscopului, psihobioritmurilor etc.
Cercetarea psihologica contemporana a adus psihologica 9i educajionala la un
punct suficient de ina It, incat sa nu mai fie descifrata cu prea multa u:;;urin\a decat cu un efort
sus\inut 9i dupa 0 practica indelungata de catre orice cercetator. Azi, problema calculelor, cu care
se confruntau cercetatorii pana nu de mult, ,nu mai constituie 0 bariera, calculatorul :;;i pachetele
de programe statistice facand posibila printr-o simpla apasare pe 0 tasta, efectuarea celor mai
complicate calcule intr-un timp nebanuit de scurt. Creatorul cunoscutului chestionar de
personalitate 16PF, psihologul R.B. Cattell (1905-1998), s-a foiosit de 0 simpla ma:;;ina de calcul
pentru a descoperi cei 16 factori ai celebrului sau chestionar. 5e spune ca foile de hartie pe care
erau trecute, itera\iile analizei factoriale se intindeau din casa pan a in gri'ldina, fiind asistat de
cateva secretare. UneleVoci afirma chiar ca in noianul de calcule s-au strecurat :;;i.unele .erori, Cu,
tehnica actuaJa de calcul, acest lucru nu se mai poate intampla. Un singur calculator, software-ul
adecvat 9i un operator, pot rezolva orice problema statistica, Oeci, problema nu mai esta a
difiCLJlta\ii de a realiza in\eJege demersul de cal cui al cutarui sau cutarui indice statistic, ci de a-i
ix
"'!;! Ii !I':II'II! 11:'11,11,'1 II i',I'!"I'i ii"
, " 'eta coreet, Psihologul de azi este prea puiin de
jescopen semnlficalla, de a-I Interpr t I pl'lcate din punct de vedere tehnlc, EI se
, I I d calcul cum sun e e a '
unde provln unele ormu e e " , 'd'f 't contexte de cercetare i pe cum trebUle
'I d t tistici utllizate In I en e , I
concentreaza pe tlpU e sat b d a statistica adecvata demersului expenmenta '
acestea sa fie interpretate, A alege corec a or are te trece cu prea multa uurinta, Desigur,
, bl peste care nu se poa '
abordat este Intr-adevar 0 pro ema, '_' ca faptul psihologic sa fie'mascat de 0
nici abuzul de statistica nu este de Une,on s a I indi.t unele articole din reviste
, ' " laborioasa S-a aJuns pana aco 0, 'b'l
abordare statlstlca prea ' , t 'h logulobinuit ele devenind accesl Ie
prestigioase de psihologie sa fie ,de nemiele: pen i revista i psihologia ca tiin\a,
numai unui numar restrans de pSlhologl. Or, In aces
d
ca , I t'le ne spune adesea mai mult decat
, " Ie diagrame e core a ,
Sa nu uitam ca Inspectarea unel simp "'d ffi concentrari specifice ale anumltor
'coeficientul ?e corela\ie, Ea ne sa I afecta corela\ia etc, Apoi, diagrama de
scoruri, sa Intulm elementele ,dlstorslonante constitui subiectul unui studiu de caz, cele
corela\ie ne indica aC,ele de psihdlogica i educaiionala se pot
care se abat de la 0 regula generala, De P, bT praetice afirmand iresponsabil ca el
multe, la fel de multe i despre cel sunt Incapab,ll Abordarea cantitativa i
"prefera", metodele calitative, neavandu-se prea ,
, ' 't I se completeaza reclproc,
calitativa nu trebUte sa fie dlsocla e, e e, ," 'h 10 ica nu ne ateptam sa gasim prea multe
Cand vedem 0 carte d,e eventual utilizand alte simboluri i
lucruri noi. Acelea1 Jormule, aC,ela1 a 9 " I 'n re sa ne invete de ce folosim 0 anum Ita
alte exemple, Pu\ine sunt i care esie procedura de utilizare,a
formuli3 i nu alta, cum sa Interpretam rezul, sa" sa" verificam Cartea pe care Flonn
, 'd eea ce donm sa a am " '
calculatorulUt pentru a surpnn e, c, ' , I , ducationala rezolva multe din problemele cu
Sava 0 of era utilizatorilor de statJstlca pSlho oglca I e
t
'I este aceea ca este scrisa de catre
'P t calitate a aces el ucran ..
care se confrunta oa e ca 0, ' I' t" abundente in formule i demonstra\1I
't " tete" lipslte de exp Ica 11, . ..
un psiholog, EI nu da nl e re, . t 'n psiholog sau student prin aceea ca 11
reduildante, Aceasta carte este fundamenta pendru, u , altul Ea of era informatii pertinente
, n anumJt mo I nu In, "
spune dar ce I de :e sa ,aca In r-u f ulelor statistice pe care Ie utilizam intr-o cercetare,
despre ceea ce se gasete In spate Ie orm "' I tot pasul in aceasta lucrare, se incearca 0
mUlt, prin numeroasele exef!1ple pe ?are, Ie a, a ro iata de realitate i cu nenumarate
altfel de interpretare a fenomenulUl pSlholog
lc
, mal p p
oportunita\i interpretative, I' mana Lucrarea lui Florin Alin Sava am
o carte de statistica se studlaza cu crelon,u .. In, 'n f;ta calculatorului pentru a urmari,
citit-o facarid unele note maneta. ea a constituit realmente
uneori din pura curiozitate, algontmll de calcul , t' umorul. Nu se poate sa
" \'tate care ml s-a paru 1m '
o provocare, A mal men\lona 0 ca I, t se spun multe lucruri comice, dar
, a zambe"tl Despre 5 a ,
studiezi ara 5, -:,', tin cartea sa, Exemplele rezultate din
Florin a tiut sa Ie dlstnbUie propor\lOnal , t area sensurilor variatelor abordan
sau simplu' inventate, ne dau ancore slm?atlce In pene r
statistice, indiferent de ca: de ar II t in rimul rand studen\ilor in psihologie care,
Cartea coiegulul Flann Sava este de at tPt' .. dar care sunt obligati sa 0 utilizeze,
, , f .' e din studlu s a IS ICII, " ,
tim prea blne ca rareon ac 0 , d' d niul psihologiei, al oricarui pSlholog
Ea este un foarte bun ghid al oncarUi ,om: '
pentru care psihologia este 0 tiin\a cu puternice radaclnl aplicatlve,
x
Prof, Haria D, Pitariu
Universitatea "Babe-Bolyai"
Cluj-Napoca
INTRODUCERE
Psihologia romaneasca a importanti pentru a recupera pierderile
provocate de 0 decizie politica neinspirata, a regimului comunist. Se tot
mai mult dec psihologie autohtona care sa nu mai fie tributara unor practici
imitative, de divinizare a psihologiei americane, Cu siguranta, aceasta perspectiva
merita incurajata pentru a oferi psihologiei stil propriu,
exista destul de multi psihologi care confunda acest deziderat cu 0
larghete metodologica inteleasa, Erorile metodologice sau ignOranta
statistica sunt, din nefericire, prezente frecvent in practica psihologilor de la noi.
Daca subiectele de cercetare specifice spatiului social romanesc merita
promovate, standardele de ordin metodologic statistic trebuie pastrate
la un nivel ridicat, cel putin similaf cu cel intalnit in majoritatea publicatiilor de
specialitate de Jimba engleza,
Pentru a realiza ac;est lucru este nevoie acuta de texte statist ice
comprehensibile, Tn ultimii ani, aceasta cerere a inceput sa fie acoperita prin
contributiile editoriale, in special ale colegilor din sau Cluj-Napoca. Lucrarea de
fata se alatura acestor demersuri, oferind 0 viziune proprie asupra statisticii, ce are
ca 0 prima sursa stagiul de specializare de la Universitatea Michigan din Ann Arbor
din 2000, iflsa sursa principala de inspiratie in realizarea acestei carti are Tn vedere
intrebarile sugestiile studentilor de la Facultatea de Sociologie Psihologie,
specializarea Psihologie, din cadrul Universitatii de Vest din discutiile
profesionale cu colegii. Lor Ie datorez in cea mai mare parte acest demers
intelectual.
Bunaoara, formarea predominant umanista a majoritatii studentilor de la
psihologie Ii indeparteaza, cel putin in plan afectiv, de 0 abordare matematica a
statisticii. De aceea, pe fntreg parcursul lucrarii am incercat sa evit, pe cat posibil,
un asemenea demers, substituindu-I printr-o prezentare a logicii acestor tehnici
printr-o multitudine de exemple-suport,
Cartea se adreseaza studentilor interesati, dOctoranzilor tinerilor
cercetatori care urmaresc clarifice multe din- conceptele st<;ltistice vehiculate,
Din punctul de,vedere al gradului de complexitate"lucrareaare un nivel intermediar
/
de dificultate, fiind deosebit de utila mai dupa parcurgerea unui curs
introductiv de statistica,
Din punctul de vedere al continuturilor vehiculate, cartea este structurata
pe trei parti, criteriul de divizare fiind dat de complexitatea pe care
trebuie sa Ie detina cititorul. Astfel, partea I este alcatuita din trei capitole,
introductive vizand statistica descriptiva, testa rea ipotezelor tehnicile t, X2 sau r,
ca modalitati uzuale de testare a ipotezelor. Aceasta sectiune constituie, in
principal, 0 recapitulare originala a acumulate de cititori in urrna unui
xi
. ., . ela corect. Psihologul de azi este prea puiin inte:esat de
des copen semmficai,a, de a-I Interpr t I apl'lcatedin punct de vedere tehnlc. EI se
. f I de calcul cum sun e e ". b .
unde provln _ unele. ormu e .., '. . In diferite contexte de cercetare pe cum tre ule
concentreaza pe tlpul de utlliza;e b da ea statistica adecvata demersului experimental ,
aceslea sa fie interpretate. A alege corec a or r te trece cu prea multa Desigur,
abordat este intr-adevar 0 problema pesle care nu_se ca faptul psihologic sa fie'mascat de 0
nici abuzul de statistica nu este de s a sOlO incat unele articole din reviste
abordare statistica prea labonoasa, aJuns fan ele devenind accesibile
prestigioase de psihologie sa fie de nemiele: pen 9
i
rEwista psihologia ca
numai unui numar restrans de pSlhologl. Or, In aces
d
'I I' ne spune adesea mai mull decal
. , I diagrame e core a Ie ,
Sa nu uitam ca inspectarea unel e -'d Hi -m concenlrari specifice ale anumllor
'coeficientul de corelalie. Ea ne sa I en afecla corelatia etc. Apoi, diagrama de
scoruri, sa intuim elementele car constitui sUbiectul unui studiu de caz, cele
corelalie ne indica acele cazun de excep\,e pS'lho'log'lca <:i educationala se pot spune
' - 1- rala Despre s a IS Ica "', . _ .
care se abat de la 0 regu a gene.. . b'Jj sa 0 practice afirmand iresponsabJ! ca el
multe, la fel de mulle despre cel sunt Incapab., cu Abordarea cantitativa
"prefera". metodele calitative, neavandu-se prea In_e .
. - ,. d' . t ele se completeaza reclproc. .
calitativa nu trebUJe sa lIe Isoc/a e, ., _ 'h I 'ca nu ne a!i'teplam, sa gasim prea mulle
Cand ved.em 0 carte eventual utilizand alte simboluri
lucruri noi. Jormule, alg . I . t't r sa- ne lnvete de ce fofosim 0 anumlla
. . t I -'1 din domenlu amln I ca e., . . .
alte exem?le. PU\lne sun _ucran e _ Itatele oblinute 9
i
care este procedura de utJIJzare a
formula 9
1
nu alta, cum sa mterpretam rezu , _ saw sa- verificam Cartea pe care Flonn
. . d c ea ce donm sa a am '.
calculatarulUl pentru a surpnn e, . I . _ . d' cationala rezolva multe din problemele cu
Sava 0 ofera utilizatorilor de statlstlca pSlho oglca 9
1
e '_. Ie aceea ca este scrisa de calfe
- . P t - 0 calitate a acestel ucran es ..
care se confrunta ace9lia. oa e ca . , I' t" abundente in formule 9
i
demonstrat"
d - . t "retete" lipslte de exp Ica II, "'
un psiholog. EI nu a n1!i' e.' _ t psiholog sau student prin aceea ca II
redundante. Aceasta carte este fundamentala
t
pendru. u A
/n
a/lul Ea of era inform, atii pertinente
- - A t un anuml ma I n. "
spune clar ce i de _ce sa ,aca In r- rmulelor statistice pe care Ie utilizam intr,o cercetare.
despre ?eea ce se In spatele fo e aSlm la tol pasul in aCeasla lucrare, se incear_ca 0
mult, pnn numeroasele exel'Tlple pe ?are 1 g, . ro iata de realitate 9
i
cu nenumarale
a Itfe I de inlerpretare a fenomenulUl pSlhologlC, mal ap p
oportunitati interpretative, . _ . 1 A ana Lucrarea lui Florin Alin Sava am
o carte de statistica se studlaza cu crelonu .. faia calculatorului penlru a urmari,
citit-o facarid unele note 'context, ea a constituit realmente
uneori din pura curiozilate, algontmll de calcul _ I 'mp-ortanta' umorul. Nu se poate sa
' . t' artate care mf s-a paru f .
o provocare. o_c _I , . es re stalistica se spun mulle lucruri comice,
studiezi lucrarea In cauza fara sa D. PArt a sa Exemplele rezullale din practlca
Florin a 9
tiul
sa Ie dislribuie proportional 9
1
ca e t sensurilor varialelor abordari
sau simplu' inventate, ne dau ancore Slm?atlce In pene r .
statistice, indiferent de ca: de ar fl ta in primul rand sludentilor in psihologie care,
Cartea colegulUl Flonn Sava este de t t' t' .. dar care sunt obligali sa 0 utilizeze.
. - . f >, din studlu s a IS ICII, " ,
!i'tim prea blne ca rareon 0 _ d' d eniul psihologiei, al oricarui pSlholog
Ea esle un foarte bun ghld al oncarul ,om, .
penlru care psihologia esle 0 9tiinla cu puternice radactnl aplicatlve.
x
Prof_ Horia 0_ Pitariu
Universitalea "Babe!i'-Bolyai"
Cluj-Napoca
INTRODUCERE
Psihoiogia romaneasca a importanti pentru a recupera pierderile
provocate de 0 decizie politica neinspirata, a regimului comunist. Se vorbe!?te tot
mai mult deo pSihologie autohtona care sa nu mai fie tributara unor practici
imitative, de divinizare a psihologiei americane. Cu siguranta, aceasta perspectiva
merita incurajat8 pentru a oferi psihologiei romaneti' un stU propriu.
Totu!?i, exista destul de multi psihofogi care confunda acest deziderat cu 0
farghete metodologica greit inteleasa. Erorile metodologice sau ignoranta
statistica sunt, din nefericire, prezente frecvent Tn practica psihofogilor de la noi.
Daca subiectele de cercetare specifice spatiului social romanesc merita
promovate, standardele !?tiintifice de ordin metodologic statistic trebuie pastrate
la un n;vel ridicat, cel putin similaf cu cel intalnit in majoritatea publicatiilor de
specialitate de Jimba engleza,
Pentru a realiza a<:<est lucru este nevoie acuta de texte statistice
comprehensibile. in ultimii ani, aceasta cerere a inceput sa fie acoperita prin
contributiile editoriale, in special ale colegilor din lai sau Cluj-Napoca. Lucrarea de
fat
a
se alatura acestor demersuri, oferind 0 viziune proprie asupra statisticii, ce are
ca 0 prima sursa stagiuf de speciaJizare de la Universitatea Michigan din Ann Arbor
din 2000. Illsa sursa principala de inspiratie in realizarea acestei cart
i
are in vedere
intrebarile ;;i sugestiile studentilor de la Facultatea de Sociologie !?i Psihologie,
specia/izarea Psihologie, din cadrul Universitatii de Vest din discutiile
prafesionale cu colegii. Lor Ie datorez Tn cea mai mare parte acest demers
intelectual.
Bunaoara, formarea predominant umanista a majoritatii studentilor de la
pSihologie ii Indeparteaza, cel putin In plan afectiv, de 0 abordare matematica a
statisticii. De aceea, pe Tntreg parcursul lucrarii am 1ncercat sa evit, pe cat posibiJ,
un asemenea demers, substituindu-l printr-o prezentare a logicii acestor tehnici
printr-o multitudine de exemple-suport.
Cartea se adreseaza studenti/or interesati, doctoranzilor tinerilor
cercetatori care urmaresc clarifice mufte din -conceptele statistice vehiculate,
Din punctul al gradului de complexitate,.lucrareaare un nivel intermediar
de dificultate, fiind deosebit de utifa mai dupa parcurgerea unui curs
introductiv de statistica.
Din punctul de vedere al continuturilor vehiculate, cartea este structurata
pe trei part
i
, criteriul de divizare fiind dat de complexitatea pe care
trebuie sa Ie detina cititorul. Astfel, partee I este alcatuita din trei capitole,
introductive vizand statistica descriptiva, testa rea ipotezelor i tehnicile t, X2 sau r,
ca modalitati uzuale de testare a ipotezefor. Ateasta sectiune constituie, Tn
prinCipal, 0 recapitulare originala a acumulate de cititori in urma unui
xi
--
curs introductiv de statistica. Sectiunea nu poate fi neglijata de catre cei care
dispun de cunotinte lacunare Tn domeniu, parcurgerea celar trei capitole fiind
necesara pentru a putea Tntelege celelalte parti ale cartii.
Partea a II-a, cea mai voluminoasa de altfel, cuprinde tehnicile statistice
cele mai utilizafe Tn cercetarea psihologica de vart: regresia multiliniara, tehnicile
ANOVA sau ANCOVA, analiza factoriala exploratorie sau cea confirmatorie.ln
privint
a
lor exista 0 situatie paradoxala. Dei majoritatea cursurilor introductive de
statistica nu ajung sa cuprinda aceste tehnici din cauza lipsei de timp, cele mai
multe articolele de specialitate publicate utilizeaza aceste tehnici, mai ales Tn
literatura de limb8 engleza. Prin urmare, multe persoane Tntampina dificultati in
Tntelegerea demersului statistic din cadrul acestor cercetari, fiind nevoite sa
studieze individual ori sa preia fara 0 reflectie critica orice studiu publicat. Din
nefericire, in literatura cje limba romana exista putine texte care prezinta adecvat
aceste subiecte, cele mai multe tratand problemele intr-o maniera nepotrivita
pentru profilul studentului sau absolventului de psihologie. Lucrarea de fata Ti
propune sa depaeasca. aceste neajunsuri, obiectivul central al partii a II-a fiind
"traducerea" metodelor statistice utilizate frecvent Tn cercetare pe Tntelesul
psihologilor.
Pentru a realiza acest lucru, demersul matematic de tip hartie-creion a fost
substituit prin prezentarea i discutarea rezultatelor oferite de doua din cele mai
intalnite programe statistice: SPSS, Tn varianta 11.0 i AMOS, Tn varianta 4.0. Pe
lang a interpretarea rezultatelor oferite de aceste programe, fiecare capitol contine
una sau mai multe baze de date care pot fi descarcate gratuit de pe internet la
adresa http://statisticasociala.tripod.com.Fiierele respective pot fi utilizate de
cititorii care dispun de aceste programe statistice pentru a exersa problemele
discutate.
Tn ultima parte acartii sunt prezentate doua metode statistice
complementare: scalarea multidimensionaJa !?i regresia logistica. Ambele metode
sunt considerate avansate din punctul de vedere al gradului de complexitate,
pentru a Ie putea Tntelege fiind nevoie de 0 buna stapanire a primelor doua sectiuni
ale cartii. De pi Ida, Tntelegerea capitolului destinat regresiei logistice necesita
cunoaterea regresiei liniare, Tn timp ce scalarea multidimensionala face ape I atat
la informat
iile
vizand regresia liniara, cat !?i la cele gasite Tn paginile referitoare la
analiza factoriala.
Tn Tncheiere, a dori sa multumesc tuturor celor care au contribuit prin
sugestiile i observatiile lor la bunul mers al acestei lucrari. Aceleai aprecieri
deosebite vi Ie urez i dumneavoastra, dragi cititori, pentru osteneala i curajul de
a da piept cu un limbaj statistic pe alocuri neprietenos, cat i pentru eventualele
sugestii la afsava@socio.uvt.ro. Lectura utila!
Autoru/
xii
CAPITOLUL 1
ELEMENTE DE STATISTICA DESCRIPTIVA
Analiza date lor poate parea unora un . ..
important
a
acestui proces a- fost d proces anost,. rutlnler. Insa
Pana i titulatura de cercetare tiintifica
a
c e tiintifica.
tocmai modul de analiza a datelor' an I a Iva sau calitatlva are Tn vedere
In prezent, com'unitatea' psih I '1 .
tipuri de cercetare cu toate .0 ogl or
l
recunoate I Incurajeaza ambele
, a, In une e medii
cantitativa are Tntaietate. Acest fapt oate fi cercetarea
didactice universitare care Tncura'e p regaslt!?1 In practlca unor cadre
cantitative complementare unui de J aza I.ntotdeauna aplicarea unor metode
facultativ recomandarea unor schimb, utilizeaza cu caracter
Crt. un ca I a Ive Intr-o cercetare cantitativa.
a ea de fata vlzeaza doar tehrJic.i statistice n r -
lucru dintr-o lipsa de respect fata de .lnsa nu face acest
pentru a fi descrise yin sa t calitatJve. Tehnlclle cantitative alese
din domeniu, precum cele ale lui me prezentate Tn textele introductive
(2000), Radu !?i colab. (1993) Stan (2000), Novak (1977), Hohn
introducere, dei tehnicile _ I co a . (1999). cum am precizat i in
articolele tiintifice publicate -Tn sunt foarte raspandite in
statistica deca-t tang t. IS e e e speclalltate, cursurile introductive de
en la aceasta tematic p'
cercetatorii din psihologie se vad nevoiti de a.. urmare,. studentii i
necritic rezultatele publicate sau la dmulte on, sa Intr-un mod
de cuno!?tint
e
Tn domeniu. Iverse comunJcan, dm cauza Iipsei
Analiza datelor cu scop descriptiv inciud .
menite sa faciliteze Tntelegerea re Ire .e un co.mplex de metode I tehnici
Reprezentarilegrafice, ad: :r::v analiza o.bservate.
reprezinta elemente Tntalnite des Tn rd' en_te sau alii Indlcaton statistici
aceea este necesara 0 buna sau In textele de specialitate, de
Acest minim de cunotinte t f .
statistica descriptiva Ea nu . ' poa e I Integrat Tn termenul generic de
mai co recta a realitatii. decat sa faca 0 radiografie cat
, un slnQ.ur aspect al .
u . t" ( : H'- '. . [(3a I a,1I vorblm despre 0
descriem pentrbu 0 smgura..-Y.Clnabila), iar in situaiia Tn care
, .",-"". .. -, I' a I e vor 1m de 0 st f r . d
variabile). $e vorbe . bivariata
In caresunt analizate simultan!? cel1 0 statJstlca Tn situatii
le
statistica tine cont nu d d .. ale realitatll. Prelucrarea ,
, oar e numarul variabil I .. . . '
masurare ufi/izate. e or, CI I de calitatea scalelor de
',I,l', 'l'III'I','II',II',",'r 'II 'JII.'II'III.IIIIJII','III:III '1"Ii,"','il"1 '1IIIIi"II','II'III'II',111 111'11',111'11'"1,11',11 III 'I "11:11' r",',"/"; i:,','I"1
.G"
o alta idee de baza Tn analiza statistica a datelor are Tn vedere
dintre analiz"LlaniV!lIY!Jotului testat i analizal?opivelulpopula1i:! din care face
parte acel eantion. De exemplu, putem obtine anumite valori descriptive la nivelul
lotului testat (ex. nivelul de empatie la 0 c1asa de elevi de c1asa aIX-a) i alte valorl
la nivelul populat
iei
(ex. valoarea medie a empatieila nivelul populat
iei
de elevi de
clasa a IX-a). De multe ori, analiza datelor se bazeaza pe rezultatele ob\inute la
nivelul lotului de subiecti testa\i, Tnsa inferen\a se face la nivelul popula\iei din care
acesta face parte. Pent'ru a facilita distinc\ia dintre cele doua se
termeni diferiti precum cei de respectiv indicatori se
refera la pOPiJla.tiei, iar inqi.catorii statistici se refera la
Aceasta diferent
iere
se regasete, frecvent, i Tn modul de notare. Astfel, media I
abaterea standard la nivelul populatiei se noteaza cu J;Lclespectiv la nivelul
eantionului se utilizeaza simboil..irile .Q})}espectiv.. . . . "
Vom reaminti, pe scurt, informa\iile de baza din statistica descrlptlva,
pentru a patrunde mai bine semnificatia informatiilor prezentate Tn capitolel
e
urmatoare. Cititorii interesati pot consulta lucrarile deja mentionate pentru mal
multe detalii.
Acestea vor fi grupate In trei sectiuni: (1) important
a
modului de masurare
a variabilelor In analiza datelor; (2) analiza descriptiva univariata i (3)analiza
descriptiva bivariata.
1.1. ModaliHiti de masurare a variabilelor studiate
,
. Primul element de baza In analiza datelor este identificarea modului In
care au fost masurate variabilele de interes. Astfel, se pot distinge patru scale de
masurare: nominaLa,ordinala, de intervpL.i proportii (raport), fiecare avand calitat
i
diferite Tn ceea privete poslbilitatile care Ie of era pentru analiza
" De pi Ida, variabilele de tip, nominal presupun raspunsuri care ,IJEeun
t
numeric;:e'l i nigi,.,nu ...pot fi urmare, scalele de tip nominal implica
frecvente. Un exemplu tipic de variabila masurata prin scala nominala
'laCf:;ligie" deoarece raspunsurile aferente - orto.dOX:
protestant, rnusulman etc. - nu sunt nici numere, nici ordonablle mtnnsec.
Variabilele de tip ordinal; dei misunt deJifl::Dumeric, permit ordonarea intrinseca
a raspunsurilor, permitEmd asHel .. iE3rarhii. Acest fapt permite
cercetatorilor sa apeleze la analize bazate pe ierarhii (ranguri). Un exemplu de
variabila masurata prin scala ordinala este Tntalnit frecvent In studiile despre
atitudini i implica raspunsuri de genul "foarte "rar" , "mediu", "des",
des". Un alt tip de scala de masurare este cea de'tip interval. Aceasta este 0 scala
numerica (ex. un IQ de 120; 7 puncte la 0 probMeasertivitate etc.). Tot 0 scala
numerica'este i scala de prop
o
r1
ii
, avantajul acesteia fata de scala de tip interval
con stand Tn faptul ca valoarea zeroQl;I este a1.eas.a prbitrar. Un exemplu de
variabila masurata prin scale de proportii este timp'ui de react
ie
(ex. 170 ms) sau
2
'j; JII. I,W }llr lilt 1IIIlIIIIILlIIII.IIIIIIIIIILlIIIIJIIIIIJIIIIL III j,II' :1,' jill IW 'III ,lllllllllf :IIIIIIIIW 1111I 'III 111I IIII/Ilf IIII/Ilf lilt 111I III I11I 111I :1111 111I ,lilt :1111,1111111111 1111111111 111I 111I 111111111 !IIII 11111 111I ,III 111I 1111 IIIU Illf 'III' 1111' 1111 1111' 11111,11111 ,'1111111111 11111111111 11111 11111111111' ,11111111111 11111111111111111,11111 ,'1111 1111 ,1111,111111,11111111111,111111111111111111111111111111 11111 111111 111111111111 111111 11111 III' ,I
(ex: 1 lei). autori, precum Kinnear i Gray (2000), tind
sa restranga ultlmele doua modalltatl de masurare la termenul 9 . d "
. " . .' enenc e scala
deoarece maJontatea tehnicilor statistice utilizate In cazul scalelor de f
Interval sunt valabile i Tn cazul scalelor de tip proportii. Aceea . t f Ip
d t t
" . d ........ ,I pozl,le a ost
a op a a I e consIlient statlstici al SPSS-ului, care au renuntat la . d'f t'
tid ". . ' a mal I eren la
In re ce e oua tlpun de variabile (SPSS 11.0, 2001). '
alt aspect. c:etCetgJie subliniat cu privire la scalele de masurare este
ac:,la ca aproape poate fi masurata prin_J],pLrlJulte scale de
.. Spre :xemplu, .nivelulde colarizare poate fi evaluat nomTnala
In .unor de tiP. sau "necolarizat" sau prin scala
ordlnala, In cazul unor raspunsurl precum "studii primare" studii medrl" t d"
tr I" d" . ' " , "S U II
pos e, "stu ". unlversitare" etc. Realizarea unor" scoruri vizand gradul de
.ntvelul cunotintelor generale implica obtinerea unor indicatori
nUmerlCI, scale lor de tip interval. In cele din urma, prin intermediul scalei
de propor1;lI, nlvelul de colarizare poate fi reflectat prin numarul de ani de I"
absolviti (ex. 5; 12; 16 etc.). coa a
. De. trebuie remarcata distinctia calitativa dintre scalele
I pe de 0 parte, respectiv scalele de interval i proportii, pe de
alta . Pnmele sun.t scale presupunand apelul la' teh nici
nO.!1=parmnetn(fe, mai putin sofisticate. In schimb, variabilele masurate
pnn In cele mai multe cazuri, tehnici statistice
pa./:.3metnce;"mal In de fata ne vom axa
ultlmelor, deoarece In cercetarea pSlhologica ele constituie 0 majoritate clara.
1.2. Analiza descriptiva univariata
. amintite anterior cele prezentate Tn nota de subsol of era 0 buna
In!roducere" In problema analizei statistice descriptive. De aceea, ne vom rezuma
:a . doar ale unui asemenea demers descriptiv,
:nslstand Insa coeficientulul de corelatie r, ca element fundamental Tn
unor precum analiza factoriala sau regresia
IInlara.---. "', '"
(1) Descrierea unui set de date necesita putindoiparametri
1
Unul vizeaza add unei valori
pentru respectiv de date, -, 'iar celalalt vizeaza gradul de
urmannd sau eterogenitatea unui
pllda, daca am Incerca sa descriem un grup'doar prin prisma primului parametru
(ex. ambele c1ase de elevi obtin 0 medie generala de 8,25) nu am putea afla daca
' M '
infcrmaiii de a!'parametrilcr tendiniei centrale ai pct fi
Hch (2nOcOOrlc) mtro uctlV, recomandablle fllnd lucrarile lui Hchn, Varga (1999)
n ,adu I cclab. (1993), cn Sava (2002). ' '
3
___ .IIII.IIII! 'Iii illl :111: I111111I illi 1111111111111: :11111111,1111 ,II Ii' 'il I!' 'II !Ii II' 'il : 'II Iii II I: Ii II Iii ,I ,i: II; ill :11 :11
1111111,111, III 1111 IlIi'11i illlJ Ii ,II
!, i, ,'I ,! ': " :llIIIIIUIIIIIUIIII 1111I IIII'IIIIIIIIIIII'JIIIIIJIIIIII:IIIIllilllllWlllllIJlllIlEIillWllllWlllllOOllllWllllllIlllll:llll1lJllllllllllllll, 1111'1'
r -
l
J
J
I
L
L
ciasel
e
sunt similare, deoarece una ar putea fi formata din elevi omogeni, toti
avand media Tn jurul valorii de 8,25, In timp ce cealalta cJasa de elevi ar putea fl
. formata din doua categorii diferite de elevi - foarte buni slabi -" dar care
Tmpreuna ar conduce la 0 medie egala cu cea a primului grup.
Tn functie de scalele de masurare utilizate se parametrul
tendin\ei respectiv datelor ,care ar trebui calculat.
Mediana; Mod

Medie; Mediana; Mod
- ......,..-
Mod
Figura 1.1. Parametri posibili ai tendintei centrale, In funct
ie
de tipul de varia bile
Tntre parametrii \ standard cei mai
Intalniti In cazuTOatelOr"riumerice, iar 'a"bi3tereElIhtercuartila este mai des utilizata In
cazul 'datelor masurate prin scale ordinale. Tn ceea ce datele nominale,
situatia este neclara. Indicatori precum entropia,
de indicele de diversitate sau cel al dispersiei calitative sunt
necUnoscuti lipsesc cu din programele statistice pe calculator. In
consecin\a: raspandirea lor este minima, majoritatea cercetatorilor
la a urmari pentru fiecare raspuns posibil (Weisberg,
1992). .., ..... , .... .
Tn gel1eral, indjcatorii iau
dintr-un set sunt identice. Cu cat datele sunt mai cu atat
valorile sunt mai mario
Tn cazul mai frecvent Tntalnita pereche de parametri
este _rll.E?s:tJsl", ca indicator al tendintei centrale, ca
indicator al datelor. De altfel, parametri au cele mal multe
avantaje tehnice, permi\and realizarea mai multor operaiii precum standardizarea
datelor, c\asificarea raspunsl,lrilor etc.
Tn anumite situat
ii
media abaterea standard pot conduce la
rezultate distorsionate, iar pentru a evita acest lucru este esential sa inspectam
grafic situa\ia rezultatelor obtinute.
(2) analiza descrlptiva.a datelor
Reprezentarea este 0 metoda a observa distribuiia
datelor,. ea fiindcu atat mai utila cu cat numarul de
.. .....
4
Exista 0 multitudine de grafice posibil de realizat. Alegerea unu'l anum't t'
d
f f f . - . I Ip
e ra ace m. unctle de modul de masurare a variabilelor, dar de aspecte
pre eren ,Ia e, ce .. sUbiectivitatea fiecaruia. In functie de tipul de date
colectate, cele mal mtalnlte grafice sunt: .
diagrama circulaciU"p.lacinta") pentruvariabile de tip nominal;
hlstograma modificata pentru variabile de tip nominal sau ordinal'
histogramasau poligonul frecventelor pentru
..
lata un exemplu de reprezentare grafica prin metoda poligonului de frecvenie:
I ...... frecventa I
6
5
4
3
2
20,2 23 25,8 28,6 31,4 34,2' 37 39,8
Figura 1.2. Exemplu de poligon a/ frecventelor, reprezentare tipica pentru datele numerice
(3) Analiza datelor este influentata de forma distributiei datelor
. Dincolo de aspectul pur intuitiv al reprezentarii foarte importanta
este mterpretarea formei Aceasta ne ajuta sa lnielegem doua
(a) care sunt",l2.9rametrii tendintei, centrale care reprezinta cel
de date?; (b) ce fi utilizate pentru a testa anumite
_ Se ca multe dintreaspectele realita{ii ali 0 distributie normala. Sa
caz.ul Intellgentei. Cei mai multi oameni au 0, inteligenta medie. Intalnim tot
mal oameni ce mergem fie spre 0 inteligenta superioara, fie spre
un gray de IntelJgenta. 0 asemenea situatie, denumita distributie normala
po ate fl reprezentata grafic sub forma ul1.l,lU:lopot. _. ... '
5
\
'1
I
\
!
II
II
I
I'
i
I'
I
j
'1;
,1
_____ :1111. III, II! ',i
Figura 1.3. Forma unei distributii norma/e a date/or.
Multe teste statistice parametrice (utilizate in cazul datelor numerice) au
dreptcondit
ie
de aplicare normalitatea distributiei datelor. De
sa., <,::aracterizam forma distr,lPU\iei; .. ob.tiJ'tute. '. i.nt.e .. r.T .. doua aspecte.
nivelul de bo)tire, respectiv (b) ri!"relul _ .
.... 'TarO" distributie normala este are.
mediu .. de boltire (nici prea joasa, nici prea Inalta). Totodata ea este adlca
nu este Inclinata evident niei spre stanga, niei spre dreapta.
--
--
'\
I \
I \
I
I
I
I
I
Curba leptocurtlca
Curba normal a
Curba platicurtica
L-____
. Figura 1.4. Devieri ale unei curbe simetrice din perspectiva bo/tirii date/or

Cum interpretam distributiile prezentate In figura
se obtine atunei cand subiectii au rezultate 0 fre,.yent
a
mare'a rezultatelorJnilJD,llmediei"tapt ce ne conduce la ideeaunui
Un exemplu ar fi 0 clasa de elevi, ale caror rezultate sunt foarte
copii au note cuprinse Intre 1 :;;i 4, cativa copii au rezultate :;;17, lar altl elevi
au rezultate superioare, cuprinse intre B :;;i 10. Reversul sltuat
1el
este reprezentat
de 0 distributie featocurtica. Aceasta indica un grup omog,en .. 9.?date, In care cele
mai multe in cazul clasei de elevi,
6
It

I):


1;

i,II!!IIIIIII,IIII!:IIII';IIIIIIII:IIIIIIIII!:11111111I 1111 '1111 'III:,IIII:IIIII'IIII:III! I111 ,1111 1111:'llll 1IIIi 1111.1111 1111: 11111illlll,111111J11111 1111,1111 I111 ;1111',1111:111 111111I III! 11111 111111 IIIII"IIII! 1IIIIi 11111 I11111 11111'1111111111.111:111111111111'1111.1111111111111111:111111111,11111 1IIIIi 11111 '11111 11111'11111 11111'11111 '1111 11111111':111111'111111111111111111'11111'111111"11111111111111111111111111111111'1111111111111"1111111111111111111.11111:'1111111111 1IIIi 1111 111"1
aceasta ti copii cu perform ante apropiate. Cei mai multi ar Tnregistra
rezultate mtre 5 $1 7, m tlmp ce foarte putini elevi ar fi inclu$i Tn categoria elevilor cu
note sub 5 sau a celor cu note peste 7. Intr-o asemenea clasa lipsesc notele
extre_me, tapt ca nu toata de la 1 la 10 sa fie distribuita. in sfar$it, 0
curba mezocurtlca are un medlu, normal boltire, ceeace inseamna ca
multi copii au rezultate apropiate 'de valoarea mediei, de:;;i exista unii elevi foarte
slabi, respectiv foarte buni, toata gama de note fiind acoperita.
(b) Distributia datelor po ate varia $i Tn functie de nivelul de sirnetrie a
dateior. In cazul !n care distributia este asin;atrLca P9.litiv, valori
mici deciit mario Intr-o situatie $colara, aceasta ar corespunde unui test diticil, in
care majoritatea elevilor obtin note mici, de$i sunt $i elevi care obtin rezultate
$colare bune. in schimb, 0 distributie .. negativ.jqdica un al
valorilor Tn directie opusa. Vor aparea mai multe rezultate mari decat mici, tapt
care, transpus Tn note $colare, arata predominanta notelor ridicate. in cazul
probelor psihologice, prima distributie poate fi socotita un indicator al unui grad de
dificultate ridicat pentruproba respectiva, Tn timp ce 0 distributie asimetrica negativ
semnifica un grad scazut de dificultate a probei. ca aceste concluzii
sunt valide Tn condi\iile Tn care valorile ridicate indica superioare, Tn
timp ce valorile mici arata performante scazute.
Figura 1.5. Distributie asimetrica pozitiv (in stanga) i distributie asimetrica negativ (in dreapta)
Pentru a evita interpretarile subiective, se pot calcula doi indicatori care sa
ajute la .. '"'- -,' .
(in engleza evalueaza
gradul j!.!3."aslmetne al unei distributii. Valoarea(zero indica 0 distributle_.perfect
sirneirica. Valorile negative, indepartate de zero,"-indica 0 distributie
negativ, in. timp ce valorile pozitive, cu cat se indeparteaza de arata 0
asimetrie pozitiva. Pentru a diferentia 0 distributie u$or asimetrica, ce poate fi
ca 0 distributie normala, de 0 distributie clar asimetrica, Lewis-Beck (1995)
la drept prag valoarea absoluta de .BO. Astfel, 0 valoare a indicatorului de oblicitate
inclusa Tn intervalul [-.BQ_L"",80j"poate fi tratata ca un semn al unui. distributii
Valorile mai mici de -.80 indica 0 asimetrie negativa, in timp ce valoril'e
mai mari de .BO semnifica 0 asimetrie pozitiva. Aceasta regula implicita merita a fi
aplicata mai ales Tn conditiile unui e$antion mare de subiecti, sa zicem de peste
150 de perso?-ne.
7
'.-
111111,'1II11I1111111II11111111111!,III"llilll:
;l:
,1',
\i
1
J
'II II II: ':, :1 'I 'II :lli 1111 illl 1111 1111 :: Ii 'II III, 1111 :llli 'I 'i: 'III 1111111111' Jill! :1111: 11111 :III! !lli ,III: illl :111 III; :111 lit ;m 1m ,m 1m !III: 1ffi 'III :11' 'III j, II', 1'1 m lli, m 1W ',W, % ',% WI/, '111M WI/, WI Wr'W, fu lli 'i' " II 'I'
In cazul Tn care volumul,8J}antionului este mediu sau mic, putem adopta 0
alta strategie, bazata pe a indicelui d,e Aceasta
presupune Tmpartirea valorii indlct9IHll:!Lge obliCftate la
a acestuia. Ambele elemente sunt oferite de SPSS. Field (2000fpropune dOLia
lui z Tn functie de numarul ge persoane testate: 2,,li.ll.pentru un
mai mic de 30 de subiecti 1,96 pentru un mare de 30 de subiecti.
autor renun\area la regula Tn cie
subiect
i
, sa zicem peste 150, deoarece z are mari de a deveni semnificativ,
datorita scaderii erorii standard a oblicita\ii.o da!a cu marirea .
TabeluI1.1. Exemplu de valori ale mediei, medianei 9i oblicita\ii privind varsta ideala pentru
casatorie
Varsta ideala pentru casatorie
N
Media
Mediana
Oblicitatea (skewness)
Eroarea standard a oblicitatii
15
.'
26,00
25,00
2,240
,580
Fiind testaii doar 15 subiecti, vom imparti oblicitatea la eroarea sa
standard vom obtine 3,86 (2,24 : 0,58). Rezultatul, Tn valoare absoluta, este
superioc pragului specificat, de 2,58, prin urmare avem de a face cu 0 distribut,ie
asimetrica pozitiv. Deoarece In astfel de cazuri mediana este un parametru
adecvat pentru a descrie de date, am putea spune ca subiec\ii chestiona\i
considera varsta de 25 de ani ca varsta ideala pentru casatorie. E de remarcat ca
opera\ia trebuie completata de inspectarea graficului rezultat, deoarece distribut
iile
multimodale nu pot fi detectate prin urmarirea indicatorului de oblicitate.
Nu numai oblicitatea poate fi estimata exact. Boltirea beneficiaza, de.
asemenea, de un astfel de coeticient pentru a determina normalitatea unei
distribu\ii. Indlc.aloful.de boltire (1n engleza "kurtosis") este estimat de SPSS pe
baza principii ca In cazul obllcita\ii. Valoarea zero indica 0 distribu\ie
perfec(JuezocuQi.c
a
, valorile pozitive, cu cat sunt mai mari, arata 0 tendint
a
spre
distribu\ii Jeptocurtice, In timp ce valorile mai mici de zero, semnaleaza tendin\a
spre 0 distributie jJlaticurtica. Field (2000) recomanda calcularea lui z kurtosis dupa
criteri; pentru oblicitate. .........-.. ...- ..
Daca exi!?tadubii cu privire la gradul de 1}9DllHtatSl,a distribuiiei datelor, se
recomanda testarea"conditiei de normalitate' prin .
sJDlmQY. Daca .. y.Ellorile\s,u....o.t semnificat\v_e. statistic, putem afirma ca
---.. "" ..
In schimb, daca z este
nesemnificativ statistic, yom putea afirma ca distributia observata nu difera
semnificativ de 0 distribut
ie
normala teoretica, deci poate fi considerata ca atare.
Din pacate, rezultatele sunt sensibile la numarul de subiec\i testa\i. Daca
ob\inem mai putin de 30 de date, exista mari ca z sa .nu fie semnificativ, cu
8
1:111111111111 '111111:111111111111,11
exceptia unor cazuri grave de departare fata de 0 distributie S"I -
I
. "a. Iml ar In
cazu unul numar mare de date, sa zicem peste 150-200 . I'd .'
.. . . ,nscu e a obtlne un z
semnl.flcatlv mare, chiar la departari minore ale datelor de' m d I I
teoretlc al unel dlstnbutll normale 0 e u
, .
(4) mediei i a abaterii standard permite analize
statistice compleme'ntare
. !n. cazul unei standard au 0 serie de
, fw.<.!._.,. __ . escnp Ive sau inferent,iale propneta\1 care permit obtlnerea unor inforn""latl'I' d . t'
complementare. . .-
(a) Standardizarea date/or
. .. _De obicei colectam datele Tn forma lor bruta, pastrand unitatile de masura
Iniliale. In putem vorbi despre faptul ea 0 persoana a 7 puncte la
de agreslvltate verbala, 18 puncte la un test de atentie con'centrata 43 de
coreete. la un test de acuitate vizuala sau ca ma'soara 180 de De
cele mi;lI .multe on nu cunoa9tem ce semnifica\ie au aeeste cifre. Exceptie fae
cazunle m. care avem _ 'despre evolutia rezuitatelor, precum 'datele
I:gate de malilme, greutate ori unele informatii cu caracter general
de tlpul venJtulUl lunar, al temperaturii etc. Spre exemplu, nu yom eunoa!?te
rezultatul de 18 punete la un test de atentie concentrata' este mai' bun decat
ob\tnerea a 43 de raspunsuri corecte la testul de acuitate vizuala.
. .. a rezolva problema, se poate recurge la transform area rezultatelor
Inltlale, din, cote brute Tn cote t d d' . .
, . c., , s EXlsta mal multe tipuri de
transforman, toate avand la . ..
.... Transforn:ate sunt egale cu media vor avea
, 0 .. negative vor aparea'peritru scoruri iar
valonle pozltlve, pentru rezultate superioare mediei. Mai .mult, abaterea standa' d
datelor transformate In cote va fi Intotdeauna cu1
putem c?mpara once variabile, deoarece toatevor media 0 iar
standard 1. In plus.' se caTntr-o peste
din rezultate vor. valorl z cup rinse Intre -3 +3.
transformarea oncarel valori in cote z este: ".. ..'
\ x-m
; z=--
s
(1.1 )
unde.X este valoa:ea c.e fi m este m.gia obtinuta Yn
. respectlv on media popula\iei; iar s este abaterea standard a
sau a cazulin care este cunoscuta). ,V" ..
t Astfel: daca sa transformam Tn cote z cele 43 de puncte obtinute la
estul de aCUltate vlzuala, yom ob\ine valoarea -1,71, daca este' 55 iar
indica un numar de raspunsuri corecte mult mai'mic
edla. Similar, daca yom transforma in cote z rezultatul ob\inut In urma
9
Illi !II Ii III 'II' !II 'II' III' ,III 'I!' 'II' '111111111111111111 i' ii: 'I !IIIIIIIII :IIIIJIIIIII'JIII !III'JlIIIIIIJlII:1II 1111 III ill! .III' 11111.,.1111'. ____ -11_11111111111111:111111.11111,11111111111,111 11111111: '1111111111'.111111'11111 ,IIII! 11111,1111: 111111111' '11111111' '111'1111'11111111' '1111'111 :11111111, ,11111111, ,11111111111111111111 iIIllllllll ,1111 'III
. _ . = 3 11" X = 18) yom obtine -0,96. Pe
testului de concentrata (m -.21, s , .' lar sub'medie,
baza acestor transformari putem aflrma ca, am. A bfnuta la
performania la testul de ateniie concentrata este ;nal buna decat cea 0 ,I
testul de acuitate vizuala. . . t I
Pe baza cotelor z se pot calcula alte cote standardlzate, precum
I
t t d t Ion are preliminara a testelor. -
. T. Acestea apar frecvent ca moda I a e e e a
'.--.. .'-!, .
(b) . .' standard ofera mai
'In cazul'Unei dlStubutll normale, media . :'C, .
. . ." .. ' b'ect Intr-un grup de oamem.
multe cum ar fi locul.pe un su I . -- .,...... C d
Spre exemplu 'putem determina poziiia unei persoane cu un mvel de mtetilgdenr,ad '1
e
5
' ., d' t 100 10 iar abaterea s an a
11
5 10 In conditiile In care mteilgeni
a
me Ie es e '. . d t
. , , . . . d' t'b t" rmale putem emons ra
10. Altfel spus, prin apelulla proprietai,le unel IS.n U,II no. 'Ii cate
ce procent de subiecti obtin rezultate mai man de 115 on yom
" . I' Totul va devem car aca
persoane au rezultate inferioare acestel va on.
Tntelege figura 1.6. '. A d arti
, In cazul unei distributii normale, media Tmparte Irul de ?ate oua PI d'
, ., A d" r 50% mal man. In cazu e
egale: 50% din rezultate sunt mal mici decat 0 mic de 100 iar
fata ne ateptam ca 50% dintre persoane sa alba un 10 mal ,
50%, un IQ mai mare de 100.
0,13%t
55
95,:44%
13,59%'"
85 100 115
13,59% 2,14% 'f 0,1
130 145
m + 2s m + 3s
2 3
Cotele z
Cotele t
mOo 3s
- 3
20
m,2s
- 2
30
mOo is
- 1
40
m
o
50
m + is
1
60
70 80
Figura 1.6. proprieta(i1e unei distributii noimale
Noi tim ca abaterea standard pentru acest eantion este de : 5 Pe
'1" t . I de persoane cupnnse mtre
baza acestei informatii putem stabll procen aJu .' r
anumite valori 10 Intr-o distribuiie normala Intotdeauna vor fl
-.=","",' . . I flata la 0 abatere standar a a
'3',1 J352/0 dintre rezultate Tntre medle I va oarea a . 'I
, . 34 135,{ dmtre persoane e
de med
'le Revenind la exemplul nostru, estlmam ca ,0 . I d
. . t' A d on mve e
testate rezultate Ihtre 100 I 115 10, acela1 procen aJ avan
10
111111,11111.111111 11111 I11111 11111.11""""1:""1""1:11'11"1.'""1""1."1"""111""1""""""""""""."""111111 11111:111111 1IIIIIillili 11111,,11111 11111 IIlIlillll 11111 1111 1111: 111111111111111111111 11111111111'111111111111,111111:1111' 1111 :II! 111111:11111'111111 111111111111 11111111111 111111111111 llillillllil 111111111111 111111111111 11111 ,,1111111111111 !IIIII 11111,:11111 11111:111111 11111 111111 11111 111111 11111 111111 11111:11111 II 11111111'111111111 iii Ii
I
I


tl


!
ij

Ii
is
!!

I
I
,
if
%

dezvoltare intelectuala cuprins Tntre 85 100 10. Daca yom face un simplu calcul,
yom constata ca dintre persoanele testate au rezultate cuprinse Intre 85 i
1'15 10, adica Tntre valorile situate la cate 0 abatere standard Tn minus, respectiv In
plus, de lamedie [m-1s; m+1s].
Tn mod similar se poate estima procentajul de persoane aflate Tntre diferite
sectiuni ale acestei curbe. Spre exemplu, procentul de raspunsuri cuprins Tntre 0
abatere standard faia de medie i doua abateri standard fata de medie este de
13.,59%, Astfel, In problema nivelului de inteligenta, aproximativ 13,59% din
rezultateau valori cuprinse Intre 70 i 85, respectiv Tntre 115 i 130.
Tn figura 1.6 sunt prezentate i cotele z, respectiv T, corespunzatoare
procentajelor stabilite pebaza proprietatii unei distributii normale. Astfel, Tntre
valorile -2 i -1 cote z, respectiv Intre 30 i 40 cote i, se regasesc 13,59% din
rezultate. Similar, Tntre -1 i +1' cote z, respectiv Intre 40 i 60 cote T, yom obtine

Pe baza acestor procentaje se pet stabili categorii calitative de includere a
rezultatelor, utilizand urmatoarea grila:
rezultate foarte slabe (valori mai mici decat cele aflate la doua abateri
standard - 2,27%);
rezultate slabe (valori aflate Tntre doua abateri standard sub medie !?i 0
abatere standard sub medie -15,39%);
rezultate medii (valori aflate Tntre o.abatere standard de-o parte i de alta a
mediei - 68,27%);
rezultate bune (valori aflate Tntre 0 abatere standard peste medie idoua
abateri standard peste medie -15,39%);
rezultate foarte bune (valori mai mari decat cele aflate la doua abateri
standard peste medie - 2,27%).
Proprietatile distributiei datelor observate sunt esentiale, nu doar Tn
statistica descriptiva, ci i Tn cea inferentiala, cum ar fi testa rea ipotezelor. Trebuie
remarcat ca nu toate tehnicile statistice inferentiale se bazeaza pe proprietatile
unei distributii normale, Tnsa 0 logica similara este utilizata i Tn cazul altor tipuri de
distributii. 3
(c) Estimarea
Daca analizele anterioare se plasau la nivelul lotului de subiecti testati, pe
baza standard ai eantionului pot fi calculati i param,e,trJi,statistici
de la nivelul populatiei din care a fqst extras e9antionul. Acest lucru se obtine prin
estimarea erorii i a intervaluluLde Incredere asociat
Foarte rar poate fi testata Intreaga populatie, din cauza resurselor limitate,
de aceea se obinuiete a se extrage un singur eantion din cadrul acesteia, dei,
teoretic, pot fi extrase randomizat 0 multime de eantioane.
3 C ..
el Interesa\i sa cunoasca mai multe informa\ii despre proprieta\ile matematice ale diverselor tipuri de
reparti\ii ale datelor pot consulta lucrarea lui Clocotici Stan (2000).
11
1111"1111,1111111111"11111'1111111111111111111,111111,11111,111111,,11111111111 111111'111111"111"'.____ - _111111111,'" III 'I!,'II 'II II! III II!ill"il 111111
"
111 "I'IIII"II!'II"IIIIII"III!!'"
F
\
J
Sa presupunem ca vrem sa masuram nivelul de empatie la 0 clasa de liceu
:;;i un rezultat mediu de 14,3. Daca am fi evaluat nivelul de empatie i
a
clasa de vizavi am fi obtinut 14,7, iar daca am. fi extras un e:;;antion dintr-o alta
clasa am fi. obtinut 14,2. Continuand, Tn cazul extragerii aleatorii de e:;;antioane
pentru a identifica nivelul de empatie, am obtine 0 serie de medii, pe baza datelor
observate. Majoritatea mediilor ar lua valori apropiate de cele mentionate anterior,
putine dintre ele Indepartandu-se de. acestea. Cu alte cuvinte, yom obt
ine
' 0
distribut
ie
normala a extrase, care vor avea 0 anumit8
variabilitate. Gradul de a a.sestor valori se standard
a_mediei"ea fiind un estimator analog standard la nivelul
Aceasta poate fi calculata pornind de la datele obtinute dintr-un singur iar
formula de calcul este:
S
sm = .j;;,
(1.2)
unde-seste abaterea_standard a iar n este Din
se deduce ca In in care datele -;ul1lP
u
t
ine
i TmJ2.!:tia!e, respectiv mai mica, daca exista multe date, iar grupul obseNat"este '.
omogen.
o varianta similara este eroarea standard a frecvent
elor
, utilizata des In
sondajele din sociologie, fiind cunoscuta publicului larg sub numele de eroare de
eantionare. Astfel, procentul de eroare dintr-un sondaj, sa zicem 3%, Tnseamna
tocmai eroarea standard a frecventelor.
Eroarea standard a mediei este capitala, atat pentru test<![s.a ipotezelpr
bazate pe diferenta dintre medii, cat pentru estimarea unui interval .. de
incredenLal medie("J\cesta include valorile Intre care ne sa gasim
la nivelul populaiiei, pornind de la media obtinuta In eantionul
studiat.
1.3. Analiza descriptiva bivariata
In cazul Tn care doua variabile sunt analizate simultan, vorbim de 0
statistica bivariata. Cei mai importanti indicatori descriptivi Tn aceasta direct
ie
sunt
indicfJtprii ... .asociwe, sau relationarea variabile poate fi
Inteleasa prin termenii de (Neuman, 1997), Doua
variabile covariaza daca .. valorile uneia variaza Tmpreuna cuyalorile celeilalte. Tn
realitate se pot constata tot felul de astfel de legaturi. Se obseNa, Tn general, ca
venitul personal ridicat covariaza cu un numar crescut de kilometri Tn
personala,' ca rezultateie ridicate la matematica sunt asociate cu rezultate
bune la fizica, ori ca un grad crescut de timiditate covariaza cu interact
iuni
socia Ie
mai puiine etc: Conceptul de independer)ia este opus celui covariani
a
, Atunci
cand valorile a doua varia bile rluse asociaza spunem ca cele doua variabile sunt
12
,"",, ""''''1111'1111111'111111'11: II! 111"11
ar fi absenta relat
iei
la adulti Intre ordinea la
. "Pent,ru a vedea covariatie dintre dO' .
diSpOZI\le trel elemente descriptive: ._....- .. '... oua vanablle avem la
(1) calcularea coeficientilQC _ca indicatori de asociere'
(2) de p'Lincte (In en lez':=--- ' " .
(3) realizarea de t bid :-'-'C, 9 a ),
a e e e (asoclere). ..
1.3.1. Coeficientii de corelatie
, ,
Indicatorii descriptivi care arata gradul de cova'" 0"
sunt denumiti coef' f d . -, .. J
I
9\le dlntre doua vanabile
,lcleo,l. este 0 forma.,.JP"ndardizata a
__ ,L...! problema masuraru datelor prin scale diferiteAstfela 0
yom covananta dintre venit !?i numarul de an' 0" .'
vanabila va contribui mai mult la vale .', I, de absolvltl, pnma
. , area covanantel obtinute deoar
ampiltudlne mai ridicata (venitul poate varia mai o ' ,ece are 0
100.000000 rnsa 0 I . . . ,sa spunem Intre 0 lei
25, de ,se poate afla doar Tntre 0
dintre venit !?i numarul de!? . d a speclalizan). Mal mult, valoarea covariantei
ani e va fi cu siguranta' d '
rezultata rntre doua variabile care sunt masurate printr-o mal mare ecat cea
o la 1. Standardizareadatelor in cote z elimin 0 ce rr:
erge
doar de la
toate v . ' b'l I' .,..," a aceste Inconvenlente deoarece
ana lee aJung la un nivel egal d rt d' '
-3,5 !?i 3,5 qlte z. Aceasta standacdiza e amp I cuprins Intre
gradului de asociere d' t I . . ... egallza .. I(lfluenta vanabllelor asupra
d . .. IO,.[e."e e !?I, mal Important, va permlte compararea gradului
e asoclere dlntre cu asocierea dintre doua varia bile,
Tabelul 1.2. Alegerea coeficien\ilor de I
variabilelor core alie Tn func\ie de modul de masurare a
"
Tip de variabila Dihotomica Nominalfi * Ordina/a Numerica
Dihotomica r, <1>, X
2
, X
2
, 11., C, V 'C (tau) r, r biserial,
r tetrachorica r. punct biserial
Nomina/a * X
2
, 11., C, V X
2
,1I. X
2
, 11. **
Ordina/a r Spearman, r Spearman,
'C (tau) 'C (tau)
Numerica r
Date nomina Ie cu mai mult de do 0
..
_ ua categorll
" ,In cazul gruparii datelor numerice in c1ase
Exista mai multi coeficientJ.,.d I f
functie de tipul de d t ' It' .. Gore. a,le, selectarea lor facandu-se In
. . . a e.,GO ec ate (nomlnale dlhotom' . ,
doua categorl'l' 0 d' I . , .,."t
ce
, nomlnale cu mal mult de
,r lOa e sau numence) dar "I d I'" .
dintre doua vat" "" .' y e, Inlaut;3tea (monotonia) relatiei
la Ie, '
13
'Iii 'II
ii: 111111iJlJl! il! Iii 1111 III:!III III: Iii ,III 'I!! !II, 'II! ill 'II! I!! ,!!IIII'WIIIIIIII,llllilllllJlllll,!! 'II: 11'111'11: !I: ,I': :Ii 111'1
11111'111111111111 IIIII:IIII! 11111 '1111 111:;111 111"lli III ,11:11 !Iilill 1III,IIIIIIII'lllillll'IIIIIIII,IIII,III'III:llli:::111:11111:11111111:1II1111:1II1111,III'illlill"
Toii coeficienti, cu excePtia lui _X2, sunt permitand
compal!'liiidirecte. cum remarcau Clocotici Stan (2000), exista
de masurare a gradului de asociere: cele d]mr:;J!9!LaJ!', cuprinse fntre -1 1,"
respectiv cele (ledirec-ti9na/e;, implicand valori Tntre 0 1 (figura. 1.7).
-1
asociere negativa (inversa)
o
\ipsa de asociere

o
.
lipsa de asociere asociere pozitiva (directa)
prezen\a asocierii
Figura 1.7. Evo/ulia coeficienti/or de core/atie direclionali (sus) i nedirecfionali Oos)
Dupa cum se observa In imagine, cu cat un coeficient direc\ional ia 0
valoare mai.mica de zero (minimum fiind -1), cu atat exista 0 asociere negativa mai
intensa fntre variabile. Prin asoG.ierenegativa Tntelegem ca cele doua variabile
covariaza In sens invers: cand una cre:;;te".cealalta scade. Un exemplu de corelatie
negativa -;;te'relatia dintre consumul de tutun rezistenta fizica la efort. Un
consum zilnic mare de tigari tinde sa duca la scaderea rezistentei orgariismului la
efort.
In schimb, cu cat un coeficient ia 0 valoare mai mare de 0 (maximum fiind
1), vorbim de 0 corelatie pozitiva fntre variabile,cele doua 41'lergand Tn
di@tie. Spre exemplu, exista 0 corelatie pozitiva Intre consumul de tutun
numarul de probleme de sanatate la nivel pulmonar. Un con sum mare de tutun
riscul de aparitie a unor boli pulmonare. in sfar:;;it, daca 0 corelatie este 0
sau foarte apr:.oape de 0, atunci cele doua varia bile sunt independente,
Un asemenea coeficient se obtine, probabil, fntre numarulla pantofi
al unei persoane nivelul sau deinteligenta, fntre cele doua variabile neexistand 0
asociere.
Nu toti indicatorii iau valori cuprinse Tntre.-1 1. Unii pot varia dOar Tntre 0
1, unde zero semnifica absenta corelatiei. Cu cat ne Indepartam de aceasta
valoare Inspre 1, cu atat exista 0 asociere mai mare Tntre variabilele studiate.
Coeficientul de corela1ie r Bravais-Pearson
Datorita caracterului numeric al majoritatii datelor observate Tn psihologie,
coeficientul de corelatie sirpQla r este cel mai de asociere. EI este
un fnseamna ca poate lua valori Tn intervalul-1i 1.
Coeficientul este cunoscut sub 'mai multe denumiri, precum: coeficientul de
corelaiie IiniS![a_simpla, coeficientul de corelatie a produselor momentului,
coeficientul de Dintre multitudinea de formule, cea mai
simpla este:
14
1
r=-"'zz
NL..J x y
(1.3)
11 ' ,11 " 111111
1
111111111111"1 "I' "1"1:""11"'""""'""'""""""1""1"1""'""1.11
111'11111111'111,1'1111'111'1111'111'.",'1"1,,,1 1111111111111111'11111111111111111111111111111111111111 II' II: III 11I1!1I111 1111111111 1111:1111 1111 1111'111111111111111111111111 11111111 III III1'"11"1"1'11111"'1"1111'"1"1'"1 III,"
unde N reprezinta numarul de' subiecti testati iar Z 'Z '"
standardizate ale variabilei X, respectiv Y.' , , X:;;I Y reprezlnta cote
- P.entru a fi aplicata, ambele variabile trebuie masurate prin sc I. .
(sau in cazuri exceptionale prin variabi.le nominale d'h t . ) a
, . b'l ' ' , . I 0 omlce. In plus relatia
dlntre vana,_I: __ _ Pentru a fntEilege mai bine ideea de
.. yom apela la reprezentarea graflca a norului de puncte.
1.3.2. Reprezentarea grafica a variabile
.,,-""'"1
\""',Noru,1 de punc:e, :;;i sub denumirea din engleza de scatter lot"
este un graflc cu doua axe flecare dintre ele" I" d _ '
. . . . , , " Imp Ican una dmtrg",Gele doua
eXlsta 0 regula clara pnvlnd care dintre variabile sa fie reprezenfata
c.are pe -dupa Neuman (1997),. daca putem distin e
mtre irydep"endental(c,::auza) :;;i variabila c;lependenta (efect) at . . 9
va fi sltuata pe b
. ,. I' --.... . -., uncI pnma
lar ulima pe ordonata. .
- '--.---. -.
_9
c
<D
"0
<D
o

0.
;s
C
co
c7
'6
co
Cii

<D
OJ
co
'g5
::;::
5
8 4
6 3
9
7
2
10
10 15 _ 20 25 30 35
Capacitate a de memo rare
Figura 1.8. Tabe/u/ curezultate i norul de puncte in urma reprezentlirii date/or
b t Pentru yom realiza norul de puncte (diagrama decorelatie)
.aza ?e m,edll a zece subiecti la doua probe: capacitatea de
vlzuala (exp,nmata pnn numarul de cuvinte memorate dintr-o fn 30 d
secunde) .performanta (masurata prin mediagenerala' din
precedent). Pnma va fi notata cu X, in timp ce performani
a
va fi notata cu
15
,"", ilill ill'
:1
'I
-l
Y. Sa presupunem ca au fost obtinute rezultatele prezentate in partea 'din stanga a
figurii 1.8.. .
Am Tnlocuit punctele din nor cu numarul de identificare al fieearui rezultat:.
Astfel, indieele 1 reprezinta locul pegrafic dat de rezultatele obtinute de primul
subieet testat (X = 12; Y = 5,91), indieele 2 reprezinta loeul pe grafic aflat la
intersectLaIezultatelor celui de-al doilea subiect (X = 18; Y=7,44)
\ de punete .ne ofera 0 serie deinforma\ii im[lortante, vizand (a).jQl]1,i!.
relatiei dintredoua varfabile (Iiniara sau non-liniara),' (b)
pozi'tiva, negativa sau absenta), respectiv (c)
(puternica, medie, sd3zuta). Toate aeeste aspecte vor fi disGutate Tn eontinuare, nu
Tnainte de a aminti ca nivelul ealitativ'al interpretarii bazate pe norul de puncte este
dependent de numarul de subiecti testati implicit,de punctele reprezentate
grafic. Cu._pat sunt maL!nulte date, cu atat
descriptive, pe baza norului de punete, .
(a) Forma relatiei
Relatia dintre doua variabile poate lua trei forme: liniara, sau
I .
independenta, prin ultima Tn\elegand, de fapt, absen\a rela\iei (figura 1.9).
12,00
",00
10,00
,.00
'.00
7.00
'.00
5.00
'.00
'.00
-.,,"-"-

2,00 4,00 6,00 &,00 10,00 12,00 14,00 16,00

2.00 4,00 6,00, II.IlIl IIl.GO 12,00 14,00 16,00
Figura 1.9. Exemple de nor: de puncte:
relat
ie
liniara (stanga sus), relatie neliniara (dre,apta sus), absent
a
relat
iei
Oos)
16
II III 11111111', '1111 ilil
Oaea relatia esteJi;]arfJ, atunei norul de punete pare a avea 0 sin
direc\ie, care poate fi sUbliniata printr-o linie Oaca relatia este
norul de punete are 0 care poate fi semnalala prl:-ntr:I .'
'. 0 In Ie
In se poate observa In cadrul norului de punete
pnn punetele fiind distribuite parea .
_ flgu.ra capaeitatea de memorare vizuala performan\a
eXlsta 0 relatle linlara. Se observa ea norul de puncte evolueaza liniar,
dinspre stanga jos spre dreapta sus.
(b) Direetia reiatiei
. . Tn ea::ul unei reJatii . liniare, se poate apreciadireetia norului de punete
(flgura 1.: 0) .. In aces.te eo.nditii vorbim de 0 relatiILpozitiva" daca norul de puncte
evolu:aza dlnspre .stanga sus. Aceasta Inseamn<3 ea valorile mici
ale lUi X asoclate .cu valorile miei ale lui Y, iar valorile mari ale lui X corespund
unor va.lon man, Y. Titulatura de directie pozitiva vine din faptul ca 0 astfel de
a .. duce la 0 valoare pozitiva a eoefieientului de eorelatie. 0
dlrectle poate fi sesizata Tn graficul viz;3nd relatia dintre de
men:orare performantele Prin urmare, ne ea valoarea
coeflclentulUl de corela\ie dintre cele doua valori sa fie pozitiva. De altfel, r rezultat
a fost 0,79, estimarea faeuta pe baza norului de punete.
. dintre doua variabile poate fi sesizata grafie, daea directia
norulUl puncte evolueaza dinspre jos, fapt ce
Ideea ca rezultatelor mari ale lui X Ie eorespund rezultate mici Y viceversa.
'"''
"..,
lD,OO
'.00
',00
7,00
'.00
,..,
,00
'.00
".
2.00
'.00 '.00
11,00
10,00
5,00
8,00
7.00
'.00
5.00
4,00
3,00
8,00 10,00 12.00 14,00 16,00 __
ZollO <1,00 6,00 8,00 10,00 12,00 14,00 16,00
Figura 1.10. Nor de puncte cu directie pozitiva (in stanga)
sau cu directie negative. (in dreapta)
(e) ihtensitatea reiatiei
In cazul gradul de adunare a punetelor Tntr-o anumita
directie poate varia (figura 1.11) ..
17
r=0,70
" ,
..
r=0,35
: :
r= 0,00
r:::0,85
r = - 0,70
r= - 0,35
'.,
..
. .
.. ..
Figura 1.11. Structura norului de puncte in tuncfie de nivelul relafiei dintre doua varia6i1e
(6exemp/e)
Se observa ca punctele asociate unor coeficienti de corelatie mai
(ex. r :::: .35) sunt mai pe eand punctele asociate unor eoefieienti. de
corelatie puternici (ex. r = .85) sunt mai apropiate de 0 linie imaginara, care
mareheaza directia de evolutie a punctelor. Cu cat punetele sunt mai
apropiat de liD@.-itl]_.ginara, cu atat intensitatea relatiei dintre doua variabile este
In directle pozitiva, apropiata de 1, fie Tn direetie negativa, apropiata'
de -1. Similar, eu eat punetele sunt mai dispersate, eu atat legatura dintre variabile
este mai scazuta, ori chiar absenta, valorile coeficientilor de corelatie fiind mai
apropiate de O.
Importanta reprezentarii grafice prin norul de puncte
, r"-", '; ,". ,._.... -,
Pe baza de LQ[[1Ja; directia :;;i i'ntensit(3tea unei relatii
putem obtine date importante din punct de vadere calitativ, Ele ar fi fost omise,
daca ne-am fi rezumatdoar la calcularea r.
Pentru a sublinia importanta realizarii (norului de
puncte) Tn interpretarea asocierii dintre doua yom prezenta nu mai putin
de patru grafice distincte, care au un singur lucru in comun: eoefieientul de
. corelatie r a fost, In toate cazurile, foarte apropiat de zero. Se !?tie ca un asemenea
rezultat indica absenta unei relatii, lnsa yom vedea cat de ln$elatoarepot fi.valorile
lui-r,daca yom neglija sa inspedam'norul de puncte,
Tn continuare vom descrie cele patru situatii distincte care conduc la un
coeficient de corelatie apropiat de 0..,. .
(1) Ab.!ttl.tCi asocierii dintre doua variabile, reprezentata printr-un
nor de puncte a:;;ezate f"ra nici 0 directie clara, cum ar fi relatia dintre nivelul de
inteligenta numarulla p';lntofi pe de adulti (figura 1:12).
18
Ii Ii: '11'1111111111, IIIIIIIIIIIIIILIIIII, 1IIIUIIII"IIIIIJJJlIIJJJ 'lJjl j' ,
'" N
0
N
!!? .'
;2
U')
4 7 10 13 16 19 22
Figura 1.12. Nor de puncte descriind absen(a re/atiei dintre doua variabile
. . Can? se obtine un scatterplot ca cel prezentat Tn figura 1 12 valoarea 0
coeflclentulUl de corelatie una co recta Cele d " . b'l .: .... _.. a
X nu
I
' . .' u a e cuvlnte, nu putem estlma valoarea lui X cand Yare 0
va oare mica on mare :;;i viceversa.
. (2) EXistenta a. doua punctelor din nor, datorate
probabll unor sUb-setun de .. dlstmcte cum a . f'" .... , .. .,,- .... .
cele"ale (figura 1.13). .. . ..... , c., ' r I rezu tatele barl;latllor fata de
4 7 10 13 16 19 22
o
'"
'"
o
1 4 7. 10 13 16 19 22
Figura .1.13. ,!or de puncte descni'nd 0 re/arie mtre doua variabile mascate de
prezenta unel a trela (stanga - varianta initia/a; dreapta - varianta in care cele doua seturi
sunt prezentate distinct) .
Graficul de mai
. poate fi considerat 0 reprezentare schematica a
asociatiei reale dlntre venltul lunar al unei persoane (abscisa) i cheltuielile
19
.'1I111111111111U1111
acesteia pentrucosmetice (ordonata). Tn acelal?i grafic este inciusa evoluiia
ambelor sexe. Privind In imaginea din dreapta, cu puncte au fost reprezentate
rezultatele sexului frumos, iar cu cerculete au fost reprezentate cele aie,barbati/or.
Din grafic se observa ca ambele sexe, de:;;i evoiueaza paraiei, au 0 directie pozitiva
a norului de puncte, ceea ce Tnseamna ca un venit ridicat covariaza cu cheituieli
mai mari In domeniul cosmeticeior. Mai mult, se poate observa ca barba\ii, del?i au
venituri salariale ceva mai ridicate, cheltuiesc mai putini bani pe cosmetice In
comparaiie eu femeile. Daca nu am observa existenia celor doua subseturi de date
l?i am calcula coeficientul de corelaiie pentru Tntregul lot, am avea surpriza de a
obiine un coeficient de corelatie. apropiat de a :;;i, probabil, am concluziona greit
ca nu exista 0 legatura Tntre venit i cheltuielile Tn domeniul cosmeticelor. Greeaia
s-ar datora faptului ca nu am tine cont de v2lriabila moderatoare "sexul persoanei",
care influenteaza relatia prin faptul ca unele venituri ridicate ale barbatilor ar fi
asociate cu cheltuieli mai red use Tn comparaiie cu cele realizate de sexul frumos,
iar unele venituri mai mici ale femeilor se vor asocia cu cheltuieli ceva mai ridicate
decat ale barbaiilor cu venituri superioare. Aceste aspecte vor masca evoiutia
liniara :;;i pozitiva a norului de puncte, ce indica 0 cretere a cheltuielilor pe
cosmetice 0 data eu ere:;;terea venitului perso!1allunar.
(3) Existenia unei forme -curbm!.'ii.. care deterrnina
schimbarea noruiui de puncte sau vieeversa, elocventa
fiind relaiia dintre nivelul de motivare (arousal) .:;;i performania Tn sarcina (figura
1.14).
Atunci cand norul de puncte are 0 direciie ee poate fi surprinsa doar
printr-o linie curba, putem spune ca variabilele .. Tntr-un mod /iniar.
Aceasta situaiie poate fi cauzata, Tn principal, de doua motive: fie neglijarea unei
ter1;s_ .. (imaginea din stanga), fie existent3 unei relaiii curbllinlLreale
doua variabile (imaginea din dreapta). Prima situatie implica prezenta unei variabile
moderatoare, precum Tn cazul discutat anterior, un alt exemplu elocvent putand fi
citit In Rotariu :;;i eolab. (1999, p.185-186). Cea de-a doua situatie va fi prezentata
Tn continuare. Daca yom calcula coeficientul de corelatie liniara r dintre nivelul de
motivaiie in intreaga sa amplitudine (cuprinzand persoaneslab motivate,optim
motivate sau supramotivate) :;;i performanta lor in sarcina, yom avea surpriza de a
contrazice una dintre eele mai vechilegi din psihologie ce afirma ca motiva\ia
(nivelul de arousal) nu afecteaza performania in sarcina. Cum explicam acest
lucru? Simplu:. daca observam imaginea din dreapta a figurii 1.14, yom constata
ca, pana la un moment dat, cu cat nivelul de motivatie este mai mare (pe abscisa),
performaniele in sarcina cresc (pe ordonata). Adica subiectii foarte slab motivaii
obpn performante modeste, Tnsa 0 data eu intensifiearea nivelului de arousal crete
:;;i performania. Toate acestea se Tntampla pan a la un punct, socotit a fi un nivel
optim motivational, dupa care situatia se inverseaza. Astfel, se poate constata ca la
intensitaii foarte ereseute ale nivelului de arousal, performania scade. Daca am
caleula eoeficientul decorelaiie doar pentru subieCiii aflati Tntre un nivel slab de
motivare :;;i un nivel optim de motivare (In stanga liniei punctate), yom obtine un
20
..
'I
if
rezultat pozitiv .de 0,65. Vom fi tentaii, astfel, sa afirmam ca exista 0 asociere
pozitiva fntre nlvelul de motivatie :;;i performanta in sarcina, ambele evoluand in
aeeea:;;i directie. Similar, daca am calcula coeficientul de corelatie r dear
. , ru
datele aflate Tntre un nivei optim de motivare :;;i supramotivare (Tn dreapta liniei
punctate), yom obtJne un rezultat negativ, de -0,65. Valoarea ne indica 0 corelatie
inversa intre nivelul de arousal :;;i performanta in sarcina; cu cat gradul de motiva're
performantele tind sa scada.
Pe intreg .lotUI de subiecti, cele doua directii opuse se anuleaza, fapt ce
conduce la sltuat
1a
de a avea un coeficient de corelatie egal cu zero. Aceasta
valoare ne-ar induce in eroare, deoarece spre deosebire de situatia absentei
legaturii dintre variabile (figura 1.12), de aceasta data se observa exista' 0
covarianta in evoiutia celor doua variabile, doar ea ea nu este liniara. De aceea in
astfel de conditii, nu este indicata calcularea coeficientului de corelatie r
fiind necesare alte solutii, precum cele prezentate in sectiunea 3.3.3.' ,

0
C\I


'"
1
U)
'"
0
'"


*.
U)
4 7 10 13 16 19 22
10
'"
0
0
'" I.
0
I .
0
0

0
0
. I
0 0 , .
0
. .
* 0
*
.
0
0
10
4 7 10 13 16 19 22
4 7 10 13 16
Figura 1.14. Evolu{ia curbilinie a norului de puncte
evolutiei diferite a unor subseturi de date (stangajos),
respecliv unel relatii non-liniare autentice fntre douB variabile (dreapta jos)
19 22
21
'!I
1,1
. (4) EXistenia unei q,oeieri clare .,Tntre doua vqriabile,. ma.scata Tnsa de
unele dalecE:!l<Jreme cpre. reduc coeficientului .de core/aile 1.1
o -'Situatie TI'1 care coeficientul de corelaile este putermc dlstorSJonat,
de;;; exista 0 relaiie variabile, apare in prezenta unor. extreme,
neobi;;nuite (in engleza Observand figura .1.15, putem dlstlnge 0
finiara ;;i pozitiva, cu excepffa-- unui singur punct, sltuat :elelalte, In
dreapta jos a norului de puncte. Tn cazul In care datele sunt puilne, ca exem.plul
ilustrat, aceasta valoare singulara poate afecta esential valoarea de
corelatie. Astfel, daca yom calcula r pentru toate datele,.
yom obtine un r extrem de mare, mai exact In yom
calcula r incluzand valoarea r scade la .0,55, lar yom
adauga 0 alta valoare extrema, coeficientul r va mal mult, apropllndu-se
de 0.
4 7 10 13 16 19 22 4 7 10 13 16 19 22
Figura 1.15. Noru/ de puncte Tn situatia eXistentei unor va/ori extreme (outliers)
Cohen (1990) aminte9te de exemplul unui set de date a 25 de.
conti nand informatii despre inaliimea ;;i greutatea acestora.
obtinut a 'fost de 0,83, Tnsa daca la un singur s-a I.n.versat din
ordinea de trecere a datelor, trecandu-se Tnaltimea sublectulul In coloana
destinata greutatii ;;i viceversa, r a devenit -0,26!.
Tn astfel de situatii, masurile care trebU/e luate sunt dependente. de
aparitiei acestei valori neobi;;nuite. Daca ea apare ca urmare a. unel ?e
introducere a datelor Tn calculator sau ca urmare a unei neintelegen a sarClnll on a
unei Iipse de motivaiie dinpartea subiectului care a of:rit ace st. rezultat,
efimina..informatia din baza de date. Daca niei unul dlntre motlvele de mal sus
valorilor se vor calcula doi de corelatle:
rezultatiprin includerea, respectiv excluderea acestor date. In fine, .cazul
numar' foarte mare de date, influenta asupra
cor.elatie--scade mUlt, iar asemenea date' nu mai constituie un Impediment In
'
22
o alta importanta, care trebuie depistata grafic, deoarece
influent
eaza
nivelul de asociere dintre doua variabile, se
Situatia dorita are 0 titulatura la fel de greu de retinut,
Din ferieire, cele -doua situatii sunt mai de inteles decat
de I
Intr-o situattEL"sanatoasa", a unei norulde puncte trebuie sa
aiba aproximativ pe Tntreaga amplitudioe a lui X Y,
determinand 0 forma =omogena denumita tehnic homoscedasticitate, Tntr-o
distributie "riesanatoasa" a unei relatH Iiniare, norul de pund:enu are'
conformatiepetoata distributia lui X Y. Faptul este denumit. heteroscedasticitate,
datorita eterogenitaiii 'norului de puncte. De exemplu, in imaginecf"Cfindreapta a
figurii 1.16, se observa ca Iiniaritatea datelor este mai pregnanta Tn prima parte a
evoluiiei lui X, pana Tn dreptul valorii 110, dupa care aspectul .1iniar al distributiei
punctelor se pastreaza Tntr-o forma mult estompata, punctele fiind mult mai

*
*
, * *
70 80 90 100 110 120 130 140
70 80 90 100 110 120 130 140
Figura 1.16. Situafiile de homoscedasticitate (stanga) i heteroscedasticitate (dreapta)
Daca ati sa surprindeti ce Tnseamna acest lucru din perspectiva
valorii coeficieniilor de corelatie, atunci veii intui ca r este aproximativ 0,90 pentru
relaiia dintre valorile mici ale lui X Y, respectiv aproape nul pentru a descrie
relatia dintre valorile mari ale lui X Y. Ironic, valoarea lui r pentru intregul set de
date este 0,45, rezultat care nu reflecta nici una din cele doua realitaii. Tn practica,
o asemenea relat
ie
heteroscei:lastica se daca yom dori sa stabilim
gradul de asociere dintre nivelul de potentialul creativ. Potentialul
creativ este dependent, pana la un anumit nive'CdeTnteifgent
a
unei persoane. Cu
cat aceasta este mai inteligenta, cu atat potentialul creativ. Dincolo de un
anumit prag, situat dupa unii cercetatori la un 10 de 110, lucrurile se schimba,
relatia dintre cele doua variabile diminuandu-se foarte mull. Explicatia pentru acest
lucru este simpla: potentialul creativ are nevoie de un anumit nivel de dezvoltare
23
intelectuala. 0 data atins acel prag, intervin alii factori, intelectuali sau non-
intelectuali, care pot determina ca 0 persoana sa se com porte mai mult sau mai
putin creativ. Astfel, importanta inteligentei in procesul creativ se estompeaza.
Lectia care trebuie dedusa din situatia descrisa mai sus const{! in
important
a
precizarii amplitudinii variabilelor studiate. Astfel, yom obtine un rezultat
complet diferit, daca yom studia relatia dintre nivelul de timiditate frecvent
a
discursurilor tinute public, avand rezultate pe toata gama timiditat
ii
(de la extrem de
timid la extrem de asertiv) sau daca yom masura relat
ie
, tuand doar
rezultatele persoanelor foarte timide. Daca nu yom tine seama, in ultimul caz, de
caracterul selectiv al rezultatelor, yom ajunge la concluzii eronate, preeum aeeea
ca nu exista 0 asociere intre nivelul timiditatii unei persoane comportamentul sau
public.
1.3.3. .... - de prezentare a

in cazwl datelor de .!iQ)lQmi,nal sau
pentru a descrie asocierile dintre variabile. De aceea" se folosesc
eontingent
a
(de asociere), menit!3 sa surprinda covarianta variabilelor studiate.
Un astfel de tabel include datele de la un lot de 100 de student
i
, eu privire
la motivatia lor de invatare (operationalizata prin trei categorii: "foarte motivat",
"partial motivat", "nemotivat") la gradul lor de multumire fata de conditiile oferite
de universitatea la care studiaza ("multumir', "nehotarat", "nemultumit").
Tabelul se=realizeaza prin intersectarea raspu,osurilor suJ;>ieetilor la cele
doua intrebari adresate. Fiecare intersectie de raspunsuri se in
interiorul acesteia pot fi trecute fie frecventsJe,. observate, fie proS,entajele
eorespondente. in plus, la marginea liniilor a eoloanelor se pot calcula
marginaleTn cazul in care se trec frecvenielein tabel, respectiv mediile marginale,
in cazul in care se'fucreaza cu procente.
Tabelul 1.3. Tabel de contingen\2t pe bazEI de frecven\e - exemplu
Grad de motivare
Foarte motivat
Partial motivat
Acest tabel, sau unul similar exprimat inprocente, sta la baza
statistic ,al datelor non-numerice. in cazul datelqr"nominale nu exista nici 0' restric"fie
cu . privire la utilizarea unor anumiti de asgciere. in schimb, in cazul
datelor ordinale, tabel!1.L.cJEl contingenta jO;:lca rolul nOl-Wlui de' puncte. Prin
intermediul lui vedem in ce mas'ura ne putem increde in valorile coeficientilor de
24
corelaiie in 'cazul datelor ordinale, prin tabelul de contingenta
putem nota daca eXlsta 0 relatle monotona Intre cele doua varia bile. '
de re,latieIll,9.Dotoo,:este'analog"celui liniara, din cazul
datelor l).LJ.menee (Lewis-Beck, 1995). 0 relatie este exista 0
directie ciSlJi:tde .. ,e'Le>.lljtle.a,datelor. Directia poate fi pozitiva, un grad de multumire
ridicat eu 0 de a Invata, respectivnegativa, de
multumlre ndlcat este asoclat cu un nivel scazut de motivarepentru Tnvatare. Cum
ne putem da seama, dincolo de intuitie, de modul de'-as6dere a varia bile
ordinale? Simplu, asigurandu-ne ca ambele au trecute categoriile de raspunsuri
(de de la mare la mic) urmarind vai;rHetretute pe
dlago,Q..Ja pnnclpala (stanga sus - dreapta jos) cele trecute pe diagonala
secundara (stanga jos - dreapta sus). --
. Din 1.3 se observa ca cele mai multe valori se regasesc Tn
dlagonaLa, . PDnclpala (14; 19; 23), nu mai putin de 56 de subiecti din 100 dand
care indica 0 asociere pozitiva intre variabile. Tn doar 22 de
(2; 19; 1) regasesc pe oiagonala Sec.l:!!l9C;lra, corespunzatoare unei
asoclen negative. Pnn urmare, fara a trece la calcularea vreunui indicator statistic
intuim ca un grad de multumire ridicat, cu privire la conditiile oferite de universitate'
conduce la ere9terea motivatiei pentru Inva\are a studentilor. '
mult, din tabelul 1.3 deducem ca respecta conditia de
directia de asociere oecesita
pg .. Pentru problema de fata, acest lucru Tnseamna
cel mal oamenl multun;iti sunt foarte motivati, iar cei mai multi oameni
nemultumltl sunt nemotivati. In tabelul 1.4 este, prezentata 0 situatie clara de
a de monotonie (similara unei de la
vanablle.
Tabelul 1.4. Exemplu de asociere care Tncaldi conditia de monotonie
Grad de motivare
Foarte motivat
Partial motivat
Nemotivat
Gradul de multumire
!
Mul,umit Neutru Nemultumit
Se observa ca relatia nu are 0 directie de evolutie. Initial directia relatiei
era c.ei ma.i multumiti fiind foarte iar ce'i
pa rt,la I APOI, In loc sa observam continuarea directiei in sensul prezentei
mare. de persoane nemultumite ca fiind slab motivate (sageata
observam 0 schln:bare directie, astfel incat majoritatea persoanelor
sunt foarte motivate. In astfel de cazuri, nu este indicata folosirea
coeflclentllor de corelatie specifici datelor ordinale, cum ar fi indicatorii 1: al lui
Kendall sau r al lui Spearman, deoarece vor conduce la rezultate eronate
25
interpretari distorsionate. Exista 0 solutie care consta Tn renuntarea de a trata
variabilele ca masuri ordin;3le, In favoarea celor nominale, urmata de aplicarea
indicatorilor de asociere specifici datelor nominale.
BIBLIOGRAFIE
Clocotici, V., Stan, A. (2000). Statistica aplicata in psihologie. la:;;i: .Editura Polirom.
Cohen, J. (1990). Things I have learned (so far). American Psychologist, 45(12),1304-1312.
Field, A. (2000). Discovering statistic using SPSS for Windows. London: Sage Publications:
Hohn, M., Varga, D., Maru:;;ter, L. (1999). Curs de statistica aplicata Tn tiinte/e sociale.
VoLI. Timi:;;oara: Tipografia Universitatii de Vest.
Hohn, M. (2000). E/emente statistice Tn analiza fenomenelor p$ihice. Arad: Editura "viat
a
Aradeana".
Kinnear, P.R., Gray, C.D. (2000). SPSS for Windows made simple. Release 10. Hove, UK:
Psychology Press.
Lewis-Beck, M.S. (1995). Data analysis. An introduction. A Sage University Paper on
Quantitative Applications in the Social Sciences, 07-103. Thousand Oaks, USA: Sage ..
Neuman, W.L. (1997). Social research methods. Qualitative and quantitative
(3rd ed.). Needham, USA: Allyn and Bacon.
Novak, A. (1977). Metode statistice in pedagogie i psihologie. Bucure:;;ti: E.D.P.
Radu, I., Miclea, M., Albu, M., Neme:;;, S., Moldovan, 0., Szamoskozi, $. (1993).
Metodologie psihologica i analiza datelor. Cluj-Napoca: Editura Sincron.
Rotariu, T., Badescu, G., Culic, I., Mezei, E., Mure:;;an, C. (1999). Metode statistice aplicate
Tn tiinte/e socia/e. la:;;i: Editura Polirom.
Sava, F. (2002). Pagina de statistica socia/a. Gasita la http://statisticasociala.tripod.coni.
SPSS (2001). SPSS Base 11.0. User's guide. Chicago, USA: SPSS Inc.
Weisberg, H.F. (1992). Central tendency and variability. A Sage University Paper on
Quantitative Applications in the Social Sciences, 07-083. Newbury Park, USA: Sage.
26
CAPITOLUL 2
TESTAREAIPOTEZELOR
Statistica descriptiva, foarte utila altminteri, se sa prezinte
aspecte detaliate ale unor situatii observate. Cei douazeci de elevi au petrecut, In
medie, 11 secunde pentru a citi textul dat; de laborator a atins 0
frecventa de 30 de pedalari pe minut In conditia Tn care pedalarea of ere a accesul
la hrana $tiinta nu se rezuma Insa doar la fapte la descrierea acestora.
Tn urma unui demers se pot face predictii, se pot descoperi mecanisme
cauzale sau se pot gasi explicatii pentru fenomenele observate. Toate aceste
operatii necesita un demers logic, bazat pe inferente, ce trece dincolo de realitatea
imediat observabila, supusa descrierii. De multe ori datele obtinute de cercetatori
se rezuma la situatia existenta Tn anumite e$antioane, dar concluziile vizeaza
populatia din care acestea au fost extrase. Pentru a realiza acest lucru se
apeleaza din nou la inferente, pe baza unui demers logic inductiv. Inferenta
statistica se bazeaza pe teoria probabilitatilor, permitand desprinderea.
concluzii cu caracter probabilist. Tn practica, orice rezultat discutat Tn termeni de
valori semnificative statistic la un prag de .",g,!,l.01.a, corespuns unui demers
specific statisticii inferentiale.
Dupa Dyer (1995), tester'im.)potezelor reprezinta, alaturi de e;:;timarea
parametrilor statistici, unul dintre principalele aspecte ale inferentei statistice.
.. ,.. .. .-
Testarea..lpotezelor este 0 componenta fundamentala a activitatii fiind un
demers riguros ce trei (1) analiza datelor empirice;
(2) realizarea llnor pe baza acestora (3)
sceptice legate Aceasta stare de spirit se regEiseite foarte
bine in ideile lui Einstein (apud Hastie Stasser, 2000, p.86) extinse la nivelul
teoriilor:
"Oamenii de :;;tiinta nu sunt de invidiat. Natura, sau mai exact, experimentul
este un judecator neprietenos :;;i inexorabil al t"!luncii cercetatorului. Niciodata
nu Ii spune "Da" teoriei acestuia. Tn cele mai favorabile cazuri Ii spune
"Poate", iar in majoritatea eazurilor ii spune "Nu". Daca experimentul sprijina
o teorie, pentru aceasta inseamna "Poate", iar daca nu 0 sprijina Ynseamna
"Nu". Probabil ea orke teorie va experimenta intr-o buna zi pe "Nu"- cele mai
multe, chiar imediat dupa eoneeperea lor".
27

11,111111:1111'
L
Ipotezele unidirectionale ii bidirectionale
Ipotei!;a __ este 0 pre,dietie" care are. a fi
opecaUQ[la/izatB l?i teSfata pentru a oferi UJ1.J.?spuns
exempluCdEtfpoteza ar fi: "persoanele cu un nivel de extroverslune ndlcat tlnd sa
experimenteze In mai mica masura 0 afectivitate negativa". din punct de
vedere tehnic exista doua categorii de ipoteze: unidireetionale, l?i
Modul de a ipotezei cercetarii determina categoria In care este inclusa
ipoteza. Oaca se precizeaza direc\j(3.preQj9iiei, avem de-a face cu ipoteze
unjdirectionale. In aceasta categorie intra formulari de geriul: "exista 0 corelat
ie
p;;itiva"'; "exista 0 corelaiie negativa"; "grupul A este mai bun decat
"grupul A este mai slab decat grupul B". Oaca,eJireciia :ste
vorbim de Expresii precum "exista 0 corelaile mtre ,
"exista diferente Intre loturi", reprezinta modalitaii tipice de formulare a Ipotezelor
bidireciionale, , specifica fiind absenia precizarii directiei de evolut
ie
a,
Alegerea tipului de ipoteza se face in funciie de informatiile avute antenor ?e
presupunerile cercetatorului. Oaca exista suficiente indicii pentru a permlte
formularea unor ipoteze unidireciionale, este de dorit sa alegem 0
formulare, deoarece exista mai mari ca ipoteza. sa fie. sprijinita. In
care nu exista indicii cu privire la modul de evolutie a datelor, se alege 0 Ipoteza
bidirectionala. Clocotici Stan (2000) utilizeaza terminologii diferite pentru a
denum'i cele doua categorii de ipoteze. Astfel, ei utilizeaza termenul de ipoteza
uuUaterala in locul celui de ipoteza unidireciionala, respectiv pe cel de ipoteza
biLatefi3la, in locul celei bidireciionale. Pe parcursul cariii yom utiliza ambele
terminologii. . "
Indiferent de modul de formulare a Jpotezei de cercetare, testareCi,potezel
se face prin apelul la conceptul de sau ipoteza statistica.
pacate, sensul ipotezei nule a fost inieles l?i prezentat
majoritatea cartilor de specialitate. De aceea se impun cateva
conceptuale, urmate de prezentarea a doua concepte importante, dar m.al puiln
cunoscute, l?i anume, marimea efectului puterea statistica a unei cercetan.
2.1. Ipoteza nula - clarificari conceptuaJe
Tn mod normal orice student care a depal?it cursurile introductive de
statistica cercetarii, ideeaca ipoteza fi
sprijinita sau ipotezei nule. Oemersul este simplu: daca
(ipoteza statistica)este atunci ipoteza alte[n,ativa este sprijinit!3 de datele
obiinute:., Oacaipoteza nula nu atunci ipoteza alternati.va. nu este
sprijinita de datele obtinute. Ipoteza propusa de cercetator este una din Ipotezele
alternative posibile. Pr'in urmare, sprijlnirea ipotezei alternative semnifica sprijinirea
ipotezei de cercetator.
28
Prin testa rea ipotezelor se intelege testa rea 'ipotezei nule, finalizata prin
sau nerespingerea .acesteia. 0 ateniie--deosebita trebuie. acordata
alegerii cuvintelor. Sintagme de genul "ipoteza nula este acceptata sau confirmata"
sau "ipoteza cercetarii se confirma" trebuie evitate, deoarece sunt eronate.
Singurul lucru care poate fi obtinut prin testa rea ipotezelbr este respingerea sau
nerespingerea ipotezei nule.
2.1.1. Logica testarii ipotezelor
Pentru a intelege mai bine principiul testarii ipotezelor yom preciza ca
Dula(Ij,?) ne arata probabilitatea de a obtine datele.observate}n
in care ipoteza....!lli@,j;)steadev,i:'\[,C3\8 (Cohen, 1 990; Cohen, 1 noi amfi mult
mai interesaii de raspunsul la Tntrebarea: "Oat fiind aceste date, care este
probabilitatea ca ipoteza nula sa fie adevarata?". lata cateva caracteristici ale
testarii ipotezelor:
(a) Se pomete de la,12!fHlli[?a ea
Consecinta acestui fapt consta Tn practica eronata de a atribui diferitelor
praguri de semnificaiie sintagrna "semnificativ statistic", Tn cazul unui p de .05, cea .
de "foarte semnificativ statistic", In cazul unui p de .01, ori cea de "extrem de
semnificativ statistic", in situatia unui p de .001. Toate aceste praguri arata doar
probabilitatea de ji, ..obtine.datele culeseTn situatia Tn care ipoteza nula este
adevarata":rnu"probabilitatea de adevar a nule. cum am amintit, Tn
se pornel?te de la premisa ca ipoteza nula este adevarata.
(b) Ipoteza nula nu poate fi ad(},''(e,r@,9icfoar;respinsa
Ideea poate fi Tnieleasa mai bine prin apelul la urmatoarea analogie:
Oaca ploua, asfaltul este umed. '
Asfaltul nu este umed.
Oeci, nu a plouat.
Acest raiionament este corect l?i similar cu:
Oaca ipoteza nula este adevarata, probabilitatea. de a avea aceste date este mare.
Probabilitatea este mica (nu este mare).
Oeci, ipoteza nula este respinsa.
Lucrurile se schimba daca yom schimba rationamentul:
Oaca ploua, asfaltul este umed.
Asfaltul este umed.
Oeci, a plouat.
Rationamentul este incorect deoarece se produce eroarea logica a
afirmarii conseciniei. Afirmatia "daca ploua, asfaltul este umed" nu este echivalenta
29
___ ,1."1",.,1,,,,1,111111,11111 II II! II, ill' II ,II ,I' 1111, 111111, II Ii ,1"",1,1"""1,,1,,,1,1 "" 11111111'111;111111111111111111111111111111111' 1111 11111 1111'11111 1111,,111 ill ,'', 1111111111111111',' ' j,IIIIIIIIIIIIIIIIIII!III' illlll'lli 1111111 t'lIlIlIlI 1111 III !III III! ,I
cu "asfaltul este umed, deci ploua". Asfaltul poate fi ud din diverse alte motive, cum
ar fi stropirea sa de catre de la salubrizare. Similar, confirmarea ipotezei
nule este eronati:\.
Oaca ipoteza nuia este adevarata, probabilitatea de a avea aceste date este mare.
Probabilitatea este mare.
Oeci, ipoteza nula este adevarata.
Astfel, ipoteza nula poate fi doar Tnsa niciodata

(c) Oecizia de a jpC2.tezanuJa. se ia pe baza unui prag de I
semnificatie
o alta problema Tn testarea ipotezei nule este caracterul arbitrar al pragului
ales ,pentru respingerea sau nerespingerea ipotezei nule. Cel mai frecvent prag
ales este de .05, valoare stipulata initial de Fisher, parintele statisticii moderne.
Ulterior aceasta valoare a fost Exagerand, am putea spune ca publicarea
sau nepublicarea studiilor, evolutia lucrarilor de doctorat sau licent
a
, fericirea sau
nefericirea cercetatorilor au devenit dependente de acest prag.
Exista mai multe interpretari posibile ale acestui prag. Fara a intra in
detalii, interpretarea co recta a unui rezultat semnificativ statistic poate fi rezumata
simplu Tn expresia: "exista 0 probabilitate de maximum 5% de a obtine din
Tntamplare datele observate pornind de la premisa ca ipoteza nula este adevarata".
(d) Jpateza nuJa nu rnseamfJijJpotezaabsentei
in un aspect mai putin cunoscut estecaracterul restrans al sensului
acordat ipotezei nule. Cei mai multi cercetatori inteleg prin ipoteza nula absent
a
corelat
iei
sau \ipsa 'diferent
ei
dintre, medii. Aceasta situatie se reflecta Tn
majoritatea cercetarilor Tntreprinse. De altfel, utilizand simbolurile aferente, ipoteza
nula apare frecvent trecuta ca: Ho; Tn cazul corelat
iilor
sau Ho: !JA
Tn cazul difereni
elor
dintre medii. Ipoteza nula nu implica automat aceste conditii.
Mai degraba, ipoteza nula este ipoteza care trebuie anulata, fie ca este yorba de
situatii amintit(3 (ex. Ho: rAB = 0), fie ca este stipulata 0 anumita valoare' a priori
(ex. Ho: rAB = 0,25).
(e) popuJatiiJe din care au fast extrase Joturile
testate
Daca analiza s-ar fi facut la nivelul nu am fi avut nevoie de
un test de semnificatie cu valoare' probabilistica, deoarece asocierile dintre
variabile sau dintre grupe s-ar fi dedus direct din datele observate. in
acest caz ne-am fi situat la un nivel de analiza descriptiv. Testarea ipotezelor
vizeaza Tnsa statistica inferentiala, ce extinderea conCtuziilor de la
nivelullotului testat la nivelul populatiei din care a fost extras respectiv.
30
2.1.2. Ipoteza nul<1 m.?rirnEla
. ' Mul\i cercetatori aleg numarul ..desubiec\i ce urmeaza a fi testati in
func\le de resursele. avute la dispozitie. Aceasta modalitate nu este"1 - '.
. .t- d ' . nsa cea mal
fenci a, eoarece I I I ' .
.' .. ,." a vo umu
Astfel, In (ex. 10 subiecti), sunt mari
ca sa fie in realitate exista un efect. Tn
schlmb, pnn alegerea unul ntion foarte mare (ex 500 d ',-..
., . .. . e persoane ;
man de a obtlne un re.zultat semmflcatlv statistic, in realitate nu ar exista
efectul testat. Pentru a ilustra ultima situatie vom utiliza exemplul comic of 't d
Thompson (2002). I en e
Un cercetator decide sa compare inteligenta masurata prin scoruri IQ la
12000 de studenti din doua diferite. Cei din primul au obtinut un
scor de : 00,.15 abatere standard de 15, iar cei din al ora,
au . 0 Inteligenta medie de 99,85 abatere standard.
testul z pentru doua independente obtine un rezultat
semmficativ statistic. Pe baza rezultatelor, cercetatorul infiintarea
unor speciale pentru supradota\i In primul deoarece ei' sunt
semnificativ mai inteligenti decat cei din al doilea.
2.1.3. Erorile de tip I " In testarea ipotezelor
_ poate fi Tmboga\ita prin discutar.ea a
poslblle ce. pot aparea in testa rea ipotezelor. Pentru a
In_\elege:ea a,:estora vOlapela la urmatorul exemplu. Un cercetator este interesat
sa studleze In ce masura ascultarea muzicii clasice faciliteaza obtinerea unor
in domeniul Tnva\arli unei limbi straine. a testa
Ipote::a, el un lot de 50 de studenti voluntari, dornici de a invata
Ilmba. suede:a. sunt Tmpartiti aleatoriu Tn doua grupe. Prima denumita
e:pe:lm.enta.la, este form_ata din 25 de subiecti care vor invata de patru
limba_ Tntr-un mediu controlat, al carui fundal muzical este
aSlgurat de .IUI Bach Grieg. Ceilalti 25 de participanti, din grupul de
cont:ol, vor Ilmba suedeza Tntr-un mediu din care orice fond
Dupa cele patru saptamani, participantii din ambele grupe au fost testati
pnvlnd cuno$tintele lor de Iimba suedeza. '
. de cercetare, ne ca subiectii care au Tnvatat
limba suedeza In condl\lIle unui fundal muzical sa obtina rezultate maibune' 1
testul de limba s d _". ' a
. u: eza In comparatle cu studentii din grupul de control. Simbolic
formularea poate fI transpusa sub forma H1: !l2:.J::l:Q,
:entru a ipoteza va trebui sa ape lam la conceptul deipoteza nula. De
cele mal multe. on Ipoteza statistica are 0 forma opusa ipotezei de cercetare. Tn
cazul nostru, Ipoteza nula ar putea fi: Nu exista diferente semnificative Tn
performan\ele de Tnvatare a limbii suedeze Tntre cele doua de subiec\i. Cu
31
J
L
L
!
,
alte cuvinte, muzica clasica nu faciliteaza Tnvaiarea limbilor straine. Simbolic,
formularea poate fi HO: fJE ::; fJc.
1
Tn urma analizarii datelor obtinute, ne putem afla Tn una dintre urmatoarele
patru situatii:
(1) nula, constatand diferenie SBJllnifi,c\Jive intre cele doua
grupe de-'subiecii, iar aceasta decizie ege,,I;:';Qrecta, deoarece in realitate
muzica c1asica afecteaza pozitiv invaiarea limbilor straine (cadranul 1 din
label);
(2) respingemjpoteza nula, constatand diferenie semnificative lotre cele,doua
..9rupe, iar aceasta deoarece in realitate ,,'-uzica
nu are nici 0 influenta asupra Tnvaiarii limbilor straine (cadranul 2
din tabel);
(3) \Q.lJ! respingem ipoteza nula, constatand ca nu exista djf,gmoie sen;nificative
intre cele doua grupe, iar decizia este .c.QCeGta, in realitate muzica clasica
neinfluentand invatarea limbilor straine (cadranul 3 din tabel);
(4) nula, constatand absenta diferentelorj;emnificative
tntre cele doua grupe cu privire la performantele de invatare a limbii
straine, iar decizITr-este gre!?ita, deoarece in realitate muzica clasica
influenieaza invatarea limbilor str<'ine (cadranul 4 din tabel).
Ace.ste combinatii sunt reflectate Tn tabelul 2.1.
Tabelul 2.1. Erorile inlalnite in testarea ipotezelor
Tn cercetare ipoteza nuJa
Tn reaJitate .. , A fast respinsa Nu a fast respinsil
Exista efect (HO trebuia respinsa) Oecizie OK (1 ) Eroare de tip II (4)
. Nu exista efect (HO nu trebuia respinsa) Eroare de tip I

Oecizie OK (3)
Daca am face 0 analogie cu situatia din justitie !?i am considera ipoteza
nUla ca fiind situatia inculpatilor "nevinovaii pana la proba contrarie", am obtine tot
patru situatii:
(1) 0 persoana vinoy"ata Tn realitate ar fi gasita vinovata !?i de catre justitie
(cadranul 1); '.
(2) 0 persoana in realitate ar fi gasita .. (eroare
de tip I, cadranul 2);
(3) 0 persoana nevinovata Tn realitate este achitata de catre justitie
(cadranul 3);
, Modul de formulare a ipotezei nule In cazul teste lor unidirectionale variaza de la un autor la
altuJ. Unii prefera 0 formulare exacta (ex. Ho: /-IA = /lB), in timp ce allii prefera 0 formulare
(ex. HO:/-IA:5 J.!B). Ambele modalitali sunt acceptabile l/i conduc \a acelal/i rezultat.
Insa, ultima expresie subJiniaza mai bine ideea testului unidirectional (Leventhal i Huynh,
1996).
32
(4), 0 persoana vinovata,in-rea!itate este gasita nevinovata. de justitie (eroare
> de tip II, cadranul 4).2,\"
A!?adar, este situatia Tn care cercetatorul decide sa
de!?i nu Tn timp ce eroarea
este data A de cazul In care Ipoteza nultl . .,!l.LLa fost respinsa, trebuia.sa fie
Intre cele doua tipuri de erori exista 0 relatie de Ii!J,,,"n.der'li
a
. 0 data ce
ere.s.c de a comite eroarea }",;:s,?ad de a comite eroar.ea .de tip
. ..
Cum procedeaza cei mai multi cercetatori Tn realitate? Ei tind sa tina
seama I sa ignore eroarea de tip II. Din perspectiva
lui Neyman Pearson, pragul de seinnificatie de .05, stabilit a priori, nu reprezinta
altceva decat eroareade tip I. Acest prag, notat ex, reprezinta 0 probabilitate de 5%
de a obtine datele cuJese Tn conditiile 'in careJpoteza nula este adevarata. Ea
Tnseamna, de fapt, 0 probabilitate de 5% de a respingand ipoteza nula cand
ea este adevarata. Un prag de .01 Tnseamna doar 0 probabilitatg de 1% de a
comite de tip I, mai muJte de a comite eroarea de up"it- ... -'
Eroarea de tip II po ate fi prestabilita este importanta mai ales din
perspec.tiva puterii statistice a unei cercetari. Daca eroarea de tip
conventional IC!-valoarea de .05, eroarea de tip II, notata cu 13, nu are 0 asemenea
valoare. Totu!?i, cel mai frecvent se alege 0 valoare de patru ori mai mare dec{lt
prima, adic:;a .20. Transformand probabilitatile Tn !?anse, yom constata ca 0 eroare
de tip II de .20, indica de patru ori mai putine anse de a comite aceasta eroare
decat de a lua 0 decizie co recta (.20/ .80).
2.2. Marimeaefectului
Datorita numeroaselor probleme pe care Ie ridica pragul de se,mnificatie In
cadrul testarii ipotezelor, tot mai multi autori au remarcat necesitatea
rezultatelor cu ceea ce se (Cohen, 1990; Cohen,
.1994; Fan, 2001; Thompson, 1999; Thompson, 2002). Daca testul de semnificatie
raspunde fa intrebarea "exista 0 diferenta sau asociere semnificatjva?",
efectului ne arata "cat de mare este aceasta difE?renia sau Daca nu
Vom tine seama de ambele aspecte yom putea ajunge la concluzii diferite. lata,
spre exemplu, 0 situatie personala, petrecuta Tn urma cu cativa ani. Am avut
posibilitatea de a testa un program de interventie menit sa relatia
profesor-elevi (Sava, 2001). Un lot de profesori a fost testaL Tnainte !?i dupa
derularea unui program de training ce s-a Tntins pe durata a doua luni. Daca ar fi sa
luam in considerare doar praguf de semnificatie, atunci programul s-a dovedit a fi
un succes, deoarece a sa reduca nivelul de ostilitate a dascalilor in perceptia
. ,
2 Unii arnintesc 7i d.e 0 eroare de tip III (foarte pulin probabila), care apare atunci cand
Ipoteza nula este respmsa coree!, dar in direqie greita (ex. m A> m B, dar /l A < J.! B).
33
elevilor, rezultatul fiind semnificativ chiar la un p< .01. De altfel, 14 din cei 17
profesori au reu:;;it performan\e mai bune in situa\ia de post-test. Daca tine
seama :;;i de Il]arimea efectului, rezultatele nu mai sunt atat de promltatoare,
deoarece marimea efectului a fost mica tf= .29). Ce inseamna acest lucru? Se
pare caprogramul de interventie, de:;;i a avut un efect, nu a sa.
foarte mult din perceptia elevilor Tn ce prive:;;te relatia lor cuprofesortl partlclpant
l
In".
program, 'Un profesor care anterior avea 0 relatie negativa cu .elevii. nu a
perceput in termerii favorabili nici dupa terminarea programulul de Intervent
le
,
imaginea lor s-a Tmbunatatit foarte Astfel, programul nu a avut capacl-
tatea de a schimba radical relatiile dintre profesorii instruiti :;;i elevii acestora. Daca
am fi ignorat informatiile oferite de marimea efectului :;;i ne-amfi rezumat doar la
cele oferite de testul de semnificatie, am fi avut 0 imagine distorsionata in mod
favorabil.
Caracterul informativ al marimii efectului a inceput sa nu mai treaca
neobservat. Tot mai multe colective editoriale ale revistelor de specialitate cer
afi:;;area valorilor marimii efectului pe langa cele ale testului de semnificatie. Mai
mult, in manualul de publicare editat de Asociatia Psihologilor Americani se
recomanda prezentarea valorilor marimii efectului in manuscrisele trimise spre
publicare (APA, 2001). A:;;adar, marimea efectului s-a impus tot mai mult .ca
termen generic pentru 0 familie de indicatori care informeaza asupra magnltudtnll
unui efect.
2.2.1. Indicatori ai marimii efectului
-.:''''':''
Pragul de semnificatie statistica ne arata doar ca exista 0 probabilitate
foarte mica de a obtine datele observate in cazul in care ipoteza nula este
adevarata, insa nu ne'informeaza daca aceasta situatie are 0
pentru a evidentia acest lucru yom apela la calcularea marimii efectului. Numarul
mare de existenti poate fi redus la doua categorii de indici: baz2S.Lpe 0
diferenta standardizata intre medii, respectiv bazaF pe procentul
el$plicata. in intalhim mai ales indicii",d..allui Coheu,_A.(delta) al lui
9 alluiHedges. In cea de-a doua categorie avem r..,r!, 112 (eta), w
2
(omega) etc. de categoria din care fac parte, indicii pot fi u:;;or
transformati dintr-o categorie Tntr-alta. lata formulele pentru transformarea
reciproca celor mai intalniti indicatori ai marimii efectului,d.c:;;i r (Rosenthal,
Rosnow :;;i Rubin, 2000):
(2.1 )
(2.2)
34
Vo.m prezenta pe parcursul fiecarui capitol indicatorii ai marimii
efectului. In consecinta, in continuare nu yom 'insista asupra particularitatilor
'fiecarui indicator amintit. '
2.2.2. Interpretaree,J)Jarimii efectului
Magnitudinea unui efect poate fi interpretata in mai multe moduri. Utilizand
criteriile initiale propuse de gphen putem distinge trei nivele de intensitate: efect
minim sau efect efect mediu efect puternic sau mare. Valorile
corespondente aproximative pentru fiecare tip de efect Tn cazul lui d :;;i r
2
sunt
prezentate in tabelul 2.2.
Conform acestor valori, se observa ca marimea efectului obtinuta Tn urma
programului de interventie vizand ameliorarea relatiei profesor-eiev este una
redusa (d == .29, iar r2 = .02). Aceste valori pot fi interpretate :;;i altfel, in functie de
tipul de indicatori ai marimii efedului folositi. Astfel, daca s-a utilizat coeficientul de
determinare r2, yom putea spune ca doar 2% din dis persia datelor reflectand relatia
profesor-elev a fost influentata de programul de interventie aplicat. In schimb,
yom apela la calcularea lui d, yom deduce ca Tn urma aplicarii programului de
interventie media grupului a ajuns la centilul 62 in comparatie cu centilul 50,
corespunzator mediei grupului inainte de inceperea interventiei. Centilele sunt
utilizate Tn ierarhizarea rezultatelor, spre exemplu valoarea 50 Tnsemna un rezultat
mediu, iar centilul 90, un rezultat foarte bun, caz Tn care doar 10% din rezultate
sunt mai bune, in timp ce 90% sunt mai slabe. 0 marime a efectului d de .00
corespunde centilului 50, in timp ce un d de .20 arata centilul 58, un d de .50
corespunde centilului 69, iar d de .SO indica centilul 79. Mai multe amanunte peritru
cei interesati pot fi intalnite in Becker (2003).
Tabelul 2.2. Valorile reper d 9i r
2
pentru marimea efectului
Marimea efectului
Efect scazut
Efect mediu
Efect puternic
d al lui Cohen
In jurul a 0.20
In jurul a 0.50
In jurul a 0.80
coeficientul de determinare r2
.01
.06
.14
Interpretarea rezultatelor obtinute intr-o cercetare trebuie facuta Tnsa atat
in functie de marime? efectului, cat :;;i in functie de pragulde semnificatie obtinut.
Fan (2001) of era 0 bun a sinteza a interpretarii tuturor posibilitatilor intalnite in
practica. 0 adaptare a concluziilor sale este prezentata Tn tabelul 2.3.
Revenind la programul de interventie men it sa amelioreze relatia profesor-
elev, observam, din tabelul 2.3., doua explicatii posibile pentru situatia unui test
semni-ficativ statistic (p < .05) :;;i a unui efect de intensitate scatuta. Fie exista mari
:;;anse de a se fi comis eroarea de tip I, fie rezultatele, de:;;i semnificative,riu au 0
importanta practica, Prima explicatie nu pare verosimila, tinand cont de numarul
35
mic de subiecti utilizati i de puterea statistica redusa. Prin urmare, cel mai
probabil, ne afiam Tn In care programul contribuie In mica masura la
ameliorarea relatiei profesor-elev.
Tabelul 2.3. Ghid simplifical de interprelare a marimii efectului a testului de semnificalie
Marimea Testarea ipotezelor
efectufui
tpoteza nuta nu este respinsa tpoteza nuta este respinsa
Mica 1. Se pare ca ipoteza nula este 1. semnificative statistic,
sprijinita, nu exista nici un efect rezultatele nu au 0 importania
semnificativ statistic sau practic. practica deosebita.
2. Exista un risc crescut de a comite
eroarea de tip I (efectul detectat de
fapt nu eXista). Ea apare datorita une
puteri statistice foarte marL
Medie 1. Marimeaefectului arata promitator, 1. Efectuf oblinut este putin probabjl
dar exista riscul ca efectuf sa fi aparut sa fi aparut din intamplare.
din intamplare. 2. Efectul pare a fi destul de
2. Exista un risc crescut de a comite important din punct de vedere practic.
eroarea de tip II (exista un efect, dar nL Tn plus, efectul este semnificativ
a fost detectat). ProbabiJ'ca puterea statistic.
statistica de a detecta efectul este
mica.
Mare 1. Fie efectul a aparut din intamplare, 1. ConcJuziona\i cu incredere ca
fie rezuJtatul nesemnificativ statistic S8 efectul este semnificativ atat statistic,
datoreaza numarului redus de subiecti. cat pracUc.
puterea cercetarii.
2. Risc crescut de a comite eroarea
de tip II.
Tn sfarit, trebuie mentionata conventia legata de
indicatorilor marimii statistice. Ii se atribuie un semn 12<?zltlv In cazul In
care efectele observate sunt In directia anticipata.ln caz contrar, indicatorii marirnii
efectului vor avea un sernn negativ. Informatia este importanta mai ales I'n
realizarea de meta-analize. De exemplu, daca 0 ipoteza anticipa rezultate
.. ... t I imea
superioare ale grupului A In fata grupulUl B, lar datele spnJlna aces
efectului va avea un semn pozitiv. Tn schimb, daca rezultatele obtmute 0
situatie opusa celei exprimate In ipoteza, precum In situatia Tn care B obtme
rezultate superioare grupei A, rezultatului marimil efectului ise va asocla un semn
negativ (ex. r2 == - .17).
2.2.3. Stabilirea marimii efectului
Pentru a realiza un bun design al cercetarii este necesar sa stabilim a
priori valoarea a!?teptata a .marimii efectului. Ratiunea pentru care ar trebui sa.
36
........
J ....
I
I '
"I '
facem acest lucru consta in selectarea numarului de subiecti necesari pentru a fi
testali Tn vederea surprinderii efectului prezis. Pentru aceasta avem la dispozitie
mai multe strategii de lucru (Singer, A.D. Lovie P. Lovie, 1986).
Prima alternativa implica valorificarea,.rezultatelor obt
i1
llJte Tn studii
a(iJerioare. Spre exemplu, in studierea efectului pe care muzica clasica II are
asupra invatarii unei limbi straine ar putea fi consultate eventualele cercetari
anterioare in domeniu pentru a putea face predictii asupra nivelului de influentare
exercitat de prima variabila asupra celei de-a doua.
A doua strategie, oarecum simil<:lra, consta In realizarea unui .. studiu pilot,
incluzand doar cativa subiecti, pentru a estima cat mai bine valorile mediei, abaterii
standard sau a altor indicatori care pot prezice valoarea marimii efectului.
in sfarit, cea de-a treia strategie pornete de la premise teoretice,
utilizand valori a. priori alese pe baza conventiilor propuse de Cohen. Din aceasta
perspectiva, in lipsa unor informatii din de specialitate, cei mai multi
cercetatori aleg un nivel mediu al .50) ;;i in fun9tie de acesta T!?i
stabilesc numarul de subiecti necesari a fi testati.
2.2.4. Limitele marimii efectului
Vom afirma, fara Tndoiala, ca utilizarea indicatorilor de evaluare a marimii
efectului informatia statistica. Mai mult, indicatorii au devenit
indispensabili in realizarea meta-analizelor cantitative. Cu toate acestea, nici
marimea efectului nu este lipsita de unele neajunsuri. Dintre cele mai semnificative
amintim o' anumita dependenta de marimea respectiv caracteruJ
relativ al importantei practice a unui efect.
Dei s-a evidentiat ca testul de semnificatie poate fi redus Ja RrodusuJ
dintre marimea efectului marimea eantionului (Rosenthal DiMatteo, 2001),
nid marimea efectului nu este scutita de 0 anumita dependenta de marimea
e:;;antionului. Ceimai afectati indici sunt cei bazati pe graduJ de dispersie explicata,
de genul r2. Acesta reprezinta patratuJ coeficientiJor de corelatie liniara de tip r. Se
cunoate ca un numar mic de. subiecti conduce la un r ridicat, Tn timp ce un numar
foarte mare de subiecti duce la unr scazut.
CeaJalta limita vizeaza relativitatea stabijirii importantei practice a unui
efect. criteriile propuse de Cohen pastreaza validitatea Tn multe cazuri,
exista situatii Tn care lucrurile se schimba. Spre exemplu, marimea efectului
datorata ingerarii zilnice a unei doze mici de aspirina asupra prevenirii infarctului
era r
2
= 0,001, Tn conditiile In care r era doar 0,034. Acest rezultat infim arata ca
doar 0,1% din dispersia infarctului poate fi explicata de ingerarea de aspirina Tn
doze mici. Totu:;;i, realizand transformarile necesare i luand Tn considerare
valoarea umana, un asemenea rezultat ar duce la prevenirea eficienta a infarctului
pentru 34 de persoane la 1000 de locuitori, fapt care nu este de neglijat (Rosenthal
i DiMatteo, 2001). Similar, Tn studiile vizand cali.tatea VietH pentru persoane cu
diferite deficiente, orice ameliorare poate avea 0 valoare practica, chiar daca la
37
___ -."III_IIIII"_""""lIloIllllIIll,lllldll'IIII'IIII'111'1111 III 1111:111 1111 1111111 '11'1111 111'111 IIIILIIIII 111111 IIIII'illll:III,II'1i illllll,11111 '1111'llllllIlllllJIIIIIIII11111111111111I,'lllllllilllll111,1111 1111 dill 1111' II 111'11 11,'1111:111'1111:11111111 11I11111 1IIIi'III 1111111111111,111111111111111111111111111111111111111111111111111111,11111111,111111111111111111111____ _
i\:'
r!i:
i
nivelLiI schimbarilor, acestea nu sunt unele radicale. Considerentele acestea I-au
facut pe Thompson (2002) sa afirme ca exista trei Tntelesuri ale cuvantului
semnificativ: Astfel, rezultatele pot fi semnificative statistic (p < .05), semnificative
I - .
Tn plan prctic, din punct de vedere al magnitudinii schimbarii(d sau r2 cat mai
ari), respectiv semnificative din perspectiva clinica sau valorica, Tn funct
ie
de
importanta domeniului vizat (cazul aspirinei sau cel al ameliorarii calitaiii vieiii
persoanelor cu deficiente diverse).
2.3. Puterea statistica a unei cercetari
Imaginati-va puterea statistica drept 0 capacitate de a detecta vizual
fenomene. Daca puterea statistica este mica, va fi dificil sa observam fenomenele
de interes yom concluziona, poate, ca fenomenele respeetive nu exista.Acest
lucru s-ar Tntampla datorita capacitaiii noastre red use de detectare vizuala a
fenomenului Tn cauza. Tn schimb, daca yom sa ne Tmbunataiim aparatele de
detectare a fenomenului, adica sa puterea statistica a unui cercetari, yom
avea mai multe sa detectam fenomenele Mai mult, Tn situatii Tn
care puterea statistica a devenit foarte mare, yom putea detecta orice fenomene,
inclusiv.pe ace lea minuscule sau insignifiante. Tn practica se Tntampla mai rar acest
lucru, deoarece majoritatea studiilor sufera de 0 puterestatistica scazuta. De altfel,
Tversky Kahneman (1993) sau Smith (2000) reamintesc de un studiu mai veGhi
al lui Cohen, care identifica, intr-o statistica incluzand studiile publicate Tn diverse
reviste de specialitate, 0 valoare mediana a puterii statistice de .46. Acest rezultat
este mult sub valoarea optima prescrisa de .SO. Situatia nu s-a schimbat de atunci,
rezultate modeste, similare, fiind obtinute $i dupa 25 de ani de la efectuarea acelui
studiu (Cohen, 1990).
Puterea statistica poate fi determinata foarte daca tinem seama de
valoarea lui [3 (riscul de a comite eroarea de tip II), deoarece puterea statistica este
egala cu.1 - [3. Astfel, daca yom alege un [3 de .20, puterea statistica a cercetarii
respective va fi de .SO, ceea ce semnifica 0 probabilitate de SO% de a detecta un
efect daca acesta exista. Similar, un [3 de .05, conduce la 0 probabilitate de 95% .
de a identifica un efect, oricat de mic ar fi el, cu condiiia ca el sa existe. Importani
a
practica a acestor informatii este capitala Tn constructia designului de cercetare,
deoarece puterea statistica a unei cercetari poate fi modificata Tn funciie de trei
parametri importanii: marimea efectului ("Cat de mare trebuie sa fie un efect sau 0
relat
ie
dintre doua variabile pentru a fi identificata?"); marimea eanponului ("De
caii subiecti avem nevoie pentru a observa fenbmenul de interes?"); va/oarea a
("Care este pragul de semnificatie de la care yom respinge ipoteza statistica?").
Pentru calcularea puterii statistice exista programe precum Gpower (Faul
Erdfelder, 1992), ce poate fi descarcat gratuit la adresa http://www.psycho.uni-
duesseldorf .de/aap/proiects/gpower/index.html.
38
'1111:11'1 "IIIIIUIIIIIIIIIIIIIIIIIIIIIIII 1111',11111111'1111111111111"111,1111"11111111111111I,IIIII!III III! 1111 1111 III 1111I111 1111'111 1111:111,111I 111:1111:11111111 11111111 IIII!III IIII!III III 11111'111111111111111:1111111111111111111:,1111111111111111111111111111111111,1111111111111
"
1111,111111111:111111111111111 1111: III! !III'IIII I111 11111111:1111111111111 11111111111111111111111111111,:"
De asemenea, inversand demersul logic, putem calcula numarul d
subiecti de care avem pentru a realiza 0 cercetare cu 0 putere statistic:
de p.entru a de a comite eroarea de tip II. Va
reamlntlm ca medlana puterll cercetarilor publicate Tn anumite reviste de
specialitate nu a .50, ceea ce Tnseamna' ca' erau egale (.50 I .50) de
a observa un efect atunci cand acesta exista sau de a comite eroarea de tip II. lata
doua exemple concrete de utilizare a informaiiilof prezentate mai sus, pentru a
Tntelege importanta utilizarii conceptului de putere statistica a unei cercetari.
Tn primul caz, yom presupune ca un cercetator s-a aratat interesat de a
studia ,Tn ce masura exista 0 corelatie pozitiva Tntre doua probe de inteligenta
Matricele Progresive Raven - varianta standard scorul general obtinut la WAI'S'
Sa presupunem ca el a testat 25 de persoane a obtinut 0 corelatie r de 30
Aceasta nu este semnificativa statistic, p obiinuta 'fost de :07:
valoare supenoara pragului maxim acceptat de .05. Tn aceste conditii, cercetatorul
nu va putea respinge ipoteza nula va afirma ca cele doua teste de inteligenta nu
care, probabil, se va lansa Tn tot felul de speculaiii de
domenille dlstlncte pe care cele doua probe Ie masoara. aceste teste ar fi
trebuit. sa corelez: Tntr-o anumita masura, deoarece, Tn principiu, fac referire la
construct. In astfel de cazuri ne putem pune Tntrebarea: "chiar nu exista 0
corelatie Tntre cele doua probe sau rezultatul este 0 consecinta a riscului ridicat de
a comite 0 eroare de tip II?", adica de a ne de a 'nu observa corelatia
dintre cele Adoua teste. Pentru a raspunde la intrebare yom putea face un simplu
calcul apeland la Gpower. Au fost testaii 25 de subiecti, valoarea a. prestabilita a
fost de .05, ipoteza era de tip unidireciional (exista corelaiie pozitiva?), iar marimea
efectului a fost r2 de .09. Rezultatul obiinut indica 0 putere a cercetarii de .45, ceea
ce Tnseamna mai puiine de a observa corelatia Tntre cele doua variabile,
daca ea exista are 0 valoare r de aproximativ .30, decat de a comite eroarea de
tip II. Tn aceste condiiii, concluziile legate de nerespingerea ipotezei nule de
absentei corelatiei dintre cele doua probe devin extrem de discutabile
cercetatorul ar fi cunoscut importania puterii statistice, ar fi putut
planlflca mal blne studiul, pentru a ajunge la 0 valoare acceptabila a riscului de a
comite eroarea de tip II. Astfel, daca dorea sa testeze existenta unei asocieri
pozitive Tntre cele doua variabile, Tn condiiiile Tn care se la 0 marime a
efectului Tn jurul lui .09 (r = .30), se multumea cu un p < .05, iar puterea cercetarii
dorite era de .SO ([3 = .20), ar fiavut nevoie de 64 de subiecti pentru a testa relatia
dintre probe. Daca ar fi procedat astfel, de a de tip II fi
fost mult reduse, facilitand astfel interpretarea rezultatelor.
Cel de-al doilea exemplu ar putea servi drept model Tn realizarea unui
. design adecvat din perspectiva erorilor de testare a ipotezelor statistice. Sa
presupunem ca un cercetator sa studieze rolul feedback-ului Tn rezolvarea
unor sarcini noi. Tn acest scop, el grupeaza aleator participantii la studiu Tn patru
grupe: unul de control, unul alcatuit din subiecti care primesc doar feedback
, negatlv legat de sarcina; un al treilea grup care doar feedback pozitiv
39
1 ' , 1 , " ' 1 ! I ' , Ii '
legat de sarcina, respectiv un al patrulea grup care prime:?te atat feedback pozitiv,
cat $inegativ. Variabila dependenta este masurata Tn secunde, vizand rapiditatea
rezolvarii sarcinii de catre din cele trei grupe experimentale
primesc feedbackul Tn timpul rezolvarii sarcinii, Tn timp ce subiectii din grupul de
control nu primesc nici un fel de feedback. intr-un astfel de caz, cercetatorul poate
planifica acele caracteristici ale designului, astfelTncat sa aiba erori de tip I :?i II cat
mai reduse. \
cercetatorul va testa ipoteza la ANOVA simpla, urmata Tn.
caz de sucs de 0 serie de post hoc. Tn aceste el poate face 0
serle-de calcule pentru a determina volumul e:?antionului in Tn care sunt
patru grupe, Ct. dorit este de .05, puterea statistica a:?teptata este de .80, iar efect,ul
feedback-ului asupra duratei de rezolvare a sarcinii este unul mediu (f = .25). In
urma calcului a rezultat ca cercetatorul va avea nevoie de un e$antion de 180 de
persoane, adica de 45 de subiecti Tn fiecare grupa pentru a putea testa optim
ipoteza :?i a mentine,scazute erorile. Tn cazul Tn care ar fi ales 100 de subiecti,
25 Tn fiecare grupa, ar fi obtinut 0 putere a cercetarii de .50, ceea ce ar fi Tnsemnat
$anse egale de a observa efectul feedbackului asupra performantei, in cazul in
care acest efect exista $i are 0 inten5itate medie sau_ de a comite eroarea de tip II.
Marimea efectului poate fi stabilita, fie pe baza rezultatelor obtinute din cercetari
anterioare, fie pe baza teoretica, pornind de la conventiile discutate anterior care
Tmpart marimea efectului Tn: efect mic (influenta redusa a variabilei independente
(VI) asupra variabilei dependente (VO; efect mediu (influenta moderata a VI
asupra VO) $i efect mare (influenta puternica a VI asupra VOl
Douasprezece modalitati de a puterea statistica Intr-o cercetare
Tinand cont ca majoritatea cercetarilor sufera de 0 putere statistica redusa,
se impun 0 serie de masuri menite sa imbunataieasca aceasta situaiie.
extrem de importanta, sectiunea poate. fi sarita de catre cititorii mai putin
familiarizati cu conceptele statistice, datorita dificultatii crescute de Tntelegere a
textului in lipsa unor cun09tinte statistice $i metodologice de nivel intermediar.
Totu9i, a data dobandite aceste informatii, cititorii vor putea parcurge masurile
stipulate, lectura fiind deosebit de utila din punct de vedere practic.
Aceste masuri pot fi impartite in trei categorii mari: orientate spre designul
cercetarii (1-7), orientate spre masurarile efectuate in cadrul cercetarii (8-10) $i
masuri exclusiv statist ice (11-12). Aceste modalitati se bazeaza pe lucrarile lui
Embertson 9i Reise (2000), Hinkle, Wiersma $i Jurs (1994), Kirk (1982), Pedhazur
:?i Schmelkin (1991), Smith (2000) sau West, Biesanz $i Pitts (2000), cu tolii
interesati sa continue munca depusa de Jacob Cohen, parintele puterii statistice.
Majoritatea acestor masuri au fost prezentate Tn alta parte (Sava, 2002; Sava,
2003).
40
11111"1111111111 1111111111'1111111111 IIIII!IIII'IIIII ,1111 11111 '1111'11111 11111'11111 IIIIIUIIII'IIIIII '111111 111111111111111'111',111'11 1111I 1111'1111111111'11111 1111'111111111'111111111'11111 1lllilllllllllullllJllllllllililUlllIlIIlllillIllllllllIIIIlllWIlllLIIIII:JII11111111"11111111111111111: :1
Mai
subiecti
VI ca facto
fic!?i
ale
variabilelor
adecvata a
VI
nor grade
de libertate
Apelul la
covariabile
Ipoteze
unilaterale
testelor
statistice
puternice
Design cat
mai simplu
Scale
numerice
C alitatea
masurarii
VD
Figura 2.1. Surse utile pentru a crete puterea statistica a unei cercetari
1. Creterea numarului de subiec{i testa{i
Cea mai simpla $i comuna metoda de a cre9te puterea statistica a unei
cercetari consta in includerea mai rT1ultor in studiu. Aceasta poate fi
facuta fie prin crei?terea_ lot fie prin marirea
numarului de subiecti din CWJ,!Jl1ite grupe, mai impQctaote din perspectiva ipotezelor
testate. Spre exemplu, avem un design unifactorial intergrup Tn care, prin
intermediul a trei grupe de subiecti (T1-grup de control; T2- terapie individuala; T3
- terapie de grup), d,orim sa testam efectul terapiei cognitiv-comportamentale Tn
reducerea gradului de timiditate. Tn conditiile in care fiecare grup este format din 10
subiecti, avem la dispozitie doua posibilitati de a cre$te puterea cercetarii prin
marirea volumului e$antionului. Prima const?J'1_d.ublarea numarului de subiecti din
fiecare grupa, ajungand la 60 de subiecti testati. Metoda utilizata Cal1.9Jgate
Oaca grupele au 0 importanta difexita,
cum ar fi situaiia in care dorim sa aflam daca interventia de orice fel (in'CTIViduala
sau Tn grup) este semnificativ mai eficienta decat non-interventia, yom apela la 0
strategie diferita. De exemplu, yom adauga doar 5 subiecti Tn grupele
experimentale, respectiv 20de subiecti in'grupul de control. Similar, daca este mai
important sa determinam care dintre formele de interventie (individuala vs. Tn grup)
este mai eficienta, yom putea cre$te grupul de control cu 6 subiecti, in timp .ce in
fiecare grup experimental yom adauga 12 subiecti. Se observa ca numarul de
subiecti adaugati 5e mentine constant la valoarea de 30, Tnsa strategia este diferita
in functie de ipotezele urmarite.
41
'III 1IIIIIIILilillIJIIIIUIIIIlIIIIILlIIII IIIUIi 11111111 ,11111111, "" """"""""",'1""""1""""'1"","",1",,,,,,illill IIII'JIII 11111 1111 """"""""IIIIUIIII IIIIJIII II ",",,, 11111 I11111 1IIIIJIII"IIIUII,IIIII'IIIIILlIIII,:'1111'1111"""""'1"""""1""'1",,,,"",""111"111111111111111111111:11111111111111111111' " 111'111 I111 1111 III! "11,,,1 '1111111 II ,II 1111 I
2. Utilizareal1f1uU!e$ign intragrup (cu masuratori repetate)
Tn cazul Tn care avem de sub,lecti, un design intragrup are 0
putere statistica mai mare decat designul de datorita scaderii
dispersieJ...?r9fjijnee)(P'1cate) Tn primul caz. Fiind yorba de testat
i
Tn
situat
ii
diferite \tw. de subiecti'",diferiti tt:'lstati Tn cond.i.\iLJiiferite, yom avea 0
varialvilitafe:hiai redusaa rezultatelor. Aproape orice test statistic are, la numitor
dispersia erorii Tn consecinta, va duce la un scor t, sau F mai mare, fapt ce
de a obtine un rezultat
3. Introduce rea l!JJei.QQyariabile eficien.te
In situatiile Tn nu este volumului din
cauza de timp resurse sau Tn situatiile Tn designul de tip
intragrup- riC:.este potrivit, e poate tine seama de efectul unei terte varia bile,
Spre xemplu,
un cercetator poate masura- acestel vanablle atunci cand
testeaza efectul interventiei cognitiv-comportamentale Tn reducerea timiditatii. Prin
introducerea unei"covariabile care influenteaza relatia di!11re fie ele
VI i..VD,de ori se astfel
cresc obtinerii unui rezultat semnificativ 'statistic, fara a recurge la
numarului de subiecti testati. Acest rationament poate fi vizualizat Tn
figura 2.2.

, DispEfsie
" \ explictta'de
, "\ VI
DiS
P
8"t'S,iEi, "'. ) "I' -' j
neexp IColla: ' ' , './: I.
. .-- '
Disp8rsie
neexplitati..'====l
DispersiEi
'expli'cala 'de
Dispa-sie
expliCtta'de
VI
Figura 2.2. Sursa dispersiei In ANOVA (stanga), respectiv ANCOVA (dreapta)
4. Utilizarea unui design
Acest principiu filosofie, eunoscut sub numele de brieiul lui
exprima primatul unor eorecte Tn dauna unor modele complicate
dense, cu prea multe variabile. Tn statistica, acest principiu a fost etiehetat de
Cohen (1990) sub forma "maiputin este mai bine". Tn studii cu fciarte _.multe
de a comite eroarea, de tip I, adiea de a obtine anumite
. . -...,. ... -=-..
rezultate semnifieative_c.lin Tnt<3mplare. Vom ajunge Tri'cealalta extrema, Tntrebandu-
..... ,
42
'11',11""",1111""",11'"""",11"""",11"11,1111'",,1111111111111111111111111111111111111111111 ill ,II 111,11'111: ""1'""11",::,11"11"":""11,11""",11",,,,,11,,,,1"'11111:111111111111111111: "111""""'1"",""'11",,,"111"'11""""1111"""11
'
"""","":1:111",:""'11""""""""""",,,11111:11111 "",""", 111111111111 11111: 11111 111111.11111 III1Ii 1111 I illlll 11111 IIIIIUIIII ,11111 11111 1111111111 1111111111'11111 ,11,1i"
ne ,care dintre rezultatele semnificative obtinute sunt reale? Prin aplicarea unor
corectii \lom putea reduce dar yom de a comite
o eroare dEl .. !!p .. IL De exemplu, prin eorectia Bonferroni, aplieata la 0 matrice de
coreratiUntre 16 variabile (de exemplu, factorli"primari de la 16PF ai lui Cattel),
pragul de semnifieatie peritru respingerea ipotezei nule se va modifica de la .05 la
.0004 (.05/60). AstfeJ, 0 corelatie al carei prag de semnificatie obtinut este de 001
nu va putea respinge ipoteza nula. Corectia este absolut Tn
absenta ei, In conditiile Tn care nu exista asocieri reale intre variabile, probabilitatea
de a obtine, din intamplare, unul sau mai multe rezultate semnificative este de
99,3%.
5. Creterea numarului de trepfJrpentru VI.sauJi creterea amplitudinii
factorilor

Altfel spus, sunt mai mari de a obtihe un rezultat semnificativ
statistic Tn conditiile in care 'mult. Dupa de
terapie am putea conciuziona ca interventfa' nu a condus la ameliorarea'slluatiei
ciientului. Dupa exista mai mari de evolutie a
ciientului. De aceea, ester important sa acordam 0 atentie deosebita nivelului
intensitatiiYJ...asupra VD .. De cele mai multe ori acest nivel ales, astfel Tncat
sa eorespunda cat mai biner.ealitatii, pentru a ave a 0 validitate ecologica sporita.
Nu Tntotdeauna trebuie sa""'marliTi"'ffitensitatea VI pentru a observ"a' efectul sau
asupra VD. Alteori avem nevoie de 0 analiza detaliata a evolutieLYI petoata gama
Acest fapt poate fi observat Tnlegea Yerkes-Dodson. Daca am
dori sa vedem care este efectul nivelului de arousal (motivare) asupra performantei
Tn sarcina am ave a doar doua grupe de subiecti (slab motivati, respeetiv
motivati) am putea ajunge la conciuzia ea nu exista diferente Tntre cele doua grupe
implicit, ea nu exista un efeet al nivelului de motivare asupra performantei
subiectilor. Daca Tn loc de doua grupe, am utiliza trei loturi, corespunzatoare a
trepte ale VI (slab motivati, optim motivati, puternic motivati) am ajunge la rezultate
diferite am admite influenta nivelului de arousal asupra performantei subiectilor
Tn sarcina. ' ,
6. Tratarea variabilejor fici
Din fericire, de cele mai multe ori, Vi..!JD.iJ;ratate automat ca factod Tn
cadrul tehniciioI AliQY6,. tratarea VI ca poate faCiIi'ta
generalizarea altetrepte ale VI, tehnicasufera de 0 putere
statistica red usa. Tntr-un tipie unifactorial, yom avea 2-3 trepte ale VI
aproximativ 90.....c!e.subiecti. Acest lucru este normal, daca VI este
fix, insa daca VI este considerata factor aleatoriu va fi. nevoie, pe 1fu1'gi'! un numar
mare de de un numar ridicat de trepte ale a puterea
statistiea necesara d,.tectarii efectelor existente.
43
ill ilil 'II' II III "I' J 'II II' .I' I, 'I' ill'III,'I'III:II'111 111',,11 ,'11,1'1'11 ,'1','11 III m !II 11:,'1 Ii ,11:1',1:1 ,I 'IIii
7. Utilizarea unor ipoteze unidirectionale (unilaterale)
Tn conditiile utilizarii'Ufferrpoleze de se dubleaza
de a obtine rezultate semnificative statistic, deci crete a
Astfel, daca-6fectuamo 'corelatie pe 25 de subiecti intre doua probe i
obt
inem
0 valoare de -.30 yom interpreta diferit rezultatele in functie de tipul de
ipoteza avuta. Datele ar fi sprijinit 0 ipoteza unidirectionala ( "persoanele cu un
nivel crescut de depresie tind sa petreaca mai putin timp in ora?"), r = -.30, P <
.05, Ins a ar fi infirm at 0 ipoteza bidirectionala ("exista vreo asociere Intre nivelul de
depresie a unei persoane i perioada de timp petrecuta In ora?"), r = -.30, p> .05 ..
8. Utilizarea scalelor de masL/,rat;e numerice,.de tip interval sau propg1Li
Acest gen de scale de masurare apeleaza frecvent tehiliGLstati.?tice
paf.T!letrice. Din perspectiva puterii statistice este cunoscut faptul ca tehnicile
statistice=parametrice au un niveLrnai ,Jidicat decat metodele statistice
consecinta, ar fi de dorit ca dependente sau
cdteriu sa fie r'nasurate prin scale numerice, evitandu-se, pe cat posibil, iTfa'Crrarea
lor prin scale de tip nominal sau ordinal.
9. pentru a rndeplini condifiile diff}.[itelor.Jrq,hnici
statistice
'0. 'Chiar daca datele sunt masurate prin scale-J,lumer.ice, majoritatea
tehnicilor statistice necesita alte conditii suplimentare pentru a'putea fi aplicate.
Nerespectarea asumptiilor majore, in situatii de aplicare mecanica a testelor
statistice, poate conduce la erori de tip I sau II' In testarea ipotezelor. Spre
exemplu, 0 distributie complet anormala a variabilei dependente ar presupune
renuntarea la aplicarea testului t pentru doua eantioane independente, In
favoarea unei metode neparametrice corespunzatoare, In acest caz, testul U al lui
Mann-Whitney. Puterea statistica a metodei este Insa la nivelul a 69% din
capacitatea testului t de a detecta diferente Intre cele doua grupe. Tn asemenea
conditii pot fi adoptate 0 serie de artificii statistice de transformare a datelor brute,
menite sa corecteze distributia obtinuta, astfel Incat sa nu fie probleme cu
aplicarea teste lor parametrice.' 0 multitudine de transformari posibile, cele
mai fntalnite fiind ridicarea la patrat, extragerea rMacinii patrate sau utilizarea
logaritmilor naturali. lata, spre exemplu, valorile indicatorilor de asimetrie i boltire,
inainte dupa transformare, dintr-o baza de date fictiva (tabeluI2.4):
Tabelul 2.4. Valori descriptive inainte de transformare X i dupa transformare X2
Variabila Asimetrie Eroare standard Boltire Eroare standard
X -.978 .314
.082
.618
X2
-.439 .314
-.952 . 618
44
11
'
:11'11' I,,' :1 I: !:' I! 'I 1'''
Tnainte de transformarea datelor se observa 0 deviere importanta de la
normalitate, fiind 0 distributie puternic asimetrica negativ. De altfel, anormalitatea
distributiei este sustinuta i de rezultatul testului Kolmogorov-Smirnov (z = 1,50,
P < .05). Dupa ridicarea la patrat a .rezultatelor se reduce foarte mult asimetria
datelor, Insa intervin unele modificarila nivelul boltirii. Totui, dupa transformare,
distributia obtinuta nu difera semnificativ de una normala (z = 1,13, p> .05), fapt ce
va permite aplicarea unor teste parametrice. Prin asemenea transformari scad
ansele de a comite erori de tip I sau II. 0 parte din transformarile posibile au fost
discutate In sectiunea 1.4.3. din capitolul vizand statistica descriptiva.
10. Selectarea unor probe psihometrice ridicate, mai ales Tn
cazul VD. "." .. " ... , .. 0 .'. .'"
. '.
- care au un nivel scazut i care reuesc sa reflectlLcu
orice variatii ale variabilei latent'8 conduc la -;
statisticamai mare decat cei care nu lndeplinesc aceste condiiii. Spre exemplu, 0
scala care are 0 consistenta interna de .65, are un nivellidicat al erorii fapt ce
..............,."....,........ --, .... ,. t ",' -. ,
afecteaza relationarea sa cu alte probe. De pilda, In corelarea scalei cu alte probe
se vor obtine valori scazute, sub nivelul a .65, deoarece ea nu poate obtine
mai mari decat cu ea (r = .65). sa cu 0 alta variabila
este atenuata i poate deveni chiar nesemnificativa statistic. Spre exemplu, am
putea obiine 0 corelaiie de .25, care ar fi fost mai mare daca ambele probe ar fi
avut 0 consistenta interna ridicata, In jurul a .90. Tn privinta sensibilitaiii, teoria
raspunsului laitemi of era un bun mijloc de a testa i selecta acei itemi care
raspund cel mai bine cerintei de sensibilitate. Nu in ultimul rand, scalele care
coreleaza cu probele de dezirabilitate socialapot duee la
seMerea puferii statistice.
11. Salvarea unor'grq.Qgde libertate
Dei am amintit implicit de acest aspect la punctul patru, salvarea unor
grade de libertate, cu scopul de a spori puterea poate fi
Intr-un desigDcomple.x (de exemplu, Inti-un asemenea caz am
putea calcula apte cate trei pentru efectele FB, Fc),
pentru interactiunile de ordinul doi (FAB, FAC, FBC) i unul pentru interactiunea
complexa de"Qrdinu! ,trei are rost sa calculam toate aceste in
conditiile in care'sunt interactiunicare nu ne intereseaza sau in cazul in care
interpretarea rezultatelor ar fi dificila sau,.J,ipsita de'Sens(ex. FABC). Renuntand la
calcularea acelor indici, yom salva un de
ar duce la 0 cretere uoara a statistice a testelor F ramase a fi In
situatii limita, prin salvarea unor grade de libertate, rezultatele pot
deveni semnificative (de exemplu, un p de .07 se schimba intr-un p de .04) .
- ...
45
____ -_".,_1111111111111 '!II: 1111'11111',11111111111'111111111ILlIIIIJlIII!IIIIIJIILlIIIIJlIIILlIIIIJIIIILlIIIIJIII,'IIIIJIIIUIIII IIIILllIII'IIIILlIIII 11111:1111 11111 ,IIII! IIIILIIIIII 11111 1111111: 'I' Ii' II I Ii I 1111'11111111"111"111'1111'111'1111 _______ 111111 IIIIII! 111111 11111 1111'111111111111111111111111'1111 !III: 111'11:
\:
I'
"
I
! ,
12. yti/izare.a !ehnicilor ;Itl$tice cu . . .
In practlca, putem Tntalni situa\ii Tn care pot fl aphcate mal multe tehnici
statistice. De exemplu, Tn cadrul compara\iilor post h oc...9lQ AN OVA , pentrugrupe_/
egale . desubiecti omogenitatea dispersiei asumata, am putea alege Intra
procedurile TUKey Bonferroni. pi'imele au 0 putere ru.aLmareode a detecta
cu ultimele. Similar, Tntr-un design intragrup
putem apela la ANQVA pentru masuratori repetate Tn varianta sau putem
alege MANOVA"Prima statistica mai mare decat MANOVA,
de aceea ar fi preferabila utilizarea sa.
Toate aceste masuri pot fi utilizate Tn sprijinul puterii statistice a
unei. cercetari. Yom Tncheia precizand ca problema prezentata nu este doar un
moft al statisticienilor, menit sa indeparteze mai mult comunitatea psihologica de
la 0 abordare a problemelor. APA (2001) ofera dovada cea mai clara Tn
acest sens face recomandarea de a se tine cont de puterea statistica Tn
stabilirea designului Tn interpretarea unei cercetari.
2.4. Appendix - Ce inseamna gradele de Iibertate?
Cei care s-au Tntrebat vreodata ce Tnseamna gradele de libertate au
primit raspunsuri evazive ori prea elevate merita sa citeasca sectiunea de mai jOs.
Gradele Ac:LJibertate Tnsotesc Tntotdeauna rezultatele La
"-' , _.... .. ........"
recomandarile APA (2001), Tn.artieolele de speeialitate se regasese exprimari de
genul t,(23.) =: 4,11, P < .01, ori F (2, 20) =: 1,73, p> .05. Daea t
simboluri-ale-tehnicilor statistice util'iZate, iar peste pragul dEi.semnificat
ie
asociat
valori, datele din Tnseamna de libertatr::: Tn
vananta clasiea, aceste coordonate ne ajutau sa descoperim valoriie.statisJ
i
g
e
din
tabel care trebuie comparate cu valorile calculate de noi. 0 data cu aparitia
statisticii pe calculator, aeest lucru a devenitDn atavism, deoarece pragul de
semnificatie este oferit de calculator, Tmpreuna cu rezultatele obtinute.
ce sunt gradele de libertate care sunt elementele care determina
valoarea lor? Cu umor, Yu (2003) remarca faptul ca aceste grade de libertate nu
au nimic de a face cu casatoria, un barbat Tnsurat, avand 0 singura partenera,
nu mai are nici un grad de libertate. autor of era 0 excelenta explicatie
intuitiva pentru gradele de libertate pomind de la elementf:)le esentiale ce intervin Tn
determinarea lor: respectiv numarul de cr
e
trebuie
calculati. Fara a avea caracter de . lege, gradele de libertate pot fi exprimate
frecvent prin numarul de observatii minus numarulde relatii necesare pentru a
obtine i!9-ele date (n-r). .......... '
46
,
-'
........ .. ,

,,' "
I
*/
/
/
/
I
-/*
I
/ *
/
I
I
*
Figura 2.3. Dependenta grade/or de numaru/ de
(zero grade de libertate - stanga; dotrivirea perfecta - Tn mij/oc; - Tn
dreapta)
Tn imaginea din stanga avem un singur caz, adica un singur subiect testat.
Daca dorim sa estimam directia sa de evolu\ie, yom avea 0 multitudine de
posibilitati (Iiniile punctate). Pomind de la ideea ca gradele de libertate pot fi reduse
la expresia n-r, Tn cazul de fata yom obtine valoarea 0, deoarece avem un singur
subiect (n=1) 0 singura estimare de facut, vizand evolutia ulterioara a subiectului
(r = 1). Intr-o situatie cu zero 9..L9P.edeji9e.rtate nu exista nici 0 posibilitate de a
dovedi model, deoarece orice solutie poate fi
sl2rijinita.
Tn imaginea din mijloc, avem doua osingura relatie de
demonstrat (gradul de asociere dintre cele doua observatii). Facand calculul, ne
aflam Tntr-o situatie cu un singYLgradde libertate. De aceasta data yom ave a 0
singura solvtie .corecta, estimata prin linia' care trece prin cele doua
puncte. Cazul se (Tn engleza "perfect fit"), Tnsa Tn ciuda
numelui, nu ne dorim 0 asemenea situatTe. De ce? Deoarece modelul gasit perfect
este Orice alt model altemativ nu poate fi comparat, pentru a
studia Tn ce masura modelul initial descrie cel mai bine de dare:- .."
Tn imaginea din dreapta situatia se schimba Punctele din imagine nu
mai reprezinta observatii, ci variabile. Daca numarul variabilelor de estimat este
mai mare decat numarul de observatii, ar trebui sa obtinem 0 valoarea negativa a
gradelor de libertate. Aceasta situatie nedorita se suprapotrivire (Tn
engleza "over-fitting"). ..
Reeapituland, la zero grqge .. determina 0 solutie; Tn
caz de solutia este .. adevara.ta; ia7-in'" de
solutia este aproape Tntotdealjna adevarata. De aceea Tntalnim
putine cercetari bazate pe tehnici statistice efectuate pe un numar mic
de subiecti, iar atunci cand se intampla, rezultatele lor sunt privite cu
circumspectie. Pentru a elimina neajunsurile prezentate, va trebui sa avem rtllll.t
mai decat parametrii de. estimat. Numai astfel yom putea
cu increderecalitatea (fa/sitatea) testat.
47
31BLlOGRAFIE
l.PA (2001). Publication manual of the American Psychological Association (5th ed.).
Washington, DC: American Psychological Association.
3ecker, L. (2003). Effect size. Gasit la: http://www.uccs.edu/-lbecker/psY590/es.htm.
::;Iocotici, V., Stan, A. (2000). Statistica aplicata In psihologie. lai: Editura Polirom.
::;ohen, J. (1990). Things I have learned (so far). American Psychologist, 45(12),1304"1312.
::;ohen, J. (1994). The earth is round (p< .05). American Psychologist, 49(12), 997-1003.
Jyer, C. (1995). Beginning research in psychology: a practical guide to research methods
and statistics. Oxford, UK: Blackwell Publishers Ltd.
Embertson, S.E., Reise, S.P. (2000). Item response theory for psychologists. London:
Lawrence Erlbaum Associates, Publishers.
Fan, X. (2001). Statistical significance and effect size in educational research: two sides of a
coin. The Joumal of Educational Research, 94(5), 275-282.
Faul, F., Erdfelder, E. (1992). GPOWER: A priori, post hoc, and compromise power
analyses for MS-DOS [Computer program]. Bonn, Germany: Bonn University, Dept. of
Psychology.
Hastie, R., Stasser, G. (2000). Computer simulation methods for social psychology. Tn H.T.
Reis & C.M. Judd (eds.). Handbook of research methods in social and personality
psychology (p.85-114). Cambridge: Cambridge University Press.
Hinkle, D.E., Wiersma, W., Jurs, S.G. (1994). Applied statistics for the behavioral sciences
(3
fd
ed.). Boston: Houghton Mifflin Company.
Kirk, R.E. (1982). Experimental design: procedures for the behavioral sciences (2
nd
ed.).
Belmont, CA: Brooks I Cole Publishing.
Leventhal, L., Huynh, C.L. (1996). Directional decisions for two-tailed tests: power; error
rates, and sample size. Psychological Methods, 1 (3), 278-292.
Pedhazur, E.J., Schmelkin, L.P. (1991). Measurement, design, and analysis: an integrated
approach. Hillsdale, NJ: Lawrence Erlbaum Associates, Publishers.
Rosenthal, R., DiMatteo, M.R. (2001). Meta-analysis: recent developments in quantitative
methods for literature reviews. Annual Review of Psychology, 52, 59-82.
Rosenthal, R., Rosnow, R.L., Rubin, D.B. (2000). Contrasts and effects sizes in behavioral
research. A correlational approach. Cambridge: Cambridge University Press.
Sava, F. (2001). Reducing teachers' misbehaviour: an action approach. Revista de
Psihologie Aplicata, 3(4), 31-42.
Sava, F. (2002). Ten ways to increase statistical power. Analele Universitatii de Vest din
Timioara. Seria Sociologie, Psihologie, Pedagogie i ASistenta Sociala, 8, 89-92.
Sava, F. (2003). Puterea statistica i testarea ipotezelor. Psihologia Resurselor Umane,
1 (2), 28-34.
Singer, B.R., Lovie, A.D., Lovie, P./(1986). Simple size and power. Tn A.D. Lovie (ed.). New
developments in statistics for psychology and social sciences (p.129-142). London: ThEl
British PSYChological SOCiety and Methuen.
Smith, E.R. (2000). Research design. Tn H.T. Reis & C.M. Judd (eds.). Handbook of
research methods in social and personality psychology (p.17-39). Cambridge:
Cambridge University.
Thompson, B. (1999). If statistical significance tests are broken / misused, what practices
should supplement or replace them? Theory & Psychology, 9(2), 165-181.
48
ill' '111 111:1111 III! 11111111'1111111

!i III I' Ili'II"!'i!'!IIII'lllllillll,IIIIIIII':1111111IIIIIII1 I! II! 'li'II"'II':I"il! 'I"!" II , I' "I:li Ili:1 li'II"I,ii lIil,'
Thompson, B. (2002). "Statistical", "practical", and "clinical": how many kinds of significance
do counselors need to consider? Joumal of Counseling and Development, 80, 64-71.
Tversky, A., Kahneman, D. (1993). Belief in the law of small numbers. In G. Keren & C.
Lewis (eds.). A handbook for data analysis in the behavioral sciences: methodological
issues. Hillsdale, NJ: Lawrence Erlbaum Associates, Publishers.
West, S.G., Biesanz, J.C., Pitts, S.C. (2000). Causal inference and generalization in field
settings: experimental and quasi-experimental designs. In H.T. Reis & C.M. Judd (eds.).
Handb?ok of .research methods in social and personality psychology. Cambridge:
. Cambridge University Press, 40-84. .
Yu, (2003). Illustrating degrees of in terms of simple size and dimensionality.
Gaslt la adresa http://seamonkey.ed.asu.edu/-alexicomputer/sas/df.html.
49
TEHNICI INTRODUCTIVE DE TESTARE A IPOTEZELOR
Daca Tn capitolul anterior am insistat asupra logicii i principiilor de baza Tn
testarea ipotezelor, Tn urmatoare yom aplica cunotintele respective la
nivelul celor mai raspandite tehnici statistice introductive. Testarea ipotezelor, Tn
cazul unui studiu cu doua variabile, po ate fi Tnteleasa simplificat ca raspunsuri la .
una dintre urmatoarele intrebari: "Exista 0 statistic Tntre
doua variabile?" sau "Exista statistic Tntre doua grupe?". De
notat ca sintagma "semnificativa se refera la amplitudinea corelatiei
. '
sau a diferentelor observate, ci implica ideea unei probabilitati foarte mici de a
obtine datele culese in conditiile in care ipoteza nula este adevarata. Premisele
acesteia indica, fie ca "nu exista asociere intre cele doua variabile", fie ca "nu
exista diferente intre cele doua populatii din care au fost extrase e!iiantioanele".
3.1. Testarea asocierii dintre doua variabile
3.1.1. CoeficientuJ de coreJatie r
Prin analiza corelationala se urmarete in ce masura dintr:o
variabila sunt insotite variabjJa. Coeficientul de ccirelatie
liniara r este cel mai inb31nit indicator de masurare a gradului da.asociere dintre
Aa cum am precizat in capitolul destinat prezentarii elementelor de
descriptiva, r poate varia intre -1 i 1, unde 0 semnifica absenta legaturii
dintre doua variabile.
Sa presupunem ca intre nivelul de extroversiune i nivelul de neuroticism
nu exista legatura, adica avem un regal cu O. Pentru a testa relatia, yom extrage
un eantion de 30 de persoane din cadrul studentilor la psihologie, yom testa
'nivelul celor doua dimensiuni ale personalitatii !iii yom obtine 0 valoare r de -.09.
Daca am fi testat aceeai relatie pe alii 30 de 'studenti la psihologie, alei la
fntamplare, am fi obiinut un r de .04. Extragand alte loturi de subiecti, vomobserva
ca majoritatea indicatorilor r sunt apropiaii de zero i mult mai puiini sunt
indepartati de aceasta valoare. Din pacate, in practica nu ne permitem sa
extragem atat de multe eantioane pentru a testa relatia dintre doua variabile. De
obicei se testeaza un singur lot de persoane, rezultand 0 valoare r unica, sa zicem
-.12. intrebarea devine: ce probabilitate exista sa obiinemun r de -.12in conditiile
in care ru.WaX!ta legatura Tntre cele doua variabile (r real este O)? Indica un r de
51
1111 111,1111 IIh'lII III: III 11,11111111:111:,1111111 1111111'111111,,1111111111 I: ,I!: 'II !I: !I I' :::11 I' '1::I,lli:II,II: I'!IIII:IIIII 11111 ,1111::111
-.12 absen\a asocierii Intre cele doua variabile? Conform statisticii descriptive nu
ne putem da seama de acest lucru, deoarece valoarea de ;.12poate fi interpretata
ca 0 asociere negativa Intre cele doua varia bile, ceea ce implica faptul ca
persoanele cu scoruri ridicate la extroversiune tind sa aiba un nivel mai scazut de
neuroticism.
Dinpacate, sunt de 0 serie de factori, In
special de volumul 'Uh r de -.12 indica 0 Intre cele
doua variabile de . persoane, respecti'v
relatiei dintre variabile In cazul unui de'SO de persoane. Pentru a lamuri
dilema este nevoie sa privim valoarea coeficientului de corelaiie din
perspectiva statisticii inferen\iale.
lata un exemplu ipotetic, menit sa faciliteze inferen\iala a lui r:
-"""'-'''------_ ..._-------
Conform unei analize efectuate de Leary, Tchividjian !?i Kraxberger (1994/1999),
intre nivelul de auto-prezentare (management al impresiei) !?i cheltuielile lunare pe prod use
cosmetice exista 0 asociere pozitiva. Un nivel ridicat de management al impresiei indica un
autocontrol puternic faia de modul in care 0 persoana este perceputa de catre cei din jur i
implicit, mai multa grija faia de aspectul sau fizic. De aceea, ne a!?teptam ca un nivel crescut
de auto-prezentare sa fie asociat cu mai multe cheltuieli pe produse cosmetice. Pentru a
studia rela\ia dintre cele doua variabile, vom colecta date cu privire la cheltuielile lunare,
exprimate in EURO, pe produse cosmetice !?i la nivelul de management al impresiei, ob\inut
pe baza unui chestionar. Lotul testat include 50 de adolescenii (25 de fete i 25 de baie\i),
ale caror raspunsuri sunt prezentate in baza de date "corelatii.sav'.
Pentru a rezolva problema, va trebui sa raspundem la urmatoarele
Tntrebari:
1) Cum identificam faptul ca este yorba de 0 corelaiie?
2) Ce fel de date au fost colectate?
3) Condiiiile aplicarii corela\iei respective sunt Tndeplinite?
4) Ce fel de ipoteza trebuie testata?
5) Cat de intensa este asocierea dintre cele doua variabile?
Raspunsurile la primele patru Intrebari ne ajuta sa gasim coeficientul de
corelaiie care trebuie calculat ne ofera 0 imagine des pre gradul de adecvare a
interpretarii valorii gasite. Ultima Intrebare vizeaza un aspect distinct, ce tine de
marimea efectului, adica de intensitatea relaiiei dintre cele doua variabile.
(1)Cum identificam faptul cii este vorba;!fil,o corela!ie?
Multe dintre studiile Intreprinse Tn psihologie apeleaza la metoda corelaiiei.
Putem identifica necesitatea analizei corela\ionale din modul de. a
obiectivului, respectiv a ipotezeL.de,cercetare. Expresii de genul: "urmarim sa
dintre inteligen\a memorie", "exista-o"legatura
52
1!111'!IIIIII::III,IIII.lII" "II,:illllll':IIIIIIIIII:IIIIII'II:,!1 111,11 il:'II,111
Intre agresivitate frustrare", "temperaturile crescute tind sa conduca la un
consutn ridicat de lichide", "vom analiza.@iJla dintre extroversiune timiditate"
indica ,ideea de corela\ie. Tn exemplul dat, e;presiile "un nivel crescut de auto-
este asociat cu un consum maj mare de prod use cosmetice" ori "pentru
a dintre cele doua variabile" sunt indiciile care ne con due 'Ia ideea
necesita\ii dea calcula un coeficient de corela\ie.
(2) Ce fel de date au fost cQlectate?
Cheltuielile lunare 'pe exprimate Tn euro, reprezinta
date de tip Tn timp ce nivelul de management al impresiei este
masurat prin scale numerice de tip interval, prin cumularea raspunsurilor la cele
cinci Tntrebari. Astfel, cheltuielile pe prod use cosmetice sunt Intre 2 28
de EURO, iar nivelul de management al impresiei este situat intre 5 20 de
puncte, un rezultat ridicat Tnsemnand un nivel crescut de auto-prezentare. Tinand
cont ca ambele variabile sunt scale yom apela, mai
probabil, la coeficientul de corela\ie r.
(3) Condi!iile
Pe lang a aLqtE?I\Jr colectate, pentru a aplica r mai este
nevoie ca rela\ia dintre cele doua Iini51ra ca norul de puncte sa
indice 0 situaiie de Ambele aspecte, discutate Tn capitolul
introductiv de statistica descriptiva, pot fi apreciate prin inspectarea norului de
puncte din figura 3.1.
30,-------____ --,
30,--------,
20
sexul persoanelor
o baieti
x fete
10 16
managementul impresiei
managementu( impresiei
Figura 3.1. Norul de puncte dintre cele dOU8 variabile nediferentiat (in stanga), respectiv
diferentiat in functie de sexul respondentului (Tn dreapta)
Daca analizam imaginea din partea stanga, yom constata atat liniaritatea
relatiei (punctele par a evolua dinspre stanga jos spre dreapta sus, indicand 0
53
____ ' ""IIIIIIIIIIIIIIII'lllllljIIIIUIIIIIUIIIIUIIIIUIIIIUIIIIUIIIIII,IIIII,IIIIILIIIIIIUIIIII"IIIILlIIIIIJIIIII:IIII"IIIIUllllldIIIILlIIIIUIIIIIJIIILlIIIIIIIIIIIJIIII"""""""",""""1"" 111'IIIIIIIIIILIIIIII'IIIIIIIIIIII'IIIIIII',IIIIIIIIIIIIIIIIIIII"'1I1I1I1I1I1I1I1111111111 11111 1111:'1111 :"1'"",,"11 'III' "",1""""1"",:""""1""111111""1,""1""1:""1'""111"""11""1""1"111,1111111111111111111'1111' """",,,"","""""11"",,"","",,"","", III' :11,
asociere liniara pozitiva Intre variabile), cat 9i homoscedasticitatea relat
iei
(punctele par a forma un nor de puncte de grosime similara pe Intreaga
amplitudine a evoluiiei celor doua variabile). Prin urmare, toate condiiiile aplicarii lui
r sunt Indeplinite. Totu9i, daca yom analiza 9i imaginea din dreapta, cu norul de
puncte rezultat In urma diferentierii dintre cele doua sexe ale subiectilor
respondenii, yom observa ca, In cazul baieiilor, punctele sunt c8va mai impra9tiate
(norul de puncte fiind mai gros). Aceasta imagine ne face sa credem ca
legaturii dintre cele doua variabile este uor diferita pentru fete,
respectiv Mieti. Cu alte cuvinte, ne ateptam sa existe 0 asociere mai mare Tntre
preocuparea pentru managementul impresiei cheltuielile lunare pentru prod use
cosmetice In cazul fetelor, decat Tn cazul baietilor. De aceea, pe lang a valoarea lui
r pentru Intregul lot de subiecti, yom calcula i valorile r pentru fiecare sex Tn parte.
Aceasta masura este complementara Tn cazul corelatiei, Tnsa devine esentiala Tn
stabilirea unor ecuatii de regresie predictive.
Tot din imaginea respectiva se observa cheltuieli mai ridicate din partea
fetelor pentru prod use cosmetice Tn comparatie cu cele ale baietilor.
(4) Ce fel de ipoteza trebuie testata?
Ipotezele de cercetare pot fi exprimate, fie in termeni unidirectionali
(unilaterali), fie Tn termeni bidirecJ;il.Qali (bilaterali). Tn prima categori;"mcfudem
expresii de genul "persoanele cu un nivel de inteligenta ridicat tind sa obtina
performante superioare Tn rezo!varea problemelor de logica" sau "un nivel
de anxietate tinde sa fie asociat cu un nivel scazut de agresivitate verbala". In
ambele expresii este clar directia asocierii dintre variabile, ea fiind
pozitiva in primul caz ("canCI Y tinde sa creasca") 9i negativa in cel de-al
doilea ("cand X crete, Y tinde sa scada"). Tn schimb, ipotezele
precizata clar directia de asociere dintre doua variabile. Expresii de genul "exista ci '
coreiat
ie
Tntrt:X'i Y" sau "exista 0 corelatie intre problemele de sanatate 9i nivelul
de management al impresiei" sunt tipice pentru cazul ipotezelor bidirectionale.
Tn exemplul nostru putem distinge situatia unei ipoteze unilaterale,
deoarece directia asocierii dintre variabile este precizata. Cercetatorul se ateaPtat,'
ca un nivel crescut de autoprezentare sa fie asociat cu un consum mai mare de
prod use cosmetice. I
Importanta distingerii dintre cele doua tipuri de ipoteze se regase9
te
Tn t
valorile r semnificative statistic. Testareq,.ipotezelbrunidirectionale urmarete in ce
masura Y.9.l9r:ea lui, r este semnificativ difedtade_O Tn sens pozitiv (in cazul unei
prezise asocieri pozitive), respecthdO,sens negativ (in cazul unei prezise asocieri
inverse). Tn schimb, testarea bidirectionale urmarete in ce masura r
difera semnificativ de 0 Tn oricare directie,fie spre -1, fie spre +1. Datorita acestor
mLmai multe '9anse sa obiinem un rezultat semnificativ
statistic Tn cazul ipotezelor unidirectionale decat in cazul celor bidireciionale.
Sintetizand raspunsurile cheie pentru problema data, yom concluziona ca
putem aplica coeficientul de corelatie r (coeficientul de corelaiie r Bravais-
54
",":,", 11111111 :11111111 '11111111'111111111111111111111"1111' !IIII,IIII"IIII 11111 1111'11111 11111'1111,111 IIII!IIIII 11111111111'1111111111':1111111111111'11111111111111111111111111 !III' 111111111111' 11111111 'III 1111 III! I'II'II'!IIII,'II'IIIIII"IIII'II'IIII'II"IIII':IIII '11"'11' """""'"""""'""""'"""""""'""'""'''""""' """"""""""'''"'''""''""'""''""'""'"" 111111" ""' 1111 'II" "" 1111'" Ii'.,,'__ _
pearson), deoarece ipoteza dorete stabilirea gradului, de asociere dintre
preo-cuparea pentru managementul impresiei i cheltuielile lunare pentru prod use
cosmetice. Ambele varia bile sunt masurate prin scale numerice, iar relatia dintre
ele e\'ite liniara 9i homoscedastica. Tn plus, pentru testa rea valorii r va trebui sa
tinem seama de faptul ca ipoteza este formulata Tn termeni unidirectionali
, (unilaterali). -.--_.- - --- ,
Tn SPSS yom obtine valoarea lui r, daca yom urma calea din meniu:
Fereastra deschisa ca urmare a acestor optiuni
are selectata ca standard "f:earson", adica exact coeficientul de corelatie
de care avem nevoie."Na,famane doar sa selectam variabilele ce urmeaza a fi
corelate i sa modificam optiunea "two-tailed" (bidirectional) Tn "one-tailed"
(unidirectional). Output-ul oferit de SPSS este prezentat Tn figura 3.2. .. ..-;:
produse managementul
cosmetice impresiei
prod use cosmetice Pearson Correlation 1 ,699*
8ig. (1-tailed) , ,000
N 50 50
managementul impresiei Pearson Correlation ,699* 1
8ig. (1-tailed) ,000
N 50 50
**
. Correlation is significant at the 0.01 level (1-tailed).
,Figura 3.2. Output-ul SPSS eu rezultatul eorelatiei dintre eele doua variabile
SPSS este 0 marca inregistrata.
Rezultatul se poate scrie simplu sub forma: r(48) = .70, P < .01. In
expresie, r este simbolul coeficientului de corelatie liniara simpla, iar Tntre
paranteze sunt trecute gradele de libertate ale testului. Valoarea 48 indica gradele
de se Tn N
. semnJfJca numarul de subJect! testatl. Valoarea de .70 este rezultatul rotunjit
observat la intersectia dintre managementul impresiei 9i produsele cosmetice,
adica r. Tn sfar9it, p < .01 semnifica probabilitatea de a obtine datele observate Tn
condiiiile Tn .. exista 0 asociere intre 9i nivelul
cheltuielilor pentru produse cosmetice. Tn cazul de bbservao probabilitate
mai mica de 1 la 100 .01) de a obtine un r de '.70 Tn conditiile Tn care nu ar
exista 0 corelatie Tntre cele doua variablle. ' ,
Prin urmare, datele sprijina ipoteza lansata, conform careia 0 preocupare
crescuta pentru crearea unei impresii favorabile Tn ochii celorlalti se asociaza cu
cheltuieli mai ridicate pentru achizitionarea de prod use cosmetice. Ramane sa
stabilim magnitudinea relatiei dintre cele doua variabile, nu Tnainte de a aminti ca
relatia dintre cele doua variabile este r(23) = .79, P < .01 Tn cazul fetelor, respectiv
r(23) = .58, P < .01 Tn cazul Mietilor.
55
r
i
111'111 11111:
(5) Cat de intensa este asoeierea dintre eele doua varia bile?
Majoritatea textelor statistice evita sa raspunda la aceasta Tntrebare,
rezumandu-se sa prezinte rezultatele sub forma meniionata anterior.
cum am subliniat Tn capitolul destinat testarii ipotezelor, pragul de semnificatie pifu
indica intensitatea unei relatii ci raritatea de a obtine asemenea date Tn condiiiiTe -....:. ____ ,_"'_ .. __ 0'" " ____ ." >.__ I __
Tn care .ipoteza nU.la. este adevffirata. Spre eXemplu, la un numar de 700 de
persoane -r dar semnificativ...s.tatistic, cum ar fi. r
(698) =: .08, p < .001.
Cel mai utilizat criteriu pentru a aprecia dintre dOLia
variabile se coeficie[lt de determinare, notat cu r2. cum arata simbolul
sau, se calculeaza foarte fiind patratul coeficientului de corelaiie. EI poate fi
exprimat Tn procente, unde 100% corespunde unui coeficient de corelatie de 1
sau 1. Din pacate, acest criteriu nu este Tntotdeauna adecvat din cauza influen\ei
pe care 0 are marimea lotului Tn determinarea valorii lui r implicit, a coeficientului
de determinare. EI trebuie analizat cu grija Tn cercetarile corelaiionale cu illi?iputin
de20desubiecti, respectiv cele care de peU3gane.
Prin intermediul coeficientului de determinare se evalueaza
asociere comuna a. celor . dOllc3"Variabile,indicand procentul diR-dispersL9 .. unei
variabile care modul de impral?tiere a celeilalte vqriabile. Cu' alte
cuvinte, coeficientul de determinare arata .. comunalitate dintre doua
variabile. In cazul in care una dintre variabile este inClependenta, iar cealalta
dependenta, interpretarea se modifica Coeficientul de determinare poate fi
Tn\eles ca procentul dir;J-!:Ii9.[2er.i? ,.variabilei ... .. evoluiia
Schmelkin, 1991). Cu alte cuvfnte',
coeficientul de determinare nearata cat" ..pemare este'influenta variabilei
independente asupra variabiJei de pendente.
In exemplul ilustrat, vom-6btine un coeficient de determinare r2 de .49
(49%), ceea ce Tnseamna ca aproape jumatate din dispersia celor doua variabile
are 0 evolutie comuna. De obicei, coeficientul de determinare atinge valori mult mai -"H
mici. Prin comparatie cu criteriul orientativ stabilit de Cohen (1988) pentru indicele
.' d, putem aprecia ca un coeficient de determinare de"'GQtindica 0 asocieresc.azuta
Tntre doua variabile, 0 valoare de . .D6 ...indica 0 asociere de intensitate medie intre
doua variabile, iarun r
2
de 0 asociere puternica Tntre douc3 variabile.
In consecinta, Tntre gradul de preocupare pentru managementul impresiei
cheltuielile lunare pentru produse cosmetice exista 0 legatura foarte puternica. Cu
cat gradul de preocupare pentru imaginea avuta Tn ochii celorlalii este mai mare,
cu atat exista 0 tendin\a de a cheltui mai mult pe prod use cosmetice.
o alta limita a coeficientului ge determinare 0 constituie valoareapracticil.a
unei asocieri. Uneori, cum am amintit de rela\ia dintre aspirina infarctul
miocardic, un coeficient de determinare extrem de mic, de numai 0,1%, arata ca 34
din 1000 de atacuri de cord ar fi putut fi evitate prin consumul de aspirina. Deci, pe
langa magnitudinea schimbarii eviden\iata prin indicatori ai marimii efectului,
precum r2, va trebui sa tinem seama de aspectul valoric al schimbarii.
- -

56
Tn fine, se cuvine sa reamintim ca exista 0 conven\ie de folosire a semnelor
Tn cazul indicatorilor de marime a efectului. vor lua valorillega!ive Tn cazul
Tn care efectul apare gp.usa,selei precizc:lte in ipoteza, respectiv semnul
plus, daca efectul apare in directia scontata. _." ... -
Limitele interpretarii eoefieientului de eorelat
ie
Pana la urma, corelaiia nu este decat un procedeu statistic ce masoara
covari9DJg9in
tre
. doua variabile standardizate. din punct de vedere
un'urcbefiCieritCle corelaiie poate diferi, indica aceeal?i
cantltate a aSOClerli. Spre exemplu, un r de .60 arata un grad de covarianta ridicat
intre doua variabile, sursa legaturii dintre ele poate fi
de baza: _ .... , .
Corelatia nu impliea 0 eauzalitate
Multi incepatori tind sa testeze, prin metoda corelatiei, ipoteze ce contin
sintagme cauzale. 0 expresie de genul "Tn ce masura
perfo[!I1
an
t
e1
e ale subieciilor" fi r.
Valoarea coeficientului de corelaiie poate arata doar daca cele doua variabile
covariaza in directie, Tnsa un r semnificativ nu poate fi un substitut pentru a
demonstra existenia unei relatii cauzale. Aceasta poate fi demonstrata, fie printr-un
des}gn experimental ce presupune manipularea variabilelor de interes de catre
cercetator, fie printr-un demers logic, Tn care relaiia dintre cele variabile este
clara (caldura excesiva duce la consumului de lichide nu
consumului de lichide duce la temperaturii aerului). .
Sursa dintre doua variabile poate fi diversa
. """
. Brewer (2000) of era 0 sinteza excelenta cu privire la posibilele surse ale
corelatiei dintre doua variabile. Acestea au un rol deosebit in stabilirea validitatii
interne a unei cercetari. '
o posibila cauza a reJ.atiei dintredoua variabile este tocmai dependenta
de cealalta, cum ar fi consumului de lichide cu cilt
gradul de deshidratare
Figura 3.3. Schema unei re/ati; cauza/e 7ntre doua variabile
57
o alta rela!iei dintre doua _variabile este asocierea
(dependen!a) uneia-sal,le,arnbelor variabile terta.:.varia.t?Jla. Asemenea asocia!ii
se numesc corelatiiJalse (in engleza "spurious correlations")':
Figura 3.4. Schema unei re/atii false lntre doua variabile X i Y
Tn parteastanga a figurii 3.4, corelatia dintre X Y este rezultatul influen!ei
unei variabile terte C. Aceasta are 0 relatie una cauzala-cu-:::{...
Sa presupunem ca un cercetator ajunge la concluzia ca zilele ploioase (X) duc la 0
dispozitie afectiva depresiva (Y). 0 asemenea concluzie este eronatc\ deoarece 0
multime . de fenomene atmosferice, precum presiunea aerului sau gradul de
luminozitate, sunt asociate cu prezenia sau absenia ploH fara a exista 0 relaiie de
cauzalitate Intre ele. Tn schimb, aceste conditii atmosferice pot influenta dispozitia
afectiva a subiectilor. in consecinta, dispozitia afectiva nu este dependenta de
prezenta sau absenta ploii, ci de conditiile atmosferice care insotesc acest
fenomen natural. De remarcat ca pot fi 0 multitudine de variabile terte care sa
afedeze relatia dintre doua variabile.
Tn partea dreapta a figurii 3.4, cele doua variabile X Y ajung sa varieze
deoarece ameele,suntintluentate de 0 variabila terta. 0 situatie tipicaar fi relatia
testata pe un lot intre 2 17 ani, de ore de somn' $i
numarul de cuvinte $tiute. Corelatia talsa dintre cele doua variabile ne-ar putea
duce la concluzia ca 0 persoana care doarme mai putin, $tie mai multe cuvinte.
Situatia ar putea fi u$or remediata daca am $i controfa rofuf varstei
asupra celor doua variabile, dependenta evofutiei somnufui $i a
dezvoftarii fimbajului de varsta cronofogica.
ascunse (neluate Tn seama\l].u sunt singurele care PCltinfluenta
vaHditatea ,r.ezuftatelor unei cercetari. Chiar $i in situatia existentei unei
relatii cauzale, aceastapoate fi rnoderata de prezenta altor variabile. Moderarea
reJatLE?l presupune cre$terea dintre doua
variabile. Un exemplu cotidian de variabila moderatoare este tipul de ten, care'
afedeaza relatia dintre perioada de stat la soare $i nivelul de bronz al pieHl. Tn
psihologie, multe variabile de tip eticheta, precum sexul persoanei, varsta, nivelul
de experienta pot influenta relatia dintre doua variabife. Cef mai recent exemplu
poate fiobservat In imaginea din dreapta a figurii 3.1, In care se observa ca sexul
unei persoane modereaza refatia dintre managementul impresiei $i vofumuf
cheftuielilor pentru produse cosmetice. Astfef, in cazul fetelor relatia dintre cele
58
IIII Illi:II!!
doua variabile este mai intensa (r = .79) decat Tn cazul b-' t'l (_ .
. . . ale,lor r - .58). Uneon
vanabilele moderatoare pot chlar bloca relatia cauzal- d' t X . Y --"'".,,,'
.. -..: ' a In re $1 . Astfel, am
putea concluzlona eronat ca tlmpul petrecut la soare nu I'nfl t' - .
. ' uen eaza nlvelul de
a unel. pers_oan.e. Datele culese indica acest lucru, toti subiectii
testat
l
au fost Imbracatl in echipamente de protectl'e Ace t . -' I I' ' .
. .' " s ea jOaca ro u unel
, vanablle moderatoare a relatiei dintre X $i Y.
Figura 3.5. Schema unei relatii dintre X i Y moderata de 0 terta variabila
. Tn merita. facuta distinctia dintre variabilele moderatoare $i cele
medlatoare" In cazul ultlmelor, prezenta variabi!ei terte este _
aparitia relatiei d' t X . Y __.'" c, necesara pentru
, _ '. . Astfef, X afes!.?a
c
variabila C, care la randul ei
Y.. cazul dintre prezenta sau absenta ploii $i dispozitia
floofenta a alternativa, pe baza unei variabile
Atunci ploua (X), oamenll prefera sa ramana In casa (C). Or, aceasta implica
un redu.s contacte sociale (C) poate favoriza aparitia unei dispozitii
.rr). exemplu, din psihologia educationala,
cu privire la calitatea relatiei profesor-elev. Aceasta
la randul el, afecteaza motlvatla $colara a elevi!or.
Figura 3.6, Schema unei relatii dintre X i Y mediata de 0 variabi/a terta
Toate. situatii arata limitele validitatii asocierii dintre doua variabile
care nu pot fl Izolate de influenta altor aspecte neluate in studiu De aceea, un
concept interesant $i important este acela de corelatie partiaJa. .
.,
3.1.2. Corelafia partiala
Coeficientukdecorelatie dintre doua variabile noate ind
P
oate fi d"fi '1 d . t "..., ' '. c, uce In eroare sau
c, I ICI e In erpretat atunci cand relatia dintre cele doua este afectata de
Acest lucru este. mai ales Tn cazurile relatiifalsesau a
a elimma aceste neajunsuri se apeleaza Ii un artificiu statistic
denumlt corelatle partiala.
59
_11111111111111111111111111111111111111111111111111111111 Ii Ii !'III, i I, I" I',i'il,il II Illi'lIlllll
Luand exemplul corela\iei dintre nivelul de managemenJ al impresiei i
cheltuielile lunare destinate produselor cosmetice, yom aprecia probabil, ca relat
ia
este moderata, printre altele, de nivelul catigurilor lunare ale parintilor. Utilizand
baza de date "corelatii partiale.sav" i urmand calea "Analyze"-"Correlate"-"Partial"
yom deschide fereastra din SPSS specifica indicatorului de corelaiie part
iala
.
Inainte de a efectua aceastaoperaiie putem calcula corelat
iile
simple r dintre
fiecare pereche de variabile. Astfel, yom obtine r (48) = .70, P < .01 pentru relaiia
dintre managementul impresiei i cheltuielile 'Iunare destinate produselor
cosmetice, un r (48) = .51, P < .01, Intre managementul impresiei i venitul familial
lunar al subiect
ilor
, respectiv un r (48) = .77, P < .01, Intre veritul familial lunar i J""I'
cheltuielil,e lunare pe produse cosmetice. Ambele corelaiii ce implica venitul lunar
sunt semnificative, ceea ce ne face sa credem ca variabila respectiva influeni
eaza
relaiia dintre managementul impresiei i cheltuielile amintite. Venitul nu ar fi'i
influeniat relaiia dintre ele daca nici una dintre relaiiile venitului cu cele doua J
variabile nu era semnificativa. I'.
Pentru a vedea care este relatia dintre managementul impresiei i
cheltuielile destinate produselor cosmetice, eliminand influeni
a
venitului familial
lunar asUpra celor doua, yom calcula de corelaiie part
iala
. Acesta are ' I
mai multe simboluri, Tnsa noi II yom nota recomandarile "bibliei 1
psihologilor" (APA, 2001). Rezultatul obiinut indica pr (47) = .55, P < .01, valoare
l
mai mica decat cea exprimata Tn'relatia directa dintre cele doua variabile [r(48) =
.70, P < .01]. Astfel, iinand constanta influenia venitului lunar asuprarelaiiei dintre
cele doua, se constata, Tn continuare, 0 relatie pozitiva semnificativa Tntre
preocuparea subiectilor pentru managementul impresiei i cheltuielile efectuate
pentru achizitionarea de prod use cosmetice. De altfel, expresiile de genul
"eliminand influenta lui A" sau tinand constanta influenta lui A" sunt echivalente i .', . ,,'1": . ,'
partiala.
Coeficientul de corelaiie partiala poate fi calculat pentru . .fL
singura varigpliamoderatoare. Spre exemplu, putem calcula gradul de asociere
dintre managementul impresiei i consumul de prod use cosmetice eliminand
influenta exercitata atat de venitul familial lunar, cat i de sexul persoanei
chestionate. Cu fiecare variabila iinuta sub control statistic se pierde dUe un grad
de libertate. Daca In cazul lui r, gradele de libertate erau stabilite dupa formula N-2,
In sunt obtinute pe
numarul de variabile tinute constante. Astfel, In cazul unul pr
J (cu 0 singura variabila moderatoare) vom ave a in cazul unui pr dEl
(cu doua variabile moderatoare) yom avea . .9.C\.m.d. In exemplul dat,
valoarea 47 a gradelor de libertate a, fast obtinuta scazand din totalul de 50
subiecti testaii, valoarea 3, deoarece exista 0 singura variabila ce trebuia
constanta - venitul familial lunar.
Nu toate datele sunt exprimate prin $ale_lJumericepentru a se putea
calcula r. Destul de des variabilele sunt analizate pe baza freQl.ent
ei
de apariiie a
raspunsurilor i ceva mai rar, pe baza Au fost dezvoltate-o
60
.""1 n,
serie de tehnici, precum C alLu.i sau V al lui l<ramer care au la baza
X2. Alegerea coefiCf9niilor de asociere In de tipul de date
cu.,lese este prezEmtata Tn tabelul 1.2, dincapitolul destinat statisticii descriptive.
1
3.2. Tehnici de cornparatie 'intre grupuri
Ipotezele nu se rezuma doar la posibilitatea de a stabili
dintre.. ,yariabile. De multe ori interesul cade asupra stabilirii un or diferente
Tntrebarea "Poate terapia prin ras reduce
depresive?" poate fi analizata prin comparargC3diferentelor In ce privete nivelul
depresiei pe grupe: un grup care urmeaza 0 terapie prin ras i
un grup de _C9}Jtrol, asupra caruia cercetatorl:ll nu intervine. Evaluarea ,.diferentelor
dintre grupe este dependenta de modalitatea de masurare a acestora. Cel mai'des
lntalnim, fie variabile daJip D.9mipal, ale caror raspunsuri sunt analizate pe baza
diferentelor deft;ecvenJ;a",(X
2
). fie variabiLe de tip IJkIEneric. analizate pe baza
diferentelor t i
...
3.2.1. Tehnicile X
2
frecvent intalnita Tn cazul datelor QEltjpnomin.al, fie sub
forma unui gradului de.J).otrivire. (in engleza "goodness of fit"), fie sub
(Tn engleza "homogenity test"). 0
sltuatle tJplca pentru pnmul caz este de a stabili daca exista .. diferente semnificative
Tntre de genul: '., ,
"Daca duminica urmatoare ar avea loc alegeri prezideniiale, v-aii prezenta la vot?"
a) Da b) Nu c) Nu tiu I Nu raspund
Pe baza simplei analize de frecvente, rezultatele colectate sunt sintetizate
astfel:
Tabelul 3.1. Frecvenia raspunsurilor celor 70 de subiecti.chestionati
"Daca duminica urmatoare ar avea loc alegeri prezidentiale, v-ati prezenta la vot?"
DA , NU , NU :;lTIU NU RAsPUND
35 , 20 -, 15
1
Pentru detalii, vezi Clocotici i Stan (2000), Hinkle i colab., (1994); Rotariu i colab.
(1999); Sava (2003) sau Yaffee (1996). '
61
'.1''
I,
I
1
:ji
;'1
j,
, II, ill II' III '1111 ,11111 1IIIIIIIIIIILlIIIILlIIIII 11111 111111 11111',11111 11111"11111 11111,11111 111,111 ""."Ii :111111' 1111 III', 'III ,III' iIliLlIIIIL'IIIIIIIIIII.IIIIIIIIIILlIIIIL'IIIIIIIIIILlIlIl IIIILIII' 'II, III 1111'1111,11111'111,1111'11111111,1111111111111, ,I" ,III :111 11111111, 'III ,III lili ,III, :lIIlIIi ,III, 1111111: '1111 IIIhlllll 1l1Ii'1I1I,IIII'IIII':1II1 11111 'llih 1I1II1 _______ TffflITffflTfffl TffIlITffllTfffl:Tfffllfffl Tfffl'TffflTfffl Tfffli TffflTffflTffflIfffllTffffTffffTfffP,'TrrnTfffP'TrrnTffl1fflTrrnTffl!WTffl TIl TIl TffI Tfl ,III 1ff III Tffl III TffI Tffllill 1111 TffI:Tfl TffIlTffl ____ TffITfWTffHrnmnrrflffflmnmrnrrrmnmnlrrtlrrtmrtlrrt1fl'1ffrrrnrrrffTI
Tn schimb, testul X2 al gradului de omogenitate se folosete atunci
dorim sa vedem intre categoriile de raspunsde ..Ia-doua
Tntrebari. t?"
. duminica urmatoare ar avea loc alegeri prezenta la vo ,
" a) Da b) Nu G) Nu / Nu raspund .
Ati votat la ultimele alegeri
II ,
a) Da b) Nu
Tn acest caz, gradului de omogenitate va fi ,utilizata
sintetizarea prealabila a raspunsurilor -Ia . .cele. Tntr-un singur tabel.
Tabelul 32' Frecventa raspunsurilor celor 70 de
..
, ' tit?"
Daca duminica urmatoare ar avea loc alegeri v-atl prezen a a vo .
" Da Nu Nu
votat la ultimele
Nu raspund
I
7
5
alegeri prezideniiale? Da
24
r
13
10
Nu 11
Ipoteza nula a ambelor variante aLe.._JehniciLx2 stipuleaza ca .nu exista
diferente semnificative intre frecventa--r.asp.L1nsLJril?r .. I cea a
.. categorii Wiersma 1
Exemplul ce insotete explicarea celor X2 este 0 adapta:e Ipotetlca a
celui de-al doilea experiment realizat de GlaldJnI I colab, (1976/1999),
Studentilor Ii s-'au adresat prin telefon intrebari generale ale caror
d
'Intu' 'It exact cum ar fi ce procent de studenti dintre colegii tai lucreaza?". Dupa
erau greu e , ". ' u' .. fi' d
t
erm'lnarea celor "ase intrebari, a intervenit manipularea experimentala,
y U db k T unand
aleatoriu Tn trei grupe. Gelor din prima grupa Ii sua dat POZIIV, sp
U u s mult ma'l bine decat media cinci din cele raspunsun filnd corede, Gelor
ca au raspun .' ....
din grupa a doua Ii sua oferit un feedback neutru, raspunsurile lor fll.nd medII, au
raspuns cored la trei intrebari din in cei din al trellea grup pnm.lt un
feedback negativ, experimentatorii sugerand ca au raspuns m.ai slaub _decat media,
raspuns fiind cored. Dupa aceasta manipulare Ii sua pu.s 0
legata de rezultatul echipei de fotbal american a la unul dln,tre
ultimele doua meciuri sustinute. Unii au fost de rezultatul meclulUi plerdut de echlpa
universitatii iar altii de meciului Raspunsurile la intrebare au fost .codate
in una din' cele 'doua categorii: "noi" sau "non-noi". In categoria "noi" au fost Inclus.e
raspunsuri de "I-am batuf', "Noi am pierdut", ,,Am catigat cu 4-2", din,
nu ce au facut ai notri", iar in categoria "non-noi" s-au regaslt raspunsun
precum "Au pierdut", "ered ca au catigat", "Nu tiu ce-au tacut". _ . .
Studiul avea doua ipoteze:' (1) raspunsurile de tip "noi" apar mai frecvent In
de victorie a echipei de fotbal, decat in cea de infrangere; (2) acest efect va fi intenslficat In
62
I
I
.. (
cazul subiectiiorcarora'ii sua dat anterior un feedback negativ. Ambele ipoteze pornesc de la
premisa ca d persoana tinde sa se asocieze cu evenimente publice pozitive, respectiv sa se
distanteze de evenimente publice negative, efedul fiind potentat mai ales pentru subiectii
, care au suferit personale. .,
Prima ipoteza necesita un test X2 al gradului de potrivire, Tn timp ce a doua
ipoteza necesita un test X} al gradului de omogenitate. II) continuare vom detalia
asemanarile i diferentierile dintre cele doua forme X2.
Ambele forme pornesc de la ideea fre.GyeO!elor. observate cu
cele (ateptate). De exemplu, de 100 de ori,
observam ca stema a ieit de 54 de ori, iar banul de 46. Acestea sunt frecventele
observate. Cele ateptate (teoretice) sunt cele stabilite pe baza de probabilitati.
Astfel, tinand cont ca sunt doar doua fete ale monedei i au fost 100 de
ne-am atepta ca fiecare parte sa apara de 50 de ori. Diferentele dintre valorile
frecventelor observate i cele ale valorilor ateptate sunt luale in considerare in
calcularea lui X2.
Formula de calcul a lui X2 este:
k=:L(O-E)2
L..---.... .. -i
(3.1 )
unde Q'p_$fl/c;tJe, iar E frecve.ntele ateptate.
In orice tehnica de comparatie a datelor va trebui sa raspundem la
urmatoarele j'ntrebari:
1) Cum identificam situatia de comparatie, de testare a diferentelor?
2) Ce .fel de grupe sau categorii de raspunsuri sunt comparate?
3) Ce fel de date au fost colectate?
4) Conditiile aplicarii tehnicii respective sunt j'ndeplinite?
5) Ce fel de ipoteza trebuie testata?
6) Cat de intensa este diferenta dintre grupe sau dintre categoriile de raspunsuri?
(1) Gum identificam situatia de compar'!ti.e,.deJestare a diferentelor?
Majoritatea studiilor din psihologie au la baza teste de stabilire a
semnificatiei diferentelor. dintre grupe sau categorii de raspunsuri. Pentru a
identifica aceste5tucHfestes'Uflcient sa analizam modul de formulare a ipotezelor.
In exemplul dat yom regasi expresia: "raspunsurile de tip noi apar mai
frecvent Tn situatii de victorie, decat in cazuri de j'nfrangere". Alte sintagme care
indica necesitatea comparatiei pot fi: "grupul A are rezultate mai mari decat grupul
B", "tratamentul A este mai.,b!!'Q ..decaMratamentul B" sau "amt>ele tratamente sunt
mai bune decat absenta oricarei interventii". Toate aceste formulari au ca ipoteza
nula uzuala absenta diferentelor d0ire medii sau frecvente. 0 situatie aparte de
comparare a grupurilor este intalnita in cazul testului x
2
.al.-graduluLde olllQgenitate
63
"11'1111111111, Ii" '111,'IIII'JILIIIIIL:Ulllllllmlllllllru.IUIIIWIlllUIIIUIIIUI.,I__
(cea de-a doua ipoteza din exemplu). In acest caz, premisa ipotezei nule este ca
frecveni
a
de apariiiea raspunsurilor "noi" Tn situaiii de victorie sau de Tnfrangere nu
difera 1rtmnc\l.tcJ.8 tipuldefeedback primit de subiecti.
(2) Ce fel de grupe sau categorii de raspunsuri sunt comparate?
Vom amana pana la prezentarea testelor t $i z discuiia despre aceasta
problema. Pentru moment yom preciza doar cagrupeleJRLD12-a
rate
pot fi
independe]Jj:', .. In cazul lui X2 raspunsurile subieciilor trebuie sa fie
0 Tncalcare a acestei condiiii se Tntalne$te Tn testa rea repelata. a
aceluia$i .grup_de subiecti deoarece Tn cazul masuratorilor repetate, rezultatele
exprimate anterio; sau uit'erior de un subiect nu sunt ifldepenQw.te .. In
asemenea trebuie aplicate alte tehnici .statistice precum testul X2
sau X2 Stuart-Maxwell (Hinkle, Wiersma $i Jurs, 1994).
(3) Ce fel de date au fost colectate?
. cercetare pot fi considerate, fie detip
cu trei categorii de raspunsuri: feedback pozitiv, feedback neutru, respectlv
feedback negativ, fie cu doua categorii de raspunsuri - meci
ca$tigat, respectiv meci pierdut. Variabila a cercetarii este tot de tiP
nominal, categoriile de raspunsuri posibile fiini:f "noi" $i "non-noi". Acestea pot fi
refleCtate $i diilotQmic sub forma1-raspunsuri de tip "noi" $i p-taspunsuri de tip
,.-
"non-nor'. Tn cazul comparaiiilou:!mlr8 grupe, 0 importania deosebita 0 are.JIl??ul
de masurare a variabilei dependente (criteriu). Tn cazul unor date de tip nominal, ca
Tn situaiia defafii,-seva'calciJiax2.Jn schimb, Tn cazul unor date numerice, se vor
utiliza, cu mici excepiii, z.
.' "
Tabelul 3.3. Procentajul subieciilor care au' dat raspunsuri de tip "noi"
Tip de feedback
Tip de meci Pozitiv %
Neutru %
Negativ %
Media %
41 (30/75)
Meci c8tigat 28 (7/25)
28 (7/25)
64 (16/25)
16 ( 4/25)
28 (21/75)
Meci pierdut 36 (9/25)
32 (8/25)
'"
{i
,.-"
64
(4) Conditiile aplicarii tehnicii respective au fost indeplinite?
Pentru aplicareajestuluiX: .. exista cateva con<Jitii $i restriciii de utilizare:
observatiile fie independente, fiind" eu
.. J:epetate; Tn trebuie 's'a se
exc!uda-'Feciproc, ceea ce presupune ca Tntrebarile care permit
multiple nupot Ii analizate prin X} "
trebuie de cel putin mai mult,
a$-teptata pentru (celula) a tabelului de contingeni
a
.
trebuie sa fie mil1)ica de 1; similar, un procent de __40% din casut
e
"-

care au frecvente teoretice mai mici d,(,!)5J.lucel;:l 0 valoare X2 .. discutabila 0
posibila Tn asemenea situatii este reunirea unor casuteadiacente:
In unor tabele de de Ji8cfX2, este necesara aplicarea
unel core.:Jii ,.: ..ates ce presupune cre$terea cu Q,5 a diferentei dintre
frecveniele teoretice.' .. ,
. Tn calculul X2 se tinecont procentajele cOl1statate,
deoarece cele din urma duc la calcularea yf ca cumadifostobtinute
100 de raspunsuri indiferent daca au fost colectate 5000, 500 de
observatii.
Tn exemplul nostru, toate conditiile sunt Tndeplinite, existand 51 de
raspunsuri de tip "noi" Tntr-un design experimental de tip 3 x 2.
(5)Ce fel de ipoteze au fost testate?
., . Tn general ramane valabila distinciia dintre __unidirectionale $i cele
Ceea ce se schimba tine de sintagmeleutilizate,' Astfel, Tn
eompararea di.ferentelor dintre grupe, ipotezele unidirectionaie pot fi de genui
"fete Ie au un nlvel de .empatie mairidicat cel al baieiilor", "metoda A duce la
un numar de gre$eli maimic.c9:rnp?[ativ cu metoda S" etc. Ipotezele bidirectionale
nu diferentelor dintre. grupe, fiind mai degraba vagi
precum "exista Tn ce nivelul de empatie" sau
"metodele A..$iSsunt diferite Tn ce prive$te numarul de gre$eli comise".
.. . Totu$i, in X
2
,; distinctia dintre ipotezele $i cele
bldlrecilonale poate fi aplicata doar in cazul unui test eu un sJog,uLgrad.de Iibertate.
P.rima ipoteza p.oate fi considerata ca fiind de tip unidirectional, deoarece X2 are un
slngur grS!d __ iar cercetatorii anticipeaza ca raspunsurile de tip "noi" apar
mal. Tn situaii.a de victorie a echipei de totbal, decat in cea de infrangere. In
schlmb, cazul celel de-a doua ipoteze, X2 poate fi deoarece X2
are doua fiind deja un test omnibuz. Acesta arata daca eXlsta
diferente Tntre frecvenie, Tnsa nu arata unde .. se.aflaacele diferente. Astfel Tn cazul
unui X2 semnificativ vom afla ca tipul de feedback prim it nivelul
raspunsurilor de tip "noi" in functie de rezuItatuI meciului echipei' universitatii. EI DU.
ne va arata Tnsa nici .ceJel de feedback influenteaza raspunsurile subiectilor nici
daca aceste raspunsuri vor cre$te sau descre$te Tn frecventa. Tot ce
daca. :recventase.modifica saunu. Pentru a suplinillmitele ,!!-, exista modalitaii
speclflce de lucru, preeum analiza reziduurilor (Hinkle, Wiersma $i Jurs, 1994).
Tabelul 3.4. Frecvenia observata i ateptata privind subiectii care au dat raspunsuri de tip
"noi" in funciie de tipul de meci chestionat.
Tip de meci RaspLinsuri de tip "noi" Raspunsuri de tip "noi"
observate ateptate
Meci c8tigat 30 25,5
Meci plerdut 21 25,5
Total subiecii 51 51
65
, I : I ' II , Ii i II , 111111111 1111 , ' , , ' , , I iII III III iII' II! ' IIIi III' Iii ; II : II ' II 'I! ' : I II: Ii: II ' : ' iI ,,'I " " : : :1' ! III III !II,III 'II' '1111 1111'11111 111111':111111 1IIIIIillllili 1111II,IIIII!IIIII:IIII
D "nU exista diferente Tntre cele doua categorii de subiecti chestionat
i
,
t
'In fiecare situatie sa existe 25,5 raspunsuri de tip "noi".Se observa
ne ep a ' . ,
ca frecventa este diferita de Se Intrebarea
. I"' t' a' ceasta diferenta Tntamplatoare sau dlferenta este suflclent de mare
simp a. es e , . , ".' ."
entru ca probabilitatea de a obtine astfel de date din Intamplare sa fie mal.n:
lca
.05? Cu alte cuvinte, va trebuisa testam Tn .ce ..
d
. ntru a spriJ'ini afirmatia ca raspunsunle de tiP "I)OI",apar mal frecvent In
emare pe ' . , ." , ", ..
situa\ie de victorie a echipei de fotbal apartlnatoare decat In cazul Infrangerll
acesteia. . " d' .. 'b'I', f t'e
T h
'c pentru a calcula X} Tn SPSS avem doua Irec\1I POSI I e, In unc,l
e nI , . .)
d t' I testului (%2 al gradului de potrivire, respectiv %2 al gradulul de .
P
e ItPU t sta aceasta prima ipoteza ne aflam Tn situatia unui %2 al gradulUlde
en ru a e ,,' t "
potJ:ivire .. Metoda poate fi selectataurmand ,calea ,AnalEt-"Nonparametnc tes =
Optiunea standard din este de a .. calcula
imparti'nd'totalul de modalitate este
I
b.'l" . entru problema de fata (51'2) eXlsta 0 alta cale de calculare
va a I a I p , ". .. ,. ' "
a frecventelor pe baza unor Infor
n1
a\1I a pnon. Spre daca
f t
'de apariti6 a nevrozei Intr-o populatie este de 20%, lar nOI suntem
recven a, . ' 'f t" f t" d
't 't'" vedem daca frecventa de aparitie In grupul testat este dl en a a,a e
In eresa I sa " '. " 0/
I t
' d' care a fost extras atunci frecventa teoretlca va fi de 20/0
popu a,la In . __ "_ ....
din numarul subiect
ilor
testat!. . .
In cazul primei ipoteze yom obtine un %2(1) == 1.59, P < .1 test
It t n
esemnificativ statistic. Prin urmare, nu putem afirma ca raspunsunle
un rezu a t" d -t
d t
." apar mai frecvent In situa\ii de victorie a echipei de apartenen ,a eca
e Ip "nOI . " I' d' de
, 't t" d 'Infra'ngere Totuc:i valoarea lui p aproplata de pragu maxim a mls
In Sl ua II e . y , . .."
.05, ne 'duce cu gandul ca am putea asista la 0 schlmbare a concluzlel, daca vom
puterea statistica a cercetarii. . , ., ,
2 I omogenitate poate fl calculat In SPSS utllizand 0 cale
d
'f 't" % aa ma'l S.tatis.tics"-"Crosstabs", dupa
lena cev . " ' - .., -- - .
, 1 ge butonul Statistic?' iar din fereastra deschisa vom selecta
care se a e ,,----.. ' ---
pluS, revenind In Crosstabs, se po ate selecta butonul pentru
alege reziduurile standardizate ajustate. Asupra rolulUl acestora vom revenl
curand. . , . . " .., b ddt
Testarea celei de a doua ipoteze poate fl venficata utllizand aza e a e
h
t t a i ' dupa ce In prealabil am ponderat variabila "frecv" utilizand calea
" I pa ra.s V,, .' 05
"Data"-"Weight cases". In urma un %2(2) == p <. .
Valoarea %2 este semnificativa
" r'lor de tip noi" In caz de vlctone sau mfrangere a echlpel sportive de
raspunsu I" '. . .,
rt nta
" este influentata diferit In functie de tlpul de feedback ofent sublectllor.
apa ene , '.. '". ' . 't
M' ult din consultarea figurll 3.7.se observa tendmta persoanelor care au pnml
negativ sa utilizeze mai multe raspunsuri de tip "noi" In cazul In care
echipa universita\ii a catigat.
66
I
I
'I 111'1111 111"111 !II"III 'III 'II 1111 111"111 1111 111'.1111 III 1111 III 111'111 II' ::'1'11'111':111111:111'11"11"
Frecv,enta pentru fiecare casuta este rezultatul pr,gdusului dintre
.,,' ............... -
totalurile marginale'--corespunzatoare casutei respective Impartit la _tgtalul
frecventelorobseNate.Spre exemplu, ateptata a raspunsuril(;r de ii'p'
"noi" Tn cazufpersoanelor care au primit feedback neutru i care ofereau rezultatul
meciului pierdut de echipa universitaiii este de 6,2 [(21)(15)/51].
Tipul de feedback
feedback feedback feedback
pozitiv neutru negativ Total
Rezultatul victorie Frecventa observata 7 7 16 30
meciului
Frecventa asteptata 9,4 8,8 11,8
Adiusted Residual -1,5 -1,1 2,5
in/rangere Frecventa observata 9 8 4 21
Frecventa asteptata 6,6 6,2 8,2
Adjusted Residual 1,5 1,1. -2,5
Total Frecventa observata 16 15 20 51
Figura 3.7. Output SPSS cu frecvente/e observate,. ce/e ateptate i reziduurile
standardizate ajustate privind subiectii care au dat raSpunsuri de tip "nor' in functie
de tipul de meci chestionat i tipu! de feedback primit
SPSS este 0 marcii inregistrata.
Testul qn .test omnibuz, adica arata doar tipul de
feedback primit afecteaza'oln'omod diferit frecven\a raspunsurilor de tip "noi" In
functie de tipul de meci vizat Pe baza frecven.ie1of.observate putem constata unde
se afia aceste diferen\e,lnsa 0 asemenea perspectiva este foarte subiectiva.
De aceea, Tn cazurile unui %2 semnificativ statistic se recomanda
calcularea reziduurilor.i3tandardizate ajustate pentru fiecare celula In parte, pentru
a observa Valorile reziduurilor standardizate
ajustate cuprinse Tn intervalul [-2, 2]nu.ne intereseaza. In schimb, valorile care nu
----
se regasesc In acest interval sunt considerate ca indicatori_i;lL_uIl8i .. ,di,ferente
semnificative Intre frecventele observate cele Valoarea absoluta de 2
este stabilita pe baza unei distribuiii z, a carei valoare corespunzatoare pentru un p
de .05 este 1,96. ..J
Tn figura 3.7 atrag atentia doua reziduuri staridardizate ajustate, am be Ie
fiind legate de oferirea unui feedback negativ Astfel, se constata 0
frecvenia observata semnificativ mai mare decat cea In situatia unui
feedback negativ oferit persoanei i a unui rezultat pozitiv al echipei universitatii.
Inversul acestei situatii apare Tn situatia unui feedback negativ a unei Infrangeri a
echipei universitaiii.
Ce Inseamna acest lucru? Daca X2 ne arata ca tipul de feedback afecteaza
............... , __, ___ : __ .... _ ..... _ .
Tn modgill?[itreferinta directa la grupul de apartenen\a In functie de tipul de meci
vizat, ahaU;;;a-reziduurilor ne arata ca afirmatia de mai sus este valabila In cazul ..
unui feedba'd<negatiit.Astfel, subiectii carora Ii s-a spus ca au ob\inut performan\e
....,
'-....
67
'1!',III'IIII'lllllillll'illll'IIII'11111
ill 'II: ... ___ e." III ___ UUIlIliIl.'l
sub mediela Tntrebikile initiale tind sa foloseasca mai des, Tn caz de victorie a
echipei, sintagme de tipul "noi am batut", "echipa noastra a etc. Similar,
subiectii care au primit un feedback negativ tjnd sa foloseasca Tn caz de Infrangere
mai putine sintagme de identificare cu echipa universitatii.
Daca In locul raspunsurilor de tip "noi" ar fi fost contorizate frecven\ele
celor de tip "non-noi", am fi obtinut 0 situatie In oglinda. Adica, persoanele care au
primit un feedback negativ tind sa mai rar,-ln cazul victoriei echipei de
apartenenta, expresii de genul "au batut" sau "ei au Astfel, se poate
concluziona ca subiectii al caror prestigiu personal a fost afectat tind sa utilizeze
pronumele personal "noi" sau expresii care Ii includ implicit pentru a se asocia cu
situa\ii d.e succes ale grupului de apartenen\a.
Inainte de a discuta marimea efectuiui pentru tehnicile x
2
, yom prezenta,
pe scurt, modul de stabilire a gradelor de libertate. Tn cazul unui X:""eLgradului de
potrivire, gradele de libertate se unde c reprezinta
numarul de categorJi.deraspunsposibile. Tn prima ipoteza Intalnim doua categorii:
meciuri sau meciuri pierdute de echipa de fotbal a universitatii. Prin
urmare exista un singur grad de libertate. Tn schimb, In cazul unui X2 'lL9I9-
dulu
L(le
omqgeniJ!:lte._specific tabelelor de contingenta, formula devine unde c
fnseamna coloane primei variabile), iar I Inseamna
numarul (categorii ale celei de-a doua variabile). Tn cea de-a doua ipoteza
yom avea 2 grade de libertate (3-1)(2-1), deoarece tipul de feedback are trei
categorii de raspunsuri - feedback pozitiv, neutru sau negativ, iar tipul de meci
ramane cu cele doua categorii - meciuri respectiv pierdute.
(6) Cat de mare este diferenta dintre grupe sau categoriile de
raspunsuri? '
Un rezultat $.8mnificativ statistic nu Inseamna decat ca cgJ1lparate
dife[afntre .eJe. EI nu Tnseamna neaparat ca diferenia,,8.ste,mare. Pentru a vedea
cat de mare este diferenta dintre-grupe sau categorii de raspunsuri yom apela la
indicatorii de apreeiere a marjmii eJectului.
Din pacate, majoritatea pornesc de la ideea unei varjlbil?
criteriu (dependente) masuratEq)rin scale numerice, fapt ce afecteaza calcularea
marimii efectului Tn cazul testeior X2. printr-un artificiu prezentat in
Ros?nthal, Rosnow Rubin (2000a), putem estima marimea efectului in mod
ciaslc doar in cazul testelor X2 cu un singuI.gr<3,9,Sle Coeficientul de
determinare poate fi extras pe baza formulei:
(3.2)
unde X2(1) reprezinta valoarea testului.de.cP.f.Dparatie a diferentei dintre
fr9
ven
te, cifra 1 dintre paranteze ne ca formula este valabiladoar daca
testul are un singurgrad .de libertate iar Neste numarul total de frecvent
e
I, . __ . '
observate.
68
I
A
. De altfel, ,I'j reprezinta valoarea maxima a luLx
2
Tn situatia respectiva. Tn
cazul primei ip.oteze poate fi calculat coeficientul de determinare, deoarece exista
un singur grad de libertate - X2(1) = 1,93, P >.10. Aceasta valoare este comparata
cu X2 maxim pentru situatia respectiva, care este 51, deoarece totalul raspunsurilor
de tip "noi" a fost 51 .. Tn consecinta, r2 este .037 sau 3,7%. Daca yom apela la
criteriile de comparatie prezentate in tabelul 2.2 din capitolul destinat principiilor
testarii ipotezelor, vom constata ca exista un efect relativ redus al rezultatului
meciului echipei universita\ii asupra tendintei subiectilor de a formula raspunsuri de
tip "noi". Mai mUlt, daca vom tine cont ca r2 nu este decM patratul coeficientului de
corelatie, yom putea observa ca unui X2(1) = 1,93, P > .10 Ii corespunde 0 corelatie
r de .19 Intre cele doua variabile. '
Atat in cazul cat Tn cazul unui X2.s_lJlTlai mult de un grad de
libertate, poate fi estimat un alt coeficient al marimii' efectului,;'noti3t w. Acest
indicator. poate fi calculat prin intermediulsoftware-ului GPOWER'(Faul 9i
Erdfelder, 1992), disponibil gratuit de pe internet.
Marimea efectului Tn cazul primei ipoteze X2(1) = 1,93, P > .10 este .18, 0
valoare care indica acela9i efect slab al rezultatului partidei de fotbal asupra
utilizarii raspunsurilor de tip "noi". Pentru a avea 0 impresie generala, un w de .10
semnifica un efect slab, un w de .30 semnaleaza un efect de intensitate medie iar
un w de.&Q"sau mai mare indicaun'efect puternic. Pe baza marimii efectului
constata ca puterea statistica de testare a primei ipoteze nuera mai mare de .25,
ceea ce Tnseamna de trei ori mai putine de a observa acest efect mic, daca
el exista Intr-adevar, decat de a comite eroarea de tip II. Pentru a ating.e un nivel
optim al puterii statistice de .80, necesar testarii ipotezei, am fi avut nevoie de mai
multi subiec\i. Mai exact, am fi avut nevoie de 122 de raspunsuri, cu 71 mai multe
decat cele 51 de raspunsuri observate. Tn consecinta, datorita puterii red use,
rezultatul nesemnificativ statistic are 0 explica\ie alternativa ipotezei nule.
Diferen\ele pot exista In realitate, Tnsa nu au .. fost identificate datorita unui risc
crescut de a comite eroarea de tip II. Tn cazul unei puteri statistice de .25,
probabilitatea de eroare este de 75% (1 - puterea statistica).
Utilizand acela9i program statistic, yom constata un w de .38 Tn cazul celei
de-a doua ipoteze, ceea ce indica 0 schirnbare de magnitudine medie In utilizarea
raspunsurilor de tip "noi" Tn situa\ii de sau pierdere, Tn functie de tipul de
feedback personal primit. Tn cea de-a doua ipoteza, X2(1) = 6,12, P < .05, puterea
statistica era de .72, un nivel destul de apropiat de cel optim. De alttel, pentru a
atinge valoarea optima de .80 a puterii statistice, am fi avut nevoie de 61 de
raspunsuri de tip "noi" , cu 10 mai multe decat datele colectate. Tn consecin\a,
rezultatul semnificativ statistic corelat cu 0 marime medie a efectului celor doua VI
asupra VD, sprijina clar ideea ca subiectii, al caror prestigiu personal a fost afectat,
tind sa utilizeze mai frecvent termeni de referinta de genul pronumelui"noi" pentru
a se asocia cu situa\ii de succes ale grupului de apartenenta, ca 0 masura de auto-
Tnaltare.
69
II: 'I"!I"II' III "I' '11'11 II' ill '11'111 II! ill'lli '11'111 III' IIII!III:IIIIIIIIIIIII"IIII'!' I: II III: 1111'111,"
Tn sfan;;it, 0 alta modalitate de calculare a marimii efectului in cazul X2
consta in utilizarea indicatorilor de asociere obiinut
i
pe baza valorii X
2
, precu[].Y",?1
lui Cramer. Acesta este un coeficient de corelatie ce variaza Tntre 0
;1, unde 0 semnifica absenta efectului, iar 1 un de-puternic.
... De altfel, Tntregul demers X2 prezentat anterior poate fi interpretat sub
forma asocierii di[1.tre.Aolja .variabile nominale. Intr-o asemenea si,tuatie, ipoteza
nula indica relatiei dintre doua variabile, Tn timp ce un X2 semnificativ
statistic sprijina ipoteza asocierii dintre doua variabile. De aceea, Tntr-un fel, X2
constituie un Jiant Tntre tehnicile de asociere cele de comparatie.
3.2.2. Testele t i comparare a diferentelor dintre doua medii
Daca variabila dependenta nu este masurata prin scale nominale pentru a
fi supusa analizei de frecventa, ci este evaluata prin scale numerice, este nevoie
de compararea.mSlsijijQr pentru a testa ipoteza existentei diferentelor dintre doua
populat
ii
pomind de la ;)mpararea a doua grupe. De altfel, cele mai multe dintre
cercetarile studentilor la psihologie necesita apliGarea testelor t sau z. Exista trei
tipuri principale de tehnici t z, Tn sa SPSS-ul permite doar t.
Valorile z pot fi dedu5?din rezultatele oferite.
Cele trei tipuri deJeste
tehnici care privesc diferenta dintre
din care acesta a fost extras; titulatura tehnicilor este testulJ.pentruun.
respectiv testul z pentru un pentru a efectua, in SPSS,
testul t pentru un yom urma calea
. "One T Test".
tehnici care---privesc diferenta dintre mediile 9()lliL ...
independente; ele sunt denumite testul t pentru
-f respectiv testulz .. pent
ru

independente sal! .. z. pentru a calcula t independent -Tn SPSS
yom urma calea "Analyze" .. -"lndependentSaQ1pl.es_T
Test".
tehnici care privesc dintre mediile a .doua ...
(corelate,dependenie); Tn asemenea situatii vorbim de testul t peritru
perechi, prescurtat t dpenqent, respectiv testul z pentru
perechi, ori z dependent; in SPSS, t dependent poate fi obtinut
pe calea "Analyze"-"Compare
Ce sunt e!?antioanele independente !?i perechi?
In ce diferentierea dintre testele t. z independente
dependente, ea se face in functie de natura grupelor comparate. Astfel apar doua
situatii:
70
(1) daca cele.,-doua .grupe comparate au fost alese la pe baza
c.a cazul a doua sau a doua
grupe de .d!fente, se utilizeaza testele pentru ..

(2) daca cele doua grupe sunt Tn relatie Jma .. cu cealalta prin interventia
naturala a elementelor din
doua grupe, yom utiliza testele pentru perechi (corelate). Exista
trei situatii Tn care vorbim de dependente {perechi):
a) situa(ia masl4.@Q[i1orrepetate
o grupa de.J>_ubiecti este testata d,e ioua ori asupra variabile,
cercetatorul fiind interesat de modifici:\rile Tntre cele doua testari
Testand persoane:s-e ajunge la perecbi
rezultate, de pilda scorurile obtinute de ,X' la Tnceputul la finalul unei
inte7Ve'ntii terapeutice.
b) situatia perechilornatura/e _
, , ....
Cele doua grupe sunt una sau mai multe caracteristici
exista Tn Tn cazul studiilor privind impor1;anta
ordlnll la se pot crea doua grupe de subiecti, dintre care (ntr-o
grupa sa fie primii nascuti, iar in cealalta grupa mezinii cu conditia
ca fiecare dintre 11.n corespol",ldent (un frate) Tn grupa.
Se ajunge, din nou, la perechi de rezultate, de pilda scorurile obtinutede
"Popescu A.", primul nascut; distribuit Tn grupa A scorurile obtinute de
"Popescu Z.", fratele mai mic al primului, distribuit in grupa B. '
c) situatia perechilor artificia/e
1 "._--'-"'""'M. .
Elementele celor doua grupe sunt puse Tn corespondenta prin interventia
experimentatofului. Aceasta tehnica este utilizata cu de
grupele ce urmeaza a fi comparate, pentru a elimina influent3 - unor
variabiletei'te:' De exemplu, daca vrem sa vedem Tn ce masura
predare A este mai buna decat metoda B, poate ar fi bine ca grupele ce
urmeaza a fi invatate prin metode diferite Sa fie echilibrate, adica alcatuite
din elevi de De exemplu, ele patfi egalizate printr-un test
initial de Subiectii care au obtinut primele doua locuri vor fi
distribuiti Tn grupe diferite se va realiza, ulterior, 0 corespondenta (ntre
rezultatele lor. Algoritmul -de lucru se v'a pastra, pan a la
distribuirii Tn grupele de lucru nou formate a subiectilor testati prealabil.
Se observa ca perechi vor avea Tntotdeauna un numar de
subiecti . pe cand e!?antioanele independente au 0 libertate cele
doua grupe comparate putand avea,sau nu un numaregal de subiecti.
lata cateva exemple ilustrative-de studii care necesita testelor t:
71

Testul t pentru doua eantioane independente
Un cercetator crede ca strategiile sintetice conduc mai repede la deprinderea
strategiile analitice.Pentru a testa ipoteza el selecteaza doua ciaseparalele de afla\l. I.n
clasa I, fiecare dintre ere avand cate 20 de elevi. Primul grup a fost invatat
(incepand cu literele, trecand apoi lacuvinte). in timp ce al dOllea grup .a Inva\at .sa
sintetic (pornind de la asocierea cuvintelor cu imagini, pentru adepnnde .literele).
Variabila dependenta a constat intr-o proba de citire contra cronometru, obtlnandu,se un
indicator pe baza formulei: numarul de cuvinte citite intr-un minut I numarul
Testul t pentru doua eantioane perechi - cazul masuratorilor repetate .'. '.",
cercetarii este de a studiainfluenta metodelor ,de
cond\Jitelor agresive la adolescen\i. 0 grupa de 15 subiec\i cu.
testati:i'initial (pre-test) in ceea ce ,niveJul de
DlJpa testare. cei 15 urmeaza un program de
de relaxare saptamanale, fiecare durand a ora. Dupa 0
retesta\i (pgst-test)pentru a observa daca nivelul lor de
tehni?ilor de inva\ate. ",:-.: '.'}::';':,;;,i:.)'

, diferite, filnd:des.pi:irli\i de 1<3 Ivlai [TJult,
farniiii :.n6rmale .... la? ceilal\i 1n famiHi m
ce agresivitatea este inva\ati:i soCial, cu' PEl:m,ClsP!l'
semnificative in mariifestilrile agres.ive diri cete. dalla'
. .',U, "i .. .'
-" . ; :;ie-.
calm[j'relaxanta iO timp ceal doilei'!gr.up Vi'!

,.' .'.' , .. ;.' " .c,' :<;:;;/:"::9\;,::;"
. .. ......
s-a cibtinut un.scor rriediu de 80 io abaterestar:idard' de 8:
c1asa Gn nivel mediu mai ridicatdecat media , "
72
I
Dineolo de aeeste testele de sunt similare. eel putin
din perspeetiva interpretarii datelor. De aeeea. vom prezenta doar doua exemple,
eazul unui test t independent, respeetiv al unur test t dependent. De altfel. orice
studiu care impliea stabilirea diferen\elor dintre doua medii necesita' raspunsuri
clare la urmatoarele lntrebari:
1) Cum identifieam 0 de eomparare intre doua grupe?
2) Ce fel de grupe sunt eomparate?
3) Ce fel de date au fost colectate?
4) Conditiile aplicarii tehnicii respective sunt indeplinite?
5) Ce fel de ipoteza trebuie testata?
6) Cat de intensa este dintre grupe sau dintre eategoriile de raspunsuri?
Problema A
Un student, cu un bogat spirit de observalie. a remarcat ca oamenii tind sa se
Tmparta Tn doua categorii: cei care sareaza mancarea Tnainte de a 0 gusta. din obinuinta.
respectiv cei care mai 1ntai gusta i apoi Ti sareaza mancarea Tn func\ie de gust. Pe baza
acestei categorii create ad-hoc. dorim sa studiem daca exista diferen\e'Tntre cele doua
grupe de oameni Tn ce nivetul tor de impulsivitate: Aceasta trasatura de
personalitate a fost masurata printr-o scala specifica pe un numar de 63 de persoane, dintre
care 27 intrau Tn prima categorie. a celor care sareaza mancarea Tnainte de a 0 gusta. iar 36
erau persoane din a doua categorie. Datele oblinute pot fi consultate In baza de date "t
independent.sav'. (0 cercetare pe 0 tema similara a fost efectuata Tn realitate de McGee i
Snyder, fiind descrisa Tn Kerlinger i Lee, 2000).
Problema B
Un student din anul III este interesat sa stabileasca daca anul I Psihologie este mai
dificit decat anul al II-tea. din perspectiva rezuttatelor cotare. Pentru aceasta. et setecteaza
la lntamplare un grup de 28 de colegi, carora Ie catculeaza media generala ob\inuta de
Tn primii doi ani. anticipand ca subiectii selectati vor avea rezultate mai mari Tn anul II
decat in anul I. Datele obtinute pot fi gasite Tn baza de date "t dependent.sav.
(1) Cum identificam 0 situalie de 'intre doua grupe?
Raspunsul este foarte simplu: trebuie sa existe doar doua modalitati ale VI.
... ... ..d,.., ._-
In prima problema. variabilade grupare are doua,GCjtegorii: persoane care sareaza
manearea Tnainte de a 0 gusta $i persoane care sareaza mancarea dupa ce au
gustat-o. dupa preferinta. Daca variabila ar fi inclus 0 eategorie suplimentara. cea a
persoanelor care nu sareaza deloe mancarea, am fi avut trei categorii VI, deci nu
am fi aplicat testele t sau z. In problema B, avem tot doua grupe. prima fiind
constituita din rezultatele cand erau Tn anul I, iar cea de-a doua. din
rezultatele in anullI.
73
(2) Ce fel de grupe sunt comparate?
Aici trebuie sa facem distinctia Tntre situatia compararii mediio.
unui
, ' .
e$antion cu cea a'populatiei (testele t $i z pentru uri e$antion); situatia compararii
mediilor a doua ipdependente (t independent); respectiv a compararii
mediilor a doua perechi (t dependent). In problema A' identificam
situatia a doua deoarece este vorba de persoane diferite
Tli cele doua grupe (cei care folosesc sarea Tnainte, respectiv cei care folosesc
sarea dupa mancare). In plus, Tntre subiectii celor doua grupe nu exista 0
corespondenta prealabila naturala sau artificiala. Tn schimb, problema B ilustreaza
situa\ia a doua e!;;antioane perechi, fiind vorba de testa rea repetata a acelora$i
subiec\i.
(3) Ce fel de date au fost colectate?
Pentru a aplica testele+sau z avem nevoie de
dintre douamedii. Cum acestea au sens numai Tn cazul datelor prin
Tflseamna ca testele t z pot fi aplicate doar Tn cazul Tn
(criteriul) este prin scale de tip intePlal.sau.,propor1;ii. Daca VD a fost
masurat prin scale nominale sau ordinale trebuie aplicate alte tehnici, testele t $i z
nefiind adecvate. Pe lang a aceste cerinte vizand VD, reamintim ca testele t z pot
fi aplicate doar pentru a testa diferentele In cazul compararii
simultane a mai multor-.meo.ii se aplica tehni.ciIe..AtJ9YA In cele doua probleme-
exemplu se constata ca datele permit aplicarea testelor t sau z, deoarece exista
doar doua grupe Tn fiecare problema, iar rezultatele VD sunt exprimate numeric
(punctajul la testul de impulsivitate, respectiv media generala anuala).
(4) Conditiile aplicarii tehnicii respective sunt lndeplinite?
Pentru a putea aplica Tn mod corect testul ales trebuie indeplinite unele
conditii_statistice. 0 conditie valabila pentru toate testele t $i z este aceea ca
distribut
ia
In cazul Tn .care se
constata devieri grave de la normalitatea distribu\iei, datele pot .tLJran$fof!!1ate,
dupa indicatiile prezentate in finalul capitolului de statistica descriptiva. Daca
aceste transformari .nu rezolva problema, se renunta la aplicarea testelor t $i z, Tn
favoarea unor tehnici non-parametrice.
In cazul testului t Tndependent exista 0 conditiesuplimentara, aceea ca
cele doua grupe sa (dispersii Condi\ia
este analogi:Lideii..dehomoscedasticitate din cazul corelatiilor $i al regresiilor.
Totu$i, daca conditie este se po ate calcula 0 varianta Lajustata,
a carei formula este similara teste lor z. .
In cazul testului t e nevoie ca cele doua dispersii sa fie
omogene, Tnsa exista 0 alta conditie suplimentara, aceea a unei distribut
ii
normale
a dintre $i post-test. Ambele exemple respeGtafci'iite
condi\iile de aplicare a testelor t
74
I
I
III 'III !II'III III III IIIIII :11111:111111:111,,111111111::1111
Acelea$i condi\ii se pastreaza Tn cazul testelor z. Totui, cando utilizam
tesUcsau UTltf!st z? Raspunsul este mai complicat decat pare la prima vedere.
In formal, cele doua teste au distribu\ii statistice diferite. Totodata, pentru a
z nu trebuie sa cunoatem abaterile standard ale grupelor comparate,
CJ ale populatiilor din care sunt extrase cele doua grupe.
Aceasta. nu poate fi indeplinita practic decat foarte rar. Totu$i, conform
teoremeJ limJtelor centrale (Kerlinger i Lee, 2000), Tn cazul unui numar de subiecti
suficient de mare (cel pu\in 30 de subiec\i pentru fiecare grupa)
rezultatelor se apropie de forma unei distribu\ii normale z, iar estimarea
standard a popula\iei pe baza rezultatelor ob\in'ute Tn cele doua grupe este destul
de adecvata. De aceea, se obi$nuiete sa se aplice testele z candexista cel putin
3? Tn fiecare grupa comparata, respectiv testelE?J, daca Tn cel pJ:l\in
dmtre lotunle comparate exista mai pu\icLde 30de subiecti.
Tn practica se Tntalnesc des situa\ii de cele postulate Tn
teorema, facand neadecvata aplicarea testelor Z. In plus, Tn destul de multe cazuri,
formula de calcul dintre t i z nu difera. De aceea, exista tendinta dea renunta la
utilizarea testelor z Tn favoarea testelor t, ultimele putand Tnlocui 'cu succes
Z. De altfel, unele programe statistice, precum SPSS-ul, au renuntat la a prezenta
testele z, diferen\ele dintre doua medii putand fi testate pe baza t.
Chiar daca vom aplica testele z utilizand criteriul clasic al grupelor formate
din peste 30 de persoane, se observa ca ambele exemple necesita aplicarea
testelor t, deoarece in problema A, una dintre grupe avea mai putin de 30 de
subiecti (grupul celor 27 de subiecti care sareaza mancarea Tnainte a 0 gusta),
iar problema B avea in ambele grupe cate 28 de rezultate. Testele z ar fi avut insa
avantajul unor valori standard pentru a decide daca doua medii difera semnificativ.
Astfel, pentru a sprijini ipoteza ca doua medii (:litera la un nivel semnificativ statistic,
ar trebui ca valoarea calculata z sa fie mai mare sau egala cu:
z = 1,96 pentru p < .05 sau z = 2,58 pentru p < .01 Tn cazul testelor bidirec\ionale;
z = 1,65 pentru p < .05 sau z = 2,33 pentru p < .01 in cazul teste lor unidirec\ionale.
(5) Ce fel de ipoteza
Inainte de rezolvarea unei probleme trebuie sa stabilim tipul ipotezei de
cercetare: unidirectlqDqlJuqjlaterala) sau bidirec\ionala(bilaterala). in problema A
avem 0 ipoteza bilaterala, deoarece sintagma utilfzata "exista diferen\e Tntre cele
doua grupe in ceeace privete nivelul de impulsivitate" nu arata directia diferentei.
in schimb, problema B implica 0 ipoteza unilaterala: "rezultatele' obtinute 'de
studenti in anul II vor fi mai mari decat cele ob\inute de ei in anul I".
unidirec\ionale sunt mai preCise, precum "A este mai)JJic B" sau ..A este mai
mare _d.e..caLB", fiind specificata directia de evolutie a diferentelor. Acest lucru nu se
Tntampla in cazul unei ipoteze de tipul ;,A este dife;ifde B".
Pe baza raspunsurilor la aceste Tntrebari, puten, conciuziona ca este
nevoie de un test t pentru e$antioane independente Tn cazul problemei A, respectiv
75
de un test t pentru e:;;antioane perechi Tn cazul problemei B. Vom aborda pe rand
cele doua probleme.
Tabelul 3.5. Mediile abaterile standard privind nivelul de impulsivitate. din cele doua grupe
Sareaza inainte de a gusta
mancarea
M AS
Sareaza dupa ce a gustat
mancarea
M
AS
Nivel de Impulsivitate 14,81 1,78
13,64
2,22
Distan\a de 1,17 puncte dintre medii este suficient de mare pentru a sprijini
ipoteza existen\ei unei diferen\e Tn nivelul de impulsivitate intre persoanele care
sareaza mancarea inainte de a gusta :;;i cele care folosesc sarea dupa ce au gustat
Constituie prima situalie un semn de impulsivitate? Pentru a raspunde
la aceste Tntrebari va trebui sa respingem ipoteza nula care neaga eXisteni
a
unor
diferenie Tntre cele doua populatii de subiecti, iar pentru aceastavom t
pentru e:;;antioane independente.
..." ... , .. -.. ,-.-' .
Testul Levene de
eaalitate a dispersiilor
Testul t de eoalitate a mediilor
F I SiQ. t I df I Sia. (2taile<:!l.
Nivel de impulsivitate Dispersie omogena
2,
164
1
,146 2,262 I 61 I
,027
Dispersie eterogena 2,335 60,702
Figura 3.8. /nformatiiIe esentia/e din output-u/ oferit de SPSS
Tn cazu/ testului t pentru eantioarie independente.
SPSS este 0 marca inregistrata.
,023
Pentru a respinge ipoteza nula trebuie sa aratam ca difereniel
e
sunt
suficient de clare incat :;;ansele ca ele sa apara din intamplare sa fie mai mici de
.05. Urmand calea T Tests" :;;i
stabilind grupele de comparat prin butonului "Grouping \l.'rlC!ble" yom
obline rezultatele din SPSS, in figura 3.8.
Se observa ca SPSS-ul ofera doua valori ale testului t, pentru fiecare
situatie posibila: in cazul respectarii conditiei de omogenitate a dispersiei celor
doua grupe - t(61) = 2.26, P < .05, test bilateral, iar Tn cazul Tncalcarii condiiiei
amintite, 0 varianta ajustata a lui t (60,70) = 2.33, P < .05, test bilateral. Pentru a
decide care dintre valori este adecvata cazului de fata yom consulta valoarea
testului lui Levene. Un F semnificativ statistic faptul ca cele doua
dispersii incalcand astfel conditia de a clasic. Tn
asemenea conditii se cite:;;te cel de-al doilea,t. Pentru problema data, testul Levene
nu este semnificativ statistic F = 2,16, P ;:-.10, prin urmare ne yom putea increde in
prima valoare a lui t.
76
'I!II,II
Ce Tnseamna un t(61) = 2,26, P < .05? Rezultatul este semnificativ statistic
ceea ce duce la respingerea ipotezei nule care stipula ca cele populatii
difera Tn privinia nivelul de impulsivitate. Prin urmare, ipoteza cercetarii ' este
sprijinita, intre cele doua categorii de persoane existand diferente ale nivelului de
impulsivitate. Pentru a vedea directia diferentelor este sa consultam
valorile mediilor prezentate in tabelul '3.5, Astfel: yom capersoanele care
obi:;;nuiesc sa sareze mancarea Tnainte de a 0 gusta sunt mai impulsive decat cele
care sareaza mancarea dupa ce au gustat din ea.
Cele 61 de grade de libertate ale testl1lui t independent din exemplul de
mai sus pot fi calculate:;;i 'manual pe baza formulei (df = n1 + n2 - 2); Reamintim ca
cele doua grupe au fost- constituite din 36, fapt ce a
condus la cele 61 de grade de libertate-ale testului.
(6) Gat de intensa este diferenta dintre grupe sau dintre categoriile de
raspunsuri?
Mai ramane sa raspundem la 0 singura Tntrebare: cat de mare este
aceasta diferenia Tntre populaiii Tn ceea ce prive:;;te nivelul de impulsivitate? Pentru
aceasta va trebui sacalculam marimeaefe9tuiuL
Spre deosebire de tehnicile X2 care sufereau la acest capitol, exista 0
multitudine de indicatori ai marimii efectului bazaii pe stab iii rea unor diferente
standardizate Tntre medii. Dintre cei mai cunoscuti amintim de indicele d al lui
Cohen sau 9 Mai multe informalH despre ace:;;ti coeficienti"-"potfl'
gasite Tn Cohen (1988) sau Rosenthal, Rosnow :;;i Rubin (2000a). Totu:;;i, pentru a
nu suprasolicita cititorii cu explicarea unor noi indicatori, yom apela tot la
coeficientul de detelJJ2inare r
2
:;;i la corespondentul acestuia, coeficientul de
corelatie al marimii efectuTui"f,' de:;;i nu ne afiam Tn situatia unor analize
corelalionale. Formula de caW a acestora este extrem de simpla:
Pentru a afla valoarea formula, .radical.
Prin urmare marimea efectului se poate calcula pe baza valorii lui t :;;i a
gradelor de libertate aletestului respectiv, Inlocuind Tn formula (t = 2.26, iar df =
61), yom obiine un r de .19, respectiv un r2 de .035 (3,5%). Aceasta valoare indica
o diferenta de magnitudine scazuta intre cele doua grupe cu privire la nivelul de
impulsivitate. . .
Pentru a veni Tn sprijinul cititorilor familiarizati cu indicii d al lui Cohen
respectiv 9 al lui Hedges, precum :;;i pentru a facilita'realizarea de
unitare, vom prezenta formulele de transformare a lui r Tn d, respectiv Tn 9 :;;i
viceversa (Becker, 2003; Rosenthal, Rosnow:;;i Rubin, 2000a; Rosenthal, Rosnow
:;;i Rubin, 2000b):
77
''\
i
\
11
,III, III II' '
r
d
r= g

(3.5)
r=.Jd
2
+;
(3.6)

(3.4)
g=
dfv11 + n2)
nl112
d = 2r

(3.8)
g=df!-
(3.9)
..)1- r2
(3.7)
d=g df


.. .. f t liN semnifica numarul total de
unde r 9 sau d reprezinta indicatorll manmll e ec u u , .'
, . . t fiecare din cele doua grupe
subiecti testati n1 n2 numarul de sublecil pen ru I
' , ' I'b rt t De remarcat ca formule e se
comparate iar df reprezinta gradele de I e a e. d
' ' . a va fi yorba de gradele e
pastreaza in cazul testelor ANOVA, cu preclzarea c
libertate ale dispersiei neexplicate (df intragrup).
lata demersul statistic in cazul problemei B:
"1 I pentru cele doua grupe
Tabelul 3.6. Mediile i abaterile standard ale medII or co are
Anul I de studii
Anulll de studii
M AS
M AS
Media generala 8,14
1,00
8,22
0,94
.. ' t r i suficient de mare
Este aceasta diferenta dintre medII, de doar op su 1m,
, . . It' uc::or decat anul I? Pentru a
pentru a sprijini ideea studentulUl ca anul I es e mal .,. .
. Itt doua ec::antioane perechl.
raspunde la intrebare vom aplica testu pen ru .,.
Pair
1
Diferenta
df
dintre medii
t
Media generala in anul I -
-,0814
,803
27
Media generala in anul "
Figura 3.9. Informatiile esentiale din output-ul oferit SPSS
in cazul testului t pentru eantioane perechl
SPSS este 0 marca lnregistrata.
Sig. (2-tailed)
,082
. ' . - text sub forma t(27) = 1.80, P <
Rezultatul respectiv poate fl transcns In _ I
,OS, test unilateral. Se pot observa unele diferenie intre datele In tabe)
. f I-f' 39 tare semnul minus (-1.80.
forma uzuala de scriere a lUI t. Ast e, In Igura . . ' .' d' t
. - 'f I de calcul ailul t dlferenta In re
Aceasta situatie se explica prin faptul ca In ormu a ".
'. -I ul respectiv restul este negatlv,
cele doua medii se la numarator. n caz ,
78
deoarece media generala din anul I era mai mica decat media generala a anului II.
Daca am fi inversat termenii operatiei am fi obtinut un rezultat pozitiv. Tn'
consecinta, spre deosebire de corelatii, Tn cazul testelor t i znu conteaza semnul
I .. ".,., .. __ ..
acestora, ci doar rezultatul ca valoareabsoluta', cazul de fata 1,BO. 0 alta
deosebire fata de tabel privete tipul de ipoteza testata. Din pacate, SPSS-ul of era
doar valoarea pragului de semnificatie pentr!l testele bidirectionale. Daca ipoteza
cerceWrii este unidirectionala, precum in cazul problemei B, va trebui sa calculam
manual pragul de semnificatie pentru testul unilateral. Valoarea acestuia este la
jumatate din cea a pragului unui test bidirectional. Tn cazul de fata, yom obtine
pentru testul unilateral un p Cu aceasta ocazie putem constata
importanta formularii ipotezei de cercetare. Tn cazul unui test bilateral ("exista,
diferente semnificative Tntre mediile din cei doi ani de studiu"), testul t nu ar
fi fost semnificativ statistic, deoarece pragul obtinut de .08 era mai mare decat
pragul maxim admis de .05.
Prin urmare, datele nu ar fi sprijinit ideea unei diferente Tn dificultate intre
cei doi ani universitari. Tn schimb, in cazul unui test unidirectional ("media generala
din anul I va fi mai mica decat media generala din anul \I"), testul t a devenit
semnificativ statistic, deoarece un p de .04 este mai mic decat limita maxima de
.05. Pe baza acestui rezultat i analizand mediile din cele doua testari, yom putea
afirma ca anul I de studiu este mai dificil decat anul al \I-lea. Tinand cont ca ipoteza
problemei Beste unidirectionala, a doua interpretare ramane in picioare. Astfel,
datele susiin intuitia studentului, rezultatele colare din primul an de studiu fiind
mai slabe decat cele obtinute in anul al \I-lea.
Gradele de Iibertate Tn cazul testului t dependent se obtin pe baza formulei
unde N reprezinta numarul de perechi de date. Tn cazul de fata, au fost 28 de
perechi (subiecti intr-o grupa), prin urmare sunt 27 de grade de libertate.
Ramane valabila intrebarea: cat de mare este diferenia dintre cele doua
medii? Aplicand aceleai formule prezentate in cazul testului independent yom
obtine un r
2
de 6,25%, corespunzator unui r de .25. Valoarea indica un efect de
intensitate medie, existand diferente destul de cbnsistente intre rezultatele colare
obtinute Tn cei doi ani. Anul I este mai dificil decat anul al II-lea. Pentru comparatie,
un efect scazut corespunde expresiei "putin mai dificil", iar un efect puternic,
sintagmei "mult mai dificil". '
Clarificari ale modului de constituire a celor doua grupe comparate
prin testul t sau z
Adesea se face t sau z masoara influenta VI asupra
VD. Acest lucru nu este intotdeauna adevarat. Pentru a Tntalni acest aspect este
nevoie, cel putin, ca treptele VI sa de catre cercetator. Nu
Tntotdeauna se intampla aa. De multe ori criteriileCiire stau'la baza constituirii
celor pot fi manipulate de experimentator, ca in situatia variabilelor
Exemple tipice ale acestora sunt sexul (exista diferente Tntre
79
femei), grupa de varsta (exista diferente Tntre tineri etc:
mult uneori eriteriul-,:degrupare poate fi 0 consecinta a vanablle
Obiceiul de a sara mancarea Tnainte sau dupa gustarea manearii
a fi mai degraba un efeet al impulsivitaiii nu 0 cauza a aeesteia. Aeeste subtlhtail
joaca un rol important Tn interpretarea rezultatelor, precum identificarea co recta a
relaiiilor de tip cauza-efect.
80
'"
;::l
o
"0
4l

.s :0
"0 '"
co: "C
4l '" ... >
Q)
0
o
.<
Figura 3.10. Ghid de alegere a teste/or statistice inferentia1e de baza
iii 'iii '1111 "III' 11111111111 '11111 1111 ,iii 'II. ,
testele t z sau tehnicile X2 sunt cele mai utilizate metode de campare a
diferentei dintre daua grupe, ele nu epuizeaza taate pasibilitaiile Tntalnite. Figura
3.10 prezinta un ghid simplificat de alegere a testelar de comparatie introductive,
dar a celor de asociere: Ghidul pastreaza validitatea Tn cazul respectarii
candiiiilar de aplicare a fiecarei tehnici statistice in parte (detalii despre taate
aceste tehnici sau altele care Ie pot substituipot fi gasite Tn Clacatici Stan
(2000), Field (2000), Hinkle (1994), Lungu (2001); Radu calab. (1993),
Sava (2002) etc.).
3.3. Managementul datelor brute
Tn finalul acestui capitol yom discuta cateva masuri care trebuie luate in
ca;z:ul Tn care:
(1) exista
(2) exista date
(3) datele brute trebuie. transformate pentru a Tndeplini conditiile de
aplieare ale unor
3.3.1. Managementul datelor lipsa
Cu sigurania ca Tn viata reala, oricat de mult ne-am dori noi ea subiectii
testati sa . acestlucru are mig,.)?,anS,e se Tntample di'n
diverse motive: ehestionare-prea lungi, gradwl .. de intimitate ereseut al unar
etc. Tn consecinta, intre rezultatele obtinute vom regasi spaiH libere,
care var eanstitui "eariile" bazei noastre de date. In astfel de eazuri avem la
dispozitie mai multe strategii de lueru (Tabachnick !?i Fidell, 1996).
Prima alternativa, utilizata freevent, este de a nu tine cont de datele lipsa
de a subiectului respectiv. Tehnica in cazul In"'
care sunt putinedate lipsa, iar absenta lor este aleatorie. Daca sunt mai multe date
lipsa, se pot realiza doua grupe de' subiecti: cei care au eompleta-tintreaga
secjJ,:;ntadata !?i cei care au date Jipsa. Daca exista diferente
eele dou;iLgrupe, In eazul unar variabile impartante. pentru stUdiu, nu serecamanda
cazurilo.r...cu date lipsa, deaarece se pierd infarmatii impartante.
Tn aceste candiJii, cereetatarul va trebui sa estimeze datelar lipsa
sa Ie introdUCe} in baza de date. Pentru aceasta a masura paataJif
ni
99uirea
spatiilar una dintre valarile tendintei centrale (media, mediana
alegerea fiind faeuta in funetie de tipul de date !?i de farma distributiei acestara.
. Tatu!?i, cum vam vedea in sectiunea introductiva a destinat
regresiei, media nu reprezinta cea mai b'Lma modalitate de estimare aunei valari.
Datele lipsa pat fi estimate mai bine printr-a ecuaiie de regresie. Variabila care
include datele lipsa este utilizata drept criteriu, in timp ce variabilele care se
81
1111'11111111,111111 'I,', ',',,'l'lj"I,,'11 ill',,';I,II',li 1IJIIIIUIIIII'jllllillllllllll_IIIIIIIIIIIIIIIIII,II,1
asociaza foarte mult cu criteriul, vor fi luate drept predictori. Totw;;i, estimarea
date lor lipsa pe baza regresiei are $i ea anumite limite: valorile prezise pot depa$i
amplitudinea unei variabile (ex. raspunsurile se regasesc Tntre 1 $i 5, iar valoarea
estimata este 6); pentru aplicarea ei avem nevoie de variabile care sa rela\ioneze
puternic cu variabila criteriu.
3.3.2. Managementul datelor neobinuite
Am 0 veste buna pentru dumneavoastra: Tn medie, grupul de prieteni pe
care-I aveti ca$tiga, lunar, aproximativ 6.000 de USD ... Tnsa cu 0 singura condi\ie -
sa va Tmprieteniti cu un miliardar In dolari. Astfel, cele cateva milioane de lei pe
care Ie ca$tiga\i dumneavoastra:;;i ceilal\i prieteni "obi$nui\i", adunat
i
cu sute de mii
de dolari ca$tigati de miliardar, vor da 0 medie care nu reprezinta pe nimeni - 6000
de USD. Tn cazuL datelor bivariate efectul distorsionant al datelor extreme a fost , ___ .
amintit In sec\iunea destinata norului de puncte, cand am prezentat efectul lor
asupra valorii coeficientului de corela\ie.
Sursa valorilor neobi:;;nuite poate consta Tn introducerea locorectiLe....
unor
date Tn calculator (de exemplu tastarea valorii 77, Tn locul lui 7) sau Tn includerea
unui caz care nu faQ.,e parte din populatia de studiu, cum, din nefericire, este
situatia miliardarlilui 0 alta este existen\a unui numar de
valori extreme decfcele a:;;teptate Tntr-o ditrjbutie normala. Va reaminti\i probabil,
. ca 99% din datele distribuite normal au valori cuprinse intre trei abateri standard
distanta, de 0 parte :;;i de alta a mediei. Astfel, daca media unei variabile este 10,
iar abaterea standard 1, ne a$teptam ca 99% dintre persoi:me sa obtina rezultate
cuprinse rntre 7 :;;i 13. Daca 7% din date se regasesc in afara acestui interval,
precum in cazul unei distributii platicurtice, yom avea mai multe valori e)(treme.
Tn functie de sursa datelor extreme, se impun :;;i masurile corective. Astfel,
daca datele au fost introduse incorect, se poate face 0 verificare prin precizarea
valorilor minime:;;i max,ime Tntalnite. Astfel, daca datele variaza de la.1 la 10, iar noi
observam ca valoarea'maxima este 66, cu siguranta ea este 0 eroare de
tehnoredactare, ce poate fi corectata. Daca acel caz parte din. pqpulatia
aflata Tn studiu, se elimitfa"valoarea extrema prin renunt::3rea la cazul respectiv. Tn
sfar:;;it, daca ne cu mai multe valori ext'reme decat sunt a$teptate
intr-o distributie nQrmala, doua solutii. Fie se realizeaza doua categorii de
rezultate, prin includerea sau excluderea' valorilor neobi$nuite, pentiu a studia
efectul acestora asCp"r"EtTndicatorilor statisticfc'alculatt, fie se va recurge la
transformarea datelor brute. Ultima solutie este utila $i in cazul in care conditiile de
aplicare a unotteste statistice nu suntTndeplinite.
3.3.3. Transformarea datelor brute
Vom preciza de la rnceput ca Uti este yorba de 0 transformareadatelor
brute in date standardizate de tipul T sau z, ci de 0 a val.orilor,
82
'I
I
i
I
'I' II ,II ,I III 1111 III II I J II II 'II 1111 1111 1I11 1111 IIU
astfel conditiile de aplicare ale unor teste statistice sa fie Tndeplinite. Acestea
sunt dlscutate pe pareursul Tntregii luerari, la momentul prezentarii fieearei tehn' .
t t t' ICI
S a IS Ice In parte. Deoeamdata yom preeiza doar ea eele mai Tntalnite eonditii sunt
normalitateq distributiei, respeetiv Iiniaritatea $i homoscedasticitatea relatiei'dintre
doua . '
, Re!q1ij1e.neliolfe pot fi tratate Tntr-unul din urmatoarele modurt. Prima
solu.tie duee la gruparea valorilor variabilei categorii (mici, medii :;;i
man). 0 data grupate, se pot aplica, fie tehnici de comparatie a diferentelor dintre
tehnici de asociere intre variabila Y3}.Jiecare de tip
dummy, rezultata In urma gruparii valorilor X. Detalii despre aceste tehnici vor fi
oferite in eazul capitolelor referitoare la tehnicile ANOVA, respectiv in sectiunea
despre variabile,.,.9.l1F1JnY din cadrul regresiei multiliniare. Cea de-a doua
implica patrat a valorilor X,obiinand astfel variabila care apoi fi
eorelata cu vanabila)":Uneori, prin aceasta masura, relatia dintre variabile devine
liniara, acest lucru trebuie verificat prin jnspectarea de puncte.
In cazul un or date numerice, homoscedasticitatea presupune ca
Tmpra$tierea punctelor sa fie aproximativ aceea:;;i pe toata distributianQrului de
puncte (finalul sec\iunii 1}.:?), jw _ eazul datelor .. nominale, implica ca
variabila . Iq_J.eldeD:npra$tiata. pe parcursul fiecarei Gqtegorii
(omogemtatea dlsperslel). Un exemplu de neindeplinire a acestei conditii Tn cazul
datelor nominale se regase$te Tn valorile de mai jos, deoarece datele mult mai
impra$tiate in cazul barbatilor decat Tn cazul femeilor:
!nal\imebarbati = {1,75; 1,80; 1,86; 1,67; 1,62; 1,70}
1,68; 1,70; 1,65; 1,63; 1,71}
. In multe cazuri, apare ca urmare a faptului ca una
dlntre variabile nu este."distribuita normal.Tabaehnick $i Fidell (1996) ofera 0
excelenta ilustrare pentru a sustine aeest lucru, dand drept exelllplu relatia dintre
venit :;;i varsta. La varste tinere, diferenta dintre venituri nu este atat de Tnsa
o data cu Tnaintarea Tn varsta, distantele dintre oameni, Tn ceea ce prive:;;te venitul,
cresco Gradul de asociere dintre cele doua variabile este atenuat de prezenta
heteroscedasticitatii. Venitul este probabil variabila nedistribuita normal,
exista mult mai multe valori mici :;;i medii, decat salarii foarte mari. Prin urmare
relatia varsta $i venit poate fi evaluata mai corect, daca yom transforma initia'i
valorile venitului, prin logaritmare. Vom lamuri imediat ce Tnseamna aeest lucru '
In sfar$it, no(rnalitatea distdbuiiei datelor este esentiala in obtinerea
rezultate acurate pentru majoritatea tehnicile statistice, deoarece Tn realizarea lor
s-a pomit de la premisa unei distributii normale. Cand acest lucru nu se Tntampla,
avem la dispozitie doua solutii: fie renuntam la aplicarea metodelor respective In
favoarea unor tehnici Goncparametrice, fie yom transform a datele pentru a
normaliza, pe cat posibi1J;listribu\ia datelor. .
Pentru a Tntelege ideea de transformare a datelor, va punem urmatoarea
intrebare: folosind acela:;;i set de date, cum transformati 0 distributie non-normala
, ",.,.,."", ..," ...
83
:1 III :1111 :1111' IIIII ilill ,1111 illl III
illlr-I,Hla normala? Altfel spus, cum puteti obtine imaginea din dreapta figurii 3.11,
pornlnd de la imaginea din stanga?
Figura 3.11. Distributie non-norma/a, p/aticurtica (stanga),
respectiv 0 distributie norma/a (dreapta)
Este greu? lata un alt indiciu! Sa presupunem ca imaginea din stanga este
realizata pe baza urmatoarelor rezultate X = {2; 4; 7; 9; 12; 14; 16; 19; 22; 25},
astfel ca valoarea minima este 2, iar cea maxima 25. Tn schimb, imaginea din
dreapta, are valori mult mai apropiate X =={1,41; 2; 2,64; 3; 3,46; 3,74; 4,35; 4,69;
5}, minimum fiind 1,41, iar maximum 5. Spiritul de observatie i abilitat
ile
numerice
v-au condus cu siguranta la raspunsul corect. Datele initiale au fost transformate
prin Astfel 0 distributie "Impratiata" poate fi "adunata" prin
transformarea vlorilor fncat valori sa mai
-==--' __ '.'_,,'_ .. , .,:. I c. <"-
redusa. ..... .
Nu toate distributiile non-normale sufera de aceeai problema, a unei
distributii platicurtice. Uneie sunt puternic asimetrice pozitiv, altele sunt
negativ, iar fn cazurile grave pot aparea atat devieri ale boltirii, cat i ale oblicitatii.
Pentru fjecare situatie in parte exista transformari specifice. Figura 3.12 of era mai
multe informatii utile.
Transformarile necesare sunt dependente de severitatea incalcarii
premisei de normalitate a distributiei. Tn cazul distributiiI9I-.asimetrice pazitiv putem
scoate putem logarjj:[Da.sau putem obtine valorii.
De exemplu, in cazul unei distributii asimetrice pozitiv, care a deviat sever"fat
a
de
curba norrnala, datele pot fi transiormate prin logari!D]3re. Aceleai operat
ii
pot fi
efectuate i in cazul asimetriilor negative, cu conditia ca transformarea sa aiba lac
utilizand datele reflectate. Reflectarea datelor se poate intelege uor prin urmatorul
exemplu. Fie irul de date: X = {3, 7, 9, 12, 14, 17}. Pentru a va.lorile, yom
adauga mai fntai cifra 1 la valoarea maxima din ir. Din valoarea rezliltata, Hl cazul
nostru 18, yom scadea fiecare valoare din ir, obtinand X == {is, 11, 9, 6, 4, 1}.
Bineinteles ca acestea nu sunt singurele transformari posibile. Datele pot
suferi diverse alte operat
ii
, precum ridicarea la patrat, ridicarea la cub etc., insa
solutiile prapuse mai sus dau cele mai bune rezulfate in cazul unor deviaiii de la
normalitate, asemenea celor prezentate Tn figura 3.12.
Dupa transformare, fn cazul normalizarii aproximative a distribuiiei, datele
pot fi utilizate, fara nici a problema, in arice fel de tehnici statistice, care au drept
premisa distribuiia norrnala a datelor. SinguJ}!L'aspect care sepierde. prin
transformare este unitatea de masura a variabilei transformate. AstfeCdaca venitul
84
exprimat in euro are a distribuiie asimetrica pozitiv care necesita logaritmare,
valorile transformate reprezentand venitul vor avea ca unitate de masura eura
logaritmaii". Tn psihologil':l insa, multe rezultate de genul scorul 17 la un de
agresivitate, rezultatul 9 la 0 praba de sugestibilitate, nu au a unitate de masura
clara, aa ca nu yom pierde nici macar atat prin transformarea datelor.
Radacina patrata
Asimetrie pozitiva moderata
Logaritm natural
Asimetrie pazitiva severa
Inversul numarului (11 X)
Asimetrie pozrrivii extrema
Radacina patrata
din numarul
reflectat
Asimetrie negativa maderata
Logaritm
natural din
numarul
reflectat
Asimetrie negativa severa
Inversul numarului re flectat
Asimetrie negativa extrema
Figura 3.12. Distribufii non-norma/e i solutiile corespunzatoare
BIBLIOGRAFIE
APA (2001). Publication manual of the American Psychological Association (5th ed.).
Washington, DC: American Psychological Association.
Becker, l. (2003). Effect size. Gasit la: http://www.uccs.edu/-lbecker/psy590/es.htm.
Brewer, M.B. (2000). Research design and issues of validity. in H.T. Reis ;;i C.M. Judd
(eds.). Handbook of Research Methods in Social and Personality Psychology (p. 3-16) ..
Cambridge: Cambridge University Press.
85
Cialdini, R.B., Borden, R.J., Thorne, A., Walker, M.R., Freeman, S., Sloan, l.R. (1999).
Basking in reflected glory: three (football) field studies. In R.F. Baumeister (ed.). The
Self in Social Psychology (p.436-445). Ann Arbor: Taylor & Francis.
Clocotici, V., Stan, (2000). Statistica aplicata In psihologie. lai: Editura Polirom.
Cohen, J.(1988). Statistical power analysis for the behavioral sciences (2nd ed.). Hillsdale,
USA: Erlbaum.
Faul, F., & Erdfelder, E. (1992). GPOWER: A priori, post hoc, and compromise power
analyses for MS-DOS [Computer program]. Bonn, Germany: Bonn University, Dept. of
Psychology.
Field, A. (2000). Discovering statistic using SPSS for Windows. London: Sage Publications ..
Hinkle, D.E., Wiersma, W., & Jurs, S.G. (1994). Applied statistics for the behavioral sciences
(3'd ed.). Boston: Houghton Mifflin Company.
Kerlinger, F.N, & Lee, H.B. (2000). Foundations of behavioral research (4th ed.). Orlando,
USA: Harcourt College Publishers.
Leary, M.R., Tchividjian, L.R., & Kraxberger, B.E. (1999). Self-presentation can be
hazardous to your health: impression rnanagement and health risk. In R.F. Baumeister
(ed.). The Self in Social Psychology (p.182-194). Ann Arbor: Taylor & Francis.
Lungu, O. (2001). Ghid introductiv pentru SPSS 10.0. Seria Psihologie Experirnentala i
Aplicata.
Pedhazur, E.J., & Schmelkin, l.P. (1991). Measurement, design, and analysis: an integrated
approach. Hillsdale, NJ: Lawrence Erlbaum Associates, Publishers.
Radu, I., Miclea, M., Albu, M., Neme, S., Moldovan, 0., Szarnoskozi, $. (1993).
Metodo/ogie pSihologica i analiza datelor. Cluj-Napoca: Editura Sincron.
Rosenthal, R., Rosnow, R.l., & Rubin, D.S. (2000a). Contrasts and effects sizes in
behavioral research. A correlational approach. Carnbridge: Cambridge University Press.
Rosenthal, R., Rosnow, R.l., & Rubin, D.B. (2000b). Contrasts and correlations in effect-
size estimation. Psychological Science, 11 (6), 446-453.
Rotariu, T., Badescu, G., Culic, I., Mezei, E., Murean, C. (1999). Metode statistice aplicate
In tiintele socia/e. lai: Editura Polirom.
Sava, F. (2002). Pagina de statistica sociala. Gasit la http://statisticasociala.tripod.com.
Tabachnick, B.G., Fidell, l.S. (1996). Using multivariate statistics (3rd ed.). New York:
Harper Collins College Publishers.
Yaffee, RA (1996). A basic guide to statistical research and discovery. in F.T.l. Leong i
J.T. Austin (eds.). The psychology research handook: a guide for graduate students and
research assistants (p.193-207). Thousand Oaks, USA: Sage Publications.
86
I
I
I
CAPITOLUL 4
TEHNICILE ANOVA
. Cand dorim sa comparam mai mult de desubiecti nu vom mai
folosi testul t, ci vom apela la tehnicile este un de la
denumirea In engleza "Analysis Qf limba romana tehnica este
cunoscuta sub denumirea de"anaTiza dispersionala sau analiza-.devarianta.
a aprofunda descrierea explicarea tehnicii ANOVA, voi
. care preferamJ..ItilizareaANOVA in locul testului t .
(1) Prima ratiune ANOVA tine cercetarii . ..
Testul t se limiteaza la compararea diferentelor dintre situatii .
In care exista doar doua (modalitati) ale variabilei independente. Orice
manual de metodologie recomanda Insa utilizarea unuinumar cElfmai mare de
trepte ale-variabilei independente pentru a observa mai bine
" au asupra vqria.i?ilL dependente. Pentru cei care simt nevoia unei clarificari
suplimentare, voi apela la un exemplu bazat pe legea YerkeS-Dodson, care face
referire la relatia dintre motivatie performanta. Se ca exista un optim
motivational care va duce la performante crescute. Tn schimb, daea subiectii sunt
submotivati sau supramotivati vor obtine performante scazute. Pornind' de la
aeeste considerente, sa ne imaginam situatia In care apliea testul t pentru doua
grupe de subiecti, cei care au 0 motivatie scazuta (submotivati) cei care au 0
motivatie foarte ridicata (supramotivati). Tn aceste conditii nu yom observa diferente
Intre cele doua grupe In ceea ce nivelul lor performanta vom trage
concluzia ca motivatia nu afecteaza performanta. Tn schimb, daca yom introduce
cel putin 0 grupa suplimentara, formata din subiecti optim motivati, yom observa
diferente semnificative Intre cele trei grupe Yom trage concluzia ca motivatia
influenteaza nivelul de performanta. Astfel, cu cat numarul de gr1!l2e decomparatie
este mai mare, cu atat se diversifica treptele manipiJ!lte .ale variabilei
independente vom observa mai bine infll,lenta.-variabilei independente asupra
celei gependente.
(2) Cel de-al doilea motiv pentru care testul.t:G.lJ este agecvat In situatii de
comparare a mai mult de doua grupe este de
setului "......,.,
Pentru a fntelege empiric acest concept,' iata cum ar sta lucrurile pentru
situatia de mai sus, referitoare la influenta motivatiei asupra performantei. Utilizand
testul t de comparatii Intre doua grupe yom obtine trei indicatod t, co;espunzatori
compararii grupei 1 eu grupa 2, grupei 1 cu grupa 3 grupei 2 cu grupa 3.
Utilizand ANOVA, yom fi mult mai eficienti, obtinand un singur indic .. <>torF. Acesta
nu este fnsa singurul neajuns. Nu este doar 0 problema de a munci de trei ori mai
87
1111111111J111I1I1I1I1I11I 11
I IIIIIF = III1 Iii ,II
mult, ci de prezenta unor prin calcularea mai multor teste t,
un caz particular al erorii setului de comparatii. . .
Aceasta este determinata -de urmatoare (Hinkle, Wiersma Jurs,
1994):
1- (I-a)"
(4.1 )
. --' ..
unde. pragul de semnificatie stabilit a priori pentru fiecare test t !?fectuat
(frecve'nt p=.05), iar c este dat de numarul de teste t ce trebuie efectuate.
Daca exista doar doua grupe de subiecti, se apiTca un singur test t pentru a
testa diferentele dintre mediile celor doua popuiatii de subiecti (a). Daca exista
grupe de subiecti, precum in situatia prezentata mai sus, vom avea de aplicat trel
,testet (b). in cazul testarii diferentelor dintre patru grupe am fi aplicat t
(1 cu 2; 1 cu 3; 1 cu 4; 2 cu 3; 2 cu 4; 3 cu 4) (c). Aplicand formula de mal sus:
vom observa, insa, ca doar in primul caz (un singur test t pentru--un .design cu doua
grupe), probabilitatea de a comite 0 .05.
1- (1- O.osy = o.OS(a)
1-(1-0.0SY =O.lS(b)
1-(1-0.0S)6 =O.27(c)
in situatiile in care compa@1l1 mai mult de doua grupe, eroarea de tip .. 1
limita maxima acceptata de .05, aparand eroarea setului de __
Pentru situatia b, de compararea trei grupe, ea se in felul urmator: 0
probabilitate de 15% de a comite eroarea de tip I intr-una din cele trei situatll doe
comparare. Astfel, noi vom respinge ipoteza nula cand ea nu ar fi trebuit respmsa.
Similar, pentru situatia c, de comparare a patru grupe, vom ave a 0 probabilitate de
27% sa obtinem 0 eroare de tip lintr-una din cele comparatii facute. .
Asemenea situatii sunt inacceptabile, deoarece pragul maxim al
probabilitatii de aparitie a erorii de tip I este de 5% (.05). Astfel, nu vom putea
utiliza testul t in situatii de comparClI-E;Cl.mai mult de doua grupe.
Chiar in aceste unii 'autori nu renunta la ideea utilizarii testelor t
efectueaza 0 ajustare, prin metoda astfel incat sa eli mine erow
ea
setLJ.\.uLde comparatii i sa controleze ansele de a comite eroarea de tiP I.
Ajustarea este simpla consta in impaqirea pragului de semnificatie.ge.Q la
numarul-de teste.t care urmeaza a fi aplicat. in cazul unui design cu patru
fiind necesare teste t, vom obtine un nou prag de semnificatie pentru flecare
din cele teste t de .008. 0 controleaza ansa de a
comite eroarea de tip I, este foarte conservatoare, ,crescand ansele de a co mite
eroa.@.c:lAetip II, i anume, de a ar fi trebult
respinsa, deoarece. exista diferente semnificative intre populat"le dm care sunt
ext'rase grupele. '
88
Prin urmare, Tn sau uurintei de a aplica testul t, nu exista
nici un motiv te(l1einic pentru pastrarea testelor t in situatii in care comparam mai
mult de doua grupe. Sintetizand, ele nu sunt deloc economice (ex. design-ul cu
cinci grupe necesita zece teste t, in timp ce ANOVA necesita un singw indicator F);
cresc ans8Ie'cl!:i'a I, iar atunci cand aceasta estecontrolata,
sporesc ansele de comitere a erorii de tip II.
, ...,......... . ... ,.. ,
Tipologia tehnicilor ANQVA
Cele mat Tntalnite design-uri de cercetare experimentala una
dintre urmatoarele patru forme de analiza dispersionala:
a) ANOYA sil}1pla(unifactoriala; 0 cale);
b)
c) bifactoriala; douacai);
d) ANQ,\(t':. mixta.
lata 0 scurta descriere a acestor patru tipuri:
(a) ANOVA simp/a este modelul eel mai simplu dintre tehnicile ANOVA, fiind un
corespondent al testului t pentru doua eantioane io.depen,d,ell\e.
Exemplu: Trei sunt obiinute in mod aieatoriu pentru a testa
efectul pe care-I are "Viagra" asupra poteniei sexuale. 0 grupa de subiecii va
primi "placebo", pentru a contmla efectul auto-sugestiei; 0 alta grupa va primi 0
doza mica de "Viagra", in timp ce a treia grupa 0 doza ridicata de
"Viagra". Variabila dependenta a fost nivelul poteniei sexuale (Field, 2000).
(b) ANOVA eu miisuratori repetate este un mogel corespondent al testului
pentru doua ""
Exemplu: Zece subiecli se of era voluntar pentru a testa efectul pe care-I are
"Viagra" asupra potenlei sexuale. Mai Tntai subieciii vor primi "placebo", pentru ,
a controla efectul auto-sugestiei, dupa care Ii se va masura potenla sexuala.
Apoi, subiecii vor primi ,,viagra" il'l doze mici, dupa care va fi masurata
din nou polenia sexuala. Tn subiecti vor primi 0 doza mare de
"Viagra", dupa care vor fi masurate efectele aparute la nivelul poteniei sexuale.
(e) este un model mai complex, fara un echivalent direct Tn
cadrul teste lor t. ANOVA factoriala se distinge prin faptul ca vor fi testate efectele
mai (factori) asupra unei singure variabile
."
in cazul unui design faS!9/ial.
Exemplu: Yom pastra partial situaiia din exemplul ANOVA simpla, referitor la
manipularea variabilei independenle "Viagra" cu trei treple (modalitaii):
placebo; doza redusa; doza mare. Participaniii la experiment vor fi impartiti
aleatoriu intr-una din cele trei situaiii experimentale. Daca credemca nivelul de
stres al participaniilor influenieaza potenia sexuala, vom putea introduce 0 alta
89
variabila independenta cu doua trepte (stres ridicat; stres scazut) !?i vom putea
impartiparticipan\ii in doua categorii dupa acest criteriu. in consecinia, vor
rezulta !?ase grupe experimentale, intr-un design factorial de tip 3 X 2. lata cele
!?ase situaiii experimentale posibile:
Placebo x stres scazut Viagra, doza mica x stres scazut Viagra, doza mare x sIres scazut
Placebo x stres ridical Viagra, doza mica x sIres ridicat Viagra, doza mare x stres ridicat
Fara a mai exemplifica, ANOVA factoriala poate fi utilizata fn cazul
masuratorilor repetate daca sunt manipulati cel putin doi factori.
(d) ANOVA mixtii presupune 0 combinatie Tntre ANOV-fL.simpla ANOVA cu
.
Similar exemplului oferit Tn cazul tehnicii ANOVA simpla,
manipularea variabilei independente ,,viagra" cu trei trepte (placebo, doza
redusa, doza mare) se face distribuind areatoriu participaniii intr-una din cele
trei situaiii experimentale. Tn schimb, vom manipula diferit variabila "stres".
Vom utiliza aceia!?i subiecii Tn doua situaiii diferite, reprezentand cazuri de
stres ridicat sau stres scazut. Stresul ridicat a fost reprezentat de perioada de
lucru intens, cand persoanele au fost foarte ocupate !?i stresate de termenele
de finalizare a diferitelor proiecte, iar stresul scazut a fost manipulat pe
persoane, Tn situaiii de odihna, reprezentate de perioada de concediu.
Astfel, de!?i obiinem tot celule experimentale ca Tn cazul ANOVA
factoriala, nu este vorba !?i de grupe de subiecii diferiii. in aceasta situaiie
vor fi doar trei grupe de subiecii diferiii (placebo, doza mica, doza mare), iar
fiecare din va fi testat cu doua ocazii diferite (stres ridicat -
suprasolicitare plus presiunea termenelor limita; respectiv stres scazut -
concediu de odihna).
4.1. ANOVA simpla
Tehnica permite compararea simultana a trei sau mai
(modalitati) ale unei singure variabile_Lfls!,\,pendente, mentinand nivelul alfa la
valoarea dorita, de maximum .05. 0 modalitate' clasica de analiza matematica a
acestei tehnici este analiza dispersiei variabilg:Ji...dependente, Dispersia totala a
acesteia poate fi Impar1;ita In doua componente: (intergrup)
dispersiadirflnteriorulgrupeloc..(intragrup). Clocotici Stan (2000) denumesc
aceste surse variatia dintre"grupuri, respectiv variatia Tn grupuri. in cadrul ANOVA
exista doua roeelii: cea a raspunsurilor pentru"fJecare grupa In P?Jte
marea medie rezultata din luarea Tn considerare a tuturor raspunsurilor, indiferent
de din 'carefac subiectii parte, Spre exemplu, subiectur-"din grupa 1 are 0
medi?Jaspunsurilor din grupa respectiva 0 alta abatere
90
11':lli III III 111,11 111,11 111.1' '" ,:i:lli:h!"1 II: : II I ! ' ! I
""""",,,,",,'1'"'"11"'1""11",11'11,,'1"""111"'1"""'"11,111111,1111 111111 III! III 111I 111I1111 111I III! III ,III 111I1111 III
fata de marea . rezultata din toate raspunsurile exprimate Tn cercetare
,a distinge mai bine Tntre grupuri, ar trebui ca primlil,.9.omponenta
vanat1el sa fie mai micadecj.Lcea de-a doua. Prima abatere intra Tii sfera
dispersiei se datoreaza variatiilor determinate de grupare;3
aleatoare a de-a doua abatere intra Tn sfera dispersiei J0tergrup,
care reflecta atat gruparea aleato.re a cat mai ales fluctuatiile datorate '
influentei variabilei asupra celei dependente. Simplificand IUcrurile
daca este mult mai-mare decat cea ihtragrup, exista
semnificative intre deci exista olnfluenta a
independente asupra celei dependente. '
trebuieprecizat faptul ca ANOVA simpla nu constituie un panaceu
universal pentru orice situatie, Ea are doua.l1!nite,importante: ,
1) poate fi aplicata, asemenea celorlalte tehnici ANOVA doar Tn cazul Tn care
tip.D9mLnql (ex, barbati vs. femei)
sau de tip (placebo, doza mica, doza mare), Tn plus, variilbjla
este masurata printr-o scala
cateva conditii ce vor fi prezentate ,ldjterior;'" .
2) rezuItatuI final, exprimat printr-o scor general, fara a
preciza specificul evolutiei cClJ]1P.aratiei dintr grupuri.
Pentru a fntelege mai bine cel de-al do ilea aspect yom face 0 scurta
incursiune In testarea ipotezei statistice pentru testele t tehnicile ANOVA
. in cazul testelor t, ipoteza nula este Ho: fl.l = fl.2. Respingerea ipotezei nule
fnsemna automat ca cele doua grupe difera semnificativ Tn ceea ce
mediile lor (fl.1 '# f1;2),
in cazul ANOVA simpla pentru trei grupe, ipoteza nula este Ho: fl.1 = fl.2 =
fl.3, Respingerea ipotezei nule ne arata ca cele trei",medii.nusuntegale, fara a ne
spune Tnsa cum ,In mod specific, Astfel, ram'an cateva alternative
valabile, de genul fl.1 '# fl.2 '# fl.3 sau 0.1 = fl.2, dar fl.2 '# fl.3 etc. La aceste aspecte nu
putem raspunde prin acesta ramane la un nivelgeneral de
testare a enuntat Tn ipoteza nula, -,
Pornind de la acest inconvenient, exista doua strategii de rezolvare a,
problemei:
utilizarea comparatiIlgf",apriori, de genul contrastej,gr polinomiale, a celor
ortogonale sau a celor non-grtogonale\ fara a mult pe
calcularea indicatorului general F;
utilizarea unor-compar.!iiPQSL .09C;,'. fntre anumite grupe specifice,
efectuate In cazul fn care F ClJo,$.L.E2r:nnificativ statistic, indicand existenta
unor diferente TDtre grupele cercetarii. Probele post hot au calitatea de 'a
pastra, In limitele acceptabileaie pragului de .05, riscul de a comite 0
eroare de tip I totodata, de a identifica In mod specific care dintre grupe
sunt"diferite condus la respingerea ipotezei nule.
Dintre cele doua modalitati deactiune prima este mai eleganta mai
capabila de a detecta diferentele semnificative dintre grupe, Tnsa cea de a doua
91
___
asta mai populara, majoritatea cercetarilor apeland, din traditie, la tehnici post hoc.
\fom_ prezenta, pe rand, ambele modalitati de lucru, Insa yom Incepe cu cea din
urma dator.ita simplitatii sale.
lata exemplul utilizat pentrua explica ambele modalitati de lucru:
Un behaviorist dorete sa vada care este eficienta diferitelo'r terapeutice
comportamentale In tratarea fricii de vampiri. Au 'fost cuprinse 36 de persoane
voluntare In studiu, care declarau anterior credinta lor in existenta vampirilor care
manifestau 0 fobie crescuta de acetia. au in mod
aleatoriu, in trei grupe. Grupa repartizata tehnicii "in vivo" a petre cut, timp de 0
saptamana, noPiile intr-un motel aflat in vecinatatea unui cimitir parasit. Grupa
repartizata tehnicii de "desensibilizare sistematica" a invatat mai intai 0 tehnica de
relaxare, dupa care a vizionat, pe unei saptaman'i, cateva filme cu vampiri,
pe fondul unei muzici de relaxare pe fondul exersarii tehnicilor fnvaiate cu scopul
de a reduce frica de vampiri. Cel de-al treilea grup a fost pastrat cu scop de control.
La finalul saptamanii to\i participaniii au fost testa\i printr-o scala specifica de
evaluare a fricii de vampiri. Rezultate/e mici indica 0 fobie scazuta, in timp ce
rezultate/e mari indica un nive/ crescut de fobie. Exista diferente semnificative intre
populatiile reprezentate prin cele trei grupuri cu privire /a acest
Bazade date aferenta acestui exemplu este anova simpla.sav. In SPSS,
AN OVA simpla poate fi obtinuta urmand una dintre cele doua cai fie Analyze"-
Means" ANOVA", fie "Analyze" - "General
---- .' , . -,., ...... , ---=-=-
4.1.1. Procedurile post hoc
Tn cazul utilizarii procedurilor post rezolvarea problemei presupune
urmarea a doi pa:?i: .......
a) calculareaJuLF. pentru a vedea daca exista diferenta..semnificative intre
alte cuvinte, pentru a vedea daca terapiile sunt
eficiente in reduce rea fobiilor'
b) alegerea testelor post pentru a vedea cum difera grupele
intre ele,.pas necesar a fi facut doar in conditiile respingerii ipotezei nule
din primul pas. '
AN OVA
!rica de vampiri
Sumo!
Between Groups
Squares d! 'Mean Square F Sig.
160,167 2 80,083 50,986 ,000
Within Groups
51,833 33 1,571
Total
212,000 35
Figura 4.1. Output SPSS cu modul c1asic de prezentare a testului F in tabelul sumar ANOVA
SPSS este a marca inregistrata.
92
lata 0 scurta explicitare a tabelului sumar A['JOVA din 4.1 :
sursa totala a di$persiei (prima coloana) este constituita din dispersia
intecgrup dispersi.Jntragrup;
SSsau suma patrgtelor (a doua coloana) este 0 suma pentru
ambefe - - .... -
gradele de libertate sunt prezentate In a treia cofoana. Pentru dispersia
il].tergrup.efe se calcufeaza pe baza numarului de grupe minus unu (3-1),
Tn timp ce pentru dispersia intragrup ele sunt egale cu
subiecti minus numa..!:.t,J! df3
mediClpatratica este reiultatul raportult,J,Lctintce. suma patrate1oV;;i gradele
pentru fiecare tip de dispersie Tn parte. Mai muft, priri raportul
celor dou'a se obtine rezultatul fiW:lI"I;
F se interpreteaza intr-un mod similar altor teste statistice. Daca valoarea
sa este semnificativa statistic (p < .05), atunci yom respinge ipoteza nula
conform careia nu exista diferente Intre populatiile din care au fost extrase
grupele implicate in design-ul experimental;
:ezultatullui F se scrie in felul urmator: F =:::.50,98; p < .01.
In asemenea situatii am putea afirma ca, diferenteledintre cele trei grupe
nu se datoreaza hazardului. Probabil, interventiile terapeutice de sorginte
comportamentala au efect asupra reducerii fobiei de vampiri la subieciii in
studiu. Pentru a observa cum difera cele trei grupe yom apela la metodele post
hoc.
Dintre multitudinea procedurilor dezvoltate in acest scop, yom folosi doua
criterii importante in alegerea tehnicilor adecvate:
a) exista un numar de egali in grupele cercetarii?
b) exista 0 anumita dispersiei intre aceste grupe?
Tabelul 4.1. Modul de selecVe a teste/or post hoc in funciie de cele doua criterii
Numar de subiecti
Ega/i Relativ inega/i Profynd inegaJi
(ex. 10, 10, 10) (ex. 11, 10,9) (ex. 15, 10,7)
Omogenitatea Dispersii ega/e Tukey
Gabriel
Tukeyb
Hochberg GT2
dispersiei
Dispersii inegale Dunnett T3 Games-Howell Games-Howell
Daca numarul de sUbiecti este un criteriu evident Tnca din date Ie initiale ale
unei cercetari, omogenitatea disper!3iei se testeaza prin apelul la te$tul In
situatia in care rezultatul este dispersiile a
fi egale._Daca rezultatul este serrinificativ statistic, dispersiile sunt considerate a fi
eterogene, Tn aceasta situatie, vom incerca mai intai saeliminam problema
prin transformarea datelor variabilei dependente. Dad 0 asemenea solutie nu va
indrepta situatia, yom apela la metodele de comparare posl.hoc precizate'Tn cazul
93
'I 111'11:111,11''' ,I" '!',I""I 'III 'I"'i
II: ! ! I ' II ' 'II II I' ! I II ,i'll 'I: II 'i IIII! III, :1
dispersiilor inegale, dupa ce, In prealabil, yom ajusta citirea lui F. Modul de lucru In
acest caz va fi specificat ulterior, in descrierea necesare aplicarii testului
F.
Multiple Comparisons
Dependent Va . bl f' d na e: nca e vamptn
Mean
Difference
(I) situatie experimentala
(J) situatie experimentala
(l.J) Std. Error
Tukey HSD in vivo
desensibilizare
-1,08 ,512
sistematica
control
-4,92' ,512
desensibilizare
in vivo
1,08 ,512
sistematica control
3,83' ,512
control in vivo
4,92' ,512
desensibilizare
3,83' ,512
sistematica
Dunnett T3 in vivo
desensibilizare
-1,08 ,514
sistematica
control
-4,92' ,529
desensibilizare
in vivo
1,08 ,514
sistematica control
-3,83" ,491
-
control in vivo
4,92' ,529
desensibilizare
3,83' ,491
sistematica
'. The mean difference is significant at the .05 level.
Figura 4.2. Rezultateie comparatiilor post hoc oferite de SPSS 11.0
SPSS este 0 mardI inregistrata.
Sig.
,102
,000
,102
,000
,000
,000
,131
,000
,131
,000
,000
,000
Pentru problema de fata, testul Levene a fost nesemnificativ statistic, iar
numarul de sUbiecti din fiecare grupa a fost egal, fiind cate 12 participanr
l1n
fiecare
situatie Tn aceste conditii, testul Tukey este cea mai potrivita
procedura de cal cui a diferentelor specifice dintre cele trei grupe. Oricare alta
procedura, dintre cele prezentate In tabelul de mai sus, ar fi neadecvate Tn aceasta
situa\ie, deoarece ar fi prea liberale (nu ar respecta conditia, ca probabilitatea de
eroare de tip I sa fie de maximum 5%) sau prea conservat()..re (cresc ansele de a
comite eroarea de tip II). Totui, datorita faptului ca orrlOgenitatea dispersiei nu
poate fi cunoscuta Inaintea rularii programului statistic, pot fi selectate mai multe
proceduri post hoc cu mentiunea ca yom lua In considerare rezultatele obtinute
prin tehnica ce respecta cel ;"ai bine conditiile intalnite Tn cazul respectiv, cum ar fi
testul Tukey pentru problema de fata.
Urmarind valorile testului Tukey vom putea decela urmatoarele aspecte:
94
nu exista 0 diferenta semnificativa Tn ceea ce privete reducerea fricii de
vampiri Intre care au beneficiat de 0 terapie in vivo fala de cele
care au Tnvat
at
desensibilizarea sistematica (Tukey = -1,08, P >.10); -
i
1
!
I
I
terapia comportamentala bazata pe tehnica in vivo este eficienta Tn
reducerea fricii de vampiri, rezultatele subiec\ilor din aceasta grupa fiind
semnificativ mai mici decat cele ob\inute de grupul de control, formata din
care. nu au urmat nici un fel de terapie (Tukey = -4,92, P < .01);
Similar, terapla comportamentala bazata pe tehnica desensibilizarii
. este eficienta Tn reducerea fricii de vampiri,. rezultatele
sublectllor din aceasta grupa fiind semnificativ mai mici decat cele obtinute
de grupul de control (Tukey = -3,83, P < .01); ,
pentru cei comozi, SPSS-ul of era un sprijin important Tn a identifica
diferentele semnificative la un p < .05, acestea fiind marcate cu asterisc.
Totui, merita remarcat i reversul acestei situatii. Valorile testului Tukey
nu sunt specificate direct, Tnsa ele pot fi calculate pe baza datelor din
figura 4.2., facand un raport Tntre diferenla dintre medii i eroarea standard
a mediilor. De exemplu, valoarea testului Tukey Tn prima situatie nu este -
1,08, ci 1,99 (1,08 /0,512). Similar, valoarea lui t Tukey pentru' comparatia
dintre subiec\ii supui terapiei in vivo i cei din grupul de control a fost 9,60
(4,92 I 0,512), iar pentru comparatia dintre subiectii supui desensibilizarii
sistematice i grupul de control a fost 7,48 (3,83/0,512).
ultima observatie privete semnul testelor post hoc. Asemenea testelor t
conteaza valoarea absolutaobtinuta, fara a.JLo.e-contde semn. Semnul
minus nu Tnseamna altceva deCffaptul ca subiectii au obtinut Tn medie
rezultate mai marila a doua grupa de comparatie la ,
Aspectele enuntate mai sus pot fi sintetizate astfel: Th urma aplicarii testului
Tukey, ambele forme de terapie comportamentala s-au dovedit a reduce
semnificativ frica de vampiri, prin comparare cu grupul de control. Tn schimb, nu
putem afirma ca una dintre cele doua forma de terapie, in vivo sau desensibilizare
sistematica, este '1JELt?ficienta)n reducerea fricii de vampiri.
4.1.1.1. l'v1arimea efectului in cazul procedurilor post hoc
Prin testul de semnificatie statistica am reuit sa aratam 0 anumita influenta
a tipurilor de terapie asupra reducerii fobiei de vampiri. Ramane in continuare
stabilim cat de mare este aceasta reducere? Cat de eficiente sunt tehnicile
terapeutice, Tn comparatie cu lipsa oricarei interventii specifice grupului de control?
Pentru a oferi un raspuns la aceste Tntrebari yom calcula marimea efectului
singura modalitate prin care putem decide importanta practica a
obtinute. Dupa cum am demonstrat atunci cand ne-am referit la marimea efectului
un rezultat semnificativ statistic la < .05 poate fi lipsit de important9 practica
cazul unui-eff:3ct minuscul. .
Modul a acestuia se poate face utilizand una din cele doua
formule (Rosenthal, Rosnow i Rubin, 2000a; Rosenthal, Rosnow i Rubin,
2000b):
95
WIllUIIIIUIIUlIIIIIIIIIIIIIIII _
a) In cazulln care VI are doar doua trepte (modalitati):
F
\
Ir=
. ..
(4.2)
b) In cazul in care VI are mai m'ult de doua trepte (modalitati) i s-a procedat
la comparatii post b..9.<:au la contraste:
(4.3)
F*d
F
+dif
":./..int,ergrup llltragrllp
.-.. , , ... '-
F reprezinta valoarea testului omnibuz, prin care se stabilete daca
nula va fi sau...Ql!.!?spinsa. F contrast este valoarea obtinuta in cadrul unui anumlt
contrast sau comparatie..,p0st hoc, faptul ca 12:::: F. .
cazul nostr'u, fiind yorba de trei comparatiipost hoc, putem calcula trel
marimi ale efectelor. Totui, datorita faptului ca nu au fost observate
semnificative Intre cele doua interventii psihoterapeutice nu yom calcula
efectului in acel caz deoarece diferentele observate s-ar putea datora hazardulUl
Intr-o mai mare mas'ura. Acest lucru este obligatoriu, marimea efectului. putand
fi calculata :;>i In conditiile in care un rezultat nu a fost semnificativ statistic. In cazul
unui numar relativ de subiecti :;>i in situatia unei marimi a efectului ridicate, un
rezultat nesemnificativ statistic ar fi cauza unei puteri reduse de a decela
difereniele semnificative i nu a lipsei de influenta sau asociere intre cele doua
variabile in cauza.
in cazul nostru, obtinand valorile r:: pe baza rezultatelor prezentate In
4.2. :;;i a faptului ca 12 :::: F, yom utiliza formula 4.3 pentru a obtine marimea efectulUl
pentru terapia in vivo In comparatie cu rezultatele grupului de control:
r=
9,60
2
=0,82
50,98*2+ 33
intr-un mod similar, marimea efectului interveniiei bazate p,:
desensibilizare sistematica in comparaiie cu grupul de control a fost r =.0,64 .. Daca
ar fi sa ridicam aceste valori la patrat pEmtru a observa procentul din VD
influeniat de VI in cauza yom obtine 67%, respectiv 0,40%. Ambele valon sun:
foarte. ridicate, indicand un tratament excelent al fobiei de vampiri prin cele doua
metode behavioriste. Evaluarea parametrilor s-a facut pe baza tabelului 2.2.
prezentat In sectiunea destinata marimii efectului. .
In final doresc sa amintesc ca valorile r sau r
2
pot fi transform ate In altl
indicatori ai efectului pe baza formulelor 3.4-3.9 i ca SPSS-ul ofera 0
varianta de mar,imea efectului denumita eta patrat (112). Aceasta nu poate patrunde
la nivelul analitic, al comparaiiilor dintre doua grupe, fiind doar un estimator bazat
96
pe F omnibuz. Valoarea poate fi utila doar in conditiile in care VI are doar doua
. trepte, insa, chiar i in acele conditii, poate atinge valori eronate.
4.1.2. Procedurile a priori
Tn cazul in care exista 0 anumita direqis1."ajpoteLeLsta,tistice, ar fi mai util
sa se apeleze la tehnicile a priori J,gpntraste), care, Tn comparatie cu testul general
F, au 0 mai mare putere de decelare a influentei variabileUagE;)p\:)r1gel1te,8SUpra
eelei deplndente> Astfel, daca exista vreun efect, acesta este mai uor decelat prin
apelul la decat prin metoda ciasica Tn doi pa:;;i, de calculare;;.J\li p,
urmata dealegerea h9c.
Contrastele sunt proceguri care testeaza Prin
aceasta se deosebesc de testul F, prin faptul ca of era mai multa ciaritate
conceptuala. Mai mult, stau la'baza calcu@c[i, influer1tei
variabilei independente asupra celei dependente (Rosenthal i colab., 2000a).
mai multe modalitati de lucru, implicit mai multe tipuri de contraste.
Acestea pot fi grupate dupa doua criterii majore: gradul lor,,,,de .standardizare i
prezenta ,sau Astfel, avem contraste nestan9ardizate
ortogonale sau non-ortogonale, respectiv contraste standardizat.e ortogonale sau
non-Qrtogonal8'. Numele de ortogonal vine de la faptul ca setul de este
acestea Astfel,
comparatii ramane constanta la nivelul alfa dorit de .05 sau ,01. In plus, a categone
aparte de contraste standardizate sunt cele.,polinomiale, care realizeaza 0 analiza
dir1.ctionala. wate aceste aspecte vor fi disGutate pe rand,
4.1.2.1. Contraste nestandardizate
Pentru a Tntelege mecanismul de functionare i alegere a contrastelor yom
arata modul in care ar putea fi impartit?dispersia totala, bazandu-ne pe exemplul
anterior legat de influenia terapiilor' asupra reducerii fricii de
vampiri.
= +
Dispersia
explicatade
tehnica in vivo
Dispersia
explicatii de
desensibilizare
sistematica
Contrast 1
Contrast 2
Figura 4.3. Exemplu de partition are a dispersiei in cazul contrastelor ortogonale
97
111111111.111- .'IIIIIIIIIIIIWIIIIIIIIIIIIIIIIII ,IIIII! illllill ,I!I I' I, ,I Ii '111 1111 11111111111'11111111111,11111111111111111,11111111111 'IIIIIIIW! '11111 I1111 1111111111, '11111 :lIIi 1111 '111: 1111 II!! 1111, 1111 1111 1111 1111, !!III 1111 1111 'I!! ,1111, III!! 1111, 11111 ,1111 III!! !!III 1111' '1111 IIII' 11111 1111
Avantajul cootrastelor este de a putea diviza disperj)[)teJ:Q(wp)n unit;:3\i
componente de .. intere;'pentru cercetator, fiind astfel mult mai
testului general F. Spre exemplu, Tn problema noastra ar fi sa
daca fobia de vampiri se reduce semnificativ prin apelul la Qrlcare tehDlca
comportamentala Tn comparatie cu grupul de control Similar, am
fi interesat
i
sa vedem daca exista diferente semnificative Tntre cele doua.
de terapiecomportamentala Tn ceea ce eficien\a lor Tn reducerea foblel
vampiri (contrast 2). Aceste aspecte pot decurge din 'dispersia totala la fel ca \D
reprezentarea grafica de mai sus.
Tn realizarea contrasielor nestandardizateortogonCl!e sunt cateva
regulL9.e trebuie respectate: - . - .
a) :1 numarul de c'ojJtraste realizateeste Tntotdeauna J5:J, unde
numarul ce pot fi comparafe. In exemplul nostru, existand
trei grupe "de control" ""desensibilizare sistematica" "in
vivo", pot fi realizate maximum doua contraste; .
b) . daca un grup a fost TndepartaLde celelalte grupe pentru a fi com.parat cu
acestea, (ex. cazul grupului de control In primul contrast), el nu mal poate fl
utilizat-In contrastele ulterioare;
c) grupele v;-fi po Q9_es;:;tte , astfel Tncat sa existe 0 egalitate de coeficien\i Tn
fiecare contrast efectuat.
Aceasta. se face \inand seama de numarul de subiec\i .dintr-o
grupa de numarul de grupe dintr-un_"chunk".ln situat
ii
de grupe cu numar egal
de subiecti, ca In exemplul nostru, coeficientii atribuiti pentru cele doua contraste
de mai pot fi:
Contrast 1
Contrast 2
"in vivo"
desensibilizare sistematica
1
-1
La fel de bine, coeficienti pot fi:
Contrast 1
Contrast 2
"in vivo"
1/2
1
desensibilizare sistematica
1/2
-1
control
-2
o
control
-1
o
Pentru a determina daca toti coeficientii sunt trebuie ca
oricare suma pe orizontalasa fie zero (ex. 1 + 1 -2 = 0; 1 - 1 + 0 = 0 sau
Yz + Y2 -::-;-";;' O).pentrLta-detefmina daca contrastele Tndeplinesc criteriul
conirastelQL ortogonale ar trebui ca a, contraste sa fie tot
zero. Spre Tn primul caz avem: 1*1 + 1*(-1) + (-2)*0 = 0; iar In al doilea:
Yz * 1 + Y2 * (-1) + (-1)*0 = O. In concluzie, ambele cazuri respecta criteriul
ortogonalitatii.
98
Contrastele nestandardizate non-ortogonale se aseamana pana la un
punct cu cele In cazul lor nu respectarea celei
de-a reguli enuntate mai sus, c;onform careia, 0 data ce 0 grupa a fost
despnns,a pentru .a comparata cu un set de grupe nu mai poate fLcomparata
ulterior. In consecmta, a doua contrasteJluvamai fi zero Tn acest
caz. Un exemplu de set de contraste nestandardizate non-ortogonale este: .
Contrast 1
Contrast 2
Figura 4.4. Exemplu de partitionare a dispersiei In cazul contrastelor non-ortogonale
o asemenea situa\ie ar putea fi transpusa In urmatorii coeficien\i de
ponderare:
Contrast 1
Contrast 2
"in vivo" desensibilizare sistematica
1
o
control
-2
-1
Tn aceasta situatie se observa reintroducerea grupului de control Tn eel de-
al doilea contrast dupa ce In prealabil a fost comparat singur In contrastul 1. Acest
fapt nu este permis 7n contrastele ortogonale, prin urmare nici sum a produselor a
doua nu va mai fi zero [1 *1 + 1 *0 + (-2)*(-1) = 3]. .'
Dar'Oece este important sadiferentiem Intre contrastele ortogonale
cele non-ortogonale? Primele au marele avantaj de a controla emarea setului de
c0D!paratii" fapt ce mentine In limite normale valoarea pragului de semnificatie. Tn
schlmb, contrastele neortogonale, platesc lipsa de independenta dintre
fapt conduce la 0 a eroarea de tip I. Tn aceste
condltll este necesara foarte multa precautie In interpretarea contrastelor
neortogonale, fapt pentru care recomand, de cate ori este posibil utilizarea
exclusiva a contrastE:1 PLQri99() (lall:'). '
lata 0 statistica concreta, pe baza exemplului nostru. Ipotezele pe
care dorim sa Ie testam sunt:
a) !obia de vamplrl a subiectHor In grupele terapeutice
comportamentale va fi semnificativ mai mica decat cea Tntalnita In grupul
de control;
Ho1: 1 1.1. "in vivo" + 1 1.1. "desensibilizare" = 2 1.1. "control"
99
1IIIIIIIIIUlUIlIlllII.uI.-II!W_____
b) terapia"in vivo" este mai eficienta Tn acest scop Tn comparatie cu
desensibilizarea sistematica.
Ho2: 1 [.I. "in vivo" :::: 1 [.I. "desensibilizare"
Se observa ca ambele ipoteze spre d.eosebire de 0 ipoteza
generala F de genul: ..In ce masura exista 0 diferenia semnificativa Intre grupele
cercetarii Tn reducerea fobiei de vampiri".
Ho: 1 IJ. "in vivo" = 1 IJ. "desensibilizare'! :::: 1 IJ. "control"
In cazul utilizarii contrastelor, rezultatele pot fi exprimate Tn t. .. ,
Indiferent de modul de exprimare, valorile pot fi transformate uor, cunoscandu-se
faptul ca:
(4.4)
Primul din cele doua ale lui Fcontrast este
unu, In timp ee al do ilea grad de lipertate sste egal cu eel al lui t
situatie. Astfel, daea t = 3, la 12 grade de libertate, atunci F (1, 12) = 9.
! .. r
Contrast Coefficients
situatie exoerimentala
desensibilizar
Contrast in vivo e sistematica control
1 1 1 -2
2 1 -1 0
ContrastTests
Valueo!
Contrast Contrast Std. Error t df Sig. (2tailed)
frica de vampiri Assume equal variances 1 '8,75 ,886 '9,874 33
2. 1,08 ,512 2,117 33
Does not assume equal 1 8,75
.
,882 -9,926 22,255
variances
2
1,08 ,514 -2,106 21,543
Figura 4.5. Output SPSS 11.0 cu modul de prezentare a rezultatelor contrastelor
SPSS este a marca Tnregistrata.
,000
,042
,000
,047
In primul tabel din output sunt prezentati coeficieniii atribuiii celor
contraste, pentru a difereniia Tntre cele doua ipoteze specifice AI dOllea
tabel din output prezinta valorile lui t pentru fiecare dintre cele doua
specificate, inclusiv eu ajustari in cazul Tn care nu a !ntre
grupurilor comparate. Pentru problema de fata, eXlsta (testul
Levene a fost nesemnificativ statistic), prin urmare, pnmele doua randun din al
doilea tabel al figurii 4.5. sunt cele care ne intereseaza.
I
I
III ill111 'Ii 11"11 111I11 '
11,1'1,'["
Se observa, Tn cazul primei ipoteze ca, t (33) = 9,87, P < .01, rezultat ce
indica 0 diferenia semnificativa intre nivelul fobiei de in grupul de control :;;i
eel din grupele de subiecti sup use terapiei comportamentale. Rezultatul poate fi
scris :;;i sub forma: F(1, 33) = 97,41, P < .01. Urmarind valorile mediilor, vom
observa ca ambele interveniii terapeutice sunt semnificativ mal bune Tn reducerea
fobiei de vampiri cOl11parativ cu lipsa oricarei interventii (grupul. de control).
In cazul cele; de-a doua ipoteze se observa ca t (33) = 2,11, P < .05 este,
de asemenea, semnificativ statistic. Tinand cont de conVnutul celui de-al do ilea
contrast (tehnica "in vivo" este mai eficienta decat cea bazata pe desensibilizare
sistematica) i urmarind mediile celor doua grupe experimentaie, yom concluziona
ca, intr-adevar, 0 terapie comportamentala bazata pe tehnica "in vivo" este
semnificativ mai buna Tn a reduce fobia de vampiri, Tn comparaiie cuo interveniie
terapeutica bazata pe desensibilizare sistematica.
Cititorii atenti au observat, probabil, un aspect deosebit. Prin testele post
hoc, mai exact prin aplicarea procedurii Tukey, nu au aparut diferente seml1ificative
Intre cele doua modalitaii terapeutice, In timp ce contrastele ortogonale au sesizat
ca terapia "in vivo" este mai eficienta.
Cum explicam 0 asemenea situatie i cum procedam in astfel de cazuri?
Explicatia consta in faptul ca (ex. contrastele nestandardizate
ortogonale) au 0 putere mai mare de a '(jetecta populaiiile din
care au fost extral:;e cele doua grupe sau setul de grupe. Prin asemenea
situaiii, ne Yom obiinute Tn urma aplicarii contrastelor
ortogonale decat pe cele rezultate din aplicarea unor comparaiii post hoc. Acesta
este un motiv suplimentar, care ar trebui sa determine cercetatorii sa prefere, ori
de cate ori au ocazia, aplicarea comparatiilor a priori, Tn dauna celor post hoc.
Mai mult, exista situatii, foaljerClre, Tn care tel?tul F general nU--detecteaza
diferente Tntre grupele Tn timp ce Fcontrast sa=;te'stele" t ,.'
putea indica diferente Tntre.grupe. In vom proceda Tntr-un mod
similar, bazandu-ne pe aceste comparatii a priori au 0 putere mai mare de
detectare a diferentelor reale dintre populaiiile din care au fost extrase grupele Tn
comparatie cu testul general F (Rosenthal, Rosnow i Rubin, 2000a).
4.1.2.2. Marimea efectului In cazul contrastelor
Vom aborda Tn continuare problema marimii efectului Tn cazul utilizarii
contrastelor. Va reamintim ca prin intermediul lor vom putea constata In ce masura
diferentele semnificative observate ,.unt substantiale sau nu.
I - .......... .. . _.. ,., .. ''"'' ... , _,.
doua mariml ale efectului am utilizat aceleai formule 4.3. 4.4. Astfel, Tn cazul
primului contrast ce viza diferentele dintre cele doua interventii terapeutice i
grupul de control am obtinut 0 marime a efectului r de 0,72, rezultat care indica 0
scadere foarte 'mare a valorilor fobiei de vampiri la persoanele care au fost supuse
oricarei interventii terapeutice dintre cele doua amintite. In cazul celui de-al doilea
' ,
contrast semnificativ statistic r a fost doar 0,03, fapt ce arata ca. terapia in vivo duce
la 0 scadere semnificativa, dar foarte mica a nivelului fobiei Tn comparatie cu
101
"'111111111111 1111 11111 1111 IIIIIJIII'IIIIIJIIIILlIIILlllllcIlIlLlllllc'IIIILlIIIIJIIIILlIlIl 111111 11111 11111'11111 ,1111 II 111,1111111111,1111,11111:1111 IIIIIJIIII.,IIIII !IIII'IIIII IIIlIjlll'-llili ,1111,11111 ,1111' 11111 ,1111' 11111'1111'11111'1111,1111111111'11111:1111'1111:'1111 1111,:1111 !III"III! 1111 !IIII 1111'jlll 1111 1111,1111 IIII! 1111 11111 1111 illl' IIII'IIII!IIIII 11111'1111 III! 'III'!III 111'1111 111'III,IIIIIIIIII!II'I!'1
persoanele supuse desensibilizarii sistematice. Altfel spus, cele doua grupe
difera semnificativ, din punct de vedere practic nu exista diferente calitative Intre
cele doua grupe de subiecti, terapia in vivo avand un avantaj foarte mic Tn fai
a
terapiei bazata pe desensibilizare sistematica.
4.1.2.3. Contrastele standardizate
Aceasta categorie de contraste consta Intr-un set de
Ele pot fi ortogonale SPSS-ul dTspune, in
meniu, de 9apte contraste standardizate dintre care doar ultimele doua din tabelu\
4.2. sunt Field (2000) 0 sinteza a Ior. Pentru a
simplifica lor in SPSS am decis pastrarea denumirii lor din engleza.
Tabelul 4.2. Descrierea contrastelor standardizate prezente Tn SPSS
Nume Descriere Contraste Trei grupe Patru grupe
Deviation Compara fiecare'grup (cu 1 2 vs. (1,2,3) 2 vs. (1,2,3,4)
(first) excepiia primului) cu 0 2 3 vs. (1,2,3) 3 vs. (1,2,3,4)
combinatie a tuturor grupelor. 3
.
4 vs. (1,2,3,4)
<
Deviation Compara fiecare grup (cu 1 1 vs. (1,2,3) 1 vs. (1,2,3,4)
(last) excepiia ultimului) cu 0 2 2 vs. (1,2,3) 2 vs. (1,2,3,4)
combinatie a tuturor grupelor. 3
3 vs. (1,2,3,4)
Simple Fiecare grupa este comparata 1 1 vs.2 1 vs. 2
(first) cu prima categorie. 2 1 vs. 3 1 vs. 3
3
1 vs. 4
Simple Fiecare grupa este comparata 1 1 vs. 3 1 vs. 4
(last) cu ultima categorie. 2 2 vs. 3 2 vs. 4
3
3 vs. 4
Repeated Fiecare grupa, cu excepiia 1 1 vs. 2 1 vs. 2
primei categorii este 2 2 vs. 3 2 vs. 3
comparata cu grupa imediat 3
:3 vs. 4
precedenta.
Helmert Fiecare categorie, cu excepiia 1 1 vs. (2,3) 1 vs. (2,3,4)
ultimei, este comparata cu 2 2 vs. 3 2 vs. (3,4)
media grupelor ulterioare. 3
3 vs. 4
Difference Fiecare categorie, cu excepiia 1 3 vs. (2,1) 4 vs. (3,2,1)
(Helemert primei, este comparata cu 2 2 vs. 1
3 vs. (2,1)
invers)
media grupelor precedente. 3
2 vs:1
Daca am notat grupul "in vivo" cu 1, grupul "desensibilizare sistematica" cu
2 grupul de control cu 3, vom observa ca alegerea tacuta de noi, in cadrul
contrastelor nestandardizate, se In situatia "Difference" pentru trei grupe.
Daca primul contrast teste'aza diferenta Tn ceea ce nivelul fobiei de vampiri
dintre grupul de control 9i cele doua g'rupe experimentale, cel de-al doilea com para
102
I
I
I
II III III, !III' '1111 I111 '1111 1111 :III! 1111 1111 1111 !III' 1111 'III: 1111 1111' '1111 1111' ,1111 1111 III! 'III 1111 III 1111 '1111 III, :,: II' III !I III 'II 'I! "! !III 1111 ,III 1111 1111 1111 1111' :1111 1111 III' 111I 'III 1111 III '111 III' !III :111' !II! 'III' 111I 'III III! III' 1111: 1111 1111' :1111 1111' :1111 1111' 11111 1111 I1111 III! 1IIIi 1111' 11111 '1111: 1111I .1111 1111: :1111 11111 :1111 ,11111 I1111 1111I :1111 1111':111 III: I::
diferentele dintre cele doua grupe experimentale. Aceste contraste standardizate
nu' sunt disponibile In SPSS, In optiunea "one-way ANOVA", ci doar In "General
Linear .Model.-Univariate". Tn schimb, contrastele nestandardizate se
doar in ANOVA" nu sunt disponibile, fara sintaxa, Tn "General Linear
Model - Univariate".
Toate contrastele care nusunt ortogonale, indiferent daca sunt
standardizate sau nu, trebuie .. datorita crescute de a comite
Numai rezultate puternic semnificative (ex. p < .001) pot fi
Interpretate fara probleme, daca au fost utilizate contraste non-oliogonale. Un alt
aspect tehnic, tine de modul de prezentare a rezultatelor Tn SPSS. Acesta nu of era
direct valoar.ea lui t, Tnsa of era toate datele necesare ;aicularii sale,cat
de semnificatie aferent acestuia. Pentru problema ar fi aratat
astfel:
Contrast Results (K Matrix)
Depende
nt
Variable
situatie experimental a frica de
Difference Contrast vampiri
Level 2 vs. Level 1 Contrast Estimate 1,083
Hypothesized Value 0
Difference (Estimate - Hypothesized)
1,083
Std. Error ,512
Sig. ,042
95% Confidence IntelVal Lower Bound 4,238E-02
for Difference
Upper Bound 2,124
Level 3 vs. Previous Contrast Estimate 4,375
-
Hypothesized Value 0
Difference (Estimate - Hypothesized)
4,375
Std. Error ,443
Sig. ,000
95% Confidence Interval Lower Bound 3,474
for Difference Upper Bound 5,276
Figura 4.6. Rezultate oferite de SPSS 11.0 pentru contrastu/
SPSS este 0 marca Tnregistrata.
Primul contrast prezentat fn figura 4.6. este cel referitor la diferentele
existente dintre cele doua interventii terapeutice de sorginte experimentala (1 ...: "in
vivo"; 2 - "desensibilizare sistematica"). Valoarep lui teste egala cu raportul dintre
estimarea contrastului eroarea standard a diferentelor dintre medii. Tn acest prim
caz, teste 1,083/0,512, adica t = 2,11, P < .05, tehnicile comportamentale "in vivo"
fiind mai eficiente decat cele bazate pe desensibilizare sistematica, Tn reducerea
fobiei de vampiri. Se observa ca rezultatul este identic cu cel obtinut fn sectiunea
contrastelor nestandardizate, fiind vorba de situaiie.' ,
103
Cel de-al do ilea contrast testeaza diferentele dintre grupulde control (3) ;;i.
celelalte doua grupe experimentale (1 + 2). Rezultatul t::: 9,87, p < .01 este identic
" cu cel prin eontrastele nestandardizate, aratand ea eele doua interventii
comportamentale sunt mai efieiente In redueerea fobiei de vampiri Tn
cu absenta oricarei interventii (grupul de control).
A;;adar, dintre contrastele standardizate ;;i eele nestandardizate
doar de sfera de cuprindere. Exista 0 multitudine de combinatii ;;i, implicit, de
contraste nestandardizate. Cele mai des intalnite sunt preluate de multe programe
statistiee (ex. SPSS) i standardizate prin anumite denumiri, pentru a u;;ura munca
de introdueere a coeficientilor aferenti.
4.1.2.4, Contrastele polinomiale
... ::;;;.:r",._._.':::"',"'{-""";-'"'''''-'''c-
Aeeste eontraste reprezinta 0 categorie aparte de contraste standardizate
.
iortogona)e, Cand variabila independenta este permitand astfel, 0
ordonare a modalitatilor sale, pot fi aplicate contrastele polioomiale, sub forma unei
Wiersma i Jurs, 1994). Acestea numai ea of era
informatii difere:ntele _ existente Intre anumite grupe, ci ;;i arata
complementar dire.,S@gateioLfn functie de treptele variabilei independente. .
Proeedurile analizei pornesc de la ea treptele
sunt egal distantate, iar numarul de subiecti din fiecare
grupc'Leste egal. Ambele conditii pot fi incalcate, Insa In acele conditii se impun
criterii conser1/atoare ale pragurilor de semnificatie, cum ar fi un R ..
Exemplul ales pentru explicarea contrastele anterioarEtnu este potrivit
pentru a apela la contrastE:!le polinomiale, deoarece cele doua grupe de terapie
comportamentala nu sunt intrinsec ordonabile, fiind mai degraba variabile de tip
nominal. De aceea, yom apela la un alt exemplu:
Pentru a testa eficien\a edin\elor de hipnoterapie pe un eantion de subiec\i
bulimici au fost realizate cinci grupe, Tn care subieciii au fost inclui aJeatoriu.
Grupul 1 este pastrat ca grup de control, al doilea grup urmeaza edinie de
hipnoterapie 0 data pe saptamanii.; al treilea grup face lucru, dar de
doua ori pe saptamana, al patrulea grup are trei saptamanale, In timp
ce al cincilea grup urmeaza patru saptamanale de hipnoterapie.
Supunand aceste grupe la 0 analiza directionala vom putea Tntalni unul
dintre cele patru cazuri de evolutie a1ia..tgLq[, prezentate grafic In ct?!e ce urmeaza:
104
aparea in design-uri experimentale cu dou;tsau mai
multe grupe);''''=''""-
. (poate aparea in, design-uri experimentale cu mai
multe grupe); .. . .'., ....
(poate aparea in design-uri experimentale cu patru sau mai
multe grupe)'; ."-",,
directie.cuartica (poate aparea in design-uri experimentale cu cinci sau mai
multe grupe).
11"111'1111111111111'- .IIIIIIIII!IIIIIIIIIIIIIIIIIIIIIIIOOIIIIWIIIIII
1111 '11111 11111 illll'lllll 11111"IWJJJJl m
0 evolufje de,la 0 treapta la alta.
10
,.

E >
.g 5
..
0..
o
lini""
1--- Oirectie Inia-a 1
2 3 4
Figura 4.7. Directie liniadi
Directia 0 pan a la un anl!mit punct
(ex. ascendenta), dupa care sensu I . directiei se schimba (ex. J
descendenta). ' -
[lrec1ie curtilhie
"
GrlP"le eXp"rimertale
Figura 4.8. Directie curbilinie
. presupune 0 cu doua schimbari de
dlrectle pe parcursul trecerii de la 0 treapta a variabilei independente la'alta. ==.
.. 10
;: 8
E 6
.g 4
., 2
ll. 0
Directie exponentiala-cubica
2 3 4
Grupele experimentale-
Irepte ale variabilei
independenle
. -+- Directie
.exponentiala-
cubica
Figura 4.9. Directie cubica
105
III' I1111 ,lllli 11111I ,11111 '11111 lilli, :11111 11111' '11111 11111' 111111 '11111111111 ,11111 III, :111 III !II' !II' III: III IlldllLJlllLIIll'Jll1 1111 Jill '1111 1111' 11111 11111 11111 '1111i 11111 "II Iii 'III 1111111111 1111' 11111 illll, 11111 :1111. 111111111 II' III' III 'III' I1111 11111 :1111 1111' 11111 '1111' !IIII 1111 11111 '1111 1111 "1111 1111 1111: 1111 '11111 1111 1111 III! 1111 ',1111 '1111 11111 '1111 11111 III 1111 'II', 'I11 'III '.'i
Ultima 'posibilitate de evolutie a directiei este CUfl-I!ig. Aceasta direct
ie
es
te
foarte inconsecventa, avand trei puncte de a directiei.

Directie cuartica
2 3 4
Grupele experimentului
Figura 4.10. Directie cuartica (neregulata)
Contrastele polinomiale nu trebuie specificate Tn SPSS deoarece aY,-,:,alori
fixe, pentru directii l?i numar de grupe diferite. lata cateva valori ale acestora peiifru
situat
iile
experihientale cu trei pana la l?ase grupe (Hinkle, Wiersma, Jurs, 1994).
K == 3 (Irei grupe de subiecti)
K = 4 (patru grupe de subiecti)
Liniar
1 0 -1 Liniar -3 -1 1 3
Curbiliniu
-2 Curbiliniu 1 -1 -1
Cubic -1 3 -3
K == 5 (cinci grupe de subiecti)
K == 6 (ase grupe de subiecti)
Liniar
-2 -1 0 1 2 Liniar -5 -3 1 3 5
Curbiliniu 2 -1 -2 -1 2 Curbliniu 5 -1 -4 -4 -1 5
Cubic
-1 2 0 -2 Cubic
-5 7 4 -4 -7 5
Cuartic
-4 6 -4 Cuartic 1 -3 2 2 -3 1
Dezavantajul utilizarii acestor contraste polinomiale consta in posibilitatea
de a obtine mai multe valori-F"semnificative, ceea ce implica mai multe direc\ii
posibile de_evolutie' a variabilei dependente 1nfunctie de
. . .,
Sa presupunem ca dintre toate testele t calculate, doar t IlnIar a lel?lt
semnificativ statistic. Aceasta situatie ar fi aratat ca directia de evolut
ie
a lucrurflor
este una Iiniara. Consultand celor cinci grupe vom trage, probabil,
urmatoarele concluzii: l?edintele de hipnoterapie se dovedesc a fi eficiente 1n
tratarea bulimiei, cu cat numarul de l?edinte de hipnoterapie crel?te, eu atat scad
semnificativ manifestarile bulimice.
106
4.2. AN OVA factoriala
Pana 1n prezent am discutat cazurile de ANOVA 1n care era prezenta 0
. singura variabila independenta' cu mai multe trepte l?i 0 singura variabila
. dependenta. Aceasta nu este Tnsa l?i singura modalitate de a realiza 0 cercetare.
Design-ul poate incLuge mai multe independente. in acest caz se
utilizeaza'AfiQYA factoriala, prin care se simultane a
doua sau maimulte variabile independente asupra unei
Exist; mai multe avantaje Tn utilizarea unui design experimental factorial.
Un prim c3l?tig este dat de un control unor variabile dJ'l interes care Tn
ANOVA simpla sunt excluse din studiu. consta in
deoarece doua sau mai multe variabile independente sunt analizate
extrase informatii referitoare atat la fiecare factor Tn parte, cat l?i la interactiunea
dintre acel?tia, vizand influenta comunaasupra VD. '
Din aceasta perspectiva, ANOVA factoriala pentru doua variabile
independente conduce la calculularea a trei testE;!statistice F ..
realizeaza' 'pentru a gasi al variabilei A l?i
efectul principal al variabilei B), iar cel de-al treilea test masoara interactiunea
Efectele sunt analoge dispersieLintergrup
iartestuf interactiunil (silJ1bolizat AB) ne arata daca rezultatele obtinute- la. diferite
nivele ale variabilei A de .
, --hi cele ce ne vom opri doar asupra testului ANOVA bifactorial (2
.,eu mai multe trepte fiecare), fiind insa posibile' l?i
experimente care necesita mai mult de doi factori. Algoritmul de rezolvare a
acestor situatii este asemanator cu ANOVA bifactorial. De exemplu, un design
factorial complet cu treL\fctriabile independente ar duce la calcularea a l?apte teste
F generale. Trei dintre ele ar urmari efectele principale ale celor trei variabile
independente A",B, C, alte trei teste F ar urmari interactiunea dintre
pereche de varlabile (AB,f.'.,G,BC), iar ultimul F ar surprinde 0 interactiune
complexa a celor trei variabile studiate (ABC). '. '
Orice ANOVA factorial are's:pecificatdesignul experimental realizat sub
forma unorcifre. Un design factorial cu doua variabile avand
cate trepte, va fi notat Un alt design, Tn care prima variabila are
doua trepte, iar cea de a doua cinci, va fi simbolizat ANOVA 2x5. Un design
factorial, cu trei variabile independente, Tn care primele doua variabile au cate 3
trepte, iar cea de-a treia doar doua, va fi notat ANOVA 3x3x2 l?a.m.d.
Voi prezenta In continuare forma grafica a unui design experimental
bifactorial, Tn care cele doua variabile independente au cate trei trepte (tabelul 4.3).
Dupa cum se observa, din combinarea celor doi factori" fiecare cu trei
trepte, noua situaiii experimentale diferite. Acestea poarta
celule experimentale.

107
Tabelul 4.3. Exemplu de design experimental de tip 3 x 3
B1 B2
B3
A1 A1B1 A1B2
A1B3 Medie A1
A2
' A2B1 A2B2
A2B3 Medie A2
A3 A3B1 A3B2
A3B3 Medie A3
Medie B1 Medie B2 Medie B3
Daca'in cazul ANOVA simpla era suma
cu dispe@ia intragrup, in cazul ANOVA bifactorialaexista patru surse al,, dispersiel
totale, i <inume: (echivalenta cll dispersia dispersia
de-a lungul mediei.Jiniilor (datorata factoruluiA); dispersia de-a lungul mediei
coloanelor (datorata fa
c
12,C1Jlui B) i dis persia datorata interactiunii dintre cele doua
variabile independente ultimelor trei dispersii este echivalentul
dispersiei intergDdP
De aceea, in cazul ANOV A-.bifpctorial sunt testate trei ipoteze nule.
Primele doua se refera la efectul v.Tic:!bilelor incjependente .. luate
1
=
Il
A2
= )1A3, respectiv IlB1 = IlB2 = IlB3) , iar cea de-a treia se refera la
interactiunea dintre cei doi factori.
, Pentru a teoretice prezentate in cadrul ANOVA
factoriala, voi oferi drept model de rezolvare 9 problema tipica vizt':!nd memoria.
Pomind de la experimentele ciasice ale lui Loftus Palmer (Eysenck
Keane, 2000) care au ari:Hat ca memoria are 0 natura reconstructiva, un cercetator
sa studieze in ce masura relatarile martorilor oculari sunt influent
ate
de
intrebarile adresate de experienia faia de situaiia in cauza, avand drept obiectiv
stabilirea gradului de incredere in martorilor la procese.
_ Experimentul descris in continuare este 0 adaptare a cercetarilor iniiiale
realizate de autorii meniionaii. Acetia propun subieciilor sa vizioneze un film
despre un accident de circulaiie. Dupa vizionare subiectilor Ii se cere sa estimeze
viteza cu care rulau mainile in momentul accidentului (variabila dependenta),
cercetatorii fiind interesati de influenta a doua variabile independente.
o prima variabila manipulata de experimentatori este modul de adresare a
intrebarii. Astfel, ei cer unui grup sa estimeze viteza cu care s-au "zdrobit"
unui al doilea grup sa estimeze viteza cu care "s-au lovit" in timp ce in a
treia situatie, subiectii au fost ,intrebati ce viteza aveau in momentul
accidentului. Cea de a doua variabila independenta a fost experieni
a
subiectilor
care a avut doua trepte: ne-oferi. Aadar, avem un model ANOVA
factorial de tip 3x2 (trei linii i doua coloane).
Ipoteza cercetatorului este ca relatarile subieciilor sunt influent
ate
atat de
expresiile utilizate (intrebarile anchetatorului), cat de experienia subieciilor in
situaiia descrisa (profesiunea martorului) in sensul CEl subiectii - oferi pot estima
mai bine decat viteza de deplasare a automobHelor).
108
, Baza de -date aferenta exemplului este anova factoriala.sav, iar calea de
a" rezultatelor in SPSS este "Analyze" - "General' Linear Model" -
"UniVariate.
Tests of Between-Subjects Effects
Dependent Variable' viteza masinilor
Type III Sum
Source of Squares df Mean Square F Siq:
Corrected Model 1702.800"- 5 340,560 7,277
Intercept 38880,00Q 1 3881?0,000 830,769
SUGESTII 1139,400 2 569,700 12,173
EXPERIEN 97,200 1 97,200 2,077
SUGESTI,I * EXPERIEN 466,200 2 233,100 4,981
Error 1123,200 24 46,800
Total 41706,000 30
Corrected Total 2826,000 29
a;
R Squared ,603 (Adjusted R Squared = ,520)
Figura 4.11. Output SPSS 11.0 cu tabelul sumar ANOVA factorialfi
SPSS este a marca Tnregistrata.
,000
,000
,000
,162
,016
Eliminand nu ne intereseaza in acest moment, din informatiile
prezentate In modelul generalliniar din SPSS, obtinem urmatorul tabel ANOVA: '
Tabelul 4.4. Tabelul sumar ANOVA 3x2 factorial
Sursa dispersiei SS df MS F p
Linii (A) - sugestii 1139,4 2 569,7 12,17 <.01
Coloane (B) - experienta 97,2 97,2 2,07 >.10
Interacliune AxB 466,2 2 233,1 4,98 <.05
Intracelula 1123,2 24 46,8
Tatala 2826,0 28
. . se observa CEl din cele trei raporturi F, doua sunt semnificative
"sugestii" = 12,17, P, < :01] F interaciiune [F(2, 24) = 4,98, p
, ,05]. :nmul ,Indica, un efect principal semnificativ, care poate fi transpus
In estimarea vitezei de deplasare a in momentul
este Influentata semnificativ de modul de adresare a intrebarii prin
cuvlntele a!ese in scop. Aceasta inseamna ca,. daca ignoram expe;ienta
celor, dou,a de subiecti vs. exista 0 diferenta
In estlmarea vitezei, influentata de modul de formulare a
Fllnd ,un test F general, de tip omnibuz, nu putem deduce direct cum evolueaza
utilizarea termenului "zdrobit" conduce la estimarea unei
vlteze mal man decat folosirea termenului "Iovin Exista. diferente semnificative
109
Tntre utilizarea termenului "zdrobit" fata de utilizarea sintagmei "cu ce viteza
circulau mainile In momentul accidentului?" etc. Pentru a observa care diferente
sunt semnificative putem apela, fie la-Gontraste, fie la compar.atiLpo?LbPc, ambele
fiind deja prezentate Tn sectiunea destinata analizei dispersiqnale simple.
Tn urma aplicarii- testului post au fost observate diferente
semnificative In doua dintre cele trei comparatii. Mai precis, ignorand aspectul
experientei Tn conducerea autovehiculelor, persoanele carora 'Ii s-a adresat
Intrebarea incluzand termenul "zdrobit" au estimat viteze de deplasare semnificativ
mai mari Tn comparatie cu situatia utilizarii termenului "Iovit" sau Tn comparatie cu
grupul asupra caruia s-a folosit expresia neutra "viteza cu care circulau mainile".
Tn schimb, nu au fost sesizate diferente semnificative Tn ceea ce privete viteza de
deplasare a automobilelor Tn cazul utilizarii expresiei "Iovit" fata de cazul exprimarii
"viteza cu care circulau mainile".
Cel de-al doilea F din tabelul 4.4. a testat In ce masura exista 0 diferenta
semnificativa Tntre oferi i non-oferi, indiferent de uti lizate , referitoare la
estimarea vitezei cu care circulau mainile In momentul accidentului. Rezultatul,
F(1, 24) = 2,07, p >.10, a fost nesemnificativ statistic, astfel ca nu s-au gasit
diferente semnificative Tntre cele doua categorii de persoane cu privire la viteza de
a mainilor. Aceasta Inseamna ca, ignorand tipul de Intrebari adresate,
nu exista diferente Tntre oferi i non-oferi In estimarea vitezei de deplasare a
mainilor, In momentul accidentului din filmul respectiv.
In schimb, cel de-al treilea test F, vizand gradul de interactiune dintre cei
doi factori, este semnificativ statistic, existand 0 asociere Tntre treptele celor doua
variabile independente. Cu alte cuvinte, efectul modului de formulare a Intrebarilor
asupra estimarii vitezei de deplasare a mainilor a fost diferit pentru oferi fata de
non-oferi. Cum a fost diferit, este 0 alta poveste, ce necesita fntelegerea
conceptului de efect simplu.
110
55..--------'--,
45
om
35

E

Q)
'"

\
\
,
\
\
,
,
\
,
\ -'
lII--
perienta sofat
Q sofer!
25,-I-___ *
zdrobit lovil rulau in rrorrentul ac
expresie utiHzata
Figura 4.12. Reprezentarea grafica In SPSS 11.0 a interactiunii dintre cei doi (actori
SPSS este 0 marca fnregistrata.
'111'1111'11111111111'11111111
. Un mod dar simplificat, de a observa se obtine
graflcaa interactiunii factori. Acesta se po ate
obtlne direct din SPSS utilizand aceeai cale de obtinere a rezultatelor Tn cazul
ANOVA factoria}, - "l,Jnivariate", dupa care se
selecteaza butonul - Tnainte de a face acest lucrutrebuie sUbliniata
urmatoarea idee: dei efeCte"le principale au rolul lor, daca interactiunea dintre doi ..
semnificativa,aceasta devine primordiala Tn statistica i
pSlhologlca a rezultatelor unei cercetari.
Ca 0 regula generala, Tn cele mai multe situatiicand cele doua linii se
intersecteaza, precum Tn figura 4.12., exista 0 semnificativa fntre acei
doi factori. Din desen, se pot desprinde cateva obs'ervatii. Diferentele cele mai
mari, dintre oferi i non-oferi, se observa Tn cazul Tn experimentatorul a
folosit sintagma "cu ce viteza s-au zdrobit mainile In accident". Astfel, non-oferii
tind sa fie influentati mai puternic de aceasta expresie, acordand 0 viteza de
deplasare mult mai mare decat media estimarilor facute de oferi. De asemenea,
putem nota ca cea mai mica diferenta dintre cele doua categorii de persoane se
observa Tn situatia Tn care experimentatorul adopta 0 atitudine neutra, utilizand
expresia "Cu ce viteza circulau mainile Tn momentul accidentului?". Ar fi bine ca
aceste observatii grafice sa fie completate de analiza efectelor simple, 0 metoda
riguroasa, dar din nefericire absenta din meniul SPSS-ului, ea fiind disponibila doar
prin apelul la sintaxa.
4.2.1. Metoda efectelor simple
....
, Tehnica are un caracter ,post hoc i este menita sa surprinda Tn detaliu
diferentele dintre Ea se deosebete' de metodele
post hoc obinuite, fiind mult 1991; Pedhazur i Schmelkin,
1991). Spre exemplu, prin metoda .:[ukeyse observa daca exista diferente fntre
situatiile experimentale determinate de modul de formulare a Tntrebarilor, ig'norand
aspectul experientei Tn conducerea automobilului. De exemplu, yom putea
com para daca exista diferente semnificative Tntre persoanele fntrebate "cu ce
viteza s-au zdrobit mainile", respectiv persoanele aflate Tn grupa Tn care
Tntrebarea a fost "cu ce viteza lovit mainile". .
Tn schimb, prin metoda e!!:l.c.telor ... simple, yom face un pas Tn plus,
posibile $"asEl .. ale
problemeldate.,De exemplu, yom putea stabili daca exista diferente semnificative
Tntre oferii care au fost Tntrebati cu ce viteza circula Tn momentul
'ac'cidentului i non-oferii care au fost fntrebati cu ce viteza s-au zdrobit mainile.
Procedura de a obtine' efectele simple Tn SPSS este extremde complicata,
presupunand utilizarea sintaxelor. De aceea, vorrlj);:ezenta pe scur! formulele
Cei interesati pot consulta un material c-;;m-pie(pe
slte-ul de statistica sociala (Sava, 2002).
Pentru a afla efectul simplu Tn cadrul acestei trepte yom parcurge trei pai:
111
1. yom calcula suma patr;:>telor aferenta acestui efect simplu; .
2. pe baza sumei patratelOL gradele de yom obtlne
mediapatratica, iar din aceasta ..... .
3. pe baza iUi.i= .. .vom$tabili daca treapta respectiva contnbUie sem.nlflcatlv la
interactiunea dintre cei doi factori.
Vom presupline ca au fost obtinute urmatoarele rezultate In situatia
experimentala "cu ce viteza s-au zdrobit
Tabelul 4 5 Rezultatele obtinute de oferi i non-oferi Tn situatia experimental a "zdrobit"
..
Factorul 1 $oferi (81)
Non-oferi (82)
TOTAL oferi i non-oferi
/
"mod de
formulare C!
Tntrebarilor"
X
X2 X
X2
51 2601 63 3969
L treapta 1 = 189 + 258 = 447
treapta 1 - 45 2025 57 3249
L (treapta 1)2 = 7623 + 13644
"zdrobit" 39 1521 51 2601
30 900 48 2304
= 21267
24 576 39 1521 0
Suma (L) 189 7623 258 13644
Viteza medie 37,8
51,6
44,7
Formula de calcul a sumei patratelor pentru fiecare treapta este:
_ (2: ell X Y ((2: cui X Y ) (2: totl X Y (4.5)
SSr- + ... + .
. nell nenl n lOI!
unde: SSI este suma patratelor unei trepte;
ncil este numarul de subiecti din prima celula a unei trepte;
ncnl este numarul de subiecti din ultima celula a unei trepte;
ntotl este numaflll de subiecti ai unei trepte indiferent de celula;
l:cilX este suma lui X din prima celula a unei trepte;
l:cnlX este suma lui X din ultima celula a unei trepte;
l:totlX este suma tuturor X din treapta respectiva.
in problema de fata avem doar doua celule tr:ptei
reprezentate de grupul de subiecti respectiv grupul de sublect
l

Astfel, yom obtine:
f 11-:l
1I'lIIlIIillll III ,I
l
..i .... " . ' . ' .............. :: .. " ..
,"c":'
,;0", ,
'j
I
I
I
Pasul al doilea consta In obtinerea, lui F - efect simplu - pentru treapta
"zdrobit" a variabilei "mod de formulare a intrebarilor". Acesta se obiine simplu, pe
baza formulei:
MS., . I
F = eJeel_Slmp" (4.6)
MSillt meelllia
Daca media patratica intracelula exista Tn tabelul sumar ANOVA,
media patratica a efectului simplu. Aceasta este egala cu raportul dintre suma
patratelor efectului respectiv 9i gradul de libertate al celeilalte variabile cu care
interactioneaza variabila in cauza. in cazul de fata, media patratica calculata a
acestui efect simplu este egala cu sum a patratelor calculate, adica 476,1,
deoarece gradul de libertate a variabilei "experienta in este unu. Inlocuind Tn
formula de mai sus, yom obtine un F - efect simplu - pentru treapta "zdrobit" a
variabilei "modul de formulare a Tntrebarii" de 10,17 (476,1:46,8). La fel se
procedeaza Tn cazul celorlalte trepte ale variabilelor incluse Tn studiu.
Reamintim datele din tabelul sumar ANOVA pentru a clarifica toate valorile
introduse Tn calculele de mai sus:
Tabelul 4.6. Tabelul sumar ANOVA pentru exemplul dal
Sursa dispersiei SS df MS F p
Formularea Tntrebarilor (A) 1139,4 2 569,7 12,17 <.01
ofat (8) 97,2 1 97,2 2,07 >.05
466,2 2 233,1 4,98 <.05
Intracelula (Reziduala) 1123,2 24 46,8
Totala 2826 29
in urma calcularii celor cinci efecte simple, corespondente fiecarei trepte a
variabilelor independente, dupa modelul explicat anterior, yom obtine un tabel
sumar ANOVA nuantat.
Tabelul 4.7. Tabelul ANOVA extins, incluzand valorile F pentru efectele simple
Sursa dispersiei SS df MS F
12
Formularea Tntrebarii (A) 1139,4 2 569,7 12,17 <.01
81 - oferi 154,8 2 77,4 1,65
82 - non-oferi 1450,8 2 725,4 15,50 <.01
Experienta in conducerea mainii (8) 97,2 97,2 1,24
Ai - cu ce viteza s-au zdrobil 476,1 476,1 10,17 <.01
A2 - cu ce viteza s-au lovil 72,9 72,9 1,55
A3 - cu ce viteza circulau 14,4 14,4 0,30
Interactiune 466,2 2 233,1 4,98 <.05
Intracelula 1123,2 24 46,8
Totala 2826,0 29
113
11111111'1111'111'111"11111111"111,111:111111"111 I I!I 11'111 III' 111'!III"II'I!"!!il,'I! iii ,II 11,'1 '!, UIIIIU 1 ',,, l'i":'IIII:IIIII,llll'lllli:IIII:11111 Ili:II"111 III II "'1' 1,'I':I'il "llillll'III'1111111
Dupa ce am aflat valorite lui F - efecLsimplu (vezi tabelul 4.7.) - pentru
fiecare din cele cinci trepte, urmeaza ultimul pas de a stabifi daca valorile obtinute
sunt semnificatLle. statistic. Trebuie sa retinem ca nu yom utiliza pragul de
semnificatie clasic de .05. Tn acest caz intervine 0 modificare a valqrii alfa pentru a
pastra constanta eroarea setului de comparatii. Astfel, Tn cazul variabilei cu trei
trepte "formularea Tntrebarii" yom ave a ca p = .Q1lI05 I 3), Tn timp ce pentru
variabila "experienta Tn conducerea yom ave a p =.025 (.05/2), deoarece
variabila are doua trepte:
Din cele cinci efecte simple, doua se dovedesc a fi semnificative statistic.
Este yorba de interaciiunea dintre formularea Tntrebarii (A-B2),
respectiv dintre experienta Tn conducere fOlosirea sintagmei "zdrobit" (B-A 1).
Interpretarea acestor efecte simple semnificative se face pe baza observarii
mediilor situatiilor respective a graficului de reprezentare a interactiunii dintre
factori. Pentru problema noastra se desprind doua concluzii complementare, de
nuantare:
(1) primul efect simplu semnificativ (A-B2) indica 0 difereniiere mai clara, Tn
aprecierea vitezei de deplasare a mainii Tn momentul accidentului, la persoanele
care nu posed a camet de conducere. Acest fapt se datoreaza probabil lipsei de
experienia Tn apreCierea vitezelor, determinand aceasta categorie de subiecti sa fie
mai influeniabila de sugestiile experimentatorului, prin modul de formulare a
in trebarilor. Acest aspect se poate observa >i Tn graficul de interactiune a factorilor,
rezultatele subieciilor fiind mai variabile decat cele ale
(2) al doilea efect simplu semnificativ (B-A 1) indica 0 diferenia Tntre
>i non->oferi Tn cazul primei situatii experimentale. Astfel, sintagma "zdrobit"
influenteaza Tntr-o mai mica masura decat Acetia din urma
estimeaza 0 viteza de deplasare a mult mai mare In cazul Tn care au fost
utilizate cuvinte sugestive pentru forta impactului ("zdrobit"). Tn schimb, sunt
mai putin afectati de acest aspect. Graficul interactiunii identifica aceasta situatie,
in care formularea "zdrobit" conduce la cea mai mare diferentiere Tntre oferi
in ceea ce privete estimarea vitezei de deplasare a Tn
momentul producerii accidentului.
4.2.2. Marimea efectelor In cazul ANOVA factoriala
Marimea efectului poate fi calculata Tn cadrul unui Prin
intermediul acestui indicator yom putea observa Tn ce masura difere.o,ij:lle
semnificative observate "auoariumira' importania practica. Modul de calcul este
similar celui prezentat in cazul ANOVA simpla., cu deosebirea ca. Freprezinta.
valoarea testului pentru un anumit factor iar F contrast este valoarea o6tinutain
.--....., . I ....
cadrul unei comparatiipost hoc sau a unui contrast Tn .cadrul factoriJlai respe-ctrir.ln
cazul Tn care un factor are doar doua trepte, F egal GU F alJactorului
respectiv (formula 4.2.). Tn cazul unei VI cu trei sau mai multe modalitaii se

114
'1111111,111,111'111111,111111::111111',111111',111111,1111111'111111,1111111'11,II'!I'III
:olose>te 4.3, unde df intergrup devine df asociat factorului respectiv, jar df
Intragrup devine df corespunzator gispersiei intracelula.
Astfel, utilizarea expresiei "vitezacU-care s-au zdrobit a avut un
impact puternic asupra estimarii vitezei. Efectul inregistrat a fost foarte mare
comparativ cu viteza estimata de persoanele care au fost invitate sa precizeze
viteza in mQmentul lovirii lor, r fiind 0,59, r2 fiind 0,35. Pentru a ajunge la
aceste valori am aplicat formulele 4.3 4.4, utilizand valoarea lui F sugestii din
tabelul 4.4 >i calculand t Tukey pentru comparatia dintre .grupele "zdrobit" "Iovit".
Cu 35% din dispersia vitezei estimate de catre subiectii investigati
este Influentata de modul de formulare a Tntrebarii, in cazul sintagmei "viteza cu
care s-au zdrobit mainile". Acest aspect poate ave a implicatii profunde Tn
veridicitatea depozitiilor martorilor in actul de justitie. Se observa ca modul de
formulare a Tntretarii poate induce raspunsuri cu un impact profund diferit Tn
evaluarea unor situatii Tn care lipsesc reperele de apreciere.
4.2.3. Conditii lJ..ecesare pentru aplicarELCl,AN"QYA simpla i
ANOVA factoriala .......... .

::;t (1) a fost populatie. Tn cazul In care acest
fapt este greu de realizat, se masura compensatorie
subiectilor Tn grupele
Variabila depeI1Qsmta ... canditie este gre\J d..e.
Indeplinit Tn }n,care grupele experimentale sunt constituite
numar (ex. n = 10).
}'(3) Fiecare persoana din_eantion este testata a .mgura. data, astfel incat
Cand acest aspect yom
utiliza, foarte probabil, ANOVAi.:c.u.ma,suratori repetate.
,"(4) lmpartiti pe grupe. experimentale sa fie egala. Testul
este special construit pentru a observa In ce este realizata
aceasta a dispersiei.
Tehnicile ANOVA destul de robuste la nerespectarea primelor doua
conditii. Cu alte cuvinte, indicele afectat foarte mult de primele
doua conditii (Hinkle, Wiersma i Jurs, 1994). In schimb7"neTndeplinirea conditiei
patru, absenta unei dispersiei dintre grupe, afecteaza
valarilelui F. fntr-o asemenea situatie sunt posioile doua masuri alternative'
(a) '-'renuntarea la aplicarea utilizarea unor tehnicl
corespondente (b) aplicarea tehnicilor paramE?1!i.ce ANOVA prin
apelul la 0 corectie agradelor de libertate de citire a lui F din tabelul distributiei
omonime. Tabelul paate fi consultat In aproape arice manual introductiv 'de
statistica.
Tn situatia din urma, valoarea lui F obtinuta va fi comparata cu valoarea
prezentata Tn tabelul lui F Rotru.J N-1 grade de /ibertate i nu cu valoarea sa
Gorespondenta de la k-1 N-k-1 .. de libertate, daca omogenitatea dispersiei
115
era indeplinita. Mentionam ca Neste. numarul total de subiecti din iar k
este numarul de grupe sau de celule experimentale din cercetarea respectiva.
4.3. ANOVA cu masuratori repetate
fn conditiile in care aceia!?i testati de mai multe<.ori-vomapela
la ANOYA cu masurat9ri,Jepetate. Daca ANOVA simpla era corespondentul
testulLJiJ pefltru,qouae!?antioane.indeRendente, intr-o anumita masura ANOVA cu
masuratori repetate este corespondentul testl!iyLt p,entru doua perechi.
Am utilizat sintagma "Intr-o anumita masura", deoarece am putea vorbrae'ANOVA
cu masuratori repetate, atat in cazul in care un singur fa.ctof este luat in
considerare,' cat in situatia in care mai multi factori sunt masurati repetat
(ANOVA factoriala cu mas,uratori repetate). Termenul de masurator'l repetate
implica evaluarea unui individ de doua .,sau mai multe ori privitor
variabila depender)ta.
Yom utiliza un exemplu de ANOVA cu masuratori repetate apeland la un
exemplu din psihologia sociala. Tajfel recunoa$te categorizarea sociala ca 0
componenta de baza a identitatii sociale. Acest proces cognitiv de strueturare a
stimulil()f din mediul inconjurator pentru a simplifica perceptia nu se rezuma doar la
mediul social. Yom adapta un studiu descri,s pe scurt de Lyons (1998) $i apartinand
lui Tajfel Wilkes. Autorii au demonstrat tendinta de accentuare a diferentelor in
eazul unei categorizari prealabile a stimulilor. Concret, subiectii au fost rugati sa
evalueze, in numar de cuvinte, lungimea unor replici dintr-o piesa de teatru. Din
cele' opt replici selectate, patru eraumai scurte, iar patru erau mai lungi. Vom
prezenta trei situatii experimentale, dintre care primele doua respecta studiul initial,
cea de a treia fiind introdusa de noi cu scopul de a utiliza ANOVA cu masuratori
repetate in dauna unui simplu test t dependent. Prima situatie experimentala
consta in faptul ca cele patru replici mai lungi erau etichetate cu litera A, iar
celelalte patru replici mai scurte erau identificate cu B. A daua situatie a studiului
initial, poate fi etichetata ca grup de control, deoarece cele opt rep,lic; nu erau
asociate eu nici 0 litera. Cea de-a treia situatie, introdusa de noi, consta in.
asocierea mixta a Iiterelor A $i B cu eele opt replici, astfel incat sa existe ,doua
replici mai lungi $i doua replici mai scurte asociate Iiterei A, iar restul replicilor
(doua repliei mai lungi doua replici mai scurte) fiind etichetate de litera B.
Conform efectului de accentuare activat prin etichetarea stimulilor, subiectii
au exagerat diferentele dintre replicile mai lungi cele mai scurte in cazul
etichetarii primelor cu litera A !?i a celorlalte cu litera B, comparativ cu lipsa
etichetarii acestora in grupa de control. Pornind de la aeeste premise, ne yom
ea etichetarea replicilor din a treia situatie experimentala sa' reduea
diferentele dintre repliclle mai lungi eele mai seurte, datorita identificarii mixte a
acestora cu litera A, respectiv B.
Pentru a fi un design cu masuratori repetate, merita sa pr,ecizam ca au fost
ubiecti-Tn cele treisituatii experimentale diferite. In plus, pentru a
ellmlna aspectele de invatare, au fost folosite trei forme paralele ale replicilor, care
aveau numar de cuvinte fiecare, iar' pentru a elimina posibilele efecte de
ordine sau oboseala, prezentarea replicilor a fast contrabalansata, astfel incat unii
subiecti au raspuns mai intai la prima situatie experimentala, altii la situatia de
control, iar altii la ultima situatie experimentala. "
Pe baza unor. date imaginare yom testa urmatoarea ipoteza generala.
Categorizarea stimulilor afecteaza modul de perceptie a acestora. Cele doua
ipoteze specifice sunt:
a) includerea in aceea$i categorie a stimulilor similari conduce la accentuarea
perceptiei deosebirilor dintre stimulii diferiti Tn comparatie cu absenta
categorizarii..lpoteza nula pentru aceasta situatie este 1J.1 '= ).12, adiea
exista diferente semnificative in aprecierea distantei dintre replicile mai
lungi i eele mai seurte In primele doua situatii'
b) includerea In categorie a stimulilor va conduce la reducerea
perceptiei deosebirilor dintre ei in eomparatie' cu absenta categorizarii.
Ipoteza nula este in acest caz Jl2 = 1J.3, adica nu exista diferente
semnificative Tntreaprecierea distantei dintre replicile mai lungi cele
scurte In situaiia ultimelor daua grupe.
Altfel spus, utilizarea etichete pentru stimuli similari conduce la
creterea asemanarilor pereepute dintre ei, in timp ce utilizarea etichete
pentru stimuli diferiti conduce la scaderea deosebirilor percepute dintre ei.
Exemplul prezentat poate fi exersat utilizand anova repetate.sav,
urmand calea "Analyze':"':._JneneraL Linear .. Model" .. - ,;Repeated Measures". In
fereastra deschisa va trebui asociat nurna.wl3Jermenwlui pentru a defini
cele trei situatii experimentale intalnite, prin aciionarea butanului "define". fn cazul
unei ANOVA factoriala cu masuratori repetate, Inainte de a actiona butonul
se apasa "adct .. peqtru a permite definirea numarului de repetari in cazul
celui de-al doilea factor.
ANOVA cu masuratori repetate poate fi realizata atat prin testa rea lui F
ge.O.er.al,urmata de comp.araiii PQst hoc, cat prin testarea
aphcarea unor . .!n eazul de fata ipotezele impun cea de-a doua abordare,
datorita specificitatii existente In formularea lor. in scop didactic vor fi
analizate rezultatele obtinute prin metodeJe post hoc. '
Modul de prezentare a tabelului sumar pentru ANOVA cu masuratori
repetate din SPSS este putin diferit de modul de prezentare al tabelului sumar din
celelalte cazuri. EI este eonstituit doar din doua surse ale dispersiei: cea
determi.nata. de (In cazul nostru, tipul de experimentala),
respectlv dlspersl!. __ erorii, De fapt, aceste sursesunt cele mai
Importante pentru ca:lcularea lui F. .
aceasta modalitate de prezentare a rezultatelor nu tine seama de
specificul tehnicii ANOVA cu masuratori repetate. Spre de ANOVA .
117
simpla, ce considera diferen\ele ca parte a
(neexplicate), Tn ANOVA cu masuratori repetate putem -distinge trei surse ale
dispersiei:dispersiae)(plicataJ datorata treptelor variabilei dispersia
subiectilor (datorata diferenteior _dintre indivizi) dis persia neexplicata, reziduala
sau dispersia erorii. Daca va reamintiti, F nu era altceva decat raportul dintre.
dispersia explicata' cea Din acest punct de vedere, datorita reducerii
dispersiei neexplicate, prin ellminarea dispersiei datorate diferen\elor individuale, F
are mai mari sa fie semnificativ statistic. Astfel, un design cu masuratori
repetate are 0 putere statistica mai mare de a detecta situa\ii1e Tn care variabilele
independente influenteaza 0 anumita variabila dependenta.
Tests 01 Within-Subjects Effects
Measure: M EASURE 1
Source
SITUATIE
Error(SITUATIE)
Type 111 Sum
of Souares df Mean F
Sphericity Assumed 84,500 2 42,250 37,430
Greenhouse-Geisser 84,500 1,784 47,367 37,430
HuynhFeldt 84,500 2,000 42,250 37,430
Lower-bound 84,500 1,000 84,500 37,430
Sphericity Assumed 24,833 22 1,129
Greenhouse-Geisser 24,833 19,623 1,266
HuynhFeldt 24,833 22,000 1,129
Lower-bound 24,833 11,000 2,258
Figura 4.13. Output SPSS 11.0 cu tabelul sumar ANOVA
in cazul unui design cu masuratori repetate
SPSS este 0 mardi Tnregistrata.
Sio.
,000
,000
,000
,000
Pentru a identifica Tn SPSS dispersia datorata totalul
sumei J2!3tratelqr, putem sa tratam un design cu masuratori repetate ca un design
normal, introducand un factor aleatoriu denumit "subiecti", pentru a identifica
scorurile apar1;inand persoane. Tabelul sumar din SPSS devine:
118
Tests of Between-Subjects Effects
Dependent Variable: diferenta replici Iun i - scurte
Type 111 Sum
Source of Souares df Mean Square F Sio.
Intercept Hypothesis 10302,250 1 10302,250 719,903 ,000
Error 157,417 11 14,311"
SITUATIE Hypothesis 84,500 2 42,250 37,430 ,000
Error 24,833 22 1,129
b
SUBJECT Hypothesis 157,417 11 14,311 12,678 ,000
Error 24,833 22 1,129
b
SITUATIE SUBJECT Hypothesis 24,83:J. 22 1,129
Error ,000 0
c
a. MS(SUBJECT)
b. MS(GRUPA' SUBJECT)
c. MS(Error)
Figura 4.14. Output SPSS 11.0 eu tabelul sumar ANOVA factorial,
in cazu/ tratarii subieetiJor ea (aetori aleatori
SPSS esteo marca Tnregistrata.
',I ,,\ ,i',' i,",I'
lilll'li:II'iII,'llilll'!IIIIII:il:I': 'I iiil ii:I'1
Se observa, din figurilor 4.13. 4.14., ca dis persia erorii In
cazul masuratorilbr repetate s-a redus la 24,833. Daca nu am fi eliminat din cadrul
ei sursa dispersiei datorate diferentelor dintre indivizi, am fi obtinut 0 valoarea mai
mare: 182,250 (157,417- + 24,833). Valoarea ar fi obtinuta daca am face
abstractie de rezultatele care provin de la subiecti (vezi figura 4.15.).
ANOVA
Dilerenta repJici lungi - scurte
Sum of
Squares df Mean Square F
Sig.
Between Groups
84,500 2 42,250 7,650
Within Groups
182,250 33 5,523
Total
266,750 35
Figura 4.15. Output SPSS 11.0 qu tabe/ul sumar ANOVA simp/a
penfru problema categorizarii
SPSS este omarca Tnregistrata.
,002
Trecand peste aceste aspecte tehnice, se observa ca testul F in urma
aplicarii ANOVA cu masuratori repetate (figura 4.13.) a fost semnificativ statistic
[F(2, 22) = 37.43, P < .01]. Acest rezultat indica respingerea ipotezei nule conform
careia diferen\ele existente dintre mediile celor trei grupe s-ar datora hazarduluL Tn
consecinta, etichetarea unor stimuli are un efect semnificativ asupra modului de
percept
ie
a gradului de asemanare sau deosebire dintre
Tn consecinta, pentru a testa cele doua ipoteze specifice enuntate Vom
apela la confraste. Tn cazul ANOVA ANOVA.c:u masuratori
SPSS-ul ofera prin meniu doar alege intreco'ntraste
standardizate. Din tabelul 4.2., putem observa ca cea mai potrivita alegere pentru
testarea celor doua ipoteze este contrastuL.r:.epeiaL("repeated"). Acesta testeaza,
pe rand, dintre grupele 1 2, respectiv dintre grupele 2 3. Primul
contrast va testa prima ipoteza, iar eel de-al doilea, pe cea de a doua. Rezultatele
in SPSS sunt prezentate astfel:
Descriptive Statistics
Mean Std. Deviation N
efecl de accentuare
18,75
2,491 12
grup de control
17,00 2,174 12
efect de reducere
15,00
2,374 12
Figura 4.16. Output SPSS 11.0 cu valorile descriptive penfru cele trei grupe oferite de SPSS
SPSS este 0 marca Tnregistrata.
119
I '1111' 11111 11111' !IIII IIII 'III 'ii'
Tests of Within-Subjects Contrasts
M easure; MEASURE 1
Type III Sum
Sig.
Source SITUATIE of Squares df
Mean Square F
24,877 ,000
SITUATIE Level 1 vs. Level 2 36,750 1 36,750
Lever 2 VS. Level 3 48,000 1 48,000 17,600 ,001
Error(SITUATIE) Level 1 vs. Level 2 16,250 11 1,477
Level 2 VS. Level 3 30,000 11 2,727
Figura 4.17. Output SPSS 11.0 cu testu/ contrastelor standardizate "Repeated"
SPSS este 0 marca inregistrata.
Tn cazul primei ipoteze se obiine un F (1, 11) = 24,87, P < .01. Astfel,
aplicarea unor categorii identice pentru stimuli similari conduce la accentuarea
distani
ei
percepute fata de stimulii diferiii. Media distan\ei dintre stimuli In cazul
aplicarii etichetei a fost 18,75, Tn timp ce media distan\ei dintre stimuli In grupul de
control a fost 17,00. Similar, Tn cel de-al doilea contrast, F (1, 11) ::: 17,60, p < .01.
Acest rezultat arata ca aplicarea unor categorii identice pentru stimuli diferiii
conduce la reducerea distantei percepute dintre stimulii diferi\i (media pentru
grupul de control a fost 17,00, iar cea pentru ultimul grup experimental a fost
15,00). Se constata ca pragul scazut de semnificatie a celor doua contraste (.000,
respectiv .001) elimina problema unei valori inflaiioniste a lui p, peste valoarea de
.05, datorata faptului ca acest contrast "repetat" nu este ortogonal. Tn aceste
conditii, ambele ipoteze de lucru au ramas In picioare, sprijinind premisa generala
a cercetarii de fa\a, conform careia gruparea pe categorii a stimulilor afecteaza
modul de percep\ie a acestora.
9i1n cazul ANOVA cu masuratori repetate.
Pairwise Comparisons
M MEASURE 1 easure; 0
Mean
Difference
(I) SITUATIE (J) SITUATIE II-J} Std. Error
1 2 1,750' ,351
3 3,750' ,463
2 1 -1,750' ,361
3 2,000' ,477
3 1 -3,750' ,463
2 -2,000' ,477
Based on estimated marginal means
'. The mean difference is significant at the ,05 level.
a. Adjustment for multiple comparisons; Bonferroni.
Sioa
,001
,000
,001
,004
,000
,004
95% Confidence Interval for
Difference
a
Lower Bound UDDer Bound
,761 2,739
2,445 5,055
-2,739 -,761
,656 3,344
-5,055 -2,445
' -3,344 -,656
Figura 4.18. Output SPSS 11.0 cu rezultatele comparatiilor post hoc
SPSS este 0 mardi inregistrata.
120
TotU9i, criteriul de. selectie a aeestor proceduri se schimba semnificativ, deoareee
specifieul design-ului cu masuratori repetate nefndeplinirea frecventa a conditiei
de sfericitate afecteaza nivelul erorii de tip I. Oetaliidespremodul de a
procedurilor post hoc sunt furnizate In Field (2000), Kinnear 9i. Gray (2000) 9i
Weinfurt (2000). Concluzia principala este ca cea mai buna op\iune de a testa
diferentele dintre grupe este pentru orice situa\ie existenta. In
exemplul dat, rezultatele confirma diferente1e obtinute prin contraste.
Marimea efectelorin ANOVA cu masuratori repetate
in ceea ce prive9te caleularea marimii efectului, aceasta se realizeaza fntr-
.. ;"=';'':'"'''-;;-''-''''I''f
un mod similar cu eel prezentat In cazul ANOVA simpla ANOVA factoriala. Spre
exemplu, vorn calcula marimea efectului eorespunzatoare aprecierii distantei dintre
stimuli in situatia etichetarii comune a stimulilor similari 7n comparaiie cu
etichetarea comuna a stimulilor diferi\i, deci cazul grupelor 1 !?i 3. Luand 7n
considerare c F contrast este 65,59 {3,75/0,463)2, iar F (2, 22) este 37,43, vom
ob\ine, pe baza formulei 4.3, un r de 0,82 in consecin\a, un J!...este,Q,6(,.
indicatori arata un efect extrem de puternic prod us de tipul de etichetare a
stimuli lor Tn aprecierea distantelor dintre ei. Rezultatul are a importanta deosebita
Tn ameliorarea unor situatii practice. Astfel, ar trebui descurajata etichetarea diferita
a romilor de populatia majoritara, pentru a evita accentuarea diferentelor percepute
dintre cele doua categorii. Similar, utilizarea acelora9i etichete In descrierea sau
numirea persoanelor apariinand celor doua etnii, poate determina 0 reducere
importanta a diferentelor percepute Tntre cele doua popula\ii.
4.3.2
t
. Conditii aplicarea
, .,
Primele doua conditii din tehnicile ANOVA_simplasauANOVAfactoriala se
pastreaza, de9i nelndeplinirea lor nu afecteaza foarte mult rezultatele obtinute.
Tn schimb, nu este suficienta Indeplinirea conditiei ,. a
_ dispersiilor diq,tre grupe pentru a aplica ANOVA cu.masuratori repetate. Conditia
necesara este denumita condiiia de sfericitate. ACi"asta impliea
similare TntreJiecare pereche de, conditii experimentale ea fiind a conditie mai
complexe. Aceasta' dlnurma este daca
este egala in to ate' si.tuati!le' experimentale (omogenitatea dispersiei)
dintre fiecare experimentala adica
exista 0 dependenta Tntre toate conditiile experlmentale. Tn practica se
observaca este foarte dificil de Indeplinit dubla design"urilor
ANOVA cu masuratori repetate cu mai mult de grupe Tncalcand aceasta
conditie. Sa presupunem un design cu patf}lJnasuratorirElpetate. A respecta
conditia de simetrie complexa Tnseamna ca toate cele patn'; grupe au dispersii
121
i'" 'III,', i,' 'I, 'ii' i, ',' 'i, ,',', !, I iILIIIUII', 'I I, I', II ",' ',' ',',', "I, ':1, ",' ""Jl.I, 111,li','li __ '_11I11111111111
--
, I III Illlllli I
relativccegale ea exista eoefieienii de eo[eJI'l,iie relativ egaJi Tntre grupele 1 2, 1
3; 1 4; 2 3; 4; 3 4. Uneori, aceste condiiii sunt Pl'll\ial Tndeplinite. De
exemplu, exista 0 corelatie relativ egala Tntre rezultatele din grupele 1 2, respec-
tiv 1 3, dar nu Tntre 2 3 etc. Aceasta situaiie este numita sfericitate locala.
Din punct de vedere statistic, sfericitatea valprileluiF, crescand
de a comite adica de a respinge ipoteza nula cand nu
exista un efect real. Cum ne dam seama daca conditia de sfericitate este
Tndeplinita? SPSS-ul ealculeaza testul W al lui Mauchly. Daca rezultatul acestuia
este semnifi9.tiv statistic, conditia de Tncalcata. Daca rezultatul nu
este semnificativ statistic (adica 'p este mai mare de considera ca este
respectata conditia. acest test este foarte sen sibil la numarul de subieeti
la forma distributiei datelor, de aceea este necesara foarte multa precautie Tn
interpretarea sa (O'Brien Kaiser, 1985).
In primul caz, Tn care conditia de sfericitate f:IIJ?ste Tndeplinita, va trebui sa
adoptam una dintre cele doua utilizarea tehnigli_Nl.6i'JQYtdanaliza
dispersionala multivaril'lta), sau ajustarea valorilorJ.l.Jit ... masuratori
repetate. Prima nu face obiectul analizei de fata, Tn schimb ne \10m opri sa detaliem
cea'dea doua posibilitate. '
Pentru a Tntelege aceste corectii vom porni de la prem'isa ca Tndeplinirea in
totalitate a sfericitatii poate fi notata epsilon egal cu L_pe asemenea, cea mai
grava violare a acestei conditii este egala cu 1} In cazul a trei grupe
experimentale (k = 3), valoarea minima a lui epsiloneste obicei, un
epsilon Tntre ridica nici un fel de probleme. Cu cat valoarea lui epsilon
este mai mica, cu- sunt probleme mai mari legate"de neTndeplinirea conditiei de
sfericitate. Ajustarea lui F se face folosind fie corectia Greenhouse-Geisser. fie cea
conceputa de Huynh Feldt. Prima modalitate (subestimeaza
valoarea lui_epsilon), iar cea de-a doua, Iiberala valoarea lui
epsilon). au diferite de a alege una dintre eele doua modalitat
i
de ajustare a lui F. Everitt (1995) considera ca ar trebui realizata 0 medie In!re.cele
Girden (apud Field, 2000) recomanda utilizarea corectiei J;-luynh-
F.ldt, daca epsilon este cuprins intre .75 .90, respectiv a corectiei Greenhouse-
Geisser pentru valori epsilon mai mici. .='.,
Mauchly's Test of Sphericity
Measure' MEASURE 1
Epsilon"
Within Subiects Effec Mauchly's W
Approx.
Chi-Sauare 'df Sia.
Greenhous I I
e-Geisser Huvnh-Feldt Lower-bound
SITUATIE
,879 1,291 2 ,524 ,892 I 1,000 ,500
..
a. May be used to adjust the degrees of freedom for the averaged tests of sigmflcance. Correctecl tests are displayed
Tests of Within-Subjects Effects table.
Figura 4.19. Output SPSS 11. a cu rezu/tafele referifoare la situatia sfericitatii obtinute
SPSS este 0 marca inregistrata.
122
Rezultatele din figura 4.19. indica un caz fericit, dar, din pacate rar, de
Tndeplinire a conditiei de sfericitate. Valoarea lui epsilon este cuprinsa undeva in
intervalul .89 1.00, adica are 0 valoare mai mare de .90. Acest indiciu este rnsotit
de un test Mauchly nesemnificativ statistic. In consecinta, conditia de sfericitate 'a
fost indeplinita, nefiind necesare nici un fel de ajustari suplimentare in interpretarea
lui F.
Vom folosi situatie de cercetare pe 0 alta baza de date imaginare
pentru a demonstra modul de iucru Tn cazul Tn care conditia de sfericitate nu este
Tndeplinita.
Descriptive Statistics
Mean Std. Deviation N
elect de accentuare 18,75 2,491 12
grup de control 18,50 2,236 12
elect de reducere 15,83 4,282 1?

....
Mauchly's Test of Sphericity
Measure' MEASURE 1
Eosilon
a
Approx.
Within Subiects Effect Mauchly's W Chi-Square df SiQ.
Greenhous I I
e-Geisser Huvnh-Feldt Lower-bound
SITUATIE ,341 10,764 2 ,005 ,603 I ,636 I ,500
a. May be used to adjust the degrees of freedom for the averaged tests of significance. Corrected tests are displayed in the
Tests of Within-Subjects Effects table.
Tests of Within-Subjects Effects
Measure' MEASURE -1
Type III Sum Partial Eta
Source of Squares df Mean Square F Si9 Squared
SITUATIE Sphericity Assumed 62,722 2 31,361 5,478 ,012 ,332
Greenhous8-Geisser 62,722 1,205 52,033 5,478 ,030 ,332
Huynh-Feldt 62,722 1,273 49,285 5,478 ,028 ,332
-
Lower-bound 62,722 1,000 62,722 5,478 ,039 ,332
Error(SITUATIE) Sphericity Assumed 125,944 22 5,725
Greenhouse-Geisser 125,944 13,260 9,498
Huynh-Feldt 125,944 13,999 8,997
Lower-bound 125,944 11,000 11,449
Figura 4.20. Va/orile descriptive, testarea conditiei de sfencitatei tabelul sumar ANOVA cu
masuratori repetate pentru aceeai problema, utilizand 0 alta baza de date
SPSS este 0 marca inregistrata.
In aceasta situatie se observa ca atat testul Mauchly, cat valoarea lui
epsilon indica 0 incalcare a conditiei de sfericitate. Acest aspect poate fi observat
empiriC prin faptul ca abaterea standard a persoanelor aflate in a treia situatie
experimentala este apreape dubla fata de abaterea standard a celorlalte doua
grupe. Or abaterea standard nu este altceva decat radacina patrata a dispersiei.
123

Din al doilea tabel prezentat 5n figura 4.20. observam ca valoarea lui
lpsilon este undeva Intre .60.3 9i .636, astfel Incat sfericitatea este gray Incalcata,
je aceea yom alege corectia Greenhouse-Geisser a lui F. Ca urmare, Tn cel de-a!
:reilea tabel al figurii 4.20., nu yom citi prima valoare, adecvata respectarii conditiei
je sfericitate [F(2, 22) = 5,47 la un p de .012], ci yom utiliza valQarea .Iui F din
:::!reptul corectiei Greenhose-Geisser (F(1.20, 13.26) = 5,47, !a un p de .031. Tn
aceasta situa\ie ambe!e valori F au fost semnificative statistic, Tnsa se observa ca
dupa aplicarea corectiei pragullui F a crescut. Acest lucru poate fi important Tn alte
situaiii In care valorile corectate ale lui F nu sunt semnificative statistic, Tn limp ce
valorile originale ale lui F au fost semnificative, schimband astfel interpretarea
rezultatelor.
Un ultim aspect tehnic, ce merita a fi mentionat pe scurt Tn cadrul analizei
dispersionale, tine de modul de calculare a sumei patratelor (SS). Daca toatE!
rezultatele sunt complete, yom pastra tipul III de calcul, acesta fiind op\iunea
standard In SPSS. Daca yom avea date lipsa, caz Intalnit mai ales In situatia
masuratorilor repetate, vom utiliza tipul IV de calculare a sumei patratelor.
4.4. Alte modalitati ANOVA
,
Cele trei modalitati prezentate mai sus reprezinta cele mai frecvente situa\ii
care necesita analiza dispersionala. Totu9i, Tn tabelul 4.8. sunt prezentate alte
cateva tehnici AN OVA. Criteriul de diferen\iere a lor este dat de independen\a
evaluarilor (grupele formate din aceia9i subiecti sau din subiecti diferi\i) i de
numarul de varia bile independente (unul sau mai multi factori).
TabeluI4.8. Tipuri de ANOVA In funqie de des;gnul cercetarii
Subiecti diferiti Aceiai subiecti
1 variabila ANOVA simpla ANOVA cu masuratori
independenta (AN OVA unifactoriala) repetate
2 sau mai multe ANOVA factorialll ANOVA factoriaill cu
variabife independente masuratori repetate
Design mix!
(unul sau mai multi factor; variali In grupe de subiecti diferiti
I
unul sau mai multi factori masurati pe aceia:;;i subiecti)
Un design mixt este oferit de Weinfurt (2000). Un cercetator sa
observe eficienta terapiei cognitiv-comportamentale in reducerea simptomelor
depresive la pacieniii suferinzi depresie severa. Dupa 0 eval\!..[e,.initiala cu
"Inventarul de Depresie Beck", subiectii au fost Impartiti aleatoriu in doua grupe: de
Cei din grupa experimentala au urmat 0 terapie cognitiv-
comportamentala pe 0 perioada de trei luni. Inventarul Beck a mai fost admiriistrat
124
tuturor la trei luni, la ase funi i la douasprezece luni de la prima
evaluare. Intrebarea care s,e pune este daca pacientii care au urmat terapia
cognitiv-comportamentala i-au rediJs semnificativ simptomele de depresie pe
parcursul acestei perioade de timp.
4.5. Exemplu de ANOVA factoriala:
cazul euristicii de,.ac;:c;:esipjJitate
In luarea deciziilor sunt utilizate 0 serie de strategii cognitive dEinumite
euristici. Intre acestea este yorba !?i de euristica de accesibilitate care consta Tn
.. .." """
tendlnia oamenilor de a acordsa.."gpr9babllitSlte mai ridicat,:( alternativei sau
__ amintit. Imaginaii-va sunteti rugatsa oferi\i
cincisprezece exemple in care v-ati purtat agresiv. Probabil ca Yeti oferi rapid
exemple dupa care va va fi din ce Tn ce mai greusa va amintiti celelalte
situatiipana la cincisprezece. Datorita acestui fapt, probabil, nu va yeti ca 0
persoana foarte agresiva. lmaginati-va ca sunteti rugat saoferiti exemple in
care v-ati comportat agresiv. Le veii oferi rapid yeti concluziona, probabiJ, ca
sunteti 0 persoana foarte agresiva. in aceste condi\ii se Intampla un paradox,
persoanele din prima situatie se vor. autoevalua ca fiind mai putin agresive decat
persoanele din al doilea grup, dei primele au oferit de trei ori mai multe exemple
de agresivitate. Acest lucru se produce datorita experimentarii dificultatii de a
rememora toate exemplele tip din prima situa\ie in comparatie cu u:;;urinta
lor Tn a doua situa\ie, In care trebuia prezentate doar cinci exemple. Tn aceste
conditii, yom concepe un experiment similar cu cel realizat de Schwartz (apud
Kunda, 1999), dar u!?or modificat prin introducerea unei trepte suplimentare.
Unii subiecti inclu9i in experiment au fost rugati sa of ere cinci exemple de situatii In
care s-au comportat asertiv. Alii subieC\i au fost rugati sa of ere zece exemple, iar 0 a treia
grupa de participanti la studiu a fost rugata sa of ere cincisprezece exemple de situatii In
care s-au manifestat asertiv. Prin urmare, prima var:iabila independenla de
cercetator este numarul de exemple aminti!e, cu trei trepte de lucru: cinci, zece, respectiv
cincisprezece situatii de comportament asertiv. ,
Aile trei grupe de participanli au fost formate schimbi'md obiectul reamintirii. Astfel,
subieciii din a patra grupa au fost rugaii sa-9i aminteasca cinci exemple de situaiii in care s-
au comportat non-asertiv, cei din grupa cinci au fost solicitati sa-9i aminteasca zece
asemenea situ alii, In timp ce persoaneior din grupa Ii s-a cerut sa prezinte
cincisprezece situaiii Tn care s-au comportal non-asertiv. A
9
adar, cea de-a doua variabila
independenta a constat in obiectul evaluarilor siluaiiilor stimul, ea avand doua trepte: asertiv
9
i
non-asertiv. Avem de a face in acest caz cu un design factorial de tip 3 x 2, cu 9ase celule
experimentale, fiecare fiind alcatuita din subiecti diferi!i. Variabifa dependenta a constat intr-
o singura Intrebare de autoevaluare a gradului de asertivitate a subiectului. Intrebarea este
pusa pe 0 scala Likert cu zece puncte, situate de la 1 (deloc asertiv) la 10 (foarte asertiv).
125
!11'11!'!llill'IIIIII'
. -' - f ma ipoteza conform careia:
Ramane de analizat Tn ce masura se con Ir... . " . _ _
I Tntampina dificultati. Tn re;amintirea sltuat"
lor
cerute
persoane. e care. _ t de a aGelei trasaturi datorita
au un nlvel mal scazu .. ,
scazute a unor exemple (euristica de acceslbilitate). _. '.
Orice necesita parcurgerea. urmatonlor . .
./ selectarea modalitaiii.,.,9gLanaliza ulterioara testulUl F: metode a _prior) sau
comparaiii..p.osthoc; .
./ testarea condiiiilor tipuluLd,8 ANOVAefectuata,
./ interpretarea . sectiunea de analiza
Minimum de inforniatii care trebUie trecute 10, _-".'
cantitativa a datelor atinge urmatoarele puncte: . ' .. (ANOVA factoriala
.' '-'''.. f t'pulu'l do "'nallza mtrepnnsa '
./ preclzarea mtr-un paragra a I '""""'.= .. , . ""., ...... , .. : '_. . d ,.
ANOVA simpla etc.) a justificarii pentru mc1uzan aici 0
discutie scurta asupra cQI1.dItiilo,r; .' t b I cu mediile
eze'ntarea unui tabel sumaLANOVA, cat 9
1
a unUi a e .-"""d'
./ pr .' delul de mai jos msplrat In
dispersiile...fiecareicelule.expenmentale -.vezl mo
Nicol i Pexman (1999); . ' , t
./ Tn cazul unui numar mare de t(:;.ste F se poate. la prezen area
tabelului sumar ANOVA, valorile F obtinute tE?xt,. .
./ re tarea grafica dupa caz, fie a relaiiilor dll]Jre.facton . unel
fie a efectelor principale care de'
./ rezultatelor de la testele post a contrast"eLor, m unc,le
caz'
./ inte'rpretarea sumaraa rf;f:.ultatelor gasite. . _ fi formulata in
Pentru exemplul dat, sec\iunea de analiza a datelor po ate
modul urmator:
Media !]i abaterea standard a asertivitaiii auto-percepute in funct
ie
de stimulul dat !]i numarul
de exemple cerute
Dovezi de non-asertivitate
Dovezi de asertivita!e
M
AS
M
AS
Numar exemple
Cinci
6,40
0,96
4,30
0,94
5,30
0,94
5,20
0,78
Zece
4,50
1,17
6,00
1,05
Cincisprezece
Tabelul sumar ANOVA
88
df
MS F
8ursa dispersiei
0,13
2
0,065
0,06
8timulul da!
Numar exemple
0,81
1
0,810
0,83
Stimul dat X Numar exemple
32,53
2
16,265
16,66 **
Reziduala
52,70.
54
0,976
Total
86,18
59
** P < .01
126
7 ... : . 1"
"\
\
I
\
Pentru a testa Tn ce masura dificultatile de reamintire a unor situatii
definitorii pentru comportamentul asertiv gradul de auto-percepere 'a
unei persoane ca fiind asertiva, vom apela la calcularea lui F din ANOVA factorial,
Am ales aceasta tehnica datorita design-ului factorial de tip 3 x 2, cu tipul de stimul
(asertiv vs. non-asertiv) numarul de exemple cerute (5, 1 a 15) ca variabile
independente. Toate conditiile specifice aplicarii probei au fost fndeplinite, inc/usiv
omogenitatea dispersiei, unde testul Levene a fost F (5, 54) = 0,23, p> .10.
Valorile descriptive pentru fiecare situatie experimentala sunt prezentate Tn
primul tabel, iar rezultatele obtinute in urma aplic<3rii testului ANOVA 3 x 2 sunt
trecute Tn bel de-al doilea.
Din tabelul sumar ANOVA se observa ca nici unul dintre efectele principale
nu au fost semnificativ statistic. Tn aeeste conditii, orice comparatie post hoc sau
orice contrast a priori mai gasesc rostul. Tn schimb, efectul determinat de
interaciiunea dintre cei doi factori a fost semnificativ statistic, F (2, 54) = 16,66, p <
.01, indicand 0 interdependenta putemica intre acei?tia Situaiia speclala poate fi
observata eficient Tn figura de mai jos .
Din analiza ei putem observa ca ipoteza de lucru este sustinuta. Astfel,
persoanele care trebuiau sa-i?i aminteasca cinci exemple In care s-au comportat
asertiv s-au perceput pe sine ca fiind mai asertive decat persoanele care trebuiau
sa-i?i aminteasca cincisprezece situatii de acest gen.Mai mult, persoanele care
trebuiau aminteasca cinci exemple In care s-au comportat non-asertiv au
urmat un proces similar, dar invers. Ele au obtinut un scar mai mic la asertivitate in
situatia Tn care trebuiau aminteasca clnci stimuli, Tn comparatie cu situatia Tn
care trebuiau aminteasca clncisprezece asemenea situaiii, deoarece au
intampinat mai multe dificultati in amintirea situatiilor in care s-au comportat non-
asertiv. Tn schimb, nu par a fi direrente majore Tntre cele doua situatii-stimul In
cazul de mijloc, de ream intire a zece situatii stimuL Aceste date sunt sprijinite de
faptul ca patru din cele cinci efecte simple sunt semnificative statistic, singurul efect
care n-a indeplinit acest criteriu fiind tocmai situatia referitoare la amintirea a zece
stimuli asertivi sau non-asertivi.
7,0.,--------,
trasatura evaluata
J. asertilf
numar exempte
Evolu\ia nivelului de asertivitate auto-perceputa in func\ie de condiliile experimentale
127
II __ 'IHIII!IIIII_IIIIIIIIIIIIIIUlllIIIIII
Rezultatele sugereaza ideea ca oamenii tind sa fie influentati In perceptiile
lor de dificultatea de a accesa informatiile cerute (este mai dificil sa-Ii aduci aminte
cincisprezece situaiii stimul decat cinci) mai puiin de numarul de informaiii
aduse. Cu alte cuvinte, chiar daca ni se cere sa precizam cat mai multe situaiii Tn
care sa ne fi comportat asertiv, daca yom Tntampina dificultati in amintirea acelor
situatii, yom fi tentati sa ne caracterizam Tn directie opusa. Trl cazul de fata; vom_
evalua ca fiind mai degraba non-asertivi. Astfel, a fost. dovedita Tnca 0 data
influenia euristicii de accesibilitate In modul de evaluare a situatiilor
1,1
4.6. Tehnicile. ANCOV A}
.. .. _,.,.-." .. . ...- "- ... ':- '" .. ,.:_".,;/"
t-J.l;lTntotdeauna.variabilele independente de interes din cadrul unui studiu
comparativ sunt dejirLQ.s:.n.:inal (ex. barbaii sau femei) ori grup control,
grup placebo, grup tratamerit terapeutic). Tn multe situatii, factorii pot fi masuratilJe
scale ..D.umerLce, fie ele de tip interval sau p[oportii. Inteligenta exprimata Tn valori
IQ, trasaturile de personalitate sunt numai cateva
cazuri Tn care datele sunt masurate pe un interval larg. A lua fiecare valoare
numerica exprimata a face din ea 0 treapta a \f.Oabilei independente se
a fi 0 masura imposibila de adoptat practiC:fie nlJmaidin motivul
necesitatii unui numar imens la situatia unei testari
psihologice, in urma careia avem 40 de valori numerice diferite. Nu putem realiza
patruzeci de grupe de comparatie, deoarece acest efort ar fi prea imens lipsit de
eficienta Tn comparatie cu efortul depus. Daca factorii masurati pe 0 scala
numerica continua sunt importanii in clarificarea relatiilor de influenta Tntre VI VD
trebuie sa tinem cont de ei in studiu. Cum putem face acest lucru Tn situaiia in care
nu ne putem permite nici nu are sens sa realizam grupe de subiecti pentru
fiecare valoare numerica obiinuta? Doua variante de raspuns, utillzate frecvent de
cercetatari, vor fi prezentate in cele ce urmeaza. 0 a de-a treia modalitate consta
in utilizarea regresiei ca metoda de analiza va fi discutata Tn destinat
regresiei ...
(1) prima Tn stabilirea a doua sauJrei trepte ale variabilei
independente::pe baza condensarii rezultatelor a doua
trepte, subieciii pot fi impariiii in dOu;3..Q[Upe, valoarea ca unitate
de demarcaiie intre cele doua categorii de subiecii. Prin aceasta metoda, nu va fi
pierdut nici un subiect, iar cele doua grupe vor fi impariite in mod egal: grupa cu
rezultate inferi.oarern,E:;gianei (ex. abilitati scazute) grupa cu performanie
superioare medianei. (ex .. abilitaii crescute). T aceasta Impariire are marele
dezavantaj de a distorsiona intr-o anumita masura datele. Ganditi-va la a situatie in
care ar fi yorba des pre extraversiune, iar valoarea medianei a fost 12,7. Tn
caz subiectul care a obiinut valoarea 12 a fost pus Tntr-o grupa, iar cel care a
obtinut valoarea 13 a fost distribuit Tn cealalta grupa. Cunoscand faptul ca orice
instrument de masurare are anumite erori de masurare, reflectate In faptul ca nu
128
are 0 fidelitate perfecta, apare riscul de a grupa un individ. care a obtinut un
rezultat foarte apropiatT}ledianei. Tn plus, el va fi tratat la fel ca
realizat scoruri extreme, pierzandu-se foarte mult din nuaniarile necesare existente
prin masurarea caracteristicii pe 0 scala numerica. Tn aceste condiiii, 0 alta varianta
poate fi utilizata pentru gruparea subiectilor in independente.
De aceasta data sunt utilizate valori.l.e ....
. categorisi subieciii. Varianta elimina multe dintre neajunsurile preze'ntate anterior,
dar are un alt dezavantaj major, anume: eliminarea unor s,ubiecti testati din
analiza fapt ce nu ni-I putem permite in
pentru a exemplifica modalitatea de impartire a subieciilor yom porni de la cazul
masurarii gradului de extroversiune, unde media a fost 12, iar abaterea standard 4.
Grupa "extroversiune scazuta" ar putea fi alcatuita din subiectii care au obtinut
rezultate mai micisau egale cu [media - 0,5 abateri standard], 'adica din
cu un grad de extroversiune cuprins Tntre 0 10. Grupa "extroversiune ridicata"
putea fi alcatuita din subieciii care au obiinut rezultate egale sau mai mari decat
[media + 0,5 abateri standard], adica din persoane care au avut rezultate egale sau
mai mari decat 14. Astfel, subieciii cuprin!?i in intervalul m0,5s nu vor fi cuprin!?i Tn
nici una grupe !?i vor fi eliminati din analiza ulterioara a datelar. Tn cazul
prezentat ar fi fost yorba de toti subieciii care au obiinut valarile 11, 12 sau 13 la
testul de extroversiune. Tn cazul Tn care distributia rezultatelor ar fi fost normala ar
fi Tnsemnat eliminarea a aproximativ 38% din Tn plus, numarul de
din cele doua grupe !JQu7Jormate ar fi fast egal doar Tn conditiile unei distributii
perfect Tinand cont de aceste limite descrise, alii cercetatori, !?i includ
aici majoritatea speciali!?tilor in metodologie, sustin pastrare<;l, pe cat posibil, a
culese initial analizarea lor prin intermediul tehnicilor .. Jotu!?i, Tn
cazunle in care condiiiile de utilizare a ,tgb.niciL ANCOVA nusunt Tndeplinite,
varianta Tmpariirii subiectilor Tn doua sau grupe,. proces denumitgrlc!l2..are (Tn
engleza "blocking"), ramane 0 soluiie viabila, insaaesignul cercetarii nu va mai fi
complet randomizat, ci va deveni de tip gruP&L?DEJ.omizat (In engleza "randomized
block design") (Kirk, 1982). . .. -"-.
(2) Analiza (ANCOVA) reprezinta 0 extensie a tehnicilor
ANOVA . Tn contextul design-urilor de tip ANOVA, introducerea
unel. conduce, de cele mai multe ori, la 0 a puterii de
decelare a efectului uQei variabile indepenciente ... asupra uneia dependente.
Aceasta se poate face prin controlul statistic al unor dfferente de
subiectii unei cercetari. Simplu spus, ANCOVA nu este altceva' decat 0 ANO\jA Tn,
care efectele principale interactiunile Eiintre factori sunt evaluate dupa ce valorile
variabilei2.c:;pl:).t)(jente au rost ajustate Tn functie de .. valorile-covariabilei. Daca
covariabila ar fi gradul de inteligen\<,3, VD ar fi abilitatea de a citi, iar VI ar fi tipul de
program educaiional oferit, ANCOVA ar evalua efectul acestor programe asupra
abilitatilor. de .citire Tn situatia ipotetica Tn Gare toti,subiectii ar ave a acela!?i nivel de
inteligenia. Astfel, Tn ANCOVA valorile VD sunt mai Tntai ajustate y.;:; funciie de
covariabila apoi, analizate intr-un mod similar ANOVA. .
129
Ii, III '" "'"I11111 II'LI"'I"I'I"I"I"I"I"I"II!"'!""'"II1,11111,1111 i I, II, I, ,I, ,II " 'i
I ' II: III ' II: III ' II: III iIII III I J 1111: ! III III' IIII : II ' II ' III II: III II ' II ' IIII IIr IIII IIII 'IIIIi IIIII : 1111i IIIII IIIIII IIIII IIIIII IIIII, 11111i IIIII IIIII1 IIIII IIIII: IIIII 11111: IIIII IIIII' IIIII 111111 111111 111111: 11111 IIIII : IIIII 11111! IIIII1 IIIII1 IIIII1 11111:111111 11111 ,11111 11111 11111' 111111 '111111 111111 111111 11111 111111 IIIII IIIII1 'IIII1 IIIII :111, IIII iIII: IIIII! : 11111 IIIIII i IIIILlIIIII ' IIIIi : IIIi III ! I !
II
'" Dispasie
- de
Dispersie
neexplicata c,. \ J
to; ) ....
"---.-.
. Oispa'sie
. Dispersle . .' explic>:ta de
neexpllcata . VI
1
. !
- ,j
Oispersie
explicatade
cO\ariabiia
Figura 4.21. Sursa dispersiei rn situafia ANOVA (In stanga), respectiv ANCOVA (rn dreapta)
ANCOVA poate fi utilizata atat In sensul de."aJdentifica_ ..un efectcat mai
"pur"aIVlasupr?YR, cat de a reduce dispersja._datorataerorij. Mai
vorba de a elimina din calculul F acea parte a dispersiei VD care se datoreaza unui
alt factor, ce initial nu a fost -IU3tl!)_ c(;jlcul. Spre exemplu, daca am masura efectele
diferitelor programe educationale (ex. Step by Step, Waldorf, traditional) asupra
performantelor de a citi, ar fi bine sa controlam nivelul de inteligenta al copiilor, daL
fiind cunoscuta influenta 'acestui factor asupra abilitatii de a citi. Daca inteligent
a
este masurata numeric pe 0 scala de la 50 la 130, ea nu poate fi introdLJsa ca 0
alta variabila independenta, ci va fi tratata ca 0 covariabila prin ANCOVA. Tn urma
acestui demers am putE.l? evalua care a fost efectul manipularii dupa
ce am elimina irifluenta asupra VD determinata de nivelul intelectualctiferit al
copiilor inclu:;;i ,Tn studiu.fextual, prin ANCOVA am raspunde Tn acest caz la
Tntrebarea: tinand la nivel constant influeuta inteligentei asupra abilitatii de a citi,
exista diferenve semnificative Intre cele trei .programe de educatie Tn ce
abilitatea de a citi? De asemenea, de multe ori, prin introducerea acestei
covariabile s-ar reduce dispersia.erorii va astfel, puter:.ea. experimentului,
ca 0 capaci-tate de a decela existenta sau efect_ Sa ne
reamintim ca analizadisp!')rsionala nu face altceva decat un raport Intre dispersia
exE!icata9idispersia erorii.Astfel, pentru a obtine un F 'semnificativ, -prima
componenta ar trebui sa fie cu un anumit grad mai mare decat cea de--a doua. Prin
introducerea covariabilei, 0 parte a dispersiei erorii (neexplicate) devine explicata_
Figura 4:21. prezinta cel mai bine modul de partitionare a dispersiei Ih ANOVA fata
de ANCOVA.
De asemenea, ANCOVA este deosebit de raspandita In design-urile
cvasi-experimentalede tip pretest =._postest, implicand 0 grupa experimentala
una d!').cohtrol. Un exemplu tipic ar fi situatia In care doua clase paralele de elevi
sunt masurate iniiial In privinta gradului de coeziune a grupului din care fac parte.
Apoi, una dintre clase este supusa unor tehnici de dinamica de grup menite sa
Tmbunatateasca climatul unitatea clasei. Dupa finalizarea interventiei
psihologice, cele doua clase vor fi testate din nou asupra gradului de coeziune a
130
I
I
clasei de elevi. Tntr-o astfel de situatie, randomizarea a alevllor 1111 aste
posibila, cele doua grupe fiind constituite pe baza criteriulul natuml, Rcela al
fiecarui elev Tn clasa din care face parte. in asemsnea sltuatll,
dlferentele dlntre clase pot aparea de la inceput, Tnainte de apllcarea Interven\lei
psihologice_ Prin utilizarea rezultatelor de la pretest pe post de covarlablli1 vom
putea raspunde la Intrebarea: se dovede:;;te eficienta intervenlia Tn condit'iile In
care cele doua grupe ar fi pornit de la conditii egale In ce prlve:;;te gradul de
coeziune a clasei de elevi? ,
Pentru a putea oferi acest raspuns, pe baza relatiei dintrEU?(jvariabila :;;1 VD
se obtin valorile aJustate ale mediei grupelor incluse Tn cercetare pe baza unei ."
ecuaiii de regresie. De remarcat ca tehnicile ANCOVA nu'se limiteaza la 0 singura
Astfel, cu respectarea anumitor conditii ce vor fi amintite spre
finalul acestui capitol, pot fi incluse mai multegovariabile. De asemenea, acestea
pot fi introduse In diferite design-uriANOVA, determinand, Intr-o maniera similara
situatii de ANCOVA simpla, ANCOVA cu repetate, ANCOVA
sau ANcQvAolTxHCincele ce urmeaza, ne vom rezuma la un exemplu de
ANCOVA simpla, implicand 0 singura VI,<o covariabila 0 YD.
Situatia concreta se bazeaza pe studiul efectuat de Din :;;i Calao (2001),
modificat Insa din punctul de vedere al design-ului cercetariL Cei doi au investigat
In ce masura copiii care au utilizat jocuri educi'ltionale pe calculator au progresat
mai repede In ceea ce dobandirea cititului In comparatie cu copiii care nu
au beneficiat de aceasta. facilitate. Astfel, acest design consta In doua grupe de
subiecii. Variabila dependenta a constat Tntr-un test de a progresului In
citire. Deoarece acest aspect era dependent de un anumit nivel de dezvoltare a
nivelului intelectual, variabila inteligenta generala, masurata prin WISC a fost
inclusa ca 0 covariabila ..
Baza de date aferenta acestui exemplu este simpla.sav, iar calea
de urmat In SPSS pentru a realiza ANCOVA simpla sau ANCOVA factoriala este
"Analyze" - "GenergU..Jnear Model" - "Univariate".
TabeluI4.9. Tabelul sumar ANCOVA
Sursa dispersiei SS df MS F
Nivel intelectual 2566,97 2566,97 91,28 **
Jocuri calculator 271,88 271,88 9,67 **
Reziduala (Eroare) 1040,53 37 28,12
Total 3879,38 39
** P < .01
Din tabelul 4.9. se observa atat influenta semnificativa a nivelului
intelectual asupra abilitatii de a citi, cat faptul ca doua grupe de copii incluse
In studiu difera semnificativ In ceea ce abilitatea lor de a citi, chiar dupa
ce a fost controlata influenta inteligentei asupra variabilei dependente. De
asemenea, se observa ca in ANCOVA nu se calculeaza interactiunea dintre VI
131 , " 'II , , , 'II " II __ ____
'1I"I'llIIillll'lIIl ,1"1':,1'
covariabila. De altfel una dintre conditiile utilizarii ANCOVA presupune tocmai lipsa
I . I "r-.,.,.._ ....
Linei interactiunLsemuificative intre cele doua .
. Din' urmatorul tabel se pot observa uoarele ajustari ale mediei pentru cele
doua grupe dupa meniinerea constanta a inteligentei. Cea de-a doua coloana
contine valorile reale ale mediilor obtinute in urma aplicarii probelor. Cea de-a
coloana contine, in schimb, 'valo'rile celor doua medii In situaiia ipotetica in
care nu ar exista diferente intre subiectii din cele doua grupe referitoare la nivelul
intelectual. Acestea sunt' mediile care luate In considerare pentru a constata
eventuale diferenie semnificative intre populaiiile din care au fost extrase grupele
In cazul ANCOV A. Se poate constata ca, Tn situaiia ipotetica in care inteligenia
copiilor cuprini In studiu ar fi constanta, diferenia dintre cele doua grupe ar scadea
uor, dar ar ramane semnificativa statistic, in sensul ca persoanele care au
beneficiat de jocuri educative pe calculator au obiinut performanie superioare celor
care nu au avut la dispoziiie aceasta facilitate.
Tabelul 4.10. Valorile mediei reale, a celei ajustate a abaterii standard reale Tn
abilitatii de a citi
Grupa copii
Jocuri educative pe calculator
Control
Date reale (neajustate)
M AS
80,45
73,85
8,43
10,90
* SPSS-ul nu ofera valorile abaterii standard pentru datele ajustate
Date ajustate
M AS
79,76
74,53
Binelnteles ca In cazul Tn care VI are mai mult de doua trepte yom putea
utiliza, atat contrastelorL . .fat cea a comparaiiilor postJ1Qr:; pentru a
identifica mupele care qif;r,fT;tre ele. In cazul ANCOVA, procedurile post hoc
adecvate sunt Sidak, indiferent de numarul de subiecii din grupe sau
de omogenitatea 2000). Ramane de precizat ca, In problema
data, pentru a obtine atat valorile iniiiale ale mediilor, cat i valorile ajustate ale
acestora este necesar sa bifam, Tn cadrul ferestrei "QRE9DS".qin?PSS, "descriptive
statistics", respectiv "display
4.6.1. Marimea efectului In tehnicile ANCOVA
FUnd yorba de efecte concrete In plan educativ, yom calcula marimea
efectului pe care-I au jocurile de calculator asupra dezvoltarii abilitaiii de a citi a
copiilor. Aa cum am afirmat de mai multe ori pe parcursul acestui capitol, un F
..tatistic ny lnseamna neaparat 0 importania practica a gasit.
Difereniele dintre doua grupe pot fi semnificative, dar minuscu)e. Astfel,
iinand cont ca exista doar doua trepte ale variabilei constituite din persoane care
au beneficiat sau nu de jocurile pe calculator, yom utiliza formula 4:2. ,prezentata Tn
cadrul calculului marimii efectului In ANO.Y:A.,simpla. Rezultatul obiinut indica un r
132
'1,1 111:111 ill' III' Ii II" II 'h ,I l'IIIIIII!,'1Ii
11:'11,11 111111 III ill: ,ill iII':1II 'I: !I ''''II II
de 0,45, iar ri = 0,20. Dac ar fi s utiliz m indicele d al lui Cohen am obtine d =
1,02. Toate aceste valori indica un efect pozitiv important (mare). Tn
daca rezultatele studiului sunt confirmate i In alte ocazii, se demonstreaza un fapt
esential: jocurile educative pe calculator au 0 influenta foarte buna asupra
dezvoltarii abilitatii de a citi.
,
Analiza de covarianta, in ciuda avantajelor prezentate mai sus, are 0 serie
de limite i precautii de care trebuie sa tinem cont atuncicand abordam
posibilitatea de a ap/ica aceasta tehnica. Alaturi de limitele $i condiiiile specifice
fiecarui tip de design ANOVA pe care Ie-am prezentat la momentul oportun, exista
altele suplimentare $i particulare cazului ANCOVA.
4.6.2. Conditii ANCOVA
Mok i Wheldal! (1995) sau Tabachnick i Fidel! (1996) au oferit 0 serie de
argumente menite sa ateniioneze cercetatorii asupra utilizarii, fara precauiii, a
tehnicii ANCOVA. Neluarea in considerare a condiiiilor nepesare aplicarii analizei
de covarianta poate conduce la ajustari eronate ale mediilor $i in consecinta, la
Trei conditiLsuplimentare par a fi deosebit de
importante Tn aceasta situatie. . '. ' .. ,
100
E
<:>
'"
90
80
Q) 70
U
'"
Q)
(ti 60
Q)
:!:
c "
8
. ' .

70 80 90 100 110 120 130
inteligenta
Figura 4.22. Norul de puncte (scatter-ul) lntre variabila dependenta i covariabila
SPSS este 0 marca Tnre.9istrata.
_ \:; Intre variabila 0 lilJiara.,
Daca riu' exista 0 corelaiie sau relaiia dintre cele doua caracteristid hu este Iiniara, .
rezultatele ajustarii mediilor sunt eronate, deoarece intregul demers ANCOVA se
bazeaza pe regresia Iiniara. ca metoda cea mai simpla de a verifica
aceasta conditieeste-de"'a observa_Dorul qepuncte rezultat din asocierea celor
doua variabile i de a calcula un simplu coeficient de coreli3iie r Bravais-Pearson.
Pentru exemplul nostru am obiinut 0 corelatie r (38) = 0,82, p < .01 Intre nivelul
intelectual :;;i abilitatea de a citi, iar norul de puncte indica 0 relaVe liniara Intre cele
doua caracteristici.
133
Tn cazul utilizarii mai multor covariabile, conditia se pastreaza pentru
fiecare pereche covariabila - variabila dependenta Tn parte. 1n plus, Tntre
covariabile hU" trebuie existe corelatii foarte ridicate, datorita fenomenului de
multicoliniaritate (vezi sectiunea 6.5.4.).
2." Fidelitatea probei de masurare a covariabilei trebuie sa fie ridicata. 0
masurare fara erori este posibila numai Tn situatii f()i:)rte rare, Tn care variabila este
data de varsta subiectilor Tnaltimea lor etc. Cele mai multe .teste psihometrice au
un nivel de fidelitate atinge niciodata valoarea unu. Tabacknick
Fidel! (1996), Tn cazul utilizarii ANCOVA Tn situatii experimentale se ajunge la
valori F conservatoare, ceea ce de a comite II. Acest
lucru nu se pastreaza Tn cazul situatiilor cvasi non-experimentale, Tn care
putem Tntaln.Latat sub:ajustari, cat mediilor initiale. De aceea,
autoarele recomanda utilizarea covariabilelor Tn situatii cvasi non-experimentale
doar daca fidelitatea masurariLlor atingecel .putin 0,80. 0 valoare maL.:':l1
i
c::.
a
introduceprea.multa ..eroare Tn estimarea mediilor ajustate i,'implicit, Tn calcularea
diferentelbr dintre acestea.
Efectul covariabilei asupra variabilei dependenteeste similar pentru
oricare treapta a variabilei independente. Aceasta conditie este cunoscuta sub
numele de omogenitatea pantei de regresie face referire la absenta unei
interactiuni semnificative Tntre. variabila sau variabileleindependente
Unii autori, precum Dugard Todman (1995') considera ca
ANCOVA este destul de robusta la Tncalcarea acestei condit
ii
, daca numarul de
subiecti dirtmupe .este relativ egal daca variabila dependenta este distribuita
normal. Totu:;;i, Tn alte situatii , respectarea conditiei are 0 important
a
extrema.
Cele doua grafice prezentate Tn continuare exprima ambele situati
i
: Tn
stanga, de omogenitate,.a regresiei; Tn dreapta, de heterogenitate a regresiei
(Tncalcarea conditiei). in cazul Tn care exista 0 omogenitate a regresiei, liniile ce
marcheaza panta'de regresie sunt paIalele, acest fapt semnificand coeficient
i
b de
134
100',--------,
90
GRUPA
utillzeaza JOGun pe
calculator
o nu ulilizeaza jocuri
pe calculator
inteligenta

90
=5
'"

m 60
o
o
GRUPA
x utillzeaza jocuri pe
calculator
0 0 nu ulilizeaza jocuci
501--___ -1 pecalculalOr
75 90 105 120 135
inteligenta
Figura 4.23. Reprezentarea grafica a situatiilor de omogenitate (stanga) i
eterogenitate (dreapta) a regresiei .
SPSS este 0 marca lnregistrata.
regresie similari pentru a surprinde relatia dintre covariabila variabila depende t"
la trepte ale variabilei independente. in situatia de heterOgenitate
n
:
pantele nu sunt paralele, prin urmare coeficientii b de regresie Vor fi
diferltl cele doua grupe de copii. in acest caz, nu putem aplica ANCOVA
deoa.rece aJustarea mediilor se face pe baza unui b general, obtinut prin luarea
conslderare a tuturor treptelor VI, iar acesta nu este reprezentativ pentru nici una
dintre treptele VI. .
Deoarece desenul din dreapta, reprezentand cazul eterogenitatii regresiei
este bazat pe date simulate, iar eel din stanga este dat de reale ale
oferit, conditia de omogenitate a fost respectata ANCOVA a putut fi
realizata In exemplul nostru.
, 0 mai exacta de testare a acestei conditii consta Tn calcularea
.F de Interactiune Tntre VI covariabila concomitent cu calcularea efectelor
prlnclpale. Un rezultat semni!icativ,statistic indica Tncalcarea conditieide
omogenitate a dispersiei, fapt ce Tmpiedica realizarea ANCOVA. 0 alta pO;ibilitate
testare presupun.e rularea unei regresii ierarhice Tn doi Mai Tntai sunt
Introdus.e variabila independenta (cavariabila dummy) pe post
de apol atat covariabila :;;i variabila independenta, cat :;;i 0 variabila nou
din produsul celor doua, dupa transformarea prealabila a variabilei
Independente Tn variabfla de tip dummy (vezi sectiunile 6.3. 6.7.2,). Daca "F
step",. ce. masoara diferenta aparuta prin introducerea variabilei-produs este
semnlficatlv statistiC, exista 0 interactiune Tntre covariabila :;;i factor deci este
Tncalcata conditia de omogenitate a dispersiei. '
4.7. Tipuri de factori In design-uri Ie de tip ANOVA sau
ANCOVA
in .Tncheierea acestui capitol, yom face cateva scurte precizari de ordin
metodologlc menite sa faciliteze interpretarea corecta a rezultatelor obtinute din
Aceasta nu se poate face fara 0 Tntelegere adecvata a tipurilor de factori
po:'lbdl. folosi trei criterii de clasificare a variabilelor scala de
masurare utllizata; gradul de generalizare a rezultatelor :;;i gradul'de manipulare a
faetorilor. . '"
(1) Dupa primul criteriu, putem distinge factori masurati
.ordinal .. sau numeric (incluzand aici atat scala de tip interval, cat\i cea
Categoriile nominale ale . unui factor pot constitui treptele variabilei
astfel adecvate tuturot tipurilor de analiza
utllizarll contrastelor polinomiale, care necesita 0 ordonare a treptelor
factonlor. Categoriile, ordinale ale unui factor pot fi supuse tuturor tipurilor de
inclusiv contrastelor polinom!ale. in variabilele numerice.nu pot fi
foloslte catrepte ale variabilei independente Tn ANOVA decat prin grupari grosiere
ale datelor Tn cateva categorii. Totu:;;i, prine anumite . ajustari, factorii relevanti
135
'I, 'I "
'1111111111111111"
masurati prin' scale numerice pot fi utilizaii in analize de covariant
a
- i\NCOVA
(Pedhazur Schmelkin, 1991),
(2) Un al doilea criteriu de diferentiere a factorilor gradul de
manipulare a variabilelor 1m parte factorii in: variabile IT!c:tDipulCibile variabile
eticheta (Kirk, 1982; Radu 9i colab., 1993). Astfel, unele variabile, precum nivelul
cOnsumului de alcool (ex. 50 mg; 150 mg, 250 mg) pot fi manipulate alese de
experimentator. Alte variabile, cum sunt sexul persoanei, varst,: etc. sun,t
date de caracteristicile subiectilor pot fi manipulate de cercetator. In aceasta
situatie vorbim variabile eti;heta. Importanta'distinciiei dintre cele doua
tine de subtilitatea._interpretarii. Astfel, daca obtinem diferent
e
semnificati've statistic Tntre treptele variabilei manipulate, yom trage coneluzii
directe (e;. eonsum de aleool ridicat duce semnificativa a vitezei de
la stimulii vizuali). Tn schimb, obtinerea unei diferente semnificative intre
barbati femei, cu privire la viteza lor de reactie, 'i:Ju .. lnseamna prin sine ca
eticheta de "a fi barbat" sau "a fi femeie" a .. la aceasta situat
ie
. Ceea ce a
cauzat diferenta dintre sexe tine de anumite aspecte diferentiale care sunt incluse
In aceste etic'hete. Gei spre medicalepoate vor gasi cantitati
diferite de anumiti neurotransmitatori sinaptici. Unii care yin din sfera antropologiei,
vor afirma poate: ea diferentele'sunt datorate unui stil cultural diferit, barbatii, prin
natura lor de vanatori fiind nevoiti sa reactioneze mai rapid, Cu alte cuvinte, atunei
cand avem de a eu variab'ile manipulate, cauza este mc.mifestai fi
detectata direct. in schimb, In situatia unor variabile eticheta, cauz'a.Jeala nu este
detes<t;;bila,ea fiind ascunsa in spatele multitudinii diferentelor. dintre categoriile
variabilei eticheta (ex. diferentele dintre barbati femei).
(3) Tn dupa cel de-al treilea criteriu, gradul de generalizare a
rezultatelor, factorii se Impart In factQri .. factori"aleatori. De departe, cel
maLlntalnit tip suntcei fiqi, in caretreptele variabilei independente sunt
tratate ca masuri .,desine.statatoare. In schimb, factorii aleatori au stabilite trepte
care nu sunt identificate ca fiind fixe, ci mai degraba sunt considerate ca valori
reprezentative pentru variabila independenta In cauza (Smith, 2000). doua
criterii care ne ajuta sa distingem Tntre factorii i cei aleatori. Pentru ca un
factor sa fie considerat aleatoriu trebuie sa indeplineasca doua ..J;Qn.ditii de baza
(Jackson i Brashers, alese sa fie
conditii care se pot iar interpretarea rezultatelor sa nu prezinte
interes la nivelul JiecareJJrepte selectate. Pentru a ciarifica aceste aspecte, yom
apela la urmatoarele doua exemple:
Exemplul1:
Un cercetator este interesat sa 'stabileasca care dintre urmatoarele doua
metode de terapie (cognitiv-comportamentala vs. analiza tranzac\ionala) este
mal eficienta, Din acest punct de vedere, tipul de terapie este un factor fix.
deoarece ambele trepte ale tipului de terapie au In sine, cercetatorul
fiind interesat In mod special de diferentele dintre cele doua tipuri de terapie,
exista alte modalitcW posibile de interven(ie clinica.
Exemplul2:
Un cercetator este interesat sa stabileasca in ce masura consumul de alcool
condUce la erorflor de executie. Cercetatorul distribuie subiectii in
mod aleatoriu in trei grupe experimentale (50ml, 100 ml 200 ml \uica) a
grupa de control. in aceasta situa\ie, consumul de alcool poate ti tratat ca 0
variabila aleatorie deoarece treptele respective pot fi considerate ca valori
extrase dintr-un eantion mai larg. La fel de bine, treptele variabilei
independente puteau fi stabilite la 50 ml, 150 ml sau 250 ml. De interes este
evolu\ia erorilor de execu\ie in urma consumului de alcool. treptele acestuia
(50ml, 100 ml i 200 ml) fiind mai pu\inimportante, ele fiind alese arbitraL
Primul po ate fi uiteri9Lcomplicat prin introduce rea unei noi
variabile explicative, cum ar fj obiectul jnterventiei. Sa presupunem ,ca factorul
.... ,., ... - ...
respectiv a fost operationalizat prin doua trepte (modalitati): persoane care sUfera
de depresie, respectiv anxietate. Acest factor poate fi conceptualizat atat ca factor
fix, cat ca factor aleatoriu. El este factor fix daca eercetatorul este jnteresat Tn
mod concret de raspunsu/ /a urmatoarea lntrebare: Terapia cognitiv-
comportamentala este mai eficienta In ameliorarea simptomelor pacientilor
depresivi i anxioi decat terapia bazata pe analiza tranzacfjonala? FactoruJ trebuie
tratat ca aleatoriu, dad3 Tntrebarea are un caracter general: Terapia cognitiv-
comportamentala este mai eficienta In ameliorarea simptome/or decat terapia
bazata pe analiza tranzactionala?
Tn acest ultim caz, depresia sau anxietatea nu constituie un deosebit
interes, acestea putand fi considerate ca as peete extrase dintr-un eantion larg de
tulburari psihice precum: tulburarile de conversie, cele obsesiv-compulsive
urmare, unei variabile independente ca factor aleatoriu permite 0

obtinute. . " '"
Din nefericire, acest avantaj este compensat de riscuri mai mari de a
co mite eroarea I, deoarece factorii aleatori au 0 putere statistica de decelare
a efectelor mai.mica decat aceea a factorilor In in cazul
11!'!-- '< ,
unui set de date identice, exista 0 probabilitate mai mare de a sprijini ipoteza
daca yom trata factorii ca fiind
BIBLlOGRAFIE
Clocotici, V., Stan, A. (2000). Statistica aplicata in psihologie. Editura PoJirom.
Din, F.S., Calao, J. (2001). The effects of playing educational video games on kindergarten
achievement. Child Study Journal, 31 (2), 95-102.
Dugard, P., Todman, J. (1995). Analysis of pre-test post-test control group designs in
educational research. Educational Psychology, 15(2), 181-198.
Everitt, B.S. (1995). The analysis of repeated measures: a practical review with exemples.
The Statistician, 44(1), 113-135'.
137
- __ ellllllllIlIlWlIlIlIIIIIIIIIIIIIIILIIIIII'IIIIIIIIP
fata de sine; respectiv f calm. Un alt studiu evident
iaza
numai trei factori:
cinism respectiv pesimism. Sa presupunem ca primul factor extras -
gradul' de contine itemii scalelor de nelini!?tE:,l :?i insatisfact
ie
din primul
studiu. Prin analiza factoriala confirmatorie yom putea testa, pe un alt lot de
sUbiecti care dintre cele doua pare a fi mai potrivit pentru a caracteriza
scala de afectivitate negativa. .' . . _ . .._
De obicei analiza factoriala exploratone (EFA) se utllizeaza In situat
ille
In
care nu exista perspectiva teoretica clara asupra relatiilor dihtre
fenomene ce necesita analiza factorial!i Pe masura ce sunt acumulate cun09trnie
relevante pentru ace I domeniu este preferabil sa utilizam analiza
c-onfirmatorie: aceasta depage:?te caracterul exploratoriu In favoarea testarll unor
ipoteze specifice.
5.1. Analiza factorialaexploratorie
Metoda estsi __lJtil;l: In atingerea unor obiediu.e . ..gg.oerale, mai .. i!l2Ertante
decat construirea unei simple scale. Ma refer la construirea cum sunt
cele In domeniul persof}plitaiii 9i In cel al inteligentei. Acest fapt
se ideii ca analiza factoriala -;u -este doar 0 tehniCif'statistica, ci, In
primul rand, 0 De aceea este necesara 0 scurta
a teoriei analizei factoriale. inredactarea acesteia, ma voi baza, In special pe
introducerea excelenta a lui Tucker !?i MacCallum (1997), dar 9
i
pe cele realizate
de Wegener 9i Fabrigar (2000), respectiv Bryant 9i Yarnold (1995).
5.1.1. Teoria analizei factoriale
intr-o cercetare domelliuL;9i populatia gEl.interes sunt doua
esentiale deseori la un nivel impli;;t"'d'E('tratare. Prin .se
un ansamblu de fenomene la care se refera studiul respectiv. Acesta
fi mai abiliti3tile mintale) sau mai festrans (ex.
neuroticism; hiperkinezie). Populaiia este data de tota\i1,atea"entitaYilo.r pot
intra In studiu (ex. toti copiii de varsta 9colara). De regula, din ce tin
reSLirse''''lihiitate, se folosesc e9antioanede subiect
i
extrase drn
respectiva. Tntr-un mod similar, dintr-un anumit d: cercetare. fr
selectate cateva variabile care vor fi incluse in Vanabllele
selectate s;;;t-denumite atriautede Spre exemplu, In domeniul
abilitatilor mintale pot fi utilizate mai' multe p,robleme. de
aritmetica, de vocabular, de percepere a relatiilor spatiale etc. Flecare dlntre
aceste probe preziQ!.a un in consecint
a
, de
interes pot fi selectate 0 multitudine de ,.astfel ,de .atribute. Un set de astfel de
atribute supuse masurarii formeaza 0JJlte.cLe.<Acela9i principiu se aplica 9
i

11'1
"
11'
",I iii II 11,111" ,
11'11111111'1111'1111 1111 1111',' I 'I
'III' 'II' ,II III 'III III
de personalitate. Astfel, daca este afectivitatea negativa, vom
avea mai multe (atribute de suprafata) cum ar fi cinismul, pesimismul
etc.
in 'urma testarii ei,iantionului cu bateria aleasa yom sesiza mai multe
aspecte .. Mai fntai, yom observa ca exista diferente individuale. fntre subiecti
rezultatele fiind dispersate Tn functie de gradul
De asemenea, yom observa 0 anumita asogj..fe (covarianta) Intre rezultatele
de subiecti, mai multe probe. Astfel,o'persoana care a obtinut
un rezultat ridieat la 0' problema de Inrriultire e foarte probabil obtina un scar bun
i la 0 problema de adunare.
Oat fiind numac.uLJn!:.l?de probe, se pot obtine "patternuri" de Gorelatii
diverse I-J:ltre.probeJB-unei baterii. Unele dintre acestea pot fi corelate -puternic; iar
altele pot fi La prima impresie, relatiile 'stabilite Tntre varia-bile-(atributele
de suprafata) pot parea haotice. Ana-HzallctQrigla vine :?i clarifica aceasta situatie,
identificand 0 anumita orcjjnB9f structura in date. Acest lucru se face prin
, .....
unei privitoare la dispersia observate In atributele
de suprafata.
fundamentala In analiza factoriala este postularea
atribu.telor interne. Un astfel de atribut face referire la caracteristici neobS;;rvabile
....
direct ..!"L,9,?meni, dar care determina diferente intre ace9tia. Ele se afla la baza
atributelor De exemplu, am numerice,
verbale etc. ca--atrlbute interne Tn domeniul abilitatJ1gr...[llintale. Acestea nu pot fi
masurate direct, dar pot fi reflectate prin intermediul evaluarii atributelor de
suprafaia. Astfel, am putea afirma ca 0 persoana este superioara alteia in privin\a
abilitatilor numerice, daca la a serie de probe ce implica adunare, scadere,
Inmultire etc. obtine rezultate mai mari decat cealalta persoana. Aceste atribute
interne sunt cunoscute, Tn general, sub denumirea de iar Tn cadrul
analizei factoriale ele se numescfactori. "
Aceste avea un pot fi doar
care faciliteaza intelegerea 9i explicarea realitatii. 0 analogie poate fi
facuta apeland la concepte fizice precum graWic;t.tia. Existenta acesteia a fost
construita ipotetic, pornind de la observatii concrete. 'Toate au tendinta de
a cadea pe pam.nt cu 0 viteza variabila Tn functie, printre altele, de masa lor. Prin
urmare, exista 0 f0rla nevazuta care actioneaza.9i determina aceasta cadere a
obiectelor. Similar, am putea spune ea unii elevi tind sa rezolve, mai repede 9i mai
bine decat altii, probleme de matematica, datorita unui nivel mai ridicat al abilitatilor
lor numerice. Altfel spus, variabilela_manifeste sunt influentate sistema tic de
anumite in!.ElfI!El, factqri).
Se impune acum a noua distinctie Tntre doua categorii de atribute intem):
factor;i"cemuaL 9i factori"specifici:.Primii sunt aceia care
atribute dinbaterie (ex. abilitatile numerice afecteaza
obtinute atat la proba de adunare, cat 9i la cea de Inmul\ire). Tn schimb, factorii
specifici influenieaza 0 sing.I,l[a, variabila-manifesta. Dinamica dintre cele doua
141
categorii de factori este de modificarile survenite Tn (scala).
Astfel, introducere.. ... .. ul:10L (item i), poate conduce la
transform
area
unor factori sJ;>egifici Tn factori comuni !?i invers. Sa presupunem ca
avem zece probe menite sa masoare doi factori comuni: abilit?iile numerice
relatiile spatiale. Pentru fiecare atribut intern sunt prevazute cinci probe. Daca .
elim'inam toti itemii care fac referire la abilitatile numerice, cu except
ia
unei singure
probleme de adunare, abilitatea numerica devine un factor specific, deoarece se
bazeaza pe un singur atribut manifest. Alaluri de ace$ti factori comuni $i specifici,
Tn evaluarea atributelor de suprafata intervine !?i eroareaAe-masurare. Aceasta nu
tine de atri5utele inteme, constituie mai degraba, tranzitorii !?i
care afecteaza rezultatele obtinute la atributele de (ex.
oboseala,'momentul zilei ales pentru testare etc.). Intra fidelitatea !?i
erorile de masurare exisla 0 legatura inversa. eu cat un test este mai fidel, erorile
de mai mici !?i invers. Tn
,.fsctqrii specifici ai factor:uLunic ..... Astfel,
manifesfpoate fi vazut ca fiind 0 consecinta a influentei unuia sau a
mai mullor factori comuni a factorului unic.
Spre exemplu, vom lua ca model raspunsul afirmativ al unei persoane la
itemul "Intoldeauna sa se Tntample ce esie mai rau". din cadru! scalei de
pesimism YOm constata ca e! esle afectat de trei surse de variat
ie
. Prima sursa
este data de factoru! comun masurat Tn scala respectiva, adica gradul de pesimism
al persoanei respective. A doua sursa se refera la factorul specific al acestui
dat de totalitatea aspectelor care iI individualizeaza fata de ceilalt
i
itemi ai scalei. In
acest caz, datorita formularii, ar putea fi vorba de efectul de "framing" pus Tn
evidenta de Tversy $i Kahneman (Miclea, 1994). Probabil ca 0 formulare diferita,
. dar de genul: "Nu a$tept niciodata sa mi se intample !ucruri bune" ar fi
condus la rezultate u!?or diferite, data fiind specificitatea formularii. Oaca mai multi
itemi vor fi afeelati, prin modul lor de formulare, de aceste efect de "framing", yom
obtine un alt factor comun determinat de modul in care sunt formulate afirmat
iile
In termeni de sau pierdere). Tn fine, a treia sursa de variatie a
rezultatelor la iternul respectiv poate fi determinata de erorile de masurare (ex.
fidelitatea seazuta a probei; prezenta unor stimuli distraetori etc.) Factorul specific
alaturi de erorile de masurare conslituie, impreuna, unicitatea dispersiei scorurilor.
Analiza factorialaeste mai putin interesata de acest aspect Tn schimb, ea
tine seama,-j';";.n'od'cfeosebit, de rezultatelor datorate
factorilor Aceasta se nume!?te Eventualele
coreiafifexistente Intre anumite probe sunt explicate ca fiind determinate de
existe"htaunuia.sau maimultor faetori comuni. In schimb, Jipsa corelatiei sau 0
scazuta indica eXistenta posibiia a unor De exemplu,
diferite obtinute la proba de adunare !?i la cea de vocabular constituie 0
dovada ea eele doua atribute de suprafata sunt influent
ate
de factori diferiti.
La 0 scala.mai .mare, cu cat exista mai intre
atributele masurate, cu alat ele tind a dovedi existenta unui La fel,
..
142
lipsa .-e. .. corelatii dintre mai multe variabile ... manifeste constituie un indiciu al
absentei Ufiei intre variabilele respective. Tn plus, Tntr-un anumit
domeniu de interes, se pClrne$te de la prem'isa ca majoritatea atributelor de
suprafata sunt influeniate de un numar restrans defactori comuni.
Toata aceasta discutie asupra analizei factoriale porne!?te de la
legaturi variabile. Acest aspect merita sa fie retinut, deoarece
multe dintre fenomer18'le realitatii psihice nu exista 0 relatie' liniara. Tn astfel de
situatii este inadecvata folosirea analizei factoriale, cel putin Tn varianta sa clasica.
A!?adar, analiza factoriala nu este maio mult decat 0 teorie despre..dinamica
relaiiilor dintre interne. Ca orice teorie, ea 0 mal
mare saO mai mica corespondenia cu realitatea. Aplicarea ei Tn mod automat, fara
a tine cont de aceste precizari eonceptuale, poate conduce la solutii gre$ite.
. Sintetiza.nd, scopul a identifiea natura
stau la baza unui set de.variabile manifeste.Tehnica este
utilizata atat in constrl1irea de scale, cat la dezvoltarea teorii. inainte de a
aprofunda modul de reaiizare practica a unei astfel de se impune sa facem
o ultima distinctie intre analiza factor-iala .exglo(atorie $i analiza Gomponentelor
(in engleza "principal component analysis" sau PCA). "--- -_ ..
5.1.2. Analiza componenteJor principaJe VS. analiza factoriaJa
Ambele metode au fost utilizate inadecvat, de nenumarate ori, in principal
datorita neTntelegerii diferentelor dintre ele. Confuzia a fost intretinuta de cazurile
numeroase in care soluiiile, obtinute pe acela!?i set de variabile, au fost similare.
Nu in ultimul rand, une!e carl) de prom au e!?uat in Incercarea de a face' 0 distinctie
clara intre cele doua metode. '
. . analiza cOrnponentelor
pnnclpale este determinata de a .anaHiadafele:Sa ne reamintim
ca analiza"factoriala identifica trei su"rse aje factorii.comulJi, cei
de)J]asurare. Gruparea ultimelor doua surse of ere a unicitalea
variantei. insa central cadea asupra com un alitatii , ca dispersie explicata
de factorii eomoni. In schimb, analiza componentelor principale recurge la
aceasta iar teo ria de la baza ei !:'upostuleaza existerifa unor'faCtori
c!2mulJi. In PCA, dispersia d.CiJelor are la baza doua.surse: dispersia expllcata !?i
cea datorata erorilOL ..,..c!i:LrnaSljrare (Iacobucci, 1994). In aeeste fi
normalsa vorbim Tn analiza componenteJor principale,
teoria nu specifica De aceea, se folose!?te termenul substitut de
principa.la. Atat factorii, eomponentele principale pot fi denumite
generic Syopul analizei principale este extragerea
unui numfllr.cat maimic de eigenvectori, care sa explice"cat maLmult din totalul
varianteL
Oispersia; tn cazul celor doua metode, poate fi .. reprezentata grafic in
functie de sursele care com pun totalul acesteia:
143
ANALIZA FACTORIALA
Dispersie Dispersie Dispersie
datorata datorata datorata
factorilor factorilor erorilor de
comuni specifici masurare
ANALIZA COMPONENTELOR PRINCIPALE
Dispersie
explicata
Dispersie
datorata erorilor
'lhlllllllli:IlIIi'llllllllllllilIIIIIUIIIIIIIIIIIIIIIIIIIWIIII111111111111111.I11111:1111111111111,llli,III::II'
Figura 5.1. Oiferente conceptua/e mtre analiza factorial. i analiza componente/or principale
Pornind de la aceste considerente, yom constata a doua diferen\a
eseniiala intre EFA i P.9!.\,..,Analiza compoflentelor QIincipale are ca obiectiv
reducf!.(:ldatelo?J?!Tn identificarea unui de princ1p<;lle
care explica impreuna cat mai mult din manifeste. Ea,
face acest lucru pe baza unei combill"iiiliniare Tntre variabilele rTlanifeste. Tn
schimb, analiza factoriala exploratorie incearca sa determine un numar restrans de
factori care influenieaza semnificativ 0 serie larga de varia bile manifeste. Pe scurt,
PCA este 0 tehnica utila de re.,ducere a datelor, in timp ce EFA este adecvata
identificarii unor constructe p-sihologice latente.
o ultima de aspectul implicat Tn
cele doua.analize. In EFA, vazuii ca fiind
'to'fGI unor Astfel, pare natural sa
afirmam 0 persoana ob\ine rezultate fidicate Ja probe de aritmetica, vocabular,
relaiii spa\iale etc. datorita unei inteligente ridicate . In PCA, componentele
principale Mai degraba, ele sunt a
al carei scop este de a explica mai mult din totalul
dispersiei datelor. 6 situaiie care necesita PCA este aceea Tn care dorim sa
obiinem un singur indicator al "starii materiale" pe baza unor informaiii multiple ce
privesc venitul personal al subiectului, venitul financiar al familiei, un index al
bun uri lor de lux detiriute etc. Alte situatii in care se apliea PCA sunt cele Tn care
mai rnulte foarte puternic. Tn acest caz, prin
extragerea uneia sau 0 a' mai multoreomponente principale se elimina problema
mulJicoliniaritatii (vezi sectiunea 6,5.4.), Acestor diferente intre EFA i PCA se
adauga i altele, de ordin matematic, implicate in algoritmul de calcul al
eigenvectorilor. Asupra lor nu yom insista aiei. Tn plus, trebuie retinut ca SPSSul
of era doar posibilitatea realizarii analizei factoriale. Cei interesaii de utilizarea
metodei componentelor principale pot apela la alte programe software precum
ViSta (Young, 2002) sau LlSREL (Joreskog i Sorbom; 1989).
Tn eoncluzie, dei numeroase situa\ii dovedesc 0 similaritate a rezultatelor
obiinute prin cele doua metode, exista diferenie semnificative din punct de vedere
teoretie. Acestea, la randul lor, pot duce la rezultate interpretari greite ale
solutiilor obtinute. Tn continuare, yom insista asupra modului de realizare a analizei
factoriale. Totu;;i, analiza' principale implica parcurgerea acelorai
elape,
144 '
5.1.3. Design-ul {ji metodologia analizei factoriale
Obiectivul acela de a identifica factorii care influenteaza
atributeLede fi eficient printr-o singuracefcetare. 'Yom
avea nevoie de mai p:Julte studii eare sa eonduca treptat la 0 eunoatere buna a
atributelorirtterne, Nu se urmarete doar 0 simpla. replicare a lor, Dimpotr(va, prin
modificarea i, mai ales, prin modificarea ,bateriei
(setului de itemi) yom ajunge la clarificari conceptuale eseniiale. De exemplu, daca
un studiu nu reuete saevidentieze foarte clar un anumit factor, care are
importanta teoretica, putem retine itemii care au fost puternic saturaii Tn factorul
respectiv, putem elimina itemii care nu au dat satisfaciie In aceasta privinta i
putem introduce aliii, care par a masura factorul respectiv.
Orice studiu care implica analiza factoriala exploratorie rezida In
parcucg(;;lcea urmatorilor pai:
(a) alegerea tipului de care vafi analizata i a l11etodei de extragere a
faetorilor; . .
(b) stabilirea numarului trebuie extrai;
(c) rotirea f?-ctorilor pentru a facilita este cazul);
(d) identificare}lfjgtyrii factorilor ;;i interpretarea-rezultatelorgasite.
Vom aborda detaliat fiecare aspect pornind de la urmatorul exemplu din
psihologia educationala.
Didactogenia este actiunea involuntara a cadrelor didactice soldata cu a serie de
consecinte negative asupra elevilor. lntre cele mai raspandite astfel de actiuni, se regasesc
ridiculizarea elevului in public; favoritismul incorectitudinea Tn nolare; respectiv
agresivitatea verbala a dascalului. C;;onsecintele acestor actiuni asupra elevului pot fi
grupate in: efecte pedagogice (ex. scaderea motivatiei absenteism, 9colar
etc.); efecte psihologice (ex. stima de sine scazuta, mutism electiv, manifestari anxioase,
frustrare crescuta); efecte somatice sau medicale (ex. dureri de cap, aciditate gastrica,
tulburari intestinale etc.) (Poenaru, 1980; Poenaru i Sava, 1998).
Yom analiza, Tn continu'are, 0 scala menila sa evalueze aceste efecte la elevii de
liceu. Proba conIine 15 itemi care necesita raspunsuri pe a scala de tip Likert cu raspunsuri
notate de launu la cinci. Ea a fost prezentala intr-un studiu anterior, In care se urmareau
efectele atitudinii conflictuale, ostile a profesorilor asupra elevilor (Sava, 2002). Cercetarea a
avut un de 946 de elevi, care trebuiau sa evalueze un numar de 111 profesori.
Astfel, fiecare profesor era caracterizat in medie de 8,52 elevi. Deoarece analiza factoriala
porne9te de la asumptia independentei dintre cazuri, am realizat 0 medie a raspunsurilor
date de elevi pentru fiecare profesor caraclerizat. ,L\stfel, e9antionul total supus analizei
factoriale a fost de 111 subiecli.
Itemii scalei sunt prezentati Tn tabelul '5.1., iar baza de date este analiza facto ria/a
exploratorie.sav. Pentrw a realiza 0 analiza facioriala de acest tip in SPSS se utilizeaza
calea: "Analyze" - "Data reduction" - "Factor".
145
'11,111 1111 illIIIIIIIIIIIIIIIIIII,IIIIIIIIIUUUIIIUIUUlUUlUlIIJIIIIIIIIILIIII, 11111 IlIIi 111111111111111111111111111111111 !III 111111111' ,1111 111111111 1111' 11111111 !III'III' "I!" 'Ii 111'1111 '111i 1111 !IIIIIIII ,IIIIIIII! 1111111111111 1111111111 1111 ilill 1111 '11111' ill' III ,II! III 'II' III II; ill' ill illi 11111' II' II! II' :11: II' !II I',
Instrucjiuni:
Indicati in ce masura vi se potrivesc urmatoarele afirmatii utifizand scala de notare:
1 - nu mi se potrivete deloc; 4 - mi se potrivete deseori;
2 - mi se potrivete rareori; 5 - mi se potrivete Tn totalitate.
3 - nu tiu I indecis;
Tabelul 5.1. Itemii scalei de evaluare a efectelor psihologice, somatice !?i pedagog ice
ITEM I
1. Tmi plac orele de X. 1 2 3 4 5
2. Daca ar fi dupa mine a!? chiuli de la ora de X. 1 2 3 4 5
3. Daca toate disciplinele de la Bacalaureat ar conta la fel, a!? alege sa 1 2 3 4 5
dau examen la X.
4. Ma plidisesc repede la orele de X. 1 2 3 4 5
5. Tmi place sa Tnvalla X. 1 2 3 4 5
6. M-am simjit umilit de catre profesor. 1 2 3 4 5
7. ProfesorulTmi insufla Tncredere Tn forjele proprii. 1 2 3 4 5
8. Mi-am imaginat moduri de razbunare pentru suferinla prilejuita de 1 2 3 4 5
conduita profesorului.
9. Cand ma gandesc la ora de X simt un golTn stomac. 1 2 3 4 5
10. Am uneori impresia ca nu sunt Tn stare de nimic. 1 2 3 4 5
11. Tn general ma simt plin de energie la !?coala. 1 2 3 4 5
12. Tn timpul orei de X palmele imi transpira mai tare decat la alte ore. 1 2 3 4 5
13. Dupa 0 zi de !?coala spatele (gatul) meu devine Tncordat. 1 2 3 4 5
14. Mi ,s,a intamplat sa mi se faca rau la !?coala. 1 2 3 4 5
15. Dupa ora de X ma simt obosil. 1 2 3 4 5
Unde X vizeaza disciplina predata de cadrul didactic evaluat.
5.1.3.1. Tipuri de i metode .df!extragere a factorilor
Aceasta etapa este una pregatitoare. in contextul EFA exista doua tipuri de
rnat(i,Q,i: cea de cor.elatiELLgea de covarianta. A,?a cum Ie spune numele, prima
este 0 forma"stEiridardizata a celei de a doua. Matricea de coreJatii este modalitatea
eel maifrecvent folosita datorita u,?urintei interpretarii relatiilor dintre variabile ,?i a
saturatiei ,acestora Tn factorii extra,?i. Metoda are ,?i un mic dezavantaj, Tn
cu matricea de covarianta, introducand 0 cantitate 5uplimentara de
eroare , ca rezultat al standardizarii. Tn cazul unor date masurate pe scale foarte
di'ferite' ca amplitudine (ex. de reactie exprimata Tn ms ,?i randamentul ,?colar
exprimat Tn medie este binevenita standardiz?rea variabjlelor Tnainte de a
opta pentru matricea de corelatii sau cea de covarianta. in alte cazuri, Tn care totii
itemii folosesc aceea'?i scala de f!lasurare, nu este necesara standardizarea
variabilelor. Pentru scala de fata, yom pastra datele brute Tn vederea analizei !iii
yom opia pentru matric.ea de din ratiunile mentionate mai sus.
146
IIIIIIIIIIIIIIIIIIIIIII,IIIIIIIIIIII!IIIIIIII, ;11" !IIII IIIII!IIII 11111'1111 ,1111 111111111111111LlIIII"11111dIIUIIII'IIIIIJIII,jIIlUIIIII 11111 !IIIII 11111 !IIIII 111111 ,11111 111111,111111111111 1IIIII,IIIIIJllllllilldllili III1I'!III"IIII!II1:IIIIIIIIIIIIIIIIIIIIII';IIII,111111111111111 1111111111',11111 IIII!IIIII III!! 11111 1111111111 11111 III I II IIII! 11111,11111 !IIII 11111 !IIII! 11111 '11111 11111:,1111111111111111I11111111111111111 1111 !III: 1111 '1111 !III II II 1111'1111 IIII!!III1111 1111'1111 !IIIII
.. se incearca gasirea unui "pattern" in matricea de
Pnntr-un algontm sunt calculati anumittp:arametri (ex. saturatia
gradu.I de comunalitate etc.) care conduc la un al
cat mal aproplat de cea observata Tn realitate. Daca cele doua matrici au
simila:-e, implicit valori reziduale scazute, putem afirma ca
solutla este adecvata: In cazul unei matrici red.!:!.s.e. ca marime, gasirea: unui
"pattern soar putea face Inspectand vizual .,gorelatiile obtinute. Tntr-o matrice
complexa, acest lucru devine imposibil, analizei factoriaie revenindu-i meritul de a
sesiza eventualul "pattern" intre corelatii. Tn exemplul nostru, matricea de corelatii
obtinuta a fost: '
Tabelul 5.2. Matricea de corelajii dintre cei 15 ilemi ai scalei
item
2 3 4 5 6 7 8 9
10 11 12 13 14 15
1. ed01
2. ed02 .60
3, ed03
4. ed04
5. ed05
6, ed06
7. ed07
8. ed08
9, ed09
.73 .54
.71 .64 .56
.62 .53 .66 .50
.55 .40 ,35 .35 .36
.53 .37 .40 .44 .51 .36
.53 .50 .27 .38 .39 .73 .38
.54 .41 .30 .39 .29 .66 .46 .61
10, ed10 .27 .19 .09 .18 .12 .50 .21 .39 .48
11. ed11 .07 ,15 -.06 .00 .10 .05 .09 .03 .01 .22
12. ed12 .32 .20 .18 .16 .21 .51 .22 .48 .64 .50 ,.06 __
13. ed13 -.01 .04 -.04 -.07 .05 .05 -.08 .05 .02 .08 .28 -.02 ,_
14. ed14 -.08 .16 -.07 .00 ,.03 .02 .03 .06 .03 .24 .27 ,05 .39
15. ed15 .53 .44 .34 .40 .37 .59 .36 .61 .67 .47 .13 .57 .15 .15
Coeficienjii .Tngro!?ati sunt semnificalivi la p < .01
Tn privinta metodelor de extragere a exista 0 diversitate de
alternative. Probabil, cea mai Tntalnita metoda este analiza factoriala a
componentelorprincipale, care este optiunea standan;!}rLSPSS.
Tnt:e uaceasta analiza ,?i analiza componentelor principale, Tn sensul,' ei .clasic, nu
eXlsta un sern.n-de egalitate. SPSS-ul nu ofera posibilitatea realizarii metodei
componentelor principale clasice. Ceea ce face SPSS-ul sub denumirea "prlncipHI
method" nu este altceva decat analiza .. a componentelm
.. , dintre cele doua este minima constc'l Tn fnptlll cl
?p\lunea din SPSS conduce la 0 standard.L:;::are .. suplimentartl dl.lpl'l rollra,
Introducand 0 sursa suplimentara de ,eroare. Varianta claslc:1'I a 11111111;1'11
comp?nentelor principale poate fi regasita Tn PRELIS din cadn'I progrMl1llllul
statistiC LlSREL. 0 alta modalitate de-extFagere, intalnlta destul do frecvant, ".tl'l
147
'II 11I,lIi '1I"li li'li lII'il,,1I il' III
, 11111
'
111111 111,'111111
'
111"11"1
analizc.U9torilorprincipali (In engleza "principal axis factoring"). Ambe\e metode au
avantajul ca nu sunt foactepretentioase Tn ce privete prezenia unei distribuiii
multivari?te normale, dar i dezaiLantajul ca pot conduce la solulii relativ diferite,
daca sunt analizate pe baza matricei de corelatii sau a celei de covariania. Dei
sensibila la forma di;:;;tribuiiei datelor, analiza factoriala bazata pe estimarea
verosimilitaiii maxime(in engleza "maximum likelihood factor analysis") nu este
afectata de tipul de mgtrice analizata. Tn plus, are marele avantaj de a
de semnificatie. statistica a saturaiiei factorilor i a corelaiiei dintreJactorii extrai.
Aceasta constitule 0 noutate in domeniul analizei factoriale exploratorii i poate fi
valorificata utilizand programul. CEFA (Comprehensive Exploratory Factor
Analysis). Programul, realizat de cercetatori de prima seama In domeniu, poate fi
descarcat gratuit de pe internet (Browne, Cudeck, Tateneni i Mels, 1998). SPSS-
ul, dei contine posibilitatea extragerii factorilor cu aceasta metoda, nu ofera
avantajele prezente In CEFA. Singurul indicator prezent in SPSS, legat de gradul
de potrivire a modelului, nu este de mare ajutor, fiind bazat pe 0 distribuiie 'X:, deci,
foarte sensibilia volumul eantionului. -Totui, daca yeti folosi aceasta metoda, yeti
extrage cel mai mic nUr)lar de factori de la care 'X: devine nesemnificativ statistic,
fapt ce Tnseamna ca nu mai exista diferenie semnificative Tntre matricea de
corelatii (covariabile) observata i cea estimata pe baza factorilor extra$i.
5.1.3.2. Metode de selectare a numarului adecvat de factori
Tn stabilireaJ;U,JJn.arl!J.YL.cle factori trebuie sa realizam 0 balanta Tntre
principjul parcimoniei (variabilele sa fie influentate de un numarcatmai mic de
l<:jgtori)f"p;inci'p'iuL,a'curatetii (obiinerea unui suficient
existente) .-
. Tn ceea ce ne privete, am putea distinge doua categorii de metode: statice
(a priori) i dinamice. in prima categorie voi include metode ce utilizeaza
sele-c.\ie prestabiiite::"
Criteriul explicatii
Un astfel de caz este criterlU'r'p-rocentajul!:!ide disper!3ie_ explicata (intalnit
in special in metoda componentelor principale).-Un cercetator poate_decide in
avans 0 de explicata pe care sa 0 considere
satisfa..?_i1toare.-Sa presupuheri(ca el 5e asupra unui procent de 70%. Tn
aceasta situaiie, el va selecta ataii (factori sau componente principale)
cati sunt necesari pentru a explica acest procent. Dezavantajul major al metodei
este dat de caracte,CuLsubie,ctiv alacestor repere a priori. Nimic nu ne oprete sa
decidem la fel de bine in favoarea unui procent de 60% din dispersie. Mai mult, in
cazul analizei factoriale. multe dintre cercetarile publicate se muliumesc, Tn cazul
$tiintelor sociale, cu un procentaj de 40%.
Tn. cazul problemei noastre, extragerea a trei factori comuni, care explica
63% din totalul dispersiei poate fi considerata multumitoare. Rezultatele oferite de
SPSS 11.0 sunt prezentate in figura 5.2. '
148
Merita sa fie mention ate cateva aspecte. Mai Tntai, procentajul se
stabilete pe baza valoriioceigellye9Joriior extrai, denumite eigenvalue. Til cazul
utilizarii matricelor de corelatii, eigenvalue pentru fiecare variabila inclusa in studiu
cu unu. Pe baza acestei inf()rmatii putem observa puterea explicativa a
fiecarui factor extras. Astfel, primul factor. are un eigenvalue de 5,90 ceea ce
inseamna ca puterea"sa explicativa este aproape egala cu suma 8ase dintre
cincisprezece_itemi ai scaleL Valoarea explicata prin suma celor treieigenvalue
corespunzatoare fadorilor extrai sec pastreaza i dupa rotire. Tn situatii Tn care
etectuam rotatiLgrtogonale se pastre"aza i procentajul de 63%. Totu$i, dupa 0
rotire p,recum in cazul problemei de tata, procentajul explicativ al factorilor
extrai nu mai esteprecizat, deoarece suma acestora depaete totalul dispersiei. '
Tn sfarit, putem desprinde valoarea factor, inainte i
dupa, ro!ire. Astfel, Jnainte de rotire, primul factor explica din -totalul
dispersiei; eel de-al doilea, 13,53%, iar uitimul, 10,75%. Totalul acestora era de
63,62%. Dupa rotatia oblica, se observa 0 relativa egalitate intre valoarea
explicativa a primilor doi factori (eigenvalue de 4,81, respectiv 4,60), Tn timp ce al
treilea factor are 0 putere explicativa mai redusa (1,80).
Total Variance Explained
Initial Eioenvalues Extraction Sums of Souared Loadinas
Component Total % of Variance Cumulative % Total % of Variance Cumulalive%
1 5,901 39,341 39,341 5,901 39,341 39.341
2 2,030 13.530 52,871 2,030 13,530 52,871
3 1.614 10,757 63,628 1.614 10,757 63,628
4 ,834 5,557 69,184
5 ,739 4,925 74,109
6 ,673 4,485 78,594
7 .627 4,179 82,772
8 .510 3,398 86,170
9 ,492 3.277 89,447
10 ,360 2,401 91,848
11 ,336 2,238 94,086
12 ,298 1,989 96,075
13 ,238 1.588 97,663
14 .206 1.372 99,035
15 .145 ,965 100,000
ExtractIon Method. PnnClpal Component AnalYSIS.
a. When components are correlated, sums of squared loadings cannot be.added to obtain a total variance.
Figura 5.2. Output-u{ SPSS 11.0 vizand numaru{ de (actori extrai
SPSS este 0 marca Tnregistrata.
Criteriul lui Kaiser
Rotation
To\al
4,816
4,605
1,802
Un alt criteriu, extrem de popular in selectia factorilor este regula,,1wi
acesteia, vor fi selectati un numar de .. egali cu
care sunt mai maridecatunu.Adica var fi relinuti factorii
care a;:ro mai mare de;-it 0 variabila cont ca
aceasta este compusa, nu numai din i din factor;
149
de masurare. Regula are 0 validitate acceptabila. ea prezinta 0 serie de
dezavantaje: poate fi aplicata doar Tn cazul analizeUqctorialea-matricelor de
corelat
ii
,. nu ofera criterii de decizie clare. Tn cazul Tn care obtinem valori foarte
apropiate de pragu\ critic unu-(ex. eigenvalue = .99 sau 1.02), tinde sa
.necesari. Tn cazul unor mari,
Tn situatii 'GU mai putin de 30 de variabile care toate au 0 comunalitate mai mare de
.60, se a fi un indicator valid, la fel de eficient ca celelalte metode
prezentate Tn continuare.
Pentru exemplul nostru se observa ca primii trei factori Tndeplinesc conditia
de a ave a un eigenvalue mai mare decat unu (5,90; 2,03; 1,61), fapt ce indica 0
solutie trifactoriala.
Criteriul grafic.alJu!Gattel
Din categoria metodelor. ne yom opri asupra metodei
reprezentarii grafice a lui Cattell, sub numele de asupra
metodei analizei paralele propusa de Horn. Scree plot-ul este 0 reprezentare
grafica a pentru fiecare factorposibil a fi extras. In situat
ia
concreta este YOrba de 15 factori posibili, dat flind faptul"cascala contine 15 itemi.
sunt prezentati pe abscisa" Tn timp ce pe ordonata sunt trecute valorile
eigenvalue. Principiul- selectiei' tine seama de acel numar de factori de la care
sofutia' nu se Grafic, acest lucru aparereprezentat sub
forma unei coti!!Jri ce ihdica ideea unel rupturi Tntre situatiile anterioare, Tn care se
constata Tmbunatatiri semnificative ale solutiei situatiile ulterioare, Tn care
solutiile se amelioreaza nesemnificativ. Graficul SPSS al problemei date este vizibil
Tn figura 5.3.
Scree Plot

i 1
ill __ ____
1 2 3 4 5 6 7 a 9 10 11 12 13 14 15
Component Number
Figura 5.3. Analiza numarului de (actori ce trebuie extrai pe baza de scree plot
SPSS este '0 marca Inregistrata.
Se observa, pornind de la dreapta spre stanga, ca linia Tnceputa Tn dreptul
celui de-al cincisprezecelea factor continua pana la nivelul fac1:orului patru. Primii
150
trei factori se afla deasupra acestei lin ii, dupa acel punct de cotitura. Tn consec' tV
f
. t' A In a,
vor I ex ducand la 0 solutie adecvata cu trei factori. '
Metoda a condus, mai mereu, la rezultate valide. Dezavantajul utilizarii ei
apare Tn situatii Tn care punctul..:aecotitura nu este atat de evident, fiind dificila
localizarea identificarea acestuia.
Metoda analizei paralele
Metoda analizei paralele se bazeaza, cum arata numele, pe
compararea ... datele observate un set de date
Pe baza simularilor se pot stabili valori ap'roxlmative eigenvalue Tn
functie de numarulde subiecti, numarul de de factori In
aceste conditii, principiul de selectie stipuleaza extragerea acelor factori care au
eigenvalue mai mare decat cel '.' rezultat Tn urma analizei datelor
aleatoare.O analiza a lui Zwick Velicer (1986) arata ca aceasta metoda da
rezultate valide, indiferent de simularii. metoda are limite, cea mai
importanta fiind dificultatea de a deddEta-legerea_unui factor, Tn conditiile Tn care
exista Tntre intensitatea eigenvaluepbtinuta Ain date cea
corespondenta"rezultataTn urma simularii. Din pacate nu' ofera direct
posibilitatea realizarii unei analize paralele.
. In schimb, vom putea adapta ecuatia de regresie Allen
Hut>J:>ard (1986, apud Johnson Wickern, 1998) la datele oferite de SPSS pentru
a obtine aceasta analiza Tntr-un mod indirect. Ecuatia de regresie a fost dezvoltata
pentru a nu mai fi nevoiti sa realizam simulari pe date randomizate are ca
rezultat estimarea ... eigenvaluedin ..da!l standardizate (ex. matrice de
corelatii). Regula de selectie factori ai caror eigenvalue
este mai mare decat valoarea rezultata prin analiza datelor randomizate.
metoda a fost dezvoltata pentru analiza componentelor principale, rezultatele sunt
concludente Tn EFA.
Ecuatia de regresie are forma:
InAk =ak+bkln(n-l)+Ckln[(P-k-lXP-k+2)]+d InA (51)
2 k k-l'
unde: a, b, c d sunt ce pot fi luati din tabel;
n este volumul
peste numarul de factori posibil a fi (numarul de variabile manifeste),
k este un indicator ce face referire la un anumit factor.
Se mai postuleaza ca lambda zero sa fie egal cu 1.
151
""1,""'""1111111"11""1"""1""",""1:1"'""""11""1"""""","""111111111111111111111",,111111111'11111111111,1111,:111,1111,11,11111,111111,,1111"11""'"1111"11"",""1'""1""1""11"1"111"111,,"111""11,"11",111'11 III 1111 III,JIIIJIlI ,1111 1111,,1111,11111 1111 ,1111 1111:,1111 11111 1111 11111 ilil II 111111111,11111111111111111111111111
1
1111,11111111,1111111':111 ,111,111111111111111"11111111,111
lata cateva valor; ale coeficientilor a, b, c d pentru solutii de pana la opt
factori.
1
Tabelul 5.3. Valorile coeficien\ilor ecua\iei de regresie
K
a b c d K a b c d
.9794 -.2059 .1226 .0000 5 -.2670 .0360 -.0024 1.0899
2 -.3781 .0461 .0040 1.0578 6 -.2632 .0368 -.0040 1.1039
3
-.3306 .0424 .0003 1.0805 7 -.2580 .0360 -.0039 1.1173
4 -.2795 .0364 -.0003 1.0714 8 -.2544 .0373 -.0064 1.1421
Dificultatea metodei este determinata de caracteru,L:.Jne$tetic" al ecuat
iei
,
aspect contrabalansat de'acurateiea rezultatelor obtinute. .
Vom calcula in scop demonstrativ, valorile eigenvalue obtinute pnn
intermediul ecualiei pentru primii doi factori. Reamintim ca volumul a
fast de 111 profesori (n = 111), scala con\inea 15 itemi (p = 15) 9i ca, prin
conventie A zero este egal cu unu.
, primul factor vom avea:
(15-l-iX15 - 1+ 2)
InA, = .9794 -.2059 * In(111-1)+ .1226 * In . 2 ' + .0000 * lnl = .5811
Astfel, valoarea eigenvalue extrasa ih cazul primului factor (vezi figura
5.2.) a fost de 5,90, fiind mai mare decat cea oblinuta pe datelor :andomizate
(1,78). In consecinla, primul factor a trecut pragul de 91.va fi re\lnut. ,
Similar, putem calcula valoarea eigenvalue ob\lnuta din date randomlzate
9
i
pentru cel de-al do ilea factor:
(15-2-IX15-2+2)
InA, =-.3781+.0461i<ln(111-1)+.0004*ln 2 +1.0578*.5811=.471
A, = e .471 == 1.599
Eigenvalue oblinut din datele reale (2,03) este de asemenea mai mare
decat cel ob\inut prin aceasta ecua\ie (1.599). Prin urmare al doilea factor va fi
retinut. Calculand intensitatea eigenvalue pentru al treilea 9i al patrulea factor vom
obtine 1,46, respectiv 1,34. Compararea acestor valori cu cele ob\inute din datele
indica re\inerea celui de-al treilea factor (1,614), dar respingerea celui de-al
patrulea (0,834). Madar, prin utilizarea, unei adaptari a
contine tot trei factori. Utilizatorii analizei paralele obl9nulesc sa-91 prezlQte
sub forma unuigrafic asemanator celui din Figura 5.4.
---
I Cei interesa\i de situalii factoriale rnai cornplexe pot consulta Allen :;;i Hubbard (1986, apud
Johnson :;;i Wickern, 1998).
152
1,111111111111111111111111
Analiza paraJeJa
Q) 4
:::I
(;
reale'
3
Q) - 0- date randomizate
Ol
iii 2
2 4
, Numar factori
Figura 5.4. Reprezentarea grafica a ractori/or prin metoda analizei para/ele
In urma aplicariimai multor metode de selec\ie a factorilor, solulia favorita
indica extragerea a trei factori. lntr-un mod similar se procedeaza i Tn cazurile de
,",- analiza a componentelor principale. Prin utilizarea a doua sau a mai multor
modalitaii de seleclie ce of era aceea9i so lUlie, cresc semnificativ 9ansele ca
aceasta sa fie 9i solu\ia co recta pentru e9antionul respectiv.
5.1.3.3. Analiza statistica a factorilor extrai
, _,,,,,e,' .. ,
extraqerea factorifor, yom observa
fiecare factor extras. Comunpitli3tea se refera
la procentul din care este explicat de agtiunea comuna a factorilor
relim.iii 9i se fiecare"YClriabila in parte. comuni3,!Ltate.a este
ma(mare, cu atat acea variabila. este ,influentata mai mult de factoriiextra
9
i.
cu cat comunalitatea este'n,'ai cu' atat variabila respectiva este mai
pu\in influen\ata de actiunea com una a factorilor extra
9
i. In plus, conform teoriei
analizei factoriale prezentate anterior, este de
comunalitate se presupune a fi legata de .adica de erori 9i
specgifL Bunaoara, valorile comunalita\ii mai mici de ca influenta celor
trei factori este mai mica decat dispersia datorata unicitatii. Prin urmare,
itemii respectivi sunt mai PL!litl_saturaii in cei trei in dat, se
observa ca itemii referitori la nivelul de energie fizica 9i la gradul de incredere Tn
fortele proprii sunt cel mai pu\in explica\i de cei trei factori extra
9
i. in schimb, itemul
legat de preferin\a pentru obiectul de studiu 9i cel privitor la prezenta unor
probleme gastrice au cel mai mare nivel de comunalitate. Altfel spus, ei sunt in cea
mai mare masura influentatide cei trei factori extra
9
i.
153
Ii M /j, M WM ,IlJIIIIIIIIIUIIIII.IIIIII,IIIIIIIIIIIILIIIIIIIIIIIII.IlllllI1rIlllllIllllllII1ii irrr ,ill irrr:ill ml .III, [
, , ,I' III, ! I : : II, III iI : : ! I I :
Tabelul 5.4. Saturatia itemilor Tn cei tre; factor;
Eticheta itemi SATURATIE TN FACTORI Comuna/itate
2 3
preferinta obiect (1) ,837 -,311 ,079 ,804
chiul* (2) ,707 -,210 ,314 ' ,644
alegere examen (3) ,647 -,512 ,154 ,705
plictiseala* (4) ,686 -,389 ,164 ,649
Tnvatare obiect (5) ,664 -,389 ,253 ,656
umilinta suferita (6)* ,766 ,237 -,220 ,692
incredere perceputa (7) ,621 -,203 ,061 ,431
razbunare (8)* ,760 ,198 -,156 ,642
probleme gastrice (9)* ,775 ,264 -,286 ,752
lipsa incredere dO)* ,514 ,557 -,098 ,584
energie fizica (11) ,109 ,332 ,,61O ,493
transpiralie (12)* ,582 ,401 -,425 ,681
durer; musculare (13)* ,047 ,433 ,590 ,538
stare de rau (14)* ,082 ,504 ,569 ,584
oboseala (15)* ,769 ,309 -,053 ,690
Nota: itemii notal; cu asterix au fost recoda\i invers; Tn paranteze este trecut numarulde
ordine al itemilor in scala
Saturatia
Un a/t 'nivel de analiza este legat de In
fiecare factor retinut. Astfel, se obserVa ca itemul 1 este puternic saturat Tn pnmu!,
factor :;;i mai incarcat cu factorii doi :;;i Tn itemu.1 ii, par: a fl
inf/uentat mai ales de factorul trei :;;i prea putln cu cellaltl facton,
solutie initia/a este greu de de cele. mai on. datonta
dualitaiii saturatiilor. De exemplu, itemul 3 este Influentat, In re.latlv
de primii doi factori, iar itemul 12 pare a fi inf/uentat lntr-o masura relatlv
toti cei trei factorii. Aceasta stare de fapt nu este dorita, deoarece scoptll pnmgg:ll91
al 'ana/IzeiJactoriale este identific'llil9}actorilor extra:;;i. Acest lucru se_ face
doar dac<i' structura este simp/a, ceea ce inseamna ca flecare
variabi/a sa fie de un singur factor. Numai astfel yom putea
identifica cu c/aritate natura factori/or extra:;;i.
Structura simpH! . _
Pentru a-obtine 0 structura simpla se realizeaza 0 operatie suplimentara de
rotirE,a. factorilor. pe indelete aceasta operatie, sa
facem precizari suplimentare. pentru fiecare _nu
este altceva decat suma R.atr.S'ltelor factori,ale. Astfel, daca
itemul 1, observam suma patrate/or celor trei saturatii este egala cu
comunalitatea pentru itemul respectiv.
154
UlllllBlllmlllllllLIIIIIUIIIII:
0.804 == (0.837)2 + (-0.311)2 + (0.079)2
Valoarea comuna/itatii se pastreaza :;;i dupa rotire, chiar daca saturatii/e
variabilelor IQ..factorii re'Spectivi se vor schimba. Tntr-'un mod similar putem"exphca
intensitatea eigenvalue, de:;;i, spre deosebire de comunalitate, valorile sale se
modifica In urma rotirii. Daca observam pe verticala, gradul de saturatie a fiecarei
variabi/e Tntr-un anumit factor yom putea obtine nivelul eigenvalue. De exemplu,
intensitatea primu/ui factor po ate fi obtinuta dupa formula:
5,90= (0.837)2 + (0.707)2 + (0.647)2 + '" + (0.769)2
5.1.3.4. Rotirea factorilor
Tn urma se/ectarii numarului adecvat de factori yom putea stabili saturaiia
.' ....-.. . :"":"''''''-''-'-'' .-.
intr-un anumjUC:l.c:
t
9r peot[U-"fil'lc:p,Le',iterIL[rLparte. Acest fapt este necesar 'in
interpretarea De fapt, tabe/ul prezentat anterior se constituie, intre
. anumite limite, a corelatiilor care exista intre fiecare item al scalei :;;i
factorii extra:;;i. Ca in orice proces de corelaiie, cu cat saturatiile.erau mai mari, cu
atat exista 0 legatura rnai puterniC[Tntr.eJactorul respectiv :;;i contil1utul itemului in
cauza. Au fost propuse mai multe praguri valorice ale gradului de saturatie de la
care sa se considere ca 0 anumita variabi/a este Tncarcata in factorul respectiv,
Ce/e mai Tntlnite sunt pragurile de .30, .40 :;;i.50 .. Ce 'inseamna aceste praguri
daca apelam la interpretarea coeficient11or de determinare corespondenti? Luarea
in considerare a unei saturatii de ,3D indica 0 dispersie comuna de numai 9% (.302)
intre factorul incauza i variabila respectiva. Acceptarea unui prag de .40 indica
selectarea acelor itemi, ale caror dispersii sunt in prop0rtie de 16% influentate de
factorul in cauza. Tn sfar:;;it, acceptarea unui prag de .50 ca limita pentru Cl
considera ca un item este saturat in factorul'respectiv, indica 0 dispersie comuna
de 25%. Desigur, aceste valori de corelatie sunt dependente
e:;;antiQllului, deoarece 0 data cu creterea acestuia Yom obtine va/ori tot mai mici
ale coeficientului de corelatie. fn aceste conditii, autori precum Hair et al. (1998)
propun cateva pra'gurlde care sa ofere 0 putere statistica de .80, Tn
conditii/e unui p < .05. Astfel, Tn cazul a 100 de subiecti, pragul minim de la care
putem spune ca un factor inf/uenteaza 0 anumita variabila Tn timp ce un
prag de ,30 este suficient pentru un volum al de cel putin 350 subiecti.
De retinut ca aceste valori nu trebuie interpretate 'in termeni absolutL Astfe/, nu
putem spune ca un item nu este inf/uentat de uri anumit factor, daca saturatia sa
este de .53, la un e:;;antion cu 100 de persoane. Tn schimb, putem aprecia ca 0
saturatie de .33 nu merita a fi luata In calcul, de:;;i valoare ar fj fost mai
relevanta pentru un eantion de 400 de persoane.
Analizati dinamica saturatiilor din tabelul qnterior pentru cei 111 profesori
evaluati. Se observa ca cei mai multiitemi sunt incarcati in primul factor (ex. toti
itemii, cu excepiia 11, 13 :;;i14). Acest rezultat este normal pentru 0 solut
ie
nerotita.
155
Merita, de asemenea, mentionat ca exista 0 serie de itemi care @auo.-.t[u.c
tura
simpla, par a fi influeniaii de aciiunea a mai multor factori (ex.
3, 10, 12, 13 i 14). Acest rezultat Ingreuneaza interpretarea factoriala a solu\lel.
De aceea, se obinuiete frecvent sa se apliee a elimina
aceste probleme i a obtine structura cecunai simpla.
. Criteriul structurii simple a fost definit de Thurstone. Ce Inseamna acest
lucru'? Din multitudinea,de rotatii posibile, cele care concfucla structuri simple vor fi
mai uor interprelbile_i avea 0 __.!:eala. Aceasta
structura simpla duce la unor saturSlWridicate Intr-un
redusa In De asemenea, numarul de item! saturati In primul factor va
scact-e';3 reechilibrand Intr-o anumita masura, modul in Gare fiecare factor extras
la explica:ea dispersiei. Vom selecta patru din' itemii care par a fi
incarcati In mai mult decat lin singur factor.
Tabelul 5.5. Itemi cu structura factoriala complexa
alegere examen (3)
,,647 -,512
plictiseala* (4)
,686
-,389
!ipsa fncredere (10)*
,514
,557
transpira\ie (12)*
,582
,401
Rotirea factorilor poate fi mai uor jnteleasa prin apelul la reprezentarea
grafica din figura 5.5. Grafic, factorii sunt repreze.ntati prin sistemul de axe, iar 0
variabila situata In apropierea unei axe indica saturatie crescuta In acea
dimensiune (factor). Inainte de rotire, pozitia celor patru variabile era incerta pentru
a desemna i interpreta eei doi factori. Toate cele patru variabile erau situate
aproximativ la jumatatea distantei dintre sistemul initial de axe. Prin rotirea
celor'doua axe, eu aproximativ 40 In directia acelor de ceasornic, structura
s-a simplificat (vezi liniile punctate). Astfel, se observa ca itemii 3 i 4 sunt foarte
156
Factorul2
Factoru12
./'10
12
Factorull
Factorull
Figura 5.5. Schematizarea procesului de rotire a factorilor
Tn factorul 1 i prea puiin in cel de-al doilea. Tn schimb, poziiiile apropiate,
ale itemilor 10 i 12 de cea de-a doua axa indica 0 saturatie puternica in acest
factor i 0 siaM saturare Tn primul.
Tn vederea obiinerii structurii simple au fost dezvoltate maimulte modalitati
de rotire a factorilor. Cea mai importanta distinciie intre acestea imparte rotirile
doua categorii: ortogonale i oblice (Kachigan, 1991; Pedhazur i Schmelkin
" . . )
1991). In cadrul sunt constrani sa ramana necorelati,
adica sa formeze un de 90. Figura 5.5 prezinta 0 astfel de rotire,
ambii factori sunt redireciionati spre dreapta cu aproximativ 40. Acest fapt meniine
unghiul drept dintre cei doi factori.
In schimb, rotirile"",Q_bJice.,_presupun redirectionarea factorilor cu intensitati
lucru face ca dupa rotire, unghiul dintre sistemul de axe srilu fie
90. Transpusa in termeni statistici, aceasta informatie precizeaza ca-factorii
intre ei, nefiind independenii unul de Figura 5.6 prezinta .
grafic diferenia dintre cele doua modalitaiide rotire.
ROTATIE ORTOGONALA
../ ... ..................
,,/
,-
.:r........,
..,.... . ....
ROT ATlE OBLICA
.............
............" .........................................
. ...
. ..... ..... ....
.................. .., .."" .." ..,.,., .....
..........
Figura 5.6. Tipuri de rotiri ale factorilor
Alegerea dintre cele doua tipuri de rotire este dependenta de cunotintele
pe care leavem despre variabile i despre presupuii factori extrai. Oaca credem
ca exista corelatii intre dimensiunilelatent(3_E:!,xtras.e,' ar trebui sa optam pentru rotid
Daca consideram ca factorii extrai nu trebuie sa coreleze, yom alege
rotirea ortogonala. Evident ca alegerea greita a se
soldeazacCl"obtinerea unei soluiii fndepartate de cea mai simpla structura, fapt ce
Tngreuneaza interpretarea factorilor.
In cazul nostru, obieetivul specificat era de a distinge Intre efectele
educaiionale, psihologice i somatice rezultate in urma didactogeniei. Ne
ca aeeste dimensiuni sa fie independente, adica sa nu coreleze deloe? Putin
probabil. Bunaoara, elevii de comportamentele inadecvate ale profesoril'or
157
1111111111 1111111111 111111111111 IIIIII!IIIII 111111,11111 11111 :1111111111"1111111111 ,lllllllllllllli 1IIIIIIIIi iIIlll 11111 1IIIIIIIIIIIIUlIIIII:II""._____
pot suferiatat Tn plan somatic (ex. "Dupa ora de X ma simtobosit".), cat i Tn plan
educational (ex. "Daca a avea posibilitatea, a chiuli de la. ora de X".). Aceste
efecte se pot Tntrepatrunde, fiind probabiJa unei corelaiii Tntre cele doua
seturi de efecte. Lucrurile ar fi stat diferit, daca ne-am fi propus realizam 0 proba
de evaluare a flexibilitatii i am fi dorit sa pastram cativa itemi lntr-o subscala de
minciuna. Informatiile teoreticein domeniu nu specifica existenta vreunei relatii
intre flexibilitate i scala de minciuna. Tn aceste conditii, s-ar fi impus utilizarea unei
rotiriortogonale pentru a 0 structuro3 cat mai simpla.
Dincolo de aceasta distinCiie esentiala, putem identifica mai multe
modalita.ti de rotire a factoriJor (Garson, 2000; Field, 2000).
(Vaiimax
sCtt3'"acest nume se gasete cea mai utiJizata rotire factQrialade tip
ortogonal. Ea li propune sa minimizeze numarul devariaqile .care au 0 saturatie
crescuta Jntr-un anumit factor. Aceasta' Cluee itemiJor: 0 parte
avand saturatii crescute Tn acel factor, 'iar cealalta parte, 0 saturatie scazuta.
Aceasta rotire este recomandata in toate Tn care decidem sa rotim
ortogonal factorii i reprezinta optiunea standard In SPSS.
,Quartimax ..\
E;iteo rotire o!1ogonCllaaltemativa. Ea li propune sa minimizeze numarul
de factori nec6!?ari'pentru a explica fiecare variabila. Tehnica este mai putin folosita
deoa;ce tinde sa determine majoritafeavaria'bilelor sa fie saturate singur
factor. Totui, Tn situatiile In care teoria afirma unui factor general unitar
(precum factorul 9 din domeniul inteligentei) este recomandata aceasta rotire.
Qirel?t oblimin
Aceasta este 0 rotire oblica fle)(ipila, deoarece permite factorilor sa
intensitati variate, prin modlflcarea valorii lor delta. Tn SPSS, delta este
prestabili(la valoarea' zero, ceea ce lnseamno3 ca nu-pE;r;;ite corelatii ridicate lntre
factori. 0 astfel de valoare duce frecvent la valori absolute ale coeficient
ilor
de
corelaiie intre factori cuprinse intre 0 i .50. Delta poate fi modificat intre valorile .:...
0.8 i 0.8. Valorile pozitive permit corelatii ridicate intre factori, fiind posibile i
valori ale coeficientilor de corelatie de .80. Similar, valorile delta negative permit
corelatii foarte mici, coeficientii de corelatie fiind inferiori celor obtinuti daca
pastram delta egal cu Desigur ca valoarea delta va. fi stabilita tot din ratiuni
teoretice. Totui, pentru cele mai multe situatii, valoarea standard (delta = 0) poate
fi pastrata. Aceasta rotire este cunoscuto3 i sub numele de rotire directa quartimin,
fiind cea mai lntalnita rotire din categoria celor oblice.
!omax
Tn 'fine, 'Promax este 0 alta procedura de rotire oblica, mai putin utilizata
datorita pretarii sale mai ales la eantioane foarte mari aceste
tipuri de rotiri sunt prezente i intre optiunile SPSS: "-'0 "- '
Rezultatele obtinute In urma rotirii factorilor sunt structurate In doua matrici
finale: matricea . SPSS': i matricea
mod.Jului (in SPSS: factor matrix). De remarcatca aceste matrici sunt
158
in_9i3drul r:otatiilor ortogonale, caz in care SPSS-ul of era
o matnce (In engleza "rotated component matrix" sau "rotated factor
matnx").
Matricea structurii factoriale matricea modelului factorial
.' contine corelatiile olJinuite(ge ordinul zero)
dlntre vanabllelepqginaleiJactoriirotiti. Cu cat 0 corelatie este mai mare cU'a-tat
variabila respectiva e5te mai strans legato3 de factorul re'spectiv. Tn situatii' Tn care
factorii sunt corelati Tntre ei, valoarea corelatiei dintre item i un factor
:ste (in:luentata) de relatia dintre ceilalti factori extrai i itemul respectiv.
In .. schlmb: matncea. modelului factorial engleza "weights")
.In determmarea scor,lJlyL Acestea sunt corespon.gentul
beta din ecuatia de regresie. Ponderarile indica influenta
"pura" a unui factor asupra variabilei respective, eliminand influenta
alte cuvinte,
semiPcar.\iaJa in. situatii de standardizare a datelor. Cele doua' au
similare}n. conditiile Tn care factorii Tntre corelatiei
dintre factori este tipica cazurilor in care soTlitiile factoriale obtinute nu\au fost rotite
sau au suferit rotiri de tip Qx1:.o.g().nal. Din pacate, asemanarile ele creeaza
confuzii unii cercetatori, matricea modelului factorial fiind interpretata greit,
ca 0 matnce de corelatii dintre variabilele i factorii extrai (Pedhazur i Schmelkin
1991; Kline, 1993). '
In cazul rotirilo.Loblice,. SPSS-ul of era, complementar, 0 matrice de corelatii
!ntre factoriieJ:<1rai, pentru' a'sesiza structura i intensitatea relatiiJor dintre
In efectelor psihologice, educationale i' somatice din cazul prezentat
antenor, SPSS-ul of era urmatoarea matrice de corelatii intre factori:
Component Correlation Matrix
Component 1 2 3
1 1 ;000
2 ,404 1,000
3 ,010 ,110 1,000
0
Valoarea ingrosata este semnificativa statistic la p < .001
Figura 5.7. Output SPSS cu matricea core/atiilor dintre ractori
SPSS este 0 marcii Tnregistrata.
Tn figura 5.8 sunt prezentate matricile de baza oferite de SPSS. Tn cele
doua se observa 0 asemanare in structura dupa rotirea oblica a celor trei factori
Matricea modelului factorial indica 0 grupare a itemilor 1, 2, 3, 4, 5 i 7
dupa primul factor, a itemilor 6, 8, 9, 10, 12 i 15 dupa al doilea factor, respectiv a
159
II 1111111,1111111111'111111111111111111111"111111111111 I!I"III III! 1111"111"111 III '!'IIIIIIIIII"IIIII!III:IIII"IIII!I!'I! !I,
III"II:!I!II! '111,111 Im:mlfllJII "1iII1iII:'lII:1iII,'IIIIW/I,WI:!I:I
'Iii.',m 1M ',I II, i I!' ": L 1 'J 'I II,'III! IIII! 1111 III',II! !II I!IIII' I! 11I'_IIIIIIIIlIlliIlIlIll'_I'"_____ ,
itemilor ii, 13 ;;i,14 dupa al treilea factor. Matricea structurii factoriale, ne arata
corelatiile dintre fiecare item i factorii Tn cauza.
Pattern MatriX' ,
Component
1 2 3
ED03 ,868 -.099 -,100
ED05 ,831 -,059 ,048
ED04 ,803 ,007 -,028
ED01 ,797 ,200 -,057
ED02 ,749 ,059 ,194
ED07 ,572 ,167 -,026
ED12 -,145 ,877 -,144
ED09 ,147 ,803 -,085
ED10 -,153 ,756 ,216
ED06 ,192 ,738 -,042
ED15 ,217 ,693 ,139
ED08 ,248 ,669 -,007
ED14 -,069 ,074 ,753
ED13 -,028 -,009 ,734
ED11 ,098 -,061 ,702
Extraction Method: Pnnclpal Component Analysis.
Rotation Method: Oblimin with Kaiser Normalization.
a, Rotation converged in 8 iterations.
Structure Matrix
Comoonent
1 2 3
EOOl ,878 ,516 -,027
E003 ,827 ,240 -,103
E005 ,807 ,282 ,050
E004 ,805 ,328 -,019
ED02 ,775 ,383 ,208
E007 ,639 ,395 -,002
ED09 ,470 ,852 ,004
ED06 ,490 ,811 ,041
ED12 ,208 ,803 -,049
ED15 ,498 ,796 ,218
ED08 ,518 ,768 ,070
ED10 ,154 ,718 . ,298
ED14 -,032 ,129 ,760
ED13 -,024 ,060 ,732
ED11 ,081 ,056 ,696
Extraction Method: Principal Component Analysis.
Rotation Methoq: Oblimin with Kaiser Normalizatiol
Figura 5.S. Matricea modelului factorial (Tn stanga) i matricea structurii factoriale (Tn dreapta)
SPSS este 0 mardi Imegistrata.
5.1.3.5. Interpretarea naturii factorilor
Pornind de la matricea rezultata In urmC3 rotir]lJ:'I?!Cl.rilo.
r
yom urmari sa Din ambele matrici ale figurii 5.8.
observa ca primul factor este prezent Tn itemul 7 ;;i In primii cinci itemi. Corelatla
acestor variabile cu factorul respectiv variaza Intre .639 ;;i .878. Cu cat corelat
ia
este mai mare cu atat variabila respectiva are un rol mai mare In interpretarea
factorului. Se pune Intrebarea generala, ce au Tn comun aceste variabile saturate
puternic In primul factor? In plus, ce diferentiaza acest set de varia bile de
care nu au obtinut saturatii ridicate In factorul respectiv? Din analiza de cont
lnut
(vezi matricea 'modelului factorial din Figura 5.8. ;;i tabelele 5.1 sau 5.4) reie:e
cei itemi privesc efectele Tn plan pedagogic, ei fiind strans legat
i
de motivai
la
;;colara. Astfel, elevii afectati In aceasta directie nu sunt atra;;i de orele
absenteaza de la acele ore atunci 'cand au ocazia, nu Tnvata la diSCI pima
respectiva ;;i evita contactul cu aceasta. La celalalt capat, se afla elevii care nu
sunt afectati In plan pedagogic, cei carora Ie face placere sa Invete ;;i sunt atra;;i
de disciplina respectiva, participand activ la orele respective.
160
Tntr-o maniera similara se procedeaza la analiza ;;i interpretarea celorlalii
factori. Astfel, factorul doi pare a fi strans legat de itemii 6, 8, 9, 10, 12 i 15.
Corelatiile acestor itemi cu factorul doi sunt foarte ridicate, variind Tntre .718 ;;i
.852. Analiza de continut a aeestor itemi, evidentiaza structura dubla, implicand
efecte psihologice (ex. "M-am simiit umilit de catre profesor".) ;;i efecte somatice
(ex "Dupa ora de Xma simt obosit".). In consecinia, acest factor poate fi etichetat
sub denumirea "efecte psihologice ;;i somatice" ale didactogeniei. Tn star;;it, cel de-
al treilea factor este strans corelat cu itemii 11, 13 ;;i 14, valorile coeficientilor de
corelatie pentru ace;;tia fiind cuprinse fntre .696 .760. Se remarca, din continutul
itemilor, ca toti trei fac referire la 0 stare somatica a elevilor la fara
a fi specifici unui anumit profesor (ex. "Dupa 0 zi de ;;coala gatul meu devine
Incordat".).
Etichetarea faCtorilor
A;;adar, interpretarea factorilor este un proces subiyctiypazat pe matricea
structuriiJactorialesau pe matricea modelului .til.ctoria!. Denumirile Jactqrilor au la
baza 0 buna Totu;;i, pot exista cazuri In care
etichetarea factorilor nu".JlJ .u;;or. Tn astfel de situaiii, cercetatorii tind sa creeze
noi Doua exemple clasice Tn psihologie sunt date de
denumirile celor 16 factori primari din teoria personalitatii a lui Cattell sau de
personalitatile de tip A sau B din cercetarile asupra stresului desfa;;urate de
Friedman.
Dupa etichetarea itemilor se poate studia matricea corelatiilor dintre factorii
Tn problema de fata, se observa ca singura corelaiie statistic
este cea obiinuta intre primul ;;i al doilea factor (r ::;; .40), adica Tntre etectele
pedagog ice i efectele psihosomatice. Acest aspect pare normal, deoarece
comportamentele inadecvate ale cadrelor didactice pot exercita influente negative
In planuri multiple. De asemenea, prin lipsa corelatiei dintre efectele pedagog ice ;;i
etectele somatice generale, respectiv dintre efectele psihosomatice ;;i efectele
somatice generale, se constata 0 bunadiscriminare ;;i valid are a faptului ca primii
. doi factori masoara efectele decian;;ate de conduita unui anumit cadru didactic,
fiind specifice interactiunii particulare dintre un anumit dascal ;;i clasa de elevi.
5.1.3.6. Ameliorarea structurii factoriaie
De multe ori, 0 data cu interpretareaoa.tl,lljiJ.'2!QriJor, cercetatorii tind sa
finalizeze procesul analizei factoriale. Recomandarea mea este sa nu ne oprim la
acest'nive!. evaluarea modificare sau
ascalei. Se vor urmari cateva aspecte, cele mai importante fiind
gradul de com1J.[1alitate ;;i de saturatie al fiecarei variabile incluse In studiu.
Cu cat gradul mai mare, cu atat variabila respectiva
este influentata mai mult de factorii comuni extra;;i. Spre exemplu, 0 comunalitate
de .804 a itemului ."lmi plac orele de X." indica faptuI ca dispersia variabilei
161
IIIUIIIJIIIUIIIIJIIIUIIIIJIILIIIILlIIII I11111 11111.illll1 11111,111111 11111'111111 11111 11111I 1IIIIJIllullliLlIII 1111:11111 1111I111111111111111111 111111111111 111111111111 11111,11111 11111 i1111Ll111IJIIIIJIII illill 11111 1111 1IIIi'"1 11111111111111111111111111111111IIIIILIII'III;III'IIIIIIIIIUIILIIILIII'"ILIII"IIILIIIIII.... ___ I
. respective este influentata Tn proportie de ..
doar un procent de 19,6% se datoreaza unlcltatll ItemulUl, adlca eronlor de
masurare factorilor specifici. 0 valoare a comunalitatii ca
itemul respectiv este .. influentat Tn mai mare masura de aspecte unlce, ?ecat
actiunea factorilor comuni 0 variabila care are 0 comunalltate mal
redusa (ex . .40) poate fi pastrata In scala, daca este Incarcata Tntr-un factor
comun ajuta la definirea acestuia. Aceasta regula nu se apl,lca In cazul
comunalitatilor foarte scazute (c < .30). ,
Ratiunile acestei decizii pot fi intelese prin urmatoarea demonstratie.
Fie 0 scala'cu doi factori, in care doi itemi au, ambii, 0 comunalitate de .40 grade
diferite de saturatie dupa 0 rotire ortogonala.
(1) .40 = (.62)2 + (-.12)2
(2) .40 = (.45)2 + (.44)2
In cazul primului item, 5e observa clar saturatia .In primul factor (.62)
lipsa corelatiei dintre item factorul al doi/ea. Intr-o astfel :ituatie, Tn ciuda
comunalitati relativ scazute, putem pastra variabi/a respectlva deoarece of era un
bun ajutor Tn definirea primului factor. Tn schimb, in al doilea caz.am
sau inlocui cel de-al doilea item deoarece, pe IE'mga comunalltatea scazuta, nu
afera nici claritate In interpretarea factorilor datorita saturaiiilor. egale Tn cei doi
factori (ex. 45, respectiv .44). Acest criteriu al claritatii interpretarii poate
sta la baza eliminarii sau modificarii itemilor care, au un grad ndlcat de
comunalitate, nu ajuta la interpretarea factorilor: .
Aceste valori discutat.eale camunalitatilor sunt valabile pentru .lnallza
compofle'nteIOr'p'i'lncipale, sub forma ei sau Tn factoriale a ..
componentelor principale oferita de SPSS. In cazul alegem unel
extractie afactorilor, yom obtine comunalitati maimici, de aceea pot fl acceptate
valori 'mai reduse (ex. c = '.20, In cazul anaHzei factoriale a axelor principale).
Aceasta se explica prin apelul la teorie. In cazul analizei
principale, prin comunalitate se intelege dispersia explicata
comiJ'ni, cat factori specifici. Sensul traditional al comunalltaill. se
analiza factoriala exploratorie. Aici, prin comunalitate se Tnteleg
e

asupra dispersiei datelor exercitata de aciiunea simultana a g:sl\1.
Prin urmare, factorjU3.PE?cifici sunt din formand, Impreuna cu
erorile de masurare, unicitatea dispersiei.
---Un altmotiv de Inloeuire a unor itemi din scala este dat de aparitia unor
factori care in prealabil, Acest rezultat este dependent in mare
masura de in analiza. In exemplul nostru,. !nteniia a
fast de a construi 0 scala care sa evidentieze efectele comportamentL1IU1
al cadrelor didactice asupra elevilor. Itemii 11, 13 14, care au constituit al tre!l:a
factor - "efecte somatice generale" -, nu pot fi Tn aceasta categone,
deoarece nu coreleaza cu modul de comportare a dascalilor. Itemii tin mai degraba
162
de starea generala de sanatate a elevului de particularitatile in
general. Tn consecinta, un studiu ulterior poateconduce la eliminarea acestor itemi,
in conditiile in care dorim sa ne concentram pe efectele de un anumit
cadru didactic.
Reversul paragrafului precedent consta in neaf)aritia unor factori care erau
In prealabil. In caml de fata, ne sa =;;-6finem 0 diferentiere mai
clara Tntre-efedele psihologice cele somatice. Tn schimb, acestea au corelat
puternic intre ele, conducand la extragerea unui singur factor. Tn astfel de situatii,
se recomanda introducerea unor itemi Tn cercetarile ulterioare pentru
a ameliora instrumentul demasurare. Criteriul de selectie utilizat Tn introducerea
de t;starea structurii unilaterale bifactoriale a itemilor
respectivi. Astfel, Yom pure a introduce doi itemi suplimentari, unul care face
trimitere la efecte Tn plan somatic (ex. "In timpul orelor de X ma apuca durerile de
cap."), iar a/tul care se refera la efecte in plan psihologic (ex. "Ma simt descurajat
. sa-mi exprim punctele de vedere in timpul orei de X."). Tn masura Tn care
introducerea acestor itemi nu' va intre efectele psihologice cele
somatice, am putea conchide ca 0 structura comuna este mai potrivita Tn acest
caz. 0 regula uzuaJ.?-,.specifica precizeaza necesitatea existentei a celyutin trei
item', pentrul:,ecarefactor extras.
in concluzie, un studiu explorator ulterior poate urmari ameliorarea scalei
de masurare a efectelor nedorite prin introducerea urmatoarelor modificari:
(1) eliminarea itemilor 11, 13 14 care nu fac referire la efectele
de conduita unui anumit dasca/, ci masoara 0 stare somatica generala;
, (2) introducerea a doi itemi suplimentari pentru a vedea In ce masura se poate
diferentia Intre' efectele psihologice cele somatice, adica pentru a
determina cat de adecvata este extragerea unui singur factor pentru cele
doua tipuri de efecte:
5.1.3.7. Aspecte metodologice complementare
Tn analiza fadoriala merita sa fie trecute Tn revista cateva aspecte care
influenteaza rezultatele ..demersuluLstatistic ... Principalele probleme ce trebuie
caracteristicile /a selectarea variabi-
lelor manifeste dintr-un lac6nditii complementare Tn analiza factoriala.
- . '. , -.'
Volumul $i caracteristicile e$antionului
Analiza factoriala este 0 tehnica pretentioasa Tn ceea ce numarul
de subiecti n;Cesari.'Minimul acceptat pentru 0 astfel de analiza este de 1'1)0 de"
subiecti, preferabila utilizarea unor de subiectf.
Tn plus, volumul e$antionului este dependent de numaruL<;le .. variabile supuse
analizei. Se recomanda ca raportul numar de per numar de varia bile sa fif')
eel putin egaJ cucinci. AstfeJ, pentru 0 scala cu 30 de itemi, ar fi de dorit un minim
de 150 de subiecti.:-Acest raport nu trebuie Insa interpretat Tn mod rigid pentru
cazurile in care voiumul devine destul de mare. Astfel, putem efectua
163
1111'111 1111 11'111 'III III 1111 III ill 111'11'11111111'11111111111111'11111111111111"11111111111'
'111 III iII' II! 1111'111'111 II'!II ""1' 'I 'II Iii 'I' 1I"li'll il' 'II !I"II II III II: ill 11'111 li,II'11'1II"
o analiza factoriala adecvata pe un de 400 de subiecti. chiar daca
numarlJl de variabile (item i) este de 130. Mai ramane sa reamintim doar ca volumul
determina. in anumita masura. valorile de la care consideram ca un
anumit item este saturat de factorii
Tn ce, caracteristicilej'clntionului, solutia ideala ar fi selectarea
unui lot de persoane de 0 Un poate
induce 0 solutie factorLala Kline (1993) exemplifica foarte bine aceasta
stare de fapt prin situatia urmatoare. Sa presupunem ca un cercetator sa
identifice care sunt factorii care afecteaza academica utilizeaza un lot de
subiecti de elita studenti ai Universitatilor Oxford Cambridge. Datorita
omoge'nitatii 10tUlu'i, am ave a de a constata ca inteligentanu joaca
un rol important in. academica, deoarece majoritatea studentilor de la
aceste universitati au 0 inteligenta superioara. Daca de subiecti ar
include studenti de la toate universitatile britanice am avea mari sa
demon'stram ci inteligenta joaca un rol Tn Un exemplu
revelator este faptul ca foamea nu a fost gas ita ca fiind un factor motivational
fundamental Tntr-o cercetare a lui Cattell Child (apud Kline. 1993). deoarece
subiectii erau proveniti din patufa medie superioara a unor tari foarte
La polul 0R.u? se regasete selectarea unui eantion In
astfel de situatii, apare riscul de a extrage 0 serie de factori irelevanti pentru
obiectivele urmarite multi factori fiind rezultatul unor caracteri'stiCi demografice
diferentiatoare. situatie se recomanda utilizarea analizei factoriale
pentru fiecare relevant.
Testarea gradului de adecvare a se poate face prin metoda
KMO, (Kaiser-Meyer-Olkin) prezenta Tn SPSS Factor Acesta poate
ILla'Valori intre Q..LJ" Daca valorile obtinute sunt sub.50, nu este
adecvat pentru a realiza 0 analiza factoriala. Valorile Tntre .50 ..L.:70 sunt
satisfi3catoare, cele sunt adecvate, iar cele peste .8Q .. excelente
pentru a aplica analiza factoriala pe respectiv (Field, 2000). Gradul de
adecvare a pentru fiecare variabila in parte po ate fi testat prin
obtinerea unei anti-imagini, optiune disponibila Tn SPSS Tn aceeai sectiune.
Matricea obtinuta va avea. printre altele,o serie de valori pe diagonala principala.
fiind necesare valori mai maride .50 pentru fiecare variabila Tn parte.
NeTndeplinirea acestui criteriu poate duce la eliminarea itemului respectiv din
analiza.
Selectarea variabilelt;u:_supuse analizei factoriale
Teoria analizei factoriale stipul,eaza selectarea unui de
variabile pentru domeniul de interes. Selectarea unor variabile care nu fac parte din
domeniul respectiv se soldeaza cu obtinerea unor fagtori neCiteptali sau irelevanti.
Cei trei itemi din scala prezentata pe intreg parcursul acestui capitol pot fi in
aceasta categorie, deoarece ei nu se refera la domeniul efectelor prod use de
comportarnentul unui anumit cadru didactic Tn particular. De asemenea. selectarea
164
unui numar de itemi de interes._afecteaza
con\inutul Pentru a clarifica aceasta ultima situatie voi apela la
teo ria de personalitate Big-Five a lui Costa McCrae (1992). Unul dintre domeniile
personalita\ii este nivelul de agreabilitate. Acest domen(u contine fatete
reprezentative: increderea (are Tncredere in alti oameni). (spune ce 'are
pe suflet), altruismul (este disponibil spre ajutorarea celorlal\i). conformismul (evita
conflictele interpersonale), modestia (nu se comporta Tn mod arogant). i
implicarea afectiva (receptivitate la apeluri umanitare, opusul fiind persoanele care
se considera realiste iau decizii bazate pe 0 logica rece).
Pentru a masura agreabilitatea este important sa fie prezenti itemi din
toate aceste fa\ete. Daca yom utiliza doar itemi care masoara nivelul de altruism.
yom ob\ine un factor care nu va putea fi etichetat "agreabilitate". Tn schimb, cel mai
probabil, factorul va fi foarte distinct va avea 0 consistenta interna ridicata.
Validitatea de construct a agreabilit<3tii, masurata exclusiv prin fateta altruismului,
va dovedi ulterior caracterul eronat al etichetarii factorului prin acest domeniu
general. Tn conditiile Tn care celelalte fatete sunt absente.
Pornind de la acest aspect, se cuvinesa precizam ca Tn analiza factoriala
v.orbete din
Item)J9.E,uPu1 analizel factonale) I din corelatiile factorilor
primad selecta\i). Aceasta organizare ierarhica se poate observa Tn
dimensiunilor personalitatii din Big Five nu numai. Astfel. agreabilitatea este din
punct de vedere statistic un factor secundar bazat pe factori primari:
Tncrederea, sinceritatea, altruismul, conformismul, modestia i implicarea afectiva.
Fiecare dintre au la baza itemi specifici care sunt masura\i direct prin
afirma\iile prezente Tn inventar.
Factor
secundar
Factori
_ primari
itemi
Figura 5.9. Refafia dintre itemi, (actori primarf i factori secundari
Asumpt
ii
complementare ale analizei factoriale exploratorii
Tn aceasta vom prezenta cateva metode de testare a masurii Tn
care este potrivita utifizarea analizei factoriale.
o prima asump\ie multicolla.la(itatf!? va,riabilelor manifeste. Pentru
a efectua 0 analiza factoriala semnificativa ar fi bine ca asocierile dintre varia bile sa
lDari (ex. r > .90), deoarece exista riscul de a lucru.'
SPSS-ul of era posibilitatea de a calcula determinantul matricei de corela\ii-Yncadrul
165
'1111'11111'111111 11111 111111'11111,111111'1111 1IIIIIulllili 111111 '11111: 111111.11111'111111 '11111.111IIIJIIIIIUIIIILlIIIII'IIIIIIJiIIIIJIIlllJIIIIIJIIIIUIIIIUIIIIUIIII.'IIIIII.lw__ ., __ .'11 1111 :111' 1111 :111' 1111 III: '11I 11111111' 1111111111111' I111I1111 ,II: III III II, 'I 'I' II' III Ih, ,III III: iii III III III, ,II II' 'I: 'II
sectiunii "Oescriptives" din analiza factoriala. Oaca valoarea acestl.i!a este mai mica
0,00001, putem diagnostica 0 situatie de multicoliniaritate. Intr-o asemenea
situatie, va trebui sa observam care coeficient de corelatie este mai mare de .80
sau :90 :;;i sa eliminam una dintre variabile, deoarece exista :;;ansa .ca ele sa
masoare acela:;;i lucru. ..
o situatie, oarecum opusa, este cazulin care variabilele nLl .. coreleaza Tntre
ele,prin urmar'e nu sunt afectate 9&.ff),ctori comuni. Testul ,al lui
Barlett: prezent Tn "Oescriptives", SPSS," testeaza 0 asemenea tpotez.a: .. 1n ce
masura avem de a face cu 0 matrice de identitate (corelaiiile dintre vanablle, cu
excepiia diagonalei principale sunt zero)? Unrezultat statistic elimina
aceasta posibilitate :;;i ofera :;;ansa realizarii analizei Un rezultat
nesemnificativ indica faptul ca analiza factoriala nu este potnvlta pentru a fi
aplicata. Din pacate, numai situaiiile clare sunt tinde,
de regula, a fi semnificativ datorita numarului mare de sublectl dlntr-un e:;;antlon.
Toate aceste teste preliminarii au fost efectuate :;;i pentru scala de faia,
rezultatele indicand 0 pretare foarte buna a variabilelor :;;i a e:;;antionului chestionat
pentru a fi analizate factorial. . .
In sfar:;;it, analiza factoriala poate fi aplicata Tn situaiiile Tn care vanabllele
sunt masurate' prin'scale de tip intervaL sau raport, iar Tn cel mai rau caz, prin sca!e
de tip .ordinal. Nu este recomandata analiza factoriala clasica a de. tiP
categorial (ex. raspunuri de tip da sau nul, deoarece coeficieniii phi nu.
pot lua valori pe Tntreaga gama de la -1 la +1, iar relatia dintre vanablle nu
liniara. In aceasta situatie se recomanda utilizarea altor metode de analiza
factoriala, precum Principal Components" din pachetul adiiional
SPSS Categories 11.0 (Meulman :;;i Heiser, 2001) ori analiza claselor latente
(Finch :;;i West, 1997). . .
Totu:;;i, printr-un artificiu tehnic se poate aplica analiza factor.lala
expLQrCjtorie, Tn cazul datelor dihot.omice, daca se renunta la itemulul ca
unitate de masura, Tn favoarea"sc;alei' ori a unui pachet de itemi. pachet
de itemi se Tntelege gruparea mai multor itemi :;;i analizarea lor Tmpreuna. Astfel, 0
scala care in prealabil 40 de itemi cu raspunsuri dihotomice .. de tip "Oa" sau
"Nu" poate fi analizata factorial in stil clasic dupa 0 grupare prealabi!a a. itemilor
10 pachete a cate patru itemi fiecare.ln acest fel, raspunsurile sublectllor nu mal
sunt notate binar (,,1 = Oa", ,,0 = Nu"), ci pot lua valori de la 0 (In cazul Tn oare
subiectii raspund "Nu" la toti itemii dintr-un pachet) la 4 (daca subiectii .ras?und
"Oa" la toate afirmatiile din pachet). Metoda,care a fost propusa de Cattell, lar Intr-o
varianta modificata de Comrey (apud Kline; 1.993), are doua limite. Prima se refera
la caracterul subiectiv de alegere a itemilor care vor fi grupati Tn acela:;;i pachet, iar
a doua limita vizeaza caracterul factorilor rezultati in urma unei astfel de analiza.
Ace:;;ti factori sunt considerati de multi autori ca fiind factori de ordinulggj :;;i nu
factori primari.
166
5.1.4. Exemplu de analiza factoriala exploratorie - cazul inteligentei
in cele ce urmeaza, vo.i prezenta mult mai succint paii unei analize factoriale
pornind de la a serie de'probe ce masaara inteligenta. Baza de date include rezultatele de la
naua probe aplicate de Thurstane i Thurstane in 1941 (apud Tucker i MacCallum, 1997),
pe un lot de 710 elevi din clasele a VII-a i a VIIIa. Analiza factariala s-a realizat fi:jra a ave a
acces la baza de date brute, pe baza matricei de carelatii prezentate mai jas. SPSS-ul afera
aceasta pasibilitate prin sintaxa. lata a scurta descriere a celar naua teste:
(1) probe de adunare - include itemi ce presupun adunarea pe calaane;
(2) probe de inmullire - inclUde itemi de Tnmultire a daua numere;
(3) proba seriei de numere - include itemi ce constau intr-un ir de numere care se
multiplicau cu trei, cum ar fi seria: 1, 3, 9, 27, ... ; subiectii trebuiau sa identifice numarul
urmatar;
(4) proba figurilar - include a serie de litere sau semne care au fost rotite sau reflectate in
oglinda; sarcina esle de a identifica care figuri dintra serie sunt identice cu prima figura;
(5) proba car(ilor - include itemi sub forma unor carli de jac reprezentand diverse figuri
geometrice, rotite sau reflectate in diverse maduri; sarcina era de a gasi care carli pat fi
rotite pentru a se potrivi cu figura din prima carte;
(6) proba steguletelor - include itemi sub forma un or steaguri rotite i reflectate in diferite
directii; sarcina era de a identifica care steaguri sunt identice, printr-o rotire de 90
0
;
(7) proba identificarii numerelor - cansta intr-a serie de calaane numerice; sarcina
subieclilar era de a identifica care numar din calaana este identic cu cel din capul
calaanei;
(8) proba felelar - cansta in seturi a cate trei fete umane, dintre care daua sunt identice;
sarcina avuta era de a bifa pe cea care este diferita;
(9) proba citirii in aglinda - fiecare item consta intr-un cuvant scris normal, urmat de altele
patru, tiparite ca i cum ar fi reflectate in aglinda; sarcina era de a identifica care din
cele patru cuvinte esle identic cu primul.
Bineinieles ca obiectivul principal al aplicarii acestor probe era identificarea
unor factori comuni din cadrul domeniului inteligentei.
Matricea de corelatii dintre cele noua teste este:
2 3 4 5 6 7 8 9
1. Adunare
2.lnmul\ire .499
3. Serie numere .394 .436
4. Figuri .097 .007 .292
5. Carti .126 .023 .307 .621
6. Steaguri .085 .086 .328 .510 .623
7. Identiflcari numar .284 .467 .291 .044 .114 .086
8. Fe\e .152 .235 :309 .3j9 .376 .337 .393
9. Citire in oglinda .232 .307 .364 .213 .276 .271 .431 .489 1,
167
ii. ,
....
.. \':,:,"
....
1111'i111UIIIUIIII 1111111111.1111111111 1IIIiilll!:11111 11111'111111111111'111 !I" III III Iii 'Iii II: '" ill :1::111 !III !III, 1111 'III,:: 'I' ,i i, I:!i 'III'III! '

il:III,I'"
Dupa alegerea tiput\;lL de m?trice, orice analiza factoriala necesita
parcurgerea urmatorilor pa:;;i:
./ testa rea asumptiilor aferente;
./ alegerea factorilor;
./ selectarea numarului de factori extrai;
./ inspectarea matricei '1lQdel'ului factorial urmata adeseori de rotjrea fact::>rilor;
./ interpretarea factorilor. "
Cele mai multe aspecte mentionate anterior nu sunt trecute uzual In
sectiunea destinata analizei datelor, dei ele trebuie pc:lrcurse pentru a asigura 0
analiza cat mai corecta. Minimul de informatii ce trebuie oferit.in sectiunea de
analiza a datelor unui articol tiintific trebuie sa atinga urmatoarele puncte:
./ precizarea Tntr-un paragraf a tipului de anaJiza (de ex: P?A sau
EFA), a metodei de extractie a factorilor:;;i a motivatiei pentru
./ precizarea intr-un paragraf, a numarului a.
folosite Tn acest scop, a tipului de rotire factoriala, dacaestecazul, I a ra\lunll
alegerii faclJte; . .
./ prezentarea unui tabel sumar care sa contina matricea m?delululfactonal
(pattern matrix) :;;i gradul de comunalitate a fiecarei variabile. ,Nicol :;;i
(1999) ofera un asemenea model, pornind de la standardele Asoclat
lel
Psihologilor Americani (APA);
./ Tn cazul rotatiilor oblice sunt specificate i corelatiile .Tntre fa<;tori.
Pentru exemplu, 0 posibila formulare a sectiunii de analiza a date lor
ar putea fi: .
Obiectivul principal al studiului era de a identifica atributele interne care stau la
baza celor noua probe de abilitaV mentale i influenieaza evoluiia acestora. De aceea,
utilizand programul SPSS 11.0, am apelat la analiza factoriala a axelor principale pentru a
extrage factorii comuni. .
in urma analizei, atat criteriul scree plot al lui Cattell, cat i analiza paralela
adaptata dupa Allen i Hubard (1986, apud Johnson i Wickem, 1998) sugereaza 0 soluiie
adecvata cu trei factori. Acetia influenieaza impreuna 68,48% din totalul dispersiei celor
noua probe. Fiind yorba de factori subsidiari factorului 9 din domeniul inteligent
ei
, ne
ateptam sa existe corelaiii Tntre acetia. in copsecinia, pentru a obtine 0 structura cat mai
simpla, solutia a fost rotita oblic prin metoda direct oblimin la un delta egal cu zero.
in tabelul de mai jos sunt sintetizate trei categorii de informaiii: gradul de
comunalitate a variabilelor, saturatia acestora in factorii extrai, cum rezulta din matricea
modelului factorial i corelaliile dintre fgctori. Am ales sa prezint matricea modelului factorial
deoarece este mai simplu de interpretat i pentru ca ofera influenia fiecarui factor asupra
variabilelor Tn cauza, eliminand medierea celorialli factori extrai. De remarcat insa ca
aceste saturaiii nu reprezinta coeficientii d'e corelaiie simpla, ca in cazul rotatiil
or
de tip
ortogonal sau a solutiilor nerotite.
168
ITEM FACTORI Comunalitate
2 3
1. Adunare -.06 -.04 .67 .30
2. Tnmultire .15 .14 .73 .42
3. Serie numere .08 . -.28 .50 .36
4. Figuri -.01 -.73 .02' .43
5. Carti .05 -.82 .00 .53
6. Steaguri .05 -.69 .04 .44
7. Identificari numar .61 .18 '.20 .35
8. Fete umane .69 -.18 -.12 .36
9. Citire in oglinda .64 -.06 .03 .35
Corelalii intre factori /\ direct oblimin
Fact.or 1 2,18
'Factor 2 -.36 2,18
Factor 3 .51 -.12 1,88
Se observa ca primul factor este strans legat de ultimele trei probe. Toate acestea
necesita 0 examinare rapida a'stimulilor i identificarea acelora care sunt identici. Din aceste
considerente, am putea eticheta acest factor ca viteza de perceplie. Tntr-un mod similar, se
observa ca variabilele 4, 5 i 6 sunt saturate puternic in al doilea factor. Semnul minus este
dat de modul invers de cotare a probelor. Aceste trei probe au in comun faptul ca necesita
abilitatea de a recunoate relaliile dintre diferite forme cu orientare spatiala diferita. Prin
urmare, am putea intitula acest factor - relatii spa\iale. in ce privete cel de-al treilea
factor, se observa saturarea ridicata in cazul primelor trei variabile i scazuta pentru
celelalte probe. Toate cele trei teste implica calcul numeric. Mai mull, nici una din restul
probelor nu necesita calcul aritmetic. Tn consecin\a, am putea denumi acest factor ca abilitaV
de calcul.
Se observa din tabel ca cei trei factori nu sunt complet independen\i. Dat fiind
yorba de un eantion de 710 persoane, toate corela\iile intra factori sunt semnificative la un
p < .01. Se constata 0 corelatie ridicata, in special intre viteza de perceplie i abilitalile de
calcul numeric. Aceste corelaiii Tntre factori, yin sa sprijine posibilitate,a eXistentei unui factor
supraordonat, fie el factorul 9 al inteligen\ei, aa cum a fost stipulat de Thurstone.
Elementele prezentate mai sus constituie un minimum necesar de a fi
prezentat In sectiunea de analiza cantitativa a datelor. Unii autori sustin i
includerea matricei de corela\ii intre varia bile. prin aceasta masura, cercetatorii
interesa\i ar putea reface sau modifica analiza, matricea fiind un element suficient
pentru a substitui baza de date. Introducerea matricei de corelatii este dependenta
de spatiul editorial :;;i de tipul publica\iei respective. In ceea ce ma privete,
recomand prezentarea ei ori de cate ori exista spatiu suficient.
in spatele acestei imagini de "vitrina" se regasesc 0 serie intreaga de
operatii, prezentate Tn detaliu in capitolul de fata i care se desfaoara in
urmatoarea ordine:
169
'1111, 11111 111111'11111, 111111 lilli' !IIIII 11111: 11111' :1111 1111' !IIIUm ,11111, :1111, 1111l!IIIILIIIIUIIIUIIIIJIIIUIIIUIIIIJII, 111111 1IIIIIJlIII 111111 11111, :11111 lilli' 1111111:111111111111',111111111111' 111111.11111 '1111 1111' III: 1111!JI111:-'lII: 1111 IIUIIUIII ,IIIUIii ,llllllllll IIIIUIIIIJIIIIUIIIIJIIIIUIIII, iIIIIUIIIILlIIIIUIIII! 111111 11111 ,III III, illl III' 'III 1111 11111 11111 1111, III II'
(1) alegerea teoretica a tipului de analiza i a metodei a
factorilor; '"
(2) verificarea conditiiloLrrecesare i inspectarea datelor descriptive;
(3) stabilirea numarului adecvaide factori extrai i rotirea factorilor (daca este
cazul);
(4) interpretarea r:ezultatelor, finalizata cu identificareanaturii factorilor;
(5) sugerarea eventualelor,ameliorari necesare Tn studii viitoare,
5.2. Analiza factoriala confirmatorie
Daca Tn cazul analizei factoriaJe numarul de se
stabilea pe baza unor cr[terii empirice, analiza factoriala confirmatorie apeleaza la
tes.tarea,iP?tezelo[ pentru a deJactpri Tn creP9Uireduse: datele.
BineTnteles pentru a putea testa aceste ipoteze, cercetatorul trebuie saaiba
anumite informatii legate de numarul de factori care tret.Juie, extr,ai, de aceea
analiza factoriala confirmatorie apare ca 0 faza ulte[iqara llnl1i demers descriptiv,
de tip exploratoriu,
Problema care va Tnsoti explicatiile analizei factoriale cCinfirmatorii privete
testarea numarul de factori prezenti in scala BIS-BAS, dezvoltata de Carver i
White (1994), privind sistemele comportamentale activator i inhibitor. Pentru cei
mai putini familiarizati cu aceste constructe, sistemele respective sunt mecanisme
neuropsihologice care diferentiaza indivizii Tn privinta orientarii lor comportamentale
predominante, fie spre recompensa i cautarea placerii (BAS), fie spre pedeapsa i
evitarea suferintei (BIS).
Scala BIS-BAS contine 20 de itemi a fost conceputa pentru a surprinde atat
sensibilitatea persoanelor la recompensa - BAS, cat sensibili!atea persoanelor la
pedeapsa - BIS. in urma unei analize factoriale exploratorii, cei doi autori ai probei identifica
patru factori primari: BIS (slstemul comportamental inhibitor), BAS-R (sistemul
comportamental activator - sensibilitatea la recompensa), BAS-D (sistemul comportamental
activator - tendinte impulsive) BAS-FS (sistemul comportamental activator - cautarea
placerii). Dintre cei patru factori ultimii trei coreleaza intre ei, probabil datorita unui
factor secundar, denumit BAS. alti autori au obtinut structuri factoriale diferite. De
pilda, Jorm colaboratorii (1999), tot Tn urma unei analize factoriale exploratorii, ajung la
conciuzia ca 0 solutie cu doi factori - BIS BAS - este la fel de buna ca solutia cu patru
factori gasita de 'Carver White Tn 19,94. Pentru a com plica lucrurile, Ross, Millis,
Bonebright9i Bailley (2002), Tn urma unei analize factoriale ,confirmatorii, gasesc 0 alta
soluiie adecvatit Rezultatele obtinute de sprijina ideea unei solutii cu patru factori
Tnsa spre deosebire de prima solutie, totii factorii sunt independenti, adica nu coreleaza Tntre
ei. Care dintre soluti.i pare cea mai potrivita?
170
IIIII!IIIIIIIIIIIIII'IIIIII: '1111 '1111' 11111 1111: 11111 1111, '1111' 111111 11111: :11111 11111: :11111 111111111111 111111 IIIII! 111111111111: '11111 111111 '11111 111111 :11111 111111 :11111' 111111 '1111111111111111111,111111 11111 111111 11111 11111111111111111111111111111111,1111111111111111111111111'111111111111111111111111111111111111111'11 111111 "
Pentru a raspunde la aceasta intrebare va trebui sa aplicam analiza
factoriala confirmatorie. Cu ajutorul ei yom testa toate variantele enuntate mai sus
i, chiar mai mult, vom putea testa alte solutii noL Stabilirea unei factoriale
adecvate este esentiala atat Tn cercetare, cat i Tn psihodiagnostic. Spre exemplu,
un individ procedeaza corect, daca reunete scorurile tuturor itemilor BAS pentru a
obtine un rezultat global Tn cazul Tn care solutia co recta implica doi factori BIS i
BAS. Acelai lucru poate fi facut i Tn cazul unei solutii cu patru factori, dintre care
cei trei factori BAS coreleaza Tntre ei. In schimb, cercetatorul va grei, daca va
calcula un rezultat global BAS Tn cazul unei solutii corecte cu patru factori
necorelati, deoarece intre cei trei factori BAS n-ar exista 0 asociere.
Realizarea unei analize factoriale confirmatorii implica parcurgerea
. urmatoarelor etape: (1) specificarea modelelor. concurente, (2) identificarea
mQQelelor, (3) estimarea "i testarea gradului de a
(4) re-specificarea modelelor (Kelloway, 1998). . .
.. :<-." ... ",
5.2.1. Specificarea modelelor concurente
Primul pas Tntr-o analiza factoriala de acest tip implica specificarea
structl.[tL9L factoriale ce urmeaza a fi Ele se aleg pe baza informaflli6r din
literatura de -specialitate. Spre exemplu, In cazul scale; BIS-BAS vor fi
trei' asemenea modele: scala BIS-BAS cu doi factori, scala BIS-BAS cu patru
fadori necorelati i scala BIS-BAS cu patru factori, dintre care cei trei referitori la
sistemul comportamental activator sunt corelati.
Se obinuiete ca cel putin unul dintre modelele specificate sa fie
reprezentat grafic Tntr-o forma tipica analizei factoriale confirmatorii. Figura 5.10
contine 0 asemenea reprezentare grafica, obtinuta prin AMOS (2001), pentru
modelul unei scale BIS-BAS cu patru factori, dintre care cei trei, referitori la BAS,
coreleaza Tntre ei. Un alt software, utilizat frecvent pentru a realiza analize
factoriale confirmatorii este L1SREL (Joreskog i Sorbom, 1989).
Imaginea poate fi citita uor. Spre exemplu, se ateapta ca primii apte
itemi ai scalei sa fie saturati Tn factorul latent BIS. Mai mUlt, prin absenta sagetilor
care sa lege celelalte variabile latente de primii apte itemi, se stipuleaza absenta
saturatiei itemilor respectivi Tn cei trei factori BAS, Similar, modelul prezice ca
8-12 vor fi saturati doar Tn factorul BAS - recompensa, ca itemii 13-16 vor fi
atributele mariifeste pentru masurarea factorului BAS - impulsivitate, 7n timp ce
itemii 17-20 vor exprima doar factorul BAS - cautarea placerii.
De asemenea, se observa nota rea diferita a variabilelot:.manifesteadica a
date lor observate Tn realitate,. fata de cea a variabilelorJatente, a ce
stau Tn spatele covarigDteiitemilor:Astfel, variabilele manifeste sunt reprezentate
grafic sub forma unui dreQtunghi; rezultand Tn cazul exemplului dat douazeci de
dreptunghiuri, cate unul pentru fiecare item al testului. Tn schimb, variabilele latente
sunt simbolizate grafic sub forma unui oval, "cate unul pentru fiecare factor
an!icipat""Astfel, un model BIS-BAS cu patru facto ri , ca cel de fata, va avea patru
. '
171
II' III: illl' :1111' ,1111111111
"
11111, 111111 1111111I111111 1IIIIIIilllili 11111111111111 111111 1111 I: :1111111111 :1111111111 :111111111111111111111 :11: III ,11111111111111 1111111111' 11111 :1111 ' 1111111111' 111111111 !I: ill !III III: 1111 11111111, illllllll! '1111 1IIIIIIIIIIi :11111 IIIIUIIII 11111,1 Jm: Jm '1ff[1frm 1,1 III, 1M 1.1 !In ,III 111'1 @1M !M m JIr .. : I 111M, III '1M t ,'1M '1.1 illi ill ill ], I'
ovale, Tn schimb un model BIS-BAS cu doi factori va avea doar dOlla asemenea
reprezentari.
Figura 5.10. Reprezentarea grafica a mode/ului BIS-BAS cu patru factor! in AMOS.
Scalele BAS coreleazii Tntre ele
SPSS este 0 marca inregistrata.
o alta observa\ie importanta, pe baza figurii 5.10 este direc\ia de
Tndreptare a sagetilor. Toate sageti1e sunt Indreptate spre De
exemplu, In cazul primului item, rezultatul lui BIS01 este In functie de trasatura
latenta pe care 0 masoara itemul respectiv, adica BIS de eroarea de masurare,
adicii..I?OJ .. 8.ceasta eroare poate fi conceputa ca dispersie datorata_ factorilor unici
in cazul <;lnalizei factoriale.
Corela\ia dintre doi factori este reprezentata sub formaunei curbe. cu
saget.U9<3mbele capete. Spre exemplu, In modelul propus ne sa existe 0
corelatie intre BAS recompensa (BAS-R) BAS impulsivitate (BAS-D) Insa
stipulam absenta corelatiei dintre oricare scala BAS scala BIS.
In trebuie sa distingem Intre variabile
sunt cele care mLdepind de.nimeni, fiind socotite ca variabile
i se disting grafic prin faptul ca nuau nici 0 sageata orientata spre ele. Tn
-- -
172
:'111:111.1111111111111"111'111'11111111111111111111 ,
_variabile.le efect: fiind identificate grafic prin faptul
ca eXlsta eel putln 0 sageata onent'?taspre ele. In exemplul nostru se observa ca
atat factorii comuni, cat erorile demasurare (factorii unici) sunt variabile
Tn timp ce itemii probei sunt variabile endogene.
In aceasta etapa sunt specificate toate urmeaza a fi testate.
din !ipsa de spatiu, nu toate modelele de reprezentare grafica,
deoarece. 0 data Tntelese principiile de reprezentare grafica este suficient sa
denumim modelul. De pilda, patru factori identici, dar necorelati,' implica un desen
similar cu cel prezentat Tn figura 5.10 din care sunt eliminate curbele cu sageti
duble care indicau existen\a eorelatiilor dintre eele trei scale BAS. '
5.2.2. IdentifiS.Irea modelelor
Prin analiza factoriala confirmatorie se urmareteestimarea saturatiilor
itemilor Tn iq,gtorii respe(;tivi, iar pe baza acestora, sa se raspunda la in
ce satura\iiler,E';spective sunt conforme cu De exemplu,
este Itemul 5, saturat In factorul' BIS nesaturat In''ceilal\i factori, cum era
specificat Tn model? Pentru a estima parametri, analiza factoriala
confirmatorie apeleaza la un set de ecuatii structurale (Baer, 2000).
'1N.
I e
Figura 5.11. Modalitii(i minimale de reprezentare grafieli pentru soluW identificabile
Prin identificarea modeleJorse intelege in ce masura acestea, prin
structura lor, pot conduce la Fiind vorba de ecuatii structurale,
se pune problema matematica daca exista: (1) mai multe necunoscute decat
(2) atatea ecua\ii (3) mai multe
necunoscute. Vom discuta pu}in mai tarziu implicatiile acestor situatii
DeoCiim"data vom ciarifica problema identificarii.' ,
De exemplu, In imaginea din stangatrebuie estimata saturatia celor trei
variabile M 1, M2 i M3 In factorul L1, adica trebuie identificate valorile a, b c.
Pentru a Ie identifica avem la dispozitie trei ecuatii:
M1 = aL1 + e1
M2 = bL1 + e2
M3= cL1 + e3
173
1111111111111,11111,111111111111111111111111111,11111,1111,1111111'1111,1111I 11111 IIIII! 11111 111111 11111 11111 1111 11I'!lIi 11I,:!lIIIIIII,IIIIIIIIIII,IIIIILlIlIlJIIIIIIIII!IIII!Jlli,IIIIIUIIIIIIIII,II',IIII"IIIIIIII'1II11I111I111I111I11i,11,1111111, ,1111'"
,i,I:,:" 11'llill,IIIIIIIIIII,IIII.l11 :11,111:111:1
____ 1111 II' 'I,
Dei mai putin intuitiv, i Tntre cele doua modele din partea de jos a figurii
5.12 exista 0 relatie de tip cuib. Primul model poate fi transformat matematic Tn cel
de-al'doilea, daca yom constrange cele doua variabile latente L 1 i L2 sa aiba 0
corelatie egala cu 1. In schimb, doua modele f1Llse afla In relatie de tip cwii::J daca
nu putem reduce unul din modele la celalalt. "
__
,
Figura 5.13. Exemple de modele factoriale care nu se afii'i Tn relatie de tip cuib
Cele doua modele nu se afia In relatie de tip cuib deoarece variabila
latenta L2 este masurata prin itemii 3 i 4 (Tn stanga), Tn timp ce Tn dreapta, L2 este
masurat de itemii 3 i 5. Astfel, nici unul dintre modele nu este reductibil la celalalt.
Distinctia dintre modelele aflate In relatie de tip cuib i cele care nu se
regasesc Tntr-o asemenea relatie este importanta, deoarece primul tip permite
compararea directa a din perspectiva unui test de semnificatie.
""-'''''1/ .. ,.,...... '
5.2.3. Stabilirea gradului de adecvare a modelelor
"- '.' "", .,.',
Ca Tn orice analiza factoriala matricea de covarianta sau cea decorelatie
constituie inputul demersului Un model Hiac;;ial este considerat
prin parametrii.,estimati reuete sa refaca cat mai bine matricea datelor initiale.
Pentru a gradul de adecvare a unei solutii -factodale exista 0
multitudine de indicatoristatistici, dintre care yom prezenta Tn continuare. Ei
pot fi lmpartiti In doua categorii mari: indici absoluti i indici comparativi. Cei din
urma pot fi de asemenea Tmpartiti Tn indicatoricornparativi Intre modele In.
relatie cuib i indicatori de comparare a modelelor care nu se afla Tn rejatii de
acestea din urma pot fi divizate tot In doua categorii: indicatori ai
i indicatori ai gradului de parCifTlOnie a m0,9.elului.
5.2.3.1. Indicatori absoluti
Aceti indicatori urmaresc Tn ce masura,_un_anumit model, poate reproduce,
__ de covarianta (corelatie). Primul indicator este. testLJ!.x
2
al gradyIui de"
a acestuia indica diferenie
se--;:nnificative Tntre brute i matricea obtinuta baza legaturilor
specificate In model, de aceasta data fiind dezirabila situatia unui X2 nesemnificativ
176
statistic. Din pacate, valoare? lui X2 este afectata puternic de volumuL eantionului,
astfel ca exista mari anse sa obtinem un X
2
se'I1nificativ Tn eazul test rii unui
numar mem, desubiecti, cum se tntampla frecventtll studiile ee ihlplica analiza
factoriala. Totui, X2 este deosebit de uti!, deoarece sta la baza mai multor
indicatori absoluti caredepaese aceasta lim ita. Utilizand fiierul "analiza factoriala
confirmatorie.sav" Tnprogramul statistic AMOS 4.0, yom obtine in cazul scalei BIS-
BAS eu patru factori (factorii BAS coreleaza Tntre ei) 0 valoare a discrepan\ei
- X
2
(167) = 375.S5, P < .001 insa rezultatul trebuie interpretat cu precautie datorita
numarului mare de date observate (N=345).
Un alt indicator absolut ,BMR (Tn engleza "root mean squared
residuals"). Conform lui Steiger (apud Kelloway, 1995) valorile mai mici de .10
indica un model bun, iar valorile sUb.05 un model foarte bun. Printr-un mOd8lbun
se Tn\elege ca' modelul bine datelor
obseryatSl.:Eentru scala BIS-BAS, RMR a fost de .04. .'.
. Tot un indicator rezidual absolut este (In engleza "root mean'
squared error of cif-e acelea9i proprietati i valori referentiale. In
plus, acesta are avantajul ca ofera un interval de valoarea
calculata. Daca limita mc:p<ima a intervalului nu depaete ,OS, avem de-a face eu
un model destul de bun. Tn problema noastra, modelul SIS-BAS cu patru factori,
dintre care cei trei lega'ii de. BAS coreleaza Tntre ei, RMSEA a fost .06, iar intervalul
de Tneredere de 90% este cuprins Intre .052 i .06S, valori ce indica, din nou, 0
buna potrivire a modelului.
Un alt indicator absolut, probabil cel mai cunoscut, engleza
"index of goodness of fit"). Aeesta ia valori euprinse Tntre OitJilsa sunt dorite
valori pestELc90 pentru a considera ca modelul testat este unul pun. Totui, dupa
unele criterii i valorile situate peste .S5 pot semnala un model factorial
bun. GFI este un indicator sensibil, fiind dependent de numarul degate colectate 9i
de eomplexitatea modeluluL De aeeea, se poate calcula i un indi;citor ajustat al
aeestuia, si;:;'-bolizat j\GFI, care are aceleai valori de referinta. In cazul modelului
BIS-BAS testat de neil, am obtinut un GFI de .90 i un AGFI de .SS, valori care
indica un model destul de bun.
Merita sa subliniem faptul ca aceti indicatori se calculeaza pentru fiecare
model concurent antieipat. De obieei aceste valori se tree Tntr-un singur.Jabel,
pentru. a facilita analiza gradului de potrivire a fiecarui model fata de datele
observife.
Tabelul 5.6. Valorile principalilor indicatori absolu\i pentru eele trei modele testate
Modelul testat X2 df
P
RMR RMSEA GFI AGFI
Doi faetori necorela\i 915.3 170 .001 .07 .113 [.106 - .120] .76 .70
Patru factori necorela\i 431.7 170 .001 .06 .067 [.059 - .075] .89 .86
Patru faetori (sealele 375.8 167 .001 .04 .062 [.052 - .068] .90 .88
BAS eoreleaza)
.,
177
" 'I., 1.1 II, ',II '.11. III '.111,11111,1111111111111111111111111,111111111111.111111IIIUllt.IIIIIIIUIIIIIIUIILlIIIUIIII,IIIII'IIIIUIIIIJIUIIIJ111'.JIIIUUIIUIIUllIIIUIUIIIIIIILlIIIIJIIIIUIIIIJIII'JlIUIIUIIIIIJIIUIIIJIIIUlIIIJIIIIJIIIIIJIIII,IIIIIIJIIIIJIIIII'11IIIJIIIIUIIIIIJIIII"lIIlIlllIlIillllll'III', 1111' '11111111,1111',111111111111111' 11111',11111,11111111111111111111'1111111111 ,""11"" ,1111111111 '1111111111'1111' 1I1I1.,III'.::rn__
Din tabel se poate observa ea dintre eele trei modele propuse spre a fi
testate, doar ultimele doua par a fi adeevate pentru a deserie datele eulese. Primul
model, al eoneeperii sealei BIS-BAS ea 0 proba ee masoara doi faetori primari este
inadeevat, valorile indieatorilor absoluti fiihd departe de valorile de referinta amintite
mai sus. Tntre eele doua modele ramase In eursa sunt diferente miei, observandu-'
se un avantaj uor In favoarea ultimului model. Pentru a eompara aeeste modele,
putem sa apelam la indieatorii de eomparare.
5.2.3.2. Indica tori de comparare
Indicatofi"deeomparare a modele/or af/ate /nre/atie de tipcuib . ,.
Indieatorul de baza In astfel de eazuri
X2. Aa cum Ii spune numele, el se ealeuleaza fa2ifnd'diferenta Intre x
2
,fespeetiv
df _c::orespunzatori modelelor aflate In relatie de tip euib. Pe baza"liiformatiilor
prezentate anterior distingem doua pereehi de modele "euib": unu eu trei, respeetiv
doi eu tre!. Cum primul model s-a dovedit a fi ineficient, vom compara doar
modelele doi i trei. Vom obtine /::;, X2 (3) = 55.9, p < .001, ceea ce indic' diferente
semnifieative Intre eele doua modele, mai bun fiind cel de-al treilea model, adiea
cel care are un X2 mai .mic. Pe baza acestor rezultate putem coneluziona c', dei
ambele modele sedovedesc efieiente In a reproduce datele observate, modelul al
treilea este semnifieativ mai bun decat modelul eu patru factori necorelati.
/ndicatori de eOJIlQ.P.[?te a mode/filar Tn gflneral
Cand modelele nu Tn relatii de tip euib,Q.\I putem apliea X2 al
difereotelor. Tn astfel de eazuri putem aplica alti indicatori. De fapt, aceti indieatori
pot fi aplicati indiferent de tipul relatiei dintre doua modele, Insa In eazul relatiilor de
tip cuib se prefera utilizarea lui X2 al diferentelor, datorita testului de semnifieatie
asociat cu acesta.
Daea indieatorii absoluti testau dintre mod,Ellul.stipuIClt un
model saturat (lntotdeauna adevarat ea In situatia unui model abia-identifitabil),
indieatorii de eomparatie testeaza diferentele model nUl,
sla.tJ: Exista mai multi indieatori utilizati Tn aeest sens precum
engleza "normed fit index", respeetiv "non-normed fit index") dezvoltati de Bentler i
Bonnet, eFI" (in engleza "comparative fit dezvoltat de Bentler, IFI (In
engleza ::ihtremental fit index") allui Bollen sau'j,FI(fn engleza ;,relative fit index")
allui Marsh (Kelloway, 1998). Toti indieatorii, eu excePtia NNFI sunt euprini Intre 0
i 1, valorile peste .90 ori .85 fiind dezirabile pentru a eonsidera un model bun.
Tabelul 5.7. Valorile principalilor indicatori ,de compara\ie pentru cele trei modele testate
Modelul testat NFl RFI IFI CFI
Doi factori necorela\i .48 .42 .53 .53
Patru factori necorela\i .75 .73 .84 .83
Patru factori (scalEHe BAS coreleaza) .80 .77 .87 .87
178
II i'II :11 ,II !II II Ii III illlllir ilill 1111111111 1111111111 ,1111111111 UllllllllUlllllllllfJlllllllll1 '1IIIIIIIILlIIII'JlII 1111[lllllllllll 1111I 1111' lilli' 11111' 11111' 1IIIIlIIIIIUIIIIIlIIIIIlIIIIIIIIIIIlIIIIIILIIIIIIIIIIIIIIIIILIIIIIILlIIIILIIII11',111111111111/111111111111111111111111 1I1I1'IilU IIIIIIIIIU 11111 11111111' '1111 1111 '1111 1111"1111 1111 '1111 11111'11111111 'IIU IIU JI
Se observa, i in acest caz, diferenta valoriea dintre primul model .
celelalte doua. Totui, valorile indicatorilor de comparare sunt mai miei deeat II
f t
I ee e
eren,la e, ee arunea 0 umbra de Indoiala asupra Gelor trei modele testate.
Dlntre ele, ultlmul model se apropie eel mai mult de valorile dezirabile acestea f" d
. . . , lin
atJnse In eaz.ul IFI CFl demonstrand inca 0 data superioritatea aeestui'
model In eomparat,e eu celelalte.
Indica tori de campa rare a parcimoniei modele/or
Cu siguranta ea un model, eu cat este mai complex, eu atatreproduee mai
Transpus in termeni de indicatori de eomparare, ideea 0
In dauna eelorsirnple, primele avand mai
mari de a obtine indicatori de comparare dezirabili. 1n lnsa sunt favorizate
explieatiile mai simple, dorindu-se eliminarea factorilor redundanti. De aeeea
pentru a elimina distorsiunile indicatorilor de eomparatie aflati 'sub
eomplexitatii modelului, se pot caleula alti indicatori meniti sa modeleie
mai simple, Tn cazulJn care cele complexe nu ofera un avantaj semnifieaUV'. ._, ,.
Multi dintre indieatorii absoluti sau de comparatie au formule .ajustate
pentru a avantajt;l solutiile cu un grad ridicat de pareimonie. Astfel, Intre doua solutii
.Ia fel de bune, cele mai simple vor fi avantajate din perspeetiva acestor indicato;i.
Cei mai intalniti sunt PNFI (In engleza "parSimony adjusted NFl") i:PCFI
("parsimony adjusted. fiind doi indieatori de baza oferiti de AMOS.
Ambii au valori cuprinse Intre.Q.J,i 1 Insa spre deosebire de indieatorii neajustati nu
au de referinta prestabilite. De aeeea, ca strategie de utilizare se
avantaJarea aeelor modele care au 0 valoare mai ridieata., rol II joaea alti
doi eoeficientiA!9 ("Akaike Information Criterion") CAlC ("Consistent
Information Criterion"). In eazul acestora este dezirabil modelul eu valori mai mid
adica modelul Se observa i din tabelul 5.8 ea ultimele doua solutii
sunt mai bune, iar dintre ele, se constata 0 uoara inferioritate a modelului eu
factori' neeorelati.
Tabelul 5.8. Valorile principalilor indicatori de comparaiie a simplita\ii modelelor testate
Modelul testa!
PNFI PCFI AIC CAlC
Doi factori necorelaii .43 .47 995.4 1189.4
Patru factori necorelati .68 .75 511.7 705.4
Patru factori (scalele BAS coreleaza) .69 .76 431.7 630.3
Pe baza tuturor aeestor indicatori putem eoncluziona ea modelul factorial
adecvat pentru' a deserie seal a BIS-BAS pe eantionul de 345 studenti romani este
eel de-al treilea, reprezentat grafie in figura 5.10. '
Prezentarea rezultatelor se poate face, fie sub forma grafiea, fie sub forma
tabelara. Deosebirea dintre analiza factoriala exploratorie i eea eonfirmatorie este
ea In ultimul eaz se ealeuleaza saturarile doar In factorii antieipati. De exemplu, se
179
, iii III' illl I1111 1111' 11111I111111 11111 111111 111111 111111 ,111111 111111 !IIIIii 111111 ,11111 Iii, Iii ,II III 111I11I III ill: Iii !II! ,III il :, 'II! II: I!I, 1111, 111I illl',1II1 1111,1111 1111,11111 1111 11111 11111I IIIIIJII 1111111111 1IIIIilili 1111,11 ;11 II iii II' Ii: ,i' ,Ii :11 ,ii ,II ii, ,II ;" III! 1111 'II ,II! III 'III III, :lli III II, :Ii ii iii .I!: :11 ':1 :1: !! 1IIIIIIII.IIIIILlllllliIlllrnllllrnllIIllIIllllIlllllIIllllIllI.IIIII'I ____ 11"1."",,, II :11'11' !II ' , , ,I ,I 'I I' Ii ,I I I
aliiteapta ca itemul 1. sa fie saturat Tn factorul BIS i nesaturat Tn ceilalii factori. Prin
urmare, se va estima doar saturarea in BIS, celelalte saturaiii ale itemului in factorii
BAS fiind prestabilite la zero. Acelai lucru se Tntampla i Tn privinia corelaiiilor
dintre factori. Deoarece modelul presupune absenta corelaiiei dintre scala BIS i
oricare din scalele BAS, corelaiiile dintre acestea sunt prestabilite la zero. Tn
schimb, sunt estimate corelaiiile dintre cele trei scale de tip BAS, deoarece acelai
model anticipa corelaiii semnificative Tntre cei trei factori.
Tabelul 5.9. Matricea modelului factorial BIS-BAS i
a corelaliilor inter-factori
Item BIS BAS-R BAS-D BAS-F
01. .50
02 .58
03 .60
04 .56
05 .30
06 .33
07 .23
08 .48
09 .46
10 .72
11 .63
.38 12 .58
13 . 75
14 .82
.32
15 .62
16 .72
.21
17 .62
18 .77
19 .85
20 .39
BAS-R
BAS-D .38
BAS-F .32 .21
Figura 5.14. Structura factoriala BIS-BAS
5.2.4. Modificarea modelului
-=_ ..... _.-_._ ............ .
La fel ca Tn cazul analizei factoriale exploratorii, I In cazul celei
confirmatorii problema nu se Tncheie 0 data cu testa rea modelelor i oferirea
rezultatelor modelului selectat. Demersul poate fi continuat cu analiza eventualelor
modificari in mOdelul seledat. Ce parametri noi pot fi estimaii? La ce parametri
deja estimati se La asemenea intrebari se poate raspunde apeland
la indicatorii' '
Aceti indicatori Lallgrange, calculeaza gradul de modificare a lui X2 al
modelului 0 data cu introducerea sau eliminarea fiecarui parametru posibil. Dintre
toate valorile calculate, vor trezi interesul cele care Tndeplinesc doua condi\ii:
180
conduc la 0 scad ere substantiala a lui X2 (1) i cele care au 0 semnificatie teoretica
importanta .(2). Daca ultima nu ridica probleme, fiind variabila de la caz la caz,
prima este mai ambigua. Aa cum remarca Kelloway (1998), nu se poate Vorbi de
o valoare standard, de exemplu un MI de 5 nu inseamna mare lucru la un X2 de
300, insa modificarea devine importanta in cazul unui X2 de 100. Din experienia,
merita a fi analizate propunerile de modificare a modelului care au indicatorii
modificarii mai mari decat raportul X2/25. Tn cazuJ modelului nostru, x
2
(167) =
345.8, P < .001; rezulta 0 valoare de referinia a MJ de 13,83.
Covariances: M.l. Par Change Regression Weights: M.l. Par Change
e15 <--> e16 23,011 0,105 bis15 <-- bis17 14,609 0,148
e13 <--> bas-f 17,644 -0,070 bisl] <-- bis19 15,390 -0,122
e13 <--> e14 14,304 0,048 bis13 <-- bis17 15,572 -0,112
e08 <--> e09 16,lQ5 0,036 bisOl <-- bis08 13,992 0,334
Variances: M.L Par Change
Figura 5.15. Output-ul oferit de AMqS cu valorile indicilor modificarii mai mari de 13,83
SPSS este 0 marca inregistr<;lta .
Dintre cele opt propuneri de modificare observam ca nu exista nlcl una
care sa aiba 0 importania teoretica, majoritatea aspectelor privind corelalii Tntre
erori. Singura modificare care ar fi putut avea Joc ar fi fost eJiminarea itemului 7 din
scala, datorita unei saturaiii mai reduse in BIS, sub vaJoarea recomandata de .30,
dar indicatoruJ de modificare in urma renuniarii la aceasta relaiie este insignifiant,
fiind chiar mai mic decat 3. 0 asemenea vaJoare nu conduce decatla modificari
minuscule in evoluiia principalilor indicatori, aa cum reiese din tabelul 5.10.
Tabelul 5.10. Evolulia comparativa a principalilor indicatori de teslare a modelelor
Modelul testa! X2 df GFI AGFI. RMSEA NFl PNFI
SIS-BAS palru factori - 349.7 149 .90 .88 .063 [.054 - .071] .80 .69
19 itemi
BIS-BAS patru factori - 345.8 167 .90 .88 .062 [.052 - .068] .80 .69
20 de itemi
Aceasta situatie recomanda pastra:rea itemului 7. in test, deoarece
eliminarea sa nu conduce la 0 Tmbunataiire a modelului. In urma renuniarii la
itemul respectiv nu se constata un avantaj comparativ al acestui model in dauna
181
11111 11111 '1111, 11111 illlI, 111111111111111111111111111111111111111111111111111111111111111 ,1111111111 11111111111,1111111111,11111 11111111111 1111111111, 11111111111 11111I1111 1111111111 ,1111, 1111111111111111111111111111111111111111111111111111 1111 'I
111111 """,",,, 11111,111111 IIIIUIIIII 11111 illlll:1I1I1 II "'11"'""'1"'11'""'11"","",,'""""'1""'""'1"""'"",""""'"11""1""'1":""11"1""""'"111111,""""11"""'"11""1'""'""1'""'""11111111111111111,11111111111,11111111111111111,1111111111111,11111111111111111111111111,1111111111111:1111111111111,1111111111111:111111111111,1111111111111111111111111"111111111'111111111:1111111111111111111111111111'
celui cu 20 de itemL De aceea se recomanda pastrarea variantei de 20 de itemi a
scalei BIS-BAS.
De men\ionat, ca Tn cazul Tn care acceptam modificarile pe baza
acestor indicatori, ele nu au Un caracter confirmativ, ci doar exploratoriu.
5.2.5. Aspecte metodologice ale aplidirii analizei factoriale
confirmatorii
Tn finalul capitolului vom prezenta pe scurt informatii legate de volumul
In analiza factoriala confirmatorie, de tipul de colectate
analizate.factorial, precum de alte conditii ale distributiei datelor ce trebuie
Tndeplinite pentru a putea aplica aceasta
In ce privete numarul de subiecV necesari pentrua aplica aceasta analiza
:3e pastreaza regulile din analiza factoriala exploratorie. Astfel, parametrii nu pot fi
estimati adecvat sub 100 de subiec\i sau Tn condi\iile In Care nu exista un raport
de cinci-zece_subiec\i la :'0' variabila. Totui, ar fi de dorit ca numarul de subiecti
testa\i sa fie de cel pu\in 200 de persoane pentru modele factoriale dn
medie. >-- .
Datele care pot fi analizate prin aceasta metoda pot fi de tip numeric sau
ordinal. Astfel, raspunsurile nu sunt cele maipcitrivite pentru 0
astfel de analiza, dei printr-un artificiu determinat de proprietatile datelor
dihotomice ar putea fi tratate ca valori numerice binare 1 sau O. Tn acest caz
ar aparea 0 alta problema ce tine de imposibilitatea de a obtine 0 distributie
rn.L!ltivariata a conditia respectiva fiind pent'ru
a aplica verosimilitatii maxime, cea mai Tntalnita procedura in
analiza factoriala confirmatorie. Ramane ca 0 alternativa posibilitatea gruparii
itemilor Tn pachete de ltemi (Tn engleza "parcels") care sa fie analiz8te factorial.
Dupa Bryant i Yarno!d (1995) datele cu amplitudine scazuta sau distributii
conduc la atenuarea saturatiei itemilor In factorii respectivi. Tn cazul
distril)utii multivariate foarte anormale ' atat metoda estimarii verosimilitatii maxime
(in engieza MLE - "maximum estimation"), cat i metoda celo'r mai mici
patrate generalizate (Tn engleza GLS - "generalized least squared") vor produce
indicatori absoluti i comparativi distorsiona\i, iar aplicarea altor metode cum ar fi
ADF ( in engleza "assumption distribution free") necesita un numar enorm de
subieqi, de cateva mii.
In sfarit, nu toate e!ementele discutate mai sus trebuie prezentate Tn textul
articole!or trimise spre publicare, datorita spatiului redus. Tn general, ca Tn Clrice
problema inciuzand ecuatii structurale latente informatia minima oferita trebuie sa
cuprinda: ' "
182
1. 0 reprezentare grafica a unui model factorial structural, de obicei a celui
rezultat din dat'ele autorilor probei respective; aceasta reprezentare poate fi
eliminata din motive practice in cazul probelor lungi, peste 50-100 de itemi;
Tn acea situatie, figura poate fi inlocuita cu un tabel care sa prezinte atat
facto:ii ateptati, cat numarul de identificare al itemilor saturati Tn ace:;;tia;
totW;;I, graficul poate fl prezentat Tn cazul in care unitatea de baza nu este
itemul, ci pachetul de itemi similari;
2. . informatii sumare des pre tipul de matrice utilizata: despre metoda folosita
pe.ntru estimarea parametrilor i despre tratamentul datelor !ipsa i a celor

3. Tntr-un tabel a principalilor..indicatori absoluti comparativi
pentruflecare model testat, la care. vom adauga parametrii modelului
selectat daca este cazul; din pleiada de indicatori mentionati, pe
baza propnetatllor lor sau a frecventei de utilizare, recomand prezentarea
urmatorilor indici: X2(jf) cu_ pragul de semnificatie asociat GFI . AGFI
intervalul de Tncredere RMSEA, NEI. CFI, PNF] PCFI; , ", .,'
4. compararea, daca este cazul, a solutiilor aflate Tn relatii de tip cuib;
5. ultima piesa necesara implica prezentarea solutiei alese din perspectiva
parametrilor standardizati estimati implicand gradul desaturare a itemilor
In factoriirespectivi daca este cazul, a nivelului de corelatie rntre factori
(vezi figura 5.14.). '
B1BLlOGRAF1E
Baer, D. (2000). Latent variable structural equation models. A student's handbook at ICPSR
Summer Program, Ann Arbor, USA.
Browne, M,W., Cudeck, R., Tateneni', K., Mels, G. (1998). CEFA: Comprehensive
exploratoty factor analysis. Gasit la: http://quantrm2.psy.ohio-state.edu/browne/
Bryant, F.B., Yarnold, P.R., (1995). Principal components analysis and exploratory and
confirmatory factor analysis. In L.G. Grimm P.R. Yarnold (eds.) Reading and
understanding multivariate statistics (p.99-136). Washington DC: American
Psychological Association.
Carver, C.S., White, T.L. (1994). Behavioral inhibition, behavioral activation, and affective
responses to impending reward and punishment: The BIS/BAS scales. Journal of
Personality and Social Psychology, 67, 319-333.
Costa, P.T., McCrae, R.R. (1992). Revised NEG Personality Inventoty (NEO PI-R) and NEO
Five-Factor Inventoty (NEO-FFI). Professional Manual. Odessa, Florida: Psychological
Assessment Resources, Inc. .
Field, A. (2000). Discovering Statistics using SPSS for Windows. London: Sage
Publications.
Finch, J.F., West, S.G. (1997). The investigation of personality structure: statistical models.
Journal of Research in Personality, 31, 439-485.
Garson (2000). Factor analysis. Gasit la: http://www2.chass.ncsu.edu/garson/pa765/
logistic.htm
Hair, J.F. Jr., Anderson, R.E., Tatham, R.L., Black, W.C. (1998). Multivariate data analysis
(5
th
ed.). Upper Saddle River, NJ: Prentice Hall.
183
III III 'II' III 1111 III III II' 'I! Ii' :11 II, III 1111 111::111 III 'III III 1111 III 'III 1II'111i Illi :11' III III' !II 'II ____ :1111 'I
Iacobucci, D. (1994). Classic Factor Analysis. In R.P. Bagozzi (ed.) Principles of marketing
research. Cambridge, MA: Blackwell.
Johnson, RA, Wickern, D.W. (1998). Applied multivariate statistical analysis (4th ed.).
Englewood Cliffs, NJ: Prantice-Hall.
Joreskog, K.G., Sorbom, D. (1989). LlSREL-7 user's reference guide. Mooresville, IN:
Scientific Software.
Jorm, A.F., Chriestensen, H., Henderson, A.S., Jacomb, PA, Korlen, A.E., Rodgers, B.
(1999). Using the BIS/BAS scales to measure behavioral inhibition and behavioral
activation: Factor structure, validity, and norms in a large community sample.
Personality and Individual Differences, 26, 49-58.
Kachigan, S.K. (1991). Multivariate statistical analysis. A conceptual introduction (2nd ed.).
New York: Radius Press.
Kelloway, E.K. (1998). Using LlSREL for $tructural equation modeling. A researcher's guide.
Thousand Oaks, USA: Sage Publications.
Kline, P. (1993). The handbook of psychological testing. London: Routledge.
Margineanu, N. (1938). Analiza factori/or pSihici. Cluj-Napoca: Editura Institutului de
Psihologie a Universitaiii din ClUj.
Meulman, J.J., Heiser, W.J. (2001). SPSS Categories 11.0. Chicago: SPSS Inc.
Miclea, M. (1994). PSihologie cognitive. Cluj-Napoca: Casa de Editura Gloria.
Nicol, A.A.M., Pexman, P.M. (1999).Presi!nting your find;ngs. A practical guide for creating
tables. Washington DC: American Psychological Association.
Pedhazur, E.J, Schmelkin, L. (1991). Measurement, design, and analysis. An integrated
approach. Hillsdale, NJ: Lawrence Erlbaum Associates, Inc.
Poenaru, R. (1980). Didactogenia in coala. Pentru prevenirea i combaterea
didactogeniilor din invaiamant. Revista de pedagogie (9), 50-51.
Poenaru, R, Sava, F. (1998). Didactogenia In coale. Aspecte deontologice, psihologice i
pedagogice. Bucureti: Editura Danubius.
Ross, S.R., Millis, S.R., Bonebright, T.L., Bailley, S.E. (2002). Confirmatory factor analysis of
the Behavioral Inhibition and Activation Scales. Personality and Individual Differences,
33,861-865.
Sava, F. (2002). Causes and effects of teacher conflict-inducing attitudes towards pupils: a
path analysis model. Teaching and teacher education, 17(8), 1007-1021.
,Stills, D.L. (Ed.).(19S9). Intemtional encyclopedia of the social sciences: Biographical
supplement (VoI.1S). New York: Macmillan.
Tucker, L.R., MacCallum, R.C. (1997). Exploratory factor analysis. An online book, Gasit la:
http://quantrm2,psy,ohio-state.edu/maccallum/factornew.htm
. Wegener, D.T., Fabrigar, L.R. (2000). Analyzing nonexperimental data. In H.T. Reis i C.M.
Judd (Eds.). Handbook of researCh, methods in social and personality psychology
(p.412-450). Cambridge: Cambridg.e University Press.
Young, P. (2002). ViSta. Gasit la: http://forrest.psych.unc.edufresearch/
Zwick, W.R., Velicer, W.F. (1986). Comparison of five rules for determining the number of
components to retain. Psychological Bulletin, 99(3), 432-442.
184
CAPITOLUL 6
REGRESIA LlNIARA
Predileciia firii umane de, a consulta horoscopul sau de a asculta opiniile
avizate ale unui "expert Tn ghicitviitorul Tntr-o de cafea" s-a mentinut Tn
ciuda dezvoltarii tehnologice i tiintifice. Regresia statistica, dei nu la fel de
populara ca metodele amintite anterior, Ti propune, de multe ori, obiectiv: 0
predictie cat mai exacta a performantelor din viitor pe baza unor indicatori din
prezent sau trecut. Denumirea de poate induce Tn eroare specialitii Tn
psihologie, obinuiti sa utilizeze acest termen mai ales din psihanaliza, unde prin
regresie se Tntelegea 0 revenire spre trecut. Tn statistica, prin regresie ne
directionam frecventin sens opus, spre viitor, Tncercand sa prevedem cat mai
exact evolutia' vlitoare a lucrurilor. De exemplu, daca suntem un psiholog
organizational, va trebui sa prezicem, Tn procesul de selectie a personalului, care
persoana merita sa fie angajata dintr-un grup de candidati, pe baza unei estimari a
performantei viitoare a acestora. Similar, daca suntem un psiholog :;;colar i suntem
nevoiti sa identificam un grup cu risc crescut de a consuma droguri, va trebui sa
estimam, pe baza caracteristicilor lor actuale, evolutia lor ulterioara. Ambele situaiii
pot fi rezolvate prin apelul la tehnica statistica denumita regresie, Tn cazurile
respective fiind vorba de 0 regresie eu seop predietiv, Capacitatea de predictie
constituie de altfel una dintre caracteristicile definitorii ale unei discipline pentru a fi
considerata 0 tiinta.
Un alt tip de regresie, similara Tn multe privinte cu cea utilizata Tn scop
predictiv, este regresia in seop exp/ieativ. Din titulatura reiese diferenta esentiala
dintre cele doua scopuri majore ale regresiei. Prima este utilizata pentru a prezice
performantele viitoare ale unui grup de oameni pe baza unuia sau a IT]ai multor
indicatori actuali, denumiti predictori. Cea de-a doua, vizeaza explicarea influel)tei
unui set de factori asupra unei variabile criteriu, cunoscandu-se existenta unei
relatii cauzale Intre acestea. Un exemplu tipic de utilizare a regresiei In scop
explicativ este acela al identificarii influentei fumatullii in perioada prenatala asupra
dezvoltarii emotionale a copilului in primii ani de viata. Exista 0 multitudine de
factori care influenteaza dezvoltarea emotionala a copilului. Regresia explicativa nu
face altceva decat sa izoleze (controleze) statistic influenia factorilor respectivi,
pentru a vedea in ce masura fumatul contribuie in plus la acest lucru. De pilda,
daca se cunoate ca tipul de ata:;;ament, stilul educational al pariniilor, prezenia
sau absenta altor frati sau surori etc. influenteaza dezvoltarea emotionala a
copilului, prin regresie de tip explicativ se pot controla to atE). aceste influente pentru
a se observa daca fumatul mamei Tn perioada graviditatii contribuie, in plus, la
dezvoltarea emotionalanormala a copilului.
185
111111 IIIIIJIIIIIJIIII 111111 111111,111111 1IIIILlIIIII 111111 111111,1111111111!11111111111,IIIIIIIIIII'illllllllll'IIIII!IIIIIUIIIIIIJIIIIIIIIIIIIIIIIIIIIIII:IIIIII
Oiferentieri Tntre cele doua tipuri de regresie, Tn scop predictiv, respectiv Tn
scop explicativ, apar la nivel terminologic. Tn cazul ultimei, se pot folosi termenii
de variabila independenta variabila dependenta, iar 'in cazul primului tip, se
folosesc sintagmele predictor criteriu. Aceasta diferentiere terminologica are la
baza logica metodologica folosita Tn cazul celor doua tipuri de regresie. Astfel,
regresia Tn scop explicativ sa vada dacaun anumit factor influenteaza
evolutia variabilei dependente, prin controlarea influentei exercitate de' alte
varia bile incluse Tn model. Oaca prin controlarea acestor influente variabila
(variabilele) independenta( e) de interes contribuie semnificativ la evolutia' criteriului
am putea deduce existenta unei relatii Tntre acestea. Oaca relatia este 'sustinuta
o teorie relevanta Tn sau de 0 logica temporala sau' spatiala a' relatiilor
dintre ele, ne yom permite sa utilizam termenii de variabila
variabila dependenta, chiar daca nu avem de a face cu un design experimenta\.
Prin urmare, Tntrebarea principala la care Tn.cearca sa raspunda regresia utilizata Tn
scop explicativ este: "Contribuie acest factor laevolutia variabilei dependente, Tn
conditiile Tn care am controlat statistic influenta altor factori asupra acesteia?".
Nu lucru se face Tn cazul utilizarii regresiei Tn scop predictiv. Cu
toate ca nu este exclusa posibilitatea existentei unei relatii cauzale Tntre predictori
criteriu, nu acest lucru constituie interesul principal al analizei de regresie.
cum Ii spune numele, utilizarea regresiei Tn scop predictiv gasirea
unei ecuatii care sa estimeze cel mai bine evolutia criteriuluLConcret, daca criteriul
urmarit este nivelul de depresie, pot fi Tntre predictori tot felul de indicatori
care nu se afla Tn relatie cauzala cu criteriul, dar estimeaza bine nivelul acestuia.
De exemplu, includerea prefei"intei pentru culoarea neagra, scaderea apetitului
sexual etc., nu sunt cauze ale depresiei, dar Tmpreuna cu alti asemenea indicatori
pot fi utilizati eficient Tn a prezice nivelul de depresie al unei persoane. Prin urmare,
Tntrebarea principala la care Tncearca sa raspunda regresia utilizata Tn scop
predictiv este: "Care sunt predictorii care ne ajuta sa estimam cel mai bine evolutia
criteriului?". Tn cazuri rare, putem vorbi de 0 regresie cu scop mixt,
obiectivele cercetarii vizeaza atat aspecte estimative, cat explicative.
o alta diferentiere terminologica importanta este Tntre regresie liniara
simpla regresie multiliniara. Tn primul caz, vorbim de 0 regresie bazata pe un
singur predictor, de exemplu estimarea pe baza coeficientului de
inteligenta. Regresia multiliniara include mai multi predictori Tn ecuatie, precum
nivelul de inteligenta, motivatia nivelul de educatie al parintilor, pentru a
putea estima mai bine 0 alta denumire a regresiei multiliniare este
regresia liniara .multipla. Cu siguranta ca modelele multiliniare vor prezice
Tntotdeauna mai bine decat simple, care pornesc de la un singur
predictor. Ideea este intuita in astrologie, unde pentru a prezice stilul de
personalitate al unei persoane este necesar ca "specialistul" sa cunoasca mai multi
predictori: ziua de ora la care s-a nascut, anul etc. '
Tn continuare, pentru a putea Tntelege mai bine modul de functionai-ea
. ' ,
regresiei, yom explica mai intai regresia liniara simpla, bazata pe un singur
186
I!, !II 1111 :llli ,1111' 11111' lilli' '111111111111111111111' 1111111111' '1IIIIiIIIIIIIIIIUIIII,IIIIIIIIIIILlIIIIIIIIIIUIIII' 'III! 1111 '1111 1111-'1111 '1111' IIIIIJII '111' 1111 11111 !IIII 11111I1111 1111, IIII! 1111: '111' 1111 11111 iIIlll 11111 111111 '111111111111111111111' '1111111111 'IIIIIIIIII! 11111111111' '1111111111 '1111111111 !IIII! 11111 illll! 11111111111111111, 111111111111"111111 :1111111111' 11111111111: 1111111111' !III III: 1111 :111' !III 'III' III' 'III 1111 'II! 'II' 'II' III' III Jill illl ill 'II, 'I
nu preciza 0 informatie capitala: regresia Iiniara poate fi
?a.ca cntenul (variabila dependenta) a fost masurat printr-o scala
numerlca (de tlp mterval sau prop0rtii) daca relatia dintre predictori criteriu este
linia:a .. Pentru alt gen de exista alte tipuri de regresie precum, cea logistica
(vanablla. d:pend:nt.a . dlhotomica, de gen "Oa" sau "Nu"), cea logistica
multmomlnala (vanablla dependenta este masurata prin scala nominala alta decat
cea tip sau cea ordinala (variabila dependenta este prin
scala ordlnala, de genul raspunsurilor Tn patru trepte: "nesatisfacator"
"satisfacator", "bine" sau "foarte bine"). '
6.1. Regresia liniara simpla
6.1.1. Principii ale regresiei Hniare
Imaginati-va ca sunteti un proaspat absolvent de psihologie ajuns sa
lucreze in departamentul de re$urse umane din cadrul unei mari companii. Tn
aceasta calitate, sunteti pus sa selectati dintre mai multi candidati pe cei care vi se
par mai potriviti pentru a lucra in departamentul vanzari, in prima' linie a contactului
direct cu potentialii clienti. Care dintre candidati este mai potrivit pentru a fi
angajat? Pentru a raspunde la intrebare yom prezenta trei alternative posibile.
?ituatia I. Ati facut un curs introductiv de statistica, dar nu v-a placut.
In acest caz, cel mai probabil, Yeti aborda intuitiv situatia "ghicind"
performanta candidatilor pe baza unui set de intrebari sau indicatori ad-hoc
fara prea mare succes. ' ,
Situatia II. Ati facut un curs serios, dar introductiv de statistica, fara a
include regresia.
Tntr-o asemenea situatie, Yeti putea estima ceva mai corect performantele
viitoare ale candidatilor pomind de la proprietatile distributiei normale a
Oaca performanta era exprimata in volumul vanzarilor dintr-o luna, am putea
estima ca aproximativ 68% din candidaii vor obtine performante Tn jurul mediei
(intr-un interval situat la 0 abatere standard distania de 0 parte i?i'de alta a mediei)
(vezi sectiunea 2.6.2. Proprieta(ile unei distribu(ii norma/e din cadrul capitolului I).
Situatia III. Ati facut un curs serios df! statistica i intuiti ca regresia poate fi
so/uria corecta.
Tntr-adevar, prin. regresie se pot estima rezultatele viitoare ale unor
persoane pe baza unor indicatori din prezent. cum pe baza coeficientului de
inteligenta se poate prevedea intr-o anumita masura evolutia a elevilor f?i In
cazul vanzarilor, se poate prevedea performanta pe baza unor indicatori care au
legatura cu acest aspect. Totul de la existenta unei asocieri Tntre
indicatorul utilizat pentru a estima performanta viitoare 'criteriul ales pentrua
masura aceasta performanta. De exemplu, daca exista 0 corelaiie pozitiva intre
187
"',:IIIIIIIIIII'IIII'IIIIIIIIII"IIIIIIIIIIIIIII!'IIIII'IIIII,III,lIhlllllll"III'IIIIIIII'III'1111 Iii III '11"11 11I111 II':I'II:I'!I.I' II 11'1111:111111111111" ; ,:'1 ,:li"I:II ,111'11
extravertire performanta din vanzari (figura 6.1.), se poate estima ca persoanele
cu un nivel ridicat de extroversiune tind sa obtina performant
e
superioare Tn
fiind mai potrivite sa ocupe asemenea pozitii decat persoanele introvertite.
.l'l
<U
()
'6
c
c
<U
N
C
<U
>
.l'l
:J
N
<U
()
U)
*
*
C
lU
>
Introvertite
*
*
*
*
*
* *
*
*
Extravertite
Figura 6.1. Noru/ de puncte vizand re/aria dintre nive/ul de extroversiune i
volumul vanzari/or
Pornind de 1\3 aceasta asociere se poate estima ca persoanele cu un nivel
ridicat . de extravertire vor fi avantajate in domeniul vanzarilor, deoarece tind sa
obtina un numar mai mare de vanzari.
, Regresia sa gaseasca 0 ecuatie care sa ne ajute sa estimam
cat mai exact valoarea performantei viitoare. Oaca corelatia dintre doua variabile ar
fi egala cu 1 sau cu -1 am putea- anticipa exact rezultatele viitoare, deoarece linia
de regresie obtinuta sa treaca prin to ate rezultatele. Aceasta ar Tnsemna
ca nu exista nici 0 diferenta intre rezultatele constatate estimarile facute.
188
.l'l
:J
N
ttl
(.)
U)

N
C
ttl
>
Introvertite Extravertite
'"
ri
'6
c

N
C
ttl
>
.l'l
::J
N
ttl
(.)
U)

N
C
ttl
>
Introvertite
Extravertite
Figura 6.2. Noru/ de puncte lntr-o situatie de core/atie idea/a (stanga)
unit prin dreapta de regresie (dreapta)
11'1'11 'I! III'!I!:II"II'!II ,Ii il 11",::, 'i, '" I,ll 11111:'11
Din nefericire, situatia prezentata in figura 6.2 nu este reala, deoarece, Tn
practica, nu se obiin coeficienti de corelatie de +1 sau-1. De aceea, prin regresie
se urmarei?te gasirea ace lei linii care sa conduca la 0 estimare cat mai co recta a
rezultatelor. Cu alte cuvinte, se dorei?te gasirea acelei linii de regresie care sa
reproduca cel mai bine directia de evolutie a norului de puncte .
Q)

0
:g

N
C
<U
>
Q)
:;
N
<U
0
U)

N
C
<U
>
Q)

0
'0
c
.'

N
C
<U
..
>
Q)
:;
N
<U
0
II)
j
N
c
<U
>
Introvertite Extravertite I ntrovertite Extravertite
Figura 6.3. Noru/ de puncte lntr-o situatie de corelatie probabi/a (stanga)
unit prin cjreapta de regresie (dreapta)
Pentru a estima prin regresie rezultatele viitoare ale unui anumit criteriu
este necesar ca predictorul respectiv sa coreleze destul de bine cu criteriul care
trebuie estimat. Daca nu exista corelaiie intre cele doua elemente, linia de regresie
nu po ate fi estimata acceptabil, deoarece poate lua directii diferite.

()
'6
c

N
C
ro
>
<D
*
::;
N
ro
()
<J)

N
c
ro
>
Introvertite Extravertite
Figura 6.4. Directii multiple posibiJe ale liniei de regresie Tn absenta corelatiei
dintre predictor i criteriu
189
II " ,III 111111111111111.11111,111111.11111,111111,11111.111111,11III..IIII! IIlmJIIIII,llllmillmIJIIIIILmIIUlllllllmIUIIIIIIIIII' illlllllll, 1IIIulilUIli 11111:JlllllllllldIIIILlIIII,IIIIIIJlIII,IIIIIIIIIIUIIIJIIIIIIII! 11111,1111' '11111111: IIIII:!IIIII 11111:111111 11111'111111 11111 11111 III !II' IIIILIIIIIIIIII, IIIUIIIIIII 111111111,1111,1111: III' II, :1, III III' :111' mil '1IIIIJIIIIJIIIIIJIlIl 11111 11111 11111 '11111111' ,11111111' illlIlIlIIlIlII '111111111111111"11111111"111 '1111, 1111 1111111111111 11111111 1111111111111111,1111111111 1111111111 ,1111111111 11111
Pentru a stabili linia de regresie se apeleaza la proprietatile matematice ale
unei drepte, deoarece orice dreapta poate fi determinata prin urmatoarea ecuatie:
(6.1 )
unde bO este punctLiI de intersectie al ordonatei (interceptul), iar b'I este panta de
regresie (cu cat y, atunci cand x se modifica cu 0 unitate). ."
Panta de regresie ia 0 valoare pozitiva, daca exista 0 corelatl
e
pozltlva
Tntre x y 0 valoare negativa, daca exista 0 corelatie negativa intre cele doua
variabile. Pentru a Tnielegerea acestui demers putem inspecta vizual cele
doua imagini din figura 6.5. Imaginea din stanga are drept ecuatie de regresie:
y = 2,5 + O,5*X, in timp ce imaginea din dreapta are ca ecuatie de regresie:
y = 8 -1,5*X
C')
Interceptul
N
o
o
y= 2,50 + 0,50X
2 3
.<:2."\' * ib1 = -1,50

r--
*
*
*
N
o
4
o 2
Figura 6.5. Doua exemp/e ipotetice de linie de regre'Sie
y= 8 -1,50X
*
..
*
3 4 5
Pe baza imaginilor anterioare se poate observa mai bine cum se reprezinta
grafic Iinia de regresie pe baza ecuatiei obtinute. De exemplu, in din
stanga, punctul de interseciie a liniei de regresie cu ordonata este sltuat la
valoarea de bO = 2,50, Tn timp ce Tn dreapta el ia valoarea 8 (bO = 8). Ele
reprezinta estimarile lui Y, in situatia Tn care X ia valoarea O. Transpunand Tn cazul
concret al vanzarilor, daca pe abscisa 'este trecut numarul de itemi vizand
extrovertirea, iar pe ordonata este trecut numarul de vandute, din imaginea
din stanga am putea estima ca 0 persoana care a obiinut scorul zero la extravertire
va reu:;;i sa vanda pe luna 2,5 (y = 2,5 + 0,5*0), iar 0 persoana care a
obiinut scorul trei la extravertire va sa vanda 4 pe luna (y = 2,5 +
0,5*3). . .'
De asemenea, se observa din cele'doua imagini ca panta dreptel este mal
abrupta in cazul imaginii din dreapta, deoarece valoarea b1 = -1,50 este mai mare
190
in valoare absoluta decat b1 = 0,50 din imaginea din stanga. Valoarea acestei
pante indica cu cat cre:;;te (In cazul valorilor pozitive) sau cu cat scade (In cazul
valorilor negative) Y atunci cand X cu 0 unitate.
Linia de regresie care reda cel mai bine norul de puncte nu se
pe baza unor criterii subiective, cum ar fi simpla inspectare vizuala. Metoda
utilizata cel mai frecvent pentru a calcula interceptul :;;i panta de regresie se
metoda celor mai mici patrate (Tn engleza "least squares"). Metoda se
bazeaza pe calcularea sumei patratelor diferenielor dintre valorile observate :;;i
valorile estimate. Ne vom baza pe date Ie din figura 6.6 pentru a explica metoda
amintita.
o
o
N
N
o
o
(J)
o
o
CD
o
a
C'l
a
a
a
y= 1031 + 147X
o 23456 7
Suma = 0 Suma = 123.238
Legenda: X - Nivel de extravertire
Y - Vanzari lunare realizate (in Euro)
y' - Vanzari lunare estimate (in Euro)
Figura 6.6. Linia de regresie vizand re/atia dintre scoru//a extravertire i
va/oarea vanzanlor lunare In Euro
Pe baza ecuaiiei de regresie se estimeaza rezultate diferite decat
cele constatate. De exemplu, primul subiect a realizat vanzari lunare de 1500 de
EURO, Tn condiiiile Tn care se estimau, pe baza ecuaiiei de regresie, vanzari lunare
Tn valoare de 1619 EURO. Parametrii ecuaiiei de regresie se stabilesc, astfel Tncat
suma patratului diferenielor dintre valorile Y observate cele estimate sa ia
valoarea cea mai mica (ultima coloana din tabel). De exemplu, daca am fi schimbat
ecuaiia de regresie Tn Y = 1050 + 150X, suma patratelor diferenielor ar fi fost mai
mare, mai exact 130.400. Prin urmare, Tn cazul de faia valorile bO de 1031 b1 de
147 sunt oferite de catre programele statistice pentru ca duc la cea mai mica suma
a patratelor diferenielor dintre cele doua seturi de date (valorile observate
valorile estimate). eu alte cuvinte, parametrii ecuaiiei de regresie rezultati asigura
soluiia cea mai apropiata de rezultatele reale observate. .
Pentru a decide daca 0 ecuaiie de regresie descrie bine setul de date, spre
a putea fi folosita Tn scop predictiv, trebuie sa decidem cat de mare poate fi
191
diferenia dinlre rezullatele observate cele estimate. Tn acest sens, exista 0 serie
de parametri, valabili alai Tn cazul regresiei liniare simple, cat in cazul regresiei
multiliniare, pentru a descrie eficienia ecuaiiei de regresie in eslimarea rezultatelor.
6.1.2. Evaluarea eficientei unei ecuatii de regresie
intre indicatorii care ne of era informalii asupra eficienlei unui model de
regresie yom aminti testul F (Tntalnit In cazul ANOVA) R2 (coeficient de
determinare Tntalnit Tn cazul corela\iei).
Primul ne arata Tn ce"masura exista diferen\e semnificative statistic Intre
estimarile oferite pe baza ecuatiei de regresie implicate in compara\ie cu estimarile
bazate pe valorile mediei. Daca prediclorii in ecua\ia de regresie conduc la
estimari semnificaliv mai bune decat estimarile bazate pe rezultatele medii, atunci
valoarea F va fi semnificativa statistic. Daca F nu este semnificativ statistic, atunci
ecua\ia de regresie "nu-l?i are rostul, deoarece ea nu poate estima cu nimic mai
bine decat simpla consultare a mediei f<3spunsurilor subieciilor la criteriu.
Cel de-al doilea parametru poate fi consultat daca F este semnificativ
statistic. Dupa Field (2000), W of era informalii privitoare la procentajul din
dispersia variabilei criteriu care poate fi explicatiiI prin modul de evolulie a
predictorilor. in cazul regresiei liniare simple, R2 este coeficientul de determinare,
din cazul corelaiiei simple, Tn timp ce in Gazul regresiei Iiniare multiple, W
este coeficientul de determinare multipla. De?i are acela?i principiu de interpretare,
coeficientul de determinare multipla reprezinta procentul din dispersia criteriului
explicata de acpunea com una a tuturor predictorilor implica\i.
In cazul datelor prezentate in figura 6.6, SPSS-ul of era urmatoarele
rezultate:
192
Model Summary
R
,915"
a: Predictors; (Constant), Nivel de extraveriire
ANovJll'
Sum of
Model Squares df Mean Square
1 Regression 626471,5 1 626471,453
Residual 121178,5 8 15147,318
Total 747650,0 9
a. Predictors: (Constant), Nivel de extravertire
b. Dependent Variable: Vanzari lunare in Euro
Figura 6.7. Output o/erit de SPSS 11.0
SPSS este 0 mardi inregistrata.
F Siq.
41,359 ,000a
1I"II'IIIIIIIIIIIIIIIIIIIIIIIIIIII,IIIIIIIIIIIIJIIIIIIIIIIIIIIIII,IIII'III"11i
1111 1IIIi 1111
11::11 11"11 II"!I II"I! I!,"I
Din eel de-al doilea tabel se observa ea valoarea F esle semnificativa
statistic, fapt ce induce ideea superiorita\ii ecua\iei de regresie, bazata pe
introducerea nivelului de extravertire ca predictor,in estimarea vanzarilor in
comparatie cu estimarea vanzarilor pe baza mediei valorilor observate. Mai mUlt,
consultand primul tabel, se observa ca nivelul de extravertire al unei persoane
explica 83,8% din varia\ia vanzarilor observate (W = 0,838). Cu alte cuvinte, dac'
am incerca sa explicam diferentele constatate intre persoane.cu privire la vanzarile
lunare realizate de acestea, putem spune ca 0 mare. parte se datoreaza
diferen\elor in nivelul de extravertire dintre acestea. Restul de 16,2% din variatia
vanzarilor lunare. Tnregistrate se datoreaza altor factori, neluati in seama de
modelul testat, care a inclus doar extroversiunea ca predictor. A
9
adar, putem
afirma ea nivelul de vanzari realizate depinde de alii factori, dei extroversiunea
pare a fi variabila principala pe baza careia putem estima nivelul de vanzari
realizate. Din nefericire, asemenea procentaje ridicate, precum eel prezentat Tn
problema anterioara nu sunt intalnite in 9tiintele sociale decat in exemple ipotetice.
De obicei, R2 are valori mull mai modeste, fiind cuprins destul de des intre .10
.50, ceea ce inseamna ca majoritatea modelelor estimative din psihologie, bazate
pe regresie explica (estimeaza) intre 10% 50% din evolutia criteriului de interes.
DupE! cum se observE! din figura 6.8, valorile R2 sunt mai mari, dacE! linia
de regresie deserie bine directia evolutiei norului de puncte (R2 = .88 in imaginea
din stanga) ?i mai mici, daca linia de regresie nu descrie adecvat norul de puncte,
acestea fiind mai departate de directia estimata (R2 .45 in imaginea din dreapta).
..
..
*
..
*
* *
*
*
*
*
* *
*
*
*
*
*
*
*
*
*
*
*
*
* *
*
*
Figura 6.8. ReJatia dintre gradul de lmpratiere a pUr1ctelor din nor i valodle W
Din nefericire, cum remarcau Hankins, French Horne (2000), un
model nu este adecvat doar pentru simplul fapt ca R2 este mare sau inadecvat
pentru ca R2 este mic. Pentru a ne asigura ca valoarea lui RZ este apreciata corect
ar trebui sa facem 0 analiza a reziduurilor, adica a diferentelor dintre valorile
observate cele estimate pe baza ecuaiiei de regresie. este necesara
193
deoarece Tncalcarea unor condi\ii simple (ex. rela\ie neliniara, heteroscedasticitate,
prezenta datelor neobi$nuite) poate conduce la distorsiuni grave ale coeficientului
de determinare .. Despre aceste aspecte yom discuta In detaliu In sectiunea
destinata conditiilor necesare de aplicare a regresiei liniare.
la figura 6.7, observam i alti indicatori relevanti. De pilda, in
primul tabel, sub titulatura "R" este trecuta valoarea coeficientului de corelatie
liniara intre predictor i criteriu, Tn cazul de tata Tntre nivelul de extravertire i
nivelul vi:lnzarilor lunare realizate. Tn c'azul regresiei liniare simple, aceasta valoare
indica, de fapt, coeficientul de corelatie r Bravais-Pearson, Tntre predictor i criteriu.
Tn cazul unei regresii multiliniare, R indica corelatia multipla dintre criteriui grupul
de predictori inclui. De asemenea, merita sa fie remarcat faptul ca RZ reprezinta
patratul acestor coeficientide corelatie.
Un alt parametru regasit in outputul SPSS R2 ajustat. Acesta Tncearca
sa elimine unele dintre neajunsurile lui R2. Acesta din urma este dependent de
numarul de predictori inclui in ecuati<\ de regresiei de numarul de subiecti
testati. Tn forma sa ajustata, R2 incearca sa atenueze aceasta influenta, oferind un
parametru mai putin distorsionat. Totui, trebuie precizat ca indicatorul R2 ajustat
oferit de SPSS nu are rol de contravalidare, aa cum multi specialiti ar fi tentati sa
creada (Field, 2000). Astfel, el nu estimeaza procentajul din dispersia criteriului
explicata de predictori Tn cazul Tn care datele ar fi extrase pe baza raspunsurilor
subiectilor dintr-un alt eantion, ci arata -doar eticienta modelului estimativ propus
pentru eantionul de subiecti testati, Tntr-un mod cat mai putin distorsionat de
numarul de predictori sau de volumul eantionului. Dei of era informatii mai exacte
decat coeficientul de determinare, R2 ajustat ramane sensibil la distorsiune Tn cazul
nerespectarii condi\iilor necesare aplicarii regresiei liniare.
6.1.3. Testarea individuala a eficientei predictorilor In estimarea
evolutiei criteriului
Tn cazul unei regresii liniare simple, daca F a fost semnificativ statistic
Tnseamna ca predictorul inclus, in' situatia .de fata nivelul de extravertire, poate fi
utilizat in estimarea performantelor din domeniul vanzarilor. Tn schimb, in cazul
unei regresii multiliniare, eficien\a per ansamblu a modelului nu inseamna ca
fiecare dintre predictorii inclui poate estima eficient evolutia criteriului. De pilda, in
varianta unei regresii cu trei predictori, modelul poate fi considerat eficient, adica
mai bun decat 0 estimare pe baza valorii medii a criteriului, chiar daca numai un
singur predictor are legatura cu criteriul. Pentru a vedea care dintre predictod poate
estima cat mai corect evolutia criteriului, SPSS-ul of era un alt output, pe baza
caruia se poate exprima i ecuatia de regresie.
194
CoefficientS'
Unstandardized Standardized
Coefficients Coefficients
Model
B Std. Error Beta t Sip.
1 (Constant)
1031,249 101,614
10,150 ,000
Nivel de extravertire
147,232 22,894 ,915 6,431 ,000
a. Dependent Variable: Vanzari lunare in Euro
Figura 6.9. Output oferit de SPSS 11.0 cu valorile coeficien(ilor din ecuafia de regresie
SPSS este 0 mardi inregistrata.
Din aceasta figura se poate deduce ecuatia de regresie care poate fi scrisa
sub forma:
Vanzari lunare Tn EURO = 1031,2 + 147,2*Nivel extravertire;
sau,renuntfmd lazecimale:
Vanzari lunare Tn EURO = 1031 + 147*Nivel de extravertire.
Pe baza acestei ecuatii putem estima vanzarile pe care Ie vor realiza alte
persoane cu caracteristicisimil?re persoanelor testate. be exemplu, a persoana
care nu ar bifa nici un item ce exprima extroversiunea va realiza vanzari de
aproximativ 1031 de EURO lunar (a), Tn timp ce 0 persoana care a obtinut scorul7
la nivelul de extroversiune va realiza vanzari lunare dubIe, de aproximativ 2060 de
EURO (b).
Aceste rezultate au fost ob\inute Tnlocuind in ecuatiade regresie de mai
sus, valorile observate ale extroversiunii pentru cele doua persoane:
(a) Vanzari lunare Tn EURO:: 1031 + 147*0
(b) Vanzari lunare Tn EURO == 1031 + 147*7
Cu alte cuvinte, valorile b reprezinta coeficientii nestandardizati ai ecuatiei
de regresie, pe baza carora estimam cu cat crete criteriul atunci cand predictorul
se, mare!j>te cu 0 unitate. in exemplul dat, pornind de la faptul ca b extravertire este
147, putem estima ca volumul vanzarilor realizqte de 0 persoana care a obtinut, sa
zicem, cinci puncte la testul de extroversiune va avea vanzari mai mari cu 147 de
EURO decat 0 persoana care a obtinut patru puncte la testul de extroversiune, iar
aceasta, la randul ei, va obtine cu 147 de EURO mai mult decat a persoana care
are doar trei puncte la testul de extroversiune. In plus, interceptul denumit in SPSS
"constant" exprima nivelul vanzarilor obtinute de 0 persoana in conditiile Tn care
predictorul ia valoarea zero, In situatia data, daCE! persoana obtine zero puncte la
testul de extroversiune.
195
Se poate observa ca aceasta evolutie se men tine atunci cand coeficientul
de regresie al predictorului .ales are valori pozitive. Daca am fi obtinut un b negativ,
presupunem b = -147, ar fi Tnsemnat ca volumul vanzarilor lunare scade cu 147
de EURO de fiecare data cand scorul la extroversiune crete cu 0 unitate. Situatia
ar fi fost simiiara cu cea Tntalnita Tn cazul unei corelatii negative:cand X crete, Y
tinde sa scada.
Totui, valorile nestandardizate b sunt dependente de scala de masurare a
predictorilor i a .criteriului. De exemplu, valoarea coeficientului bpentru testul de
extroversiune se modifica, daca extroversiunea este masurata printr-o alta scala de
. masurare sau, daca vanzarile lunare sunt exprimate Tn lei sau dolari i nu Tn euro.
Astfel, daca yom transforma valorile exprimate Tn euro Tn lei, utilizand drept rata de
schimb 40.000 lei = 1 EURO, yom obtine alti parametri ai ecuatiei de regresie,. dei
eficienta modelului ramane aceeai.
Volum lunar de vanzi:iri Tn lei = 41.253.980 + 5.889.273*Nivel extravertire
Ce importanta are acest lucru?
Prin faptul ca parametrii nestandardizaii sunt dependenti de scala de
masurare, rezulta imposibilitatea de a compara direct influenta a doi sau mai multor
predictori asupra criteriului. De exemplu, nu se poate compara direct daca influenia
predictorului nivel de extroversiune asupra nivelului de vanzari (b1 = 147) este mai
mare decat influenta varstei subiectilor asupra volumului de vanzari (b2 = 18).
Pentru a observa predictor mai mult la estimarea evolutiei criteriului, se
obinuiete compararea standardizate ale acestor coeficienti b, denumite,
inciusiv de SPSS, beta.
Din figura 6.9 observam ca valoarea pentru extravertire este .91, ceea ce
inseamna ca, atunci cand nivelul de extroversiune crete cu 0 abatere standard,
criteriul, adica volumul vanzarilor, crete cu 0,91 abateri standard. Ecuatia de
regresie standardizata are interceptul egal cu zero, ceea ce face ca ea sa poata fi
scrisa sub forma:
Z vanzari lunare Tn EURO = .91*Z nivelul de extroversiune
Dupa cum se observa, 0 asemenea interpretare nu este la fel de
atragatoare Tn comparatie cu cea bazata pe coeficientii nestandardizati, dar are
avantajul eseniial, Tn cazul regresiilor multiliniare, de a putea compara simultan
eficienta predictorilor implicati Tn ecuatia de regresie. Astfel, daca am presupune ca
varsta este 1,21, am putea afirma CEi varsta unei persoane este un predictor mai
bun decat nivelul de extroversiune in estimarea vanzarilor lunare realizate. Acest
lucru poate fi facut, deoarece toate datele standardizate in cote z au aceeai
unitate de masura: media este zero, iar abaterea standard este egala cu unu.
o alta informatie extrasa din figura 6.9 consta Tn' faptul ca ambii parametri,
atat interceptul cat i panta de regresie, sunt semnificativi statistic. Tn cazul
196
regresiei liniare _simple, acest lucru era prevazut prin faptul ca valoarea F pentru
Tntregul model era semnificativa statistic. Tn schimb, in cazul existeniei mai multor
predictori, existenta unui F semnificativ statistic indica faptul ca cel puiin un
predictor poate estimi:) evoluiia criteriului, fara a porni de la ideea ca toti predictorii
vor avea capacitatea de a estima evolutia criteriului. Tn asemenea situatii, este
, ,
necesara consultarea valorilor t din dreptul fiecarui parametru prezentat in figura
6.9. pentru a vedea care dintre predictori explica semnificativ statistic evolutia
criteriului. Interpretarea este simpla: daca valoarea t asoCiata unui parametru este
semnificativa statistic (ex. t = 6.41, P < .001 Tn. cazul extroversiunii), atunci
predictorul respectiv Ti aduce 0 contribuiie semnificativa statistic la estimarea
evolutiei criteriului, in cazul respectiv a cifrei de vanzari lunare realizate.
Pentru a intelege rnai bine aceste detalii tehnice in interpretarea regresiei
liniare, yom prezenta un exemplu de regresie multiliniara. Tnainte de a face acest
lucru, se cuvine sa trecem Tn revista, pe scurt, principalele modalitati tehnice de
obtinere a ecLlatiei de regresie in cazul celei de tip multiliniar.
6.2. Modalitati de analiza in regresia multiliniara
De cele mai multe ori, modelele estimative bazate pe un singur predictor
nu sunt la fel de eficiente ca cele care inciud mai multi predictori. De exemplu, un
psiholog poate considera ca 0 persoana sufera de depresie, daca .are mai multi
indicatori (ex. stima de sine scazuta, scaderea apetitului alimentar i sexual,
preferinta pentru culori inchise etc.) decat, daca ar lua in calcul un singur element.
Tn situatia in care sunt inciui mai multi indicatori in modelul estimativ, vorbim de 0
regresie multipla. Analiza predictorilor inclui intr-o asemenea ecuatie de regresie,
indiferent de scopul acesteia, se poate face prin patru modalitati de baza: metoda
simultana, . metoda ierarhica, metoda pailor i metoda celui mai bun set posibil
(Licht, 1995).
Metoda simultana
Metoda simultana presupune introducerea concomitenta a tuturor
predictorilor de interes in cadrul ecuatiei de regresie. De exemplu; daca vrem sa
vedem in ce masura sexul persoanei, varsta acesteia, niveluf de educatie i unele
trasaturi de personalitate (ex. neuroticism i extroversiune) pot prezice atitudinea
subiectilor fata de am putea realiza 0 singura ecuatie de regresie, de
forma:
Atitudine telenovele = bO + b1*Sex + b2*Varsta + b3*Educa\ie + b4*Neuroticism + b5*Extroversiune
Aeeasta metoda este eel mai frecvent intalnita, fiind standard in
SPSS.
197
III II 'I 'II 'I' II 'i'il'lIliII III '11'111 ill II"II'II!III'II' 11',11 II! iII' III ill 'II , II' ii II' '1'111111,,11 Ii '11Uli .. ____ ,1111111111'11111111111'1111111111
Metoda ierarhica
Modalitatea presupune realizarea a cel putin doua analize de regresie,
aflate in rela\ie de tip cuib (toti predictorii utilizaii fntr-unul dintre modele se gasesc
fn cel de-al doilea). Pomind de la exemplul anterior, daca suntem interesati sa
vedem in ce masura trasaturile de personalitate extroversiune !?i neuroticism aduc
un plus predictiv in estimare'a atitudinii fata de telenovele, dupa eliminarea
influentei factorilor demografici, vom ave a urmatoarele doua ecuaiii de regresie: .
Atitudine telenovele = bO + b1*Sex + b2*Varsta + b3*Educalie
Atitudine telenovele = bO + b1*Sex + b2*Varstii + b3*Educalie + b4*Neuroticism + b5*Extroversiune
Fiecarei ecuatii Ii corespunde 0 anumita valoare F !?i un anumit coeficient
de determinare ajustat sau nu (R2 ajustat sau R2). Daca nu exista diferente intre
cele doua ecuatii, in privinta acestor valori, Tnseamna ca neuroticismul, respectiv
extroversiunea, nu aduc un plus de informatie cu privire la estimarea atitudinii
subiec\ilor faia de telenovele. Tn schimb, daca Fschimbare, obtinut prin diferenta
dintre cele doua modele este semnificativ statistic, Tnseamna ca trasaturile de
personalitate aduc un plus de informatii in estimarea atitudinii fata de telenovele. Tn
interpretare, acest lucru ar putea fi exprimat astfel: Tn conditiile Tn care persoanele
au aceea!?i varsta, acela!?i nivel de educaiie !?i acela!?i sex, difereniele de
personalitate la nivel de extroversiune i neuroticism contribuie semnificativ
statistic la tipul de atitudine adoptata fata de telenovele. Din acest motiv, regresia
ierarhica este frecvent utilizata Tn cazul regresiilor cu scop explicativ insa ea apare
foarte rar Tn regresiile cu scop predictiv.
Metoda pai1or
Cunoscuta Tn limba engleza sub titulatura de "stepwise", fie Tn varianta
"forward", fie in varianta "backward", metoda este criticata intens de speciali!?tii Tn
statistica, de!?i se bucura de 0 anumita popularitate in tagma cercetatorilor fi3ra 0
experienia statistica deosebita.
in varianta "Tnainte" ("forward"), ea consta Tn selectarea din setul de
predictori a aceluia care contribuie cel mai mult la estimarea criteriului, pe baza pur
statistica. Tn exemplul dat, prin aceasta metoda se realizeaza, ca prim pas, 0
analiza de regresie simpla, introducand separat fiecare dintre cei cinci predictori
(sexul persoanei, varsta, educatia, extroversiunea !?i neuroticismul), pentru a vedea
influenta lor in estimarea atitudinii fata d'la telenovele. in urma acestui pas este
selectat acel predictor care contribuie cel mai mUlt, prin valoarea coeficientului de
determinare, la estimarea criteriului. presupunem ca dintre cei cinci predictori,
cea mai mare influenta 0 exercita nivelul de educatie. Aceasta variabila este
selectata !?i introdusa Tn urmatorul pas. -Tn' acest de-al doilea pas se compara
modelele de regresie care au inclusa aceasta variabila i 0 alta, dintre cele ramase
pentru a fi testate. Tn cazul particular exprimat, in acest pas se com para patru
modele posibile ramase:
198
Atitudinea fata de telenovele = bO + b1 *Educatie + b2*Sex (1)
Atitudinea fala de telenovele = bO + b1*Educajie + b2*Varsta (2)
Atitudinea fata de telenovele = bO + b1*Educatie + b2*Extroversiune (3)
Atitudinea fala de telenovele = bO + b1'Educalie + b2*Neuroticism (4)
Dintre acestea, se alege modelul care are cel mai mare coeficient de
multipla. Sa presupunem ca dintre cele patru modele, primul are
coeflclentul de determinare multipla cel mai mare. Daca acest model t
'f r . b es e
Ica IV . mal . un decat modelul predictiv din pasul unu, bazat doar pe
nivelulul de educatie, el devine modelul cel mai bun !?i se trece la pasul
al trellea, In care se com para urmatoarele modele ramase:
Atitudinea fala de telenovele = bO + b1*Educalie + b2*Sex + b3*Varsta (1)
Atitudinea fala de telenovele = bO + b1*Educalie + b2*Sex + b3*Extroversiune (2)
Atitudinea fala de telenovele = bO + b1 *Educalie + b2*Sex + b3*Neuroticim (3)
Sa presupunem ca cel mai bun model dintre acestea este cel de-al doilea
in care este inclusa extroversiunea. Acest model se com para cu modelul de
pasul 2, iar daca este semnificativ mai bun, el devine cel mai bun model !?i se trece
la pasul vor ramane doar doua modele de comparat, dupa algoritmul
In prlmll pa!?1. Demersul poate continua p<':ma la epuizarea tuturor
vanabllelor, caz Tn care cel mai bun model este acela in care sunt inclu!?i toti cei
predictori. Daca, fnsa, diferenta dintre cel mai bun model din pasul trei cel
mal bun model din pasul doi nu este semnificativa statistic, vom concluziona ca nici
unul dintre cele trei modele de mai sus nu poate fi considerat mai bun decat cel
obtinut la pasul doi, iar modelul final poate fi cel obtinut la pasul doi:
Atitudinea fata de telenovele = bO + b1*Educatie + b2*Sex
.. "Prin urmare, prin metoda pa!?ilor se Tncearca gasirea pe baza eXciusiv
emplrlca a modelului care estimeaza cel mai bine evolutia datelor. Tn varianta
"inapoi" ("backward"), metoda pa!?ilor porne!?te invers, in pasul unu fiind prezentat
modelul cu toate cele cinci variabile, Tn pasul doi fiind prezentate to ate combinatiile
posibile de modele cu patru predictori. Daca vreunul dintre acestea nu
semnificativ diferit demodelul cu cinci predictori, el devine cel mai bun model
posibil !?i se trece la pasul trei, de' comparare a acestui model, cu cel mai bun
model obtinut din combinarea a trei dintre cei patru predictori rama!?i etc.
" De!?i, T.n metoda pa!?ilor este atractiva, prin extragerea acelui
numar de predictOr! ci3re explica cel mai bine evolutia criteriului ea sufera diverse
limite !?i m:todologice. Din punc! de apare pericolul
extrageru unor predlctori irelevanti sau al renuntarii la unii predictori reievanti sub
aspect teoretic. Din punct de vedere statistic, crese ansele de a 'Obtine
specific, aplieabil doar pe e!?antionul testat, ce nu poate fi replicat alii subiecti.
199
1111 1111, : 11111 iIIIII IIIII 1.1111111.111111iIIIIIIII11111W1111111111111111111 IIIIII iIIIII IIIII : II
La aceste neajunsuri se adauga 9i unele gregeli de atribuire a gradelor de libertate
111 cazul regresiei prill metoda pa9i1or, fapt ce cre9te probabilitatea de a comite
I:.lroarea de tip I, care, Tn acest caz, ar consta Tn includerea unor predictori care nu
ar fi trebuit inclu9i (Pedhazur 9i Schmelkin, 1991; Thompson, 1995a).
Metoda celui mai bun set posibil
Acest gen de regresie se apropie de principiul regresiei In pa9i, fiind Intr-un
fel, 0 generalizare a acesteia. Ea consta In compararea tuturor modelelor posibile
in functie de numarul de predictori inclu9i in model. De exemplu, daca am include
trei predictori 9i am utiliza metoda celui. mai bun set posibil, calculatorul va selecta
modelulcu coeficientul de determinare ajustat cel mai mare dintre toate cele 9apte
modele posibile (modelul care pastreaza cei trei predictori, tre; modele cu cate
doi predictori, trei modele cu un singur predictor). Deoarece se bazeaza pe
acelea9i principii ca cele intalnite in cazul regresiei in pa9i, metoda are acelea9i
neajunsuri.
Prin urmare, de9i exista mai multe metode de estimare a modelului
predictiv cu cel mai ridicat nivel de eficienta in estimarea criteriului, recomand
evitarea metodei pa9ilor 9i cea a celui mai bun set posibil.ln functie de scopul
urmarit, Yeti avea de ales intre metoda simultana 9i metoda ierarhica, ambele
posibil de selectat in SPSS. De altfel, metoda simultana este 9i optiunea standard
din SPSS (in engleza "enter"). Pentru a utiliza regresia ierarhica,. vom mentine
metoda "enter" insa dupa introducerea primului set de variabile yom apasa bUtonul
"next", iar apoi yom introduce atat variabilele din primul set, cat 9i cele care dorim
sa Ie introducem in eel de-al doilea.
6.3. Regresia multilinara In seop predietiv
La fel cum "speciali9tii" in astrologie considera ca pot deduce mai bine
personalitatea pe baza mai multor predictori (ex. ziua de na9tere, ora na9terii, locul
na9terii) decat pe baza unui singur criteriu, in cazul pe baza de
regresie sunt preferate modele Ie multiple (cu mai multi predictori) in fata celor
simple (cu un singur predictor). Daca revenim lei exemplulprezentat In sectiunea
destinata regresiei simple, ce viza gasirea unor predictori care sa ne ajute sa
estimam cat mai bine performanta In vanzari a candidatilor testati, ar fi bine sa
tinem seama 9i de alte varia bile, In afara extroversiunii. De exemplu, am putea
presupune ca performanta In vanzari este. afectata de experienta profesionala in
domeniu ("Cati ani de experienta profesionala in' domeniul vanzarilor au
candidatii?), gradul de atractivitate fizica a personalului din vanzari 9i de gradul de
neuroticism al acestora, cunoscandu-se faptul ca un nivel ridicat de neuroticism
corespunde unei afectivitati negative 9i unei rezistente scazute la frustrare 9i stres.
200
Pentru a da mai multa concreteie acestei situatii, Yom presupune ca 60 de
persoane angajate de doua luni in domeniul vanzarilor constituie lotul pe baza
caruia se va estima ecuatia de regresie vizand performanta in vanzari. Pe baza
acestei ecuatii vor puteafi apoi selectati viitorii angajati in domeniu. Datele sunt
prezentate in fi
9
ierul regresie multiliniara.sav.
De asemenea, se cuvine 'sa precizam modul Tn care au fost
operationalizate variabilele utilizate pe post de predictori, precum 9i criteriul. Acesta
din urma a fost reprezentat de venitul lunar obtinut din vanzari, de fiecare angajat,
in cea de-a doua luna de munca. Dintre predictori, extroversiunea 9i neuroticismul
au 'fost 'obtinute prin intermediul Inventarului de Personalitate Eysenck (EPI),
scorurile obtinute fiind Guprinse, pentru ambele scale, intre 0 9i 24 de puncte.
Gradul de atractivitate a fost obtinut pe baza sincronizarii raspunsurilor de la doi
colegi de sex opus, fiind utilizata 0 scala de la 1 la 10, unde 1 inseamna un aspect
fizic nelngrijit 9i neplacut, iar 10 un aspect fizic ingrijit 9i foarte placut. Tn privinta
experientei profesionale, aceasta a fost codata In trei categorii distincte.
Persoanele care nu aveau nici un fel de experienta profesionala anterioara au fost
notate cu 0, cele care beneficiau de experienta profesionala, dar nu In domeniul
vanzarilor, au fost cod ate cu 1, iar cele care aveau experienta profesionala In
domeniul vanzarilor erau cotate cu 2. Se observa ca, spre deosebire de ceilalti
predictori 9i de criteriu, care erau masurati prin scale de tip numeric, experienta
profesionala a fost op.erationalizata prin intermediul unei scale de tip nominal (In
acest caz particular poate fi perceputa 9i ca 0 scala d!:? tip ordinal). Pentru a analiza
influenta predictorilor de acest tip se recurge la un artificiu metodologic ce necesita
transformarea variabilelorcategoriale Tn variabile de tip "dummy".
Variabilele de tip "dummy"
Sub aceasta denumire sunt specificate In regresie toate variabilele
categoriale dihotomice, care permit raspunsuri de tip 1 sau 0 (Schroeder, Sjoquist
Stephan, 1986). De exemplu categoriile "barbat" 9i "femeie" din cadrul variabilei
"sexul persoanei"; categoriile "da" sau "nu" vizand 0 anumita atitudine sunt din start
variabile de tip dummy .. Una dintre categoriile de raspuns va fi notata cu 1 (ex.
femeie = 1; da = 1), iar cealalta categorie de raspuns va fi notata cuO (ex. barbat =
0; nu = 0). Raspunsurile notate cu zero mai sunt denumite 9i categorii de referinta.
Prin intermediul regresiei, coeficientii b rezultati arata" cu cat se modifica criteriul
atunci cand predictorul cre9te cu 0 unitate. In cazul particular al variabilelor
dummy, b arata cu cat se modifica criteriul atunci cand predictorul l:;;i schimba
categoria de raspuns (de la 0 la 1). De exemplu, daca b pentru sexul persoanei ar
fi 1000 9i am pastra drept criteriu volumul vanzarilor realizate in EURO, am putea
spune ca femeile (femeie = 1), in comparatie cu barbatii (barbat = 0), reugesc sa
obtina cu 1000 de EURO vanzari mai mari Tn domeniu.
Daca lucrurile sunt simple In cazul variabilelor categoriale de tip dihotomic,
ele se com plica putin in cazul unor variabile categoriale cu mai mult de doua
trepte. Spre exernplu, daca ar fi sa cont de starea civila a unei persoane, ca
201
II' '1111 11111 IIIIIUIIIUUlUlIl.IIIIUIIIIJIIIIIJIIIIJIIIIUIliILUIIIIUlIlIlIlliliclIIIIL,lIlIlllllll 11111"11111 11111 , 1111: '11111111111111 ,11111'111111111 !lIIh 11111 '1111111111 IIIIUIIIIIII: 1111111111 :111: '1111 'III' IIIIJIIUII '1IIUII'JIIUllulll: IIIIIJII'JIIJII!JIIJII 11111 IltIIIIIJIIIJII' 1IIIulili 1111111111 1111111111 '1111 1111 '1111 1111 III, :11' III 1111, ,11111111'.'1111.1-____ _
variabila predictor, aceasta poate fi exprimata prin patru categorii de raspuns:
o = necasatorit (burlac); 1 = casatorit; 2 = divor1;at; 3 = vaduv. Tntr-o asemenea
situaiie, pentru a vedea efectul starii civile asupra unei variabile criteriu este
necesan3 transformarea variabilei in variabile .de tip dummy (dihotomice). Se vor
forma un numar de k-1 variabile dummy, unde k este numarul de categorii de
raspuns. In acest caz, data fiind existenta a patru categorii de raspuns Yom obtine
trei variabile dummy. Ce vor avea Tn comun aceste variabile nou formate va fi
categoria de referinta. Alegerea acesteia se face in funciie de importania relativa a
raspunsurilor posibile 9i de frecventa acestora. Tn cazul starii civile, am putea alege
ca valoare de referinta prima categorie (0 = necasatorit), ceea ce Tnseamna ca cele
trei variabile dummy rezultate vor fi: casatorit, divor1;at 9i vaduv. Pentru a obtine
noile variabile se recurge la urmatoarele transformari. Pentru variabila dummy
"casatorit" yom avea doar doua raspunsuri posibile: { daca persoana este
casatorita 9i 0, daca persoana este necasatorita, divor1;ata sau vaduva. Pentru
variabila dummy "divor1;at" yom cota 1, daca persoana este divor1;ata :;;i 0, daca
persoana este necasatorita, casatorita sau vaduva. Tn sfar:;;it, variabila dummy
;,vaduv" are cota 1, daca persoana este vaduva 9i 0, daca ea se afla intr-una dintre
celelalte Irei categorii.
Dezavantajul transformarii variabilelor categoriale Tn variabile de tip
dummy consta Tn cre:;;terea artificiala a numarului de predictori, Tnsa aceasta
soluiie este singura care permite introducerea variabilelor categoriale ca predictori
Tn analiza de regresie.
Tabelul 6.1. Transformarea variabilei "experien" Tn variabile de tip dummy:
Numar Subiect "Experien" Dummv 1 "Exp. vanz"
1 0
2 1
3 2
4 1
5 0
6 2
7 1
8 2
9 1
10 0
Legenda categorie raspunsuri "experien":
o -' fara experienta profesionala;
1 - experienta profesionala Tn all domeniu;
2 - experienta profesionala Tn vanzari.
0
0
1
0
0
1
0
1
0
0
Dummy 2 "Exp. altd"
0
1
0
1
0
0
1
0
1
0
Daca ali Tnleles procesul de transformare a variabilelor categoriale Tn
variabile de tip dummy, atunci Yeti intui corect transformarile necesare Tn cazul
exemplului vizand variabila experienia profesionala. Dintre cele trei categorii
de raspunsuri: 2 - cu experienta profesionala in domeniu! vanzari!or; 1 - cu
202
'" 111"11,,1111 :I'" 1111 ,1111 "11,:1111 III ,I, ,', 'ii ,I, II " III, 'III ""'t,"":""IJI"J"I,"""I, II: lI'iil "' 111," 11,111" ,"I ,III, 1111 ,","1""1 1111:1111 11111,1111,11111111111111111111,11111111111111111111111111111111111111,11111111111:11111111"1""'"""",'""""""11'"1,"1'""'""'"111"' '"1111 ", "
profesio.nala Tn alte domenii; 0, - fara experienta profesionala
decis sa alegem drept categorie de referinta ultimul raspuns.
Aceasta declzle conduce la formarea a doua varia bile dummy, pe care Ie Yom
denumi exp_vanz :;;i exp_altd. Prima variabila dummy va cota indivizii care au
experienla Tn domeniul vanzarilor cu 1, iar pe toli ceilal\i cuO. Cea de-a doua
variabila dummy va cota indivizii care au experienta prefesionala Tn alte domenii cu
1, iar pe toti ceilal\i cu O. Tabelul 6.1 exemplifica aceasta transformare Tn cazul
primilor zece subiecti din fi9ierul regresie multipla.sav.
In cazul regresiei liniare SPSS-ul nu ofera posibilitatea de a transforma 0
variabila categoriala in varia bile dummy din meniu. Acest lucru poate fi facut doar
prin apelul la sintaxa. De aceea, cei care nu sunt familiariza\i cu ape lui la sintaxa
vor trebui sa recodeze variabila categoriala Tn variabile dummy, fie manual, fie prin
apelul la optiunea disponibila prin calea "Transform"-"Recode"-"lnto different
variables". Tn alte situatii, precum in cazul regresiei logistice, SPSS-ul permite
recodarea automata a variabilelor categoriale Tn variabile dummy. Tn acest caz,
raspunsul ales drept categorie de referinta trebuie sa fie intotdeauna codat cu 0
pentru ca SPSS alege automat aceasta ca referinta. Daca nici unul
raspunsuri nu este codat 0, SPSS-ul va alege ca valoare de referinla categoria de
raspuns cu valoarea cea mai mare. De exemplu, daca raspunsurile la variabila
"starea civila" ar fi fost codi3te: 1 - necasatorit; 2 - casatorit; 3 - divortat; 4-
vaduv, SPSS-ul ar fi ales automat categoria "vaduv" ca valoare de in
schimb, daca raspunsurile sunt codate precum in exemplul dat: 0 - necasatori't; 1 -
casatorit; 2 - divof\at; 3 - vaduv, va alege drept categorie de referinta varianta
"necasatorit". '
Revenind la exemplul dat, Yom avea de testat eficienta unui model
predictiv alcatuit din cinci predictori asupra performantelor in Cei cinci
predi<:;tori sunt extroversiunea, neuroticismul, gradul de atractivitate fizica, dummy
"experienla in vanzari" :;;i' dummy "experienta Tn alte domenii". Baza de date
aferenta este denumita regresie multipla.sav.
Prin intermeqiul regresiei liniare, disponibile in SPSS prin calea "Analyze"-
"Regression"-"Linear", yom obtine raspunsulla trei Tntrebari importante:
1. este acest model eficient?
2. care dintre predictori contribuie la eficienta modelului?
3. care dintre predictori are cea mai mare influenla asupra eficientei
modelului?
Raspunsurile la cele trei Tntrebari pentru cazul dat se gasesc sintetizate Tn
tabelele output oferite de SPSS 11.0. 9i prezentate in figura 6.10.
Primele doua tabele arata ca cei cinci predictori inclui conduc la un model
de regresie semnificativ statistic mai bun decat cel obtinut pe baza mediei - F(5,
54) = 10.46, p < .001, care este capabil sa explice, in forma ajustata, 0 propor1;ie
de 44,5% (R2 ajustat = .445) din evolutia dispersiei performan\elor Tn vanzari.
Restul de 55,5%, ramas neexplicat, se datoreaza altor factori, neintrodu:;;i
Tn modelul de regresie. TotU9i, merita mentionat ca 0 asemenea valoare, indica 0
203
1,11:1111 111111111111
buna putere explicativa Tn cadrul sociale, majorita.tea
de regresie din aceasta arie se reiuma la coeflcientl de determlnare multlpla
cuprini intre .10 i .50.
Model Summary
Model R R Square
Adjusted I Std. Error of
R Square the Estimate
1 ,701
a
,492 ,445 I 209,850
"
a. Predictors: (Constant), Expenenta In alte domenn,
Grad de atractivitale lizica, Neurolicism, Extroversiune,
Experienta in domeniul vanzarilor
Sum of
Model %luares df Mean %luare F SJg,
1 Regression 2302920 5 460583,993 10,459
Residual 2377998 54 44036,996
Total 4680918 59
"
..
a. Predictors: (Constant), Experienta in alte domenn, Grad de atraqtlvltate fizlca,
Neuroticism, Extroversiune, Experienta in domeniul vanzarilor
b. Dependent Variable: Vanzari lunare in EURO
CoefficientS'
Unstandardized Standardized
Coefficients Coefficients
Model B Std. Error Bela
1 (Constant) 1038,252 108,435
Exlroversiune 24,472 5,830 ,420
Neuroticism -8,898 5,283 -,167
Grad de atractivitate lizica 33,868 12,707 ,266
Experienta in domeniul
217,933 76,369 ,368
vanzarilor
Experienta in alte domenii 13,661 72,104 ,024
a. Dependent Variable: Vanzari lunare in EURO
Figura 6.10. Output SPSS 11.0 pentru regresia multipia
SPSS este 0 marca inregistrata.
6.3.1. Interpretarea coeficienlilor, de regresie
t
9,575
4,198
-1,684
2,665
2,854
,189
,Oooa
Siq.
,000
,DOD
,098
,010
,006
,850
Pentru a interpreta coeficientii de regresie corespunzatori fiecarui predictor
introdus in ecuatie, se tine seam a de trei criterii:
este acesta semnificativ statistic?
are 0 valoare pozitiva sau negativa?
este predictorul important?
204
r
!
I
Semnificatia statistica a predictorilor
Din ultimul tabel al figurii 6 ..10. se pot extrage informatii pretioase legate de
ultimele doua intrebari formulate, i anume: care dintre predictori contribuie la
eficient
a
modelului i care este ponderea predictorilor Tn cadrul modelului.
La 0 prima vedere, pe baza testului de semnificatie t, se constata ca,
exc/uzand interceptul,doar trei predictori din cinci contribuie semnificativ statistic la
estimarea perform ante lor din vanzari. Cei trei predictori sunt extroversiunea, nivelul
de atractivitatefizica i variabila dummy- ce opune persoanele cu experienta
profesionala in domeniul vanzarilor celor care nu aveau nici un fel de experienta.
Totui, tinand cont ca alegerea predictorilor nu s-a facut la intamplare, ci
pe baza unor premis'e teoretice, am putea spune ca avem de a face cu 0 ipoteza
de tip unilateral, in care se specifica din start directia de a criteriului in
functie de predictori. Astfel, ne-am atepta ca persoanele care au un nivel de
extroversiune i de atractivitate fizica mai ridicat, care au experienta profesionala in
domeniul vanzarilor i care au un nivel scazut de neuToticism, vor obtine
performante superioare in domeniul vanzarilor fata de persoanele care au
caracteristici opuse. in asemenea conditii, trebuie sa tinem seama ca semnificatia
testuJui t oferita de SPSS implica 0 ipoteza de tip bilateral. in consecinta, pragul de
semnificatie poate fi injumatatit pentru a testa semnificatia ipotezei uniJateraJe. Tn
urma consultarii ultimului tabel prezentaf in figura 10, se observa ca predictorul
neuroticism devine semnificativ statistic in estimarea evolutiei performantelor in
vanzari, deoarece in urma Injumatatirii pragului de semnificatie bilateral .096 se
obtine un t =: -1.68, p < .05.
Semnlll predictorilor
Daea eoeficientul de regresie bare 0 valoare pozitiva inseamna ca exista a
relaiie directa intre predictor icriteriu. Astfel, atunei cand predictorul crete cu a
unitate, criteriul cre:;;te de asemenea. Tn cazul unor valori negative ale coeficientul
de regresie exista 0 relatie inversa intre predictor i criteriu: cand -predictorul crete
cu 0 unitate, valoarea criteriului scade. Semnul predictorilor se interpreteaza doar
in cazul in care acetia contribuie semnificativ statistic 18 evoluiia criteriului. Tn
exemplul dat, nu ne intereseaza semnul ultimei variabile dummy, care face
diferenta dintre persoanele cu experienta profesion?la in alte domenii i cele fara
experienta profesionala, deoarece in lipsa semnificatiei statist ice a acestui
predictor nu se poate afirma ca acesta ajuta in vreun fel la estimarea performantei
Tn vanzari. In schimb, cu excePtia neuroticismului care are un coeficient de
corelat
ie
nestandardizat negativ (b = -8,898), toti ceilalti au a relatie directa cu
criteriul.
Ponderea predictorilor
In forma lor nestandardizata, coeficientii de regresie corespunzatori
fiecarui predictor arata cu cat se modifica criteriul, atunci cand predictorii cresc cu 0
unitate. Tn cazul regresiei multiple, precum in proplema de fata, aceasta
205
" 'iIUUIUI JlI! ,lUll' !III III, 1111 'III 'III, 1111 II' '1111 1111 'III' III 'II' ,III III III, III III 'II' 'IUIIIJlUI!JIUI'JI!JUIII 'IIUII 1111' III' IIIUII' 1111 'III' 111I :111 1111 I111 1111 illl III :11' !!I 'II ii' 'II 'i, ,il ii, 'h " 'I! ii ,I"I!:III !III'II! 111"111 11111:111'.111, ___ _
interpretare se pastreaza, adaugandu-se doar sintagma "Tn conditiile pastrarii
constante a celorlalti predictori".
De exemplu, in cazul"extroversiunii, b a fost 24,47, ceea ce Tnseamna ca 0
persoana care a obtinut, spre exemplu, scorul 11 la proba de. extroversiune, va
obtine vanzari lunare mai mari cu 24,47 EURO decat 0 persoana care a obiinut
doar 10 puncte la proba de extroversiune. Aceasta estimare este valabila Tn
conditiile Tn care pastram constanta influenta celorlalte variabile, 0 asemenea
situatie ipotetica fiind cazul Tn care cele doua persoane obiin rezultate identice la
to ate celelalte probe, singura diferentEl fiind faptul CEl la proba de extroversiune,
una dintre ele obtine un scor cu un punct mai mult decat cealalta.
Similar, Tn cazul neuroticismului, interpretarea asociat8 rezultatului
b = -8,898 ar fi: 0 persoana care obtine la scala de neuroticism cu un punct mai
mult decat 0 alta persoana, Tn condiiiile Tn care la celelalte probe au obtinut
performante egale (ceilalti predictori au fost tinuti constanti), se estimeaza ca va
ave a cu 8,89 EURO vanzari lunare mai mici decat cea de-a doua.
Tn cazul variabilelor dummy, interpretarea este u:;;or diferita. Astfel, Tn cazul
variabilei dummy "exp_vanz", care are un coeficient nestandardizat de regresie
semnificativ statistic (b = 217,93) se estimeaza diferentele Tn vanzari dintre 0
persoana care are rezultatul 0 la variabila dummy respectiva :;;i 0 alta persoana
care are cota 1 la aceea:;;i variabila, Tn conditiile In care influenta celorlalti predictori
este tinuta constanta. Tn exemplul dat, daca doua persoane obtin rezultate identice
la nivelul de extroversiune, la cel de neuroticism :;;i la cel de atractivitate fizica, dar
difera Tn ceea ce prive:;;te experienta profesionala, Tn sensul ca una are experienta
Tn domeniul vanzarilor (exp_vanz = 1), iar cealalta nu are nici un fel de experienta
(exp_vanz = 0), prima se estimeaza ca va obtine lunar, Tn vanzari, cu 217,93
EURO mai mult decil.t cea de-a doua. Cu alte cuvinte, Tn conditiile mentinerii
constante a influentei celorlalti predictori, experienia anterioara' Tn
vanzarilor aduce un plus lunar de 217,93 EURO In comparatie cu absenta oricarei
experienie profesionale.
Se observa In cadrul acestei variabile dummy ca se face comparatia cu
categoria de referinta aleasa, Tn cazul dat, persoanele fara nici un fel de experienia
profesionala. Tn cadrul acestei comparatii nu se tine seama de 0 alta categorie de
raspunsuri posibile, aceea a persoanelor care au experienta profesionala, dar Tn
alte domenii decat cel al vanzarilor. Comparatia dintre aceste persoane :;;i cele fara
experienta se obtine prin consultarea celei de-a doua variabile dummy "exp_altd",
al carei coeficient de regresie a fost nesemnificativ statistic (b = 13,66). Se observa
ca prin alegerea categoriei de referinta "persoane fara experienta profesionala" se
face de fapt compararea dintre aceasta :;;i toate celelalte categorii posibile. Tn
schimb, este imposibila compararea dintre categoriile care nu joaca rol de referinta,
Tn cazul de fata fiind imposibil tehnic sa comparam diferentele Tn performania din
vanzari dintre persoanele care au experienta Tn acest domeniu :;;i cele care au
experienta Tn alte domenii. Pentru a putea face acest lu'cru este necesar sa alegem
alta categorie de raspuns ca variabila de referinta. De exemplu, daca am nota cu 0
206
II! ill ill III 111,1111 111:lli III: ,Iii 111',ill Ilil 1111 'III: 111,lil ,11,:,1 ,11,,11 I! 111.l1;I',III:IIIIIII!IIII:111111111,11111111111111:1111111111111111111,,111 Illi '111 'III'!III 111,1111 111:1111 111:1111 III, ill ,II! III ,II,ill.li,!11
care a.u :xperienta Tn domeniul vanzarilor, am putea compara aceasta
categone de refennta cu persoanele care au experienta In alte domenii <:oi cu I
.. "' y
care nu au nlCj un fel de experienta profesionala. Similar, Intr-un astfeJde scenariu
nu am putea compara persoanele care au experienta profesionala Tn alte dome .:
I b f
nil
cu ce e care nu ene IClaza de nici un fel de experienta.
Daca se vor alege alte categorii de referinta: trebuie sa retineti ca valorile
coeficientilor standardizati se vor schimba, Tn asemenea situatii fi'ind 'necesara
noua analiza de regresie. ,0
Un alt aspect ce merita sa fie lamurit se refera la stabilirea unei ierarhii a
importantei:;;i a ponderii predictorilor Tn estimarea evolutiei criteriului. Tn acest
domeniu, coeficientii nesfandardizati b T:;;i dovedesc limitele, deoarece sunt
dependenti de amplitudinea scalelor de masurare utilizate. De exemplu, valoarea
aparent foarte mare b = 217,93 din dreptul variabilei dummy "exp_vanz" se
ca cu 0 unitate, de la 0 la 1, indica, de fapt, intreaga
scala de raspuns, pe cand un b de 24,47 indica evolutia criteriului in conditiile
modificarii tot cu 0 unitate a scalei de extroversiune, sa de la 0 la 1 chiar
daca raspunsurile sunt cuprinse de la 0 la 24 de puncte. Daca b ar fi
schimbarea de la 0 la 24, cu siguranta valoarea sa ar fi fost mult mai mare (de 24
de ori).
Pentru a elimina acest neajuns al coeficientilor nestandardizati b SPSS-ul
ofera :;;i coeficientilor standardizati, denumiti beta. Ace:;;tia au'
a nu .fl dependenti de scala de masurare, prin urmare ei permit 0 comparare
dlrecta a ponderii predictorilor. Din acela:;;i ultim tabel al figurii 6.10 se constata ca
Tn ordine descrescatoare a importantei lor in estimarea criteriului se afla: un nivel
ridicat de extroversiune (B = .420), experienta profesionala Tn domeniul vanzarilor
(B = .368), atractivitatea fizica (B = .266) :;;i un nivel scazut de neuroticism (B = _
.167). Cealalta variabila dummy, nefiind semnificativa statistic, nu prezinta interes
deoarece nu ajuta la estimarea performantelor Tn vanzari '
Unii autori precum Licht (1995). atras atentia asupra necesitatii de a
interpreta cu mai multa precautie ace:;;ti coeficienti beta. Astfel nu
este indicat jocul prop0rtiei ponderilor. De exemplu, este riscant ca
un B de .42 indica 0 importanta aproape dubla asupra estimarii performantei in
vanzari in comparatie cu un de .26. De asemenea, intre doua valori' beta
apropiate, ex. .42 :;;i B .36 este dificil de apreciat ca prima este mai mare decat a
doua, data fiind apropierea dintre cele doua care face posibila intersectia lor Tn
precizarii unui interval" de incredere pentru cele doua valori. Prin' urmare,
val?nle beta trebuie interpretate intr-un mod relativ. De exemplu, din valorile
ammtite mai sus reiese, destul de clar, ca experienta profesionala in domeniul
vanzarilor in comparatie cu absenta oricarei experiente profesionale :;;i nivelul de
ext:oversiune sunt cei mai importanti predictori ai performantelor in vanzari, cel
putln comparativ cu nivelul de neuroticism sau chiar cu gradul de atractivitate
fizica.
207
IIIJII" ___ IIIIIIIIIIIIIIIIIIIIIIIIIII,IIII!IIIII'II:I!
Din punct de vedere tehnic, ace!;>ti coeficienti standardizati se pot interpreta
lnlr-un mod similar cu cei nestandardizati. Daca cei din urma arata cu cal se
modifica criteriul Tn conditiile Tn care predictorul corespunzator cre!;>te cu 0 unitate,
iar ceilalti predictori raman conslanti, coeficientii standardiza.ti arata cu cat se
modifica criteriul Tn abateri standard daca predictorul In cauza cre!;>te cu 0 abatere
standard, iar ceilalti raman constanti. De multe ori, interpretarea pe baza acestor
coeficienti devine dificil de Tnteles sau fara un sens foarte clar. De exemplu, Tn.
cazul extroversiunii, de .42 arata ca, Tn conditiile mentinerii constante a influentei
celorlalti predictori, atunci cand nivelul de extroversiune cu 0 abatere
standard, criteriul cre!;>te cu 0,42 abateri standard. Din aceste considerente,
interpretarea datelor se face, de obicei, din prisma coeficientilor nestandardizati de
reg res ie, valorile' beta servind doar la aprecierea importantei ponderii
prediclorilor Tn estimarea evolutiei criteriului.
Ce sunt coeficientii de regresie din punct de vedere statistic?
in cazul regresiei liniare simple, beta este egal cu valoarea coeficientului
de corelatie simpla dintre predictor criteriu. In cazul regresiei multiple, datorita
prezentei mai multor predictori, beta nu mai este egal cu valoarea coeficientului de
corelatie simpla intre predictorul respectiv !;>i criteriu. Tn astfel de cazuri, beta este
un coeficient standardizat ponderat de regresie (Tn engleza "standardized partial
regression weight"), fiind din acest punct_ de vedere similar cu eel prezentat Tn
matricea modelului factorial, din cadrul analizei factoriale. Tn practica, se omite de
multe ori sintagma "partial" din titulatura, ceea ce poate duce la interpretari eronate
(Licht, 1995). Mai exact, coeficientul reprezinta 0 corelatie semipari;iala Tntre
predictor Daca corelatia pari;iala indica relatia dintre predictor criteriu,
dupa ce se elimina influenta celorlalti predictori Tn ecuatia asupra celor doi
termeni, corelatia semipar1;iala arata relatia dintre predictorul in cauza ace a parte
a criteriului care nu a fost explicata de ceilalti predictori din model.
6.3.2. Rolul ecuatiei de regresie in interpretarea datelor cu scop
predictiv
In urma oricarei analize de regresie efectuata Tn scop predictiv, ecuatia de
regresie are un rol esential. Prin intermediul ei, putem estima rezultatele altor
persoane, pe baza predictorilor gasiti relevanti pentru evolutia criteriului. Sa luam
ecuatia de regresie pentru exemplul dat, extras a din ultim tabel al figurii
6.10, pornind de la coeficientii de regresie:
Performanta vanzari = 1038 + 24,5*Extroversiune - 8,9'Neuroticism + 33,9*Atractivitate
fizica + 217,9*Dummy Experienta in vanzari + 13,6*Dummy Experienta Tn alte domenii
Pe baza acestei ecuatii, se pot estima rezultatele unui individ care, sa
presupunerri, obtine 10 puncte la proba de extroversiune, 5 puncte la scala de
208
neuroticism, prime9te nota 7 ca grad de atractivitate fizica 9i care are experienta Tn
domeniul vanzarilor. Ecuatia de regresie Tn cazul acestui individ devine: '
Performantaestimata Tn vanzari = 1038 + 24,5*10 - 8,9*5 + 33,9*7 + 217,9*1 + 13,6*0 =
1693,7 EURO
Trebuie remarcat un alt aspect tehnic, leg at de pastrarea celei de-a doua
variabile dummy Tn ecuaiie, ea nu a contribuit semnificativ statistic la
estimarea valorii' criteriului. Acest lucru a fost necesar, deoarece cealalta variabila
dummy a fost semnificativa statistic. In mod normal, variabilele care nu contribuie
la estimarea criteriului sunt eliminate din ecuatie, aceasta masura fiind
urmata de 0 alta analiza de regresie, obtinuta doar pe baza predictorilor
semnificativi, deoarece valorile b ale_ acestora se modifica prin renuntarea la
anumiti predictori. Singura exeeptie 0 constituie variabilele de tip dummy, care sunt
eoncepute Tmpreuna ca un set de predietori. Tn cazul lor sunt posibile doar doua
decizii: fie se pastreaza toate variabilele, daca cel putin una dintre ele este
semnificativa (precum Tn exemplul dat), fie se elimina intreg 'setul de variabile
dummy, Tn cazul Tn care nici una dintre acestea nu contribuie semnificativ la
estimarea eriteriului.
6.3.3. Instrumente complementare regresiei Tn scop predictiv
6.3.3.1. Decizia organizafionala
In urma stabilirii unei ecuatii de regresie, se poate constata eficienta
modelului estimativ propus !;>i prin alte mijloace decat consultarea valorii
coeficientului de determinare multi pia. Astfel, am putea impar1;i subiectii pe seama
mediei ori a medianei, in functie de distributia statistica avuta, in doua grupe:
subiectii care au obtinut rezultate sub valoarea mediei (medianei), respectiv
subiectii care au obtinut rezultate peste valoarea mediei (medianei). Aceea9i
impar1;ire se poate face utilizand. rezultatele estimate ale subiectilor, utilizand insa
drept criteriu, media sau mediana acestor estimari. Tn urma acestui demers, yom
. obtine un tabel, precum cel de mai jos, Tn care .vor rezulta patru categorii de
subiecti: cei pentru care atat rezultatele observate, cat 9i cele estimate, se afla
deasupra mediei (1); cei pentru care atat rezultatele observate, cat 9i cele estimate
se afia sub nivelul mediei (4); cei ale caror rezultate observate sunt deasupra
mediei insa rezultatele estimate se afla sub acest indicator (fals negativ) (2);
respectiv cei ale caror rezultate observate se afla sub nivelul mediei, dar a caror
estimare se afia deasupra acestei valori (fals pozitiv) (3).
209
I 111,111 !I' !!I 1IIIilii 11111111'11111111,,11111111,1111 IIII_'II'III"IIIII"'I'III"II"II'II!III"I",I:I III !III11'111 !II 'IIi III "111'11'111111'111111'111111' i
.,1' ii, I: ,'i Ii" 1111; '1,'!'Ii"1 11'1',
Tabelul 6.2. Oistributia subiectilor pe categorii conform acestei metode patratice
, ,
Rezultate observate
. Rezultate observate
sub medie peste medie
Rezultate estimate sub medie + + (4) - + (2)
Rezultate estimate peste medie + - (3) - - (1)
Conform acestui tabel, cu cat procentul persoanelor ale caror rezultate au
fost estimate coreet (cadranele 1 4) este mai mare, cu atat modelul se
mai uti! Tn c1asificarea performantei subiectilor pe baza ecuatiei de regresie
obtinute.
, Tn cazul utilizarii ecuatiei de regresie din exemplul prezentat, pornind de la
baza de date "regresie multipla.sav", sunt necesare mai multe operatii.
, Prima dintre ele vizeaza salvarea valorilor estimate ale criteriului, ca
variabila noua, in urma rularii analizei de regresie in cauz8 (calea "Analyze"-
Regression" -Linear" -"Save" -Unstandardized").
Cel de-al doilea pas consta Tn calcularea mediei a medianei pentru cele
doua variabile de interes - criteriul observat, respectiv criteriul estimat -
alegerea celui mai potrivH ind'lcator descr'lptiv pentru felul in care arata distribut'la
datelor. Tn cazul dat, distributia pare normala pentru ambele cazuri, iar valoarea
mediei a fost de 1407,27 pentru datele observate, respectiv de 1407,266 pentru
datele estimate, fiind practic egale.
AI treilea pas consta in recodarea celor doua variabile in doua variabile
diferite, nou-create, astfel Incat valorile mai mari decat media sa ia valoarea 1, iar
cele mai mici decat media sa ia valoarea 0 (calea "Transform"-"Recode"-"Into
Different Variables").
Tn urma acestui pas, putem realiza un tabel de contingenta cu rezultatele
obiinute:
Tabelul 6.3. Situatia c1asificarii subiectilor Tn exemplul dat
Rezultate observate Rezultate observate
sub medie-O peste medie - 1
Rezultate estimate sub medie - 0 26 (8) 6 (C)
Rezultate estimate peste medie - 1 5 (0) 23 (A)
nterpretarea acestui tabel se face simplu: din totalul de 60 de subiect
i
testati, pe baza ecuatiei de regresie 49 dintre ei au fost identificati corect. Astfel, 26
dintre cei care au obtinut rezultate medie, au fost estimati corect, pe baza
ecuatiei de regresie, ca obiinand rezultate sub medie. Similar, in 23 de cazuri, s-a
identificarea co recta a persoanelor care au obtinut rezultate superioare
mediei. S-au inregistrat e:;;ecuri, la subiecti s-au estimat rezultate sub
medie, Tnsa ei au obiinut rezultate peste medie, respeetiv la cinci subiecti s-au
estimat rezultate peste medie Tnsa s-au obtinut rezultate sub medie. Aceste
210
ilill '11111 11111;,11111 ,1111 III ,II 11:1',11 111111111111
sunt normale, din moment ce R2 ajustat corespunz- tor ecuatiei de regresie nu a
luat valoarea 1, ci doar 0,445.
Pe baza acestui tabel se poate obiine i un procentaj de,
corecte, pe baza formulei:
A+B
Corect = -----
A+B+C+D
(6.2)
Tn cazul dat, valoarea obtinuta indica 0,8166, ceea ce arata un procentaj
de 81,66% de estimari corecte. Un asemenea rezultat se apreciaza subiectiv. De
exemplu, a estima corect in aproximativ 4 din 5 cazuri performania Tn vanzari
6btinuta de candidaiii la un post in domeniu poate fi considerata 0 cifra destul de
buna, pentru a include predictorii respeetivi in decizia procesului de selectie. Tn alte
situaiii, mai ales din domeniul medical, un asemenea procentaj nu este
satisfacator, mai ales daca el atribuirea unui diagnostic insa In
situatii speciale, poate fi acceptat, daca alte metode nu 0 predictie mai
buna.
.. Pitariu (1983, p. 140-145) of era 0 analiza in detaliu a acestor aspecte,
oferind 0 serie de indicatori ce pot fi calculati utilizati in decizii de selectie
profesionala. Merita sa fie mentionat faptul ca, in asemenea situatii, impartirea
subiectilor in satisfacatori nesatisfacatori nu trebuie sa se faca tinand seam a
neaparat de medie. De exemplu, daca suntem interesati de candidatii foarte bun'l
pentru un anumit post, ar fi nepotrivita impartirea subiectilar In cele doua grupe pe
baza mediei sau a medianei, deoarece un rezultat putin mai mare decat
indicatori nu inseamna un rezultat foarte bun. De exemplu, dad;i cei care
efectueaza selectia candidatilor intr-un post de vanzari considera ca un angajat
foarte bun ar trebui sa yanda lUnar Tn valoare de 1700 de EURO, am putea utiliza
acest criteriu de impartire a candidatilor In "potriviti" "nesatisfacatori". Utilizand
procedeu explicat mai sus, in cazul segmentarii subiectilor pe baza mediei,
apeland la baza de date yom obtine urmatoarea distributie a subiectilor:
Tabelul 6.4. Situatia c1asificarii subiectilor considerati "foarte buni" Tn exemplul dat
Rezultate observate Rezultate observate
pana In 1700 peste 1700
Rezultate estimate pana in 1700 45 (8) 8 (C)
Rezultate estimate peste 1700 4(0) 3 (A)
Din acest tabel se vede ca in ceea ce identificarea subiectilor cu
rezultate foarte bune in dorneniu, lucrurile nu stau la fel de bine. Astfel, dintre cei
11 subiecti care au obiinut performante superioare valorii de 1700 de EURO,
intrand In categoria personalului din vanzari foarte bun, doar tre; au fost identificati
coreet de catre model. Ceva mai bine stau lucrurile in cazul celor considerati a nu
face parte din categoria celor buni. Astfel, dintre cei 49 de participanti care au
211
III: 1111111111:
obllnut performante Tn vanzari sub valoarea de 1700 EURO, 45 au fost identificati
coract. Prin urmare, modelul este destul de bun pentru a detecta pe cei care nu pot
face parte din categoria "foarte buni" Tn domeniul vanzarilor (fal!?i
pozitivi) Tnsa nu este foarte. bun Tn evaluarea subiectilor care fac parte din categoria
celor foarte buni, din cauza numarului relativ mare de subiecti fal!?i negativL Totu!?i,
Tn ansamblu, modelul predictiv poate fi folosit Tn lipsa altora mai eficiente, deoarece
conditia minima de acceptare a modelului, !?i anume, ca estimarea pe baza
inclui sa fie mai buna decat cea realizata in absenta acestora, este
indeplinita. Formula de verificare a acestei conditii este (Pitariu, 983):
A A+C
-->-----
A+D A+B+C+D
(6.3)
Inlocuind datele din tabelul 6.4. in formula de mai sus, obtinem (3/7> 11/60), adica
0,245, ceea ce se traduce prin faptul ca, in urma utilizarii ecuatiei de regresie
respective fn selectia personalului in vanzari, cre!?te procentul celor care vor
corespunde eerintelor postului cu 24,5%. Mai multe detalii despre modul de
utilizare a regresiei Tn procesul de selectie pot fi gasite Tn Pitariu (1983).
6.3.3.2. Contravalidarea
Tn cazul regresiei utilizate in scop predictiv, 0 importanta deosebita 0 are
contravalidarea sau validarea transversala (in engleza "cross-validation").
Indiferent de termenul folosit, prin acest procedeu se Urmare!?te sa se stabileasca
in ce masura 0 ecuatie de regresie obtinuta pe baza chestionarii unui e!?antion de
subiecti poate fi folosita cu succes in predictia performantei altor subiectL Pentru a
realiza acest tip de validare exista trei mijloace de baza, primele doua fiind !?i cele
mai potrivite. Astfel, 0 prima posibilitate consta in injumatatirea e!?antionului testat
printr-o metoda aleatorie, urmata apoi de calcularea coeficientilor ecuatiei de
regresie pentru cele doua grupe. De exemplu, daca au fost testati 250 de subiecti,
se pot obtine doua grupe a cate 125 de subiecti care sunt analizati prin metoda
regresiei. Daca coeficientii de regresie din cele doua ecuatii sunt apropiati ca
valoare, se poate estima ca ecuatia de regresie obtinuta prin agregarea celor doua
grupe este deslul de solida i poate fi folosita in prediqia evolutiei altor subiec\i.
Avantajul acestei metode consta Tn economia de timp !?i resurse, iar dezavantajul
ccinsta in numarul relativ mare de subiecti ce trebuie testati pentru a putea imparti
e!?antionul Tn doua grupe. De exemplu .. daca avem in total-doar 100 de subiecti
testati, injumalatirea lor va conduce la un numar destul de mic de subiecti pentru a
estima coreet coeficientii de regresie, deoareee un e!?antion mie conduce la
estimarea unor coeficienti de regresie cu un grad ridicat de instabilitate.' Tn
asemenea condi\ii am putea ajunge la concluzia ca nu yom putea utiliza ecua\ia pe
alti subiec\i, dei instabilitatea coeficientilor de regresie s-ar datora numarului mic
212
de subiecti testati !?i nu unor caracteristici ale e!?antionului care nu permit
generalizarea.
o alta posibilitate consta Tn testarea altor subiecti !?i compararea
rezultatelor celor doua ecuatii de regresie. Aceasta metoda este cea mai buna din
perspectiva validitatii ecologice insa necesita. un consum mare de resurse. '
In sfar!?it, cea de-a treia modalitate ar fi sa consultam estimativ valoarea
afustat-. a coeficientului de determinare multipl-, R2 afustat oferit de SPSS, care
de!?i nu reprezinta ceea ce multa lume crede, !?i anume, eficienta modelului
in cadrul populatiei din care a fost extras e!?antionul testat (Field, 2000),
ofera 0 Idee despre eficienta utilizarii ecuatiei de regresie !?i pe alti subiecti decat
@cei testati. valoarea sa ajustata este suficient de mare (e2:: R2 =
.40) !?I nu difera mal mult de trel-patru procente de valoarea lui R2 neajustat-
exista premise pentru a putea generaliza modeful estimativ pe tOii subiectii din
a fost extras e!?antionul. Aceasta ultima posibilitate este In mai mare niasura
supusa riscului de a ne inela in comparatie cu primele doua. De aceea, recomand
ca Tn situaiia utilizarii regresiei in seop predictiv, sa se realizeze 0 contravalidare
fie prin analiza dubla a grupelor extrase prin lotului de subiecti
(;")n
prin
testarea unui nou. e!?antion !?i compararea obtinute pe cele
wloturi. .
. Revenind la exemplul dat, numarul redus de subiecp testati (N = 60) nu ne
permlte aplicarea metodei de injumatatire. Cum nu exista un alt e!?antion de
comparaiie, va trebui sa ne multumim cu aprecierea valorii ajustate a coeficientului
de determinare multipla. Tn condiiiile In care R2 ajustat este .445, iar R2 este .492,
se observa 0 distanta destul de mare intre cele doua valori, fapt care pune sub
semnul Tndoielii posibilitatea de a generaliza rezultatele obtinute. Totui, nu ne
baza foarte mult pe aceste rezultate, deoarece diferenia destul de mare
dll1tre cele doua valori se poate datora numarului relativ redus de subiecti testati
In ultimii ani s-au dezvoltat alte metode de contravalidare' a
mOdelelor de regresie precum bootstrap (0 traducere aproximativa a termenului din
limba engleza este de largire sau Intindere). Bootstrap-ul (Thompson, 1995b)
implica copierea setuluide date de cateva sute sau mii de ori intr-un fi!?ier foarte
mare. Apoi, din acesta sunt extrase sute sau mii de eantioane diferite a caror
marime este egala cu cea a e!?antionului initial. Tehnica permite datelor deja
extrase sa fie selectate din nou, fiind astfel diferita de extragerile Iota, Tn care un
numar, 0 data extras, nu mai poate fi pus la loc. pentru a putea fi ales din nou.
Pentru fiecare dintre sutele sau miile de eantioane obtinute se calculeaza
rezultatele individuale, in functie de scopul urmarit (ex. medii, abateri standard,
coeficienti de regresie etc.). De exemplu, se poate obtine 0 medie generala pentru
coeficientul de regresie corespunzator unui anumit predictor pe baza coeficientilor
de regresie observati in fiecare e!?antion extras. Prin aceea!?i metoda se
i eroarea standard a acestui coeficient general, care nu este altceva decat
abate rea standard obtinuta in urma impra!?tierii mediilor din el?antioanele extrase.
Daca aceasta eroare standard ia 0 valoare redusa, ne putem increde
213
III:!III 1111'111 1111 111':111 III 'III 111:'111 !II'III III! III I 111'111:1111 1111'111'1111'111'1111 111"111 111"111 III! '11':1"'11 Iii! 111"111 ill: 'III illl III'II:!II'" ""I!I' i II: .II: I III II, ii ,II I: :1, 'II: .III III: ,III !II! III III Iii !II: 111I illl 1111 IIII! ,1111 illl Illi III i:
coeficientul de regresie obiinut, aspect eseniial Tn orice analiza de regresie, cu atat
mai mult In cea cu scop predictiv.
6.3.3.3. Analiza cazurilor influente
In stabilirea ecuaiiei de regresie, nu toate cazurile, adica nu toti subieciii,
contribuie la fel la stabilitatea coreditudinea ecuaiiei de regresie gasite.
Regresia, fiind bazata pe ideea asocierii dintre variabile, are toate limitele
prezentate in cazul corelatiei. Spre exemplu, cum valoarea coeficientului de
corelatie poate fi afectata gray de prezenta unor date linia de
regresie poate fi gray afedata de asemenea'valori. Figura 6.11. ofera 0 ilustraiie a
acestei situaiii, Tn figura din stanga fiind prezentata linia de regresie Tn absenia
cazului iar Tn dreapta se poate observa evolutia ei Tn prezenia acestui
caz.
Simpla prezenta a unor date poate afecta linia de regresie
conduce la rezultate distorsionate. Astfel, daca analizam linia de regresie din figura
din dreapta se observa ca traiectoria ei nu coreet evolutia majoritaiii
punctelor, adica a cazurilor observate, deoarece tine seam a de influenta datelor
extreme asupra modelului. Daca asemenea date ar fi eliminate, precum Tn
imaginea din stanga, linia de regresie va descrie mult mai bine evolutia criteriului.
Prin urmare, in cazul utilizarii regresiei Tn scop predictiv trebuie sa analizam
neaparat daca exista date sa neutralizam influenta acestora prin
realizarea unei noi regresii dupa eliminarea lor din analiza, deoarece ele afecteaza
valorile coeficientilor de regresie.

-0)
10
* tl
*
tl
:g
::0
*
c

c
* co
N N
c c
* rn co
> >
*
.$ .$
*
:::J :::J
N N
co co .*
tl tl
(j) (j)

N N
c c
co co
> >
I ntrovertite Extravertite I ntrovertite Extravertite
Figura 6.11. Influenta datelor neobi:;nuite asupra pantei Iiniei de regresie
Pentru a identifica cazurile Tn vederea obtinerii coeficientilor
de regresie cei mai potriviii pentru a descrie setul de date, se pot realiza urmatorii
214
,1111111:I',!1 11:111 Ili;11 III II III II' '1111111111111111111,1111:111,1111,11111111.111111111111:111:1111'11111111 111:1111 Illi,111 1111,111 1111 111',111 III II, ,1,11,,1;';'1
pa$i. Se calculeaza reziduurile, care cum am amintit, constituie diferenia dintre
scorul estimat $i cel observat Tn ceea ce criteriul. Deoarece reziduurile
sunt dependente de unitatea de masura utilizata Tn evaluarea criteriului, se poate
calcula rezidul standardizat, in stil clasic (Tn engleza "standardized reziduals"),
asemanator cu cel prezentat Tn sectiunea destinata cotelor z sau printr-un artificiu
de calcul (Tn engleza "studentized reziduals"). Ultimul pare a fi mai eficient in
estimarea co recta a valorilor standardizate Tn cazul reziduurilor. Interpretarea
acestora se face intr-un mod similar cu cel prezentat in standardizarea datelor.
Astfel, Tn mod normal aproximativ 95% din reziduurile standardizate ar trebui sa
aiba valori cuprinse Tntre -2 +2, iar aproximativ 99% ar trebui sa aiba valori Tntre -
3 $i +3. Daca observam un numar mult mai mare de valori situate Tn afara acestor
intervale, sa zicem 4% se afla In afara intervalului [-3 +3]. am putea afirma ca
ecuaiia de regresie obtinuta este influeniata Tn masura destul de mare de prezenta
cazurilor extreme. Daca acestea se afla intr-un numar redus (ex. 1% din reziduurile
standardizate au valori cuprinse Tn intervalul [-3 +3]), atunci influenia datelor
asupra ecuaiiei de regresie poate fi socotita minima, $i Tn consecinia,
modelul estimativ poate fi utilizat Tn prediciie.
Nu numai datele pot exercita 0 influenia mare asupra
coeficieniilor din ecuatia de regresie. Alaturi de acestea pot fi Tntalnite $i alte cazuri,
denumite influente, care pot afecta valorile coeficieniilor de regresie. Logica
acestora este simpla: daca yom elimina un anumit caz din setul de date, iar acest
lucru va conduce la modificari importante Tn valorile anumitor coeficienii de
regresie, Tnseamna ca acel caz e,xercita 0 influenia importanta asupra modelului
estimativ. Pentru a verifica existenia cazurilor influente se pot calcula 0 muliime de
indicatori precum: rezidul standardizat eliminat (in engleza "studentized deleted
rezidual), distania lui Cook, distania lui Mahalanobis etc. Dintre acestea, distania
lui Cook este cel mai de interpretat. Daca valoarea sa este mai mare de 1,
atunci cazul respectiv are 0 influenia mare asupra parametrilor modelului (Cook
Weisberg, apud Field, 2000).
Concluzia care ar trebui desprinsa din analiza indicatori este sa
se pastreze, pe cat posibil, to ate cazurile observate Tn analiza de regresie.
Tn situaiii excepiionale, Tn care anumite cazuri constituie atat date
clare, cat cazuri care influenieaza in mare masura ecuaiia de regresie obiinuta
(valori ale distantei lui Cook mai mari de 1), acestea pot fi eliminate, pentru a
obtine un model estimativ cat mai cored. Aceasta recomandare trebuie urmata mai
ales in situatia in care regresia este folosita in scop predidiv, deoarece va reduce
rezidul (distanta) dintre valorile observate cele estimate pe baza, ecuatiei de
regresie.
In problema data, vizand estimarea performantei subiec\ilor in vanzare,
datele indica absenta unor cazuri neobii?nuite I sau influente, cum rezulta
din outputul oferit de SPSS 11.0.
215
Residuals Statistics"
Minimum Maximum Mean Std, Deviation N
Predicted Value 1026,23 1814,13 1407,27 197,567 60
Std, Predicted Value -1,929 2,059 ,000 1,000 60
Standard Error of
41,297 147,192 64,695 14,897 60
Predicted Value
Adjusted Predicted Value 1018,69 1813,29 1408,34 197,618 60
Residual -381,07 545,66 ,00 200,761 60
Std, Residual -1,816 2,600 ,000 ,957, 60
Stud. Residual -1,897 2,736 -,002 1,004 60
Deleted Residual -415,65 604,10 -1,07 221,466 60
Stud, Deleted Residual -1,945 2,920 ,002 1,026 60
Mahal. Distance 1,302 28,044 4,917 3,526 60
Cook's Distance ,000 ,134 ,017 ,027 60
Centered Leverage Value ,022 ,475 ,083 ,060 60
a, Dependent Variable: Vanzari lunare in EURO
Figura 6,12, Indicatori descriptivi In analiza datelor neobinuite i a cazurilor influente
SPSS esteo marca lnregistrata,
Informaiiile de interes maxim au fost Se observa ca nu exista
nici un caz neobi!iinuit (valorile reziduurilor standardizate ajustate fiind cuprinse
Intre -1,89 2,73) !iii nici un caz influent (distantele Cook fiind cuprinse Tntre 0
0,13), Daca soar fi intalnit asemenea cazuri, acestea trebuiau identificate,
consultand noua variabila creata i denumita automat de SPSS coo_1,
6.4. Regresia multiliniara in seop explicativ
Exista multe Tntrebari interesante la care se poate oferi un raspuns
fara a fi interesati Ynsa de evolutia unei anumite persoane, De pilda, am
putea studia care trasaturi de personalitate pot prezice adulterul, daca consumul
de tutun inhiba sau faciliteaza procesul de Invatare, daca stilul de personalitate
afecteaza performanta In conducerea autovehiculelor etc, Tn toate aceste situatii
ne intereseaza variabilele respective, care pot oferi un raspuns epistemic deosebit
de uti! i nu subiectii utilizaii, pentru ca nu ne propunem sa facem anumite
concrete, precum cele Intalnite In selectia profesionala, Tn consecinta, daca In
regresia de tip predictiv eram interesati, In ultima instanta, de valoarea estimata a
performantei subiectilor pe baza unei ecuatii de regresie obiinute, in cazul regresiei
cu scopexplicativ ne intereseaza procesul In sine, fara a acorda 0 importania
estimarii valari/or subiectilor.
6.4.1. Logiea regresiei utilizate In seop explicativ
Regresia cu scop explicativ este utilizata frecvent ata! in cercetarile
fundamentale, cat in cele aplicative, In absenta unui design experimental care sa
permita atat manipularea variabilelor independente, cat controlul acelora care ar
putea afecta relatia dintre VI VD, este dificil sa izolezi 0 relaiie de tip cauzaL Mai
mult, datorita unor situatii specifice sau a Incalcarii unor standarde etice de
cercetare, experimentul nu poate fi utilizat, chiar daca ne dorim sa studiem 0 relaiie
de tip cauza-efect Tn asemenea situatii, regresia multilinara reprezinta metoda de
compromis,. prjn care se Tncearca stabilirea unei relatii nedistorsionate Tntre
variabila independenta (predictor) ii variabila dependenta (criteriu), Tn conditiile
controlului statistic al altor variabile de interes, De exemplu, daca am dori sa
vedem care este influenta factoriIor de personalitate asupraconducerii agresive a
autamobilului, ar trebui sa tinem seama de 0 serie de as peete intermediare care
pot afecta relatia dintre eL Astfel, nu putini dintre noi am vazut, de obicei seara,
straine conduse de "puti" ce aseulta muzica la maxim gonind pe
strazi, punand Tn pericol viata oamenilor a traficului din acele momente, Ar fi
imposibil sa realizam un pe aceasta problema numai din motivul ca
trasaturile de personalitate nu pot fi manipulate experimental. Tn absenta acestei
manipulari, ne ramane posibilitatea controlului efectelor altor variabile posibile
asupra variabilei dependente, De pilda, tipul de sexul varsta subieciilor,
prezenia sau absenta altor persoane In automobiletc, sunt numai caiiva factori
care pot infiuenia conducerea agresiva a mainiL Pentru a controla aceti factori
avem doua opiiuni. Fie vom exercita un control In designul cercetarii, prin alegerea
unui eantion de subiecti similari (au acelai gen de acelai numar de
persoane In sex varsta), aspect care nu ne avantajeaza
din perspectiva resurselor avute la dispoziiie, fie yom exercita un control statistic
asupra influentei acestor factori In relatia dintre trasaturile de personalitate i
conducerea agresivaa autoturismului.
Regresia Iiniara multipla in scap explicativ, aplicata prin metoda ierarhica,
este calea principala de control statistic al influentei altor variabile asupra relatiei
dintre cele de interes, In cazul dat, prin regresie ierarhica putem raspunde la
Intrebarea: "influenieaza anumite trasaturi de personalitate tendinia subiectilor de a
conduce maina In mod agresiv, in condiiiile contrplarii (eliminarii) influeniei altor
factori situationali precum tipul caracteristicile demografice ale
etc.?",
Drept exemplu, vom utiliza 0 baza de date ipotetica, adaptata dupa
cercetarea realizata de Miles i Johnson (2003), Prin comportamentul de
conducere agresiva se In\elege un ansamblu de practici precum conducerea
automobilului cu viteza excesiva, inadecvata situatiei In trafic, nesocotirea unor
reguli de circulaiie de baza, nervozitate la volan asociata cu adresarea de Injuraturi
sau gesturi obscene celorlalti participanti la trafic, stare de surescitare sau stres
intens, autori au identificat trei dimensiuni de personalitate din Big Five care
ar exercita 0 influenta semniflcativa asupra conducerii de tip agresiv, Astfel, 0
217
'III III: III 111!.Ili .III 1111 111':111 111:,111 ill,,111 111,111 'II,II! Iii II!II:II ill 'I!' .II 'III III! ,III !III:I :! 1111:111,1111,111,11, :111:111:,111'.1111,111:1111111 il ,II ,; ,,'I.u;i "IIIIIIIIUI1IIIIIIIIIrnmmIlWI.... IIII':III,III!ii'
0 agreabilitate scazuta, asociate cu un riivel ridicat de
leuroticism favorizeaza conduita agresiva la volan.
Daca am utiliza regresia, Tn forma sa simultana, am putea vedea care este
)onderea fiecaruia dintre cei trei factori, Tnsa nu am putea controla altor
:actori (ex. varsta, nivelul de educatie, sexul persoanei etc.) asupra conduitei
19resive. Prin urmare, ar exista riscul ca relatiile observate Tntre tn3saturile de
)ersonalitate conducerea agresiva a sa se datoreze acestor variabile
erte, pe care nu Ie-am controlat. De aceea, pentru a vedea Tn ce masura aceste
de personalitate influenteaza comportamentul la volan al subiectilor Tn
eliminarii influentei altor factori asupra acestei conduite Tn trafic, va trebui
,a utilizam regresia liniara ierarhica, tehnica utilizata frecvent Tn cazul regresiei cu
,cop explicativ.
Ca orice regresie de tip ierarhic, ea presupune com para rea eficientei
a cel putin doua modele ierarhice. In cazul de fata, tinand cont ca
tariabilele de control utilizate au fost sexul persoanei, tipul de (straina sau
3utohtona), varsta nivelul de educatie (superioare, respectiv medii sau
Jimnaziale), cele doua ecuatii de regresie sunt:
la volan = bO + b1*Sex + b2*Tip b3*Varstii + b4*Educa\ie
la volan ='bO + b1*Sex + b2*Tip + b3*Varstii + b4 *Educa\ie + b5*Neuroticism +
J6*Agreabilitate +
Daca diferenta dintre puterea explicativa a celor doua ecuatii este suficient
je mare, putem afirma ca trasaturile de personalitate influenteaza la
tolan, chiardaca eliminam influenta altor factori precum tipul de sau
demografice ale subiectilor.
Inainte de a trece la celor doua ecuaiii, pomind de la baza de
jate "regresie multipla auto.sav", trebuie sa discutam pe scurt ce fel de variabile
,unt trecute Tn prima ecuatie de regresie. De obicei, aici sunt trecute variabilele
se doresc a fi controlate, fie pentru ca nu prezinta interes pentru obiedivul
,tudiului (precum Tn situatia de fata, Tn care ne intereseaza doar influenta fa<;:torilor
je personalitate asupra conduite agresive la volan), fie pentru ca au fost dovedite
3nterior ca avand 0 influenta semnificativa asupra variabilei dependente. 0
3semenea situatie apare Tn cercetarile complexe Tn care se izolarea unui
,feet Tn conditiile unei actiunii comune a unei categorii de factori. De pilda, Tn
;ercetarile vizand rolul nociv al fumatului asupra sanataiii, acesta a putut fi susiinut
lUmai dupa eliminarea (controlarea) altor factori importanti pentru evolutia starii de
,anatate a unei persoane precum poluarea, antecedentele familiale, varsta, etc.
Astfel, vom include Tn aceasta prima ecuatie, fie factorii de interes despre
;are exista suficiente informatii ca ar influenta evolutia variabilei dependente, fie
actorii care nu fac obiectul studiului respectiv, dar pot afecta rela\ia dintre variabila
ndependenta (VI) i cea dependenta (VD). De asemenea,
ltilizarea !itulaturii de VI pentru predictor,' respectiv de VD pentru criteriu, regresia
!18
1""1111."",1""11.,1111",,,1,,111,'11',',;,'11,,,",1""'1"111'"11"11111111 111111111111,1111'1111111111111111111111111111111 1111'11111111,11111111,111,111111111111111111111111,1111111111 ""1"""""1'"111"""1""1""1,"""""1,11""""11'""""1111""11"'""1111111111111,1111111,1111111,,111111,'11111111111111111
nu existenta unei relatii cauzale, aceasta fiind demonstrabila doar prin
apelul la metoda experimentului. pe baza unei analize logice bazate pe
antecedenta relatiilor degenul "fumatul afecteaza grav sanatatea" i nu "sana!atea
afecteaza grav fu'ma!ul", am putea deduce de multe ori directia relatiei cauzale.
In cea de-a doua ecuatie, pe langa fadorii prezentati Tn primul model, va fi
inclus i setul de predidori (predictorul) despre care presupunem ca influenteaza,
de asemenea, evolutia VD.
Pentru a realiza Tn SPSS 0 regresie ierarhica vom apela la calea:
"Analyze"-"Regression"-"Linear". In Jereastra deschisa vom introduce agresivita!ea
la volan ca variabila dependenta i predictorii din prima ecuatie ca variabile
independente. Apoi vom apasa butonul "Next", iar de aceasta data vom introduce
atat predictorii inclui Tn primul pas, cat i variabilele independente de interes, Tn
cazul dat: "agreabil", "neurotic" i "constiin".
6.4.2. Testarea eficientei explicative a modelului propus
Prin intermediul rezultatelor oferite de SPSS 11.0 i prezentate Tn figura
6.13., vom obtine raspunsul la Tntrebarea: contribuie trasaturile de personalita!e la
explicarea conduitei agresive la volan Tn conditiile Tn care vom controla influenta
factorilor demografici care afedeaza comportamentul
Model Summary
Chanae Statistics
R Adjusted Std. Error of R Square F Sig. F
Model R Square R Square the Estimate Change Change df1 df2 Change
1
2
,562" ,316 ,303 1,859 ,316 24,926 4 216 ,000
,688
b
,473 ,456 1,643 ,157 21,202 3 213 ,000
a. Predictors: (Constant), EDUCATIE, MASINA, GENDER, VARSTA
b. Predictors: (Constant), EDUCATIE, MASINA, GENDER, VARSTA, constiinciozitate, agreabilitate,
neuroticism
Figura 6.13. Compararea eficientei modelelor
SPSS este 0 marca inregistrata.
Din tabel pot fi desprinse cateva informatii esentiaie. De exemplu, se
consta!a ca 31,6% din evolu\ia dispersiei rezultatelor la agresivitatea la volan poate
fi explicata de caracteristicile demografice ale (varsta, sex, educatie) de
caracteristicile mainii. Aces! procent daca luam Tn calcul i cele trei
trasaturi de personalitate, astfel Tncat nu mai putin de 47,3% din dispersia criteriului
agresivitate la volan poate fi pusa pe seama ac\iunii comune a fadorilor
demografici, a tipului, de maina i a acelor trei factori de personalitate selecta\i.
Mai mult diferenta dintrecele doua valori ale coeficientului de determinare , ,
219
6.R2 (delta R2 sau R2 schimbare) este de 15,7%. Toat aceast a
puterii explicative a modelului estimativ poate fi pusa exclusiv pe seama influentei
celor trei dimensiuni de personalitate asupra agresivitat
ii
la volan a
Rezultate'similare vom sesiza daca vom tine seama de valorile ajustate ale
coeficientilor de determinare multi pia.
Se poate observa, de asemenea, ca acest plus explicativ adus de
introducerea dimensiunilor de personalitate in explicarea agresivitat
ii
la volan
aduce 0 schimbare semnificativa statistic, F(3, 213) = 21,20, P < .001, dupa ce
modelul initial, bazat doar pe factorii demografici i tipul de constituia 0
solut
ie
predictiva semnificativ mai buna decat cea bazata doar pe studiul mediei,
F(4, 216) = 24,92, P < .001. In concluzie, factorii demografici tipul de
contribuie semnificativ la predictia nivelului de agresivitate la volan, controland
influent
a
acestor factori, dimensiunile de personalitate aduc un plus explicativ
pentru nivelul agresivitatii la volan.
6.4.3. Interpretarea de regresie in analizele cu scop
explicativ
Daca la nivel global lucrurile sunt clare, din figura 6.14 vom deduce, la
nivel analitic, care dintre variabilele incluse in studiu ca predictori contribuie
semnificativ statistic la explicarea nivelului de agresivitate la volan. Pentrll a
procesul de interpretare vom oferi mai intai modalitatea de codare a raspunsurilor
utilizata in acest caz:
Gender (1- barbat; 0 - femeie); Maina (1- s!raina; 0 - fabrica\ie autohtona); Vars!a
(variabila numerica exprimata in ani); Educa\ie (1 - studii superioare; 0 - studii medii sau
gimnaziale); Neuroticism (variabila numerical; Contiinciozitate (variabila numerical;
Agreabilitate (variabila numerical; Agresivitate la volan (variabila numerical
Pentru to ate scalele numerice, un rezultat ridicat indica un nivel crescut al
variabilei respective.
Se constata ca programul ofera valorile coeficientilor de regresie pentru
ambele modele. in primul model, toti cei patru predictori: sexul persoanei, tipul de
varsta nivelul de educatie iau valori semnificative statistic, fapt ce poate
fi interpretat ca fiecare dintre factori contribuie semnificativ la explicarea
evolut
iei
variabilei dependente. Fiind mai putin interesati de estimarea agresivitat
ii
la volan, ci mai mult. de prezenta sau absenta unui efect in sine, in regresiile cu
scop explicativ accentul se muta dinspre coeficien\ii nestandardizat
i
, dependenti de
scale Ie de masurare utilizate, spre coeficientii de regresie standardizati. Astfel, in
ceea ce primul model se obserya ca, mai ales barbatii, foarte tineri, cu un
nivel de educatie mai scazut posesori ai unor din import sunt cei mai
susceptibili sa conduca agresiv automobilul. Dintre predictori, se pare ca tipul de
exercita cea mai mare influenta .33), in timp ce nivelul de educatie
contribuie eel mai putin := - .18) la estimarea tipului de comportament adoptat la
volan.
??O
I' I' I, 'III 'II
Coefficients"
Unstandardized Standardized
Coefficients Coefficients
Model B Std. Error Beta t Sig.
1
2
a
(Constant) 8,605 ,818 10,524 ,000
GENDER 1,191 ' ,252 4,730 ,000
MASINA 1,509 ,256 ,336 5,901 ' ,000
VARSTA -,138 ,031 -,265 -4,488
EDUCATIE -,849 ,272 -,184 -3,121
(Constant) 10,991 ,785 14,001
GENDER 1,285 ,230 ,289 5,593
MASII\jA 1,760 ,229 ,392 7,685
VARSTA -,123 ,029 -,238 -4,328
EDUCATIE -,656 ,243 -,143 -2,703
neuroticism 6,855E-03 ,025 ,014 ,271
constiinciozitate -,324 ,054 -,305 -6,028
agreabilitate -,215 ,041 -,278 -5,314
' .
, Dependent Variable. agreslvltatea la volan
Figura 6.14, Valorile coeficientiJor de regresie nestandardizati i standardizati
oferite de SPSS 11.0
SPSS este 0 mardI Tnregistrata.
,000
,002
,000
,000
,000
,000
,007
,787
,000
,000
. Daca vom analiza rezultatele obtinute din cea de-a doua ecuatie de
vom observa ca singura variabila care nu contribuie la
expllcarea agresivitatii la volan este dimensiunea neuroticism, b == 0,0068 (in SPSS
apare. 6,8E-03). Toti ceilalti indicatori sunt factori care influenteaza
semm,flcatlv nlvelul agresivitatii lavolan. Mai mult, datorita utilizarii
lerarh,l.ee,. concluziona ca dimensiunile de personalitate agreabilitate i
semnificativ la explicarea conduitei agresive a
la volan, In condlt"le In, care au fost eliminate influentele determinate de varsta
nivelul de educatie tipul Cu alte in conditiile Tn
pe.rsoane care au varsta, sunt de gen, au nivel de
educatle au tip de dar care difera in privinta trasaturilor de
vor avea. un nivel diferit de agresivitate la volan. negative ale
coeflclentllor de regresle asoclate acestor do; predictori semnaleaza ca persoanele
care au un nivel scazut de contiinciozitate agreabilitate vor avea tendinta de a
adopta un comportament mai agresiv deciit persoanele care nu au 'aceste
in conditiile Tn care eliminam (\inem constanta)
Influenta factonlo:. demografici asupra aeestei conduitei la volan. Din punctul de
vedere al pondem acestor efecte asupra variabilei dependente se constata ca tot
tlpul contribuie eel mai mult la estimarea agresivitatii la volan (13 := .39).
221
6.4.4. Indicatorii marimii efectului In cazul regresiei multiple
Marimea efectului poate fi calculata l?i in cazul aplicarii regresiei de orice
tip. Daca, Tn scop predictiv, accentul cade pe estimarea performantelor viitoare ale
unui subiect, pornind de la valorile anumitor predictori l?i de la. determinarea
eficientei per ansambfu a modelului propus, Tn utilizarea regresiei cu scop
accentul cade pe izolarea efectelor produse de fiecare factor inclus Tn
model. Astfel, avem nevoie de stabilirea efectului fiecarei varia bile independente
asupra celei dependente,' deoarece indicatorii valoarea coeficientului de
determinare multipla, Tn forma ajustata sau nu, ne arata doar marimea efectului
rezultata Tn urma actiunii combinate ale acestor variabile.
Pentru daca yom bifa optiunea corespunzatoare din cadrul
regresiei, accesibila prin actionarea butonului "Statistics", SPSS-ul ne of era
indicatorii de corelatie partiala l?i semipari;iala, pe baza carora putem stabili
coeficienti de determinare individuaJi, Tn cazul fiecarui predictor Tn parte.
Coefflcient:f
Unstandardized Standardized
Coefficients Coefficien1s Correlations
Model B Sid. Error Bela t Sig, Zero-order Partial
1 (Conslant) 8,605 ,818 10,524 ,DOD
GENDER 1,191 ,252 ,268 4,730 ,000 ,292 ,3.06
MASINA 1,509 ,256 ,336 5,901 ,000 ,325 ,373
VARSTA ,,138 ,031 ,,265 -4,488 ,000 -,272 -,292
EDUCATIE -,849 ,272 -,184 -3,121 ,002 -,304 -,208
2 (Constant) 10,991 ,785 14,001 ,000
GENDER 1,285 ,230 ,289 5,593 ,000 ,292 ,358
MASINA 1,760 ,229 ,392 7,685 ,000 ,325 ,466
VARSTA -,123 ,029 -,238 4,328 ,000 .,272 -,284
EDUCATIE -,65tj ,243 -,143 -2,703 ,007 ' -,304 -,182
neuroticism 6,855E-03 ,025 ,014 ,271 ,787 -,004 ,019
constlinciozitate -,324 ,054 -,305 -6,028 ,000 -,326 -,382
agreabilitate -,215 ,,041 -,278 '5,314 ,000 -,193 -,342
a. Dependent Variable: agresivltatea la volan
Figura 6.15. Va/ori ale coeficienfi/or de core/arie oferife de SPSS 11,0
SPSS este 0 marca Tnregistrata.
Part
,266
,332
-,253
-,176
,278
,382
-,215
-,134
,013
-,300
-,264
Coeficientii de ordinul zero, respectiv coeficientii de corelatie pari;iala, nu
sunt altceva deca't coeficientii de corelatie r Bravais-Pearson, respectiv coeficientii
de corelatie pari;iala discutati pe Tndelete Tn capitolul al treilea, destinat tehnicilor
de testare a ipotezelor. Ultima coloana, denumita "part", indica
valoarea coeficientilor de corelatie semipari;iala Tntre factorul variabila
dependenta Tn conditiile eliminarii influEmtei celorlalti predictori asupra VD. De
exemplu, valoarea lui r semipartial notat rsp este - .30, ceea ce Tnseamna ca daca
yom elimina influenta celorlalti predictori asupra agresivitatii la volan, exista 0
asociere unica, inversa, intre nivelul de conl?tiinciozitate l?i agresivitatea la volan, 0
conl?tiinciozitate scazuta ducand la un nivel ridicat de agresivitate in conducerea
222
,11:,11 II! III Illill,111 II,il!I!'I:,I,II"
Iii ill !II:I, II: 11'111, 111,:111111::111111:111111111 !II 'i I:
automobilului. Fiind yorba de un efect izolat l?i totodata de un coeficient de
corelatle, se poate calculacoeficientul de determinare specific pentru relatia dintre
reamintindu-ne faptul ca acesta este egal cu
coeficlentului de corelatie. Astfel, am putea afirma ca 9% (-.302) din
dlspersla comportamentul agresiv la volan poate fi explicata de diferentele
interindividuale in ceea ce privel?te nivelul de conl?tiinciozitate al subiectilor testati
. prezentate mai sus constituie cele mai importante' aspecte
mterpretarll statlstlce in cazul utilizarii regresiei Tn scop explicativ.Alaturi de aceste
pot fi analizate alte aspecte, amintite Tn cazul regresiei Tn scop
predlctlv, precum contravalidarea sau analiza cazurilor influente, insa, daca Tn
cazul regresiei cu scop predictiv solutia nu poate fi conceputa fara 0 analiza atenta
a deoarece ecuatia va fi utilizata Tn scop estimativ, predictiv, Tn
regresla utllizata Tn scop explicativ acestea sunt importante, dar nu esentiale,
Rezultatele obtinute Tntr-o regresie cu scop explicativ pot fi retinute apreciate Tn
felul lor, fara a realiza neaparat 0 analiza a cazurilor influente sau fara a
:n?delul, daca yom respecta fnsa conditiile de apJicare a regresiei.
Numal Indeplmlnd aceste conditii, yom avea suportul ca modelul explicativ rezultat
nu sUfera de distorsiuni grave.
6.5. Condifii necesare pentru aplicarea regresiei liniare(Jg)
. in vederea aplicarii corecte a regresiei liniareeste necesara indeplinirea
mal multor conditii tehnice. 0 buna trecere Tn revista a acestora este oferita Tn
Berry l?i Feldman (1985) sau Licht (1995).
6.5.1. Evitarea erorii de specificare
Sub aceasta denumire pretentioasa se regasesc acele modele incorect
alese. 0 asemenea situatie apare atunci cand intre predictorii unei ecuatii de
regresie nu se gasesc unii care ar fi trebuitinclul?i. De exemplu, daca atat
cat l?i practica din domeniul vanzarilor indicau asertivitatea ca 0 trasatura
personalitate de baza Tn estimarea performantelor Tn vanzari, dar noi nu 0 includem
Tn modelul predictiv estimat, com item 0 eroare de specificare. Similar, Tn cazul
conducerii agresive a automobilului, am realiza 0 eroare de specificare daca teoria
din include reactia autoritatilor fata de acest printre
predlctoru care determina nivelul de agresivitate la volan iar noi nu tinem seama
de el, neincluzandu-I in modelul explicativ prop us. tuturor
factorilor relevanti pentruproblema in cauza, afecteaza rezultatele obtinute,
chiar riscul de distorsiune a concluziilor, deoarece nu tinem de
Influenta acestor factori cand ar trebui sa-i luam in considerare.
223
In directie opusa, eroarea de specificare poate aparea prin includerea Tn
model a unor predictori care nu ar fi trebuit deoarece ei nu relationeaza
cu criteriul. aceasta situatie este mai putin grava decat prima, deoarece ea
poate fi remediataprin eliminarea predictorului care nu contribuie semnificativ la
estimarea evolutiei criteriului, urmata de 0 naua analizare a madelului predictiv,
fara variabila Tn cauza. In un alt caz al erorii de specificare este cel Tn care,
au fast selectati predictorii relevanti, modelul unei regresii liniare nu este cel
adecvat. ModeluC regresiei liniare porne!?te de la premisa unei relatii liniare Tntre
predictori criteriu de la ,un model adltiv al efectului pe care-I au predictori
asupra modelului de estimat. in consecinta, daca utilizam regresia liniara, Tn
conditiile Tn care nu exista a relatie de liniaritate Tntre fiecare predictor criteriu,
respectiv Tn cazul Tn care exista 0 situatie de multicoliniaritate Tntre predictori,
datorita unei corelatii ridicate Tntre vorbim tot de 0 eroare de specificare.
In plan tehnic, situatia unei erori, de specificare conduce la obtinerea unar
coeficienti de regresie distorsionati sau instabilL De asemenea un alt indiciu consta
Tntr-o valaare scazuta a coeficientului de determinare multipla (R'). Totu!?i, nu orice
R2 scazut indica 0 problema de eroare de specificare, deoarece 0 asemenea
valaare se poate datora unui alt factor, precum includerea Tn model a unor
predictori cu 0 consistenia interna scazuta (implicit a eroare de masurare ridicata),
fapt des Tntalnit Tn ysihologie, prin utilizarea scalelor ca modalitati de evaluare a
diferitelor variabile. De aceea, cazul erarii de specificare datorat neincluderii unor
variante relevante poate fi detectat doar pe baza unei teorii solide existente cu
privire la evolutia criteriuluL in schimb, cazul includerii un or variabile irelevante este
mult mai u!?or de detectat prin consultarea valarilor t corespunzatoare fiecarui
coeficient de regresie. Daca aceasta valoare nu este semnificativa statistic,
Tnseamna ca variabila respectiva nu contribuie la estimarea evolutiei criteriuluL 0
alta modalitatede evaluare este _aceea de a campara valorile ajustate ale lui R2, iar
daca nu se constata diferente Tntre modelul care include cel care exclude
variabila Tn cauza, Tnseamna ca aceasta poate fi eliminata din modelul predictiv.
6.5.2. Evitarea erorii de masurare
Din pacate, Tn psihologie, ca in alte domenii alte socia Ie, nu
putem masura direct constructul dorit, citrebuie sa ape lam la 0 serie de indicatori.
De exemplu, utilizam un test de inteligenta pentru a masura nivelul intelectual sau
utilizam 0 scala de agresivitate pentru a masura magnitudinea acestei trasaturi. Nu
intotdeauna exista 0 corespondenta Tntre valoarea indicatorului valoarea reala
(latenta) a constructului teoretic respectiv. Acea diferenta po ate fi denumita eroare
de masurare. Ea este de doua feluri: sistematica OIleatoare. Primul caz apare Tn
situatia in care instrumentul utilizat pentru a masura acel concept masoara
altceva, aparand 0 problema de validitate de construct. 0 asemenea situatie este
tin uta sub control prin studiile de validare a instrumentelor utilizate, de aceea, Tn
situatia utilizarii unor instrumente adecvate !?i validate, aceasta eroare este
224
eliminata sau redusa foarte mult. In schimb, eroarea de masware aleatorie. tine de
caracteristicele psihometrice ale instrumentului utilizat, Tn special de fidelitatea
probei, dar de unele deficiente in codarea sau tehnoredactarea bazei de date.
Efectul acestui tip de eroare asupra coeficientilor de regresie este diferit,
daca eroarea apare Tn cazul criteriului sau Tn cazul predictorilor. Daca criteriul
utilizat are 0 fidelitate redusa, scade. corelatia acestuia cu predictorii, fapt ce
afecteaza atat valorile coeficientilor de regresie, cat valoarea coeficientului de
determinare multi pia, afectand astfel eficienia predictiva a modeluluL Prin urmare,
criteriul utilizat ar trebui sa aiba 0 consistenta interna cat mai ridicata, daca nu chiar
1. De aceea, recomand evitarea folosirii pe post de criteriu a ace lor variabile care
au 0 consistenta interna sub ,80, Tn cazul utilizarii regresiei in scop predictiv,
respectiv de .70, Tn cazul utilizarii regresiei Tn scop explicativ. In cazul exemplului
dat, criteriul ales, performanta obtinuta Tn vanzari, nu ridica probleme, deoarece
eroarea de masurare aleatorie este absenta, singurele probleme putand aparea
din deficiente Tn Tnregistrarea co recta a datelor.
Daca eroarea de masurare apare Tn cazul predictorilor, efectul este ceva
mai putin gray, dar prezent. Intr-o asemenea situatie, daca variabila Tn cauza nu
coreleaza cu ceilalti predictori, va fi afectata doar valoarea\ coeficientului de
regresie corespunzator variabilei respective insa daca variabila coreleaza i cu
ceilalti predictori, vor fi afectati, Tntr-o anumita masura, toti coeficientii de regresie,
Modul Tn care sunt afectati ace!?ti coeficienti nu este foarte clar, de aceea se
recomanda utilizarea unor instrumente cu calitati psihometrice cat mai bune,
6.5.3. Eroarea reziduala cat mai mica
Prin termenul reziduuri se definete diferenta dintre valoarea obseniata a
criteriului cea estimata prin utilizarea ecuaiiei de regresie, A!}a cum am precizat,
cu cat aceasta diferenta este mai mica, cu atat modelul este mai bun In estimarea
evolutiei criteriului. datorita unor aspecte matematice care nu vor fi
discutate aici este de dorit ca aceste reziduuri: (1) sa aiM media egala cu zero;
(2) sa Indeplineasca condiiia de homoscedasticitate, avand dispersie pe
intreaga amplitudine a predictorilor; (3) sa nu coreleze cu alte reziduuri sau cu
predictorii; (4) sa aiM 0 distribuiie normala (Licht, 1995). Se pare ca Tncalcari
moderate ale acestor conditii nu influenteaza foarte mult eficienta modelului
predictiv.
6.5.4. Evitarea multicoliniaritatii
Sub aceasta denumire este specificata Tncalcarea conditiei ca predictarii
pentru estimarea evolutiei criteriului sa nu coreleze prea puternic Tntre ei. Prin
urmare, nu se poate pune problema prezentei sau abseniei multicoliniaritatii, ci
225
________ 111'11111111'11111111'1111111111111111111111:11111 1111111111 11111 11111'11111 111111 11111 illll: I, II,: 1111: 1111 IIIII'IIIIJIII:III :11111:11111111111::1111111111111111:111:11111111',1111111I'III! 1111'1111 IIII! 1111 'III: 1111111111 11111:1111 1111111111 11111:1111111111111111111111111 '111111111111111111111111111111'111111 1111111 111111 1111111 111111:111111 IIIII! 11111 1111111111: 11111,1111111111111111111111111111 '11
"
11 'III
doar a prezentei ei intr-un grad mai mare sau mai mic, in functie de corelatia
existenta intre predictorL
Efectul unei multicoliniaritati crescute consta in probabilitatii de a
obiine coeficienii de regresie nesemnificativi statistic pentru una dintre variabilele
care coreleaza puternic, deoarece aceasta problema afecteaza valorile t asociate
acestor coeficienti, din cauza dificull<3tii de a decela efedele fiecarei variabile
asupra Din aceasta perspectiva, riscul de a comite eroarea de tip
II. Indiferent de scopul utilizarii regresiei, problema unei rTjulticoliniaritati ridicate
este foarte grava. Astfel, Tn cazul utilizarii regresiei Tn scop predictiv, problema
principala consta Tn instabilitatea coeficientilor de regresie, fapt ce conduce la
dificultatea de a generaliza coeficientii respectivi de a-i utiliza pe un alt lot de
subiectL In schimb, Tn cazulutilizarii regresiei Tn scop explicativ, problema capitala
consta Tn dificultatea de a decela efectul fiecarui predictor implicat asupra evolutiei
criteriului (variabilei dependente). Detectarea unei situatii de multicoliniaritate se
poate face simplu prin realizarea unei corelatii intre fiecare pereche de predictori
in studiu. Daca exista vreo corelaiie foarte ridicata, sa spunem, peste .70,
am putea intui 0 problema de multicoliniaritate ce trebuie rezolvata. SPSS-ul ofera
alte doua modalitati de diagnosticare a unei multicoliniaritati ridicate prin indicatorii
VIF (Tn engleza "variance inflation fador"), respediv toleranta (1N1F). Daca valorile
V1F sunt peste 10, iar cele ale toleraniei sunt sub 0,10, avem de-a face cu 0
problema grava de incalcare a conditiilor de utilizare a regresiei, datorita unei
multicoliniaritati ridicate. Unii autori propun chiar praguri mai joase, astfel incat 0
valoare VIF de 5 sau 0 toleranta sub 0,20, poate indica probleme in estimarea
co recta a modelului de regresie datorita multicoliniaritatii (Field, 2000).
Efectul prezentei unei multicoliniaritati ridicate este vizibil Tn exemplul
urmator, al unei regresii in scop explicativ, in care avem trei predictori. Sa luam ca
valori de exemplu f3 de .80, .30 .30. La 0 prima vedere am putea afirma ca primul
predictor are 0 influenta mai mare asupra criteriului decat ceilalti doL
aceasta situatie se poate datora unei corelatii puternice intre ultimii doi predictori.
Astfel, daca am elimina unul dintre ei, valorile f3 pentru cei doi predidori ar fi
. 70 .66. In asemenea conditii nu ar mai fi foarte clar care dintre predictorii luaii in
considerare are 0 influenia mai mare in explicarea evolutiei criteriuluL Acest
exemplu vine in sprijinul ideii de' a interpreta Tn termeni relativi diferentele
observate Tntre coeficientii standardizati de regresie, deoarece pot suferi in
situatii de multicoliniaritate.
Pentru a elimina situatia de multicoliniaritate sunt disponibile cateva solutii.
Una dintre ele vizeaza numarului de participanti Tn studiu, cunoscandu-
se tendinta ca valoarea coeficientului de dintre doua variabile sa scada 0
data cu volumului 0 alta posibilitate consta in combinarea
variabilelor care coreleaza puternic, fie prin alcatuirea unui scor compozit, fie prin
reducereadatelor ca urmare a analizei componentelor principale. Prin aceasta
ultima solutie se va pierde insa posibilitatea de a desprinde efedele separate ale
variabilelor care coreleaza puternic insa se timp bani, nefiind nevoie de
226
testa rea mai multor subiecti. Tn fine, alii autori recomanda eliminarea uneia dintre
variabilele care coreleaza prea puternic cu alte variabile.
SPSS-ul of era posibilitatea unui diagnosticcu privire la nivelul de
multicoliniaritate prin bifarea optiunii in cauza disponibila prin accesarea butonului
,;Statistics", urmand calea "Analyze" -"Regression"-"Linear".
6.5.5. EXistenta unor relatii de tip i aditiv
Prin liniaritatea unei relatii se intelege ideea ca Tntre fiecare predictor
criteriu exista 0 relatie de tip liniar, adica valoarea coeficientului de regresie se
mentine constanta la orice nivel al predictorului. Astfel, daca b pentru extroversiune
este 24,47, performanta unui individ Tn vanzari cu 24,47 EURO in situatia in
care el a obtinut 3 puncte la scala de extroversiune fata de unul care a obtinut 2
punde la aceasta proba. Aceasta diferenta, de 24,47 EURO, se mentine in
compararea unei persoane care a obtinut, sa zicem 21 de puncte, fata de 0 alta
care a obiinut 20 de punde. Mai multe informaiii des pre ce inseamna 0 relaiie
liniara pot fi citite in sectiunea 1.3.2. din capitolul introdudiv, cand am tratat
problema reprezentarii grafice a norului de puncte.
Prin relatia aditiva se intelege ideea ca nu exista un efect de interactiune
intre doi predictori, cu alte cuvinte, ca efedul unui predictor asupra criteriului nu
este dependent de valoarea unui alt predictor. Daca acest lucru se Tntampla, este
incalcata ideea de aditivitate trebuie sa se tina seama de interactiunea dintre cei
doi predictori, ca efect suplimentar Tn estimarea evolutiei criteriului.
Pentru detectarea situatiilor de relatH neliniare sau non-aditive cea mai
buna solutie este de ordin teoretic. Daca ne ca relatia dintre anumiii
predidori criteriu sa fie neliniara sau sa existe 0 interactiune Tntre predictori care
poate explica evolutia criteriului, este bine sa se specifice aceste lucruri inca din
formularea modelului predictiv.
Sa presupunem ca avem doi predictori intr-o ecuatie de regresie. Daca ne
ca ecuatia sa indeplineasca ambele cerinte, atunci ea are forma simpla
de:
Criteriu = bO + b 1 *Criteriu_1 + b2*Criteriu_2 (1 )
Daca ne ca ecuatia sa nu fie liniara, ci curbilinie, in cazul predictorului 1,
dar liniara Tn cazul predidorului 2, atunci ea are forma de:
Criteriu = bO + b11 *Criteriu_1 + b12*Criteriu_12 + b2*Criteriu_2 (2)
Daca ne ca ecuatia sa fie liniara, dar nu aditiva, atunci ea are forma
de:
Criteriu = bO + b1*Criteriu_1 + b2*Crileriu_2 + b12*CrileriuU*Criteriul_2 (3)
227
Prin urmare, efectul de aditivitate poate fi observat prin includerea unei
varia bile suplimentare care se obtineprin produsul celor doua variabile aflate Tn
situaii
e
de interactiune (mai multe detalii sunt prezentate Tn sectiunea 6.7.2., Tn
timp ce relatia de non-liniaritate poate fi tratata printr-o ecuatie liniara, dupa
includerea unei variabile reprezentate de patratul predictorului care incalca relatia
de liniaritate cu criteriul.
Detectarea statistica a urlOr asemenea relatii, atunci cand teoria nu ne
ajuta la estimarea tipului de relatie fntre variabile, se poate face printr-o metoda
. eleganta, dar costisitoare ca resurse de subiectL De exemplu, pentru a detecta
situatia de rion-liniaritate se poate fmparl) lotul de subiecti Tn trei sau patru
categorii, pe baza rezultatelor obtinute la criteriu. Spre exemplu, yom alege grupa
subiectilor cu perforniante superioare, cu performante medii, respectiv cu
performante inferioare Tn vanzari. Daca atat interceptul, cat coeficientii de
regresie rezultati nu difera foarte mult Tn cele trei cazuri Tnseamna. ca exista 0
relatie liniara Intre ansamblul de predictori criteriu. in schimb, daca sunt diferente
foarte mari Tntre (ex. b pentru extroversiune variaza Tntre 2,33 -4,11),
atunci am putea sesiza 0 relatie dar neliniara. in SPSS, acest lucru po ate fi testat
mai simplu, cerand calculatorului sa ne prezinte valoarea coeficientului de
determinare multipla Tn situatia unei relatii liniare, respectiv a unei relatii neliniare.
fn cazul Tn care R2 asociat modelului neliniar este semnificativ mai mare dedit cel
asociat modelului liniar putem presupune existenta unei relatii neliniare.
Pentru detectarea unei situatii de interactiune poate fi utilizata metoda
regresiei ierarhice; astfel, daca diferentele dintre cele doua valori F asociate
modelelor 1 3 prezentate mai sus sunt semnificative statistic, putem trage
conciuzia existentei unui efect de interactiune fntre cei doi predictori care
influenteaza evolutia criteriuluL
6.6. Exemplu de regresie multipJa Iiniara - cazul citirij
fntr-un studiu realizat de Kirby, Parrilla Pfeiffer (2003) s-a urmarit
identificarea influentei unor structuri cognitive asupra deprinderii cititului. Mai
concret, s-a studiat rolul pe care-I are viteza de pronuntare abilitatea de a emite
manipula sunete Tn performanta de citire a unui text Studiul nu are doar valente
de cercetare fundamentala, ci un aspect aplicativ esential: identificarea,
Tnca din gradinita, a copiilor susceptibili sa sufere de dislexie (dificultati de citire).
Autorii au studiat aceste efecte pe parcursul mai multor ani. Noi ne yom rezuma la
rezultatele obtinute de copii la proba de. citire fn ciasa a II-a la 0 singura variabila
dependenta - capacitatea de a cuvintelor la testul standard Gates-
MacGintie Reading Comprehension Test
Pentru a izola influenta celor doi factori a fost necesar controlul altor
catorva variabile, ce pot afecta capacitatea de a citi. Variabilele controlate au fost:
nivelul de dezvoltare. intelectuala (apreciat atat prin probe verbale, cat de.
228
"111,1111,111,1111,111"111,1 II !III!I' 'III 111'1111 '11' III"II! 1II'.!11
performanta); nivelul de familiarizare cu un material tiparit (cate litere
copilul deja, aspect ce poate ascunde diferente socio-demografice). .
Pentru a masura cei doi factori: viteza de pronuntare, respectiv abilitatea
fonetica (abilitatea de a emite manipula sunete) s-au utilizat mai multe probe,
care au fost supuse ulterior wnei anal.ize a componentelor principale, rezultand fn
final doua scoruri, cate unul pentru fiecare predictor. Pentru a facilita interpretarea
datelor, trebuie sa precizam ca rezultatele ridicate indica performan\e superioare.
Tn acest exemplu, ca, de altfei, fn arice eeuatie de regresie utilizata Tn seap
predictiv, se precizeaza cateva elemente esentiale Tn sectiunea de analiza a
datelor: .
precizarea intr-un paragraf a tipului de analiza intreprinsa (ex. regresie
multiliniara ierarhica), alaturi de justificarea alegerii facute; fn plus, se
poate face 0 precizare scurta legata de respectarea sau nerespectarea
conditiilor de baza necesare pentru aplicarea acestei tehnici;
intr-un alt paragraf, a predictorilor, a criteriului a modului Tn
care au fost
prezentarea unui tabel sumar a indicatorilor descriptivi a matricei de
corelatii intre variabilele incluse Tn model, conform standardelor APA, dupa
modelul oferit de Nicol Pexman (1999);
prezentarea fntr-un tabel sumar a coeficientilor standardizati de regresie
pentru fiecare predictor fn parte, cat a valorilor coeficientilor de
determinare multi pia aferenti modelului estimativ propus; acest lucru se
poate face utilizand recomandari APA prezentate Tn Nicol
Pexman (1999), cu precizarea ca, fn cazul regresiilor in scop predictiv,
trebuie precizate, suplimentar, valorile coeficientilor nestandardizati de
regresie eroarea standard de masurare a acestora;
interpretarea pe scurt a rezultatelor obtinute (0 analiza cantitativa).
in cazul exemplului de fata, textul din sectiunea de analiza a datelor ar
putea lua forma urmatoare:
Tabel cu indicatorii descriptivi :;;i matricea de corelatii Tntre variabilele implicate Tn model
(c1asa a II-a)
Variabila M AS 2 3 4 5
Performanta de recunoa:;;tere a 39.90 18.70. .16 .11 .45 ** .31 ** - .20 *
cuvintelor
PREDICTORI
1. Nivel intelectual - probe verbale 12.90 2.88
2. Nivel intelectual - probe de 6.40 2.21 .57 ** --
performanta
3. Familiarizarea cu materiale tiparite 35.20 17.90 .49 ** .21
4: Abilitatea fonetica 6.50 5.69 .18 * .23 . 36 **
5. Viteza de pronun\are 42.20 11.53 .06 .20 * .15 - .02
* P < .05; ** P < .01
229
'I III' !I! !II'!II ill! 1111 IIIIIJIIIIIIJILlIlILIIIIJIIUIIIIlIIIlc'IIIIIIIIIILlIIII'IIIIUIIIILlI1IIIIIIILlIIILIIIII!llIlIIIIUIIIIIIIIILlIII! 1IIILlIIIUIUIII IIIUIIi 1111 !lIli 1111111111111'1111,1111111111'1111111111111111111111111111111111III 11"""'"IIIII! 11111 ,11111 11111'11111 1111111111 1111111111111111111111 III Ii 1"1""1'""1""11,1""""1'""1'"""""'""1,""1""11""1""1'""1JIII,IIIIUIIII.IIII.,M _____ _
Analiza de regresie ierarhica a fost utilizata pentru a observa influenta
vitezei de pronuntare "i a abilitatii de manipulare a sunetelor asupra performantelor
- Tn citire obtinute de copii Tn cia sa a II-a. Am decis sa utilizam regresia ierarhica
pentru a controlainfluenta abilitatii intelectuale generale1?i a nivelului de
familiarizare cu materiale tiparite asupra performantei Tn citire. Merita remarcat
faptul ca toti predictorii au fast evaluati cand subiectii se aflau Inca la gradinita,
pentru a putea vedea Tn ce masura pot fi anticipate dificultatile de citire, pentru a se
interveni Tnca de timpuriu. Din' pl.Incte de vedere tehnic, nu au existat situatii
speciale, toate conditiile de aplicare a regresiei fiind sustinute.
(Comentariu: prin acest design, cercetarea dobande9te un caracter mixt, atat
explicativ - Tn izolarea 9i identificarea.influen\ei celor doi factori asupra abilita\ii de a citi, cat
9i predictiv, prin posibilitatea de a estima evolutia 9colara a elevifor in ceea ce prive9te
cititul, pe baza unor predictori testali anterior. Datele prezentate Tn primul tabel sunt fictive,
deoarece autorii nu au inclus un asemenea tabel, Tn schimb cele prezentate in tabelul de
mai jos sunt reale, dar adaptate conform cerinlelor APA).
Tabel sumar cu rezultatele analizei de regresie ierarhice vizand estimarea performan\elor de
recunoa9tere a cuvintelor pebaza predictorilor luati Tn studiu (N = 161).
VARIABILE R2 i.\R2 B SE b
PASUL1
Abilitate intelectuala generala
Probe verbale
Probe de performan\a
Familiaritate cu materiale tiparite
PASUL2
Abilitate intelectuala generala
Probe verba/e
Probe de performanta
Familiaritate cu materia/e tiparite
Abilitate fonetica
Viteza de pronuntare
* p < .05; ** P < .01
.378
.479
.378
.178
. 142
.421
.101 "
.157
.153
.458
.302
- .209
in fiecare model ierarhic, variabila dependenta era constituita din
performanta obtinuta Tn citire privind literelor de catre elevii din c1asa
a II-a. Predictorii inclu:;;i Tn primul pas au fost abilitatea intelectuala generala "i
gradul de familiaritate cu materialul tiparit, pentru a putea controla efectul acestora
asupra variabilei dependente. in cel de-al doilea pas, pe IEmga aceti predictori au
fost introdui cei doi fact'ari de interes, i anume, viteza de pronuntare abilitatea
de manipulare a sunetelor.
(Comentariu: in cazul regresiei utilizate Tn scop predictiv este necesara 9i
prezentarea coeficien\ilor nestandardiza\i de regresie (b), cat a erorii standard de
masurare a acestora (SE b). in cazul regresiei eu seop explicativ, predominanta Tn artieolul
230
de fata, nu este necesara preeizarea acestor indicatori suplimentari. De altfel, autorii
studiulu; de fala nici nu ofera va/orile acestora, de aceea am lasat spa\iile respectrve
neeompletate) .
Rezultatele din tabelul de mai sus sprijina ipoteza conform carela atat
abilitatea fonetica, cat i viteza de pronuntare a sunetelor influenteaza semnificativ
performanta elevilor de a 9i citi cuvinte, Tn conditiile Tn care controlam
influenta datorata diferentelor de niveluf intelectual de familiarizare cu materialele
tiparite (6.A2 =: .101, P < .01). Astfel, cei doi factori explica impreuna 10,1 % din
performanta ob\inuta la proba de citire de catre elevi, iar aceasta vine in plus, fata
de cele 37,8% explicate de factorii controlati (nivelul intelectual 9
i
gradul de
familiarizare cu materiafele tiparite).
(Comentariu: p nu este un atribut al lui R2, ci este earaeteristie lui F sehimbare.
se obinuie9te trecerea aeestei valori Tn dreptul lui R2 deoareee acesta ofera 0
informa\ie Tn plus: ee proeentaj din dis persia .eriteriului po ate fi explieata de varia\ia
predictorilor Tn studiu?).
La nivel analitic, din modelul estimativ final se observa ca nivelul intelectual
nu influenteaza abilitatea de a identifica cuvinte, valorile beta nefiind semnificative
statistic. Acest lucru este aparent surprinzator, Tnsa daca tinem Seama ca proba de
identificare a euvintelor are loe, In clasa a II-a, Tntr-o coala normala, i ca ea nu
consta in elemente de comprehensiune a textului, ci doar In elemente de citire a
cuvintelor, rezultatele nu mai sunt surprinzatoare .
In schimb, se constati:'! ca elevii care sunt familiarizati inca din gradinita cu
materialele tiparite obtin rezultate superioare la testul de identificare a cuvintelor
::: .45, p < .01), acelai fapt petrecandu-se i Tn cazul copiilor care dispun de 0
abilitate fonetiea superioara (I) = .30, P < .01). In schimb, se constata 0 relatie
inversa Tntre viteza de pronuntare i capacitatea de a identifiea cuvintele m ::: -.20,
P < .01). Acest fapt se explica prin tendinta subieetiJor cu 0 viteza superioara de
pronuntare de a se grabi i de a grei Tn identificarea co recta a cuvintelor (probabil
citind primele litere apoi ghicind cuvantul). Analiza erorilor ar putea oferi suport
acestei posibile explicatii.
In concluzie, datele obtinute sprijina ideea ca dincolo de diferentele
intelectuale sau educationale (familiarizarea cu materiale tiparite), exista anumite
structuri psihologice, precum abilitatea fonolagica viteza de pronuntare, care
influenteaza semnificativ performantele subiectilor in citire. Acest rezultat ofera
psihologilor posibilitatea de predictie i interventie timpurie (Tnca din gradinita)
asupra copiilor care pot Tntampina dificultati In citire pe perioada "colii,
reaJizandu-se astfel primii pai in vederea ameliorarii acestei situatii.
Tn spatele acestei sectiuni stau Tnsa 0 serie de operatii metodologice
statistice precum:
identificarea scopului regresiei: de tip predictiv, explicativ sau mixt;
231
alegerea celei mai bUlle modalitati de regresie: simultana, ierarhica etc;
selectarea predictorilor relevanti pentru estimarea evolutiei criteriuiui ~ i ,
daca este cazul, a ordinii de introducere a acestora Tn model;
interpretarea per ansamblu a eficientei modelului;
interpretarea coeficieniilor de regresie din perspectiva ipotezelor formulate;
verificarea Indeplinirii conditiilor de aplicare a regresiei pentru a ne asigura
ca valorile gasite nu sunt distorsionate gray.
6.7. Directii de evolutie ale regresiei
6.7.1. Alte tipuri de regresie
Dei este aplicata foarte des, regresia liniara aa cum a fost prezentata In
acest capitol, poate fi aplicata doar Tn situatia In care criteriul (variabila
dependenta) este masurat printr-o scala. numerica. Unii autori aplica regresia
liniara i in conditiile Tn care raspunsurile sunt evaluate pe a scala de tip Likert Insa
aceasta trebuie sa posede minimum 7 trepte de raspuns (Garson, 2000).
In condiiiile In care raspunsurile ordinale au mai putin de apte trepte sau
In cazul Tn care criteriul este 0 variabila de tip nominal, se aplica alte tipuri de
regresie. 0 clasificare a acestor tipuri, Tn functie de tipul de predictori 9i criterii
permise, este oferita Tn tabelul 6.5, iar una dintre cele mai fntalnite forme, regresia
logistica pentru date dihotomice, va fi detaliata In capitolul urmator.
Tabelul 6.5. 0 clasificare non-exhaustiva a tipurilor de regresie
Denumire Predictori Criteriu
Regresia logistica (binara) Orice variabile, indiferent de Numai variabile dihotomice
scala de masurare
Regresia logit Numai variabile de tip nominal Numai variabile dihotomice
Regresia logistica Orice variabile, indiferent de Numai variabile nominale
multinomial a scala de masurare (exclus cele dihotomice)
Regresia logistica ordinala Orice variabile, indiferent de Numai variabile ordinale
scala de masurare (ex. scale Likert cu 5 clase)
6.7.2. Identificarea efectelor de interactiune In regresia multipla
Din majoritatea modelelor discutate In acest capitol; analiza de regresie
viza identificarea efectelor pe care fiecare predictor la are asupra criteriului. Aceste
232
etecte izolate, pot fi- denumite efecte simple, fiind analoge efectelor simple din
tehnTcile ANOVA.
Astfel, daca fntr-un design ANOVA factorial de tip 2x3, rezultau trei valori F
(FA, FB, FAB), Intr-o regresie de tip ciasic, factorul interactiune nu poate fi
detectat, deoarece ecuatia de regresie, Tn forma standardizata este:
(6.4)
Pentru a putea masura i cel de-al treilea efect, cel de interaciiune, ecuatia
de regresie ce tre.buie testata devine:
Interpretarea primara adatelor este simpla: daca coeficieniii de regresie
sunt semnificativi statistic Inseamna ca predictorii respeetivj eontribuie semnificativ
statistic la evoluiia criteriuluL Dei lucrurile par simple, la prima vedere masurarea
efectului de interaciiune ridica cateva probleme ce vor fi discutate, pe scurt, in
continuare. Cum obiinern variabila interactiune XA*XB? Cand se poate masura
acest efeet de interaetiune? Cum se poate cunoate daca exista un efect de
interactiune? Cum se interpreteaza coeficientii corespunzatori unui efect de
interaciiune? Cum se aplica acest efect de interaciiune Tn cazul variabilelor
dummy?
Cum obtinem variabila de interactiune XA*XB?
, ,
In mare, exista doua modalitati de lucru, prima fiind mai intuitiva 9i mai des
Tntalnita, Insa cea de-a doua fiind mai potrivita din punctul de vedere al
caracteristicilor statistice pentru variabilele de tip interval, atat de frecvent Tntalnite
Tn domeniul psihologiei.
Prima modalitate consta Tn realizarea produsuluitermenilor celor doua
variabile despre care se crede ca se afla Tn relatie de interactiune (una dintre ele
moderand relatia celeilalte cu predictorul). Aeeasta modalitate simpla se aplica
atunci cand una dintre variabilele implicate este de tip dummy ~ i , de asemenea,
poate fi aplicata fara probleme, daca ambele variabile sunt masurate prin scale de
proportii. Daca nu ne aflam Tn vreuna din cele doua situatii, 5e prefera utiJizarea
celeilalte metode, deoarece simpla Inmultire a variabilelor poate conduce la
rezultate distorsionate datorita anselor mai maride multicoliniaritate ~ i avalorilor
eroriJor standard mai ridicate (Jaccard, Turrisi, Wan, 1990).
Cea de-a doua metoda, denumita centrata, consta In Inmultirea celor doi
termeni dupa ce In prealabil s-a scazut fiecare valoare din media acestora. Tabelul
de mai jos indica diferente Tntre cele doua metode cu privire la modalitatea de
obtinere q variabilei interactiune.
233
!II' ,III 1111 II! ill, 1111 1111 III 111I III illl IIIII! !IIIIIJII! '11111 illlllllill ,1111111111: 11111,11111 11111 !IIIIIIIIIII !IIIIIIIIIII 111111111111 !IIIIIIIIII! :11111 111111 IIIII! illill 111111111111 111111 !IIIII: 111111 ,111111111111 :1111 !III: .1111, IIIII:IIII! 11111, :11111 11111 ,11111'1111: 11111111111111: 1111, ,III! !III I111 '!II, 1111 III III
Tabelul 6.6. Exemplu de calculare a variabilei interactiune prin metoda clasica (coloana a
III-a), respectivprin metoda centrata (coloana a VI-a)
X Y X*Y X - X mediu Y-Y mediu {X - X mediu)(Y - Y mediu)
3 5 15 -1 0 0
2 6 12 -2 2
5 3 15 -2 ..2
6 7 42 2 2 4
1 5 5 -3 0 0
7 4 28 3 -1 ..3
X mediu = 4; Y mediu = 5
Cand se poate masura acest efect de interactiune?
In mod normal, efedul de interactiune poate 'fi evidentiat, daca ambele
varia bile sunt de tip numeric, masurate fie prin scale de proportii, fie prin scale de
interval. Unii autori recomanda evitarea masurarii efectului de interactiune Tn cazul
In care variabilele sunt de tip ordinal Insa distorsiunile determinate de includerea
unei asemenea variabile nu sunt foarte mari. Fara a intra In. detalii tehnice, yom fi
de acord cu pozitia adoptata de Jaccard, Turrisi i Wan (1990) care afirma ca
includerea unor predidori masurati prin scale ordinale Tn analiza de regresie este
Tn sine un fapt controversat, iar analiza efectelor de interactiune dintre variabilele Tn
care cel putin una este masurata prin scala ordinala nu este cu nimic mai
controversata decat analiza efectelor simple. Prin urmare, daca cercetatorul va
decide sa-i asume riscul obtinerii unor rezultafe distorsionate, prin includerea Linor
variabile masurate prin scale de tip ordinal, va putea analiza i efectul de
interactiune dintre acestea, asumandu-i aceleai riscuri.
Tn schimb, variabilele de tip categorial transformate In variabile de tip
dummy pot fi supuse unei analize a efectelor de interactiune,Tn conditiile In care
una dintre varia bile este masurata prin de tip' interval sau proportii. Daca
ambele variabile interactionate sunt de tip categorial se prefera Insa 0 alta
abordare, prin apelulla metoda clasica a tehnicilor ANOVA.
Un exemplu de masurare a efectului de interactiune dintre 0 variabila
numerica i 0 variabila de tip dummy poate fi sesizata In exemplul urmator:
234
Un cercetator sa observe in ce masura rela\ia dintre volumul de munca
(gradul de solicitare) al angajatilor stresul profesional p-erceput de acetia este
moderata de participarea acestora in cadrul un or programe de consiliere
psihologica. Sa presupunem ca trei loturi de subiec\i: 0 parte 'care au urmat
edin\e de consiliere cu psihologul companiei, 0 parte care a primit instructiuni
pentru efectuarea unor exerci\ii de relaxare acasa i un grup de control. Daca nu
exista un efect de inleractiune inlre tipul de interven\ie pSihologica urmata i gradul
de solicitare la locul de munca asupra stresului perceput, ar Tnsemna ca interventia
psihologica nu are un rol moderator Tn rela\ia dintre cele doua.
____ '.,1,,1111111"111,11111111'1111'11111'11111111',1111 !IIII 1111'11111 ,IIII! 111'11111 11111'11111 """"'","",11""11"""""'""""""",111""",,,,"""1111111'1111111111111111'1111111111,11111111111111111111""""11""""'111""""",,""""11"""11"11'"II 111111 11111 ,11111 """""" 111111 111111,111111 11111" llilli 11111,111111 11111,,11111 1111 """","""1"""""'"'",""1""""""'111,""'""",,,:""'11""""111",,,,111,,11,'
I
l
I
II
I
Relatia simpla dintre gradul de solicitare la locul de munca i stresul
perceput poate fi scrisa:
Stres = bO + b 1 *Grad de solicitare
Aceasta poate fi calcl:llata pentru fiecare tip de interventie psihologica:
Sires 1 = bO + b1*Grad de solicitare (grupul de subiecti supui consilierii psihologice)
Stres 2 = bO + b 1 *Grad de solicitare (grupul de subiecti ce a urmat acasa exercitii de
relaxare) ,
Sires 3 = bO + b1*Grad de solicilare (grupul de control)
Daca valorile pantei de regresie, adica ale lui b1, sunt asemanatoare
Inseamna ca nu exista un efect de interactiune determinat de tipul de interventie
psihologica propusa. Totui, 0 asemenea abordare descriptiva are un grad
de subiectivitate, nefiind prop ice analizei de regresie (ex. nu ne putem da seama
davca b1 de 1,53, fata de un b1 de 1,82 este diferit sau nul. Tn consecinta, pentru a
masura efectul de interactiune, ecuatia de mai sus nu este adecvata.
. 0 ecuatie care sa masoare efectul simplu al variabilei tip de
'"terventle pSlhologlca asupra stresului nu' estepropice pentru a vedea daca exista
un efect de interactiune:
Sires = bO + b1 *Grad de solicitare + b2*Dummy Consiliere + b3*Dummy relaxare
. . 0 asemenea ecuatie de reg res ie, In care valoarea de referinta pentru
vanablla dummy este constituita de grupul de control, ne ofera posibilitatea de a
raspunde la Intrebarile daca gradul de solicitare contribuie semnificativ la nivelul de
stres. de munca, respectiv daca tipul de interventie psihologica
contnbUie semnlflcatlv la nivelul stresului perceput la locul de munca. Ea nu ne
Ynsa sa vedem dad efectul tipului de interventie psihologica asupra
nlvelulUl de stres perceput este acelai, atat la oameni care au un grad de
solicitare profesionala ridicat, cat i la oameni care au un nivel de solicitare
profesionala scazut.
. Prin urmare, pe langa variabilele masurate direct, se creeaza alte doua
variabile pentru a sesiza efectul de interactiune Tn.tre variabilele dummy i variabila
ce viza gradul de solicitare profesionala.
Sires = bO + b1 *Grad de solicilare + b2*Dummy Consiliere + b3*Dummy Relaxare +
b4*Grad de solicitare* Dummy Consiliere + b5*Grad de solicilare* Dummy Relaxare
Daca exista 0 singura variabila dummy, ca In cazul variabilei "sexul
persoanei", efectul de interactiune implica' includerea unei singure variabile
235
1111111111"1111111111111111,1111 11111 IIIhlllll 1111"1111 111' '11'111 ,11,,11 '!'! III"II! , II ,,'II 'i,,1 11'1'1 11'1111111' "'1 ,i" 1111 '1111 '111 1111 ,III' 1111 ,III 1111 Ill' 'n: III: :111, 1111 ,II 111111U1111UIIII, 1111 ,1111 1111 1111 :111 1III Ill' 1III 1II1 :11 I :11 ,Ill 1111 11111 '11111 1111, III: III l'
suplimentare, fala de modelul dasic, al efectelor simple, la fel ca in ecuatiile de mai
jos:
Stres = bO + b1 *Grad de solicitare + b2*Dummy Sex (1)
SIres = bO + b1 *Grad de solicitare + b2*Dummy Sex + b3*Grad de solicitare*Dummy Sex (2)
Cum se poate cunoate daca exista un efect de interac!iune?
Metoda de verificare a prezeniei sau abser)tei acestui efect este
regresia ierarhica, prin compararea modelelor estimative care indud sau nu efectul
de interaciiune. De exemplu, daca ecuaiia notata cu unu ar avea un R2 = .23, iar
cea notat-cu doi ar avea un R2 = .31, atunci diferenia de .08, adica 8% din
dis persia variabilei criteriu, este pusa pe seama efectului de interaciiune. Aceasta
ce reprezinta marimea efectului variabilei interaciiune este semnificativa
statistic daca F schimbare (In engleza "F change") asociat acestei diferente
explicative intre cele doua modele este semnificativ statistic. Cu alte cuvinte, daca
F schimbare de la modelul 1 la mode lui 2 ar avea 0 valoare de genul F(1, 134) =
8.29, p < .01, am putea afirma ca exista un efect de interactiune intre cei do;
predictori, care aduce un plus explicativ evoluiiei criteriului.
Cum se interpreteaza coeficien!ii corespunzatori unui efect de
interac!iune?
Interpretarea efectelor simple
In cazul regresiei clasice, in care nu erau incluse efectele de interaciiune,
interpretarea coeficieniilor b sau se facea simplu. De exemplu, coeficientul b
corespunzator gradului de solicitare in munca indica nivelul de modificare al
criteriului (al stresului perceput) atunci cand gradul de solicitare cu 0 unitate
in conditiile eliminarii influentei variabilei "sexul persoanei". Cu alte cuvinte,
coeficientul arata cum se mOdifica stresul atunci cand nivelul de solicitare in munca
cu 0 unitate, pastrand la valori constante ceilalti predictori. Similar,
coeficientul indica nivelul de modificare al stresului, exprimat in abateri standard,
atunci cand nivelul de solicitare in munca cu 0 abatere standard, Tn conditiile
pastrarii constantea celorlalii predictori.
De asemenea, b corespunza!or sexului persoanei indica valoarea cu care
se modifica stresul perceput atunci cand variabila se modifica cu 0 unitate, in
condiiiile in care nivelul de solicitare in munca ia valori constante. Cum este yorba
de 0 variabila dummy (0 - femei; 1 - barbati), coeficientul b indica diferenta in ceea
ce stresul perceput intre femei barbaii, in conditiile pastrarii constante a
influentei nivel.ului de solicitare in munca asupra stresului. se considera ca
modificarea reprezentata prin valorile b sau este indiferent de nivelul de
solicitare in munca.
Tn ecuatiile de regresie care indud un factor de interactiune, valorile b
corespunzatoare efectelorsimple modifica putin modulde interpretare. Astfel,
coeficientul de regresie specific nivelului de solicitare in munca este vazut ca
236
11,lli'II'I","m'II'I',I!I',I,I' 11,'1"['11','1',',' 11:111111
"
111,'11
"
111','111 11','11'111 1'111'11'11
'
,11"1111"1
'
11"II',il 11"Il,'I'I'lIlII,IIIIIlIII"1',11,11'1'
intensitatea cu care se modifica criteriul atunci cal1d nivelul de solicitare cu 0
unitate, in conditiile in care ceilalti predictori iau valoarea zero. Concretizand, yom
spuneca b asociat nivelului de solicitare in munca ne arata cu cat se modifica
stresul perceput atunci cand nivelul de solicitare cu 0 unitate, in conditiile in
care sexul persoanei ia va loa rea zero, adica in cazul subieCiilorde sex feminin. Tn
cazul variabilei sexul persoanei, interpretarea devine: b indica diferenia dintre
stresul perceput de femei barbati atunci cand nivelul de solicitare in munca ia
valoarea zero.
Se impun doua precizari. In cazul interpretarii efectelor simple in regresii
care indud efecte de interaciiune, b nu indica valoarea cu care se modifica criteriul
atunci cand predictorul respectiv cu 0 unitate, indiferent de nivelul celorlalii
predictori, ci arata modul in care se modifica criteriul atunci cand predictorul
asociat cu ounitate, in conditiile in care ceilalii predictori iau valoarea zero.
Deosebirea apare, deoarece valorile b nu sunt constante pe toata amplittldinea
predictorilor cu rol moderator, ea fiind calc,ulata doar in situatia in care iau
valoarea zero. Uneori valoarea are 0 semnificaiie reala, ca in cazul variabilelor
dummy, Tn care cota 0 indica prezenta subiec\ilor de sex feminim, in alte situatii
insa ea nu are 0 semnificaiie reala, precum se intampla in cazul nivelului de
solicitare Tn munca, ale carui valori sunt cuprinse intre 1 ; 15.
Cea doua precizare se refera la interpretarea acestei valori zero, in
functie de tipul ,de metoda adoptata in obtinerea variabilei interactiune. Daca se
metoda dasica, bazata pe produsul valorilor variabilelor de interactiune,
zero nu are 0 semnificatie speciala insa daca se metoda centrata,
valoarea zero reprezinta, de fapt, media variabilelor interactiune. Intr-o asemenea
situatie, interpretarea initiala a lui b (nivelul cu care se modifica criteriul atunci cand
predictorul asociat se modifica. cu 0 unitate in condiiiile in care ceilalti predictori iau
valoarea zero) devine nivelul cu care se modifica criteriul atunci cand predictorul
asociat se modifica cu 0 unitate, iar ceilalV predictori iau valori medii. Din aceasta
perspectiv<3, interpretarea pierde sensul avut Tn cazul' variabilei sexul persoanei
(Tn care valoarea medie nu semnific<3 nimic) ins<3 in relevanta in cazul
variabilei nivelul de solicitare in munca, fiind yorba de 0 interpretare facuta la un
nivel mediu de solicitare in munc<3. De aceea, alegerea modului de construire a
variabilei interactiune P9ate tine seama de interpretarii rezultatelor in
funetie de metoda aleasa.
Interpretarea efectelor de interac(iune
Vom utiliza ca exemplu ecuatie, cu urmatoarele valori asoeiate:
SIres = bO + b 1 *Grad de solicitare + b2*Dummy Sex + b3*Grad de solicitare*Dummy Sex
Stres = 4,5 + 0,82*Grad de solicitare + 0, 12*Dummy Sex + 0, 18*Grad de solicitare*Dummy Sex
Interpretarea coeficientului de regresie b3, corespunzator efeetului de
interactiune, indicanivelul in care se modifica b1 atunei cand variabila sex se
237
IIIIUlIIIUIIIILlIIIII IIIIIUlIlIUllih '1IIIUIIII',IIIIIJIIIIUllih 111111 111111,11111 11111 ,11111 11111 IIIIIIJIlIl ,111111 111111 :111, 1111111111 1111' ,1111 1111111111 11111 ,1111 11111 1111 '1I1II:IIIIILlIIII '1111111111"1111111111' 11111 111111 11111,illlli 11111':11111111111111111'11111, 1111111111,111111111111111111111111111::1111111111:11111111IIIIiIIIII 111111'11111'111111 11111 ___ :1111 illl ill

modifica cu 0 unitate. Tehnic, am putea spune ca acest coeficient indica riivelul
cu care se modifica b2 atunci cand variabila grad de solicitare se modifica cu 0
unitate. De obicei, in interpretare se tine seama de aceea dintre variabile care
joaca un rol moderator. Cum in situatia de fata variabila moderatoare este' sexul
persoanei, ne yom axa pe prima posibilitate de interpretare. Astfel, yom putea
afirma ca stresul perceput se.modifica Tn functie de gradul de solicitare In munca in
mai mare .masura in cazul barbatilor decat in cazul femeilor, deoarece in cazul
barbatilor b1 devine 1 (0,82+0,18), in timp ce in cazul femeilor el este de 0,82. Tn
plan psihologic, am putea afirma ca nivelul de stres perceput este In mai mare
dependent de nivelul de solicitare in munca in cazul barbatilor, decat Tn
cazul femeilor. Ca in alte situatii, 0 asemenea interpretare are sens doar daca
coeficientul de regresie asociat efectului de interactiune este semnificativ statistic.
6.7.3. Analiza de cale
regresia, In multiplele ei forme, se 0 tehnica statistica
robusta, ce poate fi utilizata Intr-o multitudine de situatii, realitatea psihologica
complexa este uneori inadecvata pentru a permite utilizarea metodelor de regresie,
avem de-a face cu un design corelational.
De exemplu, daca yom dori sa testam teoria comportamentului planificat,
ca extensie a teoriei actiunii rationale elaborate de Fishbein Ajzen, yom constata
ca regresia nu poate fi utilizata decat printr-un artificiu tehnic (Hankins, French
Horne, 2000). Conform teoriei planificarii comportamentului, prezentata In figura
6.16, 0 persoana adopta un anurriit comportament, daca are intentia de a-I adopta
daca considera ca are capacitatea de a derula acel comportament. De
asemenea, intentia de a actiona Intr-un anumit fel este dependenta de trei factori:
atitudinea subiectului fata de problema respectiva, normele existente care aproba
sau dezaproba un anumit comportament parerea subiectului cu privire la
capacitatea sa de a adopta un anumit comportament. Conform acestei teorii, daca
un student decide sa unui coleg de-al sau raspunsurile la examen face
acest lucru, pentru ca are intentia de a-I ajuta pentru ca este de parere ca poate
face acest lucru fara probleme (are controlul actiunii). De asemenea, intentia sa de
a-I ajuta se bazeaza pe atitudinea pe care 0 are fata de acesta (ex. "este 0
persoana de treaba"), pe normele subiective existente in grup (ex. "este bine sa-ti
ajuti colegii", "estebine sa fii solidar cu pe credinta ca poate face acest
lucru faraa fi observat sanctionat.
Daca ar fi sa testam validitatea acestui model prin intermediul regresiei, ar
trebui sa impartim modelul in doua seotiuni, fiecare fiind supusa apoi unei analize
de regresie. Prima sectiune ar avea drept variabila dependenta intenVa de a
actiona, iar ca predictori: normele subiective, atitudinea controlul actiunii. Cea de
238
Norme subiective
Atitudini Inten\ia de a ac\iona Comportament
Controlul ac\iunii
Figura 6.16. Schema cauza/a a teoriei comportamentului planificat
a doua sectiune ar avea drept variabila dependenta comportamentul adoptat, iar
ca varia bile independente: intentia de a actiona controlul aqiunii. Cele doua
sectiuni sunt sesizate clar In figura 6.17.
Norme subiective
Inten\ia de a ac\iona
Atitudini Inten\ia de a ac\iona Comportament
Controlul acliunii
Controlul ac\iunii
Figura 6.17. Sectiuni ale teoriei comportamentului planificat testa bile prin intermediul
regresiei
Tn termenii ecuatiei de regresie sub forma standardizata, cele doua sectiuni
pot fi scrise sub forma:
Intentia de a actiona = (3Norme subiective + (3Atitudil1i + (3Controlul aqiunii
Comportament= (3lntentia de a actiona + (3Controlul actiunii
Din pacate, chiar daca prin regresie putem observa in ce masura cele
doua ecuatii de regresie explica intr-un mod eficient cele doua par1i ale teoriei
comportamentului planificat, nici una dintre ele nu ofera informatiile necesare cu
privire la validitatea de ansamblu a teoriei propuse. Se pot face d'oar presupuneri,
pornind de la ideea ca, daca ambele sectiuni sunt sprijinite de rezultatele analizei
de regresie, atunci intregul model este acceptat.
239
Tn asemenea situatii, in care modelul testat presupunE? mai multe variabile
dependente, am putea utiliza analiza de cale, ca modalitate mai eficienta de a
testa modelele cauzale complexe.
Oefinirea variabilelor Tn analiza de cale
Aceasta metoda statistica este utila in testa rea unor modele cauzale,
precum este cel prezentat in figura 6.16, vizand teoria comportamentului planificat:
Tntr-un asemenea model exista doua tipuri principale de variabile: variabile
exogene :;;i variabile endogene (Klem, 1995). De precizat ca unii factori pot juca
ambele roluri. Variabilele exclusiv exogene sunt variabilele de la care se porne:;;te
schema cauzala, fiind similare predictorilor din regresia multiliniara. Tn figura 6.16,
normele subiective, atitudinea :;;i controlul comportamentului sunt variabile exclusiv
exogene, in timp ce intentia de a actiona joaca rolul de variabila exogena in relatia
pe care 0 are cu comportamentul adoptat. Tn schimb, aceea:;;i variabila, inteniia de
a actiona, joaca rolul de variabila endogena (similara criteriului din regresia
multiliniara), deoarece ea este considerata ca fiind cauzata de actiunea comuna a
trei variabile: normele subiective, atitudinea :;;i controlul comportamentului. De
asemenea, comportamentul adoptat este 0 variabila exclusiv endogena, deoarece
ea nu influenieaza alte variabile insa este influentata de intentia de actiune :;;i de
controlul comportamentului.
Printr-un asemenea model putem stabili in detaliu relatia dintre variabile.
Spre exemplu, putem stabili ca exista 0 relatie indirecta intre atitudinea unei
, .
persoane :;;i comportamentul acesteia, relatia fiind mediata de intentia de a actiona.
Similar, putem afirma ca perceptia subieciilor despre u:;;urinta sau dificultatea de a
aCiiona (controlul comportamentului). are atat 0 actiune directa asupra
comportamentului adoptat, cat :;;i una indirecta, prin intermediul intentiilor de a
aCiiona. De asemenea, putem campara doua sau mai multe modele concurente
pentru a vedea care dintre ele explica mai bine date Ie culese. Spre exemplu, prin
analiza de cale se poate estima daca teoria comportamentului planificat,
prezentata in figura 6.16 explica mai bine comportamentul adoptat de a persoana
in comparatie cu a varianta modificata a acesteia (figura 6.18) sau fata de teoria
actiunii rationale (figura 6.19).
subiective
Atitudini t----"i Inten\ia de a aG\iana 1----:-1"1 Compartmnent
Controlul ac\iunii
Figura 6.18. Teoria comportamentului planificat Tn varianta modificata
240

..
!'Iarme subiective
Atitudini de a aciiona Cornportarnent
Figura 6.19. Teoria acfiunii rationale
Fara a insista mai mult asupra modului de realizare :;;i interpretare a
analizei de cale :;;i a coeficientilor rezuItati, yom mentiona ca in selectarea
modelului care explica cel mai bine datele obtinute se folose:;;te aceea:;;i strategie :;;i
aceia:;;i parametri, utilizati :;;i in cazul analizei factoriale confirmatorii, interpretarea
facandu-se intr-un mod similar (vezi sectiynea 5.2.3.). Din acest punct de vedere,
SPSS-ul nu of era posibilitatea de a realiza direct 0 analiza de cale insa un program
complementar, AMOS, poate realiza asemenea analize.
BIBLIOGRAFIE
Berry, W.D., Feldman, S. (1985). Multiple regression in practice. (Sage University Papers on
Quantitative Applications in the Social Sciences, series no. 07-050). Newbury Park, CA:
Sage.
Field, A. (2000). Discovering statistic using SPSS for Windows. London: Sage Publications.
Garson (2000). Gasit la 14.IX pe www2.chass.ncsu.edu/garson/pa765Iregression.htm
Hankins,M., French, D., Home, R. (2000). Statistical guidelines for studies of the theory of
reasoned action and the theory of planned behaviour. Psychology and Health, 15, 151-
161.
Jaccard, J., Turrisi, R., Wan, C.K. (1990). Interaction effects in multiple regression. (Sage
University Papers on Quantitative Applications in the Social Sciences, series no. 07-
072). Newbury Park, CA: Sage.
Kirby, J.R., Parrilla, R.K., Pfeiffer, S.L. (2003). Naming speed and phonological awareness
as predictors of reading development. Journal of Educational Psychology, 95(3), 453-
464.
Klem, L. (1995). Path Analysis. in L.G. Grimm i P.R. Yarnold (eds.). Reading and
understanding multivariate statistics. (p. 65-98). Washington, DC: American
Psychological Association.
Licht, M.H. (1995). Multiple regression and correlation. In L.G. Grimm i P.R. Yarnold (eds.).
Reading and understanding multivariate statistics. (p. 19-64). Washington, DC:
American Psychological Association.
Miles, D.E., Johnson, G.L. (2003). Aggressive driving behaviors: are there psychological and
attitudinal predictors? Transportation Research Part F, 6, 147-161.
241
_"'IILlIILlIIII,IIIILlIIII,llIlIlIlIIlJllllllllllllllllhIllIllIlIliLlIIIII'lIlIlIIlIIIWIIIIIIUIIIIIlJIIIIUIIIIIUIIIIUIIIIIUIIIILlIIIIlJIIIIUIIIIIJIIIILlIIIILJIIIIIJIIIIIUIiIliJIIIIIIIIUllllluIlIllIJIIIIILlIIIIIIIIIII'!IIIIII 111111.111111 11111i00i11111 111111 'IIIII! 111111:11111'111111 11111:111111 11111,111111 :11111 11111:,11111 11111,11111 11111,11111 11111LII111JlIII,1III! 1IIILIIIILlIIII '11111 !IIII,!IIIII 11111 IIIII! 11111 'III 1'11111 11111LlIIII'1II111 11111 111111 11111:111111'11111,111111,111111111111111111111,,1111111111111111111111'11111:111i 1111, 1111111 II
Nicol, A.A.M., Pexman, P.M. (1999). Presenting your findings. A practical guide for creating
tables. Washington DC, USA: American Psychological Association.
Pedhazur, E.J., Schmelkin, L. (1991). Measurement, design, and analysis: an integrated
approach. Hillsdale, USA: Lawrence Erlbaum Associates, Inc.
Pitariu, H. (1983). PSihologia selectiei i formarii profesionale. Cluj-Napoca: Editura Dacia.
Schroeder, L.D., Sjoquist, D.L., Stephan, P.E. (1986). Understanding regression analysis.
An introductory guide. (Sage University .Papers on Quantitative Applications in the
Social Sctences, series no. 07-057). Newbury Park, CA: Sage.
Thompson, B. (1995a). Stepwise regression and stepwise discriminant analysis need not
apply here: a guidelines editorial. Educational and Psychological Measurement, 55(4),
525-534.
Thompson, B. (1995b). Exploring the replicability of a study's results: Bootstrap statistics for
the multivariate case. Educational and Psychological Measurement, 55(1), 84-94.
242
[
I
CAPITOLUL 7
REGRESIA LOGISTICA
Daca criteriul sau variabila dependenta inclusa Tntr-o regresie nu este
masurata printr-o scala numerica, ci printr-una dihotomica de tipul "da" sau "nu";
"admis" sau "respins"; "corect" sau "gre;;it", "succes" sau "insucces ;;colar" etc., se
aplica a alta forma de regresie, denumita regresie logistica.
Similar regresiei liniare, regresia logistica poate fi simpla sau multipla, cu
scop predictiv sau cu scop explicativ, cuprinzand doar efecte simple sau ;;i pe cele
de Modul de lucru Tn asemenea cazuri este analog cu cel prezentat Tn
capitolul destinat regresiei liniare. De exemplu, ;;i Tn cazul regresiei logistice putem
Tntalni atat variabile numerice, cat ;;i varia bile dummy, ecuatii de regresie liniare
sau neliniare, modele simultane, ierarhice sau Tn pa;;i etc. De aceea nu vom mai
prezenta toate aceste detalii, ci ne vom concentra asupra modului de realizare ;;i
asupra particularitatilor regresiei logistice.
Un exemplu tipic In care se poate utiliza regresia logistica este cazul
Tn plan sexual. Tn functie de acest criteriu am putea Tmparii oamenii Tn
fideli sau infideli fata de parteneri. Daca ar fi sa gasim un set de variabile care sa
realizeze a predictie cat mai co recta a comportamentului in cuplu al partenerilor,
am putea utiliza regresia logistica Tn scop predictiv. Tn schimb, daca am fi interesati
sa vedem ce factori psihologici pot explica infidelitatea dupa ce am controla unii
factori personali sau sociali precum varsta, sexul subiectului, statutul subiectului,
venitul realizat, nivelul de educatie, op'ortunitatile existente la locul de munca etc.,
am utiliza regresia logistica Tn scop explicativ.
7.1. Concepte i principii teoretice
A;;adar, regresia logistica este a forma de regresie in care variabila
dependenta (VO) este dihotomica, in timp ce variabilele independente (VI) pot fi
continue sau categoriale. Exista cazuri in care: VO, de;;i este categoriala, are mai
multe alternative. Un exemplu ar fi identificarea unor predictori care sa explice cat
mai mult din evolutia probabilitatii ca oamenii sa voteze pe unul dintre liderii politici
precum Adrian Nastase, Teodor Stolojan sau Corneliu Vadim Tudor. Tn aceasta
situatie vorbim despre 0 regresie logistica multinomiala. Tn capitolul de fata vom
aborda doar regresia logistica dihotomica sau binara, denumita generic "regresie
logistica". Modalitatea de interpretarea regresiei logistice multinomiale, cat ;;i a
regresiei logistice ordinale nu poate fi inteleasa fara a buna aprofundare a regresiei
243

'1'11111,111111111111111'1111111111,11111,11111111,
Illi 1111 'III 1111'111'1111'111 11111111 11111111 11111111"11111111'1111'1111,111111111111111111 111'111"'11111111"1111'1111",111111'11111'11111"11111"11111"111111111111'111111111111'11111'111111111111111111111,11111111111111111111111'1
logistice binare. Mai multe detalii despre aceste modalita\i de regresie logistica pot
fi gasite In Agresti (1990).
Asemeni regresiei liniare, cea logistica Tncearca sa gaseasca un model
explicativ cat mai bun, exprimat printr-o functie matematica. Regresia logistica se
aseamana cu log it, cele doua tehnici oferind chiar rezultate identice, Tnsa
analiza logit are un caracter mai restrictiv, deoarece toti predictorii trebuie sa fie
masurati prin scale de tip nominal. De asemenea, regresia logistica poate fi folosita
cu succes in locul analizei discriminantului, care este 0 tehnica mult mai
pretentioasa din perspectiva conditiilor necesare pentru a fi utilizata corect. Se
cuvine sa precizam cateva diferente existente intre regresia liniara regresia
logistica.
(a) Spre deosebire de regresia liniara, nu exista conditia de liniaritate fntre
VI VD, nu exista cerinta ca VI sa fie distribuite normal, fiind astfel mai uor de
aplicat. Din toate aceste puncte de vedere regresia logistica se dovedete a fi 0
metoda foarte robusta utila.
(b) Din punct de vedere tehnic regresia logistica se bazeaza pe metoda
estimarii verosimilitatii maxime (in engleza "maximum likelihood estimation") nu
pe metoda clasica, a celor mai mici patrate.
(c) Tn fine, daca Tn regresia liniara VI duce la predictia valorii
VD, in regresia logistica VI duce la determinarea (predictia) unei
probabilit3ti pentru fiecare dintre cele doua raspunsuri posibile ale VD. Tn cazul
regresiei liniare se obtine 0 valoare estimata a criteriului, pentru fiecare subiect in
parte, pe baza ecuatiei de regresie rezultate. De exemplu, am putea estima
performanta in vanzari ,a unei persoane pe baza experientei profesionale a
acesteia i pe baza abilitatilor sale psihologice. Tn cazul regresiei logistice, dat fiind
faptul ca nu exista decat doua raspunsuri posibile (ex. fidel sau infidel fata de
partener), se poate estima probabilitatea, pentru fiecare subiect Tn parte, de a se
comporta fntr-un mod fidel sau infidel, iar acest lucru ar fi obtinut pe baza eCl,Jatiei
de regresie logistica. Dei are aparent 0 forma liniara, criteriul estimat este. 0
variabila log it, denumire ce vine de la faptul ca VD dinecuatie este logaritmul
natural al unei valori ce intra in calculul probabilitatii de a se intampla un evenimenti
sau altul. In cazul infidelitatii, criteriul indica probabilitatea ca 0 persoana sa se,
com porte fntr-un mod fidel in plan sexual sau dimpotriva.
Precizari metodologice necesare aplicarii regresiei logistice
Categoriile VD trebuie sa fie reciproc exclusive. Fidel 9i infidel fn plan!
sexual fata de partener pot constitui categorii ale VD in regresia logistica, deoarece;
ele se exclud reciproc. Tn schimb, fan ,al fotbalului i al tenisului sunt categorii care:
nu se exclud reciproc, deoarece exista persoane care pot intra in ambele categoriil
sau dimpotriva, in nici una. Prin urmare, regresia logistica nu poate fi aplicata intr-o!
asemenea situatie.
Date/e trebuie sa fie independente une/e de alte/e. Daca avem categoriile!
bolnav, respectiv sanatos psihic, nu putem include datele de la' acelai subiect:
244
ob\inute la intervale de timp diferite, in perioada episodului pSihopatologlc,
respectiv dupa
Modelul logistic trebuie sa cuprinda VI semnificative din punct de vedere
teoretic pentr.u relatia cu VO. Incluqerea unor VI care nu au legatura cu VD poate
conduce la erori de estimare a coeficientilor logit. De asemenea, pot aparea
corelatii false Tntre VI VD, caz in care este afectata calitatea modelului.
Utilizarea metodei de estimare a verosimilitatii maxime necesita un numar
mai mare de subiecti decat utilizarea metodei celor mai mici patrate. Din acest
motiv, pentru mici, testa rea ipotezelor statistice poate fi inadecvata. Un
criteriu conservator sustine necesitatea unui minimum de 50 de subiecti pentru
fiecare variabila predictor. pentru cercetari de peste 300 de subiecti, acest
raport poate. sa scada, situandu-sEl undeva in jurul a 20-30 de subiecti pentru
fiecare predictor (Wright, 1995).
7.2. Mode\u\ regresiei \ogistice
Pentru a clarifica principii Ie teoretice ale regresiei logistice yom apela in
paralel la un exemplu din psihologia politica, Mai exact, yom surprinde Tn ce
masura varsta influentea:z:a opiniile romanilor in ceea ce fntrebarea: "I;ra
mai bine inainte de 1989 decat dupa 1989, din perspectiva conducatorilor tarii?".
Datele provin din Barometrul de Opinie Publica din octombrie 1999, raspunsurile
subiectilor fiind modificate prin a reduce alternativele de raspuns de la cinci la doua
categorii. Aceste variante sunt "1 - era mai bine fnainte de 1989"; "0 - era mai rau
fnainte de 1989".
Daca modelul ecuatiei de regresie liniare simple este:
Y=bO+b1*X (7.1)
modelul regresiei logistice simple este (Menard, 1995):
In(y) = bO + b1*X (7.2)
care poate fi scris
y = exp (bO + b 1 *X)
(7.3)
unde y este ansa sau raportul dintre probabilitatea de a raspunde 1, (era mai bine
inainte de 1989) probabilitatea de a raspunde 0 (era mai rau inainte de 1989).
Adica, In (y) = In [p/(1-p)]; bO i b1 sunt coeficientii fogit corespunzatori
coeficientilor de regresie (bO fiind asociat interceptului, iar b1 fiind asociat pantei de
regresie determinate de predictorul X, in acest caz, varsta subiectilor).
245
, '" "'''' """"""-""" '"'" ""' 111111 ,111111111111 11111: IIIIIIJIII: 111111 ,111111111111 ,lilli' 1IIIII'IIIIIJIIIIJIIIIIJIIIIJIIIIIJIIIIJIIIIIJiliLlIIIII IIIIILIIIIILlIIIIIIIIIII 111"""1",111111111",,1111'1111", "1'" '1111 IIII! 1111 'i'
Raportul ia valoarea 1 cand exista 0 egalitate intre cele doua probabilitati,
adica atunci cand fiecare raspuns are 0 probabilitate de .50 (50%) de a fi ales de 0
anumita persoana. EI devine supraunitar cand exista mai mulle :;;anse sa se
intample situatia 1 (subiectul sa afirme ca era mai bine inainte de 1989) :;;i
subunilar cand :;;ansele sunt mai mari de a prezice varianta (era mai rau inainte
de 1989).
Devine necesara diferentierea clara dintre probabilitati, anse i raportul
anselor. In regresia logistica dihotomica, ansele unui subiect de a intra In
categoria 1 (era mai bine inainte de 1989) sunt egale cu raportul dintre probabili-
tatea de a fi inc/us Tn acea categorie i probabilitatea de a apar(ine ce/eilalte
categorii (0 - era mai rau inainte de 1989). Raportul se inverseaza daca dorim sa
calculam :;;ansele cazului de a intra in categoria O. Daca probabilitatea de a fi inclus
Tn categoria 1 este p = .80, ea devine .20 pentru categoria 0 (q=1-p). $ansele ca
subiectul sa apartina primei categorii sunt de patru ori mai mari (.801.20). Se
observaca probabilitfjti1e pot lua va/ori Tntre 0 i 1, in timp ce ansele variazi3 de la
o la infinit. Prin urmare, se pune problema calcularii probabilitatii ca un anumit
subiect sa fie inclus in prima categorie. Ea se face dupa formula (Wright, 1995):
.
e Y
(7.4) p
1 + e Y
unde p = probabilitatea de a se petrece eVenimentul 1 ("era mai bine Tn.inte de
1989"); e simbolizeaza exponentul, iar y ia valori diferite in functie de tipul de
ecuatie logistica. Astfel:
y = bO + b1*X
Y = bO + b1*X1 + b2*X2 ...
pentru regresii logistice simple
pentru regresii logistice multiple
Vom calcula, ilustrativ, probabilitatea unei persoane de 20 de ani Sa afirme
ca era mai bine inainte de 1989. Sa presupunem ca interceptul (bO) a fost -1,02,
iar coeficientul logit al variabilei varsta (bi) a fost 0,03. Vom obtine: y = -1,02 +
0,03*20 = -0,42
Deoarece y = exp (bO + b1 'X), exponentul valorii y de -0,42 este 0,657.
Putem inlocui in formula pentru a afla probabilitatea ca un tanar de 20 de ani sa
afirme ca era mai bine inainte de 1989.
p
0,657 = 0,396
1+0,657 .
Valoarea ne determina sa credem ca tineriide 20 de ani vor afirma mai
degraba ca este mai bine acum comparativ cu situatia dinainte de 1989, deoarece
probabilitatea de a afirma ca era mai bine Tnainte de 1989 din perspectiva
246
IIIIUIIIIIIIIIII 111111111111 111111 111111 'IIIIII.IIIIIIUI1111LlIIIII!!111111 111111 '11111' 111111 '11111: 111111:11111'11111"11111 !IIIII:IIIII'IIIIII 1111111 111111 111111'1111111111111:1111111111111111111111111111111111.111111'1111111'111111'111111111111111111:111111111111:111111111111:111111111111"11111:,1111111111::1111111111:11111111111'11111111111111Ii 1IIIi ,11111 I1111 ,1111: 11111 1111 III II
conducatorilor tarii era de 0,396, in timp ce probabilitatea de a se opune unui
asemenea raspuns era 1-p, adicaO,604, 0 valoare mai mare.
Repetand acela:;;i demers matematic pentru 0 persoana de 50 de ani yom
obtine:
y = -1,02 + 0,03*50 = 0,48, iar exp (y) = 1,61
P = 1,61 / (1+1,61) = 0,616
In acest caz, pentru 0 persoana in varsta de 50 de ani exista 0
. probabilitate mai mare de a afirma ca era mai bine inainte de 1989 (p = .616) decat
de a sustine contrariul (q = 1-p = .384).
Decizia de a fi indus 7ntr-o categorie sau alta se face avand criteriu limita 0
probabilitate de .50 insa aceasta valoare poate fi modificata in functie de
caracteristicile VD :;;i de frecventa reala a alternativelor de raspuns (Hair,
Anderson, Tatham:;;i Black, 1998). .
Pe baza probabilitatilor putem stabili :;;ansele de a fi indus intr-o categorie
sau alta. Un t<3nar de 20 de ani va ave a de aproximativ 1,5 ori mai multe :;;anse de
afirma ca este mai bine acum decat inainte de 1989 (.604/.396). In schimb, 0
persoana de 50 de ani va avea 'tot de aproximativ 1,5 ori mai multe :;;anse sa
afirme ca era mai bine inainte de 1989 decat acum (.616/.384) .
Un concept esen\ial In regresia logistica estecel de raport al anselor. EI
estimeaz8 schimbarile intervenite Tn ansa de a fi inclus Tn prima categorie (In
cazul dat: era mai bine inainte de 1989), atunci cand variabila predictor crete cu 0
unitate. Pentru a-I calcula avem nevoie doar de coeficientul logit al variabilei
predictor in cauza.
Sa presupunem ca am obtinut un 'parametru b 0,50 pentru un alt
predictor: numarul de copii. Pentru a afla raportul :;;anselor, yom calcula exponent
din valoarea acestuia (0,50).
eO,50 =1,64
Interpretarea raportului de .:;;anse va fi prezentata pe larg cand yom discuta
des pre coeficientii log it. Pana atunci ne yom rezuma sa citim rezultatul prezentat
mai sus, afirmand ca: un individ cu doi copii are de 1,64 ori mai multe :;;anse sa
afirme ca era mai bine inainte de 1989 in comparatie cu 0 persoana cu un singur
copil (VI cre:;;te cu 0 unitate). Tn cazul mai multor VI incluse in model se specifica
sintagma "pastrand cele(alte variabile constante" ..
Se poate calcula raportul :;;anselor i pentru modificari ale VI mai mari de 0
unitate. Astfel, yom com para 0 persoana cu cinci copii cu 0 alta care un copil.
Diferenta de patru unitati va fi exprimata astfel:
e
4
*O,50 =7,38
247
,1'11'1 1"11"'11',11111111111'1"1111111,:1111' 1111111111':111"111'1111'111'1111"111'1111111111
Adica, un subiect cu 5 copii, in comparatie cu cel care are un singur copil,
va ave a de 7,38 ori mai multe 9anse de a afirma ca era mai bine inainte de 1989,
din perspectiva conducatorilor tarii;'
Tn privinta rezultatelor oferite de SPSS, lucrurile sunt diferite. SPSS-ul
ofera direct valoarea raportului 9anselor pentru fiecare VI atunci cand acestea se
modifica cu 0 unitate 9i da posibilitatea de a opta pentru afi
9
area intervalului de
fncredere corespunzator fiecarui raport al 9anselor. Tn schimb, programul nu
prezinta direct 9ansele estimate pentru fiecare subiect. Acestea pot fi deduse
indirect pe baza probabilitaiilor obiinute. Deoarece probabilitaiile se calculeaza
pentru fiecare subiect Tn parte, exista Tn SPSS optiunea de a salva ca variabila
noua, probabilitatea fiecarui subiect de a raspunde 1 (de a afirma ca era mai bine
Tnainte de 1989).
Vom sublinia ca in interpretarea coeficien(ilor logit ob(inuti (inem seama de
raportul de anse i nu de probabilita(i. Acestea, nu sunt eficiente deoarece au
valori diferite la variatii constante ale variabilei predictor. Tn general, probabilitatile
se modifica mai mult pentru valori medii ale VI 9i mai putin pentru valori extreme
ale VI.
Astfel, daca admitem un intercept bO = -1,02 9i un coficient logit b1 == 0,50
pentru variabila numar copii, vom observa ca probabilitaiile nu se modifica uniform
cEmd VI cre9te cu 0 unitate. Concret, probabilitatea unei persoane cu un copil de a
afirma ca era mai bine Tnainte de 1989 este .37, iar cea a unei persoane cu doi
copii este .49, diferenta de probabilitate dintre cele doua raspunsuri fiind de .12. In
schimb, probabilitatea unui subiect cu cinci copii devine .81 faia de .87 cat este
probabilitatea pentru 0 persoana cu copii, diferenta fUrid de numai .06.
1.0
.8
.7
f
."
.5
]l .4

.3
.2
---
0.0
I
0 3 4 6 7 10 11 12
Figura 7,1. Moda/itati de evo/utie a curbei regresiei /ogistice simple In trei situatii ipotetice (b
= 3 -linie continua; b = 1,5 -lirie punctata; b = 0 -linie fntrerupta)
Acest lucru se Tntampla, deoarece regresia logistica nu are 0 forma liniara,
ci 0 forma specifica in forma de S, denumita curba de regresie logistica. Fiecare
combinaiie de coeficienii log it cu interceptul produce 0 modificare a formei
acesteia. Tn functie de valorile coeficientului log it al VI se modifica panta curbei 9i
248
111'111'1111111" 11111111 Illillll 11111111:i: 'i,:11 II iii IIII! 11111 'IIII! 11111 II 111:11111111 1111 11111111:111
"11111111111111111 1111 '111,1111 III! iii 'lI'ilil 111,1111 lIIillll lII!illl 'I' II iii ,II'II! iII'il' 111',111 III 'iii 111'1111 1II,11Ii III 'III 1111111,111111'111111111",11111111',1111 1111'111111111,1111111',111'111'111
directia acesteia .. Figura de mai jos prezinta forma curbei logistice pentru trei valori
diferite ale coeficientului logit pornind de la ideea ca interceptul a luat valoarea o.
S8 poate observa ca panta este mai abrupta in cazul liniei continue,
deoarece valoarea coeficientului logit a fost mai Tndepartata de 0 (b=3). Panta
scade Tn cazul liniei punctate, pentru ca valoarea. coeficientului log it este mai
apropiata de 0 (b=1,5). Panta arata cat de bine poate discrimina coeficientul logit
luat Tn calcul. Cu cat este mai abrupta, cu atat variabila predictor intervine mai mult
Tn modificarea probabilitatilor VD. Un coeficient logit (b=O) nu va influenta Tn nici un
fel modificarea probabilitaiilor atunci cand variabila predictor va lua valori diferite. Tn
aceasta situaiie, curta S8 transforma Tntr-o linie orizontala (IiniaTntrerupta).
Pentru valori pozitive ale coeficientului log it, curba cre9te dinspre stanga
spre dreapta. Aceasta inseamna ca valorile mici ale predictorului determina 0
probabilitate maj mica de a se fntampla evenimentul 1, iar valorile mari cresc
aceasta probabilitate. Situaiia se initerseaza daca obiinem un coeficient logit
negativ. Curba de regresie va crete dinspre dreapta spre stanga, ceea ce
Tnseamna ca valorile mari ale predictorului determina 0 probabilitate mica de
apariiie a evenimentului 1 9i invers. Astfel, un b= -1,5 va determina 0 curba inversa
faia de curba punctata rezultata din coeficientul logit b de 1,5, prezentat Tn figura
7.1. Ea va pastra Tnsa celelalte caracteristici va avea 0 panta mai abrupta
comparativ GU modelul 3 (b=O), dar mai lina decat modelul 1 (b=3). De remarcat ca
niciodata curba nu va depa:;;i probabilitatea 1 9i nu va cadea sub probabilitatea 0,
chiar daca vom utiliza valori extreme ale VI (Wright, 1995).
7.3. Estimarea modelelor logistice
In aceasta seciiune vom discuta pa9ii necesari pentru aplicarea regresiei
logistice. Vom introduce, in para lei cu explicaiiile conceptuale, urmatoarea situaiie-
exemplu:
o serie de factori influenteaza naterea unor copii sanatoi sau, dimpotriva, a unor
copii cu malformatii genetice diverse. Observand un numar de 125 de un cercetator
a anchetat mamele cu privire la 4 fadori: varsta existenta in familie (rude de gradul I
i II) a unor malformatii genetice, consumul de alcool Tn perioada sarcinii i stresul cotidian
perceput.
Baza de date aferenta acestui exemplu este regresie logistica.sav, iar
pentru analiza datelor Tn SPSS 11.0 se urmeaza calea: "Analyze"-"Regression"-
"Binary Logistic".
Regresia logistica of era posibilitatea de a:
testa daca un model este semnificativ statistic;
com para doua modele intre ele;
stab iii eficienta modelului ales;
interpreta coeficien\ii logit semnificativi din modelul ales;
stab iii profiluri ideale pe baza ecuatiei logistice obiinute;
249
Daca BIC' ia valori pozitive, modelul nu explica foarte bine datele ob\inute.
EI este chiar mai slab Tn explicarea variaiiei VD decat modelul nul, ce include
flumai interceptul. Vom discuta Tn cadrul sec\iunii urmatoare modul Tn care este
utilizat BIC' pentru a com para doua modele Tntre ele, dupa un algoritm propus de
Long (1997) :?i Freese (2000) .
Tn exemplul amintit anterior, vizand factorii ce intervin Tn apari\ia unor
malforma\ii genetice la 125 de nou-nascuii, yom evalua trei factori: consumul de
alcool in perioada sarcinii, existen\a unor rude apropiate cu malformatii genetice :?i
varsta mamei la na9tere. Ecua\ia logistica este:
In Handicap = bO + b 1 * Alcool + b2*Factori genetici + b3*Varsta mamei
Pentru testarea modelului yom apela atat la output-ul oferit de SPSS cat 9i
la anumite cal6ule suplimentare.
Omnibus Tests of Model Coefficients
Chi-square df Siq.
Step 1 Step. 54,501 3 ,000
Block 54,501 3 ,000
Model 54,501 3 ,000
Hosmer and Lemeshow Test
I Chi-square I
12,966
df 7 I
Sig. I
,073
unde Chi-Square Model este testul G2.
Figura 7.2. Testarea modeluluj propus din perspectiva gradului de semnificafie
SPSS este a marca inregistrata.
Vom scrie rezultatul sub forma G2(3) = 54.501, P < .001. Gradele de
libertate sunt date de numarul VI incluse Tn modelul testat. Pomind de la ace9ti
indicatori poate fi calculat 9i BIC', procedeu care nu este oferit direct in output-ul
SPSS-ului.
Vom avea:
BIC' = -54,501 + 3 * In 125 = -40,01
Acest rezultat po ate fi interpretat ca un credit dat modelului explicativ
propus. 0 valoare pozitiva a lui BIC' ar fi Tnsemnat ca avem un model explicativ
mai slab decat modelul nul, ce line seama doar de intercept.
252
"" II' ,III III! 1111 illI'!1II1 1111,11111 1lIIi,IIII '111 1111,11111111,11111111 iII'III'lIIllIIlIlIIilllll:lIllIlIliIllIIllI,IIII'1il '11I III"II! III 'II,III 'II'!II illl III "ii III 'I III'I!'III'II'III"II"I"I'I'" !IIII!III'III"IIIIIII'IIIIIII'III'IIII 1111 'III! 1111 'III: !III 11111 IIII':III! 1111,1111 IIII' 1111 1111 ilill 1111' 1111 ,III 'II
SPSS-ul of era rezultate pentru cea de-a treia metoda de testare a
modelelor logistice, testul Hosmer 9i Lemeshow ca masura a potrivirii. Pentru
aceasta trebuie selectata op\iunea corespunzatoare Tn fereastra "Options" a
regresiei logistice .
. Rezultatul obtinut arata ca ipoteza nula nu poate fi respinsa (p > .07), ca
urmare vom putea spune ca datele rezultate, estimate pe baza modeluiui
explicativ, nu sunt semnificativ diferite de valorile observate. roate aceste rezultate
sprijina ideea ca cel pu\in un predictor din cei trei (consumul de alcool, factorii
genetici 9i varsta mamei) contribuie semnificativ la estimarea probabilitalii de a da
natere unui copil sanatos sau unuia cu malforma\ii genetice.
7.3.2. Compararea modelelor logistice
Inainte de a trece Tn revista principalele modalitati de a compara modele,
trebuie subliniat ca exista doua tipuri de rela\iiTntre acestea: de tip "cuib", respectiv
modele diferite (Hair et aI., 1998; Garson, 2000). .
Doua modele logistice se afla Tntr-o relaiie de tip cuib, daca Tntr-un model
sunt incluse toate VI care se gasesc Tn celalalt. In caz contrar, modelele sunt
socotite a fi diferite. Pentru exemplul dat, 0 relatie de tip "cuib" este:
Ln y = bO + b1*Varsta mamei + b2*Consumul de alcool ~ i
Ln y = bO + b1 *Varsta mamei + b2*Consumul de alcool + b3*Stresul perceput
Pentru aceea9i situatie, comparatia Tntre modele diferite ar fi:
Ln y = bO +b1*Varsta mamei + b2*Consumul de alcool + b3*Stresul perceput ~ i
Ln y = bO +b1 *Varsta mamei + b2* Antecedentele genetice
Pe baza acestei diferentieri stabilim tehnica necesara pentru compararea
modele/or. Vom descrie doua procedee: X2 a/ pasu/ui i diferenta dintre criterii/e
bayesiene ajustate de inform are. ArT).be/e metode pot fi utilizate pentru modele de
tip "cuib", iar ultima poate fi utilizata"9i pentru compararea modelelor explicative
diferite.
Hi palrat al pasulu; este metoda utilizata "Tn SPSS. Tehnica surprinde
marimea modificarilor Tn ceea ce privete log likelihood prin introducerea unor VI
noi, Tn conditiile Tn care VI anterioare sunt pastrate. Se verifica astfel, daca anumite
VI merita a fi introduse Tn model, daca au un efect suficient de mare, Tncat
eliminarea lor ar conduce la un model explicativ inferior. Tehnica este eficienta 9i Tn
identificarea variabilelor dummy semnificative statistic, care pot fi testate
distorsionat prin proba Wald. Din punct de vedere tehnic, X2 al pasului este analog
lui F schimbam din cadrul metodei ierarhice din regresia liniara multi pia.
Regresia logistica poate fi calculata 9i prin alte metode decat cea
simultana (In engleza "enter") ori cea ierarhica. SPSS-u/ poate utiliza atat metoda
253
III 1111 IIII! 111111 !IIIII: 11111111111,1111, illl' !lli III Ii
progresiva "stepwise", cat :;;i pe eea regresiva "baekwise". Tn aeeste situatii este
oferit un X2 "improvement", similar ca functie lui X2 al pasului. Daca modelele
eomparate nu se afla Tntr-o relatie de tip cuib, nu yom putea folosi X2 al pasului
oferit de SPSS, ci va trebui sa apelam la valorile BIC'.
Diferenta dintre valorile BIC' a doua modele poate fi utilizata i'ndiferent
daca modelele se afla sau nu Tntr-o relatie de tip cuib. Pentru aceasta trebuie intai
calculat BIC' pentru fiecare model, iar apoi facuta diferenta dintre cele doua valori:
BIC'1 - BIC'2. Daca BIC'1 - BIC'2 > 0, vom prefera modelul al doilea; daca
BIC'1 - BIC'2 <,0, yom prefera primul model.
Raftery, autorul conceptelor BIC :;;i BIC', propune 0 grila empirica de
interpretare a diferentelor ee e$te prezentata Tn tabelul 7.1 (apud Freese, 2000).
De pilda, daca diferenta dintre doua modele in ceea ce prive:;;te BIC' este 8, putem
. afirma ca modelul cu BIC' mai mic este mult mai bun, existand 0 probabilitate de
.95 - .99 ca acest fapt sa fie adevarat.
Tabelul 7.1. Diferentele critice intre modele dupa Raftery (apud, Freese, 2000)
Diferenta Tn valoarea absoluta Semnificatie Probabilitatea implicata
0-2 SiaM .50 - .75
2-6 Medie .75 - .95
6-10 Puternica .95 - .99
> 10 Foarte puternica >.99
Vom utiliza aeeea:;;i problema pentru exemplificare. Modelele comparate vor fi:
In Handicap = bO + b1*Alcool + b2*Factori genetici + b3*Varsta mamei
In Handicap = bO + b1*Alcool + b2*Factori genetici + b3*Varsta mamei + b4*Stresul
perceput
Primul model a fost discutat :;;i testat anterior,valoarea obtinuta fiind G2(3)
54,501.
Block 1: Method = Enter
Omnibus Tests of Model Coefficients
Chi-square df Sig.
Step 1 Step 54,501 3 ,000
Block 54,501 3 ,000
Model 54,501 3 ,000
Block 2: Method = Enter
254
-----,, ' , i ii, 111,1111' 11111111 '11111111.l11! 1111 ,III: 1111 ,11111111,111, 1111 ,111:1111:111111111111111111 'III: '11;111111: '1111111111' Illi ,III, illl 'III :111111111,1111:11111:11111111' 1111 Iii i
Omnibus Tests of Model Coefficients
Chi-square df Siq.
Step 1 Step ,034 1 ,855
Block ,034 1 ,855
Model 54,535 4 ,000
Figura 7.3. Testarea eficientei modelului 7nainte i dupa includerea variabilei stresul perceput
SPSS este 0 marca Tnregistrata
I
Constatam ca :;;i al doilea model este semnificativ statistic, G2(4) = 54,535,
ca urmare, eel putin una dintre VI incluse influenteaza evolutia VD. Se pune
problema compararii celor doua modele pentru a vedea care dintre ele este mai
bun Tn explicarea aparitiei malformatiilor congenitale .
X2 al pasului apare notat ca Step X
2
, valoarea sa fiind LlX2(1) = 0.034,
P > .854. Valoarea este nesemnificativa statistic, ceea ce Tnseamna ca
introducerea variabilei "stresul perceput" nu a adus Imbunatatiri suficiente
modelului. Formula de calcul este foarte simpla:
Step X2 ::: G2 Model 2 - G2 Model 1 (7.7)
unde modelul 2 este Tntotdeauna modelul cu mai multi predictori inclu:;;i.
Putem calcula :;;i diferenta absoluta dintre valorile BIC' ale celor doua
modele:
BIC'1 = -54,501 * 3*ln N = - 40,01
BIC'2 = -54,535 * 4*ln N = - 35,22
IBIC'1-BIC'21 = 4,79
Se observa ca primul model este preferabil, dar consultand tabelul 7.1.
observam doar 0 probabilitate Tntre .75 :;;i .95 ca acest model sa fie mai bun decat
al doilea.
Trebuie sa privim intotdeauna :;;i dintr-o perspectiva teoretiea atunci cand
comparam doua modelEr. Tehnicile statistice prezentate tind sa prefere modelele ce
dau dovada de parcimonie In dauna altora mai complexe. Daca exista numeroase
argumente care sa ne faca sa credem ca a anume VI trebuie pastrata, Tn pofida
aparentelor matematice, putem face acest lucru. Tn cazul de fata este yorba de
variabila stresul perce put. este cunoscuta importanta ei In acest domeniu, ea
nu a Tmbunatatit primul model. Decizia ramane la latitudinea cercetatorului, daca
va pastra sau nu variabila respectiva Tn model, chiar daca includerea ei nu aduce
un plus explicativ. De obicei, in regresiile cu scop predictiv, asemenea variabile
sunt eliminate, deoarece obiectivul major este de a estima cat mai corect
probabilitatea subiectilor de a raspunde 1 sau Ola criteriu.
255
7.3.3. Stabilirea eficienlei explicative a modelului ales
Modelele pot trece pragul testarii ipotezei statistice mai ales in cazul unor
eiiiantioane foarte mari. Exista Tnsa 0 serie de indicatori, cu rol similar lui R2 din
regresia liniara, care arata Tn ce masura VI. influenteaza variatia VO, indicand
astfel, marimea efectului.
Vom prezenta cinci asemenea indicatori: Pseudo - R2, R2 al lui McFadden,
R2 al lui Cox Snell, R2 al lui Nagelkerke W de stabilire a proportiilor. Ultimii trei
indicatori sunt calculati de SPSS.
Oaca 'R2 din regresia Iiniara are rolul de a explica ce procent din dis persia
VO este explicat de modificarile VI, indicatorii similari din regresia logistica explica
modificarea probabilitatii VO de a fi 0 sau 1 Tn functie devariatia VI.
indicatori nu testeazao anumita ipoteza nula, ci doar evalueaza gradul de asociere
intre VI VO.
Pseudo-H2, coeficient dezvoltat de Aldrich Nelson (apud Hair colab.,
1998), are valori pozitive, subunitare. Are dezavantajul ca valoarea sa maxima nu
poate atinge 1. Tn schimb, tehnica poate fi folosita atat Tn cazul regresiei logistice
binare, clasice, cat Tn cazul regresiei logistice multinominale sau a celei ordinale.
Pentru a-I calcula utilizam formula:
Pseudo - R2 = 1 - (-2LLmodel / -2LLnull)
(7.8)
Se poate calcula un Pseudo-R2 ajustat, pentru a tine seama de marimea
(N) numarul de regresori din m.odel (df '), excluzand interceptul:
Pseudo_R aJ!tStat= Pseudo_R --- * , 2 . ( 2 d/) ( N-,.1 )
N-l N -df-1
(7.9)
R2 al lui McFadden (Long, 1997) este un indicator similar. Oiferenta este
ca McFadden ia in considerare log likelihood (LL) nu functia -2LL. McFadden
otera posibilitatea unej ajustari (in engleza "Adjusted McFadden W"), pentru a nu
spori artificial valoarea indicatorului 0 data cu numarului de VI incluse Tn
model.
R2 McFadden = 1 - (LLmodel / LLnull)
R2 McFadden' (ajustal) = 1 - [(LLmodel - dt ') / LLnull]
(7.10)
(7.11)
unde df ' este dat de numarul de parametri (VI) inclu:;;i Tn model, exceptand
interceptul.
R2 al lui Cox i Snell, respectiv R2 al lui Nagelkerke (Garson, 2000) sunt
indicatori prezentati in outputul SPSS-ului. AI doilea indicator se bazeaza pe
256
I I: 1111 111'1111 11111 111111111111 !IIII: IIII! 1111
primul, tiind 0 ajustare a acestuia pentru ca R2 sa poata lua valori intre 0 1,
asemeni Iwi R2 din regresia Iiniara. Ointre toti indicatorii mai sus prezentati, R2 al lui
Negelkerke este singurul care poate lua valori fntre 0 :;;i 1, ceilalii avand 0 valoare
maxima subunitara.
R2 al proportiilor implica realizarea unui tabel de clasificare. Acesta
coniine, Tn cazul regresiei logistice dihotomice, 2 linii 2 coloane clasifica
observatiile predictiile Tn doua grupe 0 1 (ex. ang?jat sau
Tabelul 7.2. Exemplu de c1asificare a observaiiilor Tn funciie de dalele culese i de cele
estimate
Predig!i omeri (0) Prediciii angaja!i (1)
Observatii (0) 32 5
Observalii angajati (1) 3 60
o ecuatielogistica va putea fi reprezentata printr-un asemenea tabel. Oaca
VI sunt adecvate pentru explicarea VD, S8 va observa 0 similitudihe intre observatii
(datele actuale) predictii (pe baza VI) Tn a determina dadi 0 persoana are
mai mari sa fie angajata sau, dimpotriv3, sa fie
Vom prezenta, pe rand, valorile indicatorilor' discutati pentru exemplul nou-
nascutilor vizand modeJul care nu include variabila "stresul perceput".
, calculul lui Pseudo - R2 trebuie sa valorile abaterii
modelului (-2LL model) ale abaterii initiale (-2LL nul), iar pentru calculullui R2 a
lui McFadden avem nevoie de valorile logaritmice pentru cele doua situatii (LL -
loglikelihood). Daca Tn variante mai vechi, precum SPSS 7.5., programul ofera
valorile tuturor acestor abateri, versiunile mai noi, precum SPSS 11.0., permit
calcularea acestor indicatori Tntr-un mod indirect.
Model Summary
-2 log Cox & Snell Nagelkerke
likelihood R Square R S-.9.,uare
1 109,970 ,353 ,483
Figura 7.4. Indicatod de baza ai marimii efectu!ui Tn regresia /ogistica
SPSS este 0 marca Tnregistrata.
SPSS-ul of era valorile G
2
-2LL pentru model. Se fnsa ca G2 = -2LL
null - (-2LL model), fapt ce ne ajuta la calcularea abaterii initiale. Astfel, daca G2 a
fost 54,50, iar abaterea modelului a fost 109,97, rezulta ca abaterea initiala (-2LL
null)este 164,47.
Apoi, Tnlocuind Tn formulele prezentate mai sus (7.8; 7.9; 7.10 7.11), yom
obtine:
257
'I' 'II 1II,1II!1I1II1I1I1I:IIIIIIIIIIIJIIIIIWIIIII,lIlIIhIlIlIlLlIIIII'IIII'1il1 II,'" , I' 1111:111 '111 'II! III'III! III '11' III 'III iII,:'!' 111:1111 III '11' III 1111 I
IIII,IIIIII"'II'IIIII!IIIII I 11",111,111"11: III 'II' 'ii ,11,11' 'II il ,i 111'11'111 ,II' 111;11' III 111"111 111,111' III 1111 III 111,11"111:1111,111:1111 1II"lIIiIIl, 1111
Classification TablS'
Predicted
HANDICAP
copii cu Percentage
Observed jJrobleme copii sanatosi Correct
Step 1 HANDICAP copii cu probleme 42 4 91,3
copii sanatosi 21 58 73,4
Overall Percentage 80,0
a. The cut value is ,700
Figura 7.6. Rec/asificarea subiectilor pe baza date/or observate i a ce/or estimate
SPSSeste 0 mardi inregistrata.
Tn acest caz, se observa ca ridicarea probabilitatii pentru a incadra nou-
nascutii in categoria celor duce la 0 mai buna estimare a viitorilor nou-
nascuti care vor avea malformatii geneti.ce, 91,3% dintre fiind identificati
corect. Tn schimb, scade la 73,4% puterea de estimare corecta a nou-nascutilor
estimati ca fiind
Tn aceste conditii, decizia de a alege punctul critic de ciasificare tine
exclusiv de cercetator, pe baza obiectivelor urmarite. Astfel, in cazul cand este mai
important sa identificam corect, inca din primele, luni de sarcina, daca copiii vor fi
sanatoi, vom alege un punct critic care sa ne ajute sa estimam cat mai corect
acest lucru. Daca, in schimb, este mai important sa identificam de timpuriu copiii cu
malformatii genetice, pentru a permite avortul, atunci criteriul ales va trebui sa
faciliteze detectarea co recta a acestora.
De asemenea, trebuie sa tinem seam a in SPSS de modul de codare a VD.
Daca codurile date celor doua raspunsuri posibile sunt 0 i 1, programul va pastra
acest sistem de clasificare. Daca insa, cele doua raspunsuri vor fi cod ate 1 i 2,
SPSS-ul va recoda automat valorile VD in 0 i 1. Acest lucru s-a Tntamplat i in
cazul explicat. Datele VD au fost introduse initial cu urmatoarele cod uri: 1- copii cu
malformatii genetice; 2- copii sanatoi. Acestea au fost recodate automat in: 0 -
copii cu malforma\ii genetice i 1- copii sanatoi. Aceasta schimbare poate deruta
procesul de interpretare a coeficientilor log it semnificativi, de aceea se recomanda
ca intotdeauna VD din regresia logistica sa fie codata, de la inceput, cu valorile 1 '
sau O.
7.3.4. Testarea i interpretarea co.eficientilor logit
Vom defini cateva concepte pentru a intelege mai bine aceasta sectiune.
Coeficienti( logit din regresia logistica corespund coeficientilor b din
regresia liniara. Sunt utilizati in ecua\ia regresiei logistice pentru a estima raportul
de !?anse ca variabila dihotomica sa fie 1 sau O. Mai exact, ei indica masura in care
260
se modifica ansele ca VD sa fie, 1 sau 0 cand predictorul asociat crete cu 0
unitate, iar ceilal\i predictori raman constanti.
Coeficientii logit trebuie testati pentru a yedeadaca au 0 influenta
semnificativa asupra VD. Exista in special doua tehnici folosite pentru acest scop:
testul Wald i testul X" al pasului.
Testul statistic Wald este 0 metoda utilizata frecvent in regresia logistica
pentru a testa fpoteza nula conform careia un anumit coeficient log it este,zero. Cu
alte cuvinte, testul Wald ne arata daca predictorul respectiv influenteaza sau nu
criteriul. Rezultatului ob\inut Ii corespunde 0 valoare t sau z, similara ca
interpretare cu situatia din regresia liniara. Tn acest mod, pot fi eliminate din model
acele VI care nu au fost semnificative. Totwiii prin testul Wald exista posibllitatea
comiterii unei erori de tip II Tn cazul unor coeficientii logitfoarte mari, i implicit, a
unor erori standard'ridicate. Aceasta semnifica respingerea unei VI, atunci cand ea
este semnificativa. Tn aceasta situatie (ex. un venit exprimat in milioane lei) sau in
cazul variabilelor dummy, ar fi mai bine sa se utilizeze 0 alta tehnica pentru a
reduce ansele de a comite eroarea de tip II. Alternativa' implica calcularea lui X2 al
pasului, procedeu descris anterior, dupa introducerea variabilelor in cauza.
Diferenta obtinuta este evaluata ca X
2
' cu k-1 grade de libertate, k reprezentand
numarul de categorii variabilei introduse. Daca rezultatul este semnificativ
statistic la p < .05 vom pastra variabila respectiva sau blocul de variabile dummy.
Tn cazul in care nu sesizam semnificative intre modelul explicativ care
include variabila in cauza i cel care.o exclude, putem elimina variabila respectiva
pentru a simplifica modelul (Garson, 2000).
Coeficien\ii logit obtinuti, dei semnificativi statistic, nu pot fi compara\i
direct intre ei din cauza problemelor legate de utilizarea unor scale de masurare
distincte. Pentru a rezolva aceasta problema exista posibilitatea de a calcula un
coeficient log it standardizat, indice similar lui beta din regresia liniara, sau de a
estima contribuiia par1iala a lui R pentru fiecare VI in parte.
Coeficientii logit standardizati corespund coeficieniilor beta din regresia
liniara. Sunt utilizaii pentru a com para influenta diferitilor predictori asupra
criteriului, in situatia in care cele doua VI sunt masurate pe scale diferite (ex. varsta
evaluata in ani, venitul. exprimat in lei/luna). De notat ca pentru variabilele de tip
dummy, coeficien\ii standardizati nu au nici 0 semnificatie inteligibila. SPSS-ul nu
ofera coeficientii log it standardizati, Tnsa 0 masura acceptabila este multiplicarea
fiecarui coeficient logit cu abaterea standard a variabilei respective. Rezultatele
obtinute Tn valori absolute sunt apoi ordonate pe ranguri. 0 alta posibilitate consta
Tn standardizarea tuturor VI.
Contributia partiata a lui R este 0 metoda de stabilire a importantei fiecarei
VI incluse Tn model fara a fi influentat de scala de masurare. R par1ial determina ce
procent din dispersie se datoreaza fiecarui coeficient logit semnificativ in parte
cand ceilalti sunt tin uti la valori constante. Valoarea este dependenta de testul
Wald ?i de eroarea standard, fiind astfel supusa neajunsurilor acestora amintite
261
anterior insa are avantajul de a fi prezentat direct in variantele mai vechi ale SPSS-
ului.
Pentru situatiile descrise mai sus, Tn care exista riscul ca testul Wald sa
of ere valori eronate, este mai utila calcularea coeficientilor standardizati log it sau
multiplicarea coeficientilor log it cu abaterea standard a VI respective (Garson,'
2000).
Din punctul de vedere al interpretarii coeficientilor log it, valorile negative
indica 0 a de a obtine evenimentul codat 1, pe masura ce
valoarea predidorului in schimb, un coeficient logit pozitiv indica 0 relatie
directa, crescand 0 data cu marirea valorii predictorului. Pe baza
coeficientilor logit, prezentati Tn figura 7.7, se poate scrie ecuatia Iogistica a
modelului propus.
In Handicap = 4,57+1 ,36*Fara alcool-2,23*Factori genetici-O,09*Varsta mamei
Daca coeficientii logit obtinuti sunt semnificativi statistic, urmatorul pas
consta in interpretarea lor. Vom regasi doua modalitati principale de interpretare:
(a) interpretarea prin factori (b) interpretarea prin procente (Long, 1997). Din
figura 7.7 se observa ca toti cei trei predictori exercita 0 influenta semnificativa din
punct de vedere statistic asupra evolutiei 'probabilitatii criteriului de a lua valoarea
1, adica de a se copii De exemplu, predictorul varsta mamei la
are un coeficient logit de -0,09, rezultat semnificativ statistic Wald (1) =
10,11, P < .01.
Variable B
ALCOOL(l) 1,3671
FACT. GENETIC(1)-2,2370
VARSTA
Constant
Variable
ALCOOL(l)
-,0938
4,5707
Exp(B)
3,9238
FACT. GENETICI(l) ,1068
VARSTA ,9105
S.E. Wald
,6142 4,9541
,5111 19',1566
,0295 10,1136
1,1631 15,4425
95% CI for Exp(B)
Lower Upper
1,177413,0768
,0392
,8593
,2908
,9647
df Sig R
1 ,0260 ,1340
1 , 0000 -,3230
1 ,0015 -,2221
1 ,0001
Figura 7 7. Output oferit cu privire la va/orile coeficientilor logit
SPSS este 0 Tnregistrata.
in cazul celorlalii doi predictori care sunt variabile dummy, testul Wald,
nu este cel mai potrivit de a fi aplicat in asemenea cazuri, indica, de asemenea,
coeficienti logit semnificativi statistic. Acest lucru este confirmat daca se
262
calculeaza, pe rand, cate un X2 al pasului pentru modele care exclud succesiv
aceste variabile dummy.
. de a explica cele doua modalitati de interpretare, prin fa ctori,
respectlv pnn procente, se cuvine sa precizam cum au fost codate toate aceste
variabile pentru a facilita intelegerea acestui demers. Astfel, varsta a fost exprimata
Tn ani, iar VD a avut doar doua coduri asociate: 1 - nou-nascuti'
o - cu malformatii genetice (vezi, de asemenea, figura 7.8).
In utilizarea SPSS-ului trebuie sa se diferentieie variabileie categoriale de
cele continue (Garson, 2000). Pentru aceasta adivam opiiunea "Categorical" Tn
cadrul ferestrei legate de regresia logistica. Se va deschide 0 noua fereastra ce
contine 0 lista de "Covariates" cu toate VI inc/use. Vom selecta din lista doar
predictorii care trebuie transformati Tn variabile dummy, adica doar variabilele
masurate prin scale nominale, Ti yom muta Tn lista denumita "Categorical
Covariates". OPtiunea standard a SPSS-ului este de a transform a ultima categorie
de raspuns codata ("last") Tn valoare de referinta. Prin acest procedeu, SPSS-ul
permite crearea automata a variabilelor dummy. Modul de codare a variabilelor
dummy din exemplu apare in output-ul SPSS-ului (figura 7.8).
.; De exemplu, din totalul de 125 de mame chestionate, 42 au consumat
alcool regulat pe parcursul sarcinii, iar 83 s-au abtinut de la acest lucru. Datele au
fost introduse Tn calculator cu urmatoarele coduri: 1 - daca mama nu a consumat
alcool in timpul sarcinii; 2 - daca mama a consumat alcool in' timpul sarcinii. Prin
atentionarea SPSS-ului ca predidorul respectiv necesita transformarea in variabila
dummy, 1 a devenit codul pentru mamele care nu consuma alcool, iar 0 - codul
pentru mamele care au consumat alcool regulat Tn acea perioada,
parameter
Value Freq Coding
(1)
FACTORI GENETICI
Malforma1;ii in familie 1 62 1,000
Lipsa de malformatii 2 63 ,000
ALCOOL
nu bea in timpul sarcinii 42 1,000
bea in timpul sarqinii 2 83 ,000
Figura 7.8. Output SPSS 11.0 cu privire la modul de transformare a
variabilelor nominale In variabile dummy
SPSS este 0 marca inregistrata.
(a) Interpretarea prin factori implica valorile exponentului coeficientului logit
obtinut - exp(b) (vezi figura 7.7). De exemplu, Tn cazul variabilei consum de alcool,
b a fost 1,36, iar factorul rezultat, exp(b) a fost 3,92. Pe baza acestor rezultate
putem afirma ca persoanele care nu au consumat alcool au de patru ori (3,92 ori)
mai multe de a copii In comparatie cu 0 persoana care a
263
(lOnSUmat alcoa I Tn timpul sarcinii, Tn conditiile Tn care vom pastra constante valorile
colorlults VI implicate Tn model.
Pentru variabila varsta avem exp (-0,09) = 0,9139. Fiecare an de viata Tn
plus modifica eu un factor de 0,91 de a un copil sanatos. Valorile
subunitare ale factorului Tnseamna de fapt 0 relatie inversa Tntre cele doua
elamente (ex. mai multi ani, mai pulfne de a un copil sanatos).
Formula generala utilizata In interpretarea prin factori afirma ca avem 0
(valori supraunitare) sau 0 (valori subunitare) de exp(b) ori Tn
ceea ce ca VD sa fie 1 candVI respectiva cu 0 unitate, iar
ceilalti predictori sunt mentinuti la valori constante:
Pentru VI continue putem interpreta valorile b pentru situatii cand VI
mai mult de 0 unitate. Vom exemplifica eum se modifica de a
un copil sanatos la interval de 10 ani diferenta. Formula de calcul devine: exp
(b*10) = exp (-0,09*10) = 0,4067. Astfel, 0 femeie de 30 de ani are 0,4067
(mai putin de jumatate) de a un copil sanatos Tn comparatie cu 0 alta de 20
de ani. Aceasta interpretare este valabila daca ceilalti predictori iau valori similare,
de exemplu, fie ambele femei comparate nu au consumat alcool Tn perioda sarcinii,
fie au fost comparate doua femei care au consumat alcool Tn perioada sarcinij.
(b) Cea de-a doua posibilitate de interpretare este cea prin procente, caz
Tn care se utilizeaza formula:
lOo(i -1)
(7.12)
Pentru variabila "consum de alcool" vom obtine 100 (3,925-1), adica
292,5%. 0 valoare negativa indica 0 Tn ca VD sa fie 1 atunci
cand VI cu 0 unitate, Tn timp ce 0 valoare pozitiva indica 0 a lor.
Astfel, abstinenta' de la consumul de alcool In perioada sarcinii cre!?te eu
292,5% de a na!?te uf! copil sanatos eomparativ cu 0 alta persoana ee a
consumat alcool Tn acea perioada, pastrtmd toate celelalte variabile constante.
Pentru variabila varsta, yom obtine 100 (0,91-1), adica -8,95%. Aceasta
Tnseamna ca fiecare an de viata Tn plus determina 0 cu 8,95% a
de a da na!?tere unui copil sanatos, pastrand toate celelalte variabile
constante.
7.3.5. StabiIirea unor profile ideale
Pe baza ecuatiei logistice putem stabili profile pentru diverse valori ale VI.
Avantajul acestora eonsta Tn posibilltatea de a manipula mai multe VI, Tn
timp, pentru a observa modificarile Tn evolutia VD (Freese, 2000). Reamintim ca
ecuatia de regresie pentru exemplul nostru este:
In Handicap = 4,57 + 1 ,36*Alcool- 2,23*Factori genetici - 0,09*Varsta la natere
264
"III Illi !IIIIIIIII,IIIII:IIII 1111"11 11'11' III!I! lI'i'l III!'III'III! 1111'111'1111'111'1111 III! 1111 '111'1111 'lili III: 1111 '111' 1111 'lII,illl 11111111 11111111 1111 , II "'IIIIII'illllll':II'!II 1"111 II'I!' II ill' 1111 !III'IIII'III,IIII '1111 1111'_'111' 1111 I 111'1111 1111 1111"111'1111 lIIi '1111 1111 1111'111111111111'111111,11111'111111,11111,1111 1111,1111 III
Vom com para doua persoane diferite din perspectiva probabilitatii ca VD
sa fie 1 (nou-nascut sanatos):
a) 0 mama de 20 de ani, care nu a consumat aleool Tn perioada sarcinii care nu
are Tntre rudele de gradul I II anteeedente de eopii eu handicap;
b) 0 mama de 40 de ani, care a consumat aleoolTn timpul sarcinii car'e are Tn
familie persoane cu malformatii eongenitale.
VD (a) = exp (4,57 - 0,09*20 + 1,36*1 - 2,23*0) = 4,13 (a)
VD (b) = exp (4,57 - 0,09*40 + 1,36*0 - 2,23*1) = - 1,26 (b)
Aeestea sunt apoi transformate Tn probabilitati pe baza formulei 7.4. Vom
obtine 0 probabilitate de 0,9837 pentru cazul a una de 0,2205 pentru eazul b. 0
probabilitate. de 0,50 Tnseamna egale pentru ambele categorii VD.
Observam ea primul subiect este mai probabil sa nasea un copil sanatos, iar al
doilea, unul cu malformatii genetice.
Pe bazaprobabilitatii ca VD sa fie 1 putem calcula probabilitatea ca VD
sa fie (q = i-p). Astfel, probabilitatea de a copil eu malformatii genetiee
este de 0,0163 Tn cazul primei marne i de 0,7795, Tn cel de-al doilea eaz. Tn ee
observam ca de a nate un eopil sanatos este Tn primul
eaz de 60,35 ori mai mare (.9837/.0163) Tn eomparatie cu unui copil cu
malformatii genetice. Tn sehimb, exista de 3,54 ori maiputine de a un
copil sanatos pentru cel de-al doilea eaz (.2205 / .7795 = 0,282). De asemenea,
putem compara direct rezultatele celor doua persoane. Astfel, raportul de anse
arata ea prima persoana are 213,40 ori mai multe de a un copil
sanatos Tn eomparatie cu cea de-a dpua persoana [(.98371.0163) / (.22051,7795)].
7.3.6. Analiza cazurilor infiuente asupra modelului
SPSS of era, prin activarea butonului "Save" din regresia logistica,
posibilitatea de a caleula indieatori ce descriu sau analizeaza fieeare eaz Tn parte,
asemenea situatiei amintite Tn eazul regresiei liniare.
De exemplu, prin bifarea "Predicted Values" putem stabili probabilitatea VD
de a fi 1 pentru fieeare obserVatie sau putem determina grupul Tn care a fost inc\us
, .
eazul respectiv (Hair et aI., 1998).
Prin optiunea "Influence" avemposibilitatea de a masura influenta fiecarui
caz asupra modelului. Tn tabelul 7.3. vor fi principalii indicatoriutilizafj in
detectarea eazurilor influente.
Cu ajutorul acestor indieatori putem studia cazurile care nu se Tncadreaza
bine Tn modelul explicativ propus. Cu alte euvinte, putem identifica atat cazurile
cat cele care au eontribuit cel mai mult la obtinerea valorilor logit din
ecuatia de regresie. Aceste informatii ne ajuta Tn formarea uneiimpresii generale
despre stabilitatea solutiei gasite, adica despre gradul de specificitate al solutiei la
lotul de subiecti testat. Acesta are implicatii deosebite, mai ales Tn regresia eu scop
265
11111 IIIlIIilllll ,lIlIIilllll 11111,,11111 11111,:11111 1I1II::UIILlIIII:illIIIJIIIJIIILIIIIIUIIIII 11111 ,1111 LlIIIIIIII!: 11111 !IIII: 11111 !1111,,11111 11111,.11111 11111, 11111 111111111111 11111 ,11111 11111,Illli 11111 illllllllllllllllllll ___ III 111:1111,111'1111 'III' !II! 1111111 II, ", :i, 'I, :1 II il ill 1111 III, % III illi III, illl ,II: Illi :111 III, :111111: 1111 III, Illi :1111111 'III :lli :11111111111' :1111 1111 1IIIi 1111111111111'11' ' :1 1111111,11111111' ,11111111 1111 III! :111 1111 III III 'III III! 1111111, :111 Iii ,II, Iii, ,II, ,!Ii :11, II 1 ' ,
predictiv. Ele sunt legate de posibilitatea de a generaliza rezultatele pe alte loturi
de subiecti. Ca regula generala, cu cat exista mai multe cazuri neobi!?!luite sau
influente, cu atat sunt mai . mici !?ansele de generalizare a rezultatelor [a nivelu[
populatiei din care a fost extras lotul testat.
Tabelul 7.3. Principalii indicatori de detectare a cazurilor influente
Denumire -SPSS Descriere
Valori critice
Cook's Distance Evalueaza Tn ce masura eliminarea cazului > 4 / (l1-k-1)
respectiv schimba probabilitatile ca VD sa fie 1
pentru celelalte observatii.
DfBeta Masoara modificarile coeficientului logit pentru Depairea
fiecare VI Tn parte, Tn situatia excluderii cazului intervalului 2
respectiv. Aceste valori se standardizeaza apoi.
"lElVerage value" Evalueaza masura Tn care un caz influenteaza > 3k1n
abate rea modelului i implicit testul
unde n este volumul eantionului, iar k numarul de VI.
7.4. Exemplu de regresie logistica binara - cazul infidelitatii
Tn scrierea sectiunii de analiza a datelor in articolele care utilizeaza
regresia logistica trebuie prezentate urmatoarele informaiii:
266
precizarea intr-un paragraf a variabilelor implicate in regresia logistica, atat
a predictorilor (VI), cat i a criteriului (VD), precum !?i a justificarii pentru
alegerea acestei tehnici, pornind de la ipoteza sau obiectivul studiului;
precizarea intr-un alt paragraf a datelor generale eu privire la efieienta
modelului testat, a puterii sale explicative !?i a eventualelor eomparaiii cu
alte modele alternative;
prezentarea unui tabel sumar al valorilor coeficientilor logit i a
exponentilor acestora, precum i a indicatorilor utilizati pentru testa rea
gradului de semnificatie a acestora;
in cazul regresiilor in scop predictiv se poate prezenta i tabelul eu W al
propor1;iilor, pentru a afia gradur de eoreetitudine a clasifidkii subieetilor
pe baza eeuatiei de regresie observate;
in ca2ul regresiilor cu scop explicativ, ar fi util de treeut in tabelul cu
eoeficientii log it, valorile R sal,l eoefieientii logit standardizaii, pentru a
vedea eontributia fieearei variabile la explicarea variabilei independente; de
asemenea, in cazul utilizarii metodei ierarhice se va treee X2 al pasului,
pentru fiecare treapta adaugata;
interpretarea eoefieientilor logit obtinuti folosind, fie varianta faetorilor, fie
pe cea a procentelor din .analiza raportului anselor - exp(b).

.\
!
I
t
I
I
\
\
I
I
I
Pentru exemplifieare, yom prezenta sectiunea de analiza a datelor intr-o
eereetare ipotetica, cu un scop predietiv, aeela de a gasi un set de variabile care sa
prezica cel mai bine probabilitatea unei persoane de a fi fidela, respectiv de a fi
infidela in plan sexual, fata de partenerul sau partenera sa. Tn cercetarile
anterioare au fost identificaii cativa factori care par a influenta acest comportament.
Ei pot fi impar1;iti in factori personali (sexul persoanei, varsta, nivelul de educatie
venitul realizat, tipul de religie adoptata,starea civile., statutul social), factor;
(distanta fizica dintre parteneri, numarul de parteneri de sex opus
ellglblll la locul de m!lnca, varsta la care a avut loc casatoria (prima casatorie) sau
factori psihologici (gradul de satisfaciie maritala in euplu, gradul de implicare in
relatie, nevoia de senzapi tari, stilul de ataament etc.) (Atkins, Baucom i
Jacobson, 2001; Bogaert r;;i Sadava, 2002; Drigotas i Barta, 2001; Drigotas,
Safstrom i Gentilia, 1"999; Za1< i colab., 2002).
Dintre acetia, am decis sa gasim nir;;te predictori care sa estimeze cat mai
corect persoanele care vor da dovada de fidelitate Tn plan sexual, pe un lot ipotetic
de 200 de studenti necasatoriii, avand varsta cuprinsa Tntre 18 !?i 30 de ani.
Sectiunea de analiza a date lor ar putea Iu-a urmatoarea forma:
Pentru a gasi un model predictiv care sa estimeze cat mai coreet fidelitatea
sau infidelitatea Tn plan sexual, am utilizat ca predictori un numar de opt variabile:
varsta; sexul persoanei; comportamentul religios (frecventa la biserica; pastrarea
ritualurilor in post etc.), atitudinea fata de re!atii, stilul de ataament cu cele trei
scale (sigur; ambivalent-anxios; evitant) i nevoia de senzatii tari.
Utilizand metoda simultana, modelul testat are un' G2(8) = 42.15, P < .01,
valoare semnificativa satistic, iar R2 Nagelkerke a fast .56. De altfel, cinci predictori
din opt exercita 0 influenta semnificativa statistic asupra probabilitatii ca studentii
sa fie fideli, respectiv infideli. Tinand cont de faptul ca scopul acestei cercetari este
exclusiv predictiv, precum. i de faptul ca modelul predictiv redus, ce include doar
. cele cinci variabile semnificative statistic, are aproape aceeai putere explicativa,
R2 Nagelkerke fiind .53, iar /j. G2(3) = 3.00, P > .05, vom interpreta acest model
restrans, in care G2(5) = 39.15, P < .01: Cei trei predictori eliminati sunt seorurile
subiectilor la stilulde ataament sigur !?i la eel deevitare, varsta,
deoarece coeficientii log it asociati acestora nu au fost semnificativi statistic.
Tabel cu clasificarea subiectilor Tn functie de valorile observgte !?i de cele estimate
Rezultate Studenti infideli
observate Studenti fideli
Rezultate estimate
Studenti infideli Studenti fideli
31 2
20 147
Acest model cu einci predictori. reuete sa estirfleze corect 89% din
cazuri, un procent uor superior fiind Yn identificarea cazurilor de infidelitate (94%,
267
1111 11111 1111 11111 11I1I'IIIIUIIIUIiI '1111 IIIhJlI1 1111'1111'1111 II: 'I'
adlel:\ 31 din eele 33 de eazuri), decat Tn identificarea cazurilor de fidelitate (88%,
147 din cele 167 de observatii). .
o asemenea eficienta predietiva este Tmbucuratoare, aproximativ 9 din 10
studenti fiind identificati coreet ca apartinand, fie categoriei celor fideli sexual, fie
celor infideli sexual. Mai mult, doar 2 dintre studentii care au fost iilfideli nu au fost
identifica\i coreet prin ecuatia de regresie rezultata, ceilalti 31 fiind identificati
corect.
Tabelul cu coeficientii logit i raportul anselor pentru fiecare predictor din model
Predictori b S.E. Exp(b) Wald
Sexul persoanei
Comportamentul religios
Atitudinea fata de relatie
Ataament ambivalent-anxios
Nevoia de senzaiii tari'
C6nstanta (Interceptul)
* p < .05, ** P < .01
0,97
- 0,33
0,61
0,22
0,30
0,25
0,33
0,14
0,17
0,10
0,19
0,06
2,64 7,23 **
0,72 4,91 *
1,84 10,25 **
1,25 5,10 *
1,35 6,32 **
12,46 **
Se constata ca persoanele de sex masculin au de 2,64 ori mai multe anse
de a fi infidele fata de partenerele (partenerii) lor, Tn comparatie cu persoanele de
sex feminin, Tn conditiile Tn care pastram constante celelalte variabile. De
asemenea, ansele ca persoanele care adopta un comportament religios (variabila
masurata pe 0 scala cu 10 puncte) sa adopte un comportament infidel scad cu
o 72 daca scorul la comportamentul religios crete cu un punct, Tn aceleai
de pastrare a celorlalte variabile la valori constante. in schimb, ansele
de infidelitate Tn relatie aproape sedubleaza (b = 1,84) cu fiecare punet adaugat la
variabila atitudinea fata de relatie, unde valorile ridicate indica 0 atitudine liberala.
$ansele cresc de 1,25 ori, cu fiecare punct adaugat Tn scala de ataament de tip
ambivalent-anxios. Cu alte cuvinte, un asemenea stil de ataament favorizeaza
aparitia infidelitatii in plan sexual. in sfarit, nevoia de senzatii tari favorizeaza,
asemenea, comportamentul infidel. Cu fiecare punct Tn plus la scorul acestul
predictor, ansele de a fi infidel cresc de 1,35 ori, Tn conditiile mentinerii la valori
constante a celorlaltevariabile.
Prin urmare, profilul persoanelor cu risc ridicat de a se angaja Tn relatii
sexuale Tn afara cuplului, rezultat din lotul de 200 de studenti testati, este acela al
unui barb at, care are un comportament religios redus (nu frecventeaza foarte des
slujbele saptamanale, nu tine post etc.), care are 0 atitudine liberala, deschisa, fata
de cuplu (ex. considera normal sa participe la petreceri i tara partener sau
partenera), care are un stil de ataament de tiP. ambivalent-anxios i 0 nevoie
puternica de senzatii tari.
268
BIBLIOGRAFIE
Agresti, A. (1990). Categorical data analysis. New York: John Wiley & Sons.
Atkins, D_C., Baucom, D.H., Jacobson, N.S. (2001). Understanding 'infidelity: Correlates in a
National Random Sample. Journal of Family Psychology, 15(4),735-749.
Bogaert, A.F, Sadava, S. (2002). Adult attachment and sexual behavior. Personal
Relationships, 9, 191-204 ..
Drigotas, S.M., Safstrom, C.A., Gentilia, T .. (1999) .. An investment model prediction of dating
infidelity. Journal of Personality and Social Psychology, 77(3), 509-524.
Drigotas, S.M., Barta, W. (2001). The cheating heart: Scientific explorations of infidelity.
Current Directionsin Psychological Science, 10(5), 177-180.
Freese, J. (2000). Categorical analysis. Note de curs. ICPSR Summer Program in
Quantitative Methods of Social Research, Ann Arbor.
Hair, J.E.Jr., Anderson, R.E., Tatham, R.L., Black, W.C. (1998). Multivariate data analysis
(fifth edition). New Jersey, Prentice Hall.
Garson (2000). Gasit la 14.IX pe www2.chass.ncsu.edu/garson/pa765/10gistic.htm
Long, Scott (1997). Regression models for categorical and limited dependent variables.
Thousand Oaks, Sage.
Menard, S. (1995). Applied logistic regression analysis. Publications Series: Quantitative
Applications in the Social Sciences, nr.106, Thousand Oaks, Sage.
Wickens,T.D. (1998). Categorical data analysis. Annual Review in Psychology, 48,537-558.
Wright, R.E. (1995). Logistic Regression. Tn L.G. Grimm i P.R. Yarn old (eds.). Reading and
understanding multivariate statistics (p. 217-244). Washington, DC: American
Psychological Association.
Zak, A., Coulter, C., Giglio, S., Hall, J., Sanford, S., Pellowski, N. (2002). Do his friends and
family like me? Predictors of infidelity in intimate relationships. North American Journal of
Psychology, 4(2), 287-290.
269
, 'I
!
j
!
\
CAPITOLUL 8
SCALAREA MUL TIDIMENSIONALA

Se pare ca Torgerson a fost primul care a propus termenul de scalare
multidimensionala (Notelaers, 2002). Acest termen a fost adoptat mai ales de
cercetarile din domeniul psihofizicii, Tn timp ce Tn domeniul psihometriei s-a utilizat
mult timp termenul de "analiza spatiului celui mai mic" (Tn engleza "smallest space
analysis"). Chiar daca au existat unele distinctii Tntre aceti termeni, Tn special. la
nivelul algoritmilor de calcul, principiul este acelai. Prin urmare, yom utiliza, pentru
ambele situatii, termenul generic de scalare multidimensionala.
Tn cadrul scalarii multidimensionale se regasesc un grup de tehnici menite
sa identifice gradul de proximitate perceptiva Tntre diferite aspecte studiate.
Principiul dupa care aceste tehnici este simplu: exista 0 anumita
distanta psihologica Tntre obiecte, iar aceasta distanta poate fi reprezentata grafic
sub forma unei harti perceptive. Astfel, gradul de similaritate / disimilaritate Tntre
obiecte (ex. concepte, trasaturi comportamentale, imagini, afecte) este transpus
grafic sub forma unei distante Tntre puncte, acestea nefiind altceva decat proiectii
ale obiectelor Tn plan sau Tn spatiu. Cu cat doua obiecte sunt percepute mai diferit,
cu atat dintre punctele reprezentate grafic va fi mai mare. Tn schimb, daca
doua obiecte vor fi .percepute ca fiind asemanatoare, distanta dintre punctele
corespunzatoare va fi mai mica. Prin acest demers, MDS (multigimensional
se constituie ca 0 tehnica multivariata, exploratorie, ce po ate fi utilizata
pentru a vizualiza proximitatile dintre obiecte Tntr-un spatiu redus dimensional.
Dimensiunile (axele) acestui spatiu vor constitui criteriile (variabilele) latente care
stau la baza stabilirii proximitatii dintre obiecte. Din acest punct de vedere,
scalarea multidimensionala se apropie de analiza factoriala.
Analiza factoriala presupune reducerea unui numar mai mare de variabile
la cateva variabile latente, denumite factori: Tn acelai mod, Tn MDS se Tncearca
reprezentarea grafica Tn cat mai putine dimensiuni (axe) a unuinumar mai mare de
puncte (obiecte). Ambele metode permit realizarea; unor rotiri ortogonale. Exista,
Tnsa, diferente importante Tntre cele doua tehnici. Daca analiza factoriala,
exceptand tehnica Q, necesita un numar relativ mare de raspunsuri (subiecti) i un
numar relativ mic de variabile ce trebuie factorizate, scalarea multidimensionala
necesita, mai degraba, un numar mare de puncte (variabile) i poate fi
desfaurata, Tn anumite cazuri, chiar pe un singur subiect.
271
8.1. Modele de sealare multidimensionala
Din punct de vedere m<ematic, problema principala in MDS se reduce la
unei de transformare a graduluide similaritate / disimilaritate
perceptiva dintre obiecte in distante intre puncte reprezentate grafic. In acest scop
a fast creata a serie de algoritmi de calcul, a caror selectie este dependenta de
cativa factori:
a) tipul de date prin care au fast evaluate proximitatile psihologice dintre
obiecte;
b) sursa provenientei datelor: un singur grup, mai multe grupe, a singura
persoana;
c) tipul de relatii intre obiectele' avute in vedere.
Tn functie de aceste aspecte, exista mai multe categorii de modele MDS
(van Deun 9i Delbeke, 2000):
a) modele MDS metriee VS. non-metriee
Conform primului criteriu, cel al tipului de date analizate, proximitatile
obtinute prin scale de tip interval sau raport (propoi\ii) necesita tehnici metrice,' in
timp ce datele obtinute prin scale de tip ordinal sau nominal fac apel la tehnici non-
metrice. De9i primul gen de tehnici a fast inventat mai intai, cele non-metrice sunt
mult mai des fntalnite fn literatura de specialitate (Stalans, 1998). Cel mai fntalnit
tip de date utilizate in MDS sunt cele ordinale (ex. ierarhizari, scale Likert). De
pilda, pentru a campara gradul de proximitate dintre doua directii ale psihologiei:
psihologia cognitiva 9i behaviorism, se poate utiliza a scala de comparatie cu 9apte
trepte, unde "1" ar insemna "foarte asemanatoare", iar "7", "foarte diferite".
b) modele MDS sintetiee vs. analitiee
Primele (in engleza "unweighted models") pornesc de la premisa ca toti
subiectii atribuie aceea9i importanta 9i utilizeaza acelea9i criterii de evaluare.
mult, obiectivul unui studiu, utilizand asemenea modele, este de a observa cum i9i
reprezinta toti subiectii dintr-un e9antion relatiile de proximitate psihologica dintre
obiecte. Pentru, 'a lucra cu asemenea date se obi9nuie9te sa se calculeze media
raspunsurilor provenite de la toti subiectii din e9antion pentru fiecare comparatie
facuta. Modelele analitice 5e impart in doua categorii: modele replicative (in
engleza "replicative models") 9i modele diferentiale (In engleza "weighted models").
Cele dintai se refera la situatii in care se realizeaza comparatii repetate la intervale
diferite de timp, pe acela9i lot de subiecti sau pe un singur subiect. Cele din urma
satisfac situatiile in care exista a singura testare, dar fn care suntem interesati de
. diferentele interindividuale sau intergrupale existente in cadrul unui e9antion.' Din
aceasta ultima perspectiva, eel mai probabil, yom constata diferente intre
psihologia cognitiva 9i behaviorism, daca yom intreba speciali9ti in
psihologiei transpersonale sau profesioni9ti Tn domeniul inteligentei artificiale.
e) modele de similaritate vs. modele unfolding (extinse)
Proximitatea, conform teoriei lui Coombs, poate contine atat relatii de
similaritate (gradul de apropiere intre doua orage), cat 9i 'relatii de
272
,II !I'ill II: :Ii I' 'I' r " Ii ,I' I
'I! II'" III' III' 111'illllll'III'111 II !! II,'II","II'!'II"""""
preferentiala (prefer ora9ul A lui B). Primul tip de date face referire la modele
clasice de scalare. multidimensionala, Tn timp ce alegerile preferentiale incumba
modele unfolding. TotU9i, I acestea din urma pot fi transformate date de tip
similaritate9i supuse modelelor de tip MDS (Rotariu 9i colab., 1999). '
Dincolo de aceste diferentieri, importante din perspeetiva teoretica, exista
diferente 9i in utilizarea unor algoritmi de calcul. Aceasta se datoreaza, in mare
parte, lipsei de unitate conceptuala in evolutia MDS 9i se regase9te in modalitatile
diferite de transformare a proximitatii' psihologice in distante intre punete
reprezentate grafic, dar 9i in diversitate? de programe statistice existente. Vom
amintipe scurt cativa dintre algoritmL Cititorul trebuie sa retina ca alegerea coreeta
a programul statistic tine de tipul de algoritmi de care acesta dispune. Fiecarui
design MDS Ii poate corespunde rularea unuia sau a mai multor algoritmi. Daca nu
este selectat algoritmul MDS adecvat design-ului cercetarii, se vor obtine rezultate
eronate.
Pornind de la aceste precizari, au fast dezvoltate mai multe proceduri de
scalare multidimensionala precum: KYST; MINISSA; MDPREF; TRISOSCAL;
MUL TISCALE; INPSCAL; ALSCAL; PR0?<SCAL. 'Aceste proceduri sunt cup rinse
Tntr-unul sau in mai multe programe statistice cum ar fi:
MDS(X) Library of Computers programs (Coxon, 19.82) este un prograrn
care contine majoritatea procedurilor amintite mai sus, alaturi de alte
cateva 9i poate fi descarcat de pe internet gratuit, cu licenta pe 0 perioada
de 60 de zi/e. Adresa web este: http://www.newmdsx.com
SPSS-ul contine in meniu trei dintre procedurile amintite mai sus: ALSCAL
9i INDSCAL (in pachetul de baza), respectiv PROXSCAL (in modulul
"SPSS Categories") (Meulman 9i Heiser, 2001). Prime Ie doua proceduri
sunt prezente 9i in versiuni mai vechi ale SPSS-ului. Datorita raspandirii
largi a programuluUn tara noastra, toate exemplele prezentate se vor baza
pe ace9ti. algoritmi ai SPSS-ului. TOtU9i, prin apelul la sintaxa, SPSS-ul
pune la dispozitie 9i alte tipuri de algoritmL
SAS-ul contine, printre altele, 9i procedura MUL TISCALE. Chiar daca
programul SAS nu este prea intalnit in Romania, merita retinut ca aceasta
procedura este revolutionara, fiind bazata pe estimarea rapoartelor de
verosimilitate (In engleza "maximum likelihood estimation"). Acest fapt
permite realizarea unor MDS confirmatorii 9i nu doar exploratorii.
lata a scurta descriere a celor maiimportante proceduri:
KYST (lSruskal, young, .hepard, Iorgerson) este unul din primele
programe menite sa realizeze scalare multidimensionala in situatii MDS metrice 9i
non-metrice de tip sintetic 9.i bazate pe relatii de similaritate. Aceasta procedura
este cuprinsa in programul MDS(X).
MINISSA .mallest .pace
Analysis) este a alta procedura ce poate fi utilizata in condilii similan:! eu cele ale
KYST. Tn versiunea sa metrica este denumit MRSCAL. Ambele versiuni sunt
cuprinse in pachetul MDS(X). Avantajul programului fata de KYST consta in
273
1111111 111111:1111111 111111:1111111 11111 l'IIIIIIIIIIIJIIIII.IIIIIIIIIIIIJllllJIIIILIIIIIIJIIIILlIIIIU1IIII:lIIIILIIIIllJlIIIllJIIIILlIllIUIIIlLlilii 11111 :1111: 11111 !IIII' IIII! 1Il11111I.m__ 1111111111,11111,1111111111111,11111111111111111 iIIlll 11111 IIIII!'IIIII 11111:'11111 1IIIIi'IIIII 11111:111II 1IIIIi111111 iIIlll'lIIlll1111111:111111 1111111I111111 111111 !IIII111111111111111111111111111:11111' 11111111111111111:1111111111111:111111111111111111111111111111111:1111111II1II:!IIIIIIIIIIII:iIIIIIIIIIIIIIlIIIIII,IIIIII,IIIII! 111111 IIIIIILIIIIII 1111111 111111 IIIIII!IIIIII 1111: 111111111' 11111 :11111111
11
11111111: 111111111 III 'II
posibilitatea de a realiza 0 simulare pentru a compara solutia obtinuta (ex. numarul
de dimensiuni obtinute; valoarea stresului) cu cea rezultata Tn .cazul unei distributii
aleatoare a punctetor obtinuta prin studii Monte-Carlo. .
MDPREF CMultigimensional Preference Scaling) este un program adresat _
modelelor MDS metrice, sintetice, bazate Tn pe relatii de tip unfolding, iar
secundar pe relatii de similaritate perceptiva.' Pe langa realizarea unui grafic cu
puncte, este prezentat un vector care- arata directia preferintelor subiectilor
chestiona\i. Vectorul are sageata Tndreptata Tn mediei'
subiectilor. Varianta non-metrica pentru aceasta procedura este PREFMAP care
folose9te cercuri 9i puncte ideale .rentru a sublinia preferintele
Ambele programe sunt incluse Tn pachetul deprograme MDS{X).
TRISOSCAL (Triadic .imilarities Qrdinal Scaling) este un program adresat
cazurilor de MDS non-metrice, sintetice, bazate pe relalii de similaritate.
Particularitatea se refera la modul de realizare a rela\iei de similaritate. Nu se
recurge la metode traditionale de colectare a datelor. Metoda fol08ita este data de
compara\ii Tn triade, fiind Tntalnita mai ales Tn domeniul constructelor personale,
initiate de Kelly Tn 1955 9i dezvoltate apoi de Frarisella 9i Bannister (1977).
Triadele pot fi de doua feluri: partiale (alege\i din trei obiecte, doua care sunt mai
apropiate) sau totale (alege\i din trei obiecte, doua care sunt cele mai
asemanatoare; apo! alege\i din acelea9i trei obiecte, doua care difera cel mai mUlt).
Programul este inclus tot Tn pachetul statistic MDS(X).
MUL TISCALE (Multidimensional Scale) este inclus Tn SAS i, aa cum am
amintit, este singurul procedeu care are un caracter confirmatoriu. Intr-un fel,
MUL TISCALE reprezinta Tn cadrul procedurilor MDS ceea ce analiza factoriala
confirmatorie reprezinta Tn cazul analizei factoriale.
ALSCAL (Alternating beast .quare Scaling) este probabil cea mai
raspandita procedura MDS. Ea poate fi utilizata atat Tn cazuri metrice, cat 9i non-
metrice, atat pentru rela\ii de similaritate, cat i pentru cele de tip unfolding. Totui,
proeedura este specifica datelor sintetice, fiind mai pu\in eficienta Tn compararea
diferen\elor individuale (situa\ii analitice). Programul este cuprins Tn numeroase
pachete statistice precum SPSS Base System, SAS sau ViSta.
INDSCAL (Individual Qifferences Scaling) este 0 procedura aparte, fiind
destinata nivelului analitic diferen\ial diferen\ele individuals sau grupale).
Procedura esteinclusa Tn programe statistice cum ar fi SPSS Base System, SAS,
sau MDS(X) 9i este compatibila atat pentru date, metriee, cati non-metrice.
Algoritmul poate fi utilizat pentru a reprezenta rela\iile de similaritate dintre obiecte.
PROXSCAL (Proximity Scaling) esteo procedura recent introdusa Tn
pachetul adi\ional SPSS Categories, cS! promite foarte mult. In mare, metoda
contine doua avantaje: po ate fi aplieata pentru orice tip de date (metrice sau non-
metrice), aflate Tn rela\ii de similaritate sau preferen\iale, vizand atat aspecte
analitiee (diferentiale, de replicare), cat i sintetice. Procedura include astfel
avantajele ALSCAL, INDSCAL 9i IDEOSCAL i, Tn plus, algoritmul de calcul utilizat
permite 0 mai buna aproximare grafica a punctelor pe baza distantelor dintre
274
t
I
I
j
I
,
,-
obiecte. Principala limita a algoritmului ramane imposibilitatea analizarii datelor
aflate Tn relaiii unfolding la nivel analitie. Altfel spus, nu putem surprinde diferentele
-individuale sau de grup tn ceea ce prive9te preferin\ele pentru anumite
decat prin apelul la artificii tehnice. 0 asemenea cale este introducerea unui punct
ideal i com para rea aeestuia eu fiecare dintre obiectele incluse Tn analiza pentru a
afla gradul de similaritate sau de diferen\a a acestora fa\a de punctul ideal.
8.2. Design-ul cercetarii in scalarea multidimensionala
Un design tipic implica rezolvarea a trei punete fundamentale:
1. seleetarea obiectelor analizate i a numarului aeestora;
2. metodele de colectare a datelor;
3. managementul datelcir Tn utilizarea programelor statistice (ex. SPSS-ul).
Inainte de analiza fiecarui punct Tn parte, trebuie sa amintim ca un design
tipic include, alaturi de datele privind gradul de similaritate / disimilaritate dintre
obiecte, evaluarea acestora pe baza unor atribute externe (eu scopul de a uura
identificarea dimensiunilor latente), unele date demografice (cu scopul de a
surprinde caracteristicile subiec\ilor chestiona\i) i, eventual, informa\ii des pre
trasaturile fiziee ale obiectelor. Pentru a Tn\elege practic acest subeapitol, yom
apela la un exemplu construit pornind de la structura cercetarii Tntreprinse de
Rhoades i Arnold (1999). Fi
9
ierul aferent exempluluieste "scalare similar.sav", iar
calea de urmat Tn SPSS este "Analyze" - "Scale" - "Multidimensional scaling
(PROXSCAL)". Daca nu dispune\i de modul SPSS Categories ve\i utiliza calea
"Analyze" - "Scale" - "Multidimensional scaling", dupa ce Tn prealabil ati copiat
datele fiecarui grup "experti" vs. "novici", Tn doua fiiere separate, deoarece
modulul de baza al SPSS-ului nu permite compararea grupelor, daca datele au fost
introduse direct sub forma unei matrice de similaritate.
Context: in cercetarile pe tema managementului conflictului au fost descrise 9i
clasificate 0 serie de comportamente 9i modalita\i de reac\ie In situa\ii conflictuale. Acestea -
se refera la stilul personal al fiecaruia de a raspunde, pornind de la reac\ii de tip nevrotic,
pana la strategii de acaparare a puterii. Concepte precum evitarea, compromisul,
renun\area, confruntarea, medierea, cooperarea,utilizarea forjei fizice etc., sunt de
notorietate In aceasta problema. Aceste categorii au fost grupate dupa nenumarate criterii
taxonomice precum: orientarea spre sarcina vs. orientarea spre rela\ii umane; active vs.
pasive; unilaterale vs. bilaterale; constructive vs. distructive; individuale vs. de grup etc.
Pornind de la aceste considerente, vom selecta ca obiecte supuse MDS urmatoarele zece
reactii 9i masuri In situatH de conflict: evitarea; compromisul; confruntarea; renuntarea;
cooperarea; subminarea; manipularea; amanarea; arbitrajul 9i medierea.
Pe baza acestora yom Tncerca sa raspundem la urmatoarele Tntrebari:
275
1) care dintre criteriile taxonomice amintite mai sus au 0 relevanta mai mare?
In termeni tehnici, care dintre criterii contribuie mai mult la stabilirea
distantei psihologice dintre cei zece stimuli in studiu?
2) care este, din perspectiva testat, ierarhia preferintelor de a
reactiona in situatii de conflict?
3) daca impai\im in doua grupe: cu fara experienta in
solutionarea conflictelor, exista diferente in ce modul de percepere
a celor zece reactii incluse in studiu?
8.2.1. Selectarea obiectelor i a numarului acestora
De cele mai multe ori nu putem include intreaga populatie de stimuli dintr-o
anumita categorie. NUmai in exemplul precedent pot fi trecute Tn revista mai mult
de 0 suta de reactii la conflict, pornind de la cele de tip nevrotic (ex. inhibitie,
frustrare), pana la masuri cu caracter global (greva, ri3zboi, embargo etc.). Tn
selectarea stimulilor care vor face obiectul scalarii multidimensionafe este
important sa retinem trei aspecte, pe care Ie yom prezenta pe rand.
a) Stimulii alei sa fie cat mai reprezentativi pentru categoria aleasa. Astfel,
Tn studiile de marketing nu sunt toti stimulii, oricat de minori ar fi ei, ci se
sa se aleaga stimulii cu 6 cota de piata crescuta, cu 0 diversitate cat
mai mare Tn ce atributele pe care Ie detin. Tn exemplul nostru, se
observa ca stimulii sunt reprezentativi doar daca facem referire 18 nivelul
conflictelor interpersonale (Bogathy, 2002). Daca yom tine seama de conflictele
intrapsihice, intragrupale, intergrupale sau interstatale, yom observa ca lipsesc
multe dintre reactiile tipice, posibile Tn astfel de situatii conflictuale.
b) ,Stabilitatea unei solutii este dependenta de raportul dintre numarul de
stimuli inclui i numarul de dimensiuni selectate de solutia optima. Astfel, daca
anticipam un numar mai mare de dimensiuni (ex. criterii de evaluare a unor
produse), ar fi bine sa includem un numar cat mai mare de stimuli. Au fost
elaborate 0 serie de recomandari in acest sens. Jones Koehly (1993) enumera
doua asemenea reguli. Prima sustine ca trebuie sa avem intre 4 6 stimuli pentru
fiecare dimensiune inclusa Tn solutii. Gea de-a doua, mai generala, sugereaza ca
numarul de dimensiuni extrase sa nu valoarea (n-1 )/4, unde n
reprezinta numarul de stimuli (obiecte). Tn cazul nostru, avand zece stimuli, ambele
reguli indica 0 solutie stabila reprezentata Tn plan (doua dimensiuni). 0 solutie in 3
dimensiuni pare a fi maiinstabila, insa nu imposibila. Aceasta regula nu are
caracter obligatoriu, ci doar de recomandare, prin urmare, ea nu trebuie aplicata
automat. Alegerea numarului de dime,nsiuni este dependenta Tn principal de
indicatorii statistici obtinuti de gradul de interpretabilitate a dimensiunilor. Mai
mult, Tn situatii cu un numar mare de obiecte, de exemplu 30, conform acestor
reguli ar putea fi selectate optim pana la dimensiuni. Aceasta ar com plica
interpretarea rezultatelor, fapt ce a determinat 0 tendinta puternica de a selecta,
276
i ,II III III! 11111 11111 'i III' 111,'111 1 II'I!I!' I! 1I"li !I',II !II"II:II! 111:11' 1 "I !I "! " 11111 IIIP 11111 11111 1111111111 'lI'II'IIIII,'i 'I ill ,II 111111,111'11"111111,,,11111111'11"'"'111'1111'111"1111 11111111
cel mai frecvent, doua sau trei dimensiu'ni. Alegerea numarului de dimensiuni va fi
aprofundata Intr-un subcapitol ce va urma.
c) Un alt aspect, (:Ie care trebuie sa Se 1ina seama In selectarea numarului
de stimuli consta In particularitatea MDS de a considera numarul de stimuli
ca echivalent al numarului de subiecV Prin urmare, In utilizarea scalarii
multidimensionale pentru a identifica dimensiunile latente, N (volumul
este dat de numarul de stimuli i nu denumarul de subiecti. De aceea, se prefera
un N care sa contina de la 8-9 stimuli in sus, cifra opt fiindminimul"necesar pentru
o solutie bidimensionala.
Valoarea MDS optima cuprinde 20 - SO de stimuli. Numarul de stimuli alei
este dependent i de metoda utilizata pentrucolectarea datelor, unele fiind
nepotrivite pentru un numar mare de stimuli.
8.2.2. Metode de colectare a datelor
De la aparitia tehnicilor MDS au fost dezvoltate 0 multitudine de metode de
colectare a datelor, dintre care yom prezenta pe larg trei:
compararea fiecarei perechi de stimuli;
sortarea;
ierarhizarea.
8.2.2.1. Compararea fiecarei perechi de stimuli
Este cel mai frecvent Tntalnita in MOS. Ea presupune compararea
a cate doi stimul.i. Numarul de comparatii crete foarte mult atunci cand numarul de
stimuli se de aceea modafitatea este mai putin potrivita pentru a fi
utilizata la un numar de stimuli N>20. Numarul de comparatii ce trebuie efectuate
poate fi aflat cu ajutorul formulei [n(n-1)/2]. Astfel, pentru cei 10 stimuli din
exemplul reactiilor la situatii de conflict, vor fi necesare 45 de comparatii Intre
stimuli perechi (ex. 1 cu 2; 1 tu 3; 1 cu 4; ... ; 9 cu 10). Daca numarul de stimuli ar fi
fost 12, utilizarea metode ar fi necesitat 66 de comparatii.
Din punctul de vedere al scale lor de masurare, cea mai Tntalnita modalitate
este cea ordinala, de tip Likert, cu 5, 7 sau 9 diviziuni, in care alegerea unei valori
capat (ex. "1 ") ar Tnsemna 0 foarte mare similaritate intre obiecte, iar alegerea
celuilalt capat (ex. "7") semnifica diferente foarte mari fntre obiecte. lata doua
dintre cele 45 de comparatii efectuate in problema mai sus mentionata:
Arbitraj VS. t,,'l emere
Confruntare vs. Mediere
'q/
3 4 5 6 7
2 3 4
X
6 7
I l' I I I I I I I I 1
foarte foarte foarte forute
similare diferite similare diferite
Figura 8.1. Exemp/e de comparatii perechi
277
, Ii ,II, III: 1111 11111 1111 Jill '1111 !IIII 1IIIIIJlIIIII 1IIIIIJlIIIII 111111 111111: 111111 '1IIIILlIIIII 111111: 111111 :IIIIIUIIIII,IIIII 111111 11111 111111 :11111 111111 ,11111 11111' :11111111111111111 1IIIILlIIIIIIIIIIII 111111 'IIIII! 111111 ,11111 111111 11111' 111111 11111 iIIlll 11111 11111I '11111 111111 :11111 11111, ,11111 11111 'IIII! 11111 1111' 11111 1111, !IIIIII 111111 111111, 111111 :1111111111 1111: :1111 1111' 111111 illill 111111111111 '11111' IIIIII'IIIII! 111111111111 IIIII! 111111 1IIIIi !IIII' Illi 1111 1111 'III
Conform acestor date, medierea, ca modalitate de f<3spUnS la conflict, este
vazuta ca fiind mai asemanatoare arbitrajului. In schimb, intre mediere
confruntare exista 0 distanta psihologica mai mare. Pentru a obtine erori cat mai
mici, inainte de a se trece la compararea efectiva a stimulilor se Sa fie
prezentata intreaga Iista de stimuli, pentru a da posibilitatea respondentilor
formeze 0 impresie generala asupra gradului de proximitate dintre Un
program software dezvoltat special pentru acest lucru exista limba romana.
Denumit generic MultiScal, el a fost dezvoltat de firma SOFT Age S.R.L. printr-o
finantare dintr-un grant CNCSIS. Cei interesati sa intre Tn posesia acestui program
pot cere mai multe informatii la adresa de e-mail prezentata in seciiunea
introductiva.
8.2.2.2. Sortarea stimuli/or
Sortarea stimulilor constituie 0 alternativa de colectare. a datelor ce permite
subiectilor sa grupeze stimulii Tn cateva categorii, bazandu-se pe gradul de
disimilaritate intre date. Sortarea poate fi de mai multe feluri: singulara (subiectul
alege 0 singura data) sau multipla (grupeaza obiectele de mai multe ori, dupa
criterii diferite); restrictiva (un stimul poate fi inclus Tntr-o singura categorie) sau
nerestrictiva (un stimul poate fi prezent simultan in mai multe categorii); fixa
(stimulii sunt grupati intr-un numar prestabilit de categorii) sau libera (pot fi formate
grupe de stimuli).
Avantajul acestei metode consta in de a colecta rezultatele Tn
cazul unui numar foarte mare de stimuli, astfel dezavantajul metodei
comparaiiei fiecarei perechi. Dezavaritajul primar este dat insa de validitatea mai
redusa a solutiilor obtinute pentru 'situatiile cu mai mult de trei dimensiuni. Mai mult,
utilizarea unoi" proceduri de diferentiere interindividuala din seria INDSCAL a fost
mult timp neaplicabila in astfel de situatii, iar solutiile oferite de programe precum
ALSCAL nu sunt Tntotdeauna corecte (ex. solutii degenerative) (Carroll Green,
1997).
In cazul propus, datorita numarului redus de stimuli (doar 10), este
preferabil sa nu utilizam aceasta metoda de colectare, din cauza dezavantajelor pe
care Ie prezinta. In schimb, daca am fi avut 40 de stimuli, metoda ar fi fost cu
sigurania adecvata, deoarece apelul la compararea fiecarei perechi de stimuli ar fi
presupus nu mai putin de 780 de evaluari succesive. Cu scop pedagogic, Tn figura
8.2. sunt prezentate gruparile celor 10 stimuli pe categorii obtinute de la doi
subiecti.
, In aceste cazuri se observa ca tipulde sortareutilizat peritru colectarea
datelor este de tip singular (0 singura softare), restrictiv (un stimul nu poate fi
simultan Tn mai multe categorii), liber (pot fi construite oricate categorii pot fi
alese oricate elemente Tntr-o categorie). .
Rezultatele obtinute se trec intr-o matrice, in care atat pe linii. Cat pe
coloane sunt trecuti prezentati. De fiecare data cand doi stimuli sunt sortaii
Tn grup Se un punct'. In matrice, se trece indicele de disimilaritate
278
11'111'111111111111111111111::111111111111111111111,111':11'I 11:1111 1111,'1111 1111"1111 1111'11111 11111 11111 11111!!11111'111111 1IIILillilLillilLililliJllilLilillcllllll-llill '1111'11111 IIIII'IIIIL'IIII 111111111111111111'11111-11111-1111111111111111111'111'1111111'11"111'111'1111111111
dintre do'; stimuli pornind de la formula N-k, un de N reprezinta numarul total de
subiect
i
investigati, iar k este numarul de subiecti care au sortat Tn
categorie stimulii vizati. Astfel, dad) din zece subiecti chestionati, sorteaza Tn
categorie evitarea renuntarea, indicele trecut Tn matrice, la intersectia
dintre cei doi stimuli este patru.
Subiectul1 Evitare Arbitraj Cooperare Subrninare
Renull!are Mediere Confruntare Manipulare
Amanare Compromis
Subiectu12 Cooperare Evitare Subminare
Arbitraj Renllntare Maniplilare
Mediere Amanare
Compromis
Confruntare
Figura 8.2. Exemp/u de co/ectare a date/or prin metoda sorflirii
8.2.2.3. lerarhizarea stimuli/or
lerarhizarea stimulilor presupune ca subiectii sa stabileasca 0 ordine a
preferintelor, acordand pentru fiecare stimul un rang. Spre exemplu, nota 1 revine
stimulului preferat, nota 2 stimulului aflat pe locul secund Tn topul preferintelor,
continuand pana la nota N, acordata ultimului ales dintre stimuli. Aceasta metoda
este specifica modelelor MDS non-metrice, bazate pe relatii de proximitate de tip
unfolding. Ea nu of era, cel putin In SPSS, posibilitatea unor analize diferentiale
pentru a surprinde deosebirile dintre subiecti sau dintre grupe ale Tn
eadrul modelelor sintetice, rezolvabile prin SPSS, obiectele reprezinta variabilele
cercetarii, iar fiecare linie contine rangurile acordate In urma ierarhizarii fikute de
un singur subiect.
Alaturi de aceste modalitati de colectare, intaln;te frecvent, exista altele
precum obtinerea proximitatilor prin triade, compararea incompleta a perechilor,
utilizarea aprecierii binare de tip asemanator vs. diferit etc. Mai multe informatii
sunt disponibile Tn lucrarile lui Coxon (1982), Tsogo, Masson Bardot (2000).
Toate aceste modalitati de prezentare a datelor intra in categoria celor
obtinute direct. Alaturi de acestea, se pot estima proximitati Tntre diferite obiecte pe
baza unor indicatori derivati. Cel mai cunoscut indice derivat de disimilaritate este
obtinut pe baza valorii coeficientului de corelatie dupa formula (1-r2). Se pot obtine
astfel reprezentari grafice care sa ateste prin poZitionare distantare spatiala,
relatiile dintre mai multe concepte (obiecte). Din aceasta perspectiva, MDS se
apropie eel mai mult de modul de functionare al analizei factoriale.
8.2.3. Managementul datelor colectate prin SPSS
Modul uzual de introducere a datelor Tn SPSS pentru a realiza 0 sealare
multidimensionaJa este sub forma unei matrice. Aeeasta poate avea forma
patratica (numar egal de Iinii coloane) sau dreptunghiulara (rectangulara), poate
279
:"1:'1111111111111,1111111111,11111,1111111111'11'111"111,111:1111111111111111'1111111111111,,11111111,1111111111111 IIII!,I: III III II! 1111 !III !III!!IIII IIII! 11111 '1111 11',11 'II: ill 'II II: 111'1111 """,!:", III'!III II " 1111 III, II II' 1111 1111'11111,1111 IIIIIJIII'IIII Iii' 'III "II III! !III, "',1"" """'",111, """", 1111 !III 1111 !111I_1II_.I"___ *I.-,III_lIlIlIllIIUU,11111 11111 'IIII ,III, III I!
fi simetrica (relalia dintre A B este cu cea dihtre B A) sau asimetrica
(AB diferit de BA).
Cand avem mai multi subiecti, se sa se faca media
raspunsurilor la 0 anumita comparatie. Astfel, revenind la problema c-u reactiile Tn
situatii de conflict, d.aca avem opt subiecti testati, valoarea din matrice
reprezentand gradul de disimilaritate dintre mediere confruntare este, de fapt,
media raspunsurilor celor opt respondenti la comparatia perechii respective. Daca
se considera ca este importanta analiza pe subgrupe de subiecti, yom construi mai
multe matrice. Daca dorim sa realizam 0 analiza diferentiala la nivelul fiecarui
individ, Yom construi atatea matrice cati subiecti avem.
Pornind de la exemplul dat, yom pres!Jpune ca suntem interesati atat de 0
analiza de sinteza, la nivelul Tntregului eantion, cat i de diferentele existente Tntre
doua grupe de subiecti: cu i fara experienta Tn managementul conflictelor.
Colectarea datelor prin metoda comparatieifiecarei perechi de stimuli conduce la
ob\inerea unor matrice simetrice de forma patrata. Daca datele ar fi fost
selectate prin sortare, am fi obtinut tot 0 matrice simetrica, de forma patratica, fara
Tnsa a avea posibilitatea de a analiza diferentele subgrupale sau interindividuale. in
schimb, daca am fi obtinut datele pe baza de ierarhizare a preferintelor, matricea
ar fi fost asimetrica i de forma rectangulara.
280
Figura 8.3. Print-screen SPSS cu matricea date/or
SPSS este 0 mardi inregistrata.
I
Pentru simulare, yom presupune c avem un lot de ase persoane,
Tmpartite egal Tn doua grupe: experti i non-experti Tn managementul conflictelor. in
consecinta, vom avea doua matrice, fiecare avand zece linii i zece coloane. Daca
am fi interesati de modul Tn care Tntregul eantion percepe cei zece stimuli, am
avea 0 singura matrice cu zece linii zece coloane. Figura 8.3. prezinta imaginea
fiierului "scalare similar.sav", dupa introducerea datelor Tn cele doua matrice.
Se observa din imagine doua matrice ge tip 10X10, una apartinand
subgrupului de non-experti (sursa' = 1)., iar cealalta, grupului de experti Tn
managementul conflictului (sursa = 2). Spre exemplu; valoarea de 4,66, existenta
la intersectia coloanei 2 cu linia 4, reprezinta media evaluarilor subiectilor din
grupul non-experti vizand asemi!marea dintre compromis i renuntare. Se observa
o corespondenta Tntre coloane i linii (ex. atat coloana, cat linia a cincea se
refera la subminare). in introducerea datelor este important sa pastram ordinea
liniilor pornind de la cea a coloanelor.
De asemenea, fiind yorba de date simetrice; exista posibilitatea completarii
doar a unei parti din matrice. Aceasta optiune, cu completare sub diagonala
principala, este i optiunea standard Tn PROXSCAL. Numai Tn cazuri de matrice
asimetrice este necesara completarea intregii matrice. Din nefericire, aceste
facilita\i sunt prezente doar Tn PROXSCAL, procedura inclusa Tn SPSS Categories.
Pachetul de baza,_care apeleaza la ALSCAL, permite efectuarea unei analize a
diferen\elorindividuale numai In situatiile Tn care datele nu sunt direct proximitati.
in astfel de situatii, datele sunt introduse normal (fiecare coloana reprezinta 0
variabila, iar fiecare Iinie semnifica un subiect). Pornind de aici, se creeaza 0
matrice de date automata prin selectarea completarea op\iunii "Create distances
from data". In cazul Tn care variabilele nu sunt apreciate cu aceeai unitate de
masura, se recomanda standardizarea lor initiala. Numai asUel de date pot fi
supuse analizei diferentelor individLJale prin INDSCAL, In pachetul de baza SPSS.
Daca datele sunt construite prin metoda sortarii stimulilor, yom introduce
datele Intr-o maniera similara. Totw;>i, este important sa amintim ca algoritmul de
calcul nu este foarte bine pus la punct pentru a realiza analize individuale sau
subgrupale prin aceasta metoda. In consecinta, nu se recomanda sortarea
stimulilor pentru modele MDS analitice, ea fiind utila pentru MDS sintetice, Tn
situatii cu un numar mare de stimuli, prezenta\i Intr-o slngura matrice patratica i
simetrica. 0 modalitate eleganta de a aceste neajunsuri este apelul la
masuri derivate. Astfel, daca datele initiale sunt de tip categorial, dihotomic, se
poate apela la calcularea disimilarita\ii dupa formula 1_<p2, unde phi reprezinta
valoarea coeficientului de corela\ie pentru acest tip de date.
in daca dorim sa introducem date obtinute Tn urma ierarhizarii pe
baza de preferinte a stimulilor, unica matrice introdusa va avea 0 forma asimetrica
rectangulara. in cazul exemplului de fata matricea va fi de tip 10X-6, unde pe cele
zece coloane se vor afla stimulii (variabilele), iar pe fiecare linie vor fi trecute
rezultatele unui anumit subiect. Fiind ase subiec\i chestionati, yom avea ase linii.
281
11'III,IIII:IIIIIIIIII:IIIII'IIIIII,IIIIJllluIIIILlIIIIL1IIIILlIIIIJIIIII'.IIIIIJ11III.1IIII,',lllllllllllllllllllllmJIIIIIJlllllliIIIIILWllllillllllllllll'IIIIIIIJllllljllllllIIlllmlIIJIIIIJIIIIJIIIIIJIIIII,IIIIII'11111 11111',111111 III11',1II11111111',IIIIIIIIIIIIJIIIIIIIIIIIIIIIIIJIIIIIIIIII'JIIIII'IIIIILJIIIII'IIIII'IIIII'IIIIIJIIII',IIIIIIIIII"IIIII 11111,111111 11111,'11111 111111J11111.:IIIII,JllllljlllIJIIII'JIIIIJIIIUIIIJIIII'llllllli 1III ,llllJIIIIIIIIIIJIIIIIJIIIIIUIIIIUllllltIIIIILIIIII,<a,______ IIIUIIII 11111 1IIIIlIIIII 11111 1111 1111 ilil illlr'llllI 11111011111 11111'11111 1IIIflllili 11111 111111 11111111111 1111111111"111 '""''''''''"1''''"'''""''''111111"''111 """'" "''','''' "'IL,"" ""'''''' ""''''
Rezultatele introduse In matrice se refera, de aceasta data, la rangurile
acordate stimulilor respectivi In ordinea preferintelor [unde 1 = prima alegere, iar
10 (N) = ultima alegereJ. Daca unii subiecti nu pot diferentia Intre doi stimuli, se pot
acorda ranguri egale (situatie mai putin dorita). lerarhizarea (notarea) continua
apoi In conditii cunoscute :;;i Intalnite deja In cazul corelatiei Spearman a rangurilor.
Cercetatorul are posibilitatea de a preciza, atat In acest cai, cat i Tn SitU8tii de
comparare a fiecarei perechi de stimuli, daca accepta sau nu egalitatea dintre
ranguri. lata print screen-ul SPSS 11.0 cu matricea datelor In urma iera(hizarii
stimulilor.
Matricea se cite:;;te foarte u:;;or: de exemplu, subiectul 4 claseaza
compromisul pe locul opt In ordinea preferintelor sale de a reactiona In situatii de
conflict. In schimb, subiectul 5 pune aceasta' reactie In topul pe
locul al treilea.
Figura 8.4. Print-screen SPSS cu matricea rectangufara din fiieruf "scafare preferinte. S8v"
SPSS este 0 marca Tnregistrata.
Din pacate, SPSS-ul nu dispune de mijloace adecvate pentru analiza
:nodelelor MDS analitice, unfolding. In schimb, datorita tipului de matrice duala (Tn
eng!. two-mode), exista solutii alternative. Spre deosebire de matricele unimode
282
(one-mode) prezentate anterior, In care se face referire numai la stimuli (at8.t pe
linii, cat :;;i pe coloane), matrice precum cea de mai sus contin stimuli pe coloane :;;i
pe linie. Situatia permite modelelor extinse ("unfolding") sa reprezinte
grafic atat stimulii, cat :;;i subiectii. Principiul de interpretare ramane acela:;;i. Cu cat
un subiect este mai aproph3t spatial de un anumit stimul, cu atat exista 0 preferinta
mai clara pentru acesta. '
8.3. Harta perceptiva. Reprezentareaspatiala a distantelor
psihologice "
In aceasta sectiune vom discuta despre cum se stabile:;;te numarul de axe
(dimensiuni) care contribuie cel mai mult la modul de a:;;ezare a punctelor Tn spatiu.
De asemenea, vom insista :;;i asupra modului de interpretare (identificare)
conceptuala a acestora.
8.3.1. Selectarea numarului de dimensiuni din harta perceptiva
Scalarea multidimensionala este In primul rand 0 tehnica descriptiva de
reprezentare grafica a datelor. Cu exceptia procedurii MUL TISCALE nu exista
modalitati de testare a ipotezelor legate de numarul de dimensiuni In care trebuie
reprezentate spatial obiectele.
Totu:;;i, exista mai multe indicii care pot fi utilizate In acest scop, printre
care enumeram: indicatorii statistici specifici (ex. stres sau OAF) (1), analiza grafica
de tip scree plot (2), compararea indicatorilor statistici prin metoda Monte Carlo (3),
gradul de stabilitate a solutiei (4), u:;;urinta de a grafic solutia gasita (5),
nu Tn ultimul rand, gradul de interpretabilitate a dimensiunilor (6).
Indicatori statistici 'in evaluarea numarului dedimensjuni
Gradul de potrivire sau nepotrivire a reprezentarilor spatiale pomind de la
proximitatile exprimate de subiecti poate fi apreciat printr-o serie de indicatori
statistici. Cel mai raspandit este conceptul de stres (raw stres sau raw phi). Au fost
concepute mai multe formule de ealeul, :;;i In conseeinta, mai multe forme de stres
(Stres 1; Stres 2; Stres S). Din neferieire, valoarea aeestora este dependenta de
mai multi factori, preeum tipul de date (MDS metriee tind sa ia valori de stres mai
mari decat cele non-metriee) sau va loa rea nominala a acestora (scalelede la 1 la
10 conduc la valori stres mai mari deeat scalele de la 0 la 1) (Kruskal :;;i Wish,
1994). Din cauza aeestor inconveniente, a fost obtinuta 0 formanormalizata de
stres (N Stres), care face posibila comparatia dintre reprezentarile grafice,
indiferent de tipul de date. Aceasta are valori cuprinse Intre O:;;i 1 (Coxoh, 1982).
Pornind de 1i3 aceasta normalizare, au fost propuse mai multe reguli de interpretare
283
______ =_- 111,:111 111'1111 ,III, 1111 ,11111111 ,11111111111'11111111'1111 1111 1111:11,1111 11111111:111111111,111111111111111'1111111111,1111:1,:, II 11':11 III ,II, 11'11 II: 11-'11111111111 I: II' ,I, 'II' !I' I: ,1::11 II', 1111,111,,1111 :1II,tiII_"IIII_"III___
It valorllor N Stres. Tn general, valorile mici ale stresului normalizat, preeum eele
cuprlnse Tntre 0,00 0,15, indica prezenta unei soluiii adecvate, Tn timp ce valorile
ll1ell mari de 0,20 semnaleaza faptul ca solutia gas ita nu este potrivita (Kachigan,
'1991; Kruskal Wish, 1994; Stalans, 1995).
Aceasfa interpretare nu poate fi facuta fara a tine seama de numarul de
dimensiuni ale solutiei, deoarece valoarea stresului tinde sa scada atunci cand
numarul de dimensiuni Mai mult, stresul este afectat de raportul dintre
numarul de dimensiuni cel al obiectelor. Kruskal Wish (1.994) arata ea exista
situatii cu 0 probabilitate de 50% de a obtine un. stres = (reprezentarea a
obiecte fntr-un spaiiu tetradimensional) sau un stres = 0,02 conditii, dar
Tntr-un spaiiu tridimensional). Ambele soluiii sufera gray de lipsa stabilitatii. Chiar
daca am respecta raportul minim optim dintre n
l1
marul de obiecte numarul de
dimensiuni, se ridica alte cateva Tntrebari. Ce facem daca avem de ales Tntre 0
solutie bidimensionala (N Stres = 0, 12) 0 solutie tridimensionala (N stres ==
0,08)? Ambele solutii satisf.ac criteriul valorii stresului. Care solutie ar trebui
adoptata? Raspunsul la aceasta Tntrebare iine de randamentul fieeareia dintre
solutii. Cu alte cuvinte, Tntrebarea devine: scade suficient de mult stresul pentru a
aceepta introdueerea unei dimensiuni suplimentare?
Analiza grafica de tip scree plot
Analiza grafica de tip scree plot of era un suport pentru a raspunde la
aceasta intrebare. Tehnica, introdusa de Cattell, este preluata din analiza factoriala
consta Tn realizarea unui grafic cu rol de suport. Pe abscisa (OX) sunt trecute
dimensiunile posibile ale unei solutH, iar pe ordonata, valorile stresului (normalizat
sau nul pentru fiecare situaiie Tn parte. Interpretarea graficului de la ideea
selectarii acelui numar de dimensiuni de la care nu mai sunt aduse imbunataiiri
semnificative In evoluiia stresului.
Sa presupunem ca avem 35 de obiecte introduse Tn MOS. Sa ne reamintim
ca pentru a asigura stabilitatea solutiei, numarul maxim de dimensiuni de care vom
iine seama este opt (n-1)/4, iar numarul minim, unu. Fie valorile stresului (grafieul
din stanga al figurii 8.5.).
284

\
\
\.


Hurn;rlilrne-lllJunl
Figura 8.5. Interpretarea grafica prin metoda "scree plot"
11!"il:!"I'!I'II:1 i 11111111'11111111"11111111'11111111111111111111111111 ill 1I,lli,II:IIIIIIIIIIIIII,IIIIIIIII,II'II,iIIiIIl,II' '11',111111,1111,11111111 11111111111111111,111111111,11111111,11111,1
Se observa ca valoarea stresului normalizat scade cel mai mult (a se citi
"solLitia se cel mai mUIt") cand se trece de la 0 dimensiune
(N stres = 0,23) la doua dimensiuni (N stres = 0, 12) de la doua dimensiuni la trei
dimensiuni (N stres = 0,08). Oupa aceasta, scaderea stresului este prea mica
pentru a merita sa mai introducem 0 alta dimensiune. Gratie, aceasta situatie este
reprezentata printr-o cotitura (punct terminus al unei descendente accelerate
Tnceput al unei lente). Pentru a interpretarea, Kruskal Wish
(1994) propun 0 regula suplimentara. Cu excePiia unor cazuri bine argumentate
teoretic, nu ar trebui sa acceptam acel punct de cotitura (implicit dimensiunea
adiacenta), daca valoarea stresului este mai mare de 0,10. Din acest punct de
vedere, 0 solutie tridimensionala pare a fi mai adecvata pentru graficul de mai sus.
Acest grafic poate fi realizat pe baza altor indicatori decat stresul. Printre
aminti OAF (dispersia explicata) sau coeficientul de congruenta Tucker.
Ambii indicatori, spre deosebire de stres, arata cat de bine se
reprezentarea grafica a punctelor cu afinitatile psihologiee dintre concepte. Valorile
lor, cuprinse tot intre 0 1, au 0 ser:nnificaiie inversa. Cu cat OAF sau indicele.
Tucker sunt mai apropiate de 1, soluiia este mai potrivita. Din pacate, numai
PROXSCAL-ul prezinta valorile acestor indicatori. Pachetul de baza SPSS prezinta
doar valorile Stres 1, S Stres R, ultimul fiind un indicator eehivalent pentru OAF.
Metoda Monte Carlo
o alta modalitate de seleciie a numarului de dimensiuni este data de
metoda de simulare Monte Carlo. Aceasta poate genera randomizat solutii diverse
de configurare spatiala pentru numere diferite de dimensiuni. Prin compararea
valorilor stres obiinuteprin simulare cu eele bazate pe date reale se poate alege
numarul optim de dimensiuni. Solu\ia aleasa este cea care semnaleaza prima
diferenie semnificative Tn ceea ce valorile stresului. in graficul din dreapta
seobservaca incepand cu a treia dimensiune, solutia bazata pe date reale pare a
fi semnifieativ mai buna decat cea generata de eonfiguraiii aleatoare.
Gradul de stabilitate a solu!iei
Un alt eriteriu de sprijin utilizat Tn selectarea 'numarului de dimensiuni se
refera la stabilitatea solutiei. Efectuarea unei MOS pe 1 stimuli, precum Tn
problema reaciiilor la conflict, duce doar la reprezentari grafice unidimensionale
sau bidimensionale. Conform algoritmului descris anterior, ar fi fost nevoie de
minimum 12 sau 13 stimuli pentru a putea lua Tn discutie 0 solutie stabila
tridimensionala. in astfel de situatii, cu doar doua dimensiuni, analiza scree plot-
ului justifiearea.
285
1111111111111111111111111'1111111111'111111111,11111111111'111'1111 ,1111111'11'111'111,111'1111'1111111111111111111111,11111111,1" 1111111111I111_1I1I _____ ,_1Il 1IIIILlIIIILlIIIII 111111 JIIIIII 111111 i11111Ll11111 11111 111111:11111 111111'11111 111111,11111 111111'11111 1IIIIIilllllllllll'IIIII'1II111111111 11111!IIIIIIIIIII!IIIII :11111111::1111111111111'1111111111111111111111111111111I 11111,11111'111111 11111 !IIIII 11111 11111: 11111 1111111111111:11111111111111111111111111111::1111111111,:1111111111111:11111111111111111111,111111111111::111111111111..111111111111,,111111111111'11111111111111111'111111111111111111111':11111 11111 111111 ilill '11111 11111 ,1111:JIIIIIIIIILlIIII,1ImUIIIILIIIIII,lllllillll:lllll,1111 :111, 'II
reprezentarii grafice a solutiei
Tn alegerea numarului de dimensiuni este util sa tinem cont 9i de u9urinta
reprezentarii 9i a interpretarii grafice. La baza, MDS este totu9i 0 tehnica
,3xplorativa de vizualizare a relatiilor dintre obiecte. Ce faeem Tnsa daca solutia
optima are patru sau mai multe dimensiuni? Ar fi imposibil sa reprezentam grafic 0
asemenea situatie 9i ar fi complicat sa interpretam 0 asemenea configuratie. De
3ceea, de foarte multe ori, cercetatorii au tendinta de a selecta solutii
i)idimensionale sau tridimensionale, datorita avantajului oferit de posibilitatea
reprezentarii grafice. TotU9i, daca exista indicii clare ca 0 solutie Tn patru
dimensiuni ar fi mult mai adecvata decat una tridimensionala, ar fi bine sa 0
retinem, In ciuda dezavantajului legat de dificultatea reprezentarii grafice.
Interpretabilitatea solutiei
In fine, un ultim factor care influenteaza alegerea dimensiunilor tine de
qradul de interpretabilifate a acestora. Acestui aspect Ii va fi dedicat un Tntreg
;ubcapitol. Pana atunci, vom preciza ca dintre doua solutii relativ echilibrate pe
i)aza criteriilor mai-sus amintite, este preferata aceea care ofera 0 mai buna
Interpretare a dimensiunilor 9i implicit, a atributelor pe care subiectii Ie folosesc
pentru a stabili proximitatile dintre obiecte. Tn ce prive9te numarul de dimensiuni
selectate, mai raman de discutat doua probleme ce apar uneori in generarea
solutiilor MOS.
Prima, denumita degenerarea solutiei, apare frecvent In conditii Tn care
se fac MDS non-metrice utilizand obiecte care sunt grupate Tn cateva clustere
naturale. Daca Tntalnim asemenea situatii, .interpretarea MDS se opre9te dupa
identificarea acestor grupe de obiecte, fara a merge mai departe (ex. interpretarea
dimensiunilor; analiza diferenielor interindividualeetc). Diagnosticarea unei
asemenea situatii este destul de u90ara. Tn astfel de cazuri, valorile N stres sunt
foarte mici sau chiar zero (0,00 - 0,02). Obiectele sunt reprezentate grafic prin
clustere deparlate spatial unul de al\Ul. Dimensiunile obtinute sunt greu sau deloc
interpretabile, obiectele fiind configurate fara 0 logica anume. Tn plus, diagrama
Shepard ia forma unei scM cu cateva trepte foarte marL Totu9i, putem Intalni
situatii de solutii degenen:it? fara a observa in mod obligatoriu toate aceste
simptome concomitent. )
Cealalta problema ce poate aparea este solutia locala minima. In acest
caz, datorita unor deficiente legate de procesul iterativ de generare a solutiei, se
pot obtine valori destul de crescute ale stresului 9iimp/icit, configuratii mai putin
optime. Cu alte cuvinte, procesul iterativ' se poate incheia inainte de a obtine cea
mai buna solutie. Tn sprijinulintelegerii acestui proces vine imaginea clasica a unei
persoane legate la ochi, care este pusa sa gaseasca locul cu altitudinea cea mai
joasa (va loa rea stres cea mai mica). Daca terenul este lin, persoana ar putea
cobori pas cu pas pana ar gasi locul cel mai jos posibil. Tntr-o asemenea situatie,
286

t
f
1
I:
1
i
1
- I.
1
!
I
1

1.
,.
I
j
1
1
r
t
r
1
I
I
!
solutia respectiva ar fi una co recta, iar Tn termeni statistici ar fi vorba de 0
echivalenta Tntre solutia locala minima 9i solutia globa/a minima. Daca terenul nu
ar fi unul lin, ci unul accidentat, cu multe sui9uri 9i cobora9uri, persoana legata la
ochi ar putea fi Tngelata 9i ar putea sa declare locul cel mai jOs posibil, 0 simpla
Tnfundatura. Daca ar fi luat-o fntr-o alta directie, ar fi evitat aceasta capcana 9i ar fi
ajuns, Tntr-adevar, Tn locul situat la cea mai joasa altitudine. Cum rezolvam aceasta
problema? Simplu, vom detecta mai multe puncte de start in calatoria persoanei.
Daca indiferent de acest punct, persoana ajunge Tn acela9i loc sau Tntr-un altul, cu
altitudine apropiata, Tnseamna ca ne putem baza pe solutia obtinuta. Daca exista
Tnsa diferente mari Tn ceea ce privete altitudinea punctului'de sosire (valori etero-
gene ale stresului), atunci Tntampinam situatia unei solutii minime locale. Tn astfel
de situatii, vom alege configuratia corespondenta valorii N stres cea mai mica.
Situatia in discutie poate fi recunoscuta prin valori N stres destul de mari
i, uneori, prin evolutiile paradoxale ale acestuia. Astfel, daca Tn conditii normale
stresul scade sau se mentine constant 0 data cu creterea numarului de
dimensiuni, in situatii de solutii locale minime pot aparea cazuri ciudate in care
stresul crete, daca se adauga 0 dimensiune suplimentara (ex. 0 solutie
tridimensionala poate fi suspectata daca valoarea stresului este mai mare decat Tn
cazul unei solutii bidimensionale).
Tn a stfe I de configuratii, interpretarea dimensiunilor i a felatiilor dintre
puncte se face dificil. Pentru a reduce sau elimina aceasta problema, PROXSCAL-
ul din SPSS of era posibilitatea de a alege configuratii de start diferite (puncte de
plecare a persoanei diferite). Oferta Intalnita Tn SPSS contine ca variante de start:
Simplex (initial punctele se afla la distanta egala Tntre ele), Torgerson (metoda
clasica, propice mai ales MDS metrice), Random Single sau Multiple (care of era
una sau mai multe configuratii generate aleator), Custom (permite configurarea
initiala a punctelor pe baza unor rezultate anterioare).
Exemplu: Dimensiunile latente in evaluarea strategiilor de negociere
Din dorinta de oferi mai multa claritate selectarii numarului optim de
dimensiuni, vom incheia prin a rezolva exemplul referitor la reactiile Tn situatii de
conflict. Solutia care pare sa se impuna este aceea a unei reprezentari grafice
bidimensionale. lata 9i argumentele Tn favoarea solutiei MDS cu doua dimensiuni:
valoarea indicatorului N Stres era de 0,026, Tn conditiile in care nu au fost
observate alte simptome ale unei solutii degenerative;
valoarea suficient de mica nu indica nici prezenta unei solutii locale
minime;
solutia bidimensionala are suficient de mu/ta stabilitate, data fiind prezenta
celor 10 obiecte evaluate; de altfel, cele zece obiecte indica existenta a
doar doua solutii alternative: MDS unidimensionala sau bidimensionala;
prin urmare, argumentele care sprijina solutia tridimensionala 19i pierd
sensul, deoarece, 0 asemenea solutie ar fi instabila din cauza numarului
redus de obiecte (puncte);
287
1-
I 1111' ,llli 'II' III 11'111'11 II! 'II 'II' III 'II: !II 'II !I"II,,' "'I 'I'I"!'I 'I '!'I! 'I iI II ,ii il ,I, ii ill ,II ii, III ill III ill
solu\ia . poate fi reprezentata grafic cu ul}urin\a; de altfel, reprezentarile
bidimen.sionale pe doua axe Nord-Sud Est-Vest sunt cele mai uzuale
Tn cazul har\ilor perceptive;
cele doua dimensiuni. selectate sunt interpretabile. (vezi sectiunea
8.3.2.).
8.3.2, Interpretarea configuratiei MDS
,
Este timpul sa reamintim 0 fraza esen\iala prezentata Tn introducere.
Proximitatea psihologica dintre obiecte poate fi reprezentata spatial sub forma unei
distante Tntre puncte. Cu cat punctele sunt mai apropiate unul de celalalt, cu atat .
obiectele sunt vazute de eantionul testat ca semanand mai mult. La fel, cu cat
punctele sunt mai departate unul fata de celalalt, cu- atat obiectele corespunzatoare
acestora sunt percepute mai diferit. Distan\ele dintre puncte nu trebuie
absolutizate. Cu mici exceptii, toate distantele sunt doar masuri relative. Aceasta
Tnseamna ca nu putem trage concluzii de genul: obiectul A este de doua ori mai
apropiat de obiectul B Tn compara\ie cu distan\a de la A la C, daca observam
(ochio)metric 0 asemenea situatie. Ceea ce conteaza este doar distanta relativa.
Astfel, daca distan\a dintre punctele A i B e mai mica decat cea dintre A i C sau
cea dintre B i C, putem afirma doar ca cele doua obiecte A i B par a fi percepute
ca fiind mai asemanatoare decat oricare alta combinatie. Pe baza acestor
observa\ii subiective putem grupa diferite obiecte Tn De exemplu, putem
observa din figura 8.6 ca subiec\ii tind sa perceapamai asemanator amanarea i
renun\area ca forme de reac\ie la situa\ii conflictuale decat, sa zicem, amanarea
cooperarea. Mai mult, am putea chiar identifica un cluster de reac\ii reprezentat de
tripleta: amanare, evitare i renun\are. . .
288
1
Spaliul cornun
confruntare
"
m'e,diere
cooperare " tJ
arbitraj
c
1:1
)
compromis
c
manipulare
c
amanare
c
submioare
c
evitare
C
renuntare
c
2

Dimension 1
Figura 8.6. Output SPSS cu reprezentarea spatia/a a distante/or psih%gice
SPSS este 0 mardi inregistrata.
Interpretarea configLira\iei MDS primete i mai multa consistenta, daca
identificam dimensiunile pe baza carora au fost plasate obiectele. Acestea' nu sunt
altceva decat criterii de judecata a gradului de proximitate Tntre obiecte. Figura 8.6
prezinta harta perceptiva ob\inuta Tn cazul problemeidate.
Evaluarea sUbieetiva a dimensiunilor
o prima modalitate de interpretare (identificare) a dimensiunilor este de
ordin subiectiv. Observa\i pentru cateva secunde distribu\ia punctelor de-a lungul
primei - dimensiuni. Gasi\i vreun sens pentru modul Tn care' sunt distribuite
punctele? ... Foarte bine! Se pare ca Tn partea stanga a primei dimensiuni se ana
situate reac\ii precum cooperare, mediere, compromis, confruntare, arbitraj. Ce au
acestea Tn comuni mai ales, ce Ie deosebete de punctele aflate Tn partea
dreapta, ca manipularea, evitarea, subminarea, renun\area, amanarea? Cu
excep\ia confruntarii, se pare ca medierea, cooperarea, compromisul sau arbitrajul,
implica ac\iuni bilaterale. Tn schimb, punctele din partea dreapta par a fi mai
degraba ac\iuni unilaterale. Din aceasta perspectiva, am putea concluziona ca
prima dimensiune care contribuie la reprezentarea grafica a punctelor, i implicit, la
stabilirea asemanarilor sau a deosebirilor psihologice dintre obiecte, este axa
reactii bilaterale vs. reactii unilaterale.
, mod sim'ilar, am putea observa i identifica configura\ia punctelor
pe cea de-a doua dimensiune. Cum am putea denumi aceasta axa, daca la un
capat contine ac\iuni energice, directe, de genul confruntarii, iar la se
regasesc reaC\ii precum compromisul, renun\area, evitarea sau amanarea. fie
vorba de un continuu al gradului de asertivitate? Sa fie yorba de gradul de
activism, pe 0 axa bipolara ce cuprinde reac\ii pasive vs. reac\ii active? Foarte
probabil,. mai cu seama ca spre mijlocul axei se observa reactii de nivel mediu Tn
ceea ce privete gradul de asertivitate sau activism.
o astfel de interpretare subiectiva necesita cu siguran\a multa intuitie i
sensibilitate. Trei pericole mar! fac ca aceasta metoda sa nu fie prea iubita, in
special de statisticieni. Primul pericol se refera la tendinta oamenilor de a identifica
paternuri de obiecte acolo unde de fapt nu exista. Cel de-al doilea, se refera la
posibilitatea efectuarii unei rotiri ortogonale a dimensiuniJor, schimbandu-se astfel
perspectivele de a privi punctele din grafic. Se cuvin'e aici sa amintim ca prin rotire
nu se pierd informa\iile esenfjale legate de distan\a dintre puncte.Sa ne Tnchipuim
harta Romaniei. Indiferent daca Tn urma rotirii vom localiza sau Aradul Tn
vest, sud, nord, sau est, distanta dintre ele se va pastra. Tn a treia i cea
mai consistenta critica, se refera la alte situatii MDS decat eele bidimensionale.
. Astfel, este dificil sa interpretam configura\ia punctelor Tntr-o reprezentare
tridimensionala (spatiala) i chiar imposibil, Tn situatii mai eomplexe, cu patru sau
mai multe dimensiuni. .
289

IIIII'IIII",IIIIUIIIIIIIIIIIIINIIIIIIIIIIIIIIIIIIIIIIIIIIIIUIIIIIIIIIIIIIIIIIIIIIIIIIIIIWIlIllI'IIIIII,lIlIlIIllIlIlIlIIlIlIlIIlIIlIIlIIillllll,lIlIIillllllllllllllllllllllllllllll'IIII'IIIIIIIIIIIIII,'1I1II1II1I,1I1II1I1II11I1'!IIIIIIII'IIIIIIII':III"II'III'II'!I'"
iillllllllllllllllllllllllll."',
Evnluaro(l oblectiva a dimensiunilor
AeRAta ests motivul pentru care au fost dezvoltate 0 serie de tehnici
"nlllclOtlvo" do Interpretare a dimensiunilor, indiferent de numarul acestora. Ele sunt
r/l'llIlllllllo Tn Jargon statistic adecvarea vectoriala a atributelor (Tn erigleza "property
VIL1It'lt" fitting"). r n topul aces tor masuri se afla regresia multiliniara. Principiul
i'lc".hll IInsamblu de tehnici este acela de a gasi atribute (trasaturi) ale obiectelor
proloctate care sa coreleze puternic, cu modul de configurare a punctelor cu
punctelor pe axele hartii perceptive. Pentru a utiliza tehnica adecvarii
vaIJtorl111tl a atrlbutelor este necesara colectarea unor date suplimentare. Tn
liN IlIodlll 1"11 care este masurata variabila dependenta se aplica regresia
1IllllU/llllilrtl, analiza discriminantului (ori regresia logistica). Daca
vRrllthlltllo dependente constau Tn atributele complementare studiate, variabilele
Inrltlplmdonte sLint reprezentate de coordonatele stimulilor (punctelor) pe axele
IIlartll perceptive. Astfel, intr-o situatie MDS tridimensionala vom avea trei
pmrllctorl, lar intr-o situatie MDS bidimensionala, ca Tn problema reactiilor la situatii
!lu conflict, vom ave a doar doi predictori.
Cum am proceda concret Tn acest exemplu?
Pnslil 1. Identificarea variabilelor dependente care pot ave a 0 semnificatie
pslhologica, Iii astfel, pot influenta configuratia spatiala a punctelor. Tn exemplul dat
am deds evaluam reactiile la situatii conflictuale prin prisma urmatoarelor
alribute: masuri pasive vs: active, vs. bilaterale, individuale vs.
colective, irationale vs. rationale, distructive vs.constructive.
PaslIl2. Alegerea unuia dintre cele doua moduri de masurare a acestora
(scala bipolara Tn sau noua trepte) Tn cazul regresiei multiliniare sau (optiune
dihotomica) Tn cazul analizei discriminantului sau a regresiei logistice. Vom alege
pentru exemplul-model 0 scala bipolara cu trepte. Astfel, pentru atributul
pasiv-activ, se acorda un punct pentru 0 reactie considerata a fi. pasiva,
puncte pentru una activa valori intermediare pentru nuante ale acestui aspect.
Similar se procedeaza pentru celelalte atribute.
PnslIl3. Realizarea unei medii a raspunsurilor la un obiect pentru fiecare
varlElbiid dependenta.
Paslil 4: Utilizarea coordonatelor fiecarui punct reprezentat spatial ca
varia bile predictor' efectuarea analizei statistice corespunzatoare (vezi tabelul
B.1.). De remarcat c13 valorile coordonatelor pentru fiecare stimul pot fi salvate Tntr-
lin filiier nou, prin selectarea optiunii "common space coordinates", prezenta prin
actlvarsa butonului "outp.ut" din cadrul Categories, PROXSCAL..
Dup;';\ Kruskal Wish (1994), un atribut are importanta In interpretarea
unel dimensiuni daca, in urma analize; de reg res ie, doua conditii:

a) corelatia multipla dintre coordonatele punctelor ;;i respectiv sa fie
foarte ridicata (R > .90, acceptabil Tnsa peste .80); Tn situatii limita
,111'1111111111111 1111111111111111111 1 111111 111111 ,lIlIIi 111111 '11111 '1111'11111 IIIIII!UIllIIIUlh 11111" ,
(ex. R = .78), influenta predictorilor trebuie sa fie statistic la
un prag p < .01 sau chiar mai mic;
b) valoarea coefjcientilor standardizati beta (denumiti Tn cadrul MDS
directie cosinus) sa fie cat mai apropiata de 1.
Tabelul 8.1. Valorile predidorilor i ale criteriilor 'pentru fiecare atribut studiat prezente in
baza de date "scalare coordonate.sav"
ATRIBUTE DIM1 DIM2 Activ Bilat. Colectiv Rational Constructiv
evitare 1,233 -,772 1,50 2,66 1,50 4,17 2,75
compromis -,683 -,703 3,75 5,60 3,25 5,85 3,50
confruntare -,618 1,805 6,25 4,20 3,17 4,25 3,00
renuntare ,823 -1,746 1,33 1,83 3,00 3,80 2,50
sUbminare 1,370 ,703 5,00 1,25 1,80 5,17 1,75
amanare ,539 -1,123 1,40 3,83 2,00 2,87 2,67
arbitraj -,372 ,485 4,00 5,00 5,17 4, SO 3,33
mediere -1,171 ,490 5,00 5,50 5,00 4,33 4,17
manipulare ,591 ,476 5,25 2,00 2,50 6,00 3,25
cooperare -1,712 ,386 5,50 6,17 3,50 4,83 5,83
Ce inseamna indeplinirea acestor conditii? Prima ne arat13 ce
exista intre configuratia punctelor atributul respectiv. Cu cat corelatia multiplb
dintre predictori alribute este mai mare, cu atal atributul este mai semnificativ
pentru modul de configurare a punctelor. Coeficientul de regresie standardiza!
(beta) ne arata cat de apropiat este atributul evaluat de sistemul de axe, Daca beta
pentru 0 anumita dimensiune are valoarea 1, atunci exista 0 congruenta tatala Tntre
dimensiunea respectiva ;;i vectorul atributului respectiv, deoarece cosinus de unu
este egal cu zero grade. Aceasta situatie ar constitui un indiciu extrem de puternic
Tn favoarea denumirii dimensiunii respective prin apelul la acel atribut. Retineti insa
ca este nevoie de 0 corelatie multipla ridicata. Celor mai putin familiarizati cu
aceste transformari trigonometrice Ie vin Tn ajutor manuale precum cel al lui Rogai
(1983) care contin tabele cu transformarile necesare.
Rezultatele obtinute In urma analizei de regresie pot fi sintetizate asemeni
exemplului dat:
Tabelul 8.2. Analiza atributelor
ATRIBUTE
Pasiv - Activ
Unilateral - Bilateral
Independent - Colectiv
Irational - Rational
Distructiv- Constructiv
** p < .001 * p < .01
BETADIM 1
-0,226
-0,989
-0,719
0,000
-0,926
BETA DIM 2 R
0,830 0,939**
-0,172 0,938**
0,028 0,731
0,352 0,354
-0,147 0,881*
291
.J:,-
-.
'" III 'II' 1111 !l1I,IIIIIJlIIJlII '1IIIUIIII'JllliJIIJIII 11111 '11111 IIIIIJIUllllUlllllJlllUllllll'llllljlllllllllljlllUllllUlllUIIIUIIIUIIII,'IIIIUIIIIL'IIIIUIIIUII'JlILIIIIJILIIIIJIIIIIIJI'IIIUII: IlliLIIIIIJIUIIIJilliLIllllJl, II, ,II 111'11 ,iii :i, 'ii, 111'1111',111'-"111,--.11111111,'11111111'111111111.",11.,' ____ IIJIIIIIIIIIIIIIIII 111'11 W 'll lit II 111'11 rv JF JV "11 :1111' ," W.l1
Se observa ca dintre cele cinci atribute evaluate, trei sunt puternic corelate
au Inodul de configurare a punctelor (R > .80). Mai mult, cele trei atribute sunt
tlestul de apropiate de sistemul de axe. Astfel, vectorul unilateral - bilateral
formeaza un unghi de doar 8
Q
cu prima dimensiune (cos 0,989), iar vectorul
dlstructiv - constructiv lormeaza un unghi de 22 cu aceea:;;i dimensiune (cos
0,926). Aceste unghiuri se masoara dif\ punctul de origine al hai\ii perceptive, unde
toate coordonatele iau valoa'rea zero. Tn sfar:;;it, vectorul pasiv - activ indica un
unghi destul de ascutit cu dimensiunea a doua a har1ii (cos 0,830 = 342).
2-
1-
confruntare
o
mediere
co0p,;rare I;)
1-
.2,
2.1 -1.0
Dimension 1
0.0
subminare
manipulare l:I
ama re
evitare
o
renllntare
.
1,0 2.1
Figura 8,7. Interpretarea dimensiunilor pe baza adecvarii vectoriale a atributelor
Directia vectorilor se poate stabili u:;;or, observand semnele coeficientilor
beta. Astfel, cand ambii coeficienti beta au semn negativ, sageata vectorului va fi
orientata In cadranul din stanga jos, corespunzator unor coordonate negative
pentru ambele dimensiuni (cazul unilateral - bilateral, respectiv distructiv
constructiv). Similar, In cadranul de sus stanga, vor fi orientati vectorii care au beta
negativ pentru dimensiunea 1 :;;i beta pozitiv pentru dimensiunea 2 (cazul pas iv-
activ). Asemanator se procedeaza :;;i In alte cazuri. Din pacate, un astfel de grafic
nu poate Ii efectuat direct In SPSS. Altemative raman utilizarea altor programe
precum PROFIT [In cadrul pacbetului MDS(x)] sau prelucrarea secundara a hai\ii
perceptive oferite de SPSS.
Tn figura 8.7. se observa tendinta subiectilor de a considera compromisul
ca fiind 0 masura constructiva :;;i bilaterala, confruntarea ca fiind, prin excelenta, 0
masura activa, medierea, cooperarea :;;i arbitrajul, ca reactii bilaterale, constructive
:;;i active, In acela:;;i fel, am putea interpreta manipularea :;;i subminarea ca fiind
distructive :;;i unilaterale, In timp ce evitarea, amanarea :;;i renuntarea sunt
percepute ca reactii pasive. Dincolo de aceasta Incarcatura a obiectelor In
atributele respective, observam ca prima dimensiune ar putea fi denumita axa
unilateral vs. bilateral, datorita unghiului redus dintre acest vector :;;i dimensiunea
292
In cauza. A doua dimensiune este mai greu interpretabila, de:;;i am putea afirma cu
un anumit grad de flexibilitate ca este yorba de axa pasiv - activ (unghiul dintre .
vectorul respectiv :;;i a doua dimensiune fiind de 34Q).
Aceasta nu este, singura explicatie posibila. Daca am roti ortogonal cele
doua dimensiuni cu aproximativ 20
2
in sensul acelor de ceasomic, am putea obtine
o interpretaremai clara a dimensiunilor. Prima dimensiune ar putea fi data'de
'eficienta reactiei (masuri constructive, cu consecinte bilaterale vs. masuri
distructive sau beneficii unilaterale), iar a douadimensiune ar constitui clar, axa
pasiv - activo Retineti, In fine, ea relatiile dintreveetori r:Ju trebuie sa fie ortogonale,
Tn schimb dimensiunile, chiar dupa rotire, trebuie sa formeze un unghidrept Intre
ele. Mai mult, in cazul unor proceduri gen INDSCAL, dimensiunile nu trebuie rotite,
de:;;i In practica mici rotiri pentru a maximiza interpretarea axelor sunt Intalnite
(Jones :;;i Koehly, 1993). Spatiul eomun rezultat In urma configurarii reactiilor la
situatii conflictuale este un astfel de exemplu, In care rotirea axelor cu 20
Q
olera 0
interpretare mai clara a axelor.
8.3_3. Aplicalii INDSCAL
Metodele MDS nu pot epuiza Intreaga gama de lntrebari :;;i
probleme de cereetare. Uneori nu suntem interesati de obtinerea unei har1i
perceptive pe baza rezultatelor tuturor subiectilor, ei dorim sa observam diferentele
dintre subiecti sau subgrupe ale aeestora. Reamintim ca, In situatia data, subieetii
ehestionati au fost Impai\iti In doua categorii: cu :;;i fara in solution area
conflietelor. Oare nu exista deosebiri Intre cele doua categorii de subiecti? Numai
prin modele INDSCAL se poate raspunde la 0 asemenea lntrebare.' In urma
apliearii unei astfel de proeeduri yom obtine date pe care Ie yom prezenta pe rand,
(1) Un spatiu comun reprezentand configuratia puncte/or nediferentiata pe
categorii de subiecfi
Gralicul prezentat de noi In figura 8.6. este un astfel de exemplu, fiind 0
harta perceptiva similara cu cea obtinuta direet prin ALSCAL sau prin PROXSCAL
identity matrix. Punctele vor fi la fel de distantate, singura diferenta care poate
aparea fiind la nivelul axelor. Aeest fapt nu eonstituie 0 problema, deoarece
dimensiunile pot fi rotite ortogonal In orice direetie. Se constata totu:;;i, ca modelele
INDSCAL (singurele la care rotatia nu este recomaridata, fiind posibile doar mici
ajustari) condue la hal\i perceptive mai u:;;or interpretabile pe baza pozitiei a
axelor, in timp ce alte proceduri necesita, aproape permanent, rotiri ale axelor
pentru a identifica coreet dimensiunile obtinute.
(2) /mportanta dimensiuni/or pentru fiecare categorie de subiecti (In
engleza "dimension weights" sau "saliences")
Pe baza acestora se observa eventualele diferente Intre subieeti (grupe de
subiecti) In ceea ce prive:;;te gradul de adecvare a dimensiunilor selectate pentru
fiecare categorie de respondenii .. Pentru exemplul nostru, output-ul SPSS ar oferi
urmatoarele rezultate:
293

111'1111,1111 ,il III !II"II' !II II' 111!11'III'IIII'III,lIlli'Ii,!1I III' 111'111111111111"11',
Dimension Weights
Dimension Weights
Dimension
Source 1 2
rara experienta S1 ,480 ,459
Cu experienta S2 ,512 ,416
'.'
,4 ,5 ,6 -,1 o.a
Dimension j
Figura 8.8. Output SPSS cu analiza importantei dimensiunilor pe categorii de subiecti
SPSS este 0 marca Tnregistrata.
Nu exista mari diferente Tntre modul de reprezentare a reactiilor la conflict
de catre cele doua categorii. se observa 0 tendinta din partea
persoanelor cu experienta de a acorda a mai mare importanta primei dimensiuni
(distructiv vs. constructiv) Tn comparatie cu cea de-a doua (WD1 = .512, fata de
WD2 :::: .416). Acest fapt pare normal, pentru lotul de persoane cu experienta Tn
acest domeniu tinand cont ca diferentierea reactiilor pe baza criteriului exprimat Tn
aceasta este mai Tn conflictelor. De notat ca
fiecare dimensiune selectata po ate ave a importanta diferita pentru fiecare
categorie de sUbiecti, chiar pentru fiecare subiect Tn parte. Valorile pot fi cuprinse
Tntre 0 1, unde zero reprezinta lipsa totala de importanta a acelei dimensiuni
pentru categoria de subiecti respeCtiva, Tn timp ce' 1 Tnseamna exclusivitatea
dimensiunii respective. De asemenea, Tntre dimensiuni se pot stabili raporturi Tn
ceea ce importanta acestora. In cazul de fata, raportul importantei dintre
cele doua, dimensiuni este 1,05 Tn favoarea primei dirnensiuni pentru categoria
celor fara experienta Tn solutionarea conflictelor de 1,23 tot Tn favoarea primei
dimensiuni pentru categoria celor cu experienta. Aceste aspecte pot fi, de
asemenea, reprezentate grafic (vezi figura 8,8.).
(3) Spatii individua/e pentru fiecare categorie diferentiata
Prin INDSCAL putem reprezenta grafic, cu scopul de a observa diferentele
dintre acestea, atatea harti perceptive cate categorii au fast ineluse Tn studiu.
Pentru exemplul nostru, vor fi construitedoua asemenea harti, deoarece am
Tmpartit lotul Tn doua categorii semnificative: cu fara experienta Tn solutionarea
conflictelor. Interpretarea acestor grafice se face pe baza' a doua tipuri de
informatii: modificarea Tn configuratia punctelor, respectiv gradul de sau
scadere a amplitudinii axelor. lata celedouagrafice obtinute tot prin SPSS:
294
1
f
I
I
=.lIlIlIllIlIlIlIIlImIIIIIIIIIllIIIIWII
!I, 1111:11111 1IIIIIIIililliilili 1IIIi '1111: 11111'::1111 1111 1:111111111,1111,11111:1111,11111,1111,111111111111,11111111111111111'1111111111 !I,il: Il'li II 'I' ' ii' 111"111'1111 1111: 11111111111 111111 ,11111,111111 !IIII1'111111:11111'111111111111111111'1111111111:1111111111:11111:11111 111111 111111 IIIIII! 111111.11111'11111: 111'1111 'I,
.0
D.D
.,2
'"
e -.4
.2
Grup cu experienta 82
CQMPROMt
SUBMl R
MAN/PULA.
EViTARE
p .
AMANARE
..'
RENUNTA
Q .4;--.,:;-'-,', --'::-,'-;.:--',0--'0"
Dimension 1
Grup tara experienta S1
I.'
,5
D,D
i -.5

E
COMPROMI
EVrrARE
AIo1ANARE
RENUNlA
5 -.'0 -:"c:"-;.,-J,,
Dimension 1
Figura 8.9. Output SPSS 11.0 cu reprezentarea grafica a spatiiJor individua/e
SPSS este 0 marca Tnregistrata.
Configuratia punctelbr nu pare a fi modificata, dovada fiind echivalenta
relaiiei dintre reprezentate Tn cele doua grafice. am putea
a tendintade a dimensiunii 2 pentru grupul S1 a dimensiunii 1
pentru grupul S2. Cum s-ar interpreta acest lucru? Persoanele din grupa celor fara
experientatind sa utilizeze mai frecvent dimensiunea pasiv-activ Tn gruparea
datelor. Similar, persoanele cu experienta Tn 80lutionarea conflictelor tind sa aiba 0
putere discriminativa mai mare Tn ceea ce dimensiunea distructiv _
constructiv a obiectelor apreciate. Diferentele observate, bazate pe aspectele
prezentate grafic Tn figura 8.9 sunt mici, interpretarea fiind fortata Tn cazul de
fata.
8.4. Modele de scalare muitidimensionaia conexe
8.4.1. Modele MDS constranse
in cercetare Tntalnim frecvent situatii Tn care avem date anterioare care
pot fi integrate Tn configuratiile MOS. De exemplu, daca majoritatea studiilor
anterioare In domeniuJ reaciiiJor la conflict of ere au ca dimensiune definitorie in
construirea hartii perceptive gradul de distructivitate - constructivitate a reactiei,
atunci am putea constrange harta perceptiva sa contina aceasta dimensiune din
start. Constrangerea duce automat la configurarea punctelor de pe harta pe
parcursul unei dimensiuni, astfel Tncat la un capat sa se afle reactiile distructive, iar
la celalalt reactiile constructive, Pentru a constrange stimulij de pe harta este
nevoie de configurarea initiala a acestora Tntr-un alt Din pacate, prin
utilizarea acestei metode toate dimensiunile selectate trebuie constranse. SPSS-ul
295
, " 'II 'II' "111'1111'1111111111'1111111111111111111111111111111:1111,1111111111111111111'11111'1111"1111'1111'11III 'IIII! !IIII 1111 'III! illl 111'1111 III' il!' ,III !III III '111 111,,111'111:111 ill' Iii !I! illl' 1111 1111 III: III, !I! III' 'II! 1111 III, illl 1111 III, "", 1111 :11: ,II, Ii: ill ii, :11 i!1 II I !IIIIIIII 1111 11111 1111,11111,1111 IIII! 1111 !IIII 1111 I,l, II III !illlllllllll I ___ ---II-IIJIIIII'II' 'II 'II' II' 'II' III II' 'II 11'11111111' 1111
doua posibilita\i in aceasta directie: identificarea directa a dimensiunilor,
astral Tncat fiecarei axe sa-i corespunda un atribut i realizarea unei combinatii
IInlare intre atribute in definirea unei dimensiuni. Prin acest tip de MDS nu
trebuie dimensiunile insa raman valabile celelalte aspecte ca: stabilirea
gradului de adecvare a numarului de dimensiuni ales, interpretarea configuratiei
punctelor, eventual observarea diferentelor interindividuale sau intergrup.
8.4.2. Modele MDS extinse
Aceste modele permit realizarea de harti perceptive' pornind de la
preferiniele subiec\ilor chestionati. Daca toate modele Ie discutate anterior aratau
cat de apropiate sau de diferite sunt unele obiecle in perceptia, oamenilor,
modelele extinse (unfolding) se finalizeaza prin harti .perceptive obtinute pe baza
preferintelor respondentilor pentru obiectele studiate. De cele mai multe ori, astfel
de date se prezinta sub forma unei matrice rectangulare, in care fiecare linie
reprezinta rezultatele unui subiect. in plus, haria perceptiva va contine nu numai
obiectele, ca Tn cazul datelor de similaritate, ci i subiectii, pozitionati grafic In
functie de preferintele exprimate.
Tn general exista doua abordari ale modelelor extinse (Hair, Anderson,
Tatham, Black, 1998). Abordarea explicita consta in includerea unui obiect ideal
intre stimuli, urmand apoi procedura c1asica de stabilire a gradului de similaritate
dintre obiecte. Problema Tn cazul acestei abordari consta Tn tendinta subiectilor de
a piasa acest obiect ideal, fie foarte departe de celelalte, fie [oarte aproape de un
alt stimul.preferat. Mai mUlt, prin aceasta metoda este greu sa decelam daca
subiectii au reuit sa aprecieze Tn comparatiile dintre obiecte, gradul de similaritate
existent i nu criteriul preferiniei. Din aceste considerente' este preferabila
abordarea implicita. Ea poate fi realizata pe baza unei analize interne sau externe.
Analize interne !?i externe
Analiza interna implica ideea stabilirii direcle a ierarhiei preferintelor
fiecarui subiect pentru obiectele incluse in studiu. Datele sunt adunate
matrice rectangulara, care Tn cazul exemplului dat are 10 coloane (10 reactii la
conflict studiate) i 6 linii (6 subiecti chestionati) (vezi baza de date "scalare
preferinte.sav"). In urma aplicarii MDS corespunzatoare (versiune disponibila i in
Base System), vom obiine 0 harta perceptiva ce include atat obiectele-
stimul, cat i subiectii. Mai mult, printr-o prelucrare secundara, similara celei
prezentate anterior, se poate pozitiona :;;i un vector al preferintei subiec\i1or,
rezultat dintr-o medie a raspunsurilor acestora. Interpretarea configura\iei punctelor
pe harta se face intr-o maniera asemanatoare cu modelele MDS c1asice. Astfel,
daca doua puncte (fie ele stimuli :;;i/sau subiec\i) sunt reprezentate grafic apropiat
unul de celalalt, ele sunt percS'pute ca fiind apropiate :;;i din punctul de vedere al
296
preferintelor exprimate. Similar, distantele mai mari dintre un subiect i un anumit
stimul indica a preferinia scazuta pentru obiectul respectiv.
Analiza externa consta in stabilirea poziiiei unui punct ideal intr-o
configuraiie iniiiaia construita pe baza similaritaiii dintre stimuli. Pentru a realiza
aceasta analiza yom ave a nevoie de colectarea datelor referitoare atat la
similaritate, Gat i la preferinta. Configura\ia initiala este construita pe baza
similaritatii dintre stimuli. Pe baza acestora se pot stabili puncte ideale sau cercuri
(zone) grafice incarcate cu grade diferite de preferinta. Dinpacate, SPSS-ul nu
poate integra ambele proximitaii pentru a realiza analiza externa, dei poate
. efectua separat ambele operatii. Programul destinat acestui tip de analiza, denumit
PREFMAP, se gasete insa in pachetul MDS(X). Tinand cont de conditiile
prezentate, yom exemplifica modul cum se interpreteaza 0 analiza interna,
disponibila i prin SPSS.
1.5 .,---------;""'""'"'"'m'. -r""""-""""'-------,
D
su jrtare
1,0 0
,5

Row3
RoWS
e
Row 6
c
0,0
c
,,5
a itra/ Aow4
D
C\l -1,5
:5
-2,0
renuntare
c
____
2 1
Dimension 1
Figura 8.10. Output SPSS 11.0 prelucrat cu reprezentarea graficii a
observatiilor i atributelor a MOS unfolding
SPSS este 0 Tnregistrata.
Din aceasta reprezentare grafica se observa tendin\a subiec\ilor 2 :;;i 4 de a
prefera medierea :;;i arbitrajulca modalitati de reactie, precum :;;i a subiectilor 1,3,5,
i 6 de a prefera cooperarea, confruntarea i compromisul. Mai mult, exista 0
tendint
a
medie la nivelul Tntregului e:;;antion de a opta pentru aceste reactii la
conflict, :;;i in special pentru cooperare :;;i confruntare. Tn schimb, se observa ca
subminarea, manipularea, evitarea, renuntarea sau amanarea nu starn esc prea
multe simpatii, prima fiind la nivelul intregului e:;;antion :;;i cea mai putin agreata
dintre toate formele de reactie.
Vectorul preferinielor a fost obtinut Tntr-o maniera similara cu cea descrisa
la adecvarea vectoriala a atributelor. Variabilele independente incluse sunt date tot
de coordonatele spatiale ale obiectelor evaluate (nu :;;i ale subiectilor), Tn limp ce
variabila dependenla poate fi media (mediana) rangurilor acordate In ceea ce
297
privett. pr.t.rlll\tllliI lubltlc\lIor pentru fiecare obiect. Tn exemplul nostru, corela\ia
,mlltlplA nbllnuti ,,,tr. leellte elemente a perm is constituirea unei axe preferin\a vs.
"1lI11r11'1IIi1,tl (R - .945; bntn dim1 = beta dim2 = -.073) Intr-un spa\iu
IlitUIIllllltillllUl1 (BIroI'! 2 .... 105).
8.5. Incursiunc in optiunile SPSS
SPSS-ul Base System (SPSS 11.0) ofera doua optiuni de introducere a
date lor. In modelul clasic, fiecare coloana reprezinta 0 variabila fiecare lin ie,
rezultatele unui anumit subiect. Tn modelul matriceal, datele sunt masuratori medii
ale proximita\ii dintre obiecte. Din nefericire, a doua optiune, nu este adecvata
pentru modele de tip INDSCAL. Selectand butonul "shape" In "data are distances"
avem trei optiuni de matrice: simetrice (cazul compararii fiecarei perechi de
obiecte), asimetrice (cazul testelor sociometrice) 9i reclangulare (modele
unfolding). Daca optam pentru "create data from distance", vom putea utiliza
modelul obi9nuit de introducere a datelor. Cele mai importante aspecte care
trebuie seledate aici sunt modul de masurare a datelor, cu variantele aferente
fiecarei situatii, respectiv standardizarea sau nestandardizarea variabilelor:
Variabilele trebuie standardizate dae::a nu sunt masurate cu aceea9i unitate de
masura. ApasE'md butonul "Continue" revenim In fereastra principala, unde putem
selecta tipul de model MDS. In cadrul MDS metrice putem alege variantele interval
sau raport, in funclie de datele avute, iar pentru modelele non-metrice, varianta
ordinal.
De asemenea, putem decide Intre un model sintetic, ALSCAL (Euclidian
Distance) 9i unul analitic, INDSCAL (Individual differences euclidian distance). In
plus, putem selecla numarul de dimensiuni dorite pentru care sa obtinem indicatorii
statistici de adecvare (ex. Stres). Deosebit de importanta este stabilirea tipultii de
conditionalitate. Exista trei optiuni: "matrix" - pentru datele introduse direct ca
distante in matrice; "row" - pentru modele MDS unfolding; "unconditional" - pentru
cazurile "create distances from data". Dupa alegerea modelului adecvat 9i
apasarea butonului "continue", vom putea apasa "options" pentru a selecla, Tn
principal, modalitatea Tn care dorim sa arate output-ul. Pe langa aceste op\iuni, prin
sintaxa putem apela la alte doua modele MDS importante: GEMSCAL, pentru
'situatii Tn care testam aceia9i subiecti de mai multe ori 9i ASCAL, pentru matrice , ,
asimetrice.
SPSS Categories of era, Incepand cu versiunea 10.0, procedura
PROXSCAL. Aceasta reprezinta un progres in MDS, fiind preferabila utilizarea ei
in comparatie cu procedurile ALSCAL. Manualul SPSS Categories (Meulman 9!
Heiser, 2001) of era mai multe amanunte legate de modul de utilizare a acestel
proceduri 9i, Tn plus, unele informatii sunt similare cu cele prezentate anterior.
Acestea sunt, foarte pe scurt, op\iunile ce trebuie selectate in principalele tipuri de
scalare multidimensionala.
298
""""""""""""'"""'""11"1111111111'11111'11111 1111' 1111'lllllill111111111!1111111111111111'1111"lIIi!II:II"I,
Utilizarea modelelor analitice necesita formarea mai multor matrice, in timp
ce MDS slntetice au ca design prezentarea datelor Tntr-o singura matrice. Tn cazul
exemplului nostru, am optat pentru un model echivalent INDSCAL (Weighted
Euclidian). Pa9ii urma\i pentru rezultatelor prezentate Tn capitolul de fata
(cu excep\ia MDS conexe) au fost: .. ., ..
1) introducerea datelor In SPSS sub forma unel matnce Simetrrce (vezl flgura
8.3.);
2) selectareaop\iunii MDS PROXSCAL;
3} alegerea optiunilor: "The data are proximities"; "Multiple matrix source";
The proximities are stacked matrices across columns" 9i apoi "Define";
4) j'ntroducerea variabilelor - reactii la conflict in "proximities" 9i selectarea
variabilei referitoare la experienta subiec\ilor in situatii de conflict in
"source";
5) ca model a Weighted Euclidian (INDSCAL); "Iower-triaungular
matrix"; "ordinal untie tied observations"; "dissimilarities"; "within each
source separately"; "minim2"; "maxim 3"; iar apoi "continue";
6) accesarea butonului "Plots" 9i selectarea op\iunilor: "comon space";
spaces" 9i "individual weights" (optional putand fi seleetate 9i
celelalte grafice pentru a urmarl gradul de adecvare a soluiiei);
7) seleclarea altar opiiuni-output, in func\ie de aspectele de interes avute.
Tn fine, pentru MDS constranse, cercetatorul poate interveni apeland
butonul "restrictions", iar pentru modele unfolding, poate utiliza opiiunea "the
proximities are in a single column".
BIBLIOGRAFIE
*** (2001). SPSS Base 11.0. User's guide. Chicago: SPSS Inc.
Bogathy, Z. (2002). Conflicte Tn organiza(ii. Timioara: Editura Eurostampa.
Carroll, J.D. & Green, P.E. (1997):Psychometric methods in marketing research: part 11,
multidimensional scaling. Journal of Marketing Research, 34, 193-204.
Coxon, A.P.M. (1982). The user's guide to multidimensional scaling with special reference to
the MDS(X) library of computer programs. London: Heinemann Educational Books Ltd.
Fransella, F. & Bannister, D. (1977). A manual for repertory grid technique. New York:
Academic Press. .
Hair, J.F. Jr., Anderson, R.E., Tatham, R.L., i Black, W.C. (1998). Multivariate data analysis
(5
th
ed.).Upper Saddle River, NJ: Prentice Hall.
Jones, L.E. & Koehly, L.M. (1993). Multidimensional Scaling. Tn G. Karen & C. Lewis (Eds.).
. A handbook for data analysis in the behavioral sciences: methodological issues (p. 95-
163). Hillsdale, NJ: Lawrence Erlbaum Associates. . . . nd
Kachigan, S.K. (1991). Multivariate statistical analysis. A conceptual introductIOn. (2 ed.).
New York: Radius Press.
299
111111111';111111111111111,1111111111111111111111111'1111111111"1111I 111111 11111111111111111111111111 111111:11111;111111 IIIIII!IIIIIIIIIIIIIIIIIII:III;:I!IIIIIIIIIIIIIIIIIIIIIIIII!:IIII IIII! 1111 1111 "'IIIIIIIIIIIIIII!III:III'IIIIIIIIIIIIIIII :111 !III !I! 111I III'!III 11111111'11111111
'
1111"11111111 '1111111""1111111"11111"11""""""""11",""1"11"","11"",,""1"1
1
"",1"' ""
1
"11111 'II III !! III
I\lu[lkml, J.B. & Wish, M. (1994). Multidimensional scaling. Tn M.S. Lewis-Beck (ed.).
IlIltJmat/onal handbooks of quantitative applications in the social sciences. VoIA-
Basic meaSurement (p. 301-387). Loridon: Sage Publications.
J.J. & Heiser, W.J. (2001). SPSS Categories 11.0. Chicago: SPSS Inc.
Nolulasrs, G. (2002). Multidimensional scaling. Experimenting with PROXSCAL. Gasi! la
adresa http://homeusers.brutele.be/nova-in rctiNederl/NavNOV A_r5_ c 1 .htm#website.
Ilt1Ofldes, J.A. & Arnold, J.A. (1999). The cognitive representation of responses to social
conflict: the development of an integrative taxonomy. The International Journal of
Conflict Management, 10(4), 360-384.
E. (1983). Tabele i formule matematice. Bucure!?li: Editura Tehnidl.
Rotariu, T., Badescu, G., Culic, I., Mezei, E., Mure!?an, C. (1999). Metode statistice aplicate
Tn tiintele sociale (p. 254-271). la!?i: Polirom,.
Sialans, L.J. (1995). Multidimensional scaling. Tn L.G. Grimm & P.R. Yarn old (eds). Reading
and understanding multivariate statistics (p. 137-168). Waghington, DC: APA.
Tsogo, L., Masson, M.H., & Bardol, A. (2000). Multidimensional scaling methods for many-
object sets: A review. Multivariate Behavioral Research, 35(3),307-319.
van Deun, K. & Delbeke, L. (2000). Multidimensional scaling. Gasi! la adresa:
http://www.rnathpsyc.uni-bonn.de/doc/delbeke/delbeke.htm.
300
j
1
I
r
J

1 ,
,'i
, "il:
J
I
"":,',1:, "
" ,

You might also like