You are on page 1of 19

Regresyon ve Korelasyon Analizi

Regresyon Analizi

Do.Dr. Suat AHNLER

Regresyon Analizi
Regresyon analizi, aralarnda sebep-sonu ilikisi bulunan iki veya daha fazla deiken arasndaki ilikiyi belirlemek ve bu ilikiyi kullanark o konu ile ilgili tahminler (estimation) ya da kestirimler (prediction) yapabilmek amacyla yaplr. Doada birok olayda sebep-sonu ilikisine rastlamak mmkndr. rnek: Sebep Sonu Gelir Harcama Ya Boy Gbre Verim Yem miktar St miktar alma sresi Alnan not Bu analiz tekniinde iki (basit regresyon) veya daha fazla deiken (oklu regresyon) arasndaki iliki aklamak iin matematiksel bir model kullanlr ve bu model regresyon modeli olarak adlandrlr. Bu ksmda anlalmas daha kolay olduu iin basit regresyon analizi anlatlmtr.

Do.Dr. Suat AHNLER

Regresyon Analizi
Basit regresyon modeli

Y=+X+
eklinde bir baml ve bir de bamsz deiken ieren bir modeldir. Burada Y; baml (sonu) deiken olup belli bir hataya sahip olduu varsaylr. X; bamsz (sebep) deikeni olup hatasz lld varsaylr. ; sabit olup X=0 olduunda Ynin ald deerdir. ise regresyon katsays olup, Xin kendi birimi cinsinden 1 birim deimesine karlk Yde kendi birimi cinsinden meydana gelecek deime miktarn ifade eder. ; tesadfi hata terimi olup ortalamas sfr varyans 2 olan normal dal gsterdii varsaylr. Bu varsaym parametre tahminleri iin deil katsaylarn nem kontrolleri iin gereklidir.

Do.Dr. Suat AHNLER

Regresyon Analizi
Parametrelerin (Katsaylarn) Tahmini Bir regresyon modeli oluturulurken genelde en-kk kareler ve en byk olabilirlik (maximum likelihood) teknikleri olarak bilinen iki yaklamdan birisi kullanlr. Eer hata teriminin normal dalm gstermesi eklinde bir varsaym varsa en byk olabilirlik, hata teriminin dal ile ilgili herhangi bir varsaym sz konusu deilse en-kk kareler teknii kullanlarak parametreler tahmin edilir. En-kk kareler teknii kullanlarak parametrelerin nasl tahmin edildiini rnek bir veri grubu zerinde ksaca zetleyelim.

Boy(cm) (X) 9 15 6 24 32

evre(cm) (Y) 5 6 4 12 19

Do.Dr. Suat AHNLER

Regresyon Analizi
Tabloda verilen X ve Y deikenlerine ait be gzlem ifti, koordinat eksenlerine yerletirildiinde elde edilen serpme diyagramnn ekil (a)daki grafik elde edilir.
Y 20 16 12 8 4 0 0 5 10 15 20 25 30 35 X
Y 20

16

12

0 0 5 10 15 20 25 30 35 X

(a)

(b)

ekil (a)da verilen noktalar temsil eden regresyon dorusu oluturulursa ekil (b) elde edilir. Uydurulan regresyon dorusu ile gzlem noktalar arasndaki fark hata () olarak isimlendirilir. Regresyon dorusuna ait parametreler yle tahmin edilmelidir ki; doru ile gzlem noktalar arasndaki fark (hata) en az olsun. Bunu salayacak teknik ise en-kk kareler tekniidir
Do.Dr. Suat AHNLER 6

Regresyon Analizi
Yukarda verilen basit regresyon modelinden e ekilirse yani;

Y = + X i + = Y X i
olur. Burada hata teriminin tm gzlemler iin kareleri alnr ve toplanrsa (Hata Kareler Toplam (HKT);

i =1

2 i

= (Yi X i ) 2
i =1

olur. En-kk kareler tekniinde, HKTn en kk yapabilmek iin yukardaki ifadenin nce ya gre trevini alp sfra eitleyerek
i =1 n 2 i

=0

(Y X i ) 2
i =1

=0
n

n +

X
i =1

= Yi
i =1

(Normal denklem 1)
7

Do.Dr. Suat AHNLER

Regresyon Analizi
daha sonra da ya gre trevini alp sfra eitleyerek


i =1

2 i

=0

(Y X i ) 2
i =1

n n

=0
n

2 X i + X i = X i Yi i =1 i =1 i =1

(Normal denklem 2)

eklinde normal denklemler olarak isimlendirilen iki bilinmeyenli iki denklem elde edilir. Normal denklemlerin iki bilinmeyenli denklerin zmnde kullanlan deiik yntemlerden birisi kullanlarak zm yapldnda;

X Y
i =1 n i =1

i i

( X i )( Yi ) / n
i =1 i =1 2 i

( X i ) 2 / n
i =1

Sxy Sxx

Do.Dr. Suat AHNLER

Regresyon Analizi
ve

Y
i =1

X
i =1

= Y X

eitlikleri elde edilir. Bu eitlikler ile regresyon dorusu denkleminde yer alan ve HKTn en az yapacak parametreler tahmin edilir. Bylece, en-kk kareler regresyon dorusu denklemi

Y = + X i

Do.Dr. Suat AHNLER

Korelasyon Analizi
Regresyon Katsaysnn nem Testi: Hipotezler Ho: =0 H : 0 Kullanlacak test istatistii

t=

S
2 S y. x

~ t n -2,/2 olup burada;

S =

S xx

[ S yy ( S xy ) 2 / S xx ] /(n 2) S xx

Do.Dr. Suat AHNLER

10

Korelasyon Analizi
Korelasyon Analizi ki deiken arasndaki ilikinin derecesini ve ynn belirlemek amacyla kullanlan istatistik yntemlerden birisidir. Deikenlerin baml veya bamsz olmas dikkate alnmaz. Deiik ekillerde hesaplanan ve deiik amalar iin kullanlan Pearson korelasyon katsays, Canonical korelasyon katsays, ksmi korelasyon katsays gibi farkl isimler alan korelasyon katsaylar vardr. Bunlardan Pearson korelasyon katsays r ile gsterilir ve
n n X iYi X i Yi / n i =1 i =1 i =1 r= = 2 2 n n n n X 2 X / n Y 2 Y / n i =1 i i =1 i i =1 i i =1 i n

S XY S XX SYY

forml ile hesaplanr. Korelasyon katsays -1 ile +1 arasnda deien deerler alr (-1 r +1). . Katsay, ilikinin olmad durumda 0, tam ve kuvvetli bir iliki varsa 1, ters ynl ve tam bir iliki varsa -1 deerini alr.
Do.Dr. Suat AHNLER 11

Korelasyon Analizi
Aralarndaki ilikinin derecesi aratrlan deikenlere ait gzlemler serpme diyagramnda incelendiinde, noktalarn dalmna gre korelasyon katsaysnn alabilecei deerler ekilde gsterilmitir.

Do.Dr. Suat AHNLER

12

Korelasyon Analizi Korelasyon katsaysnn yorumunu, tam deerler dnda ara deerler iin yapmak olduka gtr. Ara deerler iin katsay deerlendirirken, rnek gzlem says (n) olduka nemlidir. ok fazla gzleme dayanan deerlendirmelerde 0.25'e kadar dm bir korelasyon katsays bile anlaml saylabilmektedir. Fakat az sayda, 10-15 gzleme dayanan deerlendirmelerde korelasyon katsaysnn 0.71 stnde olmas beklenir. Populasyona gre normal saylacak kadar bir gzlem says alnarak baklm gzlem gruplar iin genellikle, 0-0.49 arasnda ise korelasyon zayf, 0.5-0.74 arasnda ise orta derecede, 0.75-1 arasnda ise kuvvetli iliki vardr denilmektedir. Basit korelasyon analizinden sz edilebilecei gibi, oklu korelasyon analizi yapmak da mmkndr.

Do.Dr. Suat AHNLER

13

Korelasyon Analizi
Korelasyon Katsaysnn nem Testi: Hipotezler Ho: =0 H : 0 Kullanlacak test istatistii

r ~ t n -2,/2 t= Sr

olup burada;

1 r 2 S r= n2

Do.Dr. Suat AHNLER

14

Regresyon ve Korelasyon Analizi rnek: Bir balk tr iin baln boyu(cm) ve vcut evresine (cm) ait deerler aadaki gibidir. Baln boyu ile vcut evresi arasndaki ilikinin dorusal bir iliki olduunu varsayarak a) Bu ilikiyi aklayan regresyon modelini oluturunuz ve regresyonun nem testini yapnz b) Korelasyon katsaysn hesaplayarak nem testini yapnz.
Boy(cm) (X) 9 15 6 24 32 evre(cm) (Y) 5 6 4 12 19 XY 45 90 24 288 608 X2 81 225 36 576 1024 Y2 25 36 16 144 361

Do.Dr. Suat AHNLER

15

Regresyon ve Korelasyon Analizi zm: (a)


Boy(cm) (X) 9 15 6 24 32 86 evre(cm) (Y) 5 6 4 12 19 46
n n

XY 45 90 24 288 608 1055

X2 81 225 36 576 1024 1942

Y2 25 36 16 144 361 582

X Y
i =1 n i =1

i i

( X i )( Yi ) / n
i =1 i =1 2 i

( X i ) 2 / n
i =1

1055 86 * 46 / 5 263.8 = = 0.57 462.8 1942 86 2 / 5

= Y X =

46 86 0.57 * = 0.604 5 5

Bylece, en-kk kareler regresyon dorusu;

Y = 0.604 + 0.57 X i
Do.Dr. Suat AHNLER 16

Regresyon ve Korelasyon Analizi


Regresyon Katsaysnn nem Testi: Hipotezler Ho: =0 H : 0 =0.01

t=

0.57 0 = 7.31 > t5-2,0.01/2=t3,0.005=5.841 olduundan Ho 0.0779 RED edilir.

S =

[ S yy ( S xy ) 2 / S xx ] /(n 2) S xx
n 2

[158.8 (263.8) 2 / 462.8] /(5 2) = = 0.0779 462.8

n 2 S yy = Yi Yi / n = 582 46 2 / 5 = 158.8 i =1 i =1
Do.Dr. Suat AHNLER 17

Regresyon ve Korelasyon Analizi zm (b):


Korelasyon katsays;

r=

263.8 S XY = = 0.973 462.8 *158.8 S XX SYY

Baln boyu ile evresi arasnda % 97.3lk pozitif bir iliki vardr. Bir dier ifade ile baln boyu arttka, evresi de artmaktadr.

Korelasyon Katsaysnn nem Testi: Hipotezler Ho: r=0 H : r0


=0.01

0.973 0 0.973 r t= = = = 7.299 2 0.1333 Sr 1 0.973 52


Do.Dr. Suat AHNLER

> t5-2,0.01/2=t3,0.005=5.841 olduundan Ho RED edilir.


18

Regresyon ve Korelasyon Analizi rnek: nein gnlk yedii yem(kg) ile verdii st(kg) arasnda bir iliki olup olmadn aratrmak amacyla yaplan bir denemeden elde edilen veriler aadaki gibir. a) Bu ilikiyi aklayan regresyon modelini oluturunuz ve regresyonun nem testini yapnz b) Korelasyon katsaysn hesaplayarak nem testini yapnz.

Yem Miktar.(kg) 5 7 9 10 8 6 11

Verdii St Miktar (kg) 12 18 19 22 20 13 25

Do.Dr. Suat AHNLER

19

You might also like