You are on page 1of 29

STATSTK-II

Korelasyon ve Regresyon

Korelasyon ve Regresyon
Genel Bak Korelasyon Regresyon Belirleme katsays Varyans analizi Kestirimler iin aralk tahminlemesi
2

Genel Bak
kili veriler
aralarnda bir iliki var mdr? varsa bu iliki bir eitlik ile temsil edilebilir mi? bu eitliin kestirimler (ngrmler) iin kullanlmas

Korelasyon

Tanm
Korelasyon bir deikenin deeri deiirken dier bir deiken bununla dorusal ilikili olarak deiiyorsa korelasyon vardr denebilir.
5

Varsaymlar
1. (x,y) ikili verilerden oluan rnek bir ans rneidir. 2. x ve ylerin dal normaldir.

Tanm
Salma diyagram yatay eksen x, dikey eksen y olmak zere, (x,y) ikili rnek verilerinin iaretlendii bir grafiktir. Her bir (x,y) ikilisi tek bir noktadr.
7

rnek
Bir firma bnyesindeki sat personeli says ile sat gelirleri arasndaki ilikiyi bilmek istemektedir.
Yllar 1999 2000 2001 2002 2003 2004 2005 2006 2007 2008 Sat Personeli Says (x) 15 18 24 22 25 29 30 32 35 38 Sat Gelirleri (yz bin $) (y) 1,35 1,63 2,33 2,41 2,63 2,93 3,41 3,26 3,63 4,15
8

kili Verilerin Salma Diyagram


Scatterplot of sat geliri vs personel says
4,5 4,0 3,5 sat geliri 3,0 2,5 2,0 1,5 1,0 15 20 25 30 personel says 35 40

Pozitif Korelasyon
y y y

x
(a) Pozitif (b) Gl pozitif

x
(c) Mkemmel pozitif

10

Negatif Korelasyon
y y y

x
(d) Negatif (e) Gl negatif

x
(f) Mkemmel negatif

11

(g) Korelasyon yok (h) Dorusal olmayan gl iliki

12

Tanm Korelasyon Katsays r


Bir rnekteki x ve y ikili deerleri arasndaki dorusal ilikinin gcn lmektedir. nxy - (x)(y) n(x2) - (x)2 n(y2) - (y)2

r=

13

Korelasyon Katsays rnin zellikleri


1. -1 r 1 2. Mkemmel pozitif dorusal iliki olduunda

r = 1 olur.
3.

Mkemmel negatif dorusal iliki olduunda r = -1 olur.

4. Dorusal iliki yok ise r = 0 olur.

14

Korelasyon ile ilgili hatalar


1. Nedensellik: Korelasyon deikenler arasndaki sebep sonu ilikilerini aklamaz. 2. Dorusallk: x ile y arasnda anlaml bir korelasyon olmad halde, aralarnda farkl ekilde bir iliki olabilir. (Baknz izleyen slayt)

15

Korelasyon ile ilgili hatalar


250 200 150

y
100 50

16

rnek Verileri in Korelasyon Hesaplamalar


Yllar 1999 2000 2001 2002 2003 2004 2005 2006 2007 2008 Toplamlar Sat Personeli Says (x) 15 18 24 22 25 29 30 32 35 38 268 Sat Gelirleri (yz bin $) (y) 1,35 1,63 2,33 2,41 2,63 2,93 3,41 3,26 3,63 4,15 27,73 x2 225 324 576 484 625 841 900 1024 1225 1444 7668 y2 1,8225 2,6569 5,4289 5,8081 6,9169 8,5849 11,6281 10,6276 13,1769 17,2225 83,8733 xy 20,25 29,34 55,92 53,02 65,75 84,97 102,3 104,32 127,05 157,7 800,62

17

rnek Verileri in Korelasyon Hesaplamalar


r= r=
nxy - (x)(y) n(x2) - (x)2 n(y2) - (y)2

(10)(800,62) - (268)(27,73) (10)(7668) - (268)2 (10)(83,8733) - (27,73)2

r = 0,987

Gl pozitif korelasyon

18

Anaktle Korelasyon Katsaysnn Testi


(anlaml bir korelasyon yoktur) (anlaml bir korelasyon vardr)

= Anaktle korelasyon katsays H0: = 0

H1: 0

19

Test statistii t
Test istatistii:

t=

r
1-r2 n-2

Kritik deerler

serbestlik derecesi = n - 2 olan tablo deerleri dikkate alnarak karar verilir.


20

Ret Blgeleri

21

Anaktle Korelasyon Katsaysnn Testi


(sat personeli says ile sat gelirleri arasnda anlaml bir korelasyon yoktur) (sat personeli says ile sat gelirleri arasnda anlaml bir korelasyon vardr)

= Anaktle korelasyon katsays H0: = 0

H1: 0

22

Test statistii t
Test istatistii:
0,987 1 0,987 2 10 - 2

t=

r
1-r n-2
2

= 17,39

serbestlik derecesi = n - 2 = 10 2 = 8, = 0,05 iin t0,025, 8= 2,31 < 17,39 Karar: H0 ret. Korelasyon anlamldr.

Kritik deer

23

Regresyon
x bamsz deiken (aklayc
deiken)

y baml deiken (cevap = yant


deikeni)

y = b0 + b1x + e

Basit dorusal regresyon modeli

b1 = eim

b0 = kesen
24

Regresyon
Regresyon Eitlii
Verilen bir ikili veriler topluluu iin regresyon eitlii,

^ y = b0 + b1x
iki deiken arasndaki ilikiyi tanmlamaktadr.

b1 = eim

b0 = kesen

Regresyon Dorusu
Regresyon eitliinin grafiidir.
25

Regresyon Dorusu
Scatterplot of sat geliri vs personel says
4,5 4,0 3,5 sat geliri 3,0 2,5 2,0 1,5 1,0 15 20 25 30 personel says 35 40

26

Notasyon
Anaktle Parametresi rnek istatistii

Regresyon eitliinde kesen Regresyon eitliinin eimi

0 1
^

b0 b1
y = b0 + b1 x

Regresyon modeli ve eitlii y = 0 + 1 x +

27

Artklar ve En Kk Kareler Yntemi


Artklar e = (y - ^) y En Kk Kareler Yntemi

e2yi minimum yapan b0 ve b1 deerlerinin bulunmasdr.

28

0 and 1 iin En Kk Kareler


Tahminleyicileri
n(x ) - (x)
2 b0 = (y) (x2) - (x)2 (xy)

b1 =

n(xy) - (x) (y) n(x2) - (x)2

29

nce b1 bulunursa, ardndan

b0 = y - b1x

30

Sat geliri iin regresyon eitliinin tahminlenmesi


b1 = b1 =
n(xy) - (x) (y) n(x2) - (x)2
10(800,62) - (268) (27,73) 10(7668) - (268)2

b1 = 0,118
b0 = y - b1x = 2,773 (0,118)(26,8) = 0,398
31

Kestirimler (ngrmler)
Verilen bir x deeri iin ynin deeri ne olur?..
Eer anlaml bir korelasyon varsa, en iyi ngrlen y deeri, x deerinin regresyon eitliinde yerine konulmasyla bulunur. nemli Not: Regresyon dorusu yalnzca tahminlemede kullanlan x uzay iinde geerlidir. Mevcut xlerden uzak bir noktada ngrmleme yaplmamaldr.

32

30 sat personeli altnda sat gelirinin kestirilmi deeri nedir?

y = - 0.398 + 0.118 (30)


^ y = 3.1516,

315160 $

33

Toplam Deikenlik, Aklanan Deikenlik ve Aklanamayan Deikenlik


y
20 19 18 17 16 15 14 13 12 11 10 9 8 7 6 5 4 3 2 1 0

(5, 19)

Toplam deikenlik (y - y ) (5, 13)

Aklanamayan deikenlik ^ (y - y ) Aklanan deikenlik (^ - y) y

(5, 9) ^ y = 3 + 2x

y=9

x
0 1 2 3 4 5 6 7 8 9

34

(toplam deikenlik) = (aklanan deikenlik) + (aklanamayan deikenlik)

(y - y) =

^ (y - y)

(y - ^ y)

(toplam deikenlik) = (aklanan deikenlik) + (aklanamayan deikenlik)

^ (y - y) = (y - y)

^ + (y - y)

(Genel kareler toplam) = (regresyon kareler toplam) + (artk kareler toplam)

35

Tanm
Belirleme Katsays
ydeki deikenliin ne kadarnn regresyon dorusu tarafndan aklanabildiini syler.

r2 = r2 =

Regresyon kareler toplam Genel kareler toplam

^ (y - y)2 = (y - y)2

RKT GKT
36

^ (y - y)2

b12( x2 (x)2/n) y2 (y)2/n

(y - y)2

0,1182(7668 (268)2/10) 83,873 (27,73)2/10

= %97,4

ydeki deimelerin %97,4 regresyon dorusu ile aklanabilmektedir.


37

Varyans Analizi Tablosu (VAT)


Deikenlik Kareler Kayna Toplamlar (KT)
Regresyon

Serbestlik Kareler Derecesi Ortalamas (KO)


Regresyon KO = RKO = RKT / 1 Artk KO = AKO = AKT / (n 2) = S2

F-Oran

RKT = b12( x2 (x)2/n) 1 Artk Kareler Toplam AKT = GKT - RKT


n-2

Artk

F=

RKO AKO

Toplam (Genel)

Genel Kareler Toplam GKT = y2 (y)2/n

n-1

38

Hata Varyansnn Tahmini


n-2 Ortalamas

^ 2 2 = (y - y) = Artk Kareler s

Tahminin Standart Hatas

s=

(y - ^ 2 y)
n-2
39

F - Testi
H0: 1 = 2 = ... = k = 0 H1: en az bir i iin i 0

(Model anlamszdr) (Model anlamldr)

40

F Testi (Basit Dorusal Regresyon in)


(Model anlamszdr) (Model anlamldr) Test statistii = F oran Ret Blgesi = F > F, 1, (n 2) ise H0 RET.
41

H0: 1 = 0

H1: 1 0

Varyans Analizi Tablosu (VAT) (Sat Gelirleri rnei)


Deikenlik Kareler Kayna Toplamlar (KT) Serbestlik Kareler Derecesi Ortalamas (KO)
Regresyon KO = RKO = RKT / 1 1

F-Oran

RKT = b12( x2 (x)2/n)


Regresyon

= 0,1182(7668 (268)2/10) = 6,7982 Artk Kareler Toplam AKT = GKT RKT = 6,9780 - 6,7982 = 0,1798 GKT = y2 (y)2/n

= 6,7982 / 1 = 6,7982
Artk KO = AKO = AKT / (n 2)

F=
F=

RKO AKO
6,7982 0,0225

Artk

n2= 10 2 = 8

= 0,1798 / 8 = 0,0225

= 302,41

Toplam (Genel)

= 83,873 (27,73)2/10 = 6,9780

n1= 10 1 = 9

42

F Testi (Sat Gelirleri rnei in)


(Model anlamszdr) (Model anlamldr) Test statistii = F oran = 302,41 Karar = F = 302,41 > F0,05, 1, 8 = 5,32 H0 RET.
43

H0: 1 = 0

H1: 1 0

Anaktle Regresyon Katsayslarnn Testi


1 = Anaktle regresyon
katsays H0: 1 = 0 (X1 iin)

(1 anlamszdr) (1 anlamldr)
44

H1: 1 0

Test statistii t
Test istatistii:

t=

b1 Sb1

Sb1 = b1in standart hatasdr. Sb1=


S (x2 (x)2/n)

45

Kritik deerler

serbestlik derecesi = n - 2 olan tablo deerleri dikkate alnarak karar verilir. |t | > t /2, n 2 ise H0 RET.

46

Anaktle Regresyon Katsayslarnn Testi (Sat Gelirleri rnei) 1 = Anaktle regresyon


katsays H0: 1 = 0 (X1 iin)

(1 anlamszdr) (1 anlamldr)
47

H1: 1 0

Test statistii t
Test istatistii: b1
0,118

t=

Sb1

0,006804

= 17,39

Sb1 = b1in standart hatasdr. Sb1=


S (x2 (x)2/n) = 0,1499 (7668 (268)2/10)
48

=0,006804

serbestlik derecesi = n - 2 olan tablo deerleri dikkate alnarak karar verilir. = 0,05 olsun. |17,39 | > t /2, n 2 = t 0,025, 8 = 2,306 H0 RET. 1 anlamldr. Basit dorusal regresyonda t2 = F olmaktadr.
49

Kritik deerler

Anaktle Regresyon Katsayslarnn Testi


0 = Anaktle regresyon
modelinde sabit terim
(0 anlamszdr) (0 anlamldr)
50

H0: 0 = 0

H1: 0 0

Test statistii t
Test istatistii:

t=

b0 Sb0

Sb0 = b0in standart hatasdr. Sb0=


S x2 n(x2 (x)2/n)

51

Kritik deerler

serbestlik derecesi = n - 2 olan tablo deerleri dikkate alnarak karar verilir. |t | > t /2, n 2 ise H0 RET.

52

Anaktle Regresyon Katsayslarnn Testi (Sat Gelirleri rnei) 0 = Anaktle regresyon


modelindeki sabit terim H0: 0 = 0
(0 anlamszdr) (0 anlamldr)

H1: 0 0

53

Test statistii t
Test istatistii: - 0,398 b0

t=

Sb0 Sb1=
S x2 n(x2 (x)2/n)

0,1884

= - 2,11
(0,1499) (7668)

(10)(7668 (268)2/10)

=0,1884
54

serbestlik derecesi = n - 2 olan tablo deerleri dikkate alnarak karar verilir. = 0,05 olsun. |- 2,11 | < t /2, n 2 = t 0,025, 8 = 2,306 H0 REDDEDLEMEZ. 0 anlamszdr.

Kritik deerler

55

E(y) Deeri in Kestirim Aral


^ y ^ - E < E(y) < y + E

Burada E = t/2,n - 2 s
n + n(x2) - (x)2
1

n(x0 - x)2

x0, xin verilen bir deeridir. ^ Karekk iindeki ifade ile Snin arpm ise x0daki y deeri iin standart hatadr. Standart hata en dk deerini x0 = x olduunda alr.
56

E(y) Deeri in Kestirim Aral


x0 = 30 personel iin satlarn beklenen deeri %95 gven ile hangi aralkta gerekleir? 3.1516

- E < E(y) < 3.1516 + E


1
10

E = (2,306)(0,1499)

(10)(30 -26,8)2 (10)(7668) - (268)


2

E = (2,306)(0,01815) = 0,04186

3,1097 < E(y) < 3,1935


57

You might also like