You are on page 1of 12

OLASILIK VE STATSTK

UYGULAMA 5 Regresyon Analizi

HAZIRLAYAN: RAGIP DENZ AHN

Hacettepe niversitesi Fen Fakltesi Akterya Bilimleri Haziran-2006

NDEKLER BALARKEN.1 GR..1 1. SAILIM GRAFKLER.2 1.1. SPSS.....2 1.2. MINITAB.2 1.3. EXCEL......3 2. ELLE ZM...3 2.1.DORUSAL REGRESYON DENKLEMNN BULUNMASI...3 2.1.1. Birinci Yol.4 2.1.2. kinci Yol...4 2.2. KATSAYILAR N HPOTEZ TESTLER..5 2.2.1. Sabit Katsaynn Sfra Eit Olup Olmadnn Testi5 2.2.2. Regresyon Katsaynn Sfra Eit Olup Olmadnn Testi6 2.3. KATSAYILAR N GVEN ARALIKLARI...6 2.3.1. Sabit Katsay in Gven Aral..6 2.3.2. Regresyon Katsay in Gven Aral.6 2.4. KTLEDEK BAIMLI DEKEN N GVEN ARALII....7 2.5. KORELASYON KATSAYISININ BULUNMASI.7 2.5.1. Birinci Yol.7 2.5.2. kinci Yol...........7 2.6. BELRTME KATSAYISI8 3. SPSS LE ZM....8 4. MINITAB LE ZM.....10 TABLO LSTES Tablo 1. On ki Kadna likin Sistolik Kan Basnc (Y) ve yalar (X)..1 Tablo 2. Modelleme ...8 Tablo 3. Dorusal Regresyon Modelinin zeti...8 Tablo 4. ANOVA(b)....8 Tablo 5. Katsaylar (a).....8 Tablo 6. Katsaylar ....10 Tablo 7. Varyans Analizi...10 GRAFK LSTES Grafik 1. Salm Grafii.2 Grafik 2. Salm Grafii.2 Grafik 3. Salm Grafii.....3

BALARKEN Regresyon analizinin temelinde; gzlenen bir olayn deerlendirilirken, hangi olaylarn etkisi altnda olduunun aratrlmas yatmaktadr. Bu olaylarn arasndaki kukulanlan bu ilikinin nicel verilere dayanmas gerekmektedir. Regresyon analizi yaplrken, gzlem deerlerinin ve etkilenilen olaylarn bir matematiksel gsterimle yani bir fonksiyon yardmyla ifadesi gerekmektedir. Kurulan bu modele regresyon modeli denilmektedir. Regresyon analizi yaplrken kurulan matematiksel modelde yer alan deikenler bir baml deiken ve bir veya birden ok bamsz deikenden olumaktadr. Bamsz deikenler kurulacak modelde bir deikenli olarak ele alnrsa, basit dorusal regresyon, birden fazla bamsz deikenli olarak alnrsa, oklu regresyon modeli konusunu oluturmaktadr. Bu aratrma raporunda bir baml deiken ve bir bamsz deikenden oluan veriler kullanlmtr. Bu nedenle dorusal regresyon modeliyle ilem yaplacaktr. Korelasyon katsays hesaplanp, gerekli yorumlar belirtilecektir. SPSS ve MINITAB paket programlarndan yaralanlacaktr. GR Tablo 1. On ki Kadna likin Sistolik Kan Basnc (Y) ve yalar (X).1 Ya(X) 56 42 72 36 63 47 55 49 38 42 68 60 Kan Basnc(Y) 147 125 160 118 149 128 150 145 115 140 152 155 Tablo 1., 12 kadna ilikin sistolik kan basmcn ve yalarn gstermektedir. Burada bu nicel veriler arasnda bir iliki olduundan kukulanlmaktadr. nsanlarn yalar ile kan basnc ilikili midir? Kan basnc ile ya arasnda bir iliki varsa bu iliki ne yndedir? likinin kuvvetlilii iin ne sylenebilir? Kan basnc baml deikendir. Yani aklanan deikendir. Ya ise bamsz deikendir. Alayan deikendir. Kan basnc ya ile aklanabilmekte midir? Sralanan bir ok sorunun yantlar iin dorusal regresyon denklemine, korelasyon katsaysna ve belirtme katsaysna ihtiya vardr. Ayrca; bu katsaylarnn ne lde anlaml olduklar da nemli bir soru iaretidir.

Kaynak: SPIEGEL, M.R., STEPHENS, L.F, Teori Ve Problemlerle statistik, , syf 341 Ek problemler 14.46

Yukarda belirtilmeye allan sorular bu aratrma raporunun temel ilgilerini oluturmaktadr. lerleyen aamalarda bu sorularn yantlar ok ynl olarak incelenecektir. 1. SAILIM GRAFKLER 1.1. SPSS Grafik 1. Salm Grafii2
170

160

150

140

130

Grafik 1. Bamsz deikene karlk gelen baml deikenlerin koordinatlarn gstermektedir. Verileri dalmlar 45 lik bir doru eklindedir. Veriler ayn ynl, pozitif, bir iliki iindedir. Grafik incelendiinde ar u noktalarda veriler bulunmamaktadr. Bu nedenle veriler arasndaki pozitif ilikinin kuvvetli olaca sylenebilir.

120

110 30 40 50 60 70 80

1.2. MINITAB Grafik 2. Salm Grafii3


150+ 135+ 120+ x x x x x x x x

K A N B A S I N C I

x x x

x --+---------+---------+---------+---------+---------+---35,0 42,0 49,0 56,0 63,0 70,0 YAS

2 3

Bu program kts SPSS paket program yardmyla hazrlanmtr. Bu program kts MINITAB paket program yardmyla hazrlanmtr.

Grafik 2., Grafik 1. ile ayn zellikleri tamaktadr. Tek fark MINITAB da hazrlanm olmasdr. 1.3. EXCEL Grafik 3. Salm Grafii4
KAN BASINCI (Baml Deiken)
180 160 140 120 100 80 60 40 20 0 0 10 20 30 40 50 60 70 80 YA (Bamsz Deiken)

Grafik 3., Grafik 1. ve 2. ile ayn zellikleri tamaktadr. Grnt kordinatlar sa tarafta yer almtr. Bunun nedeni x_ekseninin 0 dan balamasdr. MINITAB ve SPSS de ise x_ekseni 30 dan balamaktadr. Raporun bu ve bundan sonraki ksmlarnda giri blmnde ksaca zetlenen sorularn yantlar matematiksel olarak bulunacaktr. 2. ELLE ZM 2.1.DORUSAL REGRESYON DENKLEMNN BULUNMASI Bir baml bir bamsz deikenlerden denkleme dorusal regresyon denklemini denildiini biliyoruz. Baml deiken y( b0 ) ile bamsz deiken ise x ( b1 ) ile gsterilir. Dorusal regresyon denkleminin genel ifadesi aadaki denklem ile ifade edilir.

Bu program kts MICROSOFT EXCEL program yardmyla hazrlanmtr.

y = a + b.x a sabit katsaysdr. b regresyon katsaysdr. a ve b nin bulunmas regresyon denkleminin bulunmas anlamna gelir. Gerekli toplamlarn hesaplanmas:
x = 628 y = 1684
x 2 =34416 xy =89894 y 2 =238822

2.1.1. Birinci Yol


y xy an b a x x2

x b

denkleminin ortak zm ile bulunur.

1684=12a+628b 89894=628a+34416b -1057552 = -7536a - 394384 b 1078728 = 7536a + 412992 b

*-628 *12 18608.b =21176 b=1,14 7536.a = 1057552-394384*1,14 = 607954,24 a=80,67

Yuvarlamalardan dolay kk farklar kabilmektedir. rnein burada 1,138 ancak 1,14 kabul edildiinden a da 0,10 luk bir fark kmtr. Bilgisayar ktlarnda grlecei iin a 80,77 bulunmutur. y = 80,77 + 1,14 b olarak regresyon denklemi bulunur. 2.yoldan sonra regresyon denkleminin yorumu aklanacaktr. 2.1.2. kinci Yol

b=

S xy S xx
xy
x2

a=

y b n

S xy
S xx

1 n 1 n

x
2

y = 89894-1/12*628*1684 = 1764,67

x = 34416-1/12*628*628=1550,67

b=

1764,67 =1,138 1550,67

a=

1684 1,138 * 628 = 80,778 olarak bulunur. 12

y = 80,78 + 1,14.x Bamsz deiken ( ya ) x in sfr olmas anlaml olmadndan 80.78 , sabit katsay anlaml deildir. Bamsz deikendeki ( ya ) bir birimlik deiiklik baml deikeni ( kan basncn) 1,14 artrmaktadr. rnek 1 Ya 65 olan bir kiinin kan basncnn ka olabilir? Kan Basnc= 80,78 + 1,138*65 = 154,75 olmas beklenir. Eldeki verilerin bir rneklem olduu unutulmamaldr. Bu nedenle bulunan regresyon denklemi kesin dorudur. denilemez. Kitle iin regresyon denklemi; y= x eklinde gsterilir. Alfa ve beta iin belirli bir gvenilirlikte hipotez testleri yaplabilir, gven aralklar belirlenebilir. 2.2. KATSAYILAR N HPOTEZ TESTLER 2.2.1. Sabit Katsaynn Sfra Eit Olup Olmadnn Testi Ho: =0 HA: 0 Kitle varyanslar bilinmediinden T-Tablosundan yararlanlacak ve t-test istatistii elde edilecektir. Serbestlik derecesi n-2= 10 olacak ve ift ynl bir test yapldndan yanlma dzeyinin %5 bu soruda /2= 0,025 kullanlacaktr.
t
/ 2 10

= 2,228 dir.
y2
S yy

S yy
Se

1 n b.S xy

y = 238822-1/12*1684*1684=2500,67

n 2

2500,67 1,138 *1764,67 = 7,018 10

tahminin standart hatas

= 8,467 olarak bulunur. 1 X 2 7,018 * 1 2738,78 Se * 12 1550,67 n S xx T-test istatistii, t tablo deerinden byk olduu iin Ho %95 gvenilirlikle red edilir.Kitle sabit katsays %95 gvenilirlikle 0 dan farkldr.

t=

80,778 0

2.2.2. Regresyon Katsaynn Sfra Eit Olup Olmadnn Testi Ho: = 0 HA: 0 Kitle varyanslar bilinmediinden T-Tablosundan yararlanlacak ve t-test istatistii elde edilecektir. Serbestlik derecesi n-2= 10 olacak ve ift ynl bir test yapldndan yanlma dzeyinin %5 bu soruda /2= 0,025 kullanlacaktr.
t
/ 2 10

= 2,228 dir.
S yy b.S xy n 2

Se

2500,67 1,138 *1764,67 = 7,018 tahminin standart hatas 10

t=

b Se * 1 S xx

1,138 0 = 6,3854 olarak bulunur. 1 7,018 * 1550,67

T-test istatistii, t tablo deerinden byk olduu iin Ho %95 gvenilirlikle red edilir. Kitle regresyon katsays %95 gvenilirlikle 0 dan farkldr. 2.3. KATSAYILAR N GVEN ARALIKLARI 2.3.1. Sabit Katsay in Gven Aral

1 X2 1 X2 < < a + t / 2 *S e n S xx n S xx P(80,778 2,228*9,544< <80,778+2,228*9,544)=0,95 P(59,51< <102,04)=0,95


P( a - t
/2

*S e

) = 0,95

Kitle sabit katsays %95 gvenilirlikle 59,51 ile 102,04 deerleri arasndadr. Bu gven aralna bakarak da 2.2.1 deki hipotez test edilebilir. 0 belirtilen aralkta olmad iin Ho red edilir. 2.3.2. Regresyon Katsay in Gven Aral

P( b - t

S xx P( 1,138-2,228*0,1782< P(0,74< <1,535)=0,95

/2

*S e

<

< b+ t

) = 0,95 S xx <1,138+2,228*0,1782 ) = 0,95


/2

*S e

Kitle regresyon katsays %95 gvenilirlikle 0,74 ile 1,54 deerleri arasndadr. Bu gven aralna bakarak da 2.2.2 deki hipotez test edilebilir. 0 belirtilen aralkta olmad iin Ho red edilir. 2.4. KTLEDEK BAIMLI DEKEN N GVEN ARALII rnek 2 rnek1 de hesaplanan 65 yandaki bir bayan iin kan basnc ne olabilir sorusu iin %95 gvenirlikte bir aralk belirleyiniz. x = 65 y = 154,88
1 (X 0 X )2 <Ort.Y<(a+bx 0 )- t / 2 *S e n S xx P(154,75-2,228*3,033<Ort Y<154,75+2,228*3,033)=0,95 P(147,99<Ortalama Kan Basnc< 161,507)=0,95

P((a+bx 0 ) - t

/ 2 *S e

1 n

(X 0 S xx

X )2

)= 0,95

Kitle iin 65 yandaki bayanlarn kan basnlarna baktmzda ortalama olarak kan basncnn %95 gvenilirlikle 147,99 ile 161,51 arasnda olmas gerekmektedir. 2.5. KORELASYON KATSAYISININ BULUNMASI 2.5.1. Birinci Yol r=
S xy S xx .S yy

1764,67 1550,67 * 2500,67

= 0,8961394

Yorumu 2.Yolla zmden sonra aklanacaktr. 2.5.2. kinci Yol r=

Xi Xi X

X Yi
2

Y Yi Y
2

= 0,89

Korelasyon katsays sfrdan byk olduu iin ayn ynl pozitif bir iliki vardr. Yani kadnlarn yalar arttnda kan basnlar artmakta, yalar azaldnda ise kan basnc azalmaktadr. Korelasyon katsays +1 e yakn olduu iin de deikenler arasnda kuvvetli bir iliki olduu sylenebilir.

2.6. BELRTME KATSAYISI Belirtme Katsays 1 e yakn bulunursa baml deikendeki deiimin byk bir ksm bamsz deiken tarafndan aklanabilmektedir.
R2 r 2 = 80,3055 bulunur.

Baml deikendeki aklanabilmektedir.

deiimin

%80,3

bamsz

deiken

tarafndan

Not: Bilgisayar ktlar ile yaplan ilemlerde ktdan yararlanarak gerekli bilgiler bulunmas (olduu gibi yazlmas) , hesaplanmas ve yorumlanmas eklinde zlecektir. 3. SPSS LE ZM Tablo 2. Modelleme
Kabul Edilen Veriler X(a) a. Baml Deiken: Y b. Btn veriler kabul edildi. Model 1 Kabul Edilmeyen Veriler . Yntem Uyguland.

Tablo 3. Dorusal Regresyon Modelinin zeti


2 R(korelasyon R (Belirtme Model katsays) Katsays) 1 ,896(a) ,803 a Aklayc Deiken: (Bamsz), X

Dzeltilmi B.Katsays ,783

Tahminin Standart Hatas 7,018

Tablo 4. ANOVA(b)
Model 1 Deneme Hata Toplam a Aklayan: (Bamsz), X b Baml Deiken: Y Kareler Toplam 2008,200 492,467 2500,667 Serbestlik derecesi 1 10 11 Ortalamalarn Karesi 2008,200 49,247 F 40,778 Sig. ,000(a)

Tablo 5. Katsaylar (a)


Model (Sabit Katsay) X(regresyon katsays) a Baml Deiken: Y Dzeltilmemi Katsaylar B 80,778 1,138 Std. Hata 9,544 ,178 Dzeltilmi Katsaylar Beta 8,464 ,896 6,386 ,000 ,000 t Sig.

10

Korelasyon katsaysn bulunuz? Ayrca nasl hesaplanabilir? Yorumlaynz. Tablo 3. yardmyla r = 0,896 olduu grlr. Ayrca belirtme katsaysnn karekkne eittir. Sfrdan byk olduu iin ayn ynl pozitif bir iliki vardr. Ayrca 1 e yakn olduu iinde deikenler arasnda kuvvetli bir ilikiden sz edilebilir. Belirtme katsaysn bulunuz? Ayrca nasl hesaplanabilir? Yorumlaynz. Tablo 3.yardmyla R 2 (Belirtme Katsays) = 0,803 olduu grlr. Ayrca Tablo 4. yardmyla da Deneme (Kareler Top) / Toplam(Kareler Toplam) = 2008,2/2500,667=0,803065742 dr. Baml deikendeki deiim %80,3 bamsz deiken tarafndan aklanabilir. ANOVA tablosu ile test edilmek istenen hipotezi kurup, yorumlaynz. Ho: B j = 0 H A : En az bir B j 0 j: 0,1 Tablo 4. yardmyla P_value < olduu iin Ho red edilir. a ve b (sabit katsay ve regresyon katsays) %95 gvenilirlikle sfrdan farkldr. Regresyon katsays eer 0 olsayd bamsz deikende meydana gelen deiim baml deikeni etkilemeyecekti. Ancak iki katsay da sfrdan farkl olduu iin regresyon analizi anlaml hale gelmitir. Sonu olarak ANOVA ile deikenler arasnda anlaml bir iliki olduu ortaya kar. Bu nedenle bu test regresyon analizinin anlaml olup, olmadn test etmektedir. P_value>0 olsayd regresyon denklemi anlamsz olurdu. Regresyon denklemini yaznz, yorumlaynz. Tablo 5.yardmyla katsaylar grmekteyiz. y = 80,778+1,138x eklinde denklem yazlr. x in sfr olmas anlaml olmadndan sabit katsay herhangi bir anlam tamaz. Regresyon katsays bamsz deikende bir birimlik deiimin baml deikende 1,138 olarak hissedildiini gstermektedir. Sabit ve regresyon katsays hesaplaynz.( 0,05 ) a iin t = iin t test istatistiklerini tablo yardmyla

a 1 Se * n X2 S xx

Paydaki deer Tablo 5. de standart hata olarak gsterilen

ksmdr.

11

80,778/9,544 = 8,4637 bu deeri de yine Tablo 5.de grmekteyiz. b iin t =


b Se * 1 S xx

Paydaki deer Tablo 5. de standart hata olarak gsterilen

ksmdr. 1,138/0,178 = 6,39 bu deeri de yine Tablo 5.de grmekteyiz. Katsaylar tablosu iin gerekli hipotezleri kurup, yorumlar yapnz. Birinci satr iin; Ho: = 0 Ha: 0 kinci satr iin; Ho: = 0 Ha: 0

P_value = 0,000 < =0,05( ) olduu iin Ho red edilir. Yani sabit katsay sfrdan farkldr. P_value = 0,000 < =0,05( ) olduu iin Ho red edilir. Yani regresyon katsays sfrdan farkldr.

4. MINITAB LE ZM
Regresyon Denklemi; y = 80,8 + 1,14 x

Tablo 6. Katsaylar
Tahmin Edici Sabit Katsay X(regresyon) S = 7,018 Katsaylar 80,778 1,1380 Se 9,544 0,1782 T 8,46 6,39 P 0,000 0,000

Belirtme Katsays = 80,3%

Dzeltilmi B.Katsay.= 78,3%

Tablo 7. Varyans Analizi


Deneme Hata Toplam DF 1 10 11 SS 2008,2 492,5 2500,7 MS 2008,2 49,2 F 40,78 P 0,000

MINITAB program ktsyla dier zmler ayn sonucu vermektedir. Bu nedenle yorumlarda ayn olduundan tekrar edilmemitir. MINITAB in SPSS den tek fark regresyon denklemini yazl olarak vermesidir.

12

You might also like