P. 1
Regresyon Ve Korelasyon Analizi

Regresyon Ve Korelasyon Analizi

|Views: 47|Likes:
Yayınlayan: bebek_ferman

More info:

Published by: bebek_ferman on Nov 21, 2011
Telif Hakkı:Attribution Non-commercial

Availability:

Read on Scribd mobile: iPhone, iPad and Android.
download as PDF, TXT or read online from Scribd
See more
See less

11/12/2012

pdf

text

original

Regresyon ve Korelasyon Analizi

Suat ŞAHİNLER 2 .Dr.Regresyon Analizi Doç.

Suat ŞAHİNLER 3 . Örnek: Sebep Sonuç Gelir Harcama Yaş Boy Gübre Verim Yem miktarı Süt miktarı Çalışma süresi Alınan not Bu analiz tekniğinde iki (basit regresyon) veya daha fazla değişken (çoklu regresyon) arasındaki ilişki açıklamak için matematiksel bir model kullanılır ve bu model regresyon modeli olarak adlandırılır.Dr. Bu kısımda anlaşılması daha kolay olduğu için basit regresyon analizi anlatılmıştır. aralarında sebep-sonuç ilişkisi bulunan iki veya daha fazla değişken arasındaki ilişkiyi belirlemek ve bu ilişkiyi kullanark o konu ile ilgili tahminler (estimation) ya da kestirimler (prediction) yapabilmek amacıyla yapılır.Regresyon Analizi Regresyon analizi. Doç. Doğada birçok olayda sebep-sonuç ilişkisine rastlamak mümkündür.

Regresyon Analizi Basit regresyon modeli Y=α+βX+ε şeklinde bir bağımlı ve bir de bağımsız değişken içeren bir modeldir. X. ε. tesadüfi hata terimi olup ortalaması sıfır varyansı σ2 olan normal dağılış gösterdiği varsayılır. X’in kendi birimi cinsinden 1 birim değişmesine karşılık Y’de kendi birimi cinsinden meydana gelecek değişme miktarını ifade eder. Doç. Bu varsayım parametre tahminleri için değil katsayıların önem kontrolleri için gereklidir. α. bağımlı (sonuç) değişken olup belli bir hataya sahip olduğu varsayılır.Dr. Burada Y. Suat ŞAHİNLER 4 . sabit olup X=0 olduğunda Y’nin aldığı değerdir. bağımsız (sebep) değişkeni olup hatasız ölçüldüğü varsayılır. β ise regresyon katsayısı olup.

Dr. Suat ŞAHİNLER 5 . hata teriminin dağılışı ile ilgili herhangi bir varsayım söz konusu değilse en-küçük kareler tekniği kullanılarak parametreler tahmin edilir. En-küçük kareler tekniği kullanılarak parametrelerin nasıl tahmin edildiğini örnek bir veri grubu üzerinde kısaca özetleyelim. Eğer hata teriminin normal dağılım göstermesi şeklinde bir varsayım varsa en büyük olabilirlik.Regresyon Analizi Parametrelerin (Katsayıların) Tahmini Bir regresyon modeli oluşturulurken genelde en-küçük kareler ve en büyük olabilirlik (maximum likelihood) teknikleri olarak bilinen iki yaklaşımdan birisi kullanılır. Boy(cm) (X) 9 15 6 24 32 Çevre(cm) (Y) 5 6 4 12 19 Doç.

Y 20 16 12 8 4 0 0 5 10 15 20 25 30 35 X Y 20 16 12 8 4 0 0 5 10 15 20 25 30 35 X (a) (b) Şekil (a)‘da verilen noktaları temsil eden regresyon doğrusu oluşturulursa Şekil (b) elde edilir.Regresyon Analizi Tabloda verilen X ve Y değişkenlerine ait beş gözlem çifti. Uydurulan regresyon doğrusu ile gözlem noktaları arasındaki fark hata (ε) olarak isimlendirilir.Dr. Bunu sağlayacak teknik ise en-küçük kareler tekniğidir Doç. koordinat eksenlerine yerleştirildiğinde elde edilen serpme diyagramının Şekil (a)’daki grafik elde edilir. Regresyon doğrusuna ait parametreler öyle tahmin edilmelidir ki. Suat ŞAHİNLER 6 . doğru ile gözlem noktaları arasındaki fark (hata) en az olsun.

Suat ŞAHİNLER . Y = α + βX i + ε ⇒ ε = Y − α − βX i olur. ∑ε i =1 n 2 i = ∑ (Yi − α − β X i ) 2 i =1 n olur. En-küçük kareler tekniğinde. HKT’nı en küçük yapabilmek için yukarıdaki ifadenin önce α‘ya göre türevini alıp sıfıra eşitleyerek ∂∑ ε i =1 n 2 i ∂α =0⇒ ∂ ∑ (Y − α − β X i ) 2 i =1 n ∂α =0 n ⇒ nα + β ˆ ˆ ∑X i =1 n i = ∑ Yi i =1 (Normal denklem 1) 7 Doç. Burada hata teriminin tüm gözlemler için kareleri alınır ve toplanırsa (Hata Kareler Toplamı (HKT).Dr.Regresyon Analizi Yukarıda verilen basit regresyon modelinden e çekilirse yani.

ˆ β= ∑X Y i =1 n i =1 n i i − (∑ X i )(∑ Yi ) / n i =1 i =1 2 i n n ∑X − (∑ X i ) 2 / n i =1 n = Sxy Sxx Doç. Suat ŞAHİNLER 8 . Normal denklemlerin iki bilinmeyenli denklerin çözümünde kullanılan değişik yöntemlerden birisi kullanılarak çözümü yapıldığında.Regresyon Analizi daha sonra da β’ya göre türevini alıp sıfıra eşitleyerek ∂∑ ε i =1 n 2 i ∂β =0⇒ ∂ ∑ (Y − α − βX i ) 2 i =1 n ∂β n n =0 n 2 ˆ ˆ ⇒ α ∑ X i + β ∑ X i = ∑ X i Yi i =1 i =1 i =1 (Normal denklem 2) şeklinde normal denklemler olarak isimlendirilen iki bilinmeyenli iki denklem elde edilir.Dr.

Bu eşitlikler ile regresyon doğrusu denkleminde yer alan ve HKT’nı en az yapacak parametreler tahmin edilir. Böylece. Suat ŞAHİNLER 9 .Regresyon Analizi ve ˆ α= ∑Y i =1 n i n ˆ −β ∑X i =1 n i n ˆ = Y − βX eşitlikleri elde edilir.Dr. en-küçük kareler regresyon doğrusu denklemi ˆ ˆ ˆ Y = α + βX i Doç.

Suat ŞAHİNLER 10 .Korelasyon Analizi Regresyon Katsayısının Önem Testi: Hipotezler Ho: β=0 Hı : β≠0 Kullanılacak test istatistiği t= ˆ β −β S βˆ 2 S y.α/2 olup burada. x ~ t n -2.Dr. S βˆ = S xx = [ S yy − ( S xy ) 2 / S xx ] /(n − 2) S xx Doç.

ters yönlü ve tam bir ilişki varsa -1 değerini alır. Doç. Değişkenlerin bağımlı veya bağımsız olması dikkate alınmaz. ilişkinin olmadığı durumda 0. Suat ŞAHİNLER 11 .Korelasyon Analizi Korelasyon Analizi İki değişken arasındaki ilişkinin derecesini ve yönünü belirlemek amacıyla kullanılan istatistik yöntemlerden birisidir. Bunlardan Pearson korelasyon katsayısı r ile gösterilir ve n ⎛ n ⎞ X iYi − ⎜ ∑ X i ∑ Yi ⎟ / n ∑ i =1 i =1 ⎝ i =1 ⎠ r= = 2 2 n n n n ⎛ ⎞⎛ ⎞ ⎜ ∑ X 2 − ⎛ ∑ X ⎞ / n ⎟⎜ ∑ Y 2 − ⎛ ∑ Y ⎞ / n ⎟ ⎜ ⎟ ⎜ ⎟ ⎜ i =1 i ⎝ i =1 i ⎠ ⎟⎜ i =1 i ⎝ i =1 i ⎠ ⎟ ⎝ ⎠⎝ ⎠ n S XY S XX SYY formülü ile hesaplanır. Değişik şekillerde hesaplanan ve değişik amaçlar için kullanılan Pearson korelasyon katsayısı. . tam ve kuvvetli bir ilişki varsa 1. Katsayı.Dr. Korelasyon katsayısı -1 ile +1 arasında değişen değerler alır (-1≤ r ≤+1). kısmi korelasyon katsayısı gibi farklı isimler alan korelasyon katsayıları vardır. Canonical korelasyon katsayısı.

Suat ŞAHİNLER 12 . noktaların dağılımına göre korelasyon katsayısının alabileceği değerler Şekilde gösterilmiştir. Doç.Korelasyon Analizi Aralarındaki ilişkinin derecesi araştırılan değişkenlere ait gözlemler serpme diyagramında incelendiğinde.Dr.

Suat ŞAHİNLER 13 . 0.5-0. örnek gözlem sayısı (n) oldukça önemlidir.74 arasında ise orta derecede.71 üstünde olması beklenir.Dr.Korelasyon Analizi Korelasyon katsayısının yorumunu. 0.75-1 arasında ise kuvvetli ilişki vardır denilmektedir. Populasyona göre normal sayılacak kadar bir gözlem sayısı alınarak bakılmış gözlem grupları için genellikle.25'e kadar düşmüş bir korelasyon katsayısı bile anlamlı sayılabilmektedir. 10-15 gözleme dayanan değerlendirmelerde korelasyon katsayısının 0. Basit korelasyon analizinden söz edilebileceği gibi. 0-0. Ara değerler için katsayı değerlendirirken. çoklu korelasyon analizi yapmak da mümkündür. Çok fazla gözleme dayanan değerlendirmelerde 0. Fakat az sayıda.49 arasında ise korelasyon zayıf. Doç. tam değerler dışında ara değerler için yapmak oldukça güçtür.

α/2 t= Sr olup burada.Korelasyon Analizi Korelasyon Katsayısının Önem Testi: Hipotezler Ho: ρ=0 Hı : ρ≠0 Kullanılacak test istatistiği r−ρ ~ t n -2.Dr. Suat ŞAHİNLER 14 . 1− r 2 S r= n−2 Doç.

Regresyon ve Korelasyon Analizi Örnek: Bir balık türü için balığın boyu(cm) ve vücut çevresine (cm) ait değerler aşağıdaki gibidir. Boy(cm) (X) 9 15 6 24 32 Çevre(cm) (Y) 5 6 4 12 19 XY 45 90 24 288 608 X2 81 225 36 576 1024 Y2 25 36 16 144 361 Doç. Balığın boyu ile vücut çevresi arasındaki ilişkinin doğrusal bir ilişki olduğunu varsayarak a) Bu ilişkiyi açıklayan regresyon modelini oluşturunuz ve regresyonun önem testini yapınız b) Korelasyon katsayısını hesaplayarak önem testini yapınız. Suat ŞAHİNLER 15 .Dr.

57 X i Doç.57 462.57 * = −0.Dr.8 1942 − 86 2 / 5 ˆ ˆ α = Y − βX = 46 86 − 0. Suat ŞAHİNLER 16 . ˆ Y = −0.604 + 0.8 = = 0.Regresyon ve Korelasyon Analizi Çözüm: (a) Boy(cm) (X) 9 15 6 24 32 86 Çevre(cm) (Y) 5 6 4 12 19 46 n n XY 45 90 24 288 608 1055 X2 81 225 36 576 1024 1942 Y2 25 36 16 144 361 582 ˆ β= ∑X Y i =1 n i =1 n i i − (∑ X i )(∑ Yi ) / n i =1 i =1 2 i ∑X − (∑ X i ) 2 / n i =1 n = 1055 − 86 * 46 / 5 263. en-küçük kareler regresyon doğrusu.604 5 5 Böylece.

0.Regresyon ve Korelasyon Analizi Regresyon Katsayısının Önem Testi: Hipotezler Ho: β=0 Hı : β≠0 α=0.0779 RED edilir. Suat ŞAHİNLER 17 .01/2=t3.841 olduğundan Ho 0.8 i =1 ⎝ i =1 ⎠ Doç.8 ⎛ n ⎞ 2 S yy = ∑ Yi − ⎜ ∑ Yi ⎟ / n = 582 − 46 2 / 5 = 158.8] /(5 − 2) = = 0.8 − (263.0.57 − 0 = 7.31 > t5-2. S βˆ = [ S yy − ( S xy ) 2 / S xx ] /(n − 2) S xx n 2 [158.0779 462.Dr.01 t= ˆ β −β S βˆ = 0.005=5.8) 2 / 462.

8 *158. Bir diğer ifade ile balığın boyu arttıkça.973 462.01/2=t3.3’lük pozitif bir ilişki vardır. r= 263.973 r−ρ t= = = = 7. Suat ŞAHİNLER > t5-2.0.1333 Sr 1 − 0.Dr.8 S XY = = 0.0.973 5−2 Doç.841 olduğundan Ho RED edilir.8 S XX SYY Balığın boyu ile çevresi arasında % 97. çevresi de artmaktadır. 18 .01 0.Regresyon ve Korelasyon Analizi Çözüm (b): Korelasyon katsayısı.005=5.973 − 0 0. Korelasyon Katsayısının Önem Testi: Hipotezler Ho: r=0 Hı : r≠0 α=0.299 2 0.

Dr. Yem Miktarı.(kg) 5 7 9 10 8 6 11 Verdiği Süt Miktarı (kg) 12 18 19 22 20 13 25 Doç. a) Bu ilişkiyi açıklayan regresyon modelini oluşturunuz ve regresyonun önem testini yapınız b) Korelasyon katsayısını hesaplayarak önem testini yapınız. Suat ŞAHİNLER 19 .Regresyon ve Korelasyon Analizi Örnek: İneğin günlük yediği yem(kg) ile verdiği süt(kg) arasında bir ilişki olup olmadığını araştırmak amacıyla yapılan bir denemeden elde edilen veriler aşağıdaki gibir.

You're Reading a Free Preview

İndirme
scribd
/*********** DO NOT ALTER ANYTHING BELOW THIS LINE ! ************/ var s_code=s.t();if(s_code)document.write(s_code)//-->