Professional Documents
Culture Documents
Giriş
Değişkenler arasındaki ilişkiyi incelemek bilimin uğraşlarından birisi olagelmiştir.
Bunu doğal karşılamak gerekir. Çünkü gerek günlük hayatımızda gerekse bilimsel
araştırmalarda karşılaştığımız sorunların çoğunluğu iki (veya daha çok) değişken
arasında bir ilişki olup olmadığının saptanması ile ilgilidir.
İki değişken arasında bir ilişki bulunup bulunmadığı, eğer varsa bu ilişkinin
derecesinin saptanması da istatistiksel çözümlemelerde sık sık karşılaşılan bir sorundur.
Değişkenler arasındaki ilişkinin incelenmesinde regresyon ilk akla gelen tekniktir.
İstatistiksel anlamda iki değişken arasındaki ilişki, bunların değerlerinin karşılıklı
değişimleri arasında bir bağlılık şeklinde anlaşılır. Gerçekten X değişkeninin değerleri
değişirken buna bağlı olarak Y değişkeninin değerleri de değişiyorsa, bu ikisi arasında
bir ilişki bulunduğu söylenebilir.
Regresyonda değişkenlerin bağımlı değişken ve bağımsız değişken(ler) olarak iki
gruba ayrılması bir zorunluluktur. Bağımlı değişken, bağımsız değişken(ler) tarafından
açıklanmaya çalışılan değişkendir. Regresyonda bağımlı değişken Y ve bağımsız
değişken(ler) de X ile gösterilir.
Regresyonda, amaçlardan biri bağımlı değişkenle bağımsız değişken(ler)
arasındaki ilişkilerin ortaya çıkarılmasıdır. Örneğin Y ile X arasında Yi = α + β X i
+ε i (i=1,2,3,...,) gibi doğrusal bir ilişki öngörülüyorsa ilk adım modelin bilinmeyen
α ve β parametrelerinin tahmin edilmesidir. Modelin bilinmeyen parametreleri
tahmin edildiğinde bağımsız değişken(ler)’in farklı değerleri için bağımlı değişkenin
alacağı değeri tahmin etmek regresyonda bir diğer amaçtır. Bağımsız değişken(ler)’in
her farklı değer(ler)’i için bağımlı değişkenin değeri sabit ise ortada araştırılacak bir
problem yoktur.
Hem regresyonda hem de varyans çözümlemesinde bağımlı değişken en az eşit
aralıklı düzeyde ölçülür. Regresyonda, bazı özel durumlar dışında, bağımsız
değişken(ler) de en az eşit aralıklı düzeyde ölçülmelidir. Varyans çözümlemesinde ise
bağımlı değişken yine en az eşit aralıklı düzeyde ölçülürken bağımsız değişken(ler)
sınıflama ya da sıralama ölçme düzeyinde ölçülür. Bu nedenle regresyon ve varyans
çözümlemesinde amaç aynı olmakla beraber hangisinin kullanılacağı bağımsız
değişken(ler)in ölçme düzeyine bağlıdır.
Regresyon analizi, bağımsız değişken sayısına göre;
(2.1)
Ana kütle içinde birer α ve β değeri varken, bu ana kütleden çekilen her bir
örneklem için ayrı birer α̂ ve β̂ elde edilmektedir. İşte bu α̂ ve β̂ normal
bölünmeye sahip olup beklenen değerleri sırasıyla α ve β dır. Uygulamada tek bir
örneklem alınmakta ve bu örneklem yardımıyla ana kütle parametereleri tahmin
edilmektedir.
α doğrusal fonksiyonun sabitidir. X= 0 olduğunda regresyon doğrusunun dikey
eksen olan Y ile kesiştiği noktayı göstermektedir. β (βyx ile de gösterilebilir) ise
doğrusal fonksiyonun eğimidir. Regresyon analizinde bağımsız değişken X deki bir
birimlik değişmenin bağımlı değişken Y’de (Y cinsinden) ne kadarlık bir değişime
yarattığını gösteren regresyon katsayısıdır. Fonksiyon tipinin belirlenmesi için
regresyon analizine serpilme diyagramı çizilerek başlanır. Aşağıdaki serpilme
diyagramında gözlem noktalarının dağılımının doğrusal bir eğilimde olduğu açıkça
görülmektedir.
Y=α + βX
ˆ + βˆX i + ei
Yˆi = α şeklinde gösterilmektedir. Tahmin edilen regresyon doğrusu
ise şudur: Yˆ = αˆ + βˆx
i i
Yukarıdaki eşitliklerde :
E(Yi) = α + βXi
X
Şekil 2: Gerçek ve Tahmin Edilen Regresyon Doğruları
Doğrusal regresyon modeli bazı varsayımlara dayanmaktadır. Söz konusu
varsayımlar “hata teriminin bölünmesi”, “hata terimi ile serbest değişkenler arasındaki”
ve “serbest değişkenler arasındaki ilişki” ile ilgilidir. Bu varsayımları “stokastik (1)
varsayımlar” ve “diğer varsayımlar” olmak üzere iki grupta toplayabiliriz.
2.1. Varsayımlar
VARSAYIM 1: “Hata terimi normal dağılıma sahiptir”. Diğer bir deyişle her
Xi değeri için hata teriminin değerleri kendi ortalamaları etrafında çan eğrisi biçiminde
simetrik bir bölünme gösterir.
ε ~N(0, σ 2
)
sabittir”. Diğer bir deyişle, bütün X değerleri için ε hata terimleri kendi ortalamaları
etrafında aynı değişkenliğe sahiptir.
Hata teriminin varyansı ayrıca bağlı değişkenin varyansına da eşittir:
2
Var (Y)=Var (ε)= σ . “ Sabit varyans varsayımı” adı da verilen bu varsayıma göre,
hata teriminin ortalaması etrafındaki varyansı bütün X değerleri için sabittir.
α ve β ’nın tahminleri olan α̂ ve β̂ ‘nin hesaplanmasında “En Küçük
Kareler Tekniği” nden yararlanılabilir.
()
n n ^2 n 2
ˆˆ
∑ e = ∑ Y − Y = ∑ Y −− βα X = m i n
2
i ii i
İ = 1 i= 1 i= 1
(2.2.1)
yapılması gerekir. Bu yönteme “En Küçük Kareler Yöntemi” adı verilmektedir. Elde
edilen basit doğrusal regresyon denklemi de “En Küçük Kareler Yöntemi ile Basit
Doğrusal Regresyon Denklemi” olacaktır. Bu fonksiyonun minimum olabilmesi için α̂
ve β̂ parametrelerine göre kısmi türevlerinin alınması ve bunların 0’a eşitlenmesi
gerekir.
∑ (Y )
n 2
i − αˆ − βˆX i =S dersek;
i =1
∂S
∂αˆ
(
= 2∑ Yi −αˆ − βˆX i ( −1) = 0 )
(
2∑ − Yi + αˆ + βˆX i = 0 )
∑(− Y i + αˆ + βˆX i = 0 )
− ∑Yi + nα ˆ
ˆ +β ∑X i = 0
∑Y i = nα ˆX
ˆ +β i
∂S
ˆ
∂β
(
ˆ − βˆX i ( − X i ) = 0
= 2∑ Yi −α )
(
2∑ − X i Yi + αˆX i + βˆ i2 = 0 )
∑(− X Y i i )
+ αˆX i + βˆX i2 = 0
− ∑X i Yi +α
ˆ ∑X i +β
ˆ
∑X i2 = 0
∑X Y i i
ˆ ∑X i + β
=α ˆ
∑X i2
Minimum değer için yeterli şart fonksiyonun ikinci kısmi türevlerinin pozitif
olması olduğundan S fonksiyonunun α̂ve β̂’ya göre ikinci kısmi türevlerinin
hesaplanması gerekir.
∂2 S
= 2n >0
∂αˆ 2
∂2 S
= 2∑X i
2
ˆ2
∂β
>0
∑X Y i i
ˆ ∑X i + β
=α ˆ
∑X i2 (2.2.3)
∑y i = nα ˆ
ˆ +β ∑xi (2.2.4)
∑x i
ˆ ∑xi + β
yi = α ˆ
∑xi2 (2.2.5)
αˆ =
∑ X ∑Y − ∑ X ∑ X Yi
2
i i i i
(2.2.6)
n∑ X − ( ∑ X ) 2 2
i i
n∑ X i Yi − ∑ X i ∑Yi
βˆ = (2.2.7)
n∑ X i2 − ( ∑ X i )
2
∑( y − y ) =0 ve ∑(x − x ) = 0 eşitliklerinden ;
α
ˆ =0
βˆ =
∑ xi y i
∑ xi2
yˆ i = β̂xi elde edilir.
Y
Yyyyhb
E (αˆ ) = α ve ( )
E βˆ = β olur.
İspat 1: E βˆ = β( )
β̂ =
∑x y i i
=
∑x Y i i
= ∑k i yi ( Burada k i =
xi
’dir. )
∑x 2
i ∑x 2
i ∑ xi2
1
∑k =0 , ∑k x =1 ve ∑k 2
= `dir.
∑ xi2
i i i i
β̂ = ∑k i (α + βxi + ei )
β̂ = β + ∑k i ei
{[ ( )][ ( ) ]}
E βˆ − E βˆ E βˆ − β ifadesini değerlendirmede toplama işlemlerindeki kurallar
geçerlidir. Sabit olan herhangi bir faktör sola kaydırılarak beklenen değer işaretinin
önüne çarpan olarak yazılabilir. Bir sabitin beklenen değeri, bu sabitin kendisidir.
Dolayısıyla;
{[ ( )][ ( ) ]} [ ( ) ] [
E βˆ − E βˆ E βˆ − β = E βˆ − β E βˆ − E βˆ ( )]
[ ( ) ][ ( ) ( )]
= E βˆ − β E βˆ − E βˆ
=0
İspat 2: E (αˆ ) = α
α ˆx
ˆ =Y − β
α ˆx
ˆ =α + β x + e − β
(
αˆ = α − βˆ − β x + e ) ( E ( βˆ ) = β ve ()
E e =0 olduğu için )
Her iki tarafın beklenen değerleri alındığında;
((
E (αˆ ) = E (α ) − E βˆ − βˆ x + E e )) ()
E (α
ˆ ) = E (α ) ⇒ E (αˆ ) = α elde edilir.
∑ (e )
n
i −e
(2.3.1)
Se = i =1
n−2
olur. Kullanılan her bir istatistik için ( α̂ ve β̂) bir serbestlik derecesi
kaybedeceğinden serbestlik derecemiz (n-2) olacaktır.Diğer taraftan gözlenen ve
hesaplanan y değerleri arasındaki farkların toplamı sıfır olacağından (2.3.1) numaralı
formül;
Se =
∑e 2
i
(2.3.2)
n −2
∑( y − yˆ i ) ∑(y ) 2
− αˆ − βˆxi
2
i i
= =
n−2 n−2
Se =
∑y 2
− αˆ ∑ y − βˆ ∑xy
(2.3.3)
n −2
şekillerinde de yazılabilir.
βˆ αˆ
n <30 ise th =
σˆ βˆ , th = formülü,
σˆ αˆ
βˆ αˆ
n ≥ 30 ise zh = , zh = formülü kullanılır.
σˆ βˆ σˆ αˆ
H0 hipotezinde β = 0 olduğu için;
βˆ
t (veya z)=
∑( x − x )
2
σˆ βˆ /
αˆ
∑( x − x )
t (veya z) = 2 şeklinde yazılabilir.
σˆ αˆ /
σˆ αˆ = S e
∑ xi2
ve σˆ βˆ = S e
1
n∑ x ′i
2
∑ xi′ 2
2.4.4. Karar:
zα / 2 veya tα/ 2;n −2 tablo değeri z h veya t h değerinden büyükse H0 habul
edilir. Yani iki değişken arasında ilişki yoktur (örnek regresyon doğrusu tahminlerinde
kullanılmaz).
Tablo değerleri z h veya t h ’dan küçükse, H0 ret edilir. Yani iki değişken
arasında ilişki vardır(örnek regresyon denklemi tahminlerde kullanılabilir).
( )
P βˆ − tσˆ βˆ ≤ β ≤ βˆ + tσˆ βˆ = 1 − α
değeri için hesaplanan ŷ i değeri , µy için bir nokta kestirimidir. Ancak aynı x0 değeri
için çeşitli örnekler temel alınarak hesaplanacak ŷ i değerleri değişkenlik
gösterecektir. Bu değişkenliğin bir ölçüsüne gereksinim vardır. Bu değişkenlik ölçüsü
verilen bir X değeri için µy ’nin kestiriminin standart hatasıdır. Bu standart hata, aynı
zamanda X’in değerini sabit tuttuğumuzda Y’nin koşullu dağılımından hesaplanan
ortalama y değerinin standart hatasıdır. Normallik varsayımı altında kestirimi yapılan
regresyon modeli için Y değişkeninin koşullu ortalamasının standart hatası:
σˆ ( µ
1 (
x0 − x
2
)
) = Se + (2.6.1)
(∑x ) 2
/ X = x0
n
y
∑x − n
2
formülü ile hesaplanır. Böylece, verilen bir X değeri için Y değişkeninin ortalamasının
(1- α )’lık güven aralığı:
(2.6.2)
σˆ ( Y / X =x ) = S e
1 +
1
+
(
x0 − x
2
)
(2.7.1)
0
n (∑x )
∑x2 −
n
şeklindedir. Böylece verilen bir X değeri için Y değişkeninin alacağı değer (1- α )
olasılıkla:
yˆ − tα / 2;n −2σˆ ( Y / X = x0 ) ≤ Y ≤ yˆ + tα / 2;n − 2σˆ ( Y / X = x0 ) olacaktır.
(2.7.2)
( ∑ x′ y ) ii
2
i) r=
2 (2.8.1)
∑ x′ ∑ y′ i
2
i
2
βˆ ∑ xi′ yi′
ii ) r = 2
( eğim katsayısı yardımıyla ) (2.8.2)
∑ y′ i
2
ˆ2 ∑ i
x ′ 2
r2 = β
∑ y′
iii ) (eğim katsayısı yardımıyla ) (2.8.3)
2
i
vi ) r 2
= 1−
∑ e2
i
( artıklar yardımıyla ) (2.8.4)
∑ y′
i
2
Çözüm 1:
Σ xi = 758,0 , µ x = 15,792
Σ yi = 291,1 , µ y = 6,095
Σ xi2 = 12170,48
Σ yi2 = 1791,03
Σ xiyi = 4612,64
2
Σ xi − Σ y i − Σ xi Σ xi y i (12170,48)(291,1) − (758,0)(4612,64)
αˆ = =
2
nΣ x i − ( Σ x i ) 2 48(12170,48) − (758,0) 2
α̂ = 4,8285
ŷ i = 4,8285 + 0,078 xi
Parça No x y x2 xy y2 ŷ y- ŷ
(Sertlik) (Dayanıklılık)
1 7 10 49 70 100 9 1
2 9 12 81 108 144 11,5 0,5
3 5 6 25 30 36 6,5 -0,5
4 8 9 64 72 81 10,25 -1,25
5 6 8 36 48 64 7,25 0,25
6 9 11 81 99 121 11,5 -0,5
7 7 10 49 70 100 9 1
8 4 5 16 20 25 5,25 -0,25
9 8 10 64 80 100 10,25 -0,25
10 7 9 49 63 81 9 0
TOPLAM: 70 90 514 660 852 90 0
İlişkinin yapısı henüz bilinmediğinden (x,y) gözlem çiftleri için serpilme diyagramı
yapılır.
Çözüm 2:
=0,25+1,25x
y
12
10
x
2 4 6 8 10
n
n n
n ∑ x i y i − ∑ x i ∑ y i
i =1 i =1 i =1 = 10.660 − 70.90 = 6600 − 6300 = 1,25
β̂=
n
n
2
10.517 − 70 2 5140 − 4900
n.∑ xi − ∑ xi
2
i =1 i =1
ˆ x = 90 −1,25 70 = 0,25
α̂ = y − β
10 10
ve regresyon denklemi: ŷ i = α̂ + xi
β̂ = 0,25 + 1,25xi
(Kaynak: Olasılık ve İstatistik: Prof. Dr. Fikri Akdeniz)
Örnek 3: Bir akaryakıt şirketi ısınmak amacıyla sattığı gaz miktarı ve günlük sıcaklık
arasındaki ilişkiyi belirlemek istemiştir. x günlük ortalama sıcaklığı, y (bin litre olarak)
gaz satış miktarını göstermek üzere satış ve sıcaklık ile ilgili aşağıdaki tablo verilmiştir.
i =1 i =1
− 8510
β̂= ≅ −1,68
5060
ˆ .Σx
Σy − β 222 − ( −1,68 ).( −60 ) 222 −100 ,8
α̂ = = = = 12 ,12
n 10 10
Tahmin edilmiş regresyon doğrusu:
ŷ i = 12,12 – 1,68xi
Örnek 4: Bir manav muzun kilogram fiyatı ile haftalık istek arasında doğrusal bir
bağlantı olduğunu hissettirmektedir. Böyle bir bağlantı olup olmadığını incelemek
amacıyla 8 hafta için aşağıdaki değerleri kaydetmiştir.
a) x üzerinde y’nin regresyon denklemini bulunuz.
b) x = 20 için ŷ ’yi bulunuz.
Fiyat (100 milyon) (x) İstek (kg) y x2 xy y2
10 230 100 2300 52900
12 230 144 2760 52900
13 210 169 2730 44100
13 220 169 2860 48400
14 220 196 3080 48400
15 220 225 3300 48400
13 230 169 2990 52900
17 190 289 3230 36100
Toplam: 107 1750 1461 23250 384100
Çözüm 4:
nΣ xi y i − (Σ xi )(Σ y i ) 8.23250 − (107)(1750) 186000− 187250
a) βˆ = = =
2
nΣ x i − ( Σ x i ) 2 8.1461− (107) 2 11688− 11449
ˆ = −1250 = -5,23
β
239
Örnek 5: Büyük bir mağazanın satış müdürü her ay reklam için harcadığı parayı
kullanarak aylık satışlarını kestirmek istemektedir. Bu kestirimi yapmak için geçmiş 12
aya ait satış bedellerini ve reklam giderlerini kaydediyor. Bu veriler aşağıda verilmiştir,
x üzerinde y’nin regresyon doğrusunun denklemini bulunuz. Her bir x değerine karşılık
gelen aylık satışları kestiriniz.
Çözüm 5:
Σ xi = 19100
Σ yi = 31610000
Σ xiyi = 51036000000
2
Σ xi = 32510000
nΣxi y i − (Σxi )(Σy i ) 12.(51036000000) − (19100)(31610000)
βˆ = =
2
nΣ xi − (Σxi ) 2 12.(32510000) − (364810000)
ˆ = 8681000000
β = 342,99
25310000
α̂ = ŷ - β̂x = 26334166,667 – (342,99) . (1591,667) = 2088245,75
Çözüm 6:
nΣxi y i − (Σxi )(Σy i ) 25.(11824,44) − (1314,9)(235,7)
βˆ = =
2
nΣxii − (Σxi ) 2 25.(76308) − (1728962,01)
Örnek 7: Bir araştırma grubu, akıl hastalarına sürekli olarak uygulanan, ancak
uygulaması zor, pahalı ve zaman alıcı olan standart bir test yerine yeni bir test
geliştiriyor ve elde edilen yeni test sonuçlarından, çok yaygın olarak kullanılan standart
test sonuçlarını bir denklem yardımıyla elde etmek istiyor. Bu amaçla, bir hasta
grubuna ilişkin test ölçümleri her iki test ile elde ettikten sonra, yeni test (x1) sonuçları
50, 55, 60, …, 100 olan hastalar arasından birer hasta rasgele seçiliyor. İlgili sonuçlar
aşağıdaki tabloda verilmiştir.
Çözüm 7:
a) Σ xi = 825 Σ yi = 916
Σ xi2 = 64625 Σ yi2 = 80076
x 1 = 75 y = 83,27
Σ xi yi= 71790
2
nΣ xi Σ y i − Σ xi Σ xi yi (64625)(916) − (825)(71790)
αˆ = = = − 1,0
2
nΣ xi − (Σ xi ) 2 11(64625) − (825) 2
nΣxi y i − Σ xi Σ y i 11(71790) − (825)(916)
βˆ = = = 1,124
2
nΣ x i − ( Σ x i ) 2 11(64625) − (825) 2
Örneklem regresyon doğrusu: ŷ i = -1,0 + 1,124 xi
ˆ
b) xi ve y değerleri yardımıyla artıklar hesaplanır. (ei = yi - α
ˆ −β xi)
ei ei2
yi′ 2 xi′ 2
5,818 33,85 495,95 625
0,2 0,04 495,95 400
-7,418 55,03 589,03 225
-1,04 1,082 150,55 100
2,345 5,501 10,69 25
-7,27 52,89 52,85 0
1,11 1,232 45,29 25
11,49 132,04 516,65 100
-2,13 4,54 216,97 225
-5,75 33,06 279,89 400
2,64 6,97 944,33 625
Yeni test sonuçları standart test sonuçlarını 0,914 oranında yeterli derecede
açıklamaktadır.
1 1
σˆ β2ˆ = s e2 . = 3 6
, 2 5
. = 0,0 1 ⇒3 σˆ βˆ = 0,1 1
Σ xi′ 2
2750
ˆ
β 1,124
th = σ = = 9,79
ˆ βˆ 0,11
Örnek 8: Donanmaya kira karşılığı verilecek 5 araba tesadüfi olarak seçilmiştir. Her
bir araba için ağırlık ve 100 millik bir sürüşte mil başına harcadığı yakıt tutarı galon
cinsinden sonuçlar verilmiştir. Serpilme diyagramını çizerek ağırlık ve 1 milde
harcadığı yakıt arasındaki regresyon doğrusunu belirleyiniz.
Çözüm 8:
40 *
30
20 *
*
*
10 *
x (ağırlık)
1000 2000 3000 4000 5000 6000
nΣxi y i − (Σxi )(Σy i ) 5.(327820,9) − (17671)(106)
βˆ = =
2
nΣ x i − ( Σ x i ) 2 5.(69371475) − 312264241
ˆ = − 234021 ,5 = -0,007
β
34593134
106 17671
α̂ = ŷ - β̂x = − ( −0,007 ). = 21,2 + 24 ,74 = 45 ,94
5 5
ŷ i = α̂ + β̂x i ⇒ ŷ = 45,94 – 0,007xi
(Kaynak: Understanding Business statistics “John E.Hanke, Arthur G.Reitsch”)
y x
PBV (m/-sqm) PBF (L/min/sqm) ei2
xi′ 2
yi′ 2
Çözüm 9:
Σ x1 = 148,58 Σ yi = 5578 Σ xi yi= 58553,88
ŷ i = α̂ + β̂
xi ⇒ ŷ i = 199,08 + 16,10xi
H0 : α = 0 (Katsayı anlamlı değildir)
H1 : α ≠ 0 (Katsayı anlamlıdır)
Σei 2 70432 ,24
Se2 = = = 5030,87
n −k 16 − 2
Σxi 2 1799 ,24
σ
ˆ α2ˆ = se 2 . = 5030 ,87 . = 21579
Σxi 12
419 ,47
σ2
ˆα
ˆ = 146,9
α
ˆ 199 ,08
tn = ˆ = = 1,355
σαˆ 146 ,9
1 1
σ
ˆ β2ˆ = Se 2 . = 5030 ,87 . = 11,99 ⇒ σ
ˆ β2ˆ = 3,46
Σxi 2
419 ,47
ˆ
β 16 ,10
th = σ = = 4,65
ˆ βˆ 3,46
ε ~N(0, σ 2
)
VARSAYIM 2: Tahmin hataları birbirinden bağımsızdır. Yani hata terimleri
arasında otokorelasyon yoktur.
Cov (et ,et-1)=0
Bir bağımsız değişkenli, bir bağımlı değişkenli doğrusal regresyon çok sayıda
bağımsız değişkenler için genişletilebilir. Örneğin y değişkeninin x1 ve x2 bağımsız
değişkenlerinin fonksiyonu olduğunu kabul edelim. O halde aşağıdaki denklemi
düşünebiliriz.
µ y / x1 , x2 = β 0 + βx1 + β 2 x 2 (3.2.3)
ve iki kısmi regresyon katsayısına ( β̂1 ve β̂2 ) göre birinci dereceden türevlerinin
alınıp sıfıra eşitlenmesi gerekir. Böylece elde edilen fonksiyona “ En Küçük Kareler
Yöntemiyle Çoklu Regresyon Denklemi “ adı verilir. Denklemin elde edilmesi aşağıda
gösterilmektedir.
n n n
∑ e 2 = ∑ ( y − y ′) 2 = ∑ ( y − βˆ 0 − βˆ1 x1 − βˆ 2 x2 ) 2
i =1 i =1 i =1
∂e
( )
= 2∑ ( − 1) y − βˆ 0 − βˆ1 x1 − βˆ x 2 = 0
∂βˆ 0
= −∑y + nβ
ˆ +β
0
ˆ
1 ∑x1 + β2 ∑x 2 = 0
ˆ
∂e
ˆ
(
= 2∑( − x1 ) y − βˆ 0 − βˆ1 x1 − βˆ 2 x 2 = 0)
∂β 1
= −∑yx 1 + β
ˆ
0 ∑x1 + β1 ∑x1 + β2 ∑x1 x 2 = 0
ˆ 2 ˆ
∂e
∂βˆ
( )
= 2∑( − 2 ) y − βˆ 0 − βˆ1 x1 − βˆ 2 x 2 = 0
2
= −∑yx 2 + β
ˆ
0 ∑x 2 + β1 ∑x1 x 2 + β2 ∑x 2 = 0
ˆ ˆ 2
∑y = nβˆ 0
ˆ
+β 1 ∑x1 + β2 ∑x 2
ˆ 2
(3.2.4)
∑yx 1
ˆ
=β 0 ∑x1 + β1 ∑x1 + β2 ∑x1 x 2
ˆ 2 ˆ
(3.2.5)
∑yx 2
ˆ
=β 0 ∑x 2 + β1 ∑x1 x 2 + β2 ∑x 2
ˆ ˆ 2
(3.2.6)
(3.2.7)
∑y x i 1i
ˆ
=β 0 ∑x1i + β1 ∑x1i + β2 ∑x1i x 2 i
ˆ 2 ˆ
(3.2.8)
∑y x i 2i
ˆ
=β 0 ∑x 2 i + β1 ∑x1i x 2 i + β2 ∑x 2 i
ˆ ˆ 2
(3.2.9)
βˆ 0 = y − βˆ1 x1 − βˆ 2 x 2 (3.2.10)
x ′ y ′ x ′ − x ′ y ′ x ′ x ′
2
∑ 1i i ∑ 2i ∑ 2i i ∑ 1i 2i
βˆ1 = (3.2.11)
′ ′ ′ ′
2 2 2
∑ x1i ∑ x2i − ∑ x1i x2i
′ ′ ′2 ′ ′ ′ ′
∑x 2i y i
∑x1i − ∑x1i y i
∑x1i x 2 i
ˆ
β2 = (3.2.12)
′
2
′
2
′ ′
2
∑x1i ∑x 2i − ∑x1i x 2 i
Ayrıca gözlem değerlerine göre matrislerden yararlanarak da β̂0 , β̂1 ve β̂2
değerlerine ulaşmak mümkündür:
n ∑x 1i ∑x 2i
∆= ∑x 1i ∑x 2
1i ∑x x 1i 2i
∑x 2i ∑x x 1i 2i ∑x 2
2i
∑y ∑x i 1i ∑x 2i
∆0
∆0 = ∑x y ∑x 1i i
2
1i ∑x x 2i 1i β̂0 =
∆
∑x y ∑x x 2i i 1i 2i ∑x 2
2i
n ∑y ∑xi 2i
∆1
∆1 = ∑ x1i ∑x y ∑x x
1i i 1i 2i β̂1 =
∆
∑ x 2i ∑x y ∑x
2i i
2
2i
n ∑x 1i ∑y i
∆2
∆2 = ∑ x1i ∑x 2
1i ∑x y
1i i β̂2 =
∆
∑x 2i ∑x x
1i 2i ∑x y
2i i
β ˆ0 e
∑∑ ∑
2 2 2
1i 2i 1i 2i
S ∑ x′
2 2
e 2i
σˆ =
2
∑ x′ ∑ x′ − ( ∑ x′ x′ )
(3.3.2)
βˆ1 2 2 2
1i 2i 1i 2i
S ∑ x′ 2
e 1i
2
σˆ =
2
∑ x′ ∑ x′ − ( ∑ x′ x′ )
(3.3.3)
β ˆ2 2 2 2
1i 2i 1i 2i
H0 : β 0 = 0 H0 : β1 = 0 H0 : β 2 = 0
H1 : β 0 ≠ 0 H1 : β1 ≠ 0 H1 : β 2 ≠ 0
βˆ 0 βˆ1 βˆ 2
th = th = th =
σˆ βˆ σˆ βˆ σˆ βˆ
0 1 2
Hesaplanan t istatistik değerleri tα/ 2;n −k tablo değeri ile karşılaştırılarak karar
verilir.
∑ yˆ ′ ∑ ( yˆ − y)2 2
i i
R= =
2
∑ y′ ∑ ( y − y )
(3.4.1)
2 2
i i
R 2
= 1−
∑e 2
i
(3.4.2)
∑ y′ i
2
R D2 = 1 − 1 − R 2 ( ) nn −−1k
2 ∑ i
e 2
/( n − k )
RD = 1 − 2
∑ y′ /( n − 1)
i
ÇOKLU DOĞRUSAL REGRESYON ANALİZİ İÇİN ÇÖZÜMLÜ ÖRNEKLER
Örnek 1: Bir pazarlama firması gazete ve radyo reklamları ile uygun bir karışım
hazırlayarak brüt satışları etkilemeye karar vermiştir. Yönetim iki benzer pazar
alanındaki üretimin iki medya reklamları için harcanan para miktarları arasındaki
farkları test etmiştir. Harcamalar ve satış sonuçları cetvel halinde aşağıda verilmiştir.
Çok değişkenli lineer regresyon denklemini bulunuz.
Pazar Alanı Radyo (x1) $ (10-2) Gazete (x2) $ (10-2) Brüt Satışlar (y) $ (10-6)
A 42 14 24
B 45 16 29
C 44 15 27
D 43 15 27
E 45 13 25
F 43 13 26
G 46 14 28
H 44 16 30
I 45 16 28
J 44 15 28
TOPLAM 441 147 272
Çözüm 1:
Σ y = n. β̂ 1Σ
0 + β̂ x1 + 2Σ
β̂ x2
Σ x1y = 0Σ
β̂ x1 + 1Σ
β̂ x12 + 2Σ
β̂ x1x2
Σ x2y = 0Σ
β̂ x2 + 1Σ
β̂ x1x2 + 2Σ
β̂ x22
Örnek 2: Bir hastane yöneticisi, A hastalığı nedeni ile ameliyat olan hastaların
ameliyat sonrası hastanede kalış gün sayısını (y), hastaların tıbbi sorun sayısı (x1) ve
ameliyat öncesi hastanede kalış gün sayısı (x2) ile ilişkili olup olmadığını, eğer bağımlı
ve bağımsız değişkenler arasında bir ilişki varsa ameliyat sonrası hastanede kalış gün
sayısını bu iki bağımsız değişkenden hangisinin daha fazla etkilendiğini öğrenmek ve
de bu iki bağımsız değişkeni kullanacak hastaların ameliyat sonrası hastanede kalış gün
sayısını önceden kestirmek istiyor. Rasgele seçilen 20 hastaya ilişkin veriler aşağıdaki
tabloda verilmiştir.
a) Regresyon denklemini matrisler yardımıyla belirleyiniz.
b) Modelin genel anlamlılığını varyans analizi ile %5 A.D’de belirleyiniz.
c) Regresyon katsayılarının anlamlılığını matrisler yardımıyla belirleyiniz.
d) Regresyon katsayılarının güven aralıklarını ve çoklu belirlilik katsayısını
hesaplayınız.
No y x1 x2 No y x1 x2
1 6 1 1 11 13 1 4
2 6 2 1 12 9 1 2
3 11 2 2 13 17 3 3
4 9 1 3 14 17 2 4
5 16 3 3 15 12 4 1
6 16 1 5 16 6 1 1
7 4 1 1 17 5 1 1
8 8 3 1 18 12 3 2
9 11 2 2 19 8 1 2
10 13 3 2 20 9 2 2
Çözüm 2:
Hastane verisine ilişkin bazı istatistikler aşağıdadır.
Σ yi = 208 Σ x1i = 38 Σ x2i = 43
Σ yi2 = 2478 Σ x1i2 = 90 Σ x2i2 = 119
Σ x1,yi = 430 Σ x2iyi = 519 Σ x1ix2i = 79
y = 10,4 x 1 = 1,9 x 2 = 2,15
6 1 1 1
6
1 1 1 . . .1
2 1 1 2 . . .2
. x=
y= x1 =
. . .
. 1 1 . . . 2
9
1 2 2
1 1
n Σ x 1 Σ x 2 i 1i . 1 . . 2 3 4 0 8 3
2 1 2 1
x/x =
x 1 ΣΣ x1 i 1ΣΣ ixx 2 = 1i 2.i 2. =.3 9 7 8 0 9
. .
x ΣΣΣΣ xxx 2 1 . 2 . .4 7 1 3 9 1 9
2 1 i2 2 i i i
1 2 2
0,480228 − 0,12089 − 0,09327
0,005803
[x x] = − 0,12089
/ -1 0,05706
− 0,09327 0,005803 0,038255
6
1 1 . . .1 6
1 2 . . .2 208 Σy
. = 430 = Σx y
i
/
xy = 1i i
519 Σx y 2i i
1 1 . . . 2 .
9
0,480228 − 0,12089 − 0,09327 208 − 0,50398 β 0
ˆβ = − 0,12089 0,05706 0,005803 .430 = 2,402321 = β1
− 0,09327 0,005803 0,038255 519 2,948635 β 2
y1
y
2
b) Toplam Değişim Kareler Toplamı = [y y … y ] . = n.y
1 2 20
-2
.
y 20
6
6
TDKT = [6 6 … 9] . -20(10,4) = 2478 – 2163,2 = 314,8
2
.
9
208
2
Regresyon Kareler Toplamı = RKT = [-0,50498 2,402 2,948] 430 -20(10,4)
519
H0 : β 0 = β 1 = β 2 = 0
H1 : En az bir β i ≠ 0
147 ,65639
Fh = =128 ,81
1,14631
Fh = 128,81 > F0,05; 2,17 = 3,59 olduğu için doğrusal ilişkinin anlamlı olduğu yada
y değişkenindeki değişimin x1 ve x2 değişkenlerince açıklanabildiği söylenir.
0,480228 0,74194 σˆ βˆ 0
σˆ (βˆ ) = 1,07066 0,05706 = 0,25575 = σˆ
i βˆ 1
0,038255 0,209408 σˆ βˆ
2
olarak elde edilir ve regresyon katsayılarının anlamlılığı aşağıdaki gibi elde edilir.
H0 : β 0 = 0 (Katsayı anlamlı değildir)
H1 : β 0 ≠ 0 (Katsayı anlamlıdır)
ˆ
β − 0,503976
th = ˆ = = 0,679
0
σβˆ 0,741949
σβˆ
T.C.
OSMANGAZİ ÜNİVERSİTESİ
FEN EDEBİYAT FAKÜLTESİ
İSTATİSTİK BÖLÜMÜ
REGRESYON ANALİZİ
YRD.DOÇ. DR. BİRDAL ŞENOĞLU
BİLGE BAYAR
121419971008
OCAK, 2003
ESKİŞEHİR