You are on page 1of 18

6.

1 Pengertian Umum
Banyak permasalahan yang datanya dinyatakan oleh lebih dari sebuah variabel. Hubungan
antara dua atau lebih variabel dapat dinyatakan secara matematika sehingga merupakan suatumodel
yang dapat digunakan untuk berbagai keperluan analisis, misalnya: peramalan (prediction),
perpanjangan (extension), perbaikan atau pengecekan ketelitian data, atau pe ngisan datapadapriode
kosong untuk kasus hidrologi. Analisis regresi adalah analisis yang membahas hubungan fungsional
dua variabel atau lebih. Analisis korelasi (correlation analisys) adalah analisis yang membahas
tentang derajat hubungan dalam analisis regresi disebut. Tujuan regresi adalah untuk melihat
hubungan antara 2 variabel atau lebih.
6.2 Nilai Harapan
Misalkan adalah variabel acak dengan distribusi probabilitas (). Mean atau ekspektasi
atau nilai harapan dari X adalah
= () = (),

(6. 1)

= () = () ,

(6. 2)
Ekspektasi atau nilai rata-rata atau nilai mean dari variabel acak dengan fungsi kerapatan
peluang dan nilai xi untuk = 1, 2, . .. adalah

() = ( )
=1

(6. 3)
Teorema 1
Jika adalah variabel acak diskrit, nilai mean dari fungsi = () adalah
() = [ ()] = ( ) ( = )

(6. 4)
Teorema 2
Misalkan dan adalah variabel acak diskrit maka
a. untuk sembarang konstanta a, E a a dan E aX aE X
b. E X Y E X E Y
c. terdapat kontanta a, b, c

E aX bY c aE X bE Y c
Sifat-sifat ekspektasi:

a. Jika X merupakan variabel acak dengan pdf fx(x) dan u(X) adalah fungsi dari X, maka ekspektasi
dari u(X) adalah:

u x fx x , jika X diskrit
x
E u X
u x fx x dx, jika X kontinu

(6. 5)
b. Sifat linear ekspektasi

E ag X bh X aE g X bE h X
(6. 6)
6.3 Variansi
Mean dari variabel acak X adalah suatu nilai yang penting dalam statistik karena nilai tersebut
menggambarkan dimana distribusi probabilitas berpusat. Meskipun demikian mean tidakcukupuntuk
memberikan gambaran tentang bentuk suatu distribusi.Untuk mengetahui bentuk suatu distrib usi,
perlu diketahui variabilitas distribusi tersebut. Salah satu ukuran variabilitas dalam statistik adalah
variansi. Variansi dari variabel acak X atau variansi dari distribusi probabilitas X dinyatakan dengan

Var X atau dinotasikan dengan x 2 atau 2 .


Misalkan X adalah variabel acak dengan distribusi probabilitas f x dan mean . Variansi
dari X adalah
2
2
2 E X x f x , jika X diskrit

(6. 7)
2
2 E X

x f x dx , jika X kontinu
2

(6. 8)
Akar kuadrat positif ddari variansi dinamakan standar deviasi dari .
Teorema 3
Variansi variabel acak X adalah

2 E X 2 2
(6. 9)
Bukti :
Untuk kasus diskrit dapat dituliskan

2 x f x x 2 2 x 2 f x
2

x f x 2 xf x 2 f x
2

karena xf x dan
x

f x 1 untuk setiap distribusi probabilitas diskrit maka


x

2 x 2f x 2 2 2
x

sehingga diperoleh

2 x 2f x 2 E X 2 2
x

(6. 10)
Nilai disebut penyimpangan suatu pengamatan dari rataannya. Karena penyimpangan
ini dikuadratkan lalu dirata-ratakan, maka 2 akan lebih kecil untuk kelompok nilai yang dekat
dengan dibandingkan dengan kelompok nilai yang jauh dari .
Dengan kata lain, jika nilai-nilai cenderung terkonsentrasi di dekat rataannya, maka
variansinya kecil. Sedangkan jika jauh dari rataan maka variansinya besar.
Variansi untuk peubah acak lain yang bergantung pada , yaitu (), diberikan dalam
Teorema 4.
Misalkan adalah peubah acak dengan distribusi peluang (). Variansi dari peubah acak ()
adalah:
2

2
()
= [( () () )]2 = [( () () )] () ,

(6. 11)

2
()
= [( () () )]2 = [( () () )] () ,

(6. 12)

6.4 Sifat-Sifat Variansi


Teorema 5.
Jika a dan b adalah konstanta maka
2
2 2
2 2

+ = =

(6. 13)
Akibat 1: Jika a = 1, maka
2
2
2

+ = =

(6. 14)
Akibat 2: Jika b = 0, maka
2

= 2 2 = 2 2

(6. 15)

Teorema 6.
Jika X dan Y adalah peubah acak dengan distribusi peluang (, ) maka :
2
2 2
2 2

+ = + + 2

(6. 16)
Akibat 1: Jika X dan Y peubah acak saling bebas, maka:
2
2 2
2 2

+ = +

(6. 17)
Akibat 2: Jika X dan Y variabel random saling bebas, maka:
2
2 2
2 2

= +

(6. 18)
6.5 Kovariansi
Salah satu ukuran kekuatan hubungan linear antara dua variabel acak kontinu adalah dengan
menentukan seberapa banyak kedua variabel tersebut co-vary, yaitu bervariasi bersama-sama. Jika
salah satu variabel meningkat (atau menurun) sebagai akibat peningkatan (atau penurunan) variabel
pasangannya, maka dua variabel tersebut dinamakan covary. Namun jika satu variabel tidak berubah
dengan meningkatnya (atau penurunan) variabel lain, maka variabel tersebut tidak co-vary. Statistik
untuk mengukur berapa banyak kedua variabel covary dalam sampel pengamatan adalah kovarian.
Selain mengukur besarnya kekuatan hubungan di antara dua variabel, kovarian juga
menentukan arah hubungan dari kedua variabel tersebut.
Apabila nilainya positif, berati bahwa apabila nilai x berada di atas nilai rata-ratanya, maka
nilai y juga berada di atas nilai rata-rata y, dan sebaliknya (Searah).
Nilai kovarian negatif menunjukkan bahwa apabila nilai x berada di atas nilai rata-ratanya
sedangkan nilai y berada di bawah nilai rata-ratanya (berlawanan arah).
Terakhir, apabila nilai kovarian mendekati nol, menandakan bahwa kedua variabel tersebut
tidak saling berhubungan.
Jika dan dua peubah acak bebas dengan rataan x dan y , maka kovarians peubah acak
dan didefinisikan sebagai
= [( )( )]
(6. 19)
Misalkan dan adalah variabel acak dengan distribusi peluang gabungan (, ). Kovariansi
dari dan adalah
= [( )( )] = ( )( ) (, ),

(6. 20)

Dan

= [( )( )] = ( )( ) (, ) ,

(6. 21)
Interpretasi:
Kovariansi antara dua peubah acak menunjukkan sifat asosiasi (hubungan) antara keduanya;
Jika kedua peubah tersebut bergerak kearah yang sama (nilai berada di atas nilai rataratanya, maka nilai juga berada di atas nilai rata-rata y) maka hasil kali ( )( )

cenderung bernilai positif;


Jika kedua peubah tersebut bergerak ke arah berlawanan (nilai berada di atas nilai rataratanya sedangkan nilai berada di bawah nilai rata-ratanya), maka hasil kali ( )(
) cenderung akan bernilai negatif.

Terakhir, apabila nilai kovarian mendekati nol, menandakan bahwa kedua variabel tersebut
tidak saling berhubungan.
Tanda kovariansi (+ atau -) menunjukkan apakah hubungan antara kedua peubah acak positif
atau negatif.
Rumus alternatif untuk kovariansi:
= [( )( )] = ( )
(6. 22)
6.5.1 Sifat-Sifat Kovariansi
Sifat- sifat kovarian adalah sebagai berikut

Jika X dan Y diskrit:


= < > = (, )

(6. 23)
= < > = (, )

(6. 24)
= < > = (, )

(6. 25)

Jika X dan Y kontinyu

= < > = (, )

(6. 26)

= < > = (, )

(6. 27)

= < > = (, )

(6. 28)

6.6 Persamaan Korelasi


Persaman korelasi antara nilai dan adalah
(, ) =

, 1 (, ) 1

(6. 29)
hasil perhitungan dari persamaan 2.11 disebut sebagai harga/notasi Korelasi. Penjelasandari
harga/notasi korelasi adalah sebagai berikut :
HARGA (-)
Ada hubungan tapi terbalik (jika mengecil maka membesar atau sebaliknya)
HARGA (+)
Ada hubungan tetapi sebanding ( mengecil maka mengecil atau sebaliknya)
HARGA (0)
Tidak ada hubungan

Contoh Soal 6.1 :


Berikut ini adalah fungsi distribusi probabilitas bersama antara variabel X dan Y. Carilah kovariansi X
dg Y
f(x,y)
x
Jumlah
baris
0
1
2
h(y)
y
0
3/28
29/28
3/28
15/28
1
3/14
3/14
0
6/14
2
1/28
0
0
1/28
g(x)
10/28
15/28
3/28
1

Langkah 1:
Pertama hitung mean masing-masing variabel:

X E[ X ] xg( x) 0 * 5 / 14 1*15 / 28 2 * 3 / 28 3 / 4
x
Y E[Y ] yh( y) 0 *15 / 28 1* 3 / 7 2 *1 / 28 1 / 2
x

Langkah 2:
Kemudian hitung E(XY)=

E[ XY ]
y

xyf ( x, y) (0 * 0)(3 / 28) (0 *1)(9 / 28) (0 * 2)(3 / 28)


x

(1* 0) * (3 / 14) (1*1)(3 / 14) (1* 2)(0) (2 * 0)(1 / 28) (2 *1)(0) (2 * 2) * 0


E(XY)=0+0+0+0+3/14+0+0+0+0 = 3/14
Langkah 3:

XY E[ XY ] X Y

3
3 1
9
( )( )
14 4 2
56

6.7 Analisis Regresi


Analisis regresi mempelajari bentuk hubungan antara satu atau lebih peubah bebas ()
dengan satu peubah tak bebas (). Dalam penelitian peubah bebas () biasanya peubah yang
ditentukan oleh peneliti secara bebas misalnya dosis obat, lama penyimpanan, kadar zat pengawet,
umur ternak dan sebagainya. Disamping itu peubah bebas bisa juga berupa peubah tak bebasnya,
misalnya dalam pengukuran panjang badan dan berat badan sapi, karena panjang badan lebih mudah
diukur maka panjang badan dimasukkan kedalam peubah bebas (), sedangkan berat badan
dimasukkan peubah tak bebas (). sedangkan peubah tak bebas () dalam penelitian berupa respon
yang diukur akibat perlakuan/peubah bebas (). Misalnya jumlah sel darah merah akibat pengobatan
dengan dosis tertentu, jumlah mikroba daging setelah disimpan beberapa hari, berat ayampadaumur
tertentu dan sebagainya.
Bentuk hubungan antara peubah bebas () dengan peubah tak bebas () bisa dalam bentuk
polinom derajat satu (linear) polinom derajat dua (kuadratik). Polinom derajat tiga (Kubik) dan
seterusnya. Disamping itu bisa juga dalam bentuk lain misalnya eksponensial, logaritma, sigmoiddan
sebagainya. Bentuk-bentuk ini dalam analisis regresi-korelasi biasanya ditransformasi supayamenjadi
bentuk polinom.
Untuk menjelaskan bagaimana hubungan antara dua variabel, perhatikan data yang
tercantum dalam tabel berikut :

HARI
KE

PENGUNJUNG
(Xi)

BELANJA

35

32

(Yi)

HARI
KE

PENGUNJUNG

BELANJA

(Xi)

(Yi)

16

40

38

39

36

17

41

37

34

31

18

32

30

40

38

19

34

30

31

29

20

30

28

43

42

21

35

35

40

33

22

36

29

30

29

23

37

34

34

29

24

39

35

10

39

36

25

41

36

11

33

31

26

33

32

12

32

31

27

34

32

13

36

33

28

36

34

14

40

37

29

38

37

15

43

36

30

37

34

Tabel 6. 1 Banyak pengunjung dan belanja di suatu toko swalayan selama 30 hari

Tabel 2.1 merupakan gambaran banyak pengunjung (dinyatakan dengan ) dan yang
berbelanja (dinyatakan dengan ) yang telah dicatat oleh seseorang pengusaha di tokonya.
Kebiasaan yang digunakan dalam penentuan simbol-simbol yang lazim, ialah untuk hal yang
diperkirakan lebih tepat dapat digolongkan ke dalam variabel yang sifatnya bebas, sedangkan untuk
variabel yang diperkirakan akan bergantung pada .
Bentuk dari model persamaan regresi untuk populasi secara umum adalah sebgai berikut

Y f X 1 , X 2 ,..., X k / 1 , 2 ,..., m
(6. 30)
Dimana 1 , 2 ,..., m parameter-parameter yang terdapat dalam regresi itu. Regresi yang
sederhana untuk populasi dengan sebuah variabel bebas yang dikenal dengan regresi linier dengan
model:

Y 1 2 X , 1 dan 2 parameternya.
(6. 31)

Untuk satu variabel bebas (regresi linier):

1 dan 2 dari sebuah sampel acak dapat ditaksir oleh a dan b maka persamaan regresinya
adalah

Y a bX
(6. 32)

Untuk fonemena dua variabel bebas ( regresi non linier):


Parameter-parameternya 1 , 2 dan 3 dari sebuah sampel acak dapat ditaksir oleh a, b dan
c maka persamaan regresinya berupa parabola yaitu

Y aX 2 bX c
(6. 33)

6.8 Regresi Linear


Scatter diagram (diagram pencar) adalah suatu diagram yang digunakan untuk melihat secara
visual apakah ada hubungan antara 2 variabel.

Gambar 6. 1 Contoh Diagram Pencar


Sumber: http://www.spcforexcel.com/files/images/scatterpic.gif
Dengan menggunakan diagram pencar dapat dilihat apakah ada sesuatu hubungan yang
berarti diantara titik-titik itu pada atau sekitar garis lurus? Jika demikian halnya, cukup alasan bagi
kita untuk menduga bahwa antara variabel-variabel itu ada hubungan linear. Dalam hal lainnya,antara
variabel-variabel itu diduga terdapat hubungan non linear.
Setelah diketahui bentuk hubungan antara variabel itu, tugas selanjutnya ialah menentukan
hubungan tersebut dirumuskan dalam suatu persamaan matematis. Kemudian disusun dalam suatu
persamaan garis yang merepresentasikan persamaan matematisnya. Garis ini dikenal dengan nama
garis regresi. Jika hubungan = () itu linear, maka garis yang didapat adalah garis regresi linear.
Dalam hal lainnya didapat regresi nonlinear.

Oleh karena regresi linear merupakan bentuk regresi yang paling mudah ditelaah, kecuali itu
juga karena banyak regresi nonlinear yang dapat diselesaikan dengan bantuan regresi linear, makadi
sini terutama hanyalah regresi tersebut yang akan dibicarakan.
Bagaimanakah menentukan persamaan regresi yang linear ini? Yang paling mudah ialah
dengan jalan kira-kira menurut penglihatan kita. Pada kumpulan titik-titik itu ditarik sebuahgarislurus
yang akan paling dekat titik-titik itu berkerumun sekitar garis yang ditarik tadi.Sesudah itu ditentukan
bagaimana persamaannya.
Meskipun cara tersebut sangat mudah dilakukan namun untuk penelitian jarang dilakukan
oleh karena kecuali terlalu kasar hasilnya, juga terlalu subyektif dan ini sedapat mungkin harus
dihindarkan. Karenanya akan ditinjau cara yang dianggap cukup baik dan sering digunakan. Cara yang
dimaksud adalah METODA KUADRAT TERKECIL. Sebelum cara ini dibicarakan, terlebih dahulu akan
ditinjau seperlunya macam-macam regresi linear yang mungkin, sehubungan dengan variabel bebas.
Di atas dikatakan, bahwa jika variabel yang diketahui terlebih dahulu dan kemudian
ditentukan berdasarkan ini, maka ditentukan hubungan = (). Rumusan hubungan ini lebih
dikenal dengan nama regresi atas .
Jika regresi atas ini linear, maka persamaannnya dapat dituliskan dalam bentuk linear :
= + +
(6. 34)
dengan
Y = variabel tak bebas
X = variabel bebas
= koefisien intercept
= koefisien slope/ gradien
= error
Model tersebut ditaksir dengan :
= +
(6. 35)

Dengan berarti taksiran nilai untuk harga Y yang diketahui. Tiap pengamatan akan memenuhi :

Yi a bX i
(6. 36)
Sehingga error yang terjadi :

i Yi Yi Yi (a bX i )
(6. 37)
Untuk menentukan koefisien-koefisien dan ini akan digunakan Metoda Kuadrat Terkecil.
Ternyata bahwa untuk regresi linear, harga-harga dan dapat dihitung berdasarkan sekumpulan
data sebanyak buah dengan menggunakan sistem persamaan :

Yi an b X i
i 1

i 1

i 1

i 1

i 1

X iYi a X i b X i2
(6. 38)
Pasangan persamaan 6.38 disebut persamaan-persamaan normal untuk bentuk regresi
Setelah diselesaikan, akan didapat harga-harga dan yang dicari dengan persamaan

i 1

i 1

i 1

Yi X i2 X i X iYi
i 1

n X i X i
i 1
i 1
n

n X iYi X i Yi
i 1

i 1

i 1

n X i X i
i 1
i 1
n

(6. 39)
6.9 Regresi Non Linear
Setelah dipelajari seperlunya mengenai bentuk hubungan linear antara dua variabel X dan Y
sekarang akan diperhatikan bentuk hubungan nonlinear antar dua variabel. Tidak akan dibicarakan
secara luas dan mendalam mengenai regresi nonlinear ini, tetapi hanya merupakan suatu tinjauan
singkat saja, tinjauan yang pada umumnya dapat ditelaah berdasarkan teori regresi linear.
Meskipun terdapat banyak sekali bentuk regresi non linear yang biasa digunakan tetapi di sini
hanyalah akan ditinjau beberapa saja yang penting dan termudah. Untuk regresi nonlinear Y atas X
yang akan ditinjau di sini, antara lain berbentuk lengkungan :
a.
Parabola kuadratis dengan persamaan

Y a bX cX 2
(6. 40)
b.

Parabola kubis dengan persamaan

Y a bX cX 2 dX 3
(6. 41)
c.

Logaritmis dengan persamaan :

Y aX b
(6. 42)
d.

Hiperbola dengan persamaan :

1
a bX
(6. 43)

6.10 Regresi Linear Berganda


Ada banyak kenyataan bahwa pengamatan akan terdiri atas lebih dari dua variabel. Sehingga
yang harus digunakan adalah regresi dengan variabel bebas lebih dari satu.
Contoh :
1.
Harga beras tidak saja hanya ditentukan oleh adanya persediaan, tetapi juga oleh harga
bensin, upah buruh dan sebagainya.
2.
Produksi telur ayam tidak saja bergantung pada banyaknya ayam petelur yang ada saja, tetapi
juga dari banyak makanan yang diberikan, umur ayam dan barangkali masih ada faktor
lainnya.
Apabila ada satu variabel terikat Y dan k variabel bebas X1 , X 2 ,..., X k sehingga terdapat
hubungan semacam garis regresi Y atas X1 , X 2 ,..., X k . Dalam bagian ini akan dijelaskan secara
singkat bagaimana garis regresi yang dimaksud dapat ditentukan dan yang akan ditinjau di sini
hanyalah garis regresi Y atas X1 , X 2 ,..., X k yang paling sederhana ialah yang dikenal dengan nama
regresi linear berganda. Persamaan umum untuk regresi linear berganda ini adalah :

Y a0 a1 X1 ... ak X k
(6. 44)
Dimana a0 , a1 ,..., ak harus ditentukan dari data hasil pengamatan. Mudah dilihat bahwa
regresi di atas ini merupakan perluasan dari regresi linear sederhana.
Pertanyaan yang timbul adalah bagaimana koefisien-koefisien a0 , a1 ,..., ak ditentukan ?
Secara sama dengan regresi linear sederhana, maka dipergunakan Metode Kuadrat Terkecil. Oleh
karena ada k+1 parameter yang harus dicari maka diperlukan k+1 persamaan. Dapat dibayangkan
bahwa hal itu memerlukan metode penyelesaian yang lebih baik dan karenanya memerlukan
matematika yang lebih tinggi lebih-lebih untuk variabel yang cukup banyak.

6.11 Analisis Korelasi


Hubungan antara dua variabel dan yang diperoleh dinyatakan dalam bentuk persamaan
matematis yang dalam statistika dikenal dengan nama garis regresi. Jika merupakan variabel bebas
dan variabel tak bebas, regresi atas dapat digunakan untuk meramalkan nilai apabila nilai
diketahui.
Dalam banyak soal, jika nilai-nilai pengamatan terdiri atas lebih dari sebuah variabel, bukan
saja regresinya yang perlu dihitung, tetapi juga kekuatan hubungan antara variabel -variabel itu.
Ukuran yang digunakan untuk itu adalah koefisien korelasi. Korelasi dapat bersifat linier atau tidak

linier. Korelasi dikatakan linier jika pada scatter diagram (diagram pencar) semua titik terlihat
mengelompok disekitar garis lurus.
Untuk keperluan analisis tentang korelasi ini, seperti biasa akan dibedakan antara statistik
(ialah koefisien korelasi untuk data dalam sampel) dan parameter (untuk menyatakan koefisien
korelasi populasi). Koefisien korelasi untuk sampel, jadi merupakan statistik, akan dinyatakandengan
sedangkan parameternya dengan (baca : rho).
Dalam bagian berikut ini akan diuraikan bagaimana dihitung dan selanjutnya akan diberikan
penjelasan mengenai pengujian derajat asosiasi.
6.11.1 Koefisien Korelasi
Karena ternyata korelasi dan regresi berhubungan erat, maka untuk menentukan ukuran
asosiasi atau koefisien korelasi, perlu terpenuhi syarat-syarat :
1. Koefisien korelasi harus besar apabila derajat asosiasi tinggi dan harus kecil apabila derajat
asosiasi rendah.
2. Koefisien korelasi harus bebas daripada satuan yang digunakan untuk me ngukur variabel.
Untuk mencapai kedua syarat di atas, maka untuk menentukan koefisien korelasi r biasa
digunakan statistik :

X
n

i 1

Y Y
i

n 1 S x S y

(6. 45)
Inilah rumus koefisien korelasi yang pertama yang disebut Koefisien Korelasi Person atau
Product Moment.
Koefisien korelasi menunjukkan apakah cukup beralasan bagi kita untuk menyatakan ada
atau tidak adanya hubungan linear antara variabel-variabel dan . Rumus lain yang juga sering
dipergunakan adalah :

n X iYi X i Yi
i 1

i 1

i 1

2
n X i X i n Yi Yi
i 1 i 1
i 1
i 1
n

(6. 46)
Dengan menggunakan perhitungan matematika, ternyata dapat dibuktikan bahwa batasbatas koefisien korelasi itu berada dalam daerah / interval :
-1 r 1
Tanda positif menyatakan bahwa antara variabel-variabel itu terdapat korelasi positif atau
korelasi langsung yang berarti nilai variabel yang kecil berpasangan dengan nilai variabel yang
kecil serta nilai variabel yang besar berpasangan dengan nilai variabel yang besar pula.

Korelasi positif menunjukkan letak titik-titik dalam diagram pencar berada sekitar garis lurus
yang koefisien arahnya positif. Makin dekat letak titik-titik itu pada garis lurus, makin kuatlah korelasi
positif itu dan harganya makin dekat kepada satu.
Jika variabel yang besar berpasangan dengan yang kecil dan jika kecil berpasangan
dengan yang besar, akan diperoleh Korelasi negatif atau korelasi invers.
Dilihat dari diagram pencarnya, letak titik-titik akan berada sekitar sebuah garis lurus yang
koefisien arahnya negatif. Makin dekat letak titik-titik itu pada garis yang dimaksud, makin dekatpula
nilai kepada -1. Dan akhirnya jika titik-titik itu terletak pada garis lurus yang koefisien arahnya
negatif didapat harga = 1.
Dalam prakteknya jarang sekali didapatkan diagram pencar yang letak titik-titiknya pada
sebuah garis lurus seperti dalam gambar 2.1 sangat jarang. Yang sering didapati adalah bentuk yang
menyebabkan nilai koefisien korelasi tidak sama dengan 1 atau -1. Makin terpencar letak titik-titik
itu dari sebuah garis lurus, makin dekatlah kepada nol.
Setelah dikenal apa arti koefisien korelasi, masih ada ukuran lain yang sebenarnya lebih
mudah untuk ditafsirkan dalam penggunaannya. Ukuran tersebut ialah yang dinamakan koefisien
determinasi yang tiada lain daripada kuadrat koefisien korelasi. Jadi :
Koefisien Determinasi = r2
(6. 47)
Karena sudah diketahui bahwa koefisien korelasi berada 1 + 1, maka tentulah
koefisien determinasi mulai dari nol sampai dengan 1, atau :
0 r2 1
Koefisien determinasi biasanya dinyatakan dengan persen. Sedangkan penafsirannya adalah
jika r = 0,94 sehingga r2 = 0,8836 atau 88,36% maka ditafsirkan sebagai 88,36% variasi suatu variabel
yang disebabkan oleh variabel lainnya.
Koefisien determinasi banyak digunakan dalam penjelasan tambahan untuk hasil perhitungan
koefisien regresi.

6.11.2 Menghitung r Untuk Data Berkelompok


Rumus-rumus 6.45 dan 6.46 adalah rumus-rumus untuk menentukan apabila datanya masih
belum disusun dalam daftar distribusi frekuensi. Rumus-rumus 6.45 dan 6.46 pula cukup
menyenangkan untuk digunakan apabila datanya tidak terlalu banyak. Jika data yang sedang dicari
korelasinya itu banyak sekali, dengan menggunakan rumus-rumus tersebut akan memakan waktu
yang lama dari perhitungannya. Oleh karena itu perlu ada usaha untuk mempersingkatnya. Jalanyang
lazim ditempuh ialah terlebih dahulu menyusun data ke dalam daftar distribusi frekuensi.Olehkarena
kita sedang berhadapan dengan penelitian yang terdiri atas dua variabel, maka kitapun akan
memperoleh dua distribusi frekuensi. Kedua distribusi frekuensi ini harus disajikan dalam daftaryang
berklasifikasi dua, sedemikian sehingga dampaknya banyak seperti daftar kontingensi. Banyak baris
sesuai dengan banyak kelas interval distribusi frekuensi variabel yang satu, sedangkan banyak kolom
sesuai dengan banyak kelas interval dari distribusi frekuensi variabel kedua. Untuk variabel yangsatu,
yang terdapat dalam baris, kelas-kelas intervalnya mulai dari atas ke bawah disusun seperti biasa,

yakni dari data yang kecil hingga yang paling besar. Variabel yang terdapat dalam kolom, kelas-kelas
intervalnya dari kiri ke kanan yang dimulai dari data yang kecil hingga yang besar.
Frekuensi data dalam daftar ini akan didapati dalam tiap-tiap sel. Jadi frekuensi dalam setiap
sel merupakan banyak data yang ada dalam kelas interval variabel yang satu dan juga yang ada dalam
kelas interval variabel yang lain.
Untuk itu dipergunakan rumus berikut :

n fuv f xu f y v

2
2

f x u 2 f xu n fuv 2 - fuv

(6. 48)

dimana :
u = koding untuk variabel X
v = koding untuk variabel Y
fx = frekuensi kelas interval dari variabel X
fy = frekuensi kelas interval dari variabel Y
f = frekuensi dalam tiap sel
n = banyak data.
6.11.3 Korelasi Rank
Ada kalanya ingin diketahui korelasi antara dua variabel tidak berdasarkan pada pasangan
data dimana nilai sebenarnya diketahui. Umpamanya saja, kita telah melakukan penelitianmengenai
tingkatan menyenangi merk sepatu olahraga bagi prajurit A dan prajurit B anggota TNI AL. Hasilnya
dinyatakan dalam tabel di bawah ini. Untuk sepatu yang paling disukai, diberi nilai 1 dan yang paling
tidak disukai diberi nilai 10. Urut-urutan nilai tersebut dinamakan RANK. Berdasarkan ranktersebut,
dapatlah ditentukan hubungan / korelasi antara keddua variabel. Ukuran yang diperoleh biasa
dinamakan koefisien korelasi rank atau biasa juga dikenal dengan koefisien korelasi spearman dan
disimbulkan dengan (baca : er -aksen) untuk membedakan dengan koefisien korelasi yang sudah
dikenal.
Rumus untuk menghitung koefisien korelasi spearman adalah:
n

r 1

6 di2
i 1
2

n n 1
(6. 49)

dengan

di = selisih tiap pasang rank


n = banyaknya pasangan data

6.11.4 Korelasi Berganda


Korelasi berganda merupakan korelasi dari beberapa variabel bebas secara serentak dengan
variabel terikat
Misalkan ada k variabel bebas, X1 , X 2 ,..., X k dan satu variabel terikat Y dalam suatu persamaan
regresi linear Y a0 a1 X1 ... ak X k maka besarnya korelasi bergandanya adalah :

ry , x1 ,..., xk

a1 x1 y a2 x2 y ... ak xk y

(6. 50)
dengan

x y X Y n
X
Y
x y X Y
X1

y Y
2

(6. 51)
6.11.5 Korelasi Parsial
Korelasi parsial adalah korelasi antara sebuah variabel tak bebas dengan sebuah variabel
bebas tertentu dengan variabel-variabel bebas lain dianggap tetap/konstan. Koefisien korelasi parsial
dinyatakan dengan perumusan
Untuk dua variabel bebas :
Korelasi parsial Y dengan X 1 dengan X2 dianggap konstan adalah :

rYX1 . X 2

rYX1 rYX 2 rX1 X 2

1 r 1 r
2

YX 2

2
X1 X 2

(6. 52)
Korelasi parsial Y dengan X 2 dengan X1 dianggap konstan adalah :

rYX 2 . X1

rYX 2 rYX1 rX1 X 2

1 r 1 r
2

YX 1

2
X1 X 2

(6. 53)

Contoh soal 6.2 :


Diketahui suatu penelitian terhadap hubungan antara nilai biaya periklanan dengan tingkatpenjualan
dari sebuah koperasi adalah sebagai berikut : (dalam ribuan rupiah)

a.
b.
c.
d.
e.

No

Biaya periklanan

Tingkat Penjualan

50

40

51

46

52

44

53

55

54

49

Tentukan persamaan regresinya ?


Berapa besarnya koefisien korelasi dan koefisien determinasinya ?
Berapa besarnya kesalahan standar estimasinya ?
Bagaimana hubungan antara variabel biaya periklanan dengan tingkat penjualan? (r)
Berapa proporsi keragaman tingkat penjualan yang dapat di jelaskan oleh biaya periklanan
dalam hubungan linier tersebut? (r2)

Jawab:
a. Menentukan persamaan regresinya
Langkah 1 :
Menentukan variable X dan variable Y. Dalam soal ini variable biaya periklanan merupakan
variable (X) dan tingkat penjualan merupakan variable (Y).
Langkah 2:
Membuat table regresi sederhana

No

XY

X2

Y2

50

40

2000

2500

1600

51

46

2346

2601

2116

52

44

2288

2704

1936

53

55

2915

2809

3025

54

49

2646

2916

2401

Total

260

234

12195

13530

11078

Langkah 3 :
Menentukan koefisien a dan koefisien b

n. xy - x y
n x x

(5)(12195) (260)( 234)


2.7
(5)(13530) (260) 2

a y bx
a

y - b x (234 (2.7)(260))

93.6
n

Langkah 4:
Menentukan persamaan regresi linier sederhana
Y = a + b (X)
Maka persamaan regresi dalam soal ini adalah :
Y = -93,6 + 2,7 (X)
b. Menentukan koefisien korelasi dan koefisien determinasinya.
Koefisien Korelasi
n

rxy

i 1

i 1

i 1

i 1

i 1

{n xi ( xi ) 2 }{n y i ( y i ) 2 }
i 1

n xi y i xi y i
2

i 1

(5)(12195) (260)( 234)


((5)(13530) (260) 2 )((5)(11078) (234) 2 )

0.76

You might also like