You are on page 1of 47

4.

1 beberapa ide tentang perkiraan interval Bagian yang penting dalam ilmu statistik adalah statistik induktif atau statistical inference. Statistic induktif mencakup dua hal pokok, yakni teori estimasi dan pengujian hipotesis. Teori perkiraan terdirir dari dua hal penting. Yaitu perkiraan tunggal dan perkiraan interval. Perkiraan tunggal mengenai koefisien regresi, koefisien korelasi dan varian sudah dibahas panjang lebar dengan menggunakan metode kuadrat terkecil sederhana (OLS) dan juga disinggung sedikit mengenai metode maximum likelihood (ML). Dalam bab ini akan dibahas mengenai perkiraan interval dan pengujian hipotesis , baik mengenai koefisien-koefisien, individu dan nilai harapan Y, maupun varian kesalahan pengganggu. Untuk membahas ide dasar perkiraan interval, perkiraan koefisien regresi , ini artinya kalau upah karyawan naik 1 unit, maka konsumsi karyawan naik 0,8556 kali. Jadi seandainya upah karyawan naik Rp 1.000,00 maka diperkirakan konsumsi karyawan akan naik Rp 855,60. Menurut Keynes, kenaikan konsumsi selalu lebih kecil dari kenaikan pendapatan (karena upah merupakan satu-satunya pendapatan), hal itu dinyatakan dalam konsep MPC (marginal propensity to consume). Nilai b= 0,8556 ini merupakan perkiraan tunggal parameter B, yaitu koefisien regresi sebenarnya (Yi = A + BXi +
i)

. khusus dalam hal ini, kalau

X=pendapatan dan Y= konsumsi, koefisien regresi merupakan MPC. Pertanyaan yang timbul : seberapa juga perkiraan b ini dapat dipercaya ? Karena adanya fluktuasi sampling, perkiraan tunggal ini akan berbeda dengan nilai sebenarnya (B), walaupun dalam sampling yang diulang, nilai ratarata b akan sama dengan nilai B sebab b pemerkira tidak bias. Dalam statistika, tingkat kepercayaan (reliability) pemerkira tunggal diukur oleh standar eror atau variannya. Maka, daripada percaya pada perkiraan tunggal saja, kita mungkin lebih baik kalau memberikan pernyataan probabilitas, bahwa pemerkira tunggal tersebut terletak dalam suatu interval disekitar nilai parameternya (b akan terletak disekitar B), sejauh 1,2 atau 3 standard erornya. Jadi, perkiraan interval bebarti kita mengharapkan bahwa nilai B yang sebernarnya itu akan terletak dalam suatu interval (dengan nilai batas bawah dan batas atas) dengan tingkat keyakinan

tertentu, katakanlah 95% Inilah yang merupakan ide dasar di belakang perkiraan interval tersebut. Untuk lebih jelasnya, anggap bahwa kita akan mencari kenyataan betapa dekatnya nilai b tersebut dengan B. untuk maksud ini, kita mencoba mencari dua nilai positif, katakan d dan , dimana nilai alpha terletak diantara 0 dan 1,

sedemikian rupa sehingga probabilitas bahwa interval (b-d, b+d) mencakup nilai sebenarnya (B) sebesar (1- ) Dengan symbol dapat ditulis : P(b-d bd B b+d = 1b+d (4.1)

confidence interval batas bawah interval batas atas

1-

disebut koefisisen keyakinan/ tingkat keyakinan.

disebut tingkat nyata/ disebut kesalahan

berarti (level of significance). Di dalam pengujian hipotesis,

tipe pertama, yaitu kesalahan yang terjadi karena kita menolak hipotesis nol, padahal hipotesis tersebut benar (keputusan yang benar, hipoteisis tersebut harus kita termia). Alpha juga dapat diartikan sebagai besarnya kesalahan yang kita torerir di dalam membuat suatu keputusan. Kalau 1= 0,95; = 1-0,95 = 0,05;

ini berarti kita mentorerir kesalahan sebesar 5%. Salah dalam hal ini, berarti interval tidak memuat B lebih kecil dari (b d) atau lebih besar dari (b+d). kesalahan ini menimbulkan resiko dalam pembuatan keputusan, maka dari itu untuk memperkecil resiko, kesalahan harus dibuat sekecil mungkin. Titik akhir pada interval disebut batas keyakinan (confidende limit) atau nilai kritis (critical value) b d = batas keyakinan bawah atau nilai batas bawah b + d = batas keyakinan atas atau nilai batas atas dalam praktiknya, dan (1 bukan dinyatakan sebagai proporsi, tetapi sebagai

presentase, yaitu 100% dan 100(1-

Persamaan (4.1) menunjukkan bahwa suatu pemerkira interval merupakan suatu interval yang dibuat sedemikian rupa sehingga interval tersebut mempunyai nilai probabilitas sebesar (1akan memuat nilai parameter B. misalnya kalau

= 0,05 (5%), maka persamaan (4.1) harus dibaca : probabilitas bahwa interval antara ( b d ) dan ( b + d ) akan memuat nilai B sebesar 0,95 atau 95%. Perkiraan interval memberikan berbagai nilai dalam suatu interval, diharapkan nilai B akan terletak di dalamnya. Kemungkinan tidak memuat ( B terletak di luarnya, B < b-d atau B > b + d ) sebesar 5% Perlu diperhatikan beberapa aspek penting tenatang perkiraan interval ini, yaitu sebagai berikut: (1) Persamaan (4.1) tidak berarti bahwa probabilitas parameter B terletak dalam interval yang dibatasi nilai batas bawah dan atas tersebut sebesar (1,

katakana 90% atau 95 %. Sebab parameter B, walaupun tidak diketahui nilainya, dianggap mempunyai nilai tetap/konstan (tidak berubah-ubah) bisa terletak dalam interval dan bisa juga tidak. Arti persamaan (4.1) yang sebenarnya ialah bahwa dengan menggunakan metode yang dijelaskan, probabilitas untuk meperoleh suatu interval yang memuat B sebesar (1.

Penjelasan lebih lanjut : kalau seluruh sample dari suatu populasi sebanyak k kita hitung perkiraan intervalnya, akan kita peroleh k interval. Apabilak kita tentukan (1= 0,95 misalnya, maka setelah kita teliti hasil hitungan kita,

akan diperoleh kurang lebih 95 % dari k interval tersebut memuat parameter B, selebihnya / sisanya sebanyak 5% tidak memuat B. oleh karena di dalam

praktiknya, kita hanya mengambil sampel secara random satu kali saja dari populasi yang bersangkutan, maka kita harapkan dengan tingkat keyakinan sebesar 95%, sampel tersebut akan memuat parameter B.

Perhatikan gambar berikut ini : Setiap titik menunjukkan interval yang dibuat berdasarkan sampel

Ada k interval, karena ada k sampel

. ....

. .

Memuat parameter B .. .. . . .. . . .. Bagian yang diarsir terdiri dari interval yang tidak memuat B

Bagian yang tidak diarsir terdiri dari interval yang memuat parameter B

Berdasarkan gambar di atas, maka probabilitas untuk memperoleh interval yang memuat B merupakan hasil bagi daerah yang memuat B (tidak diarsir) dengan seluruh daerah : X 100% = 95% atatu 100(1-

%= 95% disebut tingkat keyakinan (confidence level). (2) Interval (4.1) adalah interval acak (random interval) , yang berarti akan berubah dari sampel ke sampel, sebab nilainya tergantung pada b yang berbeda dari sampel satu ke sampel yang lainnya.

Perhatikan gambar berikut :

Sampel 1, interval 1 = I1

memuat B memuat B

Sampel 2, interval 2 = I2

tak memuat B memuat B

Sampel 3, interval 3 = I3

memuat B tak memuat B

Sampel i, interval i = Ii

memuat B memuat B

Sampel k, interval k = Ik

memuat B tak memuat B

Keterangan : interval yang memotong garis tegak lurus memuat B, sedangkan yang tidak memotong tidak memuat B. Garis tegak lurus tempat letaknya B. ada beberapa interval. (3) Oleh karena confidence interval merupakan acak (random), pernyataan probabilitas yang menyangkut dirinya harus dimengerti, bahwa

mempunyai pengertian jangka panjang (in the long sense), yaitu yang berlaku dalam sampling yang berulang-ulang (repeated sampling). Secara khusus persamaan (4.1) berarti : apabila dalam sampling yang berulang-ulang confidence interval semacam itu dibuat, lihat gambar dari keterangan (2), maka dengan probabilitas sebesar (1, kita harapkan

dalam jangka panjang, secara rata-rata, interval seperti (4.1), kurang lebih 100(1, katakanlah 90% atau 95%, akan memuat nilai parameter B.

(4) Seperti diterangkan dalam (2), interval (4.1) sifatnya acak selama nilai b tidak diketahui. Akan tetapi, begitu kita mengambil satu sampel dan menghitung nilai b dan membuat interval, maka kita memperoleh satu interval saja, yang mungkin memuat B atau tidak memuat B, dalam hal ini interval (4.1) tidak lagi random, tetapi sudah merupakan nilai yang

tetap/konstan, misalnya antara 0,50-0,75 atau antara 0,60-0,80. Dalam hal ini kita tidak boleh membuat pernyataan probabilitas mengenai persamaan (4.1), artinya kita tidak dapat menyatakan probabbilitas sebesar (1,

bahwa suatu interval yang nilainya tetap tersebut memuat parameter B. dalam situasi semacam ini hanya ada dua kemungkinan untuk B, yaitu B berada dalam interval itu atau tidak. Jadi, probabilitasnya hanya ada dua kemungkinan nilai, yaitu 1 atau 0. Probabilitas 1 kalau B berada dalam interval dan 0 kalau B berada di luar interval.

Kemudian bagaimana caranya interval keyakinan (confidence interval) tersebut dibuat? Kalau distribusi sampling atau distribusi probabilitas dari pemerkira diketahui, maka kita dapat membuat pernyataan interval keyakinan seperti persamaan (4.1). kita ketahui bahwa dengan asumsi kenormalan tentang kesalahan pengganggu
I,

pemerkira hasil metode kuadrat terkecil biasa (OLS),

pemerkira a dan b juga mengikuti distribusi normal, dan bahwa pemerkira akan mengikuti distribusi khai-kuadrat(chi-square) = . Sebelum kita membuat

interval keyakinan tentang koefisien A dan B dalam regresi, terlebih dahulu akan disinggung beberapa jenis distribusi yang erat sekali hubungannya dengan distribusi normal. Beberapa teori yang diungkapkan disini.

4.1.1 Beberapa teori tentang beberapa jenis distribusi yang erat sekali hubungannya dengan distribusi normal.

Berikut ini akan diuraikan beberapa teori yang erat hubungannya dengan teori normal. Teori yang dikemukakan tanpa bukti ini sangat berguna dalam pemabahasan, baik teori perkiraan maupun pengujian hipotesis, antara lain fungsi t, , dan F. Teori 4.1. kalau Z1, Z2,. Zn merupakan variable bebas dan normal, masingmasing dengan rata-rata maka Z = dan variance

, yaitu Zi

N(

),

Zi, dimana

konstan dan semuanya nol, juga

mempunyai distribusi normal dengan rata-rata = = , yaitu Z N (M,

dan variance .

) = N (

Teori 4.2. kalau Z1, Z2,. Zn merupakan variabel bebas dan normal, masingmasing dengan rata-rata nol dan variance 1, yaitu Zi N (0,1) merupakan normal yang baku (standar normal), maka Z = mengikuti distribusi dengan symbol Z
.

dengan derajat kebesar sebesar n, dinyatakan

Teori 4.3. kalau Z1, Z2,. Zn merupakan variable acak yang bebas dan normal, masing-masing mempunyai distribusi dengan derajat kebebasan sebesar k, kemudian Z = akan mengikuti distribusi dengan derajat kebebasan sebesar k, dimana k = symbol Z
.

, dinyatakan dengan

Teori 4.4. kalau Z1 merupakan variable normal standard, yaitu Zi mengikuti distribusi

N (0,1) dan Z2

dengan derajat kebebasan sebesar k, dimana Z2

bebas terhadap Z1, maka variabel t yang kita definisikan sebagai berikut :

t=

(4.2)

mengikuti distribusi t dari student dengan derajat kebebasan k. Teori 4.5. kalau Z1, dan Z2 masing-masing merupakan variabel bebas yang mengikuti distribusi dan Z2 dengan derajat kebebasan k1 dan k2 , yaitu Z1

maka variabel F kita definisikan sebagai berikut.

F=

(4.3)

Mempunyai distribusi F dengan derajat kebebasan k1 dan k2 Baik distribusi t, , dan F sudah dibuat tabelnya. Untuk keperluan pembuatan perkiraan interval dan pengujian hipotesis tabel tabel tersebut sangat penting artinya.

4.2 Perkiraan Interval untuk Koefisien dan Kesalahan Pengganggu Bahwa dengan asumsi kenormalan tentang , pemerkira hasil OLS a dan

b juga mengikuti distribusi normal dengan rata-rata dan varian masing-masing. Dengan demikian, maka variabel Z yang kita definisikan adalah sebagai berikut.

Merupakan variabel normal yang standar, yaitu Z N (0,1). Berdasarkan hal ini, kita bisa menggunakan distribusi normal untuk membuat pernyataan probabilitas tentang b dengan syarat bahwa varian kesalahan pengganggu Apabila diketahui..

diketahui, suatu sifat penting yang memiliki variabel dengan distribusi dan varian ialah bahwa daerah di bawah kurva

normal dengan kata-kata normal antara sebanyak 68%; antara

(berjarak satu deviasi standar dari rata-rata), kurang lebih (berjarak dua standar deviasi dari rata-rata), kurang (berjarak tiga deviasi standar dari rata-

lebih sebanyak 95%; dan antara rata), kurang lebih sebanyak 99,7%

Perhatikan gambar berikut!

Dalam praktiknya, perkiraan tidak bias

jarang sekali diketahui, sehingga harus diperkirakan dengan , di mana

Dengan jalan mengganti persamaan sebagai berikut.

dengan

dalam persamaan (4.4), maka kita peroleh

Dapat ditunjukan bahwa t mengikuti distribusi t dengan derajat kebebasan sebesar (n-2). Persamaan (4.4) menggunakan sedangkan persamaan (4.5) menggunakan mengikuti ditribusi normal,

mengikuti ditribusi t. Uraian lebih

lanjut tentang persamaan (4.5) adalah sebagai berikut. Misalkan :

Dan Apabila diketahui, Z akan mengikuti distribusi normal yang baku , artinya mempunyai rata-rata nol dan varian

(standar normal), yaitu satu. Sedangkan

mengikuti distribusi khai-kuadrat dengan derajat kebebasan

(n-2), berdasarkan teori 4.4, variabel t berikut. Akan mengikuti distribusi t dengan derajat kebebasan (n-2). Apabila atas kita masukan, akan kita peroleh hasil berikut. dan di

Oleh karenanya, untuk membuat perkiraan interval B, kita akan menggunakan distribusi t sebagai pengganti normal berikut. ( ) diperoleh dari tabel t dengan derajat

Di mana t seperti dalam persamaan (4.5),

kebebasan sebesar (n-2). Dengan mengganti t seperti dalam persamaan (4.5), maka kita peroleh pernyataan probabilitas sebagai berikut. ( )

10

Sekarang perhatikan gambar berikut!

I II I. II. menjadi menjadi menjadi menjadi

Kemudian I dan II digabung dan kita peroleh bentuk pernyataan probabilitas sebagai berikut. ( )

Rumus perkiraan interval B menjadi :

Di mana

Contoh soal 4.1 : Buat perkiraan interval untuk B, kalau tingkat keyakinan sebesar 95%, apabila diketahui : b Se = 0,5446 = = = 1,4318880898403 1-a a a/2 = 0,95 = 0,5 = 0,25 Tingkat keyakinan 95% Kesalahan yang diterima

11

Jawaban : Sb =

Sb = Sb =

Sb = 0,1120902477704 Dari tabel t,

0,54460,5446 0.3566711684054 0,1879288315946 0,1879 0,9013

0,5446+ 0,5446+ 0.3566711684054

0,9012711684054

Kalau upah naik Rp50.000,00 maka interval antara Rp1.879 sampai Rp9.013 diharapkan akan memuat nilai B sebenarnya dengan tingkat keyakinan 95%

Contoh soal 4.2 : Buat perkiraan interval untuk B, kalau tingkat keyakinan sebesar 95%, apabila diketahui : b = 0,653102123

= 5

(1-a) = 0,95 a = 0,05

Dari tabel t,

12

Jawaban :

0,6531021230,653102123 0.098840773 0,55426135 0,5543 0,751942896 0,7519

0,653102123+ 0,653102123+ 0.098840773

Dengan tingkat keyakinan sebesar 95%, dalam jangka panjang kita harapkan bahwa interval seperti (0,55426135 - 0,751942896) akan memuat nilai parameter yang sebenarnya. Kita tidak dapat mengatakan bahwa dengan probabilitas sebesar 95%, interval khusus 0,55426135 sampai 0,751942896 akan memuat nilai parameter B yang sebenarnya. Oleh karena interval ini konstan, bukan acak (random) lagi, maka nilai parameter B sebenarnya bisa di dalam interval atau tidak. Probabilitas bahwa suatu interval khusus yang konstan memuat B ialah 1 dan 0.

Soal 4.3 Berdasarkan data dari Biro Pusat Satistik, dimana X Y = PDRB dalam milliar = Konsumsi dalam milliar TAHUN 2006 2007 2008 2009 2010 X 29.473,644 31.907,546 34.595,450 37.570,568 40.545,686 Y 9.824,3 10.568,85 9.230,04 8.298,59 8.851,38

Buat perkiraan interval koefisien regresi dengan tingkat keyakinan sebesar 95%!

13

Jawab :
Tahun 2006 2007 2008 2009 2010 Total X 29.473,64400 31.907,54600 34.595,45000 37.570,56800 40.545,68600 174.092,89400 Y 9.824,30000 10.586,85000 9.230,04000 8.298,59000 8.851,38000 46.791,16000 X2 868.695.690,63874 1.018.091.491,74212 1.196.845.160,70250 1.411.547.579,84262 1.643.952.653,21060 6.139.132.576,13657 Y2 96.516.870,49000 112.081.392,92250 85.193.638,40160 68.866.595,98810 78.346.927,90440 441.005.425,70660 XY 289.557.920,74920 337.800.403,37010 319.317.387,31800 311.782.739,89912 358.885.274,14668 1.617.343.725,48310

Belanja statistic : N=5 = 34.818,5788 = 9.358,232 = = -11.857.966,1203077 = = 77.465.427,8775263 = = 3.122.894,87748

b = = = -0,1530743
=

= 1.815.149,8592724

14

= = 435.915,0060692 Var(b)=

= = 0,0056272 Sb =
= = 0,0750147

ta/2 = 0,025 pembuatan interval keyakinan = b t Sb b + t Sb

= -0,1530743 3,182(0,0750147) 0,1530743 + 3,182(0,0750147) = -0,1530743 0,2386968 -0,1530743 + 0,2386968 = -0,3917711 0,0856225 Dengan tingkat keyakinan sebesar 95%, diharapkan dalam jangka panjang, interval seperti -0,3917711 sampai 0,0856225 akan memuat B.

Contoh soal 4.4 : Buat perkiraan interval = 2,050303333 Df = n-2 = 5-2 =3 dengan tingkat keyakinan 95% apabila diketahui :

15

Jawaban :

Artinya dengan probabilitas 95%, dalam jangka panjang kita harapkan bahwa interval antara sampai akan memuat

Contoh soal 4.5 Buat perkiraan interval = 80,88625987 Df = n-2 = 5-2 =3 dengan tingkat keyakinan 95% apabila diketahui :

Jawaban :

Dengan tingkat keyakinan 95%, diharapkan dalam jangka panjang internal seperti 25,96 sampai 1124,46

16

4.3 Pengujian Hipotesis Koefisien Regresi Pengujian hipotesis statistik (statistical testing hypothesis) sifatnya kuantitatif, jadi setiap hipotesis yang kita maksudkan harus dinyatakan dengan angka-angka. Persoalan pengujian hipotesis secara statistika mungkin bisa dinyatakan secara sederhana sebagai berikut: Apakah data observasi / empiris dari hasil penelitian sampel cukup erat hubungannya dengan hipotesis yang dinyatakan / disebutkan, atau tidak ? sehingga kita bisa sampai kepada keputusan untuk menolak atau menerima hipotesis yang telah dinyatakan. Jadi, apabila beberapa teori atau pengalaman yang telah lalu membuat kita mempercayai bahwa koefisien arah B dari regresi konsumsi mingguan terhadap upah mingguan, dalam contoh soal diketahui tingkat keyakinan sebesar 0,90, apakah hasil hitungan b = 0,5446 yang diperoleh dari sampel akan konsisten dengan hipotesis yang sudah dinyatakan sebelumnya? Kalau memang ya, kita dapat menerima hipotesis, tetapi kalau tidak kita harus menolak hipotesis tersebut. Dengan menggunakan bahasa statistik, hipotesis yang telah dinyatakan dikenal dengan hipotesis nol (null hypothesis) dan diberi simbol . Hipotesis nol

ini diuji melawan hipotesis alternative (alternative hypothesis) dengan symbol , yang menyatakan misalnya, bahwa koefisien arah atau koefisien regresi tidak sama dengan 0,90. Hipotesis alternative bisa sederhana (simple) atau komposit (composite). Misalnya, 0,90, ini komposit. Teori pengujian hipotesis berkenaan dengan pengembangan aturan-aturan atau prosedur untuk memutuskan apakah kita harus menerima atau menolak hipotesis nol. Sebetulnya, menolak menerima menerima berarti menolak berarti menerima , sebaliknya, kalau , keputusan : B = 0,90, ini sederhana, sedangkan kalau :B

. Biasanya kita berkenaan dengan

hanya merupakan kosekuensi logis saja. Sebetulnya, ada dua

pendekatan yang saling berkomplementer, untuk menentukan aturan-aturan yang dimkasud, yaitu interval keyakinan (confidence intervals) dan uji signifikan (test of significant). Kedua pendekatan tersebut menyebutkan bahwa pengujian hipotesis meliputi pembuatan pernyataan tentang nilai-nilai parameter dari distribusi tersebut.

17

Sebagai contoh, kita tahu bahwa dengan asumsi kenormalan, b juga mengikuti fungsi normal dengan rata-rata = E(b) dan var(b) = / . Kalau

kita membuat hipotesis bahwa B = 0,90, kita telah membuat pernyataan tentang salah satu parameter dari distibusi normal, yaitu mengenai rata-ratanya. Sebagian besar dari pengujian hipotesis yang dibahas akan mempunyai semacam ini, yaitu membuat pernyataan tentang satu atau beberapa nilai parameter dari beberapa distribusi probabilitas, seperti normal, t, F, dan khai kuadrat.

4.3.1 Pengujian Hipotesis dengan Pendekatan Interval Keyakinan Untuk membahas pendekatan interval keyakinan, misalnya kita mempunyai hipotesis sebagai berikut: : B = 0,90 : B 0,90 Perhatikan bahwa pengujian hipotesis nol merupakan hipotesis sederhana, sedangkan hipotesis alternatifnya komposit. Apakah perkiraan b = 0,5446cukup dekat dengan ?

Apabila diketahui : 0,1879 B 0,9013 Kita mengetahui bahwa dalam jangka panjang interval keyakinan tersebut akan memuat nilai B sebenarnya, dengan probabilitas (tingkat keyakinan) sebesar 0,95 atau 95%. Konsekuensinya, dalam jangka panjang (sampel yang di ulangulang), interval yang demikian itu akan merupakan suatu jarak (range) di mana di dalamnya akan terletak nilai B dengan tingkat/koefisien keyakinan sebesar 95%. Dengan demikian, interval keyakinan merupakan suatu himpunan dari hipotesis nol yang dapat diterima. Oleh karena itu, kalau ternyata nilai B sesuai dengan hipotesis nol, dalam hal ini : B =0,90, ternyata tercakup di dalam

interval keyakinan dengan koefisien/tingkat keyakinan sebesar 95%, maka diputuskan untuk diterima, kalau ternyata tidak tercakup (terletak di luarnya), harus ditolak tersebut.

Pengujian hipotesis dengan pendekatan interval keyakinan terdiri dari langkah-langkah berikut:

18

Pertama: Menghitung perkiraan interval dengan tingkat keyakinan yang sudah ditentukan, dalam hal ini 95%. Perkiraan interval yang diperoleh adalah 0,70995 B 1,00125. Kedua: Kita cek, apakah nilai B sesuai dengan nilai hipotesis nol, dalam hal ini, : B = 0,90, terletak dalam interval tersebut atau tidak? Kalau ya, terima, kalau tidak, kita tolak. Dalam soal yang kita hadapi, kita terima. kita

: B = 0,90

ternyata terletak dalam interval, jadi

Contoh Soal 4.6 X = Pendapatan per bulan dalam ribuan Rp Y = Konsumsi per bulan dalam ribuan Rp X Y 100 80 90 70 80 60 125 85 150 100 200 150

Uji pendapatan bahwa koefisien regresi sebesar 0,80 dengan alternative tidak sama dengan itu. Penggunaan tingkat signifikan sebesar 0,10 dengan menggunakan pendekatan interval keyakinan. Pemecahan : B = 0,80 : B 0,80 = 0,10, Jadi 1 =

1 0,10 = 0,90

19

X
100 90 80 125 150 200 745 80 70 60 85 100 150 545

Y
10000 8100 6400 15625 22500 40000 102.625 6400 4900 3600 7225 10000 22500 54.625

XY
8000 6300 4800 10625 15000 30000 74.725

49.504,17

0,6970

20

Dari tabel t,

2,132, derajat kebebasan = df = 4

Perkiraan interval B sebagai berikut:

Oleh karena interval keyakinan antara 0,5456 dan 0,8484 memuat nilai B = 0,80, maka kita terima dengan tingkat kepercayaan sebesar 0,90 atau 90%. Dengan

perkataan lain, pendapat yang menyatakan bahwa B = 0,80 dapat diterima.

Contoh Soal 4.7 Dengan menggunakan contoh soal 3.2, misalnya kita menganggap bahwa besarnya MPC (Marginal propensity to consume) yang dinyatakan dalam parameter B sebesar 0,4 dengan alternative tidak sama. Pergunakan tingkat signifikan sebesar 0,05 dengan pendekatan perkiraan interval. Pemecahan

Berdasarkan contoh soal 4.2, sudah kita hitung bahwa dengan tingkat keyakinan sebesar 95%, dalam jangka panjang, interval 0,55426135 sampai dengan 0,751942896 akan memuat nilai parameter B. Interval keyakinan 0,55426135 < B < 0,751942896 ternyata tidak memuat nilao hipotesis nol B = 0,4 ditolak. Jadi, hipotesis atau pendapat bahwa MPC = B = 0,4 ditolak. Probabilitas untuk mendapatkan nilai B = 0,4 (sebelah kiri nilai batas bawah) sebesar 0,025 (2,5%).

21

2,5% 0,55426135

2.5% 0,751942896

95% nilai batas bawah nilai batas atas

Pengujian hipotesis dengan pendekatan perkiraan interval terdiri dari dua tahap yang harus diperhatikan, Pertama : Dihitung perkiraan interval dari parameter yang bersangkutan, dengan tingkat keyakinan tertentu, yaitu . Nilai atau 0,05.

Kedua : Kemudian dicek, apakah nilai parameter berdasarkan hipotesis nol terletak di dalam interval atau tidak. Kalau ya, ditolak. diterima, kalau tidak,

4.3.2 Pengujian Hipotesis dengan Pendekatan Uji Signifikan (Nyata) Pendekatan lainnya yang sifatnya komplementer terhadap metode interval keyakinan dalam pengujian hipotesis secara statistik ialah pendekatan ujisignifikan yang dikembangkan oleh R.A. Fisher secara independen dan bersamasama oleh Neyman dan Pearson. Secara umum, dapat dikatakan bahwa suatu uji-signifikan adalah suatu prosuder untuk suatu hasil perhitungan berdasarkan sampel, untuk memeriksa benar tidaknya suatu hipotesis nol. Ide pokok yang mendasari uji-signifikan ialah suatu pemerkira (estimator) dan distribusi sampling dari pemerkira yang demikian itu di bawah hipotesis nol. Keputusan untuk menerima atau menolak dibuat

atas dasar nilai pemerkira yang diperoleh dari data empiris / hasil observasi dari sampel. Maksudnya, untuk menguji benar tidaknya nilai parameter yang dinyatakan dalam , akan dipergunakan suatu criteria uji (btest criteria) yang

dihitung berdasarkan sampel yang diteliti. Untuk ilustrasi, ingat bahwa dengan asumsi kenormalan, variable t berikut ini:

22

akan mengikuti t dengan kebebasan sebesar (n - 2). Apabila nilai B sudah jelas

dinyatakan dalam

, maka nilai t dari

langsung dapat dihitung

dari sampel yang bersangkutan, sehingga dapat dipergunakan sebagai criteria uji, sebagai dasar untuk memutuskan menerima atau menolak . Oleh karena uji

criteria ini mengikuti distribusi t, maka pernyataan interval keyakinan seperti berikut ini dapat dibuat. ( di mana Nilai sebesar (n - 2). Perhatikan uraian berikut :

) .

ialah nilai B sesuai dengan

dapat diperoleh dari tabel t dengan derajat kebebasan

I. II.

akan menjadi akan menjadi

Setelah I dan II digabung, kita peroleh hasil berikut. (


yang merupakan interval di mana b akan tercakup (terletak di dalamnya) dengan probalitas sebesar (1 ) dan . )% interval

Dengan menggunakan bahasa pengujian hipotesis, 100(1

keyakinan di kenal dengan daerah penerimaan (accepted region) dari pengujian hipotesis, sedangkan daerah di luar interval keyakinan tersebut dinamakan daerah penolakan (rejected region) dan sering disebut daerah kritis (critical region). Betapa eratnya hubungan antara pendekatan interval keyakinandan uji hipotesis dapat dilihat dengan jalan membandingkan persamaan

) .

dengan

persamaan

Di dalam prosedur interval keyakinan, kita mencoba membuat suatu batas (limit) berupa interval yang dihitung berdasarkan sampel, di mana dalam jangka panjang (sampel yang diulang-ulang), dengan tingkat keyakinan tertentu, kita harapkan

23

nilai parameter B yang tidak diketahui akan terletak; sedangkan dalam pendekatan uji-signifikan, kita membuat hipotesis atau anggapan mengenai nilai parameter B yang sebenarnya dan mencoba melihat apakah perkiraan b untuk parameter B yang dihitung berdasarkan sampel akan terletak dalam batas-batas yang pantas, sekitar nilai hipotesis tadi. Contoh Soal 4.8 Dengan menggunakan contoh soal 3.2, coba dicek apakah dapat diterima atau ditolak, dengan tingkat signifikan Pemecahan Hasil perhitungan dari sampel menunjukkan bahwa nilai b = 0,653102123, , df = 3. Dengan

dari tabel t kita peroleh

= 3,182 (dengan df = 3)

0,301159227

0,498840773

Ternyata, nilai b = 0,653102123 terletak di luar interval keyakinan 0,301159227 sampai dengan 0,498840773, maka dari itu, keputusan yang harus kita ambil adalah menolak anggapan/hipotesis bahwa MPC = B = 0,4. Dalam praktiknya, kita tidak perlu menghitung interval keyakinan seperti dalam persamaan (4.16) secara eksplisit, kita hanya perlu menghitung nilai t berdasarkan rumus berikut

Kemudian kita lihat apakah nilai t ini terletak dalam interval antara dan

, kalau ya,

diterima, kalau tidak,

ditolak.

24

GAMBAR 4.2

Jelasnya sebagai berikut. Kalau Kalau t <


diterima. , ditolak.

atau t >

Dalam contoh ini,

Oleh karena t >

, maka

ditolak.

Untuk lebih jelasnya lihat gambar 4.3. Oleh karena menggunakan distribusi t, maka prosedur pengujian hipotesis di atas disebut uji t (t-test). Di dalam bahasa uji signifikan, dalam ilmu statistika, suatu nilai perkiraan (statistic, tanpa s) dikatakan signifikan secara statistik apabila uji statistik berada dalam daerah kritis, yaitu daerah yang diarsir. Daerah ini disebut juga daerah penolakan. Dalam hal ini, diterima). ditolak (dengan sendirinya

25

GAMBAR 4.3

Dengan argumentasi yang sama, suatu uji dikatakan signifikan secara statistik apabila nilai uji berada di dalam daerah penerimaan. Dalam hal ini, hipotesis nol ( hipotesis nol ( ) diterima. Dalam contoh ini, uji t (t test) ternyata signifikan, ) harus ditolak. Jadi, pendapat (hipotesis) yang menyatakan

bahwa B = MPC = 0,4 tidak dapat diterima. Contoh pengujian hipotesis yang kita bahas di atas dikenal dengan nama uji dua arah atau two-sided atau two-tail test, karena kita berhubungan dengan dua ekor distribusi probabilitas (normal test, t test) yang merupakan daerah kritis (daerah penolakan) dan tolak kalau nilai t yang dihitung berdasarkan data hasil

observasi jatuh/berada dalam daerah penolakan tersebut. Perhatikan gambar berikut.

Kalau Kalau t <

diterima. , ditolak. merupakan hipotesis komposit

atau t >

Disebut dua arah, karena hipotesis alternative dua arah, yaitu

, yang berarti B bisa lebih besar atau lebih kecil dari

26

0,4. Misalkan pengalaman sebelumnya membuat kita mempunyai (lebih besar dari 0,4). Dalam hal ini,

Walaupun

masih merupakan hipotesis komposit, tetapi sekarang hanya satu

arah saja. Dalam hal ini, kita berhubungan dengan uji satu arah (one-tail test).

GAMBAR 4.4 Uji Signifikan Satu Arah Prosedur pengujian sama saja, kecuali bahwa nilai kritis atau batas keyakinan atas menjadi gambar 4.4) , yaitu sebesar 5%, bukan 2,5% seperti sebelumnya (lihat

27

Ada dua cara uji satu arah, yaitu sebagai berikut.

Contoh Soal 4.9 Juga dari contoh soal 3.2, uji pendapatbahwa MPC = B sebesar 0,4 dengan alternative lebih besar dari itu, dengan tingkat signifikan sebesar 0,05. Pemecahan

28

Contoh Soal 4.10 Dengan menggunakan contoh soal 3.2, uji pendapat bahwa dengan alternatif tidak sama dengan 75, dengan menggunakan Pemecahan : = 5%. = 75

= 3,235450395 Karena Oleh karena = 3,235450395 terletk dalam interval 0,216 dan 9,348, maka =75 dapat dibenarkan. Uji semacam ini

dapat diterima. Jadi, pendapat bahwa

disebut uji signifikan khai-kuadrat (the chi-square test of significance).

4.4 Analisis Varian dalam Regresi Dalam subbab 4.4 ini akan dipelajari analisis regresi dari sudut pandangan analisis varian dan mengenalkan kepada pembaca terhadap suatu cara yang komplementer dan jelas dalam melihat persoalan-persoalan statistic induktif atau statistical inference. Telah kita tunjukan suatu persamaan sebagai berikut.

29

Kalau maka menjadi = TSS (=total sum of square) = ESS (=explained sum of square) = RSS (=residual sum of square)

TSS = ESS + RSS, yang menunjukkan pemecahan / penguraian TSS menjadi dua komponen/bagian, yaitu ESS dan RSS TSS diperguanakan untuk menunjukkan jumlah variasi Y yang terdiri dari dua sumber variasi, yaitu ESS berasal dari regresi, merupakan sumbangan/

penguraian TSS menjadi dua komponen/bagian, yaitu ESS dan RSS TSS dipergunakan untuk menunjukkan jumlah variasi Y yang terdiri dari dua sumber variasi, yaitu ESS berasal dari regresi, merupakan sumbangan yang disebabkan oloeh variable bebas X, dan RSS berasal dari kesalahan pengganggu. Studi mengenai komponen-komponen TSS disebut analisis vari9an (anavar), yang berarti analisis sumber-sumber variasi yang diukur dengan varian. disebut explained sum of square atau jumlah kuadrat yang bisa

diterangkan, maksudnya ialah bahwa sumbernya itu jelas, yaitu pengaruh linear ( linear effect ) dari X. Sedangkan diksebut unexplained sum of square atau

jumlah kuadrat yang tidak bisa diterangkan , oleh karena sumber variasi memang tidak begitu jelas, sebab kesalahan pengganggu e meliputi variabel-variabel atau factor-faktor yang mempengaruhi Y, tetapi tidak dimasukkan kedalam persamaan regresi linear. Pada dasarnya, besarnya nilai derajat kebebasan merupakan selisih antara banyaknya observasi atau elemen sampel dengan banyaknya perkiraan yang akan dibuat. Jadi, kalau ada k perkiraan yang akan dibuat untuk memperkirakan k parameter, maka derajat kebebasan (df) sebesar ( n-k ). Untuk menghitung satu perkiraan, kita mempunyai df = ( n-1 ), sebab kehilangan 1 kebebasan.

30

Contoh : Tentukan 5 nilai variabel Y, sehingga rata-ratanya 5. Dalam hal ini, df = ( n -1)= 5-1 = 4, maksudnya kita bebas menentukan nilai dari 4 variabel yang pertama (4 kebebasan), sedangkan nilai variabel yang kelima tidak bebas lagi (kehilangan 1 kebebasan), sebab jumlah harus 25. Misalnya, (bebas) (bebas) (bebas) (bebas) (bebas) = 25 =5 = 25 =5 atau , (bebas) (bebas ) (bebas) (bebas) (bebas) = 25 =5

Satu perkiraan yang dibuat, satu kebebasan hilang. Tabel Anavar Untuk Model Regresi Sederhana Sumber Varian Dari Regresi (ESS) Jumlah Kuadrat (SS) df 1 d Rata rata 11) Kuadrat (MS) ESS/df =

Dari kesalahan Pengganggu (RSS) (n-2)


RSS/df= /(n-2) =

Total jumlah Kuadrat (TSS) (n-1)

Dengan menganggap bahwa kesalahan pengganggu i mempunyai distribusi normal dan H0 : B = ), da[at ditunjukkan bahwa variabel F sebagai berikut.

31

mengikuti fungsi F dengan derajat kebebasan 1 dan (n-2)

Contoh Soal 4.11 Berdasarkan contoh soal 3.2, uji pendekatan bahwa B = MPC = 0 dengan alternatif tidak sama dengan itu. Pergunakan analisis varian (anavar). Pemecahan : Diketahui b n = 0,653102123 = 83.830,6875 = 4.360.500 = 4.650 =5 Tabel Anavar Sumber Variasi
Dari regresi (ESS) Dari Kesalahan Pengganggu (RSS)

Jumlah Kuadrat (SS) 35.757,34122 242, 65878

f 1 3

Rata-Rata Kuadrat (MS) 35.757,34122 80,88626 3

F 442,0694098

Total jumlah Kuadrat (TSS) 36.000,00000 4

F=

rata-rata kuadrat regresi Rata-rata kesalahan pengganggu

F= ESS RSS

32

= 35.757,34122 80, 88626 = 442,0694098 (**)

Tabel F

F0,05 (1)(3) = 10,13 F0.01(1)(3) = 34,12

Untuk

= 0,05 (5%). Oleh karena F > F0,05(1)(3) , maka H0 ditolak. Pendapat /

hipotesis bahwa MPC=0 ditolak. Tidak benar B= 0. Untuk = 0,01 (1%). Oleh karena F > F0,05(1)(3) , maka H0 ditolak. Pendapat

bahwa B=0 Tidak benar .

Soal 4.12 Uji anggapan PDRB mempunyai konsumsi nasional dengan alternatif tidak ada pengaruhnya. Pergunakan analisis varian dengan adalah sebagai berikut : . Data dari BPS

TAHUN 2006 2007 2008 2009 2010 Jawab: b= -0,5130743


2 = =

X 29.473,644 31.907,546 34.595,450 37.570,568 40.545,686

Y 9.824,3 10.568,8 5 9.230,04 8.298,59 8.851,38

1.815.149,8592724

= 3.122.894,87748

33

= - 2 = 3.122.894,87748 - 1.815.149,8592724 = 1.307.745,0182077 Sumber variasi Jumlah kuadrat (ss)


1.815.149,8592724

df

Ratarata kuadrat (MS)


1.815.149,8592724 4,16399482

Dari regresi (ESS) Dari kesalahan pengganggu (RSS)

1.307.745,0182077 3 435.915,0060692

Total jumlah kuadrat (TSS)

3.122.894,8774800

F= = = 4,16399482 Dari table F0,05(1)(3) F 0,01(1)(3)


= 10,13 = 34,12

Oleh karena F< F0,05(1)(3), maka H0 diterima yang artinya memang ada pengaruh PDRB terhadap konsumsi daerah Kalimantan selatan.

4.5 Ramalan dengan Menggunakan Garis Regresi Linear Sederhana Berdasarkan contoh soal 3.2, kita peroleh regresi sampel dengan persamaan sebagai berikut. (4.21) di mana merupakan pemeriksaan ( ) dengan nilai variabel bebas X tertentu. Persamaan regresi linear sederhana ini dapat dipergunakan untuk meramalkan (to forecast or to predict) besarnya konsumsi (Y) untuk waktu yang akan datang apabila besarnya pendapatan (X) sudah diketahui. X diketahui, artinya sebagai berikut. a) Sudah terjadi, misalnya merupakan pendapatan waktu yang lalu. Dalam hal ini, X disebut variabel beda kala (lagged variabel) dengan simbol .

34

b) Hasil ramalan, misalnya pendapatan tahun depan,dengan simbol . c) Pendapatan sekarang,dalam waktu yang bersangkutan, dengan simbol . Untuk meramalkan Y, nilai variabel X harus diketahui terlebih dahulu. Itulah sebabnya X disebut variabel bebas (independent variable) dan sering disebut explanatory variable, artinya variabel yang menerangkan. Sedangkan, Y disebut variabel tidak bebas (dependent variable), karena memang nilainya tergantung pada nilai X. Y = nilai hasil observasi, hasil pencatatan. = nilai perhitungan berdasarkan persamaan garis regresi, sering disebut nilai regresi atau nilai teoretis. Y merupakan perkiraan atau ramalan Y. Ramalan pada dasarnya merupakan perkiraan terjadinya suatu kejadian (peristiwa) untuk waktu yang akan datang. Ada perkiraan jangka pendek, ada juga ramalan jangka panjang (short term and long term forecasting) . Ramalan (produksi, penjualan, ekspor, penerimaan negara, pendapatan nasional, konsumsi, dan variabel ekonomi lainnya) sangat diperlukan untuk dasar perencanaan. Ada dua macam ramalan untuk variable tidak bebas Y, yaitu ramalan untuk rata-rata Y dan individu Y nilai X tertentu, katakan = . Untuk selanjutnya, kita sebut ramalan rata-rata Y atau ramalAn (Y) dan ramalan individu Y. (Y)=expected (Y) merupakan rata-rata. Dalam praktiknya, meramalkan (Y) juah lebih mudah dari pada meramalkan individu Y, sebab ratarata Y kurang bervariasi dibandingkan dengan Y, sebabnya ialah (Y) = A+BX terletak tepat pada garis regresi populasi, sedangkan Y terletak di sekitar garis regresi populasi. Lihat gambar berikut!
Y, E(Y)

E(Y/X) = A + BX

(Y), lengkapnya ditulis ( / ), dibaca rata-rata Y atau nilai harapan (expected value) Y, untuk X= Titik-titik pada gambar menunjukkan nilai individu Y, untuk X tertentu, yaitu merupakan titik-titik koordinat: ( ),

35

( ), ...,( . Ramalan (Y/ ) disebut ramalan bersyarat (coditional forecast) , maksudnya hasil ramalan sangat tergantung pada nilai X= . Misalnya, kalau X=biaya advertensi dan Y= hasil penjualan, maka ramalan hasil penjualan untuk waktu yang akan datang sangat tergantung kepada biaya advertensi. Juga misalnya, kalau X = pendapatan nasional atau investasi nasional dan Y = konsumsi nasional atau PDB, maka ramalan konsumsi nasional atau ramalan PDB yang akan datang sangat tergantung kepada tinggi rendahnya pendapatan nasional atau investasi nasional yang kita beri simbol X= . Untuk membedakan nilai ramalan atau bukan, maka untuk nilai ramalan rata-rata Y kita beri simbol ( ), kita baca ramalan rata-rata Y kalau X = dan ramalan individu Y diberi simbol ( ), dibaca untuk meramalkan rata-rata Y = (Y) maupun individu Y, nilai X harus diketahui terlebih dahulu. Perlu dibedakan nilai ramalan tunggal (point forecast) , yaitu ramalan yang terdiri dari satu nilai saja, dan ramalan interval, di mana kita harapkan bahwa nilai yang kita ramalkan tersebut akan terletak dalam interval yang kita buat berdasarkan data sampel dengan menggunakn tingkat atau koefisien keyakinan tertentu, katakan 90% atau 95%

4.5.1 Ramalan Rata-Rata Y atau (Y)


Dengan menggunakan persamaan garis regresi yang sudah di buat berdasarkan data sampel berikut: = a + bX, maka kalau X = , maka Y nol topi menjadi = a + b , di mana a = 24,4545 dan b = 0,5091. Sekarang, misalnya sudah diketahui X = = 100, kita ingin meramalkan nilai rata-rata Y, yaitu ( ), maka perkiraan tunggal dari rata-rata Y dapat diperoleh dengan jalan memasukkan X = = 100 ke dalam persamaan garis regresi: =a+b = 24,4545 + 0,5091(100) = 24,4545 + 50,91 = 75,3645 Di mana perkiraan ( ). Dapat ditunjukkan bahwa merupakan perkiraan linear tunggal ( ) yang tidak bias dan varian yang minimum atau BLUE (best linear unbiased estimators) . Oleh karena (Y nol topi) merupakan suatu pemerkira (estimator) ( ), maka nilainya sebagai perkiraan akan berbeda-beda, dari sampel ke sampel akan bervariasi. Perbedaan antara nilai dengan ( ) akan memberikan gambaran mengenai kesalahan tersebut, kita perlu mengetahui distribusi sampling . Hal ini dapat ditunjukkan oleh karena merupakan fungsi kesalahan pengganggu yang berdasarkan asumsi mempunyai distribusi

36

normal dengan rata-rata nol dan varian , maka normal dengan rata-rata ( ) = (A + ) dan var( )= [ +

juga mempunyai distribusi

(4.22) dengan , perkiraannya kita peroleh variabel

Dengan jalan mengganti t sebagai berikut. t = (4.23) Di mana =

(perkiraan standard error

),

= perkiraan var(

maka t mengikuti distribusi dengan derajat kebebasan (n 2). Dengan demikian, maka t ini dapat digunakan untuk membuat perkiraan interval atau menguji hipotesis mengenai . =A+B t = P( I I. II. + ) ) dengan ) t )=1 II

I dan II digabung akan memperoleh perkiraan interval untuk tingkat keyakinan sebesar (1 ) sebagai berikut.

37

(4.24) di mana =a+b =


diperoleh dari tabel t dengan derajat kebebasan (n 2)

Contoh Soal 4.13 Dengan menggunakan data contoh soal 3.2, buat perkiraan/ramalan interval E(Y) kalau X = = 100! Pergunakan tingkat keyakinan 95%. Pemecahan var( ) =

[ +

= 80,88625987 [ = 80,88625987 [ = 80,88625987 ( 10,75936375 ) = 870,2846921 = = 29,500588 =a+b = 250,218655 + 0,653102123(100) = 250,218655 + 65,3102123 = 315,5288673 ) +

] ]

315,5288673 3,182(29,500588) ) 315,5288673 + 3,182(29,500588) 315,5288673 93,870871 ) 315,5288673 + 93,870871 221,6579963 ) 409,3997383 Kalau X = 100, dengan tingkat keyakinan 95%, dalam jangka panjang interval 221,6579963 sampai 409,3997383 akan memuat (Y) = rata-rata Y. Perkiraan tunggal untuk (Y), yaitu = 315,5288673

38

SOAL 4.14 Dengan menggunakan data berikut, buat ramalan interval rata-rata Y kalau X=1000 dengan tingkat keyakinan 95%. Dimana X Y = pendapatan rata-rata per bulan dalam jutaan rupiah = tabungan rata-rata perbulan dalam jutaan rupiah X 72.445,766 Y 40.854,481

TAHUN 2006

2007 2008

83.312,633 95.809,466

51.095,756 71.434,944

2009 2010

110.180,883 126.708,025

82.408,203 99.318,846

Jawab :
X 72.445,7660000 83.312,6330000 95.809,4660000 110.180,8830000 126.708,0250000 488.456,7730000 Y 40.854,4810000 51.095,7560000 71.434,9440000 82.408,2030000 99.318,8460000 345.112,2300000 X2 5.248.389.011,326760 6.940.994.817,392690 9.179.453.775,205160 12.139.826.978,659700 16.054.923.599,400600 49.563.588.181,9849000 Y2 1.669.088.617,77936 2.610.776.281,21154 5.102.951.224,28314 6.791.111.921,68921 9.864.233.170,77172 26.038.161.215,7350000 XY 2.959.734.170,57745 4.256.921.967,48555 6.844.143.838,37990 9.079.808.572,98325 12.584.494.821,93910

35.725.103.371,3653000

N=5 = = 2.010.622.133,63854 = 49.563.588.181,9849 = 26.038.161.215,735

39

= = 1.845.364,07019 = = 2.217.670.956,62038 b = = = 1,0894230 a= = 69.022,446 - 1,0894230(97.691,354) = -37.404,7667830 Untuk X = 00.000 = a +b = -37.404,7667830 + (1,0894230)(97.691,354) = 71.537,5374964
= =

2.190.418.082,737640

= = 9.084.291,2942476 Se = 3.014,015808

= S e

= 3.014,015808
= 3.014,015808

= 3.014,015808

40

= 3.014,015808 ( 1,7573405) = 5.296,652104 = = 3,182 ) +


) 71.537,5374964

71.537,5374964 3,182(5.296,652104) +3,182(5.296,652104) 71.537,5374964 16.853,94699 54.683,59050 ) 88.391,48448

) 71.537,5374964 + 16.853,94699

Kalau X = 100.000, dengan tingkat keyakinan 95%, dalam jangka panjang interval 54.683,59050 sampai 88.391,48448 akan memuat (Y) = rata-rata Y. Jadi, kalau pendapatan Rp100.000.000, dengan tingkat keyakinan 95%, dalam jangka panjang, interval antara Rp5.469.359.050.000,00 sampai
Rp8.839.148.448.000,00 akan memuat rata-rata tabungan sebenarnya. 95% 2,5 % 2,5 % Rp8.839.148.448.000,00

Rp5.469.359.050.000,00

Rata-rata tabungan yang sebenarnya dalam interval

4.5.2. Ramalan Individu Y


Apabila kita ingin meramalkan individu Y, yaitu untuk nilai X = , dapat ditunjukkan bahwa pemerkira = a + b selain untuk memperkirakan rata-rata Y, yaitu ), juga dapat untuk memperkirakan individu Y, yaitu . Artinya, baik perkiraan untuk maupun untuk sama, yaitu (Y nol topi), tetapi var ( ) sebagai berikut.
var( )= [1 + +

(4.25)

Kalau =

diganti

, maka

= perkiraan standard error

41

,(

di baca

dengan syarat X =

akan mengikuti fungsi t dengan derajat kebebasan sebesar (n 2). P( I I. II. + I dan II digabung, diperoleh rumus perkiraan interval individu Y dengan tingkat keyakinan sebesar (1 ) sebagai berikut. (4.26) di mana =a+b =

)=1 II

dari tabel t dengan derajat kebebasan (n 2).

Contoh Soal 4.15 Dengan menggunakan contoh soal 3.2, buat ramalan interval individu Y, dengan tingkat keyakinan 95%, kalau X = 100!

Pemecahan

42

di mana =

= 250,218655 + 0,653102123 = 250,218655 + 0,653102123(100) = 250,218655+ 65,3102123 = 315,5288673 = 80,88625987 = 8,993678884 = 8,993678884 = 8,993678884 = 8,993678884 (3,429192871) = 30,84105951 = 3,183 315,5288673 3,182(30,84105951) 315,5288673 98,13625136 217,3926159 413,6651187 8,993678884

X = 100

315,5288673 + 3,182(30,84105951)

315,5288673 + 98,13625136

Kalau X = 100, dengan tingkat keyakinan 95%, interval antara 217,3926159 sampai 413,6651187 , dalam jangka panjang akan memuat nilai individu Y.

4.5.3 Cara Melaporkan Hasil Analisis Regresi


Banyak hasil penelitiaan ekonomi secara kuantitatif yang hasilnya sukar di mengerti, khususnya hasil analisis ekonometri dengan disertai berbagai macam angka atau simbol-simbol yang sering kali kurang dimengerti oleh penbaca. Dalam hal ini, untuk melaporkan analisis regresi, perlu diperhatikan hal-hal berikut. Pertama : Persamaan garis regresi yang dihitung dari sampel, lengkap dengan segala koefisiennya = a + bX.

43

: Diikutsertakan standard error bagi setiap koefisiennya, = a + bX ( )( = standard error (a), diletakkan di bawah a = standard error (b), diletakkan di bawah b Ketiga : Diikutsertakan nilai t yang masing0masing berdasarkan sampel langsung di bawah dan . t di bawah dan , masing-masing berdasarkan sampel rumus berikut. Kedua = dan = Y = a + bX ( )( ) ( )( ) Keempat :Diikutsertakan nilai koefisien determinasi ( ) dan standard error regresi atau standard error kesalahan pengganggu ( ) = a + bX ( ) ( ) ( ) ( ) df = n 2 Kegunaan masing-masing di dalam penyajian hasil analisis regresi adalah sebagai berikut. Pertama : persamaan regresi = a + bX digunakan untuk meramalkan ) atau ) setelah X= diketahui. = a + b selain merupakan ramalan untuk ) juga merupakan ramalan ). Kedua : Standard error dan untuk mengukur tingkat ketelitian pemerkira a dan b. Makin kecil standard error suatu pemerkira, makin teliti pemerkira tersebut, maksudnya makin dekat dengan nilai parameter yang akan diperkirakan. Jadi, makin kecil dan , makin dekat a dengan A dan b dengan B. 0, berarti a A, kalau = 0 , a = A 0, berarti b B, kalau = 0, b = B (Dalam praktiknya, standard error tidak pernah nol). Ketiga : Nilai t, dan dan dapat untuk menguji hipotesis tentang parameter A dan B. Keempat : Koefisien determinasi ( ) untuk mengukur tepat / cocoknya persamaan regresi untuk meramalkan. Makin besar , makin tepat garis untuk meramalkan Y, sebab makin besar persentase sumbangan X, terhadap varian (naik turunnya) Y digunakan standard error regresi atau standard error kesalahan pengganggu untuk mengukur betapa dekatnya nilai-nilai individu Y hasil garis regresi = a + bX.

44

Makin kecil , berarti makin dekat nilai-nilai individu Y terhadap garis regresi, sehingga makin tepat / cocok garis regresi tersebut untuk meramalkan Y kalau X sudah diketahui Perhatikan gambar berikut.
(Y, )
(Y, )

. . . . . . . . . .
. . . . . .

. . .
. . . .

. . .

Garis regresi

Garis regresi

Se besar

Se kecil

(Titik-titik menunjukkan letak individu Y, jauh dari garis regresi)

(Titik-titik menunjukkan letak individu Y, jauh dari garis regresi)

45

Jadi, untuk mengukur kecocokan / ketepatan suatu garis regresi untuk meramalkan ( goodness of fit), dapat dipergunakan nilai yang makin besar, makin baik atau yang makin kecil baik.

46

DAFTAR PUSTAKA Supranto, J. 2005. Ekonometri. Jakarta. Ghalia Indonesia Badan Pusat Statistika. Kalimantan Selatan dalam angka.

47

You might also like