You are on page 1of 252

MIPA-Unej

Model Statistika Linier Daftar Isi

(Versi Elektronik) Judul

JJ J I II
I Made Tirta
Drs:Unud (Singaraja), Dip.Sc.,M.Sc.,Ph.D.:UNE (Australia)
Hal. 1 dari 245

Cari Halaman

Kembali

September 22, 2004


Layar Penuh

Tutup

Keluar
MIPA-Unej

Contents
Daftar Isi

Judul
1 Dasar-dasar Pemodelan Stokastik 4
1.1 Prinsip Pemodelan . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 5
1.2 Langkah-langkah Penting Dalam Pemodelan . . . . . . . . . . . . . . . . . . . . . . 11 JJ J I II
1.2.1 Langkah penting dalam Pemodelan secara Umum . . . . . . . . . . . . . . . 11
1.2.2 Langkah penting dalam Pemodelan Stokastik . . . . . . . . . . . . . . . . . . 12
1.3 Metode Mengestimasi Parameter . . . . . . . . . . . . . . . . . . . . . . . . . . . . 14 Hal. 1 dari 245
1.3.1 Metode kuadrat terkecil . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 15
1.3.2 Metode likelihood maksimum . . . . . . . . . . . . . . . . . . . . . . . . . . 16
1.3.3 Mencari maksimum dengan metode numerik . . . . . . . . . . . . . . . . . . 16 Cari Halaman
1.4 Model Linier dan Perkembangannya . . . . . . . . . . . . . . . . . . . . . . . . . . . 18
1.4.1 Model linier klasik . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 19
1.4.2 Model linier tercampur . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 21 Kembali
1.4.3 Model linier tergeneralisasi . . . . . . . . . . . . . . . . . . . . . . . . . . . . 23
1.4.4 Model linier campuran tergeneralisasi . . . . . . . . . . . . . . . . . . . . . . 25
1.5 Pengembangan lain model linier . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 26 Layar Penuh
1.6 Outline Buku . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 27
1.7 Latihan Soal- soal . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 28
Tutup

Keluar
2 Tinjauan Umum R 31
2.1 R dengan CLI . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 32
2.2 Beberapa Fungsi Penting dalam R . . . . . . . . . . . . . . . . . . . . . . . . . . . . 33
2.2.1 Fungsi dasar matematika . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 33
2.2.2 Operasi Vektor dan Matriks . . . . . . . . . . . . . . . . . . . . . . . . . . . . 35
2.2.3 Fungsi dasar statistika . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 37 MIPA-Unej
2.2.4 Fungsi Pembangkit Data Peubah Acak . . . . . . . . . . . . . . . . . . . . . . 38
2.2.5 Fungsi untuk Menghandel Grafik . . . . . . . . . . . . . . . . . . . . . . . . . 39
2.2.6 Aneka Rupa Perintah R . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 40
Daftar Isi
2.3 Menulis Program dengan R . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 40
2.3.1 Komponen-komponen Program . . . . . . . . . . . . . . . . . . . . . . . . . 41
2.3.2 Langkah- langkah Penting dalam Penulisan Program . . . . . . . . . . . . . . 43
Judul
2.3.3 Mendefinisikan Fungsi dalam R . . . . . . . . . . . . . . . . . . . . . . . . . . 47
2.4 Beberapa Paket/Library untuk Model Linier . . . . . . . . . . . . . . . . . . . . . . . 60
2.5 Mencari Informasi . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 61
2.6 Rgui untuk Windows . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 64 JJ J I II
2.6.1 RGui Standar . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 64
2.6.2 R-SciViews . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 74
2.6.3 RComander . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 81 Hal. 2 dari 245

2.7 Library . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 81
2.8 Bacaan Lebih Lanjut . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 91
Cari Halaman
3 Memperoleh dan Menginstal R 96
3.1 Apa itu R? . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 96
3.2 Memperoleh Paket R . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 98 Kembali
3.3 Memperoleh Paket RGui Editor . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 99
3.4 Menginstal R dan SciViews . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 99
3.5 Menambah Library R . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 100 Layar Penuh

4 Analisis Data dan Grafik dengan R 102


4.1 Meyiapkan Data . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 102 Tutup
4.1.1 Memanggil Data dari Database R . . . . . . . . . . . . . . . . . . . . . . . . 102

Keluar
4.1.2 Membangkitkan Data Simulasi . . . . . . . . . . . . . . . . . . . . . . . . . . 103
4.1.3 Mengimport data dari file . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 104
4.2 Explorasi Data . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 105
4.2.1 Deskripsi Data . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 106
4.2.2 Plotting Data . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 107
4.2.3 Plotting Data Multivariat . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 110 MIPA-Unej
4.3 Analsis Data . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 112
4.4 Pemilihan Model . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 112
Daftar Isi
5 Aljabar Matriks untuk Statistika 119
5.1 Defenisi dan Jenis Matriks . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 120
5.2 Operasi Matriks dan Sifat-sifatnya . . . . . . . . . . . . . . . . . . . . . . . . . . . . 123
5.2.1 Operasi uner . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 123 Judul

5.2.2 Operasi biner . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 124


5.2.2.1 Penjumlahan Matriks . . . . . . . . . . . . . . . . . . . . . . . . . . 127
5.2.2.2 Perkalian matriks . . . . . . . . . . . . . . . . . . . . . . . . . . . . 128 JJ J I II
5.2.3 Determinan dan invers matriks . . . . . . . . . . . . . . . . . . . . . . . . . . 129
5.3 Kebergantungan Linier dan Rank Matriks . . . . . . . . . . . . . . . . . . . . . . . . 131
5.4 Bentuk Kuadrat dan Diferensial Matriks . . . . . . . . . . . . . . . . . . . . . . . . . 133 Hal. 3 dari 245
5.5 Bacaan Lebih Lanjut . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 139
5.6 Aplikasi R untuk Operasi Matriks . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 139
5.6.1 Mendefinisikan matriks . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 139 Cari Halaman
5.6.2 Operasi Matriks dengan R . . . . . . . . . . . . . . . . . . . . . . . . . . . . 142
5.7 Latihan Soal-soal . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 143
Kembali
6 Model Linier Normal 145
6.1 Bentuk dan Asumsi . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 146
6.2 Estimasi Parameter . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 147 Layar Penuh
6.2.1 Estimasi dengan Metode Kuadrat Terkecil . . . . . . . . . . . . . . . . . . . 147
6.2.2 Estimasi dengan Metode Likelihood Maksimum . . . . . . . . . . . . . . . . . 150
6.3 Uji Inferensial dari βˆj . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 153 Tutup
6.3.1 Distribusi βˆj . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 153

Keluar
6.3.1.1 Distribusi βˆj bila σ 2 diketahui . . . . . . . . . . . . . . . . . . . . . 153
6.3.1.2 Distribusi βˆj bila σ 2 tidak diketahui . . . . . . . . . . . . . . . . . . 155
6.3.2 Estimasi selang dari βj . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 156
6.3.3 Uji Hipotesis . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 156
6.4 Pendekatan Matriks untuk Regresi Berganda . . . . . . . . . . . . . . . . . . . . . . 161
6.4.1 Perluassan hasil untuk Regresi Berganda . . . . . . . . . . . . . . . . . . . . 161 MIPA-Unej
6.4.2 Pendekatan Matriks Metode Kuadrat Terkecil . . . . . . . . . . . . . . . . . . 163
6.4.2.1 Menggunakan turunan unsur-unsur matriks . . . . . . . . . . . . . . 164
6.4.2.2 Menggunakan turunan umum matriks . . . . . . . . . . . . . . . . . 166
Daftar Isi
6.4.3 Pendekatan Matriks untuk Metode Kemungkinan Maksimum . . . . . . . . . 168
6.5 Melaporkan nilai probabilitas p . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 171
6.6 Ilustrasi Program Komputer . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 171
Judul
6.6.1 Menulis Program . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 172
6.6.2 Menggunakan fungsi lm() . . . . . . . . . . . . . . . . . . . . . . . . . . . . 175

7 Diagnostik dan Transformasi 181 JJ J I II


7.1 Memeriksa Hubungan Peubah dan Distribusi Data . . . . . . . . . . . . . . . . . . . . 182
7.1.1 Diagram pencar data . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 183
7.1.2 Diagram Pencar Sisa/ Residu . . . . . . . . . . . . . . . . . . . . . . . . . . 188 Hal. 4 dari 245
7.1.3 Memeriksa distribusi data . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 188
7.1.4 Memeriksa Model Melalui Diagram . . . . . . . . . . . . . . . . . . . . . . . 192
7.1.5 Memeriksa Model melalui AIC . . . . . . . . . . . . . . . . . . . . . . . . . . 195 Cari Halaman
7.2 Transformasi Data . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 197
7.3 Bacaan Lebih Lanjut . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 198
7.4 Latihan Soal- Soal . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 198 Kembali

8 Distribusi Keluarga Eksponensial 203


8.1 Bentuk Umum . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 204 Layar Penuh
8.2 Mean dan Varians Distribusi Keluarga Eksponensial . . . . . . . . . . . . . . . . . . . 205
8.2.1 Fungsi Skor [U] E[U ] danVar[U ] . . . . . . . . . . . . . . . . . . . . . . . . 205
8.2.2 Mean dan Varians dari a(Y ) . . . . . . . . . . . . . . . . . . . . . . . . . . . 207 Tutup
8.3 Beberapa Bentuk Khusus . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 209

Keluar
8.3.1 Distribusi Poisson dengan parameter θ. . . . . . . . . . . . . . . . . . . . . . 209
8.3.2 Distribusi Normal dengan parameter θ dan σ . . . . . . . . . . . . . . . . . . 209
8.3.3 Distribusi Gamma dengan parameters θ dan skala φ. . . . . . . . . . . . . . . 210
8.3.4 Distribusi lainnya . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 210

9 Model Linier Tergeneralisasi 214


MIPA-Unej
9.1 Konsep Dasar . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 214
9.2 Estimasi pada Model Linier Tergeneralisasi . . . . . . . . . . . . . . . . . . . . . . . 216
9.2.1 Metode Penduga Kuadrat Terkecil . . . . . . . . . . . . . . . . . . . . . . . . 218
Daftar Isi
9.2.2 Metode Penduga Likelihood Maksimum . . . . . . . . . . . . . . . . . . . . . 220
9.3 Inferensi pada Model Linier Tergeneralisasi . . . . . . . . . . . . . . . . . . . . . . . 225
9.4 Distribusi dari Penduga Likelihood Maksimum . . . . . . . . . . . . . . . . . . . . . 227
Judul
9.5 Kecocokan Model . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 229
9.6 Devians dan Distribusinya . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 230
9.7 Ilustrasi GLM dengan R . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 231
JJ J I II
10 Generalized Estimating Equation 233
10.1 Model Marjinal . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 233
10.2 Quasi-Likelihood dan Generalized Estimating Equations (GEE) . . . . . . . . . . . . . 235 Hal. 5 dari 245
10.3 Generalisasi dan Bentuk GEE . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 236

Cari Halaman

Kembali

Layar Penuh

Tutup

Keluar
MIPA-Unej

Daftar Gambar
Daftar Isi

Judul
1.1 Ilustrasi Regresi 1 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 29
1.2 Ilustrasi Regresi 2 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 30
JJ J I II
2.1 Lay Out Multi Grafik . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 67
2.2 Ilustrasi mean populasi dan rata-rata sampel untuk Berbagai Ukuran Sampel. 69
2.3 Ilustrasi Maksimum/minimum dengan Newton Raphson . . . . . . . . . . . 70 Hal. 6 dari 245
2.4 Penampilan Jendela Pembukaan Rgui untuk WIndows . . . . . . . . . . . . 71
2.5 Tampilan Pilihan Menu File dan Menu Help . . . . . . . . . . . . . . . . . . 73
2.6 Tampilan Menu Standar dan Tambahan SciView-R . . . . . . . . . . . . . . 74 Cari Halaman
2.7 Contoh tampilan Jendela Command (Script) . . . . . . . . . . . . . . . . . 76
2.8 Pilihan Menu yang dapat di atur pada Menu Dock . . . . . . . . . . . . . . 77
2.9 Tampilan beberapa Jendela Dock . . . . . . . . . . . . . . . . . . . . . . . 78 Kembali
2.10 Contoh Pemilihan Menu Data-List Dan Hasil Tampilan Data . . . . . . . . 79
2.11 Memilih Data Cars dari Paket Base menggunakan Jendela Commander . . 80
2.12 Tampilan Menu RComander B . . . . . . . . . . . . . . . . . . . . . . . . . 87 Layar Penuh
2.13 Tampilan Menu Comander Berbahasa Indonesia . . . . . . . . . . . . . . . 88
2.14 Tampilan Menu RComander . . . . . . . . . . . . . . . . . . . . . . . . . . . 89
Tutup
2.15 Tampilan Menu RComander . . . . . . . . . . . . . . . . . . . . . . . . . . . 90
2.16 Dokumentasi bantuan yang tersedia pada R . . . . . . . . . . . . . . . . . . 94
Keluar
2.17 Dokumentasi bantuan yang tersedia pada R . . . . . . . . . . . . . . . . . . 95

3.1 Menambah Library . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 101

4.1 Denstias dan QQ Norm Data Normal . . . . . . . . . . . . . . . . . . . . . 108


4.2 Denstias dan QQ Norm Data Normal . . . . . . . . . . . . . . . . . . . . . 109 MIPA-Unej
4.3 Histogram dan Denstias Berat Ayam . . . . . . . . . . . . . . . . . . . . . . 115
4.4 Contoh Pair Plot . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 116
4.5 Contoh Matriks Diagram . . . . . . . . . . . . . . . . . . . . . . . . . . . . 117 Daftar Isi
4.6 Contoh Pair Plot . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 118

6.1 Grafik Penduga βˆ1 = α̂ dari penarikan sampel 100 kali masing-masing Judul
berukuran 60. Nilai parameter sebenarnya adalah α = 3. . . . . . . . . . . . 179
6.2 Grafil Penduga βˆ1 = α̂ dari beberapa penarikan sampel dengan ukuran
mulai 10 sampai dengan 1000. Nilai parameter sebenarnya adalah α = 3. . 180 JJ J I II

7.1 Grafik Pencar Data dengan Hubungan Linear dan Varians Relatif Konstan 184
7.2 Grafik Pencar Data dengan hubungan Linear tetapi Varians Relatif tidak Hal. 7 dari 245
Konstan . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 185
7.3 Grafik Pencar Data dengan hubungan nonlinear . . . . . . . . . . . . . . . . 186
Cari Halaman
7.4 Grafik Pencar Data dengan Hubungan Eksponensial . . . . . . . . . . . . . 187
7.5 Grafik Pencar Sisa Data yang memenuhi homoskedastisitas (atas) dan Data
bersifat heteroskedastisitas(bawah). . . . . . . . . . . . . . . . . . . . . . . . 189
Kembali
7.6 Grafik Quantile dari Data Berdistribusi Normal (kiri) dan Data Cenderung Tidak
Berdistribusi Normal (Kanan) . . . . . . . . . . . . . . . . . . . . . . . . . . . 190
7.7 Grafik Sebaran Peluang dari Data Berdistribusi Normal (lebih simetris, warna Layar Penuh
biru) dan Data Tidak Berdistribusi Normal (tidak siumetris, warna merah) . . . 191
7.8 Grafik Diagnostik dari Objek yang Dihasilkan oleh Fungsi lm(). Grafik
menunjukkan data relatif memenuhi asumsi Model Linier Normal . . . . . . 193 Tutup

Keluar
7.9 Grafik Diagnostik dari Objek yang Dihasilkan oleh Fungsi lm(). Grafik
menunjukkan data tidak memenuhi asumsi Model Linier Normal, yang di-
tandai dengan adanya hubungan tidak linier dan pencilan . . . . . . . . . . 194
7.10 Sebaran data asli dan transformasi yang bisa dilakukan. Beberapa transformasi
menghasilkan sebaran yang mengikuti garis lurus tetapi varians tidak konstan . . 199
7.11 Sebaran data asli dan transformasi yang bisa dilakukan. Beberapa transformasi MIPA-Unej
menghasilkan sebaran yang mengikuti garis lurus tetapi varians tidak konstan . . 200
7.12 Sebaran data asli dan transformasi yang bisa dilakukan. Beberapa transformasi
hanya menghasilkan varians yang sedikit lebih stabil . . . . . . . . . . . . . . . 201 Daftar Isi

8.1 Plot Densitas dari sampel dengan berbagai mean dengan ukuran sampel 100 212
8.2 Sebaran Data dengan ukuran sampel 100 dengan distribusi Normal (b) dan Judul

Gamma (r) . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 213


JJ J I II

Hal. 8 dari 245

Cari Halaman

Kembali

Layar Penuh

Tutup

Keluar
MIPA-Unej

Daftar Tabel
Daftar Isi

Judul
1.1 Tabel jumlah (kg) salak dan anggur dan harga yang dibayar . . . . . . . . . 9

2.1 Daftar Fungsi Matematika dalam R . . . . . . . . . . . . . . . . . . . . . . 34


JJ J I II
2.2 Daftar Operasi Vektor dan Matriks dalam R . . . . . . . . . . . . . . . . . 35
2.3 Fungsi Dasar Statistika pada R . . . . . . . . . . . . . . . . . . . . . . . . . 37
2.4 Fungsi Pembangkit Data pada R . . . . . . . . . . . . . . . . . . . . . . . . 65 Hal. 9 dari 245
2.5 Perintah R untuk Grafik . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 66
2.6 Aneka Rupa Perintah-perintah R . . . . . . . . . . . . . . . . . . . . . . . . 68
2.7 Daftar Menu dan submenu utama Rgui . . . . . . . . . . . . . . . . . . . . 72 Cari Halaman

4.1 Tabel Fungsi eksplorasi data . . . . . . . . . . . . . . . . . . . . . . . . . . 105


Kembali
8.1 Rangkuman Distribusi Anggota Keluarga Eksponensial . . . . . . . . . . . 211
8.2 Ciri-ciri khas Distribusi Keluarga Eksponensial . . . . . . . . . . . . . . . . 211
Layar Penuh

Tutup

Keluar
MIPA-Unej

Bab 1
Daftar Isi

Dasar-dasar Pemodelan Stokastik Judul

JJ J I II

Tujuan Umum
Hal. 10 dari 245
Mahasiswa memahami hakekat pemodelan dalam bidang statistika serta mempunyai gam-
baran tentang kedudukan dan perkembangan model- model linier dalam uji statistika
Cari Halaman

Tujuan Khusus
Kembali
Setelah menyelesaikan bab ini mahasiswa diharapkan dapat:
1. menyebutkan perbedaan antara pemodelan stokastik dan pemodelan deter-ministik; Layar Penuh

2. menyebutkan langkah- langkah penting dalam pemodelan stokastik;


3. menyebutkan komponen- komponen penting dalam model linier; Tutup

Keluar
4. menyebutkan persamaan dan perbedaan dari model linier normal, model linier cam-
puran, model linier tergeneralisasi, model linier campuran tergeneralisasi, model
linier hierarkis;
5. menyebutkan metode untuk menghitung penduga parameter.
MIPA-Unej

Materi
Daftar Isi
1. Hakekat pemodelan
2. Langkah- langkah penting dalam pemodelan
Judul
3. Model linier dan perkembangannya
4. Metode mengestimasi parameter JJ J I II
5. Mendiagnosis model
Hal. 11 dari 245

1.1. Prinsip Pemodelan


Cari Halaman
Ketika kita menganalisis data dengan menggunakan metode statistika, kita hampir selalu
menekankan asumsi yang dikenakan terhadap data yang di analisis. Asumsi-asumsi itu
dapat meliputi hubungan antara peubah, maupun sebaran dari galat (error). Namun, Kembali
mungkin tidak semua kita menyadari bahwa saat itu sebenarnya kita sedang menerapkan
suatu pemodelan (dalam hal ini pemodelan statistik) dalam memecahkan persoalan yang
dihadapi maupun membuat suatu kesimpulan tentang masalah yang dihadapi. Ketika Layar Penuh
kita berbicara model atau pemodelan dalam bidang matematika atau statistika, mungkin
pikiran kita membayangkan materi matematika yang sudah merupakan tingkat lanjut (ad-
vanced mathematics) yang membutuhkan pemahaman kalkulus lanjut maupun persamaan Tutup

Keluar
diferensial. Pemodelan, baik disadari atau tidak, implisit atau eksplisit, sebenarnya se-
lalu dilakukan pada saat kita menggunakan matematika (atau khususnya statistika) dalam
memecahkan masalah dalam kehidupanm riil. Bahkan, sejak kita belum menjadi maha-
siswa, yaitu ketika di SLTP/SMU kita menyelesaikan soal bentuk cerita (words problem),
kita juga sebenarnya menerapkan pemodelan matematika. Demikian juga ketika kita
menyelesaikan aplikasi sistim persamaan linier dalah kehidupan sehari- hari. MIPA-Unej

Definisi 1.1 (Prinsip Pemodelan). Model matematika dari suatu masalah adalah
rumusan masalah dalam bentuk persamaan matematika Daftar Isi

Definisi 1.2. Pemodelan matematika adalah proses menerjemahkan masalah dalam ba-
hasa umum ke dalam bahasa atau persamaan matematika Judul

Sebagai ilustrasi, berikut disampaikan contoh soal penerapan sistim persamaan linier
dan langkah- langkah penyelesaian yang dianjurkan. JJ J I II
Contoh 1.1.
Seorang ibu membeli 3 kilogram salak dan 2 kilogram anggur. Ibu tersebut harus Hal. 12 dari 245
membayar sebesar Rp 17 000,- Sedangkan ibu lain yang membeli 3 kilogram salak dan 5
kilogram anggur harus membayar Rp 29.000,-. Jika pedagang memberlakukan harga yang
Cari Halaman
tetap terhadap kedua ibu- ibu tadi, berapa harga perkilogram salak dan harga perkilogram
anggur? Selanjutnya berapa harga yang harus dibayar jika seseorang membeli x kg salak
dan y kg anggur?
Kembali
Untuk menjawab persoalan di atas dianjurkan untuk menempuh langkah- langkah
berikut, yang mungkin hanya dilakukan secara implisit.
Layar Penuh
1. Kita misalkan bilangan yang ingin kita cari (dalam hal ini harga satu kilogram salak
dan harga satu kilogram anggur) masing- masing sebagai a dan b. Kita membuat
persamaan matematika dari persoalan dalam bentuk cerita tadi. Disini sebenarnya
Tutup
kita sedang membuat model matematika suatu persoalan. Untuk soal di atas model

Keluar
matematika yang kita peroleh adalah

3a + 2b = 1700
(1.1)
3a + 5b = 29000

2. Kita menyelesaikan persamaan matematika di atas dengan teori matematika yang MIPA-Unej
kita miliki. Dengan metode eleminasi dan substitusi balik kita memperoleh a = 3000
dan b = 4000.
Daftar Isi
3. Mensubsitusikan secara serempak nilai a dan b yang diperoleh ke sistim persamaan
yang dimiliki untuk memeriksa apakah hasil yang kita peroleh benar atau tidak.
Judul
4. Menyimpulkan bahwa harga satu kilogram salak adalah Rp 3000 dan harga satu
kilogram anggur adalah Rp 4000.
JJ J I II
Jadi harga x kg salak dan y kg anggur adalah

H = 3000x + 4000y
Hal. 13 dari 245

Jadi dapat dipahami bahwa pemodelan atau menerjemahkan masalah sehari-hari ke


persamaan matematika merupakan bagian yang sangat penting dalam menyelesaikan per-
Cari Halaman
soalan sehari- hari dengan menggunakan matematika. Pentingnya pemodelan dalam matem-
atika juga dinyatakan oleh Prof. J. Neyman, yang dikutip dari Meyer, sebagai berikut:
Whenever we use mathematics in order to study some observational phenomena we Kembali
must essentially begin by building a mathematical model (deterministic or probabilis-
tic) for these phenomena. Of necessity, the model must simplify matters and certain
details must be ignored. The success of the model depends on whether or not the
details ignored are really unimportant in the development of the phenomena studied. Layar Penuh
The solution of mathematical problems may be correct and yet be in considerable dis-
agreement with the observed data simply because the underlying assumptions made
are not warranted. It is usually quite difficult to state with certainty, whether or Tutup
not a given mathematical model is adequate before some observational data are ob-
tained. In order to check the validity of the model, we must deduce a number of

Keluar
consequences of our model and then compare these predicted results with observa-
tions. [Kapan saja kita menggunakan metematika untuk mempelajari fenomena yang
teramati, kita mesti perlu mulai dengan membangun suatu model matematika (de-
termisistik atau probabilistik) untuk fenomena tersebut. Sangat penting, model yang
dibuat harus menyederhanakan persoalan dan beberapa rincian mesti diabaikan. Ke-
berhasilan model bergantung pada apakah rincian yang diabaikan benar- benar tidak
penting dalam pengembangan fenomena yang dipelajari. Biasanya sangat sulit untuk MIPA-Unej
menyatakan dengan pasti, apakah suatu model matematika adalah tepat atau tidak
sebelum diperoleh data pengamatan. Dalam rangka memeriksa validitas model, kita
harus menurunkan sejumlah konsekuensi (dalil) dari model kita dan membandingkan
hasil dugaan teoritis dengan pengamatan] (Meyer [23]). Daftar Isi

Pembuatan model dari suatu persoalan adalah ibarat pembuatan peta suatu wilayah.
Dalam proses pembuatan peta, mesti ada penyederhanaan, yaitu mengabaikan rincian Judul
hal-hal yang tidak menjadi kepentingan. Sangat jelaslah bahwa peta yang baik adalah
peta yang sederhana namun memuat secara akurat informasi yang diperlukan. Peta yang
terlalu rinci, dalam hal tertentu menjasdi tidak komunikatif, karena terlalu banyak in- JJ J I II
formasi yang tidak diperlukan. Sementara, di lain pihak, peta yang terlalu sederhana
yang mengabaikan informasi yang penting, dapat menjerumuskan pembacanya kepada
sasaran yang keliru. Demikian juga, dalam menyelesaikan persoalan dengan menggu- Hal. 14 dari 245

nakan matematika, biasanya kita selalu memulai dengan model yang paling sederhana
yang berarti banyak informasi yang diabaikan. Karenanya penyelesaian persoalan secara
Cari Halaman
matematis ini, mungkin benar tapi tidak bermanfaat dan tidak bermakna, karena model
yang dibangun tidak sesuai dengan data yang diamati, akibat adanya asumsi penting yang
dibuat untuk mendasarinya diabaikan. Itulah sebabnya dalam penyelesaian persoalan se-
Kembali
cara matematika (atau statistika khususnya), kita memang biasanya mulai dari model yang
sederhana kemudian dikembangkan secara berangsur-angsur ke model yang lebih kompleks
yang semakin sesuai dengan kondidi riil di lapangan. Pada Contoh 1.1, sebenarnya sete- Layar Penuh
lah diperoleh kesimpulan akhir tentang harga barang, hasil tersebut perlu diperiksa atau
dicocokkan dengan keadaan riil dilapangan dengan mengambil beberapa informasi yang
lain, apakah temuan tersebut berlaku, menyimpang sedikit atau banyak. Sehingga kita Tutup
bisa mengambil langkah apakah model yang kita pakai perlu diperbaiki atau tidak. Pada

Keluar
Tabel 1.1: Tabel jumlah (kg) salak dan anggur dan harga yang dibayar
Nomor Jumlah Kg Jumlah Kg Jumlah Harga
Pembeli Salak (X1 ) Anggur (X2 ) dalam Rupiah
(H)
1 2 4 20 500 MIPA-Unej

2 6 3 29 000
3 3 2 17 000
Daftar Isi
4 4 5 31 500
5 5 6 40 000
6 6 3 30 500 Judul
7 3 5 29 000
8 2 2 14 500
9 5 6 39 500 JJ J I II
10 6 6 41 000

Hal. 15 dari 245


Contoh 1.1, ada asumsi yang dikenakan dalam persoalan tersebut yaitu pedangang dia-
sumsikan mengenakan harga yang tetap kepada semua pembeli. Ini berarti peubah harga
dianggap merupakan peubah tetap yang tidak bersifat acak. Dengan demikian mengam- Cari Halaman

bil dua pembeli sudah cukup untuk mementukan atau menghitung harga dua komuditas
(anggur dan salak).
Kembali
Persoalan akan menjadi lebih kompleks apabila dalam kenyataan di lapangan pedagang
mengenakan harga yang berbeda-beda kepada pembeli dan sangat boleh jadi kenyataan
inilah yang banyak terjadi di lapangan, terutama di pasar-pasar tradisional. Dalam kondisi
Layar Penuh
ini ada kemungkinan dari beberapa pembeli diperoleh informasi (data) yang berbeda- beda
misalnya dari 10 pembeli diperoleh informasi seperti pada Tabel 1.1 yang berupa data
fiktif. Tutup
Kedua sifat alami dari gejala ini menuntut pemodelan yang berbeda. Pemodelan yang

Keluar
pertama yang tidak memperhitungkan adanya sebaran harga disebut pemodelan de-
terministik (matematika). Dalam pemodelan ini peubah yang diamati dianggap tetap
(fixed) dan tidak memiliki sebaran sehingga hubungan yang diperoleh merupakan hubun-
gan matematika yang bersifat fungsional murni (misalnya, y = f (x)). Pemodelan yang
kedua, menganggap peubah harga berubah- ubah dengan sebaran tertentu (misalnya,
normal). Pemodelan ini disebut pemodelan stokastik (statistika). Hubungan yang MIPA-Unej
diperoleh selain mengandung komponen fungsional, juga mengandung adanya galat yang
merupakan peubah acak yang berdistribusi dengan sebaran tertentu. Jadi hubungan yang
diperoleh menjadi y = f (x, α, β) + e, dengan e adalah peubah acak/ random yang berdis- Daftar Isi

tribusi normal, misalnya. Fungsi f dan sebaran e biasanya bergantung kepada suatu
konstanta yang belum diketahui yang disebut parameter. Parameter inilah yang biasanya
Judul
menjadi fokus kepentingan dalam pemodelan statistika. Dalam contoh di atas X1 , X2 dan
Y disebut variabel/ peubah yang diketahui dari data sedangkan α dan β adalah parame-
ter yang akan dicari). Sehingga persamaan matematika yang sekarang harus diselesaikan JJ J I II
adalah
h = β1 x1 + β2 x2 + .
Hal. 16 dari 245
Selanjutnya dengan mengenakan beberapa pembatasan atau asumsi, dalam statistika,
diperoleh berbagai variasi model. Asumsi yang paling sederhana yang juga menghasilkan
model yang paling sederhana adalah bahwa ei berdistribusi identik dan independen. Model-
Cari Halaman
Statistika Linier membahas berbagai alternatif model serta penyelesaiannya. Dengan
prosedur stokastik menghasilkan persamaan yang berupa dugaan harga (Ĥ)
Kembali
ĥ = 3001, 73x1 + 3968, 40x2

dengan 3001,732 disebut penduga β1 atau βˆ1 yaitu dugaan harga 1 kg salak dan 3968,40
Layar Penuh
disebut βˆ2 yaitu digaan harga 1 kg anggur.

Tutup

Keluar
1.2. Langkah-langkah Penting Dalam Pemodelan
1.2.1. Langkah penting dalam Pemodelan secara Umum
Dari uraian pada Contoh 1.1 sebenarnya sudah tergambar langkah- langkah yang penting
dalam pemodelan secara umum. Langkah- langkah tersebut dapat diuraikan secara ebih MIPA-Unej
eksplisit seperti beikut ini.
Penentuan model Langkah ini meliputi:
Daftar Isi
1. menentukan/ mengidentifikasi peubah;
2. menentukan parameter yang menjadi kepentingan; Judul
3. menentukan hubungan antara parameter dan peubah serta
4. menentukan distribusi komponen acak;
JJ J I II
Penentukan hubungan serta distribusi ini tentunya disesuaikan dengan kondisi dan
sifat permasalahan yang dihadapi.
Hal. 17 dari 245
Menyelesaikan model Langkah ini meliputi menghitung nilai variabel atau konstanta
yang ada pada model dengan menggunakan kaidah- kaidah matematika maupun
statistika baik secara analitik maupun numerik. Cari Halaman

Melakukan verifikasi Hasil yang diperoleh dari penyelesaian model sebelum disimpulkan
atau diinterpretasikan ke dalam persoalan nnyata semestinya diverifikasi apakah su- Kembali
dah sesuai dengan model yang digunakan. Langkah ini penting untuk meyakinkan
tidak adanya kesalahan perhitungan, kesalahan pemrograman (kalau menggunakan
komputer), maupun kesalahan konsep matematika yag digunakan dalam menyele- Layar Penuh

saikan model.
Menarik kesimpulan Selanjutnya hasil yang diperoleh diinterpretasikan sesuai dengan Tutup
persoalan riil yang menjadi dasar pemilihan model.

Keluar
Melakukan uji kecocokan Karena pada umumnya pemodelan dimulai dari yang seder-
hana dengan menggunakan asumsi- asumsi secara ketat, maka tidak mustahil hasil
yang dihasilkan tidak terlalu cocok dengan kondisi riil di lapangan. Melalui langkah
ini seseorang mendapat gambaran apakah model yang dipilih sesuai atau perlu meng-
gunakan meningkatkan kompleksitas modelnya dengan menambah variabel maupun
konstanta dalam model atau mencoba hubungan fungsi yang lebih kompleks. MIPA-Unej

1.2.2. Langkah penting dalam Pemodelan Stokastik Daftar Isi


Sebenarnya langkah- langkah dalam pemodelan stokastik sudah tergambar langkah- langkah
yang penting dalam pemodelan secara umum. Namun ada beberapa langkah yang sifat-
nya khas yang tidak dilakukan dalam pemodelan umum. Sifat khas ini disebabkan karena Judul

dalam pemodelan statistika ada parameter yang menjadi kepentingan dan ada komponen
galat yang bersifat acak (distribusional). Langkah-langkah penting yang harus ditempuh
JJ J I II
dalam pemodelan stokastik dapat diuraikan seperti berikut ini.
Penentuan model. Langkah ini meliputi:
Hal. 18 dari 245
1. menentukan/ mengidentifikasi peubah;
2. menentukan parameter yang menjadi kepentingan;
Cari Halaman
3. menentukan hubungan antara parameter dan peubah serta
4. menentukan distribusi komponen acak.
Kembali
Dalam pemodelan stokastikpun penentuan hubungan serta distribusi ini tentunya
disesuaikan dengan kondisi dan sifat permasalahan yang dihadapi.
Layar Penuh
Mengestimasi parameter yang menjadi kepentingan. Langkah ini identik dengan
menyelesaikan persamaan matematika yang diperoleh sebagai model matematika
dari permasalahan yang dihadapi. Langkah ini meliputi menghitung nilai parameter-
Tutup
parameter yang ada pada model dengan menggunakan kaidah- kaidah matematika
maupun statistika baik secara analitik maupun numerik. ”
Keluar
Menarik kesimpulan/ melakukan uji inferensi. Dalam pemodelan stokastik, karena
peubah yang dihadapi adalah peubah yang bersifat random/ acak maka hasil yang
diperoleh masih harus diuji
1. apakah hasil yang diperoleh secara statistika signifikan atau tidak;
2. bagaimana besaran kesalahan dari dugaan yang diperoleh, MIPA-Unej

3. bagaimana sebaran atau rentangan atau interval dari hasil yang diperoleh?
Melakukan uji kecocokan (goodness of fit) atau mengadakan diagnostik model. Hasil Daftar Isi

yang diperoleh selain diuji signifikansinya, mestinya juga diuji kecocokannya dengan
kondisi riil dilapangan. Melalui langkah diagnostik diperiksa
Judul
1. apakah ada kecocokan atau tidak antara asumsi yang dilakukan dengan kondisi
riil data;
JJ J I II
2. apakah perlu melalukan remidi (mentransformasi data sehingga kondisi yang
disyaratkan oleh model terpenuhi) atau
3. apakah perlu mencari alternatif model yang lebih cocok. Hal. 19 dari 245

Uji kecocokan ini biasanya dilakukan pada sisa (residu) dari penggunaan model. Itu
sebabnya langkah ini kebanyakan dilakukan sesudah model dipilih. Untuk melakuakn Cari Halaman
uji ini diperlukan data yang parameternya diketahui (data hasil simulasi). Bagi
para teorisi statistika ( statistisi ), yang mereka lakukan adalah menurunkan metode
umum/ prosedur dalam mengestimasi parameter, menguji dan mendiagnosis dan Kembali
meremidi model yang mereka buat. Sedangkan tugas praktisi (statistikawan) adalah
menerapkan metode sesuai dengan persyaratan yang ditentukan atau yang dihasilkan
Layar Penuh
oleh para statistisi.
Bagi para teorisi statistika, atau statistisi, yang mereka lakukan adalah menurunkan
metode umum/ prosedur dalam mengestimasi parameter, menguji dan mendiagnosis dan Tutup
meremidi model yang mereka buat. Sedangkan tugas praktisi menerapkan metode sesuai
Keluar
dengan persyaratan yang ditentukan atau yang dihasilkan oleh para statistisi. Selain itu,
tugas para teorisi statistika (statistisi) adalah juga membangun berbagai model alternatif,
untuk berbagai kondisi dilapangan. Kemudian, secara deduktif (matematis) menurunkan
sifat- sifat dari model tersebut, cara mengestimasi parameter, cara mendiagnosis model
serta mengaplikasikan model- model yang diturunkan kedalam suatu paket komputer yang
ramah (gampang dipakai dan dipahami) sehingga bisa dipakai oleh para praktisi di lapan- MIPA-Unej
gan. Lebih tegasnya menurut Mendenhall (1979) dikatakan
The statisticians study various inferential procedures, looking for the best pre- Daftar Isi
dictor or decicion-making process for a given situation. Even more important,
the statistician provides information concerning the goodness of an inferential
procedures. [Para statistisi mempelajari berbagai prosedur penarikan kesim- Judul
pulan, mencari penduga terbaik- atau proses pengambilan keputusan untuk
kondisi tertentu. Bahkan lebih jauh mereka menyediakan informasi berkaitan
dengan kecocokan dari suatu prosedur pengambilan keputusan] (Mendenhall JJ J I II
[22]).
Bagi para analis (praktisi) statistika atau para statistikawan, tugas pokoknya adalah Hal. 20 dari 245
mempelajari model- model yang ditawarkan beserta persyaratan dan prosedur yang harus
ditempuh dalam menerapkan model tersebut. Hal ini sejalan dengan fungsi dan tujuan
Cari Halaman
ilmu statistika itu sendiri sebagaimana digambarkan Wackery et al. [38] bahwa tujuan
statistika adalah membuat kesimpulan tentang populasi berdasarkan informasi yang diper-
oleh pada suatu sampel dan untuk memberikan ukuran derajat kecocokan dari kesimpulan
Kembali
itu.

1.3. Metode Mengestimasi Parameter Layar Penuh

Salah satu langkah pokok dalam pemodelan statistika adalah mengestimasi parameter
Tutup
yang menjadi kepentingan. Dalam model linier ada dua kelompok parameter yang men-
jadi kepentingan yaitu yang paling penting adalah parameter efek tetap atau parame-
Keluar
ter regresi βj (j = 0, 1, 2, ..., k tergantung pada dimensinya) dan biasanya diperlukan
juga mengestimasi parameter dispersi (misalnya ,σ tergantung pada model linier yang di-
hadapi). Kadang- kadang parameter dispersi ini diasumsikan diketahui. Ada dua metode
yang banyak dipakai dalam mengestimasi parameter efek tetap dalam model linier yaitu:
1. metode kuadrat terkecil (least square method) dan MIPA-Unej
2. metode likelihood maksimum (maximum likelihood method).
Daftar Isi
1.3.1. Metode kuadrat terkecil
Pada dasarnya parameter yang diestimasi adalah parameter dari garis regresi dari model
Judul
yang mewakili populasi. Estimasi ini diperoleh berdasarkan informasi atau sebaran sampel
yang dimiliki. Metode least square, menggunakan pendekatan geometris. Secara geometris,
garis yang paling mewakili sebaran sampel adalah garis yang mempunyai simpangan min-
JJ J I II
imum, atau error terkecil dengan pencaran data. Untuk memudahkan perhitungan, jarak
yang aslinya berupa harga mutlak dari error, |i | diganti dengan kuadrat error tersebut
e2i . Hal. 21 dari 245
Langkah langkah dalam mengestimasi parameter dari sampel sebanyak n dengan metode
kuadrat terkecil adalah:
Cari Halaman
1. mengubah persamaan model
yi = xi β + i menjadi i = xi β − yi ;
Kembali
Pn 2
2. mencari bentuk kuadrat dan jumlah kuadrat dari kesalahan, yaitu Q = i=1 i ;

3. menghitung penduga parameter dengan mencari minimum dari Q terhadap βj . Layar Penuh

Dalam pembicaraan kita di bidang statistika, kalau kita membicaraan tentang maksimum/
minimum suatu fungsi, maka yang menjadi kepentingan kita adalah nilai peubah atau
Tutup
paremeter, yang menyebabkan fungsi itu mencapai maksimum/ minimum dan bukan nilai
maksimum/ atau minimum fungsi tersebut.
Keluar
1.3.2. Metode likelihood maksimum
Kalau metode kuadrat terkecil menggunakan pendekatan geometris, maka metode like-
lihood maksimum menggunakan pendekatan distribusi. Dari data yang dimiliki serta
asumsi distribusi yang diberlakukan pada data tersebut kita memperoleh fungsi likelihood
dari data tersebut. Jelasnya langkah tersebut dapat diuraikan sebagai berikut. Langkah- MIPA-Unej
langkah dalam mencari penduga likelihood maksimum adalah seperti berikut ini.
1. Tentukan likelihood dari data Y = (Y1 , Y2 , · · · , Yn )T ,yang mempunyai fungsi kepa-
Daftar Isi
datan peluang masing-masing ψ(θ), yaitu
n
Y
L= ψ(θ) Judul
i=1

Fungsi likelihood tidak lain adalah fungsi kepadatan probabilitas darai Y , hanya saja JJ J I II
nilai y dianggap diketahui (dari data), tetapi parameternya (θ) yang tidak diketahui.
2. Tentukan maksimum dari L atau log −L terhadap parameter θ. Hal. 22 dari 245

1.3.3. Mencari maksimum dengan metode numerik


Cari Halaman
Pada umumnya maksimum suatu fungsi tidak bisa diperoleh secara analitik, oleh kare-
nanya diperlukan pendekatan yang disebut metode numerik. Mencari maksimum/ min-
imum suatu fungsi F () pada dasarnya sama dengan mencari nilai nol atau penyelesa- Kembali
ian fungsi f (θ) = F 0 (θ) = dF/dθ. Metode numerik yang biasa dipakai dalam mencari
maksimum likelihood adalah Metode Newton-Raphson yang merupakan metode iteratif.
Langkah- langkah pokok dari metode Newton-Raphson ini dapat diuraikan sebagai berikut: Layar Penuh

1. menentukan nilai awal b0


Tutup
2. melakukan iterasi sampai konvergen (sampai kriteria konvergensi terpenuhi)

Keluar
F 0 (b0 )
b1 = b 0 − (1.2)
F 00 (b0 )
atau
f (b0 )
b 1 = b0 − (1.3)
f 0 (b0 ) MIPA-Unej

0
dimana f () = F ().
Daftar Isi
Apabila peubah atau parameternya berdimensi tinggi, maka fungsi turunan pertamanya
berupa vektor (D) sedang turunan keduanya akan berupa matriks yang disebut matriks
Hessian (H). Bentuk multivariat dari Newton- Raphson ini adalah
Judul

b1 = b0 − D(b0 ) H−1
(b0 ) (1.4)
JJ J I II
Lebih khusus lagi, dalam statistika matriks Hessian ini kadang kadang lebih sederhana jika
diganti dengan negatif dari nilai harapan nya yang disebut matriks informasi, dinotasikan
I = −E[H]. Persamaan iterasi yang menggunakan matriks informasi dikenal dengan Hal. 23 dari 245
metode skoring dari Fisher (Fisher’s scoring) yang ditunjukkan oleh persamaan berikut.

b1 = b0 + D(b0 ) I −1
(b0 ) (1.5) Cari Halaman

Ada tiga hal penting yang harus diperhatikan dalam mengaplikasikan metode numerik
(Newton-Raphson maupun Skoring dari Fisher) yaitu:
Kembali
1. algorithma yang dipakai (lengkap atau terpartisi),
2. nilai awal dan Layar Penuh

3. kriteria konvergensi
Tutup
Nilai awal untuk b0 ditentukan sedemikian sehingga pada saat itu b0 = y. Sedangkan
kriteria konvergensi bisa menggunakan maks(|b1 − b0 |) , untuk bilangan positif sangat
Keluar
kecil, misalnya 10−3 .Jika parameter yng diestimasi terdiri atas beberapa unsur, maka ada
beberapa cara yang ditempuh dalam mengestimasi dengan menggunakan metode Newton-
Raphson yaitu seperti berikut ini.
1. Mengestimasi secara serempak dengan memperlakukan parameteryang diestimasi se-
bagai sebuah vektor penduga. Cara ini disebut pendekatan algoritma penuh. Cara MIPA-Unej
ini cocok apabila setiap unsur dari vektor parameter mempunyai sifat-sifat (konver-
gensi) yang relatif sama.
Daftar Isi
2. Mengelompokkan unsur-unsur parameter yang sejenis. Unsur-unsur sejenis lalu
diberlakukan sebagai suatu vektor. Dengan demikian akan diperoleh lebih dari
satu vektor parameter. Masing-masing vektor parameter yang diestimasi dengan Judul
cara multivariate, tetapi pendugaan vektor satu dengan lainnya dilakukan secara
selang-seling. Selang seling dapat dilakukan pada setiap iterasi (nested), atau setelah
masing-masing konvergen pada kondisi tertentu(zig-zag). Algoritma seperti ini dise- JJ J I II
but algoritma terpartisi (partitioned algorithm). Pengelompokan biasanya dilakukan
berdasarkan parameter regresi (β) dan parameter dispersi (φ) yang biasanya ke-
dua jenis parameter ini mempunyai sifat-sifat yang berbeda terutama dilihat dari Hal. 24 dari 245
kecepatan konvergensinya.
Pembahasan kedua algoritma di atas (penuh dan terpartisi) dapat dilihat pada Smyth [27] Cari Halaman
dan Smyth [28].

Kembali
1.4. Model Linier dan Perkembangannya
Perkembangan pemodelan stokastik, terutama model linier, dapat dikatakan dimulai pada Layar Penuh
abad ke 19 yang didasari oleh teori matematika yang diletakkan diantaranya oleh Gauss,
Boole, Cayley dan Sylvester yang terkait dengan teori invarian dalam aljabar. Teori in-
varian aljabar mempelajari bentuk-bentuk kuantitas yang tidak berubah terhadap suatu Tutup
transformasi linier. Teori invarian ini yang mendasari perkembangan teori nilai eigen,

Keluar
vektor eigen, matriks determinan, metode dekomposisi dan masih banyak lagi yang lain-
nya. Salah satu contoh dalam statistika kita tahu bahwa korelasi dua peubah acak tidak
berubah walaupun peubah-peubah tersebut mengalami transformasi.
Perkembangan model linier dimulai dengan perkembangan analisis regresi pada abad
19 oleh Pearson perkembangan korelasi segera setelah itu. Teori regresi ini yang menjadi
dasar perkembangan teori model linier. Perkembangan model linier tidak bisa dilepaskan MIPA-Unej
dengan perkembangan teori mtriks atau aljabar linier. Melalui teori matriks (determinan,
invers, perkalian matriks) pembahasan model linier dapat didekati secara umum. Dalam
subbab ini perkembngan model linier lebih dititik beratkan dari dua asumsi dasar yaitu Daftar Isi

distribusi dan indeoendensi kesalahan.


Sebagaimana diuraikan sebelumnya, bahwa pemodelan dimulai dari yang sederhana,
Judul
yang secara matematis mudah diselesaikan, kemudian berkembang ke arah yang lebih
realistik. Hal ini dapat dilakukan dengan menerapkan berbagai asumsi yang berbeda
terhadap distribusi kesalahan dalam model yang digunakan. Prinsip seperti ini telah JJ J I II
berkembang dari model yang paling sederhana (klasik), ke model hirarkis tergeneralisasi
yang saat ini merupakan pemodelan yang paling terkini. Dalam sub-bab ini diuraikan
secara ringkas perkembangan model linier ditinjau dari segi distribusi dan independensi Hal. 25 dari 245
kesalahannya.

Cari Halaman
1.4.1. Model linier klasik
Di atas telah disebutkan bahwa pemodelan stokastik memiliki bentuk umum
Kembali
Y = Xβ +  (1.6)

Dalam hal ini  merupakan kesalahan atau error yang diasumsikan merupakan peubah acak Layar Penuh
yang berasal dari suatu distribusi tertentu, misalnya normal. Peubah x adalah peubah
yang bukan acak dan adalah parameter yang menentukan koefisien dari peubah peubah
tetap tadi. Dalam ilustrasi pada Contoh 1.1. misalnya, dianggap bahwa sebenarnya ada Tutup
hubungan yang bersifat tetap yang menentukan harga barang di pasar. Namun, selain itu

Keluar
masih ada lagi faktor lain yang bersifat acak yang menyebabkan harga barang tadi dalam
kenyataannya dari pembeli ke pembeli mungkin menyimpang dari fungsi hubungan tadi.
Dalam pemodelan statistika/ stokastik, kedua komponen ini dipisahkan yaitu yang bersifat
tetap dan fungsional dinotasikan dengan f (x, β), yang bisa disebut sebagai komponen
tetap (fixed), sedangkan komponen lainnya, , yang bersifat acak disebut sebagai komponen
acak (random component) atau dalam hal ini secara khusus disebut komponen kesalahan MIPA-Unej
(error component). Dari segi fungsi hubungan f , bentuk yang paling sederhana adalah
hubungan linier, sehingga dari aspek ini model yang paling sederhana yang kita miliki
adalah model linier. Sedangkan dari segi komponen acaknya, yang paling sederhana adalah Daftar Isi

asumsi bahwa kesalahannya berdistribusi normal dan saling independen antara satu respon
dengan respon lainnya. Asumsi ini menghasilkan model linier normal sederhana atau
Judul
Normal Linear Models (NLM). Dari kedua hal tersebut lahirlah yang disebut model normal
sederhana atau model linier klasik yang secara formal dapat diuraikan sebagai berikut.
Definisi 1.3 (Bentuk dan Asumsi Model Linier Klasik). JJ J I II

Model:
k
X Hal. 26 dari 245
yi = xij βi + i (1.7)
j=0

atau untuk keseluruhan respon dapat dituliskan dalam bentuk matriks seperti per- Cari Halaman

samaan (1.6),
Y = Xβ + 
Kembali

Asumsi: xi bukan peubah acak dan diukur tanpa kesalahan dan i independen dengan 0i
untuk setiap i 6= i0 dan masing-masing berdistribusi N (0, σ 2 ).
Layar Penuh
Dari asumsi diatas diperoleh bahwa secara keseluruhan  dapat dianggap berdistribusi
multivariat normal (MVN) dengan koefisen variasi konstan, yang dinotasikan dengan
 ∼ M V N (0, σ 2 I). Model mensyaratkan bahwa respon ke i dan ke i0 adalah saling bebas Tutup

Keluar
(independen), yang berarti tidak ada korelasi diantaranya. Beberapa referensi yang mem-
bahas model linier normal ini diantaranya adalah Neter et al. [25], Bowerman et al.[3].
Dalam buku ini Model Linier Klasik/Normal akan dibahas pada Bab 6.

1.4.2. Model linier tercampur


MIPA-Unej
Dalam kenyataan, di lapangan banyak pengamatan yang menghasilkan respon yang tidak
saling independen. Misalnya, apabila pada suatu subjek dilakukan pengamatan yang
berulang- ulang maka respon yang diperoleh antara satu dengan sebelumnya, atau satu Daftar Isi
dengan berikutnya, dapat dipastikan akan saling berkorelasi. Dengan demikian, penga-
matan yang diperoleh bukan lagi merupakan hasil pengamatan atau respon tunggal, tetapi
Judul
merupakan vektor respon. Tentu saja respon seperti ini dapat ditangani dengan metode
multivariat. Namun ada kekhasan dari pengamatan seperti ini, yaitu korelasi/ hubungan
antara respon satu dengan lainnya biasanya berpola, sehingga dianggap kurang pas kalau
JJ J I II
ditangani dengan metode multivariat biasa. Untuk menangani respon-respon semacam ini
model linier klasik di atas lalu dikembangkan menjadi model linier campuran atau Linear
Mixed Models (LMM). Dalam model ini hubungan antara respon yang satu dengan lain- Hal. 27 dari 245
nya dianggap berasal dari pengaruh suatu peubah yang tidak kentara atau laten (subjek,
misalnya). Untuk itu komponen tetap (f (x)) diuraikan lagi menjadi komponen tetap dan
komponen efek acak (random effects). Dengan demikian model ini memiliki dua kompo- Cari Halaman
nen acak yaitu komponen error () dan komponen efek acak yang biasanya dinotasikan
dengan u. Model ini biasa disebut model linier campuran (linear mixed model) yang dapat
didefinisikan sebagai berikut. Kembali

Definisi 1.4 (Bentuk dan Asumsi Model Linier Campuran).


Layar Penuh
Model:
Y = Xβ + Zu +  (1.8)
Tutup
Asumsi: u ∼ M V N (0, σ12 I) dan  ∼ M V N (0, σ22 I). u independen dengan .

Keluar
Sebenarnya varians u dapat bervariasi sehingga membentuk matriks varians-kovarians
dari (Y) yang bervariasi juga. Struktur matriks varians-kovarians ini dapat dibentuk
sesuai kondisi respon yang dihadapi. Bentuk yang paling sederhana di atas menghasilkan
matriks varians-kovarians yang disebut matriks uniform atau compound symmetry. Den-
gan menggunakan jumlah peubah acak yang berdistribusai normal dan saling independen
bisa diperoleh bahwa bentuk varians-kovarian Y , yang termasuk jenis uniform, adalah MIPA-Unej

 2
σ1 + σ22 · · · σ12 σ12

···
 σ12 · · · σ12 + σ22 · · · σ12  Daftar Isi
V=
 
.. . . .
. . . .
. 
 . . . . . 
2 2 2 2
σ1 ··· σ1 · · · σ1 + σ2 Judul

atau secara umum  


1 ··· ρ ··· ρ
 .. . . . .. .  JJ J I II
 .
 . .. . .. 
 ρ ··· 1 ··· ρ 
V = φ (1.9)

 . .
. . ... . . . ... 
Hal. 28 dari 245
 ..

ρ ··· ρ ··· 1
Cari Halaman
Model ini mengasumsikan bahwa korelasi antara pengamatan satu dan lainnya bersifat
konstan (uniform). Struktur lain yang juga banyak diterapkan adalah auto regresive 1 (ar1)
atau disebut korelasi serial yaitu:
Kembali

ρ ρ2 · · · ρk
 
1
. . 
 ρ . . . .. . . . .. 

Layar Penuh
 2 
V = φ  ρ ··· 1 ··· ρ  (1.10)

 . . . .
 .. . . .. .. ρ 

Tutup
k 2
ρ ··· ρ ρ 1

Keluar
Model ini mengasumsikan bahwa seiring dengan jarak yang makin jauh, maka korelasi/
hubungan antara respon tersebut semakin kecil. Model linier campuran/tercampur sering
juga disebut dengan istilah model linier bertingkat (hierarchical linear model). Istilah
bertingkat digunakan karena model ini biasa juga didefinisikan secara bertingkat seperti
berikut ini.
MIPA-Unej
Definisi 1.5. Asumsi Model Linier Bertingkat
1. Ada efek acak ui yang berhubungan dengan strata atau subjek ke i, untuk i = 1, ...n Daftar Isi
dimana antara satu efek acak dengan lainnya saling independen dan berdistribusi
normal dengan mean 0;
Judul
2. Kondisional terhadap efek acak ke i , respon-respon di dalam strata ini juga saling
independen dan berdistribusi normal dengan mean dan varians konstan.
Model linier Campuran tidak menjadi fokus pembahasan dalam buku ini. Bagi pem- JJ J I II
baca yang tertarik, referensi yang bisa dijadikan acuan untuk mempelajari model linier
bertingkat ini diantaranya adalah Bab 4 dari Davidian dan Giltinan [7], Diggle et al. [8],
Hal. 29 dari 245
Laird dan Ware [16]. Sedangkan untuk model yang lebih umum yaitu termasuk model-
model non-linier dapat dilihat pada Davidian dan Giltinan [7]
Cari Halaman
1.4.3. Model linier tergeneralisasi
Kondisi lain di lapangan yang tidak dapat ditangani langsung oleh model linier klasik Kembali
adalah adanya kenyataan bahwa, distribusi respon tidak mesti normal. Memang kondisi
seperti ini bisa ditanggulangi dengan mengadakan transpormasi dari respon. Transpormasi
yang banyak dipakai adalah transpormasi logaritma. Namun, ada beberapa permasala- Layar Penuh
han yang mungkin timbul sebagai efek dari transpormasi ini misalnya seperti berikut ini.
Respon yang sudah ditranspormasi mungkin mendekati distribusi normal, tetapi akibat
transpormasi ada kemungkinan syarat yang lain (syarat ketidak-bergantungan) menjadi Tutup
tidak terpenuhi. Adanya kerancuan dalam menafsirkan hasil penelitian oleh karena efek

Keluar
yang diuji adalah dalam skala logaritma, bukan dalam sekala aslinya. Hal ini menye-
babkan kesimpulan terasa janggal misalnya, ”ada hubungan positif antara log-konsentrasi
pemupukan dengan log-panen”. Untuk menangani kondisi dimana respon yang ada tidak
berdistribusi Normal, tetapi masih saling bebas, maka para statistisi yang dipelopori oleh
Nelder dan Wedderburn [24] telah mengembangkan model linier yang dikenal dengan Ger-
eralized Linear Model (GLM). Model linier ini menggunakan asumsi bahwa repon memi- MIPA-Unej
liki distribusi keluarga ekponensial. Distribusi keluarga eksponensial adalah distribusi
yang sifatnya lebih umum, dimana distribusi- distribusi yang banyak kita kenal (Normal,
Gamma, Poisson) termasuk di dalamnya dan merupakan bentuk- bentuk khusus dari dis- Daftar Isi

tribusi Keluarga Eksponensial. Definisi distribusi Keluarga Eksponensial ini akan dibahas
pada bab selanjutnya. Kalau kita simak model linier klasik, kita menemukan beberapa
Judul
hal yang sifatnya khas dan istimewa yaitu:

1. ada komponen tetap yang disebut prediktor linier ;


JJ J I II
2. respon yi berdistribusi normal dan saling independen dan
Pk
3. mean yi adalah µi = j=0 xij βj . Hal. 30 dari 245

Dalam model linier tergeneralisasi, hubungan di atas mengalami perubahan atau gen-
eralisasi, sebagaimana dalam definisi berikut: Cari Halaman

Definisi 1.6 (Asumsi Model Linier Tergeneralisasi). Model linier tergeneralisasi


adalah model yang mengandung tiga hal yaitu:
Kembali
Pk
1. komponen tetap yang disebut prediktor linier ηi = j=0 xij βj ;

2. respon yi berdistribusi secara independen dalam keluarga eksponensial; Layar Penuh

3. hubungan antara mean dengan prediktor linier ditunjukkan fungsi g(.) yang disebut
fungsi ’link’ sedemikian sedingga g(µi ) = ηi . Fungsi g() disebut fungsi hubungan Tutup
(link-function).

Keluar
Ada fungsi hubungan khusus yang disebut fungsi hubungan kanonik atau natural
yang berkaitan erat dengan distribusi y. Misalnya, jika distribusinya normal maka g()
adalah identitas. Dari hal di atas dikatakan bahwa komponen penting dalam model
linier tergeneralisasi ada tiga yaitu:
(i) adanya prediktor linier, MIPA-Unej

(ii) adanya distribusi keluarga eksponensial dan


(iii) adanya fungsi-hubungan. Daftar Isi

Referensi yang umum dijadikan acuan utama mempelajari model linier tergeneralisasi
ini adalah Generalized Linear Models oleh McCullagh dan Nelder [21], sedangkan sebagai Judul
pemula dapat menggunakan pengantar yang ditulis oleh Dobson [9]. Dalam buku ini akan
dibahas pada Bab 8 dan Bab 9.
JJ J I II
1.4.4. Model linier campuran tergeneralisasi
Hal. 31 dari 245
Model linier ini muncul akibat adanya tuntutan bahwa, di lapangan sangat mungkin terjadi
adanya respon yang tidak saja tidak berdistribusi normal tetapi juga tidak independen.
Model linier ini merupakan gabungan antara model linier campuran dan model linier
Cari Halaman
tergeneralisasi. Model linier campuran ini ada dua macam.
1. Model yang pertama komponen acaknya diasumsikan berdistribusi Normal dan meng-
Kembali
gunakan bentuk aditif seperti pada model linier campuran yang tidak tergeneralisasi.
Model linier ini yang biasa disebut sebagai Model linier campuran tergeneralisasi
(GLMM=Generalized Linear Mixed Model)
Layar Penuh

2. Model yang kedua menggunakan bentuk multiplikatif dan komponen acaknya tidak
dibatasi dengan distribusi Normal.l Model linier ini sering juga disebut Model linier
Tutup
hirarkis tergereralisasi bertingkat (HGLM=Hierarchical Generalized Linear Model).

Keluar
Model linier ini termasuk model linier yang relatif baru dan masih sedang dikem-
bangkan (lihat misalnya Lee dan Nelder [17] dan Tirta [35]. Gambar berikut me-
nunjukkan kedudukan masing-masing model linier.
3. Untuk data yang sekaligus tidak normal dan tidak saling bebas, Liang & Zeger
[18] dan Zeger & Liang [41] memperkenalkan metode yang disebut disebut Gen- MIPA-Unej
eralized Estimating Equations (untuk selanjutnya disingkat GEE) yang merupakan
sebuah analogi atau generalisasi multivariat dari quasi-likelihood. Manakala tidak
ada fungsi likelihood yang pasti untuk dijadikan acuan, cukup beralasan untuk men- Daftar Isi
duga/ mengestimasi dengan menyelesaikan sebuah analogi multivariat dari metode
quasi-score yang diperkenalkan Wedderburn [40] dimana kita hanya perlu menen-
tukan bentuk mean atau rataan (sebagai momen pertama) dan matriks varians- Judul
kovariansnya (sebagai momen kedua), tanpa perlu mengetahui bentuk pasti likeli-
hoodnya. Pembahasan yang lebih detil dapat dibaca pada Diggle et al. [8] dan akan
dibahas pada Bab 10. JJ J I II

Gambar Skema perkembangan model- model statistika linier


Hal. 32 dari 245

1.5. Pengembangan lain model linier


Cari Halaman
Selain berkembang akibat variasi asumsi distribusi dari kesalahan, model linier juga berkem-
bang ke arah variasi kondisi peubah bebas atau peubah penjelas X. Adapun asumsi dasar
dari peubah X adalah bukan peubah acak (tidak memiliki distribusi) dan merupakan Kembali
besaran kuantitatif.
Dalam perkembangannya, ada kalanya Xj merupakan peubah acak dan Xj dan Xj0
tidak saling bebas, dalam kondisi begini, dikatakan terjadi multikolinieritas antara peubah Layar Penuh

bebas X. Tingginya multikolinieritas dapat menyebabkan adanya estimasi parameter tidak


teliti. Secara matematis X − j dan Xj0 yang tidak saling bebas, menunjukkan bahwa salah
Tutup
satu kolom matriks X merupakan kombinasi linier linier dari kolom-kolom lainnya yang
menyebabkan X tidak dalam rank penuh, sehingga invers matriks XT X menjadi tidak
Keluar
terdefinisikan. Ada beberapa prosedur atau tehnik untuk menangani masalah multikolin-
ieritas, diantaranya adalah regresi Ridge (lihat Neter et al[25]).

MIPA-Unej

Daftar Isi

Judul

JJ J I II

Hal. 33 dari 245

Cari Halaman

Kembali

Layar Penuh
Gambar 1.1: Ilustrasi Data yang menunjukkan adanya pencilan

Tidak jarang juga kumpulan data yang kita miliki, sesungguhnya merupakan sekumpu- Tutup
lan dari berapa kelompok data atau sampel sesungguhnya terdiri atas beberapa subsampel.

Keluar
Persoalan yang dihadapi adalah apakah model (garis regresi) masing-masing kelompok
harus berbeda atau dapat digabung dalam satu moded yang sama. Dalam hal ini seba-
gian peubah penjelas Xj akan merupakan peubah kuantitatif, atau merupakan indikator
kelompok atau grup dari kelompok yang ada pada data, sampel maupun populasi. Anal-
isis model linier yang menangani data semacam ini menggunakan peuban boneka dummy
variable dan dapat dilihat pada Neter et al[25]. MIPA-Unej

1.6. Outline Buku Daftar Isi

Buku ini lebih banyak menekankan pada bentuk pemodelan linier yang berasumsi bahwa
respon atau kesalahan saling bebas. Namun pada bagian akhir diberikan pengantar analisis Judul
data yang melihat respon yang tidak saling bebas dengan pendekatan quasy likelihood.
Dari uraian yang telah dibicarakan sebelumnya dapat dilihat bahwa ada beberapa hal
yang harus dikuasai sebelum membicarakan model-odel yang lebih spesifik, diantaranya: JJ J I II
Kemampuan komputer. Kemampuan pemrograman atau penggunaan paket-paket pro-
gram statistika merupakan hal yang tidak dapat dihindarkan mengingat hampir selu- Hal. 34 dari 245
ruh perhitungan analisis statistika karena kompleksitas dan ukuran datanya, tidak
efisien lagi dikerjakan secara manual. Dalam buku ini akan difokuskan pada ap-
likasi paket statistika yang merupakan program open source yang dapat diperoleh Cari Halaman
secara bebas di internet (http://www.r-project.org). Program ini sangat populer
dikalangan peneliti statistika dan juga banyak diapliakskan dalam bidang finansial
(Faraway[?]). Kembali

Teori matriks. Hampir semua analiss data sekarang ini melibatkan data dalam uku-
ran besar, namun dapat disajikan dalam bentuk matriks atau vektor. Oleh karena Layar Penuh
itu sebelum membahas pemodelan lebih jauh pembahasan teori matrks juga sangat
diperlukan.
Tutup
Kedua materi di atas akan dibahas masing-masing pada Bab 2 dan Bab 3 sebelum mem-
bahas model linier baik yang klasik maupun yang lainnya.
Keluar
1.7. Latihan Soal- soal
1. Sebutkan apakah perbedaan antara pemodelan stokastik dan pemodelan determin-
istik dan berikan contoh.
2. Sebutkan langkah-langkah penting dalam pemodelan stokastik. MIPA-Unej

3. Sebutkan komponen-komponen penting dalam model linier dan asumsinya.


4. Sebutkan persamaan dan perbedaan dari model linier normal, model linier campu- Daftar Isi
ran, model linier tergeneralisasi, model linier campuran tergeneralisasi, model linier
hierarkis;
Judul
5. Sebutkan prinsip dasar dan langkah- langkah pokok dari metode likelihood maksi-
mum.
JJ J I II

Hal. 35 dari 245

Cari Halaman

Kembali

Layar Penuh

Tutup

Keluar
MIPA-Unej

Daftar Isi

Judul

JJ J I II

Hal. 36 dari 245

Cari Halaman

Kembali

Layar Penuh
Gambar 1.2: Ilustrasi Data yang memerlukan pemisahan model dari subsampel

Tutup

Keluar
MIPA-Unej

Bab 2
Daftar Isi

Tinjauan Umum R Judul

JJ J I II
Analisis data menggunakan metode statistika, baik karena kompleksitas maupun karena
ukuran datanya tidak mungkin lagi dilakukan secara manual, bahkan dengan kalkulator
Hal. 37 dari 245
sekalipun. Penggunaan komputer menjadi syuatu hal yang tidak dapat dihindarkan. Kon-
sekuensinya mata kuliah-mata kuliah bidang Statistika tidak bisa lagi diberikan hanya se-
cara teoritis tanpa adanya pengalaman praktikum di laboratorium komputer. Pengalaman Cari Halaman
praktikum menggunakan paket-paket pemrograman baik yang bersifat umum maupun
yang khusus untuk bidang statistika menjadi hal yang mendesak dilakukan. Mulai tahun
akademik 2000/ 2001 paket pemrograman yang dipilih untuk praktikum mata kuiah ini Kembali
adalah SPlus versi 4.5. Dengan berbagai alasan yang akan disebutkan kemudian maka
mulai tahun akademik 2004/ 2005 mulai diperkenalkan Paket Statistika R.
Layar Penuh

Tutup

Keluar
2.1. R dengan CLI
Dengan menggunanakan CLI diperoleh bentuk tampilan R yang sama, baik dengan meng-
gunakan sistim operasi Windows maupun Linux yang disebut R-Console. Bentuk tampilan
layar R console adalah sebagai berikut
R : Copyright 2004, The R Foundation for Statistical Computing MIPA-Unej
Version 1.9.0 (2004-04-12), ISBN 3-900051-00-3

R is free software and comes with ABSOLUTELY NO WARRANTY. You are Daftar Isi
welcome to redistribute it under certain conditions. Type
’license()’ or ’licence()’ for distribution details.
Judul
R is a collaborative project with many contributors. Type
’contributors()’ for more information and ’citation()’ on how to
cite R in publications. JJ J I II

Type ’demo()’ for some demos, ’help()’ for on-line help, or


’help.start()’ for a HTML browser interface to help. Type ’q()’ to Hal. 38 dari 245
quit R.

> Cari Halaman

R termasuk pemrograman berorentasi objek. Semua hal yang dikerjakan dalam R


dapat disimpan dalam bentuk objek dengan mendefinisikannya. Definisi dalam R meng- Kembali
gunakan notasi < −. Perhatikan bahwa notasi under score ” ” yang biasa dipakai pada
SPlus tidak dikenal oleh R. Namun, seperti halnya SPlus, R sangat peka terhadap huruf
besar/kecil (case sensitive). Layar Penuh

NamaObjek<-definisi
Tutup

Keluar
Contoh 2.1. Pada Contoh berikut objek X bernilai 9 dan objek x bernilai 8.
>x<-2^3
>X<-3^2
>x
[1] 8 MIPA-Unej
>X
[1] 9
Daftar Isi
Objek R dapat berupa konstanta, vektor/matriks atau fungsi. Agar objek yang didefin-
isikan dapat disimpan secara permanen, maka pada akhir section harus dijawab Y (yes)
ketika ada konfirmasi Save workspace mage ? Judul

2.2. Beberapa Fungsi Penting dalam R JJ J I II

2.2.1. Fungsi dasar matematika


Hal. 39 dari 245
Beberapa fungsi dasar telah didefinisikan secara internal di dalam R. Operasi- operasi
tersebut dapat dilihat pada Tabel 2.1. Terhadap matriks atau vector, operasi tersebut
bekerja perunsur. Berikut beberapa contoh penerapan dari fungsi-fungsi tersebut. Cari Halaman

Contoh 2.2. Misalkan kita ingin membentuk barisan dengan nilai awal 0, nilai akhir
=10 dan banyaknya unsur=10, maka perintah dan hasilnya adalah
Kembali

>x<-seq(0,10,length=8)
x Layar Penuh
[1] 0.000000 1.428571 2.857143 4.285714 5.714286 7.142857 8.571429
[8] 10.000000
Tutup
Beberapa cara pembulatan pecahan desimal dapat dilakukan dengan berbagai perintah
berikut
Keluar
Tabel 2.1: Daftar Fungsi Matematika dalam R
No Nama Fungsi Notasi Matematika Notasi R
1 harga mutlak || abs()
2 goniometri sin, cos, tan sin(), cos(), tan()
3 invers goniometri sin−1 , cos−1 , tan−1 asin(), acos(), atan()
MIPA-Unej
4 hiperbolikus sinh, cosh, tanh sinh(), cosh(), tanh()
5 exponensial dan log exp, ln exp(), log()
6 logaritma 10 ln10 log log log10()
7 gamma Γ() gamma() Daftar Isi
8 bilangan bulat terkecil yang tidak pxq ceiling()
kurang dari bilangan tertentu
9 bilangan bulat terbesar yang tidak xxy floor() Judul
lebih dari
10 bagian bulat suatu bilangan tranc()
11 bilangan bulat terdekat round() JJ J I II
12 pembulatan kedesimal tertentu signif
13 pembentukan matriks matrix(data, nbaris,
nkolom) Hal. 40 dari 245
14 pembentukan barisan seq(awal, akhir, kenaikan)
atau seq(awal, akhir,
length=n) Cari Halaman

round(x) Kembali
[1] 0 1 3 4 6 7 9 10
>floor(x)
[1] 0 1 2 4 5 7 8 10 Layar Penuh
> ceiling(x)
[1] 0 2 3 5 6 8 9 10
>signif(x,3) Tutup
[1] 0.00 1.43 2.86 4.29 5.71 7.14 8.57 10.00
Keluar
> signif(x,4)
[1] 0.000 1.429 2.857 4.286 5.714 7.143 8.571 10.000

2.2.2. Operasi Vektor dan Matriks


Untuk matriks atau vektor yang berdimensi sama maka opersi hitung biasa dapat di- MIPA-Unej
lakukan dan itu akan dikerjakan berdasarkan unsur-unsur y ang bersesuaian seperti pada
contoh diatas. Khusus untuk opersi vektor dan matriks, R memiliki opersi dasar seperti
yang ditunjukkan dalam Tabel 2.2 Daftar Isi

Tabel 2.2: Daftar Operasi Vektor dan Matriks dalam R Judul


No Nama Notasi Matematika Notasi R
1 transpose matriks xT t(x)
2 perkalian matriks xy x %*% y JJ J I II
−1
3 inverse matriks x
P solve(x)
4 jumlah berturutan elemen- elemen f (x) sum(f(x))
yang sudah dikenakan fungsi f Q Hal. 41 dari 245
5 hasil kali berturutan elemen-elemen f (x) prod(f(x))
yang sudah dikenakan fungsi f
6 menunjuk elemen ke i vektor v atau vi , xij v[i], x[i,j] Cari Halaman
elemen ke i, j matriks x

    Kembali
4 2
5 4
Contoh 2.3. Misalkan kita memiliki dua vektor X =  3 dan Y = 3 , maka hasil
  
Layar Penuh
6 6
berbagai operasi hitung biasa diantara diantara kedua vektor ini adalah
Tutup
> x*y

Keluar
[,1]
[1,] 8
[2,] 20
[3,] 9
[4,] 36
> x/y MIPA-Unej
[,1]
[1,] 2.00
[2,] 1.25 Daftar Isi

[3,] 1.00
[4,] 1.00
Judul

> sum(log(x))
[1] 5.886104
JJ J I II
> prod(log(x))
[1] 4.39191
Hal. 42 dari 245
Sedangkan hasil beerapa operasi vektor atau matriks diperoleh seperti berikut
> x%*%t(y)
[,1] [,2] [,3] [,4] Cari Halaman
[1,] 8 16 12 24
[2,] 10 20 15 30
[3,] 6 12 9 18 Kembali
[4,] 12 24 18 36

Layar Penuh
> t(x)%*%y
[,1]
[1,] 73
Tutup

>solve(t(x)%*%y)
Keluar
[,1]
[1,] 0.01369863

> x[2]
[1] 5
MIPA-Unej

2.2.3. Fungsi dasar statistika


Selain fungsi dasar dalam matematika, R juga mempunyai sekumpulan fungsi dasar yang Daftar Isi
biasa dipergunakan dalam bidang statistika. Variabel dalam fungsi statistika ini adalah
berupa vektor data. Fungsi- fungsi ini dirangkum pada Tabel 2.3.
Judul

Tabel 2.3: Fungsi Dasar Statistika pada R


No Nama Fungsi Notasi Statistika Notasi/ perintah dalam R JJ J I II
1 minimum. maximum min, max min(), max()
2 range range range()
3 mean, median, x̄, median mean(), median() Hal. 43 dari 245
4 variance σ2 var()
5 correlation ρxy cor(x,y)
6 ringkasan data summary() Cari Halaman

Contoh 2.4. Misalkan dua vektor X, Y seperti pada contoh sebelumnya. Jika masing- Kembali
masing vektor diperlakukan sebagai data, maka hasil terhadap beberapa fungsi statistika
tadi adalah:
Layar Penuh
> min(x)
[1] 3
Tutup
> max(y)

Keluar
[1] 6
> mean(x)
[1] 4.5

> var(y)
[,1] MIPA-Unej
[1,] 2.916667

> cor(x,y) Daftar Isi

[,1]
[1,] 0.8315218
Judul

> range(x)
[1] 3 6
JJ J I II
> range(y)
[1] 2 6 Hal. 44 dari 245

range memberikan informasi minimum dan maksimum secara serempak.


Cari Halaman
2.2.4. Fungsi Pembangkit Data Peubah Acak
Disamping fungsi dasar yang telah dibicarakan, R juga memiliki fungsi- fungsi statistika Kembali
lainnya yang banyak dipergunakan dalam simulasi data. Fungsi- fungsi ini adalah fungsi
untuk membangkitkan data dari peubah acak dengan berbagai distribusi yang banyak
dijumpai seperti normal, poisson dan gamma dengan jumlah/ ukuran sampel n. Pada Layar Penuh
dasarnya ada empat jenis fungsi terkait dengan distribusi peubah acak yaitu:

rdistribusi untuk membangkitkan data acak/random dari suatu distribusi dengan pa- Tutup
rameter tertentu.

Keluar
ddistribusi untuk mencari nilai fungsi kepadatan f (x) pada suatu nilai x tertentu.

pdistribusi untuk mencari luas daerah (nilai peluang) suatu distribusi yang dibatasi oleh
nilai x tertentu
qdistribusi untuk mencarti nilai x yang membatasi luas daerah (nilai peluang) tertentu
MIPA-Unej
dari suatu distribusi
Daftar fungsi- fungsi ini dapat dilihat pada Tabel 2.4.
Daftar Isi
Contoh 2.5.
Misalkan kita ingin mensimulasi data dari distribusi normal dengan parameter pop- Judul
ulasinya µ50 dan σ = 5. Kita memeriksa mean maupun varians riil (mean sampel) dari
data yang dibangkitkan.
JJ J I II
>mean(rnorm(100,50,5))
[1] 50.19985
Hal. 45 dari 245
>var(rnorm(100,50,5))
[1] 26.99507
Cari Halaman

2.2.5. Fungsi untuk Menghandel Grafik


Kembali
Untuk menghandel grafik, R memiliki beberapa fungsi seperti ditunjjukan pada Tabel2.5.
Dokumentasi yang lebih lengkap dapat diperoleh dengan menggunakan perintah help(...).
Layar Penuh
Contoh 2.6.
Misalkan kita inginkan 1 lembar tampilan grafik dibagi menjadi 6 subgrafik yang ter-
Tutup
susun atas 2 × 3 (2 baris dan 3 kolom). Tentu saja sumbu grafik ini diatur sehingga yang
bisa diberi label sumbu adalah semua sumbu bawah, sumbu paling kiri, sumbu atas, dan
Keluar
sumbu paling kanan. Maka perintahnya adalah seperti berikut dan hasil grafiknya dapat
dilihat pada Gambar 2.1.
par(mfrow=c(2,3))
plot(1,1,xlim=c(0,4),ylim=c(1,3),)
text(2,2,"Gambar 1.1")
plot(1,2,xlim=c(0,4),ylim=c(1,3)) MIPA-Unej
text(2,2,"Gambar 1.2")
plot(1,3,xlim=c(0,4),ylim=c(1,3))
text(2,2,"Gambar 1.3") Daftar Isi

plot(2,1,xlim=c(0,4),ylim=c(1,3))
text(2,2,"Gambar 2.1")
Judul
plot(2,2,xlim=c(0,4),ylim=c(1,3))
text(2,2,"Gambar 2.2")
plot(2,3,xlim=c(0,4),ylim=c(1,3)) JJ J I II
text(2,2,"Gambar 2.3")

Hal. 46 dari 245


2.2.6. Aneka Rupa Perintah R
Disamping fungsi- fungsi yang berhubungan dengan penghandelan file, diantaranya adalah Cari Halaman
seperti yang ada pada Tabel ??.

Kembali
2.3. Menulis Program dengan R
Dalam bagian ini akan dibahas secara lebih mendetil cara- cara mendefinisikan fungsi,
Layar Penuh
maupun membuart skrip program.

Tutup

Keluar
2.3.1. Komponen-komponen Program
Program adalah sekumpulan perintah yang menjadi suatu kesatuan yang harus diker-
jakan oleh komputer. Program biasanya ditulis untuk mengerjakan pekerjaan sejenis untuk
keperluan jangka panjang dan bisa dimanfaatkan oleh orang lain yang tidak terlibat dalam
pembuatan program tersebut. Karena itu penulisan program ini harus memenuhi beber- MIPA-Unej
apa persyaratan. Naskah dari suatu pemrograman biasa disebut listing atau script dari
program tersebut. Komponen- komponen pemrograman yang besar sebaiknya memuat
hal berikut. Daftar Isi

Seting Umum. Bagian ini mengatur hal yang sangat mendasar dari komputer, seperti:
alokasi memori, jumlah digit dari keluaran, namafile dan sebagainya. Dalam R Judul
perintah ini biasanya dikerjakan dengan perintah opsi. Sehingga untuk jelasnya
dapat dilihat dari dokumentasi perintah options ini.
JJ J I II
options(argumen1, argument2,...,.....);
Hal. 47 dari 245
Argumen yang bisa diatur diantaranya contrasts= R menyediakan beberapa bentuk
kontras yang sudah didefinisikan secrara internal yaitu.
Cari Halaman
• echo= T atau F, Jika T berarti setiap ekspresi yang dieksekusi atau dievaluasi
akan ditulis dulu (echoed) sebelum dievaluasi).
• digits= angka. Anggka ini menunjukkan banyaknya angka penting yang akan Kembali

dicetak di print out.


• object.size= 1e+08 atau lebih. Opsi ini diperlukan untuk program yang Layar Penuh
memerlukan memori atau objek yang cukup banyak (misalnya dalam simulasi).
Definisi fungsi. Apabila dalam program itu diperlukan fungsi yang didefinisikan sendiri,
Tutup
sebaiknya fungsi ini dikelompokkan dan didefinisikan pada bagian awal;

Keluar
fungsi1<-function(){}
fungsi2<-function(){}

MIPA-Unej
Data dan Inisiasi. Bagian berikut skrip bisa sanya berisi pengambilan data, baik yang
dilakukan secara simulasi maupun dengan menggunakan data riil yang dimport dari
berbagai program yang tersedia. Data riil harus diaktifkan atau diset sebelum di- Daftar Isi
analisis.
Untuk data simulasi Variabel dan konstanta yang dipakai sebelum bisa dipergunakan
Judul
harus ditetapkan nilai- nilai awalnya. Nilai awal (inisiasi) dari variabel variabel ini
juga sebaiknya diberikan pada bagian tersendiri secara mengelompok untuk memu-
dahkan pemeriksaan atau perubahan.
JJ J I II
Program inti. Bagian ini memuat inti dari pemrograman (looping, perhitungan- perhi-
tungan matematika/ statistika dan lain -lainnya).
Hal. 48 dari 245
Penutup. Bagian penutup bisa berisi rangkuman dari hasdil- hasil yang diperoleh dalam
pemrograman tersebut. Biasanya bagian ini berisi perintah menyimpan file, mentab-
ulasi hasil atau membuat grafik. Cari Halaman

Contoh 2.7. Contoh pemrograman yang lengkap beserta komponen- komponen-


nya. Kembali

# namafile Layar Penuh


options(echo=F,digits=4)
#fungsi
f1<-function(p1,p2){ Tutup
ekspresi1

Keluar
ekspresi2
hasil akhir
}
#inisiasi
p1<-5
p2<-15 #Program utama MIPA-Unej
#loop luar
for(i in 1:n){
while(kon1){ Daftar Isi

#loop dalam
tugas1
Judul
}
}
#Penutup Print(hasil.akhir) JJ J I II
write(t(x),file="x.byrows",ncol=ncol(x))

Hal. 49 dari 245


2.3.2. Langkah- langkah Penting dalam Penulisan Program
Program yang baik adalah program yang memenuhi beberapa persyaratan diantaranya
Cari Halaman
adalah.
1. Mengerjakan dengan benar apa yang mestinya dikerjakan. Untuk program yang
Kembali
dikonsumsi sendiri, atau bagi pemula, syarat yang paling utama adalah program
yang dibuat harus mengerjakan dan memberi hasil yang benar.
2. Alur logika dan matematikanya benar dan gampang diikuti. Untuk itu se- Layar Penuh
belum menulis skrip suatu pemrograman yakinkan bahwa persamaan- per-
samaan maupun fungsi- fungsi matematika yang akan digunakan sudah be-
nar/valid. Selain itu langkah yang lebih rinci berupa algoritma dari apa yang Tutup
akan dikerjakan oleh komputer sudah siap sebelum memulai menulis skrip

Keluar
yakinkan bahwa algorithma ini sudah benar. Algorithma ini bisa juga dibuat
secara lebih eksplisit berupa diagram alir(flow chart.)
3. gampang direvisi; Apa yang akan dikerjakan komputer, seharusnya dapat dila-
cak dengan mudah sehingga kalau ada kesalahan juga gampang direvisi. Penelusuran
atau revisi diharapkan tetap bisa dilakukan dengan mudah, meskipun suatu
MIPA-Unej
skrip program baru dibuka lagi setelah beberapa minggu, bulan atau tahun.
4. Efektif dan efisien dalam memanfaatkan memori dan hardisk; Sebenarnya masalah
efesiensi penggunaan memori dan kecepatan tidak terlalu penting bagi pemula, Daftar Isi
apalagi kecepatan dan penggunaan memori, secara umum dapat teratasi den-
gan semakin canggihnya piranti keras komputer sekarang. Sehingga masalah
kecepatan dan memori tidak akan terlalu terasa menjadi hambatan. Judul

5. dalam pemanfaatannya gampang diikuti. Syarat terakhir penting terutama


kalau program yang dibuat juga disediakan bagi orang lain yang mungkin tidak JJ J I II
banyak faham tentang pemrograman.
Serangkaian perintah yang sering dipergunakan atau fungsi- fungsi matematika yang
Hal. 50 dari 245
akan kita gunakan sebaiknya didefinisikan dalam bentuk fungsi R . Identifikasi fungsi-
fungsi dan variabel yang akan diperlukan dan definisikan fungsi- fungsi ini dibagian
awal. Usahakan memanfaatkan sebanyak mungkin fungsi- fungsi internal yang ada Cari Halaman
dalam paket (dalam hal ini R ). Ini penting agar penggunaan memori itu seefisien
mungkin mengingat selain karena sifatnya yang internal fungsi- fungsi ini telah teruji
kemampuannya. Buatlah program dalam ukuran sedang dan program yang besar se- Kembali
baiknya dipecah- pecah menjadi beberapa modul/ subprogram yang hanya dipanggil
kalau diperlukan. Berilah komentar atau keterangan pada setiap fungsi yang didefin-
isikan demikian juga pada setiap langkah penting. Hal ini akan membantu banyak Layar Penuh
dalam pemahaman dan proses perbaikan/ revisi terutama jika program yang dibuat
baru dibuka lagi setelah kurun waktu yang agak lama.
Tutup
Khusus untuk R , sedapat mungkin hindarkan penggunaan loop— terutama loop for(){}
yang tidak perlu, kecuali tujuannya memang untuk mendemonstrasikan kerja dari
Keluar
loop tersebut. Untuk R lebih efisien digunakan perhitungan vektor dari pada loop.
Karenanya, khususnya bagi pemrogram yang sudah berpengalaman, sedapat mungkin
gunakan perhitungan secara vektor. Jika loop digunakan, pada tahap awal gunakan
kriteria konvergensi yang agak kasar, setelah programnya berjalan baru kriterianya
diatur sesuai kebutuhan. Skrip loop selain dikelompokkan dengan menggunakan ku-
rung kurawal, juga perlu di-indent sesuai dengan tingkat loopingnya. Berikut ini MIPA-Unej
adalah contoh program yang belum memerlukan adanya fungsi.
Contoh 2.8. Kita ingin mengilustrasikan hubungan antara mean populasi dengan Daftar Isi
rata- rata sampel berdasarkan ukuran sampelnya. Untuk itu kita harus membuat
looping pembangkitan data random untuk berbagai ukuran sampel, misalnya dari 10
sampai 100 dengan kenaikan 10. Untuk itu kita akan menempuh beberapa langkah Judul
berikut ini.

1. Mendefinisikan matriks yang terdiri atas 2 kolom dan 10 baris, untuk menam- JJ J I II
pung mean sampel dari 10 macam ukuran sampel. Kolom pertama bisa diisi
ukuran sampel dan kolom kedua berisi besarnya mean masing- masing sampel.
Hal. 51 dari 245
Untuk awal kita bisa mendefinisikan seluruh elemen matriks sama dengan 0.
m<-matrix(0,10,2)
2. Membuat looping yang membuat pembangkitan data diulang mulai dari ukuran Cari Halaman
sampel 10 sampai dengan 100. Untuk ini ada beberapa alternatif.
• Dengan menggunakan indeks i = 1...10 dimana ukuran sampelnya adalah
Kembali
i × 10
for(i in 1:10){ n.sampel<-i*10 }
• Dengan menggunakan batasan maximum 100. Sedangkan n.sampel men- Layar Penuh
galami kenaikan 10 mulai dari 10
n.sampel<-10
while(n.sample<100){ Tutup
n.sampel<-n.sampel+10 }

Keluar
3. Selanjutnya di dalam loop tadi dapat disisipkan perintah membangkitkan data
normal dengan mean 50 dan varians 10, X ∼ N (50, 10). Hal ini bisa juga
dilakukan dengan membangkitkan data Z ∼ N (0, 1) selanjutnya ditransformasi
dengan X = σZ + µ. Pada bagian/tahap yang sama kita menghitung mean
dari X serta menaruh hasilnya pada matriks m pada baris dan kolom yang
bersesuaian MIPA-Unej

Z<-rnorm(n.sample)
X<-sqrt(10)*Z+50
Daftar Isi
m[i,1]<-n.sampel
m[i,2]<-mean(X)
4. Selanjutnya setelah loop berakhir pada bagian akhir kita bisa mencetak grafiknya. Judul

Grafik sederhana dapat dibuat dengan menggunakan perintah


plot(m[,1],m[,2],type=’l’).
JJ J I II
m[,k] menunjukkan seluruh baris pada kolom k sedangkan m[i,] menunjukkan
baris kedua untuk seluruh kolom. Perintah yang lebih lengkap dapat dilakukan
dengan memberikan judul dan label sumbu koordinat, atau bahkan warna. Hal. 52 dari 245
plot(m[,1],m[,2],type=’l’,xlab=’Sumbu X’,ylab=’Sumbu Y’,
main=’Judul Grafik’)
Cari Halaman
Secara keseluruhan kita menpunyai skrip berikut
n<-10
m<-matrix(0,n,2) Kembali
for(i in 1:n){
n.sampel<-i*10
Z<-rnorm(n.sample) Layar Penuh
X<-sqrt(10)*Z+50
m[i,1]<-n.sampel
m[i,2]<-mean(X) Tutup
}
plot(m[,1],m[,2],type=’l’,xlab=’Sumbu X’,ylab=’Sumbu
Keluar
Y’,main=’Judul Grafik’)

Jika petunjuk di atas diikuti dengan benar maka anda akan mendapat grafik
seperti pada Gambar 2.2.

MIPA-Unej
2.3.3. Mendefinisikan Fungsi dalam R
Perintah panjang (terutama terkait dengan rumus-rumus matematika) dan sering
Daftar Isi
dievaluasi dengan nailai berbeda dapat ditulis sebagai fungsi. Berikut akan diba-
has secara lebih rinci cara-cara mendefinisikan fungsi sesuai petunjuk yang telah
diberikan pada bab- bab sebelumnya. Sebagaimana telah dibicarakan sebelumnya
Judul
bahwa fungsi dalam R memiliki struktur

JJ J I II
nama.fungsi<-function(parameter1, parameter2){
ekspresi1,
.... Hal. 53 dari 245
fungsi1
....
hasil akhir (returned value) Cari Halaman
}

Kembali
Selain variabel atau konstanta yang didefinisikan secara internal (seperti pi =π =
3.1415 ...), maka semua variabel atau konstanta yang dipergunakan dalam definisi
Layar Penuh
harus diperlakukan sebagai parameter. Dalam suatu fungsi kita dibenarkan memang-
gil fungsi yang lain. Diantar sekian banyak perhitungan yang dilakukan di dalam
suatu fungsi, maka harus ditegaskan hasil mana yang akan ditampilkan sebagai hasil
Tutup
akhir dari eksekusi fungsi. Hasil ini disebut sebagai returned value yang dilakukan
dengan memanggil kembali hasil yang telah dihitung. Pada dasarnya fungsi R adalah
Keluar
translasi dari fungsi matematika ke dalam bahasa R. Hal ini akan terlihat jelas dari
beberapa contoh yang diberikan.
fungsi.f<-function(x){x*sin(x)}
fungsi.g<-function(x,y){
log(x)+fungsi.f(x)+exp(y)
MIPA-Unej

Fungsi g ini selain mempunyai parameter yang lebih banyak dari f juga didalamnya,
g memanggil fungsi f dan ini adalah hal yang bisa dilakukan dalam mendefinisikan
Daftar Isi
fungsi-fungsi R. Agar fungsi g berfungsi dengan baik maka fungsi f harus sudah
didefinisikan terlebih dahulu sebelum mendefinisikan fungsi g.
Judul
Contoh 2.9. Sebagai contoh misalkan kita ingin membuat fungsi untuk menghitung
akar-akar persamaan kuadrat f (x) = ax62+bx+c = 0. Maka bisa ditempuh langkah-
langkah berikut.
JJ J I II
1. Yakinkan bahwa fungsi yang kita miliki secara matematis sudah valid. Untuk
fungsi yang merupakan rumus abc bentuk matematikanya adalah
Hal. 54 dari 245

−b ± b2 − 4ac
x12 =
2a Cari Halaman
Koefisien a, b, dan c diperlakukan sebagai parameter dari fungsi ini. Akar- akar
x1 dan x2 didefinisikan sesuai dengan rumus abc. Ini adalah bagian algorithma
Kembali
yang harus sudah dimiliki sebelum kita menulis skrip pemrograman. Untuk
rumus abc, kita tahu hasil secara matematis untuk persamaan kuadrat fungsi
matematikanya ditunjukkan oleh persamaan di atas.
Layar Penuh
2. Langkah selanjutnya adalah menerjemahkan rumus atau komponen-komponennya
kedalam bahasa R. Karena ada dua nilai yang dihasilkan yaitu x1 dan x2 .
Oleh karena itu, variabel x1 dan x2 harus dikombinasikan melalui perintah Tutup
cbind(x1,x2) jika dikelompokkan menjadi vektor baris atau rbind(x1,x2)

Keluar
jika dikelompokkan menjadi vektor kolom. Vektor ini sekaligus menjadi hasil
yang ditampilkan (returned value).
fungsi.abc<-function(a,b,c){
x1<-(-b+sqrt(b^2-4*a*c))/2*a
x2<-(-b-sqrt(b^2-4*a*c))/2*a
cbind(x1,x2) MIPA-Unej
}
3. Setelah fungsi terbentuk kita bisa melakukan evaluasi. Kita bisa mengevaluasi Daftar Isi
fungsi tersebut untuk suatu nilai a, b, c tertentu. Berikut adalah beberapa
hasil yang diperoleh dari hasil evaluasi fungsi yang dibuat. Setiap kali kita
melakukan perubahan atau revisi pada fungsi, maka fungsi itu harus di eksekusi Judul
dulu supaya perbaikannya menjadi efektif tercatat dalam R. Jika tidak, maka
R tetap akan memanggil fungsi yang belum diperbaiki. Beberapa hasil yang
diperoleh dari eksekusi fungsi diatas untuk berbagai nilai parameter adalah JJ J I II
> fungsi.abc(1,-5,6)
x1 x2 Hal. 55 dari 245
[1,] 3 2
> fungsi.abc(1,0,-4)
x1 x2 Cari Halaman
[1,] 2 -2
Jika pembentukan vektor mwenggunakan perintah rbind(x1,x2) maka kita Kembali
akan memperoleh hasil seperi berikut
> fungsi.abc(1,-5,6)
Layar Penuh
[,1]
x1 3
x2 2
Tutup
> fungsi.abc(1,0,-4)

Keluar
[,1]
x1 2
x2 -2
Selanjutnya apabila akar-akar yang terjadi adalah imajiner, maka komentar R
yang muncul adalah
MIPA-Unej
> fungsi.abc(1,0,4)
[,1]
x1 NA Daftar Isi
x2 NA
yang bertarti tidak ada hasil yang tersedia. Untuk menjadikan program ini lebih Judul
komunikatif, maka kita perlu memberikan beberapa pesan yang lebih difahami,
kalau diskriminan dari rumus abc tersebut kurang dari 0. Untuk itu kita perlu
menggunakan perintah- perintah kontrol seperti if, if else. Fungsi di atas dapat JJ J I II
dikembangkan menjadi
# contoh fungsi untuk menghitung akar- akar persamaan
Hal. 56 dari 245
# kuadrat dengan rumus abc
# dalam fungsi ini a tidak boleh sama dengan 0.
fungsi.abc<-function(a,b,c){ Cari Halaman
if(a==0){stop("\na harus <>0")}
D<-b^2-4*a*c # diskriminan
if(D>=0){ Kembali
x1<-(-b+sqrt(b^2-4*a*c))/2*a
x2<-(-b-sqrt(b^2-4*a*c))/2*a
rbind(x1,x2) # membuat vektor akar- akar Layar Penuh
}
else{cat("\n Akar- akar imaginer")}
# pesan kalau D<0 Tutup

}
Keluar
Hasil evaluasi untuk berbagai nila a, b, c adalah sebagai berikut
> fungsi.abc(1,0,-4)
[,1]
x1 2
x2 -2
MIPA-Unej
> fungsi.abc(1,5,-6)
[,1]
x1 1 Daftar Isi

x2 -6
Judul
> fungsi.abc(1,5,6)
[,1]
x1 -2 x JJ J I II
2 -3

> fungsi.abc(1,0,4) Hal. 57 dari 245


Akar- akar imaginer
>
> fungsi.abc(0,0,4) Cari Halaman
Error in fungsi.abc(0, 0, 4):
a harus <>0
Kembali
Selain untuk menghitung akar- akar dari persamaankuadrat, kita dapat juga mendefin-
isikan fungsi untuk menghitung nilai fungsi persamaan tersebut untuk berbagai nilai
variabel. Hal ini bermanfaat dalam membuat grafik dari persamaan tersebut. Layar Penuh

Contoh 2.10. Fungsi untuk menghitung nilai fungsi kuadrat


Tutup
f<-function(a,b,c,x){
a*x^2+b^x+c
Keluar
}

Menghitung akar-akar persamaan derajat tinggi dengan metode numerik

Untuk persamaan selain persamaan linear dan kuadrat, maka pennyelesaiannya bi-
asanya ditempuh dengan menggunakan metode numerik. Salah satu metode numerik MIPA-Unej
ini yang banyak dipergunakan dalan statistika adalah Metode Newton-Raphson.
Dalam statistika kita sering berhubungan dengan fungsi yang merupakan fungsi- like-
Daftar Isi
lihood yang akan dicari maksimumnya. Mencari maksimum dari suatu fungsi pada
dasarnya sama dengan menyelesaikan persamaan dari turunan pertamnya. Pada
umumnya persamaan seperti ini, dalam statistika jarang mempunyai penyelesaian
Judul
analitik, sehingga harus dicari dengan metode numerik. Penyelesaian numerik suatu
persamaan dicari melalui proses iterasi yaitu proses mengerjakan sekelompok op-
erasi hitung yang semakin lama menghasilkan nilai yang semakin dekat dengan hasil JJ J I II
yang sebenarnya, kecuali jika persamaan itu tidak memiliki jawaban. Secara umum
bentuk itersai Newton-Raphson untuk menyelesaikan persamaan f (x) = 0 adalah
f (x) Hal. 58 dari 245
x1 = x0 − (2.1)
f 0 (x)
dengan f ( x) = df /dx. Jika yang dicari adalah nilai dimana fungsi itu mencapai Cari Halaman
maximum/minimum, maka iterasi Newton-Raphson ini dimodifikasi sedikit menjadi
f 0 (x)
x1 = x0 − (2.2) Kembali
f 0 0(x)
Hal ini sesuai dengan penjelasan sebelumnya bahwa mencari titik maximum suatu
fungsi sama halnya mencari penyelesaian dari fungsi turunan pertamanya. Layar Penuh

Contoh 2.11. Misalkan kita ingin mencari titik maximum atau minimum dari
fungsi pada interval −10 ≤ x ≤ 10. Tutup
2
f (x) = sin(x) + x + 2x (2.3)
Keluar
Maka langkah langkah untuk membuat program untuk mencari titik maksimum
fungsi tersebut dengan menggunakan Metode Newton Raphson adalah
1. Menentukan hasil- hasil matematika, dalam hal ini fungsi turunan pertama
dan kedua dari fungsi di atas. Dengan menggunakan berbagai tehnik dalam
diferensial integral diperoleh hasil sebagai berikut. Fungsi turunan pertama MIPA-Unej
dan kedua

f 0 (x) = cos(x) + 2x + 2 (2.4) Daftar Isi


f 00 (x) = − sin(x) + 2 (2.5)

2. Skrip fungsi. Skrip lengkap fungsi untuk menghitung titik minimum adalah Judul

d<-2
eps<-0.01
JJ J I II
x0<-0
f.f1<-function(x){
Hal. 59 dari 245
cos(x)+2*x+2}
f.f2<-function(x){
-sin(x)+2}
it<-0 Cari Halaman

cat("\n Iterasi: ")


while(d>eps){
it<-it+1 Kembali
x1<-x0-f.f1(x0)/f.f2(x0)
d<-abs(x1-x0)
x0<-x1 Layar Penuh
cat(" ",it)}

print(x0) Tutup

Keluar
x<-seq(-2,1,0.1)
y<-sin(x)+x^2+2*x
f1<-cos(x)+2*x+2
f2<--sin(x)+2
plot(x,y,type=’l’,main=’Grafik Fungsi dan Turunannya’,xlab=’X’,ylab=’Y’)
lines(x,f1,lty=2) MIPA-Unej
lines(x,f2,lty=3)
lines(x,0*x)
Daftar Isi
ya<-seq(-2,4,0.1)
xa<-0*ya+x0
lines(xa,ya,lty=3)
Judul

Secara geometris dapat diilustrasikan/ diperiksa kebanaran antara fungsi, turunan-


nya serta nilai maksimum atau minimum dengan memeriksa grafiknya (lihat Gambar JJ J I II
?? yang menunjukkan hubungan sebagai berikut
• saat f (x) mencapai nilai minimum/maksimum, maka f 0 (x) = 0; Hal. 60 dari 245
00
• nilai merupakan maksimum jika f (x) > 0, sebaliknya merupakan maksimum
jika f 00 (x) < 0.
Cari Halaman

Contoh 2.12. Buat program untuk mencari titik maksimum/minimum dari persamaan
dengan menggunakan metode Newton Raphson. Kembali
 2
x
f (x) = x exp −
10 Layar Penuh

Mengikuti langkah-langkah pemrograman sebelumnya, kita peroleh hasil dari tiap-tiap


tahap sebagai berikut: Tutup

Keluar
1. Fungsi-fungsi turunan

2x2
   2
0 x
f (x) = − + 1 exp − (2.6)
10 10
 3   2
4x 6x x
f 00 (x) − exp − (2.7) MIPA-Unej
100 10 10

2. Dalam fungsi R fungsi turunan tersebut dapat ditulis sebagai


Daftar Isi

f.tur.1<-function(x){
d1<-(-2*x^2/10+1)*exp(-x^2/10) Judul
d1 }

f.tur.2<-function(x){ JJ J I II
d2<-exp(-x^2/10)*(4*x^3/100-6*x/10)
d2
} Hal. 61 dari 245

3. Menentukan nilai awal. Nilai awal dari x dapat ditentukan misalnya x0 = 5 atau
x0 = −5. Sedangkan ∆x = 10 (delta.x) dan (crit) sebagai kriterium konvergensi Cari Halaman

dapat dipilih sekecil mungkin sesuai keparluan misalnya 0.001. Sebelum program
berjalan sebagaimana mestinya nilai  dibuat agak besar (misalnya 0.5), sehingga
Kembali
dalam pengujian program tidak memakan waktu terlalu lama.
4. Bagian utama dari program ini berisi
Layar Penuh
# looping
no.it<-0 cat("x awal adalah ",x0,"\n")
Tutup
while(delta.x>crit){
x1<-x0-f.tur.1(x0)/f.tur.2(x0)
Keluar
delta.x<-abs(x1-x0)
x0<-x1
no.it<-noit+1 }

no.it hanyalah konter/ pencacah untuk mendeteksi jumlah iterasi yang diperlukan.
Pada bagian penutup kita bisa memerintahkan komputer untuk mencetak MIPA-Unej

cat("Fungsi akan memperoleh nilai max/min pada titik x=",x1,"\n")


cat("Tingkat ketelitian adalah ",delta.x,"dan banyaknya iterasi Daftar Isi
adalah ",no.it,"\n")

Judul
Hasil yang diperoleh dari mengeksekusi program yang dibuat dengan berbagai titik
awal adalah
x awal = -4 Fungsi memperoleh nilai max/min pada titik JJ J I II
x=-2.2444951635172
Tingkat ketelitian adalah 0.000934621250368472
Banyaknya iterasi adalah 53 Hal. 62 dari 245

x awal = 3 Fungsi akan memperoleh nilai max/min pada titik


Cari Halaman
x=2.24448623841328
Tingkat ketelitian adalah
0.00093363323004958
Kembali
Banyaknya iterasi adalah 44

Hasil menunjukkan bahwa fungsi yang kita evaluasi memiliki dua titik dimana dia Layar Penuh
mencapai maksimum/ minimum. Ilustrasi akan lebih jelas pada saat kita menampilkan
grafik dari fungsi tersebut.
enghitung akar-akar persamaan fungsi multivariabel Untuk fungsi dua variabel atau Tutup
lebih prinsip yang kita gunakan adalah sama hanya kita bekerja dalam operasi vektor/

Keluar
matriks (v), vektor/ matriks turunan pertama D dan turunan kedua dari fungsi tersebut
adalah matriks Hessiannya (H) dan bentuk iterasi Newton-Raphsonnya menjadi
v1 = v0 − H−1 D (2.8)
atau secara lebih lengkapnya
MIPA-Unej
     ∂f 
v1 v1  ∂2f ∂2f ∂2f

∂v 2 ∂v1 ∂v2 ··· ∂v1 ∂vp
∂v
 ∂f1 
v2  v2   .1 .. .. ..   ∂v2 
 ..  =  ..  −  .. (2.9) Daftar Isi
      . 
. .

. . .   . 
∂2f 2
∂ f  . 
vp 1 vp 0 ∂vp ∂v1 ∂vp2 ∂f
0 ∂vp 0 Judul
Misalkan kita ingin mencari titik maksimum atau minimum dari fungsi
f (x, y) = −x2 + 2xy + 2x − 4y − 3y 2 . JJ J I II
Maka langkah langkah yang harus kita tempuh adalah mencari fungsi turunan pertama
dan kedua terhadap x dan y dari fungsi diatas. Perhitungan matematika menghasilkan Hal. 63 dari 245

Hasil-hasil matematika
∂f Cari Halaman
= 2x + 2y + 2 (2.10)
∂x
∂f
= 2x − 4 − 6y (2.11) Kembali
∂y
∂2f
=2 (2.12)
∂x2 Layar Penuh
∂2f
= −6 (2.13)
∂y 2
∂2f ∂2f Tutup
= =2 (2.14)
∂x∂y ∂y∂x
Keluar
Fungsi-fungsi R Dalam bahasa R fungsi dapat ditulis sebagai berikut:
fmv<-function(x,y){
-x^2+2xy+2x-4y-3y^2}
df.dx<-function(x,y){
-2*x+2*y+2}
df.dy<-function(x,y){ MIPA-Unej
2*x-6*y-4}

Daftar Isi
Fungsi f (x, y) didefinisikan dalam R bermanfaat jika diperlukan ilustrasi grafik (3 di-
mensi)nya baik dalam bentuk perspektif maupun konturnya. HAl ini sangat berman-
faat untuk mengilustrasikan adanya maksimum/minimum baik secara grafis maupun Judul
numerik. Untuk turunan II karena hanya berupa konstanta maka langsung dapat
didefinisikan matriks  
2 2 JJ J I II
H=
2 −6
Dalam bahasa R dapat didefinisikan dengan
Hal. 64 dari 245
H<-matrix(c(-2,2,2,-6),2,2)

Cari Halaman
Inisiasi Nilai awal variabel yang perlu ditetapkan terlebih dahulu adalah nilai awal v0 ,
matriks D, kriteria konvergensi.
Kembali
v0<-matrix(0,2,1)
D<-matrix(0,2,1)
crit<-0.001 Layar Penuh
delta<-10

Program inti. Bagian ini terdiri dari loop Newton-Raphson dalam dua variabel. Tutup

Keluar
while(delta>crit){
D[1,1]<-df.dx(x,y)
D[2,1]<-df.dy(x,y)
v1<-v0-solve(H)%*%D
delta<-max(abs(v0-v1))
v0<-v1 MIPA-Unej
it<-it+1
cat("It ",it,"V=",v1,"delta=",delta,"\n") }
print(v1) Daftar Isi

Hasil yang diperoleh adalah


Judul
It 1
v = 0.499999999999998 -0.5;
delta= 10.5 JJ J I II
It 2
v = 0.5
Hal. 65 dari 245
-0.5;
delta = 1.7763568394003e-015
> print(v1)
Cari Halaman
[,1]
[1,] 0.5
[2,] -0.5 Kembali

Jadi program yang dibuat sudah konvergen hanya pada dua iterasi. Dari beberapa
contoh diatas jelas bagi kita bahwa pada dasarnya fungsi R adalah fungsi matematika Layar Penuh
yang didefinisikan dengan menggunakan bahasa R . Ini menenjukkan bahwa alur logika
pemrograman dengan R secara alamiah sejalan dengan alur logika matemaika.
Tutup

Keluar
2.4. Beberapa Paket/Library untuk Model Linier
Sesuai dengan ppembahasan perkembangan model linier pada Bab 1, maka pada buku ini
akan lebih banyak dibahas paket/library yang terkait diantaranya adalah yang disebutkan
berikut ini (Daftar library yang lebih lengkap dapat dilihat pada Subbab 2.7, halaman 81.
MIPA-Unej
lm yaitu paket untuk melakukan analisis Model Linier Normal.
lmm yaitu paket untuk melakukan analisis Model Linier Campuran Linear Mixed Models.
Daftar Isi
glm yaitu paket untuk melakukan analisis Model Linier Tergeneralisasi (Generalized Lin-
ear Models.
Judul
glmm yaitu paket untuk melakukan analisis Model Linier Campuran Tergeneralisasi (Gen-
eralized Linear Mixed Models.
JJ J I II
gee yaitu paket untuk melakukan analiais model marjinal dengan pendekatan quasi-
likelihood mulivariat.
Hal. 66 dari 245
Dokumentasi paket-peket tersebut dapat didapat dengan menggunakan perintah
>?NamaLibrary
Cari Halaman

atau melalui dokumentasi help-html. Sedangkan untuk mengaktifkan libary-library


tersebut dapat dilakukan dengan
Kembali
>library(NamaLibrary)

Dalam model linier, hubungan antara peubah respon (Y ) dengan beberapa peubah Layar Penuh
bebas/penjelas Xj harus diberikan dalam bentuk rumus model atau model formula yang
mempunyai bentuk umum
Tutup
y~x1+x2+...

Keluar
2.5. Mencari Informasi
Hal pertama yang terenting dapat dilakukan dalam menggunakan program R adalah men-
dapatkan informasi tentang fasilitas yang disediakan R. Dari tampilan sebelumnya dapat
diketahui bahwa jika kita ingin mengetahui beberapa kemampuan dan fasilitas R dapat
dilakukan dengan menggunakan salah satu alternatif berikut: MIPA-Unej

help() untuk mengetahui dokumentasi bantuan secara umum. Selanjutnya kita dapat
memilih topik yang tersedia dan lebih mengkhususkan pencarian kita pada topik Daftar Isi
tersebut dengan menggunakan help(topik).
help.start(). Untuk mengaktiifkan dokumentasi dalam format html yang lebih inter-
Judul
aktif. Pengguna selanjutnya dapat memilih topik yang tersedia seperti layaknya
mencari informasi di internet.
JJ J I II
help.search("kata kunci"). Jika kita ingin mendapat informasi dari suatu topik ter-
tentu dapat juga kita masukkan suatu kata kunci melalui help.search().
Misalkan kita ingin mencari informasi tentang analisis regresi, maka kata kunci yang Hal. 67 dari 245
mungkin bisa dimasukkandiantaranya adalah regression, linear model. Hasil pela-
cakan menghasilkan
Cari Halaman
>help.search("regression")

Help files with alias or concept or title matching ’regression’ Kembali


using fuzzy matching:

anscombe(base) Anscombe’s Quartet of "Identical" Simple


Layar Penuh
Linear Regressions
longley(base) Longley’s Economic Regression Data
...
Tutup
MCMClogit(MCMCpack) Markov chain Monte Carlo for Logistic
Regression
Keluar
...
gam(mgcv) Generalized Additive Models using
penalized
regression splines and GCV

gam.fit(mgcv) Generalized Additive Models fitting using MIPA-Unej


penalized regression splines and GCV
...
ksmooth(stats) Kernel Regression Smoother Daftar Isi
lm(stats) Fitting Linear Models lm.influence(stats) >
Regression
Diagnostics loess(stats) Local Polynomial Regression
Judul

Sedangkan pelacakan dengan menggunakan linear models menghasilkan


JJ J I II
>help.serach("linear models")
Help files with alias or concept or title matching ’linear models’
using fuzzy matching: Hal. 68 dari 245

rlm(MASS) Robust Fitting of Linear Models


stdres(MASS) Extract Standardized Residuals from a Cari Halaman
Linear Model
studres(MASS) Extract Studentized Residuals from a
Linear Model Kembali
gls(nlme) Fit Linear Model Using Generalized Least
Squares
gnls(nlme) Fit Nonlinear Model Using Generalized Layar Penuh
Least Squares

...
Tutup

Keluar
Nama dalam kurung menunjukkan library dimana perintah tersebut berada. Untuk
memperoleh informasi lebih lanjut maka yang perlu dilakukan adalah:
1. mengaktifkan library bersangkurtan dengan menggunakan library(NamaLibrary).
2. mencari informasi dengan menggunakan help(topik).
Misalkan kita ingin mendapat informasi gls(nlme) maka yang harus kita lakukan adalah: MIPA-Unej

>library(nlme)
>help(gls)
Daftar Isi
gls package:nlme R Documentation

Fit Linear Model Using Generalized Least Squares


Judul
Description:
This function fits a linear model using generalized least squares.
The errors are allowed to be correlated and/or have unequal
variances. JJ J I II
Usage:
gls(model, data, correlation, weights, subset, method, na.action,
control, verbose) Hal. 69 dari 245
## S3 method for class ’gls’:
update(object, model, data, correlation, weights, subset,
method, na.action, control, verbose, ...) Cari Halaman

... Examples:
data(Ovary) Kembali
# AR(1) errors within each Mare
fm1 <- gls(follicles ~ sin(2*pi*Time) + cos(2*pi*Time), Ovary,
correlation = corAR1(form = ~ 1 | Mare)) Layar Penuh
# variance increases as a power of the absolute fitted values
fm2 <- update(fm1, weights = varPower())
Tutup
Dalam paket-paket library, biasanya ada informasi kepustakaan untuk mempelajari
teori serta beberapa contoh penggunaan library tersebut.
Keluar
2.6. Rgui untuk Windows
Bagi pengguna yang menggunakan sistim opertasi Windows dapat memilih beberapa
Graphical User Interface (GUI) yang dapat membantu kemudahan dalam menjalankan
program R. Ada 3 macam RGUI tersedia bagi pengguna windows yaitu:
MIPA-Unej
1. RGui standar yang dikeluarkan RTeam
2. RGui yang dengan RComander
Daftar Isi
3. RGui dengan SciViews

Judul
2.6.1. RGui Standar
Interface yang dikembangkan oleh R-Team adalah Rgui. Dibandingkan dengan program-
program komersial berbasis Windows, interface Rgui ini memang masih sangat sederhana. JJ J I II
Menu yang tersedia hanya empat kelompok yaitu : File, Edit, Misc, Package dan Help
seperti ditunjukkan pada Gambar 2.4. Beberapa pilihan submenu penting yang tersedia
Hal. 70 dari 245
dari masing-masing menu tersebut diantaranya adalah seperti dilihat pada Tabel 2.7 dan
Gambar 2.5
Untuk mengedit dan menjalankan skrip dapat dilakukan dengan menggunakan notepad Cari Halaman
dengan langkah-langkah berikut : buka file dengan perintah
>edit(nama file)
Kembali
Selanjutnya tulis skrip sebagaimana mestinya lalu disimpan dengan nama yang diinginkan.
jalankan skrip dengan memilih source pada menu file.
Layar Penuh
Bagi pengguna yang sangat bergantung pada menu, memang akan mengalami ham-
batan karena tidak bisa sekaligus mengedit dan menjalankan skrip seperti yang bisa di-
lakukan pada S-Plus. Untuk mengatasi hal ini dapat dilakukan dengan menginstall suatu
Tutup
interface Gui yang lain diantaranya adalah RComander dan R-SciViews.

Keluar
Tabel 2.4: Fungsi Pembangkit Data pada R
No Nama Dis- Fungsi Kepadatan Perintah dalam R MIPA-Unej
tribusi  
1 1  x − µ 2
1 Normal f (x) = √ exp − rnorm(n, mean, sigma )
2πσ 2 σ Daftar Isi
N (µ, σ 2 ) dnorm(x, mean, sigma)
pnorm(x, mean, sigma)
qnorm(p, mean, sigma)
Judul

2 Gamma rgamma(n, alpha,beta),


G(α, β) β α xα−1 dgamma(x, alpha, beta),
f (x) = exp(xβ)
Γ(α) pgamma(x, alpha,beta), JJ J I II
2
µ = α/β σ = α/β 2 qgamma(p, alpha, beta)

Hal. 71 dari 245


λx exp(−λ)
3 Poison(λ ) p(x) = rpois(n,lamda ), dpois(x,
x!
lambda), ppois(x, lambda),
qpois(p, lambda) Cari Halaman

4 Binomial   rbinom(n, s, pi), dbinom(x,


(s, π) s s, pi), pbinom(x, s, pi), Kembali
p(x) = π x (1 − π)s−x
x qbinom(p, s, pi)
µ = sπ σ 2 = sπ(1 − π)
Layar Penuh

Tutup

Keluar
MIPA-Unej
Tabel 2.5: Perintah R untuk Grafik
No Tujuan Perintah R Keterangan
1 membuat multigrafik par(mfrow=c(b, k)) b=banyak baris k=banyak kolom Daftar Isi
(banyak layar)
2 Membuat diagram plot(x,y, type=’l/p/b’, l=line(grafik garis) p=point(grafik
(grafik pencaran= p, xlab="", ylab="", lty=0, titik) b=keduanya Judul
dan garis =l) ylim=c(,))
3 menambah garis lines(x, y, lty=, pch= angka numerik menunjukkan jenis
pada grafik yang ’numerik’) garis JJ J I II
sudah ada
4 menampah titik points(x, y, numerik/simbol menunjukkan jenis
pada grafik yang pch=’numerik/simbol’) titik Hal. 72 dari 245
sudah ada
4 memunculkan sumbu axis(1,outer=T,las=1) Nomor aksis 1=bawah 2=kiri,
3=atas, 4=kanan. Cari Halaman
5 menambat text text(x,y,"teks")
6 memberi legend legend(xpos, ypos, "label", lty=jenis garis, marks= jenis label
lty=1:m, marks=) titik, m=banyaknya label
Kembali
7 membuat grafik nor- qqnorm(data) dan qqline(data) dikerjakan berturutan untuk mem-
malitas data peroleh grafik titik dan garis
Layar Penuh

Tutup

Keluar
MIPA-Unej

Daftar Isi

Judul

JJ J I II

Hal. 73 dari 245

Cari Halaman

Kembali

Layar Penuh

Gambar 2.1: Lay Out Multi Grafik


Tutup

Keluar
MIPA-Unej

Tabel 2.6: Aneka Rupa Perintah-perintah R


Daftar Isi
No Tujuan Perintah R Keterangan
1 membaca tanpa membuka file source("namafile")
2 mengarahkan penulisan hasil ke file sink("nama file")
Judul
3 mencetak hasil (variabel) print(variabel)
4 mencetak text cat("teks")
5 mencetak garis baru cat("\n")
6 mendefinisikan variabel, konstanta nama <- definisi JJ J I II
atau fungsi (berfungsi sebagai ”=”
dalam matematika)
7 membaca tabel read.table("namatabel") Hal. 74 dari 245

8 mengambil bagian dari kesat- objek$bagian


uan(objek)
9 menulis komentar yang tidak diek- # komentar Cari Halaman
sekusi R
10 mengatur tugas mendasar kom- options()
puter Kembali

Layar Penuh

Tutup

Keluar
Mean Populasi dan Rata−rata Sampel

MIPA-Unej
50.6

Daftar Isi
50.4

Judul
50.2
Mean−Rata−rata

JJ J I II
50.0
49.8

Hal. 75 dari 245


49.6

Cari Halaman
49.4

Kembali
0 1000 2000 3000 4000 5000

Ukuran Sampel
Layar Penuh

Gambar 2.2: Ilustrasi mean populasi dan rata-rata sampel untuk Berbagai Ukuran Sampel.
Tutup

Keluar
Grafik Fungsi dan Turunannya
4

MIPA-Unej
3

Daftar Isi

Judul
2

JJ J I II
1
Y

Hal. 76 dari 245


0

Cari Halaman
−1

Kembali

Layar Penuh
−2

−2.0 −1.5 −1.0 −0.5 0.0 0.5 1.0 Tutup

X
Keluar

Gambar 2.3: Ilustrasi Maksimum/minimum dengan Newton Raphson


MIPA-Unej

Daftar Isi

Judul

JJ J I II

Hal. 77 dari 245

Cari Halaman

Kembali

Gambar 2.4: Penampilan Jendela Pembukaan Rgui untuk WIndows Layar Penuh

Tutup

Keluar
Tabel 2.7: Daftar Menu dan submenu utama Rgui
MIPA-Unej
Menu Submenu Fungsi
File
Source Code Menunjuk file skrip yang dijalankan
Daftar Isi
Display Menunjukkan isi file skrip
Change dir Mengubah direktori tempat menyimpan file
Save Menyimpan file
Judul
Print Mencetak file
Edit
Copy Menyimpan di memory
Paste Mengeluarkan dari memory JJ J I II
Clear console Membersihkan layar tampilan
GUI Preference Mengatur tampilan Gui
Misc Hal. 78 dari 245

Stop curren Menghentikan perhitungan


Buffer output Menentukan arah keluaran (file atau layar)
List object Mendaftar objek yang ada Cari Halaman
Packages
Load Mengaktifkan modul/paket
Install ... CRAN Menginstal paket dari internet Kembali
Install .. Zip Menginstall paket dari suatu direktori lokal
Help
Membaca beberapa dokumen bantu yang tersedia Layar Penuh

Tutup

Keluar
MIPA-Unej

Daftar Isi

Judul

JJ J I II

Hal. 79 dari 245

Cari Halaman

Kembali

Gambar 2.5: Tampilan Pilihan Menu File dan Menu Help Layar Penuh

Tutup

Keluar
MIPA-Unej

Daftar Isi

Gambar 2.6: Tampilan Menu Standar dan Tambahan SciView-R Judul

2.6.2. R-SciViews JJ J I II
R-SciView adalah salah satu graphical interface R yang tersedia di internet. Saat ini inter-
face ini masih dalam pengembangan, namun sudah dapat sangat memudahkan pengguna
Hal. 80 dari 245
R yang tidak biasa menggunakan command line. Console ( jendela utama memiliki tampi-
lan seperti pada Gambar 2.6. Tampilan menu dapat diatur melalui menu Misc. Sedangkan
untuk menginstall SciViews dapat dilakukan dengan mengikuti petunjuk yang ada pada Cari Halaman
paket tersebut.
Beberapa jendela tampilan tambahan dapat diatur melalui jendela command dan be-
berapa dock yang letak, besar dan isinya dapat diatur. Jendela Command dapat digunakan Kembali
untuk mengedit dan menjalankan program yang sedang ditulis. Jendela ini mempunyai
tampilan seperti pada Gambar 2.7. Letak dan ukuran Jendela Command ini dapat diatur
sesuai keinginan. Layar Penuh
Bentuk dasar jendela dock adalah seperti pada Gambar 2.8. Jendela ini sesungguhnya
memiliki banyak submenu yang masing-masing dapat dipilih menjadi tampilan utama
berbagai menu dock, misalnya Grafik, Comannder, Reference, Warna, Objek eksplorer. Tutup

Sampai saat ini maksimum dapat ditampilkan 5 Menu Dock.


Keluar
Secara keseluruhan menu-menu doc ini dapat diatur seperti pada Gambar 2.9. Pada
gambar tersebut terlihat ada 3 menu dock yang masing-masing berfungsi menampilkan
menu pilihan analisis (commander), menu tempat menyimpan cartatandan hasil serta
grafik (berfingsi sebagai Jendela Report). Detil dari menu Commander dapat dilihat pada
Gambar ??. Pada gambar ini terlihat beberapa analisis statistika yang dapat dipilih
serta tampilah hasil ketika dipilih data. Hasil menunjukkan berbagai macam data yang MIPA-Unej
tersimpan oleh R yang dapat dijadikan ilustrasi analisis statistika. Hasil yang sama dapat
diperoleh jika kita memberikan perintah berikut
>data() Daftar Isi

Sebagai ilustrasi pertama-tama kita harus memilih salah satu data yang ada selanjut-
nya kita lakukan beberapa analisis statistika sederhana. Jika kita ingin menggunakan menu Judul

SciView maka kita pilih pada salah satu jendela Doc menu Jendela Doc ==> R Commander menu ==> Data ==> Read.
Misalkan kita ingin meenggunakan data cars dari paket base. Menu yang bisa kita pilih
adalah package base dan data set cars seperti pada Gambar 2.11. JJ J I II

Hal. 81 dari 245

Cari Halaman

Kembali

Layar Penuh

Tutup

Keluar
MIPA-Unej

Daftar Isi

Judul

JJ J I II

Hal. 82 dari 245

Cari Halaman

Kembali

Gambar 2.7: Contoh tampilan Jendela Command (Script) Layar Penuh

Tutup

Keluar
MIPA-Unej

Daftar Isi

Judul

JJ J I II

Hal. 83 dari 245

Cari Halaman

Kembali

Gambar 2.8: Pilihan Menu yang dapat di atur pada Menu Dock Layar Penuh

Tutup

Keluar
MIPA-Unej

Daftar Isi

Judul

JJ J I II

Hal. 84 dari 245

Cari Halaman

Kembali

Gambar 2.9: Tampilan beberapa Jendela Dock Layar Penuh

Tutup

Keluar
MIPA-Unej

Daftar Isi

Judul

JJ J I II

Hal. 85 dari 245

Cari Halaman

Kembali

Gambar 2.10: Contoh Pemilihan Menu Data-List Dan Hasil Tampilan Data Layar Penuh

Tutup

Keluar
MIPA-Unej

Daftar Isi

Judul

JJ J I II

Hal. 86 dari 245

Cari Halaman

Kembali

Gambar 2.11: Memilih Data Cars dari Paket Base menggunakan Jendela Commander Layar Penuh

Tutup

Keluar
2.6.3. RComander
Berbeda dengan Rgui SciViews yang menunya terintegrasi dengan Rgui standar, Rgui
RComander membuka interface tersendiri. Untuk dapat menggunakan Rgui RCommander
kita harus menginstal library RCmdr dengan cara terlebih dahulu mendownload RCmdr.zip
selanjutnya menginstal library tersebut dalam R. Sesungguhnya saat manual ini dibuat MIPA-Unej
Rgui ini disiapkan untuk R versi 1.9.1 yang belum resmi diedarkan. Untuk mengaktifkan-
nya kita lakukan perintah
library(RCmdr) Daftar Isi
Dengan perintah di atas kita memperoleh Rgui seperti pada Gambar 2.12. Dari Rgui ini
kita dapat memilih mengedit data serta melakukan analisis data maupun grafik. Dengan
Rgui ini kita dimungkinkan mengedit data sebagaimana layaknya menggunakan worksheet Judul
seperti excel dan lain-lainnya. Rgui ini juga menyediakan informasi bantuan pada menu
help. Beberapa tampilan menu terkait dengan manipulasi data dapat dilihat pada Gambar
2.13, Gambar 2.14 dan Gambar 2.15. Menu utama dari Rgui ini dapat dimodifikasi sesuai JJ J I II
kemampuan dan keperluan (misalnya dijadikan bernahasa Indonesia seperti pada Gamber
2.13).
Hal. 87 dari 245

2.7. Library
Cari Halaman
Pada saat manual ini ditulis, di Laboratorium Statstika Jurusan Matematika FMIPA Unej
tersedia paket R dengan kelengkapan library seperti berikut ini.
Kembali
Packages in library ’C:/PROGRA~1/R/RW1090/library’:

abind Combine multi-dimensional arrays Layar Penuh


acepack ace() and avas() for selecting regression
transformations
agce analysis of growth curve experiments Tutup

Keluar
base The R Base Package
bayesmix Bayesian Mixture Models with JAGS
betareg Beta Regression.
Bhat General likelihood exploration
bindata Generation of Artificial Binary Data
boot Bootstrap R (S-Plus) Functions (Canty) MIPA-Unej
bootstrap Functions for the Book "An Introduction to the
Bootstrap"
car Companion to Applied Regression Daftar Isi

cat Analysis of categorical-variable datasets with


missing values
Judul
CGIwithR CGI Programming in R
class Functions for Classification
clim.pact Climate analysis and downscaling package for JJ J I II
monthly and daily data.
cluster Functions for clustering (by Rousseeuw et al.)
CoCoAn Constrained Correspondence Analysis Hal. 88 dari 245
coda Output analysis and diagnostics for MCMC
ctest Defunct Package for Classical Tests
DAAG Data Analysis And Graphics Cari Halaman
Design Design Package
dispmod Dispersion models.
dr Methods for dimension reduction for regression Kembali
dynamicGraph dynamicGraph
eda Defunct Package for Exploratory Data Analysis
Layar Penuh
effects Effect Displays for Linear and Generalized
Linear Models
exactLoglinTest Monte Carlo Exact Tests for Log-linear models
Tutup
fOptions Financial Software Collection - fOptions

Keluar
foreign Read data stored by Minitab, S, SAS, SPSS,
Stata, ...
fSeries Financial Software Collection - fSeries
gee Generalized Estimation Equation solver
geepack Generalized Estimating Equation Package
geoRglm geoRglm - a package for generalised linear MIPA-Unej
spatial models
gllm Generalised log-linear model
glmmML Generalized linear models with random Daftar Isi

intercept
gnlm Generalized Nonlinear Regression Models
Judul
graphics The R Graphics Package
grid The Grid Graphics Package
gstat multivariable geostatistical modelling, JJ J I II
prediction and simulation
hett Heteroscedastic t regression
ISwR Introductory Statistics with R Hal. 89 dari 245
KernSmooth Functions for kernel smoothing for Wand &
Jones (1995)
lattice Lattice Graphics Cari Halaman
linprog Linear Programming / Optimization
lme4 Linear mixed-effects models using S4 classes
lmm Linear mixed models Kembali
lmtest Testing Linear Regression Models
lqs Resistant Regression and Covariance Estimation
Layar Penuh
MASS Main Package of Venables and Ripley’s MASS
mathgraph Directed and undirected graphs
Matrix A Matrix package for R
Tutup
mclust Model-based cluster analysis

Keluar
MCMCpack Markov chain Monte Carlo (MCMC) Package
methods Formal Methods and Classes
mgcv Multiple smoothing parameter estimation and
GAMs by GCV
mle Defunct package for maximum likelihood
estimation MIPA-Unej
modreg Defunct Package for Modern Regression:
Smoothing and Local Methods
multcomp Multiple Tests and Simultaneous Confidence Daftar Isi

Intervals
multiv Multivariate Data Analysis Routines
Judul
mva Defunct Package for Classical Multivariate
Analysis
mvnormtest Normality test for multivariate variables JJ J I II
mvtnorm Multivariate Normal and T Distribution
ncomplete ncomplete
nlme Linear and nonlinear mixed effects models Hal. 90 dari 245
nlmeODE Non-linear mixed-effects modelling in nlme
using differential equations
nls Defunct Package for Nonlinear Regression Cari Halaman
nnet Feed-forward Neural Networks and Multinomial
Log-Linear Models
nortest Tests for Normality Kembali
psy Various procedures used in psychometry
qcc Quality Control Charts
Layar Penuh
R2HTML HTML exportation for R objects
Rcmdr R Commander
regress Fitting Gaussian Linear Models where the
Tutup
Covariance Structure is a Linear Combination

Keluar
of Known Matrices by Maximising the Residual
Log Likelihood
relimp Relative Contribution of Effects in a
Regression Model
repeated Non-normal Repeated Measurements Models
rgl 3D visualization device system (OpenGL) MIPA-Unej
rpart Recursive Partitioning
scatterplot3d 3D Scatter Plot
SciViews A GUI (Graphical User Interface) for R Daftar Isi

sem Structural Equation Models


spatial Functions for Kriging and Point Pattern
Judul
Analysis
splines Regression Spline Functions and Classes
statmod Statistical Modeling JJ J I II
stats The R Stats Package
stats4 Statistical functions using S4 classes
stepfun Defunct Package for Step Functions, incl. Hal. 91 dari 245
Empirical Distributions
SuppDists Supplementary distributions
survival Survival analysis, including penalised Cari Halaman
likelihood.
survrec Survival analysis for recurrent event data
svRcmdr R Commander (SciViews version) Kembali
tcltk Tcl/Tk Interface
tools Tools for Package Development
Layar Penuh
tree Classification and regression trees
ts Defunct Package of Time Series Functions
utils The R Utils Package
Tutup
waveslim Basic wavelet routines for one-, two- and

Keluar
three-dimensional signal processing
wavethresh Software to perform wavelet statistics and
transforms.
xtable Export tables to LaTeX or HTML

MIPA-Unej

Daftar Isi

Judul

JJ J I II

Hal. 92 dari 245

Cari Halaman

Kembali

Layar Penuh

Tutup

Keluar
MIPA-Unej

Daftar Isi

Judul

JJ J I II

Hal. 93 dari 245

Cari Halaman

Kembali

Layar Penuh
Gambar 2.12: Tampilan Menu RComander B

Tutup

Keluar
MIPA-Unej

Daftar Isi

Judul

JJ J I II

Hal. 94 dari 245

Cari Halaman

Kembali

Layar Penuh
Gambar 2.13: Tampilan Menu Comander Berbahasa Indonesia

Tutup

Keluar
MIPA-Unej

Daftar Isi

Judul

JJ J I II

Hal. 95 dari 245

Cari Halaman

Kembali

Layar Penuh
Gambar 2.14: Tampilan Menu RComander

Tutup

Keluar
MIPA-Unej

Daftar Isi

Judul

JJ J I II

Hal. 96 dari 245

Cari Halaman

Kembali

Gambar 2.15: Tampilan Menu RComander Layar Penuh

Tutup

Keluar
2.8. Bacaan Lebih Lanjut
Secara umum semua hal yang berkaitan dengan R dapat dilihat pada situs Projek R,
misalnya pengembangan R untuk Geostatistika, pengembangan GUI untuk R dan lain-
lain.
Untuk mendukung para pengguna R, Tim Pengembang R menyediakan dokumen- MIPA-Unej
tasi elektronik yang disertakan didalam paket program R. Dokumentasi ini dapat diakses
melalui menu help (lihat Gambar 2.16) dan bisa dilihat dalam format pdf yang baik untuk
keperluan dicetak, maupun format html(lihat Gambar 2.17 yang lebih enak dibaca karena Daftar Isi
interaktif dan mudah mencari silang rujuk topik-topik terkait. Dokumentasi ini dapat
dicetak atau dibaca setiap saat sesuai keperluan. Untuk mengaktifkan Menu HTML maka
kita dapat menulis Judul

>help.start()
JJ J I II
Beberapa dokumentasi dalam bentuk pdf maupun html yang ikut serta dalam paket
R (merupakan hasil karya Tim Pengembang R) diantaranya adalah
Hal. 97 dari 245
1. An Introduction to R [30] berisi pengantar bagi pengguna pemula R
2. Reference Manual [33] berisi informasi tentang kemampuan R secara keseluruhan
Cari Halaman

3. Data Import/Export [29] berisi informasi bagaimana menggunakan data dari format
lain misalnya Minitab, SPSS SAS)
Kembali
4. R Language Manual [32] bermanfaat bagi yang ingin menulis program dalam R
5. Writing R Extension [34] diperuntukkan bagi yang ingin membuat paket/ modul/ Layar Penuh
library dalam R
6. R Installatiaon and Administration [31] berisi informasi cara memperoleh dan men- Tutup
ginstal paket R untuk berbagai flatform.

Keluar
Selain itu beberapa tulisan/dokumen juga disediakan dalam bentuk pdf dan dibuat oleh
orang-orang secara individu/ kelompok di luar Tim Pengembang R juga dapat diperoleh
melalui situs http://www.r-project.org diantaranya yang bersifat umum dan men-
dasar yang lebih menekannkan penguasaan R dari pada aplikasi statistikanya. Diantara
tulisan-tulisan tersebut adalah :
MIPA-Unej
1. Burns P[4]. Guide for Unwilling S Users berisi pengantar bagi pengguna pemula
bahasa S baik yang bersifat komersial S-Plus maupun yang gratis R
Daftar Isi
2. Paradis E. 2002 [10]. R For Beginner.
3. Wang KK. 2002. R for Windows Users.
Judul
Sedangkan dokumen yang sudah bersifat khusus dan lanjut pada bidang tertentu yang
juga dapat didapat dari internet pada situs Projek-R. Kebanyakan pembahasannya memer-
lukan pengetahuanstatistika yang memadai JJ J I II

1. Baron J & Y Li.2003[39]. Notes on the Use of R for Psychology Experiment and
Questionaire. membahas aplikasi R pada bidang psikologi dan analisis data berasal Hal. 98 dari 245
dari questionare
2. Faraway JJ. 2002.[11] Practical Regression and Anova Using R membahas secara Cari Halaman
komprehensif aplikasi R untuk regresi dan anova.
3. Maindonald. J.H. 2001.[20] Using R for Data Analysis and Graphics An Introduction Kembali
membahas eksplorasi R, khususnya kemampuan grafiknya untuk berbagai ilustrasi
analisis statistika dari tradisional sampai modern
Layar Penuh
4. Vezalini J. 2002.[37] Using R for Introductory Statistics membahas analisis statistika
tradisional yang banyak dipakai diberbagai bidang
Tutup
Disamping itu ada beberapa aplikasi dalam bidang Statistika yang tersedia di Perpus-
takaan Pusat Analisis Statistika dan Komputasi FMIPA Universitas Jember dan Pedoman
Keluar
untuk Paket S-Plus yang dapat dipergunakan untuk R. Diantara buku ini adalah buku
teks yang ditulis oleh Venables dan Ripley [36] dan Kumpulan tulisan yang dihimpun oleh
Chamber dan Hastie [5].

MIPA-Unej

Daftar Isi

Judul

JJ J I II

Hal. 99 dari 245

Cari Halaman

Kembali

Layar Penuh

Tutup

Keluar
MIPA-Unej

Daftar Isi

Judul

JJ J I II

Hal. 100 dari 245

Cari Halaman

Kembali

Gambar 2.16: Dokumentasi bantuan yang tersedia pada R Layar Penuh

Tutup

Keluar
MIPA-Unej

Daftar Isi

Judul

JJ J I II

Hal. 101 dari 245

Cari Halaman

Kembali

Gambar 2.17: Dokumentasi bantuan yang tersedia pada R Layar Penuh

Tutup

Keluar
MIPA-Unej

Bab 3
Daftar Isi

Memperoleh dan Menginstal R Judul

JJ J I II

3.1. Apa itu R?


Hal. 102 dari 245
R adalah salah satu paket analisis data, yang merupakan paket open source yang dapat
diperoleh secara cuma-cuma pada situs http://www.r-project.org/ Sebenarnya R adalah
paket pemrograman yang struktur bahasanya sangat mirip dengan S (bahasa S), maupun Cari Halaman
SPlus hanya saja paket ini lebih bersifat command line dari pada menu driven. Paket
program R ini sudah dilengkapi banyak kemampuan internal untuk menganalisis data
maupun menampilkan grafik sehingga R bisa dikatagorikan sebagai paket pengolahan data Kembali

(paket statistika). Selain itu telah pula dikembangkan modul khusus untuk metode anali-
sis tertentu oleh banyak orang yang disebut library. Dewasa ini R populer dipergunakan
Layar Penuh
baik dibidang akademik maupun industri. R mempunyai kemampuan yang hampir sama
dengan SPlus kecuali dari segi kemudahan penggunaannnya. Untuk memudahkan peng-
guna R yang biasa menggunakan menu dibanding command line, beberapa kelompok
Tutup
peneliti telah mengembangkan interface (Rconsole) diantaranya yang perbah penulis coba

Keluar
adalah WinEdt dan SciViews. Beberapa kemampuan menonjol dari R yang menjadi alasan
banyak statistisi (Faraway [?]) memilihnya sebagai paket aplikasi diantaranya adalah:
1. ada koleksi program analisis data yang sangat luas seperti statistika deskriptif, re-
gresi, pemodelan statistika (baik linear maupun non linear), anova dan multivariat;
MIPA-Unej
2. kemampuan pemrograman (bahasa S) yang dapat dikembangkan secara fleksibel
untuk kepentingan khusus yang lebih lanjut;
3. variasi penampilan grafiknya sangat banyak dan berkualitas tinggi baik penampilan Daftar Isi

di layar monitor maupun dalam bentuk cetak diatas kertas.


4. R termasuk pemrograman yang beroientasi pada objek (object oriented program- Judul
ming). Semua hasil, baik berupa variabel, konstanta maupun fungsi, oleh R disim-
pan dalam bentuk objek. Keuntungannya adalah apabila apa yang telah dikerjakan
R saat ini dikemudian hari diperlukan, maka R dapat mengambilnya tanpa harus JJ J I II
melakukan perhitungan ulang dari awal. Dengan demikian proses menjadi lebih
cepat dan lebih hemat memori. Dalam mencari objek yang diperlukan, mula-mula
Hal. 103 dari 245
R akan melihat daftar objek yang masih ada di memori, apabila tidak ditemukan,
maka R akan melanjutkan pencariannya ke hardisk yang semuanya dilakukan secara
otomatis tanpa dirasakan oleh penggunanya. Cari Halaman

5. R juga termasuk bahasa terinterpretasi/ interpreted, bukan terkompilasi/ compilled.


Dalam bahasa terinterpretasi setiap ekspresi /perintah tunggal dievaluasi dan diek-
Kembali
sekusi dengan segera. Sedangkan dalam bahasa kompilasi (C dan Fortran misalnya),
maka keseluruhan program harus dikompilasi oleh sebuah kompiler yang mener-
jemahkan bahasa C atau Fortran tadi ke dalam bahasa mesin. Keunggulan bahasa Layar Penuh
interpretasi ini adalah flreksibilitasnya untuk dikembangkan secara bertahap, sedan-
gkan kelemahannya dia memerlukan lebih banyak memori. Nasmun dengan kema-
juan perangkat keras komputer, memori dan kecepatan proses tidak lagi merupakan Tutup
masalah yang serius.

Keluar
6. R berbasis S yang merupakan dasar dari paket komersial S-Plus. Ini berarti (dan
pengalaman menunjukkan) kedua bahasa tersebut sangat kompatibel. Hampir se-
mua skrip yang dihasilkan dengan program R akan dapat dijalankan pada paket
S-Plus. Berarti pula sebagian besar petunjuk katau manual pemrograman untuk
SPlus dapat dipergunakan sebagai panduan untuk R.
MIPA-Unej
7. R adalah program open source yang tersedia secara cuma-cuma dan multiplatform
(tersedia pada sistim operasi Windows, Unix dan Linux). Sebagai open source R
didukung oleh banyak ahli statistika di seluruh dunia dan kita dapat menggunakan- Daftar Isi
nya tanpa perlu mengeluarkan biaya banyak maupun melakukan pelanggaran berupa
pembajakan. Semua dapat diperoleh secara resmi melalui Situs Projek-R
Judul

3.2. Memperoleh Paket R


JJ J I II
Pada dasarnya paket R dapat diperoleh pada situs http://www.r-project.org/, kita dapat
mengambil paket yang sesuai kebutuhan dan sistim yang kita miliki. Secara umum ada
tida macam jenis paket yang ada yaitu. Hal. 104 dari 245

1. Paket lengkap untuk windows dalam ukuran CD yang merupakan satu file beruku-
ran besar.Paket ini cocok bagi yang komputerya memiliki CD ROM Cari Halaman

2. Paket Mini untuk window yang diurai menjadi beberapa file seukuran disket. Paket
ini cocok bagi yang komputernya hanya memiliki floppy drive. Kembali

3. Paket Linux/unix paket ini disediakan bagimereka yang menggunakan sistim op-
erasi selain windows khususnya Linux. Scara khussu juga disediakan untuk berbagai
Layar Penuh
versi linux seperti Mandrake Shuse dan Debian.
Selain memperoleh paket utama R yang telah dilengkapi dengan kemampuan analisis data
Tutup
secara umum, kita juga dapat melengkapi R dengan beberapa kemampuan diantaranya

Keluar
1. Kemampuan analisis khusus dalam bentuk library. Berbagai macam library juga
tersedia pada situs R. Bagi yang menggunakan sistim operasi windows dapat mengam-
bil file dalam bentuk zip sedangkan bagi pengguna linux dapat mengambil source
code aslinya.
2. Dokumentasi untuk R yang disimpan dalam bentuk file pdf baik yang membahas MIPA-Unej
R secara umum sebagai pengantar penggunaan R, maupun dalam bentuk aplikasi
pada topik atau bidang tertentu.
Daftar Isi

3.3. Memperoleh Paket RGui Editor


Judul
Selain paket R bebserta librarynya, bagi yang ingin menggunakan menu yang lebih lengkap,
dapat memilih berbagai paket GUI. Salah satu diantaranya yang dapat dipergunakan
dengan bebas sepenuhnya adalah SciViews yang alamatnya dapat ditelusuri dari situs JJ J I II
R. Paket ini dapat dipergunakan secara bebas tanpa ada biaya registrasi. Paket lain yang
juga cukup baik tetapi perlu biaya registrasi diantaranya adalah WinEdt. Bagi pengguna
sistim operasi Linux dapat menggunakan editor Emacs dengan templit ESS (Emacs Speaks Hal. 105 dari 245
Statistics yang juga dapat dicari pada situs projek R.

Cari Halaman
3.4. Menginstal R dan SciViews
Program pertama yang harus diinstall adalah R, lalu dilanjutkan dengan instalasi SciViews. Kembali
Bagi pengguna sistim operasi windows dapat dilakukan dengan meng-klik file rw1090.exe
melalui windows explorer. Sedangkan untuk pengguna linux dapat melalukan hal serupa
pada file rpm. Bagi pengguna windows, jika instalasi sukses maka pada desktop akan Layar Penuh
muncul logo R dengan nama R.1.9.0. Program R selanjutnya dapat dibuka melalalui icon
ini.
Tutup
Bagi pengguna windows, setalah R terinstal dengan baik, selanjutnya dapat dilan-
jutkan dengan menginstal SciViews dengan mmengklik file SciViews....Setup. Program
Keluar
setup ini akan secara automatis mengkonfigurasi R. Jika sukses pada desktop akan muncul
logo yang lain dari R dengan nama SciViews RConsole. Icon ini bisa diklik jika ingin
menggunakan R dengan GUI SciViews. Untuk memanfaatkan GUI ini dalam R harus
terinstal paket/library komaner untu R yang disebut svRCmdr yang dibawa dalam paket
SciViews.
MIPA-Unej

3.5. Menambah Library R


Daftar Isi
Untuk menambah library R, ada beberapa langkah yang harus ditempun diantaranya:
1. ambil (download file zip dari libabry yang kita inginkan dan dikumpulkan dalam Judul
suatu direktori;
2. jalankan R dan pilih menu Packages.
JJ J I II
3. pilih submenu install packages from local zip files seperti pada Gambar
3.1;
Hal. 106 dari 245
4. pilih salah satu persatu atau sekaligus library yang diinginkan

Cari Halaman

Kembali

Layar Penuh

Tutup

Keluar
MIPA-Unej

Daftar Isi

Judul

JJ J I II

Hal. 107 dari 245

Cari Halaman

Kembali

Layar Penuh

Gambar 3.1: Menambah Library


Tutup

Keluar
MIPA-Unej

Bab 4
Daftar Isi

Analisis Data dan Grafik dengan R Judul

JJ J I II

4.1. Meyiapkan Data


Hal. 108 dari 245
Untuk mengilustrasikan suatu analisis statistika, diperlukan data yang memadai. Untuk
kepentingan ilustrasi data dapat berupa data riil maupun data bangkitan.
Cari Halaman

4.1.1. Memanggil Data dari Database R


Data riil yang telah ada pada R dapat dipanggil dengan perintah Kembali

data()
Layar Penuh
Selanjutnya R akan memberi informasi seluruh data yang telah ada pada databese R
beserta library yang memuat data tersebut. Berikut adalah beberapa data yang ada pada
library stats. Tutup

Keluar
Data Deskripsi

...
AirPassengers Monthly Airline Passenger Numbers 1949-1960
BJsales Sales Data with Leading Indicator MIPA-Unej
BOD Biochemical Oxygen Demand
CO2 Carbon Dioxide uptake in grass plants
ChickWeight Weight versus age of chicks on different diets Daftar Isi
DNase Elisa assay of DNase
EuStockMarkets Daily Closing Prices of Major European Stock Indices, 1991-1998
Judul
Harman23.cor Harman Example 2.3
Harman74.cor Harman Example 7.4
Indometh Pharmacokinetics of Indomethicin
JJ J I II
JohnsonJohnson Quarterly Earnings per Johnson & Johnson Share
LakeHuron Level of Lake Huron 1875-1972
Loblolly Growth of Loblolly pine trees Hal. 109 dari 245
Nile Flow of the River Nile
Orange Growth of orange trees
... Cari Halaman

Selanjutnya jika kita ingin memanggil salah satu data maka yang perlu dilakukan
adalah mengkatifkan library dan datanya, secara berturutan. Kembali

library(NamaLibrary)
data(Namadata)
Layar Penuh

4.1.2. Membangkitkan Data Simulasi


Tutup
Dalam hal memahami konsep-konsep statistika, terutama yang terkait dengan distribusi
peluang, penggunaan data simulasi memiliki beberapa keunggulan dibanding data riil.
Keluar
Dengan simulasi kita dapat membangkitkan data dengan distribusi dan parameter sesuai
yang dibutuhkan. Ada beberapa kelebihan Jika kita ingin membangkitkan data dari den-
gan simulasi, maka perlu ditetapkan jenis distribusi yang dipilih (lihat Tabel 2.4 halaman
65). Misalkan kita ingin membangkitan data berukuran 100 berdistribusi gamma standar
(α = 5), maka perintahnya adalah
MIPA-Unej
data.sim <-rgamma(100,5,1)

Daftar Isi
Selanjutnya data yang disimpan dengan nama data.sim dapat dianalisis atau dieksplo-
rasi seperti halnya data lainnya.
Judul
4.1.3. Mengimport data dari file
Misalkan kita telah memiliki data yang disimpan dengan program lain seperti Minitab, JJ J I II
Excell dan lian-lain. Untuk dapat menggunakan data tersebut maka kita perlu melakukan
langkah-langkah berikut.
Hal. 110 dari 245
1. Buka data dengan program aslinya (Minitab, Excell) lalu simpan/eksport data dalam
bentuk plain/ascii tex biasanya dengan ekstensi txt. Selanjutnya dibuka dengan
perintah read.table Cari Halaman

read.table(Namafile, header = FALSE, sep = "", quote = "\"’",


dec= ".",...) Kembali

header = True jika baris pertama file merupakan judul kolom. Untuk tanda desimal
bisa menggunakan titik atau koma sesuai kondisi data yang dimiliki. Layar Penuh

2. Bagi yang menggunakan GUI SciViews dapat memilih melakukannya dengan meng-
gunakan menu R Commander dengan memilih submenu data. Pilihan jenis data terse- Tutup
dia diantaranya dari Minitab SPSS dan dalam bentuk teks.

Keluar
4.2. Explorasi Data
R menyediakan beberapa fungsi untuk mengeksplorasi data mulai dari informasi ringkasan
(min, maks, kuanti) sampai eksplorasi melalui grafis. Beberapa perintah R yang berman-
faat untuk eksplorasi data diantaranya adalah
MIPA-Unej

Tabel 4.1: Tabel Fungsi eksplorasi data


Daftar Isi

Fungsi Library Data Deskripsi


print() RPackages uni/multivariat mencetak data secara keseluruhan Judul
summary() univariat memperoleh ringkasan data
hist() mencetak histogram data
stem() graphics stem & leaf plot (mode teks) JJ J I II
density() menggambar sebaran data
qqnorm() memeriksa normalitas data
qqline() menambah garis lurus pada diagram qq Hal. 111 dari 245
boxplot() menggambar quantil data
dotchart() RPackages multivariat histogram berganda
coplot() grahics menggambar sebaran data dengan kondisi Cari Halaman

variabel tertentu
xyplot() lattice menggambar sebaran pasangan data
Kembali
pair() graphics menggambar pasangan sebaran data
plot() RPackages mengambar sebaran data dengan 2 peubah
biplot() stats multivariat biplot multivariat data Layar Penuh
hclust() analisis klaster hirarkis
manova() multivariat analisis anova untuk data multivariat
Tutup

Keluar
4.2.1. Deskripsi Data
Deskripsi data yang meliputi min, max, mean dan median data dapat dieksplorasi den-
gan perintah summary(data). Sedangkan cetakan lengkap data dapat diperoleh melalui
perintah print(data).
library(stats) MIPA-Unej

data(ChickWeight)
summary(ChickWeight)
Daftar Isi
weight Time Chick Diet
Min. : 35.0 Min. : 0.00 13 : 12 1:220
1st Qu.: 63.0 1st Qu.: 4.00 9 : 12 2:120 Judul
Median :103.0 Median :10.00 20 : 12 3:120
Mean :121.8 Mean :10.72 10 : 12 4:118
3rd Qu.:163.8 3rd Qu.:16.00 17 : 12 JJ J I II
Max. :373.0 Max. :21.00 19 : 12
(Other):506
Hal. 112 dari 245
Sedangkan cetakan lengkap datanya adalah
weight Time Chick Diet
Cari Halaman

1 42 0 1 1
2 51 2 1 1
Kembali
3 59 4 1 1
4 64 6 1 1
5 76 8 1 1 Layar Penuh
6 93 10 1 1
7 106 12 1 1
8 125 14 1 1 Tutup
9 149 16 1 1

Keluar
....

576 234 18 50 4
577 264 20 50 4
578 264 21 50 4 MIPA-Unej

4.2.2. Plotting Data Daftar Isi

Langkah selanjutnya kita dapat memeriksa distribusi data tersebut apakah sangat menyim-
pang atau mengikuti distribusi normal dengan menggunakan grafik/plotting data seperti Judul
histogram, qqnorm, dan diagram densitas. Data normal akan memiliki densitas yang re-
latif simetrik dan diagram qq yang relatif mengikuti garis lurus (lihat Gambar 4.1). Untuk
data yang tidak normal diantaranya ditunjukkan oleh ketidaksimetrisan yang mencolok JJ J I II
serta diagram qq yang tidak mengikuti garis lurus (lihat Gambar 4.2).
Hal. 113 dari 245

Cari Halaman

Kembali

Layar Penuh

Tutup

Keluar
MIPA-Unej

Daftar Isi

Judul

JJ J I II

Hal. 114 dari 245

Cari Halaman

Kembali

Gambar 4.1: Denstias dan QQ Norm Data Normal. Grafik menunjukkan data-data cukup
simetris Layar Penuh

Tutup

Keluar
MIPA-Unej

Daftar Isi

Judul

JJ J I II

Hal. 115 dari 245

Cari Halaman

Kembali

Gambar 4.2: Denstias dan QQ Norm Data tidak Normal. Grafik menunjukkan data-data
tidak cukup simetris Layar Penuh

Tutup

Keluar
Contoh 4.1. Untuk contoh riil, misalkan dari data “Chicken Weight” kita ingin memeriksa
distribusi beratnya ayam. Grafik histogram, qqnorm dan densitas dari data tersebut dapat
dilihat pada Gambar 4.3. Gambar menunjukkan bahwa data berat tidak cukup simetris
untuk memenuhi asumsi distribusi normal.

par(mfrow=c(2,2)) MIPA-Unej

hist(ChickWeight$weight)
qqnorm(ChickWeight$weight)
Daftar Isi
plot(density(ChickWeight$weight),type=’l’)
plot(density(ChickWeight$weight),type=’p’)
Judul

4.2.3. Plotting Data Multivariat


JJ J I II
Untuk data multivariat misalnya data yang terdiri dari tiga peubah acak (X, Y, Z) yang
masing-masing terdiri atas tiga subpopulasi (P1 , P2 , P3 ). Maka sebelum melakukan analisis
lebih jauh ada beberapa pertanyaan mendasar yang dapat dieksplorasi melalui grafik, Hal. 116 dari 245
diantaranya:
1. Adakah hubungan (korelasi antara ketiga variabel? Cari Halaman

2. Apakah hubungan antara variabel bergantung subpopulasii atau sama untuk seluruh
populasi?
Kembali
Gambaran informasi data seperti diatas dapat diakses melalui grafik trellis yaitu den-
gan perintah xyplot(), coplot() atau dengan pair(). Untuk memahami penggunaan
coplot dan pair kita ambil data Orange yang merupakan data ukuran keliling jeruk dan Layar Penuh

usianya untuk 5 macam jenis pohon jeruk. Dari Gambar 4.4 dan Gambar 4.5 terlihat
bahwa kelima jenis pohon memiliki hubungan yang identik antara ukuran lingkaran jeruk
Tutup
dengan usianya. Dalam konteks regresi, seluruh data dapat diwakili oleh 1 garis regresi.

Keluar
Ilustrasi selanjutnya berdasar dari data simulasi. Keuntungan dengan menggunakan
data simulasi adalah kita dapat mengatur kondisi data sesuai yang diperlukan. Sebagai
ilustasi lebih lanjut kita simulasikan data X = (X1 , X2 , X3 ) yang masing-masing terdiri
atas tiga subpopulasi dengan ukuran sampel tiap subpopulasi adalah 20. Data simulasi
tersebut disimpan dengan nama data.xyz. Grafik ditunjukkan oleh Gambar 4.6. Dalam
kondisi ini garis regresi antara masing-masing subpopulasi harus dibedakan dan tidak bisa MIPA-Unej
digabungkan.
Informasi tentang kondisi data dapayt memberikan gambaran intuitif tentang pilihan-
pilihan alternatif analisis statistika yang dapat dipergunakan untuk menganalisis data yang Daftar Isi

dihadapi. Grafik pair() dapat dipergunakan untuk memperolleh gambaran ada tidaknya
multi kolinieritas antara peubah-peuban bebas dalam analisis regresi. Grafik yang sama
Judul
juga dapat memberi gambaran perlu tidaknya kita mempertimbangkan interaksi dalam
model.
>print(data.xyz) JJ J I II

X1 X2 X3 P
1 46.77252 96.58832 -43.72924 1 Hal. 117 dari 245
2 49.81407 102.65426 -46.78794 1
3 54.81830 112.49866 -51.95623 1
4 47.84926 98.62004 -44.92774 1 Cari Halaman
5 49.51091 101.97553 -46.55721 1
6 46.45213 95.88346 -43.47293 1
Kembali

...
Layar Penuh
53 55.56764 25.92603 -40.75514 3
54 58.12202 25.07581 -44.67061 3
55 51.82525 23.02011 -39.17019 3 Tutup
56 47.07990 23.36924 -33.12664 3
57 50.55971 23.13793 -37.53371 3
Keluar
58 56.43348 25.56385 -42.15632 3
59 54.69274 25.37066 -40.26062 3
60 60.84081 24.97322 -48.03575 3

MIPA-Unej

4.3. Analsis Data


Daftar Isi
Beberapa fungsi untuk analisis data yang umum banyak diperoleh pada library stats
untuk analisis data univariat dan library multiv dan mva untuk analisis multivariat. Be-
berapa fungsi pada library tersebut diantaranya adalah sebagai berikut Judul

Fungsi Library Data Deskripsi JJ J I II


t.test() stats Normal (sampel Uji beda mean dua populasi
kecil < 30
aov() stats Normal Uji beda mean tiga atau lebih populasi Hal. 118 dari 245
bartlett.test() Uji homogenitas varians

Disamping itu ada beberapa paket atau library yang lebih spesifik menyediakan analisis Cari Halaman
statistika untuk keperluan tertentu seperti regresi, pengukuran berulang, klaster dan lain-
lain. Daftar lengkap paket/‘library yang tersedia pada distribusi R yang ada dapat diliat
pada akhir bab ini. Kembali

4.4. Pemilihan Model Layar Penuh

Dengan tersedianya alat bantu komputer beserta paket program untuk analisis statis-
tika, maka pekerjaan seorang statistisi/statistikawan atau analis data, seyogyanya bergeser Tutup
tidak sekedar trampil mengimplementasikan suatu analisis tertentu, tetapi lebih banyak

Keluar
melakukan eksplorasi beberapa model dan teknik analisis dan memilih model yang mem-
berikan informasi terbaik.
Salah satu perkembangan pesat yang terjadi dalam bidang statistika adalah analisis
regresi atau model linier. Model ini telah mengalami perkembangan penting diantaranya
adalah (lihat Bab 1 bagian buku ini)
MIPA-Unej
1. Model linier klasik dengan asumsi bahwa data respon adalah nberdistribusi nor-
mal dan saling bebas dengan varians konstan. Dalam R metode ini diimplemen-
tasikan dalam fungsi lm(). Walaupun data respon diasumsikan normal saling bebas, Daftar Isi
namun banyak studi dan variasi dapat dilakukan pada peubah bebasnya. Apakah
peubah-peubah bebasnya mengandung multi kolinieritas? Apakah mengandung
peubah kualitatif? Apakah mengandung heteroskedastisitas (varian tidak konstan)? Judul
dan sebagainya Aplikasi R untuk diagnostik berbagai persoalan regresi/model linier
klasik (juga analisis varians) dapat dilihat pada Faraway [11]. Sedangkan pemba-
hasan komprehensip teori yang membahas hal ini dapat dilihat pada Neter et al. JJ J I II
[25] dan Bowerman et al.[3].
2. Model Liner Tercampur dengan asumsi bahwa respon berdistribusi normal tetapi Hal. 119 dari 245
tidak harus saling bebas. Data ini banyak diperoleh dari hasil pengukuran berulang
maupun populasi yang mengandung klaster. Ada beberapa fungsi penting untuk
Cari Halaman
menghandel data seperti ini yaitu
• lme(), lmm() dan regress() untuk data berasal dari populasi mengandung
kluster atau efek acak dan dengan model linier. Kembali

• nlme() untuk model tercampur nonlinier. repeated() untuk data berasal dari
pengukuran berulang. Referensi yang bisa dijadikan acuan untuk mempelajari Layar Penuh
model linier tercampur ini diantaranya adalah Bab 4 dari Davidian dan Giltinan
[7], Diggle et al. [8], Laird dan Ware [16]. Sedangkan untuk model yang lebih
umum yaitu termasuk model-model non-linier dapat dilihat pada Davidian dan Tutup
Giltinan [7]

Keluar
3. Model Linier Tergeneralisasi (MLT/GLM) dengan asumsi data respon saling
bebas tetapi tidak mesti berdistribusi normal. Fungsi penting R untuk menangani
data seperti ini adalah glm(), termasuk didalamnya adalah model logit, progit,
log-linier. Referensi utama model linier tergeneralisasi ini adalah Generalized Lin-
ear Models oleh McCullagh dan Nelder [21], sedangkan sebagai pemula dapat meng-
gunakan pengantar yang ditulis oleh Dobson [9]. MIPA-Unej

4. Model Linier Tergeneralisasi Tercampur (GLMM) yang mengasumsikan data


respon tidak saja tidak harus normal tetapi juga tidak harus saling bebas. Karena Daftar Isi
kompleksnya model, metode ini banyak menggunakan pendekatan Monte Carlo. Lin-
brary dan fungsi R untuk menangani data ini diantaranya adalah (glmmML().
Judul
5. Generalized Estimating Equation (GEE) yang mengasumsikan sama dengan
GLMM, tetapi menggunakan pendekatan quasi likelihood tanpa menggunakan likeli-
hood penuh, dan hanya menggunakan informasi tentang mean dan varians-kovarians JJ J I II
metode ini dapat diakses dengan fungsi gee() dan beberapa fungsi dari paker
geepack. Referensi teori yang cukup komprehensip membahas GEE diantaranya
adalah Diggle et al. [8]. Hal. 120 dari 245

Pemilihan model yang sesuai dapat dilakukan dengan melakukan uji anova dari berba-
gai model yang dicoba atau dengan cara menghitung koefisien AIC (Akaike’s Information Cari Halaman
Criteria) yang tersedia pada R. Untuk mempelajari Analisis statistika modern serta ap-
likasinya pada R (atau SPlus) dapat dirujuk Venables & Ripley [36] dengan library R yang
disebut MASS yang sesungguhnya merupakan judul bukunya yaitu Modern Applied Statis- Kembali
tics using SPlus. Sebagaimana telah disebutkan bahwa R merupakan satu famili bahasa
dengan SPlus dan hampir semua library yang berlaku untuk SPlus dapat diaplikasikan
Layar Penuh
pada R dengan sedikit atau tanpa sama sekali modifikasi.

Tutup

Keluar
MIPA-Unej

Daftar Isi

Judul

JJ J I II

Hal. 121 dari 245

Cari Halaman

Kembali

Gambar 4.3: Histogram dan Denstias Berat Ayam. Grafik menunjukkan data tidak cukup
simetris Layar Penuh

Tutup

Keluar
MIPA-Unej

Daftar Isi

Judul

JJ J I II

Hal. 122 dari 245

Cari Halaman

Kembali

Gambar 4.4: Diagram Data Multivariat yang menunjukkan bahwa populasi relatif tidak
homogen dan hubungan antar variabel relatif tidak sama Layar Penuh

Tutup

Keluar
20 30 40 50
MIPA-Unej
● ● ●
● ● ●

80
hetero ●
● ●
● ●

● ● ●

60
●● ● ● ● ●


●●

● ● ● ●

Daftar Isi

40
● ● ●
● ● ●
● ● ●
●● ● ● ● ●

● ● ● ● ●
●● ● ● ● ●
●●● ● ● ● ● ● ●
●● ●● ● ●

20
●●
● ● ● ● ● ● ●

● ● ● ● ●

●● ● ● ● ● ● ●
●●●● ● ● ● ● ● ●● ●
● ● ●
● ● ● ●●● ●
● ●

● ● ● ●●
●●

Judul
50

● ● ●
● ● ●



mobility ●

● ●



40

● ● ●
● ● ●
● ● ●● ●

●● ● ●●● ● ●

● ● ●
● ● ●
● ●
● ●

● ●
● ●
JJ J I II
30

● ● ● ●
●● ● ● ●
● ● ●
● ● ●
● ●
● ● ●● ●● ●
● ● ●● ● ●
● ● ●
●● ●● ● ●
20

● ● ●
● ● ●
● ● ●● ● ●
● ● ●
● ● ●● ●●
● ● ●
● ●● ● ●● ● ● ●
● ● ●
● ● ●

● ● ● Hal. 123 dari 245




● ●●


moral ●
●●

● ● ●●

15
● ●
●● ● ● ●●
●● ● ●● ● ●● ●●●●
● ● ●
● ● ● ● ● ●●
● ● ● ●●
● ● ● ● ●

● ● ● ● ●●

● ●



Cari Halaman

10
● ● ●● ●

● ●● ● ● ● ●
●●
● ● ●
● ● ● ● ●

● ● ●
● ● ● ●● ● ●●●
● ● ●
● ● ●

● ● ●
● ● ● ● ●
● ● ● ●

5
● ● ●

20 40 60 80 5 10 15
Kembali

Gambar 4.5: Diagram Data Multivariat Dengan ilustrasi QQ-Plot dan Kernel Smoothing Layar Penuh

Tutup

Keluar
MIPA-Unej

Daftar Isi

Judul

JJ J I II

Hal. 124 dari 245

Cari Halaman

Kembali

Gambar 4.6: Diagram Data Multivariat yang menunjukkan bahwa populasi tidak homogen
dan hubungan antar variabel tidak sama Layar Penuh

Tutup

Keluar
MIPA-Unej

Bab 5
Daftar Isi

Aljabar Matriks untuk Statistika Judul

JJ J I II

Tujuan Umum
Hal. 125 dari 245
Mahasiswa memahami aljabar matriks, turunan yang berkaitan dengan matriks serta
menggunakannya dalam statistika
Cari Halaman

Tujuan Khusus
Kembali
Mahasiswa dapat
1. menyebutkan jenis- jenis matriks terutama yang banyak dijumpai dalam statistika Layar Penuh

2. menyelesaikan operasi matriks


3. mencari turunan suatu matriks atau vektor. Tutup

Keluar
Materi

1. Definisi dan jenis- jenis matriks


2. Operasi hitung matriks (penjumlahan, pengurangan, perkalian, transpose)
MIPA-Unej
3. Bentuk kuadrat (quadratic form) dan turunannya.

Daftar Isi
5.1. Defenisi dan Jenis Matriks
Definisi 5.1. Matriks adalah kumpulan unsur yang disusun dalam baris dan kolom yang Judul
berbentuk persegi panjang.
Matriks biasanya dinotasikan dengan huruf besar tebal, misalnya A, B sedangkan JJ J I II
unsur- unsurnya bisa berupa bilangan atau huruf kecil. Banyaknya baris dan kolom matrks
disebut ordo matriks. Matriks berordo n × m dinotasikan dengan An×m = [aij ], dalam
hal ini aij adalah unsur yang berada pada baris ke i dan kolom ke j. Hal. 126 dari 245

Contoh 5.1.
Cari Halaman
Matriks A berikut adalah matriks yang berordo 4 ×3;
 
3 4 5
 1 3 Kembali
6 
A=  7 10 20 

5 7 2
Layar Penuh

Beberapa matriks khusus yang banyak digunakan dalam statistika diantaranya adalah
matriks bujur sangkar, matriks diagonal, matriks skalar dan matriks simetrik. Definisi
Tutup
masing -masing jenis matriks di atas dapat dilihat pada buku-buku teks standar yang
membahas matriks.
Keluar
Definisi 5.2. Matriks bujur sangkar, adalah matriks yang banyaknya baris sama dengan
banyaknya kolom, yaitu n = m.
Pada matriks bujur sangkar, unsur unsur yang berada pada baris dan kolom dengan
nomor sama disebut diagonal utama (yaitu: aii .)
MIPA-Unej
Contoh 5.2.

 
3 14 5 Daftar Isi
B =  11 3 6 
7 10 20
Judul
Definisi 5.3. Matriks diagonal adalah matriks yang semua unsurnya selain unsur un-
surnya pada diagonal utama adalah nol, yaitu aij = 0 untuk setiap i 6= j.
JJ J I II
Contoh 5.3.

 
3 0 0 Hal. 127 dari 245
D= 0 0 0 
0 0 2
Cari Halaman
Definisi 5.4. Matriks skalar adalah matriks diagonal yang semua unsurnya sama.
Contoh 5.4.
Kembali

 
3 0 0
C= 0 3 0  Layar Penuh
0 0 3
Definisi 5.5. Matriks identitas I adalah matriks skalar yang semua unsurnya 1 Tutup

Contoh 5.5.
Keluar
 
1 0 0
I= 0 1 0 
0 0 1

Definisi 5.6. Matriks nol (0) adalah matriks yang semua unsurnya adalan 0.
MIPA-Unej

Definisi 5.7. Matriks simetris adalah matriks yang unsur- unsurnya simetris terhadap
diagonal utama, yaitu aij = aji untuk setiap i dan j.
Daftar Isi
Contoh 5.6.

  Judul
3 1 5
A= 1 2 0 
5 0 4 JJ J I II
Contoh 5.7.
Hal. 128 dari 245
Dalam statistika, matriks simetrik yang banyak ditemukan adalah matriks korelasi (R)
dan matriks varians-kovarians(V).
Cari Halaman
   2 
1 r12 · · · r1n σ1 σ12 · · · σ1n
 r21 1 · · · r2n   σ21 σ22 · · · σ2n 
R= . dan V =
   
. .. .  .. .. .. .. 
 .. .. .. 

.  . . . .  Kembali
rn1 r2n · · · 1 σn1 σ2n · · · σn2

Selain matriks-matriks umum di atas, dalam statistika ada yang disebut matriks desain Layar Penuh
X. MAtriks ini merupakan matriks yang menghubungkan parameter β dengan peubah-
peubah penjelas Xj . Pada umumnya model yang dipergunakan selalu mengandung kon-
stanta sehingga kolom pertama matriks X biasanya beranggotakan 1. Tutup

Keluar
 
1 x11 x12 ··· x1p
1 x21 x22 ··· x2p 
X = .
 
.. .. ..
 ..

. . . 
1 xn1 xn2 · · · xnp
MIPA-Unej

5.2. Operasi Matriks dan Sifat-sifatnya Daftar Isi

Operasi matriks yang penting yang banyak dipergunakan dalam statistika diantaranya
adalah operasi uner yaitu: invers dan transfose dan operasi biner yaitu penjumlahan dan Judul

perkalian.
JJ J I II
5.2.1. Operasi uner
Untuk melakukan operasi uner diperlukan cukup satu matriks. Yang termasuk operasi
Hal. 129 dari 245
uner adalah operasi invers baik untuk penjumlahan maupun perkalian dan operasi transfus.
Definisi 5.8. Inverse penjumlahan suatu matriks A ditulis −A, adalah matriks yang
unsur-unsurnya adalah negatif dari unsur-unsur matrks A Cari Halaman

Contoh 5.8.
Kembali
   
3 1 5 −3 −1 −5
Jika A =  1 −2 0  , maka −A =  −1 2 0 . Layar Penuh
5 0 −4 −5 0 4

Definisi 5.9. Transfos matriks A (berordo m × n) ditulis AT adalah matriks berordo


Tutup
n × m yang diperoleh dengan menukar baris matriks A menjadi kolom dan sebaliknya,
yaitu jika B = AT , maka bij = aji .
Keluar
Contoh 5.9.
 
4 5  
4 1 2
Jika A = 1 7 maka AT =
5 7 4
2 4

Teorema 5.1. Jika A adalah matriks simetris, maka A = AT MIPA-Unej

Definisi 5.10. Invers perkalian suatu matriks A ditulis A−1 , adalah matriks yang jika
dikalikan dengan A menghasilkan matriks identitas yaitu A.A−1 = A−1 .A = I. Daftar Isi

5.2.2. Operasi biner Judul


P Q
Dalam operasi matriks secara simbolik kita akan banyak menggunakan notasi . dan .
Untuk itu dalam subbab ini akan dibahas secara sepintas kedua notasi tersebut.
JJ J I II
Definisi 5.11.
n
X Hal. 130 dari 245
f (xi ) = f (x1 ) + f (x2 ) + · · · + f (xi ) + · · · + f (xn ).
i=1

Sifat-sifat operator Sigma diberikan dalam teorema berikut ini. Cari Halaman

Teorema 5.2. Sifat- sifat operator Sigma adalah


n Kembali
X
1. Jika k adalah suatu konstanta, maka k = nk.
i=1
Layar Penuh
2. Jika k adalah suatu konstanta, dan f adalah fungsi dalam xi maka
n
X n
X Tutup
kf (xi ) = k f (xi ).
i=1 i=1

Keluar
3. Jika k1 , k2 adalah konstanta dan f (xi ) = x2i + k1 xi + k2 , maka
n
X n
X n
X
f (xi ) = x2i + k1 +nk2 .
i=1 i=1 i=1

MIPA-Unej
Bukti:
Pn
1 i=1 k = k + k + ··· + k
| {z } Daftar Isi
n
= nk.
Pn
2 i=1 kf (xi ) = kf (x1 ) + kf (x2 ) + · · · + kf (xn )
Judul

= k(f (x1 ) + f (x2 ) + · · · + f (xn ))


n
X JJ J I II
=k f (xi ).
i=1
n
X
Pn Hal. 131 dari 245
x2i + k1 xi + k2

3 i=1 f (xi ) =
i=1
x21 + k1 x1 + k2 + · · · + x2n + k1 xn + k2
 
= Cari Halaman
= x21 + · · · + x2n + k1 x1 + · · · + k1 xn + k2 + · · · + k2
| {z }
n
n n Kembali
X X
= x2i + k1 xi + nk2
i=1 i=1
n n Layar Penuh
X X
= x2i + k1 xi + nk2 .
i=1 i=1
Tutup
Untuk lebih meringkas notasi, kadang-kadang jumlah untuk seluruh rentangan indeks

Keluar
hanya dinotasikan dengan tanda titik (.) untuk indeks tersebut, misalnya
n
X
xi. = xij
j=1
Xm
x.j = xij . MIPA-Unej
i=1
P
Jika operator merupakanQ penjumlahan yang berulang, maka operator untuk perkalian Daftar Isi
berulang disebut operator yang didefinisikan seperti berikut ini.
Definisi 5.12.
n Judul
Y
f (xi ) = f (x1 ) × f (x2 ) × · · · × f (xi ) × · · · × f (xn ).
i=1
Q JJ J I II
Sedangkan sifat- sifat operator dinyatakan dalam teorema berikut.
Q
Teorema 5.3. Sifat- sifat operator adalah:
n Hal. 132 dari 245
Y
n
• jika k adalah suatu konstanta, maka k=k ;
i=1
Cari Halaman
• jika k adalah suatu konstanta, dan f adalah fungsi dalam xi maka
n
Y n
Y
kf (xi ) = k n f (xi ); Kembali
i=1 i=1

• jika k1 , k2 adalah konstanta dan f (xi ) = (x2i )(k1 xi )(k2 ), maka Layar Penuh
n
Y n
Y n
Y
f (xi ) = x2i × k1n xi × k2n .
i=1 i=1 i=1 Tutup
Q P
Pembuktian teorema di atas analog dengan pembuktian sifat- sifat operator .
Keluar
5.2.2.1. Penjumlahan Matriks
Matriks yang bisa dijumlahkan (ditambah dan dikurangi) adalah matriks yang berdordo
sama. Matriks yang berordo sama disebut compormable terhadap penjumlahan. Pen-
jumlahan matriks dilakukan dengan menjumlahkan unsur unsur yang seletak, yaitu unsur
unsur yang terletak pada baris dan kolom yang sama atau yang mempunyai indeks yang MIPA-Unej
sama.
Definisi 5.13. Jika A = (aij ) dan B = (bij ) i = 1, 2, · · · , m; j = 1, 2, · · · , n maka A + B
Daftar Isi
adalah matriks C yang berordo m × n dengan unsur unsurnya adalah cij = aij + bij .
Contoh 5.10.
Judul
Jika    
3 5 6 8
A=8 4  dan B = 2 4  , JJ J I II
6 10 3 10
maka
Hal. 133 dari 245
   
3+6 5+8 9 13
A + B = 8 + 2 4 + 4  = 10 8  .
6+3 10 + 10 9 20
Cari Halaman

Definisi 5.14. Selisih dua matriks didefinisikan sebagai jumlah dengan negatif matriks
pengurang, yaitu A − B = A + (−B).
Kembali
Teorema 5.4. Sifat- sifat penting dari penjumlahan matriks adalah
A+B=B+A komutatif
A+0=0+A identitas Layar Penuh
A + (−A) = 0 invers
A + (B + C) = (A + B) + C assosatif
Tutup
(A + B)T = AT + BT distribusi transpus

Keluar
5.2.2.2. Perkalian matriks
Perkalian matriks bisa dilakukan apabila banyaknya kolom matriks yang terkali sama
dengan banyaknya baris matriks pengali. Matriks-matriks yang dapat dikalikan disebut
matriks- matriks yang conformable terhadap perkalian. Selain perkalian dengan sesama
matriks, matriks juga dapat dikalikan dengan skalar. MIPA-Unej

Definisi 5.15. Hasil kali suatu matriks dengan suatu skalar adalah matriks yang unsur-
unsurnya adalah hasil kali setiap unsur matriks dengan skalar tersebut, yaitu kA = (kaij ) .
Daftar Isi
Contoh 5.11.    
3 −2 −6 9 −6 −18
3 1 2 0 = 3 6 0 . Judul
−5 0 4 −15 0 12
Definisi 5.16. Hasil kali dua matriks adalah matriks yang berordo sedemikian sehingga JJ J I II
barisnya sama dengan baris matriks yang dikalikan dan kolomnya sama dengan kolom
matriks pengali. Unsur unsur dari matruiks pengali merupakan kombinasi linier dari baris
matriks terkali dengan kolom dari matriks pengali. Jadi jika Am×n Bn×p , maka Cm×p = Hal. 134 dari 245
AB dengan

cik = ai1 b1k + ai2 b2k + · · · + ain bnk Cari Halaman

Xn
= aij bjk .
j=1 Kembali

Contoh 5.12.
Layar Penuh
Jika    
3 −2 −6 3 −1 2
A= 1 2 0  dan B =  5 2 0 , Tutup
−5 0 4 0 2 4

Keluar
maka AB
(3)(3) + (−2)(5) + (−6)(0) (3)(−1) + (−2)(2) + (−6)(2) (3)(2) + (−2)(0) + (−6)(4)
!
= (1)(3) + (2)(5) + (0)(0) (1)(−1) + (2)(2) + (0)(2) (1)(2) + (2)(0) + (0)(4)
(−5)(3) + (0)(5) + (4)(0) (−5)(−1) + (0)(2) + (4)(2) (−5)(2) + (0)(0) + (4)(4)
 
−1 −19 −18 MIPA-Unej
=  13 3 2 .
−15 13 6
Daftar Isi
Teorema 5.5. Sifat- sifat operasi perkalian yang penting diantaranya
1. Nonkomutatif, yaitu secara umum AB 6= BA; Judul

2. Assosiatif, yaitu (AB)C = A(BC);


3. Distributif perkalian terhadap jumlah, yaitu A(B + C) = AB + AC. JJ J I II

4. Distributif transfos terhadap perkalian, yaitu (AB)T = BT AT .


Hal. 135 dari 245

5.2.3. Determinan dan invers matriks


Definisi 5.17. Determinan dari suatu matriks bujur sangkar A, dinotasikan dengan |A| Cari Halaman
atau det(A) adalah fungsi skalar yang didefinisikan sedemikian rupa sehingga merupakan
jumlah hasilkali unsur- unsur yang sejajar diagonal utama dikurangi jumlah unsur- unsur
yang sejajar diagonal lain. Dalam bentuk notasi Kembali

n
Y n
Y n−1
Y n
Y n−1
Y
|A| = aii + ai,i+1 + · · · + a1n ai+1,i − an+1−i,i − · · · − a11 an+2−i,i . Layar Penuh
i=1 i=1 i=1 i=1 i=2

Definisi 5.18. Matriks yang determinannya tidak nol disebut matriks nonsinguler. Tutup
Sedangkan matriks yang determinannya 0 disebut matriks singuler.

Keluar
Contoh 5.13.
 
3 4 1
Jika A = 5 7 6 , maka det A adalah
3 2 5
MIPA-Unej
|A| = (3)(7)(5) + (4)(6)(3) + (1)(5)(2)
− (3)(7)(1) − (5)(4)(5) − (3)(2)(6)
= 105 + 72 + 10 − 21 − 100 − 36 Daftar Isi

= 187 − 157 = 30
Judul
Definisi 5.19. Teras(trace) suatu matriksPbujur sangkar adalah jumlah unsur diagonal
n
utama dari matriks tersebut, yaitu tr(A) = i=1 aii .
Contoh 5.14. JJ J I II

Dari  
−1 −19 −18 Hal. 136 dari 245
A =  13 3 2 ,
−15 13 6
Cari Halaman
maka tr(A) = −1 + 3 + 6 = 8.
Untuk matriks bujur sangkar beordo 2, cara mencari invers adalah sebagai berikut.
Kembali
 
a c
Teorema 5.6. Jika A = , maka
b d

• | A |= ac − bd Layar Penuh

 
−1 1 d −c
• A = |A|
−b a Tutup

Keluar
5.3. Kebergantungan Linier dan Rank Matriks
Dalam statistika pada umumnya kolom-kolom matriks mewakili peubah-peubah acak yang
bisa saling bebas atau tidaksaling bebas satu sama lain. Kondisi ini akan mempengaruhi
apakah matriks yang akan dihasilkan mempunyai rank penuh atau tidak, apakah matriks
yang dihasilkan akan mempunyai invers atau tidak. MIPA-Unej

Definisi 5.20. Suatu kolom dari matriks A dikatakan bergantung linier dengan kolom-
kolom lainnya jika dia dapat dinyatakan sebagai kombinasi linier dari kolom-kolom lainnya Daftar Isi
tersebut.
Definisi 5.21. Rank suatu matriks adalah bilangan yang menunjukkan banyaknya mak- Judul
simum kolom yang saling independen.
Definisi 5.22. Suatu matriks dikatakan mempunyai rank penuh jika ranknya sama den-
JJ J I II
gan banyaknya kolom
Teorema 5.7. Suatu matriks bujur sangkar akan non singular jika mempunyai rank
penuh, sebaliknya akan singular jika tidak mempuyai rank penuh. Hal. 137 dari 245

Contoh 5.15.
  Cari Halaman
3 4 1
Matriks A = 5 7 6 adalah matriks nonsingular dengan rank penuh 3. Tetapi
 3 2 5 Kembali
3 4 1
B = 18 7 6 tidak mempunyai rank penuh karena kolom pertama merupakan 3×
15 2 5 Layar Penuh
kolom ketiga dan karenanya B adalah matriks singular dan tidak memiliki invers. Penyele-
saian konkrit dari kegergantungan ini dapat dihitung dengan membentuk sistim persamaan
homogen antara kolom-kolom matriks dan mencari apakah sistem persamaan homogen Tutup
tersebut mempunyai atau tidak penyelesaian tidak nol.

Keluar
Teorema 5.8. Jika matriks Anp bukan matriks bujur sangkar (n < p), paling tidak ada
(p − n) kolom yang dapat dinyatakan sebagai kombinasi linier dari kolom lainnya. Dengan
demikian maka A tidak akan mempunyai rank penuh.
Contoh 5.16.
 
3 4 1 1 MIPA-Unej
Matriks A = 5 7 6 1 mempunyai banyak kolom yang lebih besar dari banyaknya
3 2 5 1
baris, karena itu pasti salah satu dari kolom yang ada dapat dinyatakan sebagai kombinasi Daftar Isi

linier dari yang lainnya. Secara aljabar hal ini mengandung pengertian bahwa sistim
persamaan ak1 + b + k2 + ck3 + dk 4 = 0, dengan kj adalah kolom ke j, mempunyai
Judul
penyelesaian dimana sekalar a, b, c, d tidak semuanya sama dengan nol.

3a + 4b + c + d = 0 (1)
JJ J I II
5a + 7b + 6c + d = 0 (2)
3a + 2b + 5c + d = 0 (3)
Hal. 138 dari 245
Selanjutnya (1)-(3) dan (2)-(3) akan menghasilkan

2b + −4c = 0 (4) Cari Halaman


2a + 5b + c = 0 (5)

Kembali

Persamaan (4) menghasilkan hubungan b = 2c yang dapat disubstitusikan ke (5)

2a + 10c + c7 = 0 Layar Penuh

2a + 11c = 0
a = −11/2c (7) Tutup

Keluar
Selanjutnya jika (7) disubstitusikan ke persamaan (1) akan menghasilkan

−33/2c + 8c + c + d = 0
d = 33/2c − 9c = 15/2c

Jadi sistim persamaan ini mempunyai penyelesaian yang bersifat parametrik, salah satu MIPA-Unej
diantaranya adalah untuk c = 2, maka diperoleh b = 4, a = −11, d = 15.
Dalam statistika, jika X adalah matriks desain yang kolomnya menunjukkan peubah-
peubah penjelas dan barisnya merupakan sampel, untuk menjamin agar X mempunyai Daftar Isi

rank penuh, maka banyaknya sampel selalu diusahakan jauh lebih banyak dari banyaknya
peubah penjelas yang menjadi perhatian.
Judul

5.4. Bentuk Kuadrat dan Diferensial Matriks


JJ J I II
Definisi 5.23. Misalkan
 
x1 
a11 a12 ··· an1

Hal. 139 dari 245

 x2 
  a21 a22 ··· an2 
x= x3  dan A =  ,

 .. .. .. ..

 ···

  . . . .  Cari Halaman
xn an1 an2 ··· ann
   
n n Kembali
X X
maka xT Ax =   xj aij  xi  ; merupakan matriks 1 ×1 (skalar) yang disebut
i=1 j=1
Layar Penuh
bentuk kuadrat.
Matriks A pada umumnya merupakan matriks simetrik, misalnya matriks korelasi
ataupun matriks varians-kovarians. Dalam statistika sering diperlukan turunan suatu ma- Tutup
triks terhadap sekelompok peubah dalam satu vektor. Pada dasarnya turunan satu peubah
Keluar
terhadap suatu vektor adalah adalah suatu vektor atau matriks yang unsur-unsurnya
adalah turunan peubah pertama terhadap peubah unsur-unsur vektor penurun sedemikain
sehingga posisi unsurnya sesuai dengan posisi unsur yang diturukan dan unsur penurun.
Definisi 5.24. Misalkan
 
x1 MIPA-Unej

 x2 
  
x=
 x3  dan g = g(x)

 ..  Daftar Isi
 . 
xn
Judul
maka
∂g
 
∂x1
∂g
JJ J I II
 
 ∂x2 
∂g  ∂g 
= ∂x3 
∂x 
 ..


 .  Hal. 140 dari 245
∂g
∂xn

dan  T   Cari Halaman


∂g ∂g ∂g ∂g ∂g ∂g
= = ···
∂xT ∂x ∂x1 ∂x2 ∂x3 ∂xn
Contoh 5.17. Kembali
 
x1
Jika g = (2x1 + 5x2 ), dan x = , maka
x2 Layar Penuh
 
∂g 2
=
∂x 5 Tutup

Contoh 5.18.
Keluar
Jika    
g1 x1

 g2 


 x2 

g=
 g3  , dan x = 
  x3 ,

 ..   .. 
 .   . 
MIPA-Unej
gn xp
∂g ∂gT
maka yang dapat dilakukan adalah T
yang menghasilkan matriks n × p atau yang Daftar Isi
∂x ∂x
menghasilkan matriks p × n.
 
dg1 /dx1 dg1 /dx2 · · · dg1 /dxp Judul
 dg2 /dx1 dg2 /dx2 · · · dg2 /dxp 
∂g 
 dg3 /dx1 dg3 /dx2 · · · dg3 /dxp 

=
∂xT
 
 .. .. .. ..  JJ J I II
 . . . . 
dgn /dx1 dgn /dx2 · · · dgn /dxp
Hal. 141 dari 245
Contoh 5.19.
   
x1 1 2
Misalkan A = dan A = maka Cari Halaman
x2 2 1
 
x1 + 2x2
1. Ax = ;
2x1 + x2 Kembali

2. xT Ax = x1 (x1 + 2x2 ) + x2 (2x1 + x2 ) = x21 + 4x1 x2 + x22 yang merupakan ben-


 

tuk kuadrat; Layar Penuh

∂(x1 + 2x2 ) ∂(x1 + 2x2 )


 
 
∂Ax  ∂x1 ∂x 2
1 2 Tutup
3. =  ∂(2x + x ) ∂(2x + x )  = = A;

∂xT 1 2 1 2 2 1
∂x1 ∂x2
Keluar
4. Turunan xT Ax terhadap x adalah

∂(x21 + 4x1 x2 + x22 )


 
T
∂x Ax  ∂x1
=

∂x ∂(x21 + 4x1 x2 + x22 ) 
∂x2 MIPA-Unej
 
2x1 + 4x2
=
4x1 + 2x2
   Daftar Isi
1 2 x1
=2
2 1 x2
= 2Ax; Judul

∂xT Ax
5. Karena pada dasarnya adalah suatu konstanta, maka juga dapat diturunkan JJ J I II
∂xT
T
terhadap x .
Hal. 142 dari 245
∂xT Ax
 
∂(x21 + 4x1 x2 + x22 ) ∂(x21 + 4x1 x2 + x22 )
=
∂xT ∂x1 ∂x2

= 2x1 + 4x2 4x1 + 2x2 Cari Halaman
 
 1 2
= 2 x1 x2
2 1
Kembali
= 2xT A;
 
∂ 2 xT Ax Layar Penuh
6. berdasarkan kedua hasil di atas maka, maka diperoleh = 2A.
∂xT ∂x
Teorema 5.9. Misalkan A adalah matriks simetrik berordo n × n dan x adalah vektor Tutup
baris berordo n, maka

Keluar
∂xT A ∂Ax
1. = =A
∂x ∂xT
∂xT Ax
2. = 2Ax
∂x
 
∂ 2 xT Ax MIPA-Unej
3. = 2A
∂xT ∂x
   
2 1 x1 Daftar Isi
Contoh 5.20. Misalkan A = , x = , sedangkan x1 = 2t1 + 3t2 dan
1 3 x2
 
2 3
x2 = 3t1 + t2 , jika t = , maka: Judul
3 1
∂x
1. x = Bt dan = B;
∂tT JJ J I II
   
2x1 + x2 2(2t1 + 3t2 ) + 3t1 + t2 ∂Ax
2. Ax = = , sehingga = A dan
x1 + 3x2 2t1 + 3t2 + 3(3t1 + t2) ∂xT Hal. 143 dari 245
    
∂Ax 7 7 2 1 2 3 ∂Ax ∂x
3. = = = AB = .
∂tT 11 6 1 3 3 1 ∂xT ∂tT Cari Halaman

Tanpa kehilangan generalisasi, hasil di atas dapat diperluas pada teorema berikut.
Bukti umum dari teorema berikut tidak dibahas dalam buku ini.
Kembali
Teorema 5.10. Misalkan y adalah vektor peubah yang merupakan fungsi dari x, yaitu
merupakan hasil perkalian antara x dengan suatu matriks simetrik dan F adalah matriks
peubah yang merupakan fungsi dari y, yaitu hasil kali y dengan suatu matriks simetrik, Layar Penuh

maka berlaku sifat turunan rantai sebagai berikut:

∂F ∂F ∂y ∂F ∂F ∂yT Tutup
= T
atau =
∂x ∂y ∂x ∂x ∂y ∂x
Keluar
Contoh 5.21. Misalkan X, Y dan β matriks-matriks sedemikian sehingga
T
Q = (Y − Xβ) (Y − Xβ)

adalah suatu bentuk kuadrat (matriks 1 × 1). Tentukan


MIPA-Unej
1. ∂Q/∂β
2. ∂ 2 Q/ (∂β T ∂β)
Daftar Isi
Jawab:
T
Q = (Y − Xβ) (Y − Xβ) Judul
 
= YT − β T XT (Y − Xβ)
 T JJ J I II
= YT Y − β T XT Y − β T XT Y + β T XT Xβ

Hal. 144 dari 245


mengingat β T XT Y adalah matriks 1×1, maka identik dengan trasfosenya dan persamaan
di atas menjadi
Cari Halaman
Q = YT Y − 2β T XT Y + β T XT Xβ.

Maka Kembali
∂Q
= 0 − 2XT Y + 2XT Xβ
∂β
Layar Penuh
= 2 XT Xβ − XT Y , dan


∂2Q
= 2XT X. Tutup
∂β T ∂β

Keluar
Contoh 5.22. Misalkan W adalah matriks simetrik, X, Y dan β matriks-matriks sedemikian
sehingga
T
Q = (Y − Xβ) W (Y − Xβ)
adalah suatu bentuk kuadrat (matriks 1 × 1). Tentukan
1. ∂Q/∂β MIPA-Unej

T
2. ∂ 2 Q/ (∂β ∂β)
Daftar Isi

5.5. Bacaan Lebih Lanjut


Judul
Referensi umum mengenai matriks dapat dijumpai pada buku-buku teks tentang matriks
atau aljabar linier. Namun tidak banyak referensi yang membahas turunan matriks/ vektor
terutama yang terkait dengan statistika. Pembahasan dalam bab ini, terutama mengenai JJ J I II
aplikasi matrks dalam statistika, dapat dijumpai pada Searle [26], Harville [12] Neter et
al. [25].
Hal. 145 dari 245

5.6. Aplikasi R untuk Operasi Matriks


Cari Halaman
Untuk aplikasi R tentang matriks dan operasinya, selain menggunakan beberapa fungsi
yang telah didefinisikan secara internal, pembaca dapat juga mencari paket/library yang
berkaitan dengan matriks. Kembali

5.6.1. Mendefinisikan matriks


Layar Penuh
Matriks dapat didefinisikan dengan beberapa cara yaitu:
1. memberikan data elemen matriks (c(a11,a21,a31,...,a21,a22,...) yang selan-
Tutup
jutnya disusun dalam bentuk baris dan kolom. Ingat bahwa R akan melengkapi
seluruh barus kolom 1 baru melengkapi kolom 2 dan seterusnya.
Keluar
>x<-seq(1,10,1)
>xmat<-matrix(x,2,5)
>ymat<-matrix(x,5,2)
>xmat
[,1] [,2] [,3] [,4] [,5]
[1,] 1 3 5 7 9 MIPA-Unej
[2,] 2 4 6 8 10
> ymat
[,1] [,2] Daftar Isi

[1,] 1 6
[2,] 2 7
Judul
[3,] 3 8
[4,] 4 9
[5,] 5 10
JJ J I II

2. menjadikan matriks data yang sudah tersusun dalam bentuk matriks dengan perin- Hal. 146 dari 245
tah as.matrix(). Untuk matriks berukuran besar, mungkin tidak praktis mencetak
seluruh elemennya, tetapi kita bisa memeriksa dimensi/ordonya dengan dim(). Pada
contoh berikut data kecepatan dan jarak tempuh mobil yang berupa tabel dengan Cari Halaman
50 baris dan 2 kolom didefinisikan menjadi matriks berordo 50 ×2.

>data(cars) Kembali
>x<-as.matrix(cars)
>dim(x)
[1] 50 2 Layar Penuh

>amat<-x%*%t(x)
>bmat<-t(x)%*%x
Tutup
>dim(amat)
[1] 50 50
Keluar
>dim(bmat)
[1] 2 2

3. beberapa matriks didefinisikan secara khusus diantaranya adalah


(a) matriks dengan elemen yang sama, misalnya k dengan ormo m × n. MIPA-Unej

>matrix(0,2,3)
[,1] [,2] [,3]
Daftar Isi
[1,] 0 0 0
[2,] 0 0 0
>matrix(1,2,3)
Judul
[,1] [,2] [,3]
[1,] 1 1 1
[2,] 1 1 1 JJ J I II
>
(b) matriks diagonal atau matriks identitas.
Hal. 147 dari 245
> diag(1,3)
[,1] [,2] [,3]
[1,] 1 0 0 Cari Halaman
[2,] 0 1 0
[3,] 0 0 1
Kembali
> diag(2,3)
[,1] [,2] [,3]
Layar Penuh
[1,] 2 0 0
[2,] 0 2 0
[3,] 0 0 2
Tutup
>diag(c(1,2,3,4,5))
[,1] [,2] [,3] [,4] [,5]
Keluar
[1,] 1 0 0 0 0
[2,] 0 2 0 0 0
[3,] 0 0 3 0 0
[4,] 0 0 0 4 0
[5,] 0 0 0 0 5
MIPA-Unej
Sebaliknya jika diag() dilakukan pada matrik bujur sangkar, maka fungsi ini
akan mengekstrak diagonal matriks tersebut.
> diag(bmat) Daftar Isi
speed dist
13228 124903
Judul

5.6.2. Operasi Matriks dengan R


Beberapa operasi matriks yang dapat dilakukan yang terkait dengan kebutuhan statistika JJ J I II
diantaranya adalah perkalian matriks, determinan ((det()) invers dan transpose matriks.
xmat%*%ymat Hal. 148 dari 245
[,1] [,2]
[1,] 95 220
[2,] 110 260 Cari Halaman
> ymat%*%xmat
[,1] [,2] [,3] [,4] [,5]
[1,] 13 27 41 55 69 Kembali
[2,] 16 34 52 70 88
[3,] 19 41 63 85 107
Layar Penuh
[4,] 22 48 74 100 126
[5,] 25 55 85 115 145
>det(xmat%*%ymat)
Tutup
[1] 500
> solve(xmat%*%ymat)
Keluar
[,1] [,2]
[1,] 0.52 -0.44
[2,] -0.22 0.19
det(ymat%*%xmat)
[1] 0
solve(ymat%*%xmat) #tes walau kita tahu det=0. MIPA-Unej
Error in ... system is exactly singular

Daftar Isi
5.7. Latihan Soal-soal
1. Sebutkan definisi matriks berikut dan beri masing- masing 1 contoh. Judul

(a) Matriks diagonal


(b) Matriks skalar JJ J I II
(c) Matriks simetrik
(d) Matriks nonsinguler. Hal. 149 dari 245

2. Buatlah dua buah matriks (A, B), masing- masing berordo 2×2 , selanjutnya hitung
Cari Halaman
(a) AB
(b) BA
(c) A−1 Kembali

3. Selesaikan Contoh 5.22 secara lengkap.


Layar Penuh
4. Selidiki apakah matriks-matriks berikut mempunyai rank kolom lengkap atau tidak.

Tutup

Keluar
 
1 2 4
3 3 6
 
2
(a) A =  4 1 
5 5 3
6 2 −1
  MIPA-Unej
1 2 4 1
5 5 3 0
 
2
(b) B =  4 1 2 Daftar Isi
6 2 −1 −4
3 3 6 0
 
3 3 6 3 3 −1 Judul
1 2 4 1 1 1
 
5
(c) C =  5 3 0 0 1  JJ J I II
6 2 −1 4 3 5
2 4 1 2 5 10
   
1 2 4 x Hal. 150 dari 245

5. Diketahui A = 2 3 6 dan x = y  . Tentukan


4 6 1 z
Cari Halaman

(a) Q = XT AX
∂Q
(b) Kembali
∂x
∂2Q
(c)
∂xT ∂x Layar Penuh

baik dengan cara menurunkan unsur-unsurnya maupun dengan cara keseluruhan


dengan cara matriks. Tutup

Keluar
MIPA-Unej

Bab 6
Daftar Isi

Model Linier Normal Judul

JJ J I II

Tujuan Umum
Hal. 151 dari 245
Mahasiswa memahami prinsip model linier normal atau model linier klasik, merumuskan
model, mengestimasi parameter dan melakukan uji inferensi.
Cari Halaman

Tujuan Khusus
Kembali
Mahasiswa dapat
1. menentukan model dan asumsi model linier normal Layar Penuh

2. mengestimasi parameter yang menjadi kepentingan dengan metode kuadrat terkecil


3. mengestimasi parameter yang menjadi kepentingan dengan metode likelihood mak- Tutup
simum

Keluar
4. menentukan distribusi penduga likelihood maksimum dan uji inferensi

5. menerapkan pendekatan matriks untuk regresi berganda;


6. dapat menggunakan paket/library lm() pada R
MIPA-Unej

Materi
1. Model linier normal: bentuk dan asumsi Daftar Isi

2. Estimasi parameter dengan metode kuadrat terkecil


Judul
3. Estimasi parameter dengan metode likelihood maximum
4. Distribusi penduga dan uji inferensi
JJ J I II
5. Pendekatan matriks untuk regresi berganda;
Hal. 152 dari 245
6.1. Bentuk dan Asumsi
Misalkan hubungan antara peubah respon (Yi ) dengan peubah tetap (Xi ) untuk subjek Cari Halaman
i = 1, 2, ...n, ditentukan oleh

Y1 = β0 + β1 X1 + 1  Kembali
.. .. ..



. . .



Yi = β0 + β1 Xi + i (6.1) Layar Penuh
.. .. .. 

. . .




Yn = β0 + β1 Xn + n

Tutup

dengan:
Keluar
1. Xi adalah peubah tetap yang tidak bersifat acak (lebih lanjut diasumsikan Xi diukur
tanpa kesalahan);
2. i , yaitu komponen kesalahannya, adalah berdistribusi identik dan independen nor-
mal dengan mean 0 dan varian konstan (misalnya σ 2 );
3. kesalahan individu satu dengan lainnya saling bebas, yaitu untuk i 6= i0 , maka i ||i0 MIPA-Unej

atau korelasi i dengan i0 adalah 0.


Dari asumsi dapat ditentukan bahwa ekspektasi dari setiap renpon adalah Daftar Isi

E [Yi ] = β0 + β1 Xi (6.2)
yang merupakan sebuah garis lurus yang kita sebut garis regresi populasi. Se-dangkan Judul
sebaran setiap pasangan (Xi , Yi ) alan berada pada atau sekitar garis tersebut sesuai dengan
besarnya i .
JJ J I II

6.2. Estimasi Parameter


Hal. 153 dari 245
Dalam kenyataan, kita hanya memiliki pasangan-pasangan data (Xi , Yi ) untuk i = 1, 2, · · · , n.
Dari data yang kita miliki kita ingin mengestimasi regesi populasi maupun sebaran simpan-
gan datanya. Maka parameter yang menjadi kepentingan   utama dalam regresi sederhana Cari Halaman
β0
di atas adalah komponen dari koefisien regresi β = . Parameter lain yang juga perlu
β1
2 Kembali
diestimasi adalah komponen variasi σ . Sebagaimana telah disebutkan sebelumnya ada
dua metode yang akan digunakan dalam mengestimasi parameter yaitu metode kuadrat
terkecil dan metode kecenderungan (likelihood) maksimum.
Layar Penuh

6.2.1. Estimasi dengan Metode Kuadrat Terkecil


Tutup
Seperti telah diuraikan pada Bab 1, bahwa dengan metode kuadrat terkecil, secara ge-
ometris kita mencari garis sedemikian sehingga kesalahan (selisih ordinat titik terhadap
Keluar
garis) menjadi minimum. Untuk mengakomodasi tanda positif dan negatif, maka yang di-
minimumkan adalah jumlah kuadrat selisih ordinat tadi. Untuk mengestimasi parameter
dengan menggunakan metode kuadrat terkecil maka ditempun langkah-langkah berikut
ini.
1. Karena yang akan diminimumkan adalah kesalahan, maka langkah pertama yang MIPA-Unej
harus dilakukan adalah mengubah model linier menjadi eksplisit terhadap kesalahan.
Dari bentuk model pada persamaan (6.1), diperoleh rumusan kesalahan
Daftar Isi
i = Y − (β0 + β1 Xi ) (6.3)

2. Mengkuadratkan kesalahan yang diperoleh serta menjumlahkannya untuk seluruh Judul


pasangan data. Dari bentuk tersebut diperoleh bentuk jumlah kuadrat kesalahan
sebagai berikut
 2 JJ J I II
n
X n
X n
X 1
X
2
Q= 2i = [Yi − (β0 + β1 Xi )] = Yi − βj Xij  (6.4)
i=1 i]1 i=1 j=0 Hal. 154 dari 245

Dalam hal ini Xi0 = 1 dan Xi1 = Xi .


Cari Halaman
3. Menurunkan bentuk kuadrat yang diperoleh terhadap parameter yang menjadi ke-
pentingan. Estimasi dengan metode kuadrat terkecil diproses dengan mencari mini-
mum Q terhadap βj . Minimum dari Q terhadap diperoleh dengan mencari turunan Kembali
pertama maupun ke dua
n
∂Q X Layar Penuh
= −2 [Yi − (β0 + β1 Xi )]
∂β0 i=1
n
∂Q X Tutup
= −2 [Yi − (β0 + β1 Xi )] Xi
∂β1 i=1

Keluar
4. Menyusun persamaan normal yang diperoleh dari sistem persamaan ∂Q/∂βj = 0.
Dari hasil sebelumnya diperoleh persamaan normal
Pn 
Pni=1 [Yi − (β0 + β1 Xi )] =0
. (6.5)
i=1 [Yi − (β0 + β1 Xi )] Xi =0
MIPA-Unej
Persamaan normal di atas selanjutnya dapat disederhanakan menjadi
n
X n
X
Yi − nβ0 − β1 Xi = 0 (6.6a) Daftar Isi
i=1 i=1
n
X n
X Xn
Xi Yi − β0 Xi − β1 Xi2 = 0 (6.6b) Judul
i=1 i=1 i=1

5. Dari persamaan normal (6.6a) di atas diperoleh JJ J I II


n n
1 X 1 X
βˆ0 = Yi − β1 Xi (6.7a)
n i=1
n i=1
Hal. 155 dari 245

= Ȳ − β1 X̄ (6.7b)
Cari Halaman
Hasil persamaan (6.7) ini selanjutnya disubstitusikan pada persamaan normal (6.6b)
sehingga diperoleh:
P P
P Xi Yi Kembali
X i Yi −
βˆ1 = P P
n
2 (6.8a)
Xi2 − ( nXi )
Pn Pn Pn
n i=1 Xi Yi − ( i=1 Xi ) ( i=1 Yi ) Layar Penuh
= 2 (6.8b)
n Xi2 − ( Xi )
P P
P P
Xi Yi − X̄ Yi Tutup
= P 2 . (6.8c)
Xi2 − n X̄
Keluar
2
Xi2 − X̄ 2 = Xi2 − nX̄ 2 , maka
P P P P
Mengingat bahwa Xi − X̄ =
P
Yi (Xi − X̄)
βˆ1 = P 2 (6.8d)
Xi − X̄
MIPA-Unej

Sebagaimana telah disampaikan bahwa metode kuadrat terkecil belum memanfaatkan


informasi distribusi dari i . Oleh karena itu apabila σ 2 tidak diketahui, tidak ada cara Daftar Isi
khusus dengan metode kuadrat terkecil untuk mengestimasi σ 2 . Namun, σ 2 biasa dies-
timasi dari rata-rata kuadrat deviasi data terhadap garis regresi yang diperoleh dari βˆj .
Derajat kebebasan yag dimiliki oleh deviasi ini adalah n − k dimana k adalah banyaknya Judul
penduga βj . Jadi untuk model dengan dua parameter β0 dan β1 , maka
n i2
1 Xh JJ J I II
σˆ2 = s2e = Yi − (βˆ0 + βˆ1 Xi ) (6.9)
n − 2 i=1

Hal. 156 dari 245


6.2.2. Estimasi dengan Metode Likelihood Maksimum
Sesuai dengan prinsip model linier normal, maka setiap peubah respon Yi merupakan
Cari Halaman
sample dari peubah acak yang berdistribusi normal dan saling independen dengan mean
E(Yi ) = β0 +β1 Xi dan varians σ 2 , yaitu Yi ∼ N (E(Yi ), σ 2 ). Dengan demikian kita peroleh
seperti berikut ini. Kembali

1. Likelihood Yi adalah
" 2 #
 Layar Penuh
1 1 Yi − β0 − β1 Xi
Li = √ exp − .
σ 2π 2 σ
Tutup

Keluar
2. Likelihood dari Y = (Y1 , Y2 , · · · , Yi , · · · , Yn )T yang komponennya saling bebas adalah
n
Y
L= Li
i=1
 n " n  2 #
1 1X Yi − β0 − β1 Xi MIPA-Unej
= √ exp − .
σ 2π 2 i=1 σ

Daftar Isi
Log-likelihood l = log L adalah

 √  1X n  2
Yi − β0 − β1 Xi Judul
l = −n log σ 2π −
2 i=1 σ
n
n 1 X 2 JJ J I II
log 2πσ 2 − 2

=− (Yi − β0 − β1 Xi ) .
2 2σ i=1

Hal. 157 dari 245

Cari Halaman

Kembali

Layar Penuh

Tutup

Keluar
Selanjutnya turunan l terhadap β0 , β1 dan σ 2 diperoleh sebagai berikut
n
∂l 1 X
= − 2 (2)(−1) (Yi − β0 − β1 Xi )
∂β0 2σ i=1
n
1 X MIPA-Unej
= (Yi − β0 − β1 Xi )
σ 2 i=1
n
∂l 1 X
= − 2 (2)(−1) (Yi − β0 − β1 Xi ) Xi Daftar Isi
∂β1 2σ i=1
n
∂l 1 X
= 2 (Yi − β0 − β1 Xi ) Xi Judul
∂β1 σ i=1
n
∂l n 1 X 2
= − + (Yi − β0 − β1 Xi ) . JJ J I II
∂σ 2 2σ 2 2σ 4 i=1

Dari persamaan di atas diperoleh persamaan normal untuk β0 dan β1 identik dengan Hal. 158 dari 245
persamaan normal (6.5). Selanjutnya dari ∂l/∂σ 2 = 0 diperoleh
n
X 2 Cari Halaman
nσ 2 + (Yi − β0 − β1 Xi ) = 0
i=1

sehingga penduga kemungkinan maksimum untuk σ 2 adalah Kembali

n
1X
σˆ2 =
2
(Yi − β0 − β1 Xi ) . Layar Penuh
n i=1

Sebenarnya estimasi σ 2 di atas berlaku untuk kondisi β0 , β1 atau µ yang diketahui. Jika
Tutup
tidak diketahui, maka penduga di atas akan menjadi bias. Untuk menghilangkan bias maka
pembaginya (derajat kebebasannya) harus dikurangi sebesar banyaknya parameter yang
Keluar
harus diestimasi sebelummnya. Dalam kasus model sederhana yang kita bahas, banyaknya
parameter ada 2 yaitu (β0 , β1 ). Dengan demikian derajat kebebasannya menjadi n − 2
dan bentuk penduga σ untuk penduga llikelihood seteleh disesuaikan manjadi
n 2
1 X
σˆ2 = Yi − βˆ0 − βˆ1 Xi (6.10)
n − 2 i=1 MIPA-Unej

6.3. Uji Inferensial dari βˆj Daftar Isi

Sebagaimana dijelaskan dalam langkah-langkah pemodelan stokastik, bahwa besaran yang


diperoleh dari penyelesaian model, yang berupa penduga, harus diuji secara statistik. Judul

Untuk keperluan ini, perlu diketahui distribusi dari penduga yang diperoleh.
JJ J I II
6.3.1. Distribusi βˆj
Setelah memperoleh estimasi dari parameter βj , maka selanjutya kita perlu memperoleh
Hal. 159 dari 245
sifat sebaran dari penduga- penduga tersebut. Dapat ditunjukkan (dianjurkan untuk mem-
buktikan sendiri) bahwa penduga-penduga yang diperoleh adalah penduga tak bias dalam
arti h i h i Cari Halaman
E βˆ0 = β0 dan E βˆ1 = β1 .

Sedangkan untuk varians βj diperoleh hasil yang berbeda untuk kasus σ 2 diketahui dan Kembali
σ 2 tidak diketahui.

6.3.1.1. Distribusi βˆj bila σ 2 diketahui Layar Penuh

Varians dari penduga-penduga βˆj dapat diturunkan dengan menggunakan prinsip bahwa:
Tutup
1. untuk suatu konstanta c, maka Var(cY ) = c2 Var (Y );

Keluar
P P
2. Bahwa Yi dan Yi0 adalah saling bebas karenanya Var[ Yi ]] = [Var(Yi )] ;

3. Var(Yi ) = σ 2 , sedang komponen yang lain berfungsi sebagai peubah tidak acak se-
hingga tidak memiliki varians dan dalam konteks ini dapat diaggap sebagai konstanta
c.
MIPA-Unej
Dari bentuk penduga βˆ0 , seperti pada persamaan (6.7) dan βˆ1 pada persamaan (6.8),
dapat lihat bahwa βˆj merupakan kombinasi linier dari Yi yang mempunyai varians σ 2 .
Dari kenyataan ini dapat dihitung varians βˆj seperti berikut ini. Daftar Isi

Teorema 6.1. Jika σ 2 diketahui, maka varians dari penduga βˆ0 dan βˆ1 masing masing
adalah: Judul

X̄ 2
 
1
Var(βˆ0 ) = +P σ2 (6.11)
n (Xi − X̄)2 JJ J I II
σ2
Var(βˆ1 ) = P (6.12)
(Xi − X̄)2
Hal. 160 dari 245

Kita lihat bahwa sesungguhnya penduga βˆj merupakan kombinasi linier dari Yi yang
Cari Halaman
berdistribusi normal. Oleh karena itu jika σ 2 diketahui maka masing-masing penduga βj
berdistribusi normal dengan varians seperti pada Teorema 6.1. Dengan demikian bisa kita
simpulkan teorema berikut
Kembali

Teorema 6.2. Jika σ diketahui dan var (βˆj ) dihitung seperti pada Teorema 6.1, maka
2

Layar Penuh
β̂ − βj
qj ∼ N (0, 1) (6.13)
var(βˆj )
Tutup

Keluar
6.3.1.2. Distribusi βˆj bila σ 2 tidak diketahui
Dalam kenyataannya, σ 2 lebih sering tidak diketahui dan harus diestimasi dari data yang
ada seperti yang telah dilakukan sebelumnya yaitu
n 2
1 X
s2e = σˆ2 = Yi − βˆ0 − βˆ1 Xi MIPA-Unej
n − 2 i=1

Teorema 6.3. Apabila σ 2 tidak lagi diketahui tetapi diganti dengan σˆ2 = s2e , maka
Daftar Isi
var(βˆj ) dinotasikan dengan s2 (βˆj ); j = 0, 1 menjadi
X̄ 2
 
2 ˆ 1
s (β0 ) = +P s2 (6.14a)
n (Xi − X̄)2 e Judul
" #
P 2
1 (1/n Xi ) 2
= +P 2 2 se (6.14b)
n
P
Xi − 1/n ( Xi ) JJ J I II

2
se
s2 (βˆ1 ) = P (6.15a) Hal. 161 dari 245
(Xi − X̄)2
s2e
=P 2 P 2 (6.15b) Cari Halaman
Xi − 1/n ( Xi )
Teorema 6.4. Apabila σ 2 tidak lagi diketahui tetapi diganti dengan σˆ2 = s2e , dan var(βˆj )
diganti dengan s2 (βˆj ); j = 0, 1, terutatama jika ukuran sampel tidak cukup besar, maka Kembali

β̂ − βj β̂j − βj
qj = ∼ tn−2 , (6.16) Layar Penuh
s2 (βˆj ) s(βˆj )

Hasil di atas dapat diperluas untuk banyaknya parameter lebih dari dua misalnya k.
Tutup
Jika ukuran sampel cukup besar, maka sesuai sifat distribusi t, distribusi t akan mendekati
N(0,1). Dengan demikian distribusinya identik dengan sebelumnya, ketika σ 2 diketahui.
Keluar
6.3.2. Estimasi selang dari βj
Sesuai dengan distribusi dari βˆj , maka estimasi selang diperoleh dengan melihat nilai t
atau z yang membatasi prosentase atau luas daerah dari kurva fungsi kepadatannya. Pada
umumnya kita menghitung estimasi selang yang simetrik.
MIPA-Unej
Teorema 6.5. Penduga selang βj untuk tarap kepercayaan (1 − α) × 100% atau tarap
signifikansi α × 100%, jika σ diketahui atau n cukup besar adalah
q q Daftar Isi
βˆj − zα/2 var(βˆj ) ≤ βj ≤ βˆj + zα/2 var(βˆj ) (6.17)

Teorema 6.6. Penduga selang βj untuk tarap kepercayaan (1 − α) × 100%) atau tarap Judul
signifikansi α × 100%, dinotasikan I.K (1 − α) × 100% jika σ tidak diketahui dan n kecil
adalah
βˆj − tα/2,n−2 s(βˆj ) ≤ βj ≤ βˆj + tα/2,n−2 s(βˆj ) (6.18) JJ J I II

6.3.3. Uji Hipotesis Hal. 162 dari 245

Selain menghitung penduga interval dari parameter regresi βj , sering juga dilakukan uji
hipotesis untuk mengetahui apakah koefisien regresi populasi dianggap signifikan atau
Cari Halaman
tidak. Dalam statistika dua macam hipotesis yang biasanya diuji, yaitu hipotesis nol (H0 )
dan hipotesis kerja (HA )
H0 : βj = 0; yaitu βj tidak signifikan Kembali
HA : βj 6= 0; yaitu βj signifikan
Adapun kriteria penerimaan atau penolakan H0 dapat dilakukan dengan beberapa cara
yaitu Layar Penuh

1. melihat I.K (1 − α) × 100% dari βj yaitu


0 ∈ I.K. : H0 diterima Tutup
0 6∈ I.K. : H0 ditolak

Keluar
2. dengan membandingkan nilai statistik yang diperoleh, yaitu

βˆj
th = dengan tα/2,n−k
s(βˆj )

dan dengan kriteria MIPA-Unej

th < tα/2,n−k : H0 diterima


th ≥ tα/2,n−k : H0 ditolak
Daftar Isi
3. Dengan menghitung nilai probabilitas p yang didefinisikan sebagai

p = 2P (T > th ); dengan catatan T ∼ tn−k Judul

Selanjutnya kriteria penerimaan hipotesis adalah


p > 5% : H0 diterima atau βj tidak signifikan JJ J I II
1% < p ≤ 5% : H0 ditolak dengan βj signifikan
p ≤ 1% : H0 ditolak dengan βj sangat signifikan
Hal. 163 dari 245

Jika βj tidak signifikan atau dapat dianggap 0, berarti tidak ada hubungan atau pen-
garuh signifikan Xj terhadap Y . Dengan kata lain tidak ada kontribusi signifikan dari
Cari Halaman
peubah Xj terhadap model yang diperiksa.
Contoh 6.1.
Kembali
Misalkan data untuk 10 pasangan (X, Y ) ditunjukkan oleh tabel berikut.

Layar Penuh

Tutup

Keluar
No X Y
1 10 15
2 12 18
3 10 20
4 15 25
5 13 20 MIPA-Unej
6 10 12
7 14 25
8 11 20 Daftar Isi

9 12 22
10 10 15
Judul
Dari data di atas kita akan melakukan hal-hal sebagai berikut:
1. menghitung koefisien regresi, beserta standar kesalahannya, antara X dan Y dengan JJ J I II
menggunakan metode kuadrat terkecil atau maksimum laikelihood;
2. menentukan penduga selang dari koefisien regresi yang diperoleh; Hal. 164 dari 245

3. menguji hipotesis
Cari Halaman
Estimasi parameter tetap β̂
Untuk persoalan ini, karena hanya ada satu macam peubah penjelas X, maka model yang
Kembali
akan kita pakai adalah
Y = β0 + β1 X
Untuk menghitung bj = βˆj secara manual, maka kita perlu melengkapi tabel di atas Layar Penuh
sebagai berikut:

Tutup

Keluar
No X Y X2 XY Y − βˆ0 + βˆ1 X
1 10 15 100 150 0,8100
2 12 18 144 216 3,2400
3 10 20 100 200 16,8100
4 15 25 225 375 0,4225 MIPA-Unej
5 13 20 169 260 3,0625
6 10 12 100 120 15,2100
Daftar Isi
7 14 25 196 350 1,6900
8 11 20 121 220 4,6225
9 12 22 144 264 4,8400
Judul
10 10 15 100 150 0,8100
Total 117 192 1399 2305 51,5175
JJ J I II
Kolom terakhir sesungguhnya di isi setelah kita memperoleh βˆ0 dan βˆ1 yang diperlukan
guna menghitung σˆ2 .
Dengan demikian Hal. 165 dari 245
Pn Pn Pn
ˆ n i=1 Xi Yi − ( i=1 Xi ) ( i=1 Yi )
β1 = 2
n Xi2 − ( Xi )
P P
Cari Halaman
10 × 2305 − 117 × 192
=
10 × 1399 − 1172
= 1, 95. Kembali

Nilai βˆ1 selanjutnya digunakan untuk menghitung a, yaitu


Layar Penuh
n n
1X 1X
βˆ0 = Yi − β1 Xi
n i=1 n i=1 Tutup

= 192/10 − 1, 95 × 117/10 = 3, 60.


Keluar
Untuk penduga varians diperoleh

σˆ2 = 51, 5175/8 = 6, 44 atau σ̂ = 2, 54.

Karena rumus akhir yang diperoleh dengan metode likelihood maksimum dan de-ngan
metode kuadrat terkecil adalah ekuivalen, maka apabila perhitungan dikerjakan dengan MIPA-Unej
metode likelihood maksimum, akan diperoleh penduga yang sama.
Selanjutnya kita bisa menghitung standar kesalahan dari penduga-penduga di atas.
" # Daftar Isi
P 2
2 ˆ 1 (1/n Xi ) 2
s (β0 ) = +P 2 2 se
n
P
Xi − 1/n ( Xi )
Judul
(1/10‘ × 117)2
 
= 1/10 + × 6, 44
1399 − 1/10 × 1172
JJ J I II
 
136, 89
= 1/10 + × 6, 44 = 29, 30
1399 − 1368, 9
s(βˆ0 ) = 5, 41. Hal. 166 dari 245
s2e
s2 (βˆ1 ) = P 2
Xi2 − 1/n ( Xi )
P
Cari Halaman
6, 44
= = 0, 2140
1399 − 1368, 9
s(βˆ1 ) = 0, 46. Kembali

Penduga selang dari β̂ Layar Penuh

Setelah mendapat standar kesalahan masing-masing penduga, maka selanjutnya kita da-
pat menghitung penduga selang dari masing-masing penduga tersebut untuk selang keper-
Tutup
cayaan yang ditentukan,misalnya 95%. Karena ukuran sampel, 10, tidak cukup besar dan
σ 2 tidak diketahui maka kita menggunakan distribusi t8 sebagai distribusi penduga yang
Keluar
kita dapat. Untuk selang simetrik, secara manual kita peroleh nilai t95%/2,8 adalah 2,31.
Selang kepercayaan 95% masing-masing penduga kita peroleh sebagai berikut.
   
βˆj − t95%/2,8 × s βˆj ≤ βj ≤ βˆj + t95%/2,8 × s βˆj

Setelah memasukkan angka-angka yang didapat sebelumnya maka diperoleh


MIPA-Unej
1. untuk j = 0
(3, 60 − 2, 31 × 5, 41) ≤ β0 ≤ (3, 60 + 2, 31 × 5, 41) Daftar Isi
−8, 90 ≤ β0 ≤ 16, 10

2. Untuk j = 1 Judul

(1, 95 − 2, 31 × 0, 46) ≤ β1 ≤ (3, 60 + 1, 95 × 0, 46)


0.89 ≤ β1 ≤ 3, 01 JJ J I II

Uji hipotesis dari β̂


Hal. 167 dari 245
6.4. Pendekatan Matriks untuk Regresi Berganda
6.4.1. Perluassan hasil untuk Regresi Berganda Cari Halaman

Apabila pada model linier ada lebih dari dua koefisien regresi, misalnya βj , j = 0, 1, 2, . . . , p
dengan k = (p + 1) > 2, maka model linier (regresi) tersebut disebut regresi berganda. Kembali
Hasil-hasil yang telah diperoleh sebelumnya dapat digeneralisasi dengan mudah untuk
kasus berganda diantaranya adalah seperti berikut ini.
Layar Penuh
1. Penduga σ 2 untuk σ yang tidak diketahui adalah
 2
n k−1
1
s2e = σˆ2 =
X X
Yi − βˆj Xij  Tutup
n − k i=1 j=0

Keluar

2. Kesalahan penduga adalah s(βˆj ) = vjj dengan v ∈ V dan V = s2e (XT X)−1

3. Distribusi penduga βˆj adalah

β̂j − βj
∼ tn−k ,
s(βˆj ) MIPA-Unej

4. Selang kepercayaan (1 − α) × 100% untuk βj adalah


Daftar Isi

βˆj − tα/2,n−k s(βˆj ) ≤ βj ≤ βˆj + tα/2,n−k s(βˆj )


Judul
Secara umum, terutama jika parameternya lebih dari 2, maka estimasi parameter lebih
praktis dilakukan dengan menggunakan pendekatan matriks. Hubungan peubah pada per-
samaan (6.1) dapat juga dituliskan dalam bentuk matriks dengan mendefinisikan matriks- JJ J I II
matriks berikut
     
Y1 β0 1 Hal. 168 dari 245
 Y2    β1   2 
1 x 12 · · · x1p
 ..   ..   .. 
     
 .  1 x22 · · · x2p  . .
Y =   ; X = . ..  ; β = β  ;  = 
 

Y

. .. ..   
 i  Cari Halaman
 i  . . . .   j  
 .  . .
 ..  1 xn2 · · · xnp  ..   .. 
Yn βp n Kembali

Sistim persamaan (6.1) selanjutnya dapat dinyatakan dalam bentuk matriks seperti berikut:
Layar Penuh
Y = Xβ +  (6.19)

dengan  dapat dianggap berdistribusi multivariat normal, MVN (Xβ, V). Ketidak saling Tutup
bergantungan antara komponen dalam vektor kesalahan digambarkan oleh bentuk matriks

Keluar
varians kovariansnya yang berbentuk matriks skalar seperti pada persamaan (6.20)
 2 
σ 0 ··· 0
0 σ2 · · · 0 
V = σ2 I =  . (6.20)
 
.. . . .. 
 .. . . .
MIPA-Unej
0 0 · · · σ2

Apabil adata yang dianalisis memiliki varians seperti diatas, maka datanya disebut berfifat
Daftar Isi
homoskedastisitas, sebaliknya jika tidak, maka disebut heteroskedastisitas. Bentuk
varians matriks yang bersifat heteroskedastisitsa dapat dilihat pada persamaan (6.21).
Estimasi bentuk matriks juga dapat dilakukan dengan metode kuadrat terkecil dan kemu- Judul
ngkinan maksimum.  2 
σ1 0 · · · 0
 0 σ22 · · · 0 
JJ J I II
V= . (6.21)
 
.. . . .. 
 .. . . . 
0 0 · · · σn2
Hal. 169 dari 245

6.4.2. Pendekatan Matriks Metode Kuadrat Terkecil


Cari Halaman
Penggunaan matriks dalam menganalisis model linier dapat dibedakan menjadi dua garis
besar yaitu.
1. Dengan melihat bentuk riil matriks dengan unsur-unsurnya, selanjutnya menerap- Kembali

kan turunan pada unsur-unsur matriks tersebut. Terakhir mengenali bentuk ma-
triks hasil yang diperoleh sebagai transformasi dari matriks yag diketahui. Cara ini
Layar Penuh
walaupun menggunakan bentuk matriks tetapi sesungguhnya belum memanfaatkan
sepenuhnya teori matriks dalam mencari turunan unsur-unsurnya.
2. Dengan melihat bentuk umum matriks, selanjutnya menurunkan bentuk matriks Tutup

yang diperoleh dengan menggunakan prinsip-prinsip diferensial matriks. Pada sub


Keluar
berikutnya akan dibahas masing-masing pendekatan di atas untuk lebih memahami
kelebihan dan kekurangan masing-masing.

6.4.2.1. Menggunakan turunan unsur-unsur matriks


Langkah-langkah yang ditepuh dengan pendekatan ini adalah MIPA-Unej

1. Menentukan bentuk matriks dari model linier yang selanjutnya digunakan untuk
mencari bentuk kuadratnya. Daftar Isi
    P 
1 Y1 P x1j βj
 2   Y2   
x2j βj  Judul
    
 ..   ..   .. 

.  .   . 
  =   − P 
 i   Yi   
     xij βj  JJ J I II
.  .   . 
 ..   ..   ..  
n Yn
P
x β nj j
Hal. 170 dari 245

Jadi Q = T  adalah
X  Cari Halaman
Q = T  = e2i
  2 
n p
X  X Kembali
= Yi − xij βj  

i=1 j=1

Layar Penuh

Tutup

Keluar
2. Turunan pertama terhadap β adalah
 Pn 2
 
∂ i=1 [Yi − p j=1 xij βj ]
P h i
Pn Pp
 P ∂β1  −2 i=1 xi1 Y i − j=1 x ij β j
 ∂ ni=1 [Yi −Ppj=1 xij βj ]2   Pn h Pp i

 ∂β2
 

  −2 i=1 xi2 Y i − j=1 x ij β j


. .

MIPA-Unej
  
∂Q  ..   .
.


=  ∂ n Y −Pp x β 2  =  Pn
 P   h i 
∂β i=1 [ i j=1 ij j ]  −2 x Y −
Pp
x β

i=1 ij i j=1 ij j 

 ∂βj   
 ..   ..  Daftar Isi
.
  
 .   h i

Pp 2
n p
 Pn
∂ i=1 [Yi − j=1 xij βj ]
P P
−2 i=1 xip Yi − j=1 xij βj
∂βp Judul
T
= −2X (Y − Xβ)

JJ J I II

Hal. 171 dari 245

Cari Halaman

Kembali

Layar Penuh

Tutup

Keluar
Turunan keduanya adalah
 h i h i
∂ ∂
P P P P
∂β1 ixi1 Yi − j xij βj ··· ∂βp ixi1 Yi − j xij βj
 h i h i
 ∂ P P ∂
P P
i xi2 Yi − j xij βj ··· i xi2 Yi − j xij βj 

 ∂β1 ∂βp
 .. .. .. 
MIPA-Unej
∂2Q 
. . .

= −2
 h i h i 
∂β T ∂β
 ∂ P P ∂
P P 
 ∂β i xij Y i − j xij βj ··· ∂βp i xij Y i − j xij β j 
 1 
 .. .. ..  Daftar Isi

 . . . 

h i h i
∂ ∂
P P P P
∂β1 i xip Yi − j xij βj ··· ∂βp i xip Yi − j xij βj
 P 2 Judul
P P P
··· · · · Pi xi1 xip

P i xi1 i xi1 xi2
P 2
Pi xi1 xij
 i xi2 xi1 i xi2 ··· i xi1 xij ··· i xi1 xip 

.. .. .. ..

 .. .. 
. . . JJ J I II
P . P. 2 P .
 
= 2
 P 
 i ij xi1
x i xij xi2 ··· i xij ··· i x ij xip


 .. .. .. .. .. .. 
. .
P . P . P . P. 2
 
Hal. 172 dari 245
i xip xi1 i xip xi2 ··· i xip xij ··· i xip
= 2XT X
Cari Halaman

6.4.2.2. Menggunakan turunan umum matriks


Langkah-langkah yang ditempuh dalam menurunkan penduga β̂ dengan kuadrat terkecil Kembali

adalah seperti berikut ini.


1. mengubah model menjadi eksplisit terhadap matriks kesalahan, yaitu  = Y − Xβ Layar Penuh

Tutup

Keluar
2. membentuk matriks bentuk kuadrat

Q = T 
= (Y − Xβ)T (Y − Xβ)
= YT Y − 2β T XT Y + β T XT Xβ (6.22) MIPA-Unej

3. mencari turunan pertama dan kedua Q terhadap β (lihat Contoh 5.21 halaman 138).
Daftar Isi
∂Q
= −2XT Y + 2XT Xβ
∂β
= −2 XT Y − XT Xβ
 Judul
(6.23)
∂2Q
= 2XT X. (6.24)
∂β T ∂β JJ J I II

4. menentukan persamaan iterasi Newton-Raphson atau skoring Fisher untuk β, den-


gan mengambil nilai awal untuk β̂ = b0 yaitu Hal. 173 dari 245

−1  T 
b1 = b0 − XT X X Xβ̂ − XT Y
Cari Halaman
−1 T
b1 = b0 + XT X X (Y − Xb0 ) (6.25)

Kembali
Apabila datanya bersifat heteroskedastisitas, maka bentuk kuadrat harus dibobot den-
gan invers matriks varians-kovarians. Metode kuadrat terkecil yang telah dibobot disebut
Weighted Least Square-WLS atau Generalized Least Square-GLS. Dengan menggunakan Layar Penuh
hasil pada Contoh 5.22 halaman 139, maka kita memperoleh persamaan berikut.

Q = (Y − Xβ)T V−1 (Y − Xβ) (6.26) Tutup


−1 T −1
b1 = b0 + XT V−1 X X V (Y − Xb0 ) (6.27)
Keluar
Untuk distribusi normal sesungguhnya solusi langsung tanpa menggunakan iterasi Newton-
Raphson dapat diperoleh dengan mencari solusi

−2 XT Y − XT Xβ = 0 atau − 2 XT V−1 Y − XT V−1 Xβ = 0


 

yang menghasilkan MIPA-Unej


−1
β̂ = XT X XT Y (6.28)
untuk kondisi homoskedastisitas dan
Daftar Isi
T −1
−1 T −1
β̂ = X V X X V Y (6.29)

untuk kondisi heteroskedastisitas. Judul

6.4.3. Pendekatan Matriks untuk Metode Kemungkinan Maksimum JJ J I II


Hasil yang diperoleh pada sub di atas dapat, khususnya turunan likelihood terhadap β,
dapat juga dilakukan secara serempak dengan mengggunakan pendekatan multivariat,
Hal. 174 dari 245
dalam arti semua data respon dapat dianggap merupakan satu kesatuan vektor respon
dengan multivariat normal dengan mean µ = Xβ dan varians-kovarians V = σ 2 I. Fungsi
kepadatan probabilitas dari Y yang berdistribusi multivariat normal (MVN) adalah
Cari Halaman
 
1 1 T
f (Y, µ) = p exp − (Y − µ) V−1 (Y − µ) (6.30)
(2π)n |V| 2
Kembali

Untuk menerapkan metode kemungkinan maksimum dengan pendekatan matriks maka


dapat ditempuh langkah-langkah berikut:
Layar Penuh
1. menganggap Y berdistribusi MVN (Xβ, V) sehingga mempunyai bentuk likelihood
 
1 1 T −1 Tutup
L= p exp − (Y − Xβ) V (Y − Xβ)
(2π)n |V| 2

Keluar
2. menentukan fungsi log-likelihood inti l(β), yaitu
1 1
l(β) = − (Y − Xβ)T V−1 (Y − Xβ) = − Q
2 2
3. menentukanturunan pertama dan kedua likelihood inti terhadap β, yaitu
MIPA-Unej
∂l(β) 1 ∂Q
=−
∂β 2 ∂β
∂ 2 l(β) 1 ∂Q Daftar Isi
=−
∂β T ∂β 2 ∂β T ∂β

4. Sekalipun bentuk turunan pertama dan keduanya sedikit berbeda dengan hasil dari Judul
metode kuadrat terkecil, karena perkalian dengan konstanta − 12 , namun bentuk
akhir dari persamaan iterasi Newton-Raphsonnya adalah identik, karena invers atau
kebalikannya akan saling meniadakan, yaitu JJ J I II
 −1  
1 ∂Q 1 ∂Q
b1 = b0 − − − Hal. 175 dari 245
2 ∂β T ∂β 2 ∂β
 −1  
∂Q ∂Q
= b0 − T
.
∂β ∂β ∂β Cari Halaman

Dengan demikian persamaan di atas akan menghasilkan bentuk iterasi Newton-


Raphson yang identik dengan metode kuadrat terkecil, yaitu Kembali

−1
b1 = b0 + XT V−1 X XT V−1 (Y − Xb0 )
Layar Penuh
Teorema 6.7. Untuk model linier sederhana dengan V = σ 2 I, jika σ diketahui, maka
var(β̂) = σ 2 (XT X)−1 . Jadi secara umum dapat dikatakan bahwa jika σ 2 diketahui, maka
 −1  Tutup
β̂ ∼ M V N β, σ 2 XT X

(6.31)

Keluar
Dari bentuk estimasi di sebelumnya dapat dilihat bahwa β̂ merupakan hasil transfor-
masi dari peubah acak Y, dalam hal ini dapat dianggap bahwa
−1
β̂ = XT V−1 X XT V−1 (Y) + B.

Dengan menggunakan hasil bahwa var(AY + B) = AVAT , maka MIPA-Unej

h −1 −1 T −1
i h iT
Var(β̂) = XT V−1 X
XT V−1 V XT V−1 X X V
Daftar Isi
h −1 T −1 i h −1 i
= XT V−1 X X V V V−1 X XT V−1 X
−1 −1
= XT V−1 X = σ 2 XT X . Judul

Teorema 6.8. Jika σ 2 tidak diketahui, maka diganti dengan


JJ J I II
1 h T i
σˆ2 = s2e = Y Y − β̂XT Y (6.32)
n−k
Hal. 176 dari 245
Bukti:
1 h i
s2e = (Y − Xβ̂)T (Y − Xβ̂) Cari Halaman
n−k
1 h T T
i
= YT Y − β̂ XT Y − YT Xβ̂ + β̂ XT Xβ̂
n−k Kembali

−1 T
Dengan menggunakan hasil bahwa β̂ = XT X XT Y dan kenyataan bahwa β̂ XT Y =
YT Xβ̂, maka diperoleh Layar Penuh

1 h T i
s2e = Y Y − β̂XT Y . Tutup
n−k

Keluar
6.5. Melaporkan nilai probabilitas p
Selain menghitung estimasi interval maupun melakukan uji hipotesis dengan distribusi t
maupun z, paket- paket statistik biasa melaporkan nilai probabilitas yang disebut nilai p
yaitu luas daerah yang berada dibagian ujung yang dibatasi oleh statistik t∗ yaitu
MIPA-Unej
β − β̂
p = P (T ≥ |t∗ | dengan t∗ = .
S(β̂)
Daftar Isi
Untuk uji dua arah yang simetris maka
p = 1 − P (−t∗ ≤ tn−1 ≤ t∗ ).
Judul
Dengan demikian semakin kecil nilai p akan semakin signifikan hasilnnya dan semakin
kuat penolakan H0. Dalam bahasa R perhitungan p dapat dilakukan dengan
p<-2*(1-pt(t,df)) JJ J I II
Teorema 6.9. Penolakan Hipotesis nol (Ho) dengan menggunakan p adalah sebagai
berikut: Ho ditolak pada taraf signifikansi α × 100% jika dan hanya jika p ≤ (α × 100%) Hal. 177 dari 245

Secara individu, uji signifikansi koefisien βˆj dengan menggunakan nilai p dapat di-
lakukan sebagai berikut:
Cari Halaman
1. βˆj sangat signifikan jika p ≤ 1%;

2. βˆj signifikan jika 1% < p ≤ 5%; Kembali

3. βˆj tidak signifikan jika p > 5%;


Layar Penuh

6.6. Ilustrasi Program Komputer


Tutup
Semua hasil-hasil yang telah diperoleh pada bab sebelumnya selanjutnya dapat diimple-
mentasikan pada program komputer yang tersedia misalnya S-Plus atau R.
Keluar
6.6.1. Menulis Program
Untuk keperluan memeriksa sifat-sifat prosedur analisis data yang telah dibicarakan, maka
ada beberapa hal yang harus diimplementasikan dalam komputer diantaranya:
1. mensimulasi data yang memenuhi asumsi sebagaimana diharapkan, misalnya Y ∼
N (Xβ, σ 2 ). Ini berarti untuk mensimulasi data kita harus menenapkan X dan β. MIPA-Unej

2. mengestimasi balik β̂ dari data Y baik dengan cara langsung mapun dengan melalui
iterasi numerik Newton-Raphson. Daftar Isi

3. mengulang-ulang proses 1. dan 2. untuk melihat sifat-sifat penduga β̂ secara umum.


Judul
4. mengimplementasikan program yang dibuat untuk data riil. Implementasi data riil
dalam buku ini selanjutnya dilakukan dengan menggunakan library yang sudah ada
yaitu lm() JJ J I II
Contoh 6.2.
Hal. 178 dari 245
Misalkan kita akan mensimulasi data sederhana dengan ukuran n = 60 X ∼ N (50, 25) (in-
gat bahwa berbeda dengan Y , tidak ada keharusan X untuk mengikuti distribusi tertentu).
Misalkan pula β = (3, 5)T dan varian kesalahan σ 2 adalah 16, artinya Y ∼ N (µ, σ 2 ) Cari Halaman
µ = Xβ dan kita akan memeriksa model

Yi = 3 + 5xi + i i = 1, . . . , 60 Kembali

Untuk membangkitkan data Y, ada dua cara yang bisa ditempuh sesuai dengan sifat
bahwa, jika X ∼ (0, σ 2 ), maka X + C ∼ N (C, σ 2 ). Layar Penuh
2
1. membangkitkan  ∼ N (0, σ ) lalu membangkitkan Y = µ + 
Tutup
n<-60
x<-rnorm(60,50,5)
Keluar
sgm<-4
x<- rnorm(n,0,sgm)
eps<-rnorm(0,sgm)
mu<-3+5*x
ydat<-mu+eps
MIPA-Unej

2. membangkitkan langsung Y ∼ N (µ, σ 2 )


Daftar Isi
ydat<-rnorm(n,mu,sgm)

Selanjutnya dari data yang ada (ydat), kita dapat mengestimasi balik β̂. Untuk model Judul
dengan distribusi normal kita dapat menghitungnya dengan dua cara yaitu dengan cara
langsung melalui
−1 T
β̂ = XT X X Y JJ J I II
atau secara umum (yang berlaku untuk semua distribusi) dengan iterasi Newton-Raphson
−1 Hal. 179 dari 245
b1 = b0 + XT X (Y − Xb0 )

Varians estimator dapat diduga dengan Cari Halaman

−1
V ar(β̂) = σ 2 XT X
Kembali

x.mat<-as.matrix(cbin(1,x))
b.hat<-solve(t(x.mat)%*%xmat)%*%t(x.mat)%*%ydat Layar Penuh
print(b.hat)

Keluaran yang diperoleh dari program diatas adalah Tutup

Keluar
>n<-60
>x<-rnorm(60,50,5)
>sgm<-4
>x<- rnorm(n,0,sgm)
>eps<-rnorm(n,0,sgm)
>mu<-3+5*x MIPA-Unej
>ydat<-mu+eps
>x.mat<-as.matrix(cbind(1,x))
>b.hat<-solve(t(x.mat)%*%x.mat)%*%t(x.mat)%*%ydat Daftar Isi

>print(b.hat)
[,1]
Judul
2.831853
x 4.760870
print(sgm^2*solve(t(x.mat)%*%x.mat))
JJ J I II
x
0.269456174 0.008044395
x 0.008044395 0.023198465 Hal. 180 dari 245

Proses diatas dapat dilakukan berulang-ulang, misalnya 100 kali, selanjutnya dihitung
rata-rata estimator dan variansnya. Hasilya sangat dekat dengan varians yang diperoleh
Cari Halaman
melalui pendugaan diatas. Dalam conoth berikut hasil estimasi dari 100 kali pendugaan
disimpan dalam matriks mh.
>var(mh) # varian dari 100 kali pendugaan Kembali
[,1] [,2]
[1,] 0.301722464 0.006733643
Layar Penuh
[2,] 0.006733643 0.019071798
>mean(mh[,1])
[1] 2.963071
Tutup
>mean(mh[,2])
[1] 4.985726
Keluar
Jika diperlukan kita juga dapat membuat grafik penduga dari 100 ulangan simulasi
yang masing-masing mengambil sampel berukuran 60 (Gambar 6.1). Pengulangan juga
dapat divariasi dengan meningkatkan ukuran sampel pada setiap siulasi. Simulasi ini
sangat baik untuk mengilustrasikan hungungan antara ukuran sampel dan ketelitian pen-
dugaan. Gambaran grafik yang diperoleh apabila dalam setiap pengambilan sampel di-
lakukan penambahan jumlah sampel seperti pada Gambar 6.2. Pada gambar tersebut MIPA-Unej
terlihat bahwa semakin besar ukuran sampel pendugaan semakin teliti, karena varians
pendugaan semakin mengecil.
Daftar Isi

6.6.2. Menggunakan fungsi lm()


Judul
lm() adalah library yang merupakan analisis model linier normal. Format perintahnya
adalah:
lm(formula, data,...) JJ J I II

dengan:
Hal. 181 dari 245
1. formula adalah peubah respon dan peubah-peubah penjelas yang dinyatakan dalam
bentuk y~x1+x2+. . .. Jika ingin menggunakan persamaan regresi tanpa konstanta
maka pada formuladitulis y~x1+x2-1 atau y~0+x1+x2 Cari Halaman

2. data adalah nama data yang akan dianalisis, yang memuat nama-mana peubah yang
dimasukkan pada formula
Kembali

Ada beberapa informasi yang dapat diekstrak dari objek yang dihasilkan fungsi lm()
ini diantaranya:
Layar Penuh
1. coef(objek) untuk mengekstrak koefisien regresi β̂.
2. deviance(objek) untuk mengekstrak jumlah kuadrat sisa. Tutup

3. formula(objek) untuk mengekstrak rumusan model yang dipergunakan


Keluar
4. plot(objek) untuk menghasilkan grafik yaitu seperti grafik sisa, grafik fitted value
dan beberapa disgnostik.
5. print(objek) untuk mencetak hasil singkat analisis.
6. step(objek untuk memeriksa model yang paling cocok dengan cara elihat angka
MIPA-Unej
AIC (Akaike’s Information Criterion) yang paling besar.
7. summary((plot) untuk mencetak lengkap hasil analisis.
Daftar Isi
Untuk mengetahui lebih jauh komponen-komponen yang tersedia dari suatu objek dapat
dilakukan dengan
>names(objek) Judul

Contoh 6.3.
JJ J I II
Misalkan kita ingin mencari persamaan regresi (model linier) dari peubah kecepatan/speed
dan jatrak tempuh distance kendaraan pada data cars.Perintah dan hasil keluaran untuk
mengetahui ringkasan data adalah: Hal. 182 dari 245

> data(cars)
> summary(cars)
Cari Halaman
speed dist
Min. : 4.0 Min. : 2.00
1st Qu.:12.0 1st Qu.: 26.00 Kembali
Median :15.0 Median : 36.00
Mean :15.4 Mean : 42.98
3rd Qu.:19.0 3rd Qu.: 56.00 Layar Penuh
Max. :25.0 Max. :120.00

Setelah diketahui nama peubah-peubahnya maka kita dapat menulis perintah model Tutup
linier seperti berikut:

Keluar
>contoh.lm<-lm(dist~speed,data=cars)
>print(summary(contoh.lm))
Call: lm(formula = dist ~ speed, data = cars)

Residuals:
Min 1Q Median 3Q Max MIPA-Unej
-29.069 -9.525 -2.272 9.215 43.201

Coefficients: Daftar Isi

Estimate Std. Error t value Pr(>|t|)


(Intercept) -17.5791 6.7584 -2.601 0.0123*
Judul
speed 3.9324 0.4155 9.464 1.49e-12 ***
---
Signif. codes: 0 ‘***’ 0.001 ‘**’ 0.01 ‘*’ 0.05 ‘.’ 0.1 ‘ ’ 1 JJ J I II

Residual standard error: 15.38 on 48 degrees of freedom


Multiple R-Squared: 0.6511, Hal. 183 dari 245
Adjusted R-squared: 0.6438
F-statistic: 89.57 on 1 and 48 DF,
p-value:1.490e-12 Cari Halaman

Dari hasil yang diperoleh dapat disimpulkan bahwa konstanta α = β0 adalah signifikan
(1% < p < 5%) dan koefisien speed adalah sangat signifikan (p < 1%). Kembali
Untuk mengetahui komponen-komponen yang dapat diekstrak dari objek contoh.lm
dapat dilakuakn dengan perintah berikut. Sedangkan untuk memanggil salah satu kom-
ponen objek dilakukan dengan NamaObjek$komponen. Layar Penuh

>names(contoh.lm)
[1] "coefficients" "residuals" "effects" "rank" Tutup
[5] "fitted.values" "assign" "qr" "df.residual"

Keluar
[9] "xlevels" "call" "terms" "model"

>contoh.lm$coeff
(Intercept) speed
-17.579095 3.932409
MIPA-Unej

Daftar Isi

Judul

JJ J I II

Hal. 184 dari 245

Cari Halaman

Kembali

Layar Penuh

Tutup

Keluar
MIPA-Unej

Daftar Isi

Judul

JJ J I II

Hal. 185 dari 245

Cari Halaman

Kembali

Layar Penuh

Gambar 6.1: Grafik Penduga βˆ1 = α̂ dari penarikan sampel 100 kali masing-masing beruku-
ran 60. Nilai parameter sebenarnya adalah α = 3. Tutup

Keluar
MIPA-Unej

Daftar Isi

Judul

JJ J I II

Hal. 186 dari 245

Cari Halaman

Kembali

Layar Penuh

Gambar 6.2: Grafil Penduga βˆ1 = α̂ dari beberapa penarikan sampel dengan ukuran mulai
10 sampai dengan 1000. Nilai parameter sebenarnya adalah α = 3. Tutup

Keluar
MIPA-Unej

Bab 7
Daftar Isi

Diagnostik dan Transformasi Judul

JJ J I II
Dalam bab ini kita akan mempelajari beberapa hal dfan prosedur terkait dengan pemerik-
saan dan pemilihan model.
Hal. 187 dari 245

Tujuan Umum Cari Halaman

Tujuan umum pembahasan meteri pada bab ini adalah agar pembaca memahami teknik
dan prosedur untuk memeriksa kecocokan model serta dapat melakukan penanganan jika
Kembali
model yang telah dipilih tidak sesuai.

Tujuan Khusus Layar Penuh

1. dapat membuat dan menggunakan teknik grafik ( qqplot() dan plot(density()))


Tutup
untuk memeriksa distribusi data

Keluar
2. dapat membuat dan menggunakan grafik residu untuk memeriksa kecocokan model;
3. dapat mengatasi jika asumsi model tidak terpenuhi atau model yang dipilih tidak
cocok

MIPA-Unej
Materi
1. Memeriksa distribusi data
Daftar Isi
2. Diagram Pencar Data dan Residu serta penggunaannya
3. Transformasi untuk data yang tidak memenuhi asumsi Judul

4. Pedoman pemilihan model


JJ J I II
7.1. Memeriksa Hubungan Peubah dan Distribusi Data
Hal. 188 dari 245
Sebagaimana telah disebutkan pada bab sebelumnya bahwa bentuk model linear dapat
dituliskan dengan dengan Y = f (X, β) + . Ada beberapa asumsi mendasar dari model
linier ini diantaranya: Cari Halaman

(i) fungsi f adalah fungsi linier;


(ii) mean dari kesalahan i yaitu E(i ) adalah 0 Kembali

(iii) varians kesalahan adalah konstan, yaitu σ 2 dan


Layar Penuh
(iv) distribusi kesalahan adalah normal.
Pemeriksaan terhadap asumsi diatas dapat dilakukan baik melalui uji statistika maupun
Tutup
secara intuitif menggunakan grafik. Dalam buku ini hanya dibahas pemeriksaan asumsi
secara intuitif menggunakan grafik/diagram.
Keluar
7.1.1. Diagram pencar data
Pemeriksaan terhadap asumsi kelineran dalam fungsi f dapat dilakukan secara kasar den-
gan menggambar diagram percar dari data maupun residu. Dari pencaran data akan dapat
diperoleh gambaran secara kasar apakah hubungan antara X dan Y mengikuti hubungan
linear atau hubungan kuadratik atau yang lainnya. MIPA-Unej
Diagram pencar data dengan berbagai jenis fungsi dan distribusi dapat dilihat pada
berbagai gambar berikut:
Daftar Isi
1. Gambar 7.1 dan Gambar 7.2 adalah grafik dari data dengan hubungan Y = f (X), β) =
β0 + β1 X yang berupa fungsi linier. Dari gambar-gamber tersebut terlihat bahwa
pencaran data terletak pada suatu garis lurus. Dekat tidaknya pencaran data dengan Judul
suatu garis sangat bergantung pada besarnya varians semakin besar variansnya se-
makin jauh datanya dari garis sehingga semakin tidak kelihatan kalau data tersebut
membentuk suatu garis lurus. Namun kedua grafk tersebut mempunyai perbedaan JJ J I II
dari kekonstanan varians yang terkait dengan jenis distribusi datanya.
2. Gambar 7.3 adalah grafik dari data dengan hubungan Y = f (X, β) = β0 +β1 X 2 . dari Hal. 189 dari 245
Gambar terlihat bahwa pecaran dadatnya berbetuk parabola yang mengindikasikan
bahwa hubungannya adalah hubungan kuadratik.
Cari Halaman
3. Gambar 7.4 adalah grafik dari data dengan hubungan Y = f (X, β) = β0 e(β1 X) . Dari
diagram pencar terlihat sebaran data mengikuti grafik eksponensial.
Kembali

Layar Penuh

Tutup

Keluar
MIPA-Unej

Daftar Isi

Judul

JJ J I II

Hal. 190 dari 245

Cari Halaman

Kembali

Layar Penuh

Gambar 7.1: Grafik Pencar Data dengan Hubungan Linear dan Varians Relatif Konstan
Tutup

Keluar
MIPA-Unej

Daftar Isi

Judul

JJ J I II

Hal. 191 dari 245

Cari Halaman

Kembali

Layar Penuh

Gambar 7.2: Grafik Pencar Data dengan hubungan Linear tetapi Varians Relatif tidak
Konstan Tutup

Keluar
MIPA-Unej

Daftar Isi

Judul

JJ J I II

Hal. 192 dari 245

Cari Halaman

Kembali

Layar Penuh

Gambar 7.3: Grafik Pencar Data dengan hubungan nonlinear


Tutup

Keluar
MIPA-Unej

Daftar Isi

Judul

JJ J I II

Hal. 193 dari 245

Cari Halaman

Kembali

Gambar 7.4: Grafik Pencar Data dengan Hubungan Eksponensial


Layar Penuh

Tutup

Keluar
7.1.2. Diagram Pencar Sisa/ Residu
Residu atau sisa adalah selisih antara nilai observasi (observed value) dengan nilai dugaan
yang diperoleh melalui garis regresi (predicted value). Residu ini merupakan penduga
dari kesalahan atau error. Secara geometris, sebenarnya pencaran residu ini sama dengan
pencaran data hanya sumbu X nya ditransformasi berimpit dengan garis regresi. Syarat MIPA-Unej
kekonstanan varians ditunjukkan oleh adanya sebaran merata sehingga lebar sebaran dari
kiri ke kanan relatif konstant (Gambar 7.5 bagian kiri). Adanya ketidak konstanan varians
ditandai dengan lebar sebaran yang tidak konstan dari kiri ke kanan (Gambar 7.5 bagian Daftar Isi
kanan). Data yang mempunyai varians konstan disebut bersifat homoskedastisitas se-
baliknya disebut bersifat heteroskedastisitas.
Judul

7.1.3. Memeriksa distribusi data


Untuk memeriksa distribusi data, secara grafis dapat dilakukan dengan membuat grafik JJ J I II
QQNorm atau Grafik Densitas. QQNorm pada dasarnya adalah grafik yang mennyajikan
sebaran quantil normal teoritis, dengan quantil data. Apabila datanya berdistribusi nor-
mal maka sebarannya akan mendekati garis lurus. Penyimpangan yang sangat mencolok Hal. 194 dari 245

pada ujung-ujung grafik menunjukkan datanya menyimpang dari distribusi normal. Pada
Gambar 7.6 diberikan grafik QQNorm dari data yang berdistribusi normal dan yang tidak
Cari Halaman
berdistribusi normal. Pada grafik untuk data ke dua, selain terlihat menyimpang dari
garis lurus di bagian ujung atas, yang berarti datanya cenderung tidak simetris ke kanan.
Simetris tidaknya sebaran data juga dapat dilihat melalui plot densitas. Gambar 7.7 me-
Kembali
nunjukkan grafik sebaran peluang dari masing-masing data yang sebelumnya digambar
dengan QQNorm. Dari grafik ini juga terlihat data ke dua cenderung lebih tidak simetris.
Layar Penuh

Tutup

Keluar
MIPA-Unej

Daftar Isi

Judul

JJ J I II

Hal. 195 dari 245

Cari Halaman

Kembali

Gambar 7.5: Grafik Pencar Sisa Data yang memenuhi homoskedastisitas (atas) dan Data
bersifat heteroskedastisitas(bawah). Layar Penuh

Tutup

Keluar
MIPA-Unej

Daftar Isi

Judul

JJ J I II

Hal. 196 dari 245

Cari Halaman

Gambar 7.6: Grafik Quantile dari Data Berdistribusi Normal (kiri) dan Data Cenderung Tidak Kembali
Berdistribusi Normal (Kanan)

Layar Penuh

Tutup

Keluar
MIPA-Unej

Daftar Isi

Judul

JJ J I II

Hal. 197 dari 245

Cari Halaman

Gambar 7.7: Grafik Sebaran Peluang dari Data Berdistribusi Normal (lebih simetris, warna biru) Kembali
dan Data Tidak Berdistribusi Normal (tidak siumetris, warna merah)

Layar Penuh

Tutup

Keluar
7.1.4. Memeriksa Model Melalui Diagram
Pada dasarnya model statistika dikembangkan untuk mengakomodasi jenis data dengan
kondisi tertentu, misalnya adanya hubungan linier, saling independen dan bersifat random.
Cara yang paling sederhana untuk memeriksa kondisi linieritas, dan kekonstanan koefisien
variasi adalah dengan menggunakan pendekatan intuitif melalui pemeriksaan pencaran MIPA-Unej
residu (sisa).
Dari sifat residu sebagai penduga dari kesalahan, maka dapat disimpulkan bahwa secara
geometris pencaran residu harus memenuhi beberapa sifat yaitu: Daftar Isi

1. sebaran mengikuti pola garis lurus;


2. menyebar secara acak dan seimbang di sekitar 0; Judul

3. lebar sebaran dari kiri ke kanan relatif konstan.


JJ J I II
Sebaran data dapat diperiksa dengan menggunakan grafik QQNorm dengan ciri-ciri:
1. sebaran titik mengikuti garis lurus,
Hal. 198 dari 245
2. penyimpangan kentara terhadap garis lurus menunjukkan data menyimpang dari
sebaran normal dan salah satunya ditunjukkan adanya ketidak simetrisan sebaran.
Cari Halaman
Paket/library lm() secara automatis menyediakan 4 macam grafik yang dapat diper-
gunakan untuk mendiagnostik model diantaranya:
Kembali
1. grafik QQNorm untuk memeriksa sebaran data;
2. grafik sisa untuk melihat kelinieran dan juga kekonstannan varians;
Layar Penuh
3. grafik residual baku dan nilai ekspektasi;
4. grafik Jarak Cook (Cook’s Distance) untuk memeriksa adanya pencilan (outlier).
Tutup
Lihat Faraway[?, Bab 7] untuk pembahasan dan diagnostik berhubungan dengan
pencilan.
Keluar
Berikut adalah contoh keluaran grafik yang digabung menjadi satu tampilan yang dapat
dibuat dengan perintah plot(NamaObjek).

MIPA-Unej

Daftar Isi

Judul

JJ J I II

Hal. 199 dari 245

Cari Halaman

Kembali

Layar Penuh

Gambar 7.8: Grafik Diagnostik dari Objek yang Dihasilkan oleh Fungsi lm(). Grafik me- Tutup
nunjukkan data relatif memenuhi asumsi Model Linier Normal

Keluar
MIPA-Unej

Daftar Isi

Judul

JJ J I II

Hal. 200 dari 245

Cari Halaman

Kembali

Gambar 7.9: Grafik Diagnostik dari Objek yang Dihasilkan oleh Fungsi lm(). Grafik me- Layar Penuh
nunjukkan data tidak memenuhi asumsi Model Linier Normal, yang ditandai
dengan adanya hubungan tidak linier dan pencilan
Tutup

Keluar
7.1.5. Memeriksa Model melalui AIC
Pemeriksaan dapat juga dilakukan dengan menggunakan kriteria informasi Akaike (AIC/Akaike’s
Information Criterion) yang menghitung perimbangan antara besarnya likelihood dengan
banyaknya variabel dalam model.
AIC = −2l(θ̂) + 2q, (7.1) MIPA-Unej

dengan q adalah banyaknya parameter dalam model. Untuk pembahasan lebih mendalam
tentang AIC dapat dilihat pada Akaike [1], Chamber & Hastie [5] dan Venables & Ripley Daftar Isi
[36] serta Hjorth [13].
Model yang dianggap terbaik adalah model dengan nilai AIC terbesar. Nilai AIC dapat
diakses dengan memberikan perintah step(objel.lm). Pada contoh berikut ditunjukkan Judul

bahwa regresi Y terhadap X1 , X2 , X3 secara serempak tidak menunjukkan adanya koefisien


yang signifikan, tetapi melalui perintah step() dapat diketahui bahwa nilai AIC tertinggi
JJ J I II
(319.91) diperoleh dengan hanya memilih X1 dengan konstanta.
Coefficients:
Estimate Std. Error t value Pr(>|t|) Hal. 201 dari 245
(Intercept) 0.181126 1.501696 0.121 0.904
x1 1.329038 0.905420 1.468 0.145
x2 -0.005625 0.049842 -0.113 0.910
x3 0.866053 0.896847 0.966 0.337 Cari Halaman

step(lm2) Start: AIC= 131.17


y ~ x1 + x2 + x3 Kembali

Df Sum of Sq RSS AIC


- x2 1 0.05 342.74 129.18 Layar Penuh
- x3 1 3.33 346.02 130.13
<none> 342.70 131.17
- x1 1 7.69 350.39 131.39
Tutup
Step: AIC= 129.18
y ~ x1 + x3
Keluar
Df Sum of Sq RSS AIC
- x3 1 3.45 346.19 128.18
<none> 342.74 129.18
- x1 1 7.65 350.39 129.39
Step: AIC= 128.18
y ~ x1 MIPA-Unej

Df Sum of Sq RSS AIC


<none> 346.19 128.18
Daftar Isi
- x1 1 2056.31 2402.50 319.91
Call: lm(formula = y ~ x1)
Judul
Coefficients:
(Intercept) x1
0.05799 2.19945
JJ J I II
Apabila dalam model hanya dimasukkan X1 , tanpa konstanta, maka akan diperoleh
hasil yang lebih signifikan untuk koefisien X1 dengan p ≈ 0 dan AIC=703. Hal. 202 dari 245
Coefficients:
Estimate Std. Error t value Pr(>|t|)
x1 2.20321 0.01225 179.9 <2e-16 *** Cari Halaman
---
Signif. codes: 0 ‘***’ 0.001 ‘**’ 0.01 ‘*’ 0.05 ‘.’ 0.1 ‘ ’ 1
step(lm2) Start: AIC= 126.18 Kembali
y ~ x1 - 1
Df Sum of Sq RSS AIC
<none> 346 126 Layar Penuh
- x1 1 113118 113465 703
======
Call: lm(formula = y ~ x1 - 1)
Tutup
Coefficients:

Keluar
x1
2.203

7.2. Transformasi Data


MIPA-Unej
Bagi data yang distribusinya, atau distribusi residunya menunjukkan adanya penyimpan-
gan dari syarat yang harus dipenuhi bagi penggunaan regresi linier klasik, maka harus
dilakukan remidi sehingga persyaratan tersebut menjadi relatif terpenuhi. Remidi yang
Daftar Isi
dilakukan biasanya adalah dengan mentransformasikan data dengan suatu fungsi yang
sesuai. Selanjutnya data hasil transformasi ini yang dianalisis dengan regresi klasik.
Bentuk grafik dan transformasi yang mungkin dilakukan untuk mengatasi ketidak lin- Judul
ieran diantaranya adalah seperti berikut ini.
1. Kurva naik dengan terbuka ke atas maka transformasi dilakukan
√ pada Y dan tran-
JJ J I II
formasi yang bisa dicoba adalah Y1 = log(Y ) atau Y1 = Y atau Y1 = 1/Y seperti
terlihat pada Gambar 7.10
Hal. 203 dari 245
2. Kurva naik dan terbuka kebawah maka transformasi dilakukan
√ pada X dan trandfor-
masi yang bisa dicoba adalah X1 = log(X) atau X1 = X atau X1 = 1/X seperti
terlihat pada Gambar 7.10
Cari Halaman

3. Kurva menurun dan terbuka keatas maka transformasi dapat dilakukan pada X atau
Y dengan salah satu transformasi sebelumnya.
Kembali
Untuk √menstabilkan varians dapat dicoba beberapa transformasi diantaranya Y1 =
log(Y ), Y1 Y atau Y1 = 1/Y . Pada Gambar 7.12 terlihat bahwa transformasi tidak
selalu dapat menstabilkan varians. Layar Penuh

Tutup

Keluar
7.3. Bacaan Lebih Lanjut
Pembahasan mengenai Model Linier Normal dapat dilihat pada Bowerman et al. [3] dan
Neter et al. [25]. Aplikasi R untuk Regresi yang cukup intensif dapat dilihat pada Faraway
[?]. Pembaca dapat juga membaca aplikasi SPlus untuk Analisis Statistika Modern oleh
Venables & Ripley [36]. MIPA-Unej

7.4. Latihan Soal- Soal Daftar Isi

1. Tentukan model dan asumsi model linier normal


Judul
2. Tentukan bentuk biasa (sumasi) maupun matriks dari jumlah kuadrat kesalahan.
3. Tuliskan bentuk akhir (dalam bentuk vektor), persamaan iterasi Skoring Fisher un-
tuk mengestimasi parameter regresi pada model linier sederhana dengan metode JJ J I II
kuadrat terkecil
4. Tuliskan bentuk akhir (dalam bentuk vektor), persamaan iterasi Skoring Fisher un- Hal. 204 dari 245

tuk mengestimasi parameter regresi pada model linier sederhana dengan metode
likelihood maksimum
Cari Halaman
5. Jelaskan distribusi penduga likelihood, baik untuk sampel besar maupun untuk sam-
pel kecil.
Kembali

Layar Penuh

Tutup

Keluar
MIPA-Unej

Daftar Isi

Judul

JJ J I II

Hal. 205 dari 245

Cari Halaman

Kembali

Layar Penuh

Tutup

Keluar
MIPA-Unej

Daftar Isi

Judul

JJ J I II

Hal. 206 dari 245

Cari Halaman

Kembali

Layar Penuh

Tutup

Keluar
MIPA-Unej

Daftar Isi

Judul

JJ J I II

Hal. 207 dari 245

Cari Halaman

Kembali

Layar Penuh

Tutup

Keluar
MIPA-Unej

Daftar Isi

Judul

JJ J I II

Hal. 208 dari 245

Cari Halaman

Kembali

Layar Penuh

Tutup

Keluar
MIPA-Unej

Bab 8
Daftar Isi

Distribusi Keluarga Eksponensial Judul

JJ J I II
Model Linier telah digunakan selama bertahun-tahun dalam analisis statistika, khususnya
untuk menganalisis data kontinu. Tehnik ini berdasarkan pada asuumsi pada distribusi
Hal. 209 dari 245
normal pada komponen acaknya dan adanya hubungan linier antara mean dengan kompo-
nen sistematik (peubah eksplanatorinya). Model linier ini selanjutnya mengalami perkem-
bangan dengan memberikan asumsi yang lebih longgar baik pada distribusinya maupun Cari Halaman
pada hubungan antara mean dengan komponen sistimetiknya. Distribusi data tidak lagi
terbatas pada distribusi normal tetapi merupakan anggota dari distribusi keluarga ekspo-
nensial. Pada bab ini akan dibicarakan keluarga eksponensial dengan sifat-sifatnya serta Kembali
beberapa distribusi penting, baik diskrit maupun kontinu, yang termasuk dalam kelompok
keluarga eksponensial.
Layar Penuh

Tutup

Keluar
Tujuan Umum
Mahasiswa dapat menuliskan bentuk umum, momen dan bentuk-bentuk khusus distribusi
keluarga eksponensial (exponential family distribution)

MIPA-Unej
Tujuan Khusus
Masiswa dapat: Daftar Isi

1. menuliskan bentuk umum distribusi keluarga eksponensial


2. menurunkan mean dan varians distribusi keluarga eksponensial Judul

3. menyebutkan bentuk-bentuk khusus distribusi keluarga eksponensial


JJ J I II

Materi
Hal. 210 dari 245
1. Bentuk umum distribusi keluarga eksponensial
2. Mean dan varians distribusi keluarga eksponensial Cari Halaman

3. beberapa bentuk khusus distribusi keluarga eksponensial


Kembali

8.1. Bentuk Umum


Kita mulai dengan definisi formal dari distribusi keluarga eksponensial. Ada beberapa Layar Penuh

variasi mendefinisikan distribusi keluarga ekspoensial dan dalam buku ini dipilih yag paling
sederhana.
Tutup

Keluar
Definisi 8.1. Suatu peubah acak Y dengan fungsi kepadatan probabilitas (f.k.p.) f dan
parameter θ dikatakan menjadi anggota distribusi keluarga eksponensial, jika f dapat diny-
atakan sebagai:
f (y; θ) = exp[a(y)b(θ) + c(θ) + d(y)]. (8.1)
Pada (8.1) s(y) = exp(d(y)); t(θ) = exp(c(θ)). Dalam beberapa kasus fungsi a, b, c dan MIPA-Unej
d mungkin mengandung parameter lain yang disebut parameter nuisan/gangguan [9, pages
22-23] yang pada tidak menjadi perhatian utama dan sering dianggap sebagai parameter
yang telah diketahui (tidak perlu diestimasi). 1 Daftar Isi
Dalam keadaan khusus a(y) = y, maka(8.1) menjadi:
f (y) = exp[yb(θ) + c(θ) + d(y)] (8.2)
Judul

dan (8.2) disebut bentuk kanonik dari distribusi keluarga eksponensial dan b(θ) disebut
parameter natural dari distribusinya.
JJ J I II

8.2. Mean dan Varians Distribusi Keluarga Eksponensial


Hal. 211 dari 245

8.2.1. Fungsi Skor [U] E[U ] danVar[U ]


Dobson [9, halaman 23-24] mendefinisikan fungsi skor dari f (y) terhadap θ sebagai U = Cari Halaman
dl(y)/dθ, dengan l(y) = log f (y) = ln f (y). Perhitungan E[U ] dan Var[U ] dibutuhkan
untuk menurunkan mean dan varians Y atau dalam bentuk yang lebih umum, E[a(Y )]
dan Var[a(Y )]. Kembali

d l(y)
U = , (8.3)
dθ Layar Penuh
1 d f (y)
= . (8.4)
f (y) d θ
Tutup
1 McCullagh dan Nelder dalam [21] mendefinisikan distribusi keluarga eksponensial dengan parameter
gangguan yang eksplisit, φ.

Keluar
Dengan demikian
Z
1 d f (y)
E[U ] = f (y) dy,
f (y) d θ
Z
d f (y)
= dy, MIPA-Unej

Z
d
= f (y) dy,
dθ Daftar Isi
d1
= ,

= 0. (8.5) Judul

Persamaan (8.3) dan (8.4) juga menghasilkan:


JJ J I II
d f (y) d l(y)
= f (y) . (8.6)
dθ dθ
Hal. 212 dari 245
Selanjutnya kita perlu menunjukkan bahwa E[U 0 ] + E[U 2 ] = 0.
 
dU
E[U 0 ] = E , Cari Halaman

d
= E[U ], (8.7)
dθ Kembali
d0
= ,

Layar Penuh
= 0. (8.8)

Tutup

Keluar
Tetapi dari (8.6), ruas kanan dari (8.7) menjadi ddθ d dl(y)
R
θ f (y) dy. Jadi, bersama dengan
(8.6), menghasilkan:
Z
d d l(y)
0 = f (y) dy,
dθ dθ
Z 2 Z
d l(y) d l(y) d f (y) MIPA-Unej
= f (y) dy + dy,
d θ2 dθ dθ
Z 2 Z  2
d l(y) d l(y) Daftar Isi
= f (y) dy + f (y) dy,
d θ2 dθ
Z Z
= U 0 f (y) dy + U 2 f (y) dy Judul

= E[U 0 ] + E[U 2 ].

Jadi, JJ J I II
0 2
E[−U ] = E[U ],
dan Hal. 213 dari 245
Var[U ] = E[−U 0 ]. (8.9)
Untuk persamaan(8.1), U dan U 0 terhadap θ adalah: Cari Halaman

d
U = [a(y)b(θ) + c(θ) + d(y)],

Kembali
= a(y)b0 (θ) + c0 (θ), (8.10)

dan
Layar Penuh
U 0 = a(y)b00 (θ) + c00 (θ). (8.11)

8.2.2. Mean dan Varians dari a(Y ) Tutup

Mean dan varians distribusi keluarga eksponensial diberikan dalam teorema berikut ini.
Keluar
Teorema 8.1. Mean dan varians a(Y ) yang didefinisikan seperti pada Definisi 8.1 mem-
punyai mean dan varians, masing-masing
c0 (θ)
E[a(Y )] = − . (8.12)
b0 (θ)
MIPA-Unej
b00 (θ)c0 (θ) − c00 (θ)b0 (θ)
Var[a(Y )] = . (8.13)
[b0 (θ)]3
Daftar Isi
Mean dan varians dari a(Y ) diturunkan seperti berikut ini. Dari persamaan (8.5) dan
persamaan (8.10), diperoleh bahwa E[a(Y ))b0 (θ) + c0 (θ)] = 0, karenanya
Judul
c0 (θ)
E[a(Y )] = − 0 .
b (θ)
JJ J I II
Dari persamaan (8.9) dan persamaan (8.11), dan menerapkan persamaan (8.12), diperoleh
bahwa
Var[U ] = E[−U 0 ], Hal. 214 dari 245

= E [−a(Y )b00 (θ) − c00 (θ)] ,


= −E[a(Y )]b00 (θ) − c00 (θ), Cari Halaman
c0 (θ)
= − 0 b00 (θ) − c00 (θ). (8.14)
b (θ)
Kembali
Tetapi dengan persamaan (8.10),
Var[U ] = [b0 (θ)]2 Var[a(Y )]. (8.15) Layar Penuh

Akibatnya, persamaan (8.14) dan persamaan (8.15) menghasilkan


b00 (θ)c0 (θ) − c00 (θ)b0 (θ) Tutup
Var[a(Y )] = .
[b0 (θ)]3
Keluar
8.3. Beberapa Bentuk Khusus
Berikut ini adalah beberapa distribusi yang menjadi anggota keluarga eksponensial.

8.3.1. Distribusi Poisson dengan parameter θ.


MIPA-Unej
Peubah acak Y yang berdistribusi Poisson mempunyai fungsi kepadatan probabilitas

θy e−θ Daftar Isi


f (y) = , y = 0, 1, 2, 3, · · ·
y!
= exp[y log θ − θ − log y!]. (8.16)
Judul
Pada persamaan (8.16) b(θ) = log θ, c(θ) = −θ, d(y) = − log y. Dengan demikian E[Y ] =
θ dan Var[Y ] = θ.
JJ J I II
8.3.2. Distribusi Normal dengan parameter θ dan σ
Bentuk fungsi kepadatan probabilitas dari peubah acak Y yang berdistribusi Normal Hal. 215 dari 245

adalah
 2 ! Cari Halaman
1 1 y−θ
f (y) = √ exp − , −∞ < y < ∞,
2πσ 2 σ
y2 θ2
 
yθ 1 2 Kembali
= exp − 2 + 2 − 2 − log(2πσ ) . (8.17)
2σ σ 2σ 2

Pada persamaan (8.17) b(θ) = θ/σ 2 , d(y) = y 2 /(2σ 2 ) dan c(θ) = −θ2 /(2σ 2 ) − 21 log(2πσ 2 ). Layar Penuh

Di sini σ adalah parameter nuisan. Jadi, E[Y ] = θ dan Var[Y ] = σ 2 .


Tutup

Keluar
8.3.3. Distribusi Gamma dengan parameters θ dan skala φ.
Peubah acak Y yang berdistribusi Gamma mempunyai fungsi kepadatan probabilitas

θ(yθ)φ−1 e−yθ
f (y) = , y > 0,
Γ(φ)
MIPA-Unej
= exp[−yθ + (φ − 1) log y + φ log θ − log Γ(φ)]. (8.18)

Padapersamaan (8.18) b(θ) = −θ, a(y) = y, c(θ) = φ log θ − log Γ(φ), d(y) = (φ − 1) log y.
Daftar Isi
Maka, E[Y ] = φ/θ, Var[Y ] = φ/θ2 . Di sini φ adalah parameter nuisan.

8.3.4. Distribusi lainnya Judul

Beberapa distribusi lainnya yang termasuk keluarga eksponensial adalah:


• Distribusi Pareto JJ J I II

• Distribusi Binomial
Hal. 216 dari 245
• Distribusi Eksponensial
• Distribusi Binomial Negatif
Cari Halaman

• Distribusi Invers Gauss [21, page 22] dan [9, page 34]
Rangkuman beberapa distribusi khusus diberikan pada Tabel 8.1. Kembali
Sebagai ilustrasi pada Gambar 8.1 ditunjukkan densitas data dengan distribusi Normal
Standar dan Gamma Standar dengan berbagai mean. Gambar menunjukkan bahwa untuk
distribusi Gamma seiring dengan kenaikan mean, varians ikut meningkat, sedangkan untuk Layar Penuh
distribusi normal, variansnya konatan. Pada Gambar 8.2 ditunjukkan sebaran data dengan
hubungan antara X dan Y yang sama tetapi yang sar=tu berdistribusi Normal yang satu
Tutup
berdistribusi Gamma. Terlihat untuk sebaran data Gamma, selain sebarannya lebih lebar
dari sebaran normal, semakin ke kanan semakin lebar sebaran data.
Keluar
Tabel 8.1: Rangkuman Distribusi Anggota Keluarga Eksponensial
Normal Poisson Gamma

MIPA-Unej
Notasi N (µ, σ 2 ) P (µ) G(µ, ν)
φ σ2 1 ν −1
2
b(θ)  2 θ /2 exp(θ) − log(−θ)
Daftar Isi

y
c() − 21 φ + log(2πφ) − log(y!) ν log(νy) − log y − log Γ(ν)
µ(θ) = E(Y ; θ) θ exp(θ) −1/θ
link kanonik identitas log resiprokal Judul
θ=η=µ θ = η = log µ θ = η = 1/µ

JJ J I II

Hal. 217 dari 245

Tabel 8.2: Ciri-ciri khas Distribusi Keluarga Eksponensial


No Nama Jenis Ruang Rentang Hubungan lain-lain Cari Halaman
Varians dan
Mean
1 Binomial diskrit 1, 2, · · · , n linier simetrik Kembali
2 Poisson diskrit 1, 2, · · · linier tidak
simetrk
Layar Penuh
3 Gamma kontinue 0<x<∞ kuadratik tidak
simetrik
4 Normal kontinue −∞ < x < ∞ bebas simetrik
Tutup

Keluar
MIPA-Unej

Daftar Isi

Judul

JJ J I II

Hal. 218 dari 245

Cari Halaman

Kembali

Gambar 8.1: Plot Densitas dari sampel dengan berbagai mean dengan ukuran sampel 100 Layar Penuh

Tutup

Keluar
MIPA-Unej

Daftar Isi

Judul

JJ J I II

Hal. 219 dari 245

Cari Halaman

Kembali

Gambar 8.2: Sebaran Data dengan ukuran sampel 100 dengan distribusi Normal (b) dan
Gamma (r) Layar Penuh

Tutup

Keluar
MIPA-Unej

Bab 9
Daftar Isi

Model Linier Tergeneralisasi Judul

JJ J I II

9.1. Konsep Dasar


Hal. 220 dari 245
Selama bertahun- tahun, model linier berikut telah digunakan secara luas dalam analisis
statistika terutama untuk data kontinu:
Cari Halaman
Y = Xβ + e (9.1)

dengan Y = (Y1 , · · · , Yi , · · · , YN )T , e = (e1 , · · · , eN )T , X = suatu N × p matriks peubah


Kembali
eksplanatori atau sering disebut matriks desain dan β = (β1 , · · · , βp )T . Lihat Dobson [9,
subbab 3.1] dan McCullagh & Nelder [21, hal. 7].
Asumsi yang mendasari model ini adalah: ei ∼ NID(0,σ 2 ), dan karenanya Y ∼ Layar Penuh
N(E[Xβ], Iσ 2 ). Asumsi-asumsi ini dapat diuraikan secara lebih terinci seperti berikut:
(i) Yi berdistribusi normal dan saling bebas dengan varians konstan, yaitu Yi ∼ NID(
Tutup
xi T β, σ 2 ), dengan xi T adalah peubah eksplanatori untuk Yi dan sama dengan baris
ke-i dari matriks X.
Keluar
(ii) Ada suatu fungsi (misalkan η) dari peubah eksplanatori yang disebut prediktor linier
dari peubah respon Y . Pada kasus di atas fungsi ini adalah ηi = xT
i β.

(iii) Ada hubungan antara prediktor (ηi ) dan komponen acak (µi ). Dalam kasus di atas
ηi = µi ( yaitu hubungan identitas).
MIPA-Unej
Model linier persamaan (9.1) dengan asumsi di atas sering disebut Model Linier Klasik.
Dalam Model Linier Tergeneralisasi (MLT) atau Generalized Linear Models (GLM), asumsi
model lebih longgar dan digeneralisasikan dengan cara berikut: Daftar Isi

(i) Asumsi (i) diperluas untuk memungkinkan Yi mempunyai distribusi yang sama dan
saling bebas dari distribusi keluarga eksponensial.
Judul
(ii) Pada asumsi (iii) hubungan antara komponen prediktor (η) dan komponen acak (µ)
tidak mesti identitas, tetapi diperluas untuk suatu fungsi monoton dan diferensiabel,
g, yaitu ηi = g(µi ). Fungsi g disebut fungsi link. JJ J I II

Jadi dalam model linier tergeneralisasi ada tiga komponen yang penting yaitu:
Hal. 221 dari 245
1. komponen distribusi, yaitu y berdistribusi keluarga eksponensial;

2. komponen prediktor linier, yaitu η = xT β; Cari Halaman

3. fungsi link yaitu fungsi monoton dan diferensiabel g sehingga g(µ) = η.


Diantara fungsi- fungsi link yang dapat digunakan, ada yang disebut fungsi link kanonik Kembali
yaitu fungsi hubungan yang terjadi pada saat b(θ) = η. Untuk distribusi binomial fungsi
yang bisa dipakai adalah:
Layar Penuh
(i) fungsi logit, yang nerupakan fungsi link kanonik yaitu
 
µ Tutup
η = log ;
1−µ

Keluar
(ii) fungsi probit, yaitu
η = Φ−1 (µ);
dimana Φ adalah fungsi kumulatif dari distribusi Normal; dan

(iii) komplementari ln-ln, yaitu


MIPA-Unej
η = log[− log(1 − µ)].

Daftar Isi
Sedangkan untuk distribusi Normal dan Poisson masing- masing mempunyai link kanonik
identitas dan log. Rangkuman distribusi keluarga eksponensial termasuk fungsi link
kanonik untuk tiap-tiap distribusi dapat dilihat pada Tabel 8.1 pada buku ini (Lihat Judul
juga McCullagh & Nelder [21, hal. 23]).

JJ J I II
9.2. Estimasi pada Model Linier Tergeneralisasi
Ada dua metode yang biasa digunakan untuk mengestimasi parameter pada model linier.
Hal. 222 dari 245
Metode tersebut adalah dan method kuadrat terkecil dan metode likelihood maksimum.

1. Metode kuadrat terkecil dalam mengestimasi parameter berkaitan dengan mencari


Cari Halaman
nilai yang sedekat mungkin dengan nilai harapannya[2, section 4.9]. Hal ini biasanya
dilakukan dengan meminimalkan jumlah kuadrat kesalahan (galat). Metode ini ser-
ing disebut metode kuadrat terkecil. Sebagai contoh, misalkan mencari penduga Kembali
dari parameter β dari model persamaan (9.1), dari Model Linier Normal. Langkah-
langkah yang bisa ditempuh, secara umum adalah
Layar Penuh
(a) Mula-mula model persamaan (9.1) disusun seperti

e = y − Xβ.
Tutup

Keluar
(b) Bentuk kuadrat dari kuadrat kesalahan didefinisikan sebagai
N
X
Q= e2i = eT e = (y − Xβ)T (y − Xβ).
i=1

MIPA-Unej
Dalam bentuk ini informasi tentang distribusi ei sama sekali belum diperhi-
tungkan dalam perhitungan estimasi parameter.
(c) Biasanya Q dibobot dengan invers dari matriks varians-kovarians (misalkan Daftar Isi
V ). Penduga kuadrat terkecil terbobot b dari β selanjutnya diperoleh dengan
meminimalkan
Qw = (y − Xβ)T V−1 (y − Xβ) Judul

terhadap parameter β, yaitu, menyelesaikan persamaan (untuk model linier


klasik) JJ J I II
∂Qw
= −2XT V−1 (y − Xβ) = O, (9.2)
∂β
atau ekuivalen dengan menyelesaikan Persamaan Normal Hal. 223 dari 245

XT V−1 Xb = XT V−1 y.
Cari Halaman
(Lihat juga Searle [26, subbab 12.8]).

Dengan metode kuadrat terkecil terbobot, maka sebagian informasi tentang dis- Kembali
tribusi ei , yaitu variansnya, telah diperhitungkan dalam menghitung penduga pa-
rameter.
Layar Penuh
2. Metode likelihood maksimum likelihood digunakan khususnya jika distribusi peubah
acaknya diasumsian diketahui [6, Subbab 9.2]. Penduga likelihood maksimum (p.l.m.)
dari suatu parameter θ biasanya dinotasikan dengan θ̂ dan didefinisikan sebagai nilai Tutup

Keluar
dari ruang rentang parameter ( misalnya Ω) yang memaksimumkan fungsi likelihood
L(y, θ), yaitu:

θ̂ ∈ Ω adalah p.l.m jika dan hanya jika L(θ̂) ≥ L(θ), ∀ θ ∈ Ω.

Penghitungan θ̂ dapat dilakukan dalam beberapa langkah berikut: MIPA-Unej

(i) Langkah pertama adalah menentukan fungsi dari data y. Ini merupakan fungsi
kepadatan bersama dari y, hanya saja dalam hal ini yang menjadi peubah yang Daftar Isi
tidak diketahui adalah parameter θ, sedangkan y adalah data yang diketahui.
N
Y
Jika datanya saling bebas maka L(y, θ) = f (yi , θ) Judul
i=1
(ii) Langkah berikutnya adalah mencari maksimum dari l(y, θ) = log L(y, θ) ter-
hadap θ. Ini merupakan maksimum lokal dari fungsi l terhadap θ. Maka θ̂ JJ J I II
adalah:
a. nilai θ sedemikian sehinga dl/dθ = 0 dan d2 l/dθ2 < 0; atau Hal. 224 dari 245
b. Nilai batas dari ruang parameter jika Ω terbatas.

Persamaan dl/dθ = 0, umumnya tidak dapat diselesaikan secara aljabar ata analitik, Cari Halaman
oleh karenanya metode iterasi, seperti metode Newton-Raphson, sering diaplikasikan.

Kembali
9.2.1. Metode Penduga Kuadrat Terkecil
Sebagaimana pada model linier klasik, metode kuadrat terkecil mencari penduga yang
menyebban terjadinya kesalahan minimum. Untuk itu persamaan (9.1) perlu diubah Layar Penuh
sehingga bentuk e menjadi eksplisit selanjutnya diturunkan minimum dari eT e, seperti
pada persamaan (9.2). Tambahan komplikasi terjadi karena dalam MLT hubungan an-
tara prediktor linier dan komponen acak tidak mesti beupa identitas, tetapi melalui suatu Tutup

Keluar
fungsi yang disebut fungsi link, g(). Dengan demikian
 T
∂Qw ∂µ ∂Qw
=
∂β ∂η ∂µ
 T
∂µ
= −2 XT V−1 (y − µ), MIPA-Unej
∂η
= 0,
Daftar Isi
 
∂µ
dimana adalah matrik diagonal berordo N dengan unsur diagonal ke-i adalah
∂η
Judul
 
∂µi
yang nilainya bergantung pada fungsi link yang digunakan. Untuk mengaplikasikan
∂ηi
metode iterasi Newton-Raphson, diperluka bentuk turuann kedua yang dapat dinyatakan
JJ J I II
dengan

∂ 2 Qw
 
∂µ ∂Qw
= Hal. 225 dari 245
∂β T ∂β ∂η ∂µ
 T  
∂µ T −1 ∂µ
=2 X V X . Cari Halaman
∂η ∂η

Dengan demikian bentuk lengkap iterasi Newton Raphson dengan Metode Kuadrat Terke-
cil Terbobot weighted Least Square adalah Kembali

" T  #−1 " T #


∂µ ∂µ ∂µ
b1 = b0 + XT V−1 X XT V−1 (y − µ) , (9.3) Layar Penuh
∂η ∂η ∂η

dengan g(µ) = Xβ. Tutup

Keluar
9.2.2. Metode Penduga Likelihood Maksimum
P.l.m. untuk model linier tergeneralisasi dapat diturunkan sebagai berikut (lihat Dobson
[9, Lampiran 1]):
N
X N
X N
X N
X
l(y) = yi b(θi ) + c(θi ) + c(θi ) + d(yi ), (9.4) MIPA-Unej

i=1 i=1 i=1 i=1

dengan Daftar Isi


c0 (θi )
E[Yi ] = µi = − 0 berdasarkan persamaan (8.12), (9.5)
b (θi )
Judul
and
p
X
g(µi ) = xT
i β = xij βj = ηi . (9.6)
j=1 JJ J I II

Untuk memperoleh β̂, kita gunakan persamaan:


Hal. 226 dari 245
N
X ∂li
Uj = ,
i=1
∂βj
Cari Halaman

dengan
li = yi b(θi ) + c(θi ) + d(yi ) (9.7)
Kembali
dan
∂li ∂li ∂θi ∂µi
= .
∂βj ∂θi ∂µi ∂βj Layar Penuh

Tutup

Keluar
Dari persamaan (9.7) kita peroleh

∂li
= yi b0 (θi ) + c0 (θi ),
∂θi
c0 (θi )
 
= b0 (θi ) yi + 0
b (θi ) MIPA-Unej
0
= b (θi )(yi − µi ) by persamaan (8.12). (9.8)
Daftar Isi
Dari persamaan (9.5), kita peroleh
 00
c (θi )b0 (θi ) − b00 (θi )c0 (θi )

∂µi
= , Judul
∂θi [b0 (θi )]2
= b0 (θi )Var[Yi ] berdasar persamaan (8.13).
JJ J I II
Oleh karena itu,
∂θi 1
= 0 . (9.9)
∂µi b (θi ) Var[Yi ] Hal. 227 dari 245

Sekarang
∂µi ∂µi ∂ηi
= , Cari Halaman
∂βj ∂ηi ∂βj
dan dari persamaan (9.6) kita peroleh
Kembali
∂ηi
= xij ,
∂βj
Layar Penuh
dan  
∂µi ∂µi
= xij . (9.10)
∂βj ∂ηi Tutup

Keluar
Oleh karena itu
b0 (θi )(yi − µi )
 
∂li ∂µi
= xij berdasar (9.8),(9.9),(9.10),
∂βj b0 (θi ) Var[Yi ] ∂ηi
  
(yi − µi )xij ∂µi
= , (9.11)
Var(Yi ) ∂ηi MIPA-Unej

dan
N N   
X ∂li X (yi − µi )xij ∂µi Daftar Isi
Uj = = (9.12)
i=1
∂βj i=1
Var(Yi ) ∂ηi
for j = 1, 2, 3, · · · , p. Umumnya, metode iterasi seperti metode Newton-Raphson , digu- Judul
nakan untuk menyelesaikan sistim persamaan U = O. Pendekatan iterasi ke- m-th dari
f (x) = 0 dengan Newton-Raphson adalah:
JJ J I II
f (x(m−1) )
 
(m) (m−1)
x =x − ,
f 0 (x(m−1) )
Hal. 228 dari 245
(m−1)
dengan x adalah nilai pendekatan dari x setelah iterasi ke-(m − 1). Dengan cara
yang sama untuk persamaan U = O, rumus iterasinya adalah:
Cari Halaman
h i−1
0 (m−1)
b(m) = b(m−1) − U U(m−1) (9.13)
Kembali
dengan U(m−1) adalah vektor U yang dinilai pada β = b(m−1) dan
(m−1)
∂2l
 Layar Penuh
0 (m−1)
U = (9.14)
∂βj ∂βk
Tutup
adalah matriks turunan kedua dari fungsi likelihood l yang dinilai pada β = b(m−1) . Pada
prakteknya digunakan metode alternatif disebut metode skoring. Dalam metode skoring
Keluar
ini matriks persamaan (9.14) diganti dengan suatu matriks nilai harapan

∂2l
 
E .
∂βj ∂βk

Matriks di atas sama dengan negatif dari mariks varians-kovarians atau matriks infor- MIPA-Unej
masi dari Uj ’s, I = E[UUT ] dengan unsur ke − (j, k) adalah
 
∂l ∂l Daftar Isi
Ijk = E ,
∂βj ∂βk
∂2l
 
= −E (9.15) Judul
∂βj ∂βk

untuk j, k = 1, 2, 3, · · · , p (lihat [9, Appendix A] dan [26, 341]). Oleh karena itu persamaan
(9.13) menjadi JJ J I II
(m−1) −1 (m−1)
b(m) = b(m−1) + [I ] U .
Dengan mengalikan (perkalian kiri) kedua ruas dengan I (m−1) akan menghasilkan Hal. 229 dari 245

I (m−1) b(m) = I (m−1) b(m−1) + U(m−1) . (9.16)


Cari Halaman
2
Dari persamaan (9.12) dan persamaan (9.15) dan mengetahui bahwa E[Yi −µi ] = Var[Yi ],
dapat dilihat bahwa unsur (j, k) dari I adalah
Kembali
N  2
X xij xik ∂µi
Ijk = . (9.17)
i=1
Var[Yi ] ∂ηi Layar Penuh

Persamaan persamaan (9.17) menunjukkan bahwa I dapat dinyatakan sebagai


Tutup
I = XT W,

Keluar
dengan W adalah matriks diagonal N × N dengan unsur-unsur:
 2
1 ∂µi
wii = . (9.18)
Var[Yi ] ∂ηi

Dengan menggunakan “bobot” yang sama, matriks W, persamaan (9.12) dapat diny- MIPA-Unej
atakan dalam bentuk matriks seperti
 
∂l ∂η Daftar Isi
= XT W (y − µ) (9.19)
∂β ∂µ
   
∂η ∂ηi Judul
dengan is suatu matriks diagonal N ×N dengan unsur diagonal ke-i adalah .
∂µ ∂µi
Oleh karena itu bentuk umum dari persamaan penduga dengan menggunakan iterasi
Newton Raphson adalah JJ J I II
 
(m) (m−1) T −1 T ∂η
b =b + X WX X W (9.20a)
∂µ Hal. 230 dari 245

atau dalam bentuknya yang asli


Cari Halaman
   T !−1
∂µ 1 ∂µ
b(m) =b(m−1)
+ X T
X
∂η var(Y) ∂η
     Kembali
T 1 ∂µ
X (Y − µ) (9.20b)
var(Y) ∂η
Layar Penuh
Dapat ditunjukkan bahwa persamaan (9.20) identik dengan (9.3) sehingga dikatakan pen-
duga maksimum likelihood untuk GLM identik dengan metode kuadrat terkecil terbobot.
Ada bentuk lain yang juga biasa dipakan dalam merumuskan bentuk iterasi Newtton- Tutup
Raphson untuk GLM yang dapat diturunkan seperti berikut ini. Berdasar persamaan

Keluar
(9.12) dan persamaan (9.17) dapat diunjukkan bahwa ruas kanan dari persamaan per-
samaan (9.16) adalah suatu vektor dengan unsur-unsur berbentuk:
p XN  2 N  
X xij xik ∂µi (m−1)
X (yi − µi )xij ∂µi
bk + .
i=1
Var[Yi ] ∂ηi i=1
Var[Yi ] ∂ηi
k=1
MIPA-Unej
yang sama dengan
p
N X N  −1
X (m−1)
X ∂µi Daftar Isi
xij wii xik bk + xij wii (yi − µi ) .
i=1 k=1 i=1
∂ηi

Ini berarti bahwa id dapat dinyatakan sebagai XT Wz dengan unsur-unsur vektor z adalah Judul
berbentuk:
p  −1
X (m−1) ∂µi
zi = xik bk + (yi − µi ) , JJ J I II
∂ηi
k=1

dimana i = 1, 2, 3, · · · , N , dan, µi dan ∂µi / ∂ηi dinilsi pada β = b(m−1) . Persamaan


persamaan (9.16) menjadi Hal. 231 dari 245
T (m) T
X WXb = X Wz. (9.21)
Selanjutnya β̂ diambil sama dengan b(m) untuk m yang benar . Persamaan persamaan Cari Halaman
(9.21) menunjukkan bahwa p.l.m. dari MLT ekuivalen dengan kuadrat terkecil terbobot
[9, page 41].
Kembali

9.3. Inferensi pada Model Linier Tergeneralisasi


Layar Penuh
Jika penduga θ̂ konsisten, maka dia juga secara asimptotik takbiased, yaitu
lim E[θ̂] = θ. Tutup
N →∞

Hal- hal berikut merupakan konsekuensi.


Keluar
(i) Untuk N besar, berdasar teorema limit pusat:

θ̂ − θ
q ≈ N (0, 1).
Var[θ̂]
MIPA-Unej
(ii) Sama dengan(i),
(θ̂ − θ)2
≈ χ21 . Daftar Isi
Var[θ̂]
Dalam bentuk matriks dapat dinyatakan sebagai
Judul
(θ̂ − θ)T V− (θ̂ − θ) ≈ χ2q . (9.22)

Dengan q adalah rank matriks V, dan V− adalah: JJ J I II


– invers tergeneralisasi dari matriks varians-kovarians V jika V singular, atau
– invers dari varians-kovarians matriks V jika V adalah non-singular. Hal. 232 dari 245

Untuk MLT dengan p parameter dan skore terhadap βj = U , maka kita memiliki:
Cari Halaman
∂l
Uj = j = 1, 2, 3, · · · , p,
∂βj
Kembali
E[Uj ] = 0 [see persamaan (8.5)],
dengan matriks varians-kovarians I=E[UUT ]. Jadi analog dengan persamaan (9.22) seti-
Layar Penuh
daknya secara asimtotik:

U ∼ N (0, I) or UT I −1 U ∼ χ2p , (9.23)


Tutup

dengan asumsi I adalah non-singular [9].


Keluar
9.4. Distribusi dari Penduga Likelihood Maksimum
Pendekatan Taylor tingkat ke-n untuk fungsi f pada x = a adalah:
1 1
f (x) = f (a) + f 0 (a)(x − a) + f 00 (a)(x − a)2 + · · · + f n (a)(x − a)n .
2 n!
MIPA-Unej
Dengan mengambil pendekatan Taylor tingkat pertama pada fungsi skor U(β) pada β = b
(sebagai penduga), kita peroleh:
Daftar Isi
U(β) ≈ U (b) + H(b)(β − b), (9.24)
dengan
∂l
   
U1 ∂β1 Judul
∂l
U2  
 
  ∂β2 
U(b) =  = ,

.. .. 
.   .

   JJ J I II
Up ∂l
∂βp βj =bj
and Hal. 233 dari 245
∂2l ∂2l ∂2l
 
∂β12 ∂β1 ∂β2 ··· ∂β1 ∂βp
∂2l ∂2l ∂2l
 
 ∂β2 ∂β1 ∂β22
··· ∂β2 ∂βp

H(b) =  .
  Cari Halaman
.. .. .. .. 

 . . . . 

∂2l ∂2l ∂2l
∂βp ∂β1 ∂βp ∂β2 ··· ∂βp2 βj =bj Kembali
Secara asimptotik H = E[H]. Berdasar persamaan (9.15) maka −I=E[H]([9]. Oleh karena
itupersamaan (9.24) menjadi:
Layar Penuh
U(β) ≈ U (b) − I(β − b). (9.25)
Tetapi, b adalah maksimum dari l, akibatnya U (b)=0. Oleh karena itu persamaan
Tutup
(9.25) menjadi
U(β) ≈ −I(β − b)
Keluar
dan
b − β ≈ I −1 U(β). (9.26)
Dengan mengambil nilai harapan darii kedua ruas persamaan (9.26), lalu menerapkan
bahwa E[U]=0, dapat disimpilkan bahwa E[b] = β. Akibatnya secara asimtotik b adalah
takbias. Lebih lanjut, matriks varians-kovarians dari b − β (sebut saja, V ) dapat dihitung MIPA-Unej
sebagai berikut:

E[(b − β)(b − β)T ] = E[I −1 U(I −1 U)T ], Daftar Isi


= E[I −1 UUT I −1 ],

Karena I adalah konstan dan simetrik, maka Judul

E[(b − β)(b − β)T ] = I −1 E[UUT ]I −1


JJ J I II
= I −1 II −1 = I −1 . (9.27)

Oleh karena itu Hal. 234 dari 245


(b − β)T I(b − β) ≈ χ2p . (9.28)
Statistik persamaan (9.28) disebut statistik Wald. Statistik ini ekuivalen dengan (b − β) ∼
Cari Halaman
N (0, I −1 ), yang membawa konsekuensi bahwa, secara asimtotik, untuk N besar:
(i) standar kesalahan (s.k.) dari penduga masing-masing bj adalah
Kembali

s.k.(bj ) = vjj ,

dengan vjj adalah unsur ke-(j, j) dari I −1 ; Layar Penuh

(ii) interval kepercayaan dua sisi (1 − α) × 100% untuk βj adalah


Tutup

bj ± zα/2 vjj ,

Keluar
dalam prakteknya, jika N kecil digunakan pendekatan distribusi t, yaitu

bj ± tN −p,α/2 vjj ;

dengan p menunjukkann banyaknya parameter βj yang akan diduga.


MIPA-Unej
(iii) korelasi antara penduga adalah:
vjk
corr(bj bk ) = √ √ . Daftar Isi
vjj vkk

9.5. Kecocokan Model Judul

Kecocokan model ditentukan dengan membandingkan model yang diajukan dengan model
lengkap atau model maksimal maximal model/ saturated model. Model maksimal didefin- JJ J I II
isikan sebagai:
(i) GLM/LMT yang mempunyai distribusi yang sama dengan model yang diajukan; Hal. 235 dari 245

(ii) model menggunakan fungsi link yang sama dengan model yang diajukan; dan

(iii) model yang mempunyai jumlah parameter sama dengan banyaknya pengamatan. Cari Halaman

Dengan kata lain “ia menyediakan informasi lengkap dari data” (Lihat Dobson [9,
hal. 56]).
Kembali
Untuk menguji kecocokan model, dipergunakan statistik perbandingan likelihood:

L(bmax ; y) Layar Penuh


λ= ,
L(b; y)
atau Tutup
log λ = l(bmax ; y) − l(b; y). (9.29)

Keluar
Distribusi dari persamaan (9.29) dapat diturunkan dengan menggunakan pendekatan Tay-
lor ordo dua dari likelihood l ada titik penduga β̂ = b.

l(β; y) = l(b; y) + (β − b)U(b) + 12 (β − b)T H(b)(β − b). (9.30)

Dengan argumen analog dengan persamaan (9.25), persamaan (9.30) dapat diseder- MIPA-Unej
hanakan menjadi:
1
l(b; y) − l(β; y) = (b − β)T I(b − β). (9.31)
2 Daftar Isi
Ini berarti
2[l(b; y) − l(β; y)] ≈ chi2p , (9.32)
Judul
dengan syarat I matriks dengan rank penuh atau matriks non singular.

JJ J I II
9.6. Devians dan Distribusinya
Statistics persamaan (9.29) dapat dimodifikasi dengan cara berikut sehingga pendekatan Hal. 236 dari 245
distribusinya dapat dikenali.

D = 2 log λ = 2[l(bmax ; y) − l(b; y)]. (9.33) Cari Halaman

D disebut the devians. Persamaan persamaan (9.33) dapat disusun lagi menjadi:
Kembali
D = 2[l(bmax ; y) − l(βmax ; y)
−(l(b; y) − l(β; y))
+(l(βmax ; y) − l(β; y))]. (9.34) Layar Penuh

Berdasar persamaan (9.32), bagian pertama dari ruas kanan dari persamaan (9.34) berdis-
tribusi χ2N karena memiliki N parameter. Bagian ketiga mendekati 0 jika model yang Tutup

ditentukan dengan jumlah parameter p sama baiknya dengan model maksimal. Bagian
Keluar
kedua, berdistribusi χ2p . Oleh karena itu jika bagian pertama saling bebas dengan bagian
kedua, D mendekati berdistribusi χ2N −p (lihat juga [14, page 154]). Statistik persamaan
(9.33) dapat juga dipergunakan untuk menguji apakah suatu model sama baiknya dengan
model yang lainnya (yang memiliki parameter berbeda, lihat [9, hal. 60-64]). Misal-
nya, untuk menentukan apakah model dengan jumlah parameter p secara signifikan lebih
baik dari model dengan jumlah parameter q (dengan q < p), kita menggunakan statistik MIPA-Unej
berikut:

4D = Dq − Dp Daftar Isi

= 2[l(bmax ; y) − l(bq ; y)]


− 2[l(bmax ; y) − l(bp ; y)] (9.35) Judul
= 2[l(bp ; y) − l(bq ; y)]. (9.36)

Berdasar persamaan (9.33) bagian pertama dari persamaan (9.35) adalah ∼ χ2N −q dan JJ J I II
bagian kedua adalah ∼ χ2N −p . Oleh karena itu sepanjang kedua bagian ini saling bebas,
maka persamaan (9.36) adalah ∼ χ2p−q .
Cara lain untuk memeriksa kecocokan model dan assumsinya adalah dengan menggu- Hal. 237 dari 245

nakan analisis grafik dari sisa/residu. Detil dari metode ini dapat diperoleh pada Dobson
[9, bab 5] dan Neter et al. [25, chapter 2 ]
Cari Halaman

9.7. Ilustrasi GLM dengan R


Kembali
glm(formula, family = (link=), data, x = FALSE, y = TRUE, contrasts =, ...)

formula Seperti umumnya pada model linier, formula berbentuk y x1+x2 ... Layar Penuh

family Pilihan family yang tersedia adalah


Tutup
binomial(link = "logit")
gaussian(link ="identity")
Keluar
Gamma(link = "inverse")
inverse.gaussian(link = "1/mu^2")
poisson(link = "log")
quasi(link = "identity", variance = "constant")
quasibinomial(link = "logit")
quasipoisson(link = "log") MIPA-Unej

Pada Contoh 4.1 terindikasi bahwa data berat ayam tidak mengikuti distribusi Normal.
Daftar Isi
Untuk itu kita akan bandingkan hasil yang diperoleh dengan menggunakan analisis biasa
lm() dan analisis glm.
Judul

JJ J I II

Hal. 238 dari 245

Cari Halaman

Kembali

Layar Penuh

Tutup

Keluar
MIPA-Unej

Bab 10
Daftar Isi

Generalized Estimating Equation Judul

JJ J I II

10.1. Model Marjinal


Hal. 239 dari 245
Perhatikan bahwa model linier mempunyai bentuk umum yang telah diuraikan pada bab
sebelumnnya yaitu:
Y = Xβ +  (10.1) Cari Halaman

Dalam perkembangannya di lapangan, ada kemungkinan baik  maupun Y tidak lagi


berdistribusi normal. Apabila data yang tidak berdistribusi normal ini masih saling bebas, Kembali
maka model linier yang mempelajari hubungan peubah untuk jenis data ini disebut model
linier tergeneralisasi (Generalized Linear Models, untuk selanjutnya disingkat GLM). Pem-
bahasan tentang GLM telah dibahas pada Bab 8 dan Bab 9. Referensi yang membahas Layar Penuh
secara komprehensif tentang GLM diberikan oleh McCullagh & Nelder [21]. Jika Yi tidak
berdistribusi normal, maka pada persamaan di atas terjadi perubahan asumsi yaitu:
Tutup

Keluar
1. hubungan yang ada antara ekspektasi/rataan dan prediktor linier adalah
g(µ) = η
dengan g(.) adalah fungsi monoton dan diferensiabel yang disebut fungsi link;
2. sedangkan variansnya menjadi MIPA-Unej

V ar(Y ) = ψv(µ),
dengan ψ adalah parameter skala yang bukan menjadi perhatian utama sehingga Daftar Isi
sering diasumsikan diketahui. Fungsi v() disebut fungsi varians yang bentuk khusus-
nya bergantung pada jenis distribusinya, misalnya untuk distribusi Poisson, secara
umum berlaku v(µ) = ψµ, yaitu berlaku hubungan linier antara mean dan varians Judul
pada distribusi Poisson.
Apabila data yang tidak berdistribusi normal tersebut juga tidak saling bebas, dengan JJ J I II
kata lain Yi bukanlah respon tunggal tetapi merupakan vektor respon, Yi = (Yi1 , Yi2 , Yij Yit )T .
Diggle et al.[8] menguraikan beberapa metode analisis utuk jenis respon ini, salah satu di-
antaranya, yang banyak digunakan adalah model marjinal. Dalam sebuah model marjinal, Hal. 240 dari 245
regresi dari respon terhadap peubah eksplanatori dimodelkan secara terpisah dengan ko-
relasi dalam unit/subjeknya. Dalam regresi tersebut, ekspektasi marjinal E(Yij ) dimodel
sebagai fungsi dari peubah bebas atau peubah eksplanatori (X). Ekspektasi marjinal Cari Halaman
adalah rata- rata respon dari subpopulasi yang memiliki peubah eksplanatori yang sama.
Model marjinal secara khusus memiliki asumsi:
Kembali
1. Ekspektasi marjinal, E(Yij ) = µij , bergantung pada vektor peubah eksplanatori
xij dengan hubungan g(µij ) = xij β, dengan g(.) adalah fungsi link yang diketahui
seperti misalnya logit untuk respon binomial, dan β adalah vektor parameter yang Layar Penuh
akan diduga;
2. Varians marjinal tergantung pada rataan atau ekspektasi marjinal menurut hubun-
Tutup
gan V ar(Yij ) = φv(µij ), dengan v(.) adalah fungsi varians yang diketahui dan φ
adalah parameter skala yang mungkin perlu diduga juga
Keluar
3. Korelasi antara Yij dan Yik adalah sebuah fungsi dari rataan marjinal dan mungkin
juga parameter - parameter tambahan , yaitu Corr(Yij , Yik ) = ψ(µij ; µik ; α) dimana
ψ(.) adalah sebuah fungsi yang disumsikan diketahui (Diggle et al. [8]).
Model marjinal untuk data yang berkorelasi merupakan analogi dan generalisasi alami
dari GLM untuk data saling bebas. MIPA-Unej

10.2. Quasi-Likelihood dan Generalized Estimating Equations (GEE) Daftar Isi

Dalam model linier yang peubah responnya masih saling bebas, meskipun tidak berdis-
tribusi normal, fungsi likelihoodnya relatif mudah dievaluasi dan dimaksimumkan. Metode Judul
yang menganalisis data yang tidak berdistribusi normal tetapi masih saling bebas disebut
GLM. Untuk data yang tidak saling bebas, dengan model marjinal, kita hanya menen-
tukan bentuk rataan (sebagai momen pertama) dan matriks varians-kovariansnya (seba- JJ J I II
gai momen kedua). Untuk distribusi normal, kedua momen ini telah cukup menentukan
fungsi likelihoodnya, namun tidak demikian halnya dengan distribusi lainnya seperti dis-
tribusi binomial, poisson dan gamma, misalnya. Untuk mengetahui keseluruhan likelihood Hal. 241 dari 245
diperlukan asumsi-asumsi lainnya. Meskipun dengan asumsi-asumsi tambahan, likelihood
seringkali tetap sulit ditentukan dan melibatkan banyak paremeter gangguan (nuisance)
selain parameter regresi (β) dan parameter korelasi (misalnya,α) yang harus diduga. Un- Cari Halaman

tuk alasan ini, pendekatan yang relatif mudah dipahami dan masuk akal dalam mengatasi
kesulitan ini adalah dengan menggunakan Generalized Estimating Equations (untuk se-
Kembali
lanjutnya disingkat GEE) yang pertama diperkenalkan oleh Liang dan Zeger (yaitu Liang
& Zeger [18], Zeger & Liang [41],[42],Liang et al. [19], Zeger et al. [43]). GEE meru-
pakan sebuah analogi atau generalisasi multivariat dari quasi-likelihood untuk respon sal-
Layar Penuh
ing bebas(Diggle, et al. [8]). Manakala tidak ada fungsi likelihood yang pasti untuk
dijadikan acuan, cukup beralasan untuk menduga/ mengestimasi dengan menyelesaikan
sebuah analogi multivariat dari metode quasi-score yang diperkenalkan Wedderburn [40], Tutup

Keluar
yaitu:
n  T
X ∂µi −1
S(β) = V ar (Yi ) (Yi − µi ) = 0 (10.2)
i=1
∂β

Karena secara umum berlaku g(µij ) = xi β , maka melalui fungsi hungungan (link func-
tion) akan langsung dapat dicari turunan g(.) terhadap η dan karenanya persamaan (10.2) MIPA-Unej
dapat dimodifikasi menjadi
n  T
X ∂µi −1 Daftar Isi
S(β) = Xi T V ar (Yi ) (Yi − µi ) = 0 (10.3)
i=1
∂ηi
Judul
dimana, Yi, µi dan ηi adalah vektor dan V ar(Yi ) merupakan matrik simetris. Dalam
kasus multivariat, ada tambahan komplikasi seperti Sβ yang sesungguhnya juga tergantung
pada parameter β maupun α, karena V ar(Yi ) = φV ar(Yi ; β; α). JJ J I II

10.3. Generalisasi dan Bentuk GEE Hal. 242 dari 245

Dibandingkan dengan persamaan untuk memperoleh penduga pada model linier normal
(NLM) seperti pada persamaan (6.1) pada halaman 146 dan pada model linier tergenaral-
Cari Halaman
isasi (GLM), GEE ini mengalami generalisasi atau perbedaan dalam beberapa hal yaitu:
1. Dalam NLM dan GLM respon Yi , ekspektasi E(Yi ) = µi merupakan variabel uni-
Kembali
variat, sedangkan dalam GEE mereka berupa vektor yang berhubungan dengan sub-
jek ke-i, sebagai konsekuensinya maka model (6.1) harus digeneralisasi dengan mem-
pertimbangkan jumlah untuk seluruh individu/subjek Y;
Layar Penuh
 
∂µi
2. Dalam NLM, nilai adalah 1, pada GLM nilainya berantung pada fungsi
ηi
Tutup
link g(.); sedangkan dalam GEE, karena baik ekspektasi maupun prediktor linier
dua-duanya merupakan vektor berukuran t, maka merupakan ia matrik diagonal
Keluar
 
∂µij
berukuran t × t dengan unsur diagonalnya adalah yang nilainya riilnya juga
∂ηij
masih bergantung pada fungsi link g(.) yang digunakan;
3. Dalam NLM varians dari respon, var(Yi ) = φv(µi ) adalah konstan yaitu σ 2 , dalam
GLM dia adalah tidak konstan tetapi berupa matriks diagonal, sedangkan dalam MIPA-Unej
GEE dia berupa matriks kovarians yang bersifat umum (simetris) yang tidak saja
bergantung pada µ atau β tetapi juga pada φ dan α, yang dapat dinyatakan dalam
bentuk p p Daftar Isi
vi = φ v(µi R(α) v(µi
dimana R(α) adalah matriks korelasi yang diasumsikan, misalnya struktur korelasi
Judul
seragam yang biasa disebut exchageable/uniform, dan lain- lain (Kenward & Smith
[15]). Dengan demikian secara keseluruhan V ar(Y) untuk NLM adalah 2I, untuk
GLM adalah matriks diagonal dengan unsur diagonal V ar(Yi ), sedangan pada GEE JJ J I II
dia adalah matriks diagonal blok dengan blok ke-i adalah Vi . Untuk struktur korelasi
seragam bentuknya matriks korelasinya adalah
  Hal. 243 dari 245
1 α ··· α
α 1 · · · α 
 
 .. .. . . ..  Cari Halaman
. . . .
α α ··· α
Kembali
Dengan mencari turunan, terhadap β, dari ruas kiri pada persamaan (10.3), maka
diperoleh persamaan dalam bentuk iterasi Fisher Scoring, untuk penduga β dapat
dinyatakan dengan persamaan berikut
Layar Penuh

Tutup

Keluar
" n     #−1
X
T ∂µi −1 ∂µi
b(1) =b(0) + Xi [var(Yi )] Xi
i=1
∂ηi ∂ηi
" n   #
X
T ∂µi −1 MIPA-Unej
Xi [var(Yi )] (Yi − µi ) (10.4)
i=1
∂ηi

Daftar Isi
Dalam bentuk iterasi seperti persamaan (10.4), maka varians ”biasa” b, yang biasa
disebut varians naive dapat ditentukan dengan
" #−1 Judul
n    
X ∂µi −1 ∂µi
VN = Xi T [var(Yi )] Xi (10.5)
i=1
∂ηi ∂ηi
JJ J I II
sedangkan varians yang lebih tegar, biasa disebut sandwich/ robust variance diper-
oleh dengan menerapkan hukum bahwa untuk matriks konstanta A, maka var(AY ) =
Hal. 244 dari 245
AT var(Y )A sehingga menghasilkan bentuk seperti pada persamaan

Cari Halaman

Kembali

Layar Penuh

Tutup

Keluar
MIPA-Unej

Daftar Pustaka
Daftar Isi

Judul
[1] H. Akaike. Information theory and extension of maximum likelihood theory. In B.N.
Petrov and F. Csahi, editors, 2nd Symposium on Information Theory, pages 267–281.
Buddapest, 1972. JJ J I II
[2] G.P. Beaumont. Intermediate Mathematical Statistics. Chapman and Hall, London,
1st edition, 1980.
Hal. 245 dari 245
[3] B.L. Bowerman R.T. Cornell and D.A. Dickey. Linear Statistical Models, an Appplied
Approach. Duxbury Press, Boston, 1986.
Cari Halaman
[4] P. Burns. Guide for Unwilling S. http://www.r.project.org, 2002.
[5] J.M. Chamber and T.J. Hastie. Statistical Model in S. Chapman and Hall, London, Kembali
1992.
[6] D.R. Cox and D.V. Hinkley. Theoretical Statistics. Chapman and Hall, London, 1st Layar Penuh
edition, 1974.
[7] M. Davidian and D.M. Giltinan. Nonlinear Models for Repeated Measurement Data.
Tutup
Chapman and Hall, London, 1995.

Keluar
[8] P.J. Diggle, K-Y. Liang and S.L. Zeger. Analysis of Longitudinal Data. Oxford Science
Publications, London, 1st edition, 1994.
[9] A.J. Dobson. An Introduction to Generalized Linear Models. Chapman and Hall,
London, 1990.
MIPA-Unej
[10] E.Paradi. R for Beginner. http://www.r.project.org, 2002.
[11] J.J. Faraway. Practical Regression and Anova Using R. http://www.stat.
Isa.umic.edu/∼faraway/book/, 2002. Daftar Isi

[12] D.A. Harville. Matrix Algebra From a Statistician’s Perspective. Springer, New York,
1997. Judul

[13] J.S.U. Hjortn. Computer Intensive Statistical Methods: Validation, Model Selection
and Bootstap. Chapman & Hall, London, 1994. JJ J I II
[14] R.V. Hogg and A.T. Craig. Introduction to Mathematical Statistics. Prentice-Hall,
Englewood Cliffs, 5th edition, 1995. Hal. 246 dari 245

[15] M.G. Kenward and D.M. Smith. Computing the generalized estimating equation for
repeated measurements. Genstat Newsletter, 32:50–62, 1995.
Cari Halaman
[16] N.M. Laird and J.H. Ware. Random effects models for longitudinal data. Biometrics,
38:963–974, 1982.
Kembali
[17] Y. Lee and J.A. Nelder. Hierarchical generalized linear models. J.R. Statist. Soc.,
58:619–678, 1996.
Layar Penuh
[18] K-Y Liang and S.L. Zeger. Longitudinal data analysis using generalized linear models.
Biometrika, 73:13–22, 1986.
Tutup
[19] K-Y Liang, S.L. Zeger and B. Qaqish. Multivariate regression analyses for categorical
data (with discussion). J.R. Statist. Soc., 54:3–40, 1992.
Keluar
[20] J.H. Maindonald. Using R for Data Analysis and Graphics An Introduction. ANU-
Australia, June 2001.
[21] P. McCullagh and J.A. Nelder. Generalized Linear Models. Chapman and Hall,
London, 2nd edition, 1989.
MIPA-Unej
[22] W. Mendenhall. Introduction to Probability and Ststistics. Duxbury, Belmont USA,
5th edition, 1979.
[23] P.L. Meyer. Introductory Probability and Statistical Applications. Addison-Wisley Daftar Isi

Pub. Co., Massachusets, 2nd edition, 1970.


[24] J.A. Nelder and R.W.M. Wedderburn. Generalized linear models. J.R.Statist.Soc., Judul
57:359–407, 1972.
[25] J. Neter, W. Wasserman and M.H. Kutner. Applied Linear Statistical Models. Irwin, JJ J I II
Illinois, 2nd edition, 1985.
[26] S.R. Searle. Matrix Algebra Useful for Statistics. John Wiley and Sons, New York, Hal. 247 dari 245
1st edition, 1982.
[27] G.K. Smyth. Generalized linear models with varying dispersion. J.R. Statist. Soc, Cari Halaman
51:47–60, 1989.
[28] G.K. Smyth. Partitioned algorithms for maximum likelihood and other nonlinear
Kembali
estimation. Statistics and Computing, 6:201–216, 1996.
[29] R Teams. Data Import/ Export. R Project, http://www.r.project.org.
Layar Penuh
[30] R Teams. An Introduction to R. R Project, http://www.r.project.org.
[31] R Teams. R Instalation and Administration. R Project, http://www.r.project.org. Tutup

[32] R Teams. R Language Manual. R Project, http://www.r.project.org.


Keluar
[33] R Teams. Reference Manual. R Project, http://www.r.project.org.

[34] R Teams. Writing R Extension. R Project, http://www.r.project.org.


[35] I M. Tirta. Analysis of Gamma Data with Random Effects. PhD thesis, Department
of Mathematics Statistics and Computing Sciences, The University of New England,
MIPA-Unej
Armidale, NSW Australia, 1999.
[36] W.N. Venables and B.D. Ripley. Modern Applied Statistics with S-plus. Springer,
New York, 1994. Daftar Isi

[37] J. Vezalini. Using R for Introductory Statistics. http://www.r.project.org.


Judul
[38] D.D. Wackerly W. Mendenhall and R. L. Scheafer. Mathematical Statistics with
Application. Duxbury, Belmont USA, 5th edition, 1996.
JJ J I II
[39] K.K. Wang. Notes on the Use of R for Psychology Experiment and Questionaire.
http://www.r.project.org.
Hal. 248 dari 245
[40] R.W.M. Wedderburn. Quasi-likelihood functions, generalized linear models, and the
Gauss-Newton method. Biometrika, 61:439–447, 1974.
Cari Halaman
[41] S.L. Zeger and K-Y. Liang. Longitudinal data analysis for discrete and continuous
outcomes. Biometrics, 42:121–130, 1986.
[42] S.L. Zeger and K-Y. Liang. An overview of methods for the analysis of longitudinal Kembali
data. Statistics in Medicine, 11:1825–1839, 1992.

[43] S.L. Zeger, K-Y. Liang and P.S. Albert. Models for longitudinal data: A generalized Layar Penuh
estimating equation approach. Biometrics, 44:1049–1060, 1988.

Tutup

Keluar
Indeks MIPA-Unej

Daftar Isi

AIC, 116, 197 Binomial Negatif, 212


algoritma eksponensial, 212
Judul
penuh, 20 Gamma, 212
terpartisi, 20 Inverse Gauss, 212
Normal, 211
bentuk kuadrat, 137 JJ J I II
Pareto, 212
bergantung linier, 133 Poisson, 211
berorietasi objek, 99
Hal. 249 dari 245
efek acak, 115
compormable ekplorasi
penjumlahan, 129 data, 107 Cari Halaman
perkalian, 130 eksplanatori, 205
Cook’s Distance, 194 eleminsi, 9
Kembali
Data fungsi, 43, 49
setting, 104 file, 70
data grafik, 68 Layar Penuh
eksplorasi, 107 kepadatan peluang, 67
simulasi, 104 matematika, 35, 36
distribusi matriks, 37 Tutup
Binomial, 212 statistika, 39

Keluar
fungsi R Linux, 100
gee(), 116
glm(), 116 mean, 207
glmmML(), 116 MLT, 116
lm(), 115 model linier, 115
lme(), 115 bertingkat, 25 MIPA-Unej
lmm(), 115 campuran, 23
nlme(), 115 GEE, 28
regress(), 115 GLM, 26 Daftar Isi

repeated(), 115 GLMM, 27


HGLM, 27
GEE, 116, 237 hirarkis tergeneralisasi, 27 Judul

Geostatistika, 93 klasik, 21, 115


GLM, 116 klasik/Normal, 22
JJ J I II
GLMM, 116 LMM, 23
GLS, 169 NLM, 22
normal, 21, 115 Hal. 250 dari 245
heteroskedastisitas, 165, 169, 170 tergeneralisasi, 26
homoskedastisitas, 165, 170 multikolinieritas, 28
Cari Halaman
invariant, 20 Newton-Raphson, 169
nonsingular, 133
jarak Cook, 194
Kembali
objek, 99
kanonik, 207 operasi
keluarga eksponensial, 205, 207 biner, 125 Layar Penuh
uner, 125
library, 62, 98
operator
aktifkan, 62, 65
Produk, 126 Tutup
fungsi, 65
sigma, 126
kepustakaan, 65
Keluar
outlier, 194 singular, 133
sistematis, 205
pemodelan, 9 skoring Fisher, 169
deterministik, 12 SPlus, 33, 34
stokastik, 12 sumstat, 107
pencilan, 194 MIPA-Unej
program turunan
algoritma, 46 matriks, 135
diagram alir, 46 rantai, 139 Daftar Isi
komponen, 43
langkah, 45 varians, 207
Judul
rank, 133 WLS, 169
penuh, 133
Rcli, 34 JJ J I II
regresi, 115
GEE, 116
Hal. 251 dari 245
GLM, 116
GLMM, 116
LME/LMM, 115 Cari Halaman
normal, 115
Ridge, 29
Rgui, 66 Kembali
RComander, 66
SciViews, 66, 76, 99
WinEdt, 99 Layar Penuh

S, 98
simetrik, 135, 138, 139 Tutup
simulasi, 44

Keluar

You might also like