You are on page 1of 78

1

Created by :
Reza Septiani Pontoh
MODUL PANDUAN PENGGUNAAN MINITAB 14
DALAM ANALISIS DATA

DAFTAR ISI
1 PENGANTAR STATISTIKA & PENGENALAN MINITAB...........................................4
1.1 Pendahuluan.................................................................................................................4
1.1.1 Input Data..............................................................................................................4
2 STATISTIKA DESKRIPTIF..............................................................................................6
2.1 Meringkas Data............................................................................................................6
2.2 Menyajikan Data..........................................................................................................7
2.2.1 Histogram..............................................................................................................7
2.2.2 Boxplot..................................................................................................................8
2.2.3 Steam and Leaf......................................................................................................9
2.2.4 Plot.........................................................................................................................9
3 STATISTIKA DASAR.....................................................................................................10
3.1 Satu Gugus Data Contoh............................................................................................10
3.2 Dua Gugus Data Contoh ............................................................................................12
4 ANALISIS REGRESI.......................................................................................................13
4.1 Regresi Linier.............................................................................................................13
4.2 Regresi Bertatar..........................................................................................................16
4.2.1 Prosedur Stepwise...............................................................................................16
4.2.2 Forward Selection................................................................................................17
4.2.3 Backward Elimination.........................................................................................17
4.3 Regresi Terbaik (Best Regression).............................................................................18
4.4 Regresi Percobaan Satu Faktor Bertaraf kualitatif.....................................................19
4.5 Regresi Percobaan Satu Faktor Bertaraf Kuantitatif.................................................21
4.6 Regresi Percobaan Tiga Faktor Bertaraf Kualitatif dan Kuantitatif.....................24
5 REGRESI DAN MASALAH PELANGGARAN ASUMSI.............................................28
5.1 Heteroskedastisitas (Heteroscedasticity)....................................................................28
5.2 Autokorelasi (Serial Independen)...............................................................................33
5.2.1 Metode Kuadrat Terkecil Terboboti (Weighted Least Square)...........................34
5.2.2 Transformasi model.............................................................................................35
5.3 MULTIKOLINIERITAS............................................................................................36
6 PERANCANGAN PERCOBAAN....................................................................................41
6.1 KLASIFIKASI PERLAKUAN..................................................................................42
6.1.1 Rancangan Perlakuan..........................................................................................42
6.1.2 Rancangan Lingkungan.......................................................................................43
6.2 PERCOBAAN FAKTORIAL....................................................................................43
6.2.1 Percobaan Dua Faktor RAL................................................................................43
6.2.2 Percobaan Dua Faktor RAK................................................................................45
6.2.3 Percobaan Dua Faktor RBSL..............................................................................46
6.3 RANCANGAN PETAK TERPISAH ( Split Plot Design).........................................46
6.4 RANCANGAN BLOK TERPISAH ( Split Block Design or Strip Plot Design)......47
7 PENGUJIAN ASUMSI.....................................................................................................48
7.1 Pengujian Keaditifan Model.......................................................................................50
7.2 Pengujian Kenormalan Galat......................................................................................50
7.3 Pengujian Kehomogenan Ragam...............................................................................50
7.4 Pengujian keacakan/kebebasan galat..........................................................................51
8 TRANSFORMASI DATA................................................................................................52
8.1 Transformasi untuk data tunggal................................................................................52
Tangga transformasi Tukey.................................................................................................52
2
8.2 Transformasi untuk k buah data sample bebas...........................................................53
8.2.1 Transformasi logaritma ( log Y ).........................................................................53
8.2.2 Transformasi akar kuadrat ( Y )........................................................................53
8.2.3 Transformasi Arcsin ( Sin-1Y)..........................................................................54
8.3 Transformasi Dalam Regresi Linear Sederhana ........................................................55
9 REGRESI LOGIT DAN PROBIT.....................................................................................55
9.1 Regresi Logit .............................................................................................................55
9.1.1 Model Logit.........................................................................................................56
9.1.2 Pengujian Parameter............................................................................................56
9.1.3 Intepretasi Koefisien............................................................................................57
9.2 Regresi Probit.............................................................................................................60
9.2.1 Intepretasi koefisien.............................................................................................60
9.2.2 Kriteria pemilihan Model Terbaik.......................................................................60
9.3 Perbedaan Logit dan Probit........................................................................................61
9.4 Perbedaan Regresi Linier dan Logistik......................................................................61
10 ANALISIS MULTIVARIATE........................................................................................63
10.1 ANALISIS KOMPONEN UTAMA.........................................................................63
10.2 ANALISIS KORESPONDENSI..............................................................................63
10.2.1 Analisis korespondensi sederhana.....................................................................63
10.2.2 Analisis korespondensi berganda......................................................................65
10.3 ANALISIS GEROMBOL........................................................................................68
10.3.1 Konsep Jarak.....................................................................................................68
10.3.2 Metode Perbaikan Jarak....................................................................................68
3
1 PENGANTAR STATISTIKA & PENGENALAN MINITAB
Dalam berbagai literatur, statistik atau. statistic dapat diartikan sebagai
penduga parameter, dimana parameter disini dapat berupa rata-rata, standar deviasi,
proporsi dan lain-lain. Sementara itu Statistika atau statistics adalah suatu disiplin ilmu
yang mempelajari metode pengumpulan data, menganalisis (termasuk pendugaan
parameter) dan menarik kesimpulan dari data tersebut.
Data dibagi ke dalam kelompok menurut sumbernya, yaitu data primer dan
data sekunder. Data primer adalah data yang berasal dari sumber asli dan
dikumpulkan secara khusus untuk menjawab pertanyaan penelitian kita. Data
sekunder adalah data yang berasal dari hasil survey pihak lain.
Statistika adalah salah satu alat untuk membantu para pengambil kebijakan
dalam membuat keputusan. Pengambilan keputusan ini umumnya didasarkan atas
informasi yang tersedia dari data contoh. Untuk mengetahui prosedur pengambilan
keputusan tersebut terlebih dahulu diperlukan pengertian-pengertian dasar tentang
konsep dan teori statistika. Konsep-konsep dan tahapan-tahapan yang harus dimiliki
oleh seorang peneliti dalam melakukan penelitiannya, yaitu:
1. Pendefinisian masalah
2. Pendefinisian populasi
3. Penentuan peubah / variabel
4. Teknik penarikan contoh
5. Pembuatan alat ukur
6. Metode analisis
7. Interpretasi hasil analisis
8. Kesimpulan
9. Penyajian hasil analisis
1.1 Pendahuluan
Paket program MINITAB merupakan perangkat lunak yang dapat digunakan
sebagai media pengolahan data yang menyediakan berbagai jenis perintah sehingga
memungkinkan proses pemasukkan data, manipulasi data, pembuatan grafik,
peringkasan nilai-nilai numerik dan analisis statistika.
MINITAB memiliki dua sesi primer yaitu worksheet (lembar kerja) untuk melihat
dan mengedit lembar kerja, serta sesi command yang merupakan layar untuk
menampilkan hasil. Perintah-perintah MINITAB dapat diakses melalui menu, kotak
dialog dan perintah interaktif. Perintah interaktif ditulis pada sesi command.
1.1.1 Input Data
READ : Perintah READ selain digunakan untuk memanggil atau membaca
data dari File ASCII juga dapat digunakan untuk memasukkan
data melalui keyboard. Tulislah setiap baris data pada satu
baris baru dan pisahkan masing-masing angka dengan spasi
atau koma dan akhiri dengan END.
Contoh : MTB > READ C2 C3
DATA> 2 4
DATA> 3.5 27
DATA> 1 12
DATA> END
SET : Perintah SET digunakan untuk memasukkan data ke suatu
kolom.
Contoh : MTB > SET C6
DATA> 2 7 9
DATA> 3.8 22
DATA> END
Beberapa cara meringkas penulisan data melalui perintah SET
DATA> 1 : 4 1 2 3 4
4
DATA> 1 : 3 / .5 1 1.5 2 2.5 3
DATA> 3(1) 1 1 1
DATA> 2(1:3) 1 2 3 1 2 3
DATA> (1:3) 2 1 1 2 2 3 3
DATA> 2 (1: 3) 2 2 1 2 3 2
Contoh: MTB> SET C6
DATA> 1 : 3 / .5
DATA> END
LET : Perintah LET digunakan untuk perhitungan aritmatik, bisa
juga digunakan untuk mengganti atau memperbaiki nilai dalam
kolom.
LET E = ekspresi aljabar
Contoh: MTB> LET C1 (3) = 4
MTB> LET C4 = (C1-MEAN(Cl))**2
MTB> LET K2= SUM (ABSO(Cl-MEAN (C1)))
Ekspresi aljabar didalam format perintah tersebut adalah :
1. Operasi aritmatik ( +, -, *, /, **, =, ~=, >, <, <=, => )
2. Fungsi : ABSOLUTE, EXPO, MINIMUN, ROUND, SUM, COUNT, MEDIAN,
STDEV, RANK, SORT, MEAN, PARSUM, SQRT, SSQ
Perintah fungsi selalu diikuti dengan tanda kurung MTB> SQRT (C5)
DELETE & ERASE : DELETE berfungsi untuk menghapus baris, sedangkan
ERASE digunakan untuk menghapus kolom.
Contoh: MTB> DELETE 2,4 C1-C3
MTB> ERASE C1
INSERT : berfungsi untuk menyisipkan baris data pada lembar kerja.
Contoh: MTB> INSERT 2,3 Cl-C2
DATA> 56 8
DATA> END
COPY : Perintah COPY digunakan untuk menggandakan data.
Contoh : NAMA JK BB TB
JOAN 2 135 66
HENRI 1 155 70
MARY 2 125 64
5
SUSAN 2 115 65
JAMES 1 145 64
MTB> COPY 'NAMA' 'JK' 'BB' 'TB' C12-C14;
SUBC> USE 'JK'=l. (perintah ini sama dengan OMIT 'JK'=2.)
Hasilnya :
CODE : untuk menggandakan sekaligus mengganti beberapa nilai
STACK DAN UNSTACK :
Perintah STACK digunakan untuk menggabungkan kolom atau konstanta diatas
kolom atau konstanta yang lain, UNSTACK digunakan untuk memecah atau
memisahkan isi sebuah atau beberapa kolom ke dalam beberapa kolom atau
konstanta. Subcommand yang digunakan untuk memecah adalah SUBSCRIPTS.
2 STATISTIKA DESKRIPTIF
Statistika deskriptif adalah bidang statistika yang membicarakan metode
mengumpulkan, meringkas/menyederhanakan dan menyajikan data sehingga dapat
memberikan informasi. Mengumpulkan data dapat dilakukan dengan cara:
1. Penelitian
2. Observasi
Ukuran yang digunakan dalam meringkas data:
1. Ukuran pemusatan ( mean, median, modus, kuartil)
2. Ukuran penyebaran ( ragam, range, jarak antar kuartil)
Penyajian data dapat berupa :
1. Tabulasi
2. Grafik ( histogram, boxplot (diagram kotak garis), steam and
leaf (diagram dahan daun), plot)
Peringkasan dan penyajian data yang baik akan sangat membantu dalam menganalisis
data selanjutnya. Dan membantu dalam mengambil kesimpulan secara deskriptif.
2.1 Meringkas Data
Tahapan menggunakan menu MINITAB :
Klik Stat > Basic Statistics > Display Descriptive Statistics
Variables : isi dengan peubah yang akan dideskripsikan
klik Graph : pilih Histogram of Data with normal curve
klik Statistics : checklist nilai-nilai statistic yang ingin
ditampilkan
Klik OK!
Contoh :
Data hasil yang diperoleh dari varietas padi lokal (ton/ha):
4.0, 4.0, 5.5, 6.0, 7.5, 4.8, 6.1, 4.5, 4.5, 5.0,
4.0, 5.3, 5.1, 5.8, 5.9. 6.5, 7.5, 7.5, 4.0, 4.5
Masukkan data diatas pada kolom C1
Kemudian ikuti tahapan menggunakan menu MINITAB diatas
6
Keterangan :
N : Banyak data
Mean : Rataan
Median : Nilai tengah setelah data terurut dari terkecil hingga
terbesar
TrMean : Rataan Terpangkas, yaitu rataan setelah data terkecil
dan terbesar dipotong masing-masing 5%
StDev : Simpangan Baku/ akar dari ragam
SE Mean : Rataan Galat Baku/ Simpangan Baku bagi N
Min/Max : Nilai terkecil/terbesar setelah data terurut
Q1/Q3 : kuartill/kuartil3
hasil
F
r
e
q
u
e
n
c
y
8 7 6 5 4 3
4
3
2
1
0
Mean 5.4
StDev 1.183
N 20
Histogram (with Normal Curve) of hasil
Interpretasi :
Dengan Histogram dapat dilihat apakah data menyebar normal atau tidak.
Histogram diatas menunjukan bahwa data tidak menyebar normal tetapi cenderung
menjulur ke kanan. Sedangkan kotak-kotak tersebut memiliki interval yang sama yaitu
0.5 dan tinggi kotak menunjukkan frekuensi nilai-nilai yang berada pada interval
tersebut.
2.2 Menyajikan Data
2.2.1 Histogram
Penyajian dalam bentuk Histogram memberikan gambaran frekuensi untuk
setiap nilai atau selang nilai tertentu dari peubah yang diamati secara visual.
7
Descriptive Statistics: hasil
Variable N Mean SE Mean StDev Minimum Q1 Median Q3 Maximum
hasil 20 5.400 0.265 1.183 4.000 4.500 5.200 6.075 7.500
Tahapan menggunakan menu MINITAB :
Klik Graph > Histogram
Pilih bentuk histogram yang akan ditampilkan
Graph Variables : isi dengan variabel yang akan dibuat histogram
Klik Label jika ingin memberi judul histogram
Klik Multiple Graph untuk memilih tampilan histogram (overlay lebih dari 1
variabel atau separate)
Klik OK!
Contoh :
Data hasil yang diperoleh dari vareitas padi lokal (ton/ha):
4.0, 4.0, 5.5, 6.0, 7.5, 4.8, 6.1, 4.5. 4.5, 5.0,
4.0,5.3,5.1, 5.8 , 5,9,6.5, 7.5, 7.5, 4.0, 4.5
Masukkan data di atas pada kolom Cl, beri judul kolom Hasil (ton/ha)
Kemudian ikuti tahapan menggunakan menu MINITAB diatas
hasil (ton/ ha)
F
r
e
q
u
e
n
c
y
7.5 7.0 6.5 6.0 5.5 5.0 4.5 4.0
4
3
2
1
0
histogramhasil (ton/ ha)
2.2.2 Boxplot
Penyajian dalam bentuk Boxplot tidak menampilkan data asli, tetapi
menampilkan :
Kesimetrisan penyebaran data, dapat dilihat dari apakah kotak terbagi dua
oleh garis median sama besar atau tidak, dan apakah 'ekor' bawah dan 'ekor'
atas sama panjang atau tidak.
Keanehan data, jika data pengamatan berada di luar batas BB1 dan BA1,
disebut pencilan minor, dan jika data pengamatan berada di luar batas BB2 dab
BA2 disebut data ekstrim.
Keterangan :
Q1 : Nilai Kuartil 1, nilai yang menyekat kumpulan data yang telah
diurutkan, dimana data yang lebih kecil dari Q1 sebanyak 25% dan
data yang lebih besar dari Q1 sebanyak 75%.
Q2 : Nilai Kuartil 2, sama dengan median, merupakan nilai pembatas
8
50% data disebelah kiri Q2 dan 50% data di sebelah kanan Q2.
Q3 : Nilai Kuartil 3, nilai yang menyekat kumpulan data yang telah
diurutkan, dimana data yang lebih kecil dari Q3 sebanyak 75% dan
data yang lebih besar dari Q3 sebanyak 25%.
BA1 = Q3 + 3/2(Q3-Q1) BB1 = Q1 - 3/2(Q3-Q1)
BA2 = Q3 + 3(Q3-Q1) BB2 = Q1 - 3(Q3-Q1)
Tahapan menggunakan menu MINITAB :
Klik Graph > Boxplot
Pilih bentuk histogram yang akan ditampilkan
Graph Variables : isi dengan variabel yang akan dibuat boxplot
Klik Label jika ingin memberi judul boxplot
Klik OK!
Contoh :
Gunakan data contoh Histogram, kemudian ikuti tahapan di atas
h
a
s
i
l

(
t
o
n
/
h
a
)
8
7
6
5
4
BOXPLOT HASIL (TON/ HA)
2.2.3 Steam and Leaf
Memungkinkan pengguna mendapat lebih banyak informasi dibandingkan
dengan penyajian Histogram, karena diagram dahan daun menyajikan data asli dari
setiap objek pengamatan.
Tahapan menggunakan menu MINITAB :
Klik Graph > Steam-and-leaf
Graph Variables : isi variabel yang akan dibuat steam and-leaf
Klik OK!
Contoh:
Gunakan data Histogram, ikuti langkah diatas
2.2.4 Plot
Menggunakan plot harus ada dua variabel, sehingga data tersebut dapat
diplotkan antara kedua variabel tersebut.
Tahapan menggunakan menu MINITAB :
9
Stem-and-Leaf Display: hasil (ton/ha)
Stem-and-leaf of hasil (ton/ha) N = 20
Leaf Unit = 0.10
4 4 0000
8 4 5558
(3) 5 013
9 5 589
6 6 01
4 6 5
3 7
3 7 555
Klik Graph > Plot
Graph Variables : isi Y dengan variabel yang akan diplotkan (Cl)
dan X dengan peubah lain (C2)
Klik Label jika ingin memberi judul plot serta klik pada bagian data labels jika
ingin menampilkan tipe label pada plot (klik use y-value labels).
Klik OK!
Contoh :
Gunakan data Histogram, dengan tambahan data lokasi penanaman padi :
1, 2, 3, 1, 2, 2, 3, 3, 1, 1, 1, 2, 3, 3, 2, 1, 1, 2, 3, 3.
1 = Jawa Barat, 2 = Jawa Tengah, 3 = Jawa Timur
Tempatkan data tambahan di atas pada kolom C2, kemudian ikuti tahapan di atas
3 STATISTIKA DASAR
3.1 Satu Gugus Data Contoh
MINITAB menyediakan fasilitas untuk melakukan pengujian hipotesis (pengujian
nilai tengah) dan membuat selang kepercayaan. Beberapa kriteria yang harus
diperhatikan:
1. Jika ukuran contoh besar (n>30) atau ragam populasi diketahui, maka
statistik uji yang digunakan statistik uji z.
2. Jika ukuran contohnya kecil (n<30) dan ragam populasi tidak diketahui,
maka statistik uji yang digunakan statistik uji t.
Bentuk hipotesis yang diuji :
1. H
0
: =
0
vs H
1
:
0
2. H
0
: =
0
vs H
1
: >
0
3. H
0
: =
0
vs H
1
: <
0
sedangkan selang kepercayaan (1-) 100% bagi nilai tengah popuJasi adalah:
10
) (
) 2 / (
x
z x

t dimana : x = nilai tengah contoh



x

= galat baku nilai tengah x


Langkah-langkah menggunakan menu MINITAB untuk Uji Z :
Klik Stat > BasicStatistcs > 1-Sample z
Variables : isi dengan peubah C1 atau hasil(ton/ha)
Test Mean : isi dengan nilai tengah populasi yang
dihipotesiskan (5.2)
Standar deviation : isi dengan simpangan baku populasi (1.2)
Klik options : pilih taraf nyata pada confident level dan
hipotesisnya pada alternative
Intepretasi :
Hipotesis yang diuji adalah Ho : = 5.0 vs H1 : 5.0. Setelah dilihat dari nilai
P-value teryata nilainya lebih besar dari taraf nyata 0.05 yang berarti terima H
0
atau
= 5.0.
Langkah-langkah menggunakan menu MINITAB untuk Uji T :
Klik menu Stat > Basic Statistics > 1-Sample t
Variables : isi dengan peubah C1
Test Mean : isi dengan nilai tengah populasi yang
dihipotesiskan (5.2)
Klik options : pilih taraf nyata pada confident level
hipotesisnya pada alternative
Intepretasi :
11
One-Sample Z: hasil (ton/ha)
Test of mu = 5.2 vs not = 5.2
The assumed standard deviation = 1.2
Variable N Mean StDev SE Mean 95% CI Z P
hasil (ton/ha) 20 5.40000 1.18322 0.26833 (4.87409, 5.92591) 0.75 0.456
One-Sample T: hasil (ton/ha)
Test of mu = 5.2 vs not = 5.2
Variable N Mean StDev SE Mean 95% CI T P
hasil (ton/ha) 20 5.40000 1.18322 0.26458 (4.84624, 5.95376) 0.76 0.459
Hipotesis yang diuji adalah Ho : = 5.0 vs H1 : 5.0. Setelah dilihat dari nilai
P-value teryata nilainya lebih besar dari taraf nyata yang kita tentukan yaitu sebesar
0.05 yang berarti terima H
0
.
3.2 Dua Gugus Data Contoh
Jika ingin melakukan uji kesamaan dua nilai tengah dan selang kepercayaan
untuk beda nilai tengah populasi bagi dua gugus data contoh digunakan uji t dengan
perintah TWOSAMPLE (jika 2 gugus data contoh diletakkan pada kolom terpisah) atau
TWOT (jika 2 gugus data diletakkan pada satu kolom dan kolom lain dituliskan koding
dari gugus contoh).
Bentuk hipotesis yang diuji :
1. H
0
:
1
=
2
vs H
1
:
1

2
2. H
0
:
1
=
2
vs H
1
:
1
>
2
3. H
0
:
1
=
2
vs H
1
:
1
<
2
Contoh: Kita ingin menguji apakah nilai tengah antara variabel di C1 dan
C2 sama, dan kita mengujinya pada taraf nyata sebesar 0.05
Langkah-langkah dalam MINITAB :
Klik Stat > Basic statistics > 2-sample t
Klik Samples in different columns:
Masukkan kolom mana yang akan diuji (C1 dan C2)
Klik "Assume equal variances" jika kita mennganggap bahwa ragam populasi
sama
Klik options : pilih taraf nyata pada confident level serta
hipotesisnya pada alternative.
Interpretasi :
Hipotesis yang diuji adalah Ho :
hasil
=
lokasi
vs H1 :
hasil

lokasi
. Setelah dilihat
dari nilai P-value teryata nilainya lebih kecil dari taraf nyata yang kita tentukan yaitu
sebesar 0.05 yang berarti tolak H
0
atau nilai tengah hasil tidak sama dengan nilai
tengah lokasi.
12
Two-Sample T-Test and CI: hasil (ton/ha), lokasi
Two-sample T for hasil (ton/ha) vs lokasi
N Mean StDev SE Mean
hasil (ton/ha) 20 5.40 1.18 0.26
lokasi 14 2.071 0.917 0.25
Difference = mu (hasil (ton/ha)) - mu (lokasi)
Estimate for difference: 3.32857
95% CI for difference: (2.55990, 4.09725)
T-Test of difference = 0 (vs not =): T-Value = 8.82 P-Value = 0.000 DF = 32
Both use Pooled StDev = 1.0829
4 ANALISIS REGRESI
Dalam MINITAB terdapat fasilitas untuk analisis regresi yaitu regresi linier,
regresi bertatar (stepwise regression), regresi terbaik (best regression), dan regresi
kekar (robust regression). Disini hanya akan dibahas tentang regresi linier, bertatar
dan terbaik.
Model : Y
t
= + X
t
+ U
t
Asumsi yang mendasari pendugaan model regresi linier dengan menggunakan
metode kuadrat terkecil yaitu :
U
t
adalah random variable (peubah acak) dengan nilai rata-rata U
t
[E(U
t
)] = 0,
untuk semua t.
Homoskedastisitas (kehomogenan ragam) yang berarti untuk setiap sisaan
ragamnya sama. Untuk semua t, Var (U
t
) =
2
.
Tidak ada auto korelasi dalam sisaan.
Tidak terdapat hubungan atau korelasi antara beberapa atau semua variabel
bebas (multikolinearitas)
Untuk setiap t, U
t
menyebar Normal (0,
2
)
4.1 Regresi Linier
Regresi Linier adalah persamaan regresi yang menggambarkan hubungan
antara peubah bebas (X, independence variable) dengan peubah tak bebas (Y,
dependence variable) dimana hubungan keduanya dapat digambarkan sebagai suatu
garis lurus.
Berikut adalah contoh menganalisis data menggunakan regresi linier. Suatu
telaah dilakukan untuk mengevaluasi sejauh mana pengaruh biaya yang dikeluarkan
untuk iklan terhadap hasil penjualan, dikumpulkan data biaya iklan dan hasil penjualan
sebagai berikut :
No Biaya Hasil No Biaya Hasil
1 40 385 7 40 490
2 20 400 8 20 420
3 25 395 9 50 560
4 20 365 10 40 525
5 30 475 11 25 480
6 50 440 12 50 510
Jika diasumsikan hubungan antara biaya iklan dengan hasil penjualan dapat
dinyatakan sebagai persamaan linier sederhana, dugalah persamaan garis tersebut
apakah biaya iklan memberikan pengaruh yang nyata terhadap hasil penjualan.
Langkah-langkah dalam MINITAB:
Peubah respon (Hasil) disimpan di kolom pertama (C1) dan peubah penjelas
(Biaya) di kolom berikutnya (C2)
Klik Stat > Regression > Regression
Response : Masukkan peubah respon (Hasil)
Predictors : Masukkan peubah bebas (Biaya)
Klik Graphs :
Residual for plots : pilih Regular
Residual plots : pilih four in one
Klik Options :
Display, pilih variance inflation factor
Predictions intervals for new observations : isi nilai X = 35
Confidence interval: 95
Storage : Fits
Klik Result : Pilih option kedua regression equation, table ....
Klik storage : Checklist pada residuals.
13
Interpretasi :
Dari output diatas dapat diperoleh beberapa informasi, persamaan regresi yang
diperoleh adalah Hasil = 344 + 3.22 Biaya, dimana setiap
kenaikan satu satuan biaya akan menaikkan hasil sebesar 3.22 satuan. Dari
nilai-p untuk koefisien biaya dapat disimpulkan bahwa biaya mempunyai pengaruh
yang nyata terhadap perubahan hasil (nilai-p < 0.05), kemudian dari R-Sq diperoleh
kesimpulan bahwa model hanya mampu menerangkan 40.3% dari keragaman data
tetapi dari anova model diperoleh informasi bahwa model sudah cukup baik atau tepat
untuk menginterpretasikan data (nilai-p < 0.05)
Output selanjutnya adalah bila kita ingin melihat nilai dugaan y (hasil) dari
suatu nilai x (biaya) tertentu pada persamaan regresi yang telah kita peroleh. Dalam
kasus ini kita ingin menduga hasil pada biaya sebesar 35 (x = 35.00), pada biaya
sebesar 35 maka hasil yang diperoleh sebesar 456.4
14
Regression Analysis: Hasil versus Biaya
The regression equation is
Hasil = 344 + 3.22 Biaya
Predictor Coef SE Coef T P
Constant 343.71 44.77 7.68 0.000
Biaya 3.221 1.240 2.60 0.027
S = 50.2257 R-Sq = 40.3% R-Sq(adj) = 34.3%
Analysis of Variance
Source DF SS MS F P
Regression 1 17030 17030 6.75 0.027
Residual Error 10 25226 2523
Total 11 42256
Predicted Values for New Observations
New
Obs Fit SE Fit 95% CI 95% PI
1 456.4 14.5 (424.0, 488.8) (339.9, 572.9)
Values of Predictors for New Observations
New
Obs Biaya
1 35.0
Residual
P
e
r
c
e
n
t
100 50 0 -50 -100
99
90
50
10
1
Fitted Value
R
e
s
i
d
u
a
l
500 475 450 425 400
50
0
-50
-100
Residual
F
r
e
q
u
e
n
c
y
50 25 0 -25 -50 -75 -100
3
2
1
0
Observation Order
R
e
s
i
d
u
a
l
12 11 10 9 8 7 6 5 4 3 2 1
50
0
-50
-100
Normal Probability Plot of the Residuals Residuals Versus the Fitted Values
Histogram of the Residuals Residuals Versus the Order of the Data
Residual Plots for Hasil
Plot sisaan untuk hasil diatas dapat digunakan untuk pengujian asumsi. Plot
normal probability ... digunakan untuk uji asumsi kenormalan; plot residual
versus the fitted values (plot sisaan dan dugaan) menunjukkan kehomogenan
ragam sisaan, jika plot membentuk suatu pola acak atau lebar selang homogen maka
diindikasikan sisaan bersifat homogen; plot residuals versus the order ...
menunjukkan keacakan galat. Dari plot diatas maka ketiga asumsi tersebut telah
terpenuhi.
Kemudian bila ingin mengetahui apakah model regresi ordo berapa yang tepat
bisa menggunakan menu fitted line plot, tapi hanya terbatas sampai model cubic.
Dari langkah ini juga dipeloreh plot regresinya.
Langkah-langkah dalam MINITAB:
Klik Stat > Regression > Fitted Line Plot
Response (Y) : Masukkan peubah respon (Hasil)
Predictors (X) : Masukkan peubah bebas (Biaya)
Type or Regression Model : Misal pilih Cubic
15
Polynomial Regression Analysis: Hasil versus Biaya
The regression equation is
Hasil = - 337.4 + 66.03 Biaya - 1.800 Biaya**2 + 0.01630 Biaya**3
S = 53.9014 R-Sq = 45.0% R-Sq(adj) = 24.4%
Analysis of Variance
Source DF SS MS F P
Regression 3 19013.4 6337.80 2.18 0.168
Error 8 23242.9 2905.36
Total 11 42256.2
Sequential Analysis of Variance
Source DF SS F P
Linear 1 17030.0 6.75 0.027
Quadratic 1 456.1 0.17 0.693
Cubic 1 1527.2 0.53 0.489
Biaya
H
a
s
i
l
50 45 40 35 30 25 20
550
500
450
400
350
S 53.9014
R-Sq 45.0%
R-Sq(adj) 24.4%
Fitted Line Plot
Hasil = - 337.4 +66.03 Biaya
- 1.800 Biaya**2 +0.01630 Biaya**3
interpretasi :
Dari output terlihat bahwa hanya model linear yang nyata, sehingga untuk
data ini model yang tepat adalah model regresi linear atau berordo satu.
Ulangi langkah diatas (Fitted Line Plot) tapi pilih model linear.
Biaya
H
a
s
i
l
50 45 40 35 30 25 20
550
500
450
400
350
S 50.2257
R-Sq 40.3%
R-Sq(adj) 34.3%
Fitted Line Plot
Hasil = 343.7 +3.221 Biaya
4.2 Regresi Bertatar
Regresi bertatar digunakan untuk memilih secara otomatis peubah bebas yang
dapat menerangkan peubah dengan baik berdasarkan statistic F maksimum. Ada tiga
metode yang dapat didukung oleh MINITAB dalam menganalisis data menggunakan
regresi bertatar ini, yaitu :
4.2.1 Prosedur Stepwise
Adapun langkah-langkah untuk melakukan prosedur ini yaitu :
Pada setiap tahap dihitung statistik F untuk setiap prediktor dalam model.
Jika nilai F lebih kecil dari Alpha to remove (A REMOVE), maka peubah yang
nilai statistik F-nya paling kecil dikeluarkan dari model
Persamaan regresi yang baru dihitung dan hasilnya dicetak
Jika tidak ada lagi prediktor yang dikeluarkan dari model, maka dihitung
statistik F prediktor yang tidak termasuk dalam model.
16
Regression Analysis: Hasil versus Biaya
The regression equation is
Hasil = 343.7 + 3.221 Biaya
S = 50.2257 R-Sq = 40.3% R-Sq(adj) = 34.3%
Analysis of Variance
Source DF SS MS F P
Regression 1 17030.0 17030.0 6.75 0.027
Error 10 25226.2 2522.6
Total 11 42256.2
Nilai F yang paling besar dimasukkan kedalam model jika lebih besar dari Alpha
to enter (A ENTER).
Jika tidak ada lagi prediktor yang dapat ditambahkan ke dalam model, prosedur
stepwise dihentikan.
4.2.2 Forward Selection
Sama dengan prosedur stepwise, tetapi tanpa ada prediktor yang dikeluarkan
dari model. Untuk forward selection, gunakan nilai A to remove = 0.
4.2.3 Backward Elimination
Tahapan untuk melakukan prosedur ini yaitu :
Masukkan prediktor
Keluarkan prediktor dengan menggunakan prosedur stepwise
Tidak ada prediktor yang dimasukkan kembali ke dalam model
Gunakan nilai A to enter = 10000 dan tuliskan semua prediktor pada sub
perintah ENTER
Contoh kasus :
Suatu survey dilakukan terhadap 17 rumah sakit di sekitar Jabotabek. Peubah-peubah
yang diamati dalarn survey tersebut adalah :
X1 = banyaknya pasien rata-rata per hari
X2 = banyaknya pelayanan sinar-X per hari
X3 = tempat tidur yang terisi per bulan
X4 = banyaknya penduduk disekitarnya yang mungkin memerlukan
fasilitas
X5 = rata-rata lamanya pasien dirawat (opname) dalam hari
Y = banyaknya jam kerja per bulan yang dipakai di rumah sakit
tersebut.
Secara lengkap data hasil survey tersebut disajikan sebagai berikut :
No X1 X2 X3 X4 X5 Y
1 15.6 2463.0 472.9 18.0 4.5 566.5
2 44.0 2048.0 1339.7 9.5 6.9 696.8
3 20.4 3940.0 620.2 4.3 4.3 1033.2
4 18.7 6505.0 568.3 36.2 3.9 1603.6
5 49.2 5723.0 1497.6 35.2 5.5 1611.4
6 44.9 11520.0 1365.8 24.0 4.6 1613.3
7 45.5 5779.0 1687.0 43.3 5.6 1854.2
8 59.3 5969.0 1639.9 46.7 5.2 2160.6
9 94.4 8461.0 2872.3 78.7 6.2 2305.6
10 182.0 21106.0 366.1 180.5 6.2 3503.9
11 96.0 13313.0 2912.0 60.9 5.9 3571.9
12 131.4 10771.0 3921.0 103.7 4.9 3741.4
13 127.2 15543.0 3865.7 126.8 5.5 4026.5
14 252.9 36194.0 7684.1 157.7 7.0 10343.8
15 409.2 34703.0 12446.3 169.4 10.8 11732.2
16 463.7 39204.0 14098.4 331.4 7.1 15414.9
17 510.2 86533.0 15524.0 371.6 6.4 18845.4
Langkah-langkah :
Klik Stat > Regression > Stepwise
Respon : Masukkan peubah responnya (Y) = C6
Predictors : Masukkan peubah penjelas (X) = C1 - C5
17
Interpretasi Output :
Dari hasil output diatas dapat diketahui bahwa dengan menggunakan metode
stepwise, peubah bebas yang berpengaruh nyata terhadap respon yaitu X1, X2, X3
dan X5. Hal ini diketahui dari nilai p-value pada step ke-4 lebih kecil dari nilai = 15.
Nilai R-Sq = 98.81% pada step ke-4 menunjukkan bahwa model regresi diatas sudah
baik.
Pada contoh diatas digunakan = 0.15 (default), jika ingin merubah taraf
nyata tetap gunakan langkah diatas. Taraf nyata bisa dirubah melalui icon
methods ... pada alpha to enter dan alpha to remove.

4.3 Regresi Terbaik (Best Regression)
Regresi terbaik digunakan untuk meregresikan satu peubah respon pada
semua kemungkinan kombinasi subset peubah-peubah prediktor dan kemudian
memilih subset terbaik untuk setiap ukuran (size). Informasi model terbaik ini dipilih
berdasarkan nilai R-square terbesar. Pada setiap regresi subset terbaik ditampilkan
statistik, yaitu : R-sq, adj R-sq, s dan C-p. Jika model difit tanpa konstanta, R-sq dan
adj R-sq tidak ditampilkan.
Contoh :
Dari data pada contoh sebelumnya, ingin dicari kombinasi peubah yang terbaik dalam
memodelkan hubungan X dan Y dengan menggunakan regresi terbaik (Best
Regression).
Langkah-langkahnya yaitu :
Klik Stat > Regression > Best Subsets
Response : masukkan peubah respon (Y) = C6
18
Stepwise Regression: Y versus X1, X2, X3, X4, X5
Alpha-to-Enter: 0.15 Alpha-to-Remove: 0.15
Response is Y on 5 predictors, with N = 17
Step 1 2 3 4
Constant -106.082 -118.446 2.008 1375.574
X1 33.7 24.0 9.1 13.3
T-Value 18.72 6.97 1.99 2.76
P-Value 0.000 0.000 0.068 0.017
X2 0.081 0.079 0.059
T-Value 3.10 4.26 2.92
P-Value 0.008 0.001 0.013
X3 0.51 0.51
T-Value 3.87 4.20
P-Value 0.002 0.001
X5 -279
T-Value -1.81
P-Value 0.096
S 1163 927 656 606
R-Sq 95.90 97.56 98.87 99.11
R-Sq(adj) 95.62 97.22 98.61 98.81
Mallows C-p 37.7 19.1 5.0 4.0
Free Predictors : masukkan peubah bebas (X) = C1 - C5
Interpretasi Output :
Jika dilihat dari outputnya, maka dapat disimpulkan bahwa :
Kombinasi 3 peubah X terbaik yaitu X2, X3, X4 dengan nilai R-Sq(adj) =
98.8%
Kombinasi 4 peubah X terbaik yaitu X1, X2, X3, X5 dengan nilai R-Sq(adj)
= 98.8%
4.4 Regresi Percobaan Satu Faktor Bertaraf kualitatif
Analisis regresi percobaan satu faktor bertaraf kualitatif pada dasarnya serupa
dengan analisis ragam yang mengkaji perbedaan nilai rata-rata terhadap perlakuan
atau taraf kontrol. Variabel penjelas pada model regresi ini adalah (t-1) buah variabel
dummy, apabila taraf faktor kualitatif tersebut ada t buah taraf.
Contoh :
Percobaan RAL untuk mengetahui pengaruh pencampuran bensin terhadap
penggunaan bahan bakar mobil yang diukur melalui jarak tempuh perliter (km/l).
Perlakuan yang dicobakan ada 4 macam dimana A sebagai kontrol.


teknik pencampuran
A B C D
jarak tempuh per
liter
10 13 14 14
11 11 12 11
8 10 11 10
7 9 10 11
9 10 13 10
total 45 53 60 56
rata-rata 9 10.6 12 11.2
Sesuai ketentuan umum pada regresi dari factor bertaraf kualitatif maka kita bangun 4
- 1 = 3 peubah dummy: D1, D2, D3
19
Best Subsets Regression: Y versus X1, X2, X3, X4, X5
Response is Y
Mallows X X X X X
Vars R-Sq R-Sq(adj) C-p S 1 2 3 4 5
1 95.9 95.6 37.7 1163.2 X
1 95.6 95.3 42.0 1210.8 X
2 98.5 98.3 7.3 722.57 X X
2 98.1 97.8 13.0 828.30 X X
3 99.0 98.8 3.3 614.43 X X X
3 98.9 98.6 5.0 656.26 X X X
4 99.1 98.8 4.0 605.65 X X X X
4 99.0 98.7 5.1 634.31 X X X X
5 99.1 98.7 6.0 632.43 X X X X X
no D1 D2 D3 Y
keterangan
taraf ulangan
1 0 0 0 10 A 1
2 0 0 0 11 A 2
3 0 0 0 8 A 3
4 0 0 0 7 A 4
5 0 0 0 9 A 5
6 1 0 0 13 B 1
7 1 0 0 11 B 2
8 1 0 0 10 B 3
9 1 0 0 9 B 4
10 1 0 0 10 B 5
11 0 1 0 14 C 1
12 0 1 0 12 C 2
13 0 1 0 11 C 3
14 0 1 0 10 C 4
15 0 1 0 13 C 5
16 0 0 1 14 D 1
17 0 0 1 11 D 2
18 0 0 1 10 D 3
19 0 0 1 11 D 4
20 0 0 1 10 D 5
1
D =

'

) B dari (bukan lain pengamatan untuk 0


B taraf dari pengamatan jika 1

2
D =

'

) C dari (bukan lain pengamatan untuk 0


C taraf dari pengamatan jika 1
2
D =

'

) D dari (bukan lain pengamatan untuk 0


D taraf dari pengamatan jika 1
Langkah-langkah :
Klik Stat > Regression > Stepwise
Respon : masukkan peubah responnya (Y)
Predictors : masukkan peubah penjelas, yaitu : D1 D2 D3
Output :
20
Regression Analysis: Y versus D1, D2, D3
The regression equation is
Y = 9.00 + 1.60 D1 + 3.00 D2 + 2.20 D3
Predictor Coef SE Coef T P
Constant 9.0000 0.7071 12.73 0.000
D1 1.600 1.000 1.60 0.129
D2 3.000 1.000 3.00 0.008
D3 2.200 1.000 2.20 0.043
S = 1.58114 R-Sq = 37.7% R-Sq(adj) = 26.0%
Analysis of Variance
Source DF SS MS F P
Regression 3 24.200 8.067 3.23 0.051
Residual Error 16 40.000 2.500
Total 19 64.200
Interpretasi :
Dari output diatas untuk uji koefisien regresi diperoleh informasi bahwa rata-
rata perlakuan B tidak berbeda nyata dengan rata-rata respon dari control (A).
sedangkan rata-rata respon untuk perlakuan C dan D pada taraf nyata 5% berbeda
nyata dengan rata-rata respon perlakuan A.
Dari persamaan diatas diperoleh informasi bahwa rata-rata respon dari
perlakuan C lebih tinggi sebesar 3.00 dari rata-rata respon perlakuan A serta
perlakuan D mempunyai rata-rata respon lebih tinggi dari rata-rata respon perlakuan A
sebesar 2.20.
4.5 Regresi Percobaan Satu Faktor Bertaraf Kuantitatif
Model regresi percobaan satu faktor bertaraf kuantitatif sering dirumuskan
dalam bentuk fungsi polynomial. Persamaan regresi polynomial yang menyatakan
hubungan antara variable respon (Y) dan taraf-taraf kuantitatif (X) dengan ordo q
dapat dinyatakan sebagai berikut :
+ + + + +
q
q
X X X Y ...
2
2 1 0
contoh :
Percobaan pengaruh temperatur terhadap daya aktifitas baterai yang diukur
pada suatu satuan waktu. 5 Perlakuan diulang sebanyak 4 ulangan dengan rancangan
acak lengkap (RAL).

temperatur (F)

0 25 50 75 100
daya baterai

55 63 70 73 68
53 61 65 71 65
52 62 69 70 63
54 60 68 74 67
total 214 246 272 288 263 1283
rata-rata 53.50 61.50 68.00 72.00 65.75 64.15
Dilakukan analisis ragam sebelum membangun model regresi pengaruh temperature
terhadap daya aktifitas baterai.
Langkah-langkah dengan minitab :
Klik Stat > ANOVA > General Linear Model
Responses : isi dengan kolom Respon yang akan diperiksa.
Model : isi dengan kolom variabel bebas yang sesuai dengan
rancangan yang digunakan (temperatur)
Interpretasi :
Dari output diatas terlihat bahwa temperatur berpengaruh nyata terhadap
respons daya aktivitas baterai, dimana R-Sq juga menunjukkan bahwa model mampu
merepresentasikan data sebesar 94.24%.
Langkah selanjutnya adalah membangun model regresi yang tepat, dengan
terlebih dahulu melihat arah kecenderungan atau tebaran data.
21
General Linear Model: dayabaterai versus temperatur
Factor Type Levels Values
temperatur fixed 5 0, 25, 50, 75, 100
Analysis of Variance for dayabaterai, using Adjusted SS for Tests
Source DF Seq SS Adj SS Adj MS F P
temperatur 4 797.80 797.80 199.45 61.37 0.000
Error 15 48.75 48.75 3.25
Total 19 846.55
S = 1.80278 R-Sq = 94.24% R-Sq(adj) = 92.71%
Langkah-langkah dengan minitab :
Klik Graph > Scatter Plot
Pilih bentuk histogram yang akan ditampilkan
Y variables : isi dengan kolom Respon (daya baterai).
X variables : isi dengan kolom variabel bebas (temperatur)
temperatur
d
a
y
a
b
a
t
e
r
a
i
100 80 60 40 20 0
75
70
65
60
55
50
tebaran data temperatur terhadap daya aktivitas baterai
Dari tampilan diatas tampak bahwa model regresi yang cocok dengan data adalah
regresi nonlinear. Perlakuan temperatur merupakan faktor kuantitatif berjarak sama
diantara berbagai taraf temperatur yang dicobakan, maka untuk memudahkan
perhitungan analisis regresi dilakukan transformasi menjadi peubah code sebagai
berikut :

( )
( ) 2
2
min
min
T T
T T T
X
maks
maks i
i

+
=
50
50

i
i
T
X
temperatu
r
tem_code dayabaterai
temperatu
r
tem_cod
e
dayabaterai
0 -1 55 50 0 69
0 -1 53 50 0 68
0 -1 52 75 0.5 73
0 -1 54 75 0.5 71
25 -0.5 63 75 0.5 70
25 -0.5 61 75 0.5 74
25 -0.5 62 100 1 68
25 -0.5 60 100 1 65
50 0 70 100 1 63
50 0 65 100 1 67
Kemudian kita bentuk model regresi yang cocok pada percobaan ini, karena
faktor temperatur mempunyai 5 taraf maka model regresi nonlinear yang yang
mungkin terbentuk hanya sampai pada ordo 4 (kuartik). Untuk mengetahui model
regresi ordo berapa yang digunakan bisa dilakukan memalaui SAS atau MINITAB.
22
Langkah-langkah dalam MINITAB :
Klik Stat > Regression > Regression
Response (Y) : Masukkan peubah respon (daya baterai)
Predictors (X) : Masukkan peubah bebas (X X
2
X
3
X
4
)
Output :
Interpretasi :
Dari anova model terlihat bahwa model sudah sangat tepat dalam
merepresentasikan data serta diperoleh R-Sq yang tinggi. Sementara itu untuk uji
koefisien secara parsial hanya samapai ordo 3 yang nyata sehingga kita ulangi
langkah diatas tetapi hanya kita gunakan model kubik atau ordo 3.
Langkah-langkah dalam MINITAB:
Klik Stat > Regression > Regression
Response (Y) : Masukkan peubah respon (daya baterai)
Predictors (X) : Masukkan peubah bebas (X X
2
X
3
)
Output :
Interpretasi :
23
Regression Analysis: dayabaterai versus x, x**2, x**3
The regression equation is
dayabaterai = 68.6 + 12.0 x - 8.86 x**2 - 5.83 x**3
Predictor Coef SE Coef T P
Constant 68.5786 0.6243 109.85 0.000
x 11.958 1.702 7.03 0.000
x**2 -8.8571 0.9576 -9.25 0.000
x**3 -5.833 1.888 -3.09 0.007
S = 1.79154 R-Sq = 93.9% R-Sq(adj) = 92.8%
Analysis of Variance
Source DF SS MS F P
Regression 3 795.20 265.07 82.59 0.000
Residual Error 16 51.35 3.21
Total 19 846.55
Regression Analysis: dayabaterai versus x, x**2, x**3, x**4
The regression equation is
dayabaterai = 68.0 + 12.0 x - 3.87 x**2 - 5.83 x**3 - 4.50 x**4
Predictor Coef SE Coef T P
Constant 68.0000 0.9014 75.44 0.000
x 11.958 1.713 6.98 0.000
x**2 -3.875 5.649 -0.69 0.503
x**3 -5.833 1.900 -3.07 0.008
x**4 -4.500 5.028 -0.90 0.385
S = 1.80278 R-Sq = 94.2% R-Sq(adj) = 92.7%
Analysis of Variance
Source DF SS MS F P
Regression 4 797.80 199.45 61.37 0.000
Residual Error 15 48.75 3.25
Total 19 846.55
Dari model regresi ordo 3 ini terlihat bahwa dari anova untuk model diperoleh
informasi bahwa model sudah sangat tepat dalam merepresentasikan data (nilai-p <
0.05) serta diperoleh R-Sq yang tinggi (93.9%). Sementara itu untuk uji koefisien
secara parsial terlihat bahwa semua koefisien untuk semua variabel nyata sehingga
kita putuskan untuk menggunakan model regresi polynomial ordo 3 atau model
regresi kubik.
Usaha menemukan model regresi polynomial yang lebih cepat dan mudah bisa
dengan menggunakan contrast polynomial orthogonal pada program SAS. Dimana
untuk n = 5, koefisien polynomial orthogonalnya sebagai berikut :
temperatur total
koefisien kontras ortogonal
linear kuadratik kubik kuartik
0 214 -2 2 -1 1
25 246 -1 -1 2 -4
50 272 0 -2 0 6
75 288 1 -1 -2 -4
100 263 2 2 1 1
4.6 Regresi Percobaan Tiga Faktor Bertaraf Kualitatif dan
Kuantitatif.
Model regresi dengan satu faktor bertaraf kuantitatif dan dua faktor bertaraf
kualitatif, katakanlah masing-masing faktor sebanyak tiga taraf. Proses pemodelan
regresi dapat dilakukan bertahap :
1. model sederhana untuk mengkaji pengaruh utama faktor kuantitatif A, ingin
dikaji sampai derajat dua (ordo dua).
2
1 2 1 1 0
X X Y + +
Y
= respon hasil pengamatan (variabel dependent)
1
X = bentuk pengaruh linear faktor kuantitatif A
2
1
X
= bentuk pengaruh kuadratik faktor kuantitatif A
2. model sederhana untuk mengkaji pengaruh utama faktor kualitatif B, maka
dibangun 3-1 = 2 variabel dummy (D)dengan b
1
sebagai kontrol.
2 4 1 3 0
D D Y + +
1
D =

'

) b dari (bukan lain pengamatan untuk 0


b taraf dari pengamatan jika 1
2
2

2
D =

'

) b dari (bukan lain pengamatan untuk 0


b taraf dari pengamatan jika 1
3
3
tahap kedua diperoleh model regresi :
2 4 1 3
2
1 2 1 1 0
D D X X Y + + + +
3. model sederhana untuk mengkaji pengaruh utama faktor kualitatif C, maka
dibangun 3-1 = 2 variabel dummy (D)dengan c
1
sebagai kontrol.
4 6 3 5 0
D D Y + +
24
3
D =

'

) c dari (bukan lain pengamatan untuk 0


c taraf dari pengamatan jika 1
2
2

4
D =

'

) c dari (bukan lain pengamatan untuk 0


c taraf dari pengamatan jika 1
3
3
tahap ketiga diperoleh model regresi :
4 6 3 5 2 4 1 3
2
1 2 1 1 0
D D D D X X Y + + + + + +
4. langkah terakhir merumuskan bentuk pengaruh interaksi antara faktor A, B,
dan C. Hanya dikaji interaksi antar faktor pada tingkat derajat pertama,
sehingga interaksi bentuk kuadratik tidak diperhatikan. Dalam kasus ini
dirumuskan interaksi X
1
, D
1
, D
2
, D
3
dan D
4
dengan tidak perlu mengkaji interaksi
diantara taraf-taraf faktor kualitatif (D
1
D
2
dan D
3
D
4
) karena lebih penting untuk
mengkaji interaksi antar taraf dari faktor yang berbeda.
Model lengkap yang mengkaji pengaruh 3 faktor, satu faktor bertaraf kuantitatif
dan dua faktor bertaraf kualitatif dengan masing-masing faktor tiga taraf.
2 1 8 1 1 7 4 6 3 5 2 4 1 3
2
1 2 1 1 0
D X D X D D D D X X Y + + + + + + + +
+ + + + + + +
4 2 14 3 2 13 4 1 12 3 1 11 4 1 10 3 1 9
D D D D D D D D D X D X
pada model tidak melibatkan bentuk interaksi diantara ketiga faktor, dalam
prakteknya bentuk interaksi bisa saja dimasukkan untuk diuji secara statistik.
Contoh :
Percobaan pengaruh pemupukan nitrogen ((0, 50, 100) kgN/ha), manajemen
pertanaman (m1_minimum, m2_optimum, m3_intensif) serta jenis varietas (v1, v2, v3)
pemupukan (N)
manajemen
(M)
varietas
(V)
ulangan ke-
rata-rata
1 2
n1
m1
v1 3.32 3.864 3.592
v2
6.101 5.122 5.612
v3
5.355 5.536 5.446
m2
v1
3.766 4.311 4.039
v2
5.096 4.873 4.985
v3
7.442 6.462 6.952
m3
v1
4.66 5.915 5.288
v2
6.573 5.495 6.034
v3
7.018 8.02 7.519
n2
m1
v1
3.188 4.752 3.97
v2
5.595 6.78 6.188
v3
6.706 6.546 6.626
m2
v1
3.625 4.809 4.217
v2
6.357 5.925 6.141
v3
8.592 7.646 8.119
m3
v1
5.232 5.17 5.201
v2
7.016 7.442 7.229
v3
8.48 9.942 9.211
n3
m1
v1
5.468 5.788 5.628
v2
5.442 5.988 5.715
v3
8.452 6.698 7.575
m2
v1
5.759 6.13 5.945
v2
6.398 6.533 6.466
25
v3
8.662 8.526 8.594
m3
v1
6.215 7.106 6.661
v2
6.953 6.914 6.934
v3
9.112 9.14 9.126
Untuk entri data seperti pada kasus-kasus sebelumnya, dimana faktor yang
bertaraf kualitatif akan ditransformasi dan faktor bertaraf kualitatif akan di-dummy.
Langkah-langkah dalam MINITAB:
Peubah Respon disimpan di C5 dan peubah-peubah penjelas di kolom
berikutnya
Klik Stat > Regression > Regression
Response : Masukkan peubah respon (C5)
Predictors : Masukkan peubah bebas (C6-C19)
Klik Graphs :
Residual for plots : pilih Regular
Residual plots : pilih four in one
Klik Options :
Display, pilih variance inflation factor
Klik Result : Pilih option kedua regression equation, table ....
Klik storage : Checklist pada residuals.
Klik OK!
26
Regression Analysis: respon versus X1, X1**2, ...
The regression equation is
respon = 4.46 + 0.865 X1 - 0.094 X1**2 + 0.337 D1 + 1.32 D2 + 1.44 D3 + 2.15 D4
+ 0.127 X1D1 - 0.065 X1D2 - 0.472 X1D3 + 0.011 X1D4 - 0.311 D1D3
+ 1.00 D1D4 - 0.426 D2D3 + 0.750 D2D4
Predictor Coef SE Coef T P VIF
Constant 4.4595 0.2844 15.68 0.000
X1 0.8652 0.2348 3.68 0.001 5.0
X1**2 -0.0942 0.1819 -0.52 0.607 1.0
D1 0.3367 0.3638 0.93 0.360 4.0
D2 1.3197 0.3638 3.63 0.001 4.0
D3 1.4413 0.3638 3.96 0.000 4.0
D4 2.1522 0.3638 5.92 0.000 4.0
X1D1 0.1267 0.2572 0.49 0.625 2.0
X1D2 -0.0649 0.2572 -0.25 0.802 2.0
X1D3 -0.4718 0.2572 -1.83 0.074 2.0
X1D4 0.0106 0.2572 0.04 0.967 2.0
D1D3 -0.3110 0.5144 -0.60 0.549 3.6
D1D4 1.0028 0.5144 1.95 0.058 3.6
D2D3 -0.4255 0.5144 -0.83 0.413 3.6
D2D4 0.7502 0.5144 1.46 0.153 3.6
S = 0.630067 R-Sq = 87.8% R-Sq(adj) = 83.4%
Analysis of Variance
Source DF SS MS F P
Regression 14 111.1780 7.9413 20.00 0.000
Residual Error 39 15.4824 0.3970
Total 53 126.6604
Residual
P
e
r
c
e
n
t
1.0 0.5 0.0 -0.5 -1.0
99
90
50
10
1
Fitted Value
R
e
s
i
d
u
a
l
10 8 6 4
1.0
0.5
0.0
-0.5
-1.0
Residual
F
r
e
q
u
e
n
c
y
1.2 0.6 0.0 -0.6 -1.2
16
12
8
4
0
Observation Order
R
e
s
i
d
u
a
l
50 45 40 35 30 25 20 15 10 5 1
1.0
0.5
0.0
-0.5
-1.0
Normal Probability Plot of the Residuals Residuals Versus the Fitted Values
Histogram of the Residuals Residuals Versus the Order of the Data
Residual Plots for respon
interpretasi :
Dari pengujian secara parsial diatas, bentuk kuadratik dari X
1
serta bentuk
interaksi antar variabel bebas tidak nyata. Oleh karena itu model bisa disederhanakan
dengan hanya terdiri dari bentuk yang nyata saja, sehingga diperoleh model regresi
baru :
4 5 3 4 2 3 1 2 1 1 0
D D D D X Y + + + + +
kemudian dilakukan analisis regresi untuk model diatas dengan bantuan MINITAB,
diperoleh model dugaan regresi :
Interpretasi :
Dari output diatas dapat diperoleh beberapa informasi, nilai-p untuk masing-
masing koefisien peubah bebas mempunyai pengaruh yang nyata terhadap perubahan
hasil (nilai-p < 0.05), kemudian dari R-Sq diperoleh kesimpulan bahwa model
mampu menerangkan 83.4% keragaman data serta dari anova model diperoleh
informasi bahwa model sudah cukup baik atau tepat untuk menginterpretasikan data
(nilai-p < 0.05)
Faktor pemupukan berpengaruh positif terhadap hasil, dimana setiap
peningkatan satu taraf pemupukan pada range 0 sampai 100 akan meningkatkan hasil
sebesar 0.732 ton/ha. Pada faktor manajemen diperoleh informasi bahwa
manajemen optimum memberikan nilai rata-rata produksi lebih tinggi sekitar 0.567
ton/ha dari menajemen minimum serta manajemen intensif memberikan nilai rata-
rata produksi lebih tinggi sekitar 1.428 ton/ha dari menajemen minimum.
27
Regression Analysis: respon versus X1, D1, D2, D3, D4
The regression equation is
respon = 4.28 + 0.732 X1 + 0.567 D1 + 1.43 D2 + 1.20 D3 + 2.74 D4
Predictor Coef SE Coef T P VIF
Constant 4.2837 0.2013 21.28 0.000
X1 0.7321 0.1103 6.64 0.000 1.0
D1 0.5673 0.2205 2.57 0.013 1.3
D2 1.4279 0.2205 6.48 0.000 1.3
D3 1.1958 0.2205 5.42 0.000 1.3
D4 2.7365 0.2205 12.41 0.000 1.3
S = 0.661529 R-Sq = 83.4% R-Sq(adj) = 81.7%
Analysis of Variance
Source DF SS MS F P
Regression 5 105.655 21.131 48.29 0.000
Residual Error 48 21.006 0.438
Total 53 126.660
Pada faktor varietas diperoleh informasi bahwa varietas_2 memberikan nilai
rata-rata produksi lebih tinggi sekitar 1.195 ton/ha dari varietas_1 (kontrol) serta
varietas_3 memberikan nilai rata-rata produksi lebih tinggi sekitar 2.736 ton/ha dari
varietas_1. Selain informasi di atas, dari nilai VIF juga memperlihatkan bahwa tidak
adanya multikolinearitas di dalam variabel-variabel tersebut (VIF < 10.0)
Model persamaan regresi diatas juga bisa digunakan dalam peramalan produksi
dari kombinasi perlakuan tertentu. Sebagai contoh, ingin meramalkan hasil produksi
dari varietas_3 dengan manajemen intensif serta pemupukan 50 N/ha. Maka
ditetapkan besaran-besaran X
1
=0, D
1
=0, D
2
=1, D
3
=0, D
4
=1, sehingga diperoleh :
( ) ( ) ( ) ( ) ( ) ( ) 448 . 8 1 2.74 0 1.20 1 1.43 0 0.567 0 0.732 4.28 + + + + + Y E
dengan demikian dapat diramalkan bahwa hasil produksi dari kombinasi perlakuan
diatas adalah 8.448 ton/ha.
5 REGRESI DAN MASALAH PELANGGARAN ASUMSI
Dalam melakukan analisis regresi kadang kita lupa melakukan pengujian
terhadap data yang akan dianalisis, terutama yang melibatkan uji nyata. Dalam
analisis regresi asumsi-asumsi yang mendasari harus terpenuhi, yang apabila tidak
dipenuhi akan berakibat uji yang kita lakukan menjadi tidak efisien dan kesimpulan
yang didapat berbias.
Model Persamaan Regresi :
Y
i
=
0
+
1
X
1i
+
2
X
2i
+
3
X
3i
+ ... +
p

pi
+
i
Bila dituliskan dalam bentuk matriks :
+ X Y
Y merupakan vektor peubah respon yang berukuran nx1, matriks X merupakan
matriks peubah penjelas ditambah intersep (1) berukuran nxk, dan

merupakan
vektor koefisien regresi yaitu parameter yang ingin diduga. Vektor ini berukuran kx1
sedangkan adalah vektor galat berukuran nx1.
1
1
1
1
]
1

n
y
y
y
Y
...
2
1
;
1
1
1
1
1
]
1

np n
p
p
X X
X X
X X
X
... 1
... ... ... ...
... 1
... 1
1
2 21
1 11
;
1
1
1
1
1
]
1

...
1
0
;
1
1
1
1
]
1

...
2
1
Catatan : k = p + 1 (k = banyak peubah + 1 buah peubah intersep)
Beberapa asumsi yang terdapat dalam analisis regresi:

i
menyebar saling bebas mengikuti sebaran normal dengan uji nilai tengah
atau E(
i
) = 0 dan ragam (
2
)
Ragam galat homogen atau tidak terjadi masalah heteroskedastisitas, artinya
keragaman bersifat konstan untuk setiap periode waktu
Galat pada waktu ke-t tidak memiliki hubungan dengan galat pada waktu
sebelumnya
Tidak ada hubungan antar peubah X [E(X
i
,X
j
) = 0, untuk semua i j] atau pada
waktu sebelumnya

i
bersifat bebas terhadap peubah X, E(
i
, X
i
)
Dalam berbagai kasus sering ditemukan adanya pelanggaran terhadap asumsi
persamaan regresi. Misalnya dalam peubah-peubah ekonomi seringkali datanya
mengandung korelasi antar peubah itu sendiri yang dipengaruhi oleh waktu, data yang
berbentuk cross panel dimana masalah heteroskedastisitas sering terjadi. Diperlukan
analisis untuk mendeteksi pelanggaran asumsi maupun perlakuan terhadap data agar
dapat diuji dan memberi informasi.
5.1 Heteroskedastisitas (Heteroscedasticity)
Heterokesdastisitas adalah sebuah kondisi dimana keragaman galat (
2
) tidak
sama untuk setiap t, dimana t=1, 2,3 ,..,n. Artinya keragaman galat tidak konstan atau
ragam galat merupakan suatu bentuk fungsi dari i dengan dengan fungsi (
2
t
). Hal ini
28
akan berakibat ketidakefisienan pengujian yang akan kita lakukan, karena keragaman
galat merupakan fungsi dari t, maka akan berpengaruh pada keragaman koefisien
penduga, sehingga statistik uji t untuk tiap peubah menjadi tidak valid. Hal ini pun
dapat mengakibatkan analisis yang kita lakukan menghasilkan model yang
bertentangan dengan teori yang berlaku
Cara mendeteksi heteroskedastisitas :
Misalkan kita ingin menguji apakah model persamaan linier antara peubah X
dan Y mengandung heterokesdastisitas. Gunakan data Pengeluaran dan Pendapatan
sebagai peubah respon (Y) dan peubah penjelas (X).
No
Pendapatan per Kapita
(X)
Impor per
Kapita (Y)
No
Pendapatan per Kapita
(X)
Impor per
Kapita (Y)
1 0.159 0.012 16 1.147 0.114
2 0.242 0.068 17 1.456 0.129
3 0.245 0.112 18 1.572 0.281
4 0.329 0.048 19 2.544 0.454
5 0.394 0.165 20 3.083 0.440
6 0.433 0.118 21 4.211 0.996
7 0.475 0.112 22 4.556 1.408
8 0.534 0.152 23 5.002 1.639
9 0.570 0.182 24 6.324 3.872
10 0.715 0.114 25 6.329 0.695
11 0.961 0.356 26 6.800 1.096
12 0.963 0.115 27 8.372 1.986
13 0.998 0.195 28 8.400 3.142
14 1.056 0.469 29 8.894 2.481
15 1.077 0.460 30 9.640 0.838
Cara mendeteksi :
Asumsi yang berlaku :
Jumlah pengamatan (sekurang-kurangnya) dua kali jumlah variabel bebas
dalam model

i
nir-otokorelasi dan berdistribusi normal
Susun hipotesis :
H0 : Tidak terdapat heteroskedastisitas
H1 : Terdapat heteroskedastisitas
a. Urutkan data semua peubah berdasarkan peubah bebas (variabel X) dari
data terkecil ke data yang besar.
Perintah :
Membuat peringkat pada variabel X
Klik Data > Rank
Rank data in : isi dengan peubah bebas (X) yang dijadikan
patokan pengurutan data
Store Rank in : isi dengan C3 (kolom yang masih kosong)
Mengurutkan X dan Y mengikuti urutan variabel X dari kecil ke besar
Klik Data > Sort
29
Sort Column : isi dengan peubah yang akan diurutkan
By column : isi dengan C3 (rank)
Store sorted column : pilih option ketiga, isi dengan kolom
yang masih kosong
b. Bagi data contoh tersebut menjadi dua bagian yang sama besar, bila perlu buang
bagian tengah pengamatan.
Perintah :
MTB > delete 13:18 C4 C5 # delete baris ke 13-18 pada C4 dan C5 #
MTB > set C7 # membuat subscripts untuk membagi data #
DATA > (1:2)12
DATA > end
Klik Data > Unstack Colomn
unstack the data in : isi dengan kolom data peubah yang sudah
diurutkan yang hendak dibagi menjadi dua
bagian yang sama besar (C4 dan C5).
Using subscripts in : isi dengan kolom subscripts (C7)
Store unstacked data : pilih After last colomn in use.
Checklist [] pada Name the colomn containing the unstacked data
c. Regresikan masing-masing bagian data yang telah dipisahkan.
Langkah 1 :
regresikan peubah Y bagian PERTAMA (yang tadi sudah dibagi) dengan pasangan
peubah X-nya.
Klik Stat => Regression
Responses : isi dengan peubah sort_Y_1 ( peubah Y terurut)
Predictors : isi dengan peubah sort_X_1 (peubah X terurut)
Klik Storage : Checklist [] pada MSE, agar nilai Mean Square
Error (MSE) menjadi konstanta MSE1
30
output :
Langkah 2:
Regresikan peubah Y bagian kedua (yang tadi sudah dibagi) dengan pasangan
peubah X-nya.
Klik Stat > Regression > Regression
Responses : isi dengan peubah sort_Y_2 ( peubah Y terurut)
Predictors : isi dengan peubah sort_X_2 ( peubah X terurut)
Klik Storage : Checklist [] pada MSE, agar nilai Mean Square
Error (MSE) menjadi konstanta. MSE2
Output :
d. Hitung nilai Statistik uji F yakni:
1
2
MSE
MSE
F
hit

Jika F
hit
> F
0.10

,
_


2
2k c n
maka tolak Ho.
n = banyak data
c = banyak data yang dihilangkan
k = banyak parameter
31
Regression Analysis: sort_Y_1 versus sort_x_1
The regression equation is
sort_Y_1 = 0.0187 + 0.221 sort_x_1
Predictor Coef SE Coef T P
Constant 0.01873 0.04223 0.44 0.667
sort_x_1 0.22080 0.07511 2.94 0.015
S = 0.0660190 R-Sq = 46.4% R-Sq(adj) = 41.0%
Analysis of Variance
Source DF SS MS F P
Regression 1 0.037666 0.037666 8.64 0.015
Residual Error 10 0.043585 0.004359
Total 11 0.081251
Durbin-Watson statistic = 2.95307
Regression Analysis: sort_Y_2 versus sort_x_2
The regression equation is
sort_Y_2 = 0.241 + 0.218 sort_x_2
Predictor Coef SE Coef T P
Constant 0.2409 0.8606 0.28 0.785
sort_x_2 0.2179 0.1309 1.66 0.127
S = 1.01591 R-Sq = 21.7% R-Sq(adj) = 13.9%
Analysis of Variance
Source DF SS MS F P
Regression 1 2.858 2.858 2.77 0.127
Residual Error 10 10.321 1.032
Total 11 13.179
Durbin-Watson statistic = 1.90780
Klik Calc > Calculator
Store Result in Variable : isikan kolom yang masih kosong
Expression : isikan MSE
2
/MSE
1
Klik Data > Display Data
... to display: isi dengan MSE1 dan MSE2
output (di window session):
Data Display
MSE1 0.004359
MSE2 1.032
F-hit 236.795
F-hit > F tabel = F
0.1(10,10)
= 2.32 (dilihat dari tabel F)
Keputusan :
Tolak Ho, atau model ini mengandung heteroskedastisitas.
Cara Mengatasi Masalah Heteroskedastisitas adalah dengan transformasi
Model. Sesungguhnya yang mengalami heteroskedastisitas adalah model persamaan
linier dimana terkait dengan peubah X dan Y. Sehingga salah satu cara untuk
mengatasi heteroskedastisitas adalah dengan mentransformasi peubah X dan Y
dengan Fungsi Log Linier.
Bentuk fungsi menjadi : Ln Y =
0
+ Ln X +
i
e
Cara mentransformasi model :
1. Transformasi peubah X :
Klik Calc > Calculator
Store result in variabel : masukkan kolom c3 (atau kolom yang
masih kosong)
Expression : isi dengan fungsi yang ingin kita lakukan,
cari di Function > Natural log, kemudian isikan
variabel X (Pendapatan per Kapita).
klik OK !
Beri nama kolom Ln X.
2. Transformasi peubah Y :
Langkahnya sama seperti yang diatas.
Beri nama kolom Ln Y
3. Buat peringkat atau rangking bagi peubah Ln Pendapatan per Kapita
Klik Manip > Rank
Rank data in : isi dengan peubah bebas (Ln X) yang dijadikan
patokan pengurutan data
Store Result in : isi dengan C5 (kolom yg masih kosong)
klik OK !
Beri nama kolom C5 dengan Rank
Langkah berikutnya sama seperti sebelumnya, hingga didapat F-hitung. Kemudian
bandingkan dengan F tabel.
32
Kesimpulan:
F-hit = 1.03503 < F-tabel (F
0.1

,
_


2
2k c n
= 2.32),
disimpulkan model sudah tidak lagi mengandung heteroskedasitas.
5.2 Autokorelasi (Serial Independen)
Salah satu asumsi yang harus terpenuhi suatu model persamaan linier adalah
nilai galat/error ( )
t
e antara satu pengamatan dengan pengamatan yang lain harus
saling bebas. Hal inilah yang menyebabkan nilai Cov antara keduanya 0.
( ) 0 , cov
1

t t
e e . Jika asumsi ini tidak terpenuhi maka akan terjadi korelasi antar galat
atau yang disebut autokorelasi, biasanya masalah autokorelasi terjadi pada data deret
waktu dimana peubah penjelasnya merupakan periode waktu (t).
t t t
e t X Z + + +
2 1 0

Misalkan:
1. Data penjualan mobil dari tahun ke tahun
2. Data ekspor import produk non migas di Negara-negara Asia Tenggara
3. Data pertumbuhan ekonomi Indonesia
Konsekuensi yang terjadi bila mengabaikan autokorelasi adalah Uji hipotesis
menjadi tidak valid, atau kesimpulan yang diambil dari data yang mengandung
autokorelasi tidak sesuai dengan yang seharusnya. Cara mendeteksi adanya
Autokorelasi korelasi adalah menggunakan Statistik Durbin Watson
Misal: Data yang digunakan adalah data Produksi Pangan Ekspor (employ.MTW)
Langkah-langkahnya yaitu :
1. Set peubah waktu dengan pada C4 dari 0 sampai 60.
2. Regresikan data Trade dengan Food dan Metals
Klik Stat > Regression > Regression
Response : masukkan peubah Trade
Predictors : masukkan peubah Food dan Metals
Klik Option : Checklist pada Durbin Watson Statistic
output :
33
Regression Analysis: Trade versus Food, Metals
The regression equation is
Trade = 67.1 + 0.225 Food + 5.90 Metals
Predictor Coef SE Coef T P
Constant 67.05 22.03 3.04 0.004
Food 0.2255 0.2336 0.97 0.339
Metals 5.9001 0.5034 11.72 0.000
S = 11.2084 R-Sq = 74.8% R-Sq(adj) = 74.0%
Analysis of Variance
Source DF SS MS F P
Regression 2 21302 10651 84.78 0.000
Residual Error 57 7161 126
Total 59 28463
Durbin-Watson statistic = 0.442200
interpretasi :
Statistik Durbin Watson sebesar 0.442. Nilai ini lebih kecil dibandingkan nilai
dt = 1.514 dari tabel Durbin Watson. Disimpulkan terdapat autokorelasi dalam data
Produksi Pangan ekspor.
Cara mengatasi autokorelasi adalah dengan melihat hubungan antar peubah
deret waktu yang secara teoritis memiliki hubungan.
Misalnya:
Hubugan antara tingkat pendapatan nasional (Yt) dengan tingkat konsumsi agregat
(Ct) Dengan bentuk fungsi :
t t
Y b b C
1 0
+
Hubungan antara besarnya volume perdagangan (Trade) dengan tingkat penjualan
bahan pangan dan tingkat penjualan metals (besi tambang).
Dengan bentuk model : Trade (t) = b
0
+ b
1
Food(t) + b
2
Metals(t)
5.2.1 Metode Kuadrat Terkecil Terboboti (Weighted Least Square)
Ketika terjadi autokorelasi antar galat, maka berarti telah terjadi perubahan
keragaman model setiap periode waktu atau
V
2
. Dimana V adalah matriks
diagonal yang elemennya tidak sama, sehingga galat ( ) tidak memiliki kesamaan
keragaman. Elemen dari diagonal matriks V
-1
disebut sebagai pembobot
(weighted). Pembobot ini berfungsi untuk menghilangkan pengaruh peubah time
series sehingga pendugaan yang didapatkan lebih valid dan yang diambil bersifat
efisien.
Dalam prakteknya cukup sulit untuk menentukan elemen matriks V secara
pasti, dan dalam penerapan metode kuadrat terkecil terboboti ini pembobot
(weighted) ditentukan dari pendugaan dari data, atau secara subjektif ditentukan
oleh analis.
Kuadrat Terkecil Terboboti (WLS) adalah sebuah alternatif dalam melakukan
transformasi untuk memperbaiki ketidaksamaan ragam dari model yang dibangun
oleh metode kuadrat terkecil (Ordinary Least Square)
Langkah analisis :
Masih menggunakan data awal (employ.mtw)
Tambahkan pada kolom selanjutnya nilai pembobot (weighted)
Dimana nilai pembobot ini ditentukan oleh peneliti.
Klik Stat > Regression > Regression
Klik Option : Pada Weights Masukkan peubah pembobot yang
ukurannya
sama dengan peubah respon.
Klik Display : checklist Durbin-Watson statistic, untuk
melihat apakah model ini masih mengandung
autokorelasi.
NB: Jika model tersebut masih mengandung autokorelasi, maka pilih
jenis pembobot lainnya.
34
5.2.2 Transformasi model
Salah satu penyebab model mengandung autokorelasi adalah karena tidak
dimasukkannya peubah yang sesungguhnya memiliki pengaruh nyata terhadap
respon. Dikarenakan model ini dipengaruhi oleh waktu, maka bisa jadi respon juga
dipengaruhi oleh peubah penjelas pada waktu t-i, dimana (i = 1,2.,3,..).
Contoh :
Membuat model dimana peubah responnya adalah 'Trade' dan peubah penjelasnya
adalah Food
t
, Food
t-1
, Sehingga model dugaan sebagai berikut :
Trade
t
= B
0
+ B
1
Trade
t-1
+ B
2
Food
t
+ B
3
food
t-1
Cara menganalisis menggunakan MINITAB:
1. Salin peubah 'Trade', Food'. 'Metals' yang ada dalam kolom C1, C2, C3 ke
kolom C5, C6, C7 pada baris ke-2 dengan menggunakan perintah:
MTB > let C5 = LAG('Trade')
MTB > let C6 = LAG('Food')
MTB > let C7 = LAG('Metals')
2. Beri nama kolom C5, C6, C7 dengan Trade_1, Food_1, Metals_1
3. Regresikan peubah 'Trade' terhadap Trade_1, Food_1, Metals_1
Klik Stat > Regression > Regression
Responses : isi dengan Trade
Predictors : isi dengan Trade_1, Food_1, Metals_1
Klik Options : checklist pada Durbin Watson statistic.
4. Lihat pada nilai Durbin Watson statistic, jika sudah tidak berautokorelasi dan
R-sq sudah mendekati 1. plot galat berdasarkan waktu, jika sudah tidak
membentuk plot musiman berarti model sudah tepat.
Output :
35
Regression Analysis: Trade versus Trade_1, Food_1, Metals_1
The regression equation is
Trade = 6.4 + 0.821 Trade_1 + 0.143 Food_1 + 1.07 Metals_1
59 cases used, 1 cases contain missing values
Predictor Coef SE Coef T P
Constant 6.37 14.46 0.44 0.661
Trade_1 0.82090 0.08503 9.65 0.000
Food_1 0.1431 0.1404 1.02 0.312
Metals_1 1.0742 0.5721 1.88 0.066
S = 6.63820 R-Sq = 91.2% R-Sq(adj) = 90.8%
Analysis of Variance
Source DF SS MS F P
Regression 3 25269.4 8423.1 191.15 0.000
Residual Error 55 2423.6 44.1
Total 58 27693.0
Durbin-Watson statistic = 1.52907
Interpretasi :
Stattistic Durbin Watson sebesar 1,53. Nilai ini lebih besar jika dibandingkan
nilai dt = 1.514 dari tabel Durbin-Watson. Disimpulkan tidak terdapat autokorelasi
dalam data Produksi Pangan ekspor.
5.3 MULTIKOLINIERITAS
Multikolinear adalah hubungan linear yang kuat antara peubah-peubah bebas
dalam persamaan regresi berganda. Adanya multikolinearitas menyebabkan
pendugaan koefisien regresi tidak nyata. Walaupun nilai R-Squarenya tinggi, tanda
koefisien regresi tidak sesuai dengan teori dan dengan Ordinary Least Square (OLS)
atau lebih dikenal dengan Metode Kuadrat Terkecil (MKT), pendugaan koefisien regresi
mempunyai simpangan baku yang sangat besar.
Untuk mendeteksi terjadinya multikolinearitas dapat dilihat dari nilai VIF
(Variance Inflation Factor). VIF dihitung dari matriks korelasi peubah bebas yang telah
dibakukan satuannya. Hubungan antar VIF dan kolinearitas adalah melalui hubungan:
2
1
1
R
VIF

Dimana R
2
adalah koefisien determinasi dari regresi X pada peubah bebas lainnya.
Nilai VIF yang lebih besar dari 10 menunjukkan gejala multikolinearitas (Ryan, 1997)
Pendugaan koefisien regresi dengan menggunakan metode MKT dalam
keadaan multikolinear cenderung memberi hasil yang tidak stabil. Metode yang dapat
digunakan untuk mengatasi multikolinear adalah dengan metode regresi komponen
utama.
Analisis regresi komponen utama merupakan suatu analisis kombinasi antara
analisis regresi dan analisis komponen utama. Dalam penggunaan metode regresi
komponen utama, jika seluruh komponen utama dimasukkan dalam persamaan
regresi maka akan dihasilkan model yang setara dengan yang diperoleh dengan MKT
(Jollife, 1986).
Metode regresi komponen utama diawali dengan mengoperasikan pada peubah
bebas yang dibakukan. Misalnya, matriks Z berasal dari matriks X yang terpusat dan
terskalakan dengan :
( )
2
1
jj
j
jj
jj
S
X X
Z

Suku-suku komponen utama PCi merupakan kombinasi linear antara matrik Z dengan
vektor a dalam bentuk :
k kj j j j
X a X a X a PC + + + .....
2 2 1 1
Prinsip dasar dari metode regresi kornponen utama adalah menggunakan skor
komponen utama. yang terpilih sebagai peubah bebas. Komponen-komponen utama
tersebut saling ortogonal. Dengan demikian metode regresi komponen utama
merupakan analisis regresi dari peubah respon terhadap komponen-komponen utama.
yang saling tidak berkorelasi. MKT digunakan untuk memperoleh pendugaan bagi Y
sebagai fungsi dari peubah-peubah PCi yang terpilih. Persamaan regresi komponen
utama dinyatakan sebagai :
36
p p
SC b SC b SC b b Y + + + + ....
2 2 1 1 0
Dengan SC adalah skor komponen utama.
Berdasarkan 2 persamaan diatas, persamaan regresi komponen utama dapat
ditransformasi ke peubah asal yang dibakukan, sehingga persamaan regresi dengan
peubah bebas yang dibakukan adalah :
p p
Z Z Z Y + + + + ....
2 2 1 1 0
Dengan :
0 0
b
p jp j j k
b a b a b a + + + ....
2 2 1 1

Langkah-langkah analisis :
1. Data diregresikan dengan Metode Kuadrat Terkecil (MKT) untuk memeriksa
koefisien parsial, pemeriksaan sisaan dan analisis.
2. Pemeriksaan multikolinearitas antar peubah bebas.
3. Mengatasi masalah multikolinearitas dengan Regresi Komponen Utama.
4. Algoritma regresi komponen utama adalah :
Pembakuan satuan pengukuran sehingga komponen utama diperoleh
dengan menurunkan dari matriks korelasi R.
Dari komponen utama akan diperoleh skor komponen utama yang
diregresikan dengan peubah tak bebas menggunakan MKT.
Pemeriksaan koefisien regresi komponen utama secara parsial.
Pemilihan koefisien regresi yang nyata dan akar ciri yang besar.
Substitusi persamaan regresi komponen utama dengan koefisien yang telah
dipilih kedalam peubah baku.
Transformasi peubah baku kedalam peubah asalnya.
Pemeriksaan sisaan.
x1 x2 x3 x4 y
9.75 6.50 1.61 0.65 67.50
10.50 10.25 2.00 0.75 68.90
11.25 11.90 2.50 0.90 70.65
12.60 11.75 2.70 1.15 73.60
11.90 11.00 2.25 0.95 71.89
15.20 13.50 3.25 1.75 84.50
12.25 12.00 2.90 1.05 72.34
12.90 12.60 3.00 1.00 77.65
14.30 13.20 3.10 1.70 80.25
13.25 12.90 3.05 1.25 79.87
15.30 14.00 3.25 1.80 86.75
8.90 9.25 1.90 0.60 65.75
10.60 10.50 1.95 0.50 70.20
17.25 15.00 3.50 2.00 89.25
16.90 14.90 3.40 1.95 85.00
Langkah-langkah menggunakan MINITAB:
1. Regresikan data tersebut
Klik Stat > Regression > Regression
Response : Masukkan peubah respon (y)
Predictors : Masukkan peubah bebas (x1 x2 x3 x4)
Klik Options: pada Display, pilih variance inflation factor
Klik Result : Pilih option kedua regression equation, table ....
37
Regression Analysis: y versus x1, x2, x3, x4
The regression equation is
y = 41.7 + 2.35 x1 - 0.248 x2 + 2.05 x3 + 1.57 x4
Predictor Coef SE Coef T P VIF
Constant 41.658 6.345 6.57 0.000
x1 2.347 1.066 2.20 0.052 24.7
x2 -0.2483 0.8428 -0.29 0.774 12.2
x3 2.052 3.526 0.58 0.573 16.0
x4 1.569 4.492 0.35 0.734 18.1
S = 2.02669 R-Sq = 94.9% R-Sq(adj) = 92.9%
Analysis of Variance
Source DF SS MS F P
Regression 4 763.97 190.99 46.50 0.000
Residual Error 10 41.07 4.11
Interpretasi :
Dari output analisis regresi diatas terlihat adanya informasi yang kontradiktif.
Dari anova model terlihat bahwa model sangat tepat atau bagus dalam menjelaskan
data (nilai-p < 0.05) serta nilai R-Sq yang sangat tinggi yaitu sebesar 94.4%, tetapi
koefisien masing-masing variabel penjelas tidak ada yang nyata atau variabel-variabel
tersebut tidak mempunyai pengaruh yang nyata terhadap respon. Nilai VIF dari
masing-masing variabel juga sangat besar (VIF > 10.0) yang berarti ada
multikolinearitas di dalam variabel-variabel bebasnya.
2. Lihat korelasi antar peubah bebasnya
Klik Stat > Basic statistics > Correlation
Variables : Masukkan peubah-peubah bebas yang ingin dilihat
korelasinya (x1-x4)
Checklist pada display p-value
38
Correlations: x1, x2, x3, x4
x1 x2 x3
x2 0.909
0.000
x3 0.933 0.952
0.000 0.000
x4 0.969 0.864 0.911
0.000 0.000 0.000
Cell Contents: Pearson correlation
P-Value
Interpretasi :
Dari matrix korelasi terlihat bahwa antar peubah penjelas terdapat korelasi
yang besar atau terdapat multikolinearitas pada peubah penjelas
3. Melakukan analisis komponen utama
Klik Stat > Multivariate > Principal component
Variables : isi dengan variable yang diamati (C1-C4)
Number of component : isi dengan banyaknya komponen utama yang
akan dikeluarkan dan nilainya, maksimal
sebanyak variabel.
Type of Matrix
Correlation : Jika antar variabel memiliki satuan skala beda
Covariance : Jika antar variabel memiliki skala yang sama
Klik Storage
Coefficients : Untuk menyimpan vektor ciri masing-masing
komponen utama dalam kolom yang kosong C19-C23
Score : Untuk menyimpan skor masing-masing komponen
utama dalam kolom yang kosong Masukkan C24-C28
Beri nama C6-C9 dengan PC1 sampai PC4
Beri nama C10-C13 dengan score1 sampai score4
Output :
Eigen value : Akar ciri dari komponen ke-i.
Proportion : Menerangkan besarnya keragaman yang dapat
diterangkan oleh komponen ke-i.
Cumulative : Menerangkan keragaman kumulatif yang dapat
diterangkan oleh komponen utama ke-i sampai ke-j.
Lihat dari nilai cumulative, jika lebih dari 75% cukup sampai score itu saja yang
diregresikan.
4. Regresi komponen utama
Klik Stat > Regression
Regresikan Y (C5) dengan score1 (C10)
Klik storage : checlist di coefficient
Klik result : pilih option kedua
Pada worksheet akan muncul colom coef1 (C14) yang merupakan koefisien
persamaan regresi. Untuk keperluan operasi matrix dalam mengembalikan ke
39
Principal Component Analysis: x1, x2, x3, x4
Eigenanalysis of the Correlation Matrix
Eigenvalue 3.7694 0.1625 0.0442 0.0239
Proportion 0.942 0.041 0.011 0.006
Cumulative 0.942 0.983 0.994 1.000
Variable PC1 PC2 PC3 PC4
x1 -0.506 0.340 0.357 -0.708
x2 -0.494 -0.639 0.507 0.301
x3 -0.504 -0.318 -0.781 -0.187
x4 -0.497 0.612 -0.075 0.611
peubah asal maka buang baris pertama di kolom coef1 (C14) yang merupakan
nilai konstanta regresi.
Interpretasi :
Dari output analisis regresi komponen utama dengan peubah bebas score1
diatas terlihat bahwa model sangat tepat atau bagus dalam menjelaskan data
(nilai-p < 0.05) serta nilai R-Sq yang sangat tinggi yaitu sebesar 92.4%, koefisien
variabel penjelas (score1) nyata atau variabel (score1) tersebut mempunyai
pengaruh yang nyata terhadap respon. Karena hanya digunakan satu variabel
penjelas (score1) maka nilai VIF tidak keluar karena secara otomatis tidak ada
multikolinearitas.
5. Mengembalikan ke peubah asal
Langkah :
Klik di Window SESSION
Pilih menu editor kemudian aktifkan enable command
pada session window muncul MTB >
a. Buat matriks M1 yang isinya Vektor-vektor ciri (PC1)
Klik Data > copy > Column to matrix
Copy from column : isi dengan vector ciri (c6)
Store copied data : ..., in matrix isi dengan m1
b. Buat matriks M2 yang isinya koefisien dari regresi skor KU
Klik Data > copy > Column to matrix
Copy from column : isi dengan koef score dari regresi
yang telah di hilangkan konstantanya
(c14)
Store copied data : ..., in matrix isi dengan m2
c. Kalikan matriks M1 dan M2, simpan hasilnya di M3
Klik Calc > matrix > arithmetic
Pilih multiply : isi m1 by m2, mengalikan m1 dan m2
Store result : isi dengan m3
Matriks M3 tersebut merupakan koefisien-koefisien regresi yang baru,
sedangkan untuk konstanta sama dengan persaman regresi skor komponen
utama
d. Mencetak m3, bisa lewat session atau dicetak di worksheet
Klik Data > copy > matrix to columns
Copy from matrix : isi dengan m3
Store copied data : ..,in column isi dengan C16 (optional)
ikuti langkah berikut :
a. MTB > copy c6 m1
b. MTB > copy c14 m2
c. MTB > mult m1 m2 m3
40
Regression Analysis: y versus score1
The regression equation is
y = 76.3 - 3.76 score1
Predictor Coef SE Coef T P
Constant 76.2733 0.5588 136.49 0.000
score1 -3.7552 0.2979 -12.60 0.000
S = 2.16435 R-Sq = 92.4% R-Sq(adj) = 91.9%
Analysis of Variance
Source DF SS MS F P
Regression 1 744.15 744.15 158.86 0.000
Residual Error 13 60.90 4.68
Total 14 805.05
d. MTB > print m3
Matrix M3
1.89868
1.85527
1.89089
1.86520
Didapat persamaan baru :
Y = 76.3 + 1.89868 Z1 + 1.85527 Z2 + 1.89089 Z3 + 1.8652 Z4
6. Menghitung t-hitung atau signifikansi dilakukan dengan excel.
7. Persamaan diatas masih dalam bentuk baku, sehingga perlu transformasi ke dalam
bentuk X. Transformasi dapat dilakukan di excel atau di minitab.
Konstanta untuk persamaan ini didapat dari koefisien regresi dalam bentuk
baku dikali dengan negatif rataan dibagi dengan standar deviasinya. Ini
dihitung untuk semua peubah penjelas. Kemudian untuk mendapat
konstantanya hasil semua tadi ditambahkan dengan konstanta persamaan
regresi dalam bentuk baku.
Untuk koefisien regresinya, koefisien regresi dalam bentuk baku dibagi
standar deviasi masing-masing.
Sehingga kita dapat persamaan regresi :
Y = 44.0938 + 0.752055 X1 + 0.827165 X2 + 3.08215 X3 + 3.63309 X4
6 PERANCANGAN PERCOBAAN
Perancangan percobaan adalah suatu uji atau sederetan uji baik itu
menggunakan statistika deskriptif maupun statistika inferensia. Yang bertujuan untuk
mengubah input menjadi output yang merupakan respon dari percobaan tersebut.
Pada dasarnyarancangan percobaan merupakan pengaturan pemberian
perlakuan kepada satuan-satuan percobaan dengan maksud agar keragaman respon
41
yang ditimbulkan oleh keadaan lingkungan dan keheterogenan bahan percobaan yang
digunakan dapat diwadahi dan disingkirkan sehingga yang berpengaruh terhadap
respon hanya perlakuan yang diberikan.
6.1 KLASIFIKASI PERLAKUAN
6.1.1 Rancangan Perlakuan
Merupakan rancangan yang berkaitan dengan bagaimana perlakuan
perlakuan dibentuk dan diberikan ke satuan percobaan
1. Satu Faktor
2. Dua Faktor
a. Percobaan Faktorial
Bersilang
Penelitian pengaruh pemberian pupuk N dan K terhadap produksi gabah.
Pupuk K terdiri dari 3 taraf (K1, K2, dan K3) dan pupuk N terdiri dari 4
taraf (N1,N2,N3, dan N4). Sehingga ada 12 kombinasi perlakuan, dan
bila ada 3 ulangan maka ada 36 unit percobaan. Jadi penekanan
perlakuan faktorial bersilang adalah interaksi antara faktor-faktornya.
Tersarang
Penelitian terhadap pengaruh obat para sitamol dan obat X terhadap
perkembangan bakteri. Parasitamol yang diberikan dengan dosis250g,
500g, dan 750g serta obat X dengan dosis 300g, 600g, dan 900g. dalam
hal ini dosis tersarang atau khas untuk jenis obat tertentu.
b. Split Plot
Bentuk khusus dari rancangan faktorial, dimana kombinasi perlakuan
tidak diacak secara penuh. Factor petak utama diacak terlebih dahulu
terhadap satuan percobaan dan factor anak petak diacak didalam petak
utama. Misal percobaan 2 faktor (varietas : V1, V2 serta kalium : K1, K2)
dengan 2 ulangan pada RAL. Kalium sebagai petak utama dan varietas
sebagai anak petak.
V1 V2 V1 V2
V2 V1 V2 V1
K1 K0 K0
Contoh diatas dengan RAK sebanyak 3 blok.
c. Split Blok/ Strip Plot
Rancangan Blok Terpisah mirip dengan Split Plot , namun dalam split
blok kedua faktor menjadi petak utama. Pengaruh perlakuan yang
ditekankan dalam rancangan ini adalah pengaruh interaksi. Penempatan
taraf-taraf kedua faktor dilakukan saling bersilangan, sebagai misal jika
taraf-taraf factor A diacak dalam plot-plot searah lajur maka taraf-taraf
factor B diacak dalam plot-plot searah baris.
Bagan percobaan dalam percobaan 2 faktor (A dan B) dengan masing-
masing 3 taraf.
Langkah pengacakan :
1. pilih kelompok secara acak
2. tempatkan taraf-taraf factor A secara acak pada setiap kelompok
mengikuti plot lajur
3. tempatkan taraf-taraf factor B secara acak pada setiap kelompok
mengikuti plot baris
3. Tiga Faktor
a. Faktorial
Bersilang; Tersarang; Campuran (bersilang dan tersarang)
42
b. Split-Split Plot
6.1.2 Rancangan Lingkungan
Berkaitan dengan kondisi lingkungan atau diluar perlakuanyang akan
mempengaruhi respon satuan percobaan.
1. Rancangan Acak Lengkap (RAL)
RAL merupakam metode dengan pengacakan secara lengkap sehingga
setiap satuan percobaan memiliki peluang yang sama untuk mendapat setiap
perlakuan. RAL hanya cocok bagi percobaan dengan satuan percobaan yang
homogen.
2. Rancangan Acak Kelompok (RAK)
RAK digunakan jika keheterogenan unit percobaan berasal dari satu
sumber keragaman. Pengelompokan dilakukan dengan tujuan untuk
memperoleh keragaman setiap kelompok yang minimal dan keragaman antar
kelompok maksimal, diharapkan dari pengelompokan ini resp[onyang muncul
pada setiap kelompok hanya diakibatkan oleh perlakuan .
3. Rancangan Bujur Sangkar Latin (RBSL)
RBSL digunakan jika kehetrogenan unit percobaan berasal berasal dari 2
sumber keragaman. Syaratnya adalah jumlah pengelompokan berdasar baris
dan kolom harus sama.
6.2 PERCOBAAN FAKTORIAL
6.2.1 Percobaan Dua Faktor RAL
Penelitian produksi 3 varietas (V1, V2, dan V3) yang diberikan 4 dosis pupuk
N (N1,N2,N3, dan N4). Sehingga ada 12 kombinasi perlakuan, dan bila ada 3
ulangan maka ada 36 unit percobaan.
Model :
( )
ijk ij j i ijk
AB B A Y + + + +
Hipotesis yang diuji :
pengaruh utama faktor A
0 ... :
2 1 0

a
A A A H (faktor A tidak berpengaruh)
:
1
H paling sedikit ada satu i dimana 0
i
A atau faktor A
mempunyai pengaruh yang nyata terhadap respon
pengaruh utama faktor B
pengaruh sederhana (interaksi) faktor A dan faktor B
ANOVA
sumber Db JK KT E (KT) Fhit
model tetap
A a-1 JKA KTA ( ) ( ) 1
2 2
+

a A br
i
KTA/KTG
B b-1 JKB KTB ( ) ( ) 1
2 2
+

b B ar
j
KTB/KTG
AB (a-1)(b-1) JKAB KTAB ( ) ( ) ( ) 1 1
2 2
+

b a AB r
ij
KTAB/KTG
RAB (ijk)
Galat/
ijk

ab(r-1) JKG KTG


2

Total abr-1 JKT


( )
ijk ij j i ijk
AB B A Y + + + +
model acak
A a-1 JKA KTA
2 2 2
A AB
br r

+ + KTA/KTAB
B b-1 JKB KTB
2 2 2
B AB
ar r

+ + KTB/KTAB
43
AB (a-1)(b-1) JKAB KTAB
2 2
AB
r

+ KTAB/KTG
Galat ab(r-1) JKG KTG
2

Total abr-1 JKT


model campuran (A acak dan B tetap)
A a-1 JKA KTA
2 2
A
br

+ KTA/KTG
B b-1 JKB KTB ( ) ( ) ( ) ( ) 1 1
2 2 2
+ +

b B ar b b r
i AB

KTB/KTAB
AB (a-1)(b-1) JKAB KTAB ( ) ( )
2 2
1
AB
b b r

+ KTAB/KTG
Galat ab(r-1) JKG KTG
2

Total abr-1 JKT


Keterangan : a = banyak taraf faktor A
b = banyak taraf faktor B
r = banyak ulangan
Contoh :
Data diatas adalah data dari balai karantina yang ingin mengetahui pengaruh
pemberian fumigasi dengan berbagai dosis (0,16,32,48,62;g/m
3
) dengan lama
fumigasi yang berbeda (2 dan 4 jam) terhadap daya kecambah benih tomat. Metode
pengecambahan yang digunakan adalah Growing On Test. Unit percobaan yang
digunakan diasumsikan homogen.
Langkah-langkah analisis dengan minitab :
Klik Stat > ANOVA > General Linear Model
Responses : isi dengan kolom Respon yang akan diperiksa.
Model : isi dengan kolom variabel bebas yang sesuai dengan
rancangan yang digunakan model = lama dosis
lama*dosis.
333
lama
fumigasi
(jam)
ulangan
dosis fumigasi (g/m3)
rata-rata
0 16 32 48 64
2
1 96 92 92 74 50



2 98 88 94 74 50
3 94 90 84 68 54
rata-rata 96 90 90 72 51.333 79.87
4
1 90 88 78 0 0



2 94 92 82 0 0
3 92 94 74 0 0
rata-rata 92 91.333 78 0 0 52.27
rata-rata
94 90.667 84 36 25.67 66.07
output :
44
General Linear Model: RESPON versus LAMA, DOSIS
Factor Type Levels Values
LAMA fixed 2 2, 4
DOSIS fixed 5 0, 16, 32, 48, 64
Analysis of Variance for RESPON, using Adjusted SS for Tests
Source DF Seq SS Adj SS Adj MS F P
LAMA 1 5713.2 5713.2 5713.2 691.11 0.000
DOSIS 4 25459.2 25459.2 6364.8 769.94 0.000
LAMA*DOSIS 4 6258.1 6258.1 1564.5 189.26 0.000
Error 20 165.3 165.3 8.3
Total 29 37595.9
S = 2.87518 R-Sq = 99.56% R-Sq(adj) = 99.36%
Intepretasi Output :
Dari hasil output diatas dapat diketahui bahwa lama fumigasi mempengaruhi/
berpengaruh nyata terhadap daya kecambah benih tomat, demikian juga dengan
pemberian dosis dan interaksi antara lama fumigasi dan pemberian dosis
fumigasinya.Hal ini diketahui dari nilai p-value-nya yang lebih kecil dari nilai = 0.
05
Intepretasi Output :
Dari hasil output diatas dapat diketahui bahwa lama fumigasi mempengaruhi/
berpengaruh nyata terhadap daya kecambah benih tomat, demikian juga dengan
pemberian dosis dan interaksi antara lama fumigasi dan pemberian dosis
fumigasinya.Hal ini diketahui dari nilai p-value-nya yang lebih kecil dari nilai = 0.
05
6.2.2 Percobaan Dua Faktor RAK
Model :
( )
ijk k ij j i ijk
K AB B A Y + + + + +
Hipotesis yang diuji :
pengaruh utama faktor A
pengaruh utama faktor B
pengaruh sederhana (interaksi) faktor A dan faktor B
pengaruh pengelompokan
ANOVA
sumber db JK KT E (KT) Fhit
model tetap
A a-1 JKA KTA ( ) ( ) 1
2 2
+

a A br
i
KTA/KTG
B b-1 JKB KTB ( ) ( ) 1
2 2
+

b B ar
j
KTB/KTG
AB (a-1)(b-1) JKAB KTAB ( ) ( ) ( ) 1 1
2 2
+

b a AB r
ij
KTAB/KTG
Blok r-1 JKK KTK
2 2
K
ab

+ KTK/KTG
Galat (ab-1)(r-1) JKG KTG
2

Total abr-1 JKT


( )
ijk k ij j i ijk
K AB B A Y + + + + +
model acak
A a-1 JKA KTA
2 2 2
A AB
br r

+ + KTA/KTAB
B b-1 JKB KTB
2 2 2
B AB
ar r

+ + KTB/KTAB
AB (a-1)(b-1) JKAB KTAB
2 2
AB
r

+ KTAB/KTG
Blok r-1 JKK KTK
2 2
K
ab

+ KTK/KTG
Galat (ab-1)(r-1) JKG KTG
2

Total abr-1 JKT


model campuran (A acak dan B tetap)
A a-1 JKA KTA
2 2
A
br

+ KTA/KTG
B b-1 JKB KTB ( ) ( ) ( ) ( ) 1 1
2 2 2
+ +

b B ar b b r
i AB

KTB/KTAB
AB (a-1)(b-1) JKAB KTAB ( ) ( )
2 2
1
AB
b b r

+ KTAB/KTG
Blok r-1 JKK KTK
2 2
K
ab

+ KTK/KTG
Galat (ab-1)(r-1) JKG KTG
2

45
Total abr-1 JKT
Langkah-langkah analisis dengan minitab :
Langkah pengujian sama persis dengan RAL, hanya berubah di model.
Klik Stat > ANOVA > General Linear Model
Responses : isi dengan kolom Respon yang akan diperiksa.
Model : isi dengan kolom variabel bebas yang sesuai dengan
rancangan yang digunakan Model = Blok A B A*B.
6.2.3 Percobaan Dua Faktor RBSL
RBSL dilakukan apabila keheterogenan unit percobaan berasal dari dua
sumber keragaman. Pengelompokan dilakukan 2 arah yaitu berdasar baris dan
kolom. Misal:
Percobaan di perbukitan, pengelompokan berdasar arah kemiringan dan arah
mata angin.
Percobaan efektifitas jenis mesin, pengelompokan berdasar shift kerja dan
operator.
Syarat dari RBSL adalah jumlah pengelompokan berdasar baris dan kolom harus
sama. RBSL jarang dilakukan pada percobaan 2 faktor karena jika kombinasi
perlakuan yang digunakan besar maka unit percobaannya juga sangat besar, untuk
rancangan 2 faktor RBSL masih dapat diterapkan bila taraf-taraf faktor yang
digunakan tidak terlalu besar misal 2x3 atau 3x3
Model :
( )
( )
ijk l k ij j i kl ij
L K AB B A Y + + + + + +
6.3 RANCANGAN PETAK TERPISAH ( Split Plot Design)
Model :
( )
ijk ij j ik i ijk
AB B U A Y + + + + +
ijk
Y
= nilai pengamatan pada faktor A taraf ke-i dan faktor B
taraf ke-j serta ulangan ke-k

= rataan umum
i
A = pengaruh utama faktor A
ik
U = komponen acak dari petak utama, menyebar normal ( )
2
, 0
U

j
B
= pengaruh utama faktor B
( )
ij
AB
= pengaruh komponen interaksi faktor A dan faktor B
ijk

= pengaruh acak yang menyebar normal ( )


2
, 0

Hipotesis: sama seperti pada rancangan faktorial RAL.


ANOVA
sumber db JK KT E (KT) Fhit
model tetap
A a-1 JKA KTA ( ) ( ) 1
2 2 2
+ +

a A br b
i U

KTA/KTGa
Galat (a) /
RA(ik)
a (r-1) JKGa KTGa
2 2
U
b

+
B b-1 JKB KTB ( ) ( ) 1
2 2
+

b B ar
j
KTB/KTG
AB (a-1)(b-1) JKAB KTAB ( ) ( ) ( ) 1 1
2 2
+

b a AB r
ij
KTAB/KTG
Galat (B) /
RAB(ijk)
a(b-1)(r-1) JKGb KTGb
2

Total abr-1 JKT


( )
ijk ij j ik i ijk
AB B U A Y + + + + +
model acak
46
A a-1 JKA KTA
2 2 2 2
A AB U
br r b

+ + + **
Galat (a) a (r-1) JKGa KTGa
2 2
U
b

+
B b-1 JKB KTB
2 2 2
B AB
ar r

+ + KTB/KTAB
AB (a-1)(b-1) JKAB KTAB
2 2
AB
r

+ KTAB/KTGb
Galat (b) a(b-1)(r-1) JKGb KTGb
2

Total abr-1 JKT


model campuran (A acak dan B tetap)
A a-1 JKA KTA
2 2 2
A U
br b

+ + KTA/KTGa
Galat (a) a (r-1) JKGa KTGa
2 2
U
b

+
B b-1 JKB KTB ( ) ( ) ( ) ( ) 1 1
2 2 2
+ +

b B ar b b r
i AB

KTB/KTAB
AB (a-1)(b-1) JKAB KTAB ( ) ( )
2 2
1
AB
b b r

+ KTAB/KTGb
Galat (b) a(b-1)(r-1) JKG KTGb
2

Total abr-1 JKT


** = F
hit
faktor A model acak =
B A
KTG KTAB KTG
KTA
+
Langkah-langkah analisis dengan minitab :
Klik Stat > ANOVA > General Linear Model
Responses : isi dengan kolom Respon yang akan diperiksa.
Model : isi dengan kolom variabel bebas yang sesuai dengan
rancangan yang digunakan Model = A ulangan(A) B A*B.
6.4 RANCANGAN BLOK TERPISAH ( Split Block Design or Strip
Plot Design)
Model :
( )
ijk ij jk j ik i k ijk
AB V B U A K Y + + + + + + +
ANOVA
sumber db JK KT E (KT) Fhit
model tetap
Blok r-1 JKK KTK
A a-1 JKA KTA ( ) ( ) 1
2 2 2
+ +

a A br b
i U

KTA/KTGa
Galat (a) /
RA(ik)
(a-1) (r-1) JKGa KTGa
2 2
U
b

+
B b-1 JKB KTB ( ) ( ) 1
2 2 2
+ +

b B ar a
j V

KTB/KTGb
Galat(b) /
RA(jk)
(b-1)(r-1) JKGb KTGb
2 2
V
a

+
AB (a-1)(b-1) JKAB KTAB ( ) ( ) ( ) 1 1
2 2
+

b a AB r
ij

KTAB/KTG
c
Galat(c) /
AB(ijk)
(a-1)(b-1)(r-1) JKGc KTGc
2

Total abr-1 JKT


( )
ijk ij jk j ik i k ijk
AB V B U A K Y + + + + + + +
model acak
Blok r-1 JKK KTK
A a-1 JKA KTA
2 2 2 2
A AB U
br r b

+ + + *
Galat (a) (a-1) (r-1) JKGa KTGa
2 2
U
b

+
B b-1 JKB KTB
2 2 2 2
B AB V
ar r a

+ + + **
Galat(b) (b-1)(r-1) JKGb KTGb
2 2
V
a

+
AB (a-1)(b-1) JKAB KTAB
2 2
AB
r

+
KTAB/KTG
c
47
Galat(c) (a-1)(b-1)(r-1) JKGc KTGc
2

Total abr-1 JKT


model campuran (A acak dan B tetap)
Blok r-1 JKK KTK
A a-1 JKA KTA
2 2 2
A U
br b

+ + KTA/KTGa
Galat (a) (a-1) (r-1) JKGa KTGa
2 2
U
b

+
B b-1 JKB KTB ( ) ( ) ( ) ( ) 1 1
2 2 2 2
+ + +

b B ar b b V a
i AB V

KTB/KTGb
Galat(b) (b-1)(r-1) JKGb KTGb
2 2
V
a

+
AB (a-1)(b-1) JKAB KTAB ( ) ( )
2 2
1
AB
b b r

+
KTAB/KTG
c
Galat(c) (a-1)(b-1)(r-1) JKGc KTGc
2

Total abr-1 JKT


* = F
hit
faktor A model acak =
C A
KTG KTAB KTG
KTA
+
** = F
hit
faktor B model acak =
C B
KTG KTAB KTG
KTA
+
Langkah-langkah analisis dengan minitab :
Langkah pengujian persis faktorial RAL, hanya berubah di model.
Klik Stat > ANOVA > General Linear Model
Responses : isi dengan kolom Respon yang akan diperiksa.
Model : isi dengan kolom variabel bebas yang sesuai dengan
rancangan yang digunakan Model = A ulangan(A) B
ulangan(B) A*B.
7 PENGUJIAN ASUMSI
Asumsi-asumsi yang mendasari analisis ragam yang perlu diperhatikan agar
pengujian menjadi shahih adalah :
a. Model bersifat aditif
Dalam hal ini komponen-komponen penyusun model harus bersifat aditif
atau bersifat dapat dijumlahkan sesuai dengan model yang dibangun. Setiap
rancangan percobaan mempunyai model matematika yang disebut model linier
aditif. Dalam kenyataannya, bila model tidak bersifat aditif maka perlu
dilakukan transformasi. Ketidakaditifan model akan mengakibatkan
keheterogenan ragam galat sehingga ragam galat gabungan yang diperoleh
sedikit tidak efisien, untuk selang kepercayaan pengaruh perlakuan dapat
memberikan tingkat nyata palsu untuk perbandingan nilai tengah.
b. Komponen galat bersifat homogen.
Keheterogenan ragam galat dapat memberikan respon yang erotik dari
beberapa perlakuan tertentu. Keheterogenan galat akan mengakibatkan
berkurangnya keefisienan pendugaan beda-beda pengaruh antar t perlakuan.
Selain itu juga mempengaruhi kepekaan uji-uji nyata.
c. Galat menyebar normal
48
Galat harus menyebar normal karena uji yang digunakan adalah uji-F.
Sebaran F diturunkan dari sebaran chi-square yang diturunkan dari sebaran
normal.
d. Komponen galat bersifat acak/bebas
Galat percobaan harus bersifat bebas atau tidak ada korelasi antar galat.
Galat yang tidak bebas akan mengakibatkan uji nyata yang kita lakukan dapat
mengecoh dalam mengambil keputusan
Untuk pengujian asumsi, software Minitab menyediakan fasilitas yang lebih
mudah. Dan sebelum kita melakukan uji formal, terlebih dahulu lakukan pengujian
secara grafis dan pemunculan residual. Tapi sebelum melakukan pengujian asumsi,
harus dibentuk dulu model dari rancangan percobaan.
Langkah-langkah pengujian grafis dan pemunculan residu :
Klik Stat > ANOVA > General Linear Model
Responses : isi dengan kolom Respon yang akan diperiksa, bisa
lebih dari satu respon sekaligus.
Model : isi dengan kolom variabel bebas yang sesuai dengan
rancangan yang digunakan
Klik graphs : pilih Residual serta pada residual plots pilih
four in one.
Klik storage : klik di residuals.
Klik results : untuk menentukan output yang ingin ditampilkan,
klik di analysis of variance table
klik OK pada kotak dialog general linear model.
Output :
Residual
P
e
r
c
e
n
t
5.0 2.5 0.0 -2.5 -5.0
99
90
50
10
1
Fitted Value
R
e
s
i
d
u
a
l
100 75 50 25 0
5.0
2.5
0.0
-2.5
-5.0
Residual
F
r
e
q
u
e
n
c
y
4 2 0 -2 -4 -6
10.0
7.5
5.0
2.5
0.0
Observation Order
R
e
s
i
d
u
a
l
30 28 26 24 22 20 18 16 14 12 10 8 6 4 2
5.0
2.5
0.0
-2.5
-5.0
Normal Probability Plot of the Residuals Residuals Versus the Fitted Values
Histogram of the Residuals Residuals Versus the Order of the Data
Residual Plots for RESPON
interpretasi (eksploratif):
Hasil plot Residuals versus the order of the data yang berbentuk acak
menunjukkan bahwa residual bersifat bebas. Jika plotnya membentuk pola
tertentu, ini berarti residual tidak bersifat bebas.
Hasil plot residuals versus the fitted values yang tidak menunjukkan pola
tertentu mengindikasikan bahwa ragam residual bersifat homogen. Tetapi jika
ada pola tertentu yang terbentuk, hal ini mengindikasikan keheterogenan ragam
residual.
Hasil plot normal probability plot of the residuals yang membentuk pola garis
lurus menunjukkan bahwa residual menyebar normal. Jika tidak, maka berarti
residual tidak menyebar normal.
Dengan pengujian secara grafis, terkadang kita mengalami keraguan untuk
menetukan ada tidaknya pola yang terbentuk pada grafik.Untuk mengatasi masalah
49
itu, maka diperlukan pengujian secara formal.
7.1 Pengujian Keaditifan Model
Adanya ketakaditifan dalam model akan mengakibatkan keheterogenan
ragam galat. Dan sayangnya, baik Minitab maupun SAS tidak menyediakan menu
untuk melakukan pengujian ini, sehingga kita melakukannya dengan menggunkan
Excel atau dihitung secara manual.
Untuk menguji keaditifan model kita gunakan uji Tukey sebagai berikut:
2
..
.
2
..
.
2
) (
) ( ) ( Y Y Y Y r
Q
JK
j i
NONADITIF

dimana : r = banyak ulangan.


ij
j i Y Y Y Y Y Q ) )( ( .. . .. .
) ( ) (
) (
/
galat galat
nonaditif
hitung
db JK
JK
F
Apabila
) , 1 ( dbgalat hitung
F F

maka keaditifan model dapat diterima, selainnya tolak


keaditifan model.
7.2 Pengujian Kenormalan Galat
Galat harus menyebar normal karena uji yang digunakan adalah uji-F.
Sebaran F diturunkan dari sebaran chi-square yang diturunkan dari sebaran
normal, tidak terpenuhinya asumsi ini akan mengakibatkan kasimpulan yang tidak
akurat dan berbias.
Hipotesis yang akan diuji adalah:
H
0
: galat menyebar normal
H
1
: galat tidak menyebar normal
Langkah-langkah pengujiannya sebagai berikut:
Klik Stat > Basic Statistic > Normality Test
Variable : isi dengan kolom sisaan yang akan diperiksa (RESI1),
Test of Normality diisi dengan memilih salah satu
uji, kita pilih Ryan-Joiner. kemudian klik OK
Setelah keluar hasilnya, kita lihat p-value, apabila p-value > maka dapat
disimpulkan bahwa ragam galat menyebar normal, begitu pula sebaliknya.
RESI1
P
e
r
c
e
n
t
5.0 2.5 0.0 -2.5 -5.0 -7.5
99
95
90
80
70
60
50
40
30
20
10
5
1
Mean
>0.100
-1.18424E-14
StDev 2.388
N 30
RJ 0.974
P-Value
Probability Plot of RESI1
Normal
Keputusan:
Dengan menggunakan uji kenormalan Ryan-Joiner, nilai-p > 0.10 sehingga
terima H
0
atau asumsi kenormalan galat terpenuhi
7.3 Pengujian Kehomogenan Ragam
Keheterogenan galat akan mengakibatkan berkurangnya keefisienan
pendugaan beda-beda pengaruh antar t perlakuan. Selain itu juga mempengaruhi
kepekaan uji-uji nyata.
50
Hipotesis yang akan diuji adalah:
H
0
: Ragam galat homogen
H
1
: Ragam galat tidak homogen
Langkah-langkah pengujiannya sebagai berikut:
Klik Stat > ANOVA > Test for Equal Variance
Response : isi dengan kolom respon yang akan diperiksa, pengisian kolom
ini hanya boleh untuk satu respon, tidak boleh lebih. Factors diisi dengan
kolom faktor yang digunakan. Ingat! Yang dimasukkan hanya faktornya saja,
sedangkan kelompoknya tidak. Setelah semua terisi dengan benar, kemudian
klik OK
Setelah keluar hasilnya, kita lihat p-value, apabila p-value > maka dapat
disimpulkan bahwa ragam galat homogen, begitu pula sebaliknya.
95% Bonferroni Confidence Intervals for StDevs
LAMA DOSIS
4
2
64
48
32
16
0
64
48
32
16
0
100 80 60 40 20 0
Bartlett's Test
0.716
Test Statistic 3.41
P-Value 0.844
Levene's Test
Test Statistic 0.68
P-Value
Test for Equal Variances for RESPON
Keputusan : Dari uji Bartlett diperoleh nilai-p = 0.844 > 0.05
sehingga terima H
0
atau asumsi kehomogenan galat
terpenuhi pada taraf nyata 5%.
Pada output ditemukan dua nilai-p yaitu uji bartlett untuk data yang
menyebar normal serta uji lavenne untuk data yang tidak menyebar normal. Jika
kedua uji memberi kesimpulan yang beda maka perlu untuk menguji kenormalan
respon. Langkah pengujian sama dengan poin b hanya yang dimasukkan adalah
kolom respon. Jika respon menyebar normal maka kesimpulan yang benar adalah
pada uji bartlett, dan sebaliknya.
7.4 Pengujian keacakan/kebebasan galat
Galat percobaan harus bersifat bebas atau tidak ada korelasi antar galat.
Galat yang tidak bebas akan mengakibatkan uji nyata yang kita lakukan dapat
mengecoh dalam mengambil keputusan. Dalam hal ini tidak ada pengujian
formalnya, jadi digunakan plot residuals versus the order of the data yang
telah ditunjukkan di atas. plot sisaan versus order data menunjukkan pola acak,
jadi asumsi kacakan galat terpenuhi
Tampilan secara visual untuk data yang interaksinya nyata dapat dilakukan dengan
mengeluarkan plot interaksinya.
Stat > ANOVA > Interaction Plot
Responses : Masukkan peubah responnya (Y) = C4
Factors : Masukkan masing-masing faktor = C 1 C2
51
DOSIS
M
e
a
n
64 48 32 16 0
100
80
60
40
20
0
LAMA
2
4
Interaction Plot (data means) for RESPON
interpretasi :
Respon tertinggi diberkan pada kombinasi factor dosis 0 dengan faktor lama 2
jam. Dari sini juga bias terlihat bahwa antara factor lama dan factor dosis terjadi
interaksi, hal ini ditunjukkan oleh slope antara kedua berbeda.
8 TRANSFORMASI DATA
Setelah proses pengujian asumsi secara grafis selesai dan ada asumsi yang
tidak terpenuhi maka perlu dilakukan transformasi data. Tujuan dari transformasi
suatu data adalah memudahkan dalam intepretasi, mendukung kesimetrikan atau
mendukung kestabilan/kehomogenan ragam. Tujuan yang lain adalah melinearisasikan
suatu persamaan garis serta menyederhanakan struktur dari data
Transformasi merupakan usaha untuk merubah data asli dan atau skala data
(John D. Emerson dan Michael A. Soto), sementara itu menurut David Griffith
transformasi atau re-expression adalah menampilkan data dalam bentuk skala yang
berbeda.
8.1 Transformasi untuk data tunggal
Sebaran yang tidak normal pada data tunggal dapat ditransformasi
sedemikian sehingga data tersebut memiliki distribusi yang berbentuk baku,
yaitu: simetrik, berpuncak tunggal, menyempit ke kiri dan menyempit ke kanan.
Cara melakukan transformasi :
1. Tentukan sari numeriknya . Hal ini dapat dilakukan dengan membuat stem-
and- leaf plot nya terlebih dahulu
2. Buat box plot nya berdasarkan sari numeric tersebut
3. Berdasarkan stem-and-leaf, sari numeric dan box plot tersebut amatilah
bentuk distribusi data tersebut, apakah bentuk distribusinya menceng ke kiri,
simetris dan atau menceng ke kanan.
4. Gunakan tangga transformasi Tukey untuk memilih transformasi yang sesuai
bagi bentuk distribusinya.
Tangga transformasi Tukey
Didasarkan pada penjenjangan bentuk sebaran / distribusi datanya.
Jenjang transformasi Tukey
Jenjang Bentuk distribusi
Pertama Menceng ke kiri secara kuat
Kedua Menceng ke kiri sedang
Ketiga Menceng ke kiri lemah
Keempat Simetris
Kelima Menceng ke kanan secara kuat
Keenam Menceng ke kanan sedang
Ketujuh Menceng ke kanan lemah
Bentuk distribusi yang simetris tidak perlu ditransformasi, karena sudah sesuai
dengan bentuk baku. Sedangkan untuk jenjang yang lain perlu ditransformasi.
52
Untuk kelompok distribusi yang menceng ke kanan, transformasinya
didasarkan kepada fungsi monoton naik dengan turunan pertama yang
semakin membesar.
Contoh: Y
*
= Y
k
dengan k= 2, 3, 4,...
Fungsi-fungsi tersebut akan merenggangkan data-data yang berharga besar
dan merapatkan data-data yang berharga kecil.
Untuk kelompok distribusi yang menceng ke kiri, transformasinya didasarkan
kepada fungsi monoton naik dengan turunan pertama yang semakin mengecil.
Contoh: Y
*
= Y
k
dengan k < 1 , Y
*
= log Y, Y
*
= -1/ Y, dll.
Fungsi-fungsi tersebut akan merenggangkan data-data yang berharga kecil dan
merapatkan data-data yang berharga besar.
8.2 Transformasi untuk k buah data sample bebas
Untuk k buah data sample bebas seperti data dalam rancangan percobaan,
ada beberapa tipe transformasi yang sering digunakan. Yaitu :
8.2.1 Transformasi logaritma ( log Y )
Transformasi logaritma digunakan jika rataan setiap sample
sebanding/proporsional dengan rentangan/simpangan bakunya (ragam
sebanding dengan kuadrat rataan sample) atau bila pengaruh perlakuan bersifat
multiplikatif. Kondisi ini secara umum ditentukan oleh data yang meliputi range
yang luas.
Dalam transformasi logaritma, untuk data yang bernilai nol atau data
bernilai kecil (kurang dari 10) maka nilai tersebut perlu ditambah satu sehingga
menjadi log (Y+1).
Contoh:
perl
petak
rataan Simp baku ragam
1 2 3 4
1
2
3
4
5
9
4
6
9
27
12
8
15
6
9
0
5
6
4
10
1
1
2
5
10
5.5
4.5
7.25
6
16
5.92
2.89
5.5
2.16
8.04
35
8.33
30.25
4.67
64.67
Dari tabel terlihat bahwa rata-rata data lebih proporsional terhadap
simpangan bakunya dibanding dengan ragamnya. Dengan demikian transformasi
yang tepat adalah transformasi logaritma. Dan karena terdapat nilai nol serta
nilai yang kecil, maka transformasi log nya menjadi log (Y+1).
8.2.2 Transformasi akar kuadrat ( Y )
Transformasi akar kuadrat digunakan untuk data yang mempunyai rataan
cenderung sebanding / proporsional terhadap ragamnya. Kondisi ini biasanya
terjadi pada data pada nilai pengamatan yang kecil, misalnya pengamatan
terhadap peristiwa yang jarang terjadi (mengikuti sebaran poisson).
Disamping itu, transformasi akar kuadrat dapat digunakan untuk data
persentase 0%-30% atau 70%-100%, tetapi tidak keduanya. Persentase diperoleh
dari nisbah nilai pengamatan terhadap total pengamatan. Jika sebagian besar
datanya bernilai kecil, khususnya bila nol maka transformasi yang digunakan
adalah (Y+1/2)
Contoh:
perl
% pengamatan sbl trans % pengamatan sesudah trans
1 2 3 1 2 3
1
2
3
4
5
11.46
7.63
11.65
9.02
6.09
5.51
8.76
5.41
8.93
7.81
4.88
8.00
3.85
10.26
5.88
3.83
2.96
3.41
3.00
2.47
2.30
2.96
2.32
2.99
2.8
2.36
2.83
1.96
3.20
2.43
Karena data tersebut mempunyai persentase 0%-30% maka menggunakan
transformasi akar kuadrat.
53
8.2.3 Transformasi Arcsin ( Sin
-1
Y)
Transformasi arcsin tepat digunakan untuk data proporsi yang dinyatakan
sebagai persentase dengan ketentuan sebagai berikut:
Data persentase yang perlu ditransformasi adalah persentase yang
diperoleh dari nisbah terhadap total.
Misal:
x = banyaknya produk yang cacat
N = total produk
Maka persentase produk yang cacat adalah
N
x
Data persentase yang berada dalam range 30%-70% tidak perlu
ditransformasi
Data persentase yang berada pada range 0%-100%
Untuk data yang bernilai 0% diganti dengan
n 4
1
, sedangkan untuk data
yang bernilai 100% diganti dengan
n 4
1
100
Transformasi untuk data dari k sample bebas, selain memiliki karakteristik
yang telah disebutkan diatas, terdapat beberapa karakteristik transformasi lainnya.
Dalam hal ini membandingkan k sample bebas tersebut hanya dengan
pembandingan masing-masing tarafnya. Transformasi yang perlu dilakukan adalah
menentukan satu transformasi untuk semua k sample yang berkaitan. Hal ini dapat
dilakukan dengan menganggap hubungan antara sebaran dengan taraf berbentuk
linear, sehingga dapat digunakan tangga transformasi Tukey.
Karakteristik yang dapat dijadikan pijakan adalah :
Jika harga sebaran cenderung naik dengan naiknya taraf maka gunakan
transformasi:
X
*
= X, X
*
= X
3
, X
*
= X
4
Atau X
*
= - 1 / X
2
Jika harga sebaran cenderung turun dengan naiknya harga taraf, maka
gunakan transformasi:
X
*
= X
k
, k = 2, 3, 4 Atau X
*
= 10
x
Untuk lebih jelasnya, langkah-langkah yang digunakan adalah:
Hitung tarafnya, kemudian hitung log (taraf) untuk setiap sample
bebas/perlakuan
Hitung sebaran dan log (sebaran) untuk setiap perlakuan
Dengan menggunakan hubungan linier antara log(sebaran) dengan
log(taraf), yang berarti:
Hitung koefisien b, harga b akan menentukan transformasi yang dipilih
B A
B A
T log T log
S log S log
b

keterangan:
T
A
= harga taraf terbesar
T
B
= harga taraf terkecil
S
A
= harga sebaran pada contoh T
A
S
B
= harga sebaran pada contoh T
B
Jika b bernilai positif, maka transformasi yang digunakan:
Koefisien Arah b
disekitar
Bentuk
transformasi
0.5 X
*
= X
1 X
*
= log X
1.5 X
*
= - 1 / X
2 X
*
= - 1 / X
2
54
log (sebaran) = a + b log (taraf)
Jika harga b negatif, transformasi yang digunakan adalah:
X
*
= X
k
dengan k = 2, 3, 4, ...
Makin kecil harga b, makin besar harga k yang perlu dicoba.
8.3 Transformasi Dalam Regresi Linear Sederhana
Salah satu usaha untuk mempertinggi kualitas model, dapat dilakukan dengan
memperbesar harga R
2
. Hal ini dapat dilakukan dengan cara menyisihkan data
pencilan dan atau dengan transformasi data.
Kualitas R
2
yang rendah dapat pula terjadi karena asumsi kenormalan
dilanggar. Dalam hal ini, variabel tak bebas Y dan atau variabel bebas X perlu
ditransformasi. Langkah yang dapat diambil adalah:
Buat dan amati stem-and-leaf, sari numeric dan box plot dari data X dan Y
Pilih transformasi untuk data X dan Y, berpedoman pada:
Bentuk
kurva
ket
Transformasi
X
Transformasi
Y
X turun
Y naik
Log X
- 1/ X
dsb
Y
2
Y
3
dsb
Xturun
Y turun
Log X
- 1/ X
dsb
Log Y
- 1 / X
dsb
X naik
Y turun
X
2
X
3
dsb
Log Y
- 1 / X
dsb
X naik
Y naik
X
2
X
3
dsb
Y
2
Y
3
dsb
Misalkan hasil transformasi untuk X dan Y adalah X
*
dan Y
*
, lakukan regresi
linear terhadap X
*
dan Y
*
(jika terdapat pencilan hindari menggunakan MKT)
Apabila regresi dari X
*
dan Y
*
memberikan harga R
2
yang memuaskan, maka
proses pemodelan telah selesai. Bila belum maka ulangi tiga langkah terakhir.
9 REGRESI LOGIT DAN PROBIT
Analisis regresi digunakan untuk melihat hubungan antara satu atau lebih
peubah penjelas dengan peubah respon. Model regresi yang digunakan tergantung
dari peubah respon yang digunakan. Peubah respon dapat berupa peubah kuantitatif
maupun peubah kualitatif. Pada penelitian sosial peubah yang diamati sebagian besar
merupakan data kategorik termasuk data biner. Model yang sering digunakan untuk
menganalisis peubah respon berskala biner (dikotomous/binary) adalah model logit
dan model probit (Greene, 1990).
Model logit dan model probit merupakan dua model regresi yang saling dapat
menggantikan yang satu dengan yang lain untuk menganalisis peubah respon biner
(Jeff Wu, 1985). Oleh karena itu sering hanya dibuat salah satu model tanpa
mempertimbangkan model lain yang mungkin akan menghasilkan model yang lebih
sesuai.
Perbedaan antara model regresi linear dengan regresi logit probit dicerminkan
pada model parameter dan penggunaan asumsi.
9.1 Regresi Logit
55
Regresi logit merupakan teknis analisis data yang dapat menjelaskan hubungan
antara. peubah respon yang memiliki dua kategori dengan satu atau lebih peubah
penjelas berskala kontinu atau kategori (Hosmer dan Lamesow, 1989).
9.1.1 Model Logit
Model peluang regresi logistik dengan p faktor (peubah penjelas) adalah:
( ) ( )
( )
( )
p p
p p
x x
x x
x x Y E

+ + + +
+ + +

.. exp 1
.. exp
1 1 0
1 1 0
Transformasi logit dari (x) adalah : ( )
( )
( )
1
]
1

x
x
x g

1
ln
Dimana komponen g(x) yang merupakan bagian komponen sistematik tersebut, dapat
dituliskan dalam fungsi linear dari peubah penjelas :
( )
p p
x x x x g + + + + ....
2 2 1 1 0
Jika terhadap p peubah bebas dengan peubah ke-j merupakan peubah kategori
dengan k nilai, maka peubah boneka sebanyak k-1. Maka model transformasi logitnya
menjadi :
( )
p p
k
u
ju ju
x x x x g
j
+ + + +

1
1
1 1 0
....
Dimana:
j
x
= bebas ke-j dengan tingkatan kj
1
j
k
= Peubah boneka
ju

= Koefisien peubah boneka


= 1, 2,3 ...k
j-1
Dalam Pendugaan parameter digunakan metode kemungkinan maksimum (maximun
likelihood) (Agresti, 1990)
Dimana fungsi kemungkinan maksimum:
[ ]


n
i
y
i
y
i
i i
x x L
2
1
) ( 1 ) ( ) (

Untuk menduga
i
maka maksimumkan ) ( L . Untuk memudahkan perhitungan,
dilakukan pendekatan logaritma, sehingga fungsi log kemungkinannya sebagai berikut
:
[ ]
[ ] [ ] { }

n
i
i i i i
x y x y L
L L
1
)) ( 1 ( ln ) 1 ( ) ( ln ) (
) ( ln ) (


Nilai dugaan
i
dapat diperoleh dengan membuat turunan pertama ) ( L terhadap
i

= 0, dengan i = 1, 2, 3, ...p
Untuk memperoleh penduga. kemungkinan maksimum bagi parameter-parameter dari
model, secara teknis digunakan metode kuadrat terkecil terboboti secara iterative
(iteratively reweighted least squares) (McCullagh dan Nelder, 1989)
9.1.2 Pengujian Parameter
Pengujian terhadap parameter-parameter model dilakukan sebagai upaya
untuk memeriksa kebaikan model. Uji kebaikan model merupakan suatu pemeriksaan
apakah nilai yang diduga dengan peubah didalam model lebih baik atau akurat
dibandingkan dengan model tanpa peubah tersebut (Hosmer dan Lemeshow, 1989).
56
Dengan kata lain diadakan pengujian hipotesis statistik dalam menentukan apakah
peubah-peubah bebas dalam model mempunyai hubungan yang nyata dengan peubah
responnya.
Menurut Hosmer dan Lemeshow (1989), untuk mengetahui peran seluruh
peubah penjelas di dalam model secara bersama-sama dapat digunakan uji nisbah
kemungkinan yaitu uji G berdasarkan hipotesis :
0 ... :
2 1 0

p
H
:
1
H paling sedikit ada satu
0
j

(j = 1, 2, , p)
Sedangkan rumus umum untuk uji-G :
1
]
1


k
L
L
G
0
ln 2 Dengan kriteria uji :

'

>
<

0
2
,
0
2
,
,
,
tolakH
terimaH
G
p
p

Dengan
0
L = fungsi kemungkinan tanpa peubah penjelas dan
k
L = fungsi
kemungkinan dengan peubah penjelas. Statistik G mengikuti sebaran khi kuadrat
dengan derajat bebas p.
Sedangkan untuk uji nyata parameter secara parsial dapat digunakan uji-Wald.
Statistik uji-Wald adalah :
Hipotesis :
0 :
0

j
H
vs :
1
H
0
j

Dengan
j

merupakan penduga
j

( )
j
s

dan adalah dugaan galat baku dari


j

.
Statistik uji Wald mengikuti sebaran normal baku.
9.1.3 Intepretasi Koefisien
Menurut Hosmer dan Lemeshow (1989), koefisien. model logit ditulis sebagai
j

= g(x+1) - g(x). Parameter


i

mencerminkan perubahan dalam fungsi logit g(x)


untuk perubahan satu unit peubah bebas x yang disebut log odds. Log odds
merupakan beda antara dua penduga. logit yang dihitung pada dua nilai (misal x = a
dan x = b) yang dinotasikan sebagai:
( ) [ ] ( ) ( ) b x g a x g b a Ln ,

( ) b a
j

*

Sedangkan penduga rasio-odds adalah: ( ) ( ) [ ] b a b a


j

*
exp ,
Sehingga jika a-b = 1 maka ( ) exp . Rasio-odds ini dapat diintepretasikan sebagai
kecenderungan Y =1 pada x =1 sebesar

kali dibandingkan pada x =0.


Contoh Kasus:
Pengaruh perokok dan berat badan terhadap denyut nadi. Dibawah ini data 92
responden yang diukur denyut nadi (resting pulse), status perokok (smokes), dan
berat badan (weight)
Resting
Pulse
Smoke
s Weight
Resting
Pulse
Smoke
s Weight
Resting
Pulse
Smoke
s Weight
Low No 140 Low No 145 Low Yes 164
Low No 145 High Yes 150 Low No 140
Low Yes 160 Low Yes 112 Low No 142
Low Yes 190 Low No 125 High No 136
Low No 155 Low No 190 Low No 123
Low No 165 Low No 155 Low No 155
High No 150 Low Yes 170 High No 130
Low No 190 Low No 155 Low No 120
Low No 195 Low No 215 Low No 130
Low No 138 Low Yes 150 High Yes 131
High Yes 160 Low Yes 145 Low No 120
Low No 155 Low No 155 Low No 118
High Yes 153 Low No 155 Low No 125
57
Low No 145 Low No 150 High Yes 135
Low No 170 Low Yes 155 Low No 125
Low No 175 Low No 150 High No 118
Low Yes 175 High Yes 180 Low No 122
Low Yes 170 Low No 160 Low No 115
Low Yes 180 Low No 135 Low No 102
Low No 135 Low No 160 Low No 115
Low No 170 Low Yes 130 Low No 150
Low No 157 Low Yes 155 Low No 110
Low No 130 Low Yes 150 High No 116
Low Yes 185 Low No 148 Low Yes 108
High No 140 High No 155 High No 95
Low No 120 Low No 150 High Yes 125
Low Yes 130 High Yes 140 Low No 133
High No 138 Low No 180 Low No 110
High Yes 121 Low Yes 190 High No 150
Low No 125 High No 145 Low No 108
High No 116 High Yes 150
Langkah-langkah menggunakan MINITAB:
Klik Stat > Regression > Binary Logistic Regression
Response : masukkan RestingPulse
Model : masukkan Smokes dan Weight
Factors (optional) : masukkan Smokes
Klik Graph : pilih Delta chi-square vs probability dan Delta
chi-square vs leverage
Klik option : pada Link Fuction pilih Logit
Klik Result : pilih In addition, list of factor level values ...

output :
58
Binary Logistic Regression: RestingPulse versus Smokes, Weight
Link Function: Logit
Response Information
Variable Value Count
RestingPulse Low 70 (Event)
High 22
Total 92
Factor Information
Factor Levels Values
Smokes 2 No, Yes
Logistic Regression Table
Odds 95% CI
Predictor Coef SE Coef Z P Ratio Lower Upper
Constant -1.98717 1.67930 -1.18 0.237
Smokes
Yes -1.19297 0.552980 -2.16 0.031 0.30 0.10 0.90
Weight 0.0250226 0.0122551 2.04 0.041 1.03 1.00 1.05
Log-Likelihood = -46.820
Test that all slopes are zero: G = 7.574, DF = 2, P-Value = 0.023
Intepretasi Output:
1. Dilihat dari nilai uji-G dengan p-value = 0.023 < nilai = 0.05, dapat
disimpulkan bahwa peubah bebas (X) berpengaruh terhadap peubah respon (Y)
2. Dilihat dari nilai uji Wald (Z), yaitu :
Nilai parameter
1
dengan nilai-p = 0.031 < nilai = 0.05, dapat
disimpulkan bahwa koefisien peubah X1 (smokes) nyata
Nilai parameter
2
dengan nilai p = 0.041 < nilai = 0.05, dapat
disimpulkan bahwa koefisien peubah X2 (Weight) nyata.
Dilihat dari nilai Rasio Odds yaitu:
59
Goodness-of-Fit Tests
Method Chi-Square DF P
Pearson 40.8477 47 0.724
Deviance 51.2008 47 0.312
Hosmer-Lemeshow 4.7451 8 0.784
Brown:
General Alternative 0.9051 2 0.636
Symmetric Alternative 0.4627 1 0.496
Table of Observed and Expected Frequencies:
(See Hosmer-Lemeshow Test for the Pearson Chi-Square Statistic)
Group
Value 1 2 3 4 5 6 7 8 9 10 Total
Low
Obs 4 6 6 8 8 6 8 12 10 2 70
Exp 4.4 6.4 6.3 6.6 6.9 7.2 8.3 12.9 9.1 1.9
High
Obs 5 4 3 1 1 3 2 3 0 0 22
Exp 4.6 3.6 2.7 2.4 2.1 1.8 1.7 2.1 0.9 0.1
Total 9 10 9 9 9 9 10 15 10 2 92
Measures of Association:
(Between the Response Variable and Predicted Probabilities)
Pairs Number Percent Summary Measures
Concordant 1045 67.9 Somers' D 0.38
Discordant 461 29.9 Goodman-Kruskal Gamma 0.39
Ties 34 2.2 Kendall's Tau-a 0.14
Total 1540 100.0
Untuk peubah X1 (Smokes), kecenderungan seorang perokok (smokes yes)
untuk terjadinya resting pulse sebesar 0.3 kali dari orang yang tidak
merokok (smokes no).Dengan kata lain seorang perokok memiliki
kecenderungan resting pulse high.
Untuk peubah X2 (Weight), kecenderungan resting pulse low meningkat
sebesar 1.03 ketika weight naik 1 satuan. Dengan kata lain semakin
bertambah weight maka resting pulse semakin rendah.
Jadi fungsi linear dari peubah penjelas kasus diatas adalah g(x) = -1.987 -
1.1930 X1 + 0.02502 X2 sehingga regresi logistik dengan 2 faktor (peubah penjelas)
adalah :
( ) ( )
( )
( )
p p
p p
x x
x x
x x Y E

+ + + +
+ + +

.. exp 1
.. exp
1 1 0
1 1 0
( ) ( )
( )
( )
2 1
2 1
0.02502X 1.1930X - 1.987 - exp 1
0.02502X 1.1930X - 1.987 - exp
+ +
+
x x Y E
9.2 Regresi Probit
Apabila diketahui peubah respon yang digunakan berupa data proporsi atau
peubah biner, fungsi hubung yang dapat digunakan adalah fungsi hubung probit.
Model probit adalah sebagai berikut :
( ) x
x
+
Dimana (.) adalah sebaran normal kumulatif, dan

parameter yang harus


diduga.
x
adalah sebuah peluang yang terletak antara 0 dan 1 untuk semua nilai x
dan untuk semua nilai parameter.
Sebaran peluang yang digunakan dalam fungsi probit ini adalah sebaran normal baku
(McCullagh dan Nelder,1989)
( ) ( )
( )


x g s
ds e x g F
2
1
2
2
1

Dimana s adalah peubah acak yang menyebar normal baku dan i= 1,2,....n.
Sehingga : ( ) ( )
i
F x g
1

F adalah sebaran normal kumulatif dengan :


( )
ip p i i
x x x x g + + + + ...
2 2 1 1 0
9.2.1 Intepretasi koefisien
Koefisien probit adalah pengaruh dari perubahan satu unit X pada peluang
normal kumulatif dari Y. Koefisien ini adalah pengaruh pada Z scores. Tetapi
peluang dari Y bukan fungsi linear dari Z, tapi fungsi normal kumulatif Z.
Pengaruh dari perubahan satu unit X pada peluang Y tergantung pada level X,
sehingga perlu dipilih beberapa level X sebagai titik acuan. Interpretasi koefisien
model probit dilakukan dengan melihat tanda sendiri. Jika koefisien yang
diperoleh positif, maka kecenderungan Y=1 lebih besar pada peubah bebas X=1
dibandingkan dengan X=0.
9.2.2 Kriteria pemilihan Model Terbaik
Beberapa hal yang menjadi kriteria dalam memilih model terbaik dari dua
model yang diperbandingkan adalah dengan membandingkan antara dugaan dan
amatan melalui Kuadrat Tengah Galat (KTG), SK 95%, pendugaan parameter,
nilai R2 menggambarkan plot antara dugaan galat dengan dugaan X dan nilai
kebaikan suainya
2
. Selain itu, masing-masing model diuji dengan
menggunakan uji Wald.
KTG yang digunakan dalam hal ini adalah :
60
( )
( )
1

2
1
2

p n
y
p n
y y
KTG
i i
n
i
i i

Semakin kecil kuadrat tengah galat yang diperoleh maka model semakin baik.
Jika ( )

n
i
i i
y y
1
2

dapat digunakan digunakan sebagai jumlah kuadrat galat, maka


R
2
dapat digunakan sebagai ukuran kebaikan suai model yaitu:
( )
( )


n
i
i i
n
i
i i
y y
y
R
1
2
1
2
2

1

9.3 Perbedaan Logit dan Probit
Logistik berdasarkan pada peubah kualitatif menggunakan sebaran binomial.
Sedangkan probit berdasarkan peubah kualitatif menggunakan sebaran normal
kumulatif. Dalam prakteknya hampir selalu menghasilkan hasil yang sama. Logit
mungkin lebih mudah untuk diinterpretasikan.
9.4 Perbedaan Regresi Linier dan Logistik
Perbedaan regresi linier dan logistik terletak pada dua hal yaitu:
1. Selang nilai E(Y|X)
2. Model Regresinya
Regresi Linear :
( ) + X Y E
Regresi Logistik :
( ) 1 0 X Y E
Regresi Linear :
( ) + X Y E Y
Dimana :
( )
p p
x x x X Y E + + + + ...
2 2 1 1 0
dan ( )
2
, 0 ~ N
Regresi Logistik :
( ) + X Y E Y
Dimana :
( ) ( )
( )
( ) x g
x g
e
e
x X Y E
+

1

dan

( )
p p
x x x x g + + + + ...
2 2 1 1 0

Contoh Kasus:
Sama dengan contoh kasus pada regresi logit
Langkah-langkah menggunakan MINITAB:
Klik Stat > Regression > Binary Logistic Regression.
Response : masukkan RestingPulse
Model : masukkan Smokes Weight.
Factors (optional) : masukkan Smokes
Klik Options : pada Link Fuction pilih Normal/Probit
Klik Result : Pilih In addition, list of factor level ...
output :
61
Binary Logistic Regression: RestingPulse versus Smokes, Weight
Link Function: Normit
Response Information
Variable Value Count
RestingPulse Low 70 (Event)
High 22
Total 92
Factor Information
Factor Levels Values
Smokes 2 No, Yes
Logistic Regression Table
Predictor Coef SE Coef Z P
Constant -1.20106 0.976437 -1.23 0.219
Smokes
Yes -0.703780 0.325031 -2.17 0.030
Weight 0.0150848 0.0070250 2.15 0.032
Log-Likelihood = -46.734
Test that all slopes are zero: G = 7.746, DF = 2, P-Value = 0.021
Intepretasi :
1. Dilihat dari nilai uji-G dengan p-value = 0.021 < nilai = 0.05, dapat
disimpulkan bahwa peubah bebas (X) berpengaruh nyata terhadap peubah
respon (Y)
2. Dilihat dari nilai uji Wald (Z), yaitu:
Nilai parameter
1
dengan nilai-p = 0.030 < nilai = 0.05 dapat
disimpulkan bahwa koefisien peubah X1 (Smokes) nyata.
Nilai parameter
2
dengan nilai-p = 0.032 < nilai = 0.05, dapat
disimpulkan bahwa koefisien peubah X2(Weight) nyata.
3. Intepretasi koefisien model probit dilakukan dengan melihat tanda koefisien itu
sendiri.
Untuk X1 koefisien yang diperoleh negatif, maka kecenderungan resting pulse
low (Y=1) lebih kecil pada peubah bebas smokes yes (X1=l) dibandingkan
dengan smokes no (X1=0).
Untuk X2 koefisien yang diperoleh positif, maka kecenderungan resting pulse
low (Y= 1) akan naik searah dengan kenaikan peubah bebas weight.
62
Goodness-of-Fit Tests
Method Chi-Square DF P
Pearson 40.5980 47 0.733
Deviance 51.0291 47 0.318
Hosmer-Lemeshow 5.8452 8 0.665
Table of Observed and Expected Frequencies:
(See Hosmer-Lemeshow Test for the Pearson Chi-Square Statistic)
Group
Value 1 2 3 4 5 6 7 8 9 10 Total
Low
Obs 4 5 7 9 8 7 11 8 9 2 70
Exp 4.5 5.7 6.9 7.3 6.9 8.9 11.8 7.9 8.3 1.9
High
Obs 5 4 3 1 1 4 3 1 0 0 22
Exp 4.5 3.3 3.1 2.7 2.1 2.1 2.2 1.1 0.7 0.1
Total 9 9 10 10 9 11 14 9 9 2 92
Measures of Association:
(Between the Response Variable and Predicted Probabilities)
Pairs Number Percent Summary Measures
Concordant 1046 67.9 Somers' D 0.38
Discordant 462 30.0 Goodman-Kruskal Gamma 0.39
Ties 32 2.1 Kendall's Tau-a 0.14
Total 1540 100.0
Jadi fungsi linear dari peubah penjelas kasus diatas adalah g(x) = -1.2011 -
0.7038X1 + 0.015085X2 ; sehingga model peluang regresi probit dengan 2 faktor
(peubah penjelas) adalah :
( ) ( )
( )


x g s
ds e x g F
2
1
2
2
1

Kesimpulan :
Regresi Logit dan probit digunakan untuk mengetahui hubungan antara peubah
respon berskala biner (dicotomous/binary) dengan beberapa peubah penjelas yang
bersifat kategorik atau kontinu. Model logit dan model probit merupakan dua model
regresi yang saling dapat menggantikan satu dengan yang lain. Oleh karena itu sering
hanya dibuat salah satu model tanpa mempertimbangkan model lain yang mungkin
akan menghasilkan model yang lebih sesuai.
10 ANALISIS MULTIVARIATE
10.1 ANALISIS KOMPONEN UTAMA
Telah dibahas pada bagian multikolinearitas
10.2 ANALISIS KORESPONDENSI
Digunakan jika kita ingin melihat hubungan antar peubah kategorik secara
visual dimensi ganda. Korespondensi digunakan untuk menggambarkan sebuah tabel
Kontingensi. Analisis korespondensi dibagi 2 yaitu analisis korespondensi sederhana
dan berganda.
10.2.1 Analisis korespondensi sederhana
Digunakan bila hanya 2 peubah kategorik yang ingin dilihat hubungannya.
Contoh:
Seorang peneliti ingin mengetahui bagaimana hubungan suatu disiplin ilmu atau
akademik dengan beberapa kategori latar belakang keuangan yaitu A sampai E.
Didapatkan hasil sebagai berikut:
A B C D E Akademik Fund
3 19 39 14 10 Geologi A
1 2 13 1 12 biokimia B
6 25 49 21 29 kimia C
3 15 41 35 26 zoologi D
10 22 47 9 26 fisika E
3 11 25 15 34 teknik
1 6 14 5 11 mikrobiologi
0 12 34 17 23 biologi
2 5 11 4 7 statistik
2 11 37 8 20 matematika
Tahapan menggunakan menu MINITAB:
Klik Stat > Multivariate > Simples Correspondence Analysis
Input Data : pilih Columns of a Contingency Table isi dengan
data A-E (C1-C5)
Rownames : isi dengan Akademik
Colomn name : isi dengan Fund
Klik Graph : klik Symmetric plot showing rows and columns.
klik Results: klik Contingency Table
63
Output :
64
Simple Correspondence Analysis: CT1, CT2, CT3, CT4, CT5
Contingency Table
A B C D E Total
Geology 3 19 39 14 10 85
Biochemistry 1 2 13 1 12 29
Chemistry 6 25 49 21 29 130
Zoology 3 15 41 35 26 120
Physics 10 22 47 9 26 114
Engineering 3 11 25 15 34 88
Microbiology 1 6 14 5 11 37
Botany 0 12 34 17 23 86
Statistics 2 5 11 4 7 29
Mathematics 2 11 37 8 20 78
Total 31 128 310 129 198 796
Analysis of Contingency Table
Axis Inertia Proportion Cumulative Histogram
1 0.0391 0.4720 0.4720 ******************************
2 0.0304 0.3666 0.8385 ***********************
3 0.0109 0.1311 0.9697 ********
4 0.0025 0.0303 1.0000 *
Total 0.0829
Row Contributions
Component 1
ID Name Qual Mass Inert Coord Corr Contr
1 Geology 0.916 0.107 0.137 -0.076 0.055 0.016
2 Biochemistry 0.881 0.036 0.119 -0.180 0.119 0.030
3 Chemistry 0.644 0.163 0.021 -0.038 0.134 0.006
4 Zoology 0.929 0.151 0.230 0.327 0.846 0.413
5 Physics 0.886 0.143 0.196 -0.316 0.880 0.365
6 Engineering 0.870 0.111 0.152 0.117 0.121 0.039
7 Microbiology 0.680 0.046 0.010 -0.013 0.009 0.000
8 Botany 0.654 0.108 0.067 0.179 0.625 0.088
9 Statistics 0.561 0.036 0.012 -0.125 0.554 0.014
10 Mathematics 0.319 0.098 0.056 -0.107 0.240 0.029
Component 2
ID Name Coord Corr Contr
1 Geology -0.303 0.861 0.322
2 Biochemistry 0.455 0.762 0.248
3 Chemistry -0.073 0.510 0.029
4 Zoology -0.102 0.083 0.052
5 Physics -0.027 0.006 0.003
6 Engineering 0.292 0.749 0.310
7 Microbiology 0.110 0.671 0.018
8 Botany 0.039 0.029 0.005
9 Statistics -0.014 0.007 0.000
10 Mathematics 0.061 0.079 0.012
Component 1
C
o
m
p
o
n
e
n
t

2
0.50 0.25 0.00 -0.25 -0.50
0.50
0.25
0.00
-0.25
-0.50
E
D
C
B
A
Mathematics
Statistics
Botany
Microbiology
Engineering
Physics
Zoology
Chemistry
Biochemistry
Geology
Symmetric Plot
interpretasi :
Dari output juga ditampilkan lagi table kontingensi pada data dia atas, pada
analisis table kontingensi terlihat dari tabel ukuran 10x5 diringkas menjadi 4
komponen. Output selanjutnya adalah Row Contributions yang memberikan
interpretasi 2 komponen. Coord menunjukkan koordinat uatama dari baris. Corr
menunjukkan kontribusi komponen pada inertia baris, dimana komponen 1 mampu
merepresentasikan Zoology and Physics dengan baik. Contr menunjukkan kontribusi
baris terhadap masing-masing sumbu, dimana Zoology and Physics mempunyai
kontribusi tertinggi pada komponen 1.
Kecenderungan kedekatan antara peubah akademik dan fund dapat dilihat di
symmetric plot diatas. Terlihat bahwa untuk akademik zoology cenderung
berhubungan kuat dengan fund D serta engeenering sangat dekat kaitannya dengan
fund E. Selanjutnya untuk peubah-peubah lainnya dapat dilihat sendiri kedekatannya.
10.2.2 Analisis korespondensi berganda
Digunakan bila lebih dari 2 peubah kategorik yang ingin dilihat hubungannya.
Contoh: Seorang peneliti ingin mengetahui pola penggunaan telepon selular (HP)
dikalangan mahasiswa dan damapknya terhadap biaya hidup dan Indeks Prestasi
Kumulatif (IPK). Diperoleh data sebagai berikut :
65
Column Contributions
Component 1 Component 2
ID Name Qual Mass Inert Coord Corr Contr Coord Corr Contr
1 A 0.587 0.039 0.187 -0.478 0.574 0.228 -0.072 0.013 0.007
2 B 0.816 0.161 0.110 -0.127 0.286 0.067 -0.173 0.531 0.159
3 C 0.465 0.389 0.094 -0.083 0.341 0.068 -0.050 0.124 0.032
4 D 0.968 0.162 0.347 0.390 0.859 0.632 -0.139 0.109 0.103
5 E 0.990 0.249 0.262 0.032 0.012 0.006 0.292 0.978 0.699
Peubah punya/Tidak HP memiliki dua kategori yaitu punya dan tidak. Misalkan
kita beri kode 1 untuk punya dan 2 untuk tidak. Peubah SMS/minggu memiliki 3
kategori yaitu 0-5, 5-10, dan 10-15. Misalkan kita beri kode 1,2, dan 3 untuk ketiganya.
Demikian juga dengan peubah biaya hidup perbulan dan IPK yang masing-amsing
memilki 4 kategori dengan kode masing-masing 1,2,3 dan 4.
Cara entry data kedalam MINITAB adalah sebagai berikut:
c1 c2 c3 c4 c5
1 3 4 2 punya
1 2 3 3 tidak
2 1 2 3 0-5
1 3 3 1 10-15
1 2 2 3 15-20
2 2 2 4 <Rp 250.000
2 1 1 3 Rp 250.000-Rp 500.000
2 2 3 2 Rp 500.000-Rp 1.000.000
1 3 4 4 > Rp 1.000.000
2 1 3 3 < 2.00
1 3 4 1 2.00-2.50
1 2 3 3 2.50-3.00
1 2 3 3 > 3.00
1 3 3 3
1 2 4 2
1 2 3 4
2 1 2 3
1 3 4 3
1 3 3 4
2 2 3 4
Tahapan menggunakan menu MINITAB
Klik Stat > Multivariate > Multiple Correspondence Analysis
Categorical Variables : isi dengan C1, C2, C3, dan C4.
Category Names : isi dengan C5.
Number of Components : isi dengan angka 2
Klik Graphs : pilih Display Colomn Plot
output :
66
Multiple Correspondence Analysis: C1, C2, C3, C4
Analysis of Indicator Matrix
Axis Inertia Proportion Cumulative Histogram
1 0.6657 0.2959 0.2959 ******************************
2 0.3912 0.1738 0.4697 *****************
3 0.3016 0.1340 0.6038 *************
4 0.2538 0.1128 0.7166 ***********
5 0.2319 0.1031 0.8196 **********
6 0.1834 0.0815 0.9011 ********
7 0.1314 0.0584 0.9595 *****
8 0.0592 0.0263 0.9858 **
9 0.0319 0.0142 1.0000 *
Total 2.2500
Column Contributions
Component 1
C
o
m
p
o
n
e
n
t

2
1.5 1.0 0.5 0.0 -0.5 -1.0 -1.5 -2.0
1.5
1.0
0.5
0.0
-0.5
-1.0
-1.5
-2.0
> 3.00
2.50-3.00
2.00-2.50
< 2.00
>Rp 1.000.000
Rp 500.000-Rp 1.000.000
Rp 250.000-Rp 500.000
<Rp 250.000
10-15
5-10
0-5
tidak punya
Column Plot
interpretasi :
Terlihat bahwa mahasiswa yang ber-SMS 10-15 kali/minggu cenderung memilki
pengeluaran diatas Rp. 1.000.000 dan ber-IPK kurang dari 2.00. Lalu Mahasiswa yang
punya HP cenderung ber-IPK 2.00-2.50. Dan selanjutnya untuk peubah-peubah lainnya
dapat dilihat sendiri kedekatannya.
67
Component 1
ID Name Qual Mass Inert Coord Corr Contr
1 punya 0.653 0.163 0.039 0.593 0.653 0.086
2 tidak 0.653 0.088 0.072 -1.101 0.653 0.159
3 0-5 0.869 0.050 0.089 -1.617 0.654 0.196
4 5-10 0.694 0.113 0.061 -0.041 0.001 0.000
5 10-15 0.744 0.088 0.072 0.977 0.514 0.126
6 <Rp 250.000 0.416 0.013 0.106 -1.970 0.204 0.073
7 Rp 250.000-Rp 500.000 0.320 0.050 0.089 -1.127 0.318 0.095
8 Rp 500.000-Rp 1.000.000 0.291 0.125 0.056 0.101 0.010 0.002
9 > Rp 1.000.000 0.580 0.063 0.083 1.093 0.398 0.112
10 < 2.00 0.388 0.025 0.100 1.303 0.189 0.064
11 2.00-2.50 0.079 0.038 0.094 0.655 0.076 0.024
12 2.50-3.00 0.351 0.125 0.056 -0.558 0.311 0.058
13 > 3.00 0.255 0.063 0.083 0.202 0.014 0.004
Component 2
ID Name Coord Corr Contr
1 punya 0.002 0.000 0.000
2 tidak -0.005 0.000 0.000
3 0-5 -0.927 0.215 0.110
4 5-10 0.920 0.693 0.243
5 10-15 -0.653 0.230 0.095
6 <Rp 250.000 -2.004 0.211 0.128
7 Rp 250.000-Rp 500.000 0.100 0.003 0.001
8 Rp 500.000-Rp 1.000.000 0.530 0.281 0.090
9 > Rp 1.000.000 -0.739 0.182 0.087
10 < 2.00 -1.338 0.199 0.114
11 2.00-2.50 0.141 0.004 0.002
12 2.50-3.00 -0.200 0.040 0.013
13 > 3.00 0.851 0.241 0.116
10.3 ANALISIS GEROMBOL
Analisis gerombol merupakan suatu metode dalam analisis peubah ganda yang
bertujuan untuk mengelompokkan n satuan pengamatan ke dalam k gerombol dengan
k < n berdasarkan p peubah, sehingga unit-unit pengamatan dalam satu gerombol.
mempunyai sifat-sifat yang lebih mirip dibandingkan dengan unit pengamatan lain
yang terdapat dalam gerombol yang berbeda.
10.3.1 Konsep Jarak
Penggerombolan didasarkan pada ukuran jarak sebagai ukuran kemiripan antar
unit pengamatan (Duran & Odell, 1972). Konsep-konsep jarak yang digunakan dalam
analisis gerombol adalah jarak euclid, jarak mahalanobis, jarak manhattan, jarak
pearson, jarak kuasa dan jarak chebycev. Konsep jarak yang paling sering digunakan
adalah euclid dan mahalanobis.
1.1.1.1 Jarak Euclidean
jika antar peubah memiliki satuan yang sama dan tidak saling berkorelasi. Jika
terdapat korelasi maka transformasi deagan menggunakan AKU. Tetapi menurut
Cronbach & G Gleser dalam Hartigan, jarak euclid antara dua pengamatan
dengan atau tanpa transformasi komponen utama akan sama bila seluruh
komponen utama digunakan.
( )
2
1
1
2
1
]
1

P
i
jk ik ij
Y X d
Dimana D
ij
= jarak antara objek ke-i dengan objek ke-j
X
ij
= Nilai objek ke-i pada peubah k
Y
jk
= Nilai objek ke-j pada peubah k
P = Banyaknya peubah yang diamati
1.1.1.2 Jarak Mahalanobis
Digunakan jika ada. korelasi antar peubah
( ) ( )
j i j i ij
X X s X X d
1 |
Dimana:
d
ij
= Jarak antara objek ke-i dengan objek ke-j
X
i
= vektor-vektor nilai objek ke-i
X
j
= vektor-vektor nilai objek ke-j
S = Matriks ragam peragam
Jarak mahalanobis jarang digunakan karena tanpa informasi awal dari gerombol-
gerombol yang ada nilai S, tidak dapat ditentukan. Jika situasi pengukuran yang
digunakan antar peubah tidak sama, maka sebelum dilakukan penghitungan
jarak perlu dilakukan transformasi kedalam bentuk baku (Z).
10.3.2 Metode Perbaikan Jarak
Proses penggabungan dilakukan dengan. memperbaiki matriks jaraknya.
Beberapa metode perbaikan jarak yang dapat digunakan :
Metode Pautan Tunggal (Single Linkage)
Pada metode ini jarak antara dua gerombol merupakan jarak terdekat antara
pengamatan di dalam satu gerombol dengan pengamatan di dalam gerombol
lainnya. Digunakan jika pengguna memperkirakan memiliki kelompok dengan
jarak antar kelompoknya panjang. Metode ini merupakan metode yang paling
sederhana diantara metode perbaikan jarak lainnya. Pada setiap tahap perbaikan
jarak, setelah gerombol, misal U dan V digabungkan, jarak antara (UV) dan
gerombol lainnya, misal W, adalah sebagai berikut: d
(UV)W
= min {d
UW
,d
VW
}
68
Nilai d
(UV)W
jarak terdekat antara anggota gerombol (UV) dan W.
a. Metode Pautan Lengkap (Complete Lingkage )
Metode ini pada dasarya sama dengan metode pautan tunggal. Perbedaannya,
pada metode ini jarak antara dua gerombol merupakan jarak terjauh antara
pengamatan di dalam satu gerombol dengan pengamatan didalam gerombol
lainnya. Pada metode pautan lengkap digunakan untuk kelompok yang padat
dimana tidak ada dua objek yang berjauhan. Setelah gerombol U dan V
digabungkan, jarak antara gerombol (UV) dan gerombol lain ditentukan sebagai
berikut:
d
(UV)W
= max {d
UW
,d
VW
}
Nilai d
(UV)W
jarak terjauh antara anggota gerombol (UV) dan W.
b. Metode Pautan Rataan (Average Lingkage)
Metode ini mendefinisikan jarak antara dua gerombol merupakan rata-rata
semua pasangan yang mungkin antar pengamatan dalam suatu gerombol
dengan pengamatan di dalam gerombol lainnya. Pada metode pautan rataan,
setelah gerombol U dan V digabungkan rata-rata jarak antara gerombol (UV) dan
gerombol lain, misal W didefinisikan sebagai berikut:
( )
( ) W UV
i k
ik
W UV
N N
d
d

Keterangan:
d
ik
= jarak antara objek ke-i pada gerombol (UV) dan objek ke-k
pada gerombol W
N
(UV)
= jumlah pengamatan dalam gerombol (UV)
N
W
= jumlah pengamatan dalam gerombol W
c. Metode Centroid
Dalam analisis statistika, nilai tengah seringkali menjadi statistik pemusatan
gugus data. Baik uji-t maupun analisis ragam biasa digunakan untuk
mengidentifikasi perbedaan antar kelompok, dengan menguji perbedaan nilai
tengahnya. Konsep seperti ini sama dengan metode centroid yaitu
penggabungan dua gerombol dilakukan dengan menggunakan dua gerombol
yang paling dekat/mirip vektor nilai tengahnya (centroid). Persamaan untuk
metode centroid, ditentukan sebagai berikut:
pq
q p
p
qr
q p
p
pr
q p
p
tr
d
N N
N
d
N N
N
d
N N
N
d
+
+
+
+
+

Dengan p dan q adalah gerombol baru yang digabungkan (dilambangkan


dengan t) dan r adalah gerombol lainnya.
d
tr
= jarak antara gerombol baru yang digabungkan (t) dan (r)
d
pr
= jarak objek pada gerombol p dan objek pada gerombol r
d
qr
= jarak objek pada gerombol q dan objek pada gerombol r
d
pq
= jarak objek pada gerombol p dan objek pada gerombol q
N
p
= Jumlah objek dalam gerombol p
N
q
= Jumlah objek dalam gerombol q
d. Metode Ward
Metode ini memperkenalkan suatu metode penggerombolan dengan tujuan
menggabungkan dua gerombol yang meminimumkan total jumlah kuadrat galat
dalam kelompok. Pada metode ini jarak antara dua gerombol merupakan kuadrat
galat (JKG). Persamaan untuk metode Ward, ditentukan sebagai berikut:


,
_

,
_


k
j
n
i
ij
j
n
i
ij
j j
X
n
X JKG
1 1 1
2
1
Dengan:
X
ij
= Nilai objek ke-i pada gerombol ke-j
69
k = jumlah gerombol pada setiap tahap
n
j
= jumlah objek pada gerombol ke-j
X.3.3. Metode Penggerombolan
a. Penggerombolan Hirarki
Metode penggerombolan hirarki biasanya digunakan bila jumlah gerombol
yang diinginkan sudah diketahui. Metode hirarki dibagi menjadi dua, yaitu yang
bersifat mengelompokkan (agglomerative) dan yang bersifat memecah (divisive).
Metode hirarki yang bersifat agglomerative dimulai dengan
mengasumsikan bahwa setiap objek merupakan satu gerombol. Jadi pada tahap
awal, jumlah gerombol sama dengan jumlah objek. Setelah itu objek yang paling
mirip atau dekat digabungkan menjadi satu gerombol. Proses ini berlanjut sampai
semua objek bergabung menjadi satu gerombol. Untuk yang bersifat divisive
prosesnya berlawanan dengan yang bersifat agglomerative. Pada tahap awal
semua objek berada dalam satu gerombol. Setelah itu objek yang memiliki sifat
paling beda atau tidak mirip dipisah membentuk satu gerombol yang lain. Proses
ini berlanjut sampai semua objek masing-masing membentuk satu gerombol.
Dalam metode penggerombolan hirarki matriks jarak kemiripan hasil
penggerombolan dapat disajikan dalam bentuk dendogram atau diagram pohon.
Untuk menentukan banyaknya gerombol yang dibentuk dilakukan pemotongan
gerombol pada selisih jarak penggabungan terbesar (Dunn & Everitt, 1982).
Namun hal ini tidak mutlak. Pemotongan dendogram juga tergantung pada
tujuan penggerombolan dan informasi awal mengenai data, sehingga
menghasilkan gerombol-gerombol yang bermakna.
Algoritma standar yang bisa digunakan dalam penggerombolan
(Johnson & Wichern, 1988) adalah:
1. Menghitung ukuran kemiripan/ketakmiripan antara pasangan objek ke-i dan
ke-j yang disusun dalam bentuk matriks
2. Gabungkan dua individu yang memiliki jarak terdekat menjadi gerombol.
3. Memperbaharui matriks jarak antar gerombol dengan memakai salah satu
dari berbagai metode perbaikan jarak, setiap metode mempunyai kriteria
pengoptimalan tertentu.
4. Mengulangi langkah 2 dan 3 sampai terbentuk hanya satu gerombol yang
beranggotakan n individu.
Contoh:
Sebuah perusahaan sereal melakukan identifikasi terhadap 12 merk sereal untuk
sarapan yang selama ini dijual dengan tujuan akan mendapatkan kelompok-
kelompok sereal dengan karakteristik kandungan nutrisi yang mirip, diperoleh
data sebagai berikut :
Merek Protein Karbohidrat Lemak Kalori VitaminA
Life 6 19 1 110 0
Grape Nuts 3 23 0 100 25
Super Sugar Crisp 2 26 0 110 25
Special K 6 21 0 110 25
Rice Krispies 2 25 0 110 25
Raisin Bran 3 28 1 120 25
Product 19 2 24 0 110 100
Wheaties 3 23 1 110 25
Total 3 23 1 110 100
Puffed Rice 1 13 0 50 0
Sugar Corn Pops 1 26 0 110 25
Sugar Smacks 2 25 0 110 25
Tahapan menggunakan MINITAB :
Klik Stat > Multivariate > Cluster Observations
70
Variables or distance matrix : isi dengan kolom yang diisi data numerik
di atas atau karakteristik yang diamati
Linkage Method : pilih Complete
Distance Measure : pilih Euclidean
Checklist Standardize Variables, karena satuan pengukuran variabel berbeda
sehingga perlu distandarisasi.
Number of Clusters : 1(default)
Checklist Show Dendogram, untuk menampilkan dendogram
output :
71
Cluster Analysis of Observations: Protein, Carbo, Fat, Calories, VitaminA
Standardized Variables, Euclidean Distance, Complete Linkage
Amalgamation Steps
Number
Number of obs.
of Similarity Distance Clusters New in new
Step clusters level level joined cluster cluster
1 11 100.000 0.00000 5 12 5 2
2 10 95.784 0.25289 3 5 3 3
3 9 89.009 0.65935 3 11 3 4
4 8 76.943 1.38316 6 8 6 2
5 7 74.321 1.54046 2 3 2 5
6 6 64.404 2.13535 7 9 7 2
7 5 62.837 2.22937 1 4 1 2
8 4 55.956 2.64215 2 6 2 7
9 3 43.502 3.38929 2 7 2 9
10 2 23.455 4.59184 1 2 1 11
11 1 0.000 5.99891 1 10 1 12
Final Partition
Number of clusters: 1
Within Average Maximum
cluster distance distance
Number of sum of from from
observations squares centroid centroid
Cluster1 12 55 1.92217 4.31911
Observations
S
i
m
i
l
a
r
i
t
y
10 9 7 8 6 11 12 5 3 2 4 1
0.00
33.33
66.67
100.00
Dendrogram with Complete Linkage and Euclidean Distance
Pemotongan dendogram terserah dari tujuan kita, yang penting pemotongannya
bermakna. Kalau belum ada gambaran berapa gerombol yang akan dibentuk bisa
dengan melihat distance level, pemotongan dilakukan pada selisih 2 distance level
yang terbesar. Dari output diatas dengan melihat distance level pemotongan
dilakukan pada 2 cluster.
Ulangi tahapan cluster diatas :
Number of Clusters : 2
Klik storage : pada cluster memebrship column isi dengan kolom yang
kosong (C7), sebagai petunjuk observasi masuk ke gerombol 1 atau 2 agar
mempermudah interpretasi.
output :
72
Cluster Analysis of Observations: Protein, Carbo, Fat, Calories, VitaminA
Standardized Variables, Euclidean Distance, Complete Linkage
Amalgamation Steps
Number
Number of obs.
of Similarity Distance Clusters New in new
Step clusters level level joined cluster cluster
1 11 100.000 0.00000 5 12 5 2
2 10 95.784 0.25289 3 5 3 3
3 9 89.009 0.65935 3 11 3 4
4 8 76.943 1.38316 6 8 6 2
5 7 74.321 1.54046 2 3 2 5
6 6 64.404 2.13535 7 9 7 2
7 5 62.837 2.22937 1 4 1 2
8 4 55.956 2.64215 2 6 2 7
9 3 43.502 3.38929 2 7 2 9
10 2 23.455 4.59184 1 2 1 11
11 1 0.000 5.99891 1 10 1 12
Final Partition
Number of clusters: 2
Within Average Maximum
cluster distance distance
Number of sum of from from
observations squares centroid centroid
Cluster1 11 34.6494 1.67541 2.79204
Cluster2 1 0.0000 0.00000 0.00000
Cluster Centroids
Variable Cluster1 Cluster2 Grand centroid
Protein 0.101487 -1.11636 0.0000000
Carbo 0.229900 -2.52890 0.0000000
Fat 0.061546 -0.67700 0.0000000
Calories 0.280306 -3.08337 -0.0000000
VitaminA 0.093048 -1.02353 -0.0000000
Distances Between Cluster Centroids
Cluster1 Cluster2
Cluster1 0.00000 4.71175
Cluster2 4.71175 0.00000
Interpretasi :
Analisis cluster di atas menggunakan variabel yang telah distandarkan, menggunakan
konsep jarak Euclidean serta metode jarak complete. Dari output ditampilkan langkah-
langkah penggabungan antar objek, kemudian dibentuk 2 cluster. Cluster pertama
terdiri dari 11 objek serta cluster dua hanya terdiri 1 objek. Perbedaan karakteristik
antara dua cluster tersebut dapat dilihat dari bagian cluster centroid. Dari bagian
tersebut terlihat bahwa cluster dua mempunyai kandungan nustrisi, dalam hal ini
kandungan protein, carbohidrat, lemak, kalori dan vitaminA yang lebih tinggi dari
cluster dua.

Observations
S
i
m
i
l
a
r
i
t
y
10 9 7 8 6 11 12 5 3 2 4 1
0.00
33.33
66.67
100.00
Dendrogram with Complete Linkage and Euclidean Distance
2. Penggerombolan Non Hirarki
Metode non hirarki digunakan apabila jumlah satuan pengamatannya besar dan
jumlah gerombol yang diinginkan sudah diketahui sebelumnya. Metode yang paling
sering dipakai adalah metode K-rataan. Algoritma K-rataan MacQueen (Johnson &
Wichern, 1988) adalah:
.1 Pembentukan k gerombol awal dan menentukan pusat gerombol awal.
.2 Membentuk gerombol sementara dengan menghitung jarak setiap objek ke pusat
gerombol dan mengelompokkan setiap objek ke dalam gerombol berdasarkan
pusat gerombol terdekat atau jarak yang digunakan biasanya adalah jarak euclid.
.3 Setelah gerombol sementara terbentuk hitung rataan dan jumlah kuadrat tiap-tiap
gerombol yang terbentuk. Nilai rataan ini merupakan pusat gerombol yang baru.
73
.4 Ulangi langkah 2 sampai jumlah kuadrat tiap gerombol sekecil mungkin dan tidak
ada lagi perpindahan gerombol.
Contoh Non-Hirarki
Seorang peneliti ingin mengelompokkan beruang hitam berdasarkan profil beruang
menjadi 3 kategori ukuran, yakni :
Name Age Month Sex Head.L Head.W Neck.G Length Chest.G Weight Obs.No
Allen 19 7 1 10 5 15 45 23 65 1
Berta 19 7 2 11 6.5 20 47.5 24 70 1
Berta 20 8 2 12 6 17 57 27 74 2
Berta 23 11 2 12.5 5 20.5 59.5 38 142 3
Berta 29 5 2 12 6 18 62 31 121 4
Clyde 19 7 1 11 5.5 16 53 26 80 1
Clyde 20 8 1 12 5.5 17 56 30.5 108 2
Doc 55 7 1 16.5 9 28 67.5 45 344 1
Doc 67 7 1 16.5 9 27 78 49 371 2
Quincy 81 9 1 15.5 8 31 72 54 416 1
Kooch * 10 1 16 8 32 77 52 432 1
Charlie 115 7 1 17 10 31.5 72 49 348 1
Charlie 117 9 1 15.5 7.5 32 75 54.5 476 2
Charlie 124 4 1 17.5 8 32 75 55 478 3
Charlie 140 8 1 15 9 33 75 49 386 4
Geraldine 104 8 2 15.5 6.5 22 62 35 166 1
Fannie 100 4 2 13 7 21 70 41 220 1
Adam 70 9 1 15 6.5 28 78 45 334 2
Dieter 56 7 1 15 7.5 26.5 73.5 41 262 1
John 51 4 1 13.5 8 27 68.5 49 360 1
Palmer * 4 1 15.5 7 29.3 76 53 416 2
Xeronda 57 9 2 13.5 7 20 64 38 204 1
Clara 53 5 2 12.5 6 18 58 31 144 1
Abe * 6 1 12 8.3 18.5 60.3 32 122 1
Eugene 68 8 1 16 9 29 73 44 332 1
Floyd 8 8 1 9 4.5 13 37 19 34 1
Kim 44 8 2 12.5 4.5 10.5 63 32 140 1
Ichabod 32 8 1 14 5 21.5 67 37 180 1
Lorie 20 8 2 11.5 5 17.5 52 29 105 1
Mighty 32 8 1 13 8 21.5 59 33 166 1
Oliver 45 9 1 13.5 7 24 64 39 204 1
Oliver 56 8 1 14.5 7.5 26.5 66 40 250 2
Ness 9 9 2 9 4.5 12 36 19 26 1
Pete 21 9 1 13 6 19 59 30 120 1
Pete 21 9 1 13 6 19 59 30 114 2
Pete 30 9 1 13.5 6.5 23 66.5 38 210 3
Robert 177 9 1 16 9.5 30 72 48 436 1
Smokey 57 9 2 12.5 5 19 57.5 32 125 1
Smokey 67 7 2 12.5 6 19 57 34 152 2
Smokey 69 9 2 12.5 6.5 19.5 61 36 176 3
Tozia 81 9 2 13 5 20 61 33 132 1
Tozia 84 8 2 13.5 5 18.5 57 35 180 2
Unser 21 9 1 13 5 17 54 28 90 1
Unser 23 11 1 13 5.5 20.5 57.8 34.5 140 2
Viking 9 9 1 10 4 13 40 23 40 1
Walt 45 9 1 16 6 24 63 42 220 1
Xavier 9 9 1 10 4 13.5 43 23 46 1
Xavier 18 6 1 11 5 15 45 25 60 2
74
Yogi 33 9 1 13.5 6 22 66.5 34 154 1
Zelda 57 9 2 13 5.5 17.5 60.5 31 116 1
Tahapan menggunakan MINITAB :
Klik Stat > Multivariate > Cluster K-Means
Variables : isi dengan peubah 'head.l' sampai 'weight'
Number of cluster : berapa banyak gerombol yang terbentuk tergantung
kepada peneliti. Pada kasus ini isi dengan angka 3 yang berarti akan terbentuk 3
gerombol
Checklist Standardize variables, karena setiap peubah belum tentu memiliki
satuan yang sama
Klik Storage : Isi kotak Cluster membership column dengan kolom
yang masih kosong (C12) sebagai petunjuk observasi
masuk ke gerombol 1,2 atau 3.
output :
Perhatikan kolom C12! Observasi 1 termasuk gerombol 1, observasi 2 termasuk
gerombol 1, observasi 3 termasuk observasi 2, dan seterusnya.
Interpretasi :
75
K-means Cluster Analysis: Head.L, Head.W, Neck.G, Length, Chest.G, Weight
Standardized Variables
Final Partition
Number of clusters: 3
Within Average Maximum
cluster distance distance
Number of sum of from from
observations squares centroid centroid
Cluster1 9 8.704 0.900 1.422
Cluster2 26 29.498 0.982 1.887
Cluster3 15 19.948 1.117 1.724
Cluster Centroids
Grand
Variable Cluster1 Cluster2 Cluster3 centroid
Head.L -1.4801 -0.1316 1.1161 0.0000
Head.W -1.0275 -0.3086 1.1515 -0.0000
Neck.G -1.1194 -0.3650 1.3044 0.0000
Length -1.6182 -0.0694 1.0911 -0.0000
Chest.G -1.3333 -0.2557 1.2433 0.0000
Weight -1.1092 -0.3945 1.3494 -0.0000
Distances Between Cluster Centroids
Cluster1 Cluster2 Cluster3
Cluster1 0.0000 2.6411 6.1145
Cluster2 2.6411 0.0000 3.6208
Cluster3 6.1145 3.6208 0.0000
Analisis cluster di atas menggunakan variabel yang telah distandarkan, dengan tujuan
membagi objek-objek diatas ke dalam 3 cluster. Cluster pertama terdiri dari 9 objek,
cluster dua terdiri 26 objek serta cluster tiga terdiri 15 objek. Perbedaan karakteristik
antara ketiga cluster tersebut dapat dilihat dari bagian cluster centroid. Dari bagian
tersebut terlihat bahwa ke-50 beruang tersebut dikelompokkan berdasarkan ukuran
tubuhnya, dimana beruang yang masuk kedalam cluster satu mempunyai ukuran
tubuh yang kecil, kemudian cluster dua terdiri dari beruang dengan ukuran tubuh
sedang serta beruang dengan ukuran tubuh besar akan masuk kedalam cluster tiga.
X.4 ANALISIS DISKRIMINAN
Analisis diskriminan adalah teknik statistika untuk mengelompokkan atau
mengklasifikasikan suatu pengamatan atao observasi berdasar karakteristik observasi
kedalam satu kelompok dari beberapa kelompok dari beberapa kelompok yang telah
dilakukan sebelumnya.
Masalah yang sering dihadapai dalam multivariate adalah bagaimana
mendapatkan faktor penentu yang membedakan populasi atau memperoleh kombinasi
linear yang menunjukkan ukuran pembeda dalam nilai tengah populasi tersebut.
Analisis ini merupakan suatu metode untuk menghasilkan pemisah yang terbaik
antara berbagai macam kelompok. Analisis diskriminan pertama kali diperkenalkan
oleh Sir Ronald Fisher dan merupakan teknik statistika yang paling sering dipakai
untuk meneliti kumpulan-kumpulan dari suatu masalah.
Contoh :
Dalam rangka mengatur penangkapan ikan salmon, sangat diinginkan bisa
mengidentifikasi apakah ikan yang tertangkap berasal dari Alaska atau Kanada. Lima
puluh ikan diambil dari setiap tempat, dan pertumbuhan diameternya diukur ketika
ikan-ikan itu hidup di air tawar dan ketika hidup di air laut. Tujuannya adalah untuk
mengetahui apakah ikan yang tertangkap di kemudian hari berasal dari Alaska atau
dari Kanada (Minitab, Inc).
Langkah-langkah dalam Minitab :
Buka worksheet EXH_MVAR.MTW. gunakan kolom SalmonOrigin,
Freshwater, dan Marine. Taruh pada C1,C2,dan C3.
Klik Stat > Multivariate > Discriminant Analysis.
Groups : isi dengan Salmon Origin.
Predictors : isi dengan Freshwater dan Marine.
Klik OK!!
Output :
76
Linear Discriminant Function for Groups
Alaska Canada
Constant -100.68 -95.14
Freshwater 0.37 0.50
Marine 0.38 0.33
Summary of Misclassified Observations
Squared
Observation True Group Pred Group Group Distance Probability
1** Alaska Canada Alaska 3.544 0.428
Canada 2.960 0.572
2** Alaska Canada Alaska 8.1131 0.019
Canada 0.2729 0.981
12** Alaska Canada Alaska 4.7470 0.118
Canada 0.7270 0.882
13** Alaska Canada Alaska 4.7470 0.118
Canada 0.7270 0.882
30** Alaska Canada Alaska 3.230 0.289
Canada 1.429 0.711
32** Alaska Canada Alaska 2.271 0.464
Canada 1.985 0.536
71** Canada Alaska Alaska 2.045 0.948
Canada 7.849 0.052
Discriminant Analysis: SalmonOrigin versus Freshwater, Marine
Linear Method for Response: SalmonOrigin
Predictors: Freshwater, Marine
Group Alaska Canada
Count 50 50
Summary of classification
True Group
Put into Group Alaska Canada
Alaska 44 1
Canada 6 49
Total N 50 50
N correct 44 49
Proportion 0.880 0.980
N = 100 N Correct = 93 Proportion Correct = 0.930
Squared Distance Between Groups
Alaska Canada
Alaska 0.00000 8.29187
Canada 8.29187 0.00000
Interpretasi :
Dari summary of classification, terlihat bahwa dasar pengelompokan telah
mengelompokkan dengan benar sebesar 90.5%, sehingga disimpulkan
pengelompokan yang dilakukan telah terandal. Pada square distance ...
menampilkan ukuran antar group serta fungsi linear dari masing-masing group juga
ditampilkan, misal fungsi linear untuk group Alaska adalah Alaska = -100.68 +
0.37*Freshwater + 0.38*Marine serta untuk group Canada diperoleh fungsi
Canada = -95.14 + 0.50*Freshwater + 0.33*Marine. Output selanjutnya adalah
ringkasan dari kesalahan dalam klasifikasi data asal, hal ini dilihat dari nilai
probabilitinya dimana suatu pengamatan akan masuk pada group dengan nilai
probability paling besar.
Kasus selanjutnya adalah apabila ada pengamatan baru sehingga diperlukan
pendugaan pengamatan baru tersebut masuk ke group mana. Missal ada pengamatan
baru dengan nilai pengamatan x1 =(103,405) serta x2 = (94,372).
Langkah-langkah dalam Minitab :
Masukkan nilai pengamatan baru, misal pada C5(FW) dan C6(M)
Ulangi langkah analisis diskriminan diatas
Klik Options : Predict group membership for, isi dengan
variabel objek yang baru ( F dan M )
77
output :
Interpretasi :
Dari output diatas kedua pengamatan baru tersebut akan masuk ke group
alaska, hal ini bisa dilihat juga dari nilai probabilitynya.
X.5 ANALISIS BIPLOT
Analisis Biplot diperkenalkan oleh Gabriel pada tahun 1971. Pada
dasarnya, analisis ini merupakan suatu alat statistika yang menyajikan posisi
relatif n objek pengamatan dengan p peubah secara slinultan dalam dua dimensi.
Dari analisis ini dapat dikaji hubungan antara pengamatan dan peubah. Selain itu
juga menunjukkan hubungan antar peubah dan kesamaan antar pengamatan
serta dapat dilihat juga penciri masing-masing objek.
Dengan menggunakan biplot akan diperoleh visualisasi dari segugus objek
dan peubah dalam bentuk grafik bidang datar. Data yang digunakan dalam
metode biplot dapat berupa data rataan atau data asli.
Biplot merupakan teknik statistika deskriptif dimensi ganda yang dapat
disajikan secara visual dengan menyajikan secara simultan segugusan objek
pengamatan dan peubah dalam suatu gugus pada suatu bidang datar sehingga
ciri-ciri peubah dan objek pengamatan serta posisi relatif antar objek pengamatan
dengan peubah dapat dianalisis (Jollife, 1986 & Rawlings, 1988). Dari tampilan
biplot tersebut ada beberapa informasi yang dapat diperoleh, yaitu:
1. Kedekatan antar objek/kedekatan letak (posisi) dua buah objek
diinterpretasikan sebagai kemiripan sifat dua objek. Semakin dekat letak dua
buah objek maka sifat yang, ditunjukkan oleh nilai-nilai peubahnya semakin
mirip.
2. Panjang vektor peubah sebanding dengan keragaman peubah tersebut.
Semakin panjang vektor peubah maka keragaman peubah tersebut semakin
tinggi.
3. Nilai sudut antara dua vektor peubah menggambarkan korelasi kedua peubah.
Semakin sempit sudut yang dibuat antara dua peubah maka semakin tinggi
korelasinya. Jika sudut yang dibuat tegak lurus maka korelasi keduanya
rendah. Sedangkan jika sudutnya tumpul (berlawanan arah) maka korelasinya
negatif
4. Nilai peubah pada suatu objek dapat menginformasikan keunggulan dari
setiap objek. Objek yang terletak searah dengan arah dari suatu peubah maka
nilai peubah objek tersebut diatas nilai rata-rata, dan sebaliknya.
(seperti output diatas)
Prediction for Test Observations
Squared
Observation Pred Group From Group Distance Probability
1 Alaska
Alaska 0.586 0.907
Canada 5.130 0.093
2 Alaska
Alaska 3.014 0.847
Canada 6.440 0.153

You might also like