You are on page 1of 24

Pengenalan

Analisis Deret Waktu


((Time Series Analysis)
y )
MA 2081 Statistika Dasar
30 April 2012
Utriweni Mukhaiyar

Ilustrasi
Berikut adalah data rata-rata curah hujan bulanan yang

diamati dari Stasiun Padaherang pada tahun 2001 2004.


Sumber : Modul 3 Praktikum Mekanika Medium Kontinu Medan Gravitasi

Tahun
a u
2001
2002
2003
2004

Ja
Jan
278.59
299.78
425.21
547.8

Feb
eb
279.78
245.88
370.8
308.2

Mar
a
355.29
266.64
300.23
388

Apr
p
241.34
185.27
157.43
93

Mei
e
115.9
122.22
184.96
297

Ju
Jun
Jul Agust
Ju
gust
176.9 55.32 29.08
133.1 76.78 32.4
69.93 23.28 14.39
128
47
5

Sep O
Oktt Nop
op Des
es
43.82 313.68 508.49 267.82
26.09 169.05 461.62 415.73
17.86 275.23 433.23 456.02
87
105
389 371.6

Apabila
p
nilai curah hujan
j saat ini dianggap
gg p dipengaruhi
p g
oleh rata-

rata curah hujan kemarin dst, maka data rata-rata curah hujan di atas
dapat dikategorikan sebagai suatu deret waktu (time series).
2

Plot Data
berdasarkan waktu
Rata-rata curah hujan bulanan 2001 - 2004 di Stasiun Padaherang
600

nilai cu
urah hujan

500
400
300
200
100
0

10

15

20

25

waktu (bulan ke-)


3

@ UM

30

35

40

45

Proses Stokastik

Proses stokastik adalah barisan peubah acak {Yt , t T }

Setiap proses stokastik memuat ruang keadaan S dan


indeks parameterT
S : semua nilai yang mungkin dari Yt
S danT
d T dapat
d
t bernilai
b
il i diskrit
di k it atau
t kontinu
k ti

Contoh proses stokastik:


g
a. Cuaca harian kota Bandung
b. Banyaknya trombosit/hari pasien demam berdarah
sejak ia terinfeksi
c. Laju pertumbuhan populasi orang utan (% per tahun)
d Waktu antara mekarnya bunga bangkai yang ke-n
d.
ke n
dengan bunga bangkai yang ke n+1

Misal yt nilai dari Yt maka barisan nilai {yt , t T } disebut


realisasi dari {Yt , t T }

Time Series

Jika T : waktu, maka {Yt , t T } disebut time series


Realisasinya disebut data TS
Studi berkaitan dengan TS disebut analisis TS
Permasalahan dalam analisis TS :
Bagaimana
Bagaimana menentukan model Yt sehingga model
tersebut dapat digunakan untuk forecasting (prakiraan
di waktu mendatang)??

Secara umum, model TS dapat ditulis

(1)
Yt = f (.) + et
Asumsi galat: et ~ N (0, 2) dan tidak berkorelasi

Jika f linier dalam parameter-parameternya maka

persamaan (1) disebut model linier TS


Koleksi semua model linier TS dinamakan model
ARIMA(p,d,q) (Box-Jenkins, 1976)
5

Contoh Time Series


Produksi Tembakau di AS

1500
10
000

Miliar pounds
M

6
5
3

500

Persen

2000

Tingkat Pengangguran di AS

20

40

60

80

100

120

1880

1900

1920

Kuartal

1940

1960

1980

Tahun

Ukuran partikel setelah


penyemprotan pengharum ruangan

110

112

114

116

118

20
0000 40000 6000
00 80000

Data Penjualan lynx pelts di Canada

1850

1860

1870

1880
Tahun

1890

1900

100

200

300
Menit

400

500

Manfaat dan Tujuan TS


Memodelkan
d lk ddata TS sehingga
h
ddapat ddilihat
l h perilaku
l k ddata

lebih lanjut
Melakukan prediksi ke depan atau prakiraan jangka pendek
(short-time forecasting)

Beberapa Konsep Dasar dalam TS


K t i
Kestasioneran
TS {Yt , t T } stasioner jika untuk setiap t,

(konstan)
2. kov(Yt , Yt k) = k (tidak tergantung t )
1. E[Yt] =

Secara visual, data TS {Yt , t T } stasioner

jika data TS berfluktuasi di sekitar


rataannya dengan variansi konstan

Beberapa Konsep Dasar dalam TS


ACF fungsi
ACF,
f
i autokorelasi
t k
l i

ACF (fungsi autokorelasi) : fungsi antara


lag k dan k dengan, k = corr (Yt ,Yt k).
ACF sampel:
n

(Y Y )(Y

rk t k 1

t k

Y )

2
(

)
Y
Y
t
t 1

rk = 0 (secara signifikan) jika


1
1
1,96
1 96
rk 11,96
96
n
n

Beberapa Konsep Dasar dalam TS


PACF fungsi
PACF,
f
i parsial
i l autokorelasi
t k
l i
PACF (fs. autokorelasi parsial) : fungsi antara lag k

dengan kk di mana kk = corr (Yt , Yt k) setelah


d
t l h
pengaruh Y1 , Y2, , Yk-1 ditiadakan.

PACF dapat didefinisikan juga sebagai koefiesien suku

terakhir dari regresi Yt dengan Y1 , Y2, , Yk.

Artinya, jika Yt = +1Yt-1 + 2Yt-2 + + kYt-k maka


PACF sampel untuk lag k = taksiran dari k.
kk k
atau
t

kk

10

= 0 (secara signifikan) jika

1
1

1,96
kk 1,96
n
n

C t h ACF d
Contoh
dan PACF d
dengan
g SPSS
number of blowfly
8000
Coefficient

1.0

Upper Confidence Limit

0.5

6000

ACF

numb
ber of blowfly

Lower Confidence
Limit

0.0

4000
-0.5

-1.0

2000

10

11

12

13

14

15

16

Lag Number

number of blowfly

1 3 5 7 9 1 1 1 1 1 2 2 2 2 2 3 3 3 3 3 4 4 4 4 4 5 5 5 5 5 6 6 6 6 6 7 7 7 7 7 8
1 3 5 7 9 1 3 5 7 9 1 3 5 7 9 1 3 5 7 9 1 3 5 7 9 1 3 5 7 9 1 3 5 7 9 1

Sequence number

Coefficient

1.0

11

Upper Confidence Limit


Lower Confidence
Limit

0.5

Partial ACF

Dari menu SPSS, pilih


Graphs
p
Time Series
Autocorrelations...
pilih variabel yang akan
dihit
dihitung
ACF dan
d PACF-nya
PACF
OK

0.0

-0.5

-1.0
1

10

Lag Number

11

12

13

14

15

16

Model-model Time Series


Untuk TS Stasioner
1. Autoregresi (AR) : regresi terhadap TS yg lalu & galat
sekarang
sekarang
AR(1): Yt = +1Yt-1 +et , di mana 1<1<1
AR(2): Yt = +1Yt-1 + 2Yt-2 + et ,
di mana 1<2<1, 2+1<1, 2-1<1
AR(p): Yt = +1Yt-1 + 2Yt-2 + + pYt-p + et

12

2. Moving Average (MA) : regresi terhadap galat yang lalu


dan galat sekarang
MA(1) Yt = + et 1et -1 , di mana 1<
MA(1):
1 1<1
1
MA(2): Yt = + et 1et -1 2et -2
di mana 1<2<1,, 2+1<1,, 2-1<1
MA(q): Yt = + et 1et-1 2et -2 - qet q

Model-model Time Series


Untuk TS Stasioner
3. Autoregresi-Moving Average (ARMA)

regresi
terhadap
h d TS
S yang lalu
l l dan
d semua galat
l
ARMA(1,1): Yt = +1 Yt-1 +et 1et -1
ARMA(p,q):
Zt = +(1 Yt-1 + + p Yt-p ) +(et 1et -1 qet -q )
Catatan: AR(p) = ARMA(p,0), MA(q) = ARMA(0,q)

13

Model-model Time Series


Untuk TS tidak Stasioner
Misal TS {Yt } tidak stasioner.

Buat TS baru yg stasioner, sebut {Zt } dengan cara


diferensi, yaitu Zt = Yt Yt-1, untuk setiap t.
Maka
ARMA(p,q) untuk {Zt} disebut ARIMA (p,1,q)
untuk {Zt }
Jika diferensi dilakukan d kali, ditulis

ARIMA(p,d,q)
ARIMA(
d )
Catatan: ARMA(p,q) = ARIMA (p,0,q)
14

Metode Box Jenkins


Tahap awal:
Pemeriksaan kestasioneran:
- Plot TS
- Jika stasioner, lanjutkan ke tiga tahap iteratif.
Jik tidak
Jika
tid k lakukan
l k k transformasi
t
f
i atau
t diferensi
dif
i
Tiga tahap iteratif :
1 Identifikasi
1.
2. Penaksiran parameter
3. Uji diagnostik (pemeriksaan asumsi sisa)
Jika pada uji diagnostik, ada asumsi yang dilanggar
ulangi lagi 3 tahap iteratif
15

Identifikasi
Model

ACF

PACF

AR(p)

Menurun secara
Cut off setelah lag p
eksponensial atau
membentuk gelombang sinus
teredam

MA(q)

Cut off setelah lag q

Menurun secara
eksponensial atau
membentuk gelombang sinus
teredam

Mengidentifikasi orde (p,q) model ARMA melalui kriteria

Akaike (AIC)

AIC n log

+ 2m ,

m = # parameter

Hitung nilai AIC untuk setiap (p,q). Orde yang dipilih adalah
16

(p,q) dengan nilai AIC yang paling kecil

Penaksiran Parameter
Metode:

- Kuadrat terkecil (untuk model AR)


- Maksimum
M k i
lik lih d
likelihood
- Melard (digunakan SPSS)

Contoh penaksiran parameter melalui SPSS

Dari menu, pilih Analyze Forecasting Create Models ...


Pilih nama TS sebagai Dependent variable
Masukkan orde model ARIMA

17

Uji Diagnosis
Ingat asumsi galat: et ~ N (0,2) dan tidak berkorelasi
P
Pengujian
ji asumsi:
i
Cara 1:
Plot sisaan

berfluktuasi di sekitar 0 E[et ] = 0

nilai sisaan di sekitar 1,96 Var(et) = 2


2

plot ACF serta plot PACF-nya

rk dan kk signifikan 0 sisaan tidak berkorelasi

Cara 2: Uji Ljung-Box


Uji
j H0: korelasi antar sisaan = 0 dengan
g statistik Ljung-Box
j g
2
h
*
k
Jika Q

ditolak
18

r
Q n(n 2)
k 1 n k

> 2, dengan = h m dan m = # parameter,


parameter maka H0

Contoh
Hasil produksi bulanan perkebunan teh di lokasi PAL tahun

1992-2009 (T = 216)
Produksi teh "PAL" 1992-2009
1992 2009
diferensi 1 kali

300000

150000

250000

100000

200000

produksi teh

produksi teh

Produksi teh "PAL" 1992-2009

150000
100000

0
0

50

100

-50000

50000
0

-100000
0

50

100
bulan ke-

19

50000

150

200

bulan ke-

150

200

Contoh
Sari Numerik Data
DataperkebunantehPAL
Mean
StandardError
Median
Mode
StandardDeviation
p
SampleVariance
Kurtosis
Skewness
Range
Mi i
Minimum
Maximum
Sum
Count
20

133793.6
2488.531
136781
#N/A
36573.79
1.34E+09
0.222436
0.07241
218458
36305
254763
28899412
216

Data perkebunan teh PAL (diff 1 kali)


DataperkebunantehPAL(diff1kali)
Mean
StandardError
Median
Mode
StandardDeviation
Sample Variance
SampleVariance
Kurtosis
Skewness
Range
Mi i
Minimum
Maximum
Sum
Count

455.7023
2407.674
1515
15033
35303.43
1.25E+09
1.25E
09
1.855309
0.701741
216395
81536
81536
134859
97976
215

Contoh
Identifikasi
ACF menurun seperti

gelombang sinus
teredam sedangkan
PACF cut off setelah
g
lag-1.
Model yang mungkin
adalah AR(1)

ACF cut off setelah

lag-1 sedangkan PACF


jjuga
g seperti
p
cut offff
setelah lag-1.
Ada beberapa model
yang
g
seperti
mungkin,
ARIMA(1,1,1)
21

Contoh

AR (1)

Penaksiran dan Uji Diagnostik

ARIMA (1,1,1)

Diperoleh AR(1) : Yt 134113, 420 0,535Yt 1 et

22

Diperoleh ARIMA(1,1,1) :

Z t 19, 205 0, 434 Z t 1 0,934et 1 et

Contoh
Kesimpulan
Berdasarkan hasil Ljung-Box, dimana pada model AR(1) H0

ditolak
dit
l k ((sisaan
i
bberkorelasi)
k l i) untuk
t k semua 1% 10%,
10%
sedangkan ARIMA(1,1,1) tidak ditolak untuk <1,7%.
Oleh karena itu model ARIMA(1,1,1)
( , , ) bisa dianggap
gg p lebih
cocok (dengan sisaan yang tidak berkorelasi) sehingga dapat
digunakan untuk melakukan short-time forecast dengan
menggunakan persamaan :
Z t 19,, 205 0,, 434 Z t 1 0,934
,
et 1 et

Yt 1 Yt 19, 205 0, 434(Yt Yt 1 ) 0,934et 1

Yt 1 19,
19 205 11, 434Yt 00, 434Yt 1 00,934
934et 1
23

Referensi

Box, G.
B
G E.
E P.
P dan
d Jenkins,
J ki
G
G. M
M. (1976):
(
) Time
Ti
S
Series
i
Analysis: Forecasting & Control, Holden-Day Inc.,
San Fransisco
Cryer, J. D. dan Chan, K. S. (2008): Time Series
Analysis with Applications in R, Springer, New York.

24

You might also like