Cari Blog Ini

Jumat, 16 Desember 2011

Penggunaan model untuk peramalan


   Jika model terbaik telah ditetapkan, maka model siap digunakan untuk peramalan. Untuk data yang mengalami differencing, bentuk selisih harus dikembalikan pada bentuk awal dengan melakukan proses integral karena yang diperlukan adalah ramalan time series asli.
   Notasi yang digunakan dalam ARIMA adalah notasi yang mudah dan umum. Misalkan model ARIMA (0,1,1)(0,1,1)9 dijabarkan menjadi sebuah persamaan regresi yang lebih umum:
   Untuk meramalkan satu periode ke depan, yaitu Zt+1 maka model disusun seperti pada persamaan berikut:
   Nilai et+1 tidak akan diketahui, karena nilai yang diharapkan untuk kesalahan
random pada masa yang akan datang harus ditetapkan sama dengan nol. Akan tetapi dari model yang disesuaikan (fitted model) kita boleh mengganti nilai et et-8 dan et-9
dengan nilai nilai mereka yang ditetapkan secara empiris (seperti yang diperoleh setelah iterasi terakhir algoritma Marquardt).
   Tentu saja bila kita meramalkan jauh ke depan, tidak akan kita peroleh nilai empiris untuk “e” sesudah beberapa waktu, dan oleh sebab itu nilai harapan mereka akan seluruhnya nol. Untuk nilai Z pada awal proses peramalan, kita akan mengetahui nilai Zt, Zt-8, Zt-9. Akan tetapi sesudah beberapa saat, nilai  akan berupa nilai ramalan (forecasted value), bukan nilai-nilai masa lalu yang telah diketahui.
   Teknik peramalan dengan menggunakan ARIMA juga memberikan confidence interval. Jika peramalan dilakukan jauh ke depan, maka confidence interval umumnya juga akan makin melebar. Namun tidak demikian untuk confidence interval moving average model murni. Peramalan merupakan never ending process yang berarti jika data terbaru muncul, model perlu diduga dan diperiksa kembali.


Model ARIMA dan Musiman


   Musiman berarti kecendrungan mengulangi pola tingkah gerak dalam periode musim, biasanya satu tahun untuk data bulanan. Karena itu, deret waktu musiman mempunyai karakteristik yang ditunjukkan oleh adanya korelasi beruntun yang kuat pada jarak semusim (Cryer,1986). Untuk data yang stasioner, faktor musiman dapat ditentukan dengan mengidentifikasi koefisien autokorelasi pada dua atau tiga time-lag yang berbeda nyata dari nol. Autokorelasi yang secara signifikan berbeda dari nol menyatakan adanya suatu pola dalam data. Notasi umum yang singkat untuk menangani musiman adalah



dengan,
(p,d,q) = bagian yang tidak musiman dari model
(P,D,Q) = bagian musiman dari model
S = jumlah periode per musim

Pemilihan model terbaik


   Untuk menentukan model yang terbaik dapat digunakan standard error estimate berikut:

dengan:
Zt = nilai sebenarnya pada waktu ke-t
   Model terbaik adalah model yang memiliki nilai standard error estimate (S) yang paling kecil. Selain nilai standard error estimate, nilai rata-rata persentase kesalahan peramalan (MAPE) dapat juga digunakan sebagai bahan pertimbangan dalam menentukan model yang terbaik yaitu:

dengan:
T = banyaknya periode peramalan/dugaan


Pemeriksaan diagnosa


Dalam pemeriksaan terhadap model ada beberapa metode yang bisa dilakukan, antara lain adalah:
  1. Pengujian model secara keseluruhan (Overall F test) dan pengujian masingmasing parameter model secara parsial (t-test), untuk menguji apakah koefisien model signifikan secara statistik atau tidak baik secara keseluruhan maupun parsial
  2. Model dikatakan baik jika nilai error bersifat random, artinya sudah tidak mempunyai pola tertentu lagi. Dengan kata lain model yang diperoleh dapat menangkap dengan baik pola data yang ada. Untuk melihat kerandoman nilai error dilakukan pengujian terhadap nilai koefisien autokorelasi dari error, dengan menggunakan salah satu dari dua statistik berikut:
  • Uji Q Box dan Pierce:

  • Uji Ljung-Box:


Menyebar secara Khi Kuadrat dengan derajat bebas (db)=(k-p-q-P-Q) dengan:
n’ = n-(d+SD)
d = ordo pembedaan bukan faktor musiman
D = ordo pembedaan faktor musiman
S = jumlah periode per musim
m = lag waktu maksimum
rk = autokorelasi untuk time lag 1, 2, 3, 4,..., k
Kriteria pengujian:
Jika Q ≤ Khi Kuadrat (alfa ,db ), berarti: nilai error bersifat random (model dapat diterima).
Jika Q > Khi Kuadrat (alfa ,db ) berarti: nilai error tidak bersifat random (model tidak dapat diterima).



Pendugaan parameter model


Ada dua cara yang mendasar untuk mendapatkan parameter-parameter tersebut:

  • Dengan cara mencoba-coba (trial and error), menguji beberapa nilai yang berbeda dan memilih satu nilai tersebut (atau sekumpulan nilai, apabila terdapat lebih dari satu parameter yang akan ditaksir) yang meminimumkan jumlah kuadrat nilai sisa (sum of squared residual).


  • Perbaikan secara iteratif, memilih taksiran awal dan kemudian penghitungan dilakukan Box-Jenkins Computer Program untuk memperhalus penaksiran tersebut secara iteratif.

Identifikasi Model

   Pada tahap identifikasi, variabel yang akan diramalkan terlebih dahulu diuji kestasioneran datanya. Kestasioneran data dapat diuji dengan cara plot data dan menghitung autocorrelation function (ACF). Melalui plot data, dilihat secara visual apakah data memiliki kecendrungan semakin meningkat, semakin menurun, atau terdapat fluktuasi musiman. Sedangkan dari nilai ACF, jika nilai ACF mendekati nol pada lag kedua atau ketiga, maka data tersebut stasioner. Jika data yang diamati memiliki pola musiman, pada plot ACF akan terlihat nilai ACF yang signifikan pada kelipatan musimnya. Deret data non-stasioner dapat dijadikan stasioner dengan melakukan proses differencing (pembedaan). Jumlah berapa kali dilakukan proses differencing menunjukan tingkat differensiasi model. Untuk pola data yang mengandung unsur musiman, secara khusus dapat digunakan model seasonal ARIMA.
   Unsur musiman dapat dihilangkan dengan seasonal differencing . Setelah data menjadi stasioner, langkah yang selanjutnya dilakukan adalah menentukan model tentative. Untuk menentukan model tentative, diperlukan analisis dari ACF dan PACF. Pola ACF dan PACF bisa berpola cut off dan dies down. Pertama, ACF dan PACF dari data time series bisa berpola cut off. Pola cut off adalah pola ketika garis ACF dan PACF signifikan pada lag pertama atau kedua tetapi kemudian tidak ada garis ACF dan PACF yang signifikan pada lag berikutnya. Untuk pola cut off, perbedaan antara ACF dan PACF yang signifikan dengan ACF dan PACF yang tidak signifikan adalah besar sehingga garis ACF dan PACF terlihat terpotong (cut off). Kedua, ACF dan PACF dikatakan memiliki perilaku dies down jika kedua fungsi tersebut tidak terpotong, melainkan menurun secara bertahap. Bentuk penurunannya bisa tanpa ataupun dengan berbentuk gelombang sinus. Penentuan apakah suatu data time series dimodelkan dengan AR, MA atau ARIMA tergantung pola ACF dan PACF. Model AR digunakan jika plot ACFnya dies down sementara PACF-nya cut off. Model MA digunakan jika plot ACFnyacut off dan plot ACF-nya dies down. Sedangkan jika kedua plot ACF dan PACF sama-sama dies down, maka model yang digunakan adalah model ARIMA.

Kesalahan yang sering terjadi dalam penentuan p dan q bukan merupakan masalah besar pada tahap ini, karena hal ini akan diketahui pada tahap pemeriksaan diagnosa selanjutnya.

Model umum dan uji stasioneritas


   Stasioneritas berarti tidak terdapat pertumbuhan atau penurunan pada data. Data secara kasarnya harus horizontal sepanjang sumbu waktu. Dengan kata lain, fluktuasi data berada di sekitar suatu nilai rata-rata yang konstan, tidak tergantung pada waktu dan varians dari fluktuasi tersebut atau tetap konstan setiap waktu. Untuk mengetahui stasioner tidaknya data dapat diamati dari timeseries plot data tersebut, autocorrelation function data atau model trend linier data terhadap waktu.
   Suatu data time series yang tidak stasioner harus diubah menjadi data stasioner, karena aspek-aspek AR dan MA dari model ARIMA hanya berkenaan dengan data time series yang stasioner. Salah satu cara yang paling sering dipakai adalah metode pembedaan (differencing) yaitu menghitung perubahan atau selisih nilai observasi. Nilai selisih yang diperoleh dicek lagi apakah stasioner atau tidak. Jika belum stasioner maka dilakukan differencing lagi.

TAHAPAN ARIMA (Box-Jenkins)


Langkah-langkah penerapan metode ARIMA secara berturut-turut adalah identifikasi model, pendugaan parameter model, pemeriksaan diagnosa dan penerapan model untuk peramalan. Secara lengkap dapat dilihat pada bagan di bawah ini:


Rabu, 14 Desember 2011

Klasifikasi Model ARIMA

  Model Box-Jenkins (ARIMA) dibagi kedalam 3 kelompok, yaitu: model autoregressive (AR), moving average (MA), dan model campuran ARIMA (autoregresive moving average) yang mempunyai karakteristik dari dua model pertama.
1) Autoregressive Model (AR)
   Bentuk umum model autoregressive dengan ordo p (AR(p)) atau model ARIMA (p,0,0) dinyatakan sebagai berikut:
dimana: 
μ' = suatu konstanta
φp = parameter autoregresif ke-p
et = nilai kesalahan pada saat t
2) Moving Average Model (MA)
   Bentuk umum model moving average ordo q (MA(q)) atau ARIMA (0,0,q) dinyatakan sebagai berikut:
dimana: 
μ ' = suatu konstanta
θsampai θq adalah parameter-parameter moving average
et-k = nilai kesalahan pada saat t – k
3) Model campuran
a. Proses ARMA
   Model umum untuk campuran proses AR(1) murni dan MA(1) murni, misal ARIMA (1,0,1) dinyatakan sebagai berikut:
b. Proses ARIMA
  Apabila nonstasioneritas ditambahkan pada campuran proses ARMA, maka model umum ARIMA (p,d,q) terpenuhi. Persamaan untuk kasus sederhana ARIMA (1,1,1) adalah sebagai berikut:
pembedaan AR(1) dan MA(1) pertama

Sekilas Arima

    Autoregressive Integrated Moving Average (ARIMA) atau biasa disebut dengan metode Box-Jenkins. ARIMA sangat baik ketepatannya untuk peramalan jangka pendek, yang tidak membentuk suatu model struktural baik itu persamaan tunggal atau simultan yang bebasis kepada teori ekonomi atau logika, namun dengan menganalisis probabilistik atau stokastik dari data deret waktu (time series) dengan menggunakan nilai masa lalu dan sekarang dari variabel dependen untuk menghasilkan peramalan jangka pendek yang akurat dengan mengabaikan variabel independennya. Hal ini terjelaskan dengan prinsip dari metode ini yaitu “let the data speak for themselves”.
    Metode peramalan dengan menggunakan ARIMA dapat kita jumpai dalam peramalan ekonomi, analisis anggaran, kontrol terhadap proses dan kualitas, analisis sensus, perubahan struktur harga industri, inflasi, indeks harga saham, perkembangan nilai tukar terhadap mata uang asing dsb.
    Beberapa keuntungan yang dapat diperoleh dengan menggunakan ARIMA:
1) Merupakan model tanpa teori karena variabel yang digunakan adalah nilainilai lampau dan kesalahan yang mengikutinya.
2) Memiliki tingkat akurasi peramalan yang cukup tinggi karena setelah mengalami pengukuran kesalahan peramalan mean absolute error, nilainya mendekati nol.
3) Cocok digunakan untuk meramal sejumlah variabel dengan cepat, sederhana, akurat dan murah karena hanya membutuhkan data variabel yang akan diramal.
    Model ARIMA menggunakan pendekatan iteratif dalam indentifikasi terhadap suatu model yang ada. Model yang dipilih diuji lagi dengan data masa lampau untuk melihat apakah model tersebut menggambarkan keadaan data secara akurat atau tidak. Suatu model dikatakan sesuai (tepat) jika residual antara model dengan titik-titik data historis bernilai kecil, terdistribusi secara acak dan bebas satu sama lainnya.
   Pemilihan model terbaik dapat dilakukan dengan membandingkan distribusi koefisien-koefisien autocorrelation (otokorelasi) dari data time series tersebut dengan distribusi teoritis dari berbagai macam model.