Thursday 10 August 2017

Time Series Forecasting Models Seperti Moving Averages


Dalam prakteknya rata-rata bergerak akan memberikan perkiraan yang baik dari rata-rata deret waktu jika mean konstan atau berubah secara perlahan. Dalam kasus mean konstan, nilai m terbesar akan memberikan perkiraan terbaik dari mean yang mendasarinya. Periode pengamatan yang lebih lama akan rata-rata menghasilkan efek variabilitas. Tujuan pemberian m yang lebih kecil adalah memungkinkan perkiraan tersebut merespons perubahan dalam proses yang mendasarinya. Sebagai ilustrasi, kami mengusulkan kumpulan data yang menggabungkan perubahan dalam mean deret deret waktu. Angka tersebut menunjukkan deret waktu yang digunakan untuk ilustrasi bersamaan dengan permintaan rata-rata dari mana seri tersebut dihasilkan. Mean dimulai sebagai konstanta pada 10. Dimulai pada waktu 21, meningkat satu unit pada setiap periode sampai mencapai nilai 20 pada waktu 30. Maka akan menjadi konstan lagi. Data disimulasikan dengan menambahkan mean, noise acak dari distribusi Normal dengan mean nol dan standar deviasi 3. Hasil simulasi dibulatkan ke bilangan bulat terdekat. Tabel menunjukkan simulasi pengamatan yang digunakan untuk contoh. Saat kita menggunakan tabel, kita harus ingat bahwa pada suatu waktu, hanya data terakhir yang diketahui. Estimasi parameter model,, untuk tiga nilai m yang berbeda ditunjukkan bersamaan dengan mean deret waktu pada gambar di bawah ini. Angka tersebut menunjukkan perkiraan rata-rata pergerakan rata-rata pada setiap waktu dan bukan perkiraan. Prakiraan akan menggeser kurva rata-rata bergerak ke kanan menurut periode. Satu kesimpulan segera terlihat dari gambar tersebut. Untuk ketiga perkiraan, rata-rata bergerak tertinggal dari tren linier, dengan lag meningkat dengan m. Keterlambatan adalah jarak antara model dan estimasi dalam dimensi waktu. Karena lag, rata-rata bergerak meremehkan pengamatan karena rata-rata meningkat. Bias estimator adalah perbedaan pada waktu tertentu dalam nilai rata-rata model dan nilai rata-rata yang diprediksi oleh moving average. Bias ketika mean meningkat adalah negatif. Untuk mean yang menurun, biasnya positif. Keterlambatan waktu dan bias yang diperkenalkan dalam estimasi adalah fungsi m. Semakin besar nilai m. Semakin besar besarnya lag dan bias. Untuk seri yang terus meningkat dengan tren a. Nilai lag dan bias estimator mean diberikan dalam persamaan di bawah ini. Kurva contoh tidak sesuai dengan persamaan ini karena contoh model tidak terus meningkat, melainkan dimulai sebagai perubahan konstan, berubah menjadi tren dan kemudian menjadi konstan lagi. Juga contoh kurva dipengaruhi oleh noise. Perkiraan rata-rata pergerakan periode ke masa depan ditunjukkan dengan menggeser kurva ke kanan. Kelemahan dan bias meningkat secara proporsional. Persamaan di bawah ini menunjukkan lag dan bias dari perkiraan periode ke masa depan bila dibandingkan dengan parameter model. Sekali lagi, formula ini untuk rangkaian waktu dengan tren linier konstan. Kita tidak perlu heran dengan hasil ini. Pengukur rata-rata bergerak didasarkan pada asumsi mean konstan, dan contohnya memiliki kecenderungan linier dalam mean selama sebagian periode penelitian. Karena deret real time jarang sekali menaati asumsi model apapun, kita harus siap untuk hasil seperti itu. Kita juga dapat menyimpulkan dari gambar bahwa variabilitas noise memiliki efek terbesar untuk m yang lebih kecil. Estimasi ini jauh lebih fluktuatif untuk rata-rata pergerakan 5 dari moving average 20. Kami memiliki keinginan yang saling bertentangan untuk meningkatkan m untuk mengurangi efek variabilitas akibat kebisingan, dan untuk menurunkan m untuk membuat perkiraan lebih responsif terhadap perubahan. Berarti. Kesalahan adalah perbedaan antara data aktual dan nilai perkiraan. Jika deret waktu benar-benar nilai konstan maka nilai kesalahan yang diharapkan adalah nol dan varians dari kesalahan tersebut terdiri dari sebuah istilah yang merupakan fungsi dari dan istilah kedua yaitu variansi dari noise,. Istilah pertama adalah varians dari mean yang diperkirakan dengan sampel pengamatan m, dengan mengasumsikan data berasal dari populasi dengan mean konstan. Istilah ini diminimalkan dengan membuat m seluas mungkin. Sebuah m besar membuat ramalan tidak responsif terhadap perubahan deret waktu yang mendasarinya. Untuk membuat perkiraan responsif terhadap perubahan, kami ingin m sekecil mungkin (1), namun ini meningkatkan varians kesalahan. Peramalan praktis membutuhkan nilai antara. Peramalan dengan Excel Peramalan peramalan menerapkan rumus rata-rata bergerak. Contoh di bawah ini menunjukkan analisis yang diberikan oleh add-in untuk data sampel di kolom B. 10 pengamatan pertama diindeks -9 sampai 0. Dibandingkan dengan tabel di atas, indeks periode digeser oleh -10. Sepuluh observasi pertama memberikan nilai awal untuk estimasi dan digunakan untuk menghitung rata-rata pergerakan untuk periode 0. Kolom MA (10) (C) menunjukkan rata-rata bergerak yang dihitung. Parameter rata-rata bergerak m adalah di sel C3. Kolom Fore (1) (D) menunjukkan perkiraan untuk satu periode ke masa depan. Interval perkiraan ada di sel D3. Bila interval perkiraan diubah ke angka yang lebih besar, angka-angka di kolom Fore digeser ke bawah. Kolom Err (1) menunjukkan perbedaan antara pengamatan dan perkiraan. Misalnya, pengamatan pada waktu 1 adalah 6. Nilai perkiraan yang dibuat dari moving average pada waktu 0 adalah 11.1. Kesalahannya adalah -5.1. Standar deviasi dan rata-rata deviasi rata-rata (MAD) dihitung masing-masing sel E6 dan E7. Rata-rata bergerak Rata-rata bergerak Dengan dataset konvensional, nilai rata-rata seringkali merupakan yang pertama, dan salah satu statistik ringkasan yang paling berguna untuk dihitung. Bila data dalam bentuk deret waktu, mean seri adalah ukuran yang berguna, namun tidak mencerminkan sifat dinamis data. Nilai rata-rata yang dihitung selama periode korsleting, baik sebelum periode sekarang atau berpusat pada periode berjalan, seringkali lebih bermanfaat. Karena nilai rata-rata seperti itu akan bervariasi, atau bergerak, karena periode saat ini bergerak dari waktu t 2, t 3. dll, mereka dikenal sebagai moving averages (Mas). Rata-rata pergerakan sederhana adalah (biasanya) nilai rata-rata k yang tidak tertimbang sebelumnya. Rata-rata pergerakan tertimbang secara eksponensial pada dasarnya sama dengan rata-rata pergerakan sederhana, namun dengan kontribusi rata-rata tertimbang menurut jaraknya terhadap waktu saat ini. Karena tidak ada satu, tapi keseluruhan rangkaian rata-rata bergerak untuk rangkaian tertentu, himpunan Mas dapat digambarkan sendiri pada grafik, dianalisis sebagai seri, dan digunakan dalam pemodelan dan peramalan. Berbagai model dapat dibangun menggunakan moving averages, dan ini dikenal dengan model MA. Jika model seperti itu digabungkan dengan model autoregresif (AR), model komposit yang dihasilkan dikenal sebagai model ARMA atau ARIMA (yang saya terintegrasi). Rata-rata bergerak sederhana Karena deret waktu dapat dianggap sebagai himpunan nilai,, 1,2,3,4, n rata-rata nilai-nilai ini dapat dihitung. Jika kita berasumsi bahwa n cukup besar, dan kita memilih bilangan bulat k yang jauh lebih kecil dari n. Kita dapat menghitung satu set rata-rata blok, atau rata-rata bergerak sederhana (urutan k): Setiap ukuran mewakili rata-rata nilai data selama interval observasi k. Perhatikan bahwa MA yang pertama mungkin order k gt0 adalah bahwa untuk t k. Secara umum, kita dapat menurunkan subskrip ekstra dalam ungkapan di atas dan menulis: Ini menyatakan bahwa perkiraan mean pada waktu t adalah rata-rata sederhana dari nilai yang teramati pada waktu t dan langkah waktu k -1 sebelumnya. Jika bobot diterapkan yang mengurangi kontribusi pengamatan yang jauh melampaui waktu, rata-rata bergerak dikatakan merapikan secara eksponensial. Moving averages sering digunakan sebagai bentuk peramalan, dimana nilai estimasi untuk seri pada waktu t 1, S t1. Diambil sebagai MA untuk periode sampai dan termasuk waktu t. misalnya Taksiran hari ini didasarkan pada rata-rata nilai tercatat sebelumnya sampai dengan dan termasuk kemarin (untuk data harian). Simple moving averages dapat dilihat sebagai bentuk smoothing. Pada contoh diilustrasikan di bawah ini, dataset pencemar udara yang ditunjukkan dalam pendahuluan topik ini telah ditambah dengan garis rata-rata bergerak 7-hari (MA), yang ditunjukkan di sini berwarna merah. Seperti yang bisa dilihat, garis MA menghaluskan puncak dan palung data dan bisa sangat membantu dalam mengidentifikasi tren. Rumus perhitungan maju standar berarti bahwa titik data k pertama tidak memiliki nilai MA, namun setelah itu perhitungan berlanjut ke titik data akhir dalam rangkaian. Nilai rata-rata harian PM10, sumber Greenwich: London Air Quality Network, londonair. org. uk Salah satu alasan untuk menghitung rata-rata bergerak sederhana dengan cara yang dijelaskan adalah memungkinkan nilai dihitung untuk semua slot waktu dari waktu hingga saat ini, dan Sebagai pengukuran baru diperoleh untuk waktu t 1, MA untuk waktu t 1 dapat ditambahkan ke himpunan yang sudah dihitung. Ini menyediakan prosedur sederhana untuk dataset dinamis. Namun, ada beberapa masalah dengan pendekatan ini. Adalah wajar untuk mengatakan bahwa nilai rata-rata selama 3 periode terakhir, katakanlah, harus ditempatkan pada waktu t -1, bukan waktu t. Dan untuk MA selama periode genap mungkin sebaiknya ditempatkan di titik tengah antara dua interval waktu. Solusi untuk masalah ini adalah dengan menggunakan perhitungan MA terpusat, di mana MA pada waktu t adalah rata-rata seperangkat nilai simetris di sekitar t. Terlepas dari manfaatnya yang jelas, pendekatan ini umumnya tidak digunakan karena memerlukan data tersedia untuk kejadian di masa depan, yang mungkin tidak demikian. Dalam kasus di mana analisis seluruhnya merupakan rangkaian yang ada, penggunaan Mas terpusat mungkin lebih baik. Rata-rata pergerakan sederhana dapat dianggap sebagai bentuk pemulusan, menghilangkan beberapa komponen frekuensi tinggi dari deret waktu dan menyoroti (namun tidak menghilangkan) tren dengan cara yang mirip dengan pengertian umum penyaringan digital. Memang, moving averages adalah bentuk linear filter. Hal ini dimungkinkan untuk menerapkan perhitungan rata-rata bergerak ke rangkaian yang telah dihaluskan, yaitu merapikan atau menyaring rangkaian yang sudah diperhalus. Misalnya, dengan rata-rata bergerak dari order 2, kita dapat menganggapnya sebagai dihitung dengan menggunakan bobot, jadi MA pada x 2 0,5 x 1 0,5 x 2. Begitu juga MA pada x 3 0,5 x 2 0,5 x 3. Jika kita Oleskan tingkat kedua dari smoothing atau filtering, kita memiliki 0,5 x 2 0,5 x 3 0,5 (0,5 x 1 0,5 x 2) 0,5 (0,5 x 2 0,5 x 3) 0,25 x 1 0,5 x 2 0,25 x 3 yaitu penyaringan 2 tahap Proses (atau konvolusi) telah menghasilkan rata-rata pergerakan simetris tertimbang bervariasi, dengan bobot. Beberapa konvolusi dapat menghasilkan rata-rata pergerakan tertimbang yang cukup rumit, beberapa di antaranya telah ditemukan penggunaan khusus di bidang khusus, seperti dalam perhitungan asuransi jiwa. Moving averages dapat digunakan untuk menghilangkan efek periodik jika dihitung dengan panjang periodisitas seperti yang diketahui. Misalnya, dengan variasi musiman data bulanan seringkali dapat dihapus (jika ini adalah tujuannya) dengan menerapkan rata-rata pergerakan 12 jam simetris dengan semua bulan berbobot rata, kecuali yang pertama dan terakhir yang dibobot pada 12. Hal ini karena akan ada Menjadi 13 bulan dalam model simetris (waktu sekarang, t - 6 bulan). Total dibagi dengan 12. Prosedur serupa dapat diadopsi untuk periodisitas yang didefinisikan dengan baik. Rata-rata pergerakan tertimbang secara eksponensial (EWMA) Dengan rumus rata-rata bergerak sederhana: semua pengamatan sama-sama tertimbang. Jika kita menyebut bobot yang sama ini, alpha t. Masing k bobot sama dengan 1 k. Jadi jumlah bobotnya adalah 1, dan rumusnya adalah: Kita telah melihat bahwa beberapa aplikasi dari proses ini menghasilkan bobot yang bervariasi. Dengan rata-rata pergerakan tertimbang secara eksponensial, kontribusi terhadap nilai rata-rata dari pengamatan yang lebih banyak dihapus pada waktunya akan dikurangi, sehingga menekankan kejadian terkini (lokal). Pada dasarnya parameter penghalusan, 0lt alpha lt1, diperkenalkan, dan rumusan direvisi menjadi: Versi simetris dari rumus ini adalah bentuknya: Jika bobot pada model simetris dipilih sebagai persyaratan istilah ekspansi binomial, (1212) 2q. Mereka akan berjumlah 1, dan q menjadi besar, akan mendekati distribusi Normal. Ini adalah bentuk pembobotan kernel, dengan Binomial berperan sebagai fungsi kernel. Konvolusi dua tahap yang dijelaskan pada subbagian sebelumnya adalah pengaturan ini, dengan q 1, menghasilkan bobot. Dalam eksponensial smoothing perlu menggunakan seperangkat bobot yang berjumlah 1 dan yang mengurangi ukuran secara geometris. Bobot yang digunakan biasanya berbentuk: Untuk menunjukkan bahwa bobot ini berjumlah 1, pertimbangkan perluasan 1 sebagai rangkaian. Kita dapat menulis dan memperluas ekspresi dalam tanda kurung dengan menggunakan rumus binomial (1- x) hal. Dimana x (1-) dan p -1, yang memberikan: Ini kemudian memberikan bentuk rata-rata bergerak tertimbang dalam bentuk: Penjumlahan ini dapat ditulis sebagai relasi rekurensi: yang menyederhanakan perhitungan dengan sangat, dan menghindari masalah bahwa rezim pembobotan Harus benar-benar tak terbatas untuk bobot untuk jumlah ke 1 (untuk nilai-nilai kecil alfa. ini biasanya tidak terjadi). Notasi yang digunakan oleh penulis berbeda bervariasi. Beberapa menggunakan huruf S untuk menunjukkan bahwa rumus dasarnya adalah variabel yang merapikan, dan menulis: sedangkan literatur teori kontrol sering menggunakan Z daripada S untuk nilai tertimbang atau tertimbang secara eksponensial (lihat, misalnya, Lucas dan Saccucci, 1990, LUC1 , Dan situs NIST untuk lebih jelasnya dan contoh kerja). Rumus yang dikutip di atas berasal dari karya Roberts (1959, ROB1), namun Hunter (1986, HUN1) menggunakan ekspresi dari bentuk: yang mungkin lebih sesuai untuk digunakan dalam beberapa prosedur pengendalian. Dengan alpha 1, perkiraan rata-rata hanyalah nilai terukurnya (atau nilai dari item data sebelumnya). Dengan 0,5 perkiraan adalah rata-rata bergerak sederhana dari pengukuran arus dan sebelumnya. Dalam peramalan model nilai, S t. Sering digunakan sebagai perkiraan atau perkiraan nilai untuk periode waktu berikutnya, yaitu sebagai perkiraan untuk x pada waktu t 1. Jadi, kita memiliki: Ini menunjukkan bahwa nilai perkiraan pada waktu t 1 adalah kombinasi dari rata-rata bergerak tertimbang eksponensial sebelumnya Ditambah komponen yang merepresentasikan kesalahan prediksi tertimbang, epsilon. Pada waktu t. Dengan asumsi deret waktu diberikan dan perkiraan diperlukan, nilai untuk alpha diperlukan. Hal ini dapat diperkirakan dari data yang ada dengan mengevaluasi jumlah kesalahan prediksi kuadrat yang diperoleh dengan nilai alpha yang bervariasi untuk masing-masing t 2,3. Menetapkan perkiraan pertama menjadi nilai data pertama yang diamati, x 1. Pada aplikasi kontrol, nilai alpha penting dalam penentuan batas atas dan bawah, dan mempengaruhi rata-rata panjang run (ARL) yang diharapkan. Sebelum batas kontrol ini rusak (dengan asumsi bahwa deret waktu mewakili satu set variabel independen acak yang terdistribusi secara acak dengan varians umum). Dalam keadaan ini varians dari statistik kontrol: adalah (Lucas dan Saccucci, 1990): Batas kontrol biasanya ditetapkan sebagai kelipatan tetap dari varians asimtotik ini, mis. - 3 kali standar deviasi. Jika alpha 0,25, misalnya, dan data yang dipantau diasumsikan memiliki distribusi Normal, N (0,1), bila terkendali, batas kontrol akan menjadi - 1.134 dan prosesnya akan mencapai satu atau batas lainnya dalam 500 langkah. rata-rata. Lucas dan Saccucci (1990 LUC1) menurunkan ARL untuk berbagai nilai alfa dan dengan berbagai asumsi menggunakan prosedur Markov Chain. Mereka menabulasikan hasilnya, termasuk menyediakan ARL bila rata-rata proses kontrol telah digeser oleh kelipatan dari standar deviasi. Misalnya, dengan pergeseran 0,5 dengan alpha 0,25 ARL kurang dari 50 langkah waktu. Pendekatan yang dijelaskan di atas dikenal sebagai smoothing eksponensial tunggal. Karena prosedur diterapkan sekali pada deret waktu dan kemudian dianalisis atau dikendalikan dilakukan pada dataset yang dihaluskan. Jika dataset mencakup tren dan atau komponen musiman, smoothing eksponensial dua atau tiga tahap dapat diterapkan sebagai alat untuk menghapus (secara eksplisit memodelkan) efek ini (lihat lebih lanjut, bagian tentang Peramalan di bawah, dan contoh kerja NIST). CHA1 Chatfield C (1975) Analisis Seri Times: Teori dan Praktik. Chapman and Hall, London HUN1 Hunter J S (1986) Rata-rata pergerakan tertimbang secara eksponensial. J dari Quality Technology, 18, 203-210 LUC1 Lucas J M, Saccucci M S (1990) Skema Kontrol Rata-rata Bergerak Rata-rata Tertimbang: Properti dan Perangkat Tambahan. Technometrics, 32 (1), 1-12 ROB1 Roberts S W (1959) Uji Chart Kontrol Berdasarkan Rata-rata Bergerak Geometrik. Technometrics, 1, 239-250Time Series Analysis and Forecasting Banyak jenis data dikumpulkan dari waktu ke waktu. Harga saham, volume penjualan, tingkat suku bunga, dan pengukuran kualitas adalah contoh tipikal. Karena sifat sekuensial dari data, teknik statistik khusus yang menjelaskan sifat dinamis data diperlukan. Produk StatStandar Technologies menyediakan beberapa prosedur untuk menangani data deret waktu: Statgraphics Web Services Menjalankan Charts The Run Chart procedure plot data yang terdapat dalam kolom numerik tunggal. Diasumsikan bahwa data bersifat berurutan, terdiri dari individu (satu pengukuran yang diambil pada setiap periode waktu) atau subkelompok (kelompok pengukuran pada setiap periode waktu). Pengujian dilakukan pada data untuk menentukan apakah mereka mewakili rangkaian acak, atau apakah ada bukti pencampuran, pengelompokan, osilasi, atau tren. Metode Deskriptif Karakterisasi deret waktu melibatkan estimasi tidak hanya mean dan standar deviasi tetapi juga korelasi antara pengamatan yang terpisah pada waktunya. Alat seperti fungsi autokorelasi penting untuk menampilkan cara di mana masa lalu terus mempengaruhi masa depan. Alat lain, seperti periodogram, berguna bila data mengandung osilasi pada frekuensi tertentu. Ketika deret waktu berisi sejumlah besar kebisingan, sulit untuk memvisualisasikan tren yang mendasarinya. Berbagai smoothers linier dan nonlinier dapat digunakan untuk memisahkan sinyal dari noise. Dekomposisi Musiman Bila data mengandung efek musiman yang kuat, seringkali membantu memisahkan musiman dari komponen lain dalam deret waktu. Hal ini memungkinkan seseorang untuk memperkirakan pola musiman dan menghasilkan data musiman yang disesuaikan. Peramalan (User Specified Model) Tujuan umum analisis deret waktu adalah mengekstrapolasi perilaku masa lalu ke masa depan. Prosedur peramalan STATGRAPHICS meliputi jalan-jalan acak, moving averages, model tren, pemulusan eksponensial sederhana, linier, kuadrat, dan musiman, dan model deret parametrik ARIMA. Pengguna dapat membandingkan berbagai model dengan menahan sampel pada akhir rangkaian waktu untuk tujuan validasi. Peramalan (Pemilihan Model Otomatis) Jika diinginkan, pengguna dapat memilih untuk membiarkan STATGRAPHICS memilih model peramalan untuk mereka dengan membandingkan beberapa model dan secara otomatis memilih model yang memaksimalkan kriteria informasi yang ditentukan. Kriteria yang tersedia didasarkan pada kesalahan perkiraan kuadrat rata-rata, dikenakan sanksi untuk jumlah parameter model yang harus diestimasi dari data. Penggunaan umum prosedur ini dalam Six Sigma adalah memilih model ARIMA untuk mendasari diagram kontrol ARIMA, yang tidak seperti diagram kontrol yang paling tidak menganggap independensi antara pengukuran berturut-turut. Dalam kasus seperti itu, analis dapat memilih untuk hanya mempertimbangkan model formulir ARMA (p, p-1), yang menurut teori dapat menjadi ciri banyak proses dinamis.

No comments:

Post a Comment