Xem mẫu
- MÔ HÌNH ARIMA VỚI PHƯƠNG PHÁP BOX – JENKINS VÀ
ỨNG DỤNG ĐỂ DỰ BÁO LẠM PHÁT CỦA VIỆT NAM
ARIMA MODELS - THE BOX-JENKINS APPROACH AND ITS
APPLICATION TO FORECAST INFLATION IN VIETNAM
TÓM TẮT
Sự tác động của lạm phát có cả tích cực và tiêu cực theo nh ững cách th ức khác nhau tùy
thuộc vào cấu trúc của nền kinh tế, khả năng thích ứng v ới s ự thay đ ổi liên t ục c ủa l ạm phát
và mức độ tiên liệu một cách toàn diện về lạm phát. Vì vậy, dự báo lạm phát không chỉ có ý
nghĩa trong việc cung cấp các thông tin cho những nhà hoạch đ ịnh chính sách mà còn đ ối v ới
cả các nhà kinh doanh trong việc điều chỉnh các chi ến l ược; Và tính ổn đ ịnh kinh t ế vĩ mô có
liên quan đến mức độ tương đồng hay khác bi ệt giữa các d ự báo v ề l ạm phát c ủa các nhà
kinh doanh và của các nhà hoạch định chính sách. Mô hình ARIMA v ới ph ương pháp Box-
Jenkins được ứng dụng để dự báo lạm phát hàng tháng của Việt Nam v ới d ữ li ệu t ừ T ổng
cục Thống kê.
ABSTRACT
Inflation has positive and negative effects on economy in different ways. These effects depend
on the structure of economy, the adaptability and anticipation of inflation. Therefore,
forecasting inflation provides useful information for policy makers as well as businessmen; in
addition, macroeconomic stability is associated with the convergence or the divergence in
inflation, and expectations of businessmen and policy makers. The ARIMA models-The Box-
Jenkins approach are applied to forecast monthly inflation in Vietnam based on the data from
the General Statistics Office of Vietnam (GSO).
1. Giới thiệu
Nhiều nghiên cứu, đặc biệt là các nghiên cứu thực nghi ệm cho th ấy s ự tác đ ộng
của lạm phát có cả tích cực và tiêu cực theo những cách thức khác nhau tùy thu ộc vào c ấu
trúc của nền kinh tế, khả năng thích ứng với sự thay đổi liên tục của lạm phát và m ức đ ộ
tiên liệu một cách toàn diện về lạm phát. Lạm phát cao có xu hướng làm thay đổi các cân
bằng thực của nền kinh tế làm chệch hướng các nguồn lực khi th ực hi ện các giao d ịch;
giảm tín hiệu thông tin về giá tương đối vì vậy dẫn đến tình tr ạng phân b ổ ngu ồn l ực
không hiệu quả. Khi lạm phát tăng làm giá trị của tiền giảm khiến chức năng là đ ơn v ị
hạch toán của tiền thay đổi, điều này làm cho việc hạch toán chi phí-l ợi nhuận c ủa doanh
nghiệp trở nên khó khăn; tác hại của lạm phát không dự kiến được gia tăng sự bất ổn đ ịnh,
dẫn đến tình trạng tái phân phối của cải một cách tùy ti ện (ch ẳng hạn, khi l ạm phát cao
hơn so với dự kiến người đi vay được lợi và người cho vay bị thiệt).
Vì vậy, dự báo lạm phát không chỉ có ý nghĩa trong vi ệc cung c ấp các thông tin đ ối
với những nhà hoạch định chính sách kinh tế vĩ mô mà còn đ ối v ới c ả các nhà kinh doanh
trong việc điều chỉnh các chiến lược kinh doanh.
Có nhiều phương pháp tiếp cận trong phân tích và dự báo lạm phát. M ục đích c ủa
bài viết này nhằm ứng dụng mô hình ARIMA với phương pháp Box-Jenkins đ ể d ự báo
lạm phát ở Việt Nam.
George Box và Gwilym Jenkins (1976) đã nghiên cứu mô hình ARIMA
(Autoregressive Integrated Moving Average - Tự hồi qui tích hợp Trung bình trượt), và
tên của họ thường được dùng để gọi tên các quá trình ARIMA t ổng quát, áp d ụng vào vi ệc
phân tích và dự báo các chuỗi thời gian. Phương pháp Box-Jenkins với bốn bước lặp: nhận
dạng mô hình thử nghiệm; ước lượng; kiểm định bằng chẩn đoán; và dự báo.
- 2. Dự báo lạm phát của Việt Nam
2.1. Nhận dạng mô hình
Trong thực tế, chúng ta phải đối mặt với hai câu hỏi quan tr ọng: (1) B ằng cách nào
chúng ta xác định được một chuỗi thời gian là dừng; (2) Nếu chúng ta xác đ ịnh đ ược m ột
chuỗi thời gian không dừng, thì có cách nào để có thể làm cho chúng trở nên dừng.
Mặc dù có nhiều cách để kiểm tra tính dừng, nhưng có hai cách đ ược sử d ụng ph ổ
biến nhất là đồ thị (phân tích đồ thị và kiểm định bằng đồ thị tương quan (correlogram) và
kiểm định nghiệm đơn vị (unit root test)1 (Gujarati, 2003).
Toán tử dịch chuyển lùi và sai phân (Back-shift Operator and Differences)
Điều trước tiên cần phải lưu ý là hầu hết các chuỗi thời gian đ ều không d ừng, và
các thành phần AR và MA của mô hình ARIMA chỉ liên quan đến các chuỗi thời gian dừng.
Cho nên, cần phải có một ký hiệu phân biệt những chuỗi thời gian không d ừng g ốc v ới
những chuỗi tương ứng có tính dừng của nó sau khi biến đổi sai phân.
Một ký hiệu rất hữu ích là toán tử dịch chuyển lùi (trễ), L, được dùng như sau:
LYt=Yt – 1; nói cách khác, L, thực hiện trên Yt, có tác dụng dịch chuyển dữ liệu trở
lại một thời đoạn.
Áp dụng L trên Yt hai lần sẽ dịch chuyển dữ liệu trở lại 2 thời đo ạn:
L(LYt)=L2Yt=Yt - 2
Đối với dữ liệu tháng, nếu dịch chuyển đến “cùng tháng trong năm tr ước”, thì dùng
L12, và ký hiệu là L12Yt = Yt-12.
Toán tử dịch chuyển lùi thuận tiện trong việc mô tả quá trình tính sai phân.
Sai phân bậc nhất: ∆ Yt = Yt - Yt - 1
Sử dụng toán tử dịch chuyển lùi, có thể viết lại như sau.
∆ Yt = Yt - LYt = (1 - L)Yt
Lưu ý rằng sai phân bậc nhất được biểu diễn bởi (1 - L). Tương tự, nếu tính sai
phân bậc hai (nghĩa là, sai phân bậc nhất của sai phân bậc nhất), thì:
Sai phân bậc hai
∆2Yt = ∆Yt − ∆Yt −1 = (1 − 2 L + L2 )Yt = (1 − L) 2 Yt
Lưu ý sai phân bậc hai được ký hiệu là (1 - L)2. (Điều quan trọng là phải nhận thấy
được sai phân bậc hai không phải là sai phân thứ hai, được ký hiệu là 1 - L2. Tương tự, sai
phân thứ mười hai sẽ là 1 - L12, nhưng sai phân bậc mười hai sẽ là (1 - L)12)
Mục đích của việc lấy sai phân là để đạt được trạng thái dừng, và tổng quát n ếu
lấy sai phân bậc thứ d sẽ đạt được dừng,
∆ dYt = (1 - L)dYt là chuỗi dừng,
Phương pháp Box-Jenkins d ựa vào:
1. Phân tích đồ thị
Vẽ đồ thị dữ liệu chuỗi thời gian, thông qua hình dạng của đồ thị thực nghiệm cung
cấp những gợi ý ban đầu về bản chất của chuỗi thời gian. Đ ồ th ị cung c ấp hình ảnh
trực quan cho phép chúng ta có thể đánh giá một chuỗi thời gian có dừng hay không.
2. Kiểm định bằng đồ thị tương quan thông qua hàm tự tương quan và hàm t ự t ương
quan từng phần.
Hàm t ự t ươ ng quan m ẫu (Sample Autocorrelation Function-SACF)
Hàm tự tươ ng quan tại đ ộ tr ễ k (hay b ậc tr ễ k) ký hi ệu rk là:
1
Kiểm định được sử dụng phổ biến là kiểm định Dickey-Fuller tăng cường (Augmented Dickey-Fuller-ADF).
- n−k
∑ (z − z )( z t + k − z ) n
∑z
t
t =b t
rk = (2.1) Trong đó
n t =b
z=
∑ (z − z) 2 n − b +1
t
t =b
Bên c ạnh h ệ số t ươ ng quan rk, sai s ố chu ẩn của rk gọi là srk và tr ị th ống kê t rk
sẽ đượ c sử dụng đ ể giúp chúng ta nh ận d ạng th ử nghi ệm m ột mô hình Box-Jenkins.
Sai số chu ẩn c ủa rk là
k −1
∑r 2 1/ 2
(1 + 2 j) rk
(2.2) ; Tr ị th ống kê t rk là t rk = (2.3)
j =1
s rk
s rk = 1/ 2
(n − b + 1)
Hàm tự tươ ng quan c ủa m ẫu (SACF) là m ột hàm hay đ ồ th ị c ủa đ ộ t ự t ương
quan c ủa mẫu ở đ ộ tr ễ k = 1, 2, . . .
SACF có thể được dùng để giúp chúng ta tìm ra một chuỗi thời gian dừng zb, zb+1,
…,zn. Việc này có thể được thực hiện vì chúng ta có thể liên kết động thái c ủa SACF v ới
sự dừng của chuỗi thời gian. Tổng quát, với một chuỗi số liệu không có tính mùa có th ể
chỉ ra rằng:
1. Nếu SACF của chuỗi thời gian zb, zb+1,…, zn hoặc giảm thật nhanh hoặc giảm
dần khá nhanh thì giá trị của chuỗi thời gian được xem là dừng.
2. Nếu SACF của chuỗi thời gian zb, zb+1 ,…, zn giảm dần thật chậm thì chuỗi thời
gian được xem là không dừng.
Ý nghĩa chính xác của từ “khá nhanh” và “thật chậm” có phần tùy ý và t ốt nh ất
được xác định bằng kinh nghiệm. Hơn thế nữa, kinh nghi ệm chỉ ra r ằng v ới d ữ li ệu không
với tính mùa, việc SACF giảm khá nhanh, nếu có, thường xảy ra sau m ột đ ộ tr ễ k bé hơn
hay bằng 2.
Hàm t ự tươ ng quan t ừng ph ần c ủa m ẫu (Sample Partial Autocorrelation Function-
SPACF)
Chúng ta sẽ định nghĩa hàm tự tương quan từng phần của mẫu (SPACF).
1. Giá trị tương quan từng phần của mẫu tại độ trễ k là:
k =1
r1 khi
k −1
rk − ∑ rk −1, j .rk − j (2.4)
rkk = j =1
khi k = 2,3,
k −1
1 − j∑1rk −1, j .rk − j
=
Ở đây: rkj = rk-1,j - rkk .rk-1,k-j với j=1, 2, …, k-1
2. Sai số chuẩn của rkk là
srkk =1/(n-b+1)1/2 (2.5)
3. Trị thống kê trkk là
là trkk = rkk / srkk (2.6)
4. Hàm tự tương quan từng phần của mẫu (SPACF) là một danh sách hay đồ thị c ủa
các trị số tự tương quan từng phần của mẫu ở các độ trễ k=1,2,…
Đại lượng này mô tả một cách trực giác các trị tự tương quan của m ẫu đối với các
giá trị quan sát chuỗi thời gian ngăn cách bằng một độ trễ k lần đơn vị thời gian.
- Một lần nữa, để áp dụng phương pháp luận Box-Jenkins, chúng ta ph ải th ử và c ố
gắng phân loại động thái của SPACF. Đầu tiên, SPACF của m ột chu ỗi th ời gian không có
tính mùa có thể giảm thật nhanh. Điều này có ý nghĩa gì, ta nói rằng một đỉnh nhọn ở độ
trễ k tồn tại trong SPACF nếu rkk, trị tự tương quan từng phần của mẫu ở độ trễ k, là lớn
theo nghĩa thống kê. Kết luận rằng rkk là lớn theo nghĩa thống kê một cách cơ bản tương
đương với việc loại bỏ giả thuyết không cho rằng trị tự tương quan từng phần lý thuyết ở
độ trễ k, ký hiệu là ρ kk , bằng không. (H0 : ρ kk = 0). Ta có thể đánh giá một đỉnh nhọn ở độ
trễ k tồn tại trong SPACF hay không bằng cách xem trị thống kê t tương ứng với rkk. Ở đây
rkk
ta xem một đỉnh nhọn ở độ trễ k tồn tại trong SPACF nếu trị tuyệt đối của t k = là lớn
s rkk
hơn 2. Hơn thế nữa, chúng ta nói rằng SPACF giảm thật nhanh sau độ trễ k nếu không có
đỉnh nhọn nào ở các độ trễ lớn hơn k trong SPACF . Với dữ liệu không có tính mùa, kinh
nghiệm chỉ ra rằng nếu SPACF tắt, một cách tổng quát nó sẽ gi ảm thật nhanh sau m ột đ ộ
trễ bé hơn hay bằng 2. Thứ hai, chúng ta nói rằng SPACF giảm d ần n ếu hàm này không
giảm thật nhanh nhưng giảm đi theo một “dạng ổn định”. SPACF có thể giảm dần theo (1)
một dạng hàm mũ tắt dần (không dao động hoặc có dao đ ộng), (2) m ột d ạng sóng hình sin
tắt dần hoặc (3) một dạng bị trội bởi một trong hai dạng trên ho ặc m ột tổ h ợp c ủa chúng.
Hơn nữa, SPACF có thể giảm dần khá nhanh hoặc giảm dần thật chậm.
Quá trình nhận dạng của một mô hình ARIMA không có tính mùa hay có tính mùa
phụ thuộc vào những công cụ thống kê - đó là, hệ số tự tương quan, h ệ số riêng ph ần, và
đồ thị tương quan; và hiểu biết về quá trình đang nghiên cứu cũng như đòi h ỏi kinh
nghiệm và phán đoán tốt (Newbold and Bos, 1994).
Mô hình ARIMA mở rộng bao gồm các yếu tố thời vụ được ký hiệu tổng quát là:
ARIMA (p, d, q) (P, D, Q)S
Phần mô hình Phần mô hình S = số đoạn
mỗi mùa
không có tính mùa có tính mùa
Dữ liệu được sử dụng là Chỉ số giá tiêu dùng (CPI) hàng tháng theo ph ương pháp
liên hoàn từ tháng 1 năm 1996 đến tháng 12 năm 2006 của Tổng Cục Thống kê công bố.
Tỷ lệ lạm phát hàng tháng sẽ được xác định2:
CPI t − CPI t −1
πt = × 100 (2.7)
CPI t −1
π t : tỷ lệ lạm phát thời điểm t (biểu thị bằng %)
Trong đó:
CPI t : Chỉ số giá tiêu dùng thời điểm t
CPI t −1 : Chỉ số giá tiêu dùng thời điểm t-1
Hình 2.1. Tỷ lệ lạm phát hàng tháng (%)
2
Có nhiều cách để xác định tỷ lệ lạm phát dựa vào các phương pháp tính chỉ số giá khác nhau như Chỉ số giá
sản xuất (PPI), Chỉ số điều chỉnh GDP (GDP deflator), Chỉ số giá “dây chuyền” (chained price index; hoặc tỷ
lệ lạm phát cơ bản (core inflation)-loại trừ những loại hàng hoá và dịch vụ mà giá cả của chúng biến động
theo thời vụ hoặc thất thường.
- 3
2.5
2
1.5
1
0.5
0
0 12 24 36 48 60 72 84 96 108 120 132
-0.5
-1
-1.5
Hình 2.2. Đồ thị tương quan của dữ liệu sau khi biến đổi sai phân
Dựa vào hình dạng của đồ thị thực nghiệm của dữ li ệu gốc (Hình 2.1) và đ ồ th ị t ương
quan của dữ liệu sau khi biến đổi sai phân (Hình 2.2).
Các mô hình được nhận dạng như sau:
Mô hình ARIMA(0,1,1)(0,1,1)12 (Mô hình 1)
hoặc
(1 - θ1L)(1 - Θ1L12)ut
(1 - L)(1 - L12)Yt =
- Sai phân bậc nhất Sai phân bậc nhất MA(1) không MA(1) có
không có tính mùa có tính mùa có tính mùa tính mùa
Mô hình ARIMA (1,1,0)(1,1,0)12 (Mô hình 2)
hoặc (1 − φ1 L)(1 − Φ 1 L )(1 − L)(1 − L )Yt = u t
12 12
AR(1) không Sai phân không
có tính mùa có tính mùa
AR(1) có Sai phân có
tính mùa tính mùa
Mô hình ARIMA (1,1,1)(1,1,1)12 (Mô hình 3)
(1 − φ1 L)(1 − Φ 1 L12 )(1 − L)(1 − L12 )Yt = (1 − θ1 L)(1 − Θ1 L12 )u t
AR(1) không Sai phân không MA(1) không
có tính mùa có tính mùa có tính mùa
AR(1) có Sai phân có MA(1) có
tính mùa tính mùa tính mùa
2.2. Ước lượng các tham số
Cơ bản có hai cách để ước lượng những tham số φ, Φ , θ , Θ :
1. Thử và sai – Xem xét nhiều giá trị khác nhau và chọn giá tr ị (hay t ập giá tr ị, n ếu
ước lượng nhiều hơn một tham số) sao cho tổng của những bình phương phần dư đạt giá
trị nhỏ nhất.
2. Cải thiện lặp - chọn một ước lượng ban đầu và chạy bằng m ột ch ương trình
máy tính tinh chỉnh ước lượng lặp đi lặp lại3.
Bảng 2.1. Kết quả các tham số của các mô hình được ước lượng4
Mô hình 1 Mô hình 2 Mô hình 3
DS12.inf Coef. z DS12.inf Coef. z DS12.inf Coef. z
inf inf inf
_cons 0.001 0.15 _cons -0.002 -0.05 _cons 0.001 0.36
ARMA ARMA ARMA
Ma ar ar
L1. -0.616 -10.36 L1. -0.166 -1.63 L1. 0.448 4.4
ARMA12 ARMA12 ma
Ma ar L1. -0.909 -11.11
L1. -1.000 . L1. -0.458 -6.53 ARMA12
ar
3
Phương pháp Cải thiện lặp được ứng dụng rộng rãi hơn vì giải thuật mạnh.(giải thuật Marquardt)
4
Sử dụng phần mềm Stata
- L1. -0.088 -0.86
ma
L1. -1.000 .
2.3. Kiểm định mô hình
Sau khi ước lượng các tham số của một mô hình ARIMA được nhận dạng th ử,
chúng ta cần phải kiểm định để kiểm nghiệm rằng mô hình là thích hợp. Có hai cách th ức
cơ bản để thực hiện điều này:
1. Xem xét những phần dư - để xem nó theo dạng nào chưa được biết không.
2. Xem xét những thống kê lấy mẫu của giải pháp tối ưu hiện tại (sai số chu ẩn, ma
trận tương quan...)-kiểm tra xem có thể đơn giản hoá mô hình không.
Bảng 2.2. Kết quả các thông số kiểm định
Chi-Square ll(model)
Model Obs df AIC BIC
109.42
Mô hình 1 119 -85.63 4 169.26 180.38
45.94
Mô hình 2 119 -109.78 4 227.55 238.67
115.46
Mô hình 3 119 -79.28 5 168.57 182.46
Dựa vào Bảng 2.1 và Bảng 2.2 với các tiêu chuẩn kiểm định đ ược lựa ch ọn là z,
Chi-Square ( χ 2 ), AIC (Akaike Information Criterion) và BIC (Bayesian Information
Criterion), mô hình phù hợp nhất và được lựa chọn là Mô hình 1.
2.4. Dự báo bằng mô hình ARIMA
Mô hình ARIMA (0,1,1)(0,1,1)12
(1 − L)(1 − L12 )Yt = (1 − θ1 L)(1 − Θ1 L12 )u t (2.8)
Tuy nhiên, để sử dụng một mô hình được nhận dạng cho dự báo, cần phải mở rộng
mô hình (2.8) trở thành:
Yt = Yt - 1 + Yt - 12 - Yt - 13 + ut - θ1ut -1 - Θ1ut -12 + θ1Θ1ut -13 (2.9)
Khi sử dụng phương trình này để dự báo một thời đoạn ti ếp theo - nghĩa là, Yt+1 -
chúng ta tăng những chỉ số lên một, từ đầu đến cuối, như trong phương trình (2.9).
Yt+1 = Yt +Yt - 11 - Yt - 12 + ut+1 - θ1ut - Θ1ut -11 + θ1Θ1ut -12 (2.10)
Số hạng ut+1 sẽ không biết được vì giá trị kỳ vọng c ủa những sai số ngẫu nhiên
tương lai bằng 0, nhưng từ mô hình đã thích hợp, chúng ta có thể thay thế những giá tr ị ut,
ut-11, và ut-12 bằng những giá trị được xác định bằng thực nghiệm của chúng - nghĩa là, nh ư
những giá trị thu được sau lần lặp sau cùng của gi ải thuật Marquardt. Dĩ nhiên, vì chúng ta
dự báo xa hơn nữa trong tương lai, chúng ta sẽ không có nh ững giá tr ị th ực nghi ệm cho
những số hạng “u” sau một khoảng nào đó, và vì v ậy t ất c ả nh ững giá tr ị kỳ v ọng c ủa
chúng sẽ có giá trị là không.
Đối với những giá trị Y ban đầu của quá trình dự báo, chúng ta sẽ biết những giá tr ị
Yt, Yt-11, và Yt-12. Tuy nhiên, sau một lúc, những giá trị Y trong phương trình (2.10) sẽ là
những giá trị được dự báo chứ không phải là những giá trị quá khứ. Vì vậy các giá tr ị th ực
tế cần phải được cập nhật liên tục để cải thiện độ tin cậy của các giá trị dự báo.
Bảng 2.3. Kết quả dự báo lạm phát hàng tháng từ tháng 1 đến tháng 12 năm 2007
Tháng Tháng Tháng Tháng Tháng Tháng Tháng Tháng Tháng Tháng Tháng Tháng
1 2 3 4 5 6 7 8 9 10 11 12
- 0.79 1.46 -1.06 -0.10 0.60 0.44 0.20 0.31 0.34 0.48 0.89 0.76
TÀI LIỆU THAM KHẢO
Tổng cục Thống kê,
[1]
Chỉ số giá tiêu dùng các tháng trong năm, 2007.
[2] Box, G.E.P., and
G.M. Jenkins, Time Series Analysis: Forecasting and Control , Revised Edition,
Holden Day, San Francisco, 1976.
[3] Gujarati, D., Basic
th
Econometrics, 4 ed., McGraw Hill, New York, 2003.
[4] Newbold, P. and
Bos, T., Introductory business and economic forecasting (2nd edition), International
Thomson Publishing, 1994.
nguon tai.lieu . vn