Xem mẫu

  1. MÔ HÌNH ARIMA VỚI PHƯƠNG PHÁP BOX – JENKINS VÀ ỨNG DỤNG ĐỂ DỰ BÁO LẠM PHÁT CỦA VIỆT NAM ARIMA MODELS - THE BOX-JENKINS APPROACH AND ITS APPLICATION TO FORECAST INFLATION IN VIETNAM TÓM TẮT Sự tác động của lạm phát có cả tích cực và tiêu cực theo nh ững cách th ức khác nhau tùy thuộc vào cấu trúc của nền kinh tế, khả năng thích ứng v ới s ự thay đ ổi liên t ục c ủa l ạm phát và mức độ tiên liệu một cách toàn diện về lạm phát. Vì vậy, dự báo lạm phát không chỉ có ý nghĩa trong việc cung cấp các thông tin cho những nhà hoạch đ ịnh chính sách mà còn đ ối v ới cả các nhà kinh doanh trong việc điều chỉnh các chi ến l ược; Và tính ổn đ ịnh kinh t ế vĩ mô có liên quan đến mức độ tương đồng hay khác bi ệt giữa các d ự báo v ề l ạm phát c ủa các nhà kinh doanh và của các nhà hoạch định chính sách. Mô hình ARIMA v ới ph ương pháp Box- Jenkins được ứng dụng để dự báo lạm phát hàng tháng của Việt Nam v ới d ữ li ệu t ừ T ổng cục Thống kê. ABSTRACT Inflation has positive and negative effects on economy in different ways. These effects depend on the structure of economy, the adaptability and anticipation of inflation. Therefore, forecasting inflation provides useful information for policy makers as well as businessmen; in addition, macroeconomic stability is associated with the convergence or the divergence in inflation, and expectations of businessmen and policy makers. The ARIMA models-The Box- Jenkins approach are applied to forecast monthly inflation in Vietnam based on the data from the General Statistics Office of Vietnam (GSO). 1. Giới thiệu Nhiều nghiên cứu, đặc biệt là các nghiên cứu thực nghi ệm cho th ấy s ự tác đ ộng của lạm phát có cả tích cực và tiêu cực theo những cách thức khác nhau tùy thu ộc vào c ấu trúc của nền kinh tế, khả năng thích ứng với sự thay đổi liên tục của lạm phát và m ức đ ộ tiên liệu một cách toàn diện về lạm phát. Lạm phát cao có xu hướng làm thay đổi các cân bằng thực của nền kinh tế làm chệch hướng các nguồn lực khi th ực hi ện các giao d ịch; giảm tín hiệu thông tin về giá tương đối vì vậy dẫn đến tình tr ạng phân b ổ ngu ồn l ực không hiệu quả. Khi lạm phát tăng làm giá trị của tiền giảm khiến chức năng là đ ơn v ị hạch toán của tiền thay đổi, điều này làm cho việc hạch toán chi phí-l ợi nhuận c ủa doanh nghiệp trở nên khó khăn; tác hại của lạm phát không dự kiến được gia tăng sự bất ổn đ ịnh, dẫn đến tình trạng tái phân phối của cải một cách tùy ti ện (ch ẳng hạn, khi l ạm phát cao hơn so với dự kiến người đi vay được lợi và người cho vay bị thiệt). Vì vậy, dự báo lạm phát không chỉ có ý nghĩa trong vi ệc cung c ấp các thông tin đ ối với những nhà hoạch định chính sách kinh tế vĩ mô mà còn đ ối v ới c ả các nhà kinh doanh trong việc điều chỉnh các chiến lược kinh doanh. Có nhiều phương pháp tiếp cận trong phân tích và dự báo lạm phát. M ục đích c ủa bài viết này nhằm ứng dụng mô hình ARIMA với phương pháp Box-Jenkins đ ể d ự báo lạm phát ở Việt Nam. George Box và Gwilym Jenkins (1976) đã nghiên cứu mô hình ARIMA (Autoregressive Integrated Moving Average - Tự hồi qui tích hợp Trung bình trượt), và tên của họ thường được dùng để gọi tên các quá trình ARIMA t ổng quát, áp d ụng vào vi ệc phân tích và dự báo các chuỗi thời gian. Phương pháp Box-Jenkins với bốn bước lặp: nhận dạng mô hình thử nghiệm; ước lượng; kiểm định bằng chẩn đoán; và dự báo.
  2. 2. Dự báo lạm phát của Việt Nam 2.1. Nhận dạng mô hình Trong thực tế, chúng ta phải đối mặt với hai câu hỏi quan tr ọng: (1) B ằng cách nào chúng ta xác định được một chuỗi thời gian là dừng; (2) Nếu chúng ta xác đ ịnh đ ược m ột chuỗi thời gian không dừng, thì có cách nào để có thể làm cho chúng trở nên dừng. Mặc dù có nhiều cách để kiểm tra tính dừng, nhưng có hai cách đ ược sử d ụng ph ổ biến nhất là đồ thị (phân tích đồ thị và kiểm định bằng đồ thị tương quan (correlogram) và kiểm định nghiệm đơn vị (unit root test)1 (Gujarati, 2003). Toán tử dịch chuyển lùi và sai phân (Back-shift Operator and Differences) Điều trước tiên cần phải lưu ý là hầu hết các chuỗi thời gian đ ều không d ừng, và các thành phần AR và MA của mô hình ARIMA chỉ liên quan đến các chuỗi thời gian dừng. Cho nên, cần phải có một ký hiệu phân biệt những chuỗi thời gian không d ừng g ốc v ới những chuỗi tương ứng có tính dừng của nó sau khi biến đổi sai phân. Một ký hiệu rất hữu ích là toán tử dịch chuyển lùi (trễ), L, được dùng như sau: LYt=Yt – 1; nói cách khác, L, thực hiện trên Yt, có tác dụng dịch chuyển dữ liệu trở lại một thời đoạn. Áp dụng L trên Yt hai lần sẽ dịch chuyển dữ liệu trở lại 2 thời đo ạn: L(LYt)=L2Yt=Yt - 2 Đối với dữ liệu tháng, nếu dịch chuyển đến “cùng tháng trong năm tr ước”, thì dùng L12, và ký hiệu là L12Yt = Yt-12. Toán tử dịch chuyển lùi thuận tiện trong việc mô tả quá trình tính sai phân. Sai phân bậc nhất: ∆ Yt = Yt - Yt - 1 Sử dụng toán tử dịch chuyển lùi, có thể viết lại như sau. ∆ Yt = Yt - LYt = (1 - L)Yt Lưu ý rằng sai phân bậc nhất được biểu diễn bởi (1 - L). Tương tự, nếu tính sai phân bậc hai (nghĩa là, sai phân bậc nhất của sai phân bậc nhất), thì: Sai phân bậc hai ∆2Yt = ∆Yt − ∆Yt −1 = (1 − 2 L + L2 )Yt = (1 − L) 2 Yt Lưu ý sai phân bậc hai được ký hiệu là (1 - L)2. (Điều quan trọng là phải nhận thấy được sai phân bậc hai không phải là sai phân thứ hai, được ký hiệu là 1 - L2. Tương tự, sai phân thứ mười hai sẽ là 1 - L12, nhưng sai phân bậc mười hai sẽ là (1 - L)12) Mục đích của việc lấy sai phân là để đạt được trạng thái dừng, và tổng quát n ếu lấy sai phân bậc thứ d sẽ đạt được dừng, ∆ dYt = (1 - L)dYt là chuỗi dừng, Phương pháp Box-Jenkins d ựa vào: 1. Phân tích đồ thị Vẽ đồ thị dữ liệu chuỗi thời gian, thông qua hình dạng của đồ thị thực nghiệm cung cấp những gợi ý ban đầu về bản chất của chuỗi thời gian. Đ ồ th ị cung c ấp hình ảnh trực quan cho phép chúng ta có thể đánh giá một chuỗi thời gian có dừng hay không. 2. Kiểm định bằng đồ thị tương quan thông qua hàm tự tương quan và hàm t ự t ương quan từng phần. Hàm t ự t ươ ng quan m ẫu (Sample Autocorrelation Function-SACF) Hàm tự tươ ng quan tại đ ộ tr ễ k (hay b ậc tr ễ k) ký hi ệu rk là: 1 Kiểm định được sử dụng phổ biến là kiểm định Dickey-Fuller tăng cường (Augmented Dickey-Fuller-ADF).
  3. n−k ∑ (z − z )( z t + k − z ) n ∑z t t =b t rk = (2.1) Trong đó n t =b z= ∑ (z − z) 2 n − b +1 t t =b Bên c ạnh h ệ số t ươ ng quan rk, sai s ố chu ẩn của rk gọi là srk và tr ị th ống kê t rk sẽ đượ c sử dụng đ ể giúp chúng ta nh ận d ạng th ử nghi ệm m ột mô hình Box-Jenkins. Sai số chu ẩn c ủa rk là k −1 ∑r 2 1/ 2 (1 + 2 j) rk (2.2) ; Tr ị th ống kê t rk là t rk = (2.3) j =1 s rk s rk = 1/ 2 (n − b + 1) Hàm tự tươ ng quan c ủa m ẫu (SACF) là m ột hàm hay đ ồ th ị c ủa đ ộ t ự t ương quan c ủa mẫu ở đ ộ tr ễ k = 1, 2, . . . SACF có thể được dùng để giúp chúng ta tìm ra một chuỗi thời gian dừng zb, zb+1, …,zn. Việc này có thể được thực hiện vì chúng ta có thể liên kết động thái c ủa SACF v ới sự dừng của chuỗi thời gian. Tổng quát, với một chuỗi số liệu không có tính mùa có th ể chỉ ra rằng: 1. Nếu SACF của chuỗi thời gian zb, zb+1,…, zn hoặc giảm thật nhanh hoặc giảm dần khá nhanh thì giá trị của chuỗi thời gian được xem là dừng. 2. Nếu SACF của chuỗi thời gian zb, zb+1 ,…, zn giảm dần thật chậm thì chuỗi thời gian được xem là không dừng. Ý nghĩa chính xác của từ “khá nhanh” và “thật chậm” có phần tùy ý và t ốt nh ất được xác định bằng kinh nghiệm. Hơn thế nữa, kinh nghi ệm chỉ ra r ằng v ới d ữ li ệu không với tính mùa, việc SACF giảm khá nhanh, nếu có, thường xảy ra sau m ột đ ộ tr ễ k bé hơn hay bằng 2. Hàm t ự tươ ng quan t ừng ph ần c ủa m ẫu (Sample Partial Autocorrelation Function- SPACF) Chúng ta sẽ định nghĩa hàm tự tương quan từng phần của mẫu (SPACF). 1. Giá trị tương quan từng phần của mẫu tại độ trễ k là: k =1  r1 khi  k −1  rk − ∑ rk −1, j .rk − j (2.4) rkk =  j =1 khi k = 2,3,   k −1  1 − j∑1rk −1, j .rk − j  = Ở đây: rkj = rk-1,j - rkk .rk-1,k-j với j=1, 2, …, k-1 2. Sai số chuẩn của rkk là srkk =1/(n-b+1)1/2 (2.5) 3. Trị thống kê trkk là là trkk = rkk / srkk (2.6) 4. Hàm tự tương quan từng phần của mẫu (SPACF) là một danh sách hay đồ thị c ủa các trị số tự tương quan từng phần của mẫu ở các độ trễ k=1,2,… Đại lượng này mô tả một cách trực giác các trị tự tương quan của m ẫu đối với các giá trị quan sát chuỗi thời gian ngăn cách bằng một độ trễ k lần đơn vị thời gian.
  4. Một lần nữa, để áp dụng phương pháp luận Box-Jenkins, chúng ta ph ải th ử và c ố gắng phân loại động thái của SPACF. Đầu tiên, SPACF của m ột chu ỗi th ời gian không có tính mùa có thể giảm thật nhanh. Điều này có ý nghĩa gì, ta nói rằng một đỉnh nhọn ở độ trễ k tồn tại trong SPACF nếu rkk, trị tự tương quan từng phần của mẫu ở độ trễ k, là lớn theo nghĩa thống kê. Kết luận rằng rkk là lớn theo nghĩa thống kê một cách cơ bản tương đương với việc loại bỏ giả thuyết không cho rằng trị tự tương quan từng phần lý thuyết ở độ trễ k, ký hiệu là ρ kk , bằng không. (H0 : ρ kk = 0). Ta có thể đánh giá một đỉnh nhọn ở độ trễ k tồn tại trong SPACF hay không bằng cách xem trị thống kê t tương ứng với rkk. Ở đây rkk ta xem một đỉnh nhọn ở độ trễ k tồn tại trong SPACF nếu trị tuyệt đối của t k = là lớn s rkk hơn 2. Hơn thế nữa, chúng ta nói rằng SPACF giảm thật nhanh sau độ trễ k nếu không có đỉnh nhọn nào ở các độ trễ lớn hơn k trong SPACF . Với dữ liệu không có tính mùa, kinh nghiệm chỉ ra rằng nếu SPACF tắt, một cách tổng quát nó sẽ gi ảm thật nhanh sau m ột đ ộ trễ bé hơn hay bằng 2. Thứ hai, chúng ta nói rằng SPACF giảm d ần n ếu hàm này không giảm thật nhanh nhưng giảm đi theo một “dạng ổn định”. SPACF có thể giảm dần theo (1) một dạng hàm mũ tắt dần (không dao động hoặc có dao đ ộng), (2) m ột d ạng sóng hình sin tắt dần hoặc (3) một dạng bị trội bởi một trong hai dạng trên ho ặc m ột tổ h ợp c ủa chúng. Hơn nữa, SPACF có thể giảm dần khá nhanh hoặc giảm dần thật chậm. Quá trình nhận dạng của một mô hình ARIMA không có tính mùa hay có tính mùa phụ thuộc vào những công cụ thống kê - đó là, hệ số tự tương quan, h ệ số riêng ph ần, và đồ thị tương quan; và hiểu biết về quá trình đang nghiên cứu cũng như đòi h ỏi kinh nghiệm và phán đoán tốt (Newbold and Bos, 1994). Mô hình ARIMA mở rộng bao gồm các yếu tố thời vụ được ký hiệu tổng quát là: ARIMA (p, d, q) (P, D, Q)S Phần mô hình Phần mô hình S = số đoạn mỗi mùa không có tính mùa có tính mùa Dữ liệu được sử dụng là Chỉ số giá tiêu dùng (CPI) hàng tháng theo ph ương pháp liên hoàn từ tháng 1 năm 1996 đến tháng 12 năm 2006 của Tổng Cục Thống kê công bố. Tỷ lệ lạm phát hàng tháng sẽ được xác định2: CPI t − CPI t −1 πt = × 100 (2.7) CPI t −1 π t : tỷ lệ lạm phát thời điểm t (biểu thị bằng %) Trong đó: CPI t : Chỉ số giá tiêu dùng thời điểm t CPI t −1 : Chỉ số giá tiêu dùng thời điểm t-1 Hình 2.1. Tỷ lệ lạm phát hàng tháng (%) 2 Có nhiều cách để xác định tỷ lệ lạm phát dựa vào các phương pháp tính chỉ số giá khác nhau như Chỉ số giá sản xuất (PPI), Chỉ số điều chỉnh GDP (GDP deflator), Chỉ số giá “dây chuyền” (chained price index; hoặc tỷ lệ lạm phát cơ bản (core inflation)-loại trừ những loại hàng hoá và dịch vụ mà giá cả của chúng biến động theo thời vụ hoặc thất thường.
  5. 3 2.5 2 1.5 1 0.5 0 0 12 24 36 48 60 72 84 96 108 120 132 -0.5 -1 -1.5 Hình 2.2. Đồ thị tương quan của dữ liệu sau khi biến đổi sai phân Dựa vào hình dạng của đồ thị thực nghiệm của dữ li ệu gốc (Hình 2.1) và đ ồ th ị t ương quan của dữ liệu sau khi biến đổi sai phân (Hình 2.2). Các mô hình được nhận dạng như sau:  Mô hình ARIMA(0,1,1)(0,1,1)12 (Mô hình 1) hoặc (1 - θ1L)(1 - Θ1L12)ut (1 - L)(1 - L12)Yt =
  6. Sai phân bậc nhất Sai phân bậc nhất MA(1) không MA(1) có không có tính mùa có tính mùa có tính mùa tính mùa  Mô hình ARIMA (1,1,0)(1,1,0)12 (Mô hình 2) hoặc (1 − φ1 L)(1 − Φ 1 L )(1 − L)(1 − L )Yt = u t 12 12 AR(1) không Sai phân không có tính mùa có tính mùa AR(1) có Sai phân có tính mùa tính mùa  Mô hình ARIMA (1,1,1)(1,1,1)12 (Mô hình 3) (1 − φ1 L)(1 − Φ 1 L12 )(1 − L)(1 − L12 )Yt = (1 − θ1 L)(1 − Θ1 L12 )u t AR(1) không Sai phân không MA(1) không có tính mùa có tính mùa có tính mùa AR(1) có Sai phân có MA(1) có tính mùa tính mùa tính mùa 2.2. Ước lượng các tham số Cơ bản có hai cách để ước lượng những tham số φ, Φ , θ , Θ : 1. Thử và sai – Xem xét nhiều giá trị khác nhau và chọn giá tr ị (hay t ập giá tr ị, n ếu ước lượng nhiều hơn một tham số) sao cho tổng của những bình phương phần dư đạt giá trị nhỏ nhất. 2. Cải thiện lặp - chọn một ước lượng ban đầu và chạy bằng m ột ch ương trình máy tính tinh chỉnh ước lượng lặp đi lặp lại3. Bảng 2.1. Kết quả các tham số của các mô hình được ước lượng4 Mô hình 1 Mô hình 2 Mô hình 3 DS12.inf Coef. z DS12.inf Coef. z DS12.inf Coef. z inf inf inf _cons 0.001 0.15 _cons -0.002 -0.05 _cons 0.001 0.36 ARMA ARMA ARMA Ma ar ar L1. -0.616 -10.36 L1. -0.166 -1.63 L1. 0.448 4.4 ARMA12 ARMA12 ma Ma ar L1. -0.909 -11.11 L1. -1.000 . L1. -0.458 -6.53 ARMA12 ar 3 Phương pháp Cải thiện lặp được ứng dụng rộng rãi hơn vì giải thuật mạnh.(giải thuật Marquardt) 4 Sử dụng phần mềm Stata
  7. L1. -0.088 -0.86 ma L1. -1.000 . 2.3. Kiểm định mô hình Sau khi ước lượng các tham số của một mô hình ARIMA được nhận dạng th ử, chúng ta cần phải kiểm định để kiểm nghiệm rằng mô hình là thích hợp. Có hai cách th ức cơ bản để thực hiện điều này: 1. Xem xét những phần dư - để xem nó theo dạng nào chưa được biết không. 2. Xem xét những thống kê lấy mẫu của giải pháp tối ưu hiện tại (sai số chu ẩn, ma trận tương quan...)-kiểm tra xem có thể đơn giản hoá mô hình không. Bảng 2.2. Kết quả các thông số kiểm định Chi-Square ll(model) Model Obs df AIC BIC 109.42 Mô hình 1 119 -85.63 4 169.26 180.38 45.94 Mô hình 2 119 -109.78 4 227.55 238.67 115.46 Mô hình 3 119 -79.28 5 168.57 182.46 Dựa vào Bảng 2.1 và Bảng 2.2 với các tiêu chuẩn kiểm định đ ược lựa ch ọn là z, Chi-Square ( χ 2 ), AIC (Akaike Information Criterion) và BIC (Bayesian Information Criterion), mô hình phù hợp nhất và được lựa chọn là Mô hình 1. 2.4. Dự báo bằng mô hình ARIMA Mô hình ARIMA (0,1,1)(0,1,1)12 (1 − L)(1 − L12 )Yt = (1 − θ1 L)(1 − Θ1 L12 )u t (2.8) Tuy nhiên, để sử dụng một mô hình được nhận dạng cho dự báo, cần phải mở rộng mô hình (2.8) trở thành: Yt = Yt - 1 + Yt - 12 - Yt - 13 + ut - θ1ut -1 - Θ1ut -12 + θ1Θ1ut -13 (2.9) Khi sử dụng phương trình này để dự báo một thời đoạn ti ếp theo - nghĩa là, Yt+1 - chúng ta tăng những chỉ số lên một, từ đầu đến cuối, như trong phương trình (2.9). Yt+1 = Yt +Yt - 11 - Yt - 12 + ut+1 - θ1ut - Θ1ut -11 + θ1Θ1ut -12 (2.10) Số hạng ut+1 sẽ không biết được vì giá trị kỳ vọng c ủa những sai số ngẫu nhiên tương lai bằng 0, nhưng từ mô hình đã thích hợp, chúng ta có thể thay thế những giá tr ị ut, ut-11, và ut-12 bằng những giá trị được xác định bằng thực nghiệm của chúng - nghĩa là, nh ư những giá trị thu được sau lần lặp sau cùng của gi ải thuật Marquardt. Dĩ nhiên, vì chúng ta dự báo xa hơn nữa trong tương lai, chúng ta sẽ không có nh ững giá tr ị th ực nghi ệm cho những số hạng “u” sau một khoảng nào đó, và vì v ậy t ất c ả nh ững giá tr ị kỳ v ọng c ủa chúng sẽ có giá trị là không. Đối với những giá trị Y ban đầu của quá trình dự báo, chúng ta sẽ biết những giá tr ị Yt, Yt-11, và Yt-12. Tuy nhiên, sau một lúc, những giá trị Y trong phương trình (2.10) sẽ là những giá trị được dự báo chứ không phải là những giá trị quá khứ. Vì vậy các giá tr ị th ực tế cần phải được cập nhật liên tục để cải thiện độ tin cậy của các giá trị dự báo. Bảng 2.3. Kết quả dự báo lạm phát hàng tháng từ tháng 1 đến tháng 12 năm 2007 Tháng Tháng Tháng Tháng Tháng Tháng Tháng Tháng Tháng Tháng Tháng Tháng 1 2 3 4 5 6 7 8 9 10 11 12
  8. 0.79 1.46 -1.06 -0.10 0.60 0.44 0.20 0.31 0.34 0.48 0.89 0.76 TÀI LIỆU THAM KHẢO Tổng cục Thống kê, [1] Chỉ số giá tiêu dùng các tháng trong năm, 2007. [2] Box, G.E.P., and G.M. Jenkins, Time Series Analysis: Forecasting and Control , Revised Edition, Holden Day, San Francisco, 1976. [3] Gujarati, D., Basic th Econometrics, 4 ed., McGraw Hill, New York, 2003. [4] Newbold, P. and Bos, T., Introductory business and economic forecasting (2nd edition), International Thomson Publishing, 1994.
nguon tai.lieu . vn