Xem mẫu

  1. CHƯƠNG 6 KIỂM ĐỊNH VÀ LỰA CHỌN MÔ HÌNH  Các loại sai sót của dạng mô hình hồi qui  Hậu quả của sai sót mô hình  Phương pháp phát hiện các sai sót của dạng mô hình hồi qui  Tiêu chuẩn lựa chọn mô hình    
  2. Các loại sai sót của dạng mô hình hồi qui Các dạng sai sót của dạng mô hình như sau:  Bỏ sót biến quan trọng,  Đưa biến không liên quan vào mô hình,  Sử dụng dạng hàm số không đúng,  Sai số trong đo lường, và    Xác định dạng của phần sai số không   đúng.
  3.  Ví dụ về hàm chi phí của doanh nghiệp, dạng hàm đúng sẽ là: Yi = b1 + b2Xi + b3Xi2 + b4Xi3 + u1i (6.1)  Bỏ sót biến quan trọng (Xi3): Yi = a1 + a2Xi + a3Xi2 + u2i (6.2)  Đưa biến không liên quan vào mô hình (Xi4): Yi = l1 + l2Xi + l3Xi2 + l4Xi3 + l5Xi4 + u3i (6.4)  Dạng hàm sai. lnY = g1 + g2Xi + g3Xi2 + g4Xi3 + u4i (6.6)    
  4.  Sai lệch về đo lường. Yi* = b1* + b2*Xi* + b3*Xi*2 + b4*Xi*3 + ui* trong đó Yi* = Yi + εi và Xi* = Xi + wi; εi và wi là sai số của phép đo lường. Như vậy, thay vì sử dụng các biến số đúng là Yi và Xi, chúng ta lại sử dụng các biến thay thế là Yi* và Xi* có chứa các sai số.  dạng ngẫu nhiên không thích hợp của phần sai số:   Yi = β Xiui khác với Yi = αXi + ui,  
  5.  Theo trường phái trọng tiền, sự thay đổi của GDP của nền kinh tế chịu ảnh hưởng bởi sự thay đổi của lượng cung tiền, trong khi đó, theo Keynes, sự thay đổi của lượng chi mua hàng hóa dịch vụ của chính phủ sẽ ảnh hưởng lớn đến GDP.  khi có sự sai sót, kết quả của phép ước lượng sẽ không thỏa mãn các đặc điểm của “ước lượng không chệch tuyến tính tốt nhất” (BLUE).  chúng tôi chỉ tập trung phát hiện hai loại   sai sót đầu tiên.  
  6. Hậu quả của sai sót mô hình  Để minh họa, ta dùng mô hình 3 biến và  xem xét 2 loại sai sót đầu tiên: 1. Bỏ sót biến có liên quan: Giả sử dạng đúng của mô hình là: Yi = β 1 + β 2X2i + β 3X3i + ui (1) Nhưng ta lại sử dụng mô hình: Yi = α1 + α2X2i + vi (2)    
  7. Hậu quả của sai sót mô hình  Ta gặp những hậu quả sau: 1. Nếu biến bị bỏ sót có tương quan với biến sẵn có trong  ∧ ∧ mô hình, tức là r23 ≠  0, α1 và α2 sẽ bị chệch và không  vững. 2. Thậm chí nếu X2 và X3 không có tương quan thì α1  ∧ ∧ ∧ ∧ cũng bị chệch, mặc dù α 2 không chệch. 3. Var(u∧ σ 2 bị ước lượng sai. i) =  ∧ 4. Var(α 2) là ước lượng chệch của var(β 2). 5. Do vậy, khoảng tin cậy và các kiểm định không chính  xác. 6. Dự báo dựa trên mô hình sai sẽ không đáng tin cậy.    
  8. Hậu quả của sai sót mô hình  Đưa vào mô hình biến không có liên quan Giả sử mô hình đúng như sau: Yi = β 1 + β 2X2i + ui (3) Nhưng ta lại ước lượng mô hình: ∧ Yi = α1 + α2X2i + α3X3i + vi (4) ∧ Những hậu quả: 1. Các ước lượng OLS sẽ không chệch và  ∧ ∧ vững, tức là: E(α1)=β 1; E(α2)=β 2; và E(α3)=0;  ∧      
  9. Hậu quả của sai sót mô hình  Phương sai sai số, σ 2, được ước lượng  đúng;  Khoảng tin cậy và các kiểm định vẫn  đáng tin cậy;  Tuy nhiên, các ước lượng α không hiệu  quả, tức là, phương sai của chúng có thể  lớn hơn phương sai của β .    
  10. Phương pháp phát hiện các sai sót của dạng mô hình hồi qui 1. Phát hiện sự hiện diện của các biến không liên quan Yi = b1 + b2X2i + …+ bkXki + ui Xk có thực sự nằm trong mô hình hay không, dùng kiểm định t: ˆ ˆ t = βk / se( βk ) => khai thác dữ liệu =>có thể dẫn tới sai lầm sau    
  11. khai thác dữ liệu (data mining)  chúng ta lựa ra k biến (k ≤ c)   mức ý nghĩa thực sự (α*) từ mức ý nghĩa danh nghĩa (α ) có thể được tính theo công thức sau: α * ≈ (c/k).α  nếu c = 15, k = 5, và α = 5%, ta có thể tính được mức ý nghĩa thực sự là (15/5). (5) = 15%.  lưu ý rằng khi c = k thì sẽ không có hiện   tượng khai thác dữ liệu.  
  12. 2. Kiểm định biến bị bỏ sót và dạng hàm số không đúng 2.1 Kiểm tra phần dư  hàm chi phí của doanh nghiệp: Yi = b1 + b2Xi + b3Xi2 + b4Xi3 + u1i (1) Yi = a1 + a2Xi + a3Xi2 + u2i (2) Yi = a1 + a2Xi + u3i (3)    
  13.   Residuals -400 -200 0 200 400 0 2 4 1 3   sanluong 6 2 8 10
  14. 2.2 Kiểm định Durbin-Watson d  H : mô hình không có tự tương quan 0  H0: ρ = 0; H1: ρ ≠ 0. Nếu d < dU hoặc (4 - d) < dU thì bác bỏ giả thuyết H0, chấp nhận H1, tức có tự tương quan (dương hoặc âm). Giả thuyết H0 Quyết định n ếu Không có tự tương quan dương Bác bỏ 0 < d < dL Không có tự tương quan dương Không qđ dL ≤ d ≤ dU Không có tự tương quan âm Bác bỏ 4 - dL < d
  15. 2.3 Kiểm định RESET của Ramsey  Để minh họa, ta trở lại hàm chi phí tuyến  tính theo sản lượng: Yi = λ 1 + λ 2Xi + u3i (*)  Ước lượng mô hình này bằng OLS và vẽ  ∧ đồ thị của sai số theo giá trị, Yi.  Hình vẽ sẽ cho ta thấy mối quan hệ có hệ  ∧ thống giữa ei và Yi.  Các bước tiến hành:    
  16.    
  17. Kiểm định RESET của Ramsey  Chạy hồi quy mô hình (*), và tính toán  ∧ ước lượng của Yi, Yi.  Chạy lại (*) và đưa thêm biến Yi vào mô  hình dưới dạng một biến nào đó, chẳng  hạn, Yi2 và Yi3. ∧ ∧ Yi = β 1 + β 2Xi + β 3Yi2 + β 4Yi3 + ui (**)  Đặt R2 từ (**) là Rnew2 và từ (*) là Rold2.  Chúng ta dùng kiểm định F theo công  thức:    
  18. Kiểm định RESET của Ramsey Nếu F > F tra bảng ở một mức ý nghĩa nào đó, ta chấp nhận có việc bỏ sót biến. Ví dụ:    
  19. Kiểm định RESET của Ramsey: ví dụ    
  20. Ví dụ:  H0: mô hình không bỏ sót biến  Giá trị kiểm định F thu được trực tiếp từ phần mềm Stata  ovtest  Ramsey RESET test using powers of the fitted values of chiphi Ho: model has no omitted variables F(3, 4) = 1.52 Prob > F = 0.3380    
nguon tai.lieu . vn