Xem mẫu
- CHƯƠNG 6
KIỂM ĐỊNH VÀ LỰA CHỌN MÔ HÌNH
Các loại sai sót của dạng mô hình hồi
qui
Hậu quả của sai sót mô hình
Phương pháp phát hiện các sai sót của
dạng mô hình hồi qui
Tiêu chuẩn lựa chọn mô hình
- Các loại sai sót của dạng mô
hình hồi qui
Các dạng sai sót của dạng mô hình như
sau:
Bỏ sót biến quan trọng,
Đưa biến không liên quan vào mô hình,
Sử dụng dạng hàm số không đúng,
Sai số trong đo lường, và
Xác định dạng của phần sai số không
đúng.
- Ví dụ về hàm chi phí của doanh nghiệp,
dạng hàm đúng sẽ là:
Yi = b1 + b2Xi + b3Xi2 + b4Xi3 + u1i (6.1)
Bỏ sót biến quan trọng (Xi3):
Yi = a1 + a2Xi + a3Xi2 + u2i (6.2)
Đưa biến không liên quan vào mô hình (Xi4):
Yi = l1 + l2Xi + l3Xi2 + l4Xi3 + l5Xi4 + u3i (6.4)
Dạng hàm sai.
lnY = g1 + g2Xi + g3Xi2 + g4Xi3 + u4i (6.6)
- Sai lệch về đo lường.
Yi* = b1* + b2*Xi* + b3*Xi*2 + b4*Xi*3 + ui*
trong đó Yi* = Yi + εi và Xi* = Xi + wi; εi và
wi là sai số của phép đo lường. Như vậy,
thay vì sử dụng các biến số đúng là Yi và
Xi, chúng ta lại sử dụng các biến thay thế
là Yi* và Xi* có chứa các sai số.
dạng ngẫu nhiên không thích hợp của
phần sai số:
Yi = β Xiui khác với Yi = αXi + ui,
- Theo trường phái trọng tiền, sự thay đổi
của GDP của nền kinh tế chịu ảnh hưởng
bởi sự thay đổi của lượng cung tiền, trong
khi đó, theo Keynes, sự thay đổi của
lượng chi mua hàng hóa dịch vụ của
chính phủ sẽ ảnh hưởng lớn đến GDP.
khi có sự sai sót, kết quả của phép ước
lượng sẽ không thỏa mãn các đặc điểm
của “ước lượng không chệch tuyến tính
tốt nhất” (BLUE).
chúng tôi chỉ tập trung phát hiện hai loại
sai sót đầu tiên.
- Hậu quả của sai sót mô hình
Để minh họa, ta dùng mô hình 3 biến và
xem xét 2 loại sai sót đầu tiên:
1. Bỏ sót biến có liên quan:
Giả sử dạng đúng của mô hình là:
Yi = β 1 + β 2X2i + β 3X3i + ui (1)
Nhưng ta lại sử dụng mô hình:
Yi = α1 + α2X2i + vi (2)
- Hậu quả của sai sót mô hình
Ta gặp những hậu quả sau:
1. Nếu biến bị bỏ sót có tương quan với biến sẵn có trong
∧ ∧
mô hình, tức là r23 ≠ 0, α1 và α2 sẽ bị chệch và không
vững.
2. Thậm chí nếu X2 và X3 không có tương quan thì α1
∧ ∧
∧ ∧
cũng bị chệch, mặc dù α 2 không chệch.
3. Var(u∧ σ 2 bị ước lượng sai.
i) = ∧
4. Var(α 2) là ước lượng chệch của var(β 2).
5. Do vậy, khoảng tin cậy và các kiểm định không chính
xác.
6. Dự báo dựa trên mô hình sai sẽ không đáng tin cậy.
- Hậu quả của sai sót mô hình
Đưa vào mô hình biến không có liên quan
Giả sử mô hình đúng như sau:
Yi = β 1 + β 2X2i + ui (3)
Nhưng ta lại ước lượng mô hình:
∧
Yi = α1 + α2X2i + α3X3i + vi (4)
∧
Những hậu quả:
1. Các ước lượng OLS sẽ không chệch và
∧ ∧
vững, tức là: E(α1)=β 1; E(α2)=β 2; và E(α3)=0;
∧
- Hậu quả của sai sót mô hình
Phương sai sai số, σ 2, được ước lượng
đúng;
Khoảng tin cậy và các kiểm định vẫn
đáng tin cậy;
Tuy nhiên, các ước lượng α không hiệu
quả, tức là, phương sai của chúng có thể
lớn hơn phương sai của β .
- Phương pháp phát hiện các sai
sót của dạng mô hình hồi qui
1. Phát hiện sự hiện diện của các biến
không liên quan
Yi = b1 + b2X2i + …+ bkXki + ui
Xk có thực sự nằm trong mô hình hay
không, dùng kiểm định t:
ˆ ˆ
t = βk / se( βk )
=> khai thác dữ liệu =>có thể dẫn tới sai
lầm sau
- khai thác dữ liệu (data mining)
chúng ta lựa ra k biến (k ≤ c)
mức ý nghĩa thực sự (α*) từ mức ý nghĩa
danh nghĩa (α ) có thể được tính theo công
thức sau:
α * ≈ (c/k).α
nếu c = 15, k = 5, và α = 5%, ta có thể
tính được mức ý nghĩa thực sự là (15/5).
(5) = 15%.
lưu ý rằng khi c = k thì sẽ không có hiện
tượng khai thác dữ liệu.
- 2. Kiểm định biến bị bỏ sót và
dạng hàm số không đúng
2.1 Kiểm tra phần dư
hàm chi phí của doanh nghiệp:
Yi = b1 + b2Xi + b3Xi2 + b4Xi3 + u1i (1)
Yi = a1 + a2Xi + a3Xi2 + u2i (2)
Yi = a1 + a2Xi + u3i (3)
-
Residuals
-400 -200 0 200 400
0
2
4
1
3
sanluong
6
2
8
10
- 2.2 Kiểm định Durbin-Watson d
H : mô hình không có tự tương quan
0
H0: ρ = 0; H1: ρ ≠ 0. Nếu d < dU hoặc (4 - d) < dU thì
bác bỏ giả thuyết H0, chấp nhận H1, tức có tự tương
quan (dương hoặc âm).
Giả thuyết H0 Quyết định n ếu
Không có tự tương quan dương Bác bỏ 0 < d < dL
Không có tự tương quan dương Không qđ dL ≤ d ≤ dU
Không có tự tương quan âm Bác bỏ 4 - dL < d
- 2.3 Kiểm định RESET của Ramsey
Để minh họa, ta trở lại hàm chi phí tuyến
tính theo sản lượng:
Yi = λ 1 + λ 2Xi + u3i (*)
Ước lượng mô hình này bằng OLS và vẽ
∧
đồ thị của sai số theo giá trị, Yi.
Hình vẽ sẽ cho ta thấy mối quan hệ có hệ
∧
thống giữa ei và Yi.
Các bước tiến hành:
-
- Kiểm định RESET của
Ramsey
Chạy hồi quy mô hình (*), và tính toán
∧
ước lượng của Yi, Yi.
Chạy lại (*) và đưa thêm biến Yi vào mô
hình dưới dạng một biến nào đó, chẳng
hạn, Yi2 và Yi3. ∧ ∧
Yi = β 1 + β 2Xi + β 3Yi2 + β 4Yi3 + ui (**)
Đặt R2 từ (**) là Rnew2 và từ (*) là Rold2.
Chúng ta dùng kiểm định F theo công
thức:
- Kiểm định RESET của
Ramsey
Nếu F > F tra bảng ở một mức ý nghĩa nào đó, ta chấp
nhận có việc bỏ sót biến.
Ví dụ:
- Kiểm định RESET của
Ramsey: ví dụ
- Ví dụ:
H0: mô hình không bỏ sót biến
Giá trị kiểm định F thu được trực tiếp từ
phần mềm Stata
ovtest
Ramsey RESET test using powers of the
fitted values of chiphi
Ho: model has no omitted variables
F(3, 4) = 1.52
Prob > F = 0.3380
nguon tai.lieu . vn