Xem mẫu
- Tự tương quan (Autocorrelation)
Bản chất và nguyên nhân của hiện
tượng tự tương quan
Ước lượng bình phương nhỏ nhất khi
có tự tương quan
Ước lượng tuyến tính không chệch tốt
nhất khi có tự tương quan
Hậu quả của việc sử dụng phương pháp
OLS khi có tự tương quan
Phát hiện tự tương quan
Các biện pháp khắc phục
- Bản chất và nguyên nhân của hiện
tượng tự tương quan
1. Tự tương quan là gì ?
Trong mô hình hồi qui tuyến tính cổ điển,
ta giả định rằng không có tương quan
giữa các sai số ngẫu nhiên ui, nghĩa là:
cov(ui, uj) = 0 (i j)
Nói một cách khác, mô hình cổ điển giả
định rằng sai số ứng với quan sát nào
đó không bị ảnh hưởng bởi sai số ứng
với một quan sát khác.
- Bản chất và nguyên nhân của hiện
tượng tự tương quan
Tuy nhiên trong thực tế có thể xảy ra hiện
tượng mà sai số của các quan sát lại phụ
thuộc nhau, nghĩa là:
cov(ui, uj) 0 (i j)
Khi đó xảy ra hiện tượng tự tương quan.
Sự tương quan xảy ra đối với những quan sát
“cắt ngang” đgl “tự tương quan không
gian”.
Sự tương quan xảy ra đối với những quan sát
“chuổi thời gian” đgl “tự tương quan thời
gian”.
- ui, ei
ui, ei
t
t
(b)
(a)
ui, ei
ui, ei
t
t
(c) (d)
ui, ei
t
(e)
- 2. Nguyên nhân của tự tương quan
Quán tính: mang tính chu kỳ, VD: các chuổi số
liệu thời gian về: GDP, chỉ số giá, sản lượng,
thất nghiệp, …
Sai lệch do lập mô hình: bỏ sót biến, dạng hàm
sai.
Hiện tượng mạng nhện: phản ứng của cung của
nông sản đối với giá thường có một khoảng trễ
về thời gian: QSt = 1 + 2Pt-1 + ut
Độ trễ: một hộ chi tiêu nhiều trong khoảng thời
gian t có thể do chi tiêu ít trong giai đoạn t-1
Ct = 1 + 2It + 3Ct-1 + ut
Hiệu chỉnh số liệu: do việc “làm trơn” số liệu
loại bỏ những quan sát “gai góc”.
…
- Bản chất (tt)
MC
q
Dạng mô hình sai
- Ước lượng OLS khi có tự tương
quan
Giả sử tất cả các giả định đối với mô
hình hồi qui tuyến tính cổ điển đều thoả
mãn trừ giả định không tương quan
giữa các sai số ngẫu nhiên ut.
ˆ
^
1 và 2 không còn là ước lượng hiệu
quả nữa, do đó nó không còn là ước
lượng không chệch tốt nhất.
- Ước lượng bình phương nhỏ nhất
khi có tự tương quan
Xét mô hình với số liệu chuổi thời gian:
Yt = 1 + 2Xt + ut
Ta giả thuyết: ut được tạo ra theo cách sau:
ut = ut-1 + et (-1 < < 1) (*)
: hệ số tự tương quan;
et: sai số ngẫu nhiên, thỏa mãn những giả định
của OLS (et còn đgl sai số trắng):
Var(et) = 2;
E(et) = 0; Cov(et, et+s) = 0
(*): phương trình tự hồi quy bậc nhất Markov, ký
hiệu: AR(1)
Nếu ut = 1ut-1 + 2ut-2 + et : tự hồi quy bậc hai:
AR(2)
- Ước lượng bình phương nhỏ
nhất khi có tự tương quan
Với mô hình AR(1), ta có thể chứng minh được:
Nếu =0, thì phương sai sai số của AR(1) bằng
phương sai sai số của OLS.
Nếu sự tương quan giữa các ut và ut-1 rất nhỏ, thì
phương sai sai số của AR(1) cũng bằng phương sai
sai số của OLS.
Vậy nếu tương đối lớn, các ước lượng của vẫn
không chệch nhưng không còn hiệu quả nữa nên
chúng không là “BLUE”.
- Ước lượng tuyến tính không chệch
tốt nhất khi có tự tương quan
Ước lượng bình phương tổng quát (GLS) của 1
phối hợp được tham số tự tương quan vào
công thức ước lượng. Đó chính là lý do vì sao
ước lượng bình phương nhỏ nhất tổng quát là
ước lượng tuyến tính không chệch tốt nhất.
và
- Ước lượng tuyến tính không chệch
tốt nhất khi có tự tương quan
C và D là các nhân tố điều chỉnh, có
thể được bỏ qua trong phân tích thực
tế.
Khi = 0, không có thông tin bổ sung
cần được xem xét và vì vậy cả hai
hàm ước lượng GLS và OLS là như
nhau.
- Hậu quả của việc sử dụng OLS khi
có tự tương quan
1. Các ước lượng OLS vẫn là các ước
lượng tuyến tính, không chệch, nhưng
chúng không phải là ước lượng hiệu
quả nữa.
2. Phương sai ước lượng được của các
ước lượng OLS thường là chệch. Kiểm
định t và F không còn tin cậy nữa.
- Ví dụ
Giả sử hãy xem xét khoảng tin cậy
95% từ các ước lượng OLS[AR(1)] và
GLS, giả sử giá trị đúng của 2 = 0.
Xem xét một giá trị ước lượng cụ thể
của 2, chẳng hạn b2.
Chúng ta chấp nhận giả thuyết H0: 2
= 0, nếu dùng khoảng tin cậy OLS;
nhưng bác bỏ H0, nếu dùng khoảng
tin cậy GLS.
- Ví dụ
- Hậu quả của việc sử dụng OLS khi
có tự tương quan
2
ˆ
= RSS/df là ước lượng chệch của 2 và
3.
trong một số trường hợp là chệch về phía
dưới (underestimate).
4. Giá trị ước lượng R2 có thể bị ước lượng cao
hơn (overestimate) và không tin cậy khi
dùng để thay thế cho giá trị thực của R2.
5. Phương sai và sai số chuẩn của các giá trị
dự báo không được tin cậy (không hiệu
quả).
- Phát hiện tự tương quan
1. Phương pháp đồ thị
2. Kiểm định d của Durbin – Watson
3. Kiểm định 2 về tính độc lập của các
phần dư
- Phương pháp đồ thị
Giả định về sự tự tương quan liên quan đến
các giá trị ut của tổng thể, tuy nhiên, các
giá trị này không thể quan sát được.
Ta quan sát et, hình ảnh của et có thể cung
cấp những gợi ý về sự tự tương quan.
Ta có thể chạy OLS cho mô hình gốc và thu
thập et từ đó. Vẽ đường et theo thời gian và
quan sát.
- 1. PP đồ thị
et
et
t
t
(b)
(a)
et et
t
t
(c) (d)
et
t
(e) Không có tự tương quan
- Phát hiện tự tương quan
2. Kiểm định d của Durbin – Watson
Thống kê d. Durbin – Watson được định nghĩa như
sau: n
( e t e t 1 )2
e t2 e t21 2 e t e t 1
d t 2 n
e t2
2
et
t 1
d là tỷ số giữa tổng bình phương của chênh lệch
giữa 2 sai số liên tiếp với RSS
Do et2 và et-12 chỉ khác nhau có một quan sát, nên
ta có thể xem chúng bằng nhau. d có thể được
viết lại:
e t e t 1
d 21
et 2
- Kiểm định d của Durbin – Watson
Giá trị (gần
Giá trị
đúng) của d
d=4
=-1
(tương quan hoàn hảo, âm)
d=2
=0
(không có tự tương quan)
=1 d=0
(tương quan hoàn hảo,
dương)
Tức là: 0 d 4.
Nếud khác các giá trị ta cần tra bảng tìm dU và dL và
áp dụng quy tắc kiểm định sau:
nguon tai.lieu . vn