Xem mẫu
- Biến giả và Kiểm định tính ổn định cấu trúc
của mô hình
Ta có mô hình hồi quy:
Yt = α1 + α2Dt + β1Xt + β2(DtXt) + ut
- Hồi qui tuyến tính từng khúc
Hệ số góc của biến độc lập, X, có thể thay đổi
khi X đạt một mức ngưỡng nào đó.
Phân tích mô hình có sự thay đổi về độ dốc,
nhưng cũng chỉ giới hạn trong trường hợp đoạn
thẳng được ước lượng vẫn là liên tục.
Công ty trả hoa hồng cho các đại lý dựa vào
doanh thu, nếu doanh thu dưới mức x* thì cách
tính tiền hoa hồng khác với cách tính tiền hoa
hồng khi doanh thu trên mức x*.
- y tiền hoa hồng
x doanh thu
0 x*
Hình 7.3: Đường hồi qui tuyến tính từng
khúc
- Ước lượng hàm:
y = + x + xD + u (7.8)
Trong đó: y: tiền hoa hồng; x: doanh thu
x*: giá trị ngưỡng của doanh thu
1 nếu x > x*
D
0 nếu x x*
=
Kiểm định = 0
- Biến phụ thuộc là biến giả
Biến giả có thể có 2 hoặc nhiều giá trị nhưng
trong trường hợp này chúng ta chỉ xem xét
trường hợp nó chỉ có 2 giá trị: 0 hoặc 1.
mô hình xác suất tuyến tính (LPM)
Ví dụ:
1 nếu một sinh viên tốt nghiệp ra
y=
trường
0 nếu không tốt nghiệp
1 nếu một gia đình có vay được vốn từ ngân
y=
hàng
0 nếu không vay được
- Mô hình xác suất tuyến tính và hàm phân
biệt tuyến tính
Chúng ta viết mô hình xác suất tuyến
tính dưới dạng hồi qui thông thường như
sau:
yi = Pi = E(yi|xi) = i’xi + ui (7.9)
với E(ui) = 0.
Kỳ vọng có điều kiện E(yi|xi) = ’ixi được
giải thích như là xác suất có điều kiện để
sự kiện xảy ra khi biến xi đã xảy ra.
- Mô hình xác suất tuyến tính
Vì E(yi|xi) là một xác suất nên:
0 E(yi|xi) 1
Tuy OLS không đòi hỏi ui phải có phân
phối chuẩn, nhưng ta vẫn giả định nó có
phân phối chuẩn để phục vụ cho việc suy
diễn.
Giả định này bị vi phạm, vì thực sự ui
theo phân phối Bernoulli.
Xét mô hình LPM 2 biến, ta có:
- Mô hình xác suất tuyến tính
u i = Y i - 1 - 2X i
Khi Yi = 1, ui = 1 - 1 - 2Xi, với xác suất pi,
Khi Yi = 0, ui = -1 -2Xi, với xác suất 1- pi,
Ước lượng OLS vẫn không chệch, nên nếu dùng để
ước lượng điểm, kết quả vẫn tin cậy.
Có hiện tượng phương sai sai số thay đổi, do ui
theo phân phối Bernoulli nên:
Var(ui) = Pi(1 – Pi) với Pi = ’iXi
E(yi|xi) có thể vượt khoảng (0,1) nếu Xi có giá trị lớn.
R2 sẽ rất nhỏ
- y
Đường hồi qui tuyến
tính
1
Đường hồi qui thích hợp
hơn
x
0
Hình 7.4: Dự báo từ mô hình xác suất
tuyến tính
- Mô hình Probit và Logit
Trong mô hình LPM, ta có:
yi = Pi = E(yi|xi) = F(i’xi) = i’xi + ui,
Trong đó: i’xi = 0 + 1x1 + 2x2 + … + kxk
Do yi là một xác suất nên thay vì ta dùng F(i’xi) là
hàm tuyến tính như LPM, ta có thể cho F(xi) là một
hàm tích lũy xác suất (c.d.f).
Khi đó, chắc chắn 0 E(yi|xi) = F(i’xi) 1.
Tùy theo dạng của F(i’xi) được chọn, ta có các mô
hình: “lựa chọn nhị phân” (binary choice) khác
nhau:
F( i’xi) là c.d.f của phân phối chuẩn: probit model
F( i’xi) là c.d.f của phân phối logistic: logit model
- “Biến ẩn” và Mô hình Probit và
Logit
Gọi yi* là một “biến ẩn”, không quan sát được từ
quan sát i:
yi* = xi’ + vi,
Trong đó vi thỏa các giả định của CLRM.
Giả sử ta quan sát được yi khi yi* vượt một ngưỡng
nào đó, chẳng hạn, 0, với:
yi = 1 khi yi* > 0, và
yi = 0 khi yi* 0.
Do vi có p.d.f đối xứng nên: 1-F(-xi’) = F(xi’). Ta
có:
P(y = 1|xi) = P(y* > 0|xi) = P(vi > -xi’ ) = 1 - F(-xi’) =
F(xi’ )
- Mô hình logit và probit
Tác động biên (marginal effect) của xi lên Pi
là:
Pi F x'i
i f x'i
xi x i
Trong đó f(.) là p.d.f của F(.).
Ta thấy tác động từng phần này có cùng dấu
với i và phụ thuộc vào giá trị của xi, không
giống như các mô hình tuyến tính.
Do vậy, ta chỉ có thể tính tác động biên của xi
lên Pi ứng với các giá trị cụ thể của các xi.
- Mô hình logit và probit
Hàm c.d.f. trong các mô
hình: x'i
e
E yi xi Pi F xi
'
Mô hình logit: x'i
1 e
x'i
Mô hình probit: F(.) 1 x'i / 2
'
Pi F x e
là c.d.f. của phân i
2
phối chuẩn tắc.
Đây là các mô hình phi tuyến tính nên ước lượng bằng
phương pháp ML (Maximum Likelihood)
nguon tai.lieu . vn