Xem mẫu

  1. Mô hình với biến phụ thuộc là biến định tính
  2. Giới thiệu • Giả sử Y là các biến chất: – Chấp nhận hay không chấp nhận việc làm/ mức lương? – Mua nhà hay thuê nhà/ thu nhập, số con, tình trạng gia đình – Đi bằng phương tiện cá nhân hay xe buýt/ khoảng cách phải đi bộ, giá xăng,.. • Khi đó có thể “lượng hóa” các biến chất này như sau: (giả sử trong mỗi trường hợp chỉ có 2 loại lựa chọn) – Chấp nhận việc (mua nhà, đi xe máy): Y =1 – Không nhận việc (thuê nhà, đi xe buýt): Y = 0 • Quan tâm đến xác suất p=P(Y = 1|X) = f(X) và tác động của X lên xác suất này • 3 loại mô hình tương ứng với 3 dạng hàm của p – Mô hình xác suất tuyến tính – Mô hình logit – Mô hình probit
  3. Mô hình xác suất tuyến tính (LPM)  Ví dụ: Y = β1 + β2X + u (*) Trong đó Y: = 1 nếu một người là có nhà riêng = 0 nếu không có nhà riêng X: thu nhập Yi 1 0  Ký hiệu: pi = P(Y=1|Xi) x/s pi 1-pi  => E(Y|Xi ) = 1*pi + (1-pi)*0 = pi  Với gỉa thiết E(u|Xi) =0 pi = β1 + β2Xi (*) ~ E(Y|Xi) = β1 + β2Xi  => mô hình (*): mô hình xác suất tuyến tính
  4. Mô hình xác suất tuyến tính (LPM) • Kiểm tra các giả thiết của OLS với mô hình LPM: Yi 1 0 ui 1-(β1 + β2Xi ) -(β1 + β2Xi) x/s pi 1-pi x/s pi 1-pi var(ui) = pi (1-pi); không đều ui không phân phối chuẩn • Ngoài ra: Các UL của E(Y|Xi) sẽ không nhất thiết nằm trong đoạn [0,1]
  5. ước lượng mô hình LPM • Ví dụ 5.1 (mở eviews ch11.bt2 và thực hiện hồi quy) • Bước 1: Dùng OLS, thu được ei • Bước 2: Biến đổi biến số (giải quyết vấn đề PSSS thay đổi) Yi/sqrt(ei) = β1/sqrt(ei) + β2/sqrt(ei) Xi + ui/sqrt(ei) Từ các ước lượng của mô hình cuối cùng này rút ra các ước lượng cho mô hình gốc • Các vấn đề đối với mô hình LPM – phương sai của sai số không đều – u không phân bố chuẩn,... – pi tuyến tính theo X. !!!!!
  6. Mô hình xác suất phi tuyến: Mô hình logit Mô hình probit
  7. Mô hình logit- giới thiệu • Trong mô hình logit, pi được giả định có dạng exp(β1+ β2X2i) pi = 1+exp(β1+ β2X2i) • Nhận xét: pi không còn là hàm tuyến tính (theo X và β) • => Không áp dụng trực tiếp phương pháp OLS được • Tùy vào dạng của số liệu để có phương pháp UL phù hợp
  8. Phương pháp Goldberger  Nếu số liệu có dạng cá thể, không theo nhóm =>  phương pháp Goldberger: PP ước lượng hợp lý tối đa để ước lượng β1 và β2 .  Ví dụ: ch11bt2 (chạy eviews minh họa): Variable Coefficient Std. Error z-Statistic Prob. C -6.55 1.95 -3.34 0.00 X 0.38 0.11 3.45 0.00 =>ước lượng của β1 = -6.55; ULcủa β2 = 0.38
  9. Đọc kết quả ước lượng • Từ các kết quả ước lượng tính được: – Xác suất để Y = 1 khi X = X0 nào đó ˆ ˆ exp( 1   2 X 0 ) ULpi = P(Y = 1| X=X0) = ˆ ˆ 1  exp(   X ) 1 2 0 – Ảnh hưởng biên của X đến P(Y = 1) bằng ˆ pi / X  pi (1  pi )  2 • Ví dụ 5.2: ước lượng của β1 = -6.552181; của β2 = 0.38
  10. Đọc kết quả ước lượng (tiếp)  => xác suất để một người là có nhà khi thu nhập = 20 là: Exp(- 6.55+0.38x20)/[1+ Exp(- 6.55+0.38x20) ]= 0.74  Khi lương tăng lên từ 20 lên 21 đơn vị thì xác suất người đó có nhà sẽ tăng lên:  = 0.74x(1-0.74)x0.38 = 0.073
  11. Phương pháp Berkson • Nếu số liệu là phân theo nhóm exp(β1+ β2X2i) ln(pi/(1-pi) = β1+ β2Xi pi = Li=: ln(pi/(1-pi)) +ui = β1+ β2Xi +ui (**) 1+exp(β1+ β2X2i) • Khi đó ước lượng được p i cho mỗi nhóm để tính Li: Giả sử trong mẫu, nhóm tương ứng với X = xi có Ni phần tử, trong đó có ni phần tử có Y = 1=> UL của pi là ni/Ni => UL của Li • Mô hình (**) là tuyến tính, và L không bị chặn => có thể dùng OLS để thu được các ước lượng cho β1 và β2 như thông thường
  12. Tiếp • Tuy nhiên sai số ngẫu nhiên ui trong (**) có PSSS thay đổi như sau: • Khi Ni là khá lớn thì ui ~ N(0, (Nipi(1-pi))-1) • Do đó nên trước khi ước lượng bằng OLS thì phải biến đổi mô hình để giải quyết vấn đề này (phương pháp bình phương bé nhất có trọng số WLS) • Các bước thực hiện: – tính: pi (=ni/Ni); Li =ln(pi/1-pi); w = (Nipi(1-pi)) – Đổi biến: Li* = Liw1/2; Xi* = Xi*w1/2 – Dùng OLS ước lượng: Li* =α*1w+ α*2 Xi*+vi – Trong đó α*1= β1w0.5 ; α*2= β2
  13. Đọc kết quả ước lượng • Kết qủa ước lượng ch11bt3 • L* = - 0.47 w1/2 + 0.05 X* • ước lượng của α*1 là: -0.47; của α*2 là: 0.05 • Tại X = 20: w = 17.49; X* = X .17.491/2 = 20x 4.18 = 86.3 • L*(X=20) = - 0.47 x 4.18 +0.05x86.3 =2.35 • L(X=20) = 2.35/4.18 = 0.56 => p/(1-p) = exp(0.56) = 1.75; p = 1.75/2.75= 0.64 thể hiện mức độ yêu thích, • Mức tác động biên tại X=20: cơ hội của Y =1 so với Y = 0 • p(1-p)β2 = 0.64(1-0.64)0.05 = 0.011 • Nếu thu nhập tăng từ 20 lên 21 đơn vị thì xác suất để người đó có nhà tăng từ 0.64 lên (0.64+ 0.011)
  14. số liệu theo nhóm • Mi Ni X p =M/N L=ln(p/1-p) • 8.00 40.00 6.000 8/40 (0.2) -1.38 • 12.00 50.00 8.000 12/50(0.24) -1.15 • 18.00 60.00 10.00 18/60(0.3) -0.85 • 28.00 80.00 13.00 28/80(0.175) -1.55 • 45.00 100.0 15.00 45/100(0.45) -0.2 • 36.00 70.00 20.00 36/70(0.51) 0.04 • 39.00 65.00 25.00 39/65(0.6) 0.41 • 33.00 50.00 30.00 33/50(0.66) 0.66 • 30.00 40.00 35.00 30/40(0.75) 1.1 • 20.00 25.00 40.00 20/25(0.8) 1.39 • X: thu nhập; Ni: số hộ có thu nhập Xi; Mi: số hộ có thu nhập Xi mà có nhà riêng
  15. Mô hình probit
  16. Mô hình Probit • Giả sử dạng hàm của p là: pi = F( β1+ β2Xi)  1  2Xi 1 t 2 /2 F( β1+ β2Xi)=   2 e dt hàm phân phối tích lũy chuẩn hóa PP ước lượng hợp lý tối đa để ước lượng β1 và β2 . • Giải thích kết quả ước lượng: – Dự báo xác suất pi khi X = X0: pi = F( β1+ β2X0) – Tác động biên của X lên xác suất để Y = 1 ∂p i/ ∂X = f(β1+ β2Xi) β2
  17. Mô hình Probit • Ví dụ 5.4: dùng probit ước lượng số liệu ch11bt1 thu được Variable Coeff S. Error z-St Prob. C -3.57 0.94 -3.82 0.00 X 0.21 0.05 3.94 0.00 • Đọc kết quả: xác suất để một người là có nhà riêng khi thu nhập =20: • F(-3.57+0.21x20)=F(0.63) =0.7357 • Tác động biên khi X =20 là: ∂pi/ ∂X|(X = 20) =f((-3.57+0.21x20)*0.21 • =f(0.63)*0.21 =(2π)-0.5exp[(-0.63)2/2]*0.21
  18. Mô hình Logit và Probit • Khá giống nhau, chỉ khác ở các giá trị đầu, đuôi • Hàm phân phối logistic (mô hình logit) và chuẩn hóa (probit) có khác nhau ở phương sai: (π2/3) và 1 => • Hệ số UL từ logit sẽ lớn hơn từ probit khoang 1.8 lần
nguon tai.lieu . vn