Xem mẫu

  1. Chương 4: Đa cộng tuyến  Bản chất của đa cộng tuyến  Ước lượng trong trường hợp có đa cộng tuyến  Hậu quả của đa cộng tuyến  Phát hiện đa cộng tuyến  Các biện pháp khắc phục 104
  2. Bản chất của đa cộng tuyến Đa cộng tuyến (Multicollinearity): Ragnar Frisch: Đa cộng tuyến có nghĩa là sự tồn tại mối quan hệ tuyến tính “hoàn hảo” hoặc chính xác giữa một số hoặc tất cả các biến giải thích trong một mô hình hồi qui. 105
  3. Minh họa bằng hình ảnh 106
  4. Xét hàm hồi qui tuyến tính k biến độc lập: Yi =  0 +  1X1i +  2X2i + … +  kXki + Ui  Đa cộng tuyến hoàn hảo: Nếu tồn tại các số  i không đồng thời bằng 0 sao cho: 1X1i + 2X2i + …… + kXki = 0 Có nghĩa là tồn tại biến độc lập biểu diễn tuyến tính qua các biến còn lại.  Đa cộng tuyến không hoàn hảo: Nếu tồn tại các số i không đồng thời bằng 0 sao cho: 1X1i + 2X2i + …… + kXki + V = 0 107
  5. Ví dụ: X1 10 15 18 24 30 X2 50 75 90 120 150 X3 52 75 97 129 152 X2i = 5X1i, vì vậy có cộng tuyến hoàn hảo giữa X1 và X2 ; r23 = 1 X1 và X3 không có cộng tuyến hoàn hảo, nhưng hai biến này có tương quan chặt chẽ. 108
  6. Lưu ý:  Giả định về sự đa cộng tuyến liên quan đến mối quan hệ tuyến tính giữa các biến Xi, và không đề cập đến các mối quan hệ phi tuyến tính.  Xem xét mô hình: Y =  0 +  1 X +  2 X2 +  3 X3 + U Rõ ràng X2 và X3 có mối quan hệ hàm số với X nhưng phi tuyến tính nên không vi phạm giả định về đa cộng tuyến. 109
  7. Ước lượng tham số khi có đa cộng tuyến  Xét mô hình hồi qui 2 biến dưới dạng sau: Yi =  0 +  1 X1i +  2 X2i + Ui yi =  1x1i +  2x2i + Ui Với: xi  X i  X , yi  Yi  Y 2  yi x2i  x1i   yi x1i  x1i x2i b2  2 2 2  x1i  x2i  ( x1i x2i ) 2  x1i 2 Var (b2 )  2 2 2   x1i  x2i  ( x1i x2i ) 110
  8.  Trường hợp đa cộng tuyến hoàn hảo: Giả sử x2i = x1i 2 ( yi x2i )(  x1i )  (  yi x1i )( x1i x2i ) b2  ( x1i )( x2i )  ( x1i x2i ) 2 2 2 2  x1i Var (b2 )  2 2 2 2 ( x1i )(  x2i )  ( x1i x2i ) Thay vào chúng ta thấy mẫu số đều bằng 0. Do đó ước lượng tham số và phương sai không còn ý nghĩa. 111
  9. Trường hợp đa cộng tuyến gần hoàn hảo: Nếu x1, x2 có quan hệ tuyến tính chặt chẽ r12 gần ±1 2 1 Var (b1)  2 . 2  x1i 1  r 12 2 1 Var (b2 )  . 2 2  x2i 1  r12 Chúng ta thấy mẫu số sẽ tiến về 0 nên ước lượng phương sai sẽ rất lớn. 112
  10. Hậu quả nếu có đa cộng tuyến gần hoàn hảo: 1. Ước lượng phương sai sẽ lớn. 2. Ước lượng các tham số sẽ rộng.  i  (bi  t n  k 1, / 2 Sbi ) 3. Kiểm định tham số có khuynh hướng chấp nhận. bi t Sbi 4. Các ước lượng sẽ nhạy với thay đổi nhỏ của dữ liệu. 5. Dấu của các tham số có thể sai. 6. Thêm vào hoặc bớt đi biến có đa cộng tuyến mô hình sẽ thay đổi nhiều. 113
  11. Phát hiện đa cộng tuyến 1. Hệ số R2 lớn (>0,8) nhưng tỷ số t nhỏ. Ví dụ: Thực hiện hồi qui file hoi quy boi M ode l Summary Adjusted Std. Error of Model R R Square R Square the Estimate 1 ,881 a ,776 ,757 1,77383 a. Predictors: (Constant), dung tich dong co (lit), cong suat dong co (HP), trong luong xe (kg), so may (cylinder) a Coefficients Unstandardized Standardized Coefficients Coefficients Model B Std. Error Beta t Sig. 1 (Constant) 26,234 2,319 11,312 ,000 cong suat dong co (HP) -,046 ,016 -,348 -2,783 ,008 trong luong xe (kg) -,009 ,002 -,722 -4,161 ,000 so may (cylinder) ,244 ,536 ,100 ,455 ,651 dung tich dong co (lit) ,178 ,882 ,063 ,202 ,841 a. Dependent Variable: muc tieu thu xang (km/lit) 114
  12. Phát hiện đa cộng tuyến 2. Tương quan cặp giữa các biến giải thích cao Corre lations cong suat trong luong so may dung tich dong co (HP) xe (kg) (cylinder) dong co (lit) cong suat dong co (HP) Pearson Correlation 1 ,786** ,752** ,818** Sig. (2-tailed) ,000 ,000 ,000 N 50 50 50 50 trong luong xe (kg) Pearson Correlation ,786** 1 ,802** ,901** Sig. (2-tailed) ,000 ,000 ,000 N 50 50 50 50 so may (cylinder) Pearson Correlation ,752** ,802** 1 ,941** Sig. (2-tailed) ,000 ,000 ,000 N 50 50 50 50 dung tich dong co (lit) Pearson Correlation ,818** ,901** ,941** 1 Sig. (2-tailed) ,000 ,000 ,000 N 50 50 50 50 **. Correlation is significant at the 0.01 level (2-tailed). 115
  13. Phát hiện đa cộng tuyến 3. Sử dụng mô hình hồi qui phụ: X j   0  1X 1  ...   j 1 X j 1   j 1X j 1  ...   k X k  Vi Với biến phụ thuộc là Xj có hệ số tương quan lớn. Nếu mô hình có ý nghĩa thì ta nghi ngờ có hiện tượng đa cộng tuyến. b ANOVA Sum of Model Squares df Mean Square F Sig. 1 Regression 75,849 3 25,283 287,473 ,000 a Residual 4,046 46 ,088 Total 79,895 49 a. Predictors: (Constant), so may (cylinder), cong suat dong co (HP), trong luong xe (kg) b. Dependent Variable: dung tich dong co (lit) 116
  14. Phát hiện đa cộng tuyến 4. Sử dụng yếu tố phóng đại phương sai (VIF) VIF  1 2 1 R j Rj2 là hệ số xác định của hàm hồi qui phụ. Nếu VIF lớn hơn 10 có thể nghi ngờ xảy ra hiện tượng đa cộng tuyến. 117
  15. Phát hiện đa cộng tuyến 4. Sử dụng yếu tố phóng đại phương sai (VIF) VIF  1 2 1 R j Rj2 là hệ số xác định của hàm hồi qui phụ. Nếu VIF lớn hơn 5 có thể nghi ngờ xảy ra hiện tượng đa cộng tuyến. 118
  16. 4. Sử dụng yếu tố phóng đại phương sai (VIF) 119
  17. 4. Sử dụng yếu tố phóng đại phương sai (VIF) a Coefficients Unstandardized Standardized Coefficients Coefficients Collinearity Statistics Model B Std. Error Beta t Sig. Tolerance VIF 1 (Constant) 26,234 2,319 11,312 ,000 cong suat dong co (HP) -,046 ,016 -,348 -2,783 ,008 ,318 3,141 trong luong xe (kg) -,009 ,002 -,722 -4,161 ,000 ,165 6,067 so may (cylinder) ,244 ,536 ,100 ,455 ,651 ,102 9,763 dung tich dong co (lit) ,178 ,882 ,063 ,202 ,841 ,051 19,748 a.Dependent Variable: muc tieu thu xang (km/lit) Biến dung tích nghi ngờ xảy ra hiện tượng đa cộng tuyến 120
  18. Các biện pháp khắc phục 1. Sử dụng thông tin tiên nghiệm: Ví dụ: hàm sản xuất Cobb-Douglas: Qt  AL Kt e ut t Qt là sản lượng sản phẩm sản xuất ở thời kỳ t Lt là lao động ở thời kỳ t; Kt là vốn ở thời kỳ t; Ut là sai số ngẫu nhiên Logarit 2 vế ta được: ln Q  ln A   ln L   ln K  U Q*  A*  L*  K *  U 121
  19. 1. Sử dụng thông tin tiên nghiệm: Logarit 2 vế ta được: ln Q  ln A   ln L   ln K  U Q*  A*  L*  K *  U Dựa vào thông nào đó chúng ta biết hàm sản xuất thu nhập theo qui mô không đổi:  +  = 1. =>  = 1 -  Qt*  Kt*  A*   ( L*  Kt* )  U t t  Yt*  A*  X t*  U t 122
  20. Các biện pháp khắc phục 2. Thu thập thêm số liệu hoặc thu thập mới. Hiện tượng đa cộng tuyến nhiều khi do đặc tính của mẫu, do đó khi gia tăng kích thước mẫu có thể làm giảm đa cộng tuyến. 3. Bỏ bớt biến xảy ra đa cộng tuyến: Thông thường ta bỏ biến nào gây ra đa cộng tuyến nhiều. 123
nguon tai.lieu . vn