Chương 9 - Nhập môn Kinh tế lượng * Jeffrey M.
Wooldridge
09.12.2017
Phân tích hồi quy bội:
Vấn đề dạng hàm và dữ liệu
MỘT SỐ VẤN ĐỀ MỞ RỘNG
VỀ DẠNG HÀM VÀ DỮ LIỆU
9.1 Vấn đề xác định sai dạng hàm
Chúng ta có thể kiểm định xem liệu mô hình đang xét có thiếu bình phương hay bậc cao hơn
của một biến độc lập hay không bằng cách thêm các số hạng này vào mô hình và kiểm định
xem thành phần thêm vào có ý nghĩa thống kê không.
Ngoài ra, có thể sử dụng kiểm định chung về sai dạng hàm như RESET của Ramsey.
Chương 9
Kiểm định sai dạng hàm (RESET)
Ý tưởng của RESET là thêm bình phương và bậc cao hơn của giá trị ước lượng của biến phụ
thuộc vào hàm hồi quy (giống với kiểm định White rút gọn)
y 0 1 x1 ... k xk u
Wooldridge: Introductory Econometrics:
A Modern Approach, 5e
ˆ
ˆ
y 0 1 x1 ... k xk 1 y 2 y saiso
2
3
9.2
9.3
Kiểm định xem có nên loại bỏ thành phần này hay không. Nếu ta không thể loại bỏ chúng, nghĩa là mô
hình đã thiếu bậc cao của biến độc lập và biến tương tác, hay nói cách khác, mô hình sai dạng hàm.
H0: 1=0, 2=0 H0: mô hình (9.2) có dạng hàm đúng
© 2012 Cengage Learning. All Rights Reserved. May not be scanned, copied or duplicated, or posted to a publicly accessible website, in whole or in part.
© 2012 Cengage Learning. All Rights Reserved. May not be scanned, copied or duplicated, or posted to a publicly accessible website, in whole or in part.
PHÂN TÍCH HỒI QUY BỘI:
VẤN ĐỀ DẠNG HÀM VÀ DỮ LIỆU
PHÂN TÍCH HỒI QUY BỘI:
VẤN ĐỀ DẠNG HÀM VÀ DỮ LIỆU
• Ví dụ 9.1: Mô hình kinh tế về vấn đề tội phạm
Dependent Variable: NARR86 (MH2)
Method: Least Squares
Included observations: 2725
• Tập tin crime1.wf1
Dependent Variable: NARR86 (MH1)
Method: Least Squares
Included observations: 2725
Variable
PCNV
AVGSEN
TOTTIME
PTIME86
QEMP86
INC86
BLACK
HISPAN
C
R-squared
Adjusted R-squared
Coefficient
-0.133234
-0.011318
0.012022
-0.040842
-0.050540
-0.001489
0.326503
0.193914
0.568685
0.072321
0.069588
Variable
Std. Error
0.040350
0.012240
0.009435
0.008812
0.014440
0.000341
0.045416
0.039711
0.036046
t-Statistic
-3.301949
-0.924645
1.274210
-4.634769
-3.500045
-4.370173
7.189232
4.883099
15.77660
Mean dependent var
S.D. dependent var
Biến QEMP86 là 1 biến rời rạc chỉ nhận 5 giá trị.
https://sites.google.com/a/ueh.edu.vn/phamtricao/
PCNV
PCNV^2
AVGSEN
TOTTIME
PTIME86
PTIME86^2
QEMP86
INC86
INC86^2
BLACK
HISPAN
C
Prob.
0.0010
0.3552
0.2027
0.0000
0.0005
0.0000
0.0000
0.0000
0.0000
R-squared
Adjusted R-squared
0.404404
0.859077
3
Coefficient
0.552524
-0.730212
-0.017022
0.011954
0.287433
-0.029608
-0.014094
-0.003415
7.19E-06
0.292296
0.163617
0.504607
0.103454
0.099819
Std. Error
0.154237
0.156118
0.012054
0.009282
0.044258
0.003863
0.017361
0.000804
2.56E-06
0.044830
0.039451
0.036835
t-Statistic
3.582297
-4.677317
-1.412124
1.287803
6.494462
-7.663609
-0.811813
-4.249251
2.811369
6.520096
4.147388
13.69898
Mean dependent var
S.D. dependent var
Prob.
0.0003
0.0000
0.1580
0.1979
0.0000
0.0000
0.4170
0.0000
0.0050
0.0000
0.0000
0.0000
0.404404
0.859077
4
1
Chương 9 - Nhập môn Kinh tế lượng * Jeffrey M.
Wooldridge
09.12.2017
Phân tích hồi quy bội:
Vấn đề dạng hàm và dữ liệu
PHÂN TÍCH HỒI QUY BỘI:
VẤN ĐỀ DẠNG HÀM VÀ DỮ LIỆU
Wald Test: (MH2)
Equation: EQ02
Test Statistic
F-statistic
Chi-square
Value
31.40381
94.21144
df
(3, 2713)
3
Null Hypothesis: C(2)=0,C(6)=0,C(9)=0
Null Hypothesis Summary:
Normalized Restriction (= 0)
C(2)
C(6)
C(9)
Value
-0.730212
-0.029608
7.19E-06
Restrictions are linear in coefficients.
Ví dụ 9.2: Hàm hồi quy giá nhà
Probability
Bằng chứng cho thấy
có sai dạng hàm
9.5
Std. Err.
0.156118
0.003863
2.56E-06
Thảo luận
Chúng ta có thể thêm vào các bậc cao hơn của
Dependent Variable: PRICE (MH 9.4)
Method: Least Squares
Included observations: 88
R-squared
-21.77031
0.002068
0.122778
13.85252
0.672362
© 2012 Cengage Learning. All Rights Reserved. May not be scanned, copied or duplicated, or posted to a publicly accessible website, in whole or in part.
PHÂN TÍCH HỒI QUY BỘI:
VẤN ĐỀ DẠNG HÀM VÀ DỮ LIỆU
Ramsey RESET Test
Equation: EQ01
Specification: PRICE C LOTSIZE SQRFT BDRMS
Omitted Variables: Powers of fitted values from 2 to 3
• Tập tin hprice1.wf1
C
LOTSIZE
SQRFT
BDRMS
, hàm ý là thêm vào mô hình các
RESET cung cấp ít thông tin về nguyên nhân sai dạng hàm.
5
PHÂN TÍCH HỒI QUY BỘI:
VẤN ĐỀ DẠNG HÀM VÀ DỮ LIỆU
Coefficient
ˆ
y
Ít bằng chứng cho thấy
có sai dạng hàm
biến tương tác phức tạp và bậc cao hơn của các biến độc lập.
p-value = 0.0000 < 0.05 : bác bỏ H0
Vậy nên chọn mô hình 2.
Variable
9.4
0.0000
0.0000
F-statistic
Likelihood ratio
Std. Error
29.47504
0.000642
0.013237
9.010145
t-Statistic
-0.738601
3.220096
9.275093
1.537436
Mean dependent var
df
(2, 82)
2
Coefficient
Std. Error
Unrestricted Test Equation:
Dependent Variable: PRICE
Method: Least Squares
Included observations: 88
Prob.
0.4622
0.0018
0.0000
0.1279
Variable
C
LOTSIZE
SQRFT
BDRMS
FITTED^2
FITTED^3
293.5460
R-squared
7
https://sites.google.com/a/ueh.edu.vn/phamtricao/
Value
4.668205
9.489063
166.0973
0.000154
0.017599
2.174904
0.000353
1.55E-06
0.705853
317.4325
0.005203
0.299251
33.88811
0.007099
6.55E-06
Probability
0.0120
0.0087
t-Statistic
0.523252
0.029545
0.058810
0.064179
0.049786
0.235810
Mean dependent var
H0: Mô hình (9.4) có dạng hàm đúng . Với = 3%
p-value = 0.0120 < 0.03: bác bỏ H0
Prob.
0.6022
0.9765
0.9532
0.9490
0.9604
0.8142
293.5460
8
2
Chương 9 - Nhập môn Kinh tế lượng * Jeffrey M.
Wooldridge
09.12.2017
PHÂN TÍCH HỒI QUY BỘI:
VẤN ĐỀ DẠNG HÀM VÀ DỮ LIỆU
PHÂN TÍCH HỒI QUY BỘI:
VẤN ĐỀ DẠNG HÀM VÀ DỮ LIỆU
Dependent Variable: LOG(PRICE) (MH 9.5)
Method: Least Squares
Included observations: 88
Ramsey RESET Test
Equation: EQ01
Specification: PRICE C LOTSIZE SQRFT BDRMS
Omitted Variables: Powers of fitted values from 2 to 5
F-statistic
Likelihood ratio
Value
3.225850
13.15896
df
(4, 80)
4
Coefficient
Std. Error
Unrestricted Test Equation:
Dependent Variable: PRICE
Method: Least Squares
Included observations: 88
Variable
C
LOTSIZE
SQRFT
BDRMS
FITTED^2
FITTED^3
FITTED^4
FITTED^5
340.2329
0.002603
0.157983
19.32476
-0.034809
0.000191
-3.93E-07
2.83E-10
Variable
Probability
0.0166
0.0105
3320.583
0.080979
4.816594
542.8438
0.240737
0.000714
1.02E-06
5.70E-10
t-Statistic
0.102462
0.032149
0.032800
0.035599
-0.144595
0.267613
-0.383490
0.495886
C
LOG(LOTSIZE)
LOG(SQRFT)
BDRMS
R-squared
Prob.
0.9186
0.9744
0.9739
0.9717
0.8854
0.7897
0.7024
0.6213
F-statistic
Likelihood ratio
Unrestricted Test Equation:
Dependent Variable: LOG(PRICE)
Included observations: 88
0.642965
0.651284
0.038281
0.092865
0.027531
t-Statistic
-1.991517
4.387714
7.540306
1.342415
Mean dependent var
Mô hình 1:
9.6
5.633180
Variable
Coefficient
Std. Error
t-Statistic
87.88576
-4.181019
-17.34933
-0.925342
3.910284
-0.192766
240.9739
12.59521
52.48991
2.769757
13.01429
0.752080
0.364711
-0.331953
-0.330527
-0.334088
0.300461
-0.256311
Xây dựng một mô hình hỗn hợp và mỗi mô hình ban đầu là trường hợp đặc biệt
của mô hình hỗn hợp và kiểm định:
y 0 1 x1 2 x2 3 log( x1 ) 4 log( x2 ) u
Prob.
C
LOG(LOTSIZE)
LOG(SQRFT)
BDRMS
FITTED^2
FITTED^3
Dạng hàm nào sẽ
phù hợp hơn?
9.7
Mô hình 2:
0.7163
0.7408
0.7418
0.7392
0.7646
0.7984
https://sites.google.com/a/ueh.edu.vn/phamtricao/
0.0497
0.0000
0.0000
0.1831
10
Kiểm định đối với mô hình không lồng nhau
Probability
0.0831
0.0692
H0: Mô hình (9.5) có dạng hàm đúng . Với = 6%
p-value = 0.0831 > 0.06: chấp nhận H0
Prob.
Phân tích hồi quy bội:
Vấn đề dạng hàm và dữ liệu
Ramsey RESET Test
Specification: LOG(PRICE) C LOG(LOTSIZE) LOG(SQRFT) BDRMS
Omitted Variables: Powers of fitted values from 2 to 3
df
(2, 82)
2
-1.297042
0.167967
0.700232
0.036958
Std. Error
9
PHÂN TÍCH HỒI QUY BỘI:
VẤN ĐỀ DẠNG HÀM VÀ DỮ LIỆU
Value
2.565041
5.340099
Coefficient
9.8
H0: 1=0, 2=0 cho mô hình 9.7
Thảo luận
11
H0: 3=0, 4=0 cho mô hình 9.6
Luôn có thể thực hiện; tuy nhiên, không có mô hình chiếm ưu thế rõ ràng.
Không thể sử dụng nếu các mô hình có biến phụ thuộc có dạng hàm khác nhau.
© 2012 Cengage Learning. All Rights Reserved. May not be scanned, copied or duplicated, or posted to a publicly accessible website, in whole or in part.
3
Chương 9 - Nhập môn Kinh tế lượng * Jeffrey M.
Wooldridge
09.12.2017
PHÂN TÍCH HỒI QUY BỘI:
VẤN ĐỀ DẠNG HÀM VÀ DỮ LIỆU
PHÂN TÍCH HỒI QUY BỘI:
VẤN ĐỀ DẠNG HÀM VÀ DỮ LIỆU
Wald Test:
Equation: EQ03
• Tập tin hprice1.wf1
Dependent Variable: PRICE (MH 9.8)
Method: Least Squares
Included observations: 88
Variable
C
LOTSIZE
SQRFT
LOG(LOTSIZE)
LOG(SQRFT)
R-squared
Coefficient
1403.700
-0.000493
0.247463
60.21552
-282.6301
0.713293
Test Statistic
Std. Error
970.6562
0.001021
0.063686
20.04305
140.5320
t-Statistic
1.446135
-0.483133
3.885688
3.004309
-2.011144
Mean dependent var
F-statistic
Chi-square
Prob.
Normalized Restriction (= 0)
C(2)
C(3)
293.5460
F-statistic
Chi-square
Value
7.259057
14.51811
Null Hypothesis: C(4)=0,C(5)=0
Null Hypothesis Summary:
Normalized Restriction (= 0)
C(4)
C(5)
df
(2, 83)
2
Value
60.21552
-282.6301
Restrictions are linear in coefficients.
df
(2, 83)
2
Value
-0.000493
0.247463
Restrictions are linear in coefficients.
PHÂN TÍCH HỒI QUY BỘI:
VẤN ĐỀ DẠNG HÀM VÀ DỮ LIỆU
Test Statistic
7.792740
15.58548
Null Hypothesis: C(2)=0, C(3)=0
Null Hypothesis Summary:
0.1519
0.6303
0.0002
0.0035
0.0476
13
Wald Test:
Equation: EQ03
Value
Probability
0.0008
0.0004
Std. Err.
0.001021
0.063686
p-value = 0.0008 < 0.05: bác bỏ H0: 1=0, 2=0
Mô hình (9.7) không chiếm ưu thế hơn (9.6)
14
PHÂN TÍCH HỒI QUY BỘI:
VẤN ĐỀ DẠNG HÀM VÀ DỮ LIỆU
• Cách làm này chỉ cho ra kết quả tốt khi 1 giả thiết bị bác bỏ và 1 giả
thiết được chấp nhận.
• Có thể dùng kiểm định Davidson-MacKinnon, trang 350.
Probability
0.0012
0.0007
Std. Err.
20.04305
140.5320
p-value = 0.0012 < 0.05: bác bỏ H0: 3=0, 4=0
Mô hình (9.6) không chiếm ưu thế hơn (9.7)
https://sites.google.com/a/ueh.edu.vn/phamtricao/
15
16
4
Chương 9 - Nhập môn Kinh tế lượng * Jeffrey M.
Wooldridge
09.12.2017
Phân tích hồi quy bội:
Vấn đề dạng hàm và dữ liệu
9.2 Sử dụng biến đại diện cho các biến giải thích không quan sát được
Ví dụ: Bỏ sót biến năng lực trong mô hình tiền lương
Thay bằng biến đại diện
9.9
Thông thường, ước lượng của suất sinh lợi giáo dục và kinh nghiệm thường bị chệch bởi vì mô hình
có thể bỏ sót biến năng lực không quan sát được.
Ý tưởng: tìm một biến đại diện cho năng lực, có thể kiểm soát và thể hiện được năng lực khác nhau
giữa các cá nhân, khi đó hệ số hồi quy của các biến khác không còn chệch. Một trong những biến
đại diện cho năng lực là chỉ số IQ hoặc kết quả của các bài kiểm tra tương tự.
Cách sử dụng biến đại diện trong mô hình:
9.11
Phân tích hồi quy bội:
Vấn đề dạng hàm và dữ liệu
Giả thiết đối với biến đại diện
Biến đại diện “chỉ là đại diện“ cho biến bị bỏ sót, nó không thuộc vào hàm hồi
quy tổng thể, nghĩa là, nó không tương quan với nhiễu.
Nếu nhiễu và biến đại diện có tương quan, biến đại
diện cần có mặt trong mô hình hồi quy tổng thể
Biến đại diện phải đại diện “tốt“ cho biến bị bỏ sót, nghĩa là các biến khác thêm
vào không giúp gì trong dự đoán biến bị bỏ sót.
9.10
Nếu điều này không thỏa,
thì x1 và x2 cần được thêm
vào mô hình hồi quy của
biến bị bỏ sót.
Biến bỏ sót, chẳng hạn: năng lực
Hồi quy biến bỏ sót theo biến đại diện của nó (x3 đại diện cho x3*)
© 2012 Cengage Learning. All Rights Reserved. May not be scanned, copied or duplicated, or posted to a publicly accessible website, in whole or in part.
Phân tích hồi quy bội:
Vấn đề dạng hàm và dữ liệu
Khi thỏa các giả định trên, biến đại diện được sử dụng như sau:
© 2012 Cengage Learning. All Rights Reserved. May not be scanned, copied or duplicated, or posted to a publicly accessible website, in whole or in part.
Phân tích hồi quy bội:
Vấn đề dạng hàm và dữ liệu
Ví dụ 9.3: IQ là biến đại diện cho năng lực abil
Giống với kỳ vọng, suất sinh lợi giáo
dục giảm nếu IQ được đưa vào mô
hình để làm đại diện cho biến năng lực
không quan sát được.
Trong mô hình hồi quy này, sai số ngẫu nhiên e= u+β3v3 không tương quan với tất cả biến giải
thích. Khi đó, hệ số hồi quy sẽ được ước lượng đúng bằng OLS. Hệ số của biến x1 và x2 sẽ xác
định đúng. Hệ số của biến đại diện trong nhiều trường hợp cũng được quan tâm (nó là bội số
của hệ số đứng trước biến bị bỏ sót).
Hệ số hồi quy đứng trước biến IQ cho
biết sự khác nhau trong năng lực giữa
các cá nhân có ý nghĩa quan trọng đến
tiền lương (ví dụ, mức chênh lệnh 15
điểm IQ dẫn đến mức chênh lên 5,4
điểm phần trăm trong tiền lương).
Thảo luận về giả thiết biến đại diện trong hàm tiền lương
Giả thiết 1: Chỉ số IQ phải hoàn toàn không tác động trực tiếp đến tiền lương; quan trọng
Ngay cả khi chỉ số IQ không hoàn toàn
giải thích sự thay đổi do năng lực, việc
thêm nó vào mô hình ít nhất làm giảm
tính chệch của suất sinh lợi giáo dục.
là một cá nhân chứng minh năng lực trong công việc như thế nào.
Giả thiết 2: Hầu hết sự biến động của biến năng lực có thể được giải thích bởi sự thay đổi
trong chỉ số IQ, chỉ có một số ít được giải thích bởi học vấn và kinh nghiệm.
© 2012 Cengage Learning. All Rights Reserved. May not be scanned, copied or duplicated, or posted to a publicly accessible website, in whole or in part.
https://sites.google.com/a/ueh.edu.vn/phamtricao/
9.13
Có thể có đa cộng tuyến cao giữa IQ và educ
Tương tác giữa năng lực và học vấn
không có ý nghĩa.
© 2012 Cengage Learning. All Rights Reserved. May not be scanned, copied or duplicated, or posted to a publicly accessible website, in whole or in part.
5
nguon tai.lieu . vn