Xem mẫu
- THỐNG KÊ ỨNG DỤNG TRONG
TRƯỜNG ĐẠI HỌC BÁCH KHOA TP. HCM
QUẢN LÝ & KỸ THUẬT
Khoa KTXD - Bộ môn KTTNN
NỘI DUNG MÔN HỌC
Chương 1. Thống kê mô tả.
Chương 1bis. Xác suất & phân phối thống kê.
Chương 2. Khoảng tin cậy.
Chương 3. Lý thuyết kiểm định thống kê.
Chương 4. Kiểm định Cronbach’s Alpha.
Chương 5. Phân tích phương sai (ANOVA).
Giảng viên: PGS. TS. NGUYỄN THỐNG Chương 6. Hồi quy tuyến tính & giả tuyến tính.
E-mail: nguyenthong@hcmut.edu.vn or nthong56@yahoo.fr Chương 7. Xử lý số liệu thực nghiệm.
Web: http://hwww4.hcmut.edu.vn/~nguyenthong/
Chương 8. Giới thiệu phần mềm SPSS.
4/11/2014 Tél. (08) 38 640 979 - 098 99 66 719 1 4/11/2014 2
PGS. Dr. Nguyễn Thống
THỐNG KÊ ỨNG DỤNG TRONG QUẢN LÝ & KỸ THUẬT THỐNG KÊ ỨNG DỤNG TRONG QUẢN LÝ & KỸ THUẬT
Chương 6: Hồi quy tuyến tính Chương 6: Hồi quy tuyến tính
GIỚI THIỆU HỒI QUY Để có thể biểu diễn hồi quy CÓ
NGHĨA Các biến phải có tính
Đây là phương pháp nghiên NHÂN QUẢ (có ý nghĩa liên quan
cứu (định lượng) nhằm giải kinh tế, xã hội, vật lý,…).
thích một biến ĐỊNH LƯỢNG Lưu ý, phân tích phương sai dùng
nhờ vào 1 hoặc nhiều biến xem xét quan hệ biến giữa biến giải
ĐỊNH LƯỢNG dưới dạng một thích dạng ĐỊNH TÍNH & biến cần
phương trình toán học. được giải thích dạng ĐỊNH LƯỢNG.
4/11/2014 3 4/11/2014 4
PGS. Dr. Nguyễn Thống PGS. Dr. Nguyễn Thống
THỐNG KÊ ỨNG DỤNG TRONG QUẢN LÝ & KỸ THUẬT THỐNG KÊ ỨNG DỤNG TRONG QUẢN LÝ & KỸ THUẬT
Chương 6: Hồi quy tuyến tính Chương 6: Hồi quy tuyến tính
TỔNG QUÁT Y Y
HỒI QUY ĐƠN TUYẾN TÍNH HỒI QUY ĐƠN PHI TUYẾN
(đường thẳng)
HỒI QUY TUYẾN TÍNH
HỒI QUY PHI TUYẾN X X
0 Y 0
X2
HỒI QUY BỘI
0 (mặt phẳng or siêu mặt phẳng)
4/11/2014 5 4/11/2014 X1 6
PGS. Dr. Nguyễn Thống PGS. Dr. Nguyễn Thống
1
- THỐNG KÊ ỨNG DỤNG TRONG QUẢN LÝ & KỸ THUẬT THỐNG KÊ ỨNG DỤNG TRONG QUẢN LÝ & KỸ THUẬT
Chương 6: Hồi quy tuyến tính Chương 6: Hồi quy tuyến tính
HỒI QUY TUYẾN TÍNH HỒI QUY
Hồi quy tuyến tính đơn TUYẾN TÍNH ĐƠN
Hồi quy tuyến tính bội
4/11/2014 7 4/11/2014 8
PGS. Dr. Nguyễn Thống PGS. Dr. Nguyễn Thống
THỐNG KÊ ỨNG DỤNG TRONG QUẢN LÝ & KỸ THUẬT THỐNG KÊ ỨNG DỤNG TRONG QUẢN LÝ & KỸ THUẬT
Chương 6: Hồi quy tuyến tính TãM T¾THồi quy tuyến tính
Chương 6: Lý THUYÕT
M« h×nh ®îc m« t¶ bëi ph¬ng tr×nh tuyÕn tÝnh cã d¹ng
HỒI QUY TUYẾN TÍNH ĐƠN
y t b0 a1X1,t t
sau:
t=1 N (sè lîng quan tr¾c)
Y yt gi¸ biÕn cÇn nghiªn cøu t¹i thêi ®iÓm t, xi,t gi¸ trÞ biÕn gi¶i
thÝch thø i t¹i thêi ®iÓm t.
Yi
di Ñöôøng thaúng N sè lîng quan tr¾c c¸c biÕn.
hoài quy ñôn b0, a1 : tham sè m« h×nh sÏ ®îc x¸c ®Þnh tõ sè liÖu quan s¸t
X t: sai soá cuûa moâ hình.
0 Xi
4/11/2014 9 4/11/2014 10
PGS. Dr. Nguyễn Thống PGS. Dr. Nguyễn Thống
THỐNG KÊ ỨNG DỤNG TRONG QUẢN LÝ & KỸ THUẬT THỐNG KÊ ỨNG DỤNG TRONG QUẢN LÝ & KỸ THUẬT
Chương 6: Hồi quy tuyến tính Chương 6: Hồi quy tuyến tính
PHƯƠNG TRÌNH HỒI QUY Gọi yi là khoảng cách thẳng đứng từ
TUYẾN TÍNH ĐƠN giá trị quan sát (xi,yi) đến đường thẳng
Xu theá tuyeán tính
?
cần xác định. Ta định nghĩa haøm muïc
?
Y Y=b0+a1X ?
tieâu:
Quan sát
ΔY4 2
N N
ΔY3 D Yi2 Yi (b 0 a1X i ) min
i 1 i 1
Y0
0
4/11/2014
t t t3 t4 t5 tI tN 11
X 4/11/2014 Hồi quy 12
PGS. Dr. Nguyễn Thống 2
1 PGS. Dr. Nguyễn Thống
2
- THỐNG KÊ ỨNG DỤNG TRONG QUẢN LÝ & KỸ THUẬT THỐNG KÊ ỨNG DỤNG TRONG QUẢN LÝ & KỸ THUẬT
Chương 6: Hồi quy tuyến tính Chương 6: Hồi quy tuyến tính
Đây là một hàm 2 biến b0 và a1, để cho Töø ñoù: 2y b i 0 a1x i 0 [1]
D cực trị (với ý nghĩa vật lý của bài i
toán ta biết đó là cực tiểu) ta phải có: 2y b
i 0 a1x i x i 0 [2]
D
i
Giải hệ phương trình trên ta có:
b 0 (1)
0 x y i i Nx i y i
b 0 y i a 1x i
D 0
i
a1
( 2) x 2
i Nx i2
4/11/2014
PGS. Dr. Nguyễn Thống
a 1
13 4/11/2014
PGS. Dr. Nguyễn Thống
i 14
THỐNG KÊ ỨNG DỤNG TRONG QUẢN LÝ & KỸ THUẬT THỐNG KÊ ỨNG DỤNG TRONG QUẢN LÝ & KỸ THUẬT
Chương 6: Hồi quy tuyến tính Chương 6: Hồi quy tuyến tính
HAØM TÍNH a, b TRONG EXCEL PHƯƠNG TRÌNH PHƯƠNG SAI
Intercept(Y,X) tính tung ñoä
N
goác b cuûa quan heä tuyeán tính. SST yi y Phöông sai toång
2
Linest(Y,X) tính heä soá a (ñoä i 1 (baûn chaát soá lieäu)
doác cuûa quan heä tuyeán tính giöõa Sum of Square Total
Yi & Xi).
N
SSE yi y
ˆ Phöông sai moâ hình 2
i 1 (chaát löôïng moâ hình)
4/11/2014 15 Sum of Square Explicative
4/11/2014 16
PGS. Dr. Nguyễn Thống PGS. Dr. Nguyễn Thống
THỐNG KÊ ỨNG DỤNG TRONG QUẢN LÝ & KỸ THUẬT THỐNG KÊ ỨNG DỤNG TRONG QUẢN LÝ & KỸ THUẬT
Chương 6: Hồi quy tuyến tính Chương 6: Hồi quy tuyến tính
N
2 Phöông sai thaëng dö KIỂM ĐỊNH & ĐÁNH GIÁ
SSR yi yi
ˆ
(sai soá moâ hình)
i 1
Sum of Square Residual CHẤT LƯỢNG MÔ HÌNH
SST = SSE + SSR [1] HỒI QUY
[1] phöông trình phöông sai
yi: giaù trò quan saùt, y : giaù trò tính töø moâ hình
ˆ
y : giaù trò trung bình bieán nghieân cöùu
4/11/2014 17 4/11/2014 18
PGS. Dr. Nguyễn Thống PGS. Dr. Nguyễn Thống
3
- THỐNG KÊ ỨNG DỤNG TRONG QUẢN LÝ & KỸ THUẬT THỐNG KÊ ỨNG DỤNG TRONG QUẢN LÝ & KỸ THUẬT
Chương 6: Hồi quy tuyến tính Chương 6: Hồi quy tuyến tính
CHẤT LƯỢNG Hệ số xác định R2 hiệu chỉnh:
Khi số liệu quan sát n nhỏ, giá trị R2
Hệ số xác định R2 được hiệu chỉnh như sau (k=1: hồi
2
y i y quy đơn): n 1
0 1
SSE SSR
R2 1 i R2 1 (1 R 2 )
y y n k 1
2
SST SST i
i Chú ý: Khi n lớn
R2 1 mô hình càng TỐT R2 R2
4/11/2014
PGS. Dr. Nguyễn Thống
19 4/11/2014
PGS. Dr. Nguyễn Thống R2 R2 20
THỐNG KÊ ỨNG DỤNG TRONG QUẢN LÝ & KỸ THUẬT THỐNG KÊ ỨNG DỤNG TRONG QUẢN LÝ & KỸ THUẬT
Chương 6: Hồi quy tuyến tính Chương 6: Hồi quy tuyến tính
Các hệ số trong mô hình hồi quy chỉ
KIỂM ĐỊNH HỆ SỐ a, b có nghĩa khi nó KHÁC zero.
MÔ HÌNH
ai, b là các giá trị trung bình
Yimo hinh aX i b
thống kê. Khác zero ???
Kiểm định ai là khác 0 hay ai , b là các giá trị trung bình thống kê
bằng 0 theo quan điểm thống Kiểm định ai, b là khác 0 hay bằng 0
kê. theo quan điểm thống kê.
4/11/2014 21
Dùng kiểm định Student (T test).
22
PGS. Dr. Nguyễn Thống
THỐNG KÊ ỨNG DỤNG TRONG QUẢN LÝ & KỸ THUẬT THỐNG KÊ ỨNG DỤNG TRONG QUẢN LÝ & KỸ THUẬT
Chương 6: Hồi quy tuyến tính Chương 6: Hồi quy tuyến tính
KIỂM ĐỊNH HỆ SỐ ai MÔ HÌNH ĐỘ LỆCH CHUẨN CỦA ai , b
ai 0 biến độc trong phươngi
có nghĩa
lập liên kết X Giá trị độ lệch chuẩn của các hệ
trình hồi quy. số ai & b xác định như sau:
ai 0 biến Xi KHÔNG CÓ
trong phương trình hồi
quy.
Kiểm định Student
4/11/2014 23 4/11/2014 24
PGS. Dr. Nguyễn Thống PGS. Dr. Nguyễn Thống
4
- THỐNG KÊ ỨNG DỤNG TRONG QUẢN LÝ & KỸ THUẬT THỐNG KÊ ỨNG DỤNG TRONG QUẢN LÝ & KỸ THUẬT
Chương 6: Hồi quy tuyến tính Chương 6: Hồi quy tuyến tính
Để kiểm định a, b KHÁC zero hay Gọi a giá trị độ lệch chuẩn của
hệ số a:
không ta cần có giá trị a, b và các Số quan sát
giá trị độ lệch chuẩn của nó. Gọi: A SSR / n k 1
1
Giá trị độ lệch chuẩn trong các Số biến độc lập
phần mềm thường có tên A 2 X i2 nX 2 (hồi quy đơn k=1)
i
Standard Error.
Biến kiểm định : t Stat =[a] / A1 Giá trị TB của Xi
a
[Standard Error] A2
Dùng kiểm định Student. 25 26
THỐNG KÊ ỨNG DỤNG TRONG QUẢN LÝ & KỸ THUẬT THỐNG KÊ ỨNG DỤNG TRONG QUẢN LÝ & KỸ THUẬT
Chương 6: Hồi quy tuyến tính Chương 6: Hồi quy tuyến tính
Gọi: GIAÛI THÍCH KIEÅM ÑÒNH STUDENT (kieåm ñònh
b giá trị độ lệch chuẩn của hệ caùc heä soá ai cuûa moâ hình vaø 0) BAÈNG ÑOÀ THÒ
số b: S
Xi2 A
Phân Student
b i
* 1 0
n A2
-t -t5% t5% t
- Neáu S > 5% t=0 theo quan ñieåm thoáng keâ.
- Neáu S < 5% t khaùc 0 theo quan ñieåm thoáng keâ.
27 4/11/2014 28
PGS. Dr. Nguyễn Thống
THỐNG KÊ ỨNG DỤNG TRONG QUẢN LÝ & KỸ THUẬT THỐNG KÊ ỨNG DỤNG TRONG QUẢN LÝ & KỸ THUẬT
Chương 6: Hồi quy tuyến tính Chương 6: Hồi quy tuyến tính
VÍ DỤ TÍNH TỰ TƯƠNG QUAN
i (t ) i 1 (t ) i2 (t ) with , 0
có tính TỰ TƯƠNG QUAN BẬC 2
Chuỗi trể bậc 1 của
i 0 1 2 3
i 4 6 7 3
i-1 4 6 7
4/11/2014 29 4/11/2014 30
PGS. Dr. Nguyễn Thống PGS. Dr. Nguyễn Thống
5
- THỐNG KÊ ỨNG DỤNG TRONG QUẢN LÝ & KỸ THUẬT
Chương 6: Hồi quy tuyến tính
Xét hồi quy tuyến tính bội bậc k:
KIỂM ĐỊNH CÁC THẶNG DƯ CÓ
Yi a1X1,i a 2X2,i ... a k X k,i i BỊ TÍNH TỰ TƯƠNG QUAN
Kiểm định Durbin-Watson, DW
Biến cần Thặng dư
X Biến giải thích
giải thích
ei yi yi
Sai số mô hình
Giá trị quan sát
Giá trị từ mô hình
31 4/11/2014 32
PGS. Dr. Nguyễn Thống
THỐNG KÊ ỨNG DỤNG TRONG QUẢN LÝ & KỸ THUẬT THỐNG KÊ ỨNG DỤNG TRONG QUẢN LÝ & KỸ THUẬT
Chương 6: Hồi quy tuyến tính Chương 6: Hồi quy tuyến tính
CHÚ Ý TỰ TƯƠNG QUAN
Tính tự tương quan bậc 1
Yt a 0 a1X1,t t
ei ei 1
Mô hình hồi quy tuyến tính đơn sẽ
TỐT khi t là một “NHIỄU TRẮNG” Với khác 0 có tính TỰ
Nó KHÔNG CÓ tính tự tương quan TƯƠNG QUAN BẬC 1 MÔ
HÌNH CHƯA TỐT THÊM BIẾN
4/11/2014 33 ???
4/11/2014 34
PGS. Dr. Nguyễn Thống PGS. Dr. Nguyễn Thống
THỐNG KÊ ỨNG DỤNG TRONG QUẢN LÝ & KỸ THUẬT THỐNG KÊ ỨNG DỤNG TRONG QUẢN LÝ & KỸ THUẬT
Chương 6: Hồi quy tuyến tính Chương 6: Hồi quy tuyến tính
Kiểm định Durbin-Watson Tham số DW
Trong thực hành có thể dùng i i1 2
kiểm định Durbin-Watson để DW i 2
đánh giá (Tham số DW):
i 1
2
i
DW 2 Ok DW =2 Chuỗi KHÔNG có
DW KHÁC giá trị 2 càng nhiều
càng có nguy cơ tính TỰ tính tự tương quan
TƯƠNG QUAN CỦA ei.
4/11/2014 35 4/11/2014 36
PGS. Dr. Nguyễn Thống PGS. Dr. Nguyễn Thống
6
- THỐNG KÊ ỨNG DỤNG TRONG QUẢN LÝ & KỸ THUẬT THỐNG KÊ ỨNG DỤNG TRONG QUẢN LÝ & KỸ THUẬT
Chương 6: Hồi quy tuyến tính Chương 6: Hồi quy tuyến tính
Ví duï: Moät thí nghieäm xaùc ñònh goùc noäi ma saùt vaø löïc
Xem SPSS dính cuûa taàng ñòa chaát nghieân cöùu. Keát quaû cuûa 12 thí
nghieäm cho caùc öùng suaát tieáp vaø öùng suaát phaùp
TKUD \ Durbin Watson Exampe 1.sav ñöôïc trình baøy trong baûng sau. Xaùc ñònh vaø c trong
quan heä.
tg c Hệ số m/hình hqtt
Mẫu 1 2 3 4 5 6
kg/cm2) 3.2 3.7 3.7 4.2 5.2 5.3
(kg/cm2) 3.6 4.2 4.3 4.9 6.2 6.5
Mẫu 7 8 9 10 11 12
kg/cm2) 5.5 5.8 6.1 6.6 8.3 9.0
4/11/2014 37
(kg/cm2)
4/11/2014
6.6 7.0 7.5 8.1 10.4 11.4 38
PGS. Dr. Nguyễn Thống PGS. Dr. Nguyễn Thống
THỐNG KÊ ỨNG DỤNG TRONG QUẢN LÝ & KỸ THUẬT THỐNG KÊ ỨNG DỤNG TRONG QUẢN LÝ & KỸ THUẬT
Chương 6: Hồi quy tuyến tính Chương 6: Hồi quy tuyến tính
SỬ DỤNG EXCEL HOẶC
SPSS ĐỂ ỨNG DỤNG TÍNH
HỒI QUY TUYẾN TÍNH EXCEL
4/11/2014 39 4/11/2014 40
PGS. Dr. Nguyễn Thống PGS. Dr. Nguyễn Thống
THỐNG KÊ ỨNG DỤNG TRONG QUẢN LÝ & KỸ THUẬT THỐNG KÊ ỨNG DỤNG TRONG QUẢN LÝ & KỸ THUẬT
Chương 6: Hồi quy tuyến tính Chương 6: Hồi quy tuyến tính
4/11/2014 41 4/11/2014 42
PGS. Dr. Nguyễn Thống PGS. Dr. Nguyễn Thống
7
- THỐNG KÊ ỨNG DỤNG TRONG QUẢN LÝ & KỸ THUẬT THỐNG KÊ ỨNG DỤNG TRONG QUẢN LÝ & KỸ THUẬT
Chương 6: Hồi quy tuyến tính Chương 6: Hồi quy tuyến tính
SPSS
Analyze Regression
Linear
4/11/2014 43 4/11/2014 44
PGS. Dr. Nguyễn Thống PGS. Dr. Nguyễn Thống
THOÁNG KEÂ ÖÙNG DUÏNG TRONG QUAÛN LY & KYÕ THUAÄT THOÁNG KEÂ ÖÙNG DUÏNG TRONG QUAÛN LY & KYÕ THUAÄT
Chöông 4: Hoài quy tuyeán tính Chöông 4: Hoài quy tuyeán tính
4/11/2014 45 4/11/2014 46
PGS. Dr. Nguyễn Thống PGS. Dr. Nguyễn Thống
THOÁNG KEÂ ÖÙNG DUÏNG TRONG QUAÛN LY & KYÕ THUAÄT THỐNG KÊ ỨNG DỤNG TRONG QUẢN LÝ & KỸ THUẬT
Chöông 4: Hoài quy tuyeán tính Chương 6: Hồi quy tuyến tính
HỒI QUY
TUYẾN TÍNH BỘI
4/11/2014 47 4/11/2014 48
PGS. Dr. Nguyễn Thống PGS. Dr. Nguyễn Thống
8
- THỐNG KÊ ỨNG DỤNG TRONG QUẢN LÝ & KỸ THUẬT THỐNG KÊ ỨNG DỤNG TRONG QUẢN LÝ & KỸ THUẬT
Chương 6: Hồi quy tuyến tính Chương 6: Hồi quy tuyến tính
Trong trường hợp số biến giải GIẢ THIẾT
thích >1 hồi quy tuyến tính Giả thiết về ngẫu nhiên
bội. Biến cần được giải thích
• H1 : các giá trị của xi,t được quan
trắc đúng (không có sai số).
Y a 0 a1X1 a 2 X 2 ... a k X k
• H2 : E(t )=0; trung bình số học
Ví dụ: Hồi quy tuyến tính bội bậc của các sai số là bằng 0.
k. Biến giải thích
4/11/2014 49 4/11/2014 50
PGS. Dr. Nguyễn Thống PGS. Dr. Nguyễn Thống
THỐNG KÊ ỨNG DỤNG TRONG QUẢN LÝ & KỸ THUẬT THỐNG KÊ ỨNG DỤNG TRONG QUẢN LÝ & KỸ THUẬT
Chương 6: Hồi quy tuyến tính Chương 6: Hồi quy tuyến tính
• H3 : H3 hs
E( t2 ) 2 hs.
2
Phương sai của sai số là hằng
t
số với mọi t (biên độ dao động
của quanh giá trị TB của nó
là không bị phân kỳ). hs
2
4/11/2014 51 4/11/2014 52
PGS. Dr. Nguyễn Thống PGS. Dr. Nguyễn Thống
THỐNG KÊ ỨNG DỤNG TRONG QUẢN LÝ & KỸ THUẬT THỐNG KÊ ỨNG DỤNG TRONG QUẢN LÝ & KỸ THUẬT
Chương 6: Hồi quy tuyến tính Chương 6: Hồi quy tuyến tính
• H4 : các sai số thì độc lập với nhau. Giả thiết về cấu trúc
E( t . t p ) 0 if p 0 • H6 : các biến giải thích là độc lập
tuyến tính với nhau, điều này cho
• H5 : Cov(xi,t , t )=0 : các sai số độc phép ma trận [X’X] nghịch đảo được.
lập với biến giải thích. (Tính đa cộng tuyến trong hồi quy bội -
Cần loại bỏ)
4/11/2014 53 4/11/2014 54
PGS. Dr. Nguyễn Thống PGS. Dr. Nguyễn Thống
9
- THỐNG KÊ ỨNG DỤNG TRONG QUẢN LÝ & KỸ THUẬT THỐNG KÊ ỨNG DỤNG TRONG QUẢN LÝ & KỸ THUẬT
Chương 6: Hồi quy tuyến tính Chương 6: Hồi quy tuyến tính
Giả thiết về cấu trúc XÁC ĐỊNH HỆ SỐ MÔ HÌNH aI
• H7 : X’X/n tiến về giới hạn hữu hạn Dùng phương pháp BPTT (xem
n. tài liệu Kinh tế lượng- Tg. Dr.
• H8 : n>(k+1) : số lượng quan trắc phải Nguyễn Thống).
Yn,1 Xn,k1 xak1,1 t n,1
lớn hơn số lượng biến giải thích.
Gọi
Sai số mô hình
4/11/2014 55 4/11/2014 56
PGS. Dr. Nguyễn Thống PGS. Dr. Nguyễn Thống
THỐNG KÊ ỨNG DỤNG TRONG QUẢN LÝ & KỸ THUẬT THỐNG KÊ ỨNG DỤNG TRONG QUẢN LÝ & KỸ THUẬT
Chương 6: Hồi quy tuyến tính Chương 6: Hồi quy tuyến tính
Hệ số của mô hình hồi
Với: quy cần xác định THIẾT LẬP PHƯƠNG TRÌNH
y1 1 x11 . x k1 a0 ĐỂ XÁC ĐỊNH ai
y 1 x12 . xk2 a
Y 2 X
. . . . .
a 1
. Yn,1 Xn,k1 xak1,1 t n,1
y 1 x . x kn ( n ,k 1) a k (k 1,1)
n ( n ,1) 1n Min
n số quan trắc, k số biến độc lập
4/11/2014 57 4/11/2014 58
PGS. Dr. Nguyễn Thống PGS. Dr. Nguyễn Thống
THỐNG KÊ ỨNG DỤNG TRONG QUẢN LÝ & KỸ THUẬT THỐNG KÊ ỨNG DỤNG TRONG QUẢN LÝ & KỸ THUẬT
Chương 6: Hồi quy tuyến tính Chương 6: Hồi quy tuyến tính
Dùng p/p bình phương tối thiểu: ÔN
M in M in( )
2
t
'
t t Ví dụ: Tính module của vectơ U
i
2
M inY Xa Y Xa
U U 2,3
3
M in(S)
UU U 2 * 2 3 * 3 13
2
4/11/2014
X Ma trận chuyển vị của X 59 4/11/2014 60
PGS. Dr. Nguyễn Thống PGS. Dr. Nguyễn Thống
10
- THỐNG KÊ ỨNG DỤNG TRONG QUẢN LÝ & KỸ THUẬT THỐNG KÊ ỨNG DỤNG TRONG QUẢN LÝ & KỸ THUẬT
Chương 6: Hồi quy tuyến tính Chương 6: Hồi quy tuyến tính
MA TRẬN SUY BiẾN Vì S =f(a) S cực trị (cực tiểu) :
Ví dụ: Xét ma trận vuông sau: S
Y Y Y Xa a X Y a X Xa 0
1 5 a a
U det U 0
3 15 Chú ý:
Giải thích: Xét theo hàng (hoặc cột),
các vectơ là “phụ thuộc tuyến Y Xa aY X Y X X Y
a a
tính” ma trận U suy biến
det[U] =0.
4/11/2014
PGS. Dr. Nguyễn Thống
61 4/11/2014
PGS. Dr. Nguyễn Thống
62
THỐNG KÊ ỨNG DỤNG TRONG QUẢN LÝ & KỸ THUẬT THỐNG KÊ ỨNG DỤNG TRONG QUẢN LÝ & KỸ THUẬT
Chương 6: Hồi quy tuyến tính Chương 6: Hồi quy tuyến tính
Do đó: S CHÚ Ý
2XY 2XXa 0
a Để ma trận :
XX1
a a XX XY det XX 0
1
nghịch đảo được
Khi det XX 0 Hiện tượng
[X]’ ma trận chuyển vị [X] ĐA CỘNG TUYẾN trong hồi quy
4/11/2014 63
tuyến tính bội.
4/11/2014 64
PGS. Dr. Nguyễn Thống PGS. Dr. Nguyễn Thống
THỐNG KÊ ỨNG DỤNG TRONG QUẢN LÝ & KỸ THUẬT THỐNG KÊ ỨNG DỤNG TRONG QUẢN LÝ & KỸ THUẬT
Chương 6: Hồi quy tuyến tính Chương 6: Hồi quy tuyến tính
ÔN CHÚ Ý
Xét ma trận: det XX 0 Khi các vectơ Xk
1 2 (vectơ biến độc lập) có mang tính
[ A] det A 1* 6 2 * 3 0 PHỤ THUỘC TUYẾN TÍNH với
3 6
nhau.
Nhận xét 2 vectơ cột là PHỤ THUỘC
TUYẾN TÍNH: PTTT Vectơ bất kỳ Xk là tổ hợp
2 1 tuyến tính của các vectơ còn lại.
6 23 !!!
4/11/2014 65 4/11/2014 66
PGS. Dr. Nguyễn Thống PGS. Dr. Nguyễn Thống
11
- THỐNG KÊ ỨNG DỤNG TRONG QUẢN LÝ & KỸ THUẬT THỐNG KÊ ỨNG DỤNG TRONG QUẢN LÝ & KỸ THUẬT
Chương 6: Hồi quy tuyến tính Chương 6: Hồi quy tuyến tính
Phụ thuộc tuyến tính giữa Xk Ví dụ: Sè liÖu quan s¸t trong 6 n¨m vÒ tiªu dïng (Y),
thu nhËp (X1) vµ tuæi trung b×nh (X2) nh sau. Dïng
1 x11 . x k1 phÇn mÒm SPSS x¸c ®Þnh håi quy tuyÕn tÝnh.
a. X¸c ®Þnh c¸c hÖ sè cña m« h×nh.
X
1 x12 . xk2 b. X¸c ®Þnh ®é lÖch chuÈn cña c¸c hÖ sè.
. . . .
c. KiÔm ®Þnh gi¶ thiÕt c¸c hÖ sè nµy so víi 0.
1
x 1n . x kn ( n ,k1)
Y a 0 a1X1 a 2 X 2
n số quan trắc, k số biến độc lập
4/11/2014
PGS. Dr. Nguyễn Thống
67 4/11/2014
PGS. Dr. Nguyễn Thống
68
THỐNG KÊ ỨNG DỤNG TRONG QUẢN LÝ & KỸ THUẬT THỐNG KÊ ỨNG DỤNG TRONG QUẢN LÝ & KỸ THUẬT
Chương 6: Hồi quy tuyến tính Chương 6: Hồi quy tuyến tính
i Y X1 X2
1 140 200 45
2
3
155
180
220
250
34
28
XÁC ĐỊNH
HỆ SỐ
4 195 270 24
5 270 400 36
6 330 500 40
Y a 0 a1X1 a 2 X 2 MÔ HÌNH
Xem SPSS TKUD \ HoiQuyBoi_1.sav
4/11/2014 69 4/11/2014 70
PGS. Dr. Nguyễn Thống PGS. Dr. Nguyễn Thống
THỐNG KÊ ỨNG DỤNG TRONG QUẢN LÝ & KỸ THUẬT THỐNG KÊ ỨNG DỤNG TRONG QUẢN LÝ & KỸ THUẬT
Chương 6: Hồi quy tuyến tính Chương 6: Hồi quy tuyến tính
Mô hình Y = 37.22+0.629X1 – 0.537X2
Unstandardized
Coefficients
Standardized
Coefficients
ĐỘ LỆCH CHUẨN
Model
1 (Constant)
B
37.22
Std. Error
3.60
Beta t Sig.
10.33 .002 CỦA CÁC
X1 .629 .006 1.009 99.10 .000
X2 -.537 .097 -.056 -5.52 .012 HỆ SỐ MÔ HÌNH
4/11/2014 71 4/11/2014 72
PGS. Dr. Nguyễn Thống PGS. Dr. Nguyễn Thống
12
- THỐNG KÊ ỨNG DỤNG TRONG QUẢN LÝ & KỸ THUẬT THỐNG KÊ ỨNG DỤNG TRONG QUẢN LÝ & KỸ THUẬT
Chương 6: Hồi quy tuyến tính Chương 6: Hồi quy tuyến tính
Độ lệch chuẩn
KIỂM ĐỊNH CÁC HỆ SỐ CỦA ai MÔ
Unstandardized Standardized
Coefficients Coefficients HÌNH CÓ NGHĨA HAY KHÔNG
Model
1 (Constant)
B
37.22
Std. Error
3.60
Beta t Sig.
10.33 .002
(KHÁC 0 HAY BẰNG 0 THEO QUAN
X1 .629 .006 1.009 99.10 .000 ĐIỂM THỐNG KÊ)
X2 -.537 .097 -.056 -5.52 .012
4/11/2014 73 4/11/2014 74
PGS. Dr. Nguyễn Thống PGS. Dr. Nguyễn Thống
THỐNG KÊ ỨNG DỤNG TRONG QUẢN LÝ & KỸ THUẬT THỐNG KÊ ỨNG DỤNG TRONG QUẢN LÝ & KỸ THUẬT
Chương 6: Hồi quy tuyến tính Chương 6: Hồi quy tuyến tính
t B / Std.Error a i / a i Unstandardized Standardized
Coefficients Coefficients
Model B Std. Error Beta t Sig.
Unstandardized Standardized
1 (Constant) 37.22 3.60 10.33 .002
Coefficients Coefficients
Model B Std. Error Beta t Sig. X1 .629 .006 1.009 99.10 .000
1 (Constant) 37.22 3.60 10.33 .002
X2 -.537 .097 -.056 -5.52 .012
X1 .629 .006 1.009 99.10 .000
X2 -.537 .097 -.056 -5.52 .012
Nếu Sig < 5% Hệ số ai KHÁC 0
4/11/2014 75 4/11/2014 76
PGS. Dr. Nguyễn Thống PGS. Dr. Nguyễn Thống
THỐNG KÊ ỨNG DỤNG TRONG QUẢN LÝ & KỸ THUẬT THỐNG KÊ ỨNG DỤNG TRONG QUẢN LÝ & KỸ THUẬT
Chương 6: Hồi quy tuyến tính Chương 6: Hồi quy tuyến tính
T¬ng tù vÝ dô 1 víi c¸c sè liÖu nh sau:
N0 y x1 x2 x3 x4 x5 Hướng dẫn: Dùng SPSS với file
1
2
147.4
187.3
2
4
5
4
20
22
8
18
51
55
TKUD\ HoiQuyBoi_2.sav
3 139.9 5 9 24 11 58
4 147.1 6 12 22 12 60
5 105.3 8 14 30 10 62
6 131.1 9 12 29 12 55
7 124.7 10 10 27 8 47
8 170.7 7 9 21 13 65
9 172.6 10 8 20 10 45
10 144.8 9 12 22 9 58
11 189.3 9 15 24 19 55
4/11/2014
12 165.5 11 13 28 18 50
77 4/11/2014 78
PGS. Dr. Nguyễn Thống PGS. Dr. Nguyễn Thống
13
- THỐNG KÊ ỨNG DỤNG TRONG QUẢN LÝ & KỸ THUẬT THỐNG KÊ ỨNG DỤNG TRONG QUẢN LÝ & KỸ THUẬT
Chương 6: Hồi quy tuyến tính Chương 6: Hồi quy tuyến tính
Hướng dẫn: Dùng SPSS với file TKUD\ Bài tập: Người ta muốn kiểm tra sự
HoiQuyBoi_2.sav quan hệ tuyến tính nếu có giữa số
Y 222.68 2.35X1 4.94X3 5.04X 4 ngày nghĩ việc không phép của công
Standardiz nhân trong năm (Y) và các yếu tố thâm
Unstandardized
ed
Coeffici Collinearity
niên (x1) và tuổi tác (X2). Xem số liệu
Coefficients
Std.
ents Statistics
Toleranc
sau.
Y a 0 a1X1 a 2 X 2
Model B Error Beta t Sig. e VIF
1 (Constant) 222.680 18.758 11.871 .000
X1 2.352 .824 .253 2.853 .029 .324 3.090
X2 -1.072 .711 -.143 -1.507 .182 .282 3.552
X3 -4.947 .461 -.687 -10.726 .000 .618 1.619
X4 5.045 .333 .777 15.163 .000 .966 1.035
X5
4/11/2014 -.368 .288 -.086 -1.276 .249 .554 791.806 4/11/2014 80
PGS. Dr. Nguyễn Thống PGS. Dr. Nguyễn Thống
THỐNG KÊ ỨNG DỤNG TRONG QUẢN LÝ & KỸ THUẬT THỐNG KÊ ỨNG DỤNG TRONG QUẢN LÝ & KỸ THUẬT
Chương 6: Hồi quy tuyến tính Chương 6: Hồi quy tuyến tính
Bài tập: Người ta muốn kiểm tra sự
TT Số ngày vắng (Y) Thâm niên (X1) Tuổi (X2)
1 5 5 30
quan hệ tuyến tính nếu có giữa lượng
2 4 15 45 rác thải hàng ngày và nhiệt độ trong
3 2 10 42 ngày (so với nhiệt độ chuẩn 650F) và
4 6 6 30 độ ẩm (so với độ ẩm chuẩn 55%). Xem
5 8 8 32
6 6 7 35 số liệu sau.
7 5 10 40
8 3 2 28 Y a 0 a1X1 a 2 X 2
9 7 5 50
10 2 19 54
4/11/2014 81 4/11/2014 82
PGS. Dr. Nguyễn Thống PGS. Dr. Nguyễn Thống
THỐNG KÊ ỨNG DỤNG TRONG QUẢN LÝ & KỸ THUẬT THỐNG KÊ ỨNG DỤNG TRONG QUẢN LÝ & KỸ THUẬT
Chương 6: Hồi quy tuyến tính Chương 6: Hồi quy tuyến tính
TT
1
Rác thải ngày (Y)
14
Nhiệt (X1)
-5
Độ ẩm (X2)
1
HIỆN TƯỢNG
2
3
12
16
-8
1
1
4 ĐA CỘNG TUYẾN
4 20 6 6
5
6
24
29 12
8 7
14
TRONG HỒI QUY
7
8
24
14
3
-2
17
2 TUYẾN TÍNH BỘI
9 16 -7 1
10 10 -3 -1
11 14 -8 -2 4/11/2014 84
4/11/2014 83
PGS. 12 Nguyễn Thống 8
Dr. -2 3 PGS. Dr. Nguyễn Thống
14
- THỐNG KÊ ỨNG DỤNG TRONG QUẢN LÝ & KỸ THUẬT THỐNG KÊ ỨNG DỤNG TRONG QUẢN LÝ & KỸ THUẬT
Chương 6: Hồi quy tuyến tính Chương 6: Hồi quy tuyến tính
Để X1, X2, …, Xi giữ vai trò là biến giải Ghi chú
thích để nghiên cứu biến Y các Để X1 & X2 là ĐỘC LẬP TUYẾN TÍNH:
biến X1, X2, Xi phải ĐỘC LẬP
TUYẾN TÍNH. [X1].[X2] 0
Đây là điều kiện « CẦN » phải có Để X1, X2 & X3 là ĐỘC LẬP TUYẾN
khi nghiên cứu hồi quy tuyến tính TÍNH:
bội. XI KHÔNG LÀ TỔ HỢP TUYẾN
nếu KHÔNG các hệ số của mô TÍNH CỦA X CÒN LẠI.
hình (ai) không xác định được !!!
4/11/2014 85 4/11/2014 86
PGS. Dr. Nguyễn Thống PGS. Dr. Nguyễn Thống
THỐNG KÊ ỨNG DỤNG TRONG QUẢN LÝ & KỸ THUẬT THỐNG KÊ ỨNG DỤNG TRONG QUẢN LÝ & KỸ THUẬT
Chương 6: Hồi quy tuyến tính Chương 6: Hồi quy tuyến tính
ĐÁNH GIÁ HIỆN TƯỢNG VIF Variance Inflation Factor
ĐA CỘNG TUYẾN 1
VIF
TRONG HỒI QUY BỘI 1 ri2
VỚI THAM SỐ VIF ri2 hệ số xác định trong hồi quy
tuyến tính của biến giải thích Xi theo
tất cả các biến giải thích Xj còn lại.
4/11/2014 87 4/11/2014 88
PGS. Dr. Nguyễn Thống PGS. Dr. Nguyễn Thống
THỐNG KÊ ỨNG DỤNG TRONG QUẢN LÝ & KỸ THUẬT THỐNG KÊ ỨNG DỤNG TRONG QUẢN LÝ & KỸ THUẬT
Chương 6: Hồi quy tuyến tính Chương 6: Hồi quy tuyến tính
VIF
VIF=f(r2)
CHÚ Ý
2 Phổ biến r2 r*
VIF càng lớn CÀNG CÓ KHẢ NĂNG của các biến độc lập.
có hiện tượng ĐA CỘNG TUYẾN (vì
r2 1)
4/11/2014 89 4/11/2014 90
PGS. Dr. Nguyễn Thống PGS. Dr. Nguyễn Thống
15
- THỐNG KÊ ỨNG DỤNG TRONG QUẢN LÝ & KỸ THUẬT THỐNG KÊ ỨNG DỤNG TRONG QUẢN LÝ & KỸ THUẬT
Chương 6: Hồi quy tuyến tính Chương 6: Hồi quy tuyến tính
Tolerence=
1/VIF
Khu vực “ÍT” có khả năng
ĐA CỘNG TUYẾN
CHÚ Ý
1 Tolerance = 1/VIF
Tolerence=1/VIF
=(1-r2)
Nếu Tolerance < (1-R2) CÓ THỂ
có hiện tượng ĐA CỘNG TUYẾN.
1
0 r2
r2 Yêu cầu: Tolerance > (1-R2)
ĐỒ THỊ ỨNG DỤNG TRONG PHÂN R2 hệ số xác định (hiệu chỉnh) của
TÍCH ĐA CỘNG TUYẾN mô hình.
4/11/2014 91 4/11/2014 92
PGS. Dr. Nguyễn Thống PGS. Dr. Nguyễn Thống
THỐNG KÊ ỨNG DỤNG TRONG QUẢN LÝ & KỸ THUẬT THỐNG KÊ ỨNG DỤNG TRONG QUẢN LÝ & KỸ THUẬT
Chương 6: Hồi quy tuyến tính Chương 6: Hồi quy tuyến tính
SPSS NHẬN BIẾT
ĐA CỘNG TUYẾN (xem SPSS với Choles. a 0 a1.Age a 2 .Weight
file HoiQuyBoi.sav)
Ví dụ: Một nghiên cứu y về quan a 3 .Height a 4 .Tension
hệ giữa Cholesterol (biến nghiên
cứu Y) và các yếu tố Tuổi (Age),
Trọng lượng (Weight), Chiều
cao (height), Áp huyết của 20
đối tượng như sau:
4/11/2014 93 4/11/2014 94
PGS. Dr. Nguyễn Thống PGS. Dr. Nguyễn Thống
THỐNG KÊ ỨNG DỤNG TRONG QUẢN LÝ & KỸ THUẬT THỐNG KÊ ỨNG DỤNG TRONG QUẢN LÝ & KỸ THUẬT
Chương 6: Hồi quy tuyến tính Chương 6: Hồi quy tuyến tính
TT Cholesterol Age Weight Height Aphuyet
1 130 25 66.0 1.775 110 TT Cholesterol Age Weight Height Aphuyet
2 125 27 60.0 1.725 120 8 170 31 68.8 1.700 105
3 140 39 56.0 1.750 140 9 160 29 55.6 1.625 135
4 135 35 70.0 1.825 130
10 150 25 58.0 1.600 140
5 160 42 65.2 1.750 120
11 150 23 64.8 1.725 115
6 140 26 64.8 1.725 110
7 180 38 72.4 1.825 115 12 220 52 66.4 1.800 125
13 240 51 63.6 1.700 135
4/11/2014 95 4/11/2014 96
PGS. Dr. Nguyễn Thống PGS. Dr. Nguyễn Thống
16
- THỐNG KÊ ỨNG DỤNG TRONG QUẢN LÝ & KỸ THUẬT THỐNG KÊ ỨNG DỤNG TRONG QUẢN LÝ & KỸ THUẬT
Chương 6: Hồi quy tuyến tính Chương 6: Hồi quy tuyến tính
TT Cholesterol Age Weight Height Aphuyet Coeffici Collinearity
14 210 48 72.8 1.825 140 ents Sig. Statistics
Std.
15 200 47 57.2 1.600 110
B Error Tolerance VIF
16 190 36 64.8 1.750 125
Constant 298.304 103.508 0.011
17 160 33 68.8 1.775 125
HEIGHT -269.803 83.826 0.006 0.383 2.613
18 170 31 72.4 1.775 140
AGE 2.826 0.384 0.000 0.924 1.082
19 150 29 59.6 1.725 135
TENSION 0.244 0.316 0.453 0.892 1.121
20 190 48 63.6 1.725 130
4/11/2014 97
WEIGHT
4/11/2014
3.203 1.041 0.008 0.378 2.643
98
PGS. Dr. Nguyễn Thống PGS. Dr. Nguyễn Thống
THỐNG KÊ ỨNG DỤNG TRONG QUẢN LÝ & KỸ THUẬT THỐNG KÊ ỨNG DỤNG TRONG QUẢN LÝ & KỸ THUẬT
Chương 6: Hồi quy tuyến tính Chương 6: Hồi quy tuyến tính
LOẠI BỎ BIẾN WEIGHT TÓM TẮT
Unstandardized Collinearity
Xem xét giá trị R2 (càng gần giá trị 1 Ok)
Coefficients Statistics Xem xét các hệ số mô hình có KHÁC 0 ?
Std. (sig
- THỐNG KÊ ỨNG DỤNG TRONG QUẢN LÝ & KỸ THUẬT THỐNG KÊ ỨNG DỤNG TRONG QUẢN LÝ & KỸ THUẬT
Chương 6: Hồi quy tuyến tính Chương 6: Hồi quy tuyến tính
Dso Promo Dso
Naêm (100tr.) Pub (tr.) (%) Xhoi 70
1996 49 41 10 0 60
1997 40 32 15 0 50
1998 41 38 10 0 40
1999 46 40 10 0
30
2000 52 40 5 0
2001 57 42 0 0 20
2002 53 44 0 0 10
2003 35 46 0 1 0
2004 65 50 5 0 1994 1996 1998 2000 2002 2004 2006
2005 64 55 0 0
4/11/2014 103 4/11/2014 104
PGS. Dr. Nguyễn Thống PGS. Dr. Nguyễn Thống
THỐNG KÊ ỨNG DỤNG TRONG QUẢN LÝ & KỸ THUẬT THỐNG KÊ ỨNG DỤNG TRONG QUẢN LÝ & KỸ THUẬT
Chương 6: Hồi quy tuyến tính Chương 6: Hồi quy tuyến tính
Pub Promo
60 16
50 14
12
40
10
30 8
20 6
4
10
2
0 0
1994 1996 1998 2000 2002 2004 2006 1994 1996 1998 2000 2002 2004 2006
4/11/2014 105 4/11/2014 106
PGS. Dr. Nguyễn Thống PGS. Dr. Nguyễn Thống
THỐNG KÊ ỨNG DỤNG TRONG QUẢN LÝ & KỸ THUẬT THỐNG KÊ ỨNG DỤNG TRONG QUẢN LÝ & KỸ THUẬT
Chương 6: Hồi quy tuyến tính Chương 6: Hồi quy tuyến tính
BIEÁN ÑÒNH TÍNH
Cã 2 lo¹i biÕn trong nghiªn cøu håi quy:
BIẾN ĐỊNH TÍNH - BiÕn ®Þnh lîng: Thu nhËp, Doanh thu,
Sè lîng s¶n phÈm tiªu thô...
- BiÕn ®Þnh tÝnh: NghÒ nghiÖp, Tr×nh ®é
v¨n hãa, Giíi tÝnh, §ång ý kh«ng ®ång
ý, Mµu s¾c, ...
4/11/2014 107 4/11/2014 108
PGS. Dr. Nguyễn Thống PGS. Dr. Nguyễn Thống
18
- THỐNG KÊ ỨNG DỤNG TRONG QUẢN LÝ & KỸ THUẬT THỐNG KÊ ỨNG DỤNG TRONG QUẢN LÝ & KỸ THUẬT
Chương 6: Hồi quy tuyến tính Chương 6: Hồi quy tuyến tính
BIEÁN ÑÒNH TÍNH
Pr F1 ; 2 F %
i Y Giíi tÝnh Trinh ®é Th©m
niªn • Coù giaù trò cuûa α, ν1, ν2 xaùc ñònh giaù trò cuûa F bôûi:
(t/nhËp)
p
Nam Nu
- THỐNG KÊ ỨNG DỤNG TRONG QUẢN LÝ & KỸ THUẬT
Chương 6: Hồi quy tuyến tính
HẾT
4/11/2014 115
PGS. Dr. Nguyễn Thống
20
nguon tai.lieu . vn