Xem mẫu

  1. THỐNG KÊ ỨNG DỤNG TRONG TRƯỜNG ĐẠI HỌC BÁCH KHOA TP. HCM QUẢN LÝ & KỸ THUẬT Khoa KTXD - Bộ môn KTTNN NỘI DUNG MÔN HỌC Chương 1. Thống kê mô tả. Chương 1bis. Xác suất & phân phối thống kê. Chương 2. Khoảng tin cậy. Chương 3. Lý thuyết kiểm định thống kê. Chương 4. Kiểm định Cronbach’s Alpha. Chương 5. Phân tích phương sai (ANOVA). Giảng viên: PGS. TS. NGUYỄN THỐNG Chương 6. Hồi quy tuyến tính & giả tuyến tính. E-mail: nguyenthong@hcmut.edu.vn or nthong56@yahoo.fr Chương 7. Xử lý số liệu thực nghiệm. Web: http://hwww4.hcmut.edu.vn/~nguyenthong/ Chương 8. Giới thiệu phần mềm SPSS. 4/11/2014 Tél. (08) 38 640 979 - 098 99 66 719 1 4/11/2014 2 PGS. Dr. Nguyễn Thống THỐNG KÊ ỨNG DỤNG TRONG QUẢN LÝ & KỸ THUẬT THỐNG KÊ ỨNG DỤNG TRONG QUẢN LÝ & KỸ THUẬT Chương 6: Hồi quy tuyến tính Chương 6: Hồi quy tuyến tính GIỚI THIỆU HỒI QUY Để có thể biểu diễn hồi quy CÓ NGHĨA  Các biến phải có tính Đây là phương pháp nghiên NHÂN QUẢ (có ý nghĩa liên quan cứu (định lượng) nhằm giải kinh tế, xã hội, vật lý,…). thích một biến ĐỊNH LƯỢNG  Lưu ý, phân tích phương sai dùng nhờ vào 1 hoặc nhiều biến xem xét quan hệ biến giữa biến giải ĐỊNH LƯỢNG dưới dạng một thích dạng ĐỊNH TÍNH & biến cần phương trình toán học. được giải thích dạng ĐỊNH LƯỢNG. 4/11/2014 3 4/11/2014 4 PGS. Dr. Nguyễn Thống PGS. Dr. Nguyễn Thống THỐNG KÊ ỨNG DỤNG TRONG QUẢN LÝ & KỸ THUẬT THỐNG KÊ ỨNG DỤNG TRONG QUẢN LÝ & KỸ THUẬT Chương 6: Hồi quy tuyến tính Chương 6: Hồi quy tuyến tính TỔNG QUÁT Y Y HỒI QUY ĐƠN TUYẾN TÍNH HỒI QUY ĐƠN PHI TUYẾN (đường thẳng)  HỒI QUY TUYẾN TÍNH  HỒI QUY PHI TUYẾN X X 0 Y 0 X2 HỒI QUY BỘI 0 (mặt phẳng or siêu mặt phẳng) 4/11/2014 5 4/11/2014 X1 6 PGS. Dr. Nguyễn Thống PGS. Dr. Nguyễn Thống 1
  2. THỐNG KÊ ỨNG DỤNG TRONG QUẢN LÝ & KỸ THUẬT THỐNG KÊ ỨNG DỤNG TRONG QUẢN LÝ & KỸ THUẬT Chương 6: Hồi quy tuyến tính Chương 6: Hồi quy tuyến tính HỒI QUY TUYẾN TÍNH HỒI QUY  Hồi quy tuyến tính đơn TUYẾN TÍNH ĐƠN  Hồi quy tuyến tính bội 4/11/2014 7 4/11/2014 8 PGS. Dr. Nguyễn Thống PGS. Dr. Nguyễn Thống THỐNG KÊ ỨNG DỤNG TRONG QUẢN LÝ & KỸ THUẬT THỐNG KÊ ỨNG DỤNG TRONG QUẢN LÝ & KỸ THUẬT Chương 6: Hồi quy tuyến tính TãM T¾THồi quy tuyến tính Chương 6: Lý THUYÕT M« h×nh ®îc m« t¶ bëi ph¬ng tr×nh tuyÕn tÝnh cã d¹ng HỒI QUY TUYẾN TÍNH ĐƠN y t  b0  a1X1,t   t sau: t=1 N (sè lîng quan tr¾c) Y yt gi¸ biÕn cÇn nghiªn cøu t¹i thêi ®iÓm t, xi,t gi¸ trÞ biÕn gi¶i thÝch thø i t¹i thêi ®iÓm t. Yi di Ñöôøng thaúng N sè lîng quan tr¾c c¸c biÕn. hoài quy ñôn b0, a1 : tham sè m« h×nh sÏ ®îc x¸c ®Þnh tõ sè liÖu quan s¸t X t: sai soá cuûa moâ hình. 0 Xi 4/11/2014 9 4/11/2014 10 PGS. Dr. Nguyễn Thống PGS. Dr. Nguyễn Thống THỐNG KÊ ỨNG DỤNG TRONG QUẢN LÝ & KỸ THUẬT THỐNG KÊ ỨNG DỤNG TRONG QUẢN LÝ & KỸ THUẬT Chương 6: Hồi quy tuyến tính Chương 6: Hồi quy tuyến tính PHƯƠNG TRÌNH HỒI QUY Gọi yi là khoảng cách thẳng đứng từ TUYẾN TÍNH ĐƠN giá trị quan sát (xi,yi) đến đường thẳng Xu theá tuyeán tính ? cần xác định. Ta định nghĩa haøm muïc ? Y Y=b0+a1X ? tieâu: Quan sát ΔY4 2 N N ΔY3 D   Yi2   Yi  (b 0  a1X i )  min i 1 i 1 Y0 0 4/11/2014 t t t3 t4 t5 tI tN 11 X 4/11/2014 Hồi quy 12 PGS. Dr. Nguyễn Thống 2 1 PGS. Dr. Nguyễn Thống 2
  3. THỐNG KÊ ỨNG DỤNG TRONG QUẢN LÝ & KỸ THUẬT THỐNG KÊ ỨNG DỤNG TRONG QUẢN LÝ & KỸ THUẬT Chương 6: Hồi quy tuyến tính Chương 6: Hồi quy tuyến tính Đây là một hàm 2 biến b0 và a1, để cho Töø ñoù:  2y  b i 0  a1x i   0 [1] D cực trị (với ý nghĩa vật lý của bài i toán ta biết đó là cực tiểu) ta phải có:  2y  b i 0  a1x i x i  0 [2]  D i Giải hệ phương trình trên ta có:  b  0 (1)   0 x y i i  Nx i y i  b 0  y i  a 1x i  D  0 i a1 ( 2) x 2 i  Nx i2 4/11/2014 PGS. Dr. Nguyễn Thống  a 1  13 4/11/2014 PGS. Dr. Nguyễn Thống i 14 THỐNG KÊ ỨNG DỤNG TRONG QUẢN LÝ & KỸ THUẬT THỐNG KÊ ỨNG DỤNG TRONG QUẢN LÝ & KỸ THUẬT Chương 6: Hồi quy tuyến tính Chương 6: Hồi quy tuyến tính HAØM TÍNH a, b TRONG EXCEL PHƯƠNG TRÌNH PHƯƠNG SAI  Intercept(Y,X)  tính tung ñoä   N goác b cuûa quan heä tuyeán tính. SST   yi  y  Phöông sai toång 2  Linest(Y,X)  tính heä soá a (ñoä i 1 (baûn chaát soá lieäu) doác cuûa quan heä tuyeán tính giöõa Sum of Square Total Yi & Xi).   N SSE   yi  y ˆ  Phöông sai moâ hình 2 i 1 (chaát löôïng moâ hình) 4/11/2014 15 Sum of Square Explicative 4/11/2014 16 PGS. Dr. Nguyễn Thống PGS. Dr. Nguyễn Thống THỐNG KÊ ỨNG DỤNG TRONG QUẢN LÝ & KỸ THUẬT THỐNG KÊ ỨNG DỤNG TRONG QUẢN LÝ & KỸ THUẬT Chương 6: Hồi quy tuyến tính Chương 6: Hồi quy tuyến tính N 2 Phöông sai thaëng dö KIỂM ĐỊNH & ĐÁNH GIÁ SSR    yi  yi  ˆ (sai soá moâ hình) i 1 Sum of Square Residual CHẤT LƯỢNG MÔ HÌNH SST = SSE + SSR [1] HỒI QUY [1] phöông trình phöông sai yi: giaù trò quan saùt, y : giaù trò tính töø moâ hình ˆ y : giaù trò trung bình bieán nghieân cöùu 4/11/2014 17 4/11/2014 18 PGS. Dr. Nguyễn Thống PGS. Dr. Nguyễn Thống 3
  4. THỐNG KÊ ỨNG DỤNG TRONG QUẢN LÝ & KỸ THUẬT THỐNG KÊ ỨNG DỤNG TRONG QUẢN LÝ & KỸ THUẬT Chương 6: Hồi quy tuyến tính Chương 6: Hồi quy tuyến tính CHẤT LƯỢNG Hệ số xác định R2 hiệu chỉnh: Khi số liệu quan sát n nhỏ, giá trị R2 Hệ số xác định R2 được hiệu chỉnh như sau (k=1: hồi  2  y i  y quy đơn): n 1  0  1 SSE SSR R2   1  i R2  1  (1  R 2 )  y  y n  k 1 2 SST SST i i Chú ý: Khi n lớn  R2 1  mô hình càng TỐT R2  R2 4/11/2014 PGS. Dr. Nguyễn Thống 19 4/11/2014 PGS. Dr. Nguyễn Thống R2  R2 20 THỐNG KÊ ỨNG DỤNG TRONG QUẢN LÝ & KỸ THUẬT THỐNG KÊ ỨNG DỤNG TRONG QUẢN LÝ & KỸ THUẬT Chương 6: Hồi quy tuyến tính Chương 6: Hồi quy tuyến tính Các hệ số trong mô hình hồi quy chỉ KIỂM ĐỊNH HỆ SỐ a, b có nghĩa khi nó KHÁC zero. MÔ HÌNH ai, b là các giá trị trung bình Yimo hinh  aX i  b thống kê. Khác zero ???  Kiểm định ai là khác 0 hay ai , b là các giá trị trung bình thống kê  bằng 0 theo quan điểm thống Kiểm định ai, b là khác 0 hay bằng 0 kê. theo quan điểm thống kê. 4/11/2014 21  Dùng kiểm định Student (T test). 22 PGS. Dr. Nguyễn Thống THỐNG KÊ ỨNG DỤNG TRONG QUẢN LÝ & KỸ THUẬT THỐNG KÊ ỨNG DỤNG TRONG QUẢN LÝ & KỸ THUẬT Chương 6: Hồi quy tuyến tính Chương 6: Hồi quy tuyến tính KIỂM ĐỊNH HỆ SỐ ai MÔ HÌNH ĐỘ LỆCH CHUẨN CỦA ai , b ai  0  biến độc trong phươngi có nghĩa lập liên kết X Giá trị độ lệch chuẩn của các hệ trình hồi quy. số ai & b xác định như sau: ai  0  biến Xi KHÔNG CÓ trong phương trình hồi quy.  Kiểm định Student 4/11/2014 23 4/11/2014 24 PGS. Dr. Nguyễn Thống PGS. Dr. Nguyễn Thống 4
  5. THỐNG KÊ ỨNG DỤNG TRONG QUẢN LÝ & KỸ THUẬT THỐNG KÊ ỨNG DỤNG TRONG QUẢN LÝ & KỸ THUẬT Chương 6: Hồi quy tuyến tính Chương 6: Hồi quy tuyến tính Để kiểm định a, b KHÁC zero hay Gọi  a  giá trị độ lệch chuẩn của hệ số a: không ta cần có giá trị a, b và các Số quan sát giá trị độ lệch chuẩn của nó. Gọi: A  SSR / n  k  1 1  Giá trị độ lệch chuẩn trong các Số biến độc lập phần mềm thường có tên A 2   X i2  nX 2 (hồi quy đơn k=1) i Standard Error.  Biến kiểm định : t Stat =[a] / A1 Giá trị TB của Xi a  [Standard Error] A2  Dùng kiểm định Student. 25 26 THỐNG KÊ ỨNG DỤNG TRONG QUẢN LÝ & KỸ THUẬT THỐNG KÊ ỨNG DỤNG TRONG QUẢN LÝ & KỸ THUẬT Chương 6: Hồi quy tuyến tính Chương 6: Hồi quy tuyến tính Gọi: GIAÛI THÍCH KIEÅM ÑÒNH STUDENT (kieåm ñònh  b  giá trị độ lệch chuẩn của hệ caùc heä soá ai cuûa moâ hình vaø 0) BAÈNG ÑOÀ THÒ số b: S  Xi2 A Phân Student b  i * 1 0 n A2 -t -t5% t5% t  - Neáu S > 5%  t=0 theo quan ñieåm thoáng keâ. - Neáu S < 5%  t khaùc 0 theo quan ñieåm thoáng keâ. 27 4/11/2014 28 PGS. Dr. Nguyễn Thống THỐNG KÊ ỨNG DỤNG TRONG QUẢN LÝ & KỸ THUẬT THỐNG KÊ ỨNG DỤNG TRONG QUẢN LÝ & KỸ THUẬT Chương 6: Hồi quy tuyến tính Chương 6: Hồi quy tuyến tính VÍ DỤ TÍNH TỰ TƯƠNG QUAN i (t )  i 1 (t )  i2 (t ) with ,   0   có tính TỰ TƯƠNG QUAN BẬC 2 Chuỗi trể bậc 1 của  i 0 1 2 3 i 4 6 7 3 i-1 4 6 7 4/11/2014 29 4/11/2014 30 PGS. Dr. Nguyễn Thống PGS. Dr. Nguyễn Thống 5
  6. THỐNG KÊ ỨNG DỤNG TRONG QUẢN LÝ & KỸ THUẬT Chương 6: Hồi quy tuyến tính Xét hồi quy tuyến tính bội bậc k: KIỂM ĐỊNH CÁC THẶNG DƯ CÓ Yi  a1X1,i  a 2X2,i  ...  a k X k,i  i BỊ TÍNH TỰ TƯƠNG QUAN  Kiểm định Durbin-Watson, DW Biến cần Thặng dư  X  Biến giải thích  giải thích ei  yi  yi Sai số mô hình Giá trị quan sát Giá trị từ mô hình 31 4/11/2014 32 PGS. Dr. Nguyễn Thống THỐNG KÊ ỨNG DỤNG TRONG QUẢN LÝ & KỸ THUẬT THỐNG KÊ ỨNG DỤNG TRONG QUẢN LÝ & KỸ THUẬT Chương 6: Hồi quy tuyến tính Chương 6: Hồi quy tuyến tính CHÚ Ý TỰ TƯƠNG QUAN Tính tự tương quan bậc 1  Yt  a 0  a1X1,t   t ei  ei 1    Mô hình hồi quy tuyến tính đơn sẽ TỐT khi t là một “NHIỄU TRẮNG”  Với   khác 0  có tính TỰ Nó KHÔNG CÓ tính tự tương quan TƯƠNG QUAN BẬC 1  MÔ HÌNH CHƯA TỐT  THÊM BIẾN 4/11/2014 33 ??? 4/11/2014 34 PGS. Dr. Nguyễn Thống PGS. Dr. Nguyễn Thống THỐNG KÊ ỨNG DỤNG TRONG QUẢN LÝ & KỸ THUẬT THỐNG KÊ ỨNG DỤNG TRONG QUẢN LÝ & KỸ THUẬT Chương 6: Hồi quy tuyến tính Chương 6: Hồi quy tuyến tính Kiểm định Durbin-Watson Tham số DW Trong thực hành có thể dùng  i  i1 2 kiểm định Durbin-Watson để DW  i 2 đánh giá (Tham số DW):  i 1 2 i DW  2  Ok DW =2  Chuỗi KHÔNG có  DW KHÁC giá trị 2 càng nhiều  càng có nguy cơ tính TỰ tính tự tương quan TƯƠNG QUAN CỦA ei. 4/11/2014 35 4/11/2014 36 PGS. Dr. Nguyễn Thống PGS. Dr. Nguyễn Thống 6
  7. THỐNG KÊ ỨNG DỤNG TRONG QUẢN LÝ & KỸ THUẬT THỐNG KÊ ỨNG DỤNG TRONG QUẢN LÝ & KỸ THUẬT Chương 6: Hồi quy tuyến tính Chương 6: Hồi quy tuyến tính Ví duï: Moät thí nghieäm xaùc ñònh goùc noäi ma saùt vaø löïc Xem SPSS dính cuûa taàng ñòa chaát nghieân cöùu. Keát quaû cuûa 12 thí nghieäm cho caùc öùng suaát tieáp  vaø öùng suaát phaùp  TKUD \ Durbin Watson Exampe 1.sav ñöôïc trình baøy trong baûng sau. Xaùc ñònh  vaø c trong quan heä.   tg  c Hệ số m/hình hqtt Mẫu 1 2 3 4 5 6 kg/cm2) 3.2 3.7 3.7 4.2 5.2 5.3 (kg/cm2) 3.6 4.2 4.3 4.9 6.2 6.5 Mẫu 7 8 9 10 11 12 kg/cm2) 5.5 5.8 6.1 6.6 8.3 9.0 4/11/2014 37 (kg/cm2) 4/11/2014 6.6 7.0 7.5 8.1 10.4 11.4 38 PGS. Dr. Nguyễn Thống PGS. Dr. Nguyễn Thống THỐNG KÊ ỨNG DỤNG TRONG QUẢN LÝ & KỸ THUẬT THỐNG KÊ ỨNG DỤNG TRONG QUẢN LÝ & KỸ THUẬT Chương 6: Hồi quy tuyến tính Chương 6: Hồi quy tuyến tính SỬ DỤNG EXCEL HOẶC SPSS ĐỂ ỨNG DỤNG TÍNH HỒI QUY TUYẾN TÍNH EXCEL 4/11/2014 39 4/11/2014 40 PGS. Dr. Nguyễn Thống PGS. Dr. Nguyễn Thống THỐNG KÊ ỨNG DỤNG TRONG QUẢN LÝ & KỸ THUẬT THỐNG KÊ ỨNG DỤNG TRONG QUẢN LÝ & KỸ THUẬT Chương 6: Hồi quy tuyến tính Chương 6: Hồi quy tuyến tính 4/11/2014 41 4/11/2014 42 PGS. Dr. Nguyễn Thống PGS. Dr. Nguyễn Thống 7
  8. THỐNG KÊ ỨNG DỤNG TRONG QUẢN LÝ & KỸ THUẬT THỐNG KÊ ỨNG DỤNG TRONG QUẢN LÝ & KỸ THUẬT Chương 6: Hồi quy tuyến tính Chương 6: Hồi quy tuyến tính SPSS  Analyze  Regression  Linear 4/11/2014 43 4/11/2014 44 PGS. Dr. Nguyễn Thống PGS. Dr. Nguyễn Thống THOÁNG KEÂ ÖÙNG DUÏNG TRONG QUAÛN LY & KYÕ THUAÄT THOÁNG KEÂ ÖÙNG DUÏNG TRONG QUAÛN LY & KYÕ THUAÄT Chöông 4: Hoài quy tuyeán tính Chöông 4: Hoài quy tuyeán tính 4/11/2014 45 4/11/2014 46 PGS. Dr. Nguyễn Thống PGS. Dr. Nguyễn Thống THOÁNG KEÂ ÖÙNG DUÏNG TRONG QUAÛN LY & KYÕ THUAÄT THỐNG KÊ ỨNG DỤNG TRONG QUẢN LÝ & KỸ THUẬT Chöông 4: Hoài quy tuyeán tính Chương 6: Hồi quy tuyến tính HỒI QUY TUYẾN TÍNH BỘI 4/11/2014 47 4/11/2014 48 PGS. Dr. Nguyễn Thống PGS. Dr. Nguyễn Thống 8
  9. THỐNG KÊ ỨNG DỤNG TRONG QUẢN LÝ & KỸ THUẬT THỐNG KÊ ỨNG DỤNG TRONG QUẢN LÝ & KỸ THUẬT Chương 6: Hồi quy tuyến tính Chương 6: Hồi quy tuyến tính Trong trường hợp số biến giải GIẢ THIẾT thích >1  hồi quy tuyến tính Giả thiết về ngẫu nhiên bội. Biến cần được giải thích • H1 : các giá trị của xi,t được quan trắc đúng (không có sai số). Y  a 0  a1X1  a 2 X 2  ...  a k X k   • H2 : E(t )=0; trung bình số học Ví dụ: Hồi quy tuyến tính bội bậc của các sai số là bằng 0. k. Biến giải thích 4/11/2014 49 4/11/2014 50 PGS. Dr. Nguyễn Thống PGS. Dr. Nguyễn Thống THỐNG KÊ ỨNG DỤNG TRONG QUẢN LÝ & KỸ THUẬT THỐNG KÊ ỨNG DỤNG TRONG QUẢN LÝ & KỸ THUẬT Chương 6: Hồi quy tuyến tính Chương 6: Hồi quy tuyến tính • H3 :  H3   hs E( t2 )   2  hs. 2 Phương sai của sai số là hằng t số với mọi t (biên độ dao động của  quanh giá trị TB của nó  là không bị phân kỳ).   hs 2 4/11/2014 51 4/11/2014 52 PGS. Dr. Nguyễn Thống PGS. Dr. Nguyễn Thống THỐNG KÊ ỨNG DỤNG TRONG QUẢN LÝ & KỸ THUẬT THỐNG KÊ ỨNG DỤNG TRONG QUẢN LÝ & KỸ THUẬT Chương 6: Hồi quy tuyến tính Chương 6: Hồi quy tuyến tính • H4 : các sai số thì độc lập với nhau. Giả thiết về cấu trúc E( t . t  p )  0 if p  0 • H6 : các biến giải thích là độc lập tuyến tính với nhau, điều này cho • H5 : Cov(xi,t , t )=0 : các sai số độc phép ma trận [X’X] nghịch đảo được. lập với biến giải thích. (Tính đa cộng tuyến trong hồi quy bội - Cần loại bỏ) 4/11/2014 53 4/11/2014 54 PGS. Dr. Nguyễn Thống PGS. Dr. Nguyễn Thống 9
  10. THỐNG KÊ ỨNG DỤNG TRONG QUẢN LÝ & KỸ THUẬT THỐNG KÊ ỨNG DỤNG TRONG QUẢN LÝ & KỸ THUẬT Chương 6: Hồi quy tuyến tính Chương 6: Hồi quy tuyến tính Giả thiết về cấu trúc XÁC ĐỊNH HỆ SỐ MÔ HÌNH aI • H7 : X’X/n tiến về giới hạn hữu hạn Dùng phương pháp BPTT (xem n. tài liệu Kinh tế lượng- Tg. Dr. • H8 : n>(k+1) : số lượng quan trắc phải Nguyễn Thống). Yn,1  Xn,k1 xak1,1  t n,1 lớn hơn số lượng biến giải thích. Gọi Sai số mô hình 4/11/2014 55 4/11/2014 56 PGS. Dr. Nguyễn Thống PGS. Dr. Nguyễn Thống THỐNG KÊ ỨNG DỤNG TRONG QUẢN LÝ & KỸ THUẬT THỐNG KÊ ỨNG DỤNG TRONG QUẢN LÝ & KỸ THUẬT Chương 6: Hồi quy tuyến tính Chương 6: Hồi quy tuyến tính Hệ số của mô hình hồi Với: quy cần xác định THIẾT LẬP PHƯƠNG TRÌNH  y1  1 x11 . x k1   a0  ĐỂ XÁC ĐỊNH ai       y  1 x12 . xk2  a  Y 2 X . . . . .  a  1 . Yn,1  Xn,k1 xak1,1  t n,1       y  1 x . x kn ( n ,k 1)  a k (k 1,1)  n ( n ,1)  1n     Min n số quan trắc, k  số biến độc lập 4/11/2014 57 4/11/2014 58 PGS. Dr. Nguyễn Thống PGS. Dr. Nguyễn Thống THỐNG KÊ ỨNG DỤNG TRONG QUẢN LÝ & KỸ THUẬT THỐNG KÊ ỨNG DỤNG TRONG QUẢN LÝ & KỸ THUẬT Chương 6: Hồi quy tuyến tính Chương 6: Hồi quy tuyến tính Dùng p/p bình phương tối thiểu: ÔN M in   M in(  ) 2 t ' t t Ví dụ: Tính module của vectơ U i   2   M inY  Xa  Y  Xa   U    U  2,3  3  M in(S)   UU  U  2 * 2  3 * 3  13 2 4/11/2014 X  Ma trận chuyển vị của X 59 4/11/2014 60 PGS. Dr. Nguyễn Thống PGS. Dr. Nguyễn Thống 10
  11. THỐNG KÊ ỨNG DỤNG TRONG QUẢN LÝ & KỸ THUẬT THỐNG KÊ ỨNG DỤNG TRONG QUẢN LÝ & KỸ THUẬT Chương 6: Hồi quy tuyến tính Chương 6: Hồi quy tuyến tính MA TRẬN SUY BiẾN Vì S =f(a)  S cực trị (cực tiểu)  : Ví dụ: Xét ma trận vuông sau: S    Y Y  Y Xa  a X Y  a X Xa  0  1 5   a a U   det U  0 3 15 Chú ý: Giải thích: Xét theo hàng (hoặc cột),  các vectơ là “phụ thuộc tuyến Y Xa    aY X   Y X   X Y a a tính”  ma trận U suy biến  det[U] =0. 4/11/2014 PGS. Dr. Nguyễn Thống 61 4/11/2014 PGS. Dr. Nguyễn Thống 62 THỐNG KÊ ỨNG DỤNG TRONG QUẢN LÝ & KỸ THUẬT THỐNG KÊ ỨNG DỤNG TRONG QUẢN LÝ & KỸ THUẬT Chương 6: Hồi quy tuyến tính Chương 6: Hồi quy tuyến tính Do đó: S CHÚ Ý   2XY  2XXa  0 a Để ma trận : XX1  a  a   XX XY det XX  0 1 nghịch đảo được    Khi det XX  0  Hiện tượng [X]’  ma trận chuyển vị [X] ĐA CỘNG TUYẾN trong hồi quy 4/11/2014 63 tuyến tính bội. 4/11/2014 64 PGS. Dr. Nguyễn Thống PGS. Dr. Nguyễn Thống THỐNG KÊ ỨNG DỤNG TRONG QUẢN LÝ & KỸ THUẬT THỐNG KÊ ỨNG DỤNG TRONG QUẢN LÝ & KỸ THUẬT Chương 6: Hồi quy tuyến tính Chương 6: Hồi quy tuyến tính ÔN CHÚ Ý Xét ma trận: det XX  0  Khi các vectơ Xk 1 2 (vectơ biến độc lập) có mang tính [ A]     det A  1* 6  2 * 3  0 PHỤ THUỘC TUYẾN TÍNH với 3 6 nhau. Nhận xét 2 vectơ cột là PHỤ THUỘC TUYẾN TÍNH: PTTT  Vectơ bất kỳ Xk là tổ hợp  2 1 tuyến tính của các vectơ còn lại. 6  23 !!!     4/11/2014 65 4/11/2014 66 PGS. Dr. Nguyễn Thống PGS. Dr. Nguyễn Thống 11
  12. THỐNG KÊ ỨNG DỤNG TRONG QUẢN LÝ & KỸ THUẬT THỐNG KÊ ỨNG DỤNG TRONG QUẢN LÝ & KỸ THUẬT Chương 6: Hồi quy tuyến tính Chương 6: Hồi quy tuyến tính Phụ thuộc tuyến tính giữa Xk Ví dụ: Sè liÖu quan s¸t trong 6 n¨m vÒ tiªu dïng (Y), thu nhËp (X1) vµ tuæi trung b×nh (X2) nh sau. Dïng 1 x11 . x k1  phÇn mÒm SPSS x¸c ®Þnh håi quy tuyÕn tÝnh.   a. X¸c ®Þnh c¸c hÖ sè cña m« h×nh. X   1 x12 . xk2  b. X¸c ®Þnh ®é lÖch chuÈn cña c¸c hÖ sè. . . . .  c. KiÔm ®Þnh gi¶ thiÕt c¸c hÖ sè nµy so víi 0.   1  x 1n . x kn ( n ,k1)  Y  a 0  a1X1  a 2 X 2   n số quan trắc, k  số biến độc lập 4/11/2014 PGS. Dr. Nguyễn Thống 67 4/11/2014 PGS. Dr. Nguyễn Thống 68 THỐNG KÊ ỨNG DỤNG TRONG QUẢN LÝ & KỸ THUẬT THỐNG KÊ ỨNG DỤNG TRONG QUẢN LÝ & KỸ THUẬT Chương 6: Hồi quy tuyến tính Chương 6: Hồi quy tuyến tính i Y X1 X2 1 140 200 45 2 3 155 180 220 250 34 28 XÁC ĐỊNH HỆ SỐ 4 195 270 24 5 270 400 36 6 330 500 40 Y  a 0  a1X1  a 2 X 2   MÔ HÌNH Xem SPSS TKUD \ HoiQuyBoi_1.sav 4/11/2014 69 4/11/2014 70 PGS. Dr. Nguyễn Thống PGS. Dr. Nguyễn Thống THỐNG KÊ ỨNG DỤNG TRONG QUẢN LÝ & KỸ THUẬT THỐNG KÊ ỨNG DỤNG TRONG QUẢN LÝ & KỸ THUẬT Chương 6: Hồi quy tuyến tính Chương 6: Hồi quy tuyến tính Mô hình  Y = 37.22+0.629X1 – 0.537X2 Unstandardized Coefficients Standardized Coefficients ĐỘ LỆCH CHUẨN Model 1 (Constant) B 37.22 Std. Error 3.60 Beta t Sig. 10.33 .002 CỦA CÁC X1 .629 .006 1.009 99.10 .000 X2 -.537 .097 -.056 -5.52 .012 HỆ SỐ MÔ HÌNH 4/11/2014 71 4/11/2014 72 PGS. Dr. Nguyễn Thống PGS. Dr. Nguyễn Thống 12
  13. THỐNG KÊ ỨNG DỤNG TRONG QUẢN LÝ & KỸ THUẬT THỐNG KÊ ỨNG DỤNG TRONG QUẢN LÝ & KỸ THUẬT Chương 6: Hồi quy tuyến tính Chương 6: Hồi quy tuyến tính Độ lệch chuẩn KIỂM ĐỊNH CÁC HỆ SỐ CỦA ai MÔ Unstandardized Standardized Coefficients Coefficients HÌNH CÓ NGHĨA HAY KHÔNG Model 1 (Constant) B 37.22 Std. Error 3.60 Beta t Sig. 10.33 .002 (KHÁC 0 HAY BẰNG 0 THEO QUAN X1 .629 .006 1.009 99.10 .000 ĐIỂM THỐNG KÊ) X2 -.537 .097 -.056 -5.52 .012 4/11/2014 73 4/11/2014 74 PGS. Dr. Nguyễn Thống PGS. Dr. Nguyễn Thống THỐNG KÊ ỨNG DỤNG TRONG QUẢN LÝ & KỸ THUẬT THỐNG KÊ ỨNG DỤNG TRONG QUẢN LÝ & KỸ THUẬT Chương 6: Hồi quy tuyến tính Chương 6: Hồi quy tuyến tính t  B / Std.Error  a i / a i Unstandardized Standardized Coefficients Coefficients Model B Std. Error Beta t Sig. Unstandardized Standardized 1 (Constant) 37.22 3.60 10.33 .002 Coefficients Coefficients Model B Std. Error Beta t Sig. X1 .629 .006 1.009 99.10 .000 1 (Constant) 37.22 3.60 10.33 .002 X2 -.537 .097 -.056 -5.52 .012 X1 .629 .006 1.009 99.10 .000 X2 -.537 .097 -.056 -5.52 .012 Nếu Sig < 5%  Hệ số ai KHÁC 0 4/11/2014 75 4/11/2014 76 PGS. Dr. Nguyễn Thống PGS. Dr. Nguyễn Thống THỐNG KÊ ỨNG DỤNG TRONG QUẢN LÝ & KỸ THUẬT THỐNG KÊ ỨNG DỤNG TRONG QUẢN LÝ & KỸ THUẬT Chương 6: Hồi quy tuyến tính Chương 6: Hồi quy tuyến tính T¬ng tù vÝ dô 1 víi c¸c sè liÖu nh sau: N0 y x1 x2 x3 x4 x5 Hướng dẫn: Dùng SPSS với file 1 2 147.4 187.3 2 4 5 4 20 22 8 18 51 55  TKUD\ HoiQuyBoi_2.sav 3 139.9 5 9 24 11 58 4 147.1 6 12 22 12 60 5 105.3 8 14 30 10 62 6 131.1 9 12 29 12 55 7 124.7 10 10 27 8 47 8 170.7 7 9 21 13 65 9 172.6 10 8 20 10 45 10 144.8 9 12 22 9 58 11 189.3 9 15 24 19 55 4/11/2014 12 165.5 11 13 28 18 50 77 4/11/2014 78 PGS. Dr. Nguyễn Thống PGS. Dr. Nguyễn Thống 13
  14. THỐNG KÊ ỨNG DỤNG TRONG QUẢN LÝ & KỸ THUẬT THỐNG KÊ ỨNG DỤNG TRONG QUẢN LÝ & KỸ THUẬT Chương 6: Hồi quy tuyến tính Chương 6: Hồi quy tuyến tính Hướng dẫn: Dùng SPSS với file  TKUD\ Bài tập: Người ta muốn kiểm tra sự HoiQuyBoi_2.sav quan hệ tuyến tính nếu có giữa số Y  222.68  2.35X1  4.94X3  5.04X 4 ngày nghĩ việc không phép của công Standardiz nhân trong năm (Y) và các yếu tố thâm Unstandardized ed Coeffici Collinearity niên (x1) và tuổi tác (X2). Xem số liệu Coefficients Std. ents Statistics Toleranc sau. Y  a 0  a1X1  a 2 X 2   Model B Error Beta t Sig. e VIF 1 (Constant) 222.680 18.758 11.871 .000 X1 2.352 .824 .253 2.853 .029 .324 3.090 X2 -1.072 .711 -.143 -1.507 .182 .282 3.552 X3 -4.947 .461 -.687 -10.726 .000 .618 1.619 X4 5.045 .333 .777 15.163 .000 .966 1.035 X5 4/11/2014 -.368 .288 -.086 -1.276 .249 .554 791.806 4/11/2014 80 PGS. Dr. Nguyễn Thống PGS. Dr. Nguyễn Thống THỐNG KÊ ỨNG DỤNG TRONG QUẢN LÝ & KỸ THUẬT THỐNG KÊ ỨNG DỤNG TRONG QUẢN LÝ & KỸ THUẬT Chương 6: Hồi quy tuyến tính Chương 6: Hồi quy tuyến tính Bài tập: Người ta muốn kiểm tra sự TT Số ngày vắng (Y) Thâm niên (X1) Tuổi (X2) 1 5 5 30 quan hệ tuyến tính nếu có giữa lượng 2 4 15 45 rác thải hàng ngày và nhiệt độ trong 3 2 10 42 ngày (so với nhiệt độ chuẩn 650F) và 4 6 6 30 độ ẩm (so với độ ẩm chuẩn 55%). Xem 5 8 8 32 6 6 7 35 số liệu sau. 7 5 10 40 8 3 2 28 Y  a 0  a1X1  a 2 X 2   9 7 5 50 10 2 19 54 4/11/2014 81 4/11/2014 82 PGS. Dr. Nguyễn Thống PGS. Dr. Nguyễn Thống THỐNG KÊ ỨNG DỤNG TRONG QUẢN LÝ & KỸ THUẬT THỐNG KÊ ỨNG DỤNG TRONG QUẢN LÝ & KỸ THUẬT Chương 6: Hồi quy tuyến tính Chương 6: Hồi quy tuyến tính TT 1 Rác thải ngày (Y) 14 Nhiệt (X1) -5 Độ ẩm (X2) 1 HIỆN TƯỢNG 2 3 12 16 -8 1 1 4 ĐA CỘNG TUYẾN 4 20 6 6 5 6 24 29 12 8 7 14 TRONG HỒI QUY 7 8 24 14 3 -2 17 2 TUYẾN TÍNH BỘI 9 16 -7 1 10 10 -3 -1 11 14 -8 -2 4/11/2014 84 4/11/2014 83 PGS. 12 Nguyễn Thống 8 Dr. -2 3 PGS. Dr. Nguyễn Thống 14
  15. THỐNG KÊ ỨNG DỤNG TRONG QUẢN LÝ & KỸ THUẬT THỐNG KÊ ỨNG DỤNG TRONG QUẢN LÝ & KỸ THUẬT Chương 6: Hồi quy tuyến tính Chương 6: Hồi quy tuyến tính Để X1, X2, …, Xi giữ vai trò là biến giải Ghi chú thích để nghiên cứu biến Y  các Để X1 & X2 là ĐỘC LẬP TUYẾN TÍNH: biến X1, X2, Xi phải ĐỘC LẬP TUYẾN TÍNH. [X1].[X2]  0  Đây là điều kiện « CẦN » phải có Để X1, X2 & X3 là ĐỘC LẬP TUYẾN khi nghiên cứu hồi quy tuyến tính TÍNH: bội.  XI KHÔNG LÀ TỔ HỢP TUYẾN  nếu KHÔNG  các hệ số của mô TÍNH CỦA X CÒN LẠI. hình (ai) không xác định được !!! 4/11/2014 85 4/11/2014 86 PGS. Dr. Nguyễn Thống PGS. Dr. Nguyễn Thống THỐNG KÊ ỨNG DỤNG TRONG QUẢN LÝ & KỸ THUẬT THỐNG KÊ ỨNG DỤNG TRONG QUẢN LÝ & KỸ THUẬT Chương 6: Hồi quy tuyến tính Chương 6: Hồi quy tuyến tính ĐÁNH GIÁ HIỆN TƯỢNG VIF  Variance Inflation Factor ĐA CỘNG TUYẾN 1 VIF  TRONG HỒI QUY BỘI 1  ri2 VỚI THAM SỐ VIF ri2  hệ số xác định trong hồi quy tuyến tính của biến giải thích Xi theo tất cả các biến giải thích Xj còn lại. 4/11/2014 87 4/11/2014 88 PGS. Dr. Nguyễn Thống PGS. Dr. Nguyễn Thống THỐNG KÊ ỨNG DỤNG TRONG QUẢN LÝ & KỸ THUẬT THỐNG KÊ ỨNG DỤNG TRONG QUẢN LÝ & KỸ THUẬT Chương 6: Hồi quy tuyến tính Chương 6: Hồi quy tuyến tính VIF VIF=f(r2) CHÚ Ý 2 Phổ biến r2 r* VIF càng lớn  CÀNG CÓ KHẢ NĂNG của các biến độc lập. có hiện tượng ĐA CỘNG TUYẾN (vì r2 1) 4/11/2014 89 4/11/2014 90 PGS. Dr. Nguyễn Thống PGS. Dr. Nguyễn Thống 15
  16. THỐNG KÊ ỨNG DỤNG TRONG QUẢN LÝ & KỸ THUẬT THỐNG KÊ ỨNG DỤNG TRONG QUẢN LÝ & KỸ THUẬT Chương 6: Hồi quy tuyến tính Chương 6: Hồi quy tuyến tính Tolerence= 1/VIF Khu vực “ÍT” có khả năng ĐA CỘNG TUYẾN CHÚ Ý 1 Tolerance = 1/VIF Tolerence=1/VIF =(1-r2) Nếu Tolerance < (1-R2)  CÓ THỂ có hiện tượng ĐA CỘNG TUYẾN. 1 0 r2 r2 Yêu cầu: Tolerance > (1-R2) ĐỒ THỊ ỨNG DỤNG TRONG PHÂN R2 hệ số xác định (hiệu chỉnh) của TÍCH ĐA CỘNG TUYẾN mô hình. 4/11/2014 91 4/11/2014 92 PGS. Dr. Nguyễn Thống PGS. Dr. Nguyễn Thống THỐNG KÊ ỨNG DỤNG TRONG QUẢN LÝ & KỸ THUẬT THỐNG KÊ ỨNG DỤNG TRONG QUẢN LÝ & KỸ THUẬT Chương 6: Hồi quy tuyến tính Chương 6: Hồi quy tuyến tính SPSS NHẬN BIẾT ĐA CỘNG TUYẾN (xem SPSS với Choles.  a 0  a1.Age  a 2 .Weight  file HoiQuyBoi.sav) Ví dụ: Một nghiên cứu y về quan a 3 .Height  a 4 .Tension hệ giữa Cholesterol (biến nghiên cứu Y) và các yếu tố Tuổi (Age), Trọng lượng (Weight), Chiều cao (height), Áp huyết của 20 đối tượng như sau: 4/11/2014 93 4/11/2014 94 PGS. Dr. Nguyễn Thống PGS. Dr. Nguyễn Thống THỐNG KÊ ỨNG DỤNG TRONG QUẢN LÝ & KỸ THUẬT THỐNG KÊ ỨNG DỤNG TRONG QUẢN LÝ & KỸ THUẬT Chương 6: Hồi quy tuyến tính Chương 6: Hồi quy tuyến tính TT Cholesterol Age Weight Height Aphuyet 1 130 25 66.0 1.775 110 TT Cholesterol Age Weight Height Aphuyet 2 125 27 60.0 1.725 120 8 170 31 68.8 1.700 105 3 140 39 56.0 1.750 140 9 160 29 55.6 1.625 135 4 135 35 70.0 1.825 130 10 150 25 58.0 1.600 140 5 160 42 65.2 1.750 120 11 150 23 64.8 1.725 115 6 140 26 64.8 1.725 110 7 180 38 72.4 1.825 115 12 220 52 66.4 1.800 125 13 240 51 63.6 1.700 135 4/11/2014 95 4/11/2014 96 PGS. Dr. Nguyễn Thống PGS. Dr. Nguyễn Thống 16
  17. THỐNG KÊ ỨNG DỤNG TRONG QUẢN LÝ & KỸ THUẬT THỐNG KÊ ỨNG DỤNG TRONG QUẢN LÝ & KỸ THUẬT Chương 6: Hồi quy tuyến tính Chương 6: Hồi quy tuyến tính TT Cholesterol Age Weight Height Aphuyet Coeffici Collinearity 14 210 48 72.8 1.825 140 ents Sig. Statistics Std. 15 200 47 57.2 1.600 110 B Error Tolerance VIF 16 190 36 64.8 1.750 125 Constant 298.304 103.508 0.011 17 160 33 68.8 1.775 125 HEIGHT -269.803 83.826 0.006 0.383 2.613 18 170 31 72.4 1.775 140 AGE 2.826 0.384 0.000 0.924 1.082 19 150 29 59.6 1.725 135 TENSION 0.244 0.316 0.453 0.892 1.121 20 190 48 63.6 1.725 130 4/11/2014 97 WEIGHT 4/11/2014 3.203 1.041 0.008 0.378 2.643 98 PGS. Dr. Nguyễn Thống PGS. Dr. Nguyễn Thống THỐNG KÊ ỨNG DỤNG TRONG QUẢN LÝ & KỸ THUẬT THỐNG KÊ ỨNG DỤNG TRONG QUẢN LÝ & KỸ THUẬT Chương 6: Hồi quy tuyến tính Chương 6: Hồi quy tuyến tính LOẠI BỎ BIẾN WEIGHT TÓM TẮT Unstandardized Collinearity Xem xét giá trị R2 (càng gần giá trị 1  Ok) Coefficients Statistics  Xem xét các hệ số mô hình có KHÁC 0 ? Std. (sig
  18. THỐNG KÊ ỨNG DỤNG TRONG QUẢN LÝ & KỸ THUẬT THỐNG KÊ ỨNG DỤNG TRONG QUẢN LÝ & KỸ THUẬT Chương 6: Hồi quy tuyến tính Chương 6: Hồi quy tuyến tính Dso Promo Dso Naêm (100tr.) Pub (tr.) (%) Xhoi 70 1996 49 41 10 0 60 1997 40 32 15 0 50 1998 41 38 10 0 40 1999 46 40 10 0 30 2000 52 40 5 0 2001 57 42 0 0 20 2002 53 44 0 0 10 2003 35 46 0 1 0 2004 65 50 5 0 1994 1996 1998 2000 2002 2004 2006 2005 64 55 0 0 4/11/2014 103 4/11/2014 104 PGS. Dr. Nguyễn Thống PGS. Dr. Nguyễn Thống THỐNG KÊ ỨNG DỤNG TRONG QUẢN LÝ & KỸ THUẬT THỐNG KÊ ỨNG DỤNG TRONG QUẢN LÝ & KỸ THUẬT Chương 6: Hồi quy tuyến tính Chương 6: Hồi quy tuyến tính Pub Promo 60 16 50 14 12 40 10 30 8 20 6 4 10 2 0 0 1994 1996 1998 2000 2002 2004 2006 1994 1996 1998 2000 2002 2004 2006 4/11/2014 105 4/11/2014 106 PGS. Dr. Nguyễn Thống PGS. Dr. Nguyễn Thống THỐNG KÊ ỨNG DỤNG TRONG QUẢN LÝ & KỸ THUẬT THỐNG KÊ ỨNG DỤNG TRONG QUẢN LÝ & KỸ THUẬT Chương 6: Hồi quy tuyến tính Chương 6: Hồi quy tuyến tính BIEÁN ÑÒNH TÍNH Cã 2 lo¹i biÕn trong nghiªn cøu håi quy: BIẾN ĐỊNH TÍNH - BiÕn ®Þnh lîng: Thu nhËp, Doanh thu, Sè lîng s¶n phÈm tiªu thô... - BiÕn ®Þnh tÝnh: NghÒ nghiÖp, Tr×nh ®é v¨n hãa, Giíi tÝnh, §ång ý kh«ng ®ång ý, Mµu s¾c, ... 4/11/2014 107 4/11/2014 108 PGS. Dr. Nguyễn Thống PGS. Dr. Nguyễn Thống 18
  19. THỐNG KÊ ỨNG DỤNG TRONG QUẢN LÝ & KỸ THUẬT THỐNG KÊ ỨNG DỤNG TRONG QUẢN LÝ & KỸ THUẬT Chương 6: Hồi quy tuyến tính Chương 6: Hồi quy tuyến tính BIEÁN ÑÒNH TÍNH  Pr F1 ; 2  F    %  i Y Giíi tÝnh Trinh ®é Th©m niªn • Coù giaù trò cuûa α, ν1, ν2 xaùc ñònh giaù trò cuûa F bôûi: (t/nhËp) p Nam Nu
  20. THỐNG KÊ ỨNG DỤNG TRONG QUẢN LÝ & KỸ THUẬT Chương 6: Hồi quy tuyến tính HẾT 4/11/2014 115 PGS. Dr. Nguyễn Thống 20
nguon tai.lieu . vn