Xem mẫu

  1. CHÖÔNG 7 TÖÔNG QUAN & HOÀI QUI TUYEÁN TÍNH (Linear Correlation and Regression) 7.1. KHAÙI NIEÄM CHUNG Trong caùc chöông tröôùc chuùng ta chæ nghieân cöùu caùc vaán ñeà lieân quan ñeán maãu ngaãu nhieân cuûa moät bieán ngaãu nhieân X. Trong chöông naøy, chuùng ta quan taâm ñeán maãu ngaãu nhieân bao goàm caùc caëp giaù trò cuûa hai bieán ngaãu nhieân X vaø Y. Ví duï Ñeå nghieân cöùu veà chieàu cao vaø söùc naëng cuûa caùc em hoïc sinh trong moät tröôøng, chuùng ta laáy maãu ngaãu nhieân goàm n hoïc sinh vaø thu thaäp caùc soá lieäu veà chieàu cao vaø söùc naëng cuûa n hoïc sinh. Goïi X laø bieán ngaãu nhieân ñeå dö chieàu cao cuûa hoïc sinh vaø Y laø bieán ngaãu nhieân chæ söùc naëng cuûa hoïc sinh. Vôùi n hoïc sinh ta coù n caëp giaù trò (Yi , Xi). X(m) x1 x2 x3 ..... xi ....... xn Y(kg) y1 y2 y3 .......... yi .......... yn Muïc tieâu cuûa chöông naøy laø nghieân cöùu söï lieân heä giöõa bieán Y vaø X baèng söï phaân tính töông quan vaø hoài qui. Trong phaân tích töông quan ngöôøi ta ñeà caäp ñeà cöôøng ñoä cuûa moái quan heä giöõa hai bieán Y vaø X, ñaùnh giaù xem hai bieán Y vaø X coù quan heä vôùi nhau hay khoâng. Trong phaân tích hoài qui ngöôøi ta laïi xaùc ñònh quan heä giöõa hai bieán Y vaø X döôùi daïng phöông trình toaùn hoïc, töø ñoù ta coù theå döï ñoaùn ñöôïc bieán Y (bieán phuï thuoäc, dependent variable) döïa vaøo bieán X (bieán ñoäc laäp, independent variable) Trong chöông naøy, chuùng ta cuõng giôùi haïn chæ nghieân cöùu töông quan vaø hoài qui ñôn bieán vaø tuyeán tính, nghóa laø chæ nghieân cöùu tröôøng hôïp bieán Y chæ phuï thuoäc vaøo 1 bieán X vaø daïng phöông trình hoài qui laø phöông trình ñöôøng thaúng (khaùc vôùi caùc töông quan vaø hoài qui boäi vaø phi tuyeán). 7.2. TÖÔNG QUAN TUYEÁN TÍNH (Linear Correlation) 7.2.1. Ñoà thò phaân taùn (Scatter Diagram) Ñoà thò phaân taùn cuûa bieán Y ñoái vôùi bieán X laø taäp hôïp caùc ñieåm M(xi , yi) trong heä toïa ñoä vuoâng goùc. Döïa vaøo ñoà thò phaân taùn ta coù theå xaùc ñònh ñöôïc daïng quan heä giöõa 2 bieán Y vaø X. Gv. Cao Haøo Thi
  2. Y Y (D) X X Y X 7.2.2. Töông quan tuyeán tính (Linear Correlation) Trong ñoà thò phaân taùn, neáu caùc ñieåm M(xi , yi) qui tuï xung quanh moät ñöôøng thaúng (D) ta noùi hai bieán ngaãu Y vaø X coù moät söï töông quan tuyeán tính. Ñöôøng thaúng (D) ñöôïc goïi laø ñöôøng hoài qui tuyeán tính (ñöôøng hoøa hôïp thaúng). 7.2.3. Heä soá töông quan ρ cuûa taäp hôïp chính (The Population Correlation Coefficient) Goïi X, Y laø caëp giaù trò cuûa caùc bieán ngaãu nhieân vôùi soá trung bình laø µx , µy vaø phöông sai laø σ 2 , σ 2 . Ñeå ño löôøng möùc ñoä quan heä giöõa X vaø Y ngöôøi ta duøng ñaïi löôïng hieäp x y töôïng quan (covariance) vaø heä soá töông quan (correlation coefficent). 7.2.3.1. Hieäp töông quan (Covariance) σX,Y = Cov(X,Y) = E [(x - µx)(y - µy)] N ∑ ( x i − µ x )( y i − µ y ) i =1 σ xy = Cov( X, Y) = N 7.2.3.2. Heä soá töông quan cuûa taäp hôïp chính Cov( X, Y) ρ = Corr ( X, Y) = σ xσ y N ∑ ( x1 − µ x ) 2 i =1 σ2 = σ xy x N Vôùi ρ= σ xσ y N ∑ ( y i − µ ii ) 2 i =1 σ2 = y N hay Gv. Cao Haøo Thi 2
  3. E[( X − µ x )(Y − µ y )] ρ= E[( X − µ x ) 2 ] * E[(Y − µ y ) 2 ] N ∑ ( x1 − µ x )( y i − µ y ) i −1 ρ= N N ∑ (x i − µ x ) *∑ (y i − µ y ) 2 2 i =1 i =1 Tính chaát -1≤ρ≤1 ρ = + 1 : X, Y töông quan tuyeán tính döông tuyeät ñoái • ρï = - 1 : X, Y töông quan tuyeán tính aâm tuyeät ñoái • ρï = 0 : X, Y khoâng töông quan tuyeán tính. • 7.2.4. Heä soá töông quan r cuûa maãu 7.2.4.1. Hieäp töông quan cuûa maãu (Sample Covariance) n ∑ (x i − x)(y i − y) ∧ i =1 S X,Y = Cov( X, Y) = n −1 7.2.4.2. Heä soá töông quan cuûa maãu r (Sample Correlation Coefficient) S XY r= SX − SY n ∑ ( x i − x)( y i − y) i =1 r= n n ∑ ( x i − x) 2 * ∑ ( y i − y ) 2 i =1 i =1 hay n ∑ x i y i − nx. y i =1 r= n  n  2 2  ∑ x i − nx   ∑ y i − ny  2 2     i =1   i =1  Ghi Chuù -1 ≤ r ≤ 1 • r ñöôïc duøng ñeå öôùc löôïng höôùng vaø ñoä maïnh cuûa moái quan heä giöõa X,Y. • r > 0.8 töông quan maïnh r = 0.4 - 0.8 töông quan trung bình r < 0.4 töông quan yeáu. Gv. Cao Haøo Thi 3
  4. r caøng lôùn thì töông quan giöõa X vaø Y caøng chaët r > 0 höôùng TN - ÑB, r < 0 höôùng TB - ÑN 0 < r ≤ 1 : goïi laø töông quan tuyeán tính thuaän (X↑, Y↑) -1 ≤ r ≤ 0 : goïi laø töông quan tuyeán tính nghòch (X↑, Y↓) r laø öôùc löôïng cuûa ρ • Ví duï Tính heä soá töông quan giöõa 2 bieán X, Y cho bôûi baûng töông quan sau: X 0 1 2 3 4 Y 6 7 8 9 4 Giaûi Soá phaàn töû cuûa maãu n = 5 (xi - x )2 ( yi - y ) 2 xi yi (xi - x ) (yi - y ) (xi - x )(yi- y ) 0 6 -2 0 4 0 0 1 5 -1 -1 1 1 1 2 7 0 1 0 1 0 3 8 1 2 1 4 2 4 4 2 -2 4 4 -4 10 30 10 10 -1 10 30 n=5 =2 =6 x= y= 5 5 5 ∑ ( x i − x) ⋅ ( y i − y) −1 i =1 r= = −0.1 = 10 × 10 5 5 2 2 ∑ ( x i − x) × ∑ ( y i − y) i =1 i =1 r = -0.1 töông quan yeáu. Gv. Cao Haøo Thi 4
  5. 7.2.5. Kieåm ñònh giaû thuyeát veà ρ Neáu chuùng ta muoán kieåm ñònh giaû thuyeát cho raèng caùc bieán khoâng coù töông quan tuyeán tính thì ta phaûi kieåm ñònh giaû thuyeát H0: ρ = 0. Ta coù 3 tröôøng hôïp: Tröôøng hôïp 1 H0 : ρ=0 H1 : ρ≠0 R : baùc boû H0 neáu tn-2 < - tn - 2, α/2 hay tn-2 > tn-2,α/2 r Vôùi t n −2 = 2 (1 − r ) /( n − 2) r: heä soá töông quan cuûa maãu n: côõ maãu tn-2: tuaân theo phaân phoái Student t vôùi ñoä töï do n-2 Tröôøng hôïp 2 H0 : ρ=0 H1 : ρ>0 R : baùc boû H0 neáu tn-2 > - tn - 2, α Tröôøng hôïp 3 H0 : ρ=0 H1 : ρ
  6. yx2 xi2 yI xi xiyi 70 13 4900 169 910 55 18 3025 324 991 100 9 10000 81 900 40 25 1600 625 1000 15 36 225 1296 540 20 19 400 361 380 Toång 300 120 20150 2856 4720 ∑ y i 300 y= = 50 = n 6 ∑ x i 120 x= = 20 = n 6 ( ) 1 6 2 1 2 S2 = 2  ∑ x i − n x  = 2856 − 6 * 20 = 456 / 5 = 91.2 X n − 1  i =1 5 ( ) 1 6 2 1 2 S2 = 2  ∑ y i − n y  = 20150 − 6 * 50 = 5150 / 5 = 1030 y n − 1  i =1 5 1 6 1  ∑ x i y i − n x ⋅ y  = (4720 − 6 * 20 * 50 ) = −1280 / 5 = −256 S XY = n − 1  i =1 5 Heä soá töông quan: −256 S XY = −0.835 töông quan maïnh r= = S X S Y 91.2 * 1030 b) Kieåm ñònh giaû thuyeát: 1. H0 : ρ = 0 2. H1 : ρ ≠ 0 3. α = 0.05 => α/2 = 0.025 n=6 => n - 2 = 4 tn -2, α/2 = t4, 0.025 = 2.776 - tn - 2 , α/2 = -2.776 4. r = -0.835 −0.835 r tn − 2 = (1 − r 2 ) / (n − 2) [1 − (−0.835)2 ] / 4 tn -2 = - 3.03 5. Ra quyeát ñònh tn - 2 = - 3.03 < - tn -2, α/2 = -2.776 => Baùc boû H0. Giöõa 2 bieán Y vaø X coù töông quan nghòch. Gv. Cao Haøo Thi 6
  7. 7.3. HOÀI QUI TUYEÁN TÍNH ÑÔN GIAÛN (Simple Linear Regression) 7.3.1 Khaùi nieäm cô baûn veà hoài qui tuyeán tính ñôn giaûn 7.3.1.1. Moâ hình hoài qui tuyeán tính ñôn giaûn (Simple Linear Regression Model) Ñeå moâ hình hoùa quan heä tuyeán tính trong ñoù dieãn taû söï thay ñoåi cuûa bieán Y theo bieán X cho tröôùc ngöôøi ta söû duïng moâ hình hoài qui tuyeán tính ñôn giaûn. Moâ hình hoài qui tuyeán tính ñôn giaûn coù daïng sau: Yi = A + BXi + ei (moâ hình hoài qui tuyeán ñôn giaûn Y theo X) Yi : Giaù trò cuûa bieán phuï thuoäc Y trong laàn quan saùt thöù i. • Xi : Giaù trò cuûa bieán ñoäc laäp X trong laàn quan saùt thöù i . • ei : Giaù trò ñoái vôùi söï dao ñoäng ngaãu nhieân hay sai soá trong laàn quan saùt thöù i. • A : laø thoâng soá dieãn taû tung ñoä goác cuûa ñöôøng hoài qui cuûa taäp hôïp chính, hay A laø • giaù trò trung bình cuûa bieán phuï thuoäc Y khi bieán ñoäc laäp X thay ñoåi 1 ñôn vò. B : laø thoâng soá dieãn taû ñoä doác cuûa ñöôøng hoài qui cuûa taäp hôïp chính, hay B dieãn taû • söï thay ñoåi cuûa giaù trò trung bình cuûa bieán phuï thuoäc Y khi bieán ñoäc laäp X thay ñoåi 1 ñôn vò. 7.3.1.2. Phöông trình hoài qui tuyeán tính ñôn giaûn cuûa taäp hôïp chính (Population Simple Linear Regression Equation) Laø phöông trình dieãn taû giaù trò trung bình cuûa bieán phuï thuoäc Y theo bieán ñoäc laäp X ñaõ bieát. µY/ X = A + BX 7.3.1.3. Phöông trình hoài qui tuyeán tính ñôn giaûn cuûa maãu Chuùng ta coù theå öôùc löôïng caùc tham soá (A,B) cuûa phöông trình hoài qui tuyeán tính ñôn giaûn cuûa taäp hôïp chính baèng caùch söû duïng soá lieäu cuûa maãu ngaãu nhieân thu thaäp ñöôïc. Döïa vaøo soá lieäu cuûa maãu ta coù phöông trình hoài qui tuyeán tính ñôn giaûn cuûa maãu. ∧ Y = a + bX Gv. Cao Haøo Thi 7
  8. Trong ñoù: ∧ Y laø öôùc löôïng cuûa giaù trò trung bình cuûa Y ñoái vôùi bieán X ñaõ bieát • a: laø öôùc löôïng cuûa A • b laø öôùc löôïng cuûa B • Ghi chuù Phöông trình hoài qui cuûa Y theo X khaùc phöông trình hoài qui cuûa X theo Y • Neáu X ñoåi maø Y khoâng ñoåi => Y vaø X khoâng coù töông quan • Y X Döïa vaøo phöông trình hoài qui ta coù theå töï ñoaùn Y khi bieát X 7.3.2. Xaùc ñònh doác vaø tung ñoä goác cuûa ñöôøng hoài qui tuyeán tính Y b 1 ∧ Yi ∧ Yi eâi = Yi - Y i a Xi X Döïa vaøo soá hieäu cuûa maãu ta coù phöông trình hoài qui cuûa Y theo X coù daïng: ∧ Y = a + bX Trong thoáng keâ, ñeå xaùc ñònh tung ñoä goác a vaø ñoä doác b ngöôøi ta thöôøng söû duïng phöông phaùp bình phöông toái thieåu (least squared method) n ∧2 2 ( ) n n ∧ ∑ e = ∑ (Yi − Yi ) 2 = ∑ Y − a − bX i i =1 i =1 i =1 i Gv. Cao Haøo Thi 8
  9. Trong phöông phaùp bình phöông toái thieåu ta coù: n ∧2 ∑ Min e i i =1 Ñeå tìm cöïc tieåu ta caàn giaûi heä phöông trình: ∂n ∑ (Yi − a − bX i ) = 0 2 ∂ a i =1 ∂n ∑ (Yi − a − bX i ) 2 = 0 ∂ b i =1 Giaûi heä phöông trình ta coù: n n ∑( )( ) ∑x y xi − x yi − y − nxy i i i =1 i =1 b= = n 2 ∑( ) n 2 ∑ xi − x xa − nx i i =1 i =1 a = y − bx Ngöôøi ta chöùng minh ñöôïc raèng a, b laø nhöõng öôùc löôïng khoâng cheäch vaø vöõng cuûa A,B. ∧ Ñöôøng thaúng Y = a + bX ñöôïc goïi laø ñöôøng hoài qui thöïc nghieäm ∧ Ñöôøng thaúng Y = A + BX ñöôïc goïi laø ñöôøng hoài qui lyù thuyeát Ví duï Tìm ñöôøng hoài qui thöïc nghieäm cuûa y theo x cho bôøi baûng töông quan sau: xi 1 2 3 4 5 yi 2 5 4 3 6 Giaûi Goïi phöông trình ñöôøng hoài qui laø y = a + bx => xaùc ñònh a, b. xì2 xi yi xiyi 1 2 1 2 2 5 4 10 3 4 9 12 4 3 16 12 5 6 25 30 Toång 15 20 55 66 15 20 n= 2 =3 =4 x= y= 5 5 Gv. Cao Haøo Thi 9
  10. 5 ∑ x i y i − nxy 66 − 5 * 3 * 4 6 i =1 b= = = = 0.6 n 2 55 − 5 * 3 10 ∑ x i2 − nx 2 i =1 a = y − bx = 4 − 0.6 * 3 = 2.2 Phöông trình ñöôøng hoài qui thöïc nghieäm laø y = 0.6x + 2.2 Gv. Cao Haøo Thi 10
nguon tai.lieu . vn