Xem mẫu

Chương 6

Tương quan và h i quy

Trong chương này chúng ta s xem xét m i quan h gi a hai bi n ñ nh lư ng ñư c kh o sát
ñ ng th i trên m t ñám ñông, ñi u này có nghĩa là khi ta l y ng u nhiên m t cá th c a ñám
ñông ra xem xét thì ph i cân ño, phân tích, th nghi m ñ ng th i hai ñ c tính sinh h c ñ nh
lư ng X và Y.
Ví d cân và ño ñư ng kính c a tr ng gà, cân và ño vòng ng c c a bò, cân kh i lư ng bu ng
tr ng và ño chi u dài c a cá, nhi t ñ môi trư ng và lư ng th c ăn thu nh n; hàm lư ng lysin
và protein trong th c ăn, ñ dày m lưng và t l n c l n . . .
Sau khi kh o sát m t m u g m n cá th ta thu ñư c n c p s (xi, yi), m t câu h i r t t nhiên
là hai bi n X và Y có quan h v i nhau hay không ? n u có thì khi X thay ñ i Y s thay ñ i
theo như th nào?
Câu h i ñ u: X và Y có quan h v i nhau hay không ñư c trình b y m c h s tương quan,
câu h i sau khi X thay ñ i Y s thay ñ i theo như th nào ñư c trình b y m c h i quy.

6.1.

S p x p s li u

Khi có ít s li u có th ñ dãy n c p s dưói d ng c t hay hàng, n u nhi u hơn thì có th s p
dư i d ng có t n s , n u nhi u n a thì chia kho ng c X và Y ñ s p thành b ng hai chi u.
1) S p thành hàng
X
x1
Y
y1
2) S p thành hàng có t n s
X
x1
x2
Y
y1
y2
m
m1
m2
3) S p thành c t ho c thành c t có t n s
X
x1
x2
...
xn

Y
y1
y2
...
yn

x2
y2

...
...

...
...
...
X
x1
x2
...
xk

xn
yn

xk
yk
mk

n

Y
y1
y2
...
yk
T ng

m
m1
m2
...
mk
n

Chương 6 Tương quan và h i quy 89

4) S p thành b ng, X g m k l p, Y g m l l p v i các ñi m gi a xi và yj
y1

y2

...

yl

x1
x2
...

m11
m21
...

m12
m22
...

...
...
...

m1l
m2l
...

xk

mk1

mk2

...

mkl

T d ng b ng có th d dàng chuy n thành d ng c t hay hàng có t n s và ngư c tr l i
chuy n t d ng c t hay hàng có t n s thành b ng.
ph n sau các công th c tính toán ñưa ra ch ñúng khi s li u vi t dư i d ng hai c t không
có t n s , khi có t n s thì ph i thêm t n s vào các công th c.

6.2.

H s tương quan.

Trong toán h c khi có hai dãy s xi và yi ngư i ta có th kh o sát m i quan h gi a X và Y
b ng khái ni m hàm s .
Trong th ng kê xi và yi là các giá tr thu ñư c trong m u quan sát c a hai bi n ng u nhiên X,
Y và ngư i ta mu n ñưa ra m t con s ñ ñánh giá hai bi n ng u nhiên X và Y có quan h v i
nhau hay không.
Có khá nhi u con s ñư c dùng ñ ñánh giá X và Y có quan h hay không nhưng không có
con s nào tho mãn ñư c m i mong mu n c a chúng ta. Trong th c t , các nhà nghiên c u
thư ng quan tâm ñ n m i quan h tuy n tính gi a 2 tính tr ng. M c ñ quan h này ñư c th
hi n b ng h s tương quan. H s tương quan ñư c ñánh giá là ñơn gi n, d dùng và có
nhi u ưu ñi m, nhưng ch th hi n ñư c m i quan h tuy n tính gi a X và Y ch không th
dùng ñ ñánh giá m i quan h nói chung c a hai bi n.
6.2.1.

Tính h s tương quan

D a trên lý thuy t xác su t v h s tương quan chúng ta có công th c sau ñ tính h s tương
quan m u rXY gi a hai bi n ng u nhiên X và Y
n

∑(x

rXY =

i

− x )( yi − y )

1
n



( xi − x )

1

n

2



(6.1)

( yi − y )

2

1

Khai tri n công th c này ñư c công th c (6.2) thu n ti n hơn v m t tính toán
n

n

∑ xi yi −

rXY =

n

1

1

∑ xi ∑ yi
n

1
n

(x −

(∑ xi )

n

=

n

( ∑ yi )

2

2

_ _

∑ xi yi − n x y
1
_

_

(6.2)

( x − n( x) )( y − n( y ) )
2
i

2

2
1

2

)( y − 1
)
n
n
N u tính tu n t các tham s thì có th l n lư t tính phương sai m u c a bi n X, phương sai
m u c a bi n Y, hi p phương sai m u c a X và Y.
2
i

1

2
1

90 Thi t k thí nghi m

rXY =

Cov XY
s X sY

(6.3)

n

Trong ñó: s =
2
x

6.2.2.

1

(n − 1)

n

n

∑ ( xi − x )2
;

s =
2
y

∑ ( yi − y )2
1

(n − 1)

; cov XY =

∑ ( x − x )( y
i

i

− y)

1

(n − 1)

Tính ch t c a h s tương quan m u

1) Là m t s n m gi a -1 và + 1, nói cách khác rXY  ≤ 1
2) N u Y và X có quan h tuy n tính Y = a + bX thì rXY= 1 và ngư c l i n u rXY= 1 thì
Y và X có quan h tuy n tính Y = a + bX
3) N u X và Y ñ c l p v xác su t thì rXY = 0 nhưng ngư c l i không ñúng, n u rXY = 0 (g i
là không tương quan) thì chưa th k t lu n X và Y ñ c l p v xác suât. (Như v y ñ c l p v
xác su t suy ra không tương quan nhưng không tương quan không suy ra ñ c l p v xác su t).
4) N u th c hi n hai phép bi n ñ i tuy n tính
U= aX + b;

V = cY + d

thì rUV = rXY

Tính ch t này ñư c phát bi u dư i d ng: H s tương quan b t bi n ñ i v i phép bi n ñ i
tuy n tính.
Trong th ng kê thư ng dùng cách ch n g c ño m i và ñơn vi ño m i. N u g i xo là g c m i,
h là ñơn v m i, s ño x c a bi n X bây gi là u:
u=

(x − xo
)
hay x= xo + hu
h

như v y ta ñã th c hi n phép bi n ñ i tuy n tính X = xo + hU. Tương t ñ i v i Y ta bi n ñ i
Y = yo + kV
B n tính ch t này có th ch ng minh ch t ch nh các b t ñ ng th c toán h c ñ i v i 2 dãy s
nhưng ñây chúng ta th a nh n không ch ng minh.
H s tương quan ñư c coi là m t s ño m i quan h hay liên h tuy n tính gi a X và Y vì
khi rXY g n v phía 1 (thư ng g i là tương quan m nh) thì có th k t lu n X và Y có quan
h g n v i quan h tuy n tính, còn n u rXYg n v phía 0 ( thư ng g i là tương quan y u)
thì không k t lu n ñư c gì vì có th X và Y ñ c l p ho c có th có quan h , nhưng n u có thì
quan h này không th là quan h tuy n tính.
V d u thì n u rXY > 0 ta có tương quan dương, n u < 0 thì tương quan âm

H6 r = 1

H 7 r > 0 m nh

Chương 6 Tương quan và h i quy 91

H8 r0y u

Ví d 6.1: Nghiên c u m i quan h tuy n tính gi a ñư ng kính l n x (mm) và kh i lư ng y
(gram) c a m t lo i tr ng gà. Ti n hàn ño ñư ng kính l n và cân kh i lư ng c a 10 qu
tr ng. S li u thu th p ñư c như sau:
Qu tr ng

1

2

3

4

5

6

7

8

9

10

ðư ng kính l n (x)

57

54

55

52

55

60

56

56

57

58

Kh i lư ng (y)

61

59

58

56

57

59

56

58

56

60

D a vào công th c 6.1 ta có th tính ñư c h s tương quan như sau:
_

_

_

_

_

_

x

y

(x- x )

(y- y )

(x- x )²

(y- y )²

(x- x )(y- y )

57

61

1

3

1

9

3

54

59

-2

1

4

1

-2

55

58

-1

0

1

0

0

52
55
60
56
56
57
58
560

56
57
59
56
58
56
60
580

-4
-1
4
0
0
1
2
0

-2
-1
1
-2
0
-2
2
0

16
1
16
0
0
1
4
44

4
1
1
4
0
4
4
28

8
1
4
0
0
-2
4
16

_

_

Ta có: n = 10; Σxi = 560; Σyi = 580 ; x = 56; y = 58.
N u tính theo (6.1)

rXY =

16
44 × 28

= 0,4558

N u tính theo (6.2) thì
_

_

Σxi2 = 31404; Σyi2 = 33668; ( x )2 = 3136; Σxi2- n( x )2= 44
_

_

_

Σxiyi = 32496; Σxiyi - n× x × y = 16; Σyi2 - n( y )2 = 28
rXY =

16
= 0,4558
44 × 28

92 Thi t k thí nghi m

N u tính tu n t theo (8.3) thì:
2
sX =

44
28
16
2
= 1,7778
= 4,8889 ; sY =
= 3,1111 ; cov XY =
9
9
9

rXY =

6.3.

1,7778
= 0,4558
4,8889 × 3,1111

H i quy tuy n tính

V các ñi m quan sát Mi(xi,yi) trên h to ñ vuông góc, các ñi m này h p thành m t ñám
mây quan sát nhìn chung có d ng m t elíp (tr m t vài ñi m tách ra xa g i là ñi m ngo i lai),
n u rXY g n b ng 1 thì elíp r t d t, n u  rXYv a ph i thì elíp b u bĩnh, n urXY g n
b ng không thì có 2 kh năng: ho c ñám mây quan sát t n m n trên m t ph m vi r ng (không
quan h ), ho c ñám mây quan sát không còn d ng elíp mà t p trung thành m t hình cong (phi
tuy n).
Trư ng h p rXY g n 1 elíp ñám mây quan sát khá d t. ð gi i thích s thay ñ i c a Y khi
cho X thay ñ i ngư i ta thư ng ñưa ra mô hình h i quy tuy n tính Y = a + bX.
Có th tìm hi u mô hình h i quy tuy n tính theo hai cách sau ñây:

6.3.1.

ðư ng trung bình c a bi n ng u nhiên Y theo X trong phân ph i chu n 2 chi u

Kh o sát ñ ng th i 2 bi n ng u nhiên ñ nh lư ng (như ñã làm t ñ u chương này). C p bi n
X,Y thư ng tuân theo lu t chu n hai chi u, khi y n u theo dõi bi n X trư c thì ng v i m i
giá tr x c a bi n ng u nhiên X có vô s giá tr c a bi n Y, các giá tr này có giá tr trung bình
lý thuy t là kỳ v ng M(Y/ x).
Khi x thay ñ i kỳ v ng M(Y/x) thay ñ i theo và các ñi m P(x,M(Y/ x)) ch y trên m t ñư ng
th ng g i là ñư ng h i quy tuy n tính Y theo X.
N u theo dõi bi n Y trư c thì ng v i m t giá tr y c a Y có vô s giá tr c a bi n X có trung
bình là kỳ v ng M(X/ y). ði m Q(y, M(X/ y) ch y trên m t ñư ng th ng g i là ñư ng h i quy
tuy n tính X theo Y.
Như v y, v m t lý thuy t, khi có phân ph i chu n hai chi u các ñư ng h i quy tuy n tính Y
theo X và h i quy tuy n tính X theo Y chính là các ñư ng kỳ v ng có ñi u ki n M(Y/x) và
M(X/y).
Trong trư ng h p t ng quát c a phân ph i hai chi u các ñư ng kỳ v ng có ñi u ki n có th là
ñư ng th ng ho c ñư ng cong và ñư c g i là h i quy Y theo X (hay X theo Y). Trong th c
nghi m chúng ta kh o sát 2 bi n ñ nh lư ng b ng cách l y m u v i dung lư ng n khá l n.
Thay cho ñư ng h i quy tuy n tính lý thuy t có ñư ng h i quy th c nghi m. G i (x, y) là to
_

_

ñ c a m t ñi m ch y trên ñư ng th ng h i quy, x và y là trung bình c ng c a X và Y, sx và
sy là ñ l ch chu n c a X và Y, phương trình h i quy tuy n tính th c nghi m có d ng:
s
y − y = rXY Y ( x − x )
(6.4)
sX

nguon tai.lieu . vn