Xem mẫu

  1. Page 1 of 74 Chương 2 TH NG KÊ Bài 1 THAM S M U M C TIÊU 1. Trình bày ư c công th c nh nghĩa và công th c tính các tham s m u. 2. Tính ư c các tham s m u và nêu ư c ý nghĩa c a chúng. 1. CÁC KHÁI NI M Kho ng s th c kho ng óng [a, b] = {x là s th c : a ≤ x ≤ b} kho ng n a óng n a m [a, b) = {x là s th c : a ≤ x < b} ho c (a, b] = {x là s th c : a < x ≤ b} kho ng m (a, b) = {x là s th c : a < x < b}. Ký hi u t ng: n ∑ xi = x1 + x2 + ... + xn i =1 n n n ∑ ( xi + yi ) = ∑ xi +∑ yi i =1 i =1 i =1 n n ∑ axi = a∑ xi i =1 i =1 n ∑ a = n a. i =1 T p h p t ng quát và t p h p m u T p h p t ng quát là t p h p bao g m t t c các i tư ng c n nghiên c u. S ph n t c a t p h p t ng quát g i là kích thư c t p h p t ng quát, ký hi u là N. Vì các i u ki n h n ch , thư ng l y ra m t m u nghiên c u. T p h p m u là t p h p g m các i tư ng l y ra nghiên c u. S ph n t c a t p h p m u g i là kích thư c m u, ký hi u n. Nói chung N ≥ n. file://C:\WINDOWS\Temp\ttwyprsdrx\Chapter2.htm 12/10/2012
  2. Page 2 of 74 C n l y m u ng u nhiên, khách quan sao cho tính ch t c a t p h p m u ph n ánh úng tính ch t t p h p t ng quát. Có hai cách l y các ph n t ra nghiên c u. L y có hoàn l i là l y ra m t ph n t nghiên c u r i tr l i t p h p m u. K t qu các l n nghiên c u sau không ph thu c các k t qu nghiên c u trư c ó, phép th c l p. L y không hoàn l i là l y ra m t ph n t nghiên c u sau ó không tr l i t p h p m u. K t qu các nghiên c u sau ph thu c k t qu các nghiên c u trư c, phép th không c l p. D u hi u nghiên c u Khi nghiên c u ch quan tâm xem xét m t s m t, m t s tính ch t c a i tư ng nghiên c u. Các c tính, tính ch t c n nghiên c u g i là d u hi u nghiên c u. Có d u hi u nghiên c u v ch t, có d u hi u nghiên c u v lư ng. Các d u hi u v ch t ư c nghiên c u kh năng xu t hi n c a chúng, các d u hi u v lư ng ư c tính các tham s m u. 2. S P X P S LI U Khi ti n hành nghiên c u, s li u thu ư c theo th t th i gian. Như v y s li u chưa có th t theo giá tr . Trư c khi tính các tham s m u, s li u ư c s p x p theo th t giá tr . Vi c s p x p l i s li u không làm thay i k t qu tính. Có nh ng bài toán mà thu t toán òi h i ph i gi nguyên th t thu ư c theo th i gian thì không ư c s p x p l i s li u. S p x p s li u thành dãy tăng ho c b ng g i là dãy không gi m x1 ≤ x 2 ≤ x 3 ≤ ... ≤ x n (1) S p x p s li u thành dãy gi m ho c b ng g i là dãy không tăng x1 ≥ x 2 ≥ x 3 ≥ ... ≥ x n (2) Có th s p x p s li u thành dãy các giá tr khác nhau tăng d n tương ng v i t n s xu t hi n c a chúng. x1 x2 K xk k m1 m2 K mk v i ∑ mi =n (3) i=1 V i nh ng nghiên c u có kích thư c m u n r t l n, tính các tham s m u thu n ti n mà sai s không áng k , có th phân chia s li u thành nhi u l p. G i k là s l p c n phân chia : k ≥ 1 + 3,32 lgn. G i kho ng r ng c a m i l p là ∆x Rx ∆x ≤ k ∆x Như v y sai s δ = . V i ∆x ã bi t, phân chia s li u vào các l p t αi– 1 n αi. 2 file://C:\WINDOWS\Temp\ttwyprsdrx\Chapter2.htm 12/10/2012
  3. Page 3 of 74 K t qu thu ư c dãy giá tr gi a các l p tương ng v i t n s xu t hi n c a l p: ôi khi t s li u thu ư c, ch n δ sao cho phù h p v i s li u, t ó có: ∆x = 2δ, sau ó phân chia s li u vào các l p như trên. G i x là áp l c ng m ch ph i thì tâm thu b nh nhân h p hai lá (mmHg). o 153 b nh nhân, max x i = 157 , min x i = 15 ∀i ∀i R x = 157 − 15 = 142 k ≥ 1 + 3,32 lg153 = 8, 2 . 142 L y k = 9 ∆x ≤ = 15, 77 ⇒ ∆x = 15 . 9 S p x p s li u vào 9 l p ư c k t qu sau: (αi-1 - αi) 88 – 103 – 118 – 133 – 148 – 13 – 28 28 – 43 43 – 58 58 – 73 73 – 88 103 118 133 148 163 xi 20,5 35,5 50,5 65,5 80,5 95,5 110,5 125,5 140,5 155,5 mi 6 20 33 24 28 12 17 8 4 1 10 ∑ mi = 153 i =1 Chú ý : T s li u chia k l p s thành k + 1 l p. Tính các tham s m u khi chia l p s có sai s . 3. CÁC THAM S M U Trong ph n này ch nêu các tham s m u thư ng dùng. ó là trung bình m u, phương sai và l ch m u. 3.1. Trung bình m u x nh nghĩa và công th c tính n 1 x= n ∑ xi theo (1) (4) i =1 k 1 = n ∑ mi x i theo (3) (5) i =1 k 1 = x 0 + ∆x . n ∑ mi ui = x 0 + ∆xu . (6) i =1 x − x0 Trong (6) u i = i v i x0 và ∆x tuỳ ch n. ∆x file://C:\WINDOWS\Temp\ttwyprsdrx\Chapter2.htm 12/10/2012
  4. Page 4 of 74 T (5) suy ra (6) b ng cách thay xi = ∆x.ui + x0 vào (5) 1 k ∆x k x0 k 1 k ∑ mi (∆x.u i + x 0 ) = n ∑ mi ui + n ∑ mi = x 0 + ∆x n ∑ mi ui n i =1 i =1 i =1 i =1 Trung bình c ng là tr s bình quân c a các giá tr khác nhau, nhưng thu c cùng m t lo i. x có cùng ơn v xi. S th p phân c a x hơn s th p phân c a xi m t ch s . x là tâm qu n t c a t p h p m u. Tính ch t yi = x i + x 0 ⇒ y = x + x 0 ⇔ x = y-x 0 xi x yi = ( ∆x ≠ 0) ⇒ y = ⇔ x = ∆xy ∆x ∆x z i = yi + x i ⇒ z = y + x . 3.2. Phương sai s2, l ch m u s nh nghĩa và công th c tính 1 n s2 = ∑ (x i − x)2 n − 1 i =1 theo (1) (7) 1 k = ∑ mi (xi − x)2 n − 1 i =1 theo (3) (8)  2 1  k 2  k   = n ∑ mi x i −  ∑ mi x i   (9) n(n − 1)  i =1      i =1    2 ∆x 2  k 2  k   = n ∑ mi u i −  ∑ m i u i   (10) n(n − 1)  i =1      i =1   xi − x 0 trong ó u i = v i ∆x, x0 tuỳ ch n, ∆x ≠ 0. ∆x k 1 T (8), sau khi bình phương và thay x = n ∑ mi xi suy ra (9). i =1 Trong (9) thay x i = ∆x.u i + x 0 d n n file://C:\WINDOWS\Temp\ttwyprsdrx\Chapter2.htm 12/10/2012
  5. Page 5 of 74  2 1  k 2  k   s2 = n ∑ mi (∆xu i + x 0 ) −  ∑ mi (∆xu i + x 0 )   n(n − 1)  i =1      i =1   k k k 2 1  2   n∆x ∑ mi u i + 2nx 0 ∆x ∑ mi u i + (nx 0 ) − ∆x  ∑ mi u i  − 2 2 2 = n(n − 1)     i =1 i =1  i=1  k  −2nx 0 ∆x ∑ mi u i − (nx 0 ) 2  i =1    2 ∆x 2  k 2  k   = n ∑ mi u i −  ∑ mi u i   . (10) ư c ch ng minh. n(n − 1)  i =1      i =1   s2 không cùng ơn v v i xi. s= s2 ư c g i là l ch m u. s có cùng ơn v và s th p phân v i x . Như v y s2 có s th p phân g p hai s th p phân c a s. s2 là trung bình c a bình phương kho ng l ch gi a xi và x cho nên g i t t là phương sai. s2 hay s cho bi t m c t n m n c a xi so v i tâm c a m u là x , như v y cũng cho bi t i di n c a x cho các xi t t hay không. Khi o m t i lư ng nhi u l n, s 2 và s cho bi t chính xác c a các giá tr o ư c, s2 hay s ư c xem là sai s c a cách o. s và x cùng ơn v , có cùng s th p phân. Ngư i ta thư ng vi t x ± s i di n cho m u thu ư c. Công th c (6) và (10) ư c s d ng khi các xi l n ho c có s th p phân ho c cách u. Tính ch t yi = x i + x 0 ⇒ s 2 = s 2 y x xi s2 yi = (∆x ≠ 0) s2 = y x 2 ⇔ s 2 = ∆x 2s2 x y ∆x ∆x 2 zi = x i + yi ⇒ s z = s2 x + s2 y khi X và Y là hai i lư ng c l p. Các công th c khác Trong m t s trư ng h p, phương sai ư c cho dư i d ng sau: 1 k s*2 = ∑ mi ( xi − MX )2 n i =1 v i MX ã bi t. (11) s*2 ư c xem là phương sai lý thuy t DX c a i lư ng ng u nhiên khi n l n. file://C:\WINDOWS\Temp\ttwyprsdrx\Chapter2.htm 12/10/2012
  6. Page 6 of 74 = x2 − x 2 . (12) 2 s* là phương sai ch ch c a phương sai lý thuy t c a i lư ng ng u nhiên. Cách vi t (12) thư ng g p trong các công th c tính tham s c a ư ng cong h i quy và h s tương quan tuy n tính. 3.3. Phương sai c a k dãy giá tr Trong các nghiên c u ng th i k i lư ng, s li u ư c cho dư i d ng sau: X1 X2 K Xj K Xk x11 x12 K x1j K x1k x 21 x 22 K x2 j K x 2k M M K M K M x i1 x i2 K x ij K x ik M M K M K M x n11 x n 2 2 K x n j j K x n k k G i x là trung bình chung c a k dãy, x j là trung bình c a dãy th j k,n j 1 x= N ∑ xij (13) j,i =1 n 1 j x j = ∑ x ij j = 1, k (14) n j i =1 Tuỳ thu c k dãy giá tr c a cùng m t i lư ng hay c a k i lư ng khác nhau s có tương ng hai phương sai. 2 Phương sai c a k dãy giá tr c a cùng m t i lư ng S 2 1 k S = ∑ n j (x j − x)2 k − 1 j=1 (15)  n 2 k,n 2 1 k 1  j  1 j   = ∑  ∑ x ij  − N  ∑ x ij   k − 1  j=1 n j  i =1    (16)      j,i =1   file://C:\WINDOWS\Temp\ttwyprsdrx\Chapter2.htm 12/10/2012
  7. Page 7 of 74 n k, n 2 2 B−C k 1  j  1 j  v i B = ∑  ∑ x ij  , C =  ∑ x ij  . k −1  j=1 n j  i=1  N  j,i =1     2 S là trung bình c a bình phương kho ng l ch gi a trung bình c a t ng dãy và trung bình chung c a k dãy Th c hi n bình phương công th c (15) 2 1 k 2 2 S = ∑ n j (x j − 2x j x + x ) k − 1 j =1  2 k ,n j  1 k 1  nj  −2  = ∑ k − 1  j =1 n j  ∑ xij  − 2 x ∑ xij + Nx  i =1       j ,i =1    2 k ,n 2 1 k 1  nj  1 j   = ∑ k − 1  j =1 n j  ∑ xij  −  ∑ xij   i =1  N  j ,i =1           Thu ư c công th c (16) Phương sai c a k dãy giá tr c a k i lư ng khác nhau thu c cùng m t lo i S2 k, n j 1 2 S = N−k ∑ (x ij − x j )2 (17) j, i =1  k,n nj 2 1  j 2 k 1   = ∑ N − k  j,i = 1 xi j − ∑  nj  ∑  x ij   (18)   j =1  i =1    k,n j A−B 2 S = N−k , v i A= ∑ x ij2 và B ã bi t. j,i =1 S2 là trung bình c a bình phương các kho ng l ch gi a các giá tr trong dãy và trung bình c a dãy. Th c hi n bình phương công th c (17) k,n j 1 2 S = N−k ∑ ( x ij − x j )2 j, i =1 k,n j 1 = N−k ∑ (xij − 2x jxij + x j2 ) 2 j,i =1 file://C:\WINDOWS\Temp\ttwyprsdrx\Chapter2.htm 12/10/2012
  8. Page 8 of 74  k, n j nj nj 2 1  k k 1   = N−k  ∑ 2 x ij −2∑ xj ∑ x ij + ∑ n j   nj ∑ x ij      j,i =1 j =1 i =1 j =1  i =1     k,n nj 2 1  j 2 k 1   = ∑ N − k  j,i = 1 xi j − ∑   ∑  x ij   j =1 nj  i =1      Công th c (18) ư c ch ng minh. 3.4. Các tham s khác H s bi n thiên Cv s 0 Cv = ( /00) x Cv cho bi t chính xác tương i gi a s so v i x . Cv là t s , vi t dư i d ng % hay 0/00., cho phép so sánh chính xác tương i gi a các i lư ng không cùng ơn v . S trung v M e : M e là giá tr gi a c a n giá tr ã s p x p S m t M0 M0 = xi mà mi l n nh t trong các m1, m2,..., mk M0 là giá tr hay g p nh t trong k giá tr x1, x2, …, xk. V i s li u chu n theo m t nghĩa nào y thì Me = M0 = x V y Me, M0 là các giá tr cũng cho bi t tâm c a t p h p m u. Trung bình nhân, Trung bình i u hoà. Khi nghiên c u thu ư c dãy s li u x1 x2 . . . xn. ôi khi s d ng trung bình nhân g ho c trung bình i u hoà h trong x lý s li u. Công th c tính có d ng sau: g = n x1x2 ...xn 1 1 1 h= + + ... + x1 x2 xn Ví d : 1. G i X là áp l c ng m ch ph i th i tâm trương ngư i bình thư ng file://C:\WINDOWS\Temp\ttwyprsdrx\Chapter2.htm 12/10/2012
  9. Page 9 of 74 o 30 ngư i ư c k t qu sau: Giá tr xi (mm Hg) 2 3 4 5 6 7 8 9 S ngư i mi 1 4 7 8 2 5 2 1 Tính các tham s c a m u trên. Gi i: 2 Cách 1. L p b ng tính x theo (5) và s x theo (9) i xi mi mi xi mi x 2 i 1 2 1 2 4 2 3 4 12 36 3 4 7 28 112 4 5 8 40 200 5 6 2 12 72 6 7 5 35 245 7 8 2 16 128 k=8 9 1 9 81 ∑ 30 154 878 154 x = = 5,133 − 5,1. % 30 1 2624 s2 = x [30 × 878 − 154 2 ] = = 3, 0161 − 1, 74 2 % 30 × 29 870 1, 74 Cv = = 0, 339 5,13 M e = x 30 = 5, M0 = 5 . 2 2 Cách 2. L p b ng ki m tra, tính x theo (6) và s x theo (10). Ch n x0 = 5 và x = 1 d n xi - 5 n ui = = x i -5 1 file://C:\WINDOWS\Temp\ttwyprsdrx\Chapter2.htm 12/10/2012
  10. Page 10 of 74 1 x =5 + × 4 = 5,133 − 5,1. % 30 12 2624 s2 = x [30 × 88 − 42 ] = = 3, 0161 − 1, 742 % 30 × 29 870 Các giá tr c a x và s 2 trùng v i các k t qu trên. x 2. G i X là lư ng Protein huy t thanh ngư i bình thư ng (g/l). i n di 17 m u c a 17 ngư i thu ư c k t qu sau: Giá tr x (g/l) 6,9 7,2 7,6 8,2 8,5 i S ngư i m 2 3 5 6 1 i Tính các tham s c a m u trên Gi i: x i − 7, 5 x −8 L p b ng tính x theo (6) và s 2 theo (10) v i u i = x và vi = i 0,1 0,1 0,1 0,1 x = 7, 5 + ×36 = 8 + × (-49) = 7, 71 17 17 0,12  0,12  0,12 × 7170 s2 = x 17 × 498 - 362  = 17×563 - 492  = = 0, 2636 = 0,512 17×16   17×16   272 0, 51 x ± s = 7, 71 ± 0, 51(g / l) C v = = 0, 066, M e = 7, 6, M 0 = 8, 2 . 7, 71 3. G i X1, X2, X3, X4 là th i gian h t ký sinh trùng s t rét trong máu (gi ) c a b n nhóm b nh nhân i u tr theo b n cách khác nhau. K t qu nghiên c u thu ư c s li u sau: X1 18 37 46 46 46 51 62 78 85 90 X2 38 41 41 42 43 44 45 50 50 52 X3 36 48 50 52 58 60 60 68 74 74 36 38 40 42 48 60 62 70 72 72 file://C:\WINDOWS\Temp\ttwyprsdrx\Chapter2.htm 12/10/2012
  11. Page 11 of 74 X4 Tính các tham s x , s, S2 ,S2 c a b n dãy s li u. % i 2 2 2 2 X1 X1 X2 X2 X3 X3 X4 X4 1 18 324 38 1444 36 1296 36 1296 2 37 1369 41 1681 48 2304 38 1444 3 46 2116 41 1681 50 2500 40 1600 4 46 2116 42 1764 52 2704 42 1764 5 46 2116 43 1849 58 3364 48 2304 6 51 2601 44 1936 60 3600 60 3600 7 62 3844 45 2025 60 3600 62 3844 8 78 6084 50 2500 68 4624 70 4900 9 85 7225 50 2500 74 5476 72 5184 10 90 8100 52 2704 74 5476 72 5184 Σ 559 35.895 446 20.084 580 34.944 540 31.120 4 ∑ n j = 10 + 10 + 10 + 10 = 40 i =1 559 1 x1 = = 55,9 s 21 = x [10 x 35.895 – 559 2] = 516,3222 = 22,722 10 10 × 9 446 1  x2 = = 44, 6 s2 2 = x 10 × 20.084 − 446 2  = 21,3778 = 4, 62 2 10 10 × 9   580 1  x3 = = 58 s23 = x 10 × 34.944 − 5802  = 144,8889 = 12, 042 10 10 × 9   540 1  x4 = = 54 s2 4 = x 10 × 31.120 − 5402  = 217, 7778 = 14, 762 10 10 × 9   1 x= (559 + 446 + 580 + 540) = 53,125. 40 A = 35.895 + 20.084 + 34.944 + 31.120 = 122.043 5592 4462 5802 5402 B= + + + = 113.939, 7 10 10 10 10 1 C= [559 + 446 + 580 + 540]2 = 112.890, 625 40 1 s2 = % [113.939, 7 − 112.890, 625] = 349, 6917 4 −1 1 s2 = % [122.043 − 113.939, 7] = 225, 0917. 40 − 4 file://C:\WINDOWS\Temp\ttwyprsdrx\Chapter2.htm 12/10/2012
  12. Page 12 of 74 Chú ý: N u k dãy s li u c a cùng m t i lư ng, có th i bi n X j − x0 uj = v i x0 và ∆x tuỳ ch n j = 1, k , tính toán s thu n l i hơn. ∆x 2 Khi ó s 2 = ∆x % (B − C) , B và C tính theo uj. k −1 Chú ý: ôi khi giá tr trung bình không ph n ánh úng k t qu nghiên c u như các ví d dư i ây. 4. ánh giá m t phương pháp i u tr ngo i khoa m i kéo dài 10 năm nh n th y: Năm 1, 2, 3 i u tr cho 47 b nh nhân, k t qu t t: 31 ngư i Năm 4, 5, 6, 7 i u tr cho 96 b nh nhân, k t qu t t: 71 ngư i. Năm 8, 9, 10 i u tr cho 64 b nh nhân, k t qu t t: 58 ngư i. 160 T l t t trung bình c a phương pháp i u tr b ng = 0, 773. T năm 11 tr it l i u tr t t l n 207 58 hơn (90, 6%) . V y giá tr trung bình không ph n ánh úng k t qu nghiên c u. 64 5. Ch tiêu tuy n sinh vào khoa I ( K) năm 2000 c a H X là 260. S thí sinh ăng ký thi : 3267; Trung bình 13 thí sinh l y 1 ngư i. Ch tiêu tuy n sinh vào khoa II (KTYH) c a H X là 50. S thí sinh ăng ký thi : 641; Trung bình 13 thí sinh l y 1 ngư i. Ch tiêu tuy n sinh vào khoa III (YTCC) c a H X là 30. S thí sinh ăng ký thi : 1134; Trung bình 38 thí sinh l y 1 ngư i. Thí sinh thi vào khoa III có nên chuy n sang thi vào khoa I không? vào khoa I, m i thí sinh ph i hơn ít nh t 3007 thí sinh khác. vào khoa III, m i thí sinh ch ph i hơn ít nh t 1104 thí sinh khác. Thí sinh thi vào khoa II không nên i nguy n v ng sang khoa khác vì khó hơn. CÂU H I T LƯ NG GIÁ Hãy ch n m t k t qu úng. 1. nh lư ng Protein d ch não t y ngư i bình thư ng (X, v mg%) thu ư c s li u sau: 11 17 19 12 17 19 14 18 19 16 18 20 16 18 20 16 18 20 16 19 20 16 19 20 16 19 21 17 19 21 17 19 21 17 19 22 Tính x ± s c a s li u trên theo công th c tính. K t qu : A. 17,94±2,37; B. 17,94±2,40; C. 18,48±2,40; D. 18,48±2,37; E. s khác file://C:\WINDOWS\Temp\ttwyprsdrx\Chapter2.htm 12/10/2012
  13. Page 13 of 74 2. G i X là áp l c trung bình c a ng m ch ph i b nh nhân h p hai lá ơn thu n ( v: mmHg), nghiên c u thu ư c s li u sau: xi 13 23 33 43 53 63 73 83 93 103 mi 5 20 27 24 25 23 15 10 4 2 Tính x ± s c a s li u trên. K t qu : A. 50,162±20,690; B. 49,839±20,690; C. 50,162±20,757; D. 49,839±20,757; E. s khác 3. m nh p tim (t n s tim) c a tr nam 3 l a tu i thu ư c k t qu sau: Nhóm I 9 tu i n1 = 30 x1 ± s1 = 72,77±4,60 Nhóm II 10 tu i n2 = 45 x 2 ± s 2 = 72,47±5,06 Nhóm III 11 tu i n3 = 32 x 3 ± s3 = 73,63±5,42. Tính phương sai chung S2 c a 3 nhóm s li u trên. K t qu : A. 25,3800; B. 25,2674; C. 25,4891; D. 12,9012; E. s khác. 4. Theo dõi s chu t ch t khi cho các lô chu t thí nghi m s d ng các li u thu c có c tăng d n thu ư c s li u sau: xi(li u, mg/kg) 0,015 0,02 0,025 0,03 0,035 0,04 S chu t m i lô 20 69 95 78 44 20 S ch t 0 11 50 61 37 20 Tính li u ch t trung bình c a s li u trên (S li u Finney). K t qu : A. 0,02846; B. 0,0247; C. 0,0253; D. 0,0255; E. s khác. file://C:\WINDOWS\Temp\ttwyprsdrx\Chapter2.htm 12/10/2012
  14. Page 14 of 74 Bài 2 KI M NH GI THI T TH NG KÊ M C TIÊU Trình bày ư c các bư c c a bài toán ki m nh. i u tr m t b nh b ng nhi u phương pháp, m i phương pháp có m t t l kh i nh t nh. Các t l kh i c a các phương pháp có như nhau không ? nh lư ng Protein toàn ph n trong máu tr suy dinh dư ng trư c và sau i u tr . Phương pháp i u tr có hi u qu không ? Nói cách khác, lư ng Protein toàn ph n trung bình sau i u tr có cao hơn h n lư ng Protein toàn ph n trung bình trư c i u tr không ? i u tra n i tư ng nghiên c u th y m i tư ng có c tính A. Kh năng xu t hi n hi n tư ng A là po có úng không ? Trên ây là nh ng bài toán ki m nh gi thi t th ng kê. 1. GI THI T VÀ I GI THI T Trong bài toán ki m nh gi thi t th ng kê, gi thi t c n ki m nh ký hi u H 0 , ư c nêu ra dư i d ng: các t l như nhau, các trung bình như nhau... Các gi thi t i l p v i gi thi t H 0 g i t t là i thi t, ký hi u H1. i gi thi t không như nhau hay khác nhau ư c g i là i gi thi t hai phía. i gi thi t l n hơn hay nh hơn là các i gi thi t m t phía. Tuỳ theo giá tr thu ư c trong nghiên c u ưa ra i gi thi t m t phía hay hai phía. 2. I U KI N Các bài toán khác nhau có nh ng i u ki n khác nhau, song m b o tính úng n và chính xác c a ki m nh có m t s i u ki n sau: + i u ki n chu n. + i u ki n n l n. + i u ki n ám ông thu n nh t. 3. TÍNH GIÁ TR C A I LƯ NG NG U NHIÊN ó là các giá tr c a i lư ng ng u nhiên chu n T ho c Student Tn ho c i lư ng ng u nhiên χ2 … Các công th c tính ư c nêu trong t ng bài toán c th . 4. TRA GIÁ TR T I H N Trư c h t c n ch n m c α, sau ó tra giá tr t i h n tương ng m c α ó. M c α thư ng ch n là 0,05, cũng có khi ch n t i m c 0,01 hay 0,001. file://C:\WINDOWS\Temp\ttwyprsdrx\Chapter2.htm 12/10/2012
  15. Page 15 of 74 Giá tr t i h n chia mi n giá tr c a i lư ng ng u nhiên thành hai mi n: mi n có giá tr ng v i xác su t l n 1 – α là mi n gi gi thi t H0, mi n có giá tr ng v i xác su t bé α là mi n bác gi thi t H0. Tuỳ theo giá tr tính ư c c a i lư ng ng u nhiên thu c mi n nào mà quy t nh k t lu n bài toán ki m nh. 5. CÁC XÁC SU T C A BÀI TOÁN KI M NH H0 úng Giá tr c a i lư ng ng u nhiên thu c mi n gi gi thi t. Xác su t gi gi thi t khi gi thi t úng g i là tin c y. Giá tr c a i lư ng ng u nhiên thu c mi n bác gi thi t. Xác su t bác gi thi t khi gi thi t úng g i là nguy hi m lo i I hay sai l m lo i I. Do Ho úng, sai l m lo i I chính là α , còn tin c y là 1 – α . H0 sai Giá tr c a i lư ng ng u nhiên thu c mi n gi gi thi t. Xác su t gi gi thi t khi gi thi t sai g i là nguy hi m lo i II hay sai l m lo i II. Hàm sai l m lo i II ký hi u là β . Giá tr c a i lư ng ng u nhiên thu c mi n bác gi thi t. Xác su t bác gi thi t khi gi thi t sai g i là l c c a ki m nh. L c c a ki m nh b ng 1 – β . Khi α bé, 1 – α l n thì β s l n. N un l n thì α và β s có giá tr nh . Khi n l n, kinh phí nghiên c u l n vì v y c n ch n n, α và β phù h p v i nhau; khuy n cáo nên ch n α m c 0,05. file://C:\WINDOWS\Temp\ttwyprsdrx\Chapter2.htm 12/10/2012
  16. Page 16 of 74 Bài 3 SO SÁNH PHƯƠNG SAI, SO SÁNH TRUNG BÌNH C A HAI BI N CHU N M C TIÊU 1. Gi i ư c bài toán so sánh 2 phương sai, 2 trung bình. 2. Nêu ư c ý nghĩa bài toán. 1. SO SÁNH PHƯƠNG SAI Nghiên c u i lư ng ng u nhiên X thu ư c dãy giá tr x1, x2 …xn (1) Nghiên c u i lư ng ng u nhiên Y thu ư c dãy giá tr y1, y2 …ym (2) chính xác c a các s li u c a hai i lư ng ho c t n m n c a hai dãy s li u c a hai i lư ng có như nhau không ? Gi i bài toán trên c n so sánh phương sai c a hai i lư ng ng u nhiên X và Y. 1.1. Tính tham s m u Tính tham s m u c a dãy (1) : x ± s x v i n ã bi t. Tính tham s m u c a dãy (2) : y ± s y v i m ã bi t. 1.2. Các bư c c a bài toán ưa ra gi thi t H 0 : DX = DY và H1 : DX ≠ DY. Ki m tra i u ki n: i lư ng ng u nhiên X chu n; i lư ng ng u nhiên Y chu n. Tính giá tr F. s2 Gi s s 2 > s.2 , x y Fn −1, m −1 = x (3) s2 y Tra b ng Fn–1, m–1 trong (3) là giá tr c a i lư ng ng u nhiên tuân theo quy lu t Fisher – Snedecor v i n – 1 và m – 1 b c t do. Tra f(n – 1; m – 1; 0,05) trong b ng quy lu t Fisher–Snedecor, n – 1 tra c t n1 và có th n i suy, m – 1 tra hàng n 2 và l y giá tr g n nh t. K t lu n Fn −1, m−1 ≤ f (n − 1, m − 1;0, 05) : ch p nh n gi thi t H 0 . Fn −1, m−1 > f (n − 1, m − 1;0, 05) : bác b gi thi t H 0 , ch p nh n i gi thi t H1 . file://C:\WINDOWS\Temp\ttwyprsdrx\Chapter2.htm 12/10/2012
  17. Page 17 of 74 T k t lu n trên suy ra ý nghĩa c a bài toán. Ví d o ư ng kính c a viên thu c (mm) do hai máy thu c hai lo i d p ra, thu ư c s li u sau: Máy I X: 5,54 5,69 5,62 5,80 5,67 5,52 5,77 5,65 Máy II Y: 5,64 5,42 5,58 5,52 5,29 5,50 5,67 5,48 5,32 5,44 chính xác c a hai máy có như nhau không ? Gi i 1. Tham s m u c a hai dãy s li u n = 8, x ± s x = 5, 658 ± 0, 0098 . m = 10, y ± s y = 5, 486 ± 0, 0156 . 2. So sánh hai phương sai H0: DX = DY H1 : DX ≠ DY i u ki n Gi s X tuân theo quy lu t chu n. Gi s Y tuân theo quy lu t chu n. Tính F 0, 0156 F= = 1, 59 0, 0098 K t lu n Tra b ng quy lu t Fisher – Snedecor f(10 – 1; 8 – 1; 0,05) 1 f(9; 7; 0,05) = [f(8; 7; 0,05) + f(10; 7; 0,05)] 2 1 = [3,73 + 3,63] = 3,68. 2 K t lu n: 1,59 < 3,68 : ch p nh n gi thi t H0 nghĩa là hai phương sai như nhau. Hai máy có chính xác như nhau. 2. SO SÁNH HAI TRUNG BÌNH LÝ THUY T Khi nghiên c u thư ng g p bài toán: giá tr trung bình c a nhóm nam X có b ng giá tr trung bình c a nhóm n Y không ho c giá tr trung bình c a nhóm i u tr cách m t X có b ng giá tr trung bình c a nhóm i u tr cách hai Y không. Gi i bài toán, c n so sánh giá tr trung bình lý thuy t c a hai nhóm. 2.1. Tính tham s m u T hai dãy s li u thu ư c n giá tr c a i lư ng ng u nhiên X và m giá tr c a i lư ng ng u nhiên file://C:\WINDOWS\Temp\ttwyprsdrx\Chapter2.htm 12/10/2012
  18. Page 18 of 74 Y, c n tính x ± s x và y ± s y . 2.2. So sánh hai trung bình lý thuy t t gi thi t H0: MX = MY. t gi thi t i l p H1: MX > MY (Trư ng h p 1) ho c MX ≠ MY (Trư ng h p 2) Ki m tra i u ki n: i lư ng ng u nhiên X chu n. i lư ng ng u nhiên Y chu n. Tính giá tr T. Công th c tính T ph thu c vào giá tr DX, DY c a hai i lư ng X và Y có bi t không. 2.2.1. Bi t DX, DY: DX = σ2 , x DY = σ2 y x−y T= (1.1) σ2 x σ2 y + n m T là giá tr c a i lư ng ng u nhiên chu n t c. K t lu n: Tra giá tr t i h n t(α) ng v i (Trư ng h p 1) ho c t(α/2) ng v i (Trư ng h p 2) trong b ng chu n, l y α = 0,05. Khi T ≤ t(α) ho c t(α/2): ch p nh n gi thi t H 0 . Ngư c l i T > t(α) ho c t(α/2): bác b gi thi t H 0 , ch p nh n i thi t H1 . 2.2.2. Không bi t DX, DY, nhưng gi thi t r ng DX = DY x−y T= (1.2) 1 1 s+ n m Trong (1.2) s2 là phương sai m u chung c a hai dãy s li u. n m ∑ (xi − x)2 + ∑ (yi − y)2 (n − 1)s 2 + (m − 1)s 2 x y (2) 2 i =1 i =1 s = = n+m−2 n+m−2 K t lu n: T là giá tr c a i lư ng ng u nhiên có quy lu t Student v i n + m – 2 b c t do. Tra giá tr t(n + m –2; α) ho c t(n + m –2; α/2) trong b ng Student. Khi T ≤ t(n + m – 2; α) ho c t(n + m – 2; α/2): ch p nh n gi thi t H0. Ngư c l i T > t(n + m – 2; α) ho c t(n + m – 2; α/2): bác b gi thi t H0, ch p nh n i thi t H1. 2.2.3. Không bi t DX, DY file://C:\WINDOWS\Temp\ttwyprsdrx\Chapter2.htm 12/10/2012
  19. Page 19 of 74 x−y (1.3) T= s2 x s2 y + n m K t lu n: T là giá tr c a i lư ng ng u nhiên x p x Student, khi ó giá tr g n úng τ (α) ư c tính theo công th c: s 2 t(n − 1; α ) + s 2 t(m − 1; α ) x y τ( α ) = (3) s2 + s2 x y τ(α/2) tính tương t (3). Khi T ≤ τ (α) ho c τ (α/2): ch p nh n gi thi t H0. Ngư c l i T > τ (α) ho c τ (α/2): bác b gi thi t H0, ch p nh n i thi t H1. Ví d 1. G i X là ư ng kính các viên thu c do máy I d p có k t qu : n = 8; x ± s x = 5,658 ± 0, 0098 . G i Y là ư ng kính các viên thu c do máy II d p có k t qu : m = 10; y ± s y = 5,486 ± 0, 0156 . ư ng kính trung bình c a các viên thu c do hai máy d p ra có như nhau không? Gi i: H0: MX = MY , H1: MX ≠ MY. i u ki n i lư ng ng u nhiên X tuân theo quy lu t chu n. i lư ng ng u nhiên Y tuân theo quy lu t chu n. Tính T Theo k t qu so sánh phương sai trên, ta có phương sai c a bi n X và bi n Y là như nhau, nên c n tính phương sai chung c a hai bi n. (8 − 1)0, 0098 + (10 − 1)0, 0156 s2 = = 0,11432 8 + 10 − 2 5, 658 − 5, 486 T= = 3,173 1 1 0,1143 + 8 10 K t lu n Tra giá tr t i h n t(8 + 10 – 2; 0,05/2) = 2,120, t(8 + 10 – 2; 0,01/2) = 2,921. Do T = 3,173 > 2,921 : bác b gi thi t H0. Trung bình hai dãy s li u khác nhau m c 99%. ư ng kính trung bình c a các viên thu c do hai máy d p ra là khác bi t có ý nghĩa th ng kê. Không nên dùng hai máy d p các viên thu c. N u c n dùng c hai máy thì ph i ch nh máy. file://C:\WINDOWS\Temp\ttwyprsdrx\Chapter2.htm 12/10/2012
  20. Page 20 of 74 2. nh lư ng Protein toàn ph n trong huy t thanh b nh nhi suy dinh dư ng trư c i u tr X và sau i u tr Y, thu ư c s li u sau: X(g/l) 55,8 53,3 30,1 51,0 37,8 68,6 57,7 59,1 49,4 35,4 53,4 42,7 21,2 28,3 57,3 42,4 61,4 Y(g/l) 60,4 58,7 28,9 48,0 39,7 68,8 57,5 70,4 56,8 40,6 57,3 44,3 32,2 47,7 77,0 55,1 66,1 Phương pháp i u tr có hi u qu không ? Gi i Tính tham s m u Trư c i u tr n = 17, x ± s x = 47,35 ± 173, 6564 . Sau i u tr m = 17, y ± s y = 53,5 ± 182, 0925 . H0: MX = MY, H1: MX < MY. i u ki n : Gi s i lư ng ng u nhiên X tuân theo quy lu t chu n. Gi s i lư ng ng u nhiên Y tuân theo quy lu t chu n. Tính T Gi s hai phương sai như nhau, c n tính s2. (17 − 1)173, 6564 + (17 − 1)182, 0925 s2 = = 177,8745 = 13, 342 17 + 17 − 2 53,5 − 47,35 T= = 1,344 1 1 13,34 + 17 17 K t lu n Tra b ng Student t(17 + 17 –2; 0,05) ≈ t(30; 0,05) = 1,697. T = 1,344 < 1,697. Gi gi thi t m c 95%. Lư ng Protein toàn ph n trong huy t thanh b nh nhi trư c và sau i u tr như nhau. Phương pháp i u tr chưa th t s hi u qu . Chú ý: Khi quan ni m xác su t là giá tr trung bình c a các t n su t thì có th áp d ng thu t toán so sánh hai trung bình so sánh hai t l . 3. i u tr phương pháp I cho 405 b nh nhân có 328 ngư i kh i. i u tr phương pháp II cho 155 b nh nhân có 122 ngư i kh i. T l kh i c a hai phương pháp có như nhau không? Gi i Tính các xác su t G i xác su t kh i c a phương pháp I là p1 P(A) = 0,5 file://C:\WINDOWS\Temp\ttwyprsdrx\Chapter2.htm 12/10/2012
nguon tai.lieu . vn