Xem mẫu

  1. Chương 4 ƯỚC LƯỢNG CÁC THAM SỐ ĐẶC TRƯNG CỦA ĐẠI LƯỢNG NGẪU NHIÊN Giả sử một ĐLNN X có phân phối xác suất đã biết nhưng các đặc trưng của nó phụ thuộc vào một hoặc nhiều tham số chưa biết. Chẳng hạn ta biết X ~ N ( µ ; σ 2 ) , nhưng θ = ( µ ; σ 2 ) nhận giá trị nào ta chưa biết được. Thông qua mẫu ngẫu nhiên phải xác định giá trị gần đúng để thay thế các tham số đó, từ đó ta mới xác định được phân phối xác suất của X. Từ một tổng thể lấy một mẫu ngẫu nhiên, dựa vào mẫu ngẫu nhiên kích thước n đó, ta lập ra một đại lượng thống kê θɵ để thay thế cho θ , khi đó θɵ được gọi là ước lượng của θ . Có 2 phương pháp ước lượng: ước lượng điểm và ước lượng khoảng Trong chương này ta sẽ làm quen với các ước lượng điểm, ước lượng khoảng cho trung bình tổng thể, tỷ lệ của tổng thể, phương sai của tổng thể. 4.1 ƯỚC LƯỢNG ĐIỂM 4.1.1 Đặt vấn đề Xét ĐLNN X xác định trên tổng thể. Số lượng phần tử của tổng thể thường rất lớn nên hầu như không xác định được tất cả các giá trị của X, do đó không thể xác định luật phân phối xác suất của X, từ đó không thể tính được chính xác các đặc trưng của X như trung bình, phương sai, tỉ lệ… Giả sử θ là tham số đặc trưng (trung bình, phương sai, tỷ lệ…) của ĐLNN X chưa biết. Ta cần xác định xem θ nhận giá trị nào hay nói cách khác ta cần ước lượng tham số θ . Các phương pháp ước lượng được sử dụng: - Ước lượng điểm: dựa vào mẫu ngẫu nhiên (X 1 , X 2 , … ,X n ) ta xây dựng một thống kê θ * = θ * ( X 1 , X 2 ,..., X n ) để khi mẫu nhận một giá trị cụ thể ( x 1 , x 2 , … , x n ) thì xác định được một giá trị θ0 = θ * (x1 , x2 , … ,xn ) ước lượng cho θ . - Ước lượng khoảng: dựa vào một thống kê nào đó, ta tìm được một khoảng giá trị (θ1 ,θ 2 ) của θ với xác suất định trước để ước lượng cho tham số θ . 4.1.2 Các tiêu chuẩn ước lượng Từ mẫu ngẫu nhiên W X (X 1 , X 2 , … ,X n ) , ta xây dựng một thống kê θ * = θ * ( X 1 , X 2 ,..., X n ) để ước lượng cho θ . Tùy theo những tiêu chuẩn khác nhau, ta có các dạng ước lượng khác nhau cho tham số θ . 91
  2. 4.1.2.1 Ước lượng không chệch (ước lượng đúng) Thống kê θ * = θ * ( X 1 , X 2 ,..., X n ) được gọi là ước lượng không chệch của tham số θ nếu E( θ * ) = θ . Nếu E( θ * ) ≠ θ thì θ * được gọi là ước lượng chệch.  Nhận xét: Như nêu ở Chương 3, ta có: 1 n  Trung bình của mẫu ngẫu nhiên X = ∑ X i là một ước lượng không n i =1 chệch của trung bình tổng thể µ vì E ( X ) = E ( X ) = µ . 1 n ( ) 2  Phương sai mẫu điều chỉnh S 2 = ∑ Xi − X n − 1 i =1 là ước lượng không chệch của phương sai tổng thể Var(X) vì E( S 2 ) = Var( X ) . 1 n ( ) 2  Phương sai của mẫu S' 2 = ∑ X−X n i =1 là một ước lượng chệch của n −1 Var(X) vì E( S ' 2 ) = Var( X ) ≠ Var( X ) . n Ví dụ 1: Cân thử 100 trái cây của nông trường ta có kết quả như sau Trọng lượng (g) Số trái 35 – 55 3 55 – 75 10 75 – 95 25 95 - 115 35 115 – 135 20 135 – 155 6 155 – 175 1 a) Tìm ước lượng không chệch cho trọng lượng trung bình của một trái cây trong nông trường. b) Tìm ước lượng không chệch cho đại lượng biểu thị độ đồng đều của các trái cây trong nông trường. c) Nếu xem các loại trái có trọng lượng không quá 95 g là trái cây loại II. Tìm ước lượng không chệch của trái cây loại II trong nông trường. 92
  3. Giải Ta có bảng tính xi ni xi ni xi2 ni 45 3 135 6075 65 10 650 42250 85 25 2125 180625 105 35 3675 385875 125 20 2500 312500 145 6 870 126150 165 1 165 27225 ∑ n = 100 10120 1080900 a) Ước lượng không chệch cho trọng lượng trung bình của một trái cây trong nông trường là 1 k 1 x = ∑ xi ni = .10120 = 101,2 . n i =1 100 b) Ước lượng không chệch cho đại lượng biểu thị độ đồng đều của các trái cây trong nông trường là n s = s2 = s' 2 . n −1 1 k 2 2 1 mà s' 2 = ∑ x i ni − x n i =1 = 100 .1080900 − ( 101.2 )2 = 567,56 . 100 Suy ra: s = ( 567,56 ) = 573,29 = 23,94 . 100 − 1 c) Ước lượng không chệch của trái cây loại II trong nông trường là 3 + 10 + 25 f = = 0,38 = 38%  100 4.1.2.2 Ước lượng hiệu quả Giả sử θ * là ước lượng không chệch của tham số θ . Theo bất đẳng thức Tchebychev ta có Var (θ * ) ( ) P θ * − E (θ * ) < ε > 1 − ε2 . 93
  4. Var( θ * ) ( Vì E( θ * ) = θ nên P θ * − θ < ε > 1 − ) ε2 . Ta thấy Var( θ * ) càng nhỏ thì P θ * − θ < ε ( ) càng gần về 1. Do đó ta sẽ chọn θ * với Var( θ * ) nhỏ nhất. Ước lượng không chệch θ * được gọi là ước lượng có hiệu quả của tham số θ nếu Var( θ * ) nhỏ nhất trong các ước lượng của θ .  Chú ý Để tìm được Var (θ * ) nhỏ nhất ta dựa vào bất đẳng thức Grammer - Rao 1 Var (θ * ) ≥ 2  ∂ ln f ( x, θ )  n.E    ∂θ  Trong đó θ * là ước lượng không chệch bất kì của θ và f ( x,θ ) là hàm mật độ xác suất của đại lượng ngẫu nhiên X. Nếu θ * là ước lượng hiệu quả của θ thì dấu “ =” trong bất đẳng thức Grammer – Rao xảy ra  Nhận xét  σ2  Nếu X có luật phân phối xác suất X ~ N  µ ;  thì trung bình mẫu X là  n   ước lượng hiệu quả của kỳ vọng E( X ) = µ . Thật vậy n  2  Ta có X = 1 ∑ X i ~ N  µ ; σ  . n i =1   n   Mặt khác, do X có luật phân phối chuẩn nên nếu f ( x; µ ) là hàm mật độ của 1 2 2 Xi thì f ( x; µ ) = e −( x − µ ) / 2σ . σ 2π Ta tính ∂ ln f ( x, µ ) ∂  ( x − µ ) 1  x−µ 2 = − + ln = ∂µ ∂µ  2σ 2 σ 2π  σ2   2 2  ∂ ln f ( X , µ )   X −µ  n n ⇒ nE   = nE   = 4 Var ( X ) = 2  ∂µ   σ  σ 2 σ 94
  5. 1 1 σ2 Suy ra Var ( X ) = = = .  ∂ ln f ( x, µ )  2  x − µ 2 n n.E  n.E  2  ∂µ   σ    Vậy X là ước lượng hiệu quả của µ . 4.1.2.3 Ước lượng vững Thống kê θ * = θ * ( X 1 , X 2 ,..., X n ) được gọi là ước lượng vững của tham số θ nếu ∀ε > 0 ta có ( lim P θ * − θ < ε = 1 . n →∞ ) Như vậy nếu θ * là ước lượng không chệch của θ và lim Var( θ ) = 0 thì θ * n →∞ là ước lượng vững của θ .  Nhận xét  X là ước lượng vững của E(X) vì E( X ) = E( X ) và Var( X ) lim Var( X ) = lim =0. n →∞ n →∞ n  S 2 là ước lượng vững của phương sai Var(X) vì E( S 2 ) = Var( X ) và 2( n − 1 ) lim Var( S 2 ) = lim 2 [Var( X )]2 = 0 . n →∞ n →∞ n 4.2 Phương pháp khoảng tin cậy. 4.2.1 Đặt vấn đề Ước lượng điểm có một nhược điểm cơ bản là không biết được độ chính xác cũng như xác suất để ước lượng đó chính xác. Đặc biệt là khi kích thước mẫu nhỏ, sự sai lệch của ước lượng so với giá trị thật khá lớn và chỉ với một số thì khó đánh giá được khả năng mắc sai lầm khi ước lượng là bao nhiêu. Để khắc phục được hạn chế đó, người ta thực hiện ước lượng bằng một khoảng giá trị. Rõ ràng ước lượng khoảng có độ tin cậy cao hơn nhiều và cho phép xác định khách quan sai số ước lượng. Tất nhiên một khoảng ước lượng vẫn có thể sai giống như mọi ước lượng khác, nhưng so với ước lượng điểm, xác suất sai lầm có thể biết và trong chừng mực nào đấy có thể hy vọng kiểm soát được. Nói như vậy không có nghĩa là không nên dùng ước lượng điểm nữa, nó vẫn cho ta một thông tin quan trọng và ước lượng khoảng sẽ xây dựng xung quanh ước lượng điểm. 4.2.2 Phương pháp chung Cho số α khá nhỏ thường 0 < α ≤ 0,1 . Ước lượng khoảng cho θ là chỉ ra khoảng (θ1 ;θ 2 ) sao cho θ ∈ (θ1 ;θ 2 ) với xác suất 1 − α khá lớn . Ở đây: 95
  6.  (θ1 ;θ2 ) là khoảng ước lượng của θ ( khoảng tin cậy)  l = θ 2 − θ1 : độ dài khoảng tin cậy.  α gọi là mức ý nghĩa.  1 − α được gọi là độ tin cậy ( hệ số tin cậy của ước lượng)  Cùng độ tin cậy có thể cho nhiều khoảng tin cậy khác nhau, khoảng nào càng hẹp càng tốt  Bài toán tìm ước lượng khoảng với độ tin cậy 1 − α còn được gọi là bài toán tìm khoảng tin cậy 1 − α Phương pháp ước lượng khoảng được thực hiện như sau Bước 1: - Từ tổng thể lập mẫu ngẫu nhiên W X = (X 1 , X 2 , … ,X n ) . - Với mẫu ngẫu nhiên WX xây dựng một thống kê G thích hợp có chứa tham số cần ước lượng θ . Tức là G = f (X 1 , X 2 , … ,X n ,θ ) có luật phân phối xác định (phân phối chuẩn hóa, phân phối Student hay phân phối khi bình phương,…). - Khi biết được dạng phân phối của G, với α cho trước có thể tìm được hai giá trị g1 và g 2 sao cho P( g1 < G < g 2 ) = 1 − α . Các số g1 và g 2 là các phân vị thích hợp của thống kê G. Chẳng hạn có thể chọn g1 = Gα / 2 ; g 2 = G1−α / 2 tương ứng là phân vị của G mức xác suất α / 2 và 1 − α / 2 . - Biến đổi biểu thức trên về dạng P( G1 < θ < G2 ) = 1 − α trong đó G1 ,G2 là các ĐLNN suy ra từ thống kê G. Khoảng ( G1 ;G2 ) được gọi là khoảng tin cậy (hay khoảng ngẫu nhiên) của θ tương ứng xác suất 1 − α . Bước 2: Với một mẫu giá trị cụ thể wx = (x1 , x2 , … ,xn ) của WX, thay thế vào G1 ,G2 ta được các giá trị tương ứng θ1 ,θ 2 . Khi đó (θ1 ;θ2 ) là khoảng ước lượng cần tìm với mức xác suất 1 − α .  Chú ý G1 ,G2 là các ĐLNN và P( G1 < θ < G2 ) = 1 − α , do đó chỉ có thể khẳng định θ ∈ (θ1 ;θ 2 ) với mức xác suất 1 − α mà không thể viết P( θ1 < θ < θ 2 ) = 1 − α vì θ là hằng số, không phải là ĐLNN.  Ta có các dạng bài toán ước lượng cơ bản sau: 96
  7. − Ước lượng khoảng cho tham số kỳ vọng. − Ước khoảng cho tham số tỉ lệ. − Ước lượng khoảng cho tham số phương sai. 4.2.3 Ước lượng trung bình 4.2.3.1 Đặt vấn đề ĐLNN X có trung bình E ( X ) = µ chưa biết. Với mức α khá nhỏ ta dựng khoảng tin cậy ( µ1 ; µ 2 ) để ước lượng cho trung bình µ sao cho P( µ1 < µ < µ 2 ) = 1 − α . 4.2.3.2 Phương pháp Bài toán ước lượng trung bình µ được phân chia theo các trường hợp sau đây vì phụ thuộc vào các thông tin về phương sai, kích thước mẫu, luật phân phối của X. a). Trường hợp 1 Phương sai Var( X ) = σ 2 đã biết, kích thước mẫu n ≥ 30 hoặc n < 30 và X có luật phân phối chuẩn.  Từ mẫu ngẫu nhiên W X = (X 1 , X 2 , … ,X n ) chọn thống kê (X − µ) U= n ~ N (0;1) , trong đó X là trung bình mẫu ngẫu nhiên và X ~ N ( µ ; σ 2 ) σ Theo phân bố xác suất của trung bình mẫu đã xét ở chương 3, ta có U ~ N( 0;1 ) . Chọn cặp giá trị u1 = uα / 2 ; u2 = u1−α / 2 trong đó uα / 2 ; u1−α / 2 lần lượt là phân vị chuẩn mức xác suất α / 2 và 1 − α / 2 (xem phụ lục bảng 2 hoặc 2’). Tức là: P(U < uα / 2 ) = α / 2 . (4.1) P(U < u1−α / 2 ) = 1 − α / 2 . (4.2) Lấy (4.2) – (4.1) theo vế ta được P(U < u1−α / 2 ) − P(U < uα / 2 ) = 1 − α / 2 − α / 2 . ⇔ P( uα / 2 < U < u1−α / 2 ) = 1 − α . ( X − µ) ⇔ P (uα /2 < n < u1−α /2 ) = 1 − α . σ σ σ ⇔ P ( X − u1−α /2 . < µ < X − uα /2 . ) = 1−α . (4.3) n n Vì phân vị chuẩn có tính chất uα / 2 = −u1−α / 2 nên 97
  8. σ σ (4.3) ⇔ P ( X − u1−α /2 . < µ < X + u1−α /2 . ) = 1−α . n n Như vậy, khoảng ngẫu nhiên của m với độ tin cậy 1 − α là ( G1 ;G2 ) trong đó σ σ G1 = X − u1−α / 2 . và G2 = X + u1−α / 2 . . n n σ Đặt ε = u1−α / 2 . thì ε được gọi là độ chính xác hay bán kính của ước n lượng. Khi đó: G1 = X − ε và G2 = X + ε . (4.4)  Với mẫu cụ thể wx = (x1 , x2 , … ,xn ) , trung bình x , từ (4.4) ta có khoảng tin cậy ( µ1 ; µ 2 ) , trong đó µ1 = x − ε và µ2 = x + ε . Tóm lại: Trong thực hành, khi có mẫu cụ thể wx = (x1 , x2 , … ,xn ) và mức ý nghĩa α được ấn định trước thì khoảng tin cậy ( µ1 ; µ 2 ) cho tham số trung bình µ được tìm tuần tự qua các bước sau: - Với mẫu cụ thể wx . Tính trung bình mẫu x . - Với mức ý nghĩa α , tính 1 − α / 2 , rồi tra tìm phân vị chuẩn u1−α / 2 ở phụ lục phân vị chuẩn bảng 2 hoặc 2’. σ - Tính độ chính xác ε = u1−α / 2 . . (4.5) n - Xác định khoảng tin cậy ( µ1 ; µ 2 ) = ( x − ε ; x + ε ) . (4.6) + Đặt biệt: Nếu chỉ ước lượng giá trị tối đa hay giá trị tối thiểu cho trung của tổng thể ta có hai giá trị ước lượng sau: σ µ min = x − u1−α n σ µ max = x + u1−α n Ví dụ 2: Khối lượng sản phẩm là ĐLNN X có luật phân phối chuẩn, biết rằng phương sai Var( X ) = σ 2 = 4g . Kiểm tra 25 sản phẩm và tính được trung bình mẫu x = 20g . a) Ước lượng trung bình của khối lượng sản phẩm với độ tin cậy 95%. b) Nếu cho bán kính của ước lượng ε = 0,4 g thì độ tin cậy của ước lượng là bao nhiêu? 98
  9. c) Với bán kính ước lượng ε = 0,4 g , muốn có độ tin cậy 1 − α = 95% thì phải kiểm tra ít nhất bao nhiêu sản phẩm? Giải Đặt E ( X ) = µ chưa biết. a) Kích thước của mẫu đã cho là n = 25 và trung bình mẫu x = 20g , đại lượng X có độ lệch tiêu chuẩn σ = 2g . (X − µ) * Chọn thống kê U = n ~ N( 0;1 ) . σ * Độ tin cậy của ước lượng là 1 − α = 0,95 . Do đó: 1 − α / 2 = 0,975 . * Tra bảng phân vị chuẩn ta được u1−α / 2 = u0,975 = 1,96 . σ 2 * Độ chính xác ε = u1−α / 2 . = 1,96. = 0,78 g. n 25 Suy ra µ1 = x − ε = 20 − 0, 78 = 19, 22 . µ2 = x + ε = 20 + 0, 78 = 20, 78 . Vậy khoảng ước lượng trung bình khối lượng sản phẩm với độ tin cậy 95% là (19,22g;20,78g) . σ b) Ta có ε = u1−α / 2 . n n 25 suy ra u1−α / 2 = ε . = 0,4. = 1 ≈ 0,994 = u0,84 ⇒ 1 − α / 2 = 0,84 σ 2 ⇒ 1 − α = 0,68 . Vậy độ tin cậy tìm thấy là 68%. σ c) Ta có ε = u1−α / 2 . n 2 σ2 2 22 2 22 Suy ra n = u 1−α / 2 . 2 = u0,975 . = ( 1,96 ) . = 96 ,04. ε ( 0,4 )2 ( 0,4 )2 Vì n là số nguyên nên ta lấy n = 96 .  b) Trường hợp 2: Phương sai Var(X) chưa biết, kích thước mẫu n ≥ 30 . Về phương pháp cũng tuơng tự như trường hợp 1, chỉ khác là trong trường hợp này phải ước lượng σ 2 bằng phương sai mẫu điều chỉnh (được xác định từ mẫu (X − µ) ngẫu nhiên WX) và ước lượng được dựa vào thống kê: U = n ~ N (0;1) . S 99
  10. Trong thực hành, khoảng tin cậy được lập dưới dạng ( µ1 ; µ2 ) = ( x − ε ; x + ε ) . Với độ chính xác: s ε = u1−α / 2 . . (4.7) n (s là độ lệch chuẩn điều chỉnh của mẫu cụ thể). + Đặt biệt: Nếu chỉ ước lượng giá trị tối đa hay giá trị tối thiểu cho trung của tổng thể ta có hai giá trị ước lượng sau: s µ min = x − u1−α n s µ max = x + u1−α n Ví dụ 3: Khảo sát chiều cao của cây cùng độ tuổi thu được kết quả sau Chiều cao (cm) Số cây < 180 3 180 – 190 12 190 – 200 35 200 – 210 70 210 – 220 62 220 – 230 32 > 230 6 Hãy dùng số liệu trên để ước lượng trung bình µ của chiều cao cây với độ tin cậy 99%. Giải Gọi X là chiều cao của cây, cần ước lượng cho trung bình µ = E(X) trong trường hợp chưa biết Var(X) , kích thước mẫu n = 220 > 30 . Với mẫu cho trong bảng trên, các lớp chiều cao được thay thế bởi điểm giữa, riêng lớp < 180 được thay thể bởi 175 cm, còn lớp > 230 được thay thế bởi 235 cm. 100
  11. xi ni xi ni xi2 ni 175 3 525 91875 185 12 2220 410700 195 35 6825 1330875 205 70 14350 2941750 215 62 13330 2865950 225 32 7200 1620000 235 6 1410 331350 ∑ n = 220 45860 9592500 * Ta tính được 1 k 1  x = ∑ xi ni = .45860 = 208,455 . n i =1 220 n  s = s2 = s' 2 n −1 1 k 2 2 1 mà s' = ∑ x i ni − x 2 = .9592500 − ( 208,455 )2 ≈ 148,786 . n i =1 220 220 Suy ra: s = ( 148,786 ) ≈ 149,465 ≈ 12,226 . 220 − 1 ( X −µ) * Chọn thống kê U = n ~ N( 0;1 ) . S * Với độ tin cậy 1 − α = 0,99 . Ta có: 1 − α / 2 = 0,995 . * Tra bảng phân vị chuẩn ta được u1−α / 2 = u0,995 = 2,576 . s 12,226 * Độ chính xác ε = u1−α / 2 . = 2,576. = 2,123 cm. n 220 Suy ra µ1 = x − ε = 208,455 − 2,123 = 206 ,332 . µ2 = x + ε = 208,455 + 2,123 = 210,578 . Vậy khoảng ước lượng trung bình chiều cao của cây với độ tin cậy 99% là (206,332 cm;210,578cm) .  3. Trường hợp 3 101
  12. Phương sai Var(X) chưa biết; kích thước mẫu n < 30 và X có luật phân phối chuẩn. (X −µ) Chọn thống kê U = n. S Mặc dù dựa trên thông kê U cũng giống như trong trường hợp 2 nhưng khi chưa biết Var(X) , n < 30 và X có luật phân phối chuẩn thì thống kê U khi này sẽ được xấp xỉ với phân phối Sutdent với n – 1 bậc tự do T(n-1). Do đó, khi tính độ chính xác giá trị phân vị chuẩn sẽ được thay bằng phân vị student tα / 2; n −1 với mức xác suất α / 2 và bậc tự do n – 1: s . ε = tα / 2;n −1. (4.8) n + Đặt biệt: Nếu chỉ ước lượng giá trị tối đa hay giá trị tối thiểu cho trung của tổng thể ta có hai giá trị ước lượng sau: s µ min = x − tα ;n −2 n s µ max = x + tα ;n − 2 n Ví dụ 4 Lượng chi phí một loại nguyên liệu cho một đơn vị sản phẩm là ĐLNN X có luật phân phối chuẩn. Khảo sát 25 sản phẩm tính được trung bình mẫu x = 50 g và độ lệch chuẩn mẫu điều chỉnh s = 8,25 g. Hãy ước lượng trung bình của chi phí nguyên liệu với độ tin cậy 95%. Giải Ta cần ước lượng cho trung bình E(X)= µ trong trường hợp X có luật phân phối chuẩn, chưa biết Var(X) và kích thước của mẫu đã cho là n = 25
  13. s 8,25 * Độ chính xác ε = t1−α / 2;n −1 . = 2,064. = 3,406 g. n 25 Suy ra µ1 = x − ε = 50 − 3,406 = 46 ,594 g. µ2 = x + ε = 50 + 3,406 = 53,406 g. Vậy khoảng ước lượng trung bình khối lượng sản phẩm với độ tin cậy 95% là (46,594g;53,406g) .   Các chỉ tiêu của bài toán khoảng tin cậy đối xứng : Ngoài bài toán tìm khoảng tin cậy cho một trung bình tổng thể thì từ vấn đề này người ta suy ra các bài toán phụ. − Tìm kích cở mẫu khi biết được độ chính xác của ước lượng và độ tin cậy của ước lượng. − Tìm độ tin cậy khi đã biết độ chính xác của mẫu ước lượng ? 1/ Giám đốc chi nhánh của một ngân hàng muốn ước lượng số tiền gửi trung bình của mỗi khách hàng tại ngân hàng. Chọn ngẫu nhiên 30 khách hàng tính được số tiền gửi trung bình là 4750 USD và độ lệch chuẩn điều mẫu chỉnh là 1200 USD. a) Với độ tin cậy 95% hãy ước lượng số tiền gửi trung bình của mỗi khách hàng tại ngân hàng. b) Nếu sử dụng mẫu trên và muốn có độ chính xác của ước lượng trung bình là 400 USD thì đảm bảo độ tin cậy là bao nhiêu? c) Muốn ước lượng trung bình có độ tin cậy 99% và độ chính xác là 300 USD thì cần điều tra thêm bao nhiêu khách hàng? 2/ Tỷ lệ nợ xấu tại một ngân hàng là tỷ số của tổng nợ quá hạn và tổng số nợ cho vay đang được thực hiện. Điều tra ngẫu nhiên 7 ngân hàng ở vùng A có tỉ lệ nợ xấu (tính bằng %) là 7, 4, 6, 7, 5, 4, 9. a) Giả sử tỷ lệ nợ xấu có phân phối chuẩn. Với độ tin cậy 95% hãy ước lượng tỷ lệ nợ xấu trung bình của các ngân hàng vùng A. b) Nhân viên thanh tra phàn nàn rằng tỉ lệ nợ xấu của các ngân hàng vùng A cao hơn tỉ lệ nợ xấu của các ngân hàng vùng B vì ở đó tỉ lệ này chỉ có 3,5%. Hãy dùng kết quả câu a, xét xem lời phàn nàn trên đúng không? c) Với các câu hỏi tương tự cho độ tin cậy 99%. 103
  14. 4.2.4 Ước lượng tỷ lệ 4.2.4.1 Đặt vấn đề Tổng thể chia làm hai loại phần tử, những phần tử có tính chất A và không có tính chất A. Giả sử tỷ lệ p các phần tử có tính chất A chưa biết. Cho số α khá nhỏ, ước lượng tỷ lệ p là chỉ ra khoảng ( p1 ; p2 ) sao cho p ∈ ( p1 ; p2 ) với mức xác suất 1 − α (độ tin cậy của ước lượng). Gọi X là số phần tử có tính chất A khi lấy ngẫu nhiên 1 phần tử từ tổng thể. X nhận giá trị 1 khi X có tính chất A và ngược lại X nhận giá trị 0 . Khi đó X là ĐLNN có phân phối xác suất: X 0 1 P 1- p p Gọi X i (i = 1, n) là số phần tử có tính chất A trong lần lấy thứ i. 1 n Ta có: X = ∑ X i chính là tần suất ước lượng điểm của p = E(X). Mặc n i =1 khác ta có n X có phân phối nhị thức B ( n; p ) . Do đó E ( X ) = p và p (1 − p ) Var ( X ) = n 4.2.4.2 Phương pháp ( f − p) n  Chọn thống kê U = ~ N( 0;1 ) để ước lượng, trong đó p là tỷ lệ pq chưa biết, q = 1-p , n là kích thước mẫu khá lớn, f là thống kê nhận giá trị bằng tần xuất của tính chất A trong mẫu. Rõ ràng P( uα / 2 < U < u1−α / 2 ) = 1 − α Với n khá lớn, ta có f xấp xỉ tỷ lệ p nên U = ( f − p ) n f (1− f )  ( f − p) n  Suy ra P  uα / 2 < < u1−α / 2  = 1 − α  f (1− f )     f (1− f ) f (1− f )  ⇔ P  f − u1−α / 2 . < p < f − uα / 2 .  = 1−α  n n    Vì phân vị chuẩn có tính chất uα / 2 = −u1−α / 2 nên 104
  15.  f (1− f ) f (1− f )  P  f − u1−α / 2 . < p < f + u1−α / 2 .  = 1 −α .  n n    Như vậy, khoảng ngẫu nhiên của p với độ tin cậy 1 − α là ( G1 ;G2 ) trong đó f (1− f ) f (1− f ) G1 = f − u1−α / 2 . và G2 = f + u1−α / 2 . . n n f (1− f ) Đặt ε = u1−α / 2 . n Ta được: G1 = f − ε và G2 = f + ε . (4)  Với mẫu cụ thể wx = ( x1 ,x2 ,...,xn ) , tần suất f từ (4) ta có khoảng tin cậy f (1− f ) ( p1 ; p2 ) , trong đó p1 = f − ε và p2 = f + ε với ε = u1−α / 2 . n Tóm lại: Trong thực hành, khi có mẫu cụ thể wx = ( x1 ,x2 ,...,xn ) và mức ý nghĩa α được ấn định trước thì khoảng tin cậy ( p1 ; p2 ) để ước lượng tỷ lệ p được tìm tuần tự qua các bước sau: - Với mẫu cụ thể kích thước n, xác định m phần tử mang tính chất A. Tính m tần suất có tính chất A trong mẫu: f = . n - Với mức ý nghĩa α , tính 1 − α / 2 , rồi tra tìm phân vị chuẩn u1−α / 2 ở phụ lục bảng 2 hoặc 2’. f (1− f ) - Tính độ chính xác: ε = u1−α / 2 . . (4.9) n - Xác định khoảng tin cậy: ( p1 ; p2 ) = ( f − ε ; f + ε ) . (4.10) + Đặt biệt: Nếu chỉ ước lượng giá trị tối đa hay giá trị tối thiểu cho tỉ lệ của tổng thể ta có hai giá trị ước lượng sau: f (1 − f ) pmin = f − u1−α n f (1 − f ) pmax = f + u1−α n Ví dụ 5 Kiểm tra 100 sản phẩm , có 8 phế phẩm. Ước lượng tỷ lệ phế phẩm của lô hàng với độ tin cậy 95%. 105
  16. Giải Gọi p là tỷ lệ phế phẩm trong lô hàng. Ta cần tìm khoảng tin cậy cho p. ( f − p) n * Chọn thống kê U = ~ N( 0;1 ) để ước lượng. pq 8 * Với mẫu kích thước n = 100 , tỷ lệ phế phẩm là f = = 0,08 , độ tin cậy 100 của ước lượng là 1 − α = 0,95 . Do đó: 1 − α / 2 = 0,975 . * Tra bảng phân vị chuẩn ta được u1−α / 2 = u0,995 = 2,576 . f (1− f ) 0,08( 1 − 0,08 ) * Độ chính xác ε = u1−α / 2 . = 1.96. = 0,053 . n 100 Suy ra p1 = f − ε = 0,08 − 0,053 = 0,027. p2 = f + ε = 0,08 + 0,053 = 0,133 . Vậy khoảng ước lượng tỷ lệ phế phẩm của lô hàng với độ tin cậy 95% là (2,7%;13,3%) .  Chú ý: Từ bài toán ước lượng khoảng cho tham số tỉ lệ ta có hai bài toán là tìm cở mẫu, ước lượng số lượng phần tử tổng thể, ước lượng số phần tử có tính chất cần khảo sát của tổng thể , tìm độ tin cậy của ước lượng ? a) Trong đợt bầu cử tổng thống người ta phỏng vấn ngẫu nhiên 1600 cử tri thì được biết có 960 người sẽ bầu cho ứng cử viên A. Với độ tin cậy 99%, hãy xem ứng cử viên A có trúng cử hay không ? ( Biết rằng trên 50% người bầu sẽ trúng cử). b) Giám đốc một ngân hàng muốn xác định số khách hàng gởi tiền tại ngân hàng được chi trả theo tuần. Một mẫu ngẫu nhiên 100 khách hàng có 30 người được chi trả theo tuần. i) Với độ tin cậy 90% hãy ước lượng số khách hàng được chi trả theo tuần, biết ngân hàng có 2000 khách hàng. ii) Nếu muốn ước lượng tỉ lệ khách hàng được chi trả theo tuần với độ tin cậy trên và độ chính xác của ước lượng là 0,05 thì cần kích thước mẫu điều tra bao nhiêu ? c) Trong 5000 sản phẩm của một lô hàng, người ta chọn ngẫu nhiên ra 256 sản phẩm để kiểm tra thấy có 192 sản phẩm loại 1. i) Hãy ước lượng tỉ lệ sản phẩm loại 1 có trong lô hàng. ii) Hãy ước lượng tỉ lệ sản phẩm loại 1, từ đó suy ra số sản phẩm loại 1 có trong lô hàng với độ tin cậy 95%. 106
  17. iii) Nếu muốn ước lượng tỉ lệ sản phẩm loại 1 của lô hàng đạt được độ chính xác là 0, 04 sản phẩm và đô tin cậy 97% thì phải kiểm tra bao nhiêu sản phẩm nữa?. 4.2.5 Ước lượng phương sai 4.2.5.1 Đặt vấn đề Giả sử ĐLNN X có luật phân phối chuẩn X ∈ N( µ ;σ 2 ) trong đó phương sai Var( X ) = σ 2 chưa biết. Cho số α khá nhỏ, ước lượng phương sai σ 2 với mức ý ( ) ( ) nghĩa α là chỉ ra khoảng σ 12 ;σ 22 sao cho σ 2 ∈ σ 12 ;σ 22 với xác suất 1 − α (độ tin cậy của ước lượng). 4.2.5.2 Phương pháp a) Trường hợp: đã biết E( X ) = µ n ( X i − µ )2 Ta chọn thống kê χ = ∑ 2 i =1 σ2 Ta thấy χ 2 có phân phối chi bình phương với n bậc tự do Gọi χα2 / 2;n −1 và χ12−α / 2;n −1 lần lượt là phân vị khi bình phương, bậc tự do n-1 với mức xác suất lần lượt là α / 2 và 1 − α / 2 (Phụ lục bảng 5 ) P( χ12−α / 2;n < χ 2 < χα2 / 2;n ) = 1 − α  n ( X − µ )2  ⇔ P  χ12−α / 2;n < ∑ < χ 2 α / 2;n  = 1 − α  σ2  i =1   n n  ∑ i ∑ ( X i − µ )2  2 ( X − µ ) ⇔ P  i =1 2 < σ 2 < i =1 2  = 1 −α  χ χ1−α / 2;n  α / 2;n     Như vậy, khoảng ước lượng của σ 2 với độ tin cậy 1 − α là ( G1 ;G2 ) trong đó n n ∑( Xi − µ ) 2 ∑ ( X i − µ )2 G1 = i =1 2 và G2 = i =1 . χα / 2;n χ12−α / 2;n 107
  18. n  Với mẫu cụ thể wx = ( x1 ,x2 ,...,xn ) , tính các tổng ∑ ( X i − µ )2 , khi đó sẽ i =1 n ∑ ( X i − µ )2 tìm được khoảng tin cậy (σ 12 ;σ 22 ) , trong đó σ 12 = i =1 χα2 / 2;n và n ∑ ( X i − µ )2 σ 22 = i =1 2 . χ1−α / 2;n b)Trường hợp trung bình E( X ) = µ chưa biết 2 ( n − 1 )S 2  Chọn thống kê χ = 2 để ước lượng phương sai σ 2 , có luật phân σ 2 phối χ với bậc tự do n -1, trong đó n là kích thước mẫu, S2 là thống kê nhận giá trị bằng phương sai mẫu điều chỉnh kích thước n. Gọi χα2 / 2;n −1 và χ12−α / 2;n −1 lần lượt là phân vị khi bình phương, bậc tự do n -1 với mức xác suất lần lượt là α / 2 và 1 − α / 2 (Phụ lục bảng 5 ). Ta có P( χ12−α / 2;n −1 < χ 2 < χα2 / 2;n −1 ) = 1 − α  ( n − 1 )S 2  ⇔ P  χ12−α / 2;n −1 < < χα2 / 2;n −1  = 1 − α  σ 2     ( n − 1 )S 2 ( n − 1 )S 2  ⇔ P 2
  19. Khối lượng xi (g) Số sản phẩm ni 29,3 4 29,7 5 30 8 30,5 5 30,7 3 Với độ tin cậy 95% hãy tìm khoảng tin cậy cho phương sai Var( X ) = σ 2 . Giải * Ta có 1 k  x = ∑ xi ni = 30,012 n i =1 n  s = s2 = s' 2 n −1 1 k 2 2 mà s' 2 = ∑ x i ni − x n i =1 ≈ 0,205 . 25 Suy ra: s = ( 0,205 ) ≈ 0,214 . 25 − 1 2 ( n − 1 )S 2 * Chọn thống kê χ = 2 để ước lượng phương sai σ 2 . σ * Độ tin cậy của ước lượng là 1 − α = 0,95 . Do đó: 1 − α / 2 = 0,975 và α / 2 = 0,025 . ( n − 1 )s 2 24.( 0,214 )2 24.( 0,214 )2 Suy ra : σ 12 = = = = 0,028 . χα2 / 2;n −1 2 χ0,025;24 39,364 ( n − 1 )s 2 24.( 0,214 )2 24.( 0,214 )2 σ 22 = = = = 0,089 . χ12−α / 2;n −1 2 χ0,975;24 12,401 Vậy khoảng ước lượng phương sai với độ tin cậy 95% là (0,028;0,089) .  Tài liệu tham khảo chương 4 : tài liệu 1, 2,3,5,6,7,8 109
  20. BÀI TẬP ÔN TẬP CHƯƠNG 4 1/ Doanh số của một cửa hàng là biến ngẫu nhiên có phân phối chuẩn với độ lệch chuẩn là σ = 2 ( triệu/tháng). Điều tra ngẫu nhiên doanh số của 600 cửa hàng có quy mô tương tự nhau tìm được doanh số trung bình là 8,5 triệu/tháng. Với độ tin cậy 95% hãy ước lượng doanh số trung bình của các cửa hàng thuộc quy mô đó. 2/ Để ước lượng tổng doanh thu của một công ty gồm 380 cửa hàng trên toàn quốc trong một tháng. Người ta lấy ngẫu nhiên 10% số cửa hàng và có được doanh thu trong một tháng là: Doanh thu (triêu đồng/tháng) 20 40 60 80 Số cửa hàng 8 16 12 2 Với độ tin cậy 99% hãy ước lượng doanh thu trung bình của mỗi cửa hàng và tổng doanh thu của công ty (trong 1 tháng). 3/ Tiến hành quan sát về số lít xăng bán được trong một số ngày của một trạm xăng người ta thu được kết quả sau x i (lít) 200 220 240 260 280 300 320 n i (số ngày) 5 8 12 25 30 16 4 i) Ước lượng số lít xăng bán được trung bình trong ngày với độ tin cậy 99%. ii) Xem những ngày bán không đến 250 lít xăng là những ngày “ế hàng”. Ước lượng tỷ lệ những ngày “ế hàng” với độ tin cậy 95%. iii) Với thông tin mẫu có được, hỏi muốn ước lượng tỷ lệ những ngày “ế hàng” với độ tin cậy 99% và độ chính xác tối đa là 0,05 thì phải lấy mẫu thống kê với kích thước tối thiểu là bao nhiêu ngày? 4/ Kiểm tra ngẫu nhiên một số sản phẩm vừa sản xuất, cân thử và thu được các trọng lượng ( g) sau 201 203 209 204 202 206 200 207 207 Hãy tìm khoảng tin cậy 95% cho trọng lượng trung bình của sản phẩm vừa sản xuất. Giả sử khối lượng sản phẩm là 1 đặc tính chuẩn 5/ Quan sát thu nhập của một số người làm việc ở một công ty, ta có kết quả cho ở bảng dưới đây: Thu nhập ( ngàn đ/tháng) Số người Thu nhập (ngàn đ/tháng) Số người 500 − 550 5 750 − 800 47 550 − 600 9 800 − 850 24 600 − 650 12 850 − 900 18 650 − 700 35 900 − 950 6 110
nguon tai.lieu . vn