- Trang Chủ
- Toán học
- Bài giảng Xác suất thống kê: Phần 2 - Trường CĐ Cộng đồng Đồng Tháp
Xem mẫu
- Chương 4 ƯỚC LƯỢNG CÁC THAM SỐ ĐẶC TRƯNG CỦA ĐẠI
LƯỢNG NGẪU NHIÊN
Giả sử một ĐLNN X có phân phối xác suất đã biết nhưng các đặc trưng của nó
phụ thuộc vào một hoặc nhiều tham số chưa biết. Chẳng hạn ta biết X ~ N ( µ ; σ 2 ) ,
nhưng θ = ( µ ; σ 2 ) nhận giá trị nào ta chưa biết được. Thông qua mẫu ngẫu nhiên
phải xác định giá trị gần đúng để thay thế các tham số đó, từ đó ta mới xác định
được phân phối xác suất của X.
Từ một tổng thể lấy một mẫu ngẫu nhiên, dựa vào mẫu ngẫu nhiên kích thước n
đó, ta lập ra một đại lượng thống kê θɵ để thay thế cho θ , khi đó θɵ được gọi là ước
lượng của θ . Có 2 phương pháp ước lượng: ước lượng điểm và ước lượng khoảng
Trong chương này ta sẽ làm quen với các ước lượng điểm, ước lượng khoảng
cho trung bình tổng thể, tỷ lệ của tổng thể, phương sai của tổng thể.
4.1 ƯỚC LƯỢNG ĐIỂM
4.1.1 Đặt vấn đề
Xét ĐLNN X xác định trên tổng thể. Số lượng phần tử của tổng thể thường rất
lớn nên hầu như không xác định được tất cả các giá trị của X, do đó không thể xác
định luật phân phối xác suất của X, từ đó không thể tính được chính xác các đặc
trưng của X như trung bình, phương sai, tỉ lệ…
Giả sử θ là tham số đặc trưng (trung bình, phương sai, tỷ lệ…) của ĐLNN X
chưa biết. Ta cần xác định xem θ nhận giá trị nào hay nói cách khác ta cần ước
lượng tham số θ . Các phương pháp ước lượng được sử dụng:
- Ước lượng điểm: dựa vào mẫu ngẫu nhiên (X 1 , X 2 , … ,X n ) ta xây dựng một
thống kê θ * = θ * ( X 1 , X 2 ,..., X n ) để khi mẫu nhận một giá trị cụ thể
( x 1 , x 2 , … , x n ) thì xác định được một giá trị θ0 = θ * (x1 , x2 , … ,xn ) ước
lượng cho θ .
- Ước lượng khoảng: dựa vào một thống kê nào đó, ta tìm được một khoảng
giá trị (θ1 ,θ 2 ) của θ với xác suất định trước để ước lượng cho tham số θ .
4.1.2 Các tiêu chuẩn ước lượng
Từ mẫu ngẫu nhiên W X (X 1 , X 2 , … ,X n ) , ta xây dựng một thống kê
θ * = θ * ( X 1 , X 2 ,..., X n ) để ước lượng cho θ . Tùy theo những tiêu chuẩn khác
nhau, ta có các dạng ước lượng khác nhau cho tham số θ .
91
- 4.1.2.1 Ước lượng không chệch (ước lượng đúng)
Thống kê θ * = θ * ( X 1 , X 2 ,..., X n ) được gọi là ước lượng không chệch của
tham số θ nếu E( θ * ) = θ .
Nếu E( θ * ) ≠ θ thì θ * được gọi là ước lượng chệch.
Nhận xét: Như nêu ở Chương 3, ta có:
1 n
Trung bình của mẫu ngẫu nhiên X = ∑ X i là một ước lượng không
n i =1
chệch của trung bình tổng thể µ vì E ( X ) = E ( X ) = µ .
1 n
( )
2
Phương sai mẫu điều chỉnh S 2 = ∑ Xi − X
n − 1 i =1
là ước lượng không
chệch của phương sai tổng thể Var(X) vì E( S 2 ) = Var( X ) .
1 n
( )
2
Phương sai của mẫu S' 2 = ∑ X−X
n i =1
là một ước lượng chệch của
n −1
Var(X) vì E( S ' 2 ) = Var( X ) ≠ Var( X ) .
n
Ví dụ 1:
Cân thử 100 trái cây của nông trường ta có kết quả như sau
Trọng lượng (g) Số trái
35 – 55 3
55 – 75 10
75 – 95 25
95 - 115 35
115 – 135 20
135 – 155 6
155 – 175 1
a) Tìm ước lượng không chệch cho trọng lượng trung bình của một trái cây
trong nông trường.
b) Tìm ước lượng không chệch cho đại lượng biểu thị độ đồng đều của các
trái cây trong nông trường.
c) Nếu xem các loại trái có trọng lượng không quá 95 g là trái cây loại II. Tìm
ước lượng không chệch của trái cây loại II trong nông trường.
92
- Giải
Ta có bảng tính
xi ni xi ni xi2 ni
45 3 135 6075
65 10 650 42250
85 25 2125 180625
105 35 3675 385875
125 20 2500 312500
145 6 870 126150
165 1 165 27225
∑ n = 100 10120 1080900
a) Ước lượng không chệch cho trọng lượng trung bình của một trái cây trong nông
trường là
1 k 1
x = ∑ xi ni = .10120 = 101,2 .
n i =1 100
b) Ước lượng không chệch cho đại lượng biểu thị độ đồng đều của các trái cây trong
nông trường là
n
s = s2 = s' 2 .
n −1
1 k 2 2 1
mà s' 2 = ∑ x i ni − x
n i =1
=
100
.1080900 − ( 101.2 )2 = 567,56 .
100
Suy ra: s = ( 567,56 ) = 573,29 = 23,94 .
100 − 1
c) Ước lượng không chệch của trái cây loại II trong nông trường là
3 + 10 + 25
f = = 0,38 = 38%
100
4.1.2.2 Ước lượng hiệu quả
Giả sử θ * là ước lượng không chệch của tham số θ . Theo bất đẳng thức
Tchebychev ta có
Var (θ * )
( )
P θ * − E (θ * ) < ε > 1 −
ε2
.
93
- Var( θ * )
(
Vì E( θ * ) = θ nên P θ * − θ < ε > 1 − ) ε2
.
Ta thấy Var( θ * ) càng nhỏ thì P θ * − θ < ε ( ) càng gần về 1. Do đó ta sẽ
chọn θ * với Var( θ * ) nhỏ nhất.
Ước lượng không chệch θ * được gọi là ước lượng có hiệu quả của tham số
θ nếu Var( θ * ) nhỏ nhất trong các ước lượng của θ .
Chú ý
Để tìm được Var (θ * ) nhỏ nhất ta dựa vào bất đẳng thức Grammer - Rao
1
Var (θ * ) ≥ 2
∂ ln f ( x, θ )
n.E
∂θ
Trong đó θ * là ước lượng không chệch bất kì của θ và f ( x,θ ) là hàm mật
độ xác suất của đại lượng ngẫu nhiên X.
Nếu θ * là ước lượng hiệu quả của θ thì dấu “ =” trong bất đẳng thức
Grammer – Rao xảy ra
Nhận xét
σ2
Nếu X có luật phân phối xác suất X ~ N µ ; thì trung bình mẫu X là
n
ước lượng hiệu quả của kỳ vọng E( X ) = µ .
Thật vậy
n 2
Ta có X = 1 ∑ X i ~ N µ ; σ .
n i =1 n
Mặt khác, do X có luật phân phối chuẩn nên nếu f ( x; µ ) là hàm mật độ của
1 2 2
Xi thì f ( x; µ ) = e −( x − µ ) / 2σ .
σ 2π
Ta tính
∂ ln f ( x, µ ) ∂ ( x − µ ) 1 x−µ
2
= − + ln =
∂µ ∂µ 2σ 2 σ 2π σ2
2 2
∂ ln f ( X , µ ) X −µ n n
⇒ nE = nE = 4 Var ( X ) = 2
∂µ σ σ
2
σ
94
- 1 1 σ2
Suy ra Var ( X ) = = = .
∂ ln f ( x, µ )
2
x − µ 2 n
n.E n.E 2
∂µ σ
Vậy X là ước lượng hiệu quả của µ .
4.1.2.3 Ước lượng vững
Thống kê θ * = θ * ( X 1 , X 2 ,..., X n ) được gọi là ước lượng vững của tham số
θ nếu ∀ε > 0 ta có
(
lim P θ * − θ < ε = 1 .
n →∞
)
Như vậy nếu θ * là ước lượng không chệch của θ và lim Var( θ ) = 0 thì θ *
n →∞
là ước lượng vững của θ .
Nhận xét
X là ước lượng vững của E(X) vì E( X ) = E( X ) và
Var( X )
lim Var( X ) = lim =0.
n →∞ n →∞ n
S 2 là ước lượng vững của phương sai Var(X) vì E( S 2 ) = Var( X ) và
2( n − 1 )
lim Var( S 2 ) = lim 2 [Var( X )]2 = 0 .
n →∞ n →∞ n
4.2 Phương pháp khoảng tin cậy.
4.2.1 Đặt vấn đề
Ước lượng điểm có một nhược điểm cơ bản là không biết được độ chính xác
cũng như xác suất để ước lượng đó chính xác. Đặc biệt là khi kích thước mẫu nhỏ,
sự sai lệch của ước lượng so với giá trị thật khá lớn và chỉ với một số thì khó đánh
giá được khả năng mắc sai lầm khi ước lượng là bao nhiêu. Để khắc phục được hạn
chế đó, người ta thực hiện ước lượng bằng một khoảng giá trị. Rõ ràng ước lượng
khoảng có độ tin cậy cao hơn nhiều và cho phép xác định khách quan sai số ước
lượng. Tất nhiên một khoảng ước lượng vẫn có thể sai giống như mọi ước lượng
khác, nhưng so với ước lượng điểm, xác suất sai lầm có thể biết và trong chừng
mực nào đấy có thể hy vọng kiểm soát được. Nói như vậy không có nghĩa là không
nên dùng ước lượng điểm nữa, nó vẫn cho ta một thông tin quan trọng và ước lượng
khoảng sẽ xây dựng xung quanh ước lượng điểm.
4.2.2 Phương pháp chung
Cho số α khá nhỏ thường 0 < α ≤ 0,1 . Ước lượng khoảng cho θ là chỉ ra
khoảng (θ1 ;θ 2 ) sao cho θ ∈ (θ1 ;θ 2 ) với xác suất 1 − α khá lớn . Ở đây:
95
- (θ1 ;θ2 ) là khoảng ước lượng của θ ( khoảng tin cậy)
l = θ 2 − θ1 : độ dài khoảng tin cậy.
α gọi là mức ý nghĩa.
1 − α được gọi là độ tin cậy ( hệ số tin cậy của ước lượng)
Cùng độ tin cậy có thể cho nhiều khoảng tin cậy khác nhau, khoảng
nào càng hẹp càng tốt
Bài toán tìm ước lượng khoảng với độ tin cậy 1 − α còn được gọi là
bài toán tìm khoảng tin cậy 1 − α
Phương pháp ước lượng khoảng được thực hiện như sau
Bước 1:
- Từ tổng thể lập mẫu ngẫu nhiên W X = (X 1 , X 2 , … ,X n ) .
- Với mẫu ngẫu nhiên WX xây dựng một thống kê G thích hợp có chứa
tham số cần ước lượng θ . Tức là G = f (X 1 , X 2 , … ,X n ,θ ) có luật phân phối
xác định (phân phối chuẩn hóa, phân phối Student hay phân phối khi bình
phương,…).
- Khi biết được dạng phân phối của G, với α cho trước có thể tìm
được hai giá trị g1 và g 2 sao cho P( g1 < G < g 2 ) = 1 − α .
Các số g1 và g 2 là các phân vị thích hợp của thống kê G. Chẳng hạn
có thể chọn g1 = Gα / 2 ; g 2 = G1−α / 2 tương ứng là phân vị của G mức xác
suất α / 2 và 1 − α / 2 .
- Biến đổi biểu thức trên về dạng P( G1 < θ < G2 ) = 1 − α trong đó
G1 ,G2 là các ĐLNN suy ra từ thống kê G.
Khoảng ( G1 ;G2 ) được gọi là khoảng tin cậy (hay khoảng ngẫu
nhiên) của θ tương ứng xác suất 1 − α .
Bước 2:
Với một mẫu giá trị cụ thể wx = (x1 , x2 , … ,xn ) của WX, thay thế vào
G1 ,G2 ta được các giá trị tương ứng θ1 ,θ 2 . Khi đó (θ1 ;θ2 ) là khoảng ước
lượng cần tìm với mức xác suất 1 − α .
Chú ý
G1 ,G2 là các ĐLNN và P( G1 < θ < G2 ) = 1 − α , do đó chỉ có thể khẳng
định θ ∈ (θ1 ;θ 2 ) với mức xác suất 1 − α mà không thể viết P( θ1 < θ < θ 2 ) = 1 − α
vì θ là hằng số, không phải là ĐLNN.
Ta có các dạng bài toán ước lượng cơ bản sau:
96
- − Ước lượng khoảng cho tham số kỳ vọng.
− Ước khoảng cho tham số tỉ lệ.
− Ước lượng khoảng cho tham số phương sai.
4.2.3 Ước lượng trung bình
4.2.3.1 Đặt vấn đề
ĐLNN X có trung bình E ( X ) = µ chưa biết. Với mức α khá nhỏ ta dựng
khoảng tin cậy ( µ1 ; µ 2 ) để ước lượng cho trung bình µ sao cho
P( µ1 < µ < µ 2 ) = 1 − α .
4.2.3.2 Phương pháp
Bài toán ước lượng trung bình µ được phân chia theo các trường hợp sau đây
vì phụ thuộc vào các thông tin về phương sai, kích thước mẫu, luật phân phối của X.
a). Trường hợp 1
Phương sai Var( X ) = σ 2 đã biết, kích thước mẫu n ≥ 30 hoặc n < 30 và
X có luật phân phối chuẩn.
Từ mẫu ngẫu nhiên W X = (X 1 , X 2 , … ,X n ) chọn thống kê
(X − µ)
U= n ~ N (0;1) , trong đó X là trung bình mẫu ngẫu nhiên và X ~ N ( µ ; σ 2 )
σ
Theo phân bố xác suất của trung bình mẫu đã xét ở chương 3, ta có
U ~ N( 0;1 ) .
Chọn cặp giá trị u1 = uα / 2 ; u2 = u1−α / 2 trong đó uα / 2 ; u1−α / 2 lần lượt là
phân vị chuẩn mức xác suất α / 2 và 1 − α / 2 (xem phụ lục bảng 2 hoặc 2’).
Tức là:
P(U < uα / 2 ) = α / 2 . (4.1)
P(U < u1−α / 2 ) = 1 − α / 2 . (4.2)
Lấy (4.2) – (4.1) theo vế ta được
P(U < u1−α / 2 ) − P(U < uα / 2 ) = 1 − α / 2 − α / 2 .
⇔ P( uα / 2 < U < u1−α / 2 ) = 1 − α .
( X − µ)
⇔ P (uα /2 < n < u1−α /2 ) = 1 − α .
σ
σ σ
⇔ P ( X − u1−α /2 . < µ < X − uα /2 . ) = 1−α . (4.3)
n n
Vì phân vị chuẩn có tính chất uα / 2 = −u1−α / 2 nên
97
- σ σ
(4.3) ⇔ P ( X − u1−α /2 . < µ < X + u1−α /2 . ) = 1−α .
n n
Như vậy, khoảng ngẫu nhiên của m với độ tin cậy 1 − α là ( G1 ;G2 ) trong đó
σ σ
G1 = X − u1−α / 2 . và G2 = X + u1−α / 2 . .
n n
σ
Đặt ε = u1−α / 2 . thì ε được gọi là độ chính xác hay bán kính của ước
n
lượng. Khi đó: G1 = X − ε và G2 = X + ε . (4.4)
Với mẫu cụ thể wx = (x1 , x2 , … ,xn ) , trung bình x , từ (4.4) ta có khoảng
tin cậy ( µ1 ; µ 2 ) , trong đó µ1 = x − ε và µ2 = x + ε .
Tóm lại:
Trong thực hành, khi có mẫu cụ thể wx = (x1 , x2 , … ,xn ) và mức ý nghĩa α
được ấn định trước thì khoảng tin cậy ( µ1 ; µ 2 ) cho tham số trung bình µ được tìm
tuần tự qua các bước sau:
- Với mẫu cụ thể wx . Tính trung bình mẫu x .
- Với mức ý nghĩa α , tính 1 − α / 2 , rồi tra tìm phân vị chuẩn u1−α / 2 ở phụ
lục phân vị chuẩn bảng 2 hoặc 2’.
σ
- Tính độ chính xác ε = u1−α / 2 . . (4.5)
n
- Xác định khoảng tin cậy ( µ1 ; µ 2 ) = ( x − ε ; x + ε ) . (4.6)
+ Đặt biệt: Nếu chỉ ước lượng giá trị tối đa hay giá trị tối thiểu cho trung của tổng
thể ta có hai giá trị ước lượng sau:
σ
µ min = x − u1−α
n
σ
µ max = x + u1−α
n
Ví dụ 2:
Khối lượng sản phẩm là ĐLNN X có luật phân phối chuẩn, biết rằng phương
sai Var( X ) = σ 2 = 4g . Kiểm tra 25 sản phẩm và tính được trung bình mẫu
x = 20g .
a) Ước lượng trung bình của khối lượng sản phẩm với độ tin cậy 95%.
b) Nếu cho bán kính của ước lượng ε = 0,4 g thì độ tin cậy của ước lượng là
bao nhiêu?
98
- c) Với bán kính ước lượng ε = 0,4 g , muốn có độ tin cậy 1 − α = 95% thì phải
kiểm tra ít nhất bao nhiêu sản phẩm?
Giải
Đặt E ( X ) = µ chưa biết.
a) Kích thước của mẫu đã cho là n = 25 và trung bình mẫu x = 20g , đại lượng X có
độ lệch tiêu chuẩn σ = 2g .
(X − µ)
* Chọn thống kê U = n ~ N( 0;1 ) .
σ
* Độ tin cậy của ước lượng là 1 − α = 0,95 . Do đó: 1 − α / 2 = 0,975 .
* Tra bảng phân vị chuẩn ta được u1−α / 2 = u0,975 = 1,96 .
σ 2
* Độ chính xác ε = u1−α / 2 . = 1,96. = 0,78 g.
n 25
Suy ra µ1 = x − ε = 20 − 0, 78 = 19, 22 .
µ2 = x + ε = 20 + 0, 78 = 20, 78 .
Vậy khoảng ước lượng trung bình khối lượng sản phẩm với độ tin cậy 95% là
(19,22g;20,78g) .
σ
b) Ta có ε = u1−α / 2 .
n
n 25
suy ra u1−α / 2 = ε . = 0,4. = 1 ≈ 0,994 = u0,84 ⇒ 1 − α / 2 = 0,84
σ 2
⇒ 1 − α = 0,68 .
Vậy độ tin cậy tìm thấy là 68%.
σ
c) Ta có ε = u1−α / 2 .
n
2 σ2 2 22 2 22
Suy ra n = u 1−α / 2 . 2 = u0,975 . = ( 1,96 ) . = 96 ,04.
ε ( 0,4 )2 ( 0,4 )2
Vì n là số nguyên nên ta lấy n = 96 .
b) Trường hợp 2: Phương sai Var(X) chưa biết, kích thước mẫu n ≥ 30 .
Về phương pháp cũng tuơng tự như trường hợp 1, chỉ khác là trong trường
hợp này phải ước lượng σ 2 bằng phương sai mẫu điều chỉnh (được xác định từ mẫu
(X − µ)
ngẫu nhiên WX) và ước lượng được dựa vào thống kê: U = n ~ N (0;1) .
S
99
- Trong thực hành, khoảng tin cậy được lập dưới dạng
( µ1 ; µ2 ) = ( x − ε ; x + ε ) .
Với độ chính xác:
s
ε = u1−α / 2 . . (4.7)
n
(s là độ lệch chuẩn điều chỉnh của mẫu cụ thể).
+ Đặt biệt: Nếu chỉ ước lượng giá trị tối đa hay giá trị tối thiểu cho trung của tổng
thể ta có hai giá trị ước lượng sau:
s
µ min = x − u1−α
n
s
µ max = x + u1−α
n
Ví dụ 3: Khảo sát chiều cao của cây cùng độ tuổi thu được kết quả sau
Chiều cao (cm) Số cây
< 180 3
180 – 190 12
190 – 200 35
200 – 210 70
210 – 220 62
220 – 230 32
> 230 6
Hãy dùng số liệu trên để ước lượng trung bình µ của chiều cao cây với độ
tin cậy 99%.
Giải
Gọi X là chiều cao của cây, cần ước lượng cho trung bình µ = E(X) trong
trường hợp chưa biết Var(X) , kích thước mẫu n = 220 > 30 .
Với mẫu cho trong bảng trên, các lớp chiều cao được thay thế bởi điểm giữa,
riêng lớp < 180 được thay thể bởi 175 cm, còn lớp > 230 được thay thế bởi 235 cm.
100
- xi ni xi ni xi2 ni
175 3 525 91875
185 12 2220 410700
195 35 6825 1330875
205 70 14350 2941750
215 62 13330 2865950
225 32 7200 1620000
235 6 1410 331350
∑ n = 220 45860 9592500
* Ta tính được
1 k 1
x = ∑ xi ni = .45860 = 208,455 .
n i =1 220
n
s = s2 = s' 2
n −1
1 k 2 2 1
mà s' = ∑ x i ni − x
2
= .9592500 − ( 208,455 )2 ≈ 148,786 .
n i =1 220
220
Suy ra: s = ( 148,786 ) ≈ 149,465 ≈ 12,226 .
220 − 1
( X −µ)
* Chọn thống kê U = n ~ N( 0;1 ) .
S
* Với độ tin cậy 1 − α = 0,99 . Ta có: 1 − α / 2 = 0,995 .
* Tra bảng phân vị chuẩn ta được u1−α / 2 = u0,995 = 2,576 .
s 12,226
* Độ chính xác ε = u1−α / 2 . = 2,576. = 2,123 cm.
n 220
Suy ra µ1 = x − ε = 208,455 − 2,123 = 206 ,332 .
µ2 = x + ε = 208,455 + 2,123 = 210,578 .
Vậy khoảng ước lượng trung bình chiều cao của cây với độ tin cậy 99% là
(206,332 cm;210,578cm) .
3. Trường hợp 3
101
- Phương sai Var(X) chưa biết; kích thước mẫu n < 30 và X có luật phân
phối chuẩn.
(X −µ)
Chọn thống kê U = n.
S
Mặc dù dựa trên thông kê U cũng giống như trong trường hợp 2 nhưng khi
chưa biết Var(X) , n < 30 và X có luật phân phối chuẩn thì thống kê U khi này sẽ
được xấp xỉ với phân phối Sutdent với n – 1 bậc tự do T(n-1).
Do đó, khi tính độ chính xác giá trị phân vị chuẩn sẽ được thay bằng phân vị
student tα / 2; n −1 với mức xác suất α / 2 và bậc tự do n – 1:
s
. ε = tα / 2;n −1. (4.8)
n
+ Đặt biệt: Nếu chỉ ước lượng giá trị tối đa hay giá trị tối thiểu cho trung của tổng
thể ta có hai giá trị ước lượng sau:
s
µ min = x − tα ;n −2
n
s
µ max = x + tα ;n − 2
n
Ví dụ 4
Lượng chi phí một loại nguyên liệu cho một đơn vị sản phẩm là ĐLNN X có
luật phân phối chuẩn. Khảo sát 25 sản phẩm tính được trung bình mẫu x = 50 g và
độ lệch chuẩn mẫu điều chỉnh s = 8,25 g.
Hãy ước lượng trung bình của chi phí nguyên liệu với độ tin cậy 95%.
Giải
Ta cần ước lượng cho trung bình E(X)= µ trong trường hợp X có luật phân
phối chuẩn, chưa biết Var(X) và kích thước của mẫu đã cho là n = 25
- s 8,25
* Độ chính xác ε = t1−α / 2;n −1 . = 2,064. = 3,406 g.
n 25
Suy ra µ1 = x − ε = 50 − 3,406 = 46 ,594 g.
µ2 = x + ε = 50 + 3,406 = 53,406 g.
Vậy khoảng ước lượng trung bình khối lượng sản phẩm với độ tin cậy 95% là
(46,594g;53,406g) .
Các chỉ tiêu của bài toán khoảng tin cậy đối xứng : Ngoài bài toán tìm
khoảng tin cậy cho một trung bình tổng thể thì từ vấn đề này người ta suy ra
các bài toán phụ.
− Tìm kích cở mẫu khi biết được độ chính xác của ước lượng và độ tin
cậy của ước lượng.
− Tìm độ tin cậy khi đã biết độ chính xác của mẫu ước lượng
? 1/ Giám đốc chi nhánh của một ngân hàng muốn ước lượng số tiền gửi
trung bình của mỗi khách hàng tại ngân hàng. Chọn ngẫu nhiên 30 khách hàng tính
được số tiền gửi trung bình là 4750 USD và độ lệch chuẩn điều mẫu chỉnh là 1200
USD.
a) Với độ tin cậy 95% hãy ước lượng số tiền gửi trung bình của mỗi khách
hàng tại ngân hàng.
b) Nếu sử dụng mẫu trên và muốn có độ chính xác của ước lượng trung bình
là 400 USD thì đảm bảo độ tin cậy là bao nhiêu?
c) Muốn ước lượng trung bình có độ tin cậy 99% và độ chính xác là 300
USD thì cần điều tra thêm bao nhiêu khách hàng?
2/ Tỷ lệ nợ xấu tại một ngân hàng là tỷ số của tổng nợ quá hạn và tổng số nợ
cho vay đang được thực hiện. Điều tra ngẫu nhiên 7 ngân hàng ở vùng A có
tỉ lệ nợ xấu (tính bằng %) là 7, 4, 6, 7, 5, 4, 9.
a) Giả sử tỷ lệ nợ xấu có phân phối chuẩn. Với độ tin cậy 95% hãy ước
lượng tỷ lệ nợ xấu trung bình của các ngân hàng vùng A.
b) Nhân viên thanh tra phàn nàn rằng tỉ lệ nợ xấu của các ngân hàng vùng
A cao hơn tỉ lệ nợ xấu của các ngân hàng vùng B vì ở đó tỉ lệ này chỉ có
3,5%. Hãy dùng kết quả câu a, xét xem lời phàn nàn trên đúng không?
c) Với các câu hỏi tương tự cho độ tin cậy 99%.
103
- 4.2.4 Ước lượng tỷ lệ
4.2.4.1 Đặt vấn đề
Tổng thể chia làm hai loại phần tử, những phần tử có tính chất A và không
có tính chất A. Giả sử tỷ lệ p các phần tử có tính chất A chưa biết. Cho số α khá
nhỏ, ước lượng tỷ lệ p là chỉ ra khoảng ( p1 ; p2 ) sao cho p ∈ ( p1 ; p2 ) với mức xác
suất 1 − α (độ tin cậy của ước lượng).
Gọi X là số phần tử có tính chất A khi lấy ngẫu nhiên 1 phần tử từ tổng thể.
X nhận giá trị 1 khi X có tính chất A và ngược lại X nhận giá trị 0 . Khi đó X là
ĐLNN có phân phối xác suất:
X 0 1
P 1- p p
Gọi X i (i = 1, n) là số phần tử có tính chất A trong lần lấy thứ i.
1 n
Ta có: X = ∑ X i chính là tần suất ước lượng điểm của p = E(X). Mặc
n i =1
khác ta có n X có phân phối nhị thức B ( n; p ) . Do đó E ( X ) = p và
p (1 − p )
Var ( X ) =
n
4.2.4.2 Phương pháp
( f − p) n
Chọn thống kê U = ~ N( 0;1 ) để ước lượng, trong đó p là tỷ lệ
pq
chưa biết, q = 1-p , n là kích thước mẫu khá lớn, f là thống kê nhận giá trị bằng tần
xuất của tính chất A trong mẫu.
Rõ ràng P( uα / 2 < U < u1−α / 2 ) = 1 − α
Với n khá lớn, ta có f xấp xỉ tỷ lệ p nên U = ( f − p ) n
f (1− f )
( f − p) n
Suy ra P uα / 2 < < u1−α / 2 = 1 − α
f (1− f )
f (1− f ) f (1− f )
⇔ P f − u1−α / 2 . < p < f − uα / 2 . = 1−α
n n
Vì phân vị chuẩn có tính chất uα / 2 = −u1−α / 2 nên
104
- f (1− f ) f (1− f )
P f − u1−α / 2 . < p < f + u1−α / 2 . = 1 −α .
n n
Như vậy, khoảng ngẫu nhiên của p với độ tin cậy 1 − α là ( G1 ;G2 ) trong đó
f (1− f ) f (1− f )
G1 = f − u1−α / 2 . và G2 = f + u1−α / 2 . .
n n
f (1− f )
Đặt ε = u1−α / 2 .
n
Ta được: G1 = f − ε và G2 = f + ε . (4)
Với mẫu cụ thể wx = ( x1 ,x2 ,...,xn ) , tần suất f từ (4) ta có khoảng tin cậy
f (1− f )
( p1 ; p2 ) , trong đó p1 = f − ε và p2 = f + ε với ε = u1−α / 2 .
n
Tóm lại:
Trong thực hành, khi có mẫu cụ thể wx = ( x1 ,x2 ,...,xn ) và mức ý nghĩa α
được ấn định trước thì khoảng tin cậy ( p1 ; p2 ) để ước lượng tỷ lệ p được tìm tuần
tự qua các bước sau:
- Với mẫu cụ thể kích thước n, xác định m phần tử mang tính chất A. Tính
m
tần suất có tính chất A trong mẫu: f = .
n
- Với mức ý nghĩa α , tính 1 − α / 2 , rồi tra tìm phân vị chuẩn u1−α / 2 ở phụ
lục bảng 2 hoặc 2’.
f (1− f )
- Tính độ chính xác: ε = u1−α / 2 . . (4.9)
n
- Xác định khoảng tin cậy: ( p1 ; p2 ) = ( f − ε ; f + ε ) . (4.10)
+ Đặt biệt: Nếu chỉ ước lượng giá trị tối đa hay giá trị tối thiểu cho tỉ lệ của tổng thể
ta có hai giá trị ước lượng sau:
f (1 − f )
pmin = f − u1−α
n
f (1 − f )
pmax = f + u1−α
n
Ví dụ 5
Kiểm tra 100 sản phẩm , có 8 phế phẩm. Ước lượng tỷ lệ phế phẩm của lô
hàng với độ tin cậy 95%.
105
- Giải
Gọi p là tỷ lệ phế phẩm trong lô hàng. Ta cần tìm khoảng tin cậy cho p.
( f − p) n
* Chọn thống kê U = ~ N( 0;1 ) để ước lượng.
pq
8
* Với mẫu kích thước n = 100 , tỷ lệ phế phẩm là f = = 0,08 , độ tin cậy
100
của ước lượng là 1 − α = 0,95 . Do đó: 1 − α / 2 = 0,975 .
* Tra bảng phân vị chuẩn ta được u1−α / 2 = u0,995 = 2,576 .
f (1− f ) 0,08( 1 − 0,08 )
* Độ chính xác ε = u1−α / 2 . = 1.96. = 0,053 .
n 100
Suy ra p1 = f − ε = 0,08 − 0,053 = 0,027.
p2 = f + ε = 0,08 + 0,053 = 0,133 .
Vậy khoảng ước lượng tỷ lệ phế phẩm của lô hàng với độ tin cậy 95% là
(2,7%;13,3%) .
Chú ý: Từ bài toán ước lượng khoảng cho tham số tỉ lệ ta có hai bài toán là tìm cở
mẫu, ước lượng số lượng phần tử tổng thể, ước lượng số phần tử có tính chất cần
khảo sát của tổng thể , tìm độ tin cậy của ước lượng
? a) Trong đợt bầu cử tổng thống người ta phỏng vấn ngẫu nhiên 1600 cử tri
thì được biết có 960 người sẽ bầu cho ứng cử viên A. Với độ tin cậy 99%,
hãy xem ứng cử viên A có trúng cử hay không ? ( Biết rằng trên 50%
người bầu sẽ trúng cử).
b) Giám đốc một ngân hàng muốn xác định số khách hàng gởi tiền tại ngân
hàng được chi trả theo tuần. Một mẫu ngẫu nhiên 100 khách hàng có 30 người
được chi trả theo tuần.
i) Với độ tin cậy 90% hãy ước lượng số khách hàng được chi trả theo
tuần, biết ngân hàng có 2000 khách hàng.
ii) Nếu muốn ước lượng tỉ lệ khách hàng được chi trả theo tuần với độ
tin cậy trên và độ chính xác của ước lượng là 0,05 thì cần kích thước mẫu
điều tra bao nhiêu ?
c) Trong 5000 sản phẩm của một lô hàng, người ta chọn ngẫu nhiên ra 256
sản phẩm để kiểm tra thấy có 192 sản phẩm loại 1.
i) Hãy ước lượng tỉ lệ sản phẩm loại 1 có trong lô hàng.
ii) Hãy ước lượng tỉ lệ sản phẩm loại 1, từ đó suy ra số sản phẩm loại
1 có trong lô hàng với độ tin cậy 95%.
106
- iii) Nếu muốn ước lượng tỉ lệ sản phẩm loại 1 của lô hàng đạt được
độ chính xác là 0, 04 sản phẩm và đô tin cậy 97% thì phải kiểm tra bao
nhiêu sản phẩm nữa?.
4.2.5 Ước lượng phương sai
4.2.5.1 Đặt vấn đề
Giả sử ĐLNN X có luật phân phối chuẩn X ∈ N( µ ;σ 2 ) trong đó phương sai
Var( X ) = σ 2 chưa biết. Cho số α khá nhỏ, ước lượng phương sai σ 2 với mức ý
( ) ( )
nghĩa α là chỉ ra khoảng σ 12 ;σ 22 sao cho σ 2 ∈ σ 12 ;σ 22 với xác suất 1 − α (độ
tin cậy của ước lượng).
4.2.5.2 Phương pháp
a) Trường hợp: đã biết E( X ) = µ
n ( X i − µ )2
Ta chọn thống kê χ = ∑ 2
i =1 σ2
Ta thấy χ 2 có phân phối chi bình phương với n bậc tự do
Gọi χα2 / 2;n −1 và χ12−α / 2;n −1 lần lượt là phân vị khi bình phương, bậc tự do
n-1 với mức xác suất lần lượt là α / 2 và 1 − α / 2 (Phụ lục bảng 5 )
P( χ12−α / 2;n < χ 2 < χα2 / 2;n ) = 1 − α
n
( X − µ )2
⇔ P χ12−α / 2;n < ∑ < χ 2
α / 2;n = 1 − α
σ2
i =1
n n
∑ i ∑ ( X i − µ )2
2
( X − µ )
⇔ P i =1 2 < σ 2 < i =1 2 = 1 −α
χ χ1−α / 2;n
α / 2;n
Như vậy, khoảng ước lượng của σ 2 với độ tin cậy 1 − α là ( G1 ;G2 ) trong đó
n n
∑( Xi − µ ) 2
∑ ( X i − µ )2
G1 = i =1 2
và G2 = i =1 .
χα / 2;n χ12−α / 2;n
107
- n
Với mẫu cụ thể wx = ( x1 ,x2 ,...,xn ) , tính các tổng ∑ ( X i − µ )2 , khi đó sẽ
i =1
n
∑ ( X i − µ )2
tìm được khoảng tin cậy (σ 12 ;σ 22 ) , trong đó σ 12 = i =1
χα2 / 2;n
và
n
∑ ( X i − µ )2
σ 22 = i =1 2 .
χ1−α / 2;n
b)Trường hợp trung bình E( X ) = µ chưa biết
2 ( n − 1 )S 2
Chọn thống kê χ = 2
để ước lượng phương sai σ 2 , có luật phân
σ
2
phối χ với bậc tự do n -1, trong đó n là kích thước mẫu, S2 là thống kê nhận giá trị
bằng phương sai mẫu điều chỉnh kích thước n.
Gọi χα2 / 2;n −1 và χ12−α / 2;n −1 lần lượt là phân vị khi bình phương, bậc tự do n -1 với
mức xác suất lần lượt là α / 2 và 1 − α / 2 (Phụ lục bảng 5 ).
Ta có
P( χ12−α / 2;n −1 < χ 2 < χα2 / 2;n −1 ) = 1 − α
( n − 1 )S 2
⇔ P χ12−α / 2;n −1 < < χα2 / 2;n −1 = 1 − α
σ 2
( n − 1 )S 2 ( n − 1 )S 2
⇔ P 2
- Khối lượng xi (g) Số sản phẩm ni
29,3 4
29,7 5
30 8
30,5 5
30,7 3
Với độ tin cậy 95% hãy tìm khoảng tin cậy cho phương sai Var( X ) = σ 2 .
Giải
* Ta có
1 k
x = ∑ xi ni = 30,012
n i =1
n
s = s2 = s' 2
n −1
1 k 2 2
mà s' 2 = ∑ x i ni − x
n i =1
≈ 0,205 .
25
Suy ra: s = ( 0,205 ) ≈ 0,214 .
25 − 1
2 ( n − 1 )S 2
* Chọn thống kê χ = 2
để ước lượng phương sai σ 2 .
σ
* Độ tin cậy của ước lượng là 1 − α = 0,95 . Do đó: 1 − α / 2 = 0,975 và
α / 2 = 0,025 .
( n − 1 )s 2 24.( 0,214 )2 24.( 0,214 )2
Suy ra : σ 12 = = = = 0,028 .
χα2 / 2;n −1 2
χ0,025;24 39,364
( n − 1 )s 2 24.( 0,214 )2 24.( 0,214 )2
σ 22 = = = = 0,089 .
χ12−α / 2;n −1 2
χ0,975;24 12,401
Vậy khoảng ước lượng phương sai với độ tin cậy 95% là (0,028;0,089) .
Tài liệu tham khảo chương 4 : tài liệu 1, 2,3,5,6,7,8
109
- BÀI TẬP ÔN TẬP CHƯƠNG 4
1/ Doanh số của một cửa hàng là biến ngẫu nhiên có phân phối chuẩn với độ lệch
chuẩn là σ = 2 ( triệu/tháng). Điều tra ngẫu nhiên doanh số của 600 cửa hàng có
quy mô tương tự nhau tìm được doanh số trung bình là 8,5 triệu/tháng. Với độ tin
cậy 95% hãy ước lượng doanh số trung bình của các cửa hàng thuộc quy mô đó.
2/ Để ước lượng tổng doanh thu của một công ty gồm 380 cửa hàng trên toàn quốc
trong một tháng. Người ta lấy ngẫu nhiên 10% số cửa hàng và có được doanh thu
trong một tháng là:
Doanh thu (triêu đồng/tháng) 20 40 60 80
Số cửa hàng 8 16 12 2
Với độ tin cậy 99% hãy ước lượng doanh thu trung bình của mỗi cửa hàng và
tổng doanh thu của công ty (trong 1 tháng).
3/ Tiến hành quan sát về số lít xăng bán được trong một số ngày của một trạm xăng
người ta thu được kết quả sau
x i (lít) 200 220 240 260 280 300 320
n i (số ngày) 5 8 12 25 30 16 4
i) Ước lượng số lít xăng bán được trung bình trong ngày với độ tin cậy 99%.
ii) Xem những ngày bán không đến 250 lít xăng là những ngày “ế hàng”. Ước
lượng tỷ lệ những ngày “ế hàng” với độ tin cậy 95%.
iii) Với thông tin mẫu có được, hỏi muốn ước lượng tỷ lệ những ngày “ế
hàng” với độ tin cậy 99% và độ chính xác tối đa là 0,05 thì phải lấy mẫu thống kê
với kích thước tối thiểu là bao nhiêu ngày?
4/ Kiểm tra ngẫu nhiên một số sản phẩm vừa sản xuất, cân thử và thu được các
trọng lượng ( g) sau
201 203 209 204 202 206 200 207 207
Hãy tìm khoảng tin cậy 95% cho trọng lượng trung bình của sản phẩm vừa
sản xuất. Giả sử khối lượng sản phẩm là 1 đặc tính chuẩn
5/ Quan sát thu nhập của một số người làm việc ở một công ty, ta có kết quả cho ở
bảng dưới đây:
Thu nhập ( ngàn đ/tháng) Số người Thu nhập (ngàn đ/tháng) Số người
500 − 550 5 750 − 800 47
550 − 600 9 800 − 850 24
600 − 650 12 850 − 900 18
650 − 700 35 900 − 950 6
110
nguon tai.lieu . vn