Xem mẫu
- Kiêm tra gia
̉ ́ tri ̣
Trung bì nh
1Sample t
2Sample t
Paired t
Mục tiêu học tập
● Hiểu được làm thế nào để tìm giá trị trung bình của tập hợp sử dụng
số liệu thống kê của mẫu
● Hiểu quá trình quyết định chấp nhận hay loại bỏ những giả thuyết áp
dụng cho tính giá trị trung bình của tập hợp
● Hiểu phương pháp để tiến hành phân tích thông qua những bài tập ví dụ
khác nhau.
- Sơ đồ thử nghiệm giả thiết
One population
When significance level = 0.05: Hypothesis Testing 1-Proportion
If P-value>0.05, cannot reject Ho
Stat -Basic Stats -1 proportion
Two population
If P-value
- Kiêm tra gia
̉ ́ tri trung bi
̣ ̀ nh là gì ?
Đinh nghi
̣ ̃a
Dùng để quyết định liệu có chấp nhận hay loại bỏ một giả thiết dựa vào giá
trị trung bình tại một tiêu chuẩn nhất định (giá trị giới hạn).
Kiểm tra giá trị trung bình được dùng khi có một vấn đề liên quan tới giá trị
trung bình của quá trình hoặc khi chúng ta muốn xác định sự khác biệt giữa
hai quá trình.
Phán quyết của bạn là gì?
Giai đoạn phục vụ trung bình của công nhân nữ trong
ngành điện tử là 6 năm. Sau khi áp dụng một vài chính sách
̣ ̣
Qúa khứHiên tai
phúc lợi xã hội gần đây thì thời gian về hưu của công nhân
nữ đã tăng 6.5 năm. Liệu chúng ta có thể nói rằng thời gian
phục vụ trung bình đã thay đổi so với trước đây hay không?
Khi chúng ta muốn kiểm tra liệu có sự khác biệt nào về giá
của 256M DRAM năm ngoái và năm nay. Giá trung bình
của 256M DRAM của năm ngoái là $15 và năm nay là $13.
Liệu chúng ta có thể nói rằng có sự khác biệt về giá giữa Năm nay Năm trước
năm ngoái và năm nay?
Proprietary to Samsung Electronics Company Test of Mean 3 Rev 7.0
- Tông quan
̉
Công cu na
̣ ̀ o sẽ được sử dung?
̣
1Sample tTest
2Sample tTest Paired tTest
1Sample ZTest
ThThửử nghi
nghiệệm đm đểể xem có
xem có Khi dữữ li liệệu d
Khi d u dướưới di dạạng
ng
Thử nghiêm đ
̣ ể kiểm tra tư
bbấất kt kỳỳ s sựự khác bi
khác biệệt v
t vềề từ ng c
̀ ng cặặp đp đồồng nh
ng nhấất, so
t, so
xem có sự khác biệt nào
ị trung bình và giá
giá trị trung bình và giá
giá tr sánh giá trị trung bình củủa a
sánh giá tr ị trung bình c
về giá trị trung bình của
c tiêu củủa a mmộột t
ị mụục tiêu c hai tậập h
hai t p hợợp s p sửử d dụụng s
ng sựự
trtrị m hai tập hợp
khác biệệt gi
khác bi t giữữa các giá tr
a các giá trị ị
ttậập h
p hợợp riêng bi
p riêng biệệtt
quan sát đượ
quan sát đ ượcc
Z Test được sử dụng khi độ lệch chuẩn của tập hợp σ là được
biế t,
t Test được sử dung khi
̣ σ chưa được biế t.
Proprietary to Samsung Electronics Company Test of Mean 4 Rev 7.0
- Qui trì nh phân tí ch
ỵ́̉TT
gau
iêt lâp
hỵ́̉gau
iêt lâp
h Bướ c 1: Thiết lâp gia thuyê
̣ ̉ ́t (Null hypothesis & Alternative
hypothesis)
Bướ c 2: Normality test
XX b
âgiđ
̣́̉ơ h
ac n b
âgiđ
̣́̉ơ h
ac n Bướ c 3: Test of equal variance
(Thực hiên Test of Mean cho 2 tâp h
̣ ̣ ợp)
ố̀̉PP
đ
êu
ticb
ân
hố̀̉đ
êu
ticb
ân
h Bướ c 4: Xác đinh hi
̣ ̣ ̉ ữ liêu thông qua phân ti
̀nh dang cua d ̣ ̉
́ch biêu
đồ.
XX
troǵ̣ư
u
ôq
m
h
in
ac đtroǵ̣ư
u
ôq
m
h
in
ac đ Bướ c 5: Xác đinh m
̣ ức quan trong
̣ α
CC m
đ
tgk
̣́̉ư sôliêu
on
h m
đ
tgk
̣́̉ư sôliêu
on
h Bướ c 6: Chon sô
̣ ̣
́ liêu thô ̉ ử nghiêm gia thuyê
́ng kê đê th ̣ ̉ ́t
ẹ́̀TT
V
vaP
tgk
sôlêu
h
in Bướ c 7: Tính thử nghiêm thô
̣ ́ng kê và PValue sử dung Minitab
̣
ẹ́̀V
vaP
tgk
sôlêu
h
in
Bướ c 8: Đưa ra kết luân thô
̣ ́ng kê thông qua sự giai thi
̉ ̣
́ch giá tri P
̣ĐĐ
ôgk
́ư h
in
yêtđ
u
a rq̣ ôgk
́ư h
in
yêtđ
u
a rq Value
(PValue
- 1Sample t
Ví dụ
Một tổ chức người tiêu dùng chọn một cách ngẫu nhiên 15 gói bột mỳ để kiểm tra khối
lượng thực của gói bột mỳ trên TV có giống như khối lượng được in trên bao bì. Khối
lượng trên bao bì là 110g và đo lường thực tế thì thấp hơn thế. Kiểm tra để xem khối
lượng thực của gói bột mỳ có ít hơn giá trị in trên bao bì 5% hay không.
119 110 108 120 117 109 96 104 123 113 129 106 93 92 102
Proprietary to Samsung Electronics Company Test of Mean 6 Rev 7.0
- Bướ c 1 Thiế t lâp gia thuyê
̣ ̉ ́t
Null hypothesis H0: μ =110g
Alternative hypothesis H1: μ Basic Statistics > Normality Test
H0: Dữ liêu tuân theo phân bô
̣ ̉
́ chuân.
H1: Dữ liêu không tuân theo phân bô
̣ ̉
́ chuân.
PValue=0.951 lớn hơn 0.05. Do đó, chúng
̉ ́i rằng dữ liêu tuân theo phân bô
ta có thê no ̣ ́
̉
chuân.
Bướ c 3 Phân tí ch biêu đô
̉ ̀
Sử dung biêu đô
̣ ̉ ̉ ̣
̀ đê nhân biê ̉
́t khoang hi ̣ ̉ ữ liêu
̀nh dang cua d ̣
(Sử dung Histogram, Box Plot, Dot Plot, etc.)
̣
Proprietary to Samsung Electronics Company Test of Mean 7 Rev 7.0
- Bướ c 4 Xá c đinh m
̣ ứ c đô quan trong
̣ ̣
Thông thường α = 5% (0.05) được sử dụng. Nếu không được xác định
thì Minitab sẽ sử dụng 5% như mức độ quan trong
̣
Sử dụng Minitab, hệ số tin cậy (1α) được sử dụng thay thế mức độ
̣
quan trong.
Ví dụ) Nếu α=5%, giá trị sử dụng trong Minitab sẽ là 95.0
Bướ c 5 Chon l
̣ ựa thí nghiêm thô
̣ ́ ng kê
̣
Chon 1Sample t (T statistic is used)
[Note]
̣
Thí nghiêm thống kê: Thí nghiệm thống kê được sử dụng để quyết định có chấp nhận
hay loại bỏ giả thiết.
Proprietary to Samsung Electronics Company Test of Mean 8 Rev 7.0
- Bướ c 6 Tí nh số liêu thô
̣ ́ ng kê và PValue
̣
Chon m ức đô tin cây
̣ ̣
Stat > Basic Statistics > 1Sample t ̣ ̣
(Măc đinh :95.0)
1
4
5
6
2
7 3
̣ ̉
Chon gia thuyê ́t thay thế.
̉
Nếu gia thuyê ́t thay thế là :
Có thể vẽ đồ thị theo sự chọn ̣
μ110: chon “greater than”
Proprietary to Samsung Electronics Company Test of Mean 9 Rev 7.0
- ̉ ừ Minitab
Kết qua t
OneSample T: A
Test of mu = 110 vs
- 2Sample t
Ví dụ
Đội cải tiến hợp nhất kiểm tra xem các kiểu khác nhau của các máy in có thể
hiện sự khác nhau về tỉ lệ kẹt giấy hay không. Khi số lần kẹt giấy trung bình
hàng tháng của các máy in từ công ty A và công ty B như sau, hãy kiểm định
xem liệu số lần kẹt giấy trung bình hàng tháng của các máy in từ hai công ty
có khác nhau với mức đáng kể là 5% hay không.
(Tên file : 2Sample t Test.mtw)
Company A 45 59 60 64 58 67 53 61
Company B 59 68 63 66 48 64 69 60
Proprietary to Samsung Electronics Company Test of Mean 11 Rev 7.0
- Bướ c 1 Thiết lập giả thuyết
̉
Gia thuyê ̣
́t vô hiêu (Null hypothesis) H 0: μ1 = μ2
̉
Gia thuyê ̣ ựa (Alternative hypothesis) H1: μ1 ≠ μ2
́t chon l
Bướ c 2 Normality test
Stat > Basic Statistics > Normality Test
P ro bability P lo t o f Co mpa ny A
No ny
P ro bability P lo t o f Co mpa rma B
l
99 No rma l
Me a n 58 .3 8
99 StDe v 6.80 2
95
Me a n
StDe v
62.1 3
6.70 7
N 8 Company A’s P Value=0.440
AD 0.32 2
95 90 N
AD
8
0.41 3
P Va lu e 0.44 0 Company B’s PValue=0.252
90 80
70
P Va lue 0.25 2
Vì vậy, cả hai tập dữ liệu
80
đều có sự phân bố chuẩn.
P e rc e n t
60
70
P e rc e n t
50
60
40
50
30
40
30 20
20 10
10 5
5
1
1
40 45 50 55 60 65 70 75
45 50 55 60 65 Co mp 70a n y A 75 80
Co mp a n y B
Proprietary to Samsung Electronics Company Test of Mean 12 Rev 7.0
- Bướ c 3 Test of equal variance
Kiểm định xem liệu biến thiên của dữ liệu dành cho công ty A và công ty
B có như nhau hay không
Stat > Basic Statistics > 2Variances
• Đối với hai nhóm có dữ liệu không
xếp chồng, áp dụng ‘2
Variances,”
• Đối với hai hay nhiều nhóm có dữ
1 liệu xếp chồng, áp dụng ‘2
Variances” or “Test for Equal
Variances”
2
̣
Nhâp m ức đô tin
̣
̣
cây
̣ ̣
(Măc đinh :95.0)
Proprietary to Samsung Electronics Company Test of Mean 13 Rev 7.0
- Sử dung thông tin Ftest
̣
nếu dữ liêu la
̣ ̀ phân
bố chuân̉
Te s t fo r Equal Varianc e s fo r Co mpany A, Co mpa ny B
F Te s t
Com pa ny A
Te s t Sta tis tic
P Va lu e
1.03
0.971
Sử dung thông tin
̣
Le ve ne ' s Te s t
Levene’s Test nếu dữ
Te s t Sta tis tic 0.00 ̣ ̉ ̀ phân
liêu không phai la
Com pa ny B
P Va lu e 1.000 bố chuân̉
5.0 7.5 10.0 12.5 15.0
9 5 % B o n fe rro n i Co n fid e n c e In te rva ls fo r S tDe vs
Com pa ny A
Com pa ny B
45 50 55 60 65 70
Da ta
Khi giá trị PValue = 0.971 lớn hơn mức có nghĩa 0.05, chúng ta có thể
nói rằng có biến thiên như nhau (Có nghĩa là biến thiên giống nhau)
Proprietary to Samsung Electronics Company Test of Mean 14 Rev 7.0
- Bướ c 4 Phân tích đồ thị
Sử dụng đồ thị để nhân biê
̣ ́t hình dạng toàn bộ của dữ liệu
(Use Histogram, Box Plot, Dot Plot, etc.)
Bướ c 5 Xác định mức có ý nghĩa
Thông thường α = 5% (0.05) là được sử dung.
̣
̣
Măc kha ̣
́c, nếu không xác đinh được, Minitab sử dung 5% nh
̣ ư là mức
có ý nghĩa.
Trong Minitab, mức đô tin cây (1
̣ ̣ α ) được nhập vào thay thế cho mức
có nghĩa.
Ví du) Nê
̣ ̣ ̣
́u α = 5%, giá tri nhâp vào Minitab sẽ là 95.0
Bướ c 6 Chon th
̣ ử nghiêm thô
̣ ́ ng kê
Select 2Sample t (T statistic)
Proprietary to Samsung Electronics Company Test of Mean 15 Rev 7.0
- Bướ c 7 Tí nh toá n thố ng kê thử nghiêm va
̣ ̀ PValuẹ
Chon m ức đô tin
̣
̣
cây
Stat > Basic Statistics > 2Sample t ̣ ̣
(Măc đinh :95.0)
4
5
1
6
2 ̣ ̉
Chon gia thuyê ́t thay thế.
̉
Nếu gia thuyê ́t thay thế là :
μ1 μ2 : greater than
10
Lựa chọn nếu bạn cho rằng hai Có thể vẽ đồ thị theo sự
tổng thể đang được so sánh có độ chọn lựa của bạn
lệch chuẩn như nhau. (trong ví dụ 8 (Dot Plot or Box Plot)
này, nếu kiểm định biến thiên như
nhau kết luận rằng biến thiên
giống nhau, thì ô này được tích vào) 9
Proprietary to Samsung Electronics Company Test of Mean 16 Rev 7.0
- (Chú ý) Trong trường hợp kiểm định một phía
Nếu bạn muốn khẳng định rằng “Trị số trung bình của nhà cung cấp A ( 1) lớn hơn
trị số trung bình của nhà cung cấp B ( 2)
Giả thuyết không khác biệt =
1
. Giả thuyết thay thế
2
>
1
.
2
Chứng tỏ rằng cột chứa dữ
liệu đang được so sánh
Trong ví dụ này, giả thuyết thay thế là “Trị số
trung bình của công ty A (C1) lớn hơn trị số trung
̣ Greater Than
bình của công ty B (C2)”. Vì vây,
đã được chon.
̣
Proprietary to Samsung Electronics Company Test of Mean 17 Rev 7.0
- ̉ ừ Minitab
Kết qua t
Twosample T for Company A vs Company B
N Mean StDev SE Mean
Company A 8 58.38 6.80 2.4
Company B 8 62.13 6.71 2.4
Test statistic PValue
Difference = mu (Company A) mu (Company B)
Estimate for difference: 3.75000
95% CI for difference: (10.99362, 3.49362)
TTest of difference = 0 (vs not =): TValue = 1.11 PValue = 0.286 DF = 14
Both use Pooled StDev = 6.7546
Proprietary to Samsung Electronics Company Test of Mean 18 Rev 7.0
- ̉ ̀ thị
Kết qua đô
Bo x plo t o f Co mpany A, Co mpany B
70
65
60
Da ta
55
50
45
Co mp a n y A Co mp a n y B
Bướ c 8 Kết luận thống kê
Từ giá tri PValue=0.286 l
̣ ớn hơn 0.05, gia thuyê
̉ ́t không khác biệt (null
̉ ̣ ̣ ̉
hypothesis) H0 không thê bi loai bo.
Bướ c 9 Kết luận thực tế
Chúng ta không thể nói rằng số lần kẹt giấy trung bình hàng tháng của các
máy in từ công ty A và B là khác nhau.
Proprietary to Samsung Electronics Company Test of Mean 19 Rev 7.0
- Paired t
Được sử dụng để so sánh các trị số trung bình của hai nhóm khi dữ liệu theo dạng các
cặp thuần nhất. Cũng được coi như sự so sánh theo cặp (t cặp đôi)
Ví dụ: So sánh quãng đường đi tương ứng với số xăng công ty A và công ty B sử dụng
Phương phá p Phương phá p
1 2
Ngẫu nhiên chia 8 chiếc xe thành 2 nhóm. Đổ đầy
Ngẫu nhiên lựa chọn 8 chiếc xe ô tô, đổ đầy xăng cho
xăng của A vào những chiếc xe thuộc một nhóm và
chúng từ A và B. Sau đó đo quãng đường đi của từng xăng của B vào những chiếc xe thuộc nhóm kia. Đo
chiếc xe quãng đường đi của từng chiếc xe.
☞ Bởi vì dữ liệu là các cặp đôi thuần nhất, sử ☞ Bởi vì dữ liệu độc lập với nhau, sử dung
̣
dung
̣ Paired t 2Sample t
̣
Loai xe Công ty A Côngty B ̣
Loai xe Công ty A Công ty B
1 a1 b1 1 a1
2 a2 b2 2 a2
3 a3 b3 3 b1
4 a4 b4 4 a3
5 a5 b5 5 b2
6 a6 b6 6 a4
7 a7 b7 7 b3
8 a8 b8 8 b4
Proprietary to Samsung Electronics Company Test of Mean 20 Rev 7.0
nguon tai.lieu . vn