Xem mẫu

  1. Kiêm tra gia ̉ ́  tri ̣ Trung bì nh  1­Sample t  2­Sample t  Paired t  Mục tiêu học tập ●   Hiểu được làm thế nào để tìm giá trị trung bình của tập hợp sử dụng  số liệu thống kê của mẫu ●  Hiểu quá trình quyết định chấp nhận hay loại bỏ những giả thuyết áp  dụng cho tính giá trị trung bình của tập hợp ● Hiểu phương pháp để tiến hành phân tích thông qua những bài tập ví dụ  khác nhau.
  2. Sơ đồ thử nghiệm giả thiết  One population When significance level = 0.05: Hypothesis Testing 1-Proportion If P-value>0.05, cannot reject Ho Stat -Basic Stats -1 proportion Two population If P-value
  3. Kiêm tra gia ̉ ́  tri trung bi ̣ ̀ nh là  gì ?   Đinh nghi ̣ ̃a ­ Dùng để quyết định liệu có chấp nhận hay loại bỏ một giả thiết dựa vào giá  trị trung bình tại một tiêu chuẩn nhất định (giá trị giới hạn). ­ Kiểm tra giá trị trung bình được dùng khi có một vấn đề liên quan tới giá trị  trung bình của quá trình hoặc khi chúng ta muốn xác định sự khác biệt giữa  hai quá trình.  Phán quyết của bạn là gì?  Giai đoạn phục vụ trung bình của công nhân nữ trong  ngành điện tử là 6 năm. Sau khi áp dụng một vài chính sách    ̣ ̣ Qúa khứHiên tai phúc lợi xã hội gần đây thì thời gian về hưu của công nhân  nữ đã tăng 6.5 năm. Liệu chúng ta có thể nói rằng thời gian  phục vụ trung bình đã thay đổi so với trước đây hay không?  Khi chúng ta muốn kiểm tra liệu có sự khác biệt nào về giá  của 256M DRAM năm ngoái và năm nay. Giá trung bình  của 256M DRAM của năm ngoái là $15 và năm nay là $13.  Liệu chúng ta có thể nói rằng có sự khác biệt về giá giữa  Năm nay Năm trước năm ngoái và năm nay? Proprietary to Samsung Electronics Company Test of Mean­ 3 Rev  7.0
  4. Tông quan ̉  Công cu na ̣ ̀ o sẽ  được sử dung? ̣ 1­Sample t­Test 2­Sample t­Test Paired t­Test 1­Sample Z­Test ThThửử nghi  nghiệệm đm đểể xem có   xem có  Khi dữữ li liệệu d Khi d u dướưới di dạạng  ng  Thử nghiêm đ ̣ ể kiểm tra  tư bbấất kt kỳỳ s sựự khác bi  khác biệệt v t vềề    từ ng c ̀ ng cặặp đp đồồng nh ng nhấất, so  t, so  xem có sự khác biệt nào  ị trung bình và giá  giá trị trung bình và giá  giá tr sánh giá trị trung bình củủa a  sánh giá tr ị trung bình c về giá trị trung bình của  c tiêu củủa a mmộột t  ị mụục tiêu c hai tậập h hai t p hợợp s p sửử d dụụng s ng sựự    trtrị m hai tập hợp khác biệệt gi khác bi t giữữa các giá tr a các giá trị ị  ttậập h p hợợp riêng bi p riêng biệệtt quan sát đượ quan sát đ ượcc Z Test được sử dụng khi độ lệch chuẩn của tập hợp σ  là  được  biế t,  t Test được sử dung khi  ̣ σ  chưa được biế t. Proprietary to Samsung Electronics Company Test of Mean­ 4 Rev  7.0
  5.  Qui trì nh phân tí ch  ỵ́̉TT gau iêt lâp hỵ́̉gau iêt lâp h Bướ c 1: Thiết lâp gia thuyê ̣ ̉ ́t (Null hypothesis & Alternative  hypothesis) Bướ c  2: Normality test XX b âgiđ ̣́̉ơ h ac n b âgiđ ̣́̉ơ h ac n Bướ c 3: Test of equal variance               (Thực hiên Test of Mean cho 2 tâp h ̣ ̣ ợp) ố̀̉PP đ êu  ticb ân hố̀̉đ êu  ticb ân h Bướ c 4: Xác đinh hi ̣ ̣ ̉ ữ liêu thông qua phân ti ̀nh dang cua d ̣ ̉ ́ch biêu  đồ. XX troǵ̣ư u ôq m h in ac đtroǵ̣ư u ôq m h in ac đ Bướ c 5: Xác đinh m ̣ ức quan trong  ̣ α  CC m đ tgk ̣́̉ư  sôliêu on h m đ tgk ̣́̉ư  sôliêu on h Bướ c 6: Chon sô ̣ ̣ ́ liêu thô ̉ ử nghiêm gia thuyê ́ng kê đê th ̣ ̉ ́t  ẹ́̀TT ­V vaP tgk  sôlêu h in Bướ c 7: Tính thử nghiêm thô ̣ ́ng kê và P­Value sử dung Minitab ̣ ẹ́̀­V vaP tgk  sôlêu h in Bướ c 8: Đưa ra kết luân thô ̣ ́ng kê thông qua sự giai thi ̉ ̣ ́ch giá tri P­ ̣ĐĐ ôgk ́ư h in yêtđ u a rq̣ ôgk ́ư h in yêtđ u a rq Value             (P­Value 
  6. 1­Sample t  Ví  dụ Một tổ chức người tiêu dùng chọn một cách ngẫu nhiên 15 gói bột mỳ để kiểm tra khối  lượng thực của gói bột mỳ trên TV có giống như khối lượng được in trên bao bì. Khối  lượng trên bao bì là 110g và đo lường thực tế thì thấp hơn thế. Kiểm tra để xem khối  lượng thực của gói bột mỳ có ít hơn giá trị in trên bao bì 5% hay không.  119  110  108  120  117  109  96  104  123  113  129  106  93  92  102      Proprietary to Samsung Electronics Company Test of Mean­ 6 Rev  7.0
  7. Bướ c 1      Thiế t lâp gia thuyê ̣ ̉ ́t Null hypothesis            H0: μ =110g Alternative hypothesis H1: μ  Basic Statistics > Normality Test H0: Dữ liêu tuân theo phân bô ̣ ̉ ́ chuân. H1: Dữ liêu không tuân theo phân bô ̣ ̉ ́ chuân. P­Value=0.951 lớn hơn 0.05. Do đó, chúng  ̉ ́i rằng dữ liêu tuân theo phân bô ta có thê no ̣ ́  ̉ chuân. Bướ c 3      Phân tí ch biêu đô ̉ ̀ Sử dung biêu đô ̣ ̉ ̉ ̣ ̀ đê nhân biê ̉ ́t khoang hi ̣ ̉ ữ liêu ̀nh dang cua d ̣ (Sử dung Histogram, Box Plot, Dot Plot, etc.) ̣ Proprietary to Samsung Electronics Company Test of Mean­ 7 Rev  7.0
  8. Bướ c 4      Xá c đinh m ̣ ứ c đô quan trong ̣ ̣ Thông thường α = 5% (0.05) được sử dụng. Nếu không được xác định  thì Minitab sẽ sử dụng 5% như mức độ quan trong ̣ Sử dụng Minitab, hệ số tin cậy (1­α) được sử dụng thay thế mức độ  ̣ quan trong. Ví dụ) Nếu α=5%, giá trị sử dụng trong Minitab sẽ là 95.0 Bướ c 5      Chon l ̣ ựa thí  nghiêm thô ̣ ́ ng kê ̣ Chon 1­Sample t (T statistic is used)    [Note] ̣    Thí nghiêm thống kê: Thí nghiệm thống kê được sử dụng để quyết định có chấp nhận  hay loại bỏ giả thiết. Proprietary to Samsung Electronics Company Test of Mean­ 8 Rev  7.0
  9. Bướ c 6   Tí nh số  liêu thô ̣ ́ ng kê và  P­Value ̣ Chon m ức đô tin cây  ̣ ̣ Stat > Basic Statistics > 1­Sample t ̣ ̣ (Măc đinh :95.0) 1 4 5 6 2 7 3 ̣ ̉ Chon gia thuyê ́t thay thế. ̉ Nếu gia thuyê ́t thay thế là : Có thể vẽ đồ thị theo sự chọn  ̣ μ110: chon “greater than” Proprietary to Samsung Electronics Company Test of Mean­ 9 Rev  7.0
  10. ̉ ừ Minitab ­ Kết qua t One­Sample T: A  Test of mu = 110 vs 
  11. 2­Sample t  Ví  dụ Đội cải tiến hợp nhất kiểm tra xem các kiểu khác nhau của các máy in có thể  hiện sự khác nhau về tỉ lệ kẹt giấy hay không. Khi số lần kẹt giấy trung bình  hàng tháng của các máy in từ công ty A và công ty B như sau, hãy kiểm định  xem liệu số lần kẹt giấy trung bình hàng tháng của các máy in từ hai công ty  có khác nhau với mức đáng kể là 5% hay không. (Tên file : 2­Sample t Test.mtw) Company  A 45 59 60 64 58 67 53 61 Company B 59 68 63 66 48 64 69 60 Proprietary to Samsung Electronics Company Test of Mean­ 11 Rev  7.0
  12. Bướ c 1      Thiết lập giả thuyết ̉ Gia thuyê ̣ ́t vô hiêu (Null hypothesis)              H 0: μ1 = μ2  ̉ Gia thuyê ̣ ựa (Alternative hypothesis) H1: μ1 ≠ μ2 ́t chon l Bướ c 2      Normality test Stat > Basic Statistics > Normality Test P ro bability   P lo t  o f  Co mpa ny   A No ny  P ro bability   P lo t  o f  Co mpa rma B l  99 No rma l  Me a n 58 .3 8 99 StDe v 6.80 2 95 Me a n StDe v 62.1 3 6.70 7 N 8 Company A’s P Value=0.440 AD 0.32 2 95 90 N AD 8 0.41 3 P­ Va lu e 0.44 0 Company B’s P­Value=0.252  90 80 70 P­ Va lue 0.25 2 Vì vậy, cả hai tập dữ liệu  80 đều có sự phân bố chuẩn. P e rc e n t 60 70 P e rc e n t 50 60 40 50 30 40 30 20 20 10 10 5 5 1 1 40 45 50 55 60 65 70 75 45 50 55 60 65 Co mp 70a n y   A 75 80 Co mp a n y   B Proprietary to Samsung Electronics Company Test of Mean­ 12 Rev  7.0
  13. Bướ c 3      Test of equal variance Kiểm định xem liệu biến thiên của dữ liệu dành cho công ty A và công ty  B có như nhau hay không Stat > Basic Statistics > 2­Variances  • Đối với hai nhóm có dữ liệu không  xếp chồng, áp dụng ‘2­ Variances,” • Đối với hai hay nhiều nhóm có dữ  1 liệu xếp chồng, áp dụng ‘2­ Variances” or “Test for Equal  Variances” 2 ̣ Nhâp m ức đô tin  ̣ ̣ cây  ̣ ̣ (Măc đinh :95.0) Proprietary to Samsung Electronics Company Test of Mean­ 13 Rev  7.0
  14. Sử dung thông tin F­test  ̣ nếu dữ liêu la ̣ ̀ phân  bố chuân̉ Te s t  fo r  Equal  Varianc e s   fo r  Co mpany   A,   Co mpa ny   B F­ Te s t Com pa ny A Te s t Sta tis tic P­ Va lu e 1.03 0.971 Sử dung thông tin  ̣ Le ve ne ' s  Te s t Levene’s Test  nếu dữ  Te s t Sta tis tic 0.00 ̣ ̉ ̀ phân  liêu không phai la Com pa ny B P­ Va lu e 1.000 bố chuân̉ 5.0 7.5 10.0 12.5 15.0 9 5 %  B o n fe rro n i  Co n fid e n c e   In te rva ls   fo r  S tDe vs Com pa ny A Com pa ny B 45 50 55 60 65 70 Da ta Khi giá trị P­Value = 0.971 lớn hơn mức có nghĩa 0.05, chúng ta có thể  nói rằng có biến thiên như nhau (Có nghĩa là biến thiên giống nhau) Proprietary to Samsung Electronics Company Test of Mean­ 14 Rev  7.0
  15. Bướ c 4   Phân tích đồ thị Sử dụng đồ thị để nhân biê ̣ ́t hình dạng toàn bộ của dữ liệu (Use Histogram, Box Plot, Dot Plot, etc.) Bướ c 5      Xác định mức có ý  nghĩa Thông thường α = 5% (0.05) là được sử dung. ̣ ̣ Măc kha ̣ ́c, nếu không xác đinh được, Minitab sử dung 5% nh ̣ ư là mức  có ý nghĩa. Trong Minitab, mức đô tin cây (1­  ̣ ̣ α ) được nhập vào thay thế cho mức  có nghĩa.  Ví du) Nê ̣ ̣ ̣ ́u α = 5%,  giá tri nhâp vào Minitab sẽ là 95.0 Bướ c 6      Chon th ̣ ử nghiêm thô ̣ ́ ng kê Select 2­Sample t (T statistic) Proprietary to Samsung Electronics Company Test of Mean­ 15 Rev  7.0
  16. Bướ c 7      Tí nh toá n thố ng kê thử nghiêm va ̣ ̀  P­Valuẹ Chon m ức đô tin  ̣ ̣ cây  Stat > Basic Statistics > 2­Sample t ̣ ̣ (Măc đinh :95.0) 4 5 1 6 2 ̣ ̉ Chon gia thuyê ́t thay thế. ̉ Nếu gia thuyê ́t thay thế là : μ1  μ2 : greater than 10 Lựa chọn nếu bạn cho rằng hai  Có thể vẽ đồ thị theo sự  tổng thể đang được so sánh có độ  chọn lựa của bạn lệch chuẩn như nhau. (trong ví dụ  8  (Dot Plot or Box Plot) này, nếu kiểm định biến thiên như  nhau kết luận rằng biến thiên  giống nhau, thì ô này được tích vào) 9 Proprietary to Samsung Electronics Company Test of Mean­ 16 Rev  7.0
  17. (Chú ý) Trong trường hợp kiểm định một phía                Nếu bạn muốn khẳng định rằng “Trị số trung bình của nhà cung cấp A ( 1) lớn hơn  trị số trung bình của nhà cung cấp B ( 2)                 Giả thuyết không khác biệt  =  1  . Giả thuyết thay thế  2  >  1  .  2  Chứng tỏ rằng cột chứa dữ  liệu đang được so sánh Trong ví dụ này, giả thuyết thay thế là “Trị số  trung bình của công ty A (C1) lớn hơn trị số trung  ̣ Greater Than  bình của công ty B (C2)”. Vì vây,  đã được chon. ̣ Proprietary to Samsung Electronics Company Test of Mean­ 17 Rev  7.0
  18. ̉ ừ Minitab ­ Kết qua t Two­sample T for Company A vs Company B            N   Mean  StDev  SE Mean Company A  8  58.38   6.80      2.4 Company B  8  62.13   6.71      2.4 Test statistic P­Value Difference = mu (Company A) ­ mu (Company B) Estimate for difference:  ­3.75000 95% CI for difference:  (­10.99362, 3.49362) T­Test of difference = 0 (vs not =): T­Value = ­1.11  P­Value = 0.286  DF = 14 Both use Pooled StDev = 6.7546 Proprietary to Samsung Electronics Company Test of Mean­ 18 Rev  7.0
  19. ̉ ̀ thị ­ Kết qua đô Bo x plo t  o f  Co mpany   A,   Co mpany  B 70 65 60 Da ta 55 50 45 Co mp a n y A Co mp a n y B Bướ c 8      Kết luận thống kê Từ giá tri P­Value=0.286 l ̣ ớn hơn 0.05, gia thuyê ̉ ́t không khác biệt (null  ̉ ̣ ̣ ̉ hypothesis) H0 không thê bi loai bo. Bướ c 9      Kết luận thực tế Chúng ta không thể nói rằng số lần kẹt giấy trung bình hàng tháng của các  máy in từ công ty A và B là khác nhau. Proprietary to Samsung Electronics Company Test of Mean­ 19 Rev  7.0
  20. Paired t Được sử dụng để so sánh các trị số trung bình của hai nhóm khi dữ liệu theo dạng các  cặp thuần nhất. Cũng được coi như sự so sánh theo cặp (t cặp đôi) Ví dụ: So sánh quãng đường đi tương ứng với số xăng công ty A và công ty B sử dụng Phương phá p  Phương phá p  1 2 Ngẫu nhiên chia 8 chiếc xe thành 2 nhóm. Đổ đầy  Ngẫu nhiên lựa chọn 8 chiếc xe ô tô, đổ đầy xăng cho  xăng của A vào những chiếc xe thuộc một nhóm và  chúng từ A và B. Sau đó đo quãng đường đi của từng  xăng của B vào những chiếc xe thuộc nhóm kia. Đo  chiếc xe quãng đường đi của từng chiếc xe.  ☞   Bởi vì dữ liệu là các cặp đôi thuần nhất, sử  ☞  Bởi vì dữ liệu độc lập với nhau, sử dung ̣ dung  ̣ Paired t       2­Sample t ̣ Loai xe Công ty A Côngty B ̣ Loai xe Công ty A Công ty B 1 a1 b1 1 a1 2 a2 b2 2 a2 3 a3 b3 3 b1 4 a4 b4 4 a3 5 a5 b5 5 b2 6 a6 b6 6 a4 7 a7 b7 7 b3 8 a8 b8 8 b4 Proprietary to Samsung Electronics Company Test of Mean­ 20 Rev  7.0
nguon tai.lieu . vn