Xem mẫu

  1. GIỚI THIỆU MÔN HỌC THỐNG KÊ CHO KHOA HỌC XÃ HỘI Giảng viên: ThS. Nguyễn Thị Xuân Mai
  2. BÀI 3 ƯỚC LƯỢNG VÀ KIỂM ĐỊNH GIẢ THUYẾT THỐNG KÊ Giảng viên: ThS. Nguyễn Thị Xuân Mai 2
  3. MỤC TIÊU BÀI HỌC • Trình bày một số vấn đề cơ bản về điều tra chọn mẫu. • Trình bày các yếu tố của ước lượng. • Trình bày phương pháp ước lượng số trung bình của tổng thể chung. • Trình bày phương pháp ước lượng tỷ lệ của tổng thể chung. • Trình bày công thức xác định cỡ mẫu cần điều tra. • Giới thiệu một số vấn đề về kiểm định giả thuyết thống kê và các khái niệm có liên quan. • Trình bày phương pháp kiểm định giả thuyết thống kê về giá trị trung bình của một tổng thể chung. • Trình bày phương pháp kiểm định giả thuyết thống kê về tỷ lệ của một tổng thể chung. 3
  4. CÁC KIẾN THỨC CẦN CÓ Kiến thức chung về kinh tế - xã hội. 4
  5. HƯỚNG DẪN HỌC • Đọc tài liệu tham khảo. • Thảo luận với giáo viên và các sinh viên khác về những vấn đề chưa hiểu rõ. • Trả lời các câu hỏi của bài học. • Đọc và tìm hiểu thêm về điều tra thống kê, điều tra chọn mẫu và phương pháp thống kê suy luận. 5
  6. CẤU TRÚC NỘI DUNG 3.1 Điều tra chọn mẫu Ước lượng số trung bình và tỷ lệ từ kết quả điều tra 3.2 chọn mẫu 3.3 Kiểm định giả thuyết thống kê 6
  7. 3.1. ĐIỀU TRA CHỌN MẪU 3.1.1. Khái niệm điều tra chọn mẫu 3.1.2. Ưu nhược điểm của điều tra chọn mẫu 3.1.3. Sai số trong điều tra chọn mẫu 7
  8. 3.1.1. KHÁI NIỆM ĐIỀU TRA CHỌN MẪU • Điều tra chọn mẫu là một loại điều tra không toàn bộ trong đó người ta chỉ chọn ra một số đơn vị thuộc đối tượng nghiên cứu để tiến hành điều tra thực tế. Các đơn vị này được chọn theo những quy tắc nhất định để đảm bảo tính đại biểu. Kết quả của điều tra chọn mẫu được dùng để suy rộng cho tổng thể chung. • Các khái niệm liên quan:  Chọn mẫu ngẫu nhiên: Là phương pháp tổ chức chọn mẫu một cách hoàn toàn ngẫu nhiên không qua một sự sắp xếp nào. Ví dụ: bốc thăm, quay số hoặc chọn theo bảng số ngẫu nhiên hay chọn bất kỳ. Có nhiều phương pháp chọn mẫu ngẫu nhiên: chọn ngẫu nhiên giản đơn, chọn mẫu hệ thống, chọn mẫu chùm, chọn mẫu phân tầng, chọn mẫu phân tổ.  Chọn mẫu phi ngẫu nhiên: là phương   X i pháp chọn đơn vị điều x  xphụ tra i thuộc vào ý muốn chủ quan của người chọn, dựa N trên những thông tin đã biết n về tổng thể. * * Ví dụ: chọn đơn vị trung bình, chọn N n p  chuyên gia. f  N n   Xi     2 2 xi  x 2  S2  N n 1 8
  9. 3.1.1. KHÁI NIỆM ĐIỀU TRA CHỌN MẪU • Tổng thể chung là một tập hợp bao gồm toàn bộ các đối tượng nghiên cứu. → Xác định đúng tổng thể nghiên cứu rất quan trọng. Việc xác định sai sẽ dẫn đến kết quả tính toán trên mẫu bị chệch và dẫn đến sai số phi chọn mẫu. • Tổng thể mẫu (còn gọi là mẫu) là một tập hợp con được rút ra từ tổng thể nghiên cứu. → Điều tra chọn mẫu là thu thập thông tin từ các đơn vị trong mẫu. • Suy rộng (ước lượng) từ các tham số (mức độ) tính toán được trên các đơn vị điều tra (TTM) suy ra các tham số tương ứng của toàn bộ hiện tượng (TTC). Tổng thể chung Tổng thể mẫu Qui mô N n Số trung bình Tỷ lệ theo một tiêu thức Phương sai hoặc 2 = p(1- p) hoặc S2 = f(1 – f) 9
  10. 3.1.2. ƯU NHƯỢC ĐIỂM CỦA ĐIỀU TRA CHỌN MẪU • Ưu điểm:  Tiết kiệm hơn về mặt thời gian và chi phí so với điều tra toàn bộ.  Do điều tra ít đơn vị nên có thể mở rộng nội dung điều tra đi sâu nghiên cứu chi tiết nhiều mặt của hiện tượng.  Tài liệu thu được trong điều tra chọn mẫu có độ chính xác cao hơn do giảm được sai số phi chọn mẫu.  Tiến hành nhanh gọn, bảo đảm tính kịp thời của số liệu thống kê. Mặt khác, điều tra chọn mẫu không đòi hỏi phải có tổ chức lớn, chỉ cần một cơ quan hoặc một nhóm người cũng có thể tiến hành điều tra được. • Nhược điểm:  Không cho biết thông tin đầy đủ, chi tiết về từng đơn vị tổng thể, không cho biết qui mô tổng thể.  Do chỉ tiến hành điều tra một số đơn vị rồi dùng kết quả để suy rộng cho toàn bộ tổng thể nên chắc chắn không tránh khỏi sai số khi suy rộng.  Kết quả điều tra chọn mẫu không thể tiến hành phân nhỏ theo mọi phạm vi và tiêu thức nghiên cứu như điều tra toàn bộ mà chỉ có thể thực hiện ở một mức độ nhất định tuỳ thuộc vào quy mô mẫu và cách rải mẫu. 10
  11. 3.1.2. ƯU NHƯỢC ĐIỂM CỦA ĐIỀU TRA CHỌN MẪU • Trường hợp vận dụng điều tra chọn mẫu:  Sử dụng để thay thế cho điều tra toàn bộ trong trường hợp đối tượng nghiên cứu cho phép vừa có thể điều tra toàn bộ vừa có thể điều tra chọn mẫu hoặc với những trường hợp không cho phép điều tra toàn bộ, hoặc do quy mô điều tra toàn bộ quá lớn, cần thu thập nhiều chỉ tiêu nhưng không đủ kinh phí và nhân lực để tiến hành điều tra toàn bộ.  Kết hợp với điều tra toàn bộ để mở rộng nội dung điều tra và đánh giá kết quả của điều tra toàn bộ.  Sử dụng để tổng hợp nhanh tài liệu của điều tra toàn bộ phục vụ kịp thời yêu cầu thông tin cho các đối tượng sử dụng.  Sử dụng trong trường hợp muốn so sánh các hiện tượng với nhau hoặc muốn đưa ra một nhận định nào đó mà chưa có tài liệu cụ thể (để kiểm tra giả thuyết thống kê). 11
  12. 3.1.3. SAI SỐ TRONG ĐIỀU TRA CHỌN MẪU • Sai số trong điều tra thống kê là chênh lệch giữa giá trị thu được qua điều tra và giá trị thực tế của nó. → là vấn đề không thể tránh khỏi trong các cuộc điều tra. → gây ảnh hưởng đến độ tin cậy của kết quả điều tra. • Có hai loại sai số trong điều tra thống kê:  Sai số phi chọn mẫu, xảy ra ở tất cả các cuộc điều tra. Nguyên nhân: xác định sai mục đích, xác định đối tượng điều tra không phù hợp, đơn vị điều tra không trả lời hoặc trả lời sai, lỗi trong bảng hỏi, điều tra viên… → Nếu sai số là ngẫu nhiên thì khi điều tra một số lớn đơn vị, các sai số sẽ bù trừ cho nhau. Nếu sai số có hệ thống thì càng điều tra nhiều đơn vị, sai số càng lớn.  Sai số chọn mẫu, chỉ xảy ra trong điều tra chọn mẫu. Đó là sự khác biệt giữa giá trị ước lượng của mẫu và giá trị của tổng thể chung. Sai số chọn mẫu còn gọi là sai số do tính đại biểu, xảy ra do mẫu điều tra không đại diện cho tổng thể chung. → Do sai số phi chọn mẫu không tính được nên phần dưới đây chỉ đề cập tới sai số chọn mẫu. 12
  13. 3.1.3. SAI SỐ TRONG ĐIỀU TRA CHỌN MẪU • Các nhân tố tác động đến sai số chọn mẫu, gồm có:  Số đơn vị tổng thể mẫu n: Khi số đơn vị điều tra tăng lên, tổng thể mẫu sẽ gần với tổng thể chung, sai số chọn mẫu sẽ giảm.  Phương pháp tổ chức chọn mẫu: Các phương pháp chọn mẫu khác nhau, tính đại diện của mẫu chọn ra khác nhau sẽ dẫn đến những sai số chọn mẫu khác nhau.  Độ đồng đều của tổng thể chung: nếu tổng thể có độ đồng đều cao tức phương sai tổng thể 2 tương đối nhỏ thì sai số chọn mẫu sẽ nhỏ. • Sai số chọn mẫu không phải là một trị số cố định. Với cùng một hiện tượng nhưng nếu tiến hành điều tra nhiều lần với các cách chọn mẫu khác nhau, kết cấu của tổng thể mẫu khác nhau thì sẽ có các sai số chọn mẫu khác nhau. • Giá trị của sai số chọn mẫu ảnh hưởng rất nhiều đến ước lượng khoảng tin cậy của các tham số. 13
  14. 3.2. ƯỚC LƯỢNG SỐ TRUNG BÌNH VÀ TỶ LỆ TỪ KẾT QUẢ ĐIỀU TRA CHỌN MẪU 3.2.1. Các yếu tố của ước lượng 3.2.2. Ước lượng số trung bình của tổng thể chung 3.2.3. Ước lượng tỷ lệ của tổng thể chung 3.2.4. Xác định cỡ mẫu điều tra 14
  15. 3.2.1. CÁC YẾU TỐ CỦA ƯỚC LƯỢNG Ước lượng khoảng tin cậy là xác định một khoảng giá trị mà tham số của tổng thể chung rơi vào đó với xác suất nhất định. • Khoảng giá trị này gọi là khoảng tin cậy, được xác định bởi hai giới hạn: giới hạn tin cậy dưới và giới hạn tin cậy trên. Thống kê mẫu Khoảng tin cậy Giới hạn tin cậy dưới Giới hạn tin cậy trên • Độ tin cậy là xác suất để tham số của tổng thể chung rơi vào trong khoảng tin cậy đó, được ký hiệu là (1-α) %, chẳng hạn 90%, 95%, 99%... → α chính là xác suất để tham số của tổng thể chung không rơi vào trong khoảng tin cậy. 15
  16. 3.2.2. ƯỚC LƯỢNG SỐ TRUNG BÌNH CỦA TỔNG THỂ CHUNG • Trường hợp đã biết phương sai của tổng thể chung (2)  Điều kiện: tổng thể chung phân phối chuẩn. Trong trường hợp không phân phối chuẩn, phải sử dụng mẫu lớn.  Khoảng tin cậy ước lượng cho số trung bình của tổng thể chung là: x x    x x Trong đó:  x là sai số chọn mẫu (sampling error) khi ước lượng số trung bình của tổng thể chung.   x  z  / 2 . x  z  / 2 n • Trường hợp chưa biết phương sai của tổng thể chung (2).  Điều kiện: áp dụng khi tổng thể chung phân bố chuẩn và sử dụng phân vị Student.  Khoảng tin cậy ước lượng cho số trung bình của tổng thể chung là: x x    x x Trong đó:  x là sai số chọn mẫu khi ước lượng số trung bình của tổng thể chung. s x  t  / 2,(n1) .x  t  / 2,(n1) n 16
  17. 3.2.2. ƯỚC LƯỢNG SỐ TRUNG BÌNH CỦA TỔNG THỂ CHUNG Ví dụ: Một mẫu gồm 20 nhân viên được tiến hành điều tra nhằm thu thập thông tin liên quan đến một chương trình đào tạo. Người ta tính được thời gian trung bình để hoàn tất chương trình của 20 nhân viên này là 51,5 ngày với độ lệch tiêu chuẩn là 6,84 ngày. Hãy ước lượng thời gian trung bình để hoàn tất chương trình với độ tin cậy 95%. • Do chưa biết phương sai của tổng thể chung nên sẽ dùng phương sai của tổng thể mẫu để ước lượng. • Tra bảng t-Student với mức ý nghĩa 0,05 và 19 bậc tự do, t0,025;19 = 2,093. • Công thức ước lượng:  6,84  51,5  2, 093.   hay 51,5  3, 2  20  • Kết luận: Với mẫu đã cho, khoảng tin cậy 95% cho thời gian trung bình để hoàn tất chương trình là: 48,3    54, 7 (ngày) 17
  18. 3.2.3. ƯỚC LƯỢNG TỶ LỆ CỦA TỔNG THỂ CHUNG • Theo tiêu thức nghiên cứu, tổng thể chỉ có 2 loại biểu hiện. Khi đó tổng thể chung có phân phối nhị thức. Phân phối xấp xỉ chuẩn được sử dụng. • Với mẫu đủ lớn (n.p  5 và n(1-p)  5), công thức ước lượng khoảng tin cậy cho tỷ lệ của tổng thể chung như sau: f  f  p  f  f Trong đó:  f là sai số chọn mẫu khi ước lượng tỷ lệ của tổng thể chung. f (1  f ) f  z / 2 . n  z/2 là giá trị tới hạn của phân phối chuẩn. 18
  19. 3.2.4. XÁC ĐỊNH CỠ MẪU ĐIỀU TRA Cơ sở xác định cỡ mẫu: • Sai số chọn mẫu là nhỏ nhất. • Chi phí điều tra là thấp nhất. → Đây là hai yêu cầu đối lập nhau → Khi xác định cỡ mẫu thường dựa vào độ chính xác trong ước lượng. • Cỡ mẫu được xác định khi ước lượng số trung bình là: Z 2/2 2 n  2x Ví dụ: Cỡ mẫu là bao nhiêu để khoảng tin cậy 90% khi ước lượng số trung bình nằm trong phạm vi  5. Một nghiên cứu đã cho rằng độ lệch chuẩn là 45. Z 2/ 2  2 1, 6452.452 n   219, 2  220 x 2 5 2 Cỡ mẫu được xác định khi ước lượng tỷ lệ là: Z 2/ 2 p 1  p  n  2f Lưu ý: Cỡ mẫu luôn làm tròn lên. 19
  20. 3.2.4. XÁC ĐỊNH CỠ MẪU ĐIỀU TRA Để xác định cỡ mẫu, cần phải biết 3 yếu tố: • Độ tin cậy mong muốn, được xác định bằng giá trị z/2. • Sai số chọn mẫu có thể chấp nhận được, . • Độ lệch tiêu chuẩn của tổng thể, , là yếu tố thường không biết trong đa phần các trường hợp. Có một số cách để xác định giá trị  này như sau:  Lấy phương sai lớn nhất trong các lần điều tra trước (nếu có).  Lấy phương sai của các hiện tượng khác tương tự (nếu có).  Điều tra thí điểm để tính phương sai.  Có thể ước lượng độ lệch tiêu chuẩn qua khoảng biến thiên tùy theo phân phối của tổng thể. Cụ thể, nếu tổng thể có phân phối chuẩn thì: R xmax  xmin   6 6 20
nguon tai.lieu . vn