Xem mẫu

  1. Bài giảng THỐNG KÊ TRONG NGHIÊN CỨU KHOA HỌC XÃ HỘI Chương 2 THU THẬP VÀ TRÌNH BÀY DỮ LIỆU Nguyễn Công Nhựt Kênh video https://www.youtube.com/c/Toanchobacdaihoc Ngày 30 tháng 10 năm 2021 Nguyen Cong Nhut Thống kê trong nghiên cứu khoa học xã hội Ngày 30 tháng 10 năm 2021 1 / 25
  2. GIỚI THIỆU MÔN HỌC THỐNG KÊ TRONG NGHIÊN CỨU KHOA HỌC XÃ HỘI Hướng dẫn cách học - chi tiết cách đánh giá môn học Tài liệu, video bài giảng được đưa lên elearning hàng tuần. Sinh viên tải về, in ra và mang theo khi học. Điểm tổng kết môn học được đánh giá xuyên suốt quá trình học Điểm quá trình: 40% Thi cuối kỳ: 60% Thi tự luận, 60 phút Cán bộ giảng dạy ThS Nguyễn Công Nhựt Nguyen Cong Nhut Thống kê trong nghiên cứu khoa học xã hội Ngày 30 tháng 10 năm 2021 2 / 25
  3. Content 1 CÁC KHÁI NIỆM CƠ BẢN TRONG THỐNG KÊ 2 THU THẬP VÀ TRÌNH BÀY DỮ LIỆU Bài 1 NGUỒN DỮ LIỆU Bài 2 TRÌNH BÀY DỮ LIỆU 3 TÓM TẮT DỮ LIỆU 4 PHÂN PHỐI MẪU 5 ƯỚC LƯỢNG CHO MỘT THAM SỐ THỐNG KÊ 6 KIỂM ĐỊNH GIẢ THUYẾT CHO MỘT THAM SỐ THỐNG KÊ 7 HỒI QUY VÀ TƯƠNG QUAN Nguyen Cong Nhut Thống kê trong nghiên cứu khoa học xã hội Ngày 30 tháng 10 năm 2021 3 / 25
  4. Content 1 CÁC KHÁI NIỆM CƠ BẢN TRONG THỐNG KÊ 2 THU THẬP VÀ TRÌNH BÀY DỮ LIỆU Bài 1 NGUỒN DỮ LIỆU Bài 2 TRÌNH BÀY DỮ LIỆU 3 TÓM TẮT DỮ LIỆU 4 PHÂN PHỐI MẪU 5 ƯỚC LƯỢNG CHO MỘT THAM SỐ THỐNG KÊ 6 KIỂM ĐỊNH GIẢ THUYẾT CHO MỘT THAM SỐ THỐNG KÊ 7 HỒI QUY VÀ TƯƠNG QUAN Nguyen Cong Nhut Thống kê trong nghiên cứu khoa học xã hội Ngày 30 tháng 10 năm 2021 4 / 25
  5. THU THẬP VÀ TRÌNH BÀY DỮ LIỆU NỘI DUNG Nguyen Cong Nhut Thống kê trong nghiên cứu khoa học xã hội Ngày 30 tháng 10 năm 2021 5 / 25
  6. THU THẬP VÀ TRÌNH BÀY DỮ LIỆU NỘI DUNG 1-1 Nguồn dữ liệu 1-2 Cách trình bày một mẫu cụ thể Nguyen Cong Nhut Thống kê trong nghiên cứu khoa học xã hội Ngày 30 tháng 10 năm 2021 5 / 25
  7. Bài 1 NGUỒN DỮ LIỆU NỘI DUNG Nguyen Cong Nhut Thống kê trong nghiên cứu khoa học xã hội Ngày 30 tháng 10 năm 2021 6 / 25
  8. 2.1 Dữ liệu thứ cấp (Secondary data) Dữ liệu thứ cấp là các thông tin đã có sẵn và có thể thu thập từ các nguồn sau: a) Số liệu nội bộ là loại số liệu đã được ghi chép và cập nhật trong đơn vị hoặc được thu thập từ các cuộc điều tra trước đây. b) Số liệu từ các ấn phẩm của nhà nước: các dữ liệu do các cơ quan thống kê nhà nước phát hành định kỳ như niên giám thống kê, ... c) Báo, tạp chí chuyên ngành: các báo và tập chí đề cập đến vấn đề có tính chất chuyên ngành như tạp chí thống kê, ... d) Thông tin của các tổ chức, hiệp hội nghề nghiệp: Viện nghiên cứu kinh tế, phòng thương mại, ... e) Các công ty tổ chức thu thập thông tin, nghiên cứu và cung cấp thông tin theo yêu cầu. Số liệu thứ cấp có ưu điểm là ít tốn kinh phí, số liệu được cập nhật kịp thời. Tuy nhiên dữ liệu thứ cấp thường đ¯a qua tổng hợp và xử lý nên ít sử dụng cho dự báo thống kê. Nguyen Cong Nhut Thống kê trong nghiên cứu khoa học xã hội Ngày 30 tháng 10 năm 2021 7 / 25
  9. 2.2 Dữ liệu sơ cấp (Primary data) Dữ liệu sơ cấp là các thông tin thu thập từ các cuộc điều tra. Căn cứ vào phạm vi điều tra có thể chia làm hai loại: điều tra toàn bộ và điều tra chọn mẫu. Điều tra toàn bộ là tiến hành thu thập thông tin trên tất cả các đơn vị thuộc tổng thể nghiên cứu. Mặc dù, điều tra toàn bộ cung cấp tất cả thông tin về đơn vị tổng thể nhưng việc tiến hành điều tra rất tốn thời gian, khi phí và một số trường hợp do thời gian kéo dài nên số liệu kém chính xác do hiện tượng biến động theo thời gian; đôi khi phá vơ tổng thể nghiên cứu. Điều tra chọn mẫu là từ tổng thể ta lấy một số phần từ đại diện cho tổng thể và tính những đặc trưng cơ bản của nó và từ đó dùng phương pháp thống kê để ước lượng cho các tham số của thổng thể. Nguyen Cong Nhut Thống kê trong nghiên cứu khoa học xã hội Ngày 30 tháng 10 năm 2021 8 / 25
  10. 2.3 Các phương pháp thu thập thông tin Quan sát trụcc tiếp là phương pháp thu thập dữ liệu bằng mắt và số liệu được người thu thập ghi lại dựa trên những gì bản thân thu thập được trong quá trình đó. Phương pháp gủi thử : Nhân viên điều tra gửi bảng câu hỏi đến đối tượng cung cấp thông tin thông qua đường bưu điện. Phương pháp này có thể thu thập được nhiều thông tin, tiết kiệm chi phí so với các phương pháp khác nhưng tỷ lệ đối tượng trả lời thường rất thấp. Phỏng vấn bằng điện thoại: thu thập thông tin bằng cách phỏng vấn bằng điện thoại. Phương pháp này thu thập thông tin nhanh chóng tuy nhiên rất tốn kém, nội dung thu thập thông tin bị hạn chế. Phỏng vấn trực tiếp thích hợp cho việc điều tra nhiều thông tin, nội dung của thông tin tương đối phức tạp cần thu thập thông tin chi tiết. Thường có hai hình thức Phỏng vấn cá nhân: Nhân viên điều tra tiếp xúc với đối tượng cung cấp thông tin tại nhà riêng hoặc nơi làm việc, thương áp dụng cho các cuộc điều tra chính thức. Phỏng vấn nhóm: Nhân viên điều tra phỏng vấn từng nhóm để thảo luận về một vấn đề nào đó, thường được sử dụng để kiểm tra lại bảng câu hỏi có hoàn chỉnh chưa hoặc cần tìm hiểu về một vấn đề phức tạp cần phải có ý kiến cụ thể của những người am hiểu. Nguyen Cong Nhut Thống kê trong nghiên cứu khoa học xã hội Ngày 30 tháng 10 năm 2021 9 / 25
  11. Bài 2 TRÌNH BÀY DỮ LIỆU NỘI DUNG Nguyen Cong Nhut Thống kê trong nghiên cứu khoa học xã hội Ngày 30 tháng 10 năm 2021 10 / 25
  12. 2.4 Các cách trình bày một mẫu cụ thể 2.4.1 Cách lập bảng tần số cho dữ liệu định tính Để đưa ra quyết định từ dữ liệu dạng thô thường rất khó. Do vậy, ta cần phải tổ chức lại dữ liệu. Ta có hai dạng tổ chức dữ liệu: bảng hoặc đồ thị. Ta s¯e lập bảng phân phối tần số với những thông tin sau: Cột thứ nhất liệt kê tất cả các biểu hiện có thể có của đối tượng theo đặc điểm ta đang muốn lập bảng tần số để tót tắt dữ liệu.| Cột thứ hai là cột tần số được điền số liệu bằng cách đếm xem có bao nhiêu quan sát có cùng một biểu hiện. Tổng của cột tần số phải bằng tổng số quan sát của tập dữ liệu. Cột thứ ba là cột tần suất được tính bằng cách lấy tần số chia cho tổng số quan sát của tập dữ liệu, lấy kết quả nhân với 100% rồi ghi vào cột tần suất tại vị trí tương ứng cùng hàng nhằm so sánh với tổng số quan sát thì số đơn vị có cùng biểu hiện chiếm bao nhiêu %. Tổng cột tần suất đúng bằng 100%. Nguyen Cong Nhut Thống kê trong nghiên cứu khoa học xã hội Ngày 30 tháng 10 năm 2021 11 / 25
  13. 2.4.2 Cách lập bảng tần số cho dữ liệu định lượng Đối với dữ liệu định lượng mà đặc điểm quan tâm có ít biểu hiện Các trình bày c¯ung giống như cách trình bày cho dữ liệu định tính, lúc này mỗi giá trị xem như là một biểu hiện. Giả sử một mẫu cụ thể (x1 , x2 , . . . , x ) có: k +x1 có n1 giá trị, x2 có n2 giá trị, . . . , x có n giá trị. +x1 < x2 < · · · < x và k k k n1 + n2 + · · · + n = n Ta có thể mô tả dữ liệu bằng bảng phân phối tần số như sau: k Hình Nguyen Cong Nhut Thống kê trong nghiên cứu khoa học xã hội Ngày 30 tháng 10 năm 2021 12 / 25
  14. 2.4.2 Cách lập bảng tần số cho dữ liệu định lượng Để có được nhiều thông tin hơn khi đọc bảng phân phối tần số thì người ta thêm vào cột tần số tích l¯ uy, tần suất và tần suất tích l¯ uy. Hình Nguyen Cong Nhut Thống kê trong nghiên cứu khoa học xã hội Ngày 30 tháng 10 năm 2021 13 / 25
  15. 2.4.2 Cách lập bảng tần số cho dữ liệu định lượng Điều tra thời gian đợi phục vụ của khách hàng tại một cửa hàng (đơn vị: phút). Người ta chọn ngẫu nhiên 10 người, kết quả thu được như sau: 4, 5, 5, 7, 8, 7, 8, 7, 9, 9. Hình Nguyen Cong Nhut Thống kê trong nghiên cứu khoa học xã hội Ngày 30 tháng 10 năm 2021 14 / 25
  16. 2.4.2 Cách lập bảng tần số cho dữ liệu định lượng Đối với dữ liệu định lượng mà đặc điểm quan tâm có nhiều biểu hiện Đối với dữ liệu có nhiều biểu hiện thì việc liệt kê từng biểu hiện giống như trên không còn phù hợp mà bảng tần số khá dài dòng. Để thuận tiện người ta tiến hành phân tổ dự liệu. Phưng pháp phân tổ dũ liệu - Các tổ không được trùng nhau, một quan sát bất kỳ chỉ thuộc về một tổ - Tất cả các tổ được phân chia phải đảm bảo bao quát hết tất cả các giá trị hiện có của tập dữ liệu - Tránh không để tổ rỗng do không có quan sát nào thuộc về tổ. Tham khảo các bước thực hiện phân tổ Q Xác định số tổ cần chia k (không có quy định chính xác về số tổ cần chia là bao nhiêu nhưng theo kinh nghiệm người ta thấy nên chia từ 5 đến 15 tổ). Công thức phân chia số tổ 1 k = (2 × n ) 3 Nguyen Cong Nhut Thống kê trong nghiên cứu khoa học xã hội Ngày 30 tháng 10 năm 2021 15 / 25
  17. 2.4.2 Cách lập bảng tần số cho dữ liệu định lượng Chú ý: nếu số lẻ thì phải làm tròn. Xác định khoảng cách tổ xmax − xmin h= k Trong đó: xmax là giá trị lớn nhất của tập dữ liệu xmin là giá trị nhỏ nhất của tập dữ liệu Nguyen Cong Nhut Thống kê trong nghiên cứu khoa học xã hội Ngày 30 tháng 10 năm 2021 16 / 25
  18. 2.4.2 Cách lập bảng tần số cho dữ liệu định lượng k số tổ cần chia Tổ thứ nhất: (xmin ; xmin + h ) Tổ thứ hai: (x + h ; xmin + 2h ) min Đếm các giá trị quan sát vào tổ. Trường hợp giá trị bằng đúng cận trên của tổ thì ta xếp giá trị đó vào tổ kế tiếp, tức là cận dưới ≤ x < cận trên i Để đơn giản ta có thể lập bảng phân phối tần số như sau: Mỗi nhóm (lớp) có bề rộng bằng nhau, nhất − Giá trị bé nhất Bề rộng của mỗi nhóm được xác định bởi, Giá trị lớn Số khoảng cần chia Tối thiểu là 5 khoảng, nhưng không nhiều hơn 15 khoảng, Các khoảng không trùng nhau. Nguyen Cong Nhut Thống kê trong nghiên cứu khoa học xã hội Ngày 30 tháng 10 năm 2021 17 / 25
  19. 2.4.2 Cách lập bảng tần số cho dữ liệu định lượng Chọn ngẫu nhiên 20 ngày mùa đông có nhiệt độ cao và đo nhiệt độ (đơn vị: độ F ) được số liệu như sau: 24 35 17 21 24 37 26 46 58 30 32 13 12 38 41 43 44 27 53 27 H¯ay lập bảng phân phối tần số cho số liệu này. Các bước thực hiện: - Sắp xếp dữ liệu theo thứ tự tăng dần 12, 13, 17, 21, 24, 24, 26, 27, 27, 30, 32, 35, 37, 38, 41, 43, 44, 46, 53, 58 - Xác định miền dữ liệu (range): 58 − 12 = 46 - Chọn số khoảng cần chia: 5 (thông thường từ 5 đến 15 ) - Xác định độ rộng của khoảng: 10 (làm tròn 46/5 ) - Xác định biên của các khoảng: từ 10 đến dưới 20 , từ 20 đến dưới 30, . . ., từ 50 đến dưới 60 . - Đếm số giá trị của dữ liệu nằm trong mỗi khoảng Nguyen Cong Nhut Thống kê trong nghiên cứu khoa học xã hội Ngày 30 tháng 10 năm 2021 18 / 25
  20. 2.4.2 Cách lập bảng tần số cho dữ liệu định lượng Hình Nguyen Cong Nhut Thống kê trong nghiên cứu khoa học xã hội Ngày 30 tháng 10 năm 2021 19 / 25
nguon tai.lieu . vn