Xem mẫu

  1. PHƯƠNG PHÁP NGHIÊN CỨU KHOA HỌC Giảng viên: TS. Phan Thế Công 11 v1.0015108208
  2. BÀI 5 PHƯƠNG PHÁP XỬ LÍ DỮ LIỆU Giảng viên: TS. Phan Thế Công v1.0015108208 2
  3. MỤC TIÊU CỦA BÀI • Phân biệt được thông tin định tính và định lượng. • Phân tích và xử lí được các thông tin định tính và định lượng hợp lí cho từng loại đề tài nghiên cứu. v1.0015108208 3
  4. CÁC KIẾN THỨC CẦN CÓ Để học tốt bài học này, người học cần có những kiến thức cơ bản của các môn học sau: • Kiến thức của giai đoạn học phổ thông như: lịch sử, văn học, toán học, địa lí... • Kiến thức về xác suất và thống kê toán; • Các kiến thức và kĩ năng cơ bản về tin học văn phòng. v1.0015108208 4
  5. HƯỚNG DẪN HỌC • Đọc tài liệu là bài giảng, giáo trình và các tài liệu tham khảo trước lúc nghe giảng, trước lúc thực hành. • Nghe và đọc thêm các thông tin mới trên các phương tiện thông tin truyền thông, sách báo, tạp chí chuyên ngành. • Thảo luận với sinh viên và giáo viên trên diễn đàn và thông qua hệ thống H2472. v1.0015108208 5
  6. CẤU TRÚC NỘI DUNG 5.1 Các khái niệm cơ bản 5.2 Xử lí thông tin định lượng 5.3 Xử lí thông tin định tính v1.0015108208 6
  7. 5.1. CÁC KHÁI NIỆM CƠ BẢN Tóm lược các loại biến cố Loại biến số Định nghĩa Các hình thức thể hiện khác Một biến số được đo lường để xác định • Biến thành quả (Outcome) Phụ thuộc sự tác động (treatment) hay thay đổi • Biến kết quả (Result) (Dependent) (manipulation) của biến độc lập như thế nào. • Biến tiêu chí (Criterion) • Tác động (treatment) Độc lập Một biến số được thay đổi để xác định • Yếu tố (Factor) (Independent) ảnh hưởng của nó đối với biến phụ thuộc. • Biến dự đoán (Predictor) Kiểm soát Một biến số có quan hệ với biến phụ thuộc, mà sự ảnh hưởng của nó cần phải • Biến giới hạn (Restricting) (Comtrol) được loại bỏ. Một biến số có quan hệ với biến phụ Ngoại vi thuộc hoặc biến độc lập, không phải là • Biến đe dọa (Threatening) (Extraneous) mục tiêu nghiên cứu. Một biến số có quan hệ với biến phụ Điều tiết • Biến tương tác (Interacting thuộc hoặc biến độc lập và có ảnh hưởng (Moderator) variable) đến biến phụ thuộc. v1.0015108208 7
  8. 5.2. XỬ LÍ THÔNG TIN ĐỊNH LƯỢNG 5.2.1. Các loại thang đo 5.2.4. Đo lường trong phân tích dữ liệu khuynh hướng tập trung 5.2.2. Độ tin cậy 5.2.5. Kiểm tra T-mẫu độc lập (T-test) 5.2.3. Xử lí dữ liệu 5.2.6. Phân tích phương sai một hướng (one-way anova) 5.2.7. Xây dựng mô hình hồi quy v1.0015108208 8
  9. 5.2.1. CÁC LOẠI THANG ĐO TRONG PHÂN TÍCH DỮ LIỆU Thang đo đa phương (mutiple items scale): Thang Likert Thang nhân tố (itemized category) Thang so sánh (comparative scale) Thang đo đơn phương Thang thứ hạng (rank order scale) (single item scale) Thang tổng (sum scale) Thang hình ảnh (pictorial scale) Thang đo đa phương Thang Likert (mutiple item scale) v1.0015108208 9
  10. 5.2.1. CÁC LOẠI THANG ĐO TRONG PHÂN TÍCH DỮ LIỆU (tiếp theo) a. Thang đo đơn phương • Dùng khi thuộc tính cần đo chỉ có thể thể hiện một phương (dimensionality)  Chiều cao (cao, thấp)  Cân nặng (nặng, nhẹ)  Kính trọng (nhiều, ít) • Có thể dùng để so sánh. Thang nhân tố Biti’s là công ty Rất Hoàn toàn không sáng tạo sáng tạo 1 2 3 4 5 6 7 Nhân tố đo lường: Tính sáng tạo! v1.0015108208 10
  11. 5.2.1. CÁC LOẠI THANG ĐO TRONG PHÂN TÍCH DỮ LIỆU (tiếp theo) Thang đo so sánh So với Bita’s, Biti’s là Ít sáng tạo Sáng tạo Sáng tạo hơn tương đương nhiều hơn 1 2 3 4 5 6 7 Nhân tố đo lường: Tính sáng tạo! Thang đo thứ hạng (rank order) Ví dụ: Hãy chỉ ra mức độ yêu thích âm nhạc của bạn, với 1 là thích nhất, 2 là thích thứ nhì… cho mỗi loại âm nhạc dưới đây • Nhạc trẻ; • Quan họ; • Cải lương; • Ca trù; • Hát bội. v1.0015108208 11
  12. 5.2.1. CÁC LOẠI THANG ĐO TRONG PHÂN TÍCH DỮ LIỆU (tiếp theo) Thang tổng Bạn có 100 điểm (trọng số) để phân phối vào các khía cạnh khác nhau của nhà hàng: • Khung cảnh • Giá • Dịch vụ • Chất lượng thức ăn 100 điểm v1.0015108208 12
  13. 5.2.1. CÁC LOẠI THANG ĐO TRONG PHÂN TÍCH DỮ LIỆU (tiếp theo) b. Thang đo đa phương • Khi thuộc tính cần đo có thể có nhiều thành tố cùng một lúc:  Ví dụ: Năng lực làm việc thể hiện qua nhiều thành tố (item) như:  Điểm số học tập;  Thông minh (IQ);  Khả năng cảm xúc (EQ). • Một trả lời sẽ không thể hiện hết hoặc thể hiện không đúng nội dung cần đo. Thang đo tổng thể (summated) • Thang Likert: Cách đo lường dựa vào mức độ “đồng ý” và không đồng ý về các nội dung muốn xem xét. • Phần lớn được dùng nghiên cứu động thái của tổ chức. v1.0015108208 13
  14. 5.2.2. ĐỘ TIN CẬY • Đó là mức độ nhất quán hay ổn định của công cụ đo. • 3 cách ước lượng:  Dùng chỉ số Cronbatch alfa (chấp nhận khi chỉ số  > 0.7).  Kiểm tra và tái kiểm tra: Dùng một công cụ đo và đo 2 lần trên một nhóm khảo sát. Chỉ số tương quan của kết quả sẽ thể hiện độ tin cậy của công cụ đo.  Mẫu tương đương (Equivalent forms): Lập 2 mẫu đo lường khác nhau nhưng đo cùng một hiện tượng. Chỉ số tương quan giữa 2 mẫu sẽ thể hiện độ tin cậy của công cụ đo. v1.0015108208 14
  15. 5.2.3. XỬ LÍ DỮ LIỆU • Mục tiêu: giúp sinh viên biết cách:  Nhập liệu;  Làm sạch số liệu;  Thực hiện thống kê mô tả;  Kiểm định T-tests, ANOVA;  Tương quan, hồi quy. • Dữ liệu vừa thu thập thường chưa được tổ chức tốt vì:  Có thể có giá trị khuyết tức bị mất (missing);  Có thể câu trả lời không phù hợp;  Có thể nhập liệu sai. • Ta cần xử lí dữ liệu (có thể dùng phần mềm thống kê SPSS)  Phân tích mô tả (Descriptive analysis)  Xác định trung bình “Mean” của từng biến số;  Xem kết quả có bất thường không. Nếu có thì sửa chữa lại số liệu cho đúng. • Cách làm: Analyse  Descriptive Statistics  Frequencies v1.0015108208 15
  16. 5.2.4. ĐO LƯỜNG KHUYNH HƯỚNG TẬP TRUNG • Số bình quân mẫu (Mean) thường được dùng với vai trò ước lượng xu hướng trung tâm chẳng hạn số bình quân của tổng thể chung. Số bình quân theo nghĩa thông thường, được gọi chính xác hơn là số bình quân số học để phân biệt với số bình quân nhân hay số bình quân điều hòa. Nó còn được gọi là số bình quân của mẫu. • Số trung vị (Median) là một số tách giữa nửa lớn hơn và nửa bé hơn của một mẫu, một quần thể, hay một phân bố xác suất. Nó là giá trị giữa trong một phân bố, mà số các số nằm trên hay dưới con số đó là bằng nhau. Điều đó có nghĩa rằng 1/2 quần thể sẽ có các giá trị nhỏ hơn hay bằng số trung vị, và một nửa quần thể sẽ có giá trị bằng hoặc lớn hơn số trung vị. • Mốt (Mode) của một danh sách dữ liệu là giá trị của phần tử có số lần xuất hiện lớn nhất trong danh sách. Ví dụ, mode của {1, 3, 6, 6, 6, 7, 7, 12, 12, 17} là 6. Khác với số bình quân số học giản đơn, mode không nhất thiết phải là duy nhất. Mode đặc biệt hữu dụng khi các giá trị của các quan sát không có thứ tự dễ thấy (thường khi dữ liệu không phải là số) do các số bình quân và số trung vị có thể không được xác định. Ví dụ, mode của {táo, táo, chuối, cam, cam, cam, đào} là cam. v1.0015108208 16
  17. 5.2.4. ĐO LƯỜNG KHUYNH HƯỚNG TẬP TRUNG Khi nào thì sử dụng các số đo này? Số đo Mức đo Khi sử dụng Ví dụ Mốt (Mode) Số mệnh danh Dữ liệu dưới dạng Màu mắt, hình thức hợp phân loại. đồng, giới tính. Trung vị Số thứ tự Dữ liệu bao gồm các Phân hạng trong lớp, thứ (Median) giá trị cực biên. tự lúc sinh. Trung bình Miền và tỉ lệ Dữ liệu phù hợp. Tốc độ trả lời, tuổi, mức (Mean) độ thích. v1.0015108208 17
  18. 5.2.5. KIỂM TRA T-MẪU ĐỘC LẬP (T-TEST) • Quy trình kiểm tra T-mẫu độc lập so sánh trung bình của 2 nhóm.  Đối tượng cần được phân bổ vào 2 nhóm một cách ngẫu nhiên, vì vậy sự khác biệt có được là do tác động (hay không chịu tác động) mà không phải do sự ảnh hưởng của yếu tố khác. Chẳng hạn nếu so sánh thu nhập bình quân giữa nam và nữ không phù hợp với loại kiểm tra này.  Một người không được phân công ngẫu nhiên thành nam hay nữ. Trong tình huống như vậy, bạn nên bảo đảm rằng sự khác biệt ở các yếu tố khác không làm tăng cường hay giảm nhẹ sự khác biệt đáng kể của trung bình.  Khác biệt về thu nhập bình quân có thể chịu ảnh hưởng bởi các yếu tố như học vấn, chứ không chỉ chịu ảnh hưởng của giới tính. • Quy trình kiểm tra T một mẫu xác định xem trung bình của một biến nào đó có khác so với một hằng số cho trước hay không. Ví dụ: Một nhà sản xuất thực phẩm muốn kiểm tra các hộp thực phẩm của mình có trọng lượng trung bình khác với 300 gram, với mức tin cậy là 95%. v1.0015108208 18
  19. 5.2.6. PHÂN TÍCH PHƯƠNG SAI MỘT HƯỚNG (ONE-WAY ANOVA) • Quy trình phân tích phương sai một hướng là lối phân tích phương sai của biến phụ thuộc bởi một biến số đơn (biến độc lập). • Phân tích phương sai được dùng để kiểm tra giả thuyết rằng nhiều trung bình là bằng nhau. Đây là một kĩ thuật mở rộng của phương pháp kiểm tra T hai mẫu độc lập. • Bên cạnh việc xác định sự khác biệt giữa các trung bình, bạn cũng đôi khi muốn xác định xem trung bình nào là khác biệt. • Có 2 loại kiểm tra để so sánh trung bình:  Đối chiếu ưu tiên là lối kiểm tra tiến hành trước khi tiến hành thực nghiệm;  Kiểm tra hậu kì là lối kiểm tra tiến hành sau khi thực nghiệm. • Bạn cũng có thể kiểm tra khuynh hướng thay đổi trên nhiều phân loại khác nhau. Ví dụ: Mức độ tiếp thu bài giảng của học sinh thay đổi khác nhau. Một thực nghiệm tiến hành với 3 môn học khác nhau: Toán, Lí và Văn. Toán, Lí là môn khoa học suy luận và Văn là môn diễn đạt. • Bên cạnh tiến hành kiểm tra mức độ tiếp thu bài giảng tùy thuộc vào loại môn giảng, bạn cũng có thể xác định mức độ tiếp thu khác biệt giữa các môn suy luận và môn diễn đạt. v1.0015108208 19
  20. 5.2.7. XÂY DỰNG MÔ HÌNH HỒI QUY • Phân tích hồi quy là một phân tích thống kê để xác định xem các biến độc lập (biến thuyết minh) quy định các biến phụ thuộc (biến được thuyết minh) như thế nào. • Đây là một phương pháp thống kê mà giá trị kì vọng của một hay nhiều biến ngẫu nhiên được dự đoán dựa vào điều kiện của các biến ngẫu nhiên khác. • Phân tích hồi quy không chỉ là trùng khớp đường cong (lựa chọn một đường cong mà vừa khớp nhất với một tập điểm dữ liệu); nó còn phải trùng khớp với một mô hình với các thành phần ngẫu nhiên và xác định. • Hồi quy thường được xếp vào loại bài toán tối ưu vì chúng ta nỗ lực để tìm kiếm một giải pháp để cho sai số và phần dư là tốt nhất. Phương pháp sai số chung nhất được sử dụng là phương pháp bình phương cực tiểu: Phương pháp này tương ứng với một hàm hợp lí dạng Gauss của các dữ liệu quan sát khi biết biến ngẫu nhiên (ẩn). Về một mặt nào đó, bình phương cực tiểu là một phương pháp ước lượng tối ưu: Xem định lí Gauss-Markov. v1.0015108208 20
nguon tai.lieu . vn