Xem mẫu

  1. BỘ GIÁO DỤC VÀ ĐÀO TẠO TRƯỜNG ĐẠI HỌC SƯ PHẠM TP. HỒ CHÍ MINH KHOA VẬT LÝ KIM VĂN THANH KHÓA LUẬN TỐT NGHIỆP SỬ DỤNG PHẦN MỀM XỬ LÝ SỐ LIỆU SPSS VÀ R TRONG NGHIÊN CỨU VỀ KHOA HỌC GIẢNG DẠY VẬT LÝ Chuyên ngành: Sư phạm Vật lý TP. Hồ Chí Minh, năm 2020
  2. BỘ GIÁO DỤC VÀ ĐÀO TẠO TRƯỜNG ĐẠI HỌC SƯ PHẠM TP. HỒ CHÍ MINH KHOA VẬT LÝ SỬ DỤNG PHẦN MỀM XỬ LÝ SỐ LIỆU SPSS VÀ R TRONG NGHIÊN CỨU VỀ KHOA HỌC GIẢNG DẠY VẬT LÝ Người thực hiện: Kim Văn Thanh Người hướng dẫn khoa học: ThS. Tô Thị Hoàng Lan TP. Hồ Chí Minh, năm 2020
  3. i LỜI CẢM ƠN Trong suốt thời gian học tập và hoàn thành khóa luận tốt nghiệp, với sự cố gắng nỗ lực của bản thân, tôi đã nhận được sự giúp đỡ, hướng dẫn tận tình của nhiều cá nhân và tập thể. Cho phép tôi được tỏ lòng biết ơn và gửi lời cảm ơn chân thành tới: Ban Giám hiệu Trường Đại học Sư phạm Thành phố Hồ Chí Minh cùng toàn thể cán bộ quản lý và giảng viên của Trường nói chung và của Khoa Vật lý nói riêng. Với sự giúp đỡ, tạo điều kiện của nhà Trường, tôi đã có một môi trường thuận lợi để học tập, nghiên cứu và tiếp thu kiến thức cho bản thân. Đặc biệt, tôi xin bày tỏ lòng biết ơn sâu sắc tới giảng viên hướng dẫn ThS. Tô Thị Hoàng Lan đã tận tình hướng dẫn, giúp đỡ, quan tâm và động viên tôi trong quá trình tìm hiểu và xây dựng khóa luận tốt nghiệp. Xin chân thành cảm ơn các tác giả của các tài liệu tham khảo mà tôi đã trích dẫn trong khóa luận của mình. Đặc biệt là GS. Nguyễn Văn Tuấn bởi những bài giảng cùng sự tư vấn, giải đáp các khó khăn, khúc mắc mà tôi gặp phải trong quá trình tìm hiểu về phần mềm R. Xin chân thành cảm ơn sự nhận xét và góp ý tận tình của ThS. Lê Hải Mỹ Ngân, TS. Phan Thị Ngọc Loan, cùng sự giúp đỡ của bạn Nguyễn Thị Thảo Trang đã giúp tôi hoàn thành sản phẩm cho khóa luận. Tôi xin chân thành cảm ơn bạn Phan Thanh Trà đã luôn đồng hành, giúp đỡ, nhận xét và góp ý để giúp tôi hoàn thành khóa luận. Cuối cùng, nhân dịp hoàn thành khóa luận tốt nghiệp, cho phép tôi được gửi lời cảm ơn sâu sắc tới gia đình, người thân cùng bạn bè đã hỗ trợ, động viên, giúp đỡ và tạo điều kiện thuận lợi cho tôi vượt qua mọi khó khăn trong quá trình học tập kiến thức, tìm hiểu và xây dựng khóa luận tốt nghiệp này. TP. Hồ Chí Minh, tháng 06 năm 2020 Tác giả Kim Văn Thanh
  4. ii DANH MỤC CÁC TỪ VIẾT TẮT Ký hiệu Ý nghĩa XSTK Xác suất thống kê VD Ví dụ
  5. iii MỤC LỤC LỜI CẢM ƠN ................................................................................................... i DANH MỤC CÁC TỪ VIẾT TẮT ................................................................ ii MỤC LỤC ....................................................................................................... iii DANH MỤC BẢNG BIỂU ..............................................................................1 DANH MỤC HÌNH ẢNH ................................................................................2 PHẦN MỞ ĐẦU ...............................................................................................5 1. Lý do chọn đề tài ...............................................................................................5 2. Tổng quan nghiên cứu.......................................................................................5 3. Định hướng nghiên cứu của đề tài ....................................................................8 3.1. Mục tiêu đề tài ............................................................................................8 3.2. Câu hỏi nghiên cứu ....................................................................................8 4. Phương pháp, đối tượng nghiên cứu .................................................................8 4.1. Phương pháp nghiên cứu ............................................................................8 4.2. Đối tượng nghiên cứu.................................................................................9 5. Cấu trúc khóa luận ............................................................................................9 CHƯƠNG 1. SỬ DỤNG PHẦN MỀM SPSS ...............................................11 1. Giới thiệu phần mềm SPSS .............................................................................11 1.1. Lịch sử hình thành và phát triển ...............................................................11 1.2. Khả năng của SPSS ..................................................................................11 1.3. Giao diện ..................................................................................................12 1.4. Khai báo biến ...........................................................................................12 1.5. Nhập dữ liệu .............................................................................................13 2. Các chức năng cơ bản của SPSS .....................................................................14 2.1. Tạo biến mới từ các biến sẵn có ...............................................................14 2.2. Thống kê mô tả .........................................................................................16 2.3. Tạo bảng tương quan nhiều chiều ............................................................21 2.4. So sánh trung bình ....................................................................................22 2.5. Phân tích tương quan ................................................................................33 2.6. Kiểm định độ tin cậy của thang đo...........................................................36
  6. iv 2.7. Phân tích hồi quy ......................................................................................39 2.8. Biểu đồ .....................................................................................................46 CHƯƠNG 2. SỬ DỤNG PHẦN MỀM R .....................................................48 1. Giới thiệu phần mềm R ...................................................................................48 1.1. Lịch sử hình thành và phát triển ...............................................................48 1.2. Khả năng của R ........................................................................................48 1.3. Giao diện ..................................................................................................49 1.4. Dẫn nhập ..................................................................................................51 1.5. Nhập dữ liệu .............................................................................................54 2. Các chức năng cơ bản của R ...........................................................................58 2.1. Tạo biến mới từ các biến sẵn có ...............................................................58 2.2. Thống kê mô tả .........................................................................................61 2.3. So sánh trung bình ....................................................................................66 2.4. Phân tích tương quan ................................................................................75 2.5. Kiểm định độ tin cậy của thang đo...........................................................77 2.6. Phân tích hồi quy ......................................................................................79 2.7. Biểu đồ .....................................................................................................84 3. Các lỗi thường gặp trong sử dụng R và RStudio ............................................85 3.1. Lỗi đọc file ...............................................................................................85 3.2. Lỗi không tìm thấy dataset, không tìm thấy lệnh. ....................................85 3.3. Lỗi trùng tên biến .....................................................................................85 4. Tổng kết các lệnh thường dùng trong R. ........................................................85 CHƯƠNG 3. ỨNG DỤNG PHẦN MỀM XỬ LÝ SỐ LIỆU PHỤC VỤ NGHIÊN CỨU KHOA HỌC GIẢNG DẠY VẬT LÝ .........................................89 1. So sánh phần mềm SPSS và R ........................................................................89 1.1. Giống nhau ...............................................................................................89 1.2. Khác nhau .................................................................................................89 2. Ưu và nhược điểm của phần mềm SPSS và R ................................................90 2.1. Ưu và nhược điểm của phần mềm SPSS..................................................90 2.2. Ưu và nhược điểm của phần mềm R ........................................................91 3. Ứng dụng phần mềm SPSS và R vào các nghiên cứu Khoa học giảng dạy Vật lý .........................................................................................................................92 KẾT LUẬN VÀ KIẾN NGHỊ ........................................................................94
  7. v TÀI LIỆU THAM KHẢO..............................................................................97 PHỤ LỤC ........................................................................................................99
  8. 1 DANH MỤC BẢNG BIỂU Bảng 1. Thống kê mô tả biến Diemthi..............................................................19 Bảng 2. Bảng chéo Xeploai và Lop ..................................................................20 Bảng 3. Bảng tương quan giữa Xeploai với Gioitinh và Lop. ..........................22 Bảng 4. Kết quả tính giá trị trung bình theo biến định tính ..............................23 Bảng 5. Kết quả kiểm định Paired-Samples T-Test .........................................25 Bảng 6. Kết quả kiểm định One-Sample T Test ...............................................27 Bảng 7. Kết quả so sánh trung bình giữa hai nhóm .........................................29 Bảng 8. Kết quả kiểm định One-Way ANOVA .................................................32 Bảng 9. Kết quả phân tích tương quan đơn ......................................................35 Bảng 10. Đánh giá hệ số Cronbach’s Alpha ....................................................39 Bảng 11. Bảng Model Summary .......................................................................42 Bảng 12. Bảng ANOVA ....................................................................................43 Bảng 13. Bảng Coecients .................................................................................44 Bảng 14. Tổng hợp các lệnh cơ bản thường dùng trong R ...............................88
  9. 2 DANH MỤC HÌNH ẢNH Hình 1. Giao diện làm việc của SPSS ...............................................................12 Hình 2. Cửa sổ khai báo biến ...........................................................................13 Hình 3. Nhập dữ liệu vào SPSS ........................................................................14 Hình 4. Mã hóa biến .........................................................................................15 Hình 5. Mã hóa biến Xeploai ............................................................................15 Hình 6. Cơ sở dữ liệu lớp thực nghiệm và lớp đối chiếu .................................16 Hình 7. Tính tần suất biến Diemthi ..................................................................17 Hình 8. Kết quả tính tần số biến Diemthi .........................................................18 Hình 9. Các tùy chọn trong lệnh Options của Descriptives .............................18 Hình 10. Tạo bảng chéo hai biến ......................................................................19 Hình 11. Đồ thị bảng chéo Xeploai và Lop ......................................................20 Hình 12. Tạo bảng nhiều chiều.........................................................................21 Hình 13. Tính giá trị trung bình theo biến định tính ........................................23 Hình 14. Bảng số liệu so sánh cặp ....................................................................24 Hình 15. Kiểm định Paired-Samples T-Test ....................................................25 Hình 16. Kiểm định One-Sample T Test ..........................................................26 Hình 17. So sánh trung bình giữa hai nhóm .....................................................28 Hình 18. Phân nhóm giá trị so sánh trung bình giữa hai nhóm ........................28 Hình 19. Cơ sở dữ liệu mức tiêu thụ xăng .......................................................30 Hình 20. Kiểm định One-Way ANOVA ............................................................31 Hình 21. Đánh giá kết quả kiểm định One-Way ANOVA. ................................32 Hình 22. Phân tích tương quan đơn ..................................................................34 Hình 23. Đánh giá hệ số Cronbach’s Alpha .....................................................38 Hình 24. Bảng số liệu phân tích hồi quy tuyến tính .........................................40 Hình 25. Phân tích hồi quy tuyến tính bội ........................................................40 Hình 26. Cài đặt thông số phân tích .................................................................41
  10. 3 Hình 27. Cài đặt biểu đồ kiểm tra giả thiết hồi quy .........................................41 Hình 28. Bảng ý nghĩa giá trị Durbin-Watson .................................................43 Hình 29. Đồ thị Histogram ...............................................................................45 Hình 30. Đồ thị Normal P-P Plot .....................................................................45 Hình 31. Đồ thị Scatter Plot .............................................................................46 Hình 32. Vẽ đồ thị với SPSS.............................................................................47 Hình 33. Giao diện sử dụng của R ....................................................................49 Hình 34. Giao diện sử dụng của RStudio .........................................................50 Hình 35. Cài đặt Packages trực tiếp cho R .......................................................53 Hình 36. Cài packages tự động với RStudio ....................................................54 Hình 37. Hợp nhất các biến thành dataset ........................................................55 Hình 38. Nhập dữ liệu trực tiếp ........................................................................56 Hình 39. Đọc file vào RStudio ..........................................................................57 Hình 40. Xem trước dữ liệu trước khi đọc .......................................................57 Hình 41. Cơ sở dữ liệu lớp thực nghiệm và lớp đối chiếu ...............................58 Hình 42. Cơ sở dữ liệu mức tiêu thụ xăng .......................................................59 Hình 43. Tạo biến mới đơn giản .......................................................................59 Hình 44. Lệnh mã hóa biến Xeploai .................................................................60 Hình 45. Mã hóa biến Xeploai ..........................................................................60 Hình 46. Trích dữ liệu từ dataset cũ .................................................................61 Hình 47. Dữ liệu lớp thực nghiệm trích từ dataset Dulieu ...............................61 Hình 48. Thông báo package và dataset sẽ làm việc. .......................................62 Hình 49. Bảng phân tích tần số biến Diem. ......................................................62 Hình 50. Lệnh vẽ đồ thị phân bố tần số............................................................63 Hình 51. Đồ thị phân bố tần số biến Diem .......................................................63 Hình 52. Lệnh vẽ biểu đồ beeswarm. ...............................................................64 Hình 53. Biểu đồ phân bố điểm theo từng lớp .................................................64 Hình 54. Bảng chéo phân tích hai biến ............................................................66
  11. 4 Hình 55. Phân tích tham số thống kê theo nhóm..............................................67 Hình 56. Dữ liệu so sánh cặp............................................................................68 Hình 57. Kiểm định Paired T Test ...................................................................69 Hình 58. Lệnh kiểm định trung bình tổng thể điểm lớp thực nghiệm ..............70 Hình 59. Lệnh kiểm định trung bình tổng thể điểm lớp đối chiếu ...................70 Hình 60. Kiểm định trung bình tổng thể điểm lớp thực nghiệm ......................71 Hình 61. Kiểm định trung bình tổng thể điểm lớp đối chiếu ...........................71 Hình 62. So sánh phương sai giữa điểm của hai nhóm lớp ..............................72 Hình 63. Kiểm định Two Sample T Test giữa điểm của hai nhóm lớp ............73 Hình 64. Cơ sở dữ liệu mức tiêu thụ xăng .......................................................74 Hình 65. Kiểm định ANOVA ............................................................................74 Hình 66. Tương quan giữa mức tiêu thụ xăng và công suất động cơ ..............76 Hình 67. Tương quan giữa mức tiêu thụ xăng và khối lượng xe .....................76 Hình 68. Tương quan giữa mức tiêu thụ xăng và số cylinder ..........................77 Hình 69. Tương quan giữa mức tiêu thụ xăng và dung tích động cơ ...............77 Hình 70. Hệ số Cronbach's Alpha của cơ sở dữ liệu mức tiêu thụ xăng .........78 Hình 71. Phân tính hồi quy tuyến tính với R. ...................................................79 Hình 72. Biểu đồ Histogram về phân bố phần dư ............................................81 Hình 73. Biểu đồ Normal Q-Q Plot về phân bố phần dư .................................81 Hình 74. Biểu đồ studentized residuals về phương sai và giá trị tiên lượng....82 Hình 75. Biểu đồ Component + Residual Plot về mối tương quan tuyến tính 83 Hình 76. Kiểm tra giả định độc lập durbinWatsonTest ....................................84
  12. 5 PHẦN MỞ ĐẦU 1. Lý do chọn đề tài Ngày 26/12/2018, Bộ Giáo dục và Đào tạo đã chính thức công bố chương trình giáo dục phổ thông mới bao gồm chương trình giáo dục tổng thể và chương trình giáo dục từng bộ môn. Đây là bước đổi mới toàn điện trên quy mô cả nước về chương trình dạy và học ở phổ thông. Chương trình giáo dục phổ thông mới sẽ tập trung phát triển về phẩm chất và năng lực cho các em học sinh. Qua đó, chương trình giáo dục phổ thông mới tập trung trả lời câu hỏi: “Học xong chương trình, học sinh làm được những gì?”. Việc đổi mới chương trình cũng đồng thời đặt ra yêu cầu và thách thức đối với đội ngũ giáo viên trong việc đổi mới phương pháp dạy học và cách thức tổ chức dạy học nhằm phát triển tối đa phẩm chất và năng lực cho từng đối tượng học sinh. Trong bối cảnh có rất nhiều thay đổi và mới mẻ về tổ chức dạy học các môn học ở phổ thông nói chung và Vật lý nói riêng, cần có những nghiên cứu khoa học trong lĩnh vực này trở nên là một việc cần thiết và cũng là cơ hội để mở ra nhiều hướng nghiên cứu trong lĩnh vực khoa học giáo dục mà môn Vật lý là một phần trong đó. Một trong các phương pháp nghiên cứu trong khoa học giáo dục là Thống kê và sử dụng phần mềm xử lý số liệu thống kê. Hiện nay, các phần mềm thống kê cũng rất phát triển với nhiều phần mềm khác nhau có thể tính toán và xử lý lượng lớn dữ liệu. Tuy nhiên, được sử dụng rộng rãi trên thị trường có thể kể đến hai phần mềm là SPSS và R (cùng các gói package của R). Cả hai phần mềm này có đáp ứng được phần lớn nhu cầu xử lý số liệu trong nghiên cứu khoa học giáo dục hay không? Mỗi phần mềm có ưu điểm và nhược điểm nào, đặc biệt với đối tượng sử dụng là sinh viên, học viên cao học hoặc giáo viên phổ thông? Cách sử dụng mỗi phần mềm này ra sao và để cho hiệu quả? Với các câu hỏi như trên, chúng tôi quyết định chọn đề tài “Sử dụng phần mềm xử lý số liệu SPSS và R trong nghiên cứu về khoa học giảng dạy Vật lý” để làm đề tài nghiên cứu. 2. Tổng quan nghiên cứu Các đề tài nghiên cứu về khoa học dạy học Vật lý đều ít nhiều sử dụng Thống kê. Những mô thức phổ biến là sử dụng thống kế mô tả, so sánh trung bình mẫu, kiểm định giả thuyết thống kê. Có thể thấy rõ mô thức này trong luận văn Thạc sĩ Khoa học giáo dục của tác giả Hà Thị Trúc Linh (2016). “Xây dựng và sử dụng hệ thống câu hỏi TNKQ theo định hướng phát triển năng lực chuyên biệt và dạy học chương “Cảm ứng điện từ” – Vật lý 11”[11]; Banhnalak Bosanthay (2017). “Tổ chức dạy
  13. 6 học chương “Dòng điện một chiều” – Vật lý lớp 9 THCS ở nước CHDCND Lào theo hướng phát huy tính tích cực, tự lực học tập của học sinh”[3]; Bùi Xuân Dương (2017). “Tổ chức dạy học giải quyết vấn đề một số kiến thức của chương “Các định luật bảo toàn” – Vật lý 10 với sự hỗ trợ của phần mềm Crocodile PHYsics”[5]. Những số liệu này cần thiết cho việc nghiên cứu mẫu can thiệp và mẫu đối chứng. Các tham số được sử dụng như điểm trung bình, phương sai, độ lệch chuẩn, tần số điểm, tần số tích lũy,… của điểm các lớp trước và sau khi áp dụng phương pháp mới. Các tác giả kết so sánh kết quả, vẽ biểu đồ từ đó kết luận độ hiệu quả của phương pháp mới được nêu ra. Nếu chỉ dừng ở thống kê mô tả thì việc xử lý số liệu khá đơn giản, có thể tính bằng tay hoặc dùng phần mềm Excel. Tuy nhiên, để xử lý số liệu với các bước phức tạp hơn thì các đề tài nghiên cứu cần đến phần mềm chuyên dụng xử lý số liệu. Trước tiên, xét đến phần mềm SPSS. SPSS là một phần mềm thương mại có phí bản quyền khoảng 99$/tháng. Đó là một khó khăn với sinh viên, học viên cao học hay giáo viên phổ thông nếu muốn sử dụng phần mềm này cho nghiên cứu của mình. Tuy nhiên, tính năng của SPSS giúp việc sử lý số liệu phức tạp được tiến hành dễ dàng và có mức độ sâu hơn là thống kê mô tả. Trong luận văn Thạc sĩ Khoa học giáo dục của các tác giả: Hoàng Thị Hạnh (2016). “Vận dụng mô hình PEER INSTRUCTION trong dạy học một số kiến thức chương “Chất khí” – Vật lý 10”[7], tác giả đã giới thiệu mô hình Peer Instruction và phân tích ưu điểm, hạn chế và những thuận lợi, khó khăn khi áp dụng mô hình vào dạy học Vật lý phổ thông ở Việt Nam. Dựa vào đó tác giả đã phân tích kiến thức và xây dựng tiến trình dạy học chương “Chất khí” – Vật lý 10 theo mô hình Peer Instruction. Từ đó tổ chức thực nghiệm sư phạm và khảo sát số liệu đánh giá kết quả của mô hình. Tác giả đã dùng SPSS để tính toán các tham số của thống kê mô tả như điểm trung bình, phương sai, độ lệch chuẩn, tần suất và tần suất tích lũy, … Ngoài ra với số liệu khảo sát là điểm của hai lớp gồm lớp thực nghiệm và lớp đối chiếu tác giả đã sử dụng kiểm định Independent-Sample T Test để so sánh trung bình giữa hai nhóm. Từ đó thấy được sự khác nhau về ý nghĩa thống kê giữa điểm của lớp thực nghiệm và điểm của lớp đối chiếu. Điểm trung bình của lớp thực nghiệm cao hơn so với lớp đối chiếu nên có thể thấy được độ hiệu quả của việc áp dụng mô hình Peer Instruction vào dạy học Vật lý phổ thông ở nước ta. Thao tác này sẽ khó khăn hơn nếu không sử dụng một phần mềm chuyên dụng cho việc xử lý số liệu.
  14. 7 Ngoài SPSSI, có thể sử dụng phần mềm Transana để phân tích các đoạn phim trong quá trình giảng dạy. Phần mềm Transana được sử dụng trong luận văn Thạc sĩ Khoa học giáo dục của tác giả Đinh Vũ Nguyên Chương (2017). “Tổ chức dạy học chủ đề tích hợp “Năng lượng” cho sinh viên chuyên ngành kỹ thuật”[4]. Trong đó phần mềm Transana được sử dụng để phân tích các clip được quay lại trong quá trình giảng dạy bằng phương pháp mới. Từ đó đánh giá được sự tích cực làm việc, hoạt động của học sinh được nâng cao. Bên cạnh đó, cũng có những đề tài không sử dụng phân tích thống kê để đánh giá kết quả mà thay vào đó, tác giả chấm điểm sản phẩm của học sinh và thu thập những nhận xét của học sinh, giáo viên và các chuyên gia để kết luận độ hiệu quả của mô hình. Ví dụ như luận văn Thạc sĩ Khoa học giáo dục của tác giả: Đàm Việt Thắng (2017). “Tổ chức hoạt động ngoại khóa về ứng dụng kỹ thuật chương “Cơ học chất lưu” – Vật lý 10 theo hướng phát huy tính tích cực và phát triển năng lực sáng tạo của học sinh”[15]; luận văn tốt nghiệp của tác giả Nguyễn Thanh Huy (2017). “Xây dựng cơ sở học liệu cho việc dạy và học học phần thiên văn và quang học trong môn khoa học tự nhiên ở bậc tiểu học”[9]. Phương pháp đánh giá này không thuyết phục do đây chỉ là đánh giá trên một mẫu nhỏ và chưa đủ cơ sở để đánh giá độ hiệu quả của đề tài trên phạm vi quần thể. Như vậy, qua tìm hiểu và phân tích một vài luận văn, khóa luận về khoa học dạy học môn Vật lý được bảo vệ tại Khoa Vật lý trường Đại học Sư phạm Tp.HCM trong khoảng 3 năm trở lại đây các tác giả có sử dụng SPSS và một số phần mềm khác để xử lý số liệu. Tuy nhiên trong phạm vi tìm hiểu, chúng tôi chưa ghi nhận đề tài nào có sử dụng phần mềm R để xử lý số liệu. Trong khi sử dụng SPSS cần phải trả phí bản quyền, R là một phần mềm thống kê miễn phí. Tuy nhiên R có thể xem như là một ngôn ngữ thống kê vì người dùng phải lập trình với rất nhiều câu lệnh và nhiều gói Packages khá phức tạp. Điều này có lẽ là một nguyên nhân dù được sử dụng miễn phí nhưng không nhiều đề tài dành cho sinh viên, học viên cao học sử dụng, mặc dù tìm hướng dẫn sử dụng R không khó. Trong các hướng dẫn chi tiết về R, có thể kể đến sách của Giáo sư Nguyễn Văn Tuấn (2014). “Phân tích dữ liệu với R”[14]. Trong quyển sách này, tác giả đã trình bày rất chi tiết về các chức năng và hướng dẫn sử dụng phần mềm R để phân tích số liệu. Giáo sư đã trình bày rõ ràng và đầy đủ về cách sử dụng kèm theo các ví dụ cụ thể về các chức năng của R trong sách. Tuy nhiên, chính vì đầy đủ nên tài liệu khá
  15. 8 dài, lên đến 517 trang, phù hợp cho học tập và nghiên cứu với R nhưng lại không thân thiện với một người mới bắt đầu dùng và chỉ dùng như một công cụ nghiên cứu. Chính vì lẽ đó, trong khóa luận này chúng tôi sẽ trình bày cách sử dụng các chức năng quan trọng, cần thiết cho phân tích số liệu trong lĩnh vực Khoa học giáo dục nói chung và Khoa học giảng dạy Vật lý nói riêng của phần mềm SPSS và R. Một quyển cẩm nang vừa phải là rất cần thiết cho những người dùng ban đầu. Đồng thời chúng tôi cũng phân tích ưu và nhược điểm của từng phần mềm để người dùng có thể lựa chọn phần mềm nào phù hợp với bản thân. 3. Định hướng nghiên cứu của đề tài 3.1. Mục tiêu đề tài Phân tích hai phần mềm xử lý số liệu SPSS và R để phục vụ cho các nghiên cứu về khoa học giảng dạy Vật lý và tạo ra một quyển cẩm nang sử dụng cho hai phần mềm này với các chức năng quan trọng và cơ bản nhất. 3.1.1. Mục tiêu cụ thể - Giới thiệu và phân tích ưu, nhược điểm của phần mềm SPSS. - Giới thiệu và phân tích ưu, nhược điểm của phần mềm R. - So sánh sự khác nhau giữa hai phần mềm SPSS và R. - Phân tích số liệu thực tế để đưa ra sự phù hợp của từng phần mềm với các đề tài nghiên cứu khác nhau về khoa học giảng dạy Vật lý. - Thiết kế cẩm nang hướng dẫn sử dụng. 3.2. Câu hỏi nghiên cứu - Sử dụng phần mềm SPSS và R trong xử lý số liệu nghiên cứu như thế nào? - Ưu, nhược điểm của hai phần mềm SPSS và R là gì? - Đâu là sự khác nhau giữa SPSS và R? Tại sao hai phần mềm này có thể tồn tại song song với nhau trên trị trường mà không nghiêng hẳn về một phần mềm nào? - Từng phần mềm SPSS và R phù hợp với đề tài nghiên cứu nào? 4. Phương pháp, đối tượng nghiên cứu 4.1. Phương pháp nghiên cứu 4.1.1. Phương pháp nghiên cứu lý luận - Phân tích và nghiên cứu các tài liệu liên quan đến phần mềm SPSS và R.
  16. 9 - Nghiên cứu các tài liệu về khoa học giảng dạy Vật lý. - Mô hình hóa các hệ thống số liệu thực tế. - Nghiên cứu các tài liệu về xử lý số liệu, các luận văn, luận án liên quan đến xử lý số liệu và khoa học giảng dạy Vật lý. 4.1.2. Phương pháp nghiên cứu thực tiễn - Nghiên cứu các số liệu thực tiễn liên quan đến khoa học giảng dạy Vật lý. - Nghiên cứu việc xây dựng hướng xử lý và sử dụng phần mềm xử lý số liệu SPSS và R để phân tích số liệu thực tế liên quan đến khoa học giảng dạy Vật lý. 4.2. Đối tượng nghiên cứu Hai phần mềm SPSS và R cùng số liệu của các đề tài nghiên cứu về khoa học giảng dạy Vật lý. 5. Cấu trúc khóa luận Để đạt được mục tiêu đã đề ra, khóa luận sẽ nghiên cứu thực tế tình hình sử dụng phần mềm xử lý số liệu trong các nghiên cứu về khoa học giảng dạy Vật lý; đưa ra ưu, nhược điểm của hai phần mềm SPSS và R; so sánh đặc điểm khác nhau giữa hai phần mềm; rút ra nhận xét về sự phù hợp của từng phần mềm với các đối tượng nghiên cứu khác nhau trong lĩnh vực khoa học giảng dạy Vật lý. Với các nhiệm vụ như trên khóa luận này được chia làm ba chương không kể phần mở đầu và kết luận. Chương 1: Sử dụng phần mềm SPSS Trong chương này khóa luận sẽ giới thiệu phần mềm SPSS, và các chức năng cơ bản thường dùng cho các nghiên cứu về Khoa học giảng dạy Vật lý. Song song đó, khóa luận cũng đưa ra các VD cụ thể cho từng chức năng để phân tích mẫu trên các số liệu thực tế. Chương 2: Sử dụng phần mềm R Trong chương này khóa luận sẽ giới thiệu phần mềm R, và các chức năng cơ bản thường dùng cho các nghiên cứu về Khoa học giảng dạy Vật lý. Song song đó, khóa luận cũng đưa ra các VD cụ thể cho từng chức năng để phân tích mẫu trên các số liệu thực tế. Chương 3: Ứng dụng phần mềm xử lý số liệu phục vụ nghiên cứu khoa học giảng dạy Vật lý Trong chương này khóa luận sẽ tập trung vào việc đánh giá hai phần mềm SPSS và R. Từ kết quả thu được khi phân tích các VD với số liệu thực tế ở Chương 1 và
  17. 10 Chương 2 rút ra kết luận về ưu, nhược điểm của hai phần mềm này. Qua đó trình bày về những đặc điểm giống và khác nhau của hai phần mềm trên để trả lời câu hỏi tại sao hai phần mềm này lại cùng tồn tại song song với nhau mà không nghiêng hẳn về một phần mềm nào? Đồng thời đưa ra kết luận về sự phù hợp của từng phần mềm với các đối tượng sử dụng khác nhau, các đối tượng nghiên cứu khác nhau trong lĩnh vực khoa học giảng dạy Vật lý.
  18. 11 CHƯƠNG 1. SỬ DỤNG PHẦN MỀM SPSS 1. Giới thiệu phần mềm SPSS 1.1. Lịch sử hình thành và phát triển SPSS là một phần mềm phổ biết đã được xây dựng từ những năm 1968 và được hoàn thiện dần theo thời gian. SPSS (viết tắt của Statistical Package for the Social Sciences) là một chương trình máy tính phục vụ cho công tác phân tích thống kê. SPSS được sử dụng rộng rãi trong công tác thống kê kinh tế - xã hội và được sử dụng rộng rãi trong kinh tế lượng.[2] Thế hệ đầu tiên của SPSS được đưa ra từ những năm 1968 chuyên sử dụng cho các máy chủ ở Mỹ. SPSS được sử dụng bởi các nhà nghiên cứu thị trường, nghiên cứu y khoa, công ty điều tra, các nhà nghiên cứu giáo dục và những lĩnh vực khác. Sau đó phần mềm không ngừng cải tiến và nâng cao các tính năng của mình, ngày càng có nhiều thế hệ mới của SPSS ra đời, với các tiện ích ngày càng phong phú, đa dạng hơn. Thế hệ mới nhất cho đến nay được xem là SPSS 22.0 được giới thiệu từ tháng 8 năm 2008, có cả phiên bản cho các hệ điều hành Microsoft Windows, Mac, và Linux/ UNIX. SPSS 22.0, nhiều chức năng đa dạng và linh hoạt nên được sử dụng rộng rãi trong nhiều ngành khoa học khác nhau như: Xã hội học, Y học, Nhân học, Tâm lý học, Kinh tế học, Marketing…[2] 1.2. Khả năng của SPSS Phần mềm SPSS cung cấp một hệ thống quản lý dữ liệu và khả năng phân tích thống kê với giao diện thân thiện cho người dùng trong môi trường đồ hoạ, sử dụng các trình đơn mô tả và các hộp thoại đơn giản. Chức năng cơ bản của SPSS: + Thống kê mô tả (Descriptive statistics): tần số (Frequencies), các loại bảng số liệu tổng hợp (Cross tabulation, Explore, Descriptive Ratio Statistics). + Thống kê 2 biến số (Bivariate statistics): trung bình (Means), tương quan (bivariate, partial, distances), kiểm định phi tham số (Nonparametric tests), kiểm định sự tin cậy của thang đo bằng Cronbach Alpha phân tích tương quan, kiểm định trung bình (T-test), kiểm định sự khác nhau giữa các biến phân loại (định danh) bằng phân tích phương sai (ANOVA), vẽ bản đồ nhận thức (dùng trong marketing).
  19. 12 + Dự báo (Prediction): Hồi quy (regression), phân tích nhân tố (Factor analysis), cluster analysis (two-step, K-means, hierarchical), biệt thức (Discriminant). 1.3. Giao diện Giao diện của SPSS trực quan và quen thuộc nhờ có nét tương đồng với các phần mềm Office thường dùng, trong đó: Hình 1. Giao diện làm việc của SPSS 1. Thanh menu chức năng, 2. Biểu tượng một số chức năng thông dụng, 3. Cột hiển thị tên các biến, 4. Số thứ tự các dòng, 5. Data View (cửa sổ nhập liệu và thể hiện dữ liệu). Variable View (cửa sổ khai báo biến). 1.4. Khai báo biến SPSS yêu cầu người sử dụng phải khai báo đầy đủ các biến trước khi thực hiện các bước tính toán với dữ liệu. Công việc này được thực hiện trong của sổ Variable View, với:
  20. 13 Hình 2. Cửa sổ khai báo biến + Name: tên biên, ký tự liên tục, không có khoảng trắng, + Type: kiểu dữ liệu, số (numeric), chữ (string), ngày tháng (date), tiền tệ (dollar),… + Width: độ rộng kiểu dữ liệu, nêu type là string thì width là số ký tự tối đa, + Decimals: lượng số thập phân, + Label: nhãn biến (chú thích cho tên biến, là tên cột hiển thị ở bảng kết quả), + Values: giá trị mã hóa dữ liệu: ví dụ 1 là Nam, 2 là Nu, + Missing: khai báo giá trị khuyết (khai báo khi bản khảo sát có dữ liệu sai hoặc không đúng cấu trúc), các giá trị này sẽ bị bỏ đi để tránh làm ảnh hướng tới kết quả, + Columns: độ rộng cột tên biến, + Align: vị trí hiển thị dữ liệu trong cột (căn lề), + Measure: loại thang đo dữ liệu: • Scale (thang đo tỉ lệ): có thể cộng, trừ, nhân, chia, • Ordinal (thang đo thứ bậc): có thể cộng, trừ nhưng hạn chế về nhân chia, ví dụ điểm trung bình, • Nominal (thang đo định danh): chỉ đếm được tần số chứ không thực hiện các phép tính được, + Role: vai trò của biến. 1.5. Nhập dữ liệu SPSS cung cấp nhiều công cụ nhập số liệu khảo sát rất tiện dụng, trong đó phổ biến là nhập dữ liệu thủ công và nhập từ phần mềm Excel.
nguon tai.lieu . vn