Xem mẫu

  1. Chương I PHÂN LOẠI DỮ LIỆU, MÃ HÓA, NHẬP LIỆU VÀ MỘT SỐ XỬ LÝ TRÊN BIẾN Biên soạn: TS. NGUYỄN THỊ PHƯƠNG GIANG Phone: 0944.822.211 E-Mail: nguyenthiphuonggiang@iuh.edu.vn NỘI DUNG • Phân loại dữ liệu • Các loại thang đo • Nguyên tắc mã hóa và nhập liệu • Cửa sổ làm việc của SPSS • Tạo tập tin dữ liệu trong SPSS • Một số xử lý trên biến • Thay đổi một số mặc định • Tiếng việt trong SPSS 02/08/2017 2 Phân loại Dữ liệu • Dữ liệu định tính: Phản ánh tính chất, sự hơn kém, không tính được trị trung bình. • Ví dụ: Giới tính, kết quả học tập. • Dữ liệu định lượng: Phản ánh mức độ hơn kém, được thể hiện bằng các con số nên tính được giá trị trung bình. Các con số thu thập có thể ở dạng liên tục hay rời rạc. 02/08/2017 3 1
  2. Các loại thang đo • Thang đo danh nghĩa (Nominal scale): Trong thang đo này, các con số chỉ dùng để phân loại các đối tượng. • Những phép toán thống kê có thể sử dụng được là: đếm, tính tần suất của một biểu hiện nào đó 02/08/2017 4 Các loại thang đo • Thang đo thứ bậc (Ordinal scale): Các con số trong thang đo danh nghĩa được sắp xếp theo một qui thứ bậc. Ví dụ: Bạn hài lòng như thế nào về mùi của sản phẩm Snack Khoai tây chiên mà bạn vừa dùng thử? (Hài lòng, bình thường, không hài lòng) 02/08/2017 5 Các loại thang đo • Thang đo khoảng (Interval scale): Là dạng đặc biệt của thang đo thứ bậc vì nó cho biết được khoảng cách giữa các thứ bậc. Thông thường thang đo khoảng có dạng là một dãy các chữ số liên tục và đều đặn từ 1 đến 5, từ 1 đến 7 hay từ 1 đến 10,… Dãy số này có 2 cực ở hai đầu thể hiện 2 trạng thái đối nghịch nhau. 02/08/2017 6 2
  3. Các loại thang đo • Thang đo tỉ lệ (Ratio scale): có tất cả các đặc tính khoảng cách và thứ tự của thang đo khoảng, ngoài ra điểm không trong thang đo khoảng là một giá trị thật nên có thể thực hiện được phép chia để tính tỉ lệ. Thang đo khoảng và thang đo tỉ lệ có thể đo lường nên SPSS gộp chung hai loại thang đo này thành thang đo mức độ (Scale Measures). 02/08/2017 7 Nguyên tắc Mã hóa – Nhập liệu Giới tính Tuổi Nghề nghiệp 1 Nữ 21 Sinh viên 2 Nữ 32 Nhân viên văn phòng 3 Nam 53 Về hưu … … … … n Nam 42 Nghề khác 02/08/2017 8 Nguyên tắc Mã hóa – Nhập liệu Giới tính Tuổi Nghề nghiệp 1 2 21 10 2 2 32 3 3 1 53 11 … … … … n 1 42 14 02/08/2017 9 3
  4. Nguyên tắc Mã hóa – Nhập liệu • Phần lớn mỗi biến tương ứng với một câu hỏi cụ thể trong bản trả lời. Như thế ta chỉ cần tạo 1 biến. • Trường hợp câu hỏi có thể chọn nhiều trả lời thì chúng ta phải có nhiều con số để nhập nên cần phải có nhiều ô để nhập. • Qui tắc nhập liệu: Từ trái qua phải (theo từng dòng) và từ trên xuống (sang dòng) 02/08/2017 10 Cửa sổ làm việc của SPSS • Khởi động - Click biểu chương trình trên thanh công cụ - Từ Menu Start, chọn Program, chọn SPSS • Nội dung của Menu - File: xử lý File - Edit: chỉnh sửa - 02/08/2017 View: Hiển thị 11 Cửa sổ làm việc của SPSS - Data: các công tác liên quan đến dữ liệu - Transform: Chuyển đổi dữ liệu, tính toán, mã hóa lại các biến. - Analyze: Thực hiện các thủ tục thống kê - Graphs: Tạo biểu đồ, đồ thị - Windows: Sắp xếp các cửa sổ làm việc trong SPSS. 02/08/2017 12 4
  5. Tạo tập tin dữ liệu trong SPSS for Windows • Khai báo biến: - Click Variable view. - Khai báo biến trên từng dòng, nội dung của dòng là các thuộc tính của biến. - Name: Tên biến - Type: Kiểu biến - Width: Độ rộng của biến 02/08/2017 13 Tạo tập tin dữ liệu trong SPSS for Windows - Decimals: Số số lẻ - Label: Nhãn biến - Value: Mã hóa cho các giá trị định tính - Missing: Khai báo các loại giá trị khuyết - Column: Độ rộng của biến khi nhập liệu - Align: Vị trí dữ liệu trong cột - Measure: Chọn loại thang đo 02/08/2017 14 Tạo tập tin dữ liệu trong SPSS for Windows • Lưu tập tin dữ liệu: - Menu File, chọn Save. - Save in: chọn nơi lưu - File name: Đặt tên file (chỉ đặt tên chính) - Click nút Save Mặc định kiểu tập tin là sav 02/08/2017 15 5
  6. Một số xử lý trên biến • Mã hóa lại biến (Recode): Sử dụng khi cần giảm số biểu hiện của một biến định tính. Hoặc muốn chuyển biến định lượng thành biến định tính - Qui trình thực hiện: - Menu Transform > Recode into Different Variables (tạo biến mới) hoặc Recode into Same Variables (thay biến cũ) 02/08/2017 16 Một số xử lý trên biến - Chọn biến muốn Recode - Đặt lại Name và Label, Click Change - Click Old and New Values… để xác định sự chuyển đổi. - Click Continue và OK để thực hiện lệnh. 02/08/2017 17 Một số xử lý trên biến • Chuyển biến dạng Category thành biến dạng Dichotomy: Biến dạng Category có nhiều trị số mã hóa tượng trưng cho nhiều trạng thái. Biến Dichotomy là biến phân loại chỉ có 2 trị số mã hóa tượng trưng cho 2 trạng thái khác nhau (có hoặc không) 02/08/2017 18 6
  7. Một số xử lý trên biến • Cách thực hiện: – Menu transform, chọn Count – Target Variable: Khai báo tên biến cần tạo – Target Label: Khai báo nhãn – Đưa các biến cần chuyển vào Numeric Var – Click Define Values mở hộp thoại – Nhận 7 vào ô Value – Click Continue và OK 02/08/2017 19 Tùy chọn của chương trình • Menu Edit, chọn Options: – Measurement System: Thay đổi đơn vị – Variable list: Thay đổi cách thể hiện – Pivot Table: Chọn cách thể hiện bảng kết quả – File Location: Chọn nơi lưu trữ và mở file dữ liệu – Viewer: Chọn font hiển thị kết quả 02/08/2017 20 Câu hỏi ôn tập 1. Hãy cho biết các loại dữ liệu và các loại thang đo? 2. Nguyên tắc mã hóa và nhập liệu 3. Trình bày cách tạo tập tin dữ liệu trong SPSS For Windows. 4. Qui trình thực hiện việc mã hóa lại biến (Recode) 5. Chuyển Category thành Dichotomy 02/08/2017 21 7
  8. CHƯƠNG II LÀM SẠCH DỮ LIỆU NỘI DUNG  Sự cần thiết  Các biện pháp ngăn ngừa  Các phương pháp làm sạch dữ liệu Sự cần thiết Dữ liệu sau khi nhập xong chưa thể đưa vào xử lý và phân tích vì:  Chất lượng của phỏng vấn và đọc soát (hiểu sai, thu thập sai, chọn sai đối tượng, trả lời sai ý, người đọc soát chưa phát hiện,…)  Nhập dữ liệu (sai, sót, thừa) 8
  9. Các biện pháp ngăn ngừa  Thiết kế bản câu hỏi rõ ràng, dễ hỏi, dễ trả lời.  Chọn lọc và huấn luyện phỏng vấn viên kỹ lưỡng.  Sau khi phỏng vấn, bản câu hỏi phải được đọc soát trước khi nhập.  Việc mã hóa phải được tiến hành tập trung với một số ít cá nhân phụ trách. Các phương pháp làm sạch dữ liệu  Dùng bảng tần số - Lập bảng tần số cho tất cả các biến, đọc và rà soát các giá trị lạ. Sau đó dùng lệnh FIND để tìm lỗi.  Cách thực hiện - Trong Data View, chọn cột có giá trị lỗi - Vào Menu Edit > Find - Nhập vào giá trị lỗi - Truy ngược lại số thứ tự của hàng để biết được bản câu hỏi tương ứng. Các phương pháp làm sạch dữ liệu  Dùng bảng phối hợp hai hay ba biến - Lập bảng tần số cho tất cả các biến, đọc và rà soát các giá trị lạ. Sau đó dùng lệnh FIND để tìm lỗi.  Cách thực hiện - Trong Data View, chọn cột có giá trị lỗi - Vào Menu Edit > Find - Nhập vào giá trị lỗi - Truy ngược lại số thứ tự của hàng để biết được bản câu hỏi tương ứng. - Vào Data > Sort Case để sắp xếp biến filter_$ 9
  10. Các phương pháp làm sạch dữ liệu  Cách tìm lỗi đơn giản ngay trên cửa sổ dữ liệu - Sử dụng lệnh Data > Sort Case để tìm lỗi đơn giản cho các biến giới tính. Câu hỏi ôn tập  Sự cần thiết phải làm sạch dữ liệu.  Các biện pháp ngăn ngừa lỗi cho dữ liệu  Trình bày các phương pháp làm sạch dữ liệu từ đơn giản đến phức tạp. CHƯƠNG III TÓM TẮT VÀ TRÌNH BÀY DỮ LIỆU 30 10
  11. NỘI DUNG • Phương pháp và công cụ • Bảng tần số đơn giản • Các đại lượng thống kê mô tả • Lập bảng tần số đồng thời tính toán các đại lượng thống kê mô tả • Thống kê mô tả theo thủ tục Explore • Lập bảng tổng hợp nhiều biến • Xử lý câu hỏi có thể chọn nhiều trả lời • Trình bày kết quả bằng đồ thị • Bảng tùy biến (Custom tables) 31 PHƯƠNG PHÁP VÀ CÔNG CỤ • Bảng tần số đơn giản • Các đại lượng thống kê mô tả, biểu đồ tần số • Bảng kết hợp nhiều biến • Đồ thị 32 BẢNG TẦN SỐ ĐƠN GiẢN • Xác định số lượng và tỉ lệ của các biểu hiện nào đó trong tập dữ liệu. • Ví dụ: Lập bảng tần số của gtinh • Sau khi thực hiện, ta được 2 bảng: – Bảng 3.1 N Valid 500 Missing 0 – Valid: Trị hợp lệ (Số người có trả lời) – Missing: Thiếu dữ liệu (Không trả lời) 33 11
  12. BẢNG TẦN SỐ ĐƠN GiẢN – Bảng 3.2 Frequency Percent Valid Cumulative Percent Percent Valid Nam 249 49.8 49.8 49.8 Nu 251 50.2 50.2 100.0 Total 500 100.0 100.0 – Cột đầu tiên là các biểu hiện của biến gtinh – Frequency: Tần số của từng biểu hiện – Percent: Tần suất tính theo tỉ lệ % – Valid Percent: Phần trăm hợp lệ, tính trên số quan sát có thông tin trả lời. – Cumulative Percent: Phần trăm tích lũy do cộng dồn từ các phần trăm từ trên xuống. Trương Ngọc Tú 34 34 BẢNG TẦN SỐ ĐƠN GiẢN • Cách thức tiến hành lệnh Frequencies: – Menu Analyze > Descriptive Statistics > Frequencies. – Chọn biến muốn lập bảng tần số bằng cách click vào tên biến và click nút mũi tên sang phải (hoặc nhấp đôi tại biến) – Click OK ta có 2 bảng kết quả 3.1 và 3.2 – Lưu ý: Nếu bỏ chọn ở phần Display Frequency Tables thì ta chỉ tạo được bảng 3.1 Trương Ngọc Tú 35 35 CÁC ĐẠI LƯỢNG THỐNG KÊ MÔ TẢ • Chỉ thực hiện đối với các biến định lượng • Cách thức tiến hành lệnh: – Menu Analyze > Descriptive Statistics > Descriptive. – Chọn 1 hoặc nhiều biến định lượng muốn tính bằng cách click vào tên biến và click nút mũi tên sang phải (hoặc nhấp đôi tại biến) – Click nút Options để vào hộp tùy chọn các đại lượng thống kê – Click Continue để trở về hộp thoại trước đó – Click OK ta có bảng kết quả Descriptives Bảng 3.3 Trương Ngọc Tú 36 36 12
  13. CÁC ĐẠI LƯỢNG THỐNG KÊ MÔ TẢ • Ý nghĩa của các kết quả trên bảng 3.3: – N: Tổng số quan sát – Minimun: Giá trị nhỏ nhất – Maximun: Giá trị lớn nhất – Mean: Giá trị trung bình cộng – Std Error: Sai số chuẩn khi dùng giá trị trung bình mẫu để ước lượng giá trị trung bình của tổng thể – Std Deviation: Độ lệch chuẩn, cho biết mức độ phân tán của các giá trị của biến quanh giá trị trung bình Trương Ngọc Tú 37 37 CÁC ĐẠI LƯỢNG THỐNG KÊ MÔ TẢ • Lựa chọn cách thể hiện bảng kết quả: – Trên cửa sổ Output, nhấp đôi tại bảng kết quả. – Menu Pivot > Transpose Rows and Columns – Ngoài ra ta cũng có thể dùng cách đổi thứ hai: Menu Pivot > Pivoting Trays. Lần lượt thực hiện sắp xếp các nhãn đại diện vào bảng, ta sẽ có được bảng kết quả theo yêu cầu (sinh viên tự nghiên cứu) Trương Ngọc Tú 38 38 LẬP BẢNG TẦN SỐ ĐỒNG THỜI TÍNH TOÁN CÁC ĐẠI LƯỢNG THỐNG KÊ MÔ TẢ • Cách thực hiện: – Menu Analyze > Descriptive Statistics > Frequencies – Chọn biến định lượng (c3) – Click nút Statistics để chọn các đại lượng thống kê cần tính như: • Percentile Values: Các giá trị tứ vị phân, … • Central Tendency: Khuynh hướng tập trung • Dispersion: Khuynh hướng phân tán • Distribution: Hình dáng phân phối – Để vẽ biểu đồ, ta nhấn nút Chart, trong đó: • None: không thể hiện • Bar charts: Biểu đồ dạng thanh • Pie charts: Biểu đồ hình tròn • Histograms:Biểu đồ phân phối tần số – Click OK Trương Ngọc Tú 39 39 13
  14. THỐNG KÊ MÔ TẢ VỚI THỦ TỤC EXPLORE • Thực hiện thủ tục Explore: – Vào Menu Analyze > Descriptive Statistics > Explore. – Chọn một hay nhiều biến dạng định lượng và đưa sang khung Dependent List (biến tuoi). – Chọn một hay nhiều biến muốn sử dụng làm điều kiện để phân tích biến định lượng trên. – Click nút Statistics để vào hộp Explore:Statistic – Click nút Plots để vào hộp thoại Explore – Click nút Options lựa chọn cách thức thủ tục Explore xử lý các giá trị Missing. – Sau mỗi lần chọn và xử lý xong các hộp thoại trên, click nút Continue để về hộp thoại chính. – Tại hộp thoại Explore, click OK. Trương Ngọc Tú 40 40 THỐNG KÊ MÔ TẢ VỚI THỦ TỤC EXPLORE • Chức năng của thủ tục Explore: – Tính toán các đại lượng thống kê cho tất cả các trường hợp hoặc cho các nhóm con – Nhận diện các giá trị khác biệt – Tính toán các giá trị thập vị phân của phân phối – Tạo biểu đồ, hình dáng của biểu đồ cho thấy dữ liệu phân phối như thế nào. • Chuẩn bị thực hành (tạo file Explore) – Vào Menu Data > Select Cases – Chọn Random sample of cases – Click Sample (nhập số 20 vào khung Aproximately) – Click Continue và sau đó Click OK (nhớ chọn mục Delete unselected cases) Trương Ngọc Tú 41 41 Chương 4 PHÂN TÍCH NHÂN TỐ EXPLORE FACTOR ANALYSIS ALPHA VÀ KIỂM ĐỊNH CRONBACH (EFA) 14
  15. NỘI DUNG CHÍNH Định nghĩa Điều kiện ứng dụng Nghiên cứu các nhân tố Số các nhân tố phải tách ra Phép quay (rotation) Điểm số nhân tố (Factorial Scores) Độ tin cậy và hiệu lực (Reliability and Validity) ĐỊNH NGHĨA Phân tích nhân tố khám phá là một phương pháp phân tích thống kê dùng để rút gọn một tập gồm nhiều biến quan sát phụ thuộc lẫn nhau thành một tập biến (gọi là các nhân tố) ít hơn để chúng có ý nghĩa hơn nhưng vẫn chứa đựng hầu hết nội dung thông tin của tập biến ban đầu (Hair & ctg, 1998) Chú ý: từ đây có thể hiện các biến là các items MÔ HÌNH NHÂN TỐ Giả sử phân tích nhân tố rút ra được i nhân tố (factors), ta có: Fi = W i1X1 + W i2X2 + W i3X3 + …. + W inXn Với Fi là ước lượng trị số của nhân tố (factor) thứ i. W ik là quyền số hay trọng số nhân tố (weight or factor score coefficient) của biến số thứ k đến nhân tố i. k: Số biến (items) 15
  16. ĐỊNH NGHĨA PHÂN TÍCH NHÂN TỐ Rút gọn số biến đầu tiên là xác định các chiều (dimension) khác nhau sau đó, giải sự liên quan của mỗi biến (variable, items) với các nhân tố (factors) tùy theo tình hình mà giảm số lượng các biến Chú ý Không có biến độc lập và biến phụ thuộc, các biến có cùng một tình trạng (cùng thang đo) KÍCH THƯỚC MẪU Tối thiểu là 50 quan sát và tốt hơn là lớn hơn 100 Số quan sát sẽ ảnh hưởng đến việc lựa chọn các tiêu chuẩn trong phân tích nhân tố. Qui tắc kinh nghiệm: số quan sát lớn hơn (ít nhất) 5 lần số biến (items) VÍ DỤ THANG ĐIỂM LIKERT 16
  17. LÝ THUYẾT KHOA HỌC Lý thuyết khoa học Là hệ thống luận điểm về mối liên hệ giữa các sự kiện khoa học Gồm: Hệ thống khái niệm Các mối liên hệ SƠ LƯỢC VỀ KHÁI NIỆM Khái niệm là công cụ để gọi tên một sự kiện khoa học, để tư duy và trao đổi thông tin, là cơ sở để nhận dạng bản chất của một sự vật Khái niệm gồm 2 bộ phận hợp thành Nội hàm là tất cả các thuộc tính bản chất của sự kiện Ngoại diện là tất cả các cá thể có chứa thuộc tính chỉ trong nội hàm Ví dụ: Khoa học Nội hàm là hệ thống trí thức về bản chất sự vật Ngoại diện là các loại khoa học: khoa học tự nhiên, xã hội, kỹ thuật… THÀNH PHẦN CỦA LÝ THUYẾT KHOA HỌC Các giới hạn trong nghiên cứu: giá trị, thời gian và không gian -> giả thuyết Giả thuyết lý thuyết Khái niệm Khái niệm Khả năng suy rộng nghiên cứu nghiên cứu Giả thuyết kiểm định Biến quan sát Biến quan sát 17
  18. MÔ HÌNH NGHIÊN CỨU VÀ CÁC KHÁI NIỆM Items 1.1 Items 1.2 LÃNH ĐẠO Items 1.3 … CƠ HỘI ĐTẠO VÀ Items 1.n TTIẾN LƯƠNG, THƯỞNG Items 2.1 SỰ TRUNG Items 2.2 THÀNH ĐỒNG NGHIỆP Items 2.3 … Items 2.n PHÚC LỢI BẢN CHẤT CVIỆC MÔI TRƯỜNG LV PHÂN TÍCH NHÂN TỐ Analyze Data Reduction Factor PHÂN TÍCH NHÂN TỐ Chọn tất cả các biến cần phân tích nhân tố vào ô Variables vào như hình vẽ Nhấn vào Descriptive s 18
  19. PHÂN TÍCH NHÂN TỐ Chọn Anti- image và KMO Phương pháp: Principal Components Tiêu chuẩn: Eigenvalues>=1 hoặc Cố định số nhân tố PHÂN TÍCH NHÂN TỐ Xoay Varima x Xóa các trọng số 0,5 (Hair và cộng sự, 2006) ĐK2: Sig. (Bartlett’s Test) < 0,05 (Hair và cộng sự, 2006) Câu hỏi: Nếu KMO 0,05 thì giải quyết thế nào? -=> Bỏ items có giá trị trên đường chéo của Anti-image Matrices < 0,3 Kiểm định Bartlett xem xét giả thuyết Ho: độ tương quan giữa các biến quan sát bằng không trong tổng thể. 19
  20. B2. XÁC ĐỊNH SỐ LƯỢNG NHÂN TỐ Vấn đề 1: Tương ứng với việc chọn Eigenvalues > 1 + Phương sai trích > 0,5 (50%) + Eigenvalues > 1 (Gerbing và Anderson, 1988) Vấn đề 2: Chọn số lượng nhân tố cố định trước Copyright @ 2009, LÊ VĂN HUY, Thông tin từ biểu Rotated Compon ent Matrix Bỏ các items có giá trị
nguon tai.lieu . vn