Xem mẫu

  1. TRƯỜNG ĐẠI HỌC CÔNG NGHIỆP TP. HỒ CHÍ MINH KHOA QUẢN TRỊ KINH DOANH NGHIÊN CỨU MARKETING CHƯƠNG 7 XỬ LÝ DỮ LIỆU- ỨNG DỤNG PHẦN MỀM SPSS 1 NỘI DUNG XỬ LÝ DỮ LIỆU A. Các phương pháp xử lý dữ liệu; 1. Các giai đoạn xử lý dữ liệu. 2. ỨNG DỤNG PHẦN MỀM SPSS B. Giới thiệ u phần mề m SPSS; 1. Chuẩn bị dữ liệ u; 2. Định biế n và nhập dữ liệ u; 3. Các phép biến đổi và thao tác trên tập dữ liệ u. 4. 2 A. XỬ LÝ DỮ LIỆU TRONG NC MAR Nhiệm vụ tổng quát của việc xử lý dữ liệu là “chuyển hóa” những ghi chép quan sát hoặc các câu trả lời dưới dạng “thô” thành các con số thống kê theo một trật tự nhất định để chuẩn bị cho việc phân tích và diễn giải các kết quả nghiên cứu thu được. 3
  2. 1. Các phương pháp xử lý dữ liệu Có 2 phương pháp xử lý dữ liệu cơ bản là : Xử lý Xử lý với trợ giúp thủ công của máy tính 4 2. Các giai đoạn xử lý dữ liệu Chuẩn bị dữ liệ u Nhập dữ liệu và lưu trữ Giai đọan này gổm 3 Giai đọan này cũng gồm 3 bước: bước: Ø Kiểm tra và hiệ u v Nhập dữ liệu vào máy chỉnh dữ liệ u; tính; Ø Định biế n dữ liệu; v Làm sạch dữ liệu; Ø Mã hóa dữ liệu. v Lưu trữ dữ liệu. 5 2.1.1 Kiểm tra và hiệu chỉnh dữ liệu Đây là bước kiểm tra chất lượng thông tin trong bảng câu hỏi nhằm đảm bảo không có bảng câu hỏi nào bị thiếu hoặc chứa đựng những thông tin sai sót theo yêu cầu thiết kế ban đầu. Người kiểm tra phải bảo đảm tính toàn vẹn và tính chính xác của từng bảng câu hỏi. Thông thường ở bước này các nhà nghiên cứu sẽ tiến hành kiểm tra các đặc tính cơ bản của bảng câu hỏi. Cụ thể: Ø Tính lôgíc của các câu trả lời; Ø Tính đầy đủ của một câu trả lời và của một bảng câu hỏi; Ø Tính hợp lý và xác thực của các câu trả lời. 6
  3. 2.1.1 Kiểm tra và hiệu chỉnh dữ liệu Quá trình kiểm tra, rà soát lại bảng câu hỏi là nhằm mục đích kiểm tra, phát hiện, sửa chữa và thông báo kịp thời cho người thu thập dữ liệu để tránh những sai sót tương tự. Để xử lý các sai sót phát hiện được qua kiểm tra, ta có thể chọn cách xử lý tuỳ thuộc vào mức độ sai sót. Cụ thể: § Trả về cho bộ phận thu thập dữ liệu nhằm làm sáng tỏ vấn đề; § Suy luận từ các câu trả lời khác; § Loại bỏ bảng câu hỏi. 7 2.1.2 Định biến dữ liệu Biến nghiên cứu là tập hợp các khái niệm có ý nghiã mô tả (định tính, định lượng ) cho mục tiêu nghiên cứu, được thể hiện bằng các ký hiệu (mã hoá) theo một qui ước nào đó. Biến nghiên cứu được thể hiện và là một bộ phận không thể thiếu trong mô hình nghiên cứu. Biến nghiên cứu có thể được phân loại theo kiểu dữ liệu (dạng thang đo). Biến định tính là biến chứa các giá trị quan sát ở dạng thang đo biểu danh và thang đo xếp hạng theo bậc. Biến định lượng là biến chứa các giá trị quan sát ở dạng thang đo khoảng và thang đo tỷ lệ. Trong bảng câu hỏi, mỗi một câu hỏi thường phải nhằm một mục đích quan sát nào đó. Do vậy, thường mỗi một câu hỏi tương ứng với một biến quan sát. 8 Thí dụ về biến nghiên cứu Giả sử rằng “Các yếu t ố tác động đến quyết định lựa chọn (mua) mì ăn li ền nhãn hiệu “Hảo Hảo” của khách hàng trên thị trường TP.HCM” là: (a1) Chất lượng SP; (a2) Khẩu vị phù hợp; (a3) Định lượng vừa đủ; (a4) Dễ dàng mua; (a5) Bao bì hấp dẫn. Khi đi sâu nghiên cứu về “ chất lượng” sản phẩm, các thuộc tính cấu thành kết luận chất lượng sản phẩm tốt của mì ăn li ền ”Hảo Hảo” gồm có: (a1.1) Sợi mì dai (khi ăn); (a1.2) Màu sắc của mì và nước dùng tươi ngon; (a1.3) Có thành phần dinh dưỡng cao; … Và các yếu tố còn lại cũng có các thuộc tính xác định chúng. 9
  4. Thí dụ về biến nghiên cứu Ở thí dụ trên các biến số: a1; a2; a3; a4 là các biến số trực tiếp (cấp 1) tác động đến quyết định lựa chọn mì ăn liến “ Hảo Hảo”. Còn các biến số a1.1; a1.2; … là các biến số cấp 2 ( Xem mô hình nghiên cứu). Thí dụ: Với câu hỏi “ Xin vui lòng cho biết sở thích của bạn đối với sữa chua Vinamilk? -> Ta có thể định biến nghiên cứu là: c3: Sở thích của khách hàng đối với sữa chua Vinamilk. 10 2.1.3 Mã hoá dữ liệu Mã hoá dữ liệu (Coding) là quá trình chuyển đổi các trả lời thành dạng mã số để nhập và xử lý dữ liệu. Mục đích của việc mã hoá là tạo nhãn (labels) cho các câu trả lời, thường là bằng các con số, hay ký hiệu. Một trả lời khi mã hoá thường sẽ thể hiện bằng 1ký tự chỉ số trả lời (số đo). Thí dụ: Với câu hỏi “ Xin vui lòng cho biết sở thích của bạn đối với sữa chua Vinamilk? Code: 1 2 3 4 5 Rất ghét Ghét Tạm được Rất thích Thích 11 2.1.3 Mã hoá dữ liệu Mã hoá còn giúp giảm thiểu các câu trả lời bằng cách nhóm các câu trả lời vào 1 nhóm có cùng ý nghiã. Mã hoá dữ liệu làm cơ sở cho việc thống kê phân tích dữ liệu. Tiến trình mã hoá có thể được tiến hành bằng việc lập Sổ mã hoá dữ liệ u như sau: v Xác định loại câu trả lời cho những câu hỏi tương ứng. Những câu trả lời này có thể thu thập từ một mẫu các bảng câu hỏi đã hoàn tất; v Xây dựng một danh mục liệt kê các câu trả lời; v Gán cho các câu trả lời một nhãn hiệu, ký hiệu, một giá trị (thường là một con số cụ thể). 12
  5. Hình 7.1: Sổ mã hoá dữ liệu Câu hỏi nghiên cứu Biến quan sát Mã trả lời Trả lời TT Vui lòng cho biết giới tính a1:Giới tính 1 1 Nam của bạn? Nữ 2 Xin vui lòng cho biết bạn a2: Nhóm tuổ i Dưới 18 tuổ i 2 1 thuộ c nhóm tuổ i nào dưới Từ 19- 25 2 đây? Từ 26-35 3 Từ 36-45 4 Trên 45 tuổ i 5 Xin vui lòng cho biết sở a3: Sở thích c ủa Rất ghét 3 1 thích của bạ n đố i với sữa khách hàng đố i 2 Ghét với sữa chua chua Vinamilk? Tạm được 3 Vinamilk. 4 Thích Rất thích 5 … 13 2.2 Nhập dữ liệu và lưu trữ 2.2.1- Nhập dữ liệ u vào máy tính CÁC BƯỚC CÔNG ViỆC (Inputing data into computer) 2.2.2- Làm sạch dữ liệu (Data cleaning) 2.2.3- Lưu trữ dữ liệu (Data saving) 2.2.1 Nhập d ữ liệu vào máy tính Bảng câu hỏi sau khi phỏng vấn, hiệu chỉnh và mã hoá dữ liệu thì công việc tiếp theo là nhập dữ liệu vào máy. Dữ liệu sau khi nhập xong ở dạng một ma trận được gọi là Ma trận dữ liệu (data matrix). Các phần mềm xử lý dữ liệu trong thống kê đều cần dữ liệu ở dạng ma trận. 15
  6. 2.2.2 Làm sạch dữ liệu Có 2 sai sót thường gặp trong nhập dữ liệu là : 2- Trả lời 1- Ô trống không hợp lý (Missing data) (Roque value) 16 2.2.2 Làm sạch dữ liệu Các ô trống là các ô của ma trận không chứa đựng dữ liệu trả lời. Nguyên nhân của sai sót là do thu thập dữ liệu bị sót, hoặc nhập dữ liệu sai. Để phát hiện ô trống ta có thể dùng phép đếm (count) theo các biến, vì số ô theo các biến sẽ phải có số lượng đúng bằng cỡ mẫu. Khi phát hiện sai sót phải chỉnh sửa lại. Trả lời không hợp lý là các trả lời có dữ liệu không nằm trong thang đo đã thiết kế. Ví dụ: thang đo có 5 bậc (từ 1-5), nhưng lại có dự liệu là 7, hoặc 33 là những dữ liệu không hợp lý. Để phát hiện các trả lời không hợp lý ta chỉ cần tính tần số theo cột (biến). Loại sai sót này chủ yếu do nhập liệu (do gõ sai). 2.2.3 Lưu trữ dữ liệu: Dưới dạng văn bản hoặc files. 17 3. TÓM TẮT DỮ LIỆU Dữ liệu sau khi được lưu giữ ở dạng ma trận dữ liệu, công việc tiếp theo là tóm tắt chúng để chuẩn bị cho các phương pháp phân tích tiếp theo. Dữ liệu thường được tóm tắt ở 3 dạng: Dạng thống kê Dạng bảng, biể u Dạng đồ thị 18
  7. 3.1 Tóm tắt dạng thống kê 2- Đo lường mức độ phân tán 1- Đo lường mức độ tập trung (Measure of dispersion) (Measure of centrality) Gồm có: Gồm có: v Trung bình (mean); v Phương sai (Variance); v Trung vị ( Median); vĐộ lệch chuẩ n v Mode. (Standard Deviation); v Khoảng biến thiên (Range) 19 3.1 Tóm tắt thống kê 3.1.1 Đo lường mức độ tập trung Ba đại lượng thường sử dụng trong đo lường mức độ tập trung của các quan sát có công thức tính như sau: Ø Trung bình của biến Xi ( i= 1,2,3… n) của mẫu: X = (1/n ). Σni=1Xi Ø Trung vị là giá trị nằm giữa của thang đo. Ø Mode là giá trị có tần số xuất hiện lớn nhất của một tập hợp các số đo. 20 3.1 Tóm tắt thống kê 3.1.2 Đo lường mức độ phân tán Ø Phương sai (S2) đo lường mức độ phân tán của một tập số đo xung quanh trung bình của nó. công thức tính như sau: S2 = [1/(n-1)]. Σni=1(Xi – X)2 Ø Căn bậc 2 của phương sai được gọi là độ lệch chuẩn (SD), S2 SD = Ø Khoảng biến thiên là khoảng cách giữa giá trị lớn nhất và giá trị nhỏ nhất của một tập số đo. 21
  8. 3.2 Tóm tắt dạng bảng Hai dạng bảng thường dùng trong nghiên cứu thị trường là: 1- Bảng đơn 2- Bảng chéo (Simple one-way (Cross- Tabulation) Tabulation) 22 Bảng đơn (mẫu) C3: Sở thích của khách hàng đối với sữa chua Vinamilk. Thang đo Tần số tuyệt Tần số Tần sô tích đối tương đối luỹ (%) (%) 5- Rất thích 40 20 20 4- Thích 100 50 70 3- Tạm được 30 15 85 2- Ghét 20 10 95 1- Rất ghét 10 5 100 Tổng N= 200 100% 23 Bảng chéo (mẫu) C7: Sở thích về sữa chua Vinamilk theo giới tính. Thang đo Tổng Giới tính Giới tính Nữ Nam 5- Rất thích 10 30 40 4- Thích 40 60 100 3- Tạm được 24 6 30 2- Ghét 18 2 20 1- Rất ghét 8 2 10 Tổng 100 100 N= 200 24
  9. 3.3 Tóm tắt dạng đồ thị Có 4 dạng đồ thị thường dùng là: Pie Bar chart chart Scatter Line graph graph 3.3 Tóm tắt dạng đồ thị Đồ thị thanh thường được sử dụng cho các câu hỏi cho nhiều trả lời để biểu diễn tần số - tổng của nó lớn hơn kích thước mẫu ( tần số tuyệt đối) hay lớn hơn 100% tần số tương đối. 26 3.3 Tóm tắt dạng đồ thị Đồ thị bánh thường được sử dụng cho các câu hỏi đơn trả lời để biểu diễn tần số tương đối – Tổng của nó bằng 100%. 27
  10. 3.3 Tóm tắt dạng đồ thị Đồ thị đường và Đồ thị phân tán được sử dụng để biểu diễn mối quan hệ giữa các biến. 28 4. CHỌN PHƯƠNG PHÁP PHÂN TÍCH DỮ LIỆU Để chọn phương pháp phân tích dữ liệu phù hợp, nhà nghiên cứu cần chú ý một số vấn đề có ý nghiã quan trọng sau: 1- Thang đo 4- Số biến 2- Phân bố cần phân tích của dữ liệ u 3- Phương pháp 5- Mối quan hệ chọn mẫu giữa các biến 29 4.1 Thang đo Có các cách phân tích thích hợp đối với mỗi loại thang đo: v Thang đo định danh chỉ cho chúng ta tính: tần số; kiể m định tần số (Chi- bình phương). v Thang đo xếp hạng theo thứ tự cho phép chúng ta tính: tần số; trung vị; kiể m định tần số; Kolmogorov – Smirnov; Wilcoxon. v Thang đo khoảng và thang đo tỷ lệ cho phép chúng ta thực hiện các phân tích nêu trên. Bên cạnh đó còn cho phép ta tính: giá trị trung bình; Các phép kiể m định Z, t. 30
  11. 4.2 Phân bố của dữ liệu Tuỳ theo sự phân bố của dữ liệu ở các dạng chúng ta có phương pháp phân tích tương thích: (1)Phân bố tham s ố (Parametric) : => dùng phép kiể m định Z,t; (2)Phân bố phi tham số (Non- Parametric): => dùng phép kiể m định tần số; Wilcoxon. 31 4.3 Phương pháp chọn mẫu 1- Chọn mẫu theo xác suất 2- Chọn mẫu phi xác suất Đây là phương pháp tốt nhất Việc chọn mẫu phi ngẫu nhiên để ta có thể chọn ra một mẫu hoàn toàn phụ thuộc vào kinh có khả năng đại biểu cho tổ ng nghiệ m và sự hiểu biết về tổng thể thể. Vì có thể tính được sai số của ngườ i nghiên cứu nên kết quả do chọn mẫu, nhờ đó ta có thể điều tra thường mang tính chủ áp dụng được các phương quan của người nghiên cứu. Mặt pháp ước lượng thống kê, khác, ta không thể tính được sai số kiể m định giả thuyết thống kê do chọn mẫu, do đó không thể áp trong xử lý d ữ liệu để suy rộ ng dụng phương pháp ước lượng kết quả trên mẫu cho tổng thể thống kê để suy rộng kết quả trên mẫu cho tổng thể chung chung 32 4.4 Số biến cần phân tích Các nhà nghiên cứu thường căn cứ vào số lượng biến số cần phân tích để phân loại các phương pháp phân tích dữ liệu: Ø Khi số bi ến được phân tích là 1 thì được gọi là phương pháp phân tích đơn biến (Univariate data analysic); Ø Khi số biến được phân tích là 2 thì gọi là phương pháp phân tích nhị biến (Bivariate data analysic); Ø Khi có nhiều biến để phân tích thì các phương pháp phân tích đó gọi là phương pháp phân tích đa biế n (Multivariate data analysic). 33
  12. 4.5 Mối quan hệ giữa các biến Xét về mối liên hệ giữa các biến, chúng ta có hai nhóm phân tích chính: 2- Phân tích 1- Phân tích phụ thuộc phụ thuộc lẫn nhau 34 4.5.1 Phân tích phụ thuộc Khi các biến phân tích được chia thành hai nhóm: Bíên độc lập – biến phụ thuộc thí phương pháp phân tích là phân tích phụ thuộc. Các phương pháp phổ bi ến trong nhóm này có thể kể như: (1)Phân tích hồi qui đa biến (Multiple regression analysis); (2)Phân tích phân biệt (Discriminant analysis); (3)Phân tích phương sai đa biến (Multivariate analysis of variance). 35 4.5.2 Phân tích phụ thuộc lẫn nhau Trong trường hợp không có biến độc lập và biến phụ thuộc mà các biến này phụ thuộc lẫn nhau thì phương pháp phân tích là phân tích phụ thuộc lẫn nhau. Các phương pháp thường dùng trong nhóm này như: (1)Phân tích yếu tố khám phá (Exploratory factor analysis); (2)Phân tích nhóm đồng nhất (Cluster analysis); (3)Phân tích đa hướng (Multidimensional Scaling);… 36
  13. B: ỨNG DỤNG SPSS TRONG XỬ LÝ DỮ LIỆU 3- Các thao tác và phép bi ến đổi trên tập dữ liệu 2- Định biến và nhập dữ liệu trên SPSS 1- Giới thiệu phần mềm SPSS 1. Giới thiệu phần mềm SPSS SPSS (viết tắt của Statistical Package for the Social Sciences) là một chương trình máy tính phục vụ công tác thống kê. SPSS được sử dụng rộng rãi trong công tác thống kê xã hội. Thế hệ đầu tiên của SPSS được đưa ra từ năm 1968. Thế hệ mới nhất là thế hệ (Verison) 18.0 được giới thiệu từ tháng 8 năm 2008, có cả phiên bản cho các hệ điều hành Microsoft Windows, Mac, và Linux / UNIX. Trong phạm vi môn học này, chúng ta thống nhất sử dụng SPSS 15.0 cho việc xử lý dữ liệu. 38 1. Giới thiệu phần mềm SPSS Phần mềm SPSS có tất cả 3 dạng màn hình: Màn hình hiể n thị dữ liệu (Data view) Màn hình Màn hình hiển thị kết quả hiển thị biế n (Variables view) (Output) 39
  14. 1. Giới thiệu phần mềm SPSS Màn hình quản lý dữ liệu (Data view): là nơi lưu trữ dữ liệu nghiên cứu với một cấu trúc cơ sở dữ liệu (data) bao gồm: Cột (Colum)- Đại diện cho bi ến quan sát, mỗi cột chứa đựng các dữ liệu (n dữ liệu); Hàng (Row)- Đại diện cho 1 phần tử được quan sát, mỗi hàng chức đựng tất cả các câu trả lời (dữ liệu) của một đối tượng nghiên cứu; và ô (Cell)- Chứa đựng một kết quả trả lời tương ứng với một câu hỏi khảo sát (biến) và một phần tử. 40 1. Giới thiệu phần mề m SPSS Màn hình quản lý biến (Variable view): Là nơi quản lý các biến (Variable) và các thông số đặc tính của biến. Trong màn hình này mỗi dòng quản lý một biến, và mỗi cột thể hi ện một thông số đặc tính của biến. Cụ thể như sau: 41 1. Giới thiệu phần mềm SPSS - Tên biến ( Name): Là tên đại diện cho biến. Tên biến sẽ hiển th ị trên đầu mỗi cột trong màn hình quản lý dữ liệu. - Lọai biến (Type): Thể hiện định dạng dữ liệu trong biến: Dang số- Numeric (mặc định); Dạng chuỗ i – String; Dạng ngày tháng – Date; Dạng đơn vị tiền tệ - Currency;… - Chiều rộng cột (Width): Ch ỉ số lượng ký tự được hiển th ị; - Hiển thị số lẻ (Decimals) : Thể hiện số lượng con số sau dấu phẩy được hiển th ị; - Nhãn của biến (Label): Nêu rõ hơn về ý ngh ĩa của biến số; - Giá trị trong biến (Values): Cho phép khai báo các giá trị trong biến vớ i ý ngh ĩa cụ thể; - Giá trị khuyết (Missing): Do thiế t kế bảng câu hỏi có một s ố giá trị ch ỉ mang tính chất quản lý, không có ý nghĩa phân tích. Để lọai bỏ biến này ta cần khai báo nó như là giá tr ị khuyết để lọai bỏ giá trị này ra khỏi các phân tích thống kê. - Dạng thang đo (Measures): Hiển th ị dạng thang đo của giá tr ị trong biến. 42
  15. 1. Giới thiệu phần mềm SPSS Màn hình hiển thị kết quả (output): Các phép phân tích thống kê sẽ cho ra các kết quả như bảng biểu, đồ thị và các kết quả kiểm đ ịnh. Các kết quả này sẽ được truy xuất ra một màn hình, và được lưu giữ dưới một tập tin khác (.SPO). Màn hình này cho phép ta xem và lưu giữ kết quả phân tích. 43 2. Định biến và nhập dữ liệu trên SPSS 2.1 Định biến trên SPSS Định biến trong màn hình quản lý biến (Variables view) thực hiện trước khi nhập dữ liệu vào máy tính. Qui trình định biến như sau: 1. Đặt tên biến (Name); 2. Định dạng biến (Type); 3. Xác định số lượng con số hiển thị cho giá trị biến (Width) và số lượng con số lẻ hiển thị (Decimals); 4. Gán nhãn cho biến (Variable Label); 5. Định tên cho các giá trị trong biến (Value labels); 6. Định nghiã các giá trị khuyết (Missing values); 7. Định kích thước cột (Column format); 8. Định vị trí hiển thị giá trị (Align); 9. Định dạng thang đo (Measurement) 44 2. Định biến và nhập dữ liệu trên SPSS 2.2 Nhập dữ liệu trên SPSS Dữ liệu được nhập từ màn hình quản lý dữ liệu (Data view). Màn hình này thể hiện ra một ma trận dữ liệu gồm: Cột; hàng; và ô. Với các cột lần lượt tương ứng với các biến, các dòng tương ứng với mỗi phần tử. Ta cũng có thể nhập dữ liệu từ các phần mềm khác như Excel, Fox sau đó chuyển vào SPSS bằng lệnh Copy. 45
  16. 3. Các phép biến đổi và thao tác trên tập dữ liệu Có 5 phép biến đổi trên tập dữ liệu thường sử dụng là: Làm sạch Mã hoá Và tóm tắt lại dữ liệu Hợp nhất tập dữ liệu Đánh giá độ tin cậy của thang đo Tách tập dữ liệu 3.1 Mã hoá lại Mã hoá lại (Recode) là công cụ biến đổi các giá trị (đã mã hoá) thành các mã hoá mới phù hợp với đòi hỏi của việc phân tích dữ liệu. SPSS cung cấp cho ta 2 loại mã hoá lại là: 2- Mã hoá 1- Mã hoá lại vào biến khác trên cùng 1 biến (Recode into difference (Recode into same variable) Variable) 47 3.1 Mã hoá lại Mã hoá lại trên cùng một biến thì các giá trị được mã hoá lại sẽ thay thế cho các giá trị cũ (các giá trị này sẽ mất đi), cần chú ý rằng các giá trị vừa được mã hoá lại chưa có nhãn, do đó sau khi recode ta phải khi báo lại nhãn cho giá trị. Qui trình này được thực hiện qua các bước sau: § Transform/ Recode/ Recode into same variables ta sẽ có hộp thoạ i (7.4); § Chọn và chuyển các biến cần mã hoá lạ i sang hộp thoạ i variables, nhấn Old and new value để chuyển các giá tr ị cũ thành các giá tr ị mớ i. Old value dùng để khai báo các giá trị cũ cần chuyển đổi, New value dùng để khai báo giá trị mớ i sẽ thay thế cho giá trị cũ. Add để lưu giữ sự chuyển đổ i này. 48
  17. 3.1 Mã hoá lại Mã hoá lại vào biến khác thì các giá trị hiện tại của một biến trở thành giá trị mới trong một biến khác. Qui trình này thực hiện như sau: § Transform/ Recode into different variables ta sẽ có hộp thoại (7.7); § Chọn và chuyển các biến cần mã hoá lại vào hộp thoại variables, khai báo tên biến mới và nhãn biến mới trong hộp thoại Output variable. Nhấn Change để xác nhận khai báo này. 49 3.2 Làm sạch và tóm tắt dữ liệu với SPSS Để làm sạch dữ liệu với SPSS ta chỉ cần thực hiện tính tần số với thao tác đơn giản: Ø Analyze/ Descriptive statistics/ Frequencies. Ta có hộp thoại tóm tắt tần số, ta cần chọn và đưa các biến cần tính vào ô variables. Nhấn OK ta sẽ có bảng tóm tắt tần số. Các bạn chú ý phần Missing (lỗi) nếu có thì phải hiệu chỉnh lại dữ liệu nhé. Ø Để tóm tắt thống kê dữ liệu trên SPSS như: (1) Min; (2) Max; (3) Mean; (4) Phương sai chỉ cần thao tác. qTại hộp thoại tóm tắt tần số ta chọn Statistics rồi chọn ô cần thiết rồi Continue/ OK bạn sẽ có kết quả ngay lập tức. 50 3.3 Đánh giá độ tin cậy của thang đo bằng Cronbach Alpha trên SPSS Khi thực hiện các nghiên cứu định lượng, người nghiên cứu phải sử dụng nhiều thang đo lường khác nhau. Hiện tượng kinh tế - xã hội vốn rất phức tạp nên việc lượng hoá các khái niệm nghiên cứu đòi hỏi phải có sự kiểm tra độ tin cậy của các thang đo trước khi sử dụng. Phần này chúng ta sẽ thực hành kiểm tra độ tin cậy của thang đo bằng công cụ Cronbach Alpha trên SPSS. Thí dụ: Gi ả sử rằng “Các yế u tố tác động đến quyết định lựa chọn (mua) mì ăn li ền nhãn hiệu “Hảo Hảo” của khách hàng trên thị trường TP.HCM” là: (a1) Chất lượng SP; (a2) Khẩu vị phù hợp; (a3) Định lượng vừa đủ; (a4) Dễ dàng mua; (a5) Bao bì hấp dẫn. 51
  18. 3.3 Đánh giá độ tin cậy của thang đo bằng Cronbach Alpha trên SPSS Người nghiên cứu quan tâm và muốn đo lường xem trong 5 nhân tố nêu trện thì mức độ tác động của các yếu tố nào là mạnh hơn đến quyết định lựa chọn sản phẩ m. Muốn vậy, ta phải xây dựng các câu hỏi và thang đo có độ tin cậy về khái niệm “ Các yếu tố tác động đến quyết định lựa chọn (mua) mì ăn liền “Hảo Hảo”. Theo nghiên cứu trước đó thì các yếu tố quyết định… gồm 5 khiá cạnh. Chúng ta sẽ xem xét tính toán Cronbach Alpha đối với các mục hỏi của từng khiá cạnh. Câu hỏi liên quan đến đo lường mức độ tác động của các yếu tố … như sau: 52 3.3 Đánh giá độ tin cậy của thang đo bằng Cronbach Alpha trên SPSS Xin bạn vui lòng trả lời bằng cách khoanh tròn vào một con số ở từng dòng. Nhữ ng con số này thể hiện mức độ bạn đồng ý hay không đồng ý đối với các phát biểu theo qui ước sau: Rất không đồng ý Không đồng ý Trung lập Đồng ý Rất đồng ý 1 2 3 4 5 a1: Chất lượng c ủa mì ăn liền “Hảo Hảo” là yế u tố quyết 1 2 3 4 5 định việc tôi lựa chọn nó: a2: Khẩu vị phù hợp là yếu tố quyế t định việc tôi lựa chọn 1 2 3 4 5 mì ăn liền “Hảo Hảo” a3: Mì ăn liền “Hảo Hảo” có định lượng vừa dủ là yếu tố 1 2 3 4 5 quyết định việc tôi lựa chọn nó. a4: Việc tôi cá thể mua mì ăn liền “Hảo Hảo” một cách dễ 1 2 3 4 5 dàng, ở mọi nơi là yếu tố quyế t định việc tôi lựa chọn nó. a5: Bao bì của mì ăn liền “Hảo Hảo” rất hấp dẫn là yế u tố 1 2 3 4 5 quyết định ciệc tôi lựa chọn nó. 53 3.3 Đánh giá độ tin cậy của thang đo bằng Cronbach Alpha trên SPSS Vấn đề ở đây là đây có phải là một thang đo tốt cho một khía cạnh khái niệm mà ta quan tâm hay không? Để trả lời câu hỏi này ta sẽ tính toán đại lượng Cronbach Alpha. Một nghiên cứu sơ bộ với cỡ mẫu n0 > 30 cho ta ma trận mẫu, sau khi làm sạch dữ liệu và lưu mẫu ta tiến hành tính toán Cronbach Alpha: § Analys / Scale/ Reliability Analysis. Hộp thoại hiện ra ta chọn các biến từ a1 – a5 đưa vào hộp Items. Sau đó chọn Statistics. § Trong hộp thoại Statistics, hãy nhấp mouse để chọn các đại lượng cơ bản nhất như: Item; Scale; Scale if item deleted sau đó nhấn Continue trở về hộp thoại đầu tiên và chọn OK kết quả tính toán Cronbach Alpha sẽ hiển thị tại màn hình Output. 54
  19. 3.3 Đánh giá độ tin cậy của thang đo bằng Cronbach Alpha trên SPSS Với kết quả Alpha từ : § >0.8 -> Là thang đo tốt; § 0.7- 0.8 -> Là thang đo sử dụng được; § 0.6 – 0.7 -> Là thang đo sử dụng được đối với những khái niệm mới, hoặc cho SV mới bắt đầu học nghiên cứu; § < 0.6 -> Là thang đo không đảm bảo độ tin cậy, không sử dụng được và bạn phải sửa chữa bảng câu hỏi. Chú ý cột Alpha if item deleted nếu có tồn tại giá trị lớn hơn Alpha thì hãy loại bỏ đi mục hỏi đó (mức độ tác động đến quyết định … của yếu tố đó là thấp/ không đáng kể) do đó ta loại bỏ bớt đi. 55 3.4 Tách tập dữ liệu (Split file) Công cụ Split file cho phép tách dữ liệu trong tập dữ liệu đang quan sát thành những nhóm nhỏ riêng biệt. Sau khi thực hiện lệnh này các phân tích xử lý thống kê sẽ cho kết quả riêng biệt theo từng nhóm được tách ra này. ØData/ Split file ta có hộp thoại. Ta chọn Group based on list và chọn các biến để phân tách dữ liệu, và OK. 56 3.5 Hợp nhất các tập dữ liệu (Merge files) SPSS cho phép ta hợp nhất các dữ liệu/ biến quan sát từ trong một tập dữ liệu vào tập dữ liệu đang sử dụng. Cả hai tạo ra một tập dữ liệu/ biến mới chứa đựng tất cả các quan sát từ 2 tập dữ liệu. Ø Add Cases/ hay Add Variables và OK. 57
  20. C. Hướng dẫn tiểu luận môn học Sau khi hoàn chỉnh Bảng câu hỏi, và điều tra sơ bộ với cỡ mẫu n0 > 30. Các bạn thực hiện việc xử lý dữ liệu với SPSS, trong đó chú ý: 1.Hiệu chỉnh và làm sạch dữ liệu; 2.Tóm tắt dữ liệu (Dạng bảng, dạng thống kê, dạng đồ thị); 3.Kiểm định độ tin cậy của thang đo với SPSS; 4.Xác định cỡ mẫu cho nghiên cứu chính thức (vận dụng Excell). 58 XIN CẢM ƠN CÁC BẠN! 59
nguon tai.lieu . vn