Xem mẫu
- TRƯỜNG ĐẠI HỌC CÔNG NGHIỆP TP. HỒ CHÍ MINH
KHOA QUẢN TRỊ KINH DOANH
NGHIÊN CỨU
MARKETING
CHƯƠNG 7
XỬ LÝ DỮ LIỆU-
ỨNG DỤNG PHẦN MỀM SPSS
1
NỘI DUNG
XỬ LÝ DỮ LIỆU
A.
Các phương pháp xử lý dữ liệu;
1.
Các giai đoạn xử lý dữ liệu.
2.
ỨNG DỤNG PHẦN MỀM SPSS
B.
Giới thiệ u phần mề m SPSS;
1.
Chuẩn bị dữ liệ u;
2.
Định biế n và nhập dữ liệ u;
3.
Các phép biến đổi và thao tác trên tập dữ liệ u.
4.
2
A. XỬ LÝ DỮ LIỆU TRONG NC MAR
Nhiệm vụ tổng quát của việc xử lý dữ liệu là “chuyển hóa”
những ghi chép quan sát hoặc các câu trả lời dưới dạng
“thô” thành các con số thống kê theo một trật tự nhất định
để chuẩn bị cho việc phân tích và diễn giải các kết quả
nghiên cứu thu được.
3
- 1. Các phương pháp xử lý dữ liệu
Có 2 phương pháp xử lý dữ liệu cơ bản là :
Xử lý
Xử lý
với trợ giúp
thủ công
của máy tính
4
2. Các giai đoạn xử lý dữ liệu
Chuẩn bị dữ liệ u Nhập dữ liệu và lưu trữ
Giai đọan này gổm 3 Giai đọan này cũng gồm 3
bước: bước:
Ø Kiểm tra và hiệ u v Nhập dữ liệu vào máy
chỉnh dữ liệ u; tính;
Ø Định biế n dữ liệu; v Làm sạch dữ liệu;
Ø Mã hóa dữ liệu. v Lưu trữ dữ liệu.
5
2.1.1 Kiểm tra và hiệu chỉnh dữ liệu
Đây là bước kiểm tra chất lượng thông tin trong bảng
câu hỏi nhằm đảm bảo không có bảng câu hỏi nào bị thiếu
hoặc chứa đựng những thông tin sai sót theo yêu cầu thiết
kế ban đầu. Người kiểm tra phải bảo đảm tính toàn vẹn và
tính chính xác của từng bảng câu hỏi. Thông thường ở bước
này các nhà nghiên cứu sẽ tiến hành kiểm tra các đặc tính
cơ bản của bảng câu hỏi. Cụ thể:
Ø Tính lôgíc của các câu trả lời;
Ø Tính đầy đủ của một câu trả lời và của một bảng câu hỏi;
Ø Tính hợp lý và xác thực của các câu trả lời.
6
- 2.1.1 Kiểm tra và hiệu chỉnh dữ liệu
Quá trình kiểm tra, rà soát lại bảng câu hỏi là nhằm
mục đích kiểm tra, phát hiện, sửa chữa và thông báo kịp
thời cho người thu thập dữ liệu để tránh những sai sót
tương tự. Để xử lý các sai sót phát hiện được qua kiểm tra,
ta có thể chọn cách xử lý tuỳ thuộc vào mức độ sai sót. Cụ
thể:
§ Trả về cho bộ phận thu thập dữ liệu nhằm làm sáng tỏ vấn
đề;
§ Suy luận từ các câu trả lời khác;
§ Loại bỏ bảng câu hỏi.
7
2.1.2 Định biến dữ liệu
Biến nghiên cứu là tập hợp các khái niệm có ý nghiã mô tả
(định tính, định lượng ) cho mục tiêu nghiên cứu, được thể
hiện bằng các ký hiệu (mã hoá) theo một qui ước nào đó.
Biến nghiên cứu được thể hiện và là một bộ phận không thể
thiếu trong mô hình nghiên cứu.
Biến nghiên cứu có thể được phân loại theo kiểu dữ
liệu (dạng thang đo). Biến định tính là biến chứa các giá
trị quan sát ở dạng thang đo biểu danh và thang đo xếp
hạng theo bậc. Biến định lượng là biến chứa các giá trị
quan sát ở dạng thang đo khoảng và thang đo tỷ lệ. Trong
bảng câu hỏi, mỗi một câu hỏi thường phải nhằm một mục
đích quan sát nào đó. Do vậy, thường mỗi một câu hỏi
tương ứng với một biến quan sát.
8
Thí dụ về biến nghiên cứu
Giả sử rằng “Các yếu t ố tác động đến quyết định lựa chọn
(mua) mì ăn li ền nhãn hiệu “Hảo Hảo” của khách hàng trên thị
trường TP.HCM” là: (a1) Chất lượng SP; (a2) Khẩu vị phù hợp;
(a3) Định lượng vừa đủ; (a4) Dễ dàng mua; (a5) Bao bì hấp dẫn.
Khi đi sâu nghiên cứu về “ chất lượng” sản phẩm, các thuộc tính
cấu thành kết luận chất lượng sản phẩm tốt của mì ăn li ền ”Hảo
Hảo” gồm có: (a1.1) Sợi mì dai (khi ăn); (a1.2) Màu sắc của mì
và nước dùng tươi ngon; (a1.3) Có thành phần dinh dưỡng cao;
… Và các yếu tố còn lại cũng có các thuộc tính xác định chúng.
9
- Thí dụ về biến nghiên cứu
Ở thí dụ trên các biến số: a1; a2; a3; a4 là các biến số
trực tiếp (cấp 1) tác động đến quyết định lựa chọn mì ăn
liến “ Hảo Hảo”. Còn các biến số a1.1; a1.2; … là các biến
số cấp 2 ( Xem mô hình nghiên cứu).
Thí dụ: Với câu hỏi “ Xin vui lòng cho biết sở thích của bạn
đối với sữa chua Vinamilk? -> Ta có thể định biến nghiên
cứu là:
c3: Sở thích của khách hàng đối với sữa chua Vinamilk.
10
2.1.3 Mã hoá dữ liệu
Mã hoá dữ liệu (Coding) là quá trình chuyển đổi các
trả lời thành dạng mã số để nhập và xử lý dữ liệu. Mục đích
của việc mã hoá là tạo nhãn (labels) cho các câu trả lời,
thường là bằng các con số, hay ký hiệu. Một trả lời khi mã
hoá thường sẽ thể hiện bằng 1ký tự chỉ số trả lời (số đo).
Thí dụ: Với câu hỏi “ Xin vui lòng cho biết sở thích của bạn đối
với sữa chua Vinamilk?
Code: 1 2 3 4 5
Rất ghét Ghét Tạm được Rất thích
Thích
11
2.1.3 Mã hoá dữ liệu
Mã hoá còn giúp giảm thiểu các câu trả lời bằng cách
nhóm các câu trả lời vào 1 nhóm có cùng ý nghiã. Mã hoá dữ
liệu làm cơ sở cho việc thống kê phân tích dữ liệu. Tiến trình
mã hoá có thể được tiến hành bằng việc lập Sổ mã hoá dữ
liệ u như sau:
v Xác định loại câu trả lời cho những câu hỏi tương ứng.
Những câu trả lời này có thể thu thập từ một mẫu các bảng
câu hỏi đã hoàn tất;
v Xây dựng một danh mục liệt kê các câu trả lời;
v Gán cho các câu trả lời một nhãn hiệu, ký hiệu, một giá trị
(thường là một con số cụ thể).
12
- Hình 7.1: Sổ mã hoá dữ liệu
Câu hỏi nghiên cứu Biến quan sát Mã trả lời Trả lời
TT
Vui lòng cho biết giới tính a1:Giới tính
1 1 Nam
của bạn? Nữ
2
Xin vui lòng cho biết bạn a2: Nhóm tuổ i Dưới 18 tuổ i
2 1
thuộ c nhóm tuổ i nào dưới Từ 19- 25
2
đây?
Từ 26-35
3
Từ 36-45
4
Trên 45 tuổ i
5
Xin vui lòng cho biết sở a3: Sở thích c ủa Rất ghét
3 1
thích của bạ n đố i với sữa khách hàng đố i 2 Ghét
với sữa chua
chua Vinamilk?
Tạm được
3
Vinamilk.
4 Thích
Rất thích
5
…
13
2.2 Nhập dữ liệu và lưu trữ
2.2.1- Nhập dữ liệ u vào máy tính
CÁC BƯỚC CÔNG ViỆC
(Inputing data into computer)
2.2.2- Làm sạch dữ liệu
(Data cleaning)
2.2.3- Lưu trữ dữ liệu
(Data saving)
2.2.1 Nhập d ữ liệu vào máy tính
Bảng câu hỏi sau khi phỏng vấn, hiệu chỉnh và mã
hoá dữ liệu thì công việc tiếp theo là nhập dữ liệu vào máy.
Dữ liệu sau khi nhập xong ở dạng một ma trận được gọi là
Ma trận dữ liệu (data matrix). Các phần mềm xử lý dữ
liệu trong thống kê đều cần dữ liệu ở dạng ma trận.
15
- 2.2.2 Làm sạch dữ liệu
Có 2 sai sót thường gặp trong nhập dữ liệu là :
2- Trả lời
1- Ô trống
không hợp lý
(Missing data)
(Roque value)
16
2.2.2 Làm sạch dữ liệu
Các ô trống là các ô của ma trận không chứa đựng
dữ liệu trả lời. Nguyên nhân của sai sót là do thu thập dữ
liệu bị sót, hoặc nhập dữ liệu sai. Để phát hiện ô trống ta có
thể dùng phép đếm (count) theo các biến, vì số ô theo các
biến sẽ phải có số lượng đúng bằng cỡ mẫu. Khi phát hiện
sai sót phải chỉnh sửa lại.
Trả lời không hợp lý là các trả lời có dữ liệu không
nằm trong thang đo đã thiết kế. Ví dụ: thang đo có 5 bậc (từ
1-5), nhưng lại có dự liệu là 7, hoặc 33 là những dữ liệu
không hợp lý. Để phát hiện các trả lời không hợp lý ta chỉ
cần tính tần số theo cột (biến). Loại sai sót này chủ yếu do
nhập liệu (do gõ sai).
2.2.3 Lưu trữ dữ liệu: Dưới dạng văn bản hoặc files.
17
3. TÓM TẮT DỮ LIỆU
Dữ liệu sau khi được lưu giữ ở dạng ma trận dữ liệu, công
việc tiếp theo là tóm tắt chúng để chuẩn bị cho các phương
pháp phân tích tiếp theo. Dữ liệu thường được tóm tắt ở 3
dạng:
Dạng thống kê
Dạng bảng, biể u Dạng đồ thị
18
- 3.1 Tóm tắt dạng thống kê
2- Đo lường mức độ phân tán
1- Đo lường mức độ tập trung
(Measure of dispersion)
(Measure of centrality)
Gồm có: Gồm có:
v Trung bình (mean); v Phương sai (Variance);
v Trung vị ( Median); vĐộ lệch chuẩ n
v Mode. (Standard Deviation);
v Khoảng biến thiên
(Range)
19
3.1 Tóm tắt thống kê
3.1.1 Đo lường mức độ tập trung
Ba đại lượng thường sử dụng trong đo lường mức độ
tập trung của các quan sát có công thức tính như sau:
Ø Trung bình của biến Xi ( i= 1,2,3… n) của mẫu:
X = (1/n ). Σni=1Xi
Ø Trung vị là giá trị nằm giữa của thang đo.
Ø Mode là giá trị có tần số xuất hiện lớn nhất của một tập
hợp các số đo.
20
3.1 Tóm tắt thống kê
3.1.2 Đo lường mức độ phân tán
Ø Phương sai (S2) đo lường mức độ phân tán của một tập
số đo xung quanh trung bình của nó. công thức tính như
sau:
S2 = [1/(n-1)]. Σni=1(Xi – X)2
Ø Căn bậc 2 của phương sai được gọi là độ lệch chuẩn
(SD),
S2
SD =
Ø Khoảng biến thiên là khoảng cách giữa giá trị lớn nhất
và giá trị nhỏ nhất của một tập số đo.
21
- 3.2 Tóm tắt dạng bảng
Hai dạng bảng thường dùng trong nghiên cứu
thị trường là:
1- Bảng đơn
2- Bảng chéo
(Simple one-way
(Cross- Tabulation)
Tabulation)
22
Bảng đơn (mẫu)
C3: Sở thích của khách hàng đối với sữa chua Vinamilk.
Thang đo Tần số tuyệt Tần số Tần sô tích
đối tương đối luỹ (%)
(%)
5- Rất thích 40 20 20
4- Thích 100 50 70
3- Tạm được 30 15 85
2- Ghét 20 10 95
1- Rất ghét 10 5 100
Tổng N= 200 100%
23
Bảng chéo (mẫu)
C7: Sở thích về sữa chua Vinamilk theo giới tính.
Thang đo Tổng
Giới tính Giới tính
Nữ
Nam
5- Rất thích 10 30 40
4- Thích 40 60 100
3- Tạm được 24 6 30
2- Ghét 18 2 20
1- Rất ghét 8 2 10
Tổng 100 100 N= 200
24
- 3.3 Tóm tắt dạng đồ thị
Có 4 dạng đồ thị thường dùng là:
Pie
Bar
chart
chart
Scatter
Line
graph
graph
3.3 Tóm tắt dạng đồ thị
Đồ thị thanh thường được
sử dụng cho các câu hỏi
cho nhiều trả lời để biểu
diễn tần số - tổng của nó
lớn hơn kích thước mẫu (
tần số tuyệt đối) hay lớn
hơn 100% tần số tương
đối.
26
3.3 Tóm tắt dạng đồ thị
Đồ thị bánh thường
được sử dụng cho các
câu hỏi đơn trả lời để
biểu diễn tần số tương
đối – Tổng của nó
bằng 100%.
27
- 3.3 Tóm tắt dạng đồ thị
Đồ thị đường và Đồ thị phân tán được sử dụng để biểu
diễn mối quan hệ giữa các biến.
28
4. CHỌN PHƯƠNG PHÁP PHÂN TÍCH
DỮ LIỆU
Để chọn phương pháp phân tích dữ liệu phù hợp, nhà
nghiên cứu cần chú ý một số vấn đề có ý nghiã quan
trọng sau:
1- Thang đo
4- Số biến
2- Phân bố
cần phân tích
của dữ liệ u
3- Phương pháp 5- Mối quan hệ
chọn mẫu giữa các biến
29
4.1 Thang đo
Có các cách phân tích thích hợp đối với mỗi loại
thang đo:
v Thang đo định danh chỉ cho chúng ta tính: tần số; kiể m
định tần số (Chi- bình phương).
v Thang đo xếp hạng theo thứ tự cho phép chúng ta tính:
tần số; trung vị; kiể m định tần số; Kolmogorov –
Smirnov; Wilcoxon.
v Thang đo khoảng và thang đo tỷ lệ cho phép chúng ta
thực hiện các phân tích nêu trên. Bên cạnh đó còn cho phép
ta tính: giá trị trung bình; Các phép kiể m định Z, t.
30
- 4.2 Phân bố của dữ liệu
Tuỳ theo sự phân bố của dữ liệu ở các dạng chúng ta
có phương pháp phân tích tương thích:
(1)Phân bố tham s ố (Parametric) : => dùng phép kiể m
định Z,t;
(2)Phân bố phi tham số (Non- Parametric): => dùng
phép kiể m định tần số; Wilcoxon.
31
4.3 Phương pháp chọn mẫu
1- Chọn mẫu theo xác suất 2- Chọn mẫu phi xác suất
Đây là phương pháp tốt nhất Việc chọn mẫu phi ngẫu nhiên
để ta có thể chọn ra một mẫu hoàn toàn phụ thuộc vào kinh
có khả năng đại biểu cho tổ ng nghiệ m và sự hiểu biết về tổng thể
thể. Vì có thể tính được sai số của ngườ i nghiên cứu nên kết quả
do chọn mẫu, nhờ đó ta có thể điều tra thường mang tính chủ
áp dụng được các phương quan của người nghiên cứu. Mặt
pháp ước lượng thống kê, khác, ta không thể tính được sai số
kiể m định giả thuyết thống kê do chọn mẫu, do đó không thể áp
trong xử lý d ữ liệu để suy rộ ng dụng phương pháp ước lượng
kết quả trên mẫu cho tổng thể thống kê để suy rộng kết quả trên
mẫu cho tổng thể chung
chung
32
4.4 Số biến cần phân tích
Các nhà nghiên cứu thường căn cứ vào số lượng
biến số cần phân tích để phân loại các phương pháp phân
tích dữ liệu:
Ø Khi số bi ến được phân tích là 1 thì được gọi là phương
pháp phân tích đơn biến (Univariate data analysic);
Ø Khi số biến được phân tích là 2 thì gọi là phương pháp
phân tích nhị biến (Bivariate data analysic);
Ø Khi có nhiều biến để phân tích thì các phương pháp
phân tích đó gọi là phương pháp phân tích đa biế n
(Multivariate data analysic).
33
- 4.5 Mối quan hệ giữa các biến
Xét về mối liên hệ giữa các biến, chúng ta có hai
nhóm phân tích chính:
2- Phân tích
1- Phân tích
phụ thuộc
phụ thuộc
lẫn nhau
34
4.5.1 Phân tích phụ thuộc
Khi các biến phân tích được chia thành hai nhóm:
Bíên độc lập – biến phụ thuộc thí phương pháp phân tích
là phân tích phụ thuộc. Các phương pháp phổ bi ến trong
nhóm này có thể kể như:
(1)Phân tích hồi qui đa biến (Multiple regression
analysis);
(2)Phân tích phân biệt (Discriminant analysis);
(3)Phân tích phương sai đa biến (Multivariate analysis of
variance).
35
4.5.2 Phân tích phụ thuộc lẫn nhau
Trong trường hợp không có biến độc lập và biến
phụ thuộc mà các biến này phụ thuộc lẫn nhau thì
phương pháp phân tích là phân tích phụ thuộc lẫn nhau.
Các phương pháp thường dùng trong nhóm này như:
(1)Phân tích yếu tố khám phá (Exploratory factor analysis);
(2)Phân tích nhóm đồng nhất (Cluster analysis);
(3)Phân tích đa hướng (Multidimensional Scaling);…
36
- B: ỨNG DỤNG SPSS TRONG XỬ LÝ DỮ LIỆU
3- Các thao tác và phép bi ến đổi trên
tập dữ liệu
2- Định biến và nhập dữ liệu trên SPSS
1- Giới thiệu phần mềm SPSS
1. Giới thiệu phần mềm SPSS
SPSS (viết tắt của Statistical Package for the Social
Sciences) là một chương trình máy tính phục vụ công tác
thống kê. SPSS được sử dụng rộng rãi trong công tác thống
kê xã hội. Thế hệ đầu tiên của SPSS được đưa ra từ năm
1968. Thế hệ mới nhất là thế hệ (Verison) 18.0 được giới
thiệu từ tháng 8 năm 2008, có cả phiên bản cho các hệ điều
hành Microsoft Windows, Mac, và Linux / UNIX. Trong
phạm vi môn học này, chúng ta thống nhất sử dụng SPSS
15.0 cho việc xử lý dữ liệu.
38
1. Giới thiệu phần mềm SPSS
Phần mềm SPSS có tất cả 3 dạng màn hình:
Màn hình
hiể n thị dữ liệu
(Data view)
Màn hình Màn hình
hiển thị kết quả
hiển thị biế n
(Variables view) (Output)
39
- 1. Giới thiệu phần mềm SPSS
Màn hình quản lý dữ liệu (Data view): là nơi lưu
trữ dữ liệu nghiên cứu với một cấu trúc cơ sở dữ liệu
(data) bao gồm: Cột (Colum)- Đại diện cho bi ến quan sát,
mỗi cột chứa đựng các dữ liệu (n dữ liệu); Hàng (Row)-
Đại diện cho 1 phần tử được quan sát, mỗi hàng chức
đựng tất cả các câu trả lời (dữ liệu) của một đối tượng
nghiên cứu; và ô (Cell)- Chứa đựng một kết quả trả lời
tương ứng với một câu hỏi khảo sát (biến) và một phần tử.
40
1. Giới thiệu phần mề m SPSS
Màn hình quản lý biến (Variable view): Là nơi
quản lý các biến (Variable) và các thông số đặc tính của
biến. Trong màn hình này mỗi dòng quản lý một biến, và
mỗi cột thể hi ện một thông số đặc tính của biến. Cụ thể
như sau:
41
1. Giới thiệu phần mềm SPSS
- Tên biến ( Name): Là tên đại diện cho biến. Tên biến sẽ hiển th ị
trên đầu mỗi cột trong màn hình quản lý dữ liệu.
- Lọai biến (Type): Thể hiện định dạng dữ liệu trong biến: Dang
số- Numeric (mặc định); Dạng chuỗ i – String; Dạng ngày tháng –
Date; Dạng đơn vị tiền tệ - Currency;…
- Chiều rộng cột (Width): Ch ỉ số lượng ký tự được hiển th ị;
- Hiển thị số lẻ (Decimals) : Thể hiện số lượng con số sau dấu phẩy
được hiển th ị;
- Nhãn của biến (Label): Nêu rõ hơn về ý ngh ĩa của biến số;
- Giá trị trong biến (Values): Cho phép khai báo các giá trị trong
biến vớ i ý ngh ĩa cụ thể;
- Giá trị khuyết (Missing): Do thiế t kế bảng câu hỏi có một s ố giá
trị ch ỉ mang tính chất quản lý, không có ý nghĩa phân tích. Để lọai
bỏ biến này ta cần khai báo nó như là giá tr ị khuyết để lọai bỏ giá
trị này ra khỏi các phân tích thống kê.
- Dạng thang đo (Measures): Hiển th ị dạng thang đo của giá tr ị
trong biến.
42
- 1. Giới thiệu phần mềm SPSS
Màn hình hiển thị kết quả (output):
Các phép phân tích thống kê sẽ cho ra các kết quả
như bảng biểu, đồ thị và các kết quả kiểm đ ịnh.
Các kết quả này sẽ được truy xuất ra một màn
hình, và được lưu giữ dưới một tập tin khác
(.SPO). Màn hình này cho phép ta xem và lưu giữ
kết quả phân tích.
43
2. Định biến và nhập dữ liệu trên SPSS
2.1 Định biến trên SPSS
Định biến trong màn hình quản lý biến (Variables view)
thực hiện trước khi nhập dữ liệu vào máy tính. Qui trình
định biến như sau:
1. Đặt tên biến (Name);
2. Định dạng biến (Type);
3. Xác định số lượng con số hiển thị cho giá trị biến (Width)
và số lượng con số lẻ hiển thị (Decimals);
4. Gán nhãn cho biến (Variable Label);
5. Định tên cho các giá trị trong biến (Value labels);
6. Định nghiã các giá trị khuyết (Missing values);
7. Định kích thước cột (Column format);
8. Định vị trí hiển thị giá trị (Align);
9. Định dạng thang đo (Measurement)
44
2. Định biến và nhập dữ liệu trên SPSS
2.2 Nhập dữ liệu trên SPSS
Dữ liệu được nhập từ màn hình quản lý dữ liệu (Data
view). Màn hình này thể hiện ra một ma trận dữ liệu gồm:
Cột; hàng; và ô. Với các cột lần lượt tương ứng với các
biến, các dòng tương ứng với mỗi phần tử. Ta cũng có thể
nhập dữ liệu từ các phần mềm khác như Excel, Fox sau
đó chuyển vào SPSS bằng lệnh Copy.
45
- 3. Các phép biến đổi và thao tác
trên tập dữ liệu
Có 5 phép biến đổi trên tập dữ liệu
thường sử dụng là:
Làm sạch
Mã hoá
Và tóm tắt
lại dữ liệu
Hợp nhất
tập dữ liệu Đánh giá độ
tin cậy của
thang đo
Tách tập
dữ liệu
3.1 Mã hoá lại
Mã hoá lại (Recode) là công cụ biến đổi các giá
trị (đã mã hoá) thành các mã hoá mới phù hợp với
đòi hỏi của việc phân tích dữ liệu. SPSS cung cấp
cho ta 2 loại mã hoá lại là:
2- Mã hoá
1- Mã hoá lại
vào biến khác
trên cùng 1 biến
(Recode into difference
(Recode into same variable)
Variable)
47
3.1 Mã hoá lại
Mã hoá lại trên cùng một biến thì các giá trị được
mã hoá lại sẽ thay thế cho các giá trị cũ (các giá trị này sẽ
mất đi), cần chú ý rằng các giá trị vừa được mã hoá lại chưa
có nhãn, do đó sau khi recode ta phải khi báo lại nhãn cho
giá trị. Qui trình này được thực hiện qua các bước sau:
§ Transform/ Recode/ Recode into same variables ta sẽ có hộp
thoạ i (7.4);
§ Chọn và chuyển các biến cần mã hoá lạ i sang hộp thoạ i variables,
nhấn Old and new value để chuyển các giá tr ị cũ thành các giá tr ị
mớ i. Old value dùng để khai báo các giá trị cũ cần chuyển đổi, New
value dùng để khai báo giá trị mớ i sẽ thay thế cho giá trị cũ. Add để
lưu giữ sự chuyển đổ i này.
48
- 3.1 Mã hoá lại
Mã hoá lại vào biến khác thì các giá trị hiện tại của
một biến trở thành giá trị mới trong một biến khác. Qui
trình này thực hiện như sau:
§ Transform/ Recode into different variables ta sẽ có
hộp thoại (7.7);
§ Chọn và chuyển các biến cần mã hoá lại vào hộp thoại
variables, khai báo tên biến mới và nhãn biến mới trong
hộp thoại Output variable. Nhấn Change để xác nhận
khai báo này.
49
3.2 Làm sạch và tóm tắt dữ liệu với SPSS
Để làm sạch dữ liệu với SPSS ta chỉ cần thực hiện
tính tần số với thao tác đơn giản:
Ø Analyze/ Descriptive statistics/ Frequencies. Ta có hộp
thoại tóm tắt tần số, ta cần chọn và đưa các biến cần tính
vào ô variables. Nhấn OK ta sẽ có bảng tóm tắt tần số.
Các bạn chú ý phần Missing (lỗi) nếu có thì phải hiệu
chỉnh lại dữ liệu nhé.
Ø Để tóm tắt thống kê dữ liệu trên SPSS như: (1) Min; (2)
Max; (3) Mean; (4) Phương sai chỉ cần thao tác.
qTại hộp thoại tóm tắt tần số ta chọn Statistics rồi
chọn ô cần thiết rồi Continue/ OK bạn sẽ có kết quả
ngay lập tức.
50
3.3 Đánh giá độ tin cậy của thang đo bằng
Cronbach Alpha trên SPSS
Khi thực hiện các nghiên cứu định lượng, người nghiên
cứu phải sử dụng nhiều thang đo lường khác nhau. Hiện tượng
kinh tế - xã hội vốn rất phức tạp nên việc lượng hoá các khái
niệm nghiên cứu đòi hỏi phải có sự kiểm tra độ tin cậy của các
thang đo trước khi sử dụng. Phần này chúng ta sẽ thực hành
kiểm tra độ tin cậy của thang đo bằng công cụ Cronbach
Alpha trên SPSS.
Thí dụ: Gi ả sử rằng “Các yế u tố tác động đến quyết định lựa
chọn (mua) mì ăn li ền nhãn hiệu “Hảo Hảo” của khách hàng
trên thị trường TP.HCM” là:
(a1) Chất lượng SP;
(a2) Khẩu vị phù hợp;
(a3) Định lượng vừa đủ;
(a4) Dễ dàng mua;
(a5) Bao bì hấp dẫn.
51
- 3.3 Đánh giá độ tin cậy của thang đo bằng
Cronbach Alpha trên SPSS
Người nghiên cứu quan tâm và muốn đo lường xem
trong 5 nhân tố nêu trện thì mức độ tác động của các yếu tố
nào là mạnh hơn đến quyết định lựa chọn sản phẩ m.
Muốn vậy, ta phải xây dựng các câu hỏi và thang đo
có độ tin cậy về khái niệm “ Các yếu tố tác động đến quyết
định lựa chọn (mua) mì ăn liền “Hảo Hảo”.
Theo nghiên cứu trước đó thì các yếu tố quyết
định… gồm 5 khiá cạnh. Chúng ta sẽ xem xét tính toán
Cronbach Alpha đối với các mục hỏi của từng khiá cạnh.
Câu hỏi liên quan đến đo lường mức độ tác động của các
yếu tố … như sau:
52
3.3 Đánh giá độ tin cậy của thang đo bằng
Cronbach Alpha trên SPSS
Xin bạn vui lòng trả lời bằng cách khoanh tròn vào một con
số ở từng dòng. Nhữ ng con số này thể hiện mức độ bạn đồng ý hay
không đồng ý đối với các phát biểu theo qui ước sau:
Rất không đồng ý Không đồng ý Trung lập Đồng ý Rất đồng ý
1 2 3 4 5
a1: Chất lượng c ủa mì ăn liền “Hảo Hảo” là yế u tố quyết 1 2 3 4 5
định việc tôi lựa chọn nó:
a2: Khẩu vị phù hợp là yếu tố quyế t định việc tôi lựa chọn 1 2 3 4 5
mì ăn liền “Hảo Hảo”
a3: Mì ăn liền “Hảo Hảo” có định lượng vừa dủ là yếu tố 1 2 3 4 5
quyết định việc tôi lựa chọn nó.
a4: Việc tôi cá thể mua mì ăn liền “Hảo Hảo” một cách dễ 1 2 3 4 5
dàng, ở mọi nơi là yếu tố quyế t định việc tôi lựa chọn nó.
a5: Bao bì của mì ăn liền “Hảo Hảo” rất hấp dẫn là yế u tố 1 2 3 4 5
quyết định ciệc tôi lựa chọn nó.
53
3.3 Đánh giá độ tin cậy của thang đo bằng
Cronbach Alpha trên SPSS
Vấn đề ở đây là đây có phải là một thang đo tốt cho
một khía cạnh khái niệm mà ta quan tâm hay không? Để
trả lời câu hỏi này ta sẽ tính toán đại lượng Cronbach
Alpha. Một nghiên cứu sơ bộ với cỡ mẫu n0 > 30 cho ta ma
trận mẫu, sau khi làm sạch dữ liệu và lưu mẫu ta tiến hành
tính toán Cronbach Alpha:
§ Analys / Scale/ Reliability Analysis. Hộp thoại hiện ra ta
chọn các biến từ a1 – a5 đưa vào hộp Items. Sau đó chọn
Statistics.
§ Trong hộp thoại Statistics, hãy nhấp mouse để chọn các
đại lượng cơ bản nhất như: Item; Scale; Scale if item
deleted sau đó nhấn Continue trở về hộp thoại đầu tiên và
chọn OK kết quả tính toán Cronbach Alpha sẽ hiển thị tại
màn hình Output.
54
- 3.3 Đánh giá độ tin cậy của thang đo bằng
Cronbach Alpha trên SPSS
Với kết quả Alpha từ :
§ >0.8 -> Là thang đo tốt;
§ 0.7- 0.8 -> Là thang đo sử dụng được;
§ 0.6 – 0.7 -> Là thang đo sử dụng được đối với những
khái niệm mới, hoặc cho SV mới bắt đầu học nghiên cứu;
§ < 0.6 -> Là thang đo không đảm bảo độ tin cậy,
không sử dụng được và bạn phải sửa chữa bảng câu hỏi.
Chú ý cột Alpha if item deleted nếu có tồn tại giá
trị lớn hơn Alpha thì hãy loại bỏ đi mục hỏi đó (mức độ
tác động đến quyết định … của yếu tố đó là thấp/ không
đáng kể) do đó ta loại bỏ bớt đi.
55
3.4 Tách tập dữ liệu (Split file)
Công cụ Split file cho phép tách dữ liệu trong
tập dữ liệu đang quan sát thành những nhóm nhỏ riêng biệt.
Sau khi thực hiện lệnh này các phân tích xử lý thống kê sẽ
cho kết quả riêng biệt theo từng nhóm được tách ra này.
ØData/ Split file ta có hộp thoại. Ta chọn Group based
on list và chọn các biến để phân tách dữ liệu, và OK.
56
3.5 Hợp nhất các tập dữ liệu (Merge files)
SPSS cho phép ta hợp nhất các dữ liệu/ biến
quan sát từ trong một tập dữ liệu vào tập dữ liệu đang sử
dụng. Cả hai tạo ra một tập dữ liệu/ biến mới chứa đựng tất
cả các quan sát từ 2 tập dữ liệu.
Ø Add Cases/ hay Add Variables và OK.
57
- C. Hướng dẫn tiểu luận môn học
Sau khi hoàn chỉnh Bảng câu hỏi, và điều tra
sơ bộ với cỡ mẫu n0 > 30. Các bạn thực hiện việc xử lý dữ
liệu với SPSS, trong đó chú ý:
1.Hiệu chỉnh và làm sạch dữ liệu;
2.Tóm tắt dữ liệu (Dạng bảng, dạng thống kê, dạng đồ thị);
3.Kiểm định độ tin cậy của thang đo với SPSS;
4.Xác định cỡ mẫu cho nghiên cứu chính thức (vận dụng
Excell).
58
XIN CẢM ƠN CÁC BẠN!
59
nguon tai.lieu . vn