Xem mẫu
- Chương I
PHÂN LOẠI DỮ LIỆU, MÃ HÓA, NHẬP
LIỆU VÀ MỘT SỐ XỬ LÝ TRÊN BIẾN
Biên soạn: TS. NGUYỄN THỊ PHƯƠNG GIANG
Phone: 0944.822.211
E-Mail: nguyenthiphuonggiang@iuh.edu.vn
NỘI DUNG
• Phân loại dữ liệu
• Các loại thang đo
• Nguyên tắc mã hóa và nhập liệu
• Cửa sổ làm việc của SPSS
• Tạo tập tin dữ liệu trong SPSS
• Một số xử lý trên biến
• Thay đổi một số mặc định
• Tiếng việt trong SPSS
02/08/2017 2
Phân loại Dữ liệu
• Dữ liệu định tính: Phản ánh tính chất, sự
hơn kém, không tính được trị trung bình.
• Ví dụ: Giới tính, kết quả học tập.
• Dữ liệu định lượng: Phản ánh mức độ hơn
kém, được thể hiện bằng các con số nên
tính được giá trị trung bình. Các con số
thu thập có thể ở dạng liên tục hay rời rạc.
02/08/2017 3
1
- Các loại thang đo
• Thang đo danh nghĩa (Nominal scale):
Trong thang đo này, các con số chỉ dùng
để phân loại các đối tượng.
• Những phép toán thống kê có thể sử dụng
được là: đếm, tính tần suất của một biểu
hiện nào đó
02/08/2017 4
Các loại thang đo
• Thang đo thứ bậc (Ordinal scale): Các con
số trong thang đo danh nghĩa được sắp
xếp theo một qui thứ bậc.
Ví dụ: Bạn hài lòng như thế nào về mùi của
sản phẩm Snack Khoai tây chiên mà bạn
vừa dùng thử? (Hài lòng, bình thường,
không hài lòng)
02/08/2017 5
Các loại thang đo
• Thang đo khoảng (Interval scale): Là dạng
đặc biệt của thang đo thứ bậc vì nó cho
biết được khoảng cách giữa các thứ bậc.
Thông thường thang đo khoảng có dạng là
một dãy các chữ số liên tục và đều đặn từ
1 đến 5, từ 1 đến 7 hay từ 1 đến 10,…
Dãy số này có 2 cực ở hai đầu thể hiện 2
trạng thái đối nghịch nhau.
02/08/2017 6
2
- Các loại thang đo
• Thang đo tỉ lệ (Ratio scale): có tất cả các
đặc tính khoảng cách và thứ tự của thang
đo khoảng, ngoài ra điểm không trong
thang đo khoảng là một giá trị thật nên có
thể thực hiện được phép chia để tính tỉ lệ.
Thang đo khoảng và thang đo tỉ lệ có thể đo
lường nên SPSS gộp chung hai loại thang
đo này thành thang đo mức độ (Scale
Measures).
02/08/2017 7
Nguyên tắc Mã hóa – Nhập liệu
Giới tính Tuổi Nghề nghiệp
1 Nữ 21 Sinh viên
2 Nữ 32 Nhân viên văn phòng
3 Nam 53 Về hưu
… … … …
n Nam 42 Nghề khác
02/08/2017 8
Nguyên tắc Mã hóa –
Nhập liệu
Giới tính Tuổi Nghề nghiệp
1 2 21 10
2 2 32 3
3 1 53 11
… … … …
n 1 42 14
02/08/2017 9
3
- Nguyên tắc Mã hóa –
Nhập liệu
• Phần lớn mỗi biến tương ứng với một câu
hỏi cụ thể trong bản trả lời. Như thế ta chỉ
cần tạo 1 biến.
• Trường hợp câu hỏi có thể chọn nhiều trả
lời thì chúng ta phải có nhiều con số để
nhập nên cần phải có nhiều ô để nhập.
• Qui tắc nhập liệu: Từ trái qua phải (theo
từng dòng) và từ trên xuống (sang dòng)
02/08/2017 10
Cửa sổ làm việc của SPSS
• Khởi động
- Click biểu chương trình trên thanh công cụ
- Từ Menu Start, chọn Program, chọn SPSS
• Nội dung của Menu
- File: xử lý File
- Edit: chỉnh sửa
- 02/08/2017
View: Hiển thị 11
Cửa sổ làm việc của SPSS
- Data: các công tác liên quan đến dữ liệu
- Transform: Chuyển đổi dữ liệu, tính toán,
mã hóa lại các biến.
- Analyze: Thực hiện các thủ tục thống kê
- Graphs: Tạo biểu đồ, đồ thị
- Windows: Sắp xếp các cửa sổ làm việc
trong SPSS.
02/08/2017 12
4
- Tạo tập tin dữ liệu trong
SPSS for Windows
• Khai báo biến:
- Click Variable view.
- Khai báo biến trên từng dòng, nội dung
của dòng là các thuộc tính của biến.
- Name: Tên biến
- Type: Kiểu biến
- Width: Độ rộng của biến
02/08/2017 13
Tạo tập tin dữ liệu trong
SPSS for Windows
- Decimals: Số số lẻ
- Label: Nhãn biến
- Value: Mã hóa cho các giá trị định tính
- Missing: Khai báo các loại giá trị khuyết
- Column: Độ rộng của biến khi nhập liệu
- Align: Vị trí dữ liệu trong cột
- Measure: Chọn loại thang đo
02/08/2017 14
Tạo tập tin dữ liệu trong
SPSS for Windows
• Lưu tập tin dữ liệu:
- Menu File, chọn Save.
- Save in: chọn nơi lưu
- File name: Đặt tên file (chỉ đặt tên chính)
- Click nút Save
Mặc định kiểu tập tin là sav
02/08/2017 15
5
- Một số xử lý trên biến
• Mã hóa lại biến (Recode):
Sử dụng khi cần giảm số biểu hiện của một
biến định tính.
Hoặc muốn chuyển biến định lượng thành
biến định tính
- Qui trình thực hiện:
- Menu Transform > Recode into Different
Variables (tạo biến mới) hoặc Recode into
Same Variables (thay biến cũ)
02/08/2017 16
Một số xử lý trên biến
- Chọn biến muốn Recode
- Đặt lại Name và Label, Click Change
- Click Old and New Values… để xác định sự
chuyển đổi.
- Click Continue và OK để thực hiện lệnh.
02/08/2017 17
Một số xử lý trên biến
• Chuyển biến dạng Category thành biến
dạng Dichotomy:
Biến dạng Category có nhiều trị số mã hóa
tượng trưng cho nhiều trạng thái.
Biến Dichotomy là biến phân loại chỉ có 2 trị
số mã hóa tượng trưng cho 2 trạng thái
khác nhau (có hoặc không)
02/08/2017 18
6
- Một số xử lý trên biến
• Cách thực hiện:
– Menu transform, chọn Count
– Target Variable: Khai báo tên biến cần tạo
– Target Label: Khai báo nhãn
– Đưa các biến cần chuyển vào Numeric Var
– Click Define Values mở hộp thoại
– Nhận 7 vào ô Value
– Click Continue và OK
02/08/2017 19
Tùy chọn của chương
trình
• Menu Edit, chọn Options:
– Measurement System: Thay đổi đơn vị
– Variable list: Thay đổi cách thể hiện
– Pivot Table: Chọn cách thể hiện bảng kết quả
– File Location: Chọn nơi lưu trữ và mở file dữ
liệu
– Viewer: Chọn font hiển thị kết quả
02/08/2017 20
Câu hỏi ôn tập
1. Hãy cho biết các loại dữ liệu và các
loại thang đo?
2. Nguyên tắc mã hóa và nhập liệu
3. Trình bày cách tạo tập tin dữ liệu
trong SPSS For Windows.
4. Qui trình thực hiện việc mã hóa lại
biến (Recode)
5. Chuyển Category thành Dichotomy
02/08/2017 21
7
- CHƯƠNG II
LÀM SẠCH DỮ LIỆU
NỘI DUNG
Sự cần thiết
Các biện pháp ngăn ngừa
Các phương pháp làm sạch dữ liệu
Sự cần thiết
Dữ liệu sau khi nhập xong chưa thể đưa vào xử lý và
phân tích vì:
Chất lượng của phỏng vấn và đọc soát (hiểu sai, thu
thập sai, chọn sai đối tượng, trả lời sai ý, người đọc
soát chưa phát hiện,…)
Nhập dữ liệu (sai, sót, thừa)
8
- Các biện pháp ngăn ngừa
Thiết kế bản câu hỏi rõ ràng, dễ hỏi, dễ trả lời.
Chọn lọc và huấn luyện phỏng vấn viên kỹ lưỡng.
Sau khi phỏng vấn, bản câu hỏi phải được đọc soát
trước khi nhập.
Việc mã hóa phải được tiến hành tập trung với một số
ít cá nhân phụ trách.
Các phương pháp làm sạch dữ liệu
Dùng bảng tần số
- Lập bảng tần số cho tất cả các biến, đọc và rà soát các
giá trị lạ. Sau đó dùng lệnh FIND để tìm lỗi.
Cách thực hiện
- Trong Data View, chọn cột có giá trị lỗi
- Vào Menu Edit > Find
- Nhập vào giá trị lỗi
- Truy ngược lại số thứ tự của hàng để biết được bản
câu hỏi tương ứng.
Các phương pháp làm sạch dữ liệu
Dùng bảng phối hợp hai hay ba biến
- Lập bảng tần số cho tất cả các biến, đọc và rà soát các
giá trị lạ. Sau đó dùng lệnh FIND để tìm lỗi.
Cách thực hiện
- Trong Data View, chọn cột có giá trị lỗi
- Vào Menu Edit > Find
- Nhập vào giá trị lỗi
- Truy ngược lại số thứ tự của hàng để biết được bản
câu hỏi tương ứng.
- Vào Data > Sort Case để sắp xếp biến filter_$
9
- Các phương pháp làm sạch dữ liệu
Cách tìm lỗi đơn giản ngay trên cửa sổ dữ liệu
- Sử dụng lệnh Data > Sort Case để tìm lỗi đơn giản
cho các biến giới tính.
Câu hỏi ôn tập
Sự cần thiết phải làm sạch dữ liệu.
Các biện pháp ngăn ngừa lỗi cho dữ liệu
Trình bày các phương pháp làm sạch dữ
liệu từ đơn giản đến phức tạp.
CHƯƠNG III
TÓM TẮT VÀ TRÌNH BÀY
DỮ LIỆU
30
10
- NỘI DUNG
• Phương pháp và công cụ
• Bảng tần số đơn giản
• Các đại lượng thống kê mô tả
• Lập bảng tần số đồng thời tính toán các
đại lượng thống kê mô tả
• Thống kê mô tả theo thủ tục Explore
• Lập bảng tổng hợp nhiều biến
• Xử lý câu hỏi có thể chọn nhiều trả lời
• Trình bày kết quả bằng đồ thị
• Bảng tùy biến (Custom tables)
31
PHƯƠNG PHÁP VÀ CÔNG CỤ
• Bảng tần số đơn giản
• Các đại lượng thống kê mô tả, biểu đồ tần
số
• Bảng kết hợp nhiều biến
• Đồ thị
32
BẢNG TẦN SỐ ĐƠN GiẢN
• Xác định số lượng và tỉ lệ của các biểu
hiện nào đó trong tập dữ liệu.
• Ví dụ: Lập bảng tần số của gtinh
• Sau khi thực hiện, ta được 2 bảng:
– Bảng 3.1
N Valid 500
Missing 0
– Valid: Trị hợp lệ (Số người có trả lời)
– Missing: Thiếu dữ liệu (Không trả lời)
33
11
- BẢNG TẦN SỐ ĐƠN GiẢN
– Bảng 3.2
Frequency Percent Valid Cumulative
Percent Percent
Valid Nam 249 49.8 49.8 49.8
Nu 251 50.2 50.2 100.0
Total 500 100.0 100.0
– Cột đầu tiên là các biểu hiện của biến gtinh
– Frequency: Tần số của từng biểu hiện
– Percent: Tần suất tính theo tỉ lệ %
– Valid Percent: Phần trăm hợp lệ, tính trên số
quan sát có thông tin trả lời.
– Cumulative Percent: Phần trăm tích lũy do cộng
dồn từ các phần trăm từ trên xuống.
Trương Ngọc Tú 34
34
BẢNG TẦN SỐ ĐƠN GiẢN
• Cách thức tiến hành lệnh Frequencies:
– Menu Analyze > Descriptive Statistics >
Frequencies.
– Chọn biến muốn lập bảng tần số bằng cách
click vào tên biến và click nút mũi tên sang
phải (hoặc nhấp đôi tại biến)
– Click OK ta có 2 bảng kết quả 3.1 và 3.2
– Lưu ý: Nếu bỏ chọn ở phần Display Frequency
Tables thì ta chỉ tạo được bảng 3.1
Trương Ngọc Tú 35
35
CÁC ĐẠI LƯỢNG THỐNG KÊ MÔ TẢ
• Chỉ thực hiện đối với các biến định lượng
• Cách thức tiến hành lệnh:
– Menu Analyze > Descriptive Statistics >
Descriptive.
– Chọn 1 hoặc nhiều biến định lượng muốn tính
bằng cách click vào tên biến và click nút mũi
tên sang phải (hoặc nhấp đôi tại biến)
– Click nút Options để vào hộp tùy chọn các đại
lượng thống kê
– Click Continue để trở về hộp thoại trước đó
– Click OK ta có bảng kết quả Descriptives
Bảng 3.3
Trương Ngọc Tú 36
36
12
- CÁC ĐẠI LƯỢNG THỐNG KÊ MÔ TẢ
• Ý nghĩa của các kết quả trên bảng 3.3:
– N: Tổng số quan sát
– Minimun: Giá trị nhỏ nhất
– Maximun: Giá trị lớn nhất
– Mean: Giá trị trung bình cộng
– Std Error: Sai số chuẩn khi dùng giá trị trung
bình mẫu để ước lượng giá trị trung bình của
tổng thể
– Std Deviation: Độ lệch chuẩn, cho biết mức độ
phân tán của các giá trị của biến quanh giá trị
trung bình
Trương Ngọc Tú 37
37
CÁC ĐẠI LƯỢNG THỐNG KÊ MÔ TẢ
• Lựa chọn cách thể hiện bảng kết quả:
– Trên cửa sổ Output, nhấp đôi tại bảng kết quả.
– Menu Pivot > Transpose Rows and Columns
– Ngoài ra ta cũng có thể dùng cách đổi thứ hai:
Menu Pivot > Pivoting Trays. Lần lượt thực hiện
sắp xếp các nhãn đại diện vào bảng, ta sẽ có
được bảng kết quả theo yêu cầu (sinh viên tự
nghiên cứu)
Trương Ngọc Tú 38
38
LẬP BẢNG TẦN SỐ ĐỒNG THỜI TÍNH TOÁN CÁC
ĐẠI LƯỢNG THỐNG KÊ MÔ TẢ
• Cách thực hiện:
– Menu Analyze > Descriptive Statistics >
Frequencies
– Chọn biến định lượng (c3)
– Click nút Statistics để chọn các đại lượng
thống kê cần tính như:
• Percentile Values: Các giá trị tứ vị phân, …
• Central Tendency: Khuynh hướng tập trung
• Dispersion: Khuynh hướng phân tán
• Distribution: Hình dáng phân phối
– Để vẽ biểu đồ, ta nhấn nút Chart, trong đó:
• None: không thể hiện
• Bar charts: Biểu đồ dạng thanh
• Pie charts: Biểu đồ hình tròn
• Histograms:Biểu đồ phân phối tần số
– Click OK
Trương Ngọc Tú 39
39
13
- THỐNG KÊ MÔ TẢ VỚI THỦ TỤC EXPLORE
• Thực hiện thủ tục Explore:
– Vào Menu Analyze > Descriptive Statistics >
Explore.
– Chọn một hay nhiều biến dạng định lượng và
đưa sang khung Dependent List (biến tuoi).
– Chọn một hay nhiều biến muốn sử dụng làm
điều kiện để phân tích biến định lượng trên.
– Click nút Statistics để vào hộp Explore:Statistic
– Click nút Plots để vào hộp thoại Explore
– Click nút Options lựa chọn cách thức thủ tục
Explore xử lý các giá trị Missing.
– Sau mỗi lần chọn và xử lý xong các hộp thoại
trên, click nút Continue để về hộp thoại chính.
– Tại hộp thoại Explore, click OK.
Trương Ngọc Tú 40
40
THỐNG KÊ MÔ TẢ VỚI THỦ TỤC EXPLORE
• Chức năng của thủ tục Explore:
– Tính toán các đại lượng thống kê cho tất cả các
trường hợp hoặc cho các nhóm con
– Nhận diện các giá trị khác biệt
– Tính toán các giá trị thập vị phân của phân phối
– Tạo biểu đồ, hình dáng của biểu đồ cho thấy dữ
liệu phân phối như thế nào.
• Chuẩn bị thực hành (tạo file Explore)
– Vào Menu Data > Select Cases
– Chọn Random sample of cases
– Click Sample (nhập số 20 vào khung
Aproximately)
– Click Continue và sau đó Click OK (nhớ chọn
mục Delete unselected cases)
Trương Ngọc Tú 41
41
Chương 4
PHÂN TÍCH NHÂN TỐ
EXPLORE FACTOR
ANALYSIS ALPHA
VÀ KIỂM ĐỊNH CRONBACH (EFA)
14
- NỘI DUNG CHÍNH
Định nghĩa
Điều kiện ứng dụng
Nghiên cứu các nhân tố
Số các nhân tố phải tách ra
Phép quay (rotation)
Điểm số nhân tố (Factorial Scores)
Độ tin cậy và hiệu lực (Reliability and Validity)
ĐỊNH NGHĨA
Phân tích nhân tố khám phá là một phương pháp
phân tích thống kê dùng để rút gọn một tập gồm
nhiều biến quan sát phụ thuộc lẫn nhau thành một
tập biến (gọi là các nhân tố) ít hơn để chúng có ý
nghĩa hơn nhưng vẫn chứa đựng hầu hết nội dung
thông tin của tập biến ban đầu (Hair & ctg, 1998)
Chú ý: từ đây có thể hiện các biến là các items
MÔ HÌNH NHÂN TỐ
Giả sử phân tích nhân tố rút ra được i nhân tố
(factors), ta có:
Fi = W i1X1 + W i2X2 + W i3X3 + …. + W inXn
Với
Fi là ước lượng trị số của nhân tố (factor) thứ i.
W ik là quyền số hay trọng số nhân tố (weight or factor
score coefficient) của biến số thứ k đến nhân tố i.
k: Số biến (items)
15
- ĐỊNH NGHĨA PHÂN TÍCH NHÂN TỐ
Rút gọn số biến
đầu tiên là xác định các chiều (dimension) khác nhau
sau đó, giải sự liên quan của mỗi biến (variable, items)
với các nhân tố (factors)
tùy theo tình hình mà giảm số lượng các biến
Chú ý
Không có biến độc lập và biến phụ thuộc, các biến có
cùng một tình trạng (cùng thang đo)
KÍCH THƯỚC MẪU
Tối thiểu là 50 quan sát và tốt hơn là lớn hơn
100
Số quan sát sẽ ảnh hưởng đến việc lựa chọn
các tiêu chuẩn trong phân tích nhân tố.
Qui tắc kinh nghiệm: số quan sát lớn hơn (ít
nhất) 5 lần số biến (items)
VÍ DỤ THANG ĐIỂM LIKERT
16
- LÝ THUYẾT KHOA HỌC
Lý thuyết khoa học
Là hệ thống luận điểm về mối liên hệ giữa các sự kiện
khoa học
Gồm:
Hệ thống khái niệm
Các mối liên hệ
SƠ LƯỢC VỀ KHÁI NIỆM
Khái niệm là công cụ
để gọi tên một sự kiện khoa học,
để tư duy và trao đổi thông tin,
là cơ sở để nhận dạng bản chất của một sự vật
Khái niệm gồm 2 bộ phận hợp thành
Nội hàm là tất cả các thuộc tính bản chất của sự kiện
Ngoại diện là tất cả các cá thể có chứa thuộc tính chỉ
trong nội hàm
Ví dụ: Khoa học
Nội hàm là hệ thống trí thức về bản chất sự vật
Ngoại diện là các loại khoa học: khoa học tự nhiên, xã hội, kỹ thuật…
THÀNH PHẦN CỦA LÝ THUYẾT KHOA HỌC
Các giới hạn trong nghiên cứu: giá trị, thời gian và không gian -> giả thuyết
Giả thuyết
lý thuyết
Khái niệm Khái niệm
Khả năng suy rộng
nghiên cứu nghiên cứu
Giả thuyết
kiểm định
Biến quan sát Biến
quan sát
17
- MÔ HÌNH NGHIÊN CỨU VÀ CÁC KHÁI NIỆM
Items 1.1
Items 1.2
LÃNH ĐẠO
Items 1.3
… CƠ HỘI ĐTẠO VÀ
Items 1.n TTIẾN
LƯƠNG, THƯỞNG
Items 2.1
SỰ TRUNG
Items 2.2 THÀNH
ĐỒNG NGHIỆP
Items 2.3
…
Items 2.n
PHÚC LỢI
BẢN CHẤT CVIỆC
MÔI TRƯỜNG LV
PHÂN TÍCH NHÂN TỐ
Analyze
Data Reduction
Factor
PHÂN TÍCH NHÂN TỐ Chọn tất cả
các biến cần
phân tích
nhân tố vào
ô Variables
vào như
hình vẽ
Nhấn vào
Descriptive
s
18
- PHÂN TÍCH NHÂN TỐ
Chọn Anti-
image và KMO
Phương pháp:
Principal Components
Tiêu chuẩn:
Eigenvalues>=1
hoặc
Cố định số nhân
tố
PHÂN TÍCH NHÂN TỐ
Xoay
Varima
x
Xóa các trọng số 0,5 (Hair
và cộng sự, 2006)
ĐK2: Sig. (Bartlett’s
Test) < 0,05 (Hair và
cộng sự, 2006)
Câu hỏi: Nếu KMO 0,05
thì giải quyết thế nào?
-=> Bỏ items có giá trị trên đường chéo của Anti-image
Matrices < 0,3
Kiểm định Bartlett xem xét giả thuyết Ho: độ tương quan giữa các biến
quan sát bằng không trong tổng thể.
19
- B2. XÁC ĐỊNH SỐ LƯỢNG NHÂN TỐ
Vấn đề 1: Tương ứng với việc chọn Eigenvalues > 1
+ Phương sai trích > 0,5 (50%)
+ Eigenvalues > 1
(Gerbing và Anderson, 1988)
Vấn đề 2: Chọn số lượng nhân tố cố định trước
Copyright @ 2009, LÊ VĂN HUY,
Thông tin từ
biểu
Rotated
Compon
ent
Matrix
Bỏ các items
có giá trị
nguon tai.lieu . vn