Xem mẫu
- TRƯỜNG ĐẠI HỌC NÔNG LÂM HUẾ
DỰ ÁN HỢP TÁC VIỆT NAM – H À LAN
BÀI GIẢNG
NGHIÊN CỨU CHUYÊN SÂU
Người biên soạn: PGS.TS Nguyễn Minh Hiếu
Huế, 08/2009
- TRƯỜNG Đ ẠI HỌC NÔNG LÂM
D Ự ÁN GIÁO DỤC VIỆT NAM HÀ LAN
B ÀI GIẢNG
ỨNG DỤNG TIN HỌC TRONG
THIẾT KẾ THÍ NGHIỆM VÀ XỬ LÝ SỐ LIỆU
(Phương pháp nghiên cứu nâng cao)
LÊ ĐÌNH PHÙNG
NG UYỄN MINH HIẾU
HUẾ, 2008
- MỤC LỤC
M Ở ĐẦU ............................................................................................................................ 2
B ÀI I: NH ẬP SỐ LIỆU .................................................................................................... 4
1.1. Nguyên tắc của nhập số liệu .................................................................................... 4
1.2. Nhập số liệu trong trư ờng hợp số liệu không phân nhóm/tổ ................................... 4
1.3. Nhập số liệu trong trư ờng hợp số liệu phân tổ bởi một nhân tố .............................. 5
1.4. Nhập số liệu trong trư ờng hợp số liệu phân tổ bởi hai nhân tố................................ 6
1.5. Nhập số liệu trong các kiểu thiết kế thí nghiệm có sự khống chế sự sai khác ban đầu
......................................................................................................................................... 7
B ÀI 2. KI ỂM TRA SỐ LIỆU VÀ ĐỊNH HƯ ỚNG PHÂN TÍCH............................... 10
2.1. Kiểm tra số liệu bằng tr ình ứ ng dụng filter trong EXCEL .................................... 11
2.2. Kiểm tra số liệu bằng tr ình ứ ng dụng Box- plot hoặc Scatter Plot trong SPSS...... 14
B ÀI 3. PHÂN TÍCH THỐNG KÊ MÔ TẢ ................................................................... 19
3.1. Phân tích thống kê mô tả trong trư ờng hợp tập hợp số liệu không phân nhóm ..... 20
3.2. Phân tích thống kê mô tả trong trư ờng hợp tập hợp số liệu phân nhóm ............... 21
B ÀI 4. PHÂN TÍCH PHƯƠNG SAI ............................................................................. 23
B ÀI 5. PHÂN TÍCH PHƯƠNG SAI CHO CÁC KIỂU THIẾT KẾ THÍ NGHIỆM
KHÁC NHAU .................................................................................................................. 28
5.1. Nguyên tắc của phân tích số liệu của thiết kế thí nghiệm RC B và LSD ............... 28
5.2. Phân tích số liệu từ thí nghiệm kiểu RCB.............................................................. 29
5.3. Phân tích số liệu từ thí nghiệm kiểu LSD .............................................................. 34
B ÀI 6. ÁP DỤNG QUY TẮC NGẪU NHIÊN TRONG THIẾT KẾ THÍ NGHIỆM VỚI
M ỘT NHÂN TỐ ............................................................................................................. 39
6.1. Ngẫu nhiên hóa trong thiết kế thí nghiệm kiểu C RD và RCB ............................... 39
6.2. Ngẫu nhiên hóa trong thiết kế thí nghiệm kiểu LSD ............................................. 41
B ÀI 7. PHÂN TÍCH H ỒI QUY ..................................................................................... 42
2
- MỞ ĐẦU
Hai giai đ o ạn th ú v ị nhấ t trong nghiê n cứu là thiế t k ế thí n ghiệ m và xử lý số
liệu. Tuy nhiê n, đ â y là hai giai đo ạn tiêu tố n thời g ian nhấ t. Trong mộ t th í nghiệm, quá
tr ình thiế t kế thí n ghiệ m và xử lý s ố liệ u k hô ng phải c h ỉ tiến hà nh một lần mà thư ờng
được lặp đ i lặ p lại nhiề u lần, đặ c biệ t là gia i đ oạn xử lý s ố liệ u. Nhận đ ịnh này c àng
đ úng khi làm v iệc với một tậ p hợp s ố liệu lớn, ví d ụ s ố liệu điề u tra. Hiểu bản chấ t của
thiế t k ế thí nghiệm và xử lý s ố liệ u là đặc biệ t quan trọng. Quá tr ình thiế t k ế th í nghiệm
và xử lý số liệu s ẽ nhanh hơn, chính xác hơ n và thú v ị hơn nếu c húng ta có thể ứng
d ụng tin học vào p hân tích s ố liệu thay v ì tính toán đơn thuần.
Hiệ n nay c ó rất nhiều phần mề m g iúp c ho quá tr ình xử lý số liệu. Nếu c húng ta
sử d ụng c ác p hần mềm để p hâ n tích k ết quả th ì luô n luô n c ó kế t quả. Vấn đề c ơ bản là
kết quả đ ó đ úng hay sai, k ế t quả đó nói lê n đ iều gì. Quả là k hô ng thừa k hi nhấ n mạnh
rằng c húng ta phải hiểu đư ợc bản chấ t của thiế t kế thí nghiệ m và xử lý số liệu tr ước khi
ứ ng d ụng cô ng nghệ thô ng tin. Tất c ả các kiế n thức về bản c hấ t c ủa thiế t k ế th í nghiệm
và xử lý s ố liệu đ ư ợc đề c ậ p trong họ c phần p hương pháp thí n ghiệ m. Trong phạ m vi
c ủa học phần này c húng tô i đề cậ p đ ến v iệ c vận d ụng p hầm mề m SPSS trong xử lý số
liệu.
P hầ m mềm SPSS là một phần mề m r ất thô ng d ụng. Chúng ta c ó thể có được
p hầ m mề m nà y b ất kỳ ở đ â u. Việ c xử d ụng p hần mềm nà y r ất đ ơn g iản, như ng lạ i r ất
có h iệu q uả. C ó thể nói r ằng phần mề m S PSS giải q uyế t đư ợc gần n hư to àn b ộ các yê u
cầu c ủa xử lý số liệu trong các nghiên c ứu trong nô ng nghiệ p. Mặ t khác p hần mềm
SPSS cũng có ưu thế xử lý các tập hợp s ố liệu k há lớn như s ố liệ u điề u tra. Do vậy,
c húng ta có thể ho àn to àn sử d ụng p hần mềm SPSS cho xử lý số liệu th í nghiệ m và số
liệu đ iều tra. Một ư u đ iể m k hác nữa là k ết quả đầu r a c ủa xử lý s ố liệu bằng p hần mềm
SPSS có thể được thao tác và c hế b ản mộ t c ách d ễ dàng trê n c ác p hần mề m k hác như
Micr oso ft Of fic es. Điều nà y rất thuận lợi k hi chúng ta s ử d ụng kế t quả xử lý s ố liệu cho
việc hoàn thành b ài b áo hay luậ n vă n. Hơn thế nữa c ách s ử d ụng p hầ m mề m S PSS
c ũng tương tự như mộ t số p hầ m mề m thông dụng k hác n hư GENS TAT, MINITAB,
vv. Do vậy, quả là khiê m tốn đ ể nói r ằng nếu c húng ta c ó thể sử dụng đư ợc phần mềm
SPSS thì c húng ta có thể sử d ụng các phần mề m tin họ c thố ng k ê khác.
Với mục đ ích giúp c ho đ ối tư ợng họ c bậ c đại học c ó thể sử dụng p hần mềm
SPSS trong xử lý s ố liệ u nghiê n cứu, chúng tôi biên soạn nội d ung họ c phần này và
k hi k ế t th úc chương này, hy vọng ngư ời đọ c c ó thể thự c hiện mộ t số nội d ung sau b ằng
p hần mề m SPSS:
N hậ p số liệu c ho c ác lo ại thiế t k ế thí n ghiệ m k hác nha u
K iể m tra đ ược số liệ u và đ ịnh hư ớng p hâ n tíc h
P hâ n tích thố ng k ê mô tả
P hâ n tích phương sai
Xử lý số liệu thí n ghiệ m mộ t nhâ n tố
3
- Áp d ụng quy tắc n gẫu n hiê n trong thiế t k ế thí n ghiệ m
P hâ n tích tương quan hồ i q uy
B ÀI I: N HẬP SỐ LIỆU
Mấu c hố t c ủa xử lý s ố liệu bằng c ác p hầ m mềm t in họ c là nhậ p số liệu theo c ách
máy c ó thể h iểu đư ợc. Máy tính s ẽ xử lý đ úng nếu ta nhập số liệu đ úng. N hập và quản
lý s ố liệu là một công đoạn quan trọng trong quá tr ình nghiên cứu. Cách thức nhập và
q uản lý số liệ u đòi hỏi phải dễ hiễ u đối với các thành viê n trong và ngoài nhó m nghiên
cứu. Hơn thể nữa, nhập và quản lý số liệ u phải thuận lợi cho quá trình xử lý số liệu sau
này. Để nhậ p s ố liệu c húng ta c ó thể có hai lựa c họn. Nhậ p s ố liệu trong phần mềm
EXCEL sau đ ó mỗi khi xử lý s ố liệu thì nạp (import) s ố liệu vào phần mề m SPSS. Lựa
c họn thứ 2 là n hậ p số liệu tr ực tiếp vào p hần mề m SPSS. Mỗi cách nhậ p có những ư u
đ iểm và nhược điể m c ủa nó . Trong phạm v i c ủa c hương này chúng tô i giới thiệu sự lựa
c họn thứ n hấ t, nhậ p và quản lý s ố liệu từ EXCEL.
1.1. Nguyên t ắc c ủa nhập số liệ u
Để có thể nhập số liệ u c húng ta c ần xác định rõ :
Đơn v ị th í nghiệm c ủa nghiê n c ứu
Số b iế n độ c lậ p c ủa nghiên c ứu
Số b iế n p hụ thuộc c ủa n ghiê n cứu
Để nhậ p số liệu đ úng, cần tuyệ t đ ối tuâ n theo các nguyê n tắc s au đ â y:
Mỗi đ ơn vị th í nghiệ m đư ợc nhập vào trong mộ t hàng c ủa worksheet
e xcel. Tấ t cả c ác thông tin c ủa mỗi đ ơn v ị th í nghiệ m p hải đều đ ư ợc nằm
c ùng trong mộ t hàng.
Hàng thứ nhấ t c ủa worksheet e xcel là hàng tê n biế n (độ c lậ p và phụ
thuộ c) .
Mỗi b iến đ ộc lập hay biến p hụ thuộ c nằm trong mộ t c ộ t. Tấ t cả c ác thông
tin về mộ t biế n phải đư ợc nằ m trong mộ t c ột.
N goài r a đ ể mọ i ngư ời đ ều c ó thể hiể u đ ược tập hợp số liệu, nê n d ùng các c hức
năng phụ trợ k hác trong e xcel đ ể giả i thích thêm về tập hợp số liệ u. Ví dụ ta c ó thể
d ùng chứ c nă ng ins ert comment để c hú th ích các tên biến, đơn vị c ủa b iến c ũng như
c hú th ích c ác số liệ u cần thiế t.
1.2. Nhập số liệu trong trư ờng hợp số liệ u không phâ n nhóm/t ổ
Ví dụ 1. Mộ t nhóm nghiê n cứu đ ã tiến hành xác đ ịnh nă ng suất lúa ( kg/ha) tại
10 ô r uộng, kế t quả thu đư ợc ở b ảng 1. Hãy nhậ p s ố liệu đ ể p hâ n tích thống k ê mô tả
năng suấ t lúa .
4
- Bảng 1. Nă ng suấ t lúa (kg/ha) ở 10 ô r uộng k hác nhau
Năng suất Năng suất
S TT STT
(kg/ha) (kg/ha)
1 3.853 6 2.606
2 4.788 7 4.936
3 4.576 8 4.454
4 6.034 9 5.276
5 5.874 10 5.916
C húng ta có thể nhập số liệu n hư sau:
Hình 1 : N hập số liệ u trong trư ờng hợp số liệu k hông phâ n tổ
1.3. Nhập số liệu trong trư ờng hợp số liệ u phân tổ bởi một nhân tố
Ví dụ 2. Mộ t nhó m nghiê n c ứu đã tiến hành nghiê n c ứu ả nh hư ởng của các mức
p hâ n bón đến năng suấ t lúa ( kg/ha) trong mộ t thí n ghiệ m đư ợc thiết k ế theo kiểu C RD,
kết quả thu đư ợc ở bảng 2. Hảy nhậ p số liệ u đ ể p hâ n tíc h ả nh hư ởng c ủa c ác mức phâ n
bón đ ến nă ng suấ t lúa .
5
- Bảng 2. S ố liệu từ thí nghiệ m ảnh hư ởng c ủa mức phâ n b ón đến năng suấ t lúa
(kg/ha)
C ông thức phân bón Lặp lần 1 Lặp lần 2 Lặp lần 3 Lặp lần 4
N0 3.853 2.606 3.144 2.894
N1 4.788 4.936 4.562 4.608
N2 4.576 4.454 4.884 3.924
N3 6.034 5.276 5.906 5.652
N4 5.874 5.916 5.984 5.518
C húng ta có thể nhập số liệu n hư sau:
Hình 2 : N hập số liệ u trong trư ờng hợp số liệu p hân tổ b ởi mộ t nhâ n tố
1.4. Nhập số liệu trong trư ờng hợp số liệ u phân tổ bởi hai nhâ n tố
Ví dụ 3 . Mộ t nhó m nghiê n c ứu đã tiến hành nghiê n c ứu ả nh hư ởng của các mức
đạm b ón và g iống lúa đ ến năng suấ t lúa (kg/ha) trong mộ t th í nghiệ m đ ược thiế t kế
theo kiểu CRD, k ế t quả thu đư ợc ở b ảng 3. Hảy nhậ p s ố liệu đ ể p hâ n tích ả nh hư ởng
c ủa c ác mức phân b ón và giố ng lúa đ ến nă ng suất lúa.
6
- Bảng 3. S ố liệu thu được từ thí nghiệ m ảnh hư ởng c ủa mức đ ạm b ón và giống
lúa đ ến nă ng suất lúa (kg/ha) trong thí nghiệm thiế t kế theo kiểu C RD
Giống
Giống 1 G iống 2 G iống 3 Giống 4
Phâ n bón (V1) (V2) (V3) (V4)
N0 3.853 2.606 3.144 2.894
N1 4.788 4.936 4.562 4.608
N2 4.576 4.454 4.884 3.924
N3 6.034 5.276 5.906 5.652
N4 5.874 5.916 5.984 5.518
Có thể nhập số liệu như sau:
Hình 3 : N hập số liệ u trong trư ờng hợp số liệu p hân tổ b ởi ha i nhâ n tố
1.5. Nhập số liệu trong c ác k iể u t hiế t kế t hí nghiệ m có s ự k hống chế sự s ai khác
ban đầu
Ví dụ 4. Mộ t nhó m nghiê n c ứu đã tiến hành nghiê n c ứu ả nh hư ởng của các mức
đạm b ón và g iống lúa đ ến năng suấ t lúa (kg/ha) trong mộ t th í nghiệ m đ ược thiế t kế
theo kiểu RCB, kế t quả thu đư ợc ở bảng 4. Hãy n hậ p s ố liệu đ ể p hâ n tích ả nh hư ởng
c ủa c ác mức đ ạ m bón và giố ng đ ến nă ng suấ t lúa.
7
- Bảng 4. S ố liệu từ thí nghiệ m ảnh hư ởng c ủa mức phâ n bón và giống lúa đến
năng suấ t lúa (kg/ha) trong thí nghiệ m thiế t k ế theo kiểu RCB
G iống V1
P hân bón
N0 3,853 2,606 3,144 2,894
N1 4,788 4,936 4,562 4,608
N2 4,576 4,454 4,884 3,924
N3 6,034 5,276 5,906 5,652
N4 5,874 5,916 5,984 5,518
G iống V 2
N0 2,846 3,794 4,108 3,444
N1 4,956 5,128 4,150 4,991
N2 5,928 5,698 5,810 4,308
N3 5,664 5,362 6,458 5,474
N4 5,458 5,546 5,786 5,932
G iống V 3,
N0 4,192 3,754 3,738 3,428
N1 5,251 4,582 4,896 4,286
N2 5,822 4,848 5,678 4,932
N3 5,888 5,524 6,042 4,756
N4 5,864 6,264 6,056 5,362
Đâ y là mộ t thí n ghiệ m hai nhân tố : giống và mức phâ n bón. Thí nghiệm này
được thiế t kế theo kiể u RCB. Như vậy, xuất hiện thê m mộ t yế u tố thứ 3, đó là yếu tố
k hối, dùng để khống c hế s ự sai khác ban đầu của các đơn vị th í nghiệ m. N ếu c ó thể
nhậ p số liệu c ủa k iể u thiết k ế thí nghiệm này, thì c húng ta s ẽ c ó thể nhậ p đư ợc số liệu
trong các k iểu thiế t kế thí nghiệ m khác n hư LS, SPLIT- PLOT và STRIP- PLOT. Trong
p hạ m vi c ủa c hương tr ình đ ào tạo bậc đại học chúng tô i ch ỉ g iới thiệ u cách nhậ p s ố liệu
c ủa ha i kiểu thiết k ế thí nghiệ m RCB và LS.
N guyê n tắc c ơ bản n hập s ố liệu trong c ác k iểu thiế t k ế thí n ghiệ m có s ự k hống
c hế s ự sai khác b an đ ầu (RCB, LS, SPLIT-PLOT và S TRIP- PLOT) là xe m xé t yếu tố
k hống c hế như là một yếu tố thí nghiệ m. Có nghĩa là mỗi một yếu tố khống c hế sự sai
k hác cần mộ t c ột trong wor ksheet c ủa excel.
C húng ta có thể nhập số liệu c ho v í dụ 4 ở hình 4. Hình 4 trình bày cá ch nhậ p số
liệu c ủa 1 4 đ ơn v ị thí n ghiệ m đầu.
8
- Hình 4 : N hập s ố liệu trong tr ư ờng hợp số liệ u p hân tổ b ởi ha i nhâ n tố theo kiểu
thiế t k ế RCB
Ví dụ 5 . Mộ t nhó m n ghiê n cứu đ ã tiến hành nghiên c ứu nă ng suấ t (tấn/ha) c ủa 3
giống ngô la i A, B, D và g iống đối c hứng C, trong mộ t thiết k ế th í nghiệm k iểu LS,
kết quả thu đư ợc ở bảng 5. Hãy nhậ p số liệ u để so s ánh nă ng suấ t của các giống ngô .
Bảng 5 . N ă ng suất ( tấn/ha) c ủa c ác g iống ngô A, B, D và C trong thí nghiệm
thiế t k ế theo kiểu LS
N ăng suất hạt (tấn/ha)
Số hàng
Cột 1 C ột 2 C ột 3 C ột 4
9
- 1 1,640(B) 1,210(D) 1,425(C) 1,345(A)
2 1,457(C) 1,185(A) 1,400(D) 1,290(B)
3 1,670(A) 0,710(C) 1,665(B) 1,180(D)
4 1,565(D) 1,290(B) 1,655(A) 0,660(C)
C húng ta có thể nhập như sau (hình 5).
Hình 5 : N hập số liệ u trong trư ờng hợp thiế t kế th í n ghiệ m kiểu LS
Tó m lại, nguyê n tắc c ơ b ản c ủa nhập s ố liệ u để xử lý số liệu bằng p hần mềm
SPSS cũng như các p hần mề m k hác như GENSTAT và MINITAB là “m ỗi đ ơn v ị thí
nghiệm nằm trong một hàng, mỗi biến nằm trong một cột”.
B ÀI 2. KI ỂM TRA SỐ LIỆU VÀ Đ ỊNH HƯ ỚNG PHÂN TÍCH
P hâ n tích số liệu là việ c là m rất đ ơn giản và nhanh chóng, do vậy chúng ta
k hông c ần thiết vội vàng phân tích s ố liệu. Với c ác yê u cầu của mộ t thí n ghiệ m thô ng
10
- thường trong nông nghiệp , phâ n tích s ố liệu có thể ho àn thành trong vài p hút. Tuy
nhiê n, nếu k hô ng kiểm tra s ố liệu mộ t c á ch cẩn thận th ì v iệ c xử lý số liệ u c ó thể p hải
là m đ i là m lại n hiều lầ n do sau khi ho àn thành xử lý số liệu, nhà n ghiê n cứu có thể p há t
hiện mộ t s ố số liệu chư a đư ợc nhập chính xác. Tậ p hợp số liệu c àng lớn bao nhiê u thì
việc kiể m tra số liệ u càng q uan trọng bấy n hiê u.
Mục đ ích c ơ bản của việ c kiể m tra số liệu là p há t hiệ n ra các s ai s ót trong nhậ p
số liệu và phá t hiệ n c ác trư ờng hợp ngo ại lệ ( outliner ). Ngo ài ra việ c kiể m tra s ố liệu
còn có thể giúp ngư ời nghiê n cứu đ ịnh h ình đ ư ợc khuynh hư ớng của mối quan hệ giữa
các b iến n ghiê n cứu, từ đó lự a chọn p hương á n phâ n tích số liệu thíc h hợp.
Việ c kiể m tra số liệ u có thể đư ợc thực hiện bằng nhiề u cá ch khác n hau. Ví d ụ sử
d ụng trình ứng dụng f ilter trong EXCEL, Box p lot hoặ c Scatter p lot trong SPSS.
2.1. Kiể m tra số liệ u bằng trình ứng dụng filter trong EXCEL
K iể m tra s ố liệ u bằng cá ch s ử dụng tr ình ứ ng d ụng filter ( lọ c) có thể đ ư ợc thực
hiện mộ t c ách dễ d àng và nhanh chóng, đ ặ c biệ t khi chúng ta có tậ p hợp s ố liệu nhỏ .
Ví dụ 6. Hã y k iể m tra các số liệu đã nhậ p ở b ảng 2 (ví d ụ 2 ). C ần c hú ý r ằng
đây là mộ t tập hợp số liệu r ất đ ơn giản c húng ta hoàn toàn có thể k iểm tra b ằng mắ t
thường. Tuy nhiê n từ các v í dụ đ ơn giản c húng ta c ần k hái q uát hóa thành phương pháp
k iểm tra s ố liệu c ho mọi tậ p hợp số liệ u k hác nhau.
C húng ta c ó thể k iể m tra như s au:
Bước 1: Khởi đ ộng chức nă ng filter. Việ c khởi động này c ó thể thực hiện
như s au: Data- Filter- AutoF ilter
Bướ c 2: F ilter số liệu nă ng suấ t để p hát hiện r a c ác trư ờng hợp nhậ p sai
hoặ c các trường hợp n go ại lệ
Bước 3: C họn số liệu được c ho là s ai ho ặ c ngo ại lệ đ ể phá t hiệ n bản ghi
(đơn v ị th í nghiệm) nào chứa số liệu đ ó
Từ hình 6 k hông có s ai s ó t nào đ ư ợc p hát hiệ n trong nhậ p số liệu. Giả sử c húng
ta đã nhậ p sai số liệu c ủa đ ơn vị thí nghiệ m thứ nhất, thay vì nhập 3.853 chúng ta đã
nhậ p thành 3 8. 533. Từ hình 7, chúng ta c ó thể đ ặt nghi ngờ về độ c hính xác của bản
ghi c ó nă ng suấ t 38. 533.
11
- Hình 6. Kiể m tra số liệu bằng c hức nă ng Filter
N hư vậy nếu nh ìn vào h ình 7 thì c húng ta c ó thể p há t hiệ n b ản ghi (đơn vị thí
nghiệ m) c ó năng suất 38. 533 . Chúng ta c ó thể di chuyển thẳng đ ến đ ơn v ị th í nghiệm
có c hứa s ố liệu 38 .533. Khi đó c ác đ ơn vị thí nghiệm k hác sẽ b ị ẩ n (8). Màu sắc của
f ilter bị thay đ ổi. Sự thay đ ổi mà u s ắc này báo hiệu tậ p hợp s ố liệ u nghiê n cứu đang b ị
f ilter ( lọ c). N ếu c húng ta muốn thao tác với to àn b ộ số liệu th ì c h ú ý p hải b ỏ c hức năng
f ilter . Điều này c ó thể thực hiệ n đ ư ợc bằng c ách chọn ALL trong filter . C hức năng
f ilter còn có thể giúp ta lựa c họ n đư ợc c á c số liệu theo một số tiê u ch í nào đó do chúng
ta đ ịnh ra .
12
- Hình 7. Kiể m tra số liệu bằng c hức nă ng Filter
Hình 8. Kiể m tra số liệu bằng c hức nă ng Filter
13
- 2. 2. Kiể m tra số liệ u bằng trình ứng dụng B ox- plot ho ặc Scatter Plot trong SPSS
3.2.1. Nạp số liệu từ EXCEL vào SPSS
Sau khi đã n hậ p xong số liệu thì c h úng ta có thể nạ p số liệu vào S PSS để k iểm
tra số liệu cũng n hư p hâ n tích và xử lý số liệu. Việc nạ p s ố liệu vào S PSS ho àn toàn
đ ơn giản như việ c mở mộ t file số liệu. Chúng ta có thể tiến hành theo các bước sau
đây:
Bước 1: Khởi đ ộng SPSS
Bước 2: C họn file – Open Da ta ( h ình 9)
Hình 9. Nạ p số liệu vào SPSS
Bước 3: Tìm đến f ile e xcel chứa số liệu đ ã nhập và mở file (open) . Chú
ý: c h ỉ rõ loại f ile mà c húng ta muốn mở là file có đuô i XLS (file EXCEL). K hi muốn
nạp s ố liệu từ f ile E XCEL vào SPSS, chúng ta phải tắt file EXCEL chứa s ố liệu.
Ví dụ 9. Hã y nạ p ( input) số liệ u ở v í dụ 2 từ E XCEL vào SPSS
Sau khi nạp s ố liệu c húng ta sẽ c ó k ế t quả như ở hình 10
14
- Hình 10 . N ạ p s ố liệu vào SPSS và k ết quả nạ p s ố liệu
2.2.2. Kiểm tra số liệu bằng trình ứng dụng Box -plot h oặc Scatter - P lot trong SPSS
Thự c chất c ủa k iểm tra s ố liệ u bằng tr ình ứ ng d ụng Box- plot hoặ c Scatter- Plot
trong SPSS là vẽ đ ồ thị Box- Plot ho ặ c vẽ đồ thị S catter - P lot. Như vậy, nếu c húng ta
có thể k iể m tra s ố liệu b ằng cá ch sử dụng hai loạ i đồ th ị trê n th ì chúng ta c ũng c ó thể
vẽ c ác đồ thị k hác theo ý muốn. Thự c chấ t là c húng ta lợi d ụng c hứ c nă ng vẽ đ ồ thị để
k iểm tra s ố liệu. Chúng tô i hy vọng r ằng qua phần này ngư ời đ ọc có thể vẽ đ ược các
lo ại đ ồ thị bằng p hần mề m S PSS và k iểm tra số liệ u.
Ví dụ 10. Hã y k iểm tra s ố liệu bằng đồ thị Box- plot trong SPSS b ằng c ách d ùng
tập hợp s ố liệu ở ví dụ 2 (b ảng 2.).
C húng ta c ó thể làm theo c ác b ước sau:
Bước 1: Nạp s ố liệ u vào SPSS
Bước 2: C họn Graph- Boxplot- Sinp le (có thể c họn c lus tered trong tr ư ờng
hợp số liệ u p hâ n nhóm)
Bước 3: Chọn biến ở tr ục tung và biến ở tr ục ho ành
Bước 4: Xem xét c ác trư ờng hợp ngo ại lệ từ đồ thị Box- plot
15
- Năng suấ t
6500
6000
550 0
5000
4500
4000
3500
3000
2500
N0 N1 N2 N3 N4
Công thứ c phâ n b ón
Hình 11. Đồ th ị Box- Plot mô tả mối q uan hệ giữa c ô ng thứ c phân b ón và nă ng
s uấ t c ủa lúa
Q ua đ ồ thị tr ên ta khô ng thấ y những giá tr ị ngo ạ i lệ . Có thể h iểu một c ách đ ơn
giản là c ác giá trị nằ m ngo à i các đuô i của đồ th ị Box- Plot th ì nê n đư ợc xe m xé t về tính
c hính xác cũng như có thể đ ư ợc xem xét như c ác trư ờng hợp ngo ại lệ .
Ví dụ 11. Một nhó m nghiên c ứu đ iều tra ả nh hưởng của tuổi c ủa c hủ hộ đến
việc chấp nhậ n ( Y) hay khô ng chấp nhận (N) tr ồng giống ngô địa phương. Kế t quả
được thể hiện ở b ảng 6 . Hã y kiể m tra kế t quả nhậ p s ố liệu.
Bảng 6. Số liệu về ả nh hưởng c ủa tuổ i c hủ hộ đến chấp nhậ n g iống ngô địa
p hương
Loại hộ Tuổi chủ hộ Tuổi chủ hộ Tuổi chủ hộ Tuổi chủ hộ Tuổi chủ hộ
12
N 48 24 36 10
N 17 36 48 36 6
Y 46 60 5 36 14
N 24 36 24 32 92
N 17 48 36 12 12
N 17 14 24 24 2
Y 24 36 60 5 8
Y 48 36 7,5 24 8
Y 168 5 4 24 5
16
- Y 40 30 60 36 36
N 6 5 48 24 8
Y 16 36 48 34 144
N 12 8 8 22 30
N 28 12 5 19 10
Y 46 12 72 36 7
Y 36 26 72 12 24
N 17 6 10 24 14
N 36 24 12 18 1
N 24 15 12 18 20
N 24 24 36 25 12
N 12 6 48 8 2
N 36 12 24 10 12
N 29 14 18 42 48
N 36 14 5 4 48
N 48 36 36 6 48
N 36 24 36 9 2
Y 48 24 36 60 30
N 36 24 36 46 12
N 12 12 60 24 12
N 84 6 8 32 15
N 9 36 7 92 10
Y 18 36 26 7 7
N 36 48 36 7 72
Y 60 24 22 7 30
N 15 36 18 8 60
Vẽ đồ thị kiểu Box- Plot, k ết quả đư ợc tr ình b ày ở hình 1 2.
Q ua hình 1 2. c ó thể đ ặt nghi ng ờ vào mộ t số bản ghi hay đ ơn vị thí nghiệ m thứ 9, 212,
58, 79, 76, 204, 64, 191 và 30 trong file số liệ u. Các số liệu đó có thể d o sai só t khi
nhậ p số liệu, c ũng có thể là những trường hợp ngo ại lệ , do vậy ch úng ta cần kiể m tra
lại n hững số liệu này. Cần đ ặc biệ t chú ý là khô ng đ ư ợc lo ại bỏ c ác số liệ u này khi
k hô ng c ó lý do ch ính đ áng. Các trư ờng hợp ngoạ i lệ thô ng thư ờng là m c ơ s ở c ho việ c
đề xuấ t ý tưởng nghiê n c ứu mới.
C húng ta có thể vừa k iểm tra s ố liệ u vừa xe m xé t khuynh hư ớng của
p hâ n bố số liệ u hay xe m xé t mối quan hệ g iữa c ác b iến. Điều nà y có thể đư ợc thực hiện
thông qua đồ thị k iểu Scatter- Plot. Tiến tr ình vẽ đ ồ th ị kiểu Scatter- Plot tuâ n theo các
bước như sau : Gr aphs - S catter- S imp le. Sau đó chọn b iế n x và b iế n y. Chỉ c họn
S imple khi ta muốn vẽ đ ồ thị đơn ch ỉ gồ m mộ t biến x và mộ t biế n y ( Hình 13).
17
- 200
9
150 212
i
o100 79 76 58
u 204
t
191 64
30
50
0
N Y
loaiho
Hình 12. Đồ th ị Box- Plot để k iểm tra s ố liệu
Hình 13. Các bư ớc vẽ đồ thị Scatter-Plot
Hình 14 trình bày một ví dụ về đồ thị Scatter- Plot từ một tập hợp số liệ u với 573
đ ơn v ị thí nghiệm. Do tập hợp số liệ u khá lớn cho nên chúng tôi không trình bày tập
hợp số liệ u.
18
nguon tai.lieu . vn