Xem mẫu

  1. TRƯỜNG ĐẠI HỌC NÔNG LÂM HUẾ DỰ ÁN HỢP TÁC VIỆT NAM – H À LAN BÀI GIẢNG NGHIÊN CỨU CHUYÊN SÂU Người biên soạn: PGS.TS Nguyễn Minh Hiếu Huế, 08/2009
  2. TRƯỜNG Đ ẠI HỌC NÔNG LÂM D Ự ÁN GIÁO DỤC VIỆT NAM HÀ LAN B ÀI GIẢNG ỨNG DỤNG TIN HỌC TRONG THIẾT KẾ THÍ NGHIỆM VÀ XỬ LÝ SỐ LIỆU (Phương pháp nghiên cứu nâng cao) LÊ ĐÌNH PHÙNG NG UYỄN MINH HIẾU HUẾ, 2008
  3. MỤC LỤC M Ở ĐẦU ............................................................................................................................ 2 B ÀI I: NH ẬP SỐ LIỆU .................................................................................................... 4 1.1. Nguyên tắc của nhập số liệu .................................................................................... 4 1.2. Nhập số liệu trong trư ờng hợp số liệu không phân nhóm/tổ ................................... 4 1.3. Nhập số liệu trong trư ờng hợp số liệu phân tổ bởi một nhân tố .............................. 5 1.4. Nhập số liệu trong trư ờng hợp số liệu phân tổ bởi hai nhân tố................................ 6 1.5. Nhập số liệu trong các kiểu thiết kế thí nghiệm có sự khống chế sự sai khác ban đầu ......................................................................................................................................... 7 B ÀI 2. KI ỂM TRA SỐ LIỆU VÀ ĐỊNH HƯ ỚNG PHÂN TÍCH............................... 10 2.1. Kiểm tra số liệu bằng tr ình ứ ng dụng filter trong EXCEL .................................... 11 2.2. Kiểm tra số liệu bằng tr ình ứ ng dụng Box- plot hoặc Scatter Plot trong SPSS...... 14 B ÀI 3. PHÂN TÍCH THỐNG KÊ MÔ TẢ ................................................................... 19 3.1. Phân tích thống kê mô tả trong trư ờng hợp tập hợp số liệu không phân nhóm ..... 20 3.2. Phân tích thống kê mô tả trong trư ờng hợp tập hợp số liệu phân nhóm ............... 21 B ÀI 4. PHÂN TÍCH PHƯƠNG SAI ............................................................................. 23 B ÀI 5. PHÂN TÍCH PHƯƠNG SAI CHO CÁC KIỂU THIẾT KẾ THÍ NGHIỆM KHÁC NHAU .................................................................................................................. 28 5.1. Nguyên tắc của phân tích số liệu của thiết kế thí nghiệm RC B và LSD ............... 28 5.2. Phân tích số liệu từ thí nghiệm kiểu RCB.............................................................. 29 5.3. Phân tích số liệu từ thí nghiệm kiểu LSD .............................................................. 34 B ÀI 6. ÁP DỤNG QUY TẮC NGẪU NHIÊN TRONG THIẾT KẾ THÍ NGHIỆM VỚI M ỘT NHÂN TỐ ............................................................................................................. 39 6.1. Ngẫu nhiên hóa trong thiết kế thí nghiệm kiểu C RD và RCB ............................... 39 6.2. Ngẫu nhiên hóa trong thiết kế thí nghiệm kiểu LSD ............................................. 41 B ÀI 7. PHÂN TÍCH H ỒI QUY ..................................................................................... 42 2
  4. MỞ ĐẦU Hai giai đ o ạn th ú v ị nhấ t trong nghiê n cứu là thiế t k ế thí n ghiệ m và xử lý số liệu. Tuy nhiê n, đ â y là hai giai đo ạn tiêu tố n thời g ian nhấ t. Trong mộ t th í nghiệm, quá tr ình thiế t kế thí n ghiệ m và xử lý s ố liệ u k hô ng phải c h ỉ tiến hà nh một lần mà thư ờng được lặp đ i lặ p lại nhiề u lần, đặ c biệ t là gia i đ oạn xử lý s ố liệ u. Nhận đ ịnh này c àng đ úng khi làm v iệc với một tậ p hợp s ố liệu lớn, ví d ụ s ố liệu điề u tra. Hiểu bản chấ t của thiế t k ế thí nghiệm và xử lý s ố liệ u là đặc biệ t quan trọng. Quá tr ình thiế t k ế th í nghiệm và xử lý số liệu s ẽ nhanh hơn, chính xác hơ n và thú v ị hơn nếu c húng ta có thể ứng d ụng tin học vào p hân tích s ố liệu thay v ì tính toán đơn thuần. Hiệ n nay c ó rất nhiều phần mề m g iúp c ho quá tr ình xử lý số liệu. Nếu c húng ta sử d ụng c ác p hần mềm để p hâ n tích k ết quả th ì luô n luô n c ó kế t quả. Vấn đề c ơ bản là kết quả đ ó đ úng hay sai, k ế t quả đó nói lê n đ iều gì. Quả là k hô ng thừa k hi nhấ n mạnh rằng c húng ta phải hiểu đư ợc bản chấ t của thiế t kế thí nghiệ m và xử lý số liệu tr ước khi ứ ng d ụng cô ng nghệ thô ng tin. Tất c ả các kiế n thức về bản c hấ t c ủa thiế t k ế th í nghiệm và xử lý s ố liệu đ ư ợc đề c ậ p trong họ c phần p hương pháp thí n ghiệ m. Trong phạ m vi c ủa học phần này c húng tô i đề cậ p đ ến v iệ c vận d ụng p hầm mề m SPSS trong xử lý số liệu. P hầ m mềm SPSS là một phần mề m r ất thô ng d ụng. Chúng ta c ó thể có được p hầ m mề m nà y b ất kỳ ở đ â u. Việ c xử d ụng p hần mềm nà y r ất đ ơn g iản, như ng lạ i r ất có h iệu q uả. C ó thể nói r ằng phần mề m S PSS giải q uyế t đư ợc gần n hư to àn b ộ các yê u cầu c ủa xử lý số liệu trong các nghiên c ứu trong nô ng nghiệ p. Mặ t khác p hần mềm SPSS cũng có ưu thế xử lý các tập hợp s ố liệu k há lớn như s ố liệ u điề u tra. Do vậy, c húng ta có thể ho àn to àn sử d ụng p hần mềm SPSS cho xử lý số liệu th í nghiệ m và số liệu đ iều tra. Một ư u đ iể m k hác nữa là k ết quả đầu r a c ủa xử lý s ố liệu bằng p hần mềm SPSS có thể được thao tác và c hế b ản mộ t c ách d ễ dàng trê n c ác p hần mề m k hác như Micr oso ft Of fic es. Điều nà y rất thuận lợi k hi chúng ta s ử d ụng kế t quả xử lý s ố liệu cho việc hoàn thành b ài b áo hay luậ n vă n. Hơn thế nữa c ách s ử d ụng p hầ m mề m S PSS c ũng tương tự như mộ t số p hầ m mề m thông dụng k hác n hư GENS TAT, MINITAB, vv. Do vậy, quả là khiê m tốn đ ể nói r ằng nếu c húng ta c ó thể sử dụng đư ợc phần mềm SPSS thì c húng ta có thể sử d ụng các phần mề m tin họ c thố ng k ê khác. Với mục đ ích giúp c ho đ ối tư ợng họ c bậ c đại học c ó thể sử dụng p hần mềm SPSS trong xử lý s ố liệ u nghiê n cứu, chúng tôi biên soạn nội d ung họ c phần này và k hi k ế t th úc chương này, hy vọng ngư ời đọ c c ó thể thự c hiện mộ t số nội d ung sau b ằng p hần mề m SPSS:  N hậ p số liệu c ho c ác lo ại thiế t k ế thí n ghiệ m k hác nha u  K iể m tra đ ược số liệ u và đ ịnh hư ớng p hâ n tíc h  P hâ n tích thố ng k ê mô tả  P hâ n tích phương sai  Xử lý số liệu thí n ghiệ m mộ t nhâ n tố 3
  5.  Áp d ụng quy tắc n gẫu n hiê n trong thiế t k ế thí n ghiệ m  P hâ n tích tương quan hồ i q uy B ÀI I: N HẬP SỐ LIỆU Mấu c hố t c ủa xử lý s ố liệu bằng c ác p hầ m mềm t in họ c là nhậ p số liệu theo c ách máy c ó thể h iểu đư ợc. Máy tính s ẽ xử lý đ úng nếu ta nhập số liệu đ úng. N hập và quản lý s ố liệu là một công đoạn quan trọng trong quá tr ình nghiên cứu. Cách thức nhập và q uản lý số liệ u đòi hỏi phải dễ hiễ u đối với các thành viê n trong và ngoài nhó m nghiên cứu. Hơn thể nữa, nhập và quản lý số liệ u phải thuận lợi cho quá trình xử lý số liệu sau này. Để nhậ p s ố liệu c húng ta c ó thể có hai lựa c họn. Nhậ p s ố liệu trong phần mềm EXCEL sau đ ó mỗi khi xử lý s ố liệu thì nạp (import) s ố liệu vào phần mề m SPSS. Lựa c họn thứ 2 là n hậ p số liệu tr ực tiếp vào p hần mề m SPSS. Mỗi cách nhậ p có những ư u đ iểm và nhược điể m c ủa nó . Trong phạm v i c ủa c hương này chúng tô i giới thiệu sự lựa c họn thứ n hấ t, nhậ p và quản lý s ố liệu từ EXCEL. 1.1. Nguyên t ắc c ủa nhập số liệ u Để có thể nhập số liệ u c húng ta c ần xác định rõ :  Đơn v ị th í nghiệm c ủa nghiê n c ứu  Số b iế n độ c lậ p c ủa nghiên c ứu  Số b iế n p hụ thuộc c ủa n ghiê n cứu Để nhậ p số liệu đ úng, cần tuyệ t đ ối tuâ n theo các nguyê n tắc s au đ â y:  Mỗi đ ơn vị th í nghiệ m đư ợc nhập vào trong mộ t hàng c ủa worksheet e xcel. Tấ t cả c ác thông tin c ủa mỗi đ ơn v ị th í nghiệ m p hải đều đ ư ợc nằm c ùng trong mộ t hàng.  Hàng thứ nhấ t c ủa worksheet e xcel là hàng tê n biế n (độ c lậ p và phụ thuộ c) .  Mỗi b iến đ ộc lập hay biến p hụ thuộ c nằm trong mộ t c ộ t. Tấ t cả c ác thông tin về mộ t biế n phải đư ợc nằ m trong mộ t c ột. N goài r a đ ể mọ i ngư ời đ ều c ó thể hiể u đ ược tập hợp số liệu, nê n d ùng các c hức năng phụ trợ k hác trong e xcel đ ể giả i thích thêm về tập hợp số liệ u. Ví dụ ta c ó thể d ùng chứ c nă ng ins ert comment để c hú th ích các tên biến, đơn vị c ủa b iến c ũng như c hú th ích c ác số liệ u cần thiế t. 1.2. Nhập số liệu trong trư ờng hợp số liệ u không phâ n nhóm/t ổ Ví dụ 1. Mộ t nhóm nghiê n cứu đ ã tiến hành xác đ ịnh nă ng suất lúa ( kg/ha) tại 10 ô r uộng, kế t quả thu đư ợc ở b ảng 1. Hãy nhậ p s ố liệu đ ể p hâ n tích thống k ê mô tả năng suấ t lúa . 4
  6. Bảng 1. Nă ng suấ t lúa (kg/ha) ở 10 ô r uộng k hác nhau Năng suất Năng suất S TT STT (kg/ha) (kg/ha) 1 3.853 6 2.606 2 4.788 7 4.936 3 4.576 8 4.454 4 6.034 9 5.276 5 5.874 10 5.916 C húng ta có thể nhập số liệu n hư sau: Hình 1 : N hập số liệ u trong trư ờng hợp số liệu k hông phâ n tổ 1.3. Nhập số liệu trong trư ờng hợp số liệ u phân tổ bởi một nhân tố Ví dụ 2. Mộ t nhó m nghiê n c ứu đã tiến hành nghiê n c ứu ả nh hư ởng của các mức p hâ n bón đến năng suấ t lúa ( kg/ha) trong mộ t thí n ghiệ m đư ợc thiết k ế theo kiểu C RD, kết quả thu đư ợc ở bảng 2. Hảy nhậ p số liệ u đ ể p hâ n tíc h ả nh hư ởng c ủa c ác mức phâ n bón đ ến nă ng suấ t lúa . 5
  7. Bảng 2. S ố liệu từ thí nghiệ m ảnh hư ởng c ủa mức phâ n b ón đến năng suấ t lúa (kg/ha) C ông thức phân bón Lặp lần 1 Lặp lần 2 Lặp lần 3 Lặp lần 4 N0 3.853 2.606 3.144 2.894 N1 4.788 4.936 4.562 4.608 N2 4.576 4.454 4.884 3.924 N3 6.034 5.276 5.906 5.652 N4 5.874 5.916 5.984 5.518 C húng ta có thể nhập số liệu n hư sau: Hình 2 : N hập số liệ u trong trư ờng hợp số liệu p hân tổ b ởi mộ t nhâ n tố 1.4. Nhập số liệu trong trư ờng hợp số liệ u phân tổ bởi hai nhâ n tố Ví dụ 3 . Mộ t nhó m nghiê n c ứu đã tiến hành nghiê n c ứu ả nh hư ởng của các mức đạm b ón và g iống lúa đ ến năng suấ t lúa (kg/ha) trong mộ t th í nghiệ m đ ược thiế t kế theo kiểu CRD, k ế t quả thu đư ợc ở b ảng 3. Hảy nhậ p s ố liệu đ ể p hâ n tích ả nh hư ởng c ủa c ác mức phân b ón và giố ng lúa đ ến nă ng suất lúa. 6
  8. Bảng 3. S ố liệu thu được từ thí nghiệ m ảnh hư ởng c ủa mức đ ạm b ón và giống lúa đ ến nă ng suất lúa (kg/ha) trong thí nghiệm thiế t kế theo kiểu C RD Giống Giống 1 G iống 2 G iống 3 Giống 4 Phâ n bón (V1) (V2) (V3) (V4) N0 3.853 2.606 3.144 2.894 N1 4.788 4.936 4.562 4.608 N2 4.576 4.454 4.884 3.924 N3 6.034 5.276 5.906 5.652 N4 5.874 5.916 5.984 5.518 Có thể nhập số liệu như sau: Hình 3 : N hập số liệ u trong trư ờng hợp số liệu p hân tổ b ởi ha i nhâ n tố 1.5. Nhập số liệu trong c ác k iể u t hiế t kế t hí nghiệ m có s ự k hống chế sự s ai khác ban đầu Ví dụ 4. Mộ t nhó m nghiê n c ứu đã tiến hành nghiê n c ứu ả nh hư ởng của các mức đạm b ón và g iống lúa đ ến năng suấ t lúa (kg/ha) trong mộ t th í nghiệ m đ ược thiế t kế theo kiểu RCB, kế t quả thu đư ợc ở bảng 4. Hãy n hậ p s ố liệu đ ể p hâ n tích ả nh hư ởng c ủa c ác mức đ ạ m bón và giố ng đ ến nă ng suấ t lúa. 7
  9. Bảng 4. S ố liệu từ thí nghiệ m ảnh hư ởng c ủa mức phâ n bón và giống lúa đến năng suấ t lúa (kg/ha) trong thí nghiệ m thiế t k ế theo kiểu RCB G iống V1 P hân bón N0 3,853 2,606 3,144 2,894 N1 4,788 4,936 4,562 4,608 N2 4,576 4,454 4,884 3,924 N3 6,034 5,276 5,906 5,652 N4 5,874 5,916 5,984 5,518 G iống V 2 N0 2,846 3,794 4,108 3,444 N1 4,956 5,128 4,150 4,991 N2 5,928 5,698 5,810 4,308 N3 5,664 5,362 6,458 5,474 N4 5,458 5,546 5,786 5,932 G iống V 3, N0 4,192 3,754 3,738 3,428 N1 5,251 4,582 4,896 4,286 N2 5,822 4,848 5,678 4,932 N3 5,888 5,524 6,042 4,756 N4 5,864 6,264 6,056 5,362 Đâ y là mộ t thí n ghiệ m hai nhân tố : giống và mức phâ n bón. Thí nghiệm này được thiế t kế theo kiể u RCB. Như vậy, xuất hiện thê m mộ t yế u tố thứ 3, đó là yếu tố k hối, dùng để khống c hế s ự sai khác ban đầu của các đơn vị th í nghiệ m. N ếu c ó thể nhậ p số liệu c ủa k iể u thiết k ế thí nghiệm này, thì c húng ta s ẽ c ó thể nhậ p đư ợc số liệu trong các k iểu thiế t kế thí nghiệ m khác n hư LS, SPLIT- PLOT và STRIP- PLOT. Trong p hạ m vi c ủa c hương tr ình đ ào tạo bậc đại học chúng tô i ch ỉ g iới thiệ u cách nhậ p s ố liệu c ủa ha i kiểu thiết k ế thí nghiệ m RCB và LS. N guyê n tắc c ơ bản n hập s ố liệu trong c ác k iểu thiế t k ế thí n ghiệ m có s ự k hống c hế s ự sai khác b an đ ầu (RCB, LS, SPLIT-PLOT và S TRIP- PLOT) là xe m xé t yếu tố k hống c hế như là một yếu tố thí nghiệ m. Có nghĩa là mỗi một yếu tố khống c hế sự sai k hác cần mộ t c ột trong wor ksheet c ủa excel. C húng ta có thể nhập số liệu c ho v í dụ 4 ở hình 4. Hình 4 trình bày cá ch nhậ p số liệu c ủa 1 4 đ ơn v ị thí n ghiệ m đầu. 8
  10. Hình 4 : N hập s ố liệu trong tr ư ờng hợp số liệ u p hân tổ b ởi ha i nhâ n tố theo kiểu thiế t k ế RCB Ví dụ 5 . Mộ t nhó m n ghiê n cứu đ ã tiến hành nghiên c ứu nă ng suấ t (tấn/ha) c ủa 3 giống ngô la i A, B, D và g iống đối c hứng C, trong mộ t thiết k ế th í nghiệm k iểu LS, kết quả thu đư ợc ở bảng 5. Hãy nhậ p số liệ u để so s ánh nă ng suấ t của các giống ngô . Bảng 5 . N ă ng suất ( tấn/ha) c ủa c ác g iống ngô A, B, D và C trong thí nghiệm thiế t k ế theo kiểu LS N ăng suất hạt (tấn/ha) Số hàng Cột 1 C ột 2 C ột 3 C ột 4 9
  11. 1 1,640(B) 1,210(D) 1,425(C) 1,345(A) 2 1,457(C) 1,185(A) 1,400(D) 1,290(B) 3 1,670(A) 0,710(C) 1,665(B) 1,180(D) 4 1,565(D) 1,290(B) 1,655(A) 0,660(C) C húng ta có thể nhập như sau (hình 5). Hình 5 : N hập số liệ u trong trư ờng hợp thiế t kế th í n ghiệ m kiểu LS Tó m lại, nguyê n tắc c ơ b ản c ủa nhập s ố liệ u để xử lý số liệu bằng p hần mềm SPSS cũng như các p hần mề m k hác như GENSTAT và MINITAB là “m ỗi đ ơn v ị thí nghiệm nằm trong một hàng, mỗi biến nằm trong một cột”. B ÀI 2. KI ỂM TRA SỐ LIỆU VÀ Đ ỊNH HƯ ỚNG PHÂN TÍCH P hâ n tích số liệu là việ c là m rất đ ơn giản và nhanh chóng, do vậy chúng ta k hông c ần thiết vội vàng phân tích s ố liệu. Với c ác yê u cầu của mộ t thí n ghiệ m thô ng 10
  12. thường trong nông nghiệp , phâ n tích s ố liệu có thể ho àn thành trong vài p hút. Tuy nhiê n, nếu k hô ng kiểm tra s ố liệu mộ t c á ch cẩn thận th ì v iệ c xử lý số liệ u c ó thể p hải là m đ i là m lại n hiều lầ n do sau khi ho àn thành xử lý số liệu, nhà n ghiê n cứu có thể p há t hiện mộ t s ố số liệu chư a đư ợc nhập chính xác. Tậ p hợp số liệu c àng lớn bao nhiê u thì việc kiể m tra số liệ u càng q uan trọng bấy n hiê u. Mục đ ích c ơ bản của việ c kiể m tra số liệu là p há t hiệ n ra các s ai s ót trong nhậ p số liệu và phá t hiệ n c ác trư ờng hợp ngo ại lệ ( outliner ). Ngo ài ra việ c kiể m tra s ố liệu còn có thể giúp ngư ời nghiê n cứu đ ịnh h ình đ ư ợc khuynh hư ớng của mối quan hệ giữa các b iến n ghiê n cứu, từ đó lự a chọn p hương á n phâ n tích số liệu thíc h hợp. Việ c kiể m tra số liệ u có thể đư ợc thực hiện bằng nhiề u cá ch khác n hau. Ví d ụ sử d ụng trình ứng dụng f ilter trong EXCEL, Box p lot hoặ c Scatter p lot trong SPSS. 2.1. Kiể m tra số liệ u bằng trình ứng dụng filter trong EXCEL K iể m tra s ố liệ u bằng cá ch s ử dụng tr ình ứ ng d ụng filter ( lọ c) có thể đ ư ợc thực hiện mộ t c ách dễ d àng và nhanh chóng, đ ặ c biệ t khi chúng ta có tậ p hợp s ố liệu nhỏ . Ví dụ 6. Hã y k iể m tra các số liệu đã nhậ p ở b ảng 2 (ví d ụ 2 ). C ần c hú ý r ằng đây là mộ t tập hợp số liệu r ất đ ơn giản c húng ta hoàn toàn có thể k iểm tra b ằng mắ t thường. Tuy nhiê n từ các v í dụ đ ơn giản c húng ta c ần k hái q uát hóa thành phương pháp k iểm tra s ố liệu c ho mọi tậ p hợp số liệ u k hác nhau. C húng ta c ó thể k iể m tra như s au:  Bước 1: Khởi đ ộng chức nă ng filter. Việ c khởi động này c ó thể thực hiện như s au: Data- Filter- AutoF ilter  Bướ c 2: F ilter số liệu nă ng suấ t để p hát hiện r a c ác trư ờng hợp nhậ p sai hoặ c các trường hợp n go ại lệ  Bước 3: C họn số liệu được c ho là s ai ho ặ c ngo ại lệ đ ể phá t hiệ n bản ghi (đơn v ị th í nghiệm) nào chứa số liệu đ ó Từ hình 6 k hông có s ai s ó t nào đ ư ợc p hát hiệ n trong nhậ p số liệu. Giả sử c húng ta đã nhậ p sai số liệu c ủa đ ơn vị thí nghiệ m thứ nhất, thay vì nhập 3.853 chúng ta đã nhậ p thành 3 8. 533. Từ hình 7, chúng ta c ó thể đ ặt nghi ngờ về độ c hính xác của bản ghi c ó nă ng suấ t 38. 533. 11
  13. Hình 6. Kiể m tra số liệu bằng c hức nă ng Filter N hư vậy nếu nh ìn vào h ình 7 thì c húng ta c ó thể p há t hiệ n b ản ghi (đơn vị thí nghiệ m) c ó năng suất 38. 533 . Chúng ta c ó thể di chuyển thẳng đ ến đ ơn v ị th í nghiệm có c hứa s ố liệu 38 .533. Khi đó c ác đ ơn vị thí nghiệm k hác sẽ b ị ẩ n (8). Màu sắc của f ilter bị thay đ ổi. Sự thay đ ổi mà u s ắc này báo hiệu tậ p hợp s ố liệ u nghiê n cứu đang b ị f ilter ( lọ c). N ếu c húng ta muốn thao tác với to àn b ộ số liệu th ì c h ú ý p hải b ỏ c hức năng f ilter . Điều này c ó thể thực hiệ n đ ư ợc bằng c ách chọn ALL trong filter . C hức năng f ilter còn có thể giúp ta lựa c họ n đư ợc c á c số liệu theo một số tiê u ch í nào đó do chúng ta đ ịnh ra . 12
  14. Hình 7. Kiể m tra số liệu bằng c hức nă ng Filter Hình 8. Kiể m tra số liệu bằng c hức nă ng Filter 13
  15. 2. 2. Kiể m tra số liệ u bằng trình ứng dụng B ox- plot ho ặc Scatter Plot trong SPSS 3.2.1. Nạp số liệu từ EXCEL vào SPSS Sau khi đã n hậ p xong số liệu thì c h úng ta có thể nạ p số liệu vào S PSS để k iểm tra số liệu cũng n hư p hâ n tích và xử lý số liệu. Việc nạ p s ố liệu vào S PSS ho àn toàn đ ơn giản như việ c mở mộ t file số liệu. Chúng ta có thể tiến hành theo các bước sau đây:  Bước 1: Khởi đ ộng SPSS  Bước 2: C họn file – Open Da ta ( h ình 9) Hình 9. Nạ p số liệu vào SPSS  Bước 3: Tìm đến f ile e xcel chứa số liệu đ ã nhập và mở file (open) . Chú ý: c h ỉ rõ loại f ile mà c húng ta muốn mở là file có đuô i XLS (file EXCEL). K hi muốn nạp s ố liệu từ f ile E XCEL vào SPSS, chúng ta phải tắt file EXCEL chứa s ố liệu. Ví dụ 9. Hã y nạ p ( input) số liệ u ở v í dụ 2 từ E XCEL vào SPSS Sau khi nạp s ố liệu c húng ta sẽ c ó k ế t quả như ở hình 10 14
  16. Hình 10 . N ạ p s ố liệu vào SPSS và k ết quả nạ p s ố liệu 2.2.2. Kiểm tra số liệu bằng trình ứng dụng Box -plot h oặc Scatter - P lot trong SPSS Thự c chất c ủa k iểm tra s ố liệ u bằng tr ình ứ ng d ụng Box- plot hoặ c Scatter- Plot trong SPSS là vẽ đ ồ thị Box- Plot ho ặ c vẽ đồ thị S catter - P lot. Như vậy, nếu c húng ta có thể k iể m tra s ố liệu b ằng cá ch sử dụng hai loạ i đồ th ị trê n th ì chúng ta c ũng c ó thể vẽ c ác đồ thị k hác theo ý muốn. Thự c chấ t là c húng ta lợi d ụng c hứ c nă ng vẽ đ ồ thị để k iểm tra s ố liệu. Chúng tô i hy vọng r ằng qua phần này ngư ời đ ọc có thể vẽ đ ược các lo ại đ ồ thị bằng p hần mề m S PSS và k iểm tra số liệ u. Ví dụ 10. Hã y k iểm tra s ố liệu bằng đồ thị Box- plot trong SPSS b ằng c ách d ùng tập hợp s ố liệu ở ví dụ 2 (b ảng 2.). C húng ta c ó thể làm theo c ác b ước sau:  Bước 1: Nạp s ố liệ u vào SPSS  Bước 2: C họn Graph- Boxplot- Sinp le (có thể c họn c lus tered trong tr ư ờng hợp số liệ u p hâ n nhóm)  Bước 3: Chọn biến ở tr ục tung và biến ở tr ục ho ành  Bước 4: Xem xét c ác trư ờng hợp ngo ại lệ từ đồ thị Box- plot 15
  17. Năng suấ t 6500 6000 550 0 5000 4500 4000 3500 3000 2500 N0 N1 N2 N3 N4 Công thứ c phâ n b ón Hình 11. Đồ th ị Box- Plot mô tả mối q uan hệ giữa c ô ng thứ c phân b ón và nă ng s uấ t c ủa lúa Q ua đ ồ thị tr ên ta khô ng thấ y những giá tr ị ngo ạ i lệ . Có thể h iểu một c ách đ ơn giản là c ác giá trị nằ m ngo à i các đuô i của đồ th ị Box- Plot th ì nê n đư ợc xe m xé t về tính c hính xác cũng như có thể đ ư ợc xem xét như c ác trư ờng hợp ngo ại lệ . Ví dụ 11. Một nhó m nghiên c ứu đ iều tra ả nh hưởng của tuổi c ủa c hủ hộ đến việc chấp nhậ n ( Y) hay khô ng chấp nhận (N) tr ồng giống ngô địa phương. Kế t quả được thể hiện ở b ảng 6 . Hã y kiể m tra kế t quả nhậ p s ố liệu. Bảng 6. Số liệu về ả nh hưởng c ủa tuổ i c hủ hộ đến chấp nhậ n g iống ngô địa p hương Loại hộ Tuổi chủ hộ Tuổi chủ hộ Tuổi chủ hộ Tuổi chủ hộ Tuổi chủ hộ 12 N 48 24 36 10 N 17 36 48 36 6 Y 46 60 5 36 14 N 24 36 24 32 92 N 17 48 36 12 12 N 17 14 24 24 2 Y 24 36 60 5 8 Y 48 36 7,5 24 8 Y 168 5 4 24 5 16
  18. Y 40 30 60 36 36 N 6 5 48 24 8 Y 16 36 48 34 144 N 12 8 8 22 30 N 28 12 5 19 10 Y 46 12 72 36 7 Y 36 26 72 12 24 N 17 6 10 24 14 N 36 24 12 18 1 N 24 15 12 18 20 N 24 24 36 25 12 N 12 6 48 8 2 N 36 12 24 10 12 N 29 14 18 42 48 N 36 14 5 4 48 N 48 36 36 6 48 N 36 24 36 9 2 Y 48 24 36 60 30 N 36 24 36 46 12 N 12 12 60 24 12 N 84 6 8 32 15 N 9 36 7 92 10 Y 18 36 26 7 7 N 36 48 36 7 72 Y 60 24 22 7 30 N 15 36 18 8 60 Vẽ đồ thị kiểu Box- Plot, k ết quả đư ợc tr ình b ày ở hình 1 2. Q ua hình 1 2. c ó thể đ ặt nghi ng ờ vào mộ t số bản ghi hay đ ơn vị thí nghiệ m thứ 9, 212, 58, 79, 76, 204, 64, 191 và 30 trong file số liệ u. Các số liệu đó có thể d o sai só t khi nhậ p số liệu, c ũng có thể là những trường hợp ngo ại lệ , do vậy ch úng ta cần kiể m tra lại n hững số liệu này. Cần đ ặc biệ t chú ý là khô ng đ ư ợc lo ại bỏ c ác số liệ u này khi k hô ng c ó lý do ch ính đ áng. Các trư ờng hợp ngoạ i lệ thô ng thư ờng là m c ơ s ở c ho việ c đề xuấ t ý tưởng nghiê n c ứu mới. C húng ta có thể vừa k iểm tra s ố liệ u vừa xe m xé t khuynh hư ớng của p hâ n bố số liệ u hay xe m xé t mối quan hệ g iữa c ác b iến. Điều nà y có thể đư ợc thực hiện thông qua đồ thị k iểu Scatter- Plot. Tiến tr ình vẽ đ ồ th ị kiểu Scatter- Plot tuâ n theo các bước như sau : Gr aphs - S catter- S imp le. Sau đó chọn b iế n x và b iế n y. Chỉ c họn S imple khi ta muốn vẽ đ ồ thị đơn ch ỉ gồ m mộ t biến x và mộ t biế n y ( Hình 13). 17
  19. 200 9 150 212 i o100 79 76 58 u 204 t 191 64 30 50 0 N Y loaiho Hình 12. Đồ th ị Box- Plot để k iểm tra s ố liệu Hình 13. Các bư ớc vẽ đồ thị Scatter-Plot Hình 14 trình bày một ví dụ về đồ thị Scatter- Plot từ một tập hợp số liệ u với 573 đ ơn v ị thí nghiệm. Do tập hợp số liệ u khá lớn cho nên chúng tôi không trình bày tập hợp số liệ u. 18
nguon tai.lieu . vn