Xem mẫu

  1. BỘ GIÁO DỤC V À Đ À O TẠO TRƯỜNG ĐẠI HỌC NGOẠI T H Ư Ơ N G Đ ế TÀI NGHIẾN CỨU KHOM HỌC CẤP B Ộ ỨNG DỤNG CÔNG NGHỆ TESTING TRONG XÂY DỰNG NGÂN HÀNG ĐẼ THI (TESTITEMS BANKING) Mã sô: B 8 4 - 2 9-00 Chủ nhiệm đề tài: - TS Nguyễn Đức Hoạt Người tham gia: - ThS. Nguyễn Phương Sửu - KS. Lãm Ngọc Minh T H Ư V) EN ỊB U Ô N G DA! HÓT: NGOAI ;H'JONfc DT.0C05% HÀ NỘI 2002
  2. BỘ GIÁO DỤC VÀ ĐÀO TẠO TRƯỜNG ĐẠI HỌC NGOẠI THƯƠNG ýfi ^ V % Đế TÀI NGHIÊN CỨU KHOA HỌC CẤP BỘ ỨNG DỤNG CÔNG NGHỆ TESTING TRONG XÂY DỰNG NGÂN HÀNG ĐÊ THI (TESTITEMS BANKING) MÃ SỐ: B98-40-02 Xác nhận của cơ quan chủ trì đề tài Chủ nhiệm đề tài KT HIỆU TRƯỞNG
  3. Mạc LỤC NỘI DUNG Trang MỤC LỤC » LỜI NÓI Đ Ầ U » C H Ư Ơ N G ì: M Ú C TIÊU V À P H À M VI Á P DỤNG C Ủ A Đ Ể TÀI Ì 1.1. Tinh cấp thiết của đề tài 1 ỉ .ĩ. Mục tiêu và phạm vi áp dụng của đẽ tài 3 C H Ư Ơ N G l i : C ơ SỞ L Ý L U Ậ N V À P H Ư Ơ N G P H Á P N G H I Ê N c ứ u 6 2.1. Quan hệ giữa hoạt động giảng dạy và kiểm tra đánh giá 6 2.2. Các trường phái ngôn ngữ và lý thuyết về kiểm tra đánh giá ì C H Ư Ơ N G n i : QUY T R Ì N H X Â Y DỤNG M Ộ T N G Â N H À N G Đ Ể THI 15 3.1. Định nghĩa về ngân hàng đề thi (item bank) 15 3.2. Ý nghĩa của việc xây dựng ngân hàng đề thi 16 3.3. Thực tiễn áp dung ngân hàng đề thi trẽn thế giới li 3.4. Xây dựng tiểu mục (itemlquestion) 19 3.5. Quy trình xây dựng ngân hàng và làm đề thi 21 C H Ư Ơ N G IV: K H Ả N Ă N G TIN H Ọ C HOA K H Â U KIỂM TRA Đ Á N H GIÁ 40 4.1. Tính cẩn thiết của việc xác định thuộc tính 40 4.2. Đ c tính cần có của phần mềm chuyên dụng 33 4.3. Tinh tương thích với chương trình phân tích, đánh giá kết quả 44 4.4. Giới thiệu phẩn mềm ứng dụng TESTPRO Ì .0 44 C H Ư Ơ N G V: K Ế T L U Ậ N V À K H U Y Ế N NGHỊ GIẢI P H Á P 50 Tài liệu tham khảo 53 Phụ lục 1: Kết quả phán tích tiểu mục Phụ lục 2: Bài thi m u
  4. L Ờ I NỚI ĐẨU Kiểm tra đánh giá (KTĐG/TESTING) là một kháu quan trọng trong giảng dạy và học tập nói chung và trong giảng dậy và học liếng Anh nói riêng. K i ể m tra đánh giá là công cụ quan trọng trong qua trình quản lý giáo dục, đặc biệt là trong quy trình bảo đảm chất lượng trong giáo dục và đào lạo. N ó đám báo cho các nhà quản lý, giáo viên và người học đánh gia chính xác tính hiệu quả trong hoạt động đào tạo. Trên thế giới công nghệ K T Đ G hay TESTING đã được áp dụng rộng rãi và đã thu được nhiều thành tễu to lớn góp phần đáng kể nâng cao chất lượng đào tạo. o Việt nam, cũng đã có nhiều công trình nghiên cứu và bài viết cả về phương diện lý thuyết và áp dụng thễc tiễn công nghệ K T Đ G trong đó có cả việc áp dụng tin học trong K T Đ G đặc biệt là áp dụng phần mềm chuyên dụng trong xây dễng, vận hành ngán hàng tiểu mục đề thi (gọi tất là ngân hàng đề thi (NHĐT)). N h ó m tác giả chúng tôi đã chọn đề tài nghiên cứu "ứng dụng công nghệ TESTING trong xây dễng ngân hàng đề t h i " nhằm mục đích nghiên cứu m ô hình và đánh aiá tính khả thi khi áp dụng phần mềm chuyên dụng trong xây dễng và vận hành một N H Đ T thông qua việc lập và cho vận hành thử nghiệm ở quy mỏ nhỏ (trên 720 tiểu mục). Mục tiêu nghiên cứu của đề tài là xây dễng một ngân hàng đề thi cho môn học tiếng Anh Kinh doanh quốc tế đang dạy cho sinh viên năm thứ 3 hệ cử nhân chuyên ngành Tiếng Anh thương mại tại trường đại học ngoại thương và vận hành thử trên quy m ô thễc nghiệm (demonstration) một ngân hàng gồm trên 720 tiểu mục. N h ó m tác giả hy vọng thành công của đề tài sẽ dẫn tới việc áp dụng trên quy m ô chính quy không những cho môn học này m à cả các m ô n học và ngành khác trong và ngoài trường. Trong quá trình thễc hiện đề tài chúng tôi đã nhận được sễ trợ giúp kinh phí quý báu của Bộ giáo dục và đào tạo thông qua Vụ Khoa học và Công nghệ, sễ
  5. chỉ đạo sái sao và quan tâm cổ vũ lớn lao của ban giám hiệu n ường Đại học Ngoại thương, sự trự giúp và hợp lác nhiệt tình của cúc đồng nghiệp (rong và ngoài trường, các cán bộ các phòng, khoa. Chúng tôi cũng nhận dược các ý kiến góp ý quý báu của các nhà khoa héc và sự tham gia nhiệt tình của các sinh viên. Nhân dịp này chúng l ồ i xin bày tỏ lòng cảm ơn chán thành tới Bộ GD Đ T và Ban giám hiệu nhà trường cùng tốt cả các tập thể và cá nhãn đã giúp đỡ chúng tôi hoàn thành công trình này. Nhóm tác giả cũng xin cám ơn cône ty tin học EDTECH đã cộng tác và có nhã ý cho phép chúng tối sử dụng phần mềm chuyên dụng TestPro Ì .0 của công ty để thực hiện đề tài này. Các tác giả
  6. C H Ư Ơ N G ì: MỤC TIÊU V À PHẠM VI ÁP DỰNG CỦA Đ Ể TÀI 1.1. TÍNH CẤP THẾT CỦA ĐỀ TÀI Vấn đề đo lường và đánh giá chất lượng đào tạo là một vấn đề then chốt trong hoạt động dạy và học, quản lý giáo dục nói chung và trong hoạt động học tập, giảng dạy, và quản lý đào tạo ngoại ngữ nóiriêngtrong đó có tiếng Anh. Hoạt động thi, kiểm tra đánh giá là một khâu quan trọng trong quá trình đó. Một bài thi hoặc kiểm tra đánh giá (TEST) phải đạt các tiêu chí như: có độ tin cậy cao (reliability) và độ giá trị cao (validity) có khả năng đo lường những kiến thệc và kỹ năng cần đo, có khả năng phân loại người học, an toàn và tiện lợi trong sử dụng, khách quan và công bằng trong đánh giá, đảm bảo tính khách quan cao, hạn chế đến mệc tối đa yếu tố chủ quan của người chấm. Từ lâu nay, việc kiểm tra theo phương pháp truyền thống chủ yếu dựa vào phương pháp đánh giá chủ quan (Subjective Tests) đã bộc l ộ một số nhược điểm. Tuy có tiện lợi cho người ra đề, dễ điều hành song cũng có nhiều hạn chế như không bảo đảm bao phủ các mảng kiến thệc, tính chủ quan cao, khó bảo đảm độ đồng nhất về độ khó dễ giữa các bài TEST, giữa bài ra trong các năm khác nhau, việc chấm thi rất mất thời gian và không đảm bảo tính đồng nhất giữa các người chấm khác nhau. Tại khoa tiếng A n h trường Đ ạ i học Ngoại thương (ĐHNT), công nghệ kiểm tra đánh giá ( C N K T Đ G ) đã được bước đầu ệng dụng ở mệc độ nhất định, ví dụ như các bài trắc nghiệm khách quan đã được các giáo viên sưu tầm, biên soạn để ệng dụng trong kiểm tra và đánh giá. Song về cơ bản đây m ớ i là hoạt động đơn lẻ, thiếu tính hệ thống và không dựa trên một quy trình công nghệ
  7. và do vậy tuy đã có cải tiến so với các phương pháp truyền thống song vẫn chưa đáp ứng được các tiêu chí nêu trên. Đ ề tài này đã chọn m ô n Tiếng A n h kinh doanh quốc tế để thử nghiệm quy trình ứng dụng phần mềm chuyên dụng trong kiểm tra đánh giá. M ô n Tiếng A n h K D Q T là một m ô n đã được dạy qua hai khoa hệ cử nhân Tiếng A n h thương mại. M ô n học đã có giáo trình ổn đữnh, có mục tiêu và thời lượng xác đữnh cho các chương. Trong hai năm qua việc kiểm tra đánh giá vẫn thực hiện dưới hình thức kết hợp giữa đánh giá chủ quan thông qua bài tự luận, bài dữch ( 3 0 % tổng số điểm) và bài trắc nghiệm khách quan ( 7 0 % ) . Các bài trắc nghiệm được giáo viên sưu tẩm và sửa đổi hoặc lấy từ trên mạng. Các bài này tuy dưới hình thức trắc nghiệm khách quan song do không có phần mềm chuyên dụng nên chưa thể đữnh chuẩn theo các thông số như độ tin cậy, độ giá trữ, mức độ khó dễ của từng tiểu mục, từng bài test cụ thể so với mục tiêu và yêu cầu của m ô n học. Nói tóm lại việc ra đề, chấm thi, xác đữnh kết quả và phân hạng sinh viền cũng như khả năng đánh giá mức độ tiến bộ, các kiến thức và kỹ năng còn yếu và thiêu còn mang tính chủ quan và không chính xác. Kết quả là người học, thày dạy và người quản lý không có một công cụ đo lường nhất quán và chính xác. Từ nhiều năm nay, Bộ giáo dục và đào tạo, các cơ sở đào tạo đại học được chú trọng đến việc ứng dụng C N K T Đ G nhằm nâng cao hiệu quả và tính chuẩn xác trong đánh giá kết quả dạy và học đại học nói chung và trong dạy và học ngoại ngữ nóiriêng.Nhiều hội thảo, công trình nghiên cứu đã tập trung thảo luận các biện pháp nhằm nâng cao và hoàn thiện hơn nữa công tác đánh giá chất lượng trong giáo dục đại học, đặc biệt là việc ứng dụng C N K T Đ G trong đó có việc áp dụng công nghệ thông tin trong C N K T Đ G và xây dựng Ngân hàng tiểu mục đề thi, sau đây gọi tắt là Ngân hàng đề thi (NHĐT). Việc nghiên cứu m ô hình hoa quy trình C N K T Đ G dựa trên N H Đ T có sử dụng phần mềm chuyên dụng là một việc cấp thiết thực hiện mục tiêu của Bộ G D Đ T nhằm ứng dụng t i n học, và từng bước chuẩn hoa quy trình kiểm tra và 2
  8. đánh giá trong giáo dục đại học. Việc ứng dụng C N K T Đ G sẽ giúp nâng cao tính hiệu quả giảng dạy và học ngoại ngữ tại khoa Tiếng Anh nói riêng và có thể nghiên cứu ứng dụng cho các m ô n và ngành học khác trên nền tảng công nghệ chung tại trường Đ H N T . N ó không những giúp nâng cao hiệu quả giảng dạy và học tập m à còn là một công cụ đắc lực cho các nhà quản lý giáo dục trong việc đánh giá hiệu quả và lập kế hoạch chiến lược trong đào tạo. 1.2. M Ụ C TIÊU V À PHẠM VI Á P DỤNG C Ủ A Đ Ể TÀI 1.2.1. Mục tiêu của đê tài: Mục tiêu của đề tài này nhằm: - Nghiên cứu đánh giá khả năng ứng dụng N H Đ T có sồ dụng phần mềm chuyên dụng trong kiểm tra đánh giá trong hoạt động giảng dạy tiếng Anh. - Khuyến nghị quy trình cồng nghệ và m ô hình ứng dụng N H Đ T trong giảng dạy tiếng A n h nói chung và tiếng A n h chuyên ngành nói riêng và các biện pháp và yêu cầu về hạ tầng cơ sở kỹ thuật, nguồn lực đề triển khai trên quy m ô rộng và bảo đảm tính bền vững của hệ thống. - Đưa ra một ngân hàng đề thi mẫu gồm trên 720 tiểu mục có sồ dụng phần mềm chuyền dụng. Ngân hàng này gồm các tiểu mục và đề thi cho m ô n Tiếng Anh kinh doanh quốc tế đang được giảng dạy cho hệ cồ nhân tiếng A n h thương mại tại Khoa tiếng Anh, trường Đ H N T H à nội. 1.2.2. Phạm vi áp dụng: Nếu được triển khai áp dụng công trình sẽ góp phần đắc lực bảo đảm cho công tác kiểm tra đánh giá được hiệu quả trong phạm v i khoa tiếng A n h và cho các bộ m ô n ngoại ngữ khác tại trường Đ H N T , cho các khoa hoặc trường chuyên ngữ khác. Do tính ứng dụng thực tiễn cao của phần mềm ứng dụng, các quy trình công nghệ thiết lập bởi công trình có thể được áp dụng cho công tác kiểm tra đánh giá cho Gác m ô n học thuộc các lĩnh vực và chuyên ngành khác. 3
  9. 1.2.3. Nội dung và sấn phẩm của đề tài: Nội dung của đềt i gồm hai phần chính sau: à Ả ) Phần giới thiệu và thuyết minh để tài gồm 5 chương: - Chương ì: Mục tiêu và phạm vì áp dụng cùa đề tài Mục tiêu của đềt i nhằm nghiên cứu cơ sở lý luận và khả năng áp dụng công à nghệ kiêm tra đánh giá hiện đại trong giảng dạy ngoại ncữ nói chung và tiếng Anh nói riêng nhìn tử giác độ lý thuyết về ngón ngữ, tâm lý và giáo học pháp ngoại ngũ. Trên cơ sở trên đề t i khuyến nghị quy trình công nghệ trong quá à trình lập, quản lý vận hành một ngân hàng đè thi có sử dụng phần m é m chuyên dụns. - Chương 2: Cơ sở lý luận và phương pháp nghiên cứu Phần này xem xét các trường phái lý thuyết liên quan đến giảng dạy ngoại ngữ và công nghệ kiểm tra đánh giá, các tiêu chí càn có của một ngán hàng đề thi và một bài kiểm tra đánh giá (test). - Chương 3: Quy trình xây dựng ngân hàng đề thi Trong phần này tác giả xác định các quy trình lập ngân hàng đề t h i và khuyếnnghị một m ô hình Ún 2 dụng mang tính khả thi cao đáp ứng được những tiêu chí cần có. - Chương 4: Khả năng tin học hoa khâu kiểm tra và đánh giá Trong phần này tác giả đã nghiên cứu khả năng áp dụng tin học trong kiểm tra và đánh giá đặc biệt là nêu các yêu cầu cần có của một phần mềm ứng dụng. Phần này cũng giới thiệu các tính năng, công dụng của phần mềm chuyên dụng TestPro Ì .0 do công ty tin học Edtech phát triển. Phần mềm này được sử dụng để chạy trên quy m ô thử nghiệm một ngán hàng tiểu mục đề t h i gồm 4
  10. trên 720 tiểu mục cho món Tiếng Anh Kinh doanh quốc lố đang dạy tại n ường Đại học Ngoại thương. - Chương 5: Kết luận và khuyên nghị lỊÌái pháp Trên cơ sở đánh giá khả năng ứng dụng, m ô hình hoa và chạy thử nghiệm trên quỵ m ó nhỏ, đề t i khuyến nghị giải pháp triển khai trên quy m ó chính thức à cho một số môn học đang dạy tại Khoa tiếng Anh và cho cả các môn học khác trong trường. B) Sản phẩm của đề tài: Toàn bộ trên 720 tiểu mục thô đưẹc biên soạn, sưu tầm và phán loại sẽ đưẹc nạp vào một phần mềm ứng dụng do cóng ty Edtech phát triển. Toàn bộ phần mềm ứng dụng và trên 720 tiểu mục đưẹc chứa trong Ì đĩa CD để dùng vào mục đích hoạt độn£ trên quy m ô thử nghiệm. N ộ i dung kiểm tra đưẹc dựa trên mục tiêu và nội dung của 5 chương đầu thuộc môn học Tiếng A n h Kinh doanh quốc tế. Phần mềm ứng dụng sử dụng trong đề tài này mang tính thử nghiệm. Do kinh phí hạn hẹp của đề tài, phần mềm ứng dụng sẽ đưẹc chuyển giao trong giai đoạn triển khai một khi công trình đưẹc phép ứng dụng trên quy m ô lớn tại trường Đ H N T . 5
  11. C H Ư Ơ N G l i : C ơ SỞ L Ý L U Ậ N V À P H Ư Ơ N G P H Á P N G H I Ê N cứu 2.1. Quan hệ giữa hoạt động giảng dạy và kiểm tra đánh giá Quá trình dạy là chu trình liên tục và khép kín bao gồm nhiều bước k ế tiếp nhau, bổ sung cho nhau. Xây dựng chương trình đào tạo theo hướng lấy người học làm trọng tám thường bắt đầu từ khâu phán tích yêu cầu, mục đích của người học. Những yêu cầu và mục đích ấy được cụ thộ hoa thành mục tiêu chương trình đào tạo. Mục tiêu chương trình đào tạo mang tính chỉ đạo quyết định nội dung chương trình nào, phương pháp nào, tài liệu dạy-học nào và phương thức kiộm tra-đánh giá nào là phù hợp độ đạt mục tiêu chương trình đề ra. Đ ộ có thộ đánh giá tổng thộ chất lượng của chương trình đào tạo, người ta cần đánh giá thành quả học tập của người học. Những thông tin đánh giá tổng thộ giúp người quản lý và người làm chương trình rút ra được bài học cho những khoa học sau. Quá trình dạy học có thộ m ô tả vắn tắt theo m ô hình sau (Hình 1): Phân tích nhu cầu người Mục tiêu đào tạo ị Đánh giá kết quả N ộ i dung đào tạo Phương pháp / hoạt động Hình Ì: Vị trí của kiểm tra đánh giá trong hoạt động đào tạo
  12. Chu trình trên, theo quan diêm phát triển trong giáo dục, là chu trình khép kín luôn luôn đổi mới theo nhu cầu và trình độ của người học. Cũng như chương trình và phương pháp đào tạo, phương pháp và nội dung kiểm tra đánh giá cũng không ngừng được bổ sung và hoàn thiện. 2.2. Các t r u ồ n g phái ngôn ngữ và lý thuyết về k i ể m t r a đánh giá Phương pháp luận đóng vai trò đựnh hướng cho quá trình dạy-học. Lý luận về dạy và học ngoại ngữ đã trải qua nhiều thời kỳ phát triển và chựu sự chi phối của nhiều trường phái ngôn ngữ học, tâm lý học khác nhau. Đ ã có lúc các nhà khoa học đã cố gắng tìm ta một phương pháp dạy ngoại ngữ tốt nhất. Nhưng rốt cuộc, người ta phải đi đến kết luận rằng không có phương pháp nào là tốt nhất phù hợp với mọi đối tượng và m ọ i hoàn cảnh học tập. Phương pháp kiểm tra/đánh giá cũng chựu sự chi phối của các trào lưu trên. Tuy các trường phái thì có nhiều song trong phạm vi công trình này chúng tôi x i n chỉ đề cập đến hai trường phái chính có ảnh hưởng sâu sắc nhất tới phương pháp giảng dạy và kiểm tra đánh giá hiện đại, đó là trường phái cấu trúc-hành v i (structural- behavourist approach) và trường phái giao tiếp (communicative approach). Đ ể đảm bảo cho một bài test đáp ứng được những tiêu chí của nó, người soạn thảo phải hiểu rõ mình đựnh test cái gì. Theo quan điểm giao tiếp, một bài test phải gồm những tập hợp những kỹ năng ngôn ngữ nguyên mẫu m à người học có thể sử dụng trong những tình huống giao tiếp tương tự trong thực tế. Vì vậy một N H Đ T phải được xây dựng trên nền tảng lý thuyết và một m ô hình về năng lực giao tiếp của người học. D ư ớ i đây là một số trường phái ngôn ngữ và tâm lý học chính là cơ sở lý luận chủ chốt của C N K T Đ G hiện đại. 2.2.1. Trường phái cấu trúc và trắc nghiệm tâm lý (The psychometric- structural approach) Có thể nói nguyên tắc chủ đạo để thiết kế các bài test dựa trên các chương trình hoặc giáo trình thiết kế theo trường phái cấu trúc là dựa trên trường phái 7
  13. lúm lý hành vi và lý thuyết ngôn ngữ học cấu trúc thể hiện cụ thè trong các công trình của Lado (1961), Harris (1969) và Healon (1975). Các bài test thời kỳ này gọi chung l bài test cấu trúc-lrấc nghiệm tám lý (The psychometric- à structural approach) với đặc trưng chính lù sự nhấn mạnh đến tính khách quan (objectivity) trona C N K T Đ G . Hình thức bài icsl chủ yếu l dạng câu lựa chọn à không cần ngữ cảnh (discrete-point multiple choice items), hình thức này thộm chí còn đùn" để kiểm tra cúc kỹ năng sản sinh (productive skills) như nói và viết. Các bài test chủ yếu dựa trên sự phân chia nhỏ ngôn ngữ thành các bộ phộn cấu thành có trình tự từ thành phần nhỏ đến lớn, từ cao đến thấp: ám vị, ngữ vị đến từ vị và sau cùng là cáu. Năng lực ngôn ngữ của một người được coi là quá trình nhớ và tích lũy và hình thành hệ thống thói quen trong giao tiếp từ đan giản đến phức tạp. Trường phái này rất được ưa chuộng và được áp dụna trong dạy ngoại ngữ trong thộp kỷ 60 và 70 và hiện nay vẫn được áp dụng khá rộng rãi tuy có được cải biên. Tuy nhiên trường phái này cũng có những hạn chế nhất định. Carrol (1961) nhộn xét các dạng test kiểu này chỉ có thể đo lường từng phần cấu thành nhỏ của ngôn ngữ không thể đánh giá tổng hợp quá trình vộn dụng cấu trúc trong giao tiếp trong những tình huống cụ thể và vì vộy cần thiết k ế test theo hướng tích họp có tính đến các yếu tố về tình huống siao tiếp cụ thể chứ không nén chia nhỏ kiến thức hoặc kỹ năng của người học. Bài test không đủ khả năng đưa các yếu tố về chu cảnh giao tiếp vào nội dung test. Tuv còn những hạn chế trên song các bài test dựa trên trường phái cấu trúc và trác nghiệm tám lý đã có nhũng đóng góp đáng kể cho C N K T Đ G như: • Đ ã chú trọng đến phương pháp phân tích thống kê và lượng hoa trong đánh giá • Đ ã dựa trên khái niệm về độ tin cộy (Reliability) và độ giá trị (Validity) • Có sự gắn kết giữa nội dung test và nội dung chương trình giảng dạy. 8
  14. • Đ ể cao tính khách quan trong đánh giá 2.2.2. Trường phái giao tiếp Trường phái trắc nghiệm dựa trên nàng lực giao tiếp (Communicative language testing) được phát triển trên cơ sở trào lưu chung (rong giảng dạy ngoại ngữ từ trường phái cấu trúc sang trường phái giao liếp nhấn mạnh đến việc vận dụns ngôn ngữ trons giao tiếp. Hymes (1967) đưa ra khái niệm tình huống aiao tiếp để chỉ các hoạt đầng ngôn ngũ' chủ yếuchi phối bởi các quy tắc giao tiếp chứ không phải chỉ bởi các quy tắc ngữ pháp. Hymes cũng đưa ra khái niệm năng lực giao tiếp (communicative competence). Theo ông, năng lực giao tiếp không chỉ bao sòm các kiến thức về ngữ pháp m à còn liên quan đến các khả năng khác ngoài ngôn ngữ. Các yếutố giao tiếp thực tế cần phải đưa vào các bài test, các yếutố đó phải phản ánh được các đặc trưng sau của giao tiếp: • Giao tiếp phải mang tính tương tác, nghĩa là nầi dung người nói nói lệ thuầc vào nầi dung nghe được. Quá rình giao tiếp là qu trình trao đổi á linh hoạt luôn luôn phải phân tích tình huống và ý đồ của người đối thoại. • Giao tiếp đòi hỏi phải xảy ra trong ngữ cảnh cụ thể • Giao tiếp đòi hỏi phải sử dụng r.cữ liệu thực và phải đạt tới mầt mục đích cụ thể như thông báo hay thuyết phục. Dựa trên cơ sở lý luận trên chúng ta thấy hiểu rõ nầi dung, kiến thức và kỹ năng cần phải đánh giá là điều kiên tiên quyết, là điểm bắt đầu để trên cơ sở đó xác định tính (đầ) giá trị (validity) của mầt bài test hay mầt N H Đ T . Nói tóm lại tính giá trị của mầt test nhằm trả lời cho câu hỏi liệu bài test có đo lường được cái người thiết kế test định đo hay không? Tuy nhiên, trên thực tế 9
  15. khái niệm tính giá trị cũng như phương pháp nhằm đạt được tính giá trị cao của một test cũng còn có nhiều điều phải bằn trong giới khoa học. 2.2.3. Loại hình kiểm tra đánh giá Về tính chất, bài test có thể chia thành 2 loại hình chính kiểm tra quá trình (process) và kiểm tra sản phẩm cuối cùng (end-product). M ỗ i loại có tác dụng riêng của nó, tuy thuộc vào mục đích sử dụng. Các bài test còn được chia thành các loại hình chính sau tuy mục đích test: Ì) Kiểm tra kết quả (Achievement Test): Kiềm tra kết quả dùng để đo kết quả người học đạt được sau một khoa học hoốc mức độ hoàn thành chương trình. N ó nhất thiết phải lấy múc tiêu và nôi dung chương trình học làm cơ sở (syllabus-based), ví dụ như bài t h i tốt nghiệp chương trình phổ thông trung học chẳng hạn. Ngân hàng tiểu mục đề thi thuộc đè tài nghiên cứu này cũng thuộc loại hình này. 2) Kiểm tra theo chuẩn thực tế(Proficiency Test) Loại hình kiểm tra này đánh giá kỹ năng toàn diện về một ngôn ngữ nhất định của thí sinh trước những yêu cầu cụ thể cần phải hoàn thành. N ộ i dung bài thi thuôc loại hình đánh giá này không liên quan đến chương trình, n ộ i dung, phương pháp học tập cụ thể của thí sinh, m à quan tâm đến yêu cầu thí sinh cần phải đạt được trong một tình huống nhất định (syllabus-independent) ví dụ như thi tuyển làm thông dịch viên cho Liên hơp quốc hoốc thi tuyển vào một trường đại học cụ thể nào đó chẳng hạn. 3) Kiểm tra thăm dò (Diagnostic Test) Kiểm tra thăm dò thường sử dụng trước khóa học để giúp giáo viên soạn chương trình giảng dạy hợp với trình độ học sinh và phát hiện những khó khăn của người học. 10
  16. 4) Kiểm tru xếp thứ bậc (Placement Tesl) Loại hình kiểm tra này được sử dụng đổ xếp người học vào nhóm, lớp cho thích hợp với trình độ, dặc điểm văn hoa, tâm lý . . hoặc phục vụ nhũng mục . đích khác. 2.2.4. Những tiêu chí của một bài kiểm tra đánh giá (test) Một bài đánh giá có tác dụng tích cực đối với quá trình dạy-học hay không phụ thuộc vào những tiêu chí quan trong cần có, đó là độ rin cậy, tính giá trị, khả năng phân loại tích cực và tính thực tiễn của một bài bài test cụ thể. Thiếu những tiêu chí này, một bài test không những không cóp khệ năng đo lường chính xác m à còn có thể có tác dụng tiêu cực đối với quá trình dạy và học. ã) Độ tin cậy Đ ộ tin cậy có liên quan đến mức độ chính xác của phương pháp đo. về mặt lý thuyết, độ tin cậy có thể được coi là số đo mức độ sai lệch giữa điểm số quan sát được và điểm số thực (lý thuyết). Điểm số quan sát được là điểm số thực tế m à người học có được và điểm số thực là điểm số lý thuyết m à ngươi học phệi đạt nếu không mắc lỗi. M ộ t bài thi/kiểm tra được coi là có độ tin cậy khi: - trong hai lần kiểm tra khác nhau, cùng một học sinh đạt số điểm tương đương nhau hoặc trùng nhau nếu làm cùng một nội dung kiểm tra, - í có khệ năng học sinh gian lận trong khi kiểm tra, t - hai giáo viên chấm cùng một bài cho hai hai điểm sát hoặc trùng nhau. - lời chỉ dẫn trong bài rõ ràng, người đọc không hiểu theo nhiều cách khác nhau Có nhiều yếu tố dẫn đến các sai số về phép đo. Các yếu tố này có thể mang tính nội tại hay bên ngoài. Các ngồn sai số từ bên ngoài có liên quan đến quá trình thực hiện bài test và yếu tố chùi quan của người được test như xúc cệm, không ổn định về tâm lý khi dự test . Các nguồn sai số bên trong gắn với n ộ i li
  17. dung bài test gây ra do chọn qua í câu test. Một bài test trên thực tế muốn bảo t đảm độ tin cây phải có í nhất là 30 câu. Sai số cũng gây ra bởi việc lựa chọn t lệch mẫu. Ngay cả khi đã đủ về số lượng câu song nếu các câu không mang tính đại diện về nội dung cũng như tỷ lệ câu (trọng số). Khái niệm này gần với khái niệm về độ giá trị về nội dung bàn dưới đây. Đ ỏ đánh giá mực độ tin cậy của một bài test Kuder và Richarson đã đưa ra công thức gọi là công thức K- R21. Công thức này đo độ phù hợp nội tại có nghĩa là các câu hỏi càng thuần nhất thì độ khó của chúng là thích hợp điều đó có nghiã là hệ số tin cậy cao. Đ ộ tin cậy cao cũng có nghĩa là tần suất phân bổ các câu có độ khó trung bình phải cao còn ở hai thái cực phải nhỏ. Các câu hỏi hay tiỏu mục trong một bài test được xác đinh là có độ tin cậu cao k h i có độ tương quan dương. Ngoài yêu cầu về độ tin cậy, bài thi/ kiỏm tra cần phản ánh đúng trình độ của người học và đó được cái muốn đo - có nghĩa là đồng thời phải có tính giá trị. b) Tính giá trị Nói một cách đơn giản, bài kiỏm tra có tính giá trị cao phải thực sự đánh giá được người học về lĩnh vực cần được đánh giá, phải đo được cái cần phải đo. Tính giá trị là một khái niệm đa phương diện. Có một số phương pháp đỏ thiết lập tính giá trị: • Thông qua việc so sánh nội dung bài test với mục tiêu và nội dung của m ô n học. • So sánh với các bài test cùng kiỏm tra đánh giá một kỹ năng hay k h u vực kiến thức cụ thỏ. • So sánh khả năng thực tế của người tham gia test với yêu cầu lý tưởng trong một lĩnh vực kiến thức hay kỹ năng. 12
  18. • Xác định được bài test đã phản ánh trung thực nguyên lý và lý thuyết về khả nàng thực hành của ngươi tham gia test. Trên cơ sở xác định nói trên, các học giả dã đi đến thống nhất về í nhất là 4 t phương diện thuộc tính giá trị bao gồm tính giá trị về nội dung (content validity), tính giá trị theo chuẩn (criterion-related validity), tính giá trị về cấu trúc hay thuộc tính (contruct validity), tính giá trị bề mặt hoặc hình thức (face validity). Tính giá trị nội dung có liên quan đến độ bao phủ của một test đối với nội dung của một chương trình, tính giá trị nội dung rất cển thiết cho loại hình test về thành tích học tập ngược lại nội dung kiểu test về trình độ hoàn toàn do người thiết k ế lựa chọn thù thuộc vào quan niệm của người test về chuẩn đánh giá. Tính giá trị theo chuẩn đo lường độ dự báo và độ tương đương đồng thời của một test so vói các test khác đã được kiểm định làm chuẩn. Phép đo này dựa vào tính tương đương giữa các bài test trên cơ sở so sánh kết quả test của các cá thể và các bài test. Tính giá trị về cấu trúc hay thuộc tính có liên quan đến khả năng đo lường các thuộc tính cấu thành nên một kỹ năng cụ thể cển đo. Phép đo này liên quan đến các thuộc tính thuộc hành vi, năng lực tư duy của người được test. Thí dụ một bài test với mục đích đo lường khả năng tư duy phân tích của một người phải phản ánh tương đối trung thực các thuộc tính các khía cạnh thuộc về tư duy phân tích được thể hiện qua việc thực hiện bài test gồm khả năng phân tích, tổng hợp, phê phán V..V.. v ề khía cạnh này tính giá trị về cấu trúc cũng trùng lặp với tính giá trị về nội dung. Cuối cùng là tính giá trị về bề mặt hay hình thức. Tính giá trị hình thức liên quan đến sự tiếp nhận của nguôi được test, giáo viên và người tổ chức test về hình thức. Ngày nay x u hướng chung là lựa chọn các dạng test thực hành. 13
  19. Đ ộ tin cậy và tính giá trị có quan hệ với nhau. Trong thực tế có những tiểu mục có độ tin cậy nhưng lại không có tính giá trị. Đ ó là trường hợp người viết tiểu mục định kiểm tra về lĩnh vực A nhưng thực tế lại đo một lĩnh vực nào đó khác. Ví dụ, tiểu mục sau được viết nhằm kiểm tra kỹ năng đọc hoặc có thể là kiến thốc ngữ pháp. Ì. Napoleon was ứ. French b. German c. Italian ả. Russian 2. Bananas grow mostly in countries. a. cold b. tropical c. temperate ả. dry Tiểu mục này nếu cho cùng một thí sinh làm nhiều lần có thể mang lại kết quả giống nhau. Như vậy tiểu mục có độ tin cậy cao. Nhưng nếu xét về tính giá trị thì chưa chắc vì nó không chắc chắn là đo được cái định đo: kỹ nâng đọc hay kiến thốc ngữ pháp hay thậm chí kiến thốc lịch sử (1) hoặc sinh học (2). Hiện tượng này gọi là test song trùng. c) Khả năng phân loại tích cực Bài kiểm tra phải có khả năng phân loại tích cực. Điều đó đơn giản có nghĩa là người học có khả năng cao hơn phải đạt điểm cao hơn trong bài k i ể m tra ấy. Điều này nghe thật đơn giản, nhưng trong thực tế lại có những trường hợp bài thi phân loại tiêu cực đối với người học. Ví dụ, một bài thi quá thấp so v ớ i trình độ người học, người làm bài đều được điểm tuyệt đối hoặc gần tuyệt đối trong khi trình độ thực tế của họ rất khác nhau. Bài thi ấy không có khả năng phân loại tích cực. 14
nguon tai.lieu . vn