Xem mẫu

  1. NGHIÊN CỨU KHOA HỌC ỨNG DỤNG MẠNG NƠRON SVM TRONG MÔ HÌNH LAI DỰ BÁO ĐỘ ẨM LỚN NHẤT VÀ NHỎ NHẤT TRONG NGÀY APPLICATIONS OF SVM NETWORKS IN HYBRID MODEL FOR PREDICT THE MAXIMUM AND MINIMUM HUMIDITY OF THE DAY Đỗ Văn Đỉnh, Vũ Quang Ngọc Email: dodinh75@gmail.com Trường Đại học Sao Đỏ Ngày nhận bài: 17/11/2018 Ngày nhận bài sửa sau phản biện: 20/3/2018 Ngày chấp nhận đăng: 28/3/2018 Tóm tắt Dự báo độ ẩm môi trường trong ngày là một trong những bài toán không chỉ ở Việt Nam mà các quốc gia trên thế giới đang rất quan tâm tới. Bài toán dự báo trên có tính chất phụ thuộc nhiều vào điều kiện địa lý và mang tính khu vực. Do đó, tại từng khu vực và vùng miền khác nhau cần xác lập bộ thông số dữ liệu phù hợp cho quá trình dự báo. Trong bài báo này, đề xuất sử dụng mô hình lai, phối hợp máy học vectơ hỗ trợ SVM (Support Vector Machine) và mô hình khai triển theo phương pháp tuyến tính SVD (Singular Value Decomposition) để dự báo và ước lượng giá trị độ ẩm lớn nhất và nhỏ nhất trong ngày tại thành phố Hải Dương, Việt Nam. Bộ số liệu đầu vào là giá trị lớn nhất, nhỏ nhất của nhiệt độ, độ ẩm, tốc độ gió và giá trị trung bình của lượng mưa, số giờ nắng của các ngày trước đó. Chất lượng của giải pháp đề xuất được kiểm nghiệm trên bộ số liệu quan trắc thực tế (2191 ngày, từ ngày 01/01/2010 đến ngày 31/12/2015) ở thành phố Hải Dương, Việt Nam. Kết quả thực nghiệm cho sai số tuyệt đối trung bình MAE = 4,23%. Từ khóa: Dự báo; mô hình lai; máy học vectơ hỗ trợ; độ ẩm lớn nhất, nhỏ nhất trong ngày. Abstract Forecasting the humidity of the day is one of the problems not only in Vietnam but also in other countries in the world. The prediction problem is highly dependent on geographic and regional conditions. Therefore, in different regions and regions, it is necessary to establish appropriate data sets for the forecasting process. In this paper, we propose to use a hybrid model, support vector machine (SVM) and a Singular Value Decomposition (SVD) model to predict and estimate maximum and minimum daily humidity values ​​in Hai Duong city, Vietnam. The input data is the maximum, minimum value of temperature, humidity, wind speed and mean value of precipitation, the number of hours of sunshine of the previous day. The quality of the proposed solution was tested on the actual observation data (2191 days, 01/01/2010 to 31/12/2015) in Hai Duong city, Vietnam. Experimental results showed an average error of MAE = 4.23%. Keywords: Predict; hybrid model; support vector machines; maximum and minimum daily humidity. 1. ĐẶT VẤN ĐỀ Diễn biến của độ ẩm không khí rất phức tạp, nó chịu ảnh hưởng của rất nhiều các yếu tố khác như Việt Nam là một quốc gia nằm trong khu vực nhiệt độ ẩm, áp suất khí quyển, lượng mưa, tốc độ gió, đới gió mùa, có lượng mưa và độ ẩm phức tạp trên bức xạ nhiệt, tốc độ phát triển các thành phần kinh từng vùng miền có sự khác nhau rõ rệt. Dự báo độ tế,… Hiện nay, các mô hình dự báo thông số thời ẩm không khí là một trong những nội dung chính của tiết sử dụng phổ biến nhất được chia thành hai dạng là mô hình dự báo tất định (Deterministic bản tin dự báo thời tiết, nó có ý nghĩa quan trọng Model) và mô hình dự báo thống kê (Statistical đối với ngành nông nghiệp, công nghiệp và dịch vụ, Model) [2]. Trong đó, mô hình dự báo tất định nhằm phòng chống và hạn chế thiên tai, thiết lập kế được xây dựng dựa trên quá trình diễn biến thời hoạch sản xuất, khai thác tiềm năng khí hậu. tiết, nó đòi hỏi một hệ thống cơ sở hạ tầng đủ 18 Tạp chí Nghiên cứu khoa học - Đại học Sao Đỏ, ISSN 1859-4190 Số 1(60).2018
  2. LIÊN NGÀNH ĐIỆN - ĐIỆN TỬ - TỰ ĐỘNG HÓA mạnh và người vận hành, khai thác mô hình phải này sẽ được dùng để huấn luyện khối phi tuyến có trình độ về công nghệ thông tin. Ngược lại, các hay nói cách khác: sai số còn lại từ khối tuyến tính mô hình dự báo thống kê đơn giản hơn, nó không trở thành đầu vào của khối phi tuyến. đòi hỏi quá cao về mặt cơ sở hạ tầng hay quá chi Để kiểm nghiệm chất lượng các mô hình mạng tiết về các thông số ảnh hưởng đến thông số thời nơron ước lượng thành phần phi tuyến, trong bài tiết cần dự báo vì mô hình này có khả năng tự báo tác giả sử dụng các mô hình mạng MLP, MLR, Elman, BRtree, SVM và các mạng Hybrid của các động xây dựng mối quan hệ tuyến tính cũng như mạng nơron trên như Hybrid-MLP, Hybrid-MLR, phi tuyến giữa các thông số cần dự báo và các Hybrid-Elman, Hybrid-BRTree. Từ đó, đánh giá thông số khác. chất lượng các mô hình mạng nơron cho bài toán Đã có nhiều mô hình dự báo thống kê được dự báo thông số thời tiết. Các mô hình dự báo và nghiên cứu và ứng dụng thành công trên thế ước lượng thông số thời tiết sẽ được đánh giá chất giới như phương pháp hồi quy phi tuyến tính, phi lượng thông qua các chỉ số Mean Absolute Error tuyến; phương pháp giá trị cực trị (Extreme Value) (MAE); Mean Relative Error (MRE); Maximum và mạng nơron nhân tạo (ANN - Artificial Neural Absolute Error (MaxAE); Standard Deviation (SD). Network) [5-9], trong số đó, các mô hình ứng 2.1. Cấu trúc của mô hình dự báo dụng mạng nơron nhân tạo đã đạt được những tiến bộ đáng kể và nghiên cứu ứng dụng rộng rãi Giả thiết rằng ta có bộ số liệu đo quan trắc trong thời gian qua [1, 5, 6, 8]. Thuật toán máy môi trường tại điểm A. Ta xây dựng hàm quan hệ giữa thông số cần dự báo với các học vectơ hỗ trợ SVM được Vapnik giới thiệu năm thông số môi khác thông qua phương trình: 1995 [4], đã được nghiên cứu thử nghiệm trong lĩnh vực dự báo thời tiết và thu được những kết Ti ( A, d + 1) = f (Ti ( A, d ), Ti ( A, d - 1) ,  , Ti ( A, d - K )) (1) quả khả quan, trong hầu hết các nghiên cứu đã Hoặc được công bố, mô hình dự báo nhiệt độ không khí dùng mạng SVM đều cho kết quả tốt hơn so với é T ( A,d ),T ( A,d -1),T ( A,d -K ) ù ê i i i ú các mô hình ANN kiểm chứng [7-10,13]. Mặt khác, ê ú (2) Ti ( A,d +1) = f ê  ú trong bài báo này đề xuất ứng dụng mạng nơron ê ú êT j ( A,d ),T j ( A,d -1),,T j ( A,d -K ú SVM trong mô hình lai [2] để dự báo độ ẩm không ë û khí, kết quả nghiên cứu thực nghiệm cho thấy ứng trong đó: dụng mạng SVM trong mô hình lai dự báo độ ẩm Ti ( A, d ) : thông số môi trường thứ i tại vị trí A ở không khí cho kết quả khả quan hơn so với các ngày d. mô hình mạng nơron khác (như mạng RBF, MLP, MLR, Elman, BRtree,…). Cấu trúc mô hình dự báo độ ẩm lớn nhất, nhỏ nhất trong ngày dựa vào các số liệu đo trong quá khứ 2. ỨNG DỤNG MẠNG SVM TRONG MÔ HÌNH như hình 1. LAI DỰ BÁO ĐỘ ẨM MÔI TRƯỜNG Bài toán dự báo là một trường hợp đặc biệt của bài toán ước lượng và xây dựng mô hình ánh xạ giữa đầu vào và đầu ra [1, 2]. Theo [2, 13], mô hình lai đã được đề xuất để dự báo ngắn hạn phụ tải điện, dự báo nhiệt độ lớn nhất, nhỏ nhất trong ngày và cho kết quả khả quan; để ước lượng thành phần tuyến tính, tác giả sử dụng thuật toán khai triển theo các giá trị kỳ dị SVD, phần ước Hình 1. Sơ đồ cấu trúc mô hình dự báo lượng phi tuyến sử dụng mạng MLP [2] và SVM thông số khí tượng [13]. Trong bài báo này, tác giả đề xuất ứng dụng 2.2. Các thuật toán xây dựng mô hình dự báo phối hợp SVD và SVM trong mô hình lai để dự báo và ước lượng độ ẩm lớn nhất (RHmax) và độ 2.2.1. Mô hình ước lượng tuyến tính ẩm cao nhất (RHmin) trong ngày. Từ phương trình (5), hàm quan hệ tuyến tính giữa Như đã trình bày ở [1, 2, 13], bằng thực nghiệm RHmax của ngày d với RHmax của các ngày quá khứ mô hình lai có nhiều ưu việt hơn các mô hình và được xác định từ hệ phương trình ước lượng xấp mạng nơron khác. Khi sử dụng mô hình lai sẽ xỉ như trong công thức (3) và (4). Từ (4) ta cần xác định vectơ a = [ a1 , a2 , , aK ] để đạt cực tiểu của T giảm bớt mức độ phức tạp của mô hình phi tuyến, trước hết cần ước lượng thành phần tuyến tính, hàm sai số ước lượng. Trong thực tế áp dụng, ta sau đó ta loại thành phần tuyến tính khỏi các số còn cần trả lời hai câu hỏi: 1. Cần sử dụng bao liệu đầu vào để nhằm chỉ giữ lại thành phần phi nhiêu số liệu trong quá khứ?; 2. Đó là những số tuyến trong tín hiệu của đối tượng. Tín hiệu còn lại liệu nào? Tạp chí Nghiên cứu khoa học - Đại học Sao Đỏ, ISSN 1859-4190 Số 1(60).2018 19
  3. NGHIÊN CỨU KHOA HỌC a1 ⋅ RH max ( K ) + a2 ⋅ RH max ( K − 1) + ... + aK ⋅ RH max ( d − K ) ≈ RH max ( K + 1) a ⋅ RH ( K − 1) + a ⋅ RH ( K − 2) + ... + a ⋅ RH ( d − K + 1) ≈ RH ( K + 2)  1 max 2 max K max max (3)   ... ... ... a1 ⋅ RH max ( N max − 1) + a2 ⋅ RH max ( N max − 2) + ... + aK ⋅ RH max ( N max − K ) ≈ RH max ( N max )  RH max ( K ) RH max ( K − 1) .... RH max (1)   a1   RH max ( K + 1)   RH ( K − 1) RH max ( K − 2) ... RH max (2)   a   RH ( K + 2) (4) max ⇔  .  2  ≈  max               RH max ( N max − 1) RH max ( N max − 2) ... RH max ( N max − K ) aK   RH max ( N max )  Phương pháp xác định thích nghi được thực hiện K = K–1, và quay lại bước 2 nếu K > Kmin chọn như sau: trước. Quá trình lặp các bước 2-3 cho đến khi K - Trước tiên ta sử dụng một số lượng lớn số liệu giảm xuống một giá trị đủ nhỏ có thể chấp nhận quá khứ (trong nghiên cứu ta sử dụng K = 60 - được để mô hình không quá phức tạp. Cụ thể tương đương 2 tháng số liệu trước đó - là đủ lớn trong bài báo ta chọn Kmin< 5. để dự báo ngày tiếp theo). Tương tự như vậy, ta xây dựng hàm quan hệ - Với K số liệu quá khứ, ta xác định vectơ T tuyến tính giữa RHmax của ngày d với RHmax,RHmin’ a = [ a1, a2 , , a K ] của hàm ước lượng tuyến tính K Tmax, Tmin, Winmax, Winmin, RainAll và RhAll của các RH max ( d ) ≈ ∑  a ⋅ RH  i ( d − i )  bằng phương max  i =1 quá khứ ta được phương trình (5). Khi xác định pháp SVD. được mối quan hệ tuyến tính giữa RHmax của ngày - Xác định thành phần có giá trị tuyệt đối nhỏ nhất trong vectơ a. Thành phần này sẽ tương ứng với d với các ngày trong quá khứ, ta tính sai số chênh ngày trong quá khứ ít ảnh hưởng tới ngày dự lệch giữa số liệu thực tế và số liệu ước lượng như báo. Ta loại bỏ khỏi bộ số liệu trong quá khứ, giảm phương trình (6): ai1 ⋅ RH max ( d − i ) + ai 2 ⋅ RH min ( d − i ) + ai3 ⋅ Tmax (d − i ) +  K   RH max ( d ) ≈ ∑ + ai 4 ⋅ Tmin ( d − i ) + ai 5 ⋅ Winmax ( d − i ) + ai 6 ⋅ Winmin ( d − i ) +  (5) i =1   + ai 7 ⋅ RainAll (d − i ) + ai8 ⋅ RhAll (d − i )  K ai1RH max ( d − i ) + ai 2 ⋅ RH min ( d − i ) + ai 3 ⋅ Tmax ( d − i ) +    NL( d ) RH max ( d ) − = ∑ + ai 4 ⋅ Tmin (d − i) + ai5 ⋅Winmax (d − i) + ai 6 ⋅Winmin (d − i) +  (6) i =1   + ai 7 ⋅ RainAll (d − i ) + ai8 ⋅ RhAll (d − i )  Phương trình (6): đây sẽ là phần phụ thuộc phi kế theo các bước sau: chuẩn bị dữ liệu, lựa chọn tuyến còn lại giữa RHmax với các ngày trong quá đặc tính cho mô hình dự báo và mô hình ước khứ. Hoàn toàn tương tự khi xây dựng các mô lượng, xây dựng kiến trúc mạng, lựa chọn phương hình ước lượng cho RHmin. pháp và đào tạo mạng, đánh giá độ tin cậy. 2.2.2. Mô hình ước lượng phi tuyến 3.1. Kết quả ước lượng thành phần tuyến tính Khi xác định được các thông số mô hình tuyến 3.1.1. Ước lượng tuyến tính RHmax tính, ta tiến hành xây dựng mạng nơron nhân tạo Bằng phương pháp phân tích SVD kết hợp với để ước lượng thành phần phi tuyến. Giá trị chênh kinh nghiệm thực tế, ta xác định các yếu tố ảnh lệnh (phương trình (6)) được sử dụng là đầu vào hưởng lớn nhất đến giá trị độ ẩm lớn nhất (RHmax) cho mô hình ước lượng thành phần phi tuyến. cần dự báo: 3. KẾT QUẢ VÀ THẢO LUẬN - Ảnh hưởng của RHmax trong quá khứ đến RHmax Mô hình nghiên cứu được xây dựng trên nền dự báo, ta xác định được 4 ngày có hệ số phụ phần mềm Matlab®2010b, với SVM sử dụng thuộc lớn là: d-1, d-3, d-8 và d-11 loại ngày d-52 vì LS-SVMlabv1.8_R2009b_R2011a và được thiết ở xa ngày dự báo. Tiếp tục khảo sát sự phụ thuộc 20 Tạp chí Nghiên cứu khoa học - Đại học Sao Đỏ, ISSN 1859-4190 Số 1(60).2018
  4. LIÊN NGÀNH ĐIỆN - ĐIỆN TỬ - TỰ ĐỘNG HÓA của RHmax vào các số liệu RHmin, Tmax, Tmin, Winmax, là d-6, d-17, d-39, d-50 và d-60. Loại ngày d-39, Winmin, RainAll và ShAll trong quá khứ bằng cách d-50 và d-60 do ở xa ngày dự báo. làm hoàn toàn tương tự ta được: - Lượng mưa trung bình ngày (RainAll) đến độ ẩm - Ảnh hưởng của RHmin trong quá khứ đến RHmax lớn nhất (RHmax) là các ngày d-1, d-7, d-10, d-51 và dự báo bao gồm các ngày là d-1, d-7 và d-19. d-60. Loại ngày d-51 và d-60 do ở xa ngày dự báo. Ngày d-46 và d-56 xa ngày dự báo nên bỏ qua. - Số giờ nắng trong ngày (ShAll) ảnh hưởng đến - Giá trị Tmax trong quá khứ ảnh hưởng đến RHmax RHmax là d-1, d-5, d-40, d-56 và d-60. Loại các dự báo gồm d-1, d-4 và d-6, ngày d-55 và d-60 bỏ ngày d-40, d-56 và d-60 do ở xa ngày dự báo. qua vì ở xa ngày dự báo. Tổng hợp lại ta có mô hình được lựa chọn để dự - Các giá trị Tmin trong quá khứ ảnh hưởng đến báo giá trị RHmax của ngày thứ d sẽ gồm 22 số liệu RHmax dự báo d-1, d-6, d-9, d-58 và d-60. Ngày quá khứ như công thức (7). Kiểm tra chất lượng d-58 và d-60 ở xa ngày dự báo nên bỏ qua. của mô hình sử dụng 710 ngày số liệu cuối trong tập số liệu 2191 ngày. Bảng 1 là kết quả sai số khi - Ảnh hưởng của tốc độ gió max (Winmax) đến khai triển thành phần tuyến tính ước lượng RHmax, RHmax là d-1, d-6, d-32, d-42 và d-48. Loại ngày kết quả tính toán sai số trung bình tuyệt đối khi d-32, d-42 và d-48 do xa ngày dự báo. ước lượng RHmax tương đối nhỏ, sai số trung bình - Ảnh hưởng của tốc độ gió min (Winmin) đến RHmax tuyệt đối kiểm tra MAE(Etest) = 3,47% RH max (d ) = 0, 484 ⋅ RH max (d − 1) + 0,121 ⋅ RH max (d − 3) + 0,133 ⋅ RH max (d − 8) + + 0,121 ⋅ RH max (d − 11) + 0,378 ⋅ RH min (d − 1) + 0,199 ⋅ RH max (d − 7) + + 0, 219 ⋅ RH max (d − 19) + 0,925 ⋅ Tmax (d − 1) + 0,389 ⋅ Tmax (d − 4) + + 0, 472 ⋅ Tmax (d − 6) + 1,132 ⋅ Tmin (d − 1) + 0,561 ⋅ Tmin (d − 6) + (7) + 0, 454 ⋅ Tmin (d − 9) + 5,550 ⋅ Winmax (d − 16) + 14,869 ⋅ Winmin (d − 6) + + 14, 482 ⋅ Winmin (d − 17) + 1,346 ⋅ RainAll (d − 1) + 1,350 ⋅ RainAll (d − 7) + + 1,316 ⋅ RainAll (d − 10) + 3,964 ⋅ ShAll (d − 1) + 3,810 ⋅ ShAll (d − 5) 3.1.2. Ước lượng tuyến tính RHmin Thực hiện ước lượng độ ẩm lớn nhất (RHmin) tương tự Tmax, Tmin và RHmax, ta xác định các yếu tố ảnh hưởng lớn nhất đến giá trị độ ẩm nhỏ nhất (RHmin) cần dự báo: - Ảnh hưởng của RHmin trong quá khứ đến RHmin dự báo, ta xác định được 4 ngày có hệ số phụ thuộc lớn là: d-1, d-4, d-6 và d-13, loại ngày d-56 Hình 2. Đồ thị sai số học và sai số kiểm tra khi khai vì ở xa ngày dự báo. Tiếp tục khảo sát sự phụ triển thành phần tuyến tính để ước lượng RHmax thuộc của RHmin vào các số liệu RHmax, Tmax, Tmin, Winmax, Winmin, RainAll và ShAll trong quá khứ Hình 2 biểu diễn đáp ứng của bộ số liệu gốc, kết bằng cách làm hoàn toàn tương tự ta được: quả ước lượng RHmax bằng phương pháp khai - Ảnh hưởng của RHmax trong quá khứ đến RHmin dự triển thành phần tuyến tính. báo bao gồm các ngày là d-1, d-3 và d-8. Ngày d-43 Bảng 1. Kết quả sai số khi khai triển thành phần và d-56 xa ngày dự báo nên bỏ qua. tuyến tính ước lượng RHmax - Giá trị Tmax trong quá khứ ảnh hưởng đến RHmin Quá trình dự báo gồm d-3, d-5 và d-9, ngày d-28 và d-60 bỏ Sai số Học Kiểm tra qua vì ở xa ngày dự báo. MAE 3,69 3,47 - Các giá trị Tmin trong quá khứ ảnh hưởng đến RHmin dự báo d-1, d-4, d-10, d-24 và d-60. Ngày d-24 và MRE 4,30 3,93 d-60 ở xa ngày dự báo nên bỏ qua. MaxAE 10,60 19,79 - Ảnh hưởng của tốc độ gió max (Winmax) đến RHmin là d-5, d-21, d-44, d-53 và d-60. Loại ngày d-21, SD 3,89 3,58 d-44, d-53 và d-60 do xa ngày dự báo. Tạp chí Nghiên cứu khoa học - Đại học Sao Đỏ, ISSN 1859-4190 Số 1(60).2018 21
  5. NGHIÊN CỨU KHOA HỌC - Ảnh hưởng của tốc độ gió min (Winmin) đến RHmin - Số giờ nắng trong ngày (ShAll) ảnh hưởng đến là d-1, d-11, d-22, d-42 và d-60. Loại ngày d-22, RHmin là d-4, d-20, d-40, d-55 và d-60. Loại các d-42 và d-60 do ở xa ngày dự báo. ngày d-20, d-40, d-55 và d-60 do ở xa ngày dự báo. - Lượng mưa trung bình ngày (RainAll) đến RHmin - Tổng hợp lại ta có mô hình được lựa chọn để dự là các ngày d-1, d-3, d-31, d-46 và d-56. Loại ngày báo giá trị RHmin của ngày thứ d sẽ gồm 19 số liệu d-31, d-46 và d-60 do ở xa ngày dự báo. quá khứ: RH min (d ) = 0, 640 × RH min (d - 1) + 0, 087 × RH min (d - 4) + 0, 093 × RH min (d - 6) + + 0, 088 × RH min (d - 13) + 0, 705 × RH max (d - 1) + 0, 204 × RH max (d - 3) + + 0,195 × RH max (d - 8) + 0, 740 × Tmax (d - 3) + 0, 520 × Tmax (d - 5) + + 0, 629 × Tmax (d - 9) + 1, 643 × Tmin (d - 1) + 0, 700 × Tmin (d - 4) + (8) + 0, 403 × Tmin (d - 10) + 4,121 × Winmax (d - 5) + 11, 315 × Winmin (d - 1) + + 10, 680 × Winmin (d - 11) + 1,159 × RainAll(d - 1) + + 1, 001 × RainAll(d - 3) + 2, 772 × RainAll(d - 4) Kiểm tra chất lượng của mô hình sử dụng 710 3.2. Kết quả ước lượng thành phần phi tuyến ngày số liệu cuối trong tập số liệu 2191 ngày. 3.2.1. Ước lượng phi tuyến RHmax Bảng 2 là kết quả sai số khi khai triển thành phần tuyến tính ước lượng RHmax, kết quả tính Khi thực hiện khai triển thành phần tuyến tính, khi toán sai số trung bình tuyệt đối khi ước lượng ước lượng RHmax ở phần 3.1.1a cho kết quả có RHmin nhỏ, sai số trung bình tuyệt đối kiểm tra 22 thông số môi trường trong quá khứ ảnh hưởng MAE(Etest) = 8,23%, so với mô hình ước lượng tới ngày dự báo. Phần chênh lệch được xác định thông số môi trường RHmax thì mô hình ước lượng theo công thức 6, hình 4 là sai số còn lại sau khi RHmin sai số lớn hơn. Hình 3 biểu diễn đáp ứng ước lượng thành phần tuyến tính và cũng là bộ số của bộ số liệu gốc, kết quả ước lượng RHmin bằng liệu đầu vào cho mô hình ước lượng thành phần phương pháp khai triển thành phần tuyến tính. phi tuyến. Bảng 2. Kết quả sai số khi khai triển thành phần tuyến tính ước lượng RHmin Quá trình Học Kiểm tra Sai số MAE 8,15 8,23 MRE 12,63 12,39 MaxAE 18,17 17,07 STD 6,07 6,08 Hình 4. Các sai số còn lại RHmax của mô hình tuyến tính trở thành đầu vào của mô hình phi tuyến Bảng 3 là kết quả sai số ước lượng thành phần phi tuyến RHmax cho kết quả sai số trung bình tuyệt đối khá tốt ( MAE ( Etest _ Hybrid -SVM ) = 3, 35%) . Hình 5 là đồ thị biểu diễn sai số học và sai số kiểm tra Hình 3. Đồ thị sai số học và sai số kiểm tra khi khai kết quả ước lượng thành phần phi tuyến với RHmax triển thành phần tuyến tính để ước lượng RHmin trong mô hình lai. 22 Tạp chí Nghiên cứu khoa học - Đại học Sao Đỏ, ISSN 1859-4190 Số 1(60).2018
  6. LIÊN NGÀNH ĐIỆN - ĐIỆN TỬ - TỰ ĐỘNG HÓA Bảng 3. Kết quả sai số khi ước lượng thành phần phi tuyến của RHmax Mạng Sai số học Sai số kiểm tra ước lượng MAE MRE (%) MaxAE SD MAE MRE (%) MaxAE SD MLP 3,05 3,53 30,47 3,03 3,88 4,35 28,93 3,86 MLR 3,70 4,30 40,59 3,89 3,47 3,92 29,79 3,58 RBF 3,36 3,91 35,53 3,39 3,56 4,00 23,03 3,47 BRTree 1,88 2,13 21,62 2,04 5,00 5,60 36,79 5,18 Elman 3,06 3,54 33,10 3,00 3,62 4,09 32,14 3,83 SVM 3,26 3,81 37,83 3,47 3,35 3,79 25,40 3,41 Hybrid-MLP 2,97 3,44 25,80 3,02 3,48 3,91 27,13 3,61 Hybrid-MLR 3,70 4,30 40,59 3,89 3,47 3,92 29,79 3,58 Hybrid-RBF 3,10 3,58 31,84 3,04 3,82 4,28 22,45 3,71 Hybrid-BRTree 1,84 2,12 30,59 2,17 4,02 4,51 33,07 4,69 Hybrid-Elman 2,99 3,44 25,39 2,94 3,62 4,06 24,63 3,47 Hybrid-SVM 3,23 3,77 37,48 3,42 3,35 3,79 25,54 3,43 Hình 5. Sai số học và sai số kiểm tra kết quả ước lượng thành phần phi tuyến với RHmax trong mô hình lai Hình 6. Các sai số còn lại RHmin của mô hình tuyến tính trở thành đầu vào của mô hình phi tuyến 3.2.2. Ước lượng phi tuyến RHmin Bảng 4 là kết quả sai số khi ước lượng thành Tương tự như khi ước lượng thành phần phi tuyến phần phi tuyến RHmin sử dụng mạng SVM trong với RHmax, ta có 19 thông số môi trường trong quá khứ ảnh hưởng tới giá trị RHmin của ngày dự báo. mô hình lai. Kết quả sai số cho thấy sai số trung Phần chênh lệch còn lại sau khi ước lượng thành bình tuyệt đối tốt (MAE(Etest)=4,23%). Hình 7 là phần tuyến tính và cũng là bộ số liệu đầu vào cho mô đồ thị biểu diễn sai số học và sai số kiểm tra kết hình ước lượng thành phần phi tuyến được xác định quả ước lượng thành phần phi tuyến với RHmin theo công thức (6) và được biểu diễn trên hình 6. trong mô hình lai. Bảng 4. Kết quả sai số khi ước lượng thành phần phi tuyến của RHmin Mạng Sai số học Sai số kiểm tra ước lượng MAE MRE (%) MaxAE SD MAE MRE (%) MaxAE SD MLP 7,62 11,75 31,154 5,73 8,46 12,74 34,61 6,30 MLR 8,15 12,89 38,85 6,08 8,56 13,01 37,67 6,28 RBF 8,02 12,41 35,57 5,97 8,33 12,49 37,74 6,11 BRTree 5,93 7,73 26,07 3,87 11,18 17,90 48,05 8,75 Elman 7,37 11,35 38,55 5,61 8,64 12,93 35,37 6,47 SVM 7,79 12,05 37,17 5,84 8,37 12,57 39,63 6,06 Hybrid-MLP 7,85 12,15 33,48 5,83 8,38 12,68 35,90 6,06 Hybrid-MLR 8,14 12,63 38,17 6,08 8,24 12,40 37,07 6,08 Hybrid-RBF 8,14 12,63 38,07 6,07 8,23 12,38 36,52 6,06 Hybrid-BRTree 4,39 6,70 24,56 3,41 11,03 16,65 47,40 8,46 Hybrid-Elman 5,30 8,11 27,13 4,32 10,31 15,51 42,02 7,66 Hybrid-SVM 3,43 8,42 15,45 5,92 4,23 9,40 17,06 6,05 Tạp chí Nghiên cứu khoa học - Đại học Sao Đỏ, ISSN 1859-4190 Số 1(60).2018 23
  7. NGHIÊN CỨU KHOA HỌC [2]. Nguyễn Quân Nhu (2009). Nghiên cứu và ứng dụng mạng nơron và logic mờ cho bài toán dự báo phụ tải điện ngăn hạn. Luận án tiến sĩ. [3]. Đỗ Văn Đỉnh, Đinh Văn Nhượng và Trần Hoài Linh (2015). Ứng dụng mô hình hỗn hợp trong ước lượng giá trị lớn nhất và nhỏ nhất của nhiệt độ môi trường ngày, Tạp chí Khoa học và Công nghệ - Đại học Đà Nẵng, số 11(96), quyển 2, trang 35-39. [4]. V. Vapnil (1995). Support-Vector Networks. Machine Learning, 20, 273-297. [5]. Parag P Kadu et al. Temperature Prediction System Hình 7. Sai số học và sai số kiểm tra kết quả Using Back propagation Neural Network an Approch. ước lượng thành phần phi tuyến với RHmin International Journal of Computer Science & trong mô hình lai Communication Networks, Vol 2(1), pp. 61-64. [6]. Mohsen Hayati and Zahra Mohebi (2007). 4. KẾT LUẬN Temperature forecating based on neural network approach. World Applied Sciences Journal 2(6), Khi ước lượng các bài toán phi tuyến, để giảm bớt pp. 613-620. mức độ phức tạp của giải pháp, mô hình hỗn hợp [7]. H. Wang and D. Hu (2005). Comparison of SVM tách riêng thành phần tuyến tính và thành phần and ls-SVM for regression, in Neural Networks and Brain. ICNN&B’05. International Conference on, phi tuyến để xử lý. vol. 1. IEEE, pp. 279-283. Thành phần tuyến tính được xác định thông qua [8]. Y.Radhika and M.Shashi (2009). Atmospheric việc sử dụng khai triển theo các giá trị kỳ dị (SVD). Temperature Prediction using Support Vector Thuật toán này cho phép xác định được hàm quan Machines. International Journal of Computer Theory and Engineering, Vol. 1, No. 1, April 2009, pp. 55-58. hệ tuyến tính giữa độ ẩm lớn nhất (hoặc thấp [9]. Ani Shabri. Least Square Support Vector Machines nhất) của một ngày và các ngày trước đó từ hệ as an Alternative Method in Seasonal Time Series các phương trình ước lượng xấp xỉ được viết dưới Forecasting, Applied Mathematical Sciences, Vol. 9, dạng ma trận có số hàng nhiều hơn số cột. 2015, no. 124, pp. 6207 - 6216. [10]. T. Joachims (1998). Making large-Scale Support Thành phần phi tuyến được xác định thông qua Vector Machine Learning Practical, in Advances việc sử dụng mô hình mạng nơron khác nhau; in Kernel Methods - Support Vector Learning. Qua thực nghiệm cho thấy sai số học và sai số B. Schölkopf and C. Burges and A. Smola (ed.), MIT- kiểm tra khi dự báo độ ẩm lớn nhất (RHmax) và Press, Cambridge, MA. thấp nhất (RHmin), kết quả thu được tốt nhất khi sử [11]. D.E. Rumelhart; G.E. Hinton and R.J. Williams dụng mạng SVM. Vì vậy, ta thấy rằng ứng dụng (1986). Learning internal representations by error propagation, Rumelhart, D.E. et al. (eds.). mạng SVM trong mô hình hỗn hợp cho bài toán Parallel distributed processing: Explorations in the dự báo một số thông số thời tiết là phù hợp, sai số microstructure of cognition (Cambridge MA.: MIT học và sai số kiểm tra ở mức trung bình, đặc biệt Press), 318-362. là sai số kiểm tra sẽ có giá trị tương đối ổn định; [12]. R.A. Fisher (1936). The Use of Multiple Measurements Kết quả sai số trung bình tuyệt đối khi dự báo là in Taxonomic Problems. Annals of Eugenics, No 7, pp. 179-188. 3,35% (độ ẩm lớn nhất), 4,23% (độ ẩm nhỏ nhất). [13]. Dinh Do Van, Nhuong Dinh Van, Hoai Linh Tran (2016). Applications of SVM networks in hybrid model TÀI LIỆU THAM KHẢO for environment parameters estimation. The 4th IEEE International Conference on Sustainable Energy [1]. Trần Hoài Linh (2009). Mạng nơron và ứng dụng Technologies (ICSET). November 14-16, Hanoi, Viet trong xử lý tín hiệu. NXB Bách khoa. Nam, pp. 190-195. 24 Tạp chí Nghiên cứu khoa học - Đại học Sao Đỏ, ISSN 1859-4190 Số 1(60).2018
nguon tai.lieu . vn