Xem mẫu

  1. Tuyển tập Hội nghị Khoa học thường niên năm 2021. ISBN: 978-604-82-5957-0 ỨNG DỤNG DEEP LEARNING VÀ MÔ HÌNH TOÁN THỦY VĂN VÀO DỰ BÁO DÒNG CHẢY LŨ Trần Thị Ngân1, Trần Kim Châu1 1 Trường Đại học Thủy lợi, email: ngantt@tlu.edu.vn 1. GIỚI THIỆU thông tin về mưa dự báo, trong nghiên cứu này mưa dự báo được giả thiết bằng mưa Dự báo dòng chảy là điều kiện tiên quyết thực đo. cho việc vận hành hồ chứa nhưng lại là vấn đề phức tạp và có độ bất định lớn. Thông 2. ỨNG DỤNG RNN TRONG BÀI TOÁN thường, các mô hình thủy văn được sử dụng DỰ BÁO DÒNG CHẢY LŨ để tính toán dòng chảy từ mưa. Tuy nhiên, các mô hình thủy văn hiện tại chưa mô phỏng Quá trình giải bài toán dự báo dòng chảy được đầy đủ quá trình vật lý hình thành dòng lũ bao gồm việc giải quyết một chuỗi các bài chảy cũng như chưa cập nhật được những sự toán nhỏ hơn. Chuỗi các bài toán nhỏ hơn thay đổi liên tục của bề mặt thảm phủ trên này được gọi là pipeline của mô hình học lưu vực. Trong những năm gần đây, việc ứng máy (Hình 1). dụng nghệ trí tuệ nhân tạo trong bài toán dự báo đã được nghiên cứu. Đặc biệt, các mô hình học sâu đang phát triển mạnh và được Tiền xử lý dữ liệu ứng dụng trong nhiều lĩnh vực [2, 3]. Dự báo dòng chảy cũng là một trong những lĩnh vực tiềm năng khi áp dụng các mô hình học sâu vào giải quyết các hạn chế đặt ra. Với khả Chuyển tập dữ liệu sang năng tự cập nhật trong quá trình huấn luyện, dạng chuỗi thời gian các mô hình mạng nơ ron khắc phục được những hạn chế trong mô hình thủy văn [1, 4]. Trong bài báo này, chúng tôi áp dụng mạng nơ ron hồi tiếp (Recurrent Neural Chia dữ liệu và chuyển sang Network - RNN) để tối ưu bộ thông số mô dạng vector hình thủy văn HMS theo thời gian thực nhằm mục đích dự báo dòng chảy lũ đến hồ chứa Tả Trạch. Trong cách tiếp cận này, mô hình Xây dựng và huấn luyện thủy văn sẽ có nhiệm vụ chuyển đổi mưa thời mô hình gian thực của các trạm đo trên lưu vực thành dòng chảy lũ đến hồ. Sử dụng kết quả tính toán từ mô hình và dữ liệu thực đo được trong thời gian 4 giờ trước thời điểm dự báo làm dữ liệu đầu vào cho mạng RNN. Từ đó Kiểm tra mô hình RNN đưa ra được bộ thông số tối ưu tại thời điểm dự báo. Ứng dụng bộ thông số tìm được để Hình 1. Mô hình Pipeline của bài toán tính toán dòng chảy dự báo. Do hạn chế dự báo dòng chảy lũ sử dụng RNN 110
  2. Tuyển tập Hội nghị Khoa học thường niên năm 2021. ISBN: 978-604-82-5957-0 Với bài toán dự báo dòng chảy lũ, ta sẽ dựa vào phân tích chuỗi thời gian. Đây là quá trình là dự đoán trạng thái tiếp theo dựa trên một chuỗi đầu vào nhất định dựa trên những gì đã quan sát trước đó. Kết quả dự đoán là lưu lượng đến hồ trong thời điểm giờ tiếp theo, v.v. Trong bài báo này, nhóm tác giả thử nghiệm mạng RNN trên các thông Hình 3. Mạng RNN không bị xáo trộn số như sau: theo thời gian Input: số liệu Qden của 4h trước (mô hình và thực đo). Lớp ẩn xác định không gian trạng thái Output: bộ thông số mô hình sẽ dùng cho hoặc “bộ nhớ” của hệ thống được tính toán 1h sau. bằng công thức Các bước giải quyết bài toán dự báo dòng ht = fH (ot) (1) chảy lũ như sau: Tiền xử lý dữ liệu: dữ liệu sau khi thu thập Với ot = WIHxt + WHHht-1 + bh từ các trạm sẽ được tổng hợp và tiền xử lý. fH là hàm kích hoạt của lớp ẩn; Chuyển tập dữ liệu sang dạng chuỗi thời bh là vector bias của hidden unit. gian: ban đầu, dữ liệu của các tham số tại các Các nút trong lớp ẩn được liên kết với lớp mốc thời gian (t-4), (t-3), (t-2), (t-1) được đầu ra bằng kết nối trọng số WHO. Lớp đầu ra thiết lập. Bộ tham số tại các thời điểm này có P nút yt = (y1, y2, y3, y4,…, yP) được tính được sử dụng để dự đoán tham số tại thời toán bằng công thức: điểm tiếp theo (t) (Hình 2). 0 , x  0 yt  f o (WH 0 ht  b0 ) f ( x )   (2)  x, x  0 Với: f0 là hàm kích hoạt của lớp đầu ra b0 là vector bias của nút thuộc lớp đầu ra. Vì các cặp đầu vào - đầu ra là tuần tự theo thời gian nên các bước trên được lặp lại theo thời gian t = (1, ..., T). Công thức (1) và (2) Hình 2. Mô phỏng kết quả dự đoán được cho thấy RNN bao gồm một số phương trình đưa vào mô hình ở bước thời gian tiếp theo trạng thái phi tuyến tính, có thể lặp lại theo thời gian. Trong mỗi bước thời gian, các trạng - Chia tập dữ liệu thành bộ train, test và thái ẩn cung cấp một dự đoán ở lớp đầu ra dựa chuyển sang dạng vector. trên vector đầu vào. Trạng thái ẩn của RNN là - Áp dụng mạng RNN để giải quyết bài toán một tập các giá trị, tổng hợp được thông tin bao gồm các bước nhỏ: xây dựng và huấn lịch sử của chuỗi cho tới bước thời gian hiện luyện mô hình RNN, kiểm tra mô hình RNN. tại. Thông tin tích hợp này có thể xác định Một mạng nơ ron hồi quy RNN gồm 3 lớp: hành vi trong tương lai của mạng và đưa ra lớp đầu vào, lớp ẩn, lớp đầu ra. Lớp đầu vào các dự đoán chính xác ở lớp đầu ra. RNN sử gồm N đầu vào là một chuỗi vector theo thời dụng một chức năng kích hoạt phi tuyến đơn gian t {x1…, xt-4, xt-3, xt-2, xt-1,…} với giá trị giản trong mọi unit. Tuy nhiên, cấu trúc đơn tương ứng xt = (x1, x2, x3, x4,…, xN). Các giá giản như vậy có khả năng tạo mô hình động trị đầu vào được kết nối với các nút trong lớp lực học phong phú, nếu nó được huấn luyện ẩn bằng ma trận trọng số W1H. Lớp ẩn có M tốt thông qua các bước đo thời gian. hidden units ht = (h1, h2, h3, h4,…, hM) được Với bài toán dự báo này, do dữ liệu đầu liên kết với nhau theo thời gian bằng liên kết vào đều có giá trị dương, nên sử dụng hàm lặp lại (Hình 3). kích hoạt ReLU có công thức như sau: 111
  3. Tuyển tập Hội nghị Khoa học thường niên năm 2021. ISBN: 978-604-82-5957-0 0 , x  0 - Mô hình dự báo dòng chảy lũ theo thời f(x) (3) gian thực xây dựng bằng mạng RNN cho ra  x, x  0 kết quả khá sát với thực đo. Hàm mất mát đánh giá hiệu suất của - Thời gian chạy mô hình nhanh, do đó có mạng bằng cách so sánh đầu ra ˆy với y được thể xử lý các bộ dữ liệu lớn một cách hiệu quả. xác định bằng công thức: - Tuy nhiên nhận thấy, độ chính xác của Ty mô hình còn phụ thuộc vào số lần đưa dữ liệu ( ˆy, y )   ( ˆy, y ) (4) vào chạy trong mạng. Trong mỗi lần đưa dữ t 1 Đây là tổng số tổn thất trong mỗi bước liệu vào mạng, nếu lượng dữ liệu quá lớn, mô thời gian. Trong số các mô hình RNN, MSE hình cũng sẽ không hoạt động tốt. là hàm mất mát phổ biến nhất, được thể hiện 4. KẾT LUẬN như sau: Trong nghiên cứu này, nhóm tác giả đã kết 1 n RMSE   ( ˆyi  yi )2 (5) hợp mạng RNN và mô hình thủy văn vào bài n i 1 toán dự báo dòng chảy lũ theo thời gian thực Với ˆyi là giá trị thực đo tại thời điểm t nhằm mục đích tăng độ chính xác của mô yi là giá trị dự báo tại thời điểm t hình dự báo dòng chảy. Mô hình đã tìm ra được bộ thông số tối ưu phục vụ cho việc dự 3. KẾT QUẢ THỰC NGHIỆM báo được lượng nước lũ trong thời gian tiếp Quá trình thực nghiệm được tiến hành trên theo dựa vào các bước thời gian trước đó. Điều này có thể giúp nâng cao tính chính xác bộ dữ liệu về dòng chảy lũ thu thập từ các cho việc mô phỏng dòng chảy. Ngoài ra còn trạm Tạ Trạch 1,2,3,4. Bộ dữ liệu được phân giúp người sử dụng mô hình giảm bớt các chia với 75% dùng cho huấn luyện mô hình quá trình dò tìm thủ công tốn nhiều thời gian và 25% dùng để kiểm tra mô hình. và công sức. Kết quả của nghiên cứu được thể hiện thông qua việc so sánh giữa đường quá trình 5. TÀI LIỆU THAM KHẢO lũ tính toán và thực đo. Quá trình đánh giá dự [1] Hồ Việt Hùng, Lê Xuân Hiền, Giha Lee trên các độ đo RMSE, MAE. (2018), “Ứng dụng mạng nơ ron nhân tạo Các độ đo tính được có giá trị như sau: dự báo lưu lượng dòng chảy sông Hồng tại - MAE = 30.6653 Sơn Tây dựa trên dữ liệu ở thượng lưu” - MSE = 5747.0368 trong Hội nghị Khoa học Cơ học Thủy khí - RMSE = 75.8092 toàn quốc lần thứ 21, Quy Nhon, Vietnam. Tính chính xác của thuật toán là khá cao. [2] Kawazoe, Y., Shimamoto, K., Yamaguchi, Có thể dự báo cho ra kết quả không sai lệch R., Shintani-Domoto, Y., Uozaki, H., quá lớn so với thực tế (Hình 4). Fukayama, M., & Ohe, K. (2018). Faster R- CNN-Based Glomerular Detection in Multistained Human Whole Slide Images. Journal of Imaging, 4(7), 91. [3] Mo, X., Tao, K., Wang, Q., & Wang, G. (2018, August). An Efficient Approach for Polyps Detection in Endoscopic Videos Based on Faster R-CNN. In 2018 24th International Conference on Pattern Recognition (ICPR) (pp. 3929-3934). IEEE. [4] Xuan-Hien Le, Hung Viet Ho, Giha Lee and Sungho Jung (2019), "Application of Long Short-Term Memory (LSTM) Neural Network for Flood Forecasting" Water, Hình 4. Biểu đồ kết quả dự đoán và thực đo DOI:10.3390/w11071387. 112
nguon tai.lieu . vn