Xem mẫu
- Tuyển tập Hội nghị Khoa học thường niên năm 2021. ISBN: 978-604-82-5957-0
ỨNG DỤNG DEEP LEARNING VÀ MÔ HÌNH TOÁN THỦY VĂN
VÀO DỰ BÁO DÒNG CHẢY LŨ
Trần Thị Ngân1, Trần Kim Châu1
1
Trường Đại học Thủy lợi, email: ngantt@tlu.edu.vn
1. GIỚI THIỆU thông tin về mưa dự báo, trong nghiên cứu
này mưa dự báo được giả thiết bằng mưa
Dự báo dòng chảy là điều kiện tiên quyết
thực đo.
cho việc vận hành hồ chứa nhưng lại là vấn
đề phức tạp và có độ bất định lớn. Thông 2. ỨNG DỤNG RNN TRONG BÀI TOÁN
thường, các mô hình thủy văn được sử dụng DỰ BÁO DÒNG CHẢY LŨ
để tính toán dòng chảy từ mưa. Tuy nhiên,
các mô hình thủy văn hiện tại chưa mô phỏng Quá trình giải bài toán dự báo dòng chảy
được đầy đủ quá trình vật lý hình thành dòng lũ bao gồm việc giải quyết một chuỗi các bài
chảy cũng như chưa cập nhật được những sự toán nhỏ hơn. Chuỗi các bài toán nhỏ hơn
thay đổi liên tục của bề mặt thảm phủ trên này được gọi là pipeline của mô hình học
lưu vực. Trong những năm gần đây, việc ứng máy (Hình 1).
dụng nghệ trí tuệ nhân tạo trong bài toán dự
báo đã được nghiên cứu. Đặc biệt, các mô
hình học sâu đang phát triển mạnh và được Tiền xử lý dữ liệu
ứng dụng trong nhiều lĩnh vực [2, 3]. Dự báo
dòng chảy cũng là một trong những lĩnh vực
tiềm năng khi áp dụng các mô hình học sâu
vào giải quyết các hạn chế đặt ra. Với khả Chuyển tập dữ liệu sang
năng tự cập nhật trong quá trình huấn luyện, dạng chuỗi thời gian
các mô hình mạng nơ ron khắc phục được
những hạn chế trong mô hình thủy văn [1, 4].
Trong bài báo này, chúng tôi áp dụng
mạng nơ ron hồi tiếp (Recurrent Neural Chia dữ liệu và chuyển sang
Network - RNN) để tối ưu bộ thông số mô dạng vector
hình thủy văn HMS theo thời gian thực nhằm
mục đích dự báo dòng chảy lũ đến hồ chứa
Tả Trạch. Trong cách tiếp cận này, mô hình
Xây dựng và huấn luyện
thủy văn sẽ có nhiệm vụ chuyển đổi mưa thời
mô hình
gian thực của các trạm đo trên lưu vực thành
dòng chảy lũ đến hồ. Sử dụng kết quả tính
toán từ mô hình và dữ liệu thực đo được
trong thời gian 4 giờ trước thời điểm dự báo
làm dữ liệu đầu vào cho mạng RNN. Từ đó Kiểm tra mô hình RNN
đưa ra được bộ thông số tối ưu tại thời điểm
dự báo. Ứng dụng bộ thông số tìm được để Hình 1. Mô hình Pipeline của bài toán
tính toán dòng chảy dự báo. Do hạn chế dự báo dòng chảy lũ sử dụng RNN
110
- Tuyển tập Hội nghị Khoa học thường niên năm 2021. ISBN: 978-604-82-5957-0
Với bài toán dự báo dòng chảy lũ, ta sẽ
dựa vào phân tích chuỗi thời gian. Đây là
quá trình là dự đoán trạng thái tiếp theo dựa
trên một chuỗi đầu vào nhất định dựa trên
những gì đã quan sát trước đó. Kết quả dự
đoán là lưu lượng đến hồ trong thời điểm
giờ tiếp theo, v.v. Trong bài báo này, nhóm
tác giả thử nghiệm mạng RNN trên các thông Hình 3. Mạng RNN không bị xáo trộn
số như sau: theo thời gian
Input: số liệu Qden của 4h trước (mô hình
và thực đo). Lớp ẩn xác định không gian trạng thái
Output: bộ thông số mô hình sẽ dùng cho hoặc “bộ nhớ” của hệ thống được tính toán
1h sau. bằng công thức
Các bước giải quyết bài toán dự báo dòng ht = fH (ot) (1)
chảy lũ như sau:
Tiền xử lý dữ liệu: dữ liệu sau khi thu thập Với ot = WIHxt + WHHht-1 + bh
từ các trạm sẽ được tổng hợp và tiền xử lý. fH là hàm kích hoạt của lớp ẩn;
Chuyển tập dữ liệu sang dạng chuỗi thời bh là vector bias của hidden unit.
gian: ban đầu, dữ liệu của các tham số tại các Các nút trong lớp ẩn được liên kết với lớp
mốc thời gian (t-4), (t-3), (t-2), (t-1) được đầu ra bằng kết nối trọng số WHO. Lớp đầu ra
thiết lập. Bộ tham số tại các thời điểm này có P nút yt = (y1, y2, y3, y4,…, yP) được tính
được sử dụng để dự đoán tham số tại thời toán bằng công thức:
điểm tiếp theo (t) (Hình 2). 0 , x 0
yt f o (WH 0 ht b0 ) f ( x ) (2)
x, x 0
Với:
f0 là hàm kích hoạt của lớp đầu ra
b0 là vector bias của nút thuộc lớp đầu ra.
Vì các cặp đầu vào - đầu ra là tuần tự theo
thời gian nên các bước trên được lặp lại theo
thời gian t = (1, ..., T). Công thức (1) và (2)
Hình 2. Mô phỏng kết quả dự đoán được cho thấy RNN bao gồm một số phương trình
đưa vào mô hình ở bước thời gian tiếp theo trạng thái phi tuyến tính, có thể lặp lại theo
thời gian. Trong mỗi bước thời gian, các trạng
- Chia tập dữ liệu thành bộ train, test và thái ẩn cung cấp một dự đoán ở lớp đầu ra dựa
chuyển sang dạng vector. trên vector đầu vào. Trạng thái ẩn của RNN là
- Áp dụng mạng RNN để giải quyết bài toán một tập các giá trị, tổng hợp được thông tin
bao gồm các bước nhỏ: xây dựng và huấn lịch sử của chuỗi cho tới bước thời gian hiện
luyện mô hình RNN, kiểm tra mô hình RNN. tại. Thông tin tích hợp này có thể xác định
Một mạng nơ ron hồi quy RNN gồm 3 lớp: hành vi trong tương lai của mạng và đưa ra
lớp đầu vào, lớp ẩn, lớp đầu ra. Lớp đầu vào các dự đoán chính xác ở lớp đầu ra. RNN sử
gồm N đầu vào là một chuỗi vector theo thời dụng một chức năng kích hoạt phi tuyến đơn
gian t {x1…, xt-4, xt-3, xt-2, xt-1,…} với giá trị giản trong mọi unit. Tuy nhiên, cấu trúc đơn
tương ứng xt = (x1, x2, x3, x4,…, xN). Các giá giản như vậy có khả năng tạo mô hình động
trị đầu vào được kết nối với các nút trong lớp lực học phong phú, nếu nó được huấn luyện
ẩn bằng ma trận trọng số W1H. Lớp ẩn có M tốt thông qua các bước đo thời gian.
hidden units ht = (h1, h2, h3, h4,…, hM) được Với bài toán dự báo này, do dữ liệu đầu
liên kết với nhau theo thời gian bằng liên kết vào đều có giá trị dương, nên sử dụng hàm
lặp lại (Hình 3). kích hoạt ReLU có công thức như sau:
111
- Tuyển tập Hội nghị Khoa học thường niên năm 2021. ISBN: 978-604-82-5957-0
0 , x 0 - Mô hình dự báo dòng chảy lũ theo thời
f(x) (3) gian thực xây dựng bằng mạng RNN cho ra
x, x 0 kết quả khá sát với thực đo.
Hàm mất mát đánh giá hiệu suất của - Thời gian chạy mô hình nhanh, do đó có
mạng bằng cách so sánh đầu ra ˆy với y được thể xử lý các bộ dữ liệu lớn một cách hiệu quả.
xác định bằng công thức: - Tuy nhiên nhận thấy, độ chính xác của
Ty
mô hình còn phụ thuộc vào số lần đưa dữ liệu
( ˆy, y ) ( ˆy, y ) (4) vào chạy trong mạng. Trong mỗi lần đưa dữ
t 1
Đây là tổng số tổn thất trong mỗi bước liệu vào mạng, nếu lượng dữ liệu quá lớn, mô
thời gian. Trong số các mô hình RNN, MSE hình cũng sẽ không hoạt động tốt.
là hàm mất mát phổ biến nhất, được thể hiện 4. KẾT LUẬN
như sau:
Trong nghiên cứu này, nhóm tác giả đã kết
1 n
RMSE ( ˆyi yi )2 (5) hợp mạng RNN và mô hình thủy văn vào bài
n i 1 toán dự báo dòng chảy lũ theo thời gian thực
Với ˆyi là giá trị thực đo tại thời điểm t nhằm mục đích tăng độ chính xác của mô
yi là giá trị dự báo tại thời điểm t hình dự báo dòng chảy. Mô hình đã tìm ra
được bộ thông số tối ưu phục vụ cho việc dự
3. KẾT QUẢ THỰC NGHIỆM báo được lượng nước lũ trong thời gian tiếp
Quá trình thực nghiệm được tiến hành trên theo dựa vào các bước thời gian trước đó.
Điều này có thể giúp nâng cao tính chính xác
bộ dữ liệu về dòng chảy lũ thu thập từ các
cho việc mô phỏng dòng chảy. Ngoài ra còn
trạm Tạ Trạch 1,2,3,4. Bộ dữ liệu được phân
giúp người sử dụng mô hình giảm bớt các
chia với 75% dùng cho huấn luyện mô hình
quá trình dò tìm thủ công tốn nhiều thời gian
và 25% dùng để kiểm tra mô hình.
và công sức.
Kết quả của nghiên cứu được thể hiện
thông qua việc so sánh giữa đường quá trình 5. TÀI LIỆU THAM KHẢO
lũ tính toán và thực đo. Quá trình đánh giá dự
[1] Hồ Việt Hùng, Lê Xuân Hiền, Giha Lee
trên các độ đo RMSE, MAE. (2018), “Ứng dụng mạng nơ ron nhân tạo
Các độ đo tính được có giá trị như sau: dự báo lưu lượng dòng chảy sông Hồng tại
- MAE = 30.6653 Sơn Tây dựa trên dữ liệu ở thượng lưu”
- MSE = 5747.0368 trong Hội nghị Khoa học Cơ học Thủy khí
- RMSE = 75.8092 toàn quốc lần thứ 21, Quy Nhon, Vietnam.
Tính chính xác của thuật toán là khá cao. [2] Kawazoe, Y., Shimamoto, K., Yamaguchi,
Có thể dự báo cho ra kết quả không sai lệch R., Shintani-Domoto, Y., Uozaki, H.,
quá lớn so với thực tế (Hình 4). Fukayama, M., & Ohe, K. (2018). Faster R-
CNN-Based Glomerular Detection in
Multistained Human Whole Slide
Images. Journal of Imaging, 4(7), 91.
[3] Mo, X., Tao, K., Wang, Q., & Wang, G.
(2018, August). An Efficient Approach for
Polyps Detection in Endoscopic Videos
Based on Faster R-CNN. In 2018 24th
International Conference on Pattern
Recognition (ICPR) (pp. 3929-3934). IEEE.
[4] Xuan-Hien Le, Hung Viet Ho, Giha Lee and
Sungho Jung (2019), "Application of Long
Short-Term Memory (LSTM) Neural
Network for Flood Forecasting" Water,
Hình 4. Biểu đồ kết quả dự đoán và thực đo DOI:10.3390/w11071387.
112
nguon tai.lieu . vn