Xem mẫu

  1. Hội nghị Khoa học Công nghệ lần thứ 4 - SEMREGG 2018 DỰ BÁO NỒNG ĐỘ Ô NHIỄM TSS (TỔNG RẮN LƠ LỬNG) CỦA CHẤT LƯỢNG NƯỚC MẶT THEO THỜI GIAN TẠI TRẠM TÂN HIỆP, SÔNG ĐỒNG NAI Nguyễn Công Nhựt Khoa Công nghệ thông tin, Trường Đại học Nguyễn Tất Thành, 300A Nguyễn Tất Thành, Quận 4, Tp. Hồ Chí Minh Email: ncnhutqnam@gmail.com TÓM TẮT Nước rất cần thiết cho sự sống của con người và sự phát triển kinh tế - xã hội. Ô nhiễm nguồn nước là vấn đề được cả nhân loại đều quan tâm. Ở Việt Nam, do sự phát triển các nhà máy, xí nghiệp nên nguồn nước bị ô nhiễm ngày càng trầm trọng, trong đó có sông Đồng Nai. Trong bài báo này, tác giả sử dụng nồng độ ô nhiễm TSS tại trạm quan tắc Tân Hiệp, sông Đồng Nai, sử dụng phương pháp nội suy Kriging để tìm ra mô hình phù hợp và đưa ra kết quả dự báo ô nhiễm nguồn nước khu vực sông Đồng Nai theo thời gian với độ tin cậy cao. Dữ liệu TSS được quan trắc liên tục trong ba tháng (từ đầu tháng 2 năm 2018 đến cuối tháng 4 năm 2018), kết quả dự báo khi sử dụng nội suy Kriging có độ chính xác cao với hệ số hồi quy bằng 1.005, hệ số tương quan bằng 0.859 (giá trị tốt nhất bằng 1), sai số dự báo 2.258, sai số chuẩn bằng 0.044. Qua đó cho thấy sử dụng phương pháp nội suy Kriging là một giải pháp hiệu quả và phù hợp trong các bài toán với các thông tin thời gian. Từ khóa: Ô nhiễm nguồn nước, địa thống kê, Kriging, variogram. 1. GIỚI THIỆU Ô nhiễm nguồn nước là vấn được cả xã hội quan tâm không chỉ riêng Việt Nam mà cả trên toàn thế giới. Ô nhiễm nguồn nước do rất nhiều nguyên nhân gây ra như rác thải trong các nhà máy, xí nghiệp, sản xuất nông nghiệp, sinh hoạt của người dân…Việc xây dựng các trạm quan trắc môi trường nước cũng rất cần thiết, nhưng cũng gặp rất nhiều khó khăn như chi phí lắp đặt một trạm quan trắc rất tốn kém và vấn đề vận hành và bảo quản cũng gặp hết sức khó khăn. Theo trung tâm quan trắc môi trường của Sở Tài nguyên và Môi trường Bình Dương, mạng lưới quan trắc chất lượng nước tự động trên sông Đồng Nai của tỉnh Bình Dương có 4 trạm gồm có Tân Hiệp, Vĩnh Nguyên, Thủ Dầu Một và Tân Uyên. Hệ thống quan trắc liên tục theo từng ngày với các thông số quan trắc như TSS, pH, Nitrat, nhiệt độ và độ mặn. Tuy nhiên, với sự phát triển nhanh chóng của các khu công nghiệp, thì vấn đề ô nhiễm môi trường, đặc biệt là ô nhiễm nguồn nước là vấn đề nóng, tình trạng khan hiếm nước sạch, nguồn nước ô nhiễm dẫn đến nhiều căn bệnh nguy hiểm. Do vậy, yêu cầu đặt ra cần có một mô hình Toán học để dự báo trong tương lai chất lượng nguồn nước tại một khu vực nào đó có an toàn để sử dụng hay không? Bằng cách sử dụng dữ liệu quan trắc liên tục trong 3 tháng liền (từ tháng 2 đến tháng 4 năm 2018, tại trạm Tân Hiệp) tác giả đưa ra mô hình Toán học thích hợp để dự đoán ô nhiễm nguồn nước trong các tháng tiếp theo. Hiện nay đã có một số mô hình dự báo ô nhiễm nguồn nước như mô hình QUAL2K, mô hình IPC,… Mô hình QUAL2K là một phiên bản của mô hình QUAL2E. Mô hình này được phát triển do sự hợp tác giữa trường Đại học Tufts và Trung tâm Môi trường Chất lượng nước của Cục Môi trường Mỹ (US.EPA). Mô hình được sử dụng rộng rãi để dự báo diễn biến chất lượng nước sông và 59
  2. The fourth Scientific Conference - SEMREGG 2018 dự đoán tải trọng của các chất thải vào sông. Mô hình IPC do Ngân hàng thế giới, Tổ chức Y tế thế giới và Tổ chức y tế Hoa Kỳ phát triển. Mô hình IPC đánh giá chất lượng nước sông, dự báo biến đổi chất lượng nước sông, tính toán tải lượng cần cắt giảm của từng nguồn. 2. DỮ LIỆU VÀ PHƢƠNG PHÁP Sông Đồng Nai là con sông nội địa dài nhất Việt Nam, lớn thứ nhì Nam Bộ về lưu vực, chỉ sau sông Cửu Long. Sông Đồng Nai chảy qua các tỉnh Lâm Đồng, Đắk Nông, Bình Phước, Đồng Nai, Bình Dương, Thành phố Hồ Chí Minh với chiều dài 586 km (364 dặm) và lưu vực 38.600 km² (14.910 mi2). Nếu tính từ đầu nguồn sông Đa Dâng thì dài 586 km còn nếu tính từ điểm hợp lưu với sông Đa Nhim phía dưới thác Pongour thì dài 487 km. Sông Đồng Nai đổ vào Biển Đông tại khu vực huyện Cần Giờ. Dữ liệu được thu thập từ trạm quan trắc môi trường nước tự động Tân Hiệp trên sông Đồng Nai, quan trắc liên tục hàng ngày từ tháng 2 năm 2018 đến tháng 4 năm 2018 (xem Bảng 1). Thông số TSS (turbidity suspendid solids) là tổng rắn lơ lửng. Thường đo bằng máy đo độ đục (turbidimeter). Độ đục gây ra bởi hiện tượng tương tác giữa ánh sáng và các chất lơ lửng trong nước như cát, sét, tảo và những vi sinh vật và chất hữu cơ có trong nước. Các chất rắn lơ lửng phân tán ánh sáng hoặc hấp thụ chúng và phát xạ trở lại với cách thức tùy thuộc vào kích thước, hình dạng và thành phần của các hạt lơ lửng và vì thế cho phép các thiết bị đo độ đục ứng dụng để phản ánh sự thay đổi về loại, kích thước và nồng độ của các hạt có trong mẫu,… Tác giả áp dụng phương pháp địa thống kê để dự báo nồng độ ô nhiễm nguồn nước TSS trong thời gian tiếp theo. Bảng 1. Dữ liệu ô nhiễm nguồn nước TSS tại trạm Tân Hiệp Thời gian TSS (mg/lít) Thời gian TSS (mg/lít) Thời gian TSS (mg/lít) 1/2/2018 21 1/3/2018 19 1/4/2018 24 …… …… …… …… …… …… 28/2/2018 15 28/3/2018 23 28/4/2018 30 29/3/2018 19 29/4/2018 31 30/3/2018 15 30/4/2018 37 31/3/2018 20 Công cụ chính trong địa thống kê là variogram, thể hiện sự phụ thuộc không gian giữa các quan sát lân cận. Variogram ( ) là một nửa phương sai của sự khác biệt giữa các giá trị thuộc tính tại tất cả các điểm được tách bởi một khoảng cách h [1] ( ) ( ) ∑ , ( ) ( )-2 (1) ( ) trong đó Z(s) là giá trị tại điểm đã có dữ liệu quan trắc và N(h) là tổng số cặp điểm cách nhau một khoảng cách h. Dưới điều kiện tính ổn định bậc hai [2], chúng ta có: [Z(s)] và hàm hiệp phương sai 2 Cov[Z(s), Z(s h)] [(Z(s) )(Z(s h) )] [Z(s)Z(s h) ] C(h) (2) Khi đó Var[Z(s)] C(0) [Z(s) ]2 60
  3. Hội nghị Khoa học Công nghệ lần thứ 4 - SEMREGG 2018 1 (h) [Z(s) Z(s h)]2 C(0) C(h) 2 Các mô hình được sử dụng phổ biến nhất là mô hình spherical, mô hình exponential, mô hình Gaussian và mô hình tuyến tính (Isaaks Srivastava, 1989) [3]. Tính đầy đủ và hiệu lực của mô hình variogram được kiểm tra một cách thỏa đáng bằng một kỹ thuật được gọi là cross-validation. Đồ thị Crossing thể hiện mối tương quan giữa giá trị ước lượng và giá trị thực tế. Variogram thích hợp nhất dựa trên việc chọn lựa mô hình có hệ số tương quan R2 cao nhất bằng cách thử rất nhiều mô hình để tìm ra mô hình có sai số thấp nhất thì mô hình đó tốt nhất. Kỹ thuật Kriging là một ước lượng nội suy chính xác được sử dụng để tìm ước lượng không thiên lệch tuyến tính tốt nhất, tức phải có sai số ước lượng nhỏ nhất. Chúng tôi sử dụng phương pháp Kriging thông thường để phân tích không gian và thời gian. Phương pháp Kriging thông thường chủ yếu được áp dụng cho các tập dữ liệu chưa biết và với một xu hướng. Phương trình tổng quát cho ước lượng Kriging tuyến tính là: n ˆ ) Z(s w i Z(si ) (3) 0 i 1 Để ước lượng tuyến tính không chệch trong Kriging thông thường thì chúng ta có hệ phương trình sau: n w i (si ,s j ) (s0 ,si ) i 1 (4) n wi 1 i 1 ˆ trong đó Z(s 0 ) là giá trị Kriging tại vị trí s0, Z(si) là giá trị đã biết tại vị trí si và wi là các trọng số liên kết với dữ liệu. is the weight associated with the data, là nhân tử Lagrange. Cực tiểu Kriging sai số bình phương trung bình của dự báo min e2 ˆ )]2 [Z(s0 ) Z(s 0 Theo tính ổn định bậc hai thì phương trình cuối cùng có thể được viết thành: n n n 2 e C(0) 2 w i C(s0 ,si ) w i w jC(si , s j ) (5) i 1 i 1 j 1 Do đó bài toán cực tiểu có thể được viết như sau: n n n n min C(0) 2 w i C(s0 ,si ) w i w jC(si ,s j ) 2 ( w i 1) (6) i 1 i 1 j 1 i 1 Từ (8) lấy đạo hàm riêng theo w1, w2,..., wn và λ và cho các đạo hàm riêng bằng 0, chúng ta có: n n jC(si ,s j ) C(s0 ,si ) 0, i 1, 2,..., n và wi 1 j 1 i 1 Sử dụng kí hiệu ma trận hệ phương trình sau được viết thành: 61
  4. The fourth Scientific Conference - SEMREGG 2018 C(s1 ,s1 ) C(s1 ,s 2 ) C(s1 ,s n ) 1 w1 C(s0 ,s1 ) C(s2 ,s1 ) C(s2 ,s 2 ) C(s2 ,sn ) 1 w2 C(s0 ,s 2 ) C(sn ,s1 ) C(sn ,s 2 ) C(sn ,s n ) 1 wn C(s0 ,s n ) 1 1 1 0 1 Do đó các trọng số w1, w2,..., wn và nhân tử Lagrange λ có thể được tính W=C-1c trong đó W (w1, w 2 ,..., w n , ) c (C(s0 ,s1 ), C(s0 ,s2 ),..., C(s0 ,sn ),1) C(si ,s j ), i 1, 2,..., n, j 1, 2,..., n, 1, i n 1, j 1, 2,..., n, C 1, i 1, 2,..., n, j n 1, 0, i n 1, j n 1. Phần mềm GS+ (phiên bản 5.1.1) được sử dụng cho phân tích địa thống kê trong nghiên cứu này (Gamma Design Software, 2001) [4]. 3. KẾT QUẢ VÀ THẢO LUẬN Để kiểm tra tính đẳng hướng (isotropic) của TSS, cách tiếp cận thông thường nhất là so sánh các variogram trong vài hướng (Goovaerts, 1997) [5]. Trong nghiên cứu này các góc chính như 0o, 45ơ, 90o và 135o với dung sai góc of 45o được sử dụng để xác định tính đẳng hướng. Hình 1. Mô hình variogram đẳng hướng cho thông số TSS. Hình. 1 cho thấy sự phù hợp variogram cho phân tích không gian của TSS. Thông qua bản đồ semivariance của thông số TSS, mô hình đẳng hướng là phù hợp. Các giá trị variogram được thể hiện trong Bảng 2. Mô hình phù hợp nhất để nội suy là mô hình Gaussian với các thông số (Nugget = 6.5, Sill = 64, Range = 95, r2 = 0.969 và RSS = 101). 62
  5. Hội nghị Khoa học Công nghệ lần thứ 4 - SEMREGG 2018 Bảng 2. Các giá trị variogram của TSS. Nugget Sill Range r2 RSS Linear 0 46.75 60.79 0.951 152 Gaussian 6.5 64 95 0.969 101 Spherical 0.2 61.4 114 0.932 215 Exponetial 0.1 61.2 169.2 0.882 410 Kiểm định mô hình: Kết quả đáng tin cậy của việc lựa chọn mô hình sử dụng phép nội suy thích hợp được biểu diễn trong Bảng 3 theo hệ số hồi quy, hệ số tương quan và giá trị nội suy, ngoài ra còn có các giá trị lỗi như sai số chuẩn (SE) và sai sô dự báo (SE Prediction) Bảng 3. Kiểm định các thông số mô hình. Coefficient regression Coefficient correlation SE SE Prediction 1.005 0.859 0.044 2.258 Hình 2. Kết quả kiểm định sai số dự báo cho thông số TSS. Hình. 2 cho thấy kết quả kiểm định sai số giữa giá trị ước lượng và giá trị thực tế theo phương pháp nội suy Kriging với sự đẳng hướng TSS. Hệ số hồi quy bằng 1.005, hệ số tương quan gần bằng 0.859 (kết quả tốt nhất bằng 1), sai số chuẩn bằng 0.044 và sai số dự báo bằng 2.258 cho thấy sự lựa chọn mô hình nội suy Kriging phù hợp với tập dữ liệu trong Bảng 1. Từ Hình 3 chúng ta thấy rằng từ tháng 2 đến tháng 4 (từ 1 đến 89 ngày), thì tháng 2 có nồng độ ô nhiễm TSS thấp nhất và tăng dần đến tháng 4 điều này cũng phù hợp với thực tế vì tháng 2 là mùa khô và tháng 4 là đầu mùa mưa nên TSS tăng cao. Trục X, Y là biểu diễn số ngày (bắt đầu từ ngày 1/2/2018 đến ngày 30/4/2018 tức là có 89 ngày. Dựa vào Hình 3, chúng ta có thể dự báo nồng độ ô nhiễm TSS trong các tháng tiếp theo và đưa ra các giải pháp khắc phục. Ứng dụng phương pháp địa thống kê đã đề cập để dự đoán nồng độ ô nhiễm TSS tại trạm Tân Hiệp cho thấy kết quả dự báo có sai số nhỏ như Hình 2. Thông qua nghiên cứu dự báo này sử dụng các phương pháp và mô hình dựa vào nội suy, chúng ta có thể dự báo mức độ ô nhiễm nồng độ TSS cho các tháng tiếp theo mà chưa có số liệu quan trắc, từ đó đề xuất các biện pháp cải thiện và bảo vệ môi trường. 63
  6. The fourth Scientific Conference - SEMREGG 2018 Hình 3. Nội suy Kriging cho thông số TSS trong 2 chiều. Từ bản đồ dự báo, chúng tôi thấy rằng dự báo cho kết quả tốt nhất trong khoảng thời gian 89 ngày, nằm ngoài khoảng thời gian này kết quả dự báo có thể không chính xác. Nếu thời gian quan trắc chất ô nhiễm càng nhiều thì việc lựa chọn các mô hình nội suy là dễ dàng hơn, kết quả nội suy có độ tin cậy cao hơn và ngược lại. Các màu khác nhau thể hiện mức độ ô nhiễm khác nhau. Mức độ ô nhiễm thấp nhất là màu xanh và cao nhất là màu trắng. Các khu vực có cùng màu có cùng mức độ ô nhiễm. Kết quả mô hình vẫn còn sai số điều này có thể do nhiều yếu tố ảnh hưởng khác đến thông số TSS như độ mặn, nhiệt độ, hàm lượng Nitrat, lưu lượng nước… Đây là bài báo đầu tiên tác giả sử dụng phương pháp nội suy Kriging để dự báo ô nhiễm nguồn nước theo thời gian. 4. KẾT LUẬN Các ứng dụng về địa thống kê để dự đoán nồng độ TSS trên các con sông tại trạm quan trắc Tân Hiệp đã cho kết quả sai số nhỏ giữa các giá trị ước tính và giá trị thực (sai số chuẩn bằng 0.044 và sai số dự báo bằng 2.258). Từ đó, nghiên cứu cho thấy tính hiệu quả và tính hợp lý với độ tin cậy cao của lý thuyết địa thống kê để xây dựng các mô hình dự báo phù hợp. Khi xây dựng mô hình, chúng ta nên chú ý đến các giá trị lỗi của mô hình, đặc tính dữ liệu của đối tượng. Chúng tôi cũng xem xét kết quả của việc lựa chọn mô hình nhằm mục đích lựa chọn mô hình phù hợp nhất cho các dữ liệu thực tế, vì các mô hình riêng biệt cung cấp độ chính xác khác nhau. Do đó, kinh nghiệm lựa chọn mô hình cũng đóng một vai trò rất quan trọng trong các kết quả nội suy. Cuối cùng, việc so sánh phương pháp được đề xuất với một số phương pháp khác có thể được thực hiện như sau. Phương pháp đa giác (nearest neighbor) có các ưu điểm như dễ sử dụng, tính toán nhanh trong 2 chiều; nhưng cũng có nhiều nhược điểm như ước tính không liên tục; hiệu ứng cạnh / nhạy cảm với ranh giới. Phương pháp Triangulation có những ưu điểm dễ hiểu, tính toán nhanh trong 2 chiều; có thể được thực hiện bằng tay, nhưng ít nhược điểm là mạng lưới tam giác không phải là duy nhất. Việc sử dụng tam giác Delaunay là một nỗ lực để làm việc với một bộ tam giác “chuẩn”, không hữu ích cho phép ngoại suy và khó thực hiện trong 3 chiều. Phương tiện mẫu cục bộ có lợi thế là dễ hiểu; dễ tính toán ở cả 2 chiều và nhanh; nhưng nhược điểm có thể là định nghĩa vùng lân cận không phải là duy nhất, vị trí của mẫu không được sử dụng ngoại trừ việc xác định vùng lân cận, 64
  7. Hội nghị Khoa học Công nghệ lần thứ 4 - SEMREGG 2018 nhạy cảm với phân cụm dữ liệu tại các vị trí dữ liệu. Phương pháp này không phải lúc nào cũng trả về câu trả lời có giá trị. Phương pháp này hiếm khi được sử dụng. Tương tự, phương pháp khoảng cách nghịch đảo dễ hiểu và dễ thực hiện, cho phép thay đổi số mũ bổ sung thêm sự linh hoạt cho sự thích ứng của phương pháp với các vấn đề ước lượng khác nhau. Phương pháp này có thể xử lý bất đẳng hướng; nhưng nhược điểm là những khó khăn gặp phải khi điểm ước tính trùng với điểm dữ liệu (d = 0, trọng số không xác định), dễ bị phân cụm. Acknowledgment: Tác giả xin chân thành biết ơn TS. Nguyễn V. M. Mẫn, bộ môn Toán, khoa Khoa học, đại học Mahidol, Thái Lan and TS. Tạ Quốc Dũng khoa Địa chất và Kỹ thuật Dầu khí, trường Đại học Bách khoa Tp. HCM. TÀI LIỆU THAM KHẢO 1. S. H. Ahmadi and A. Sedghamiz - “Geostatistical analysis of Spatial and Temporal Variations of groundwater level” - Environmental Monitoring and Assessment, 129, 277-294, 2007. 2. R. Webster and M. A. Oliver - Geostatistics for Enviromental Scientists, 2nd Edition, John Wiley and Sonc LTD, The Atrium, Southern Gate, Chichester, West Sussex PO19, England, 6-8, 2007. 3. E. Isaaks and M. R. Srivastava - An introduction to applied geostatistics, New York: Oxford University Press, 1989. 4. Gamma Design Software - GS+ Geostatistics for the Environmental Science, version 5.1.1, Plainwell USA: MI, 2001. 5. P. Goovaerts - Geostatistics for natural resources Evaluation, New York: Oxford University Press, 199. PREDICTED CONCENTRATION TSS POLLUTION (TOTAL SUSPENDED SOLIDS) FOR WATER QUALITY AT THE TIME OF TAN HIEP STATION, DONG NAI RIVER Nhut Nguyen Cong Department of Information Technology, Nguyen Tat Thanh University, 300A Nguyen Tat Thanh, District 4, Ho Chi Minh City Email: ncnhutqnam@gmail.com ABSTRACT Water is essential for human life and socio-economic development. Water pollution is a concern for all mankind. In Vietnam, due to the development of factories and factories, water pollution has become more severe, including the Dong Nai River. In this article, the author uses the concentration of TSS at the Tan Hiep control station, Dong Nai River, using the Kriging interpolation method to find the appropriate model and give the results of water pollution prediction. Dong Nai river area over time with high reliability. TSS data were monitored continuously for three months (from the beginning of February 2018 to the end of April 2018), the predicted results using Kriging interpolation with high accuracy with regression coefficient equal to 1,005, the coefficient is 0.859 (the best value is 1), the forecast error is 2.258, the standard error is 0.044. It shows that using the Kriging interpolation method is an effective and suitable solution in mathematical problems with time information. Keywords: Water pollution, geostatistics, Kriging, semivariogram. 65
nguon tai.lieu . vn