Xem mẫu

  1. CHƯƠNG 3 KẾT QUẢ TÍNH TOÁN VÀ PHÂN TÍCH DỰ BÁO MƯA MÔ HÌNH HRM Chương 3 tập trung đánh giá sai số hệ thống (Bias) theo không gian và thời gian của dự báo mưa mô hình HRM trong 3 năm 2005, 2006 và 2007 kết hợp với những chỉ tiêu đánh giá khác nhằm làm rõ hơn chất lượng dự báo mưa của mô hình HRM. Cuối cùng là việc đánh giá, so sánh khả năng dự báo mưa vừa, mưa lớn của mô hình HRM cho khu vực Đông Bắc Bộ trong một số hình thế gây mưa chính ở khu vực này. 3.1 Các kết quả tính toán Với bộ số liệu mưa dự báo 24h của mô hình HRM và bộ số liệu quan trắc thực tế tương ứng, chúng tôi đã tiến hành tính toán và phân tích trên bộ số liệu đó, kết quả thu được như dưới đây: - Các chỉ tiêu Bias, SD, MAE, RMSE trên biến liên tục đa cấp mưa - Phân bố độc lập mưa dự báo và quan trắc theo 10 cấp - Các chỉ tiêu ETS, P, HK, HSS trên biến rời rạc hai cấp mưa - Các chỉ tiêu BE/10, TS, PosP, PreP trên biến rời rạc đa cấp mưa - Các chỉ tiêu BE/10, TS, FAR, POD trên biến rời rạc 2 cấp mưa - Chỉ tiểu Bias thể hiện sai số theo không gian. - Phân bố mưa thực tế và mưa dự báo của mô hình HRM theo trung bình ngày. - Các trường hợp mưa lớn được xét riêng. 3.2 Phân tích chất lương sản phẩm dự báo Để đánh giá sai số hệ thống dự báo mưa của mô hình HRM, chúng tôi tập trung đi vào phân tích những thành phần sau: 72
  2. - Sai số hệ thống, tính biến động của sai số dự báo theo không - thời gian. - Kỹ năng dự báo. - Chất lượng chung/mức chính xác dự báo chung; - Những trường hợp riêng 3.2.1 Phân tích sai số hệ thống Bias 3.2.1.1 Sai số hệ thống theo chỉ tiêu thống kê Sai số dự báo các yếu tố khí tượng của bất kỳ một hệ thống hay mô hình dự báo nào cũng được chia ra làm 2 thành phần là sai số hệ thống và sai số ngẫu nhiên. Cũng giống như các hệ quan trắc khí tượng, sai số hệ thống là sai số về nguyên tắc có thể hiệu chỉnh được, còn sai số ngẫu nhiên là sai số không thể hiệu chỉnh được. Vì vậy việc đánh giá chất lượng dự báo của mô hình trước tiên là phải xem xét sai số hệ thống. Với một phương pháp đánh giá xác định thì sai số hệ thống gây ra bởi các nhân tố đặc trưng của mô hình và chúng lặp đi lặp lại theo thời gian, đồng thời chúng có đặc điểm phân bố theo không gian và thời gian. - Để mở rộng khả năng phân tích sai số, đối với sai số hệ thống chúng tôi tính 3 chỉ tiêu Bias cho 3 loại biến: + Với biến liên tục ta tính sai số trung bình đại số giưa trị số mưa dự báo và trị số quan trắc, ký hiệu là 'BIAS'. Đây là sai số hệ thống đích thực của mô hình. 73
  3. + Với biến rời rạc 10 cấp mưa và 2 cấp ta tính trung bình sai số hệ thống về số trường hợp dự báo so với số trường hợp thực tế, ký hiệu là BE. Nó ám chỉ sự sai khác về số trường hợp dự báo và số trường hợp thực tế, trong đó không tính đến số trường hợp dự báo đúng, vì thế nó chỉ có ý nghĩa tham khảo thêm cho phân tích sai số hệ thống, ngay cả khi BE=1. Trong các hình vẽ, màu vàng được ký hiệu là tháng 6, màu hồng là tháng 7, màu xanh lục là tháng 8, màu đỏ là tháng 9, màu xanh lam là tháng 10. Đường trung các tháng là đường màu xanh lục liền nét. Trục hoành thể hiện các cấp mưa được phân cấp, trục tung là trị số của các chỉ tiêu thống kê 2005 74
  4. 2006 2007 Hình 3.1 Chỉ tiêu BIAS trên biến liên tục: 2005, 2006, 2007 Từ hình vẽ phân bố chỉ tiêu Bias qua ba năm 2005 đến 2007, ta có thể dễ dàng thấy là: Trong tất cả các cấp mưa thì lượng mưa dự báo của mô hình HRM phần lớn đều cao hơn thực tế, chỉ có cấp mưa 1 (0 – 6.35 mm) BIAS
  5. hơn 50 mm trở lại. Từ cấp mưa với lượng nhỏ hơn 50 mm, thì lượng mưa trung bình tháng mô hình dự báo cao hơn thực tế chỉ khoảng 5 – 20 mm. Tháng 10 là tháng có sai số lớn nhất, Bias >0 và tăng dần, nghĩa là mô hình luôn dự báo mưa cao hơn thực tế. Trong 2 năm 2006 và 2007, ở cấp mưa với lượng mưa 50 – 60 mm của một số tháng, Bias nhỏ < 0 khá lớn, điều này là do trong những tháng đó, có một số trạm có lượng mưa đặc biệt lớn trong khi dự báo là nhỏ hơn khá nhiều. Để tham khảo thêm về sai số hệ thống, ta dẫn ra đường cong BE Trong các hình vẽ, màu vàng được ký hiệu là tháng 6, màu hồng là tháng 7, màu xanh lục là tháng 8, màu đỏ là tháng 9, màu xanh lam là tháng 10. Đường trung các tháng là đường màu xanh lục liền nét. Trục hoành thể hiện các cấp mưa được phân cấp, trục tung là trị số của các chỉ tiêu thống kê 2005 76
  6. 2006 2007 Hình 3.2 Chỉ tiêu BE trên biến rời rạc 10 cấp mưa , 2005, 2006, 2007 Từ chỉ tiêu BE được thể hiện bằng hình vẽ ta có thể thấy rằng trong năm 2005, 2 tháng đầu và cuối mùa: tháng 6 và tháng 10 BE khá lớn và > 1 (để dễ biểu diễn trên hình vẽ BE được chia cho 10, như vậy BE/10 = 0,1 tương ứng với BE=1) đối với cấp mưa < 6 trở lại. Trong khi đó các tháng còn lại thì có BE > 1 ở cấp mưa 1 và 2, các cấp mưa sau đó BE < 1 và giảm dần nhưng vẫn ở mức khá ổn định. Đến cấp mưa > 7 thì BE tiến nhanh đến 0. Điều này cho ta thấy rằng những tháng đầu và cuối mùa mưa, kết quả dự báo của mô hình luôn vượt so với thực tế trong 6 cấp mưa đầu, những cấp mưa còn lại thì gần như không dự báo được. Trong 3 tháng còn lại, chất lượng dự báo khá tốt và ổn định, đặc biệt là ở các cấp mưa 2, 3 và 3. Cấp mưa càng lớn, kết quả dự báo càng giảm và không sát thực tế. Năm 2006, chất lượng dự báo được cải thiện rõ rệt, nhưng ở tháng 10 BE lại quá lớn, đặc biệt là trong ba cấp mưa đầu, các tháng còn lại kết quả khá ổn định. 77
  7. Năm 2007 cho thấy BE ổn định, không còn những trường hợp đặc biệt như hai năm trước nhưng kết quả dự báo lại không tốt bằng hai năm trước do BE < 1 nhiều, điều này cho thấy rằng mô hình đã bỏ qua, không dự báo được một số đợt mưa kể cả những tháng giữa mùa mưa. Khi xem xét chỉ tiêu sai số tuyệt đối trung bình (MAE) có thể thấy rằng trong 3 – 4 cấp mưa đầu tiên, giá trị của MAE rất ổn định, ngoài ra đường thể hiện MAE giữa các tháng khá trùng khít nhau, từ cấp mưa 4 – 5 trở đi, MAE của các tháng đều có sự biến động và tăng mạnh. Các đường biểu diễn MAE của các tháng từ những cấp mưa này đều không gần sát nhau nữa, điều này cho thấy đối với các cấp mưa lớn, độ lớn trung bình của sai số có sự khác biệt rất rõ qua từng tháng. Ngoài ra để đánh giá độ tin cậy của mô hình, xem xét đồng thời hai chỉ số ME (sai số hệ thống) và MAE, ta thấy rằng chúng rất sát nhau. Điều này cho ta biết rằng có thể dùng chỉ số Bias để hiệu chỉnh sản phẩm dự báo một cách đáng tin cậy. Chỉ tiêu RMSE cũng hoàn toàn phù hợp với MAE và độ biến động SD (độ biến động SD được trình bày ở phần phụ lục). 78
  8. RMSE 2005 MAE 2005 RMSE 2006 MAE 2006 79
  9. RMSE 2007 MAE 2007 Hình 3.3 Các chỉ tiêu MAE và RMSE trong 3 năm 2005, 2006 và 2007 Đến đây có thể nói rằng sai số hệ thống của HRM khá ổn định và có quy luật rõ rệt (quan trọng ở tính quy luật, còn trị số lớn hay nhỏ không mấy quan trọng). Còn câu hỏi đặt ra là tại sao ở các cấp mưa lớn mưa HRM > mưa thực tế mà những ngày có mưa lớn cụ thể thì lại thấy mưa HRM < mưa thực tế? Điều đó không có gì trái với quy luật của sai số hệ thống và sẽ được đề cập đến trong phần "Phân tích những trường hợp riêng" ở dưới. 3.2.1.2 Sai số hệ thống phân bố theo không gian Khi nghiên cứu về sai số hệ thống ta phải xem xét cả phân bố của chúng theo không gian, vì nếu ta chỉ mới biết xu thế mô hình dự báo thiên cao hay thiên thấp so với mưa thực tế có nghĩa là ta chưa nói gì đến ảnh hưởng của cơ chế hoàn lưu và địa hình. Do đó ta chưa xác định được để hoàn thiện mô hình ta cần tác động vào đâu, đồng thời cũng chưa biết được việc hiệu chỉnh sản phẩm mô hình ta phải tác động vào 80
  10. cái gì và như thế nào. Đặc biệt là để sử dụng thông minh kết quả mô hình, dự báo mưa cho những địa điểm cụ thể mà ta không biết phân bố sai số hệ thống theo không gian thì không thể thực hiện được. Để nắm được phân bố sai số hệ thống theo không gian, ta phải biểu diễn chúng trên bản đồ đẳng sai số cho từng cấp mưa trên từng khu vực. Trong các hình được trình bày như ở dưới đường đỏ (liền nét) là Bias >0 - ứng với trường hợp mưa mô hình dự báo cao hơn thực tế, đường xanh (chấm chấm) là Bias
  11. Hình 3.4 Các chỉ tiêu MAE và RMSE trong 3 năm 2005, 2006 và 2007 Do số lượng hình vẽ rất nhiều nên chúng tôi chỉ lấy một số hình vẽ phân bố sai số theo không gian 6 cấp mưa đầu của tháng 6/2005, những tháng sau đó sẽ chỉ trình bày phân tích, hình vẽ sẽ được lưu ở phần phụ lục. 82
  12. Trong tháng 6/2005, đối với cấp mưa 1 ta dễ dàng nhận thấy có sự đan xen giữa các khu vực có Bias < 0 và các khu vực có Bias > 0. Hai khu vực có Bias < 0 lớn nhất là Hà Giang và Quảng Ninh, nhưng đến các cấp mưa tiếp theo, từ cấp 2 đến cấp 4 thì khu vực Hà Giang là có Bias < 0, ngoài ra khu Tây Bắc cũng bắt đầu có Bias 0. Tính theo trung bình tháng 6/2005 thì chỉ có Hà Giang là có Bias < 0 với chênh lệch lượng mưa dự báo thấp hơn so với thực tế khoảng 20 – 25 mm. Tháng 7/2005, khu vực có Bias < 0 nhiều nhất lại chủ yếu tập trung ở các tỉnh ven biển từ Hải Phòng đến Quảng Ninh, riêng Hà Giang chỉ có ở cấp mưa 3 và 6 là Bias < 0. Từ cấp mưa 7 trở đi, Bias > 0. Tháng 8/ 2005, Bias < 0 vẫn duy trì ở các tỉnh ven biển và mở rộng ra phía đồng bằng ven biển và cũng chỉ xảy ra ở các cấp mưa nhỏ hơn cấp 5. Tháng 9/2005, khu vực có Bias < 0 tiếp tục mở rộng về phía nam đồng bằng, đặc biệt là các tỉnh ven biển Thái Bình, Nam Định ở các cấp mưa 2 và 3. Tháng 10/2005 Bias > 0 ở tất cả các cấp mưa. Đến tháng 6/2006, về cơ bản khu vực Hà Giang vẫn có Bias < 0 nhưng chỉ ở trong 3 cấp mưa đầu tiên. Đến tháng 7/2006, ở 3 cấp mưa đầu tiên khu vực Hà Giang vẫn có bias < 0. Từ cấp mưa 2 trở lên, khu vực ven biển, đặc biệt là khu vực Móng Cái (Quảng Ninh) Bias < 0. Sang cấp mưa 4, 5, Bias < 0 ở hầu hết các tỉnh vùng núi phía Bắc và vùng núi Đông Bắc. Từ cấp mưa 6 thì Bias > 0. Trong tháng 8/2006, khu vực các tỉnh ven biển Bắc Bộ tiếp tục có Bias âm, đồng thời đến cấp mưa 4 thì mở rộng ra toàn bộ khu vực đồng bằng. Sang tháng 9/2006, khu vực Hà Giang và nam đồng bằng có Bias < 0 ở cấp mưa bằng 3 trở lại. Tháng 10/2006 giống năm 2005, nghĩa là Bias luôn > 0 ở tất cả các cấp mưa. Năm 2007: Tháng 6 khu vực có Bias < 0 vẫn tập trung ở Hà Giang và khu vực vùng núi phía đông bắc (Móng Cái – Quảng Ninh) và xảy ra chủ yếu ở 3 cấp mưa đầu 83
  13. tiên. Tháng 7 giống tháng 6 nhưng xảy ra đến cấp mưa thứ 5. Trong tháng 8, có hai cấp mưa 4 và 5 các khu vực Hà Giang và Đông Bắc (Cao Bằng, Quảng Ninh, Lạng Sơn) Có Bias âm khá lớn. Tháng 9 ngoài các khu vực như Hà Giang và Móng cái có Bias < 0, xu hướng Bias < 0 cũng mở rộng ra toàn bộ phía Đông Bắc Bộ và xảy ra ở cấp mưa bằng 4 trở lại. Tháng 10 Bias < 0 chủ yếu ở một vài khu vực nhỏ ở phía nam đồng bằng và xảy ra ở hai cấp mưa đầu tiên, từ các cấp mưa về sau, Bias > 0. Như vậy, sau khi xem xét về sai số theo không gian ( cụ thể ở đây là các đường đẳng sai Bias) chúng ta có thể dễ dàng thấy là sai số hệ thống xảy ra có tính quy luật: - Trong tất cả các cấp mưa, Bias < 0 chỉ ở mưa cấp 5, cấp 6 trở lại, còn từ cấp 6 trở lên Bias luôn > 0. - Khu vực Hà Giang và Móng Cái, Quảng Ninh là hai nơi có tần suất Bias < 0 nhiều nhất, tiếp theo đó là khu vực đồng bằng ven biển và vùng núi phía Bắc. - Theo tháng, trong tháng đầu tiên Bias < 0 chủ yếu ở Hà Giang và Móng Cái, sau đó trong tháng 7, 8 và 9 khu vực có Bias < 0 mở rộng lần lượt dần ra phía các tỉnh ven biển và trong tháng 8, 9 thì mở rộng ra ở khu vực nam đồng bằng. Đến tháng 10 thì Bias luôn > 0. 3.2.2 Về những chỉ tiêu thống kê khác 3.2.2.1 Về chỉ tiêu TS a) Chỉ tiêu TS đa cấp Chỉ tiêu TS biểu thị độ chính xác dự báo trong từng cấp mưa, thường được gọi là độ chính xác tương đối (relative accuracy). Chỉ số TS xác định sự phù hợp giữa vùng mưa dự báo và vùng mưa quan trắc. Khi TS=1 có nghĩa dự báo mưa là hoàn hảo, vùng 84
  14. mưa dự báo trùng với vùng mưa quan trắc. Đặc tính của chỉ số này là nó rất nhạy với các dự báo sự xuất hiện mưa đúng, nhưng nó không quan tâm tới các trường hợp không dự báo được sự xuất hiện của hiện tượng và số lần dự báo sai. Chỉ số này không nói lên nguồn gốc của sai số dự báo. Trong các mùa khác nhau, chỉ số này bị ảnh hưởng bởi tần suất khí hậu của hiện tượng. Hình dưới cho ta thấy ở mưa cấp 1 là cấp có tần suất mưa lớn nhất thì TS cũng lớn nhất, còn ở các cấp mưa có tần suất nhỏ thì TS cũng thường nhỏ. Trong các hình vẽ, màu vàng được ký hiệu là tháng 6, màu hồng là tháng 7, màu xanh lục là tháng 8, màu đỏ là tháng 9, màu xanh lam là tháng 10. Đường trung các tháng là đường màu xanh lục liền nét. Trục hoành thể hiện các cấp mưa được phân cấp, trục tung là trị số của các chỉ tiêu thống kê 2005 85
  15. 2006 2007 Hình 3.5 Chỉ tiêu TS cho 10 cấp mưa ba năm 2005, 2006 và 2007 b) Chỉ tiêu TS của các cấp mưa phân đôi Hình dưới là chỉ tiêu TS của các cấp mưa phân đôi (hai cấp liên tiếp). Ta thấy với cách phân đôi này mức chính xác tương đối được cải thiện đáng kể. Một lần nữa ta lại thấy đường cong TS của tháng 10 cứ như bị tách ra khỏi tập hợp. Điều này gợi cho ta suy nghĩ là tháng 10 là tháng chuyển tiếp giữa mùa mưa và mùa khô, do đó TS của tháng 10 thường bị dị thường như vậy. 86
  16. Trong các hình vẽ, màu vàng được ký hiệu là tháng 6, màu hồng là tháng 7, màu xanh lục là tháng 8, màu đỏ là tháng 9, màu xanh lam là tháng 10. Đường trung các tháng là đường màu xanh lục liền nét. Trục hoành thể hiện các cấp mưa được phân cấp, trục tung là trị số của các chỉ tiêu thống kê 2005 2007 2006 Hình 3. 6 Chỉ tiêu TS với cấp mưa phân đôi 2005, 2006, 2007 3.2.2.2 Về chỉ tiêu độ chính xác dự báo P% 87
  17. Để xem xét độ chính xác dự báo của mô hình, ngoài độ chính xác tương đối TS ra, chúng tôi còn tính các chỉ tiêu cho 10 cấp mưa gồm PosP, PreP, và P% cho toàn bộ các cấp mưa dự báo (được xem như chất lượng dự báo của mô hình/hệ thống dự báo). Đối với các cấp mưa phân đôi (2 cấp) các chỉ tiêu đã tính gồm FAR, POD, HK, HSS và P%. Khi xét đến toàn bộ các cấp mưa dự báo, đầu tiên ta xem xét chỉ số “xác suất hậu nghiệm” - POSP, xác suất hậu nghiệm cho chúng ta cái nhìn tổng quan về chất lượng dự báo đúng/sai của mô hình, với khoảng giá trị từ 0 – 1, xác suất hậu nghiệm tốt nhất khi có giá trị bằng 1. Trong các hình vẽ, màu vàng được ký hiệu là tháng 6, màu hồng là tháng 7, màu xanh lục là tháng 8, màu đỏ là tháng 9, màu xanh lam là tháng 10. Đường trung các tháng là đường màu xanh lục liền nét. Trục hoành thể hiện các cấp mưa được phân cấp, trục tung là trị số của các chỉ tiêu thống kê 2005 88
  18. 2007 2006 Hình 3.7 Xác suất hậu nghiệm – POSP cho toàn bộ 10 cấp mưa ba năm 2005, 2006 và 2007 Từ các hình vẽ biểu diễn giá trị Posp qua ba năm 2005, 2006 và 2007 ta thấy rằng chỉ ở cấp mưa đầu tiên Posp có giá trị tốt, đến cấp mưa thứ 2 Posp đã có sự giảm đột ngột trong cả 3 năm đánh giá, và từ cấp mưa thứ 2 trở đi, giá trị trung bình của Posp đều nhỏ hơn 0.1. Nếu xét riêng cho từng năm thì thấy là trong năm 2005, ở tất cả các tháng Posp khá ổn định, tháng 6 và tháng 10 có Posp thấp nhất và chúng = 0 từ cấp mưa thứ 5 trở đi. Năm 2006 Posp có sự trồi sụt ổn định, cứ một cấp mưa Posp = 0 thì ở cấp mưa sau Posp = 0.1, tuy nhiên năm 2006 cũng là năm có Posp kém nhất khi Posp chỉ cho giá trị đến cấp mưa thứ 7. Sang năm 2007, tuy Posp vẫn có giá trị thấp nhưng vẫn có giá trị tham khảo trên toàn bộ 10 cấp mưa, đặc biệt trong tháng 10 từ cấp mưa 6 trở lại, Posp cho giá trị khá tốt so với 2 năm trước đó. 89
  19. Xác suất nhận biết PreP cho chúng ta thấy được khả năng mà mô hình có thể nhận biết/ dự báo được khả năng xuất hiện một hiện tượng thời tiết nào đó hay không, PreP cũng có giá trị trong khoảng (0 – 1), giá trị hoàn hảo của PreP = 1 xảy ra khi mô hình dự báo được tất cả những hiện tượng xảy ra. Trong các hình vẽ, màu vàng được ký hiệu là tháng 6, màu hồng là tháng 7, màu xanh lục là tháng 8, màu đỏ là tháng 9, màu xanh lam là tháng 10. Đường trung các tháng là đường màu xanh lục liền nét. Trục hoành thể hiện các cấp mưa được phân cấp, trục tung là trị số của các chỉ tiêu thống kê 2005 90
  20. 2006 2007 Hình 3.8 Xác suất nhận biết - PreP cho toàn bộ 10 cấp mưa ba năm 2005, 2006 và 2007 Nhìn vào hình vẽ biểu thị các giá trị của PreP qua các năm cũng dễ dàng thấy được rằng mô hình có khả năng nhận biết khá tốt đối với những cấp mưa nhỏ (3 cấp mưa đầu), cấp mưa càng nhỏ thì mô hình nhận biết càng tốt, càng cấp mưa lớn PreP càng nhỏ hay nói cách khác khả năng nhận biết các đợt mưa lớn của mô hình còn gặp nhiều hạn chế. Khi xét đến chỉ tiêu FAR, ta dễ dàng thấy là đối với chỉ tiêu FAR, phần trăm “báo động sai” là khá lớn. Trong năm 2005, tháng 7 và tháng 9 FAR xấp xỉ 0.6 – 0.7, còn tháng 8 FAR xấp xỉ 0.8 – 0.9; tháng 10 FAR > 0.9 và đến cấp mưa thứ 3 trở đi thì FAR không còn giá trị tham khảo nữa. Năm 2006, tháng 7, 8 và 9 có FAR khá ổn định từ cấp mưa < 50 mm trở lại, từ cấp mưa > 60 mm trở lên, FAR tăng khá nhanh; riêng 2 tháng 6 và tháng 10 FAR khá cao, tuy nhiên tháng 10 FAR còn có giá trị tham khảo 91
nguon tai.lieu . vn