- Trang Chủ
- Môi trường
- Ứng dụng phân tích thống kê và công nghệ GIS xác định và khoanh vùng đồng nhất số liệu mưa năm vùng đông bằng sông Cửu Long
Xem mẫu
- The fourth Scientific Conference - SEMREGG 2018
ỨNG DỤNG PHÂN TÍCH THỐNG KÊ VÀ CÔNG NGHỆ GIS
XÁC ĐỊNH VÀ KHOANH VÙNG ĐỒNG NHẤT SỐ LIỆU MƯA
NĂM VÙNG ĐÔNG BẰNG SÔNG CỬU LONG
Phạm Linh Chi1, Phạm Thị Bích Thục2
1
Khoa Khí tượng - Thủy văn, Trường Đại học Tài nguyên và Môi trường TP. HCM
2
Phòng Tài nguyên nước, Viện Địa lý tài nguyên TP. HCM
Email: linhchi2111@gmail.com
TÓM TẮT
Bài báo sử dụng phương pháp phân tích thống kê với kĩ thuật kiểm định Phương sai theo 1 dấu
hiệu [1] cùng sự trợ giúp của hệ thống thông tin địa lý (GIS) trong việc xác định và đánh giá tính
đồng nhất theo không và thời gian của dữ liệu mưa khu vực Đồng bằng sông Cửu Long.
Theo đó, dữ liệu mưa được chọn để nghiên cứu là từ năm 1999 - 2015. Kết quả cho thấy, dữ
liệu yếu tố mưa phù hợp với thực tế khách quan, các khu vực mưa xác định bằng phân tích thống kê
tương đối trùng khớp với với quy luật phân bố mưa do hoạt động của hoàn lưu gió mùa Tây Nam ở
vùng Đồng bằng sông Cửu Long; đồng thời loại bỏ được sai số trong quá trình quan trắc.
Từ khóa: Phân tích thống kê, GIS, vùng đồng nhất, số liệu mưa năm, Đồng bằng sông Cửu Long.
1. MỞ ĐẦU
Mưa là yếu tố có vai trò rất to lớn đối với sản xuất và đời sống và đây là yếu tố vốn biến động
nên mạng lưới quan trắc yếu tố mưa được chú trọng phát triển và còn phát triển dày hơn trong
tương lai, trong đó có khu vực ĐBSCL, một trong những đồng bằng lớn và phì nhiêu của Việt Nam,
khu vực Đông Nam Á và trên thế giới [4]. Với khối lượng dữ liệu đồ sộ việc đánh giá dữ liệu của
yếu tố mưa là công tác quan trọng nhằm chuẩn hóa dữ liệu theo không và thời gian tránh các trường
hợp sai số trong nghiên cứu và tính toán.
Có nhiều nguyên nhân, cả tự nhiên và nhân tạo làm cho tính đồng nhất của chuỗi dữ liệu mưa
bị hạn chế. Tuy nhiên khi phân tích các nhân tố hình thành mưa để chỉ ra sự đồng nhất là chưa đủ,
vì chỉ mới là định tính. Hợp lí hơn cần sử dụng phương pháp thống kê, nó cho phép đánh giá tính
đồng nhất của các chuỗi quan trắc mưa trong dạng định lượng. Phương pháp thống kê còn cho phép
kiểm định tính đồng nhất của chuỗi dữ liệu mưa theo không gian khi cần kết hợp chúng trong một
khu vực địa lí đồng nhất [2].
Bên cạnh đó, kết hợp hệ thống thông tin địa lý GIS để kiểm tra và phân vùng lại kết quả của
phương pháp phân tích thống kê bằng kỹ thuật kiểm định phương sai, một cách trực quan theo
không gian là phương án thích hợp để tạo ra nguồn dữ liệu tin cậy làm đầu vào phục vụ các yêu cầu
tính toán liên quan đến tài nguyên nước mưa cho khu vực Đồng bằng sông Cửu Long.
2. KHU VỰC NGHIÊN CỨU
Khu vực khảo sát và nghiên cứu được chọn là 102 trạm đo mưa thuộc 13 tỉnh thành phố vùng
Đồng bằng sông Cửu Long (Long An, Tiền Giang, Bến Tre, Vĩnh Long, Trà Vinh, Cần Thơ, Sóc
Trăng, Bạc Liêu, Cà Mau, Kiên Giang, An Giang, Đồng Tháp, Hậu Giang). Trong đó có 58 trạm đo
330
- Hội nghị Khoa học Công nghệ lần thứ 4 - SEMREGG 2018
mưa nhân dân (nd), 27 trạm Thủy văn (tv) và 17 trạm Khí tượng (kt) được trình bày ở Bảng 1 [5].
Khu vực này mang những đặc điểm chung của khí hậu đồng bằng Nam Bộ, có chế độ khí hậu gió
mùa cận xích đạo với nền nhiệt cao đều quanh năm, lượng mưa lớn phân hoá theo mùa. Một năm có
hai mùa: Mùa mưa bắt đầu từ tháng 5, kết thúc vào tháng 11; Mùa khô bắt đầu từ tháng 12, kết thúc
vào tháng 4 năm sau. Ngoài ra còn chịu ảnh hưởng của chế độ khí hậu nhiệt đới gió mùa và mang
tính đặc thù của vùng đồng bằng ven biển [4].
Bảng 1.Thống kê các trạm đo mưa và thời gian có số liệu tại các trạm đo mưa ở ĐBSCL.
STT Tỉnh Trạm Năm Loại STT Tỉnh Trạm Năm Loại
1 Sông Đốc 1981-2016 tv 54 Bạc Liêu NT Đông Hải 1990-2016 nd
2 Năm Căn 1960-2016 tv 55 Cần Thơ 1985-2016 kt
3 Cà Mau 1958-2016 kt 56 Rạch Gòi 1988-2016 nd
Cần Thơ
4 Cái Nước 1985-2016 nd 57 Ô Môn 1989-2016 nd
5 U Minh 1984-2016 nd 58 Thốt Nốt 1999-2016 nd
6 Cà Mau NT U Minh 1981-2016 nd 59 Kế Sách 1982-2016 nd
7 Trần Văn Thời 1982-2016 nd 60 Long Phú 1992-2016 nd
8 Thới Bình 1979-2016 nd 61 Mỹ Tú 1992-2016 nd
9 Viễn An Đông 1989-2016 nd 62 Vĩnh Châu 1995-2016 nd
Sóc Trăng
10 Phú Tân 1987-2016 nd 63 Trần Đề 1989-2016 tv
11 Đầm Dơi 1984-2016 nd 64 Phụng Hiệp 1977-2016 tv
12 Chợ Lách 1979-2016 tv 65 Đại Ngãi 1977-2016 tv
13 Bình Đại 1978-2016 tv 66 Sóc Trăng 1974-2016 kt
14 Bến Trại 1979-2016 tv 67 Mỹ Thuận 1978-2016 tv
15 Ba Tri 1978-2016 kt 68 Tam Bình 1989-2016 nd
Bến Tre Vĩnh Long
16 Giồng Trôm 1979-2016 nd 69 Trà Ôn 1990-2016 nd
17 Huơng Mỹ 1979-2016 nd 70 Vĩnh Long 1992-2016 kt
18 Mỏ Cày 1979-2016 nd 71 Tân Châu 1915-2016 tv
19 Bến Tre 1912-2016 kt 72 Châu Đốc 1911-2016 kt
20 Tân An 1973-2016 kt 73 Long Xuyên 1913-2016 tv
21 Kiến Bình 1978-2016 tv 74 Chợ Mới 1915-2016 tv
22 Mộc Hóa 1959-2016 kt 75 Vàm Nao 1980-2016 tv
23 Tuyên Nhơn 1981-2016 tv 76 An Giang Xuân Tô 1992-2016 tv
24 Long An Bến Lức 1978-2016 tv 77 Tri Tôn 1930-2016 tv
25 Cần Đước 1978-2016 nd 78 Hội An 1984-2016 nd
26 Duc Hoa 1981-2016 nd 79 Núi Sập 1980-2016 nd
27 Tân Trụ 1978-2016 nd 80 Vĩnh T Trung 1979-2016 nd
28 Vĩnh Hưng 1984-2016 nd 81 Thới Sơn 1979-2016 nd
331
- The fourth Scientific Conference - SEMREGG 2018
STT Tỉnh Trạm Năm Loại STT Tỉnh Trạm Năm Loại
29 Hậu Giang Vị Thanh 1977-2016 kt 82 Cao Lãnh 1978-2016 kt
30 Mỹ Tho 1910-2016 kt 83 Trường Xuân 1984-2016 tv
31 Hòa Bình 1978-2016 tv 84 Châu Thành 1977-2016 nd
32 Vàm Kênh 1984-2016 tv 85 Đồng Tháp Hồng Ngự 1985-2016 nd
33 Long Định 1957-2016 tv 86 Mỹ Thọ 1988-2016 nd
34 Cai Lậy 1976-2016 tv 87 Sa Đéc 1910-2016 nd
35 Cái Bè 1984-2016 nd 88 Thanh Bình 1984-2016 nd
36 Tiền Giang Chợ Gạo 1978-2016 nd 89 Lai Vung 1977-2016 nd
37 Châu Thành 1978-2016 nd 90 Rạch Giá 1910-2016 kt
38 Gò Công Đông 1910-2016 nd 91 Xẻo Rô 1984-2016 tv
39 An Hữu 1993-2016 nd 92 Phú Quốc 1957-2016 kt
40 Hậu Mỹ Bắc 1978-2016 nd 93 An Biên 1978-2016 nd
41 Phú Mỹ 1991-2016 nd 94 Gò Quao 1978-2016 nd
42 Mỹ Phước 1978-2016 nd 95 Kiên Giang Giồng Riềng 1978-2016 nd
43 Trà Vinh 1910-2016 tv 96 Hà Tiên 1911-2016 nd
44 Càng Long 1978-2016 kt 97 Kiên Lương 1962-2016 nd
45 Trà Vinh Bến Giá 1989-2016 nd 98 Hòn Đất (Tri Tôn) 1978-2015 nd
46 Tiểu Cần 1979-2016 nd 99 Vĩnh Hòa Hưng 1981-2016 nd
47 Trà Cú 1977-2016 nd 100 Vĩnh Thuận 1978-2016 nd
48 Phước Long 1978-2016 tv 101 An Minh 1984-2016 nd
49 Gành Hào 1978-2016 tv 102 Thổ Chu 1995-2016 kt
50 Bạc Liêu 1984-2016 kt
Bạc Liêu
51 Giá Rai 1984-2016 nd
52 Ngăn Dừa 1987-2016 nd
53 Long Điền Tân 1992-2016 nd
3. DỮ LIỆU VÀ PHƢƠNG PHÁP NGHIÊN CỨU
3.1. Dữ liệu nghiên cứu
Dữ liệu nghiên cứu trong báo cáo là số liệu mưa bình quân tháng tại các trạm đo mưa do Đài
khí tượng thủy văn Nam Bộ cung cấp. Thời gian có số liệu tại các trạm được trình bày ở Bảng 1.
Các điểm thu kết quả quan trắc được biểu diễn qua bản đồ Hình 1:
332
- Hội nghị Khoa học Công nghệ lần thứ 4 - SEMREGG 2018
Hình 1. Vị trí các điểm thu kết quả quan trắc mưa.
3.2. Phƣơng pháp nghiên cứu
3.2.1. Phương pháp Modified Z - Scores [3]
Sử dụng phương pháp Modified Z - Scores [3] để phát hiện những giá trị đo đạc bất thường
(quá lớn hoặc quá nhỏ) trong chuỗi dữ liệu thô.
Các bước thực hiện:
B1: Tìm trung vị của độ lệch tuyệt đối (MAD)
MAD = median {|xi − ̅ |}, ̅ là trung bình của chuỗi số
B2: Tính độ khác biệt giữa các biến số:
̅
Mi = 0,6745
B3: Nếu | Mi | > 3,5 thì xi là điểm bất thường.
3.2.2. Phương pháp thử dần
Tiến hành đánh giá tính đồng nhất cho các trạm trong 1 tỉnh, sau đó đánh giá tính đồng nhất
của chuỗi số liệu của các tỉnh lân cận dựa vào giá trị bình quân của các giá trị bình quân mưa nhiều
năm của các trạm (Xtbtb).
3.2.3. Phương pháp phân tích phương sai theo 1 dấu hiệu [1]
3.2.3.1. Một số khái niệm liên quan
a. Giả thiết không (Null Hypothesis - Ho)
Giả thiết Ho là giả thiết ban đầu đưa ra để kiểm định. Thường giả thiết thiên về sự công nhận.
333
- The fourth Scientific Conference - SEMREGG 2018
b. Mức ý nghĩa ( )
Mức ý nghĩa là xác suất khi loại bỏ không chính xác giả thiết Ho, hay còn gọi là xác suất sai
lầm loại 1. Ngược lại với mức ý nghĩa là mức tin cậy: = 1 - Giá trị càng nhỏ thì mức tin
cậy càng lớn.
c. Miền tới hạn - Biên tới hạn
Miền tới hạn: Là miền tập hợp các giá trị xác định theo chỉ tiêu kiểm định và mức ý nghĩa, nếu
giá trị tính toán rơi vào miền này thì giả thiết Ho bị bác bỏ.
Biên tới hạn (Fth): Là ngưỡng giá trị cho phép của Ftt để chấp nhận giả thiết Ho.
3.2.3.2. Quy trình phân tích
a. Quy trình phân tích
Chọn chuỗi dữ liệu mưa năm từ năm 1999 - 2015 của các trạm đo mưa ở ĐBSCL làm chuỗi dữ
liệu nghiên cứu, các bước phân tích kiểm định tính đồng nhất của chuỗi dữ liệu được tiến hành theo
từng bước (B) sau:
- B1: Xác lập giả thiết Ho
Chọn giá trị trung bình (Xtbtb) của các giá trị trung bình mưa (Xtb) các trạm từ năm 1999-
2015 làm giả thiết là Ho, giả thiết xu thế hội tụ của chuỗi số tiến gần về Xtbtb, khẳng định rằng
không có sự khác biệt giữa các giá trị Xtb với giá trị Xtbtb.
- B2: Chọn mức ý nghĩa ờng chọn 1, 2, 5 và 10 %) [2]
Chọn 0,05 = 5 %. Mức ý nghĩa này cho độ tin cậy là 95 %, có nghĩa là đang chấp nhận sai
sót 5 % khi loại bỏ không chính xác giả thiết Ho trường hợp Ho đúng. Ngoài ra, mức ý nghĩa còn
cho thấy rằng việc chấp nhận có 5 % số liệu Xtb trong chuỗi có sự sai khác với giả thiết Ho (Xtbtb).
- B3: Xác định miền tới hạn và biên tới hạn dựa vào dạng phân bố của chỉ tiêu và mức ý
nghĩa
Sử dụng bảng tra Fisher [2] và mức ý nghĩa đã chọn để xác định Fth.
- B4: Tính chỉ tiêu thống kê theo tài liệu quan trắc (Ftt) [1]
𝒏 𝒌 ∑𝒊𝒊 𝒌 ̅ ̅ 𝟐
𝟏 𝒏𝒊 𝑿𝒊 𝑿
F = 𝒋 𝒏𝒊
tt 𝒌 𝟏 ∑𝒊𝒊 𝒌𝟏 ∑𝒋 𝟏 𝑿𝒊𝒋 𝑿 ̅𝒊 𝟐
n-k, k-1: các bậc tự do
k: tổng số lớp, lưu vực
ni: số năm quan trắc trong mỗi lớp i
∑ ̅ ̅ : Tổng bình phương giữa các lớp
∑ ∑ ̅ : Tổng bình phương nội bộ các lớp
- B5: So sánh Ftt với biên tới hạn (Fth) và kết luận chấp nhận hay loại bỏ giả thiết Ho
Nếu Ftt < Fth thì chấp nhận giả thiết Ho và ngược lại bác bỏ giả thiết Ho.
b. Quy trình đánh giá tính đồng nhất của chuỗi số liệu mưa năm (1999 - 2015) của một số trạm
ở ĐBSCL (thuộc nhóm đồng nhất thứ 4)
(Các trạm còn lại được tiến hành phân tích tương tự và kết quả được thống kê ở mục 4.1)
334
- Hội nghị Khoa học Công nghệ lần thứ 4 - SEMREGG 2018
Bảng 2. Chuỗi số liệu mưa năm (1999 - 2015) của một số trạm ở ĐBSCL
(thuộc nhóm đồng nhất thứ 4).
Kiên Giang Cà Mau
j i 1 2 3 4 5 6 7 8 9 10 11
NT Trần Viễn
Trạm Xẻo An An Sông Năm Cà U Thới
STT U Văn An
Năm Rô Minh Biên Đốc Căn Mau Minh Bình
Minh Thời Đông
1 1999 3074 3177 3344 2260 2964 3549 3067 3258 3306 2837 2987
2 2000 2941 2274 2223 2499 2880 2630 3006 2871 2520 2612 2933
3 2001 2242 2031 3014 2372 2637 2393 2471 2032 1542 2442 2860
4 2002 1787 2233 1950 2221 2215 2303 2401 2041 2054 2335 2331
5 2003 2377 2030 2280 2026 2377 2488 2420 2450 2214 2117 2258
6 2004 1743 2444 2132 1935 1781 1932 2535 2120 2018 2285 1653
7 2005 1961 2377 1638 2047 2769 2204 2060 2447 2053 2171 2093
8 2006 2528 3097 1475 2389 2213 2345 2533 2282 2375 2115 1707
9 2007 2768 2997 2634 2508 2613 2611 3291 2929 2938 2871 3385
10 2008 2181 2603 2376 3064 2904 2602 2740 2518 2797 2603 2417
11 2009 2312 2466 2294 2446 2314 2244 2456 2485 2168 2406 1844
12 2010 2236 2351 1614 2422 2811 1987 2553 2515 2192 2335 2136
13 2011 2204 2101 2057 2186 2324 2446 2434 2157 2317 2086 1800
14 2012 2154 2499 2321 2239 2243 2154 2768 2862 2119 2387 1881
15 2013 2621 2347 3113 2403 2250 1941 2410 2231 2114 2466 2060
16 2014 2498 2020 2088 2389 1935 2066 1883 3001 2400 2017 2270
17 2015 2146 2189 1399 2097 2228 2297 1927 2251 2291 2058 2114
tb 2340 2426 2233 2324 2439 2364 2527 2497 2319 2361 2278
tb.tb 2373
B1: Gọi Ho là giá trị bình quân mưa nhiều năm (1999 - 2015) của 11 trạm trong Bảng 2 Xtb.tb
= 2373.
B2: Chọn mức ý nghĩa = 0,05.
B3: Xác định Fth dựa vào bảng tra Fisher và mức ý nghĩa = 0,05. Thu được: Fth = 3,97.
B4: Xác định Ftt dựa vào số liệu quan trắc:
∑𝒊𝒊 𝒌
𝟏 𝒏𝒊
̅𝒊
𝑿 ̅
𝑿 𝟐
= 1387489
- Đầu tiên, tính Tổng bình phương giữa các lớp:
𝒊 𝒌 ∑𝒋 𝒏𝒊 ̅𝒊 𝟐
- Sau đó, xác định Tổng bình phương nội bộ các lớp: ∑𝒊 𝟏 𝒋 𝟏 𝑿𝒊𝒋 𝑿 = 26569863
335
- The fourth Scientific Conference - SEMREGG 2018
∑ ̅ ̅
- Cuối cùng, thu được: Ftt = ̅
= 0,92
∑ ∑
B5: Nhận thấy Ftt < Fth nên giả thiết Ho được chấp nhận, chuỗi số liệu đồng nhất.
3.2.4. Phương pháp GIS (Geographic Information S stem)
3.2.4.1. Xây dựng dữ liệu không gian
Sử dụng phần mềm Mapinfo xây dựng:
* Nhóm lớp nền chung: Lớp hành chính, lớp vị trí (các trạm đo mưa), lớp thủy văn.
* Nhóm chuyên đề: Lớp đường đồng mức lượng mưa bình quân năm của các trạm đo mưa
trong khu vực nghiên cứu.
3.2.4.2. Xây dựng dữ liệu thuộc tính
Với mỗi lớp dữ liệu không gian trong Mapinfo sẽ có một bảng thuộc tính đi kèm. Từ đó tiến
hành xây dựng dữ liệu thuộc tính cho các trạm đo mưa, phục vụ cho công việc vẽ đường đồng mức
sau này.
4. KẾT QUẢ VÀ THẢO LUẬN
4.1. Kết quả đánh giá tính đồng nhất và phân vùng đồng nhất
Sau khi kiểm định tính đồng nhất chuỗi dữ liệu mưa bình quân nhiều năm các trạm tại ĐBSCL
kết quả thu được 6 nhóm vùng đồng nhất, các bước thực hiện phân tích dữ liệu theo phương pháp
Phân tích phương sai theo 1 dấu hiệu được tóm tắt và thể hiện trong 6 bảng tương ứng với 6 nhóm
dưới đây:
Bảng 1. Nhóm đồng nhất số liệu mưa thứ 1. STT Tên trạm Xtb
STT Tên trạm Xtb 19 Ba Tri 1561
1 Cần Thơ 1548 20 Hương Mỹ 1637
2 Rạch Gòi 1678 21 Bến Tre 1529
3 Ô Môn 1559 22 Trà Vinh 1455
4 Thốt Nốt 1457 23 Càng Long 1646
5 Mỹ Thuận 1500 24 Bến Giá 1631
6 Tam Bình 1480 25 Tiểu Cần 1495
7 Trà Ôn 1767 26 Trà Cú 1625
8 Vĩnh Long 1499 27 Hòa Bình 1448
9 Kế Sách 1502 28 Vàm Kênh 1511
10 Long Phú 1691 29 Long Định 1514
11 Mỹ Tú 1634 30 Cai Lậy 1457
12 Vĩnh Châu 1639 31 Gò Công Đông 1498
13 Trần Đề 1596 32 Mỹ Phước 1411
14 Phụng Hiệp 1732 33 Hậu Mỹ Bắc 1686
15 Đại Ngãi 1771 34 Tân An 1561
16 Chợ Lách 1477 35 Kiến Bình 1502
17 Bình Đại 1494 36 Mộc Hóa 1651
18 Bến Trai 1547 37 Tuyên Nhơn 1466
38 Bến Lức 1669
336
- Hội nghị Khoa học Công nghệ lần thứ 4 - SEMREGG 2018
STT Tên trạm Xtb Bảng 3. Nhóm đồng nhất số liệu mưa thứ 3.
39 Cần Đước 1469 STT Tên trạm Xtb
40 Đức Hoà 1561 1 Rạch Giá 2194
41 Vĩnh Hưng 1466 2 Gò Quao 2040
42 Cái Bè 1447 3 Hà Tiên 2081
43 Chợ Gạo 1513 4 Kiên Lương 2178
5 Vĩnh Hòa Hưng 1965
44 Phú Mỹ 1527
6 Vĩnh Thuận 2117
45 Mỹ Tho 1523
7 Giồng Riêng 1918
B1 Ho 1560
8 Hòn Đất (Tri Tôn) 1915
B2 5% 9 Cái Nước 2220
B3 Fth 1.49 10 Đầm Dơi 1889
B4 Ftt 0.9807 11 Vị Thanh 1971
Ftt < Fth 12 Phước Long 2073
B5 Kết luận
Đồng nhất 13 Gành Hào 1948
14 Bạc Liêu 2067
Bảng 2. Nhóm đồng nhất số liệu mưa thứ 2.
15 Giá Rai 2070
STT Tên trạm Xtb 16 Ngan Dừa 1941
1 Tân châu 1301 17 Sóc Trăng 1915
2 Châu đốc 1310 B1 Ho 2030
3 Long xuyên 1537 B2 5%
4 Chợ Mới 1426 B3 Fth 2.03
5 Vàm Nao 1403 B4 Ftt 1.64
6 Xuân Tô 1427 Ftt < Fth
B5 Kết luận
7 Tri Tôn 1291 Đồng nhất
8 Hội An 1346 Bảng 4. Nhóm đồng nhất số liệu mưa thứ 4.
9 Núi Sập 1395 STT Tên trạm Xtb
10 Vĩnh T Trung 1317 1 Xẻo Rô 2340
11 Thới Sơn 1443 2 An Minh 2426
12 Cao Lãnh 1554 3 An Biên 2233
13 Trường Xuân 1506 4 Sông Đốc 2324
14 Châu Thành 1310 5 Năm Căn 2439
15 Hồng Ngự 1370 6 Cà Mau 2364
16 Mỹ Thọ 1509 7 U Minh 2527
17 Sa Đéc 1486 8 NT U Minh 2497
18 Thanh Bình 1391 9 Trần Văn Thời 2319
19 Lai Vung 1413 10 Thới Bình 2361
B1 Ho 1407 11 Viễn An Đông 2278
B2 5% B1 Ho 2373
B3 Fth 1.94 B2 5%
B4 Ftt 1.40 B3 Fth 3.97
Ftt < Fth B4 Ftt 0.92
B5 Kết luận Ftt < Fth
Đồng nhất B5 Kết luận
Đồng nhất
337
- The fourth Scientific Conference - SEMREGG 2018
Bảng 5. Nhóm đồng nhất số liệu mưa thứ 5. Bảng 6. Nhóm đồng nhất số liệu mưa thứ 6.
STT Tên trạm Xtb STT Tên trạm Xtb
1 NT.Đông Hải 1790 1 Tân Trụ 1311
2 Châu Thành 1345
2 Long Điền Tân 1768
3 An Hữu 1273
B1 Ho 1779 4 Mỏ Cày 1317
B2 5% B1 Ho 1310
B3 Fth 250.35 B2 5%
B3 Fth 19.47
B4 Ftt 0.05
B4 Ftt 0.37
Ftt < Fth Ftt < Fth
B5 Kết luận B5 Kết luận
Đồng nhất Đồng nhất
Trong quá trình kiểm định, trong chuỗi dữ liệu mưa bình quân nhiều năm (1999 - 2015) có
xuất hiện một số giá trị bất thường nên cần tiến hành loại bỏ các giá trị đó ra khỏi chuỗi để đảm bảo
tính đồng nhất cho chuỗi dữ liệu. Sử dụng phương pháp Modified Z - Scores tìm được các trạm cần
được loại bỏ ra khỏi chuỗi kiểm định gồm: Giồng Trôm, Phú Tân.
+ Giồng Trôm: Trạm Giồng Trôm thuộc tỉnh Bến Tre, có lượng mưa bình quân nhiều năm
(1999 - 2015) là Xtb = 1873 trong khi các trạm lân cận Xtb chỉ dao động từ 1400 đến trên 1600. Bởi
vì sự sai khác quá lớn của lượng mưa bình quân nhiều năm của trạm Giồng Trôm so với các trạm
lân cận nên cần loại bỏ trạm Giồng Trôm để đảm bảo tính đồng nhất của chuỗi dữ liệu.
Chuỗi dữ liệu tính toán gồm lượng mưa bình quân nhiều năm (1999 - 2015) của 25 trạm lân
cận trạm Phú Tân, bao gồm: Giồng Trôm (1873 mm), Chợ Lách (1477 mm), Bình Đại (1494 mm),
Bến Trại (1547 mm), Ba Tri (1561 mm), Hương Mỹ (1637 mm), Bến Tre (1529 mm), Hòa Bình
(1448 mm) vàm Kênh (1511 mm), Long Định (1514 mm), Cai Lậy (1457 mm), Gò Công Đông
(1498 mm), Mỹ Phước (1411 mm), Hậu Mỹ Bắc (1686 mm), Cái Bè (1447 mm), Chợ Gạo (1513
mm), Phú Mỹ (1527 mm), Tân An (1561 mm), Kiến Bình (1502 mm), Mộc Hóa (1651 mm), Tuyên
Nhơn (1466 mm), Bến Lức (1669 mm), Cần Đước (1469 mm), Đức Hòa (1561 mm), Vĩnh Hưng
(1466 mm).
Kết quả tính toán theo phương pháp Modified Z - Scores được trình bày theo các bước
như sau:
B1: Tìm trung vị của độ lệch tuyệt đối (MAD)
MAD = median {|xi − ̅ |} = 62 (mm), ̅ = 1539 (mm) là trung bình của chuỗi số.
B2: Tính độ khác biệt giữa các biến số:
̅
Mi = 0,6745
B3: Nhận thấy tính toán cho trạm Giồng Trôm có | Mi | = 3,51 > 3,5, kết luận rằng giá trị lượng
mưa bình quân nhiều năm tại trạm Giồng Trôm là giá trị bất thường cần loại bỏ khỏi chuỗi
tính toán.
+ Phú Tân: Trạm Phú Tân là trạm nằm ở tỉnh Cà Mau, có lượng mưa bình quân nhiều năm
(1999 - 2015) là Xtb = 1535 trong khi các trạm lân cận có Xtb>1800. Giá trị Xtb của trạm Phú Tân
quá nhỏ so với toàn bộ Xtb của các trạm lân cận nó, cho nên cần tiến hành loại bỏ trạm Phú Tân ra
khỏi chuỗi dữ liệu để đảm bảo tính đồng nhất cho chuỗi.
338
- Hội nghị Khoa học Công nghệ lần thứ 4 - SEMREGG 2018
Chuỗi dữ liệu tính toán gồm lượng mưa bình quân nhiều năm (1999 - 2015) của 18 trạm lân
cận trạm Phú Tân, bao gồm: Rạch Giá (2194 mm), Gò Quao (2040 mm), Hà Tiên (2081 mm), Kiên
Lương (2178 mm), Vĩnh Hòa Hưng (1965 mm), Vĩnh Thuận (2117 mm), Giồng Riêng (1918 mm),
Hòn Đất (Tri Tôn) (1915 mm), Cái Nước (2220 mm), Đầm Dơi (1889 mm), Phú Tân (1536mm), Vị
Thanh (1971 mm), Phước Long (2073 mm), Gành Hào (1948 mm), Bạc Liêu (2067 mm), Giá Rai
(2070 mm), Ngan Dừa (1941 mm), Sóc Trăng (1915 mm). Kết quả tính toán theo phương pháp
Modified Z - Scores được trình bày theo các bước như sau:
B1: Tìm trung vị của độ lệch tuyệt đối (MAD)
MAD = median {|xi − ̅ |} = 81 (mm), ̅ = 2002 (mm) là trung bình của chuỗi số.
B2: Tính độ khác biệt giữa các biến số:
̅
Mi = 0.6745
B3: Nhận thấy tính toán cho trạm Phú Tân có| Mi | = 3,71 > 3,5, kết luận rằng giá trị lượng
mưa bình quân nhiều năm tại trạm Phú Tân là giá trị bất thường cần loại bỏ khỏi chuỗi tính toán.
- Ngoài ra, đối với Thổ Chu, Phú Quốc là 2 trạm đảo có đặc điểm mưa khác với các trạm trong
đất liền nên không tiến hành phân vùng chung với các trạm đất liền.
4.2. Kết quả sử dụng phần mềm Mapinfo thể hiện vùng đồng nhất trên bản đồ
Nhằm kiểm tra lại tính chính xác của kết quả kiểm định bằng phương pháp thống kê, tiến hành
khoanh vùng các nhóm điểm đồng nhất với nhau trên Mapinfo và thành lập bản đồ đường đồng mức
lượng mưa bình quân nhiều năm các trạm đo mưa tại ĐBSCL. Các kết quả trên Mapinfo được thể
hiện trong Hình 2. và Hình 3.
Hình 2. Khoanh vùng đồng nhất lượng mưa bình quân nhiều năm các trạm ở ĐBSCL
(1999 - 2015).
339
- The fourth Scientific Conference - SEMREGG 2018
Hình 3. Biểu đồ đường đồng mức lượng mưa bình quân nhiều năm các trạm ở ĐBSCL
(1999 - 2015).
Hình 2 là hình thể hiện 6 nhóm vùng đồng nhất theo kết quả kiểm định. Các nhóm đồng nhất
có Xtbtb tăng dần theo hướng từ Biển Tây sang Biển Đông (nhóm 4 - nhóm 3 - nhóm 5 - nhóm 2 -
nhóm 1 - nhóm 6).
Hình 3 là Biểu đồ đường đồng mức lượng mưa bình quân nhiều năm các trạm ở ĐBSCL (1999-
2015) cho thấy rằng lượng mưa ở ĐBSCL tăng dần theo không gian hướng từ Biển Tây sang Biển
Đông.
5. KẾT LUẬN
Kết quả kiểm định tính đồng nhất bằng phương pháp phân tích phương sai theo 1 dấu hiệu
phân chia các trạm đo mưa ở ĐBSCL thành 6 vùng đồng nhất về số liệu mưa bình quân nhiều năm
(1999-2015).
Bằng việc sử dụng phương pháp Modified Z - Scores đã phát hiện ra có 2 trạm không phù hợp
và cần được loại bỏ ra khỏi chuỗi kiểm định là trạm Giồng Trôm và Phú Tân.
Hiệu quả của việc sử dụng GIS xây dựng Biểu đồ đường đồng mức lượng mưa bình quân
nhiều năm các trạm ở ĐBSCL (1999-2015), cho hình ảnh trực quan về quy luật phân bố mưa tại
ĐBSCL.
Đối chiếu kết quả kiểm định tính đồng nhất và biểu đồ đường đồng mức lượng mưa bình quân
ĐBSCL khá trùng khớp, thấy rằng lượng mưa ở ĐBSCL chia làm 3 khu vực rõ rệt và giảm dần theo
không gian hướng từ Biển Tây sang Biển Đông đúng với điều kiện hoạt động của gió mùa Tây
Nam, nguyên nhân chính hình thành mưa ở khu vực này.
340
- Hội nghị Khoa học Công nghệ lần thứ 4 - SEMREGG 2018
Kết quả đã đáp ứng được yêu cầu chuẩn hóa dữ liệu theo không và thời gian nhằm tránh các
trường hợp sai số trong nghiên cứu và tính toán liên quan đến dữ liệu mưa ở ĐBSCL về sau.
TÀI LIỆU THAM KHẢO
1. Ngô Đình Tuấn - Tập Bài giảng Phân tích thống kê trong thủy văn. Nxb. Nông nghiệp, 1998.
2. Nguyễn Hữu Khải - Phân tích thống kê trong thủy văn. Giáo trình ĐHKHTN, 2008.
3. How to Detect and Handle Outlier - Boris Iglewicz, David Caster Hoaglin. ASQC Quality
Press, 1993.
4. Web Hệ thống thông tin địa lý - http://mgis.vn.
5. Đài Khí tượng - thủy văn Khu vực Nam Bộ - Số liệu khí tượng.
APPLY STATISTICAL ANALYSIS AND GIS TO IDENTIFY DATA CONSOLIDATION
OF RAINFALL IN MEKONG DELTA
Pham Linh Chi1, Pham Thi Bich Thuc2
1
Department Hydro-Meteorology, Ho Chi Minh City University of Natural resources
and Environment
2
Department Water Resources, Ho Chi Minh Institute of Resources Geography
Email:linhchi2111@gmail.com
ABSTRACT
The paper introduced one-way analysis of variance, statistical methods of analysis and
geographic information system (GIS) to identify and delineate the data consolidation of the average
yearly rainfall data for many years in Mekong Delta. According to the rain data were collected in
years 1999 to 2015. The results achieved using statistical methods of analysis and GIS accord with
objective reality, with 6 areas of rainfall data consolidated and have a good agreement with Southest
monsoon activity in Mekong Delta.
Keywords: Statistical methods of analysis, uniform area, GIS, rainfall data, Mekong Delta.
341
nguon tai.lieu . vn