Xem mẫu

  1. CHẨN ĐOÁN VÀ DỰ BÁO THỐNG KÊ CÁC QUÁ TRÌNH HẢI DƯƠNG HỌC Smirnov N. P., Vainovsky P. A., Titov Iu. E. Biêndịch: Phạm Văn Huấn NXB Đại học Quốc gia Hà Nội - Hà Nội - 2005 Từ khóa: Quá trình hải dương học, chẩn đoán, dự báo, thống kê, phương pháp hồi quy, thành phần chính, nhân tố, phương pháp phân loại, cấu trúc, biến động, ma trận số liệu, nhận biết phân biệt, khai triển trường, mô hình tuyến tính, đa chiều, phân tích quan hệ, dự báo tổ hợp. Tài liệu trong Thư viện điện tử Trường Đại học Khoa học Tự nhiên có thể được sử dụng cho mục đích học tập và nghiên cứu cá nhân. Nghiêm cấm mọi hình thức sao chép, in ấn phục vụ các mục đích khác nếu không được sự chấp thuận của nhà xuất bản và tác giả.
  2. Н. П. СМИРНОВ, П. А. ВАЙНОВСКИЙ, Ю. Э. ТИТОВ SMIRNOV N. P., VAINOVSKY P. A., TITOV Iu. E. СТАТИСТИЧЕСКИЙ ДИАГНОЗ CHẨN ĐOÁN VÀ DỰ BÁO THỐNG KÊ И ПРОГНОЗ CÁC QUÁ TRÌNH HẢI DƯƠNG HỌC ОКЕАНОЛОГИЧЕСКИХ ПРОЦЕССОВ BIÊN DỊCH : PHẠM VĂN HUẤN Санкт-Петербург NHÀ XUẤT BẢN ĐẠI HỌC QUỐC GIA HÀ NỘI - 2005 ГИДРОМЕТЕОИЗДАТ - 1998
  3. Cuốn sách Chẩn đoán và dự báo thống kê các quá trình hải dương học tổng kết những kinh nghiệm ứng dụng các phương pháp thống kê nhiều biến vào nghiên cứu trường các yếu tố hải dương học diễn ra trong đại dương. Các tác giả giới thiệu tóm tắt về bản chất và ý nghĩa của các phương pháp phân tích thống kê hiện đại, quy trình tính toán thực tế khi áp dụng chúng vào các nhiệm vụ nghiên cứu cụ thể, không đi sâu vào khía cạnh toán học của vấn đề. Do đó cuốn sách sẽ là một tài liệu chỉ dẫn phù hợp cho những người không chuyên toán muốn ứng dụng công cụ thống kê toán học vào công việc nghiên cứu của mình. Đặc biệt, khi diễn đạt những bài toán nghiên cứu và dự báo thống kê các quá trình hải dương, các tác giả luôn chú trọng phương diện phương pháp luận nghiên cứu, cách đặt vấn đề, cách lý giải nội hàm của những kết quả nhận được, nhờ đó giúp chúng ta biết cách ứng dụng công cụ thống kê một cách khéo léo và hiệu quả. Các phương pháp thống kê nhiều biến cho phép người nghiên cứu phân tích toàn diện, đồng thời nhiều quá trình, nhiều đặc trưng hải dương học, từ đó nhận được quan niệm đầy đủ về những gì đang và sẽ diễn ra trong biển và đại dương, hình thành những mô hình về cấu trúc và biến động của quá trình, hiện tượng mà ta quan tâm. Hiện nay ở Việt Nam nguồn dữ liệu về các yếu tố thủy văn, thủy hoá, khí tượng, sinh học biển ngày càng được thu thập thêm, dần dần trở nên đồng bộ, phong phú. Với phương tiện tính toán ngày càng hiện đại, chắc chắn hướng nghiên cứu phân tích thống kê tự động sẽ phát triển và cuốn sách này sẽ hữu ích cho nhiều người nghiên cứu. Người biên dịch 1
  4. MỞ ĐẦU MỤC LỤC Tính đa chiều và ngẫu nhiên trong biến động của các quá trình đại MỞ ĐẦU 2 dương không cho phép người ta ngay tức khắc theo dõi, mô tả định lượng Chương 1 - MÔ TẢ MỐI LIÊN HỆ CỦA CÁC QUÁ TRÌNH 18 1.1. PHÂN TÍCH HỒI QUY ĐA CHIỀU. HỒI QUY TUYẾN TÍNH ĐA CHIỀU và lý giải cơ chế vật lý của chúng một cách đơn trị. Các phương pháp 18 phân tích thống kê sẽ là một công cụ phát hiện và mô tả những mối quan 1.2. PHƯƠNG PHÁP PHÂN TÍCH TƯƠNG QUAN CHUẨN HOÁ 25 hệ tương hỗ phức tạp đó để giải quyết các bài toán chẩn đoán và dự báo Chương 2 - MÔ TẢ CẤU TRÚC CỦA CÁC QUÁ TRÌNH 29 2.1. PHƯƠNG PHÁP THÀNH PHẦN CHÍNH 29 những quá trình đại dương. Độ chính xác và tin cậy của những kết luận 2.2. PHƯƠNG PHÁP PHÂN TÍCH NHÂN TỐ 35 nhận được phụ thuộc rất nhiều vào số lượng và sự đa dạng của thông tin Chương 3 - PHÂN LOẠI CÁC QUÁ TRÌNH 43 ban đầu được đưa vào xử lý. 3.1. PHƯƠNG PHÁP PHÂN LOẠI TỰ ĐỘNG 43 3.2. PHƯƠNG PHÁP PHÂN TÍCH PHÂN BIỆT 51 Thực tế ta thấy toàn bộ cơ sở thông tin được tích luỹ trên ba mặt Chương 4 - NỘI DUNG DỰ BÁO CỦA CÁC PHƯƠNG PHÁP PHÂN TÍCH phẳng: không gian − thời gian X (l , t ) , không gian − dấu hiệu X (l , z ) , THỐNG KÊ ĐA CHIỀU 56 dấu hiệu − thời gian X ( z , t ) ; tập hợp những thông tin này làm thành một 4.1. DỰ BÁO CẤU TRÚC CỦA CÁC QUÁ TRÌNH 56 4.2. DỰ BÁO NHỮNG LỚP TRẠNG THÁI CỦA CÁC QUÁ TRÌNH 59 khối lập phương dữ liệu với các trục: không gian ( l ), thời gian ( t ), các 4.3. KẾT HỢP CÁC MÔ HÌNH DỰ BÁO 61 biến số ( z ) (hình 0.1). Vậy các dữ liệu được sắp xếp trong khối lập 4.4. TÍNH KHẢ BÁO THỐNG KÊ CỦA CÁC QUÁ TRÌNH HẢI DƯƠNG HỌC 63 phương đó như thế nào? Một quan trắc riêng lẻ x về một biến số nào đó, Chương 5 - NHỮNG KẾT QUẢ CHẨN ĐOÁN THỐNG KÊ CÁC QUÁ tại một điểm không gian, vào một thời điểm cho trước, sẽ là một ô duy TRÌNH HẢI DƯƠNG HỌC 67 nhất trong khối lập phương dữ liệu. Một chuỗi gồm N quan trắc 5.1. CHẨN ĐOÁN CÁC TRƯỜNG NHIỆT Ở BẮC ĐẠI TÂY DƯƠNG 68 {x1 , x 2 , ..., x N } sẽ là một vectơ nằm dọc theo trục tương ứng của khối lập 5.2. CHẨN ĐOÁN CẤU TRÚC NƯỚC BIỂN NA UY 77 5.3. CHẨN ĐOÁN CẤU TRÚC CÁC KHỐI NƯỚC Ở BIỂN phương. BELLINSHAUZEN 88 Thí dụ, bản ghi nhiệt độ nước ở một điểm tại những thời điểm Chương 6 - NHỮNG KẾT QUẢ DỰ BÁO THỐNG KÊ CÁC QUÁ TRÌNH HẢI DƯƠNG HỌC 93 t1 , t 2 , ..., t N sẽ cho ta một vectơ quan trắc X(t ) , trong khối lập phương 6.1. DỰ BÁO CÁC TRƯỜNG NHIỆT Ở BẮC ĐẠI TÂY DƯƠNG 94 dữ liệu nó sẽ song song với trục thời gian. Một quan trắc phân bố thẳng 6.2. DỰ BÁO ĐIỀU KIỆN BĂNG BIỂN BAREN 105 đứng của nhiệt độ nước sẽ là một vectơ dữ liệu song song với trục không 6.3. DỰ BÁO PHÂN BỐ KHÔNG GIAN CỦA PHÙ DU SINH VẬT Ở BIỂN NA UY 110 gian: X(l ) . Nếu ta quan trắc liên tiếp theo thời gian về phân bố thẳng KẾT LUẬN 114 đứng của nhiệt độ nước tại một điểm, ta sẽ nhận được một mặt phẳng dữ TÀI LIỆU THAM KHẢO 116 liệu nằm trong khối lập phương song song với mặt phẳng các dấu hiệu: 2
  5. X(t , l ) . phân tích mức độ quan hệ cặp đồng bộ hay bất đồng bộ giữa chúng. Vậy là người ta đã nghiên cứu cấu trúc thống kê của quá trình một cách đầy Còn nếu như đồng thời với nhiệt độ, ta quan trắc nhiều lần các tham số đủ hơn so với phân tích đơn chiều. trạng thái đại dương khác (độ muối, vận tốc dòng chảy, các yếu tố hoá Nhưng chỉ trong các phương pháp phân tích thống kê đa chiều thì học), thì kết quả là ta nhận được khối lập phương dữ liệu phủ đầy tất cả các trục tọa độ đã chọn: X(t , l , z ) . mới thực sự có khả năng khảo sát đồng thời một tập hợp các vectơ quan trắc. Các phương pháp phân tích thống kê đa chiều hướng tới giải quyết Trong các phương pháp phân tích dữ liệu đơn chiều, người ta xét các bài toán phân tích thống kê đối với những ma trận gồm N quan trắc chuỗi quan trắc trong thời gian hoặc trong không gian và nghiên cứu (các đối tượng) về M biến số (các dấu hiệu). Ở đây, những ma trận có được tính chất của sự biến động (tuần hoàn, ngẫu nhiên...), sự đồng nhất thể là những bảng số nhận được bằng cách cắt khối lập phương dữ liệu của các dao động, sự liên hệ của vectơ quan trắc [104, 123, 201]. Khi đó dọc theo một mặt bất kỳ nào đó. Đây có thể là những ma trận quan trắc thực tế ta không xét tới mặt phẳng quan trắc về những tham số khác nhau. trong các mặt phẳng: các biến số − thời gian X( z , t ) , các biến số − không Và mặc dù có những hiệu quả nhất định, các phương pháp thống kê đơn gian X( z, l ) hoặc thời gian − không gian X(t , l ) . Ta có thể đưa trục các chiều không cho phép phân tích một cách đầy đủ cần thiết về quá trình dấu hiệu vào phân tích thì cũng hoàn toàn như vậy, đó là ưu điểm rõ rệt phức tạp đa tham số. của phân tích thống kê đa chiều, nó cho phép khảo sát khối lập phương dữ liệu một cách toàn thể. Những tập phân bố đồng thời của các đặc X(t,l,z) trưng quan trắc được phân tích bằng các phương pháp phân tích các vectơ và các ma trận, với chúng, bằng phép phân tích thống kê đa chiều sẽ đưa ra sự mô tả định lượng về những mối liên hệ tương hỗ ẩn bên trong các tham số ban đầu và phát hiện ra nội hàm của các mô hình chẩn đoán và X(l,z) X(z,t) X(l,t) dự báo các quá trình hải dương đa chiều được nghiên cứu. Khái niệm chẩn đoán Theo từ điển các từ nước ngoài, thì chẩn đoán là quá trình xác định X(l) X(z) X(t) thực chất của bệnh và trạng thái của bệnh nhân trên cơ sở khám xét toàn X(z) X(t) X(l) diện về anh ta. Áp dụng vào hải dương học thực hành, bản chất của thuật ngữ này không có gì đổi khác nhiều lắm. Ta có thể định nghĩa như sau: Hình 0.1. Khối lập phương dữ liệu hải dương học: Các mặt phẳng và vectơ quan trắc hợp phần Chẩn đoán là tuần tự những thủ tục tổng kết, hệ thống hoá và lý giải về sự Các phương pháp phân tích cặp các chuỗi (phân tích tương quan, hồi biến động quan sát thấy của các đặc trưng hải dương nhằm hình thành quy, phổ) nhằm mục đích mô tả thống kê về mối liên hệ tương hỗ của hai một mô hình tin cậy về các quá trình đang diễn ra. vectơ quan trắc trong thời gian hay trong không gian: X1 (t ) , X 2 (t ) ; Chẩn đoán đòi hỏi hai giai đoạn cơ bản: phân tích và tổng hợp. Phân X1 (l ) , X 2 (l ) . Ở đây người ta vừa phân tích từng vectơ riêng biệt, vừa tích, tức tách bạch đối tượng nghiên cứu thành những hợp phần, là giai 3
  6. đoạn nghiên cứu đầu tiên. Giai đoạn này có thể bao gồm nhiều phương sinh. Đó là những tham số đặc trưng cho các trường vật lý, động lực, pháp biến đổi dữ liệu quan trắc và các tính toán để mô tả các hợp phần và năng lượng, ta có thể kể ra rất nhiều. May thay, tất cả những tham số đó những hiện tượng riêng lẻ của các quá trình. Nội dung chính của một liên hệ với những đặc trưng nguyên sinh thông qua những quy luật vật lý phương pháp phân tích bất kỳ − phương pháp vật lý, thực nghiệm, thống đã biết và tạo thành một tập hợp các biến đặc trưng một cách đơn trị cho kê hay số trị − là làm sao phát hiện và mô tả những yếu tố hợp thành các những dạng quá trình hải dương cụ thể. quá trình đang diễn ra. Ý nghĩa của chẩn đoán vật lý còn ở chỗ nó khái quát những biến đổi Tổng hợp là giai đoạn kết thúc của chẩn đoán và hướng tới liên kết đang diễn ra trong đại dương thông qua một hệ thống những thuật ngữ và những bộ phận cấu thành đơn lẻ, hay những tính chất đơn giản nhất đã phạm trù đã biết và chấp nhận trong hải dương học. Đó là những yếu tố phát hiện được, thành một chỉnh thể nào đó. Nguyên tắc cơ bản của sự cân bằng nhiệt (entalpy, các dòng nhiệt), những yếu tố cấu trúc ngang và liên kết này là hình thành một cách lôgic bức tranh hoàn chỉnh về các sự thẳng đứng của nước (các khối nước, front và đới chuyển tiếp, các xoáy kiện đang diễn ra trên cơ sở những quy luật và những mối liên hệ của các nước và các hệ thống hoàn lưu) v.v... Đối với những loại thuật ngữ cụ thể yếu tố đã phát hiện được ở giai đoạn phân tích. Thực chất thì tổng hợp đã có những hệ phương pháp phân tích chuyên biệt. bao gồm nhiều phương pháp trong số các phương pháp phân tích, nhưng Thông thường, hệ phương pháp phân tích vật lý là một tổ hợp gồm chúng được áp dụng với chức năng nội dung và mục tiêu khác − để liên những phương pháp kinh nghiệm phân tích định lượng kết hợp với những kết và hệ thống hoá những hợp phần đã biết. Ngoài ra, tổng hợp gồm cả phương pháp thực tiễn xử lý và mô tả định tính. Có sự liên kết đó là nhờ sự lý giải về hệ thống các quy luật đã thấy được. Lý giải được hiểu là sự kinh nghiệm nhiều năm nghiên cứu thực tế, thường thì không phải là kết giải thích vật lý về những quy luật đã phát hiện, nêu ra cơ chế vật lý quả của những nghiên cứu một cách hệ thống và có định hướng, mà là do chung trong sự xuất hiện và phát triển của các hiện tượng đang diễn ra người ta khái quát những điều đáng quan tâm từ hoạt động thực tiễn. trong đại dương. Thí dụ, phương pháp luận phân tích T , S đối với các khối nước Tác giả công trình này gộp vào khái niệm chẩn đoán toàn bộ những thủ tục biến đổi thông tin hải dương học đa dạng trong quá trình nghiên [23,125] là một thành tựu cơ bản của khoa học, cho phép hiểu và mô tả cứu sự vận hành của hệ thống "đại dương" trong quá khứ hay hiện tại. Vì những quá trình quan trọng nhất hình thành cấu trúc khối nước. Trong khi vậy, có hai loại thủ tục chẩn đoán sau đây với tư cách là những bộ phận đó hệ phương pháp mô tả điều kiện băng và trạng thái mặt biển theo cấu thành của chẩn đoán: chẩn đoán vật lý và chẩn đoán thống kê. Những thang điểm là đúc rút từ những nhu cầu thực tiễn hàng hải. khái niệm này khác nhau về dấu hiệu kỹ thuật hay dấu hiệu tính toán. Phần lớn những phương pháp phân tích vật lý các quá trình hải Chẩn đoán vật lý bao gồm các thủ tục và phương pháp xác định dương kết hợp những cơ sở của phép phân tích định lượng các quan trắc trạng thái đại dương, được xây dựng trên cơ sở mô tả những hiện tượng với những giải pháp lý luận tập hợp, chuẩn bị và xử lý thông tin hải và quá trình hải dương bằng cách tính toán và phân tích những đặc trưng dương học. Những quy tắc lý thuyết đồng thời là cơ sở để lý giải tiếp theo thủy vật lý. Theo nội dung, chẩn đoán vật lý có tính truyền thống. Trước về những ước lượng định lượng về phương diện hải dương học. hết, nó gồm những phương pháp hải dương học tính toán những đặc Về toàn cục thì thực tiễn phân tích vật lý đối với những quá trình hải trưng trạng thái đại dương không trực tiếp quan trắc, những đặc trưng thứ 4
  7. dương là một phương pháp luận đã hình thành, hoàn chỉnh và rất hiệu quả pháp tiếp cận hữu hiệu, trong đó có những phương pháp phân tích thống trong xử lý thông tin hải dương học. kê nhiều biến. Cuối cùng, nguyên nhân thứ ba là do tình trạng lưu giữ thông tin hải Những nguyên tắc của chẩn đoán thống kê dương học vào máy tính rất chậm trễ. Như đã biết, hiệu quả của việc xử Chẩn đoán thống kê yêu cầu sử dụng các phương pháp thống kê để lý những mảng dữ liệu lớn tuỳ thuộc rất nhiều vào trình độ tổ chức thông xử lý, phân tích và lý giải thông tin hải dương học đa dạng. Phương pháp tin. Tính tin cậy của những kết luận thống kê liên quan với độ dài tập luận của chẩn đoán thống kê dựa trên nhiều phương pháp phân tích thống mẫu nghiên cứu. Vì vậy, sự tích luỹ thông tin và lưu giữ chúng một cách kê và thể hiện dữ liệu. có tổ chức có thể xem là con đường nhanh nhất để phát triển các phương Chẩn đoán thống kê có nhiều triển vọng ứng dụng thực tế trong pháp chẩn đoán thống kê. nghiên cứu hải dương học. Đó là do hiện nay có rất nhiều phương pháp Bản chất của chẩn đoán thống kê là phân tích định lượng một tập thống kê biến đổi thông tin. Song việc sử dụng chẩn đoán thống kê trong hợp những đặc trưng hải dương học, thành lập những mô hình thống kê thực tế hiện còn rất hạn chế. Về điều này có một số nguyên nhân. tối ưu về những quá trình được quan trắc, mô tả tiếp và lý giải những quy Thứ nhất, rõ ràng rằng trong giới những người nghiên cứu ứng dụng luật và cơ chế vật lý hình thành nên tính biến động đại dương. Phương chưa hiểu sâu sắc về chính hệ thống các tính toán thống kê và sự liên hệ pháp luận phân tích thống kê được phổ biến rộng rãi nhất trong phân tích ràng buộc bên trong của các phương pháp thống kê khác nhau. Thực chất sơ bộ những chuỗi quan trắc (dựng tổ chức đồ, ước lượng các mômen điều này cản trở việc sử dụng nhiều phương pháp để hình thành và kiểm thống kê bậc thấp), mô tả quan hệ các chuỗi (tương quan cặp và hồi quy), tra các giả thuyết thống kê, chấp nhận những quyết định có căn cứ thống phát hiện quy luật biến động thời gian của các đặc trưng hải dương học kê để khảo sát định lượng toàn diện về những mối liên hệ lẫn nhau giữa (phân tích điều hoà, phổ, hiệp phổ). Trong khi đó các phương pháp phân các đặc trưng hải dương học. Chúng tôi cho rằng chính là sự thiếu hiểu tích nhiều biến nói chung hiện còn ít được dùng hơn, điều này hoàn toàn biết thực dụng về bản chất của phương pháp luận thống kê đã làm nảy không tương xứng với sức mạnh thực tế của các phương pháp đó. sinh sự hoài nghi đối với nó. Kết quả là sự chẩn đoán bị quy về ứng dụng Ta sẽ khái quát hoá những nhận xét trên đây về chẩn đoán vật lý và thực tế một số thủ pháp phương pháp luận riêng biệt, những thủ pháp này thống kê dưới dạng một sơ đồ trực quan đơn giản sao cho có thể tóm lược mặc dù chưa phải là tối ưu để giải quyết các bài toán cụ thể, nhưng chúng được những ý tưởng phương pháp luận của các hướng nghiên cứu khác được dùng quen, ổn định, thành tập tục lịch sử, không gây cho nhà nghiên nhau (hình 0.2). cứu những bất trắc nào. Thấy rằng khối chẩn đoán thống kê liên quan trực tiếp với ba khâu Thứ hai, áp dụng những phương pháp phân tích thống kê hiện đại của hệ thống xử lý: các cơ sở dữ liệu, chẩn đoán vật lý và hình thành tri phải đi kèm với cơ sở kỹ thuật tương ứng. Những tính năng của các máy thức của người dùng. Tương ứng với những mối liên hệ qua lại đó, có thể tính hiện có đôi khi quyết định giới hạn của việc phân tích thống kê thông phát biểu những bài toán cơ bản của chẩn đoán thống kê gồm ba nhóm tin trong thực tế. Khác với những tính toán thủy động lực, thống kê đòi sau đây. hỏi không chỉ tốc độ máy tính, mà chủ yếu là dung lượng nhớ lớn. Bộ 1. Những bài toán về xử lý sơ bộ các số liệu, bao gồm các thủ tục nhớ trong và bộ nhớ ngoài quy định khả năng áp dụng nhiều phương 5
  8. hình thành những mảng thông tin ban đầu từ các cơ sở dữ liệu gốc và trên lượng thu được về các mối liên hệ thống kê cần phải thống nhất lại dưới cơ sở những kết quả tính toán các đặc trưng hải dương học thứ sinh trong hình thức những mô hình về hiện tượng, đáng tin về mặt thống kê, sau đó khối chẩn đoán vật lý. lý giải theo tinh thần vật lý về cơ chế hoạt động của những mô hình nhận được theo thuật ngữ hải dương học và phù hợp với những tiên đề vật lý 2. Những bài toán phân tích thống kê thông tin, thể hiện dưới dạng đã chấp nhận khi phân tích. một loạt vấn đề cụ thể về phân tích thống kê tối ưu đối với tài liệu. Thí dụ, những bài toán về phát hiện những hợp phần tuần hoàn trong biến Sơ đồ khối trên đây vận hành thành công hay không tuỳ thuộc vào thiên thời gian và không gian, đánh giá định lượng mối liên hệ giữa các tương quan giữa trình độ tri thức của người sử dụng những kết quả chẩn dao động của những đặc trưng hải dương học trong không gian hay trong đoán và tính hiệu quả của những quyết định thực tiễn chấp nhận trên cơ thời gian. sở tri thức đó. Nếu hiệu số giữa hai hợp phần này âm thì sẽ phát sinh yêu cầu tiếp tục nghiên cứu. Nếu hiệu dương sẽ nảy sinh khả năng tiếp tục sử dụng tri thức, thí dụ, dưới dạng các dự báo sự phát triển của những quá TÝnh c¸c ®Æc tr−ng vËt lý ↓ trình hải dương trong thời gian hay trong không gian. Ph©n tÝch vËt lý c¸c qu¸ tr×nh Sự thành công trong giải quyết những bài toán chẩn đoán thống kê ↓ ChÈn ®o¸n vËt lý các quá trình hải dương tuỳ thuộc rất nhiều vào tính hiệu quả của việc áp LËp c¸c m« h×nh vËt lý ↓ dụng các phương pháp cụ thể xử lý thống kê thông tin. Về hình thức, khối Lý gi¶i kÕt qu¶ chẩn đoán thống kê là một tuần tự nhiều phương pháp của thống kê học, TÝnh c¸c ®Æc tr−ng thèng kª việc chọn và cụ thể hoá chúng được thực hiện phù hợp với những mục ↓ tiêu chung của người nghiên cứu. Tuy nhiên, có thể nêu ra một số nguyên Ph©n tÝch thèng kª c¸c qu¸ tr×nh C¬ së ChÈn ®o¸n tắc cơ bản trong khi chọn và ứng dụng các phương pháp thống kê trong ↓ d÷ liÖu thèng kª LËp m« h×nh thèng kª chuỗi chung chẩn đoán các quá trình hải dương. ↓ Nguyên tắc bổ sung. Theo nguyên tắc này, những phương pháp được Lý gi¶i kÕt qu¶ chọn phải dẫn tới những kết quả sao cho có thể xây dựng được bức tranh Tri thøc đầy đủ nhất về các hiện tượng đang diễn ra. Như vậy cũng chính là nhấn ↓ mạnh rằng phải loại trừ sự lặp lại nhiều lần những kết quả. Có cần phân Ng−êi sö dông H×nh thμnh ↓ loại một tập mẫu mà về tập mẫu đó tất cả những chỉ tiêu đồng nhất đã bμi to¸n ChÊp nhËn quyÕt ®Þnh được khẳng định trước không? Tuy nhiên, trong thực tế cũng có thể cần ↓ phân loại nhiều lần một tập mẫu theo nhiều chỉ tiêu và quy tắc phân loại Dù b¸o khác nhau để làm sao chọn được một cấu trúc lớp ổn định nhất và có căn cứ vật lý nhất. Ý nghĩa của quy tắc này là ở chỗ sao cho kết quả ở lần sau mở Hình 0.2. Sơ đồ chức năng chẩn đoán các quá trình hải dương học rộng những quan niệm của chúng ta về đối tượng nghiên cứu đã thu được ở lần 3. Những bài toán ở giai đoạn tổng hợp, khi những ước lượng định chẩn đoán trước. 6
  9. Nguyên tắc kết hợp các phương pháp để liên tục áp dụng những trình chung xử lý thông tin hải dương học. Giai đoạn phân tích gồm bốn phương pháp nghiên cứu phức tạp hơn. Những phương pháp xử lý thống nhóm phương pháp xử lý. Xử lý bước đầu được chia thành một khối độc kê đơn sơ hơn thì cho những kết quả thô, gần đúng, nhưng ít tốn thời lập để nhấn mạnh tầm quan trọng và sự cần thiết của việc lựa chọn ban đầu thật cẩn thận các tham số phân tích thống kê. gian. Phương pháp chính xác hơn thường phức tạp hơn và ít kinh tế hơn. Thông thường, sự phức tạp tính toán và tăng độ chính xác kết quả luôn Rõ ràng, việc chọn lựa cụ thể những tham số phải xuất phát từ các dẫn tới thu hẹp phạm vi ứng dụng của hệ phương pháp. Độ tin cậy cao điều kiện phát biểu bài toán chẩn đoán. Sau khi có kết quả chẩn đoán vật của một ước lượng thống kê chủ yếu là do tuân thủ nghiêm ngặt những lý, ở mức định tính chúng ta đã có thể tiên đoán khả năng đưa thêm điều giới hạn trong khi tính toán. Bài toán quen thuộc trong khí tượng những tham số bổ sung vào danh sách các mối liên hệ cần nghiên cứu. thủy văn về tính các chuẩn nhiều năm của nhiệt độ nước là một minh hoạ Trong danh sách đã có thể đưa thêm những biến không trực tiếp quan về điều vừa nêu. Ước lượng gần đúng trung bình số học theo chuỗi quan trắc, nhưng có thể tính được trong quá trình chẩn đoán vật lý. trắc dài tỏ ra không có gì kém so với những ước lượng tinh xảo kỳ vọng Phân tích thống kê ban đầu trong chẩn đoán thống kê có thể được toán học thực hiện bằng nhiều phương pháp phức tạp với xấp xỉ không xem vừa như là mục tiêu nghiên cứu, vừa như là giai đoạn tính toán trung dừng. gian. Trong mọi trường hợp thì kết quả phân tích thống kê ban đầu là nền Nguyên tắc kế thừa cho phép dần dần đạt tới độ tin cậy cực đại của tảng để lý giải về tính ổn định và tính biến động của các tham số, tính kết quả tính toán với độ mạo hiểm tối thiểu. Nguyên tắc này tạo ra khả đồng nhất và tính dừng của các thành phần riêng biệt của các quá trình năng phân chia thành từng pha các phương pháp chẩn đoán thống kê được nghiên cứu. những quá trình hải dương. Một pha là một nhóm các phương pháp xử lý Cần tách riêng các phương pháp ước lượng trị số của những mômen thống kê gồm một số những tính toán khép kín, người sử dụng kiểm soát thống kê đầu tiên và thuật toán tính toán các tổ chức đồ thực nghiệm một tính hiệu quả của nó. Thí dụ, khi tính các thành phần chính, có thể tổ chiều và hai chiều như là những thủ tục tính toán các đặc trưng thực chức một pha tính mỗi thành phần và khôi phục giá trị của thành phần đó. nghiệm quan trọng của những quá trình hải dương. Các ước lượng thống Sau khi kiểm tra tính hội tụ và tính lý giải được của các thành phần, kê − trung bình, phương sai, các hệ số biến phân, độ bất đối xứng, độ người sử dụng quyết định cần tiếp tục khai triển hay kết thúc các thủ tục nhọn, các tham số phân bố xác suất, là thông tin quan trọng về cấu trúc tính toán. nội tại của biến động thời gian hay không gian của các quá trình. Trên cơ sở đó hình thành quan niệm ban đầu về biến động nền của các hiện tượng Trình tự chẩn đoán thống kê nghiên cứu nói chung. Trong thực tế có thể thực hiện những nguyên tắc chẩn đoán thống kê Phân tích các chuỗi thời gian được tách thành một khối riêng biệt, vì chung nhất đã liệt kê trên đây dưới dạng những sơ đồ tính toán thống kê. trong đó những thuật toán ước lượng định lượng về mức độ có quy luật Ta sẽ dừng lại ở một trong những phương án khả dĩ tỏ ra rất hiệu quả trong sự biến thiên các đặc trưng hải dương học theo thời gian được liên trong nghiên cứu các quá trình hải dương quy mô lớn. kết thành một chuỗi những tính toán liên quan nhau một cách lôgic. Sơ đồ chẩn đoán thống kê này (hình 0.3) hình thành trên cơ sở Những ý tưởng phân tích chuỗi thời gian đã được xét chi tiết và toàn diện những nguyên tắc đã xét ở trên như một bộ phận hợp thành của một quá 7
  10. trong nhiều chuyên khảo về những vấn đề phân tích xác suất các quá nhiều tầng, gồm cả một dải rộng tần số dao động riêng và dao động trình hải dương [69, 151, 193]. Ở đây cần nhấn mạnh ý nghĩa to lớn của cưỡng bức. Chính tính có cấu trúc của hệ thống đã cho phép chúng ta sau phép phân tích thống kê tổng hợp đối với các quá trình hải dương đa khi xấp xỉ đánh giá được cấu trúc tần số của các quá trình, có thể ngay chiều trong hệ phương pháp này. tức khắc xếp các hiện tượng đang xét vào một thang bậc nhất định trong sự đa tầng biến động đại dương. Tuy nhiên, kinh nghiệm cho thấy rằng tập hợp các tần số dao động đặc trưng là có hạn và thực tế nó nằm gọn Chän c¸c tham sè trong dải biến động từ cỡ vài phút đến vài nghìn năm, điều khẳng định Xö lý b−íc ®Çu ↓ H×nh thμnh c¸c tËp mÉu này đủ chính xác và đủ tin cậy đối với những nhu cầu thực tiễn và lý Ph©n tÝch thèng kª ban ®Çu thuyết hiện nay. Ph©n tÝch ↓ Ta đã biết rằng cấu trú c tần số trong sự tương tác giữa các thành Ph©n tÝch c¸c chuçi thêi gian tố của hệ thống khí hậu có số bậc tự do rất khác nhau. Việc mô tả ↓ những mối liên hệ qua lại trong các dao động của những đặc trưng hải Ph©n tÝch thèng kª ®a chiÒu dương học trong miền tần số được thực hiện bằng các phương pháp phân tích phổ tương hỗ; theo phương pháp này, từ các ước lượng phổ Lùa chän m« h×nh thèng kª dao động đồng pha và không đồng pha, độ hiệp biến và pha các dao ↓↑ Tæng hîp động, ta sẽ có được quan niệm về sự hiện diện hay không hiện diện Lý gi¶i c¸c ®Æc tr−ng thèng kª của những tương tác có tính tuần hoàn giữa hai chuỗi thời gian. Còn có một nhóm các bài toán phân tích chuỗi thời gian liên quan Hình 0.3. Sơ đồ chức năng của chẩn đoán thống kê tới việc mô tả những dao động tuần hoàn chu kỳ dài trong các quá các quá trình hải dương trình ban đầu, gọi là "xu thế". Bài toán mô tả xu thế chắc chắn không Tách ra tính biến thiên có quy luật của chuỗi thời gian có nghĩa là nên coi là bài toán tầm thường và có lẽ nó cũng là bài toán còn lâu nhận những ước lượng tin cậy của những đặc trưng về tính ngẫu nhiên mới hoàn thiện. hay tính có quy luật trong biến thiên thời gian. Rõ ràng, phát hiện ra Theo truyền thống thì các nhà nghiên cứu xem xu thế là một thứ những quy luật là kết quả quan trọng khi phân tích các chuỗi thời gian. nhiễu không mong muốn. Nguyên nhân là do xu thế phá huỷ điều kiện Trước hết quy luật được hiểu là sự tuần hoàn lặp lại tiềm ẩn trong các dao dừng của các chuỗi thời gian, làm giảm mạnh hiệu quả của các phương động của các đặc trưng hải dương học mà người ta giải thích như là sự pháp phân tích tương quan và phổ kinh điển. Thực vậy, tính không dừng biểu hiện của các cơ chế hình thành các quá trình nghiên cứu bởi những về kỳ vọng toán học, về các đặc trưng biên độ và pha dao động làm giảm nhân tố bên ngoài hay bên trong. Vì vậy các phương pháp phân tích điều độ tin cậy của những ước lượng của các thành phần tất định, vì phần lớn hoà của Fourier, phương pháp phân tích biểu đồ chu kỳ, phân tích phổ trường hợp trong thực tế các ước lượng này được tính theo những thuật được phát triển mạnh mẽ nhất. toán áp dụng đối với những tập mẫu dừng. Chính vì vậy mà người ta Đại dương là một hệ thống phức tạp gồm những mối liên hệ cấu trúc thường muốn bằng mọi cách loại bỏ các xu thế trong các chuỗi. 8
  11. Loại bỏ xu thế được thực hiện bằng nhiều phương pháp khác nhau, số liệu theo kiểu của mình. Những phương pháp phân tích thống kê đa cơ sở của các phương pháp đó là ý tưởng mô tả riêng rẽ từng dao động chiều phổ dụng nhất là: một trong các chuỗi thời gian. Và biến động xu thế ( A(t ) ) trong cách tiếp 1) Phân tích hồi quy; cận này được xem như một biến động độc lập, không trực tiếp liên hệ với 2) Phân tích thành phần và phân tích nhân tố; biến động chu kỳ ngắn hơn ( B(t ) ). Như vậy biến động chung X(t ) của 3) Phân tích tương quan chuẩn hoá; các quá trình hải dương được mô tả dưới dạng mô hình tổng hợp phần: 4) Phân loại hay phân tích nhóm (cluster analysis); X(t ) = A(t ) + B(t ) . 5) Phân tích phân biệt (discriminant analysis). Phải thừa nhận một trong những nét quan trọng nhất của tất cả các Trên cơ sở những phương pháp này nảy sinh hàng trăm biến thể phương pháp phân tích thông tin hải dương học là số lượng các biến đặc khác nhau. Nhiệm vụ của người nghiên cứu là làm sao định hướng tốt, trưng cho mặt này hoặc mặt khác của các quá trình tăng lên theo kiểu lựa chọn và sử dụng những phương pháp hiệu quả nhất. Khả năng áp hàm mũ. dụng phân tích thống kê đa chiều trong thực tế được quy định và được kiểm tra bằng sự phù hợp giữa mô hình thống kê được xây dựng và số Thí dụ, ngay ở giai đoạn xử lý sơ bộ, với hai chuỗi thời gian xuất liệu thực, ngoài ra phải xét xem những mối phụ thuộc tương hỗ nhận phát là nhiệt độ và độ muối đã có thể thêm vào một chuỗi mật độ. Sau được theo mô hình có lý giải được về vật lý hay không. Khi ứng dụng các quá trình phân tích ban đầu người nghiên cứu sẽ có thêm hàng chục đặc phương pháp phân tích thống kê đa chiều mà kết quả kém, thì điều đó trưng định lượng. Cuối cùng, sau khi phân tích cấu trúc dao động tiềm ẩn, không chỉ nói lên nhược điểm của bản thân phương pháp, mà chủ yếu do lượng thông tin công tác lại tăng lên một số lần nữa do có những ước không phù hợp giữa phương pháp và số liệu xuất phát hay việc áp dụng lượng hàm tự tương quan, tương quan tương hỗ, hàm phổ và hiệp phổ, nó không đúng đắn. Chỉ có thể thành công khi áp dụng những phương các tham số khai triển Fourier, theo mô hình tổng hợp phần, những ước pháp này một cách có lựa chọn, có cơ sở và khéo léo trong thực tế. Vì lượng này hình thành một cách riêng rẽ cho các thành phần xu thế và các vậy, điều đáng quan tâm đặc biệt là sự phù hợp giữa các phương pháp thành phần chu kỳ ngắn. Thực tế là xảy ra tình trạng dư thông tin, phân tích thống kê đa chiều và các nhiệm vụ cần giải quyết. Dưới dạng muốn hệ thống hoá thông tin phải có những phương pháp đặc thù, đó chung nhất, vấn đề này được xem xét trong bảng 0.1, bảng này chỉ giới là các phương pháp phân tích thống kê đa chiều. thiệu những giải pháp đã từng được thử thách nhiều nhất trong thực hành Phân loại các phương pháp phân tích thống kê đa chiều hải dương học để giải quyết những bài toán điển hình bằng các phương pháp phân tích thống kê đa chiều. Ở đây, những mục tiêu nghiên cứu rất Mục đích cơ bản của phần lớn các phương pháp phân tích thống kê đa dạng được chia thành ba nhóm, đối với mỗi nhóm đã xác định những đa chiều là biến đổi dữ liệu xuất phát, sao cho người nghiên cứu có thể nguyên tắc và những phương pháp giải quyết cụ thể. một cách trực quan và khá đầy đủ ý niệm được bản chất của những mối liên hệ chủ yếu trong tài liệu phân tích. Vì có nhiều quan điểm lý thuyết Vấn đề mô tả thống kê những mối liên hệ nhằm mục đích xây dựng khác nhau, nên cũng xuất hiện và phát triển nhiều phương pháp phân tích các mô hình hiện tượng và quá trình để chẩn đoán và dự báo, được đặt thống kê đa chiều, mỗi phương pháp trong số đó lý giải sự biến động của lên vị trí đầu tiên. Điều này không phải ngẫu nhiên, vì nó luôn là kết cục 9
  12. chính của phần lớn những bài toán thực dụng mà chúng ta giải quyết. muối, áp suất trong các phương trình trạng thái nước biển thực nghiệm. Ngoài ra, vấn đề này cũng cần được giải quyết trong nhiều quá trình Chính phương pháp này được sử dụng khi lập những công thức tính và nghiên cứu khác liên quan tới phân loại các quá trình hay phân tích cấu dự báo điều kiện băng theo các đặc trưng khí tượng. Phương pháp tiếp trúc của chúng. Giải pháp mô tả thống kê truyền thống về phương diện cận tương tự cũng được dùng khi khảo sát sự phụ thuộc của các tham số này là ứng dụng các phương pháp phân tích tương quan và hồi quy nhiều sóng vào tốc độ gió, độ dài đà gió... biến, nhờ những phương tiện đó người nghiên cứu mô tả mối phụ thuộc Tìm cấu trúc tiềm ẩn trong các dữ liệu khí tượng thủy văn có nghĩa giữa các biến. là phát hiện những quy luật cơ bản của những biến không gian − thời gian. Trong hải dương học vấn đề này đang được giải quyết trên ba Bảng 0.1. Phân loại các phương pháp phân tích thống kê đa chiều phương diện chính: phân tích cấu trúc các mối liên hệ giữa những tham Mục tiêu Những nguyên tắc Các phương pháp số trạng thái đại dương, phân tích cấu trúc những quy mô biến động không gian của các đặc trưng hải dương học và phân tích cấu trúc biến Mô tả những mối liên Mô tả định lượng những Hồi quy đa biến (tuyến tính, hệ (mô hình hoá, dự mối liên hệ giữa các biến phi tuyến) động thời gian của các quá trình. báo) trên cơ sở tương quan và Phân tích tương quan chuẩn Nguyên tắc chính thực hiện những bài toán là khai triển tập mẫu ban hồi quy hoá đầu thành chuỗi các thành phần trực giao (không phụ thuộc với nhau). Phương pháp khai triển được chọn sao cho mỗi thành phần trực giao mô Phát hiện và mô tả Biến đổi các biến thành Khai triển thành các đa thức cấu trúc tiềm ẩn của những thành phần trực giao đại số trực giao (Chebưsev, tả một mối liên hệ đặc trưng nào đó giữa các biến hoặc khái quát được số liệu Fourier) quy mô điển hình của biến động không gian − thời gian. Phương pháp thành phần chính Phải thừa nhận phương pháp khai triển đơn giản nhất là các thủ tục khai triển theo các đa thức đại số, trong đó các đa thức Chebưsev và Phân tích nhân tố Fourier là phổ dụng nhất. Phương pháp các thành phần chính cũng được Tách các tập con trong Tách biệt tự nhiên tập hợp Phân tích nhóm (phân loại tự sử dụng rộng rãi, mặc dù nó có phần phức tạp hơn. Phương pháp phân các đối tượng quan quan trắc thành những lớp động) trắc; điển hình, phân đồng nhất, đánh giá sắp xếp tích nhân tố tạm thời ít được ứng dụng trong hải dương học thực hành, Phân tích phân biệt loại, phân vùng các quan trắc cụ thể vào song trong các lĩnh vực khoa học khác (khí tượng học, sinh học, xã hội những lớp xác định học, kinh tế học) nó tỏ ra rất hữu hiệu. Sự hiệu quả của phương pháp phân tích nhân tố thường phải trả giá bằng sự phức tạp của các thủ tục Một khi đã tích luỹ được nhiều thông tin rằng có những mối liên hệ tính toán. tiềm ẩn, thì các phương pháp chỉ là biến những kết luận định tính thành dạng toán học − thành những phương trình hồi quy đa biến. Ở đây phân Quá trình hệ thống hoá khoa học đối với những tri thức tích luỹ gắn tích hồi quy đa biến là cách tiếp cận chủ yếu trong khi giải quyết các bài liền với phân loại hoá, phân loại các đối tượng nghiên cứu. Những vấn đề toán mô tả. Nhiều kết quả khoa học và thực tiễn quan trọng đã có được phân loại khối nước, phân loại dạng băng, phân loại cấu trúc nước thẳng nhờ ứng dụng phương pháp này trong hải dương học. Thí dụ, sử dụng hồi đứng... có ý nghĩa thực tiễn và khoa học đặc biệt. quy đa biến cho phép mô tả sự phụ thuộc của mật độ vào nhiệt độ, độ 10
  13. Loại (kiểu) của hiện tượng hay quá trình là kết quả khái quát thông đường khả dĩ ứng dụng phân tích thống kê đa chiều phải xuất phát trước tin tích luỹ về đại dương rất quan trọng. Thông thường, những bài toán hết từ sự thoả mãn các giả thiết về tính chuẩn trong các phân bố thực kiểu tương tự được giải quyết bằng cách ứng dụng phương pháp phân nghiệm của các biến xuất phát và tính dừng, tính đồng nhất của các chuỗi tích phân biệt. Theo phương pháp này, dựa trên những tính chất thống kê được nghiên cứu. của những lớp đã được phân ra trước đây, có thể xếp thông tin mới vào một trong những lớp đó với một sai số tối thiểu. Trong thực hành, phân Ph−¬ng ¸n 2 Ph−¬ng ¸n 1 tích phân biệt đã được ứng dụng hiệu quả khi nhận dạng kiểu cấu trúc Ph©n lo¹i c¸c qu¸ Khai triÓn c¸c ®Æc tr−ng thẳng đứng nhiệt độ nước, khi chẩn đoán và dự báo kiểu điều kiện băng. tr×nh ®−îc nghiªn cøu ®−îc nghiªn cøu trong hÖ trong kh«ng gian c¸c quy chiÕu trùc chuÈn (c¸c Trình tự chẩn đoán thống kê các quá trình đa chiều biÕn xuÊt ph¸t (ph©n ®a thøc chuÈn, c¸c thμnh lo¹i tù ®éng, ph©n tÝch phÇn chÝnh, c¸c nh©n tè Các phương pháp phân tích thống kê đa chiều có mục đích mô tả chung, c¸c biÕn chuÈn ho¸) những hệ thống đa tham số. Hai nhóm phương pháp có vị trí trung tâm trong phân tích thống kê đa chiều: đó là các phương pháp phân loại và M« t¶ c¸c ®Æc tr−ng các phương pháp phân tích cấu trúc. Khi thực hiện một khảo sát cụ thể thèng kª cña nh÷ng lo¹i, M« t¶ biÕn ®éng c¸c nh÷ng líp ®· ®−îc t¸ch nào đó, thì có lẽ vấn đề chính là ta phải lựa chọn tương quan giữa hai qu¸ tr×nh b»ng c¸c ra b»ng c¸c ph−¬ng ph¸p nhóm phương pháp đó. ph−¬ng ph¸p ph©n tÝch ph©n tÝch b−íc ®Çu vμ b−íc ®Çu ®èi víi nh÷ng ph©n tÝch c¸c chuçi Trong thực tiễn nghiên cứu hải dương học, có thể có hai phương án chuçi thêi gian trong hÖ trình tự ứng dụng phân tích thống kê đa chiều. Trên hình 0.4 trình bày quy chiÕu trùc chuÈn những sơ đồ chi tiết về ứng dụng phân tích thống kê đa chiều. Rõ ràng là Ph©n tÝch cÊu tróc c¸c cả hai phương án đều nhằm một mục tiêu cuối cùng: đạt tới sự mô tả líp, c¸c qu¸ tr×nh bªn đúng đắn và tin cậy nhất về độ biến động có mặt trong các quá trình hải Ph©n lo¹i c¸c qu¸ trong c¸c líp b»ng c¸ch tr×nh theo c¸c kiÓu biÕn khai triÓn trong hÖ quy dương. Nhưng mục tiêu sẽ đạt được bằng những cách khác nhau, tuỳ ®éng cña nh÷ng tham sè chiÕu trùc chuÈn (c¸c ®a thuộc vào cấu trúc số liệu xuất phát mà ta phát hiện được ở những giai khai triÓn quy chiÕu thøc, c¸c thμnh phÇn (ph©n lo¹i tù ®éng, ph©n đoạn xử lý thống kê trước đó đối với những tham số hải dương học. chÝnh, c¸c nh©n tè tÝch nhËn d¹ng) chung, c¸c biÕn chuÈn) Nhà nghiên cứu phải đối mặt với vấn đề chọn trình tự áp dụng các phương pháp phân tích thống kê đa chiều và câu hỏi những phương pháp Hình 0.4. Sơ đồ chức năng trình tự phân tích thống kê đa chiều đối với thông tin hải dương học cụ thể nào về nguyên tắc cần thiết phải sử dụng. Người ta giải đáp những Sở dĩ phải phân loại ngay từ đầu các biến được nghiên cứu là vì có vấn đề đó không phải ở mức linh tính, mà phải ở mức luận lý. Có nên những trường hợp không thoả mãn các giả thiết về tính chuẩn trong các ứng dụng các phương pháp phân tích thống kê đa chiều hay không là phải luật phân bố một chiều và hai chiều, đặc biệt trong trường hợp xuất hiện dựa vào những kết quả phân tích thống kê ban đầu và những kết luận rút dao động đa mốt. Chính đặc điểm này có tính quyết định tới việc sử dụng ra từ phân tích các chuỗi thời gian. Các nguyên tắc chọn những con 11
  14. Dự báo các quá trình hải dương phép phân loại các quá trình được nghiên cứu. Theo kinh nghiệm của các tác giả, nếu ngay từ đầu đã thực hiện phân tích cấu trúc với những số liệu Nghiên cứu chẩn đoán không phải là mục tiêu tự thân. Thông thường loại này bằng các phương pháp khai triển thì thường dẫn tới những mô các nghiên cứu chẩn đoán là để mở đầu cho giai đoạn cuối cùng, phức tạp hình thống kê kém hiệu quả. Nguyên nhân dẫn tới những kết quả kém hơn − dự báo những quá trình hải dương. Ngày nay, khi mà cái giá của như vậy là do tính ít thông tin của các ước lượng tham số tương quan và một quyết định có căn cứ, có hiệu quả kinh tế trực tiếp phụ thuộc vào hồi quy, vì phần lớn các phương pháp khai triển thực nghiệm xuất phát từ chất lượng thông tin khí tượng thủy văn xuất phát và các ước lượng dự những ước lượng đó. báo, thì bài toán này trở nên đặc biệt cấp thiết. Trong trường hợp này, Phải lưu ý những người nghiên cứu thực hành rằng quy luật này những thành công đáng kể nhất trong dự báo bao giờ cũng là do người dự hoàn toàn có cơ sở, vì ước lượng liên hệ tương quan tuyến tính dựa trên báo thấu hiểu những quá trình đang diễn ra trong đại dương và bản thân đòi hỏi tuân thủ tính chuẩn của phân bố xác suất hai chiều của các biến những phương pháp ngoại suy đã sử dụng. [8, 75, 96, 201]. Nếu giả thiết chuẩn của luật phân bố thực nghiệm không Từ kinh nghiệm thấy rằng các phương pháp chẩn đoán cần phải liên thoả mãn với xác suất P (%), thì ta chỉ có thể hy vọng nhận được kết quả hệ gắn bó với nhau trong khi khảo sát những quá trình cụ thể. Tuy nhiên, khai triển với độ chính xác khai triển không cao hơn P (%) chứ không trong thực tiễn nhiều khi không phải như vậy, và điều này là do thiếu mong gì hơn. những khảo luận lý thuyết và phương pháp luận tương ứng. Công trình này cũng đặt ra mục tiêu minh hoạ tính hiệu quả và triển vọng ứng dụng Cần nhấn mạnh rằng sự kết hợp, móc nối giữa một số phương pháp các phương pháp phân tích thống kê đa chiều để giải quyết những bài phân tích thống kê đa chiều ngày nay là một tất yếu, được khẳng định toán dự báo các quá trình hải dương đa chiều. bằng kinh nghiệm ứng dụng thực tiễn các phương pháp, bằng căn cứ lý Khái niệm "dự báo" trong hải dương học thực hành hiện đại được luận về sự liên kết này và bằng những khả năng kỹ thuật của máy tính hình thành như là sự tiên đoán có căn cứ khoa học về những biến đổi hiện đại. Theo cách tiếp cận như vậy, nguyên tắc kết hợp các phương trong trạng thái các yếu tố chế độ đại dương. Bài toán dự báo các đặc pháp nghiên cứu những quá trình hải dương phức tạp có thể hiện thực hoá trưng hải dương học không phải là bài toán tầm thường, một mặt vì tính trên trình độ hiểu biết mới về những kết luận thống kê đã nhận được. phức tạp của các quá trình đang diễn ra trong đại dương, mặt khác vì Việc kết hợp các phương pháp áp dụng đối với nhiều hệ tọa độ khác nhau thiếu những hiểu biết có căn cứ khoa học cho phép mô tả đúng các quá (thí dụ, không gian − các biến và các biến − thời gian) cho phép mô tả trình. Lý thuyết tổng quát về những quá trình hải dương tạo ra một hệ thống quan điểm đôi khi không phải là không còn những mâu thuẫn, trên cấu trúc các mối liên hệ của toàn bộ hình lập phương thông tin hải dương cơ sở đó xây dựng nên những phương pháp cụ thể phân tích và dự báo học đa chiều, có nghĩa là tái tạo được một bức tranh đầy đủ hơn về sự các đặc trưng hải dương học. Tuy nhiên, từ lý thuyết đó chưa dẫn tới một hình thành đối tượng nghiên cứu. thuật giải vạn năng, đảm bảo dự báo hiệu quả. Những quan trắc trong đại Những thí dụ dưới đây về chẩn đoán các quá trình hải dương sẽ là dương ít khi cho phép người ta lý giải một tính biến động nào đó một những minh chứng cụ thể cho những lập luận ở trên. cách đơn trị, mà thường chỉ là cơ sở hình thành nên những giả thiết còn phải kiểm tra cẩn thận. Sự đa dạng của các nhân tố trực tiếp và gián tiếp 12
  15. ảnh hưởng tới biến động thời gian của các đặc trưng hải dương học, làm thế được của các khối, hoàn thiện các khối, cuối cùng cho phép người chúng ta rất khó chính thức hoá một cách đơn trị những mối phụ thuộc nghiên cứu xác định được những khả năng của mô hình, tức thực hiện nhân quả. Vì vậy, những phương pháp thống kê chẩn đoán và dự báo các việc kiểm tra các mô hình dự báo và đưa ra đánh giá khách quan cuối đặc trưng hải dương học ngày càng được ứng dụng rộng hơn trong thực cùng về mô hình đang dùng. tiễn. Tương tự như công trình [153] có thể định nghĩa dự báo thống kê Phân loại các phương pháp dự báo như là sự suy luận xác suất về triển vọng phát triển và trạng thái có thể có Ngày nay, dự báo một quá trình đa chiều là một bài toán tương đối của quá trình hải dương trong tương lai dựa trên mô hình thống kê về sự đặc biệt trong thực tiễn nghiên cứu dự báo hiện đại. Đối với hải dương tiến triển của quá trình. học, thì điển hình nhất là dự báo quá trình một chiều, gọi là dự báo một Những nguyên tắc dự báo thống kê yếu tố chế độ hay dự báo một đặc trưng hải dương học. Ở đây tính đa liên Trong quá trình nghiên cứu dự báo, một trong những nhiệm vụ quan hệ, đa chiều của bản thân quá trình hình thành sự biến thiên của đặc trưng trọng nhất là hình thành những vấn đề phương pháp luận nhằm mục đích đang xét bị đẩy xuống hàng thứ yếu (được tham số hoá gián tiếp qua nâng cao tính căn cứ của các dự báo. Việc tuân thủ những nguyên tắc phương trình hồi quy đa biến) hoặc là bị bỏ qua hoàn toàn khi sử dụng phương pháp luận phổ biến xây dựng các mô hình dự báo ở mức độ nào những phương trình tự dự báo. Trong công trình này, chúng tôi sẽ cố đó sẽ giúp người nghiên cứu tránh được những sai lầm thô thiển. Chúng gắng thử nghiệm ý tưởng bảo tồn tính đa chiều của quá trình cả trong ta sẽ nêu ra những nguyên tắc này. chẩn đoán lẫn trong dự báo. Ở đây chúng tôi cho rằng nội dung quan trọng nhất của dự báo một quá trình đa chiều chính là dự báo được sự tiến 1. Sự đồng thuận giữa mô hình và cấu trúc số liệu quan trắc xuất triển liên hệ lẫn nhau của các tham số của vectơ m chiều các biến quan phát. Từ nguyên tắc này suy ra rằng trước khi tiến tới xây dựng một trắc. Vì vậy việc dự báo một cách tách biệt các tham số riêng lẻ không có phương pháp dự báo cụ thể, phải đưa ra mô tả cấu trúc dữ liệu, tức thực vị trí hàng đầu, mà quan trọng là xây dựng mô hình dự báo mô tả được hiện phân tích chúng bằng phương pháp thống kê đúng đắn. những quan hệ đa chiều của các tham số của quá trình. 2. Sự đầy đủ, khả năng thích ứng và khả năng phát triển của mô Số lượng các phương pháp có thể có để dự báo thống kê các quá hình dự báo. Mô hình phải mô tả được dải rộng những biến thiên của quá trình đa chiều một mặt do nội dung kết quả chẩn đoán, mặt khác do chức trình được nghiên cứu, tự điều chỉnh khi mô tả một lớp quá trình cụ thể, năng mục tiêu của dự báo quy định. Trong bảng 0.2 biểu diễn ba mục tiêu còn các tham số của nó phải thay đổi tuỳ thuộc vào độ chính xác dự báo. quan trọng nhất của việc xây dựng mô hình dự báo trong nghiên cứu hải Tuân thủ những nguyên tắc này cho phép hiểu sâu hơn những đặc điểm dương học ứng dụng. Chúng ta sẽ khái quát tóm tắt những nguyên tắc và của mô hình và những lớp tham số mà nó mô tả, tức chẩn đoán thêm về những thủ pháp phương pháp luận tương ứng. các quá trình được nghiên cứu. Dự báo cấu trúc của quá trình đa chiều thực hiện dựa trên cơ cở 3. Sự đơn giản của mô hình. Theo nguyên tắc này, mô hình đảm bảo ngoại suy trong thời gian các kết quả khai triển trực giao ma trận quan trực quan đối với người nghiên cứu và người sử dụng (người đặt hàng), trắc xuất phát bằng các phương pháp phân tích thành phần chính và phân bằng cách đó giúp ta thể hiện mô hình dưới dạng các khối (dưới dạng tích nhân tố. Sự biến động trong thời gian của những nhân tố chung những mô đun chương trình và những chương trình vạn năng). Tính thay 13
  16. (những thành phần chính) chứa đựng động thái những mối liên hệ quan số hạng khai triển trực giao, những số hạng khai triển này liên hệ một trọng nhất của các biến ban đầu. Trong phương pháp này thông tin được cách tin cậy, về phương diện thống kê, với biến phải ngoại suy. Phương nén đáng kể − số nhân tố chung thực tế nhỏ hơn hai lần so với số biến án thứ hai − xây dựng mô hình dự báo trên cơ sở tính tới những mối liên xuất phát. Sự độc lập của các thành phần khai triển sẽ đảm bảo tính hiệu hệ bất đồng bộ giữa các tham số xuất phát của quá trình và biến phải quả của các phương pháp tự dự báo. ngoại suy. Theo truyền thống, bài toán này được giải bằng các phương pháp phân tích hồi quy đa chiều, tuỳ thuộc vào tính ổn định của các mối Bảng 0.2. Phân loại các phương pháp dự báo các quá trình đa chiều liên hệ và mức độ tuyến tính của chúng mà chọn mô hình hồi quy tối ưu. Mục tiêu Nguyên tắc Phương pháp Tuần tự chung xử lý các quá trình hải dương đa chiều Dự báo cấu Dự đoán sự tiến triển của Ngoại suy các số hạng khai triển bằng Đa phần các dự báo thống kê vật lý khí tượng thủy văn hiện đại hiện trúc của quá các tham số tổng hợp trong những phương pháp tự dự báo (tự hồi trình mô hình khai triển trực giao quy, trung bình trượt, hài Fourier) thực hoá hai ý tưởng: Dự báo lớp Dự đoán sự tiến triển của Ngoại suy hàm mật độ xác suất bảo tồn 1) Dự báo đa tham số, trong đó sự tiến triển của quá trình được mô tả trạng thái quá trình theo nghĩa thay hay biến thiên lớp bằng những phương bằng cách đưa vào phân tích một số mối liên hệ bất đồng bộ bên ngoài ổn của quá thế các lớp trạng thái pháp ước lượng Bayes và lý thuyết các trình quá trình Markov định nhất phản ánh những cơ chế nhân quả; Dự báo một Dự đoán đặc trưng có tính Ngoại suy dựa trên việc tính tới các 2) Tự dự báo, tức sự phát triển tương lai của quá trình chỉ phụ thuộc biến riêng tới ảnh hưởng của tất cả các mối liên hệ không đồng bộ của những vào sự biến động của bản thân nó trong quá khứ. lẻ của quá tham số của quá trình tham số xuất phát bằng các phương trình đa pháp phân tích hồi quy đa biến (tuyến Nét tiêu biểu là việc ứng dụng các sơ đồ dự báo đa tham số trong hải chiều tính, đa thức, phổ, hồi quy từng bước) dương học không phải là do các phương pháp tự dự báo đã hết khả năng Tính đa mốt của quá trình nhiều chiều biểu lộ rõ nét là tiền đề quan tiềm tàng của nó. Các tác giả cuốn sách này chưa thấy có công trình nào trọng để chẩn đoán và dự báo động lực của nó, với ý nghĩa là động lực chứng minh theo tài liệu thực tế về tương quan giữa hai phương pháp chung của trạng thái quá trình. Ước lượng trạng thái tương lai của quá luận. Ngược lại, chúng ta chỉ thấy rằng thường người ta đổ xô vào các sơ trình ở đây được thực hiện dựa trên ngoại suy hàm mật độ xác suất bằng đồ dự báo đa tham số sau khi thất bại với tự dự báo mà chỉ sử dụng một các phương pháp của lý thuyết các quá trình Markov và ước lượng Bayes. trong những phương pháp đơn giản nhất − phân tích xu thế hoặc xấp xỉ Các trị số dự báo của những tham số xuất phát được xác định qua những Fourier. Trong khi đó, còn cả một loạt các phương pháp tự dự báo thống ước lượng kỳ vọng toán học và phương sai của chúng, ứng với lớp đang kê xác suất có rất nhiều khả năng thì nhìn chung chưa được dùng tới. xét. Sự phát triển và hoàn thiện của các phương pháp thống kê cho phép Trong nhiều tình huống thực tế, việc dự báo những quá trình đa nhìn nhận tương quan giữa các dự báo đa tham số và tự dự báo từ những chiều được đưa về việc ngoại suy một biến quan trắc duy nhất của quá quan điểm mới, trực tiếp dựa theo kết quả chẩn đoán các quá trình hải trình. Về nguyên tắc thì không có gì khó khăn trong việc giải quyết bài dương đa chiều. Việc ứng dụng các phương pháp phân tích thống kê đa toán này theo hai cách tiếp cận đã xét. Dựa vào chẩn đoán cấu trúc quá biến trong chẩn đoán tạo ra một khả năng hấp dẫn mô tả tin cậy quá trình trình, có thể thực hiện dự báo bằng cách ngoại suy một số rất hạn chế các 14
  17. ˆ hải dương bằng những mô hình thống kê xác suất khép kín với số tham số F(t + τ, z ) = F(t , z ) ⋅ B(t , z ) + ε(t , z ) , độc lập tổng quát tối thiểu − các thành phần chính, các nhân tố chung, các trong đó ma trận các hệ số dự báo thống kê xác suất B liên hệ trạng thái lớp. Giá trị dự báo của những tham số này rất hiển nhiên. Phương pháp ˆ quá khứ F và trạng thái tương lai F của quá trình hải dương. Ở đây luận tự dự báo kinh điển khi áp dụng với những chỉ tiêu chẩn đoán tổng cũng xuất hiện phần dư ε gồm những sai số dự báo. quát này sẽ có một nội hàm mới. Mối liên hệ giữa chẩn đoán và dự báo được thực hiện không chỉ Nét mới của phương pháp tiếp cận này chính là ở chỗ xem xét lại thông qua ma trận các tham số tổng hợp F duy nhất đối với hai giai đoạn khái niệm đa chiều trong chẩn đoán và dự báo. Sự đa chiều không chỉ chẩn đoán và dự báo. Trong trường hợp nếu ma trận phần dư của các mô được xem đơn thuần là có nhiều tiên lượng xuất phát, được quan trắc hay hình chẩn đoán khác với quá trình kiểu nhiễu trắng, thì nó cũng có thể được tính trực tiếp cho phương trình dự báo. Nó được hiểu là sự đa chiều được đưa vào dự báo độc lập. Khi đó sẽ có một thành phần chịu trách của bản thân yếu tố được dự báo, sự đa chiều này mô tả tin cậy trạng thái nhiệm dự báo bản thân ma trận ε cũng được đưa vào mô hình dự báo. của quá trình hải dương và chứa lượng thông tin đủ để tự dự báo. Vì vậy Trên hình 0.5 trình bày sơ đồ tổng quát tuần tự xử lý các quá trình hải trong khi chẩn đoán, mỗi tham số trạng thái quá trình hải dương được dương đa chiều. Những khía cạnh quan trọng nhất trong các giai đoạn chẩn quan trắc không phải được nghiên cứu riêng rẽ, mà trong toàn bộ tập hợp đoán và dự báo đã được bàn luận ở trên và sẽ còn được phân tích tiếp theo. những mối liên hệ thống kê của nó với các biến khác, kết cục là chính Ở đây sẽ khái quát về các mối liên hệ giữa những khối lớn của sơ đồ này để điều này cho phép hình thành những chỉ tiêu tổng hợp về cấu trúc và bước đầu đánh giá những khả năng tiềm tàng của việc ứng dụng phương động lực của quá trình. Nội dung của dự báo khi đó trở thành việc giải pháp tiếp cận này trong thực tế. Nguyên tắc tổ chức cơ bản mối liên hệ quyết bài toán dự báo hữu hiệu những tham số chẩn đoán tổng hợp không giữa các khối là nhằm thực hiện ý tưởng về sự liên hệ ngược của các cần phải tính tới một cách tường minh những mối liên hệ bên ngoài, tức phương pháp xử lý riêng lẻ và các giai đoạn phân tích. Việc đưa ra những giảm nhẹ đáng kể phương diện tính toán khi xây dựng các sơ đồ dự báo. mối liên hệ ngược ở mức độ nào đó làm phức tạp quá trình xử lý thông tin. Biểu diễn hình thức tổng quát nhất của mô hình chẩn đoán trong Sở dĩ phải có những mối liên hệ ngược đó là vì hiểu biết hiện thời của phân tích thống kê đa chiều theo quan điểm tiếp cận trên đây có thể theo chúng ta về bản chất của các quá trình hải dương còn hạn chế. Vì vậy thực phương trình ma trận dạng tế là hiện nay chưa thể đề xuất một tuần tự khả dĩ duy nhất để xử lý và trình X(t , z , l ) = F (t , z ) ⋅ A( z , t ) + E(t , z , l ) . bày dữ liệu thoả mãn nhiều yêu cầu của các hướng phân tích khác nhau. Việc ứng dụng những mối liên hệ ngược, về nguyên tắc, sẽ đảm bảo chọn Ở đây X − ma trận các tham số trạng thái đại dương quan trắc; F − ma ra một mô hình chẩn đoán và dự báo tối ưu trong khuôn khổ một bài toán trận các tham số tổng quát, nhận được qua chẩn đoán, A − ma trận các hệ cụ thể và trong điều kiện thông tin hiện có. số liên hệ, E − ma trận các sai số không được mô tả bởi mô hình chẩn Ta sẽ làm rõ ý nghĩa của những mối liên hệ ngược trong tuần đoán tổng quát. tự chẩn đoán và dự báo. Thông tin hiện có về biến động của các Khi giải quyết nhiệm vụ dự báo, cần dự báo được những tham số quá trình không thể đặc trưng đầy đủ về quá trình, nếu không bổ ˆ tổng hợp tạo thành ma trận F . Diễn biến trong thời gian của chúng được sung thêm những đặc trưng vật lý không trực tiếp quan trắc, những mô tả bằng nhiều mô hình ngoại suy dạng 15
  18. đặc trưng này tính theo những quy luật của thủy nhiệt động lực để nhận được những kết luận vật lý tin cậy hơn về bản chất của các quá học. Những đặc trưng nhận được bổ sung danh sách các tham số trình được nghiên cứu. xuất phát và tham gia vào thủ tục phân tích thống kê. Trong giai đoạn tổng hợp các kết quả tính toán có thể nảy sinh sự cần thiết phải tính toán giải tích lặp lại để gắn kết tốt hơn các kết quả của TH«NG TIN những phương pháp khác nhau và xây dựng nên mô hình thống kê chung hoàn thiện về quá trình. Sự đồng thuận giữa các kết quả tính toán trong ChÈn ®o¸n Dù b¸o thèng kª ChÈn ®o¸n thèng kª khuôn khổ mô hình chung về quá trình phải có căn cứ vật lý, vì vậy mà vËt lý phải quay về chẩn đoán vật lý. Khi cần phải mở rộng mô hình chẩn đoán Ph©n tÝch Lùa chän c¸c TÝnh c¸c ®Æc m« h×nh dù chung, thì tập hợp những tham số xuất phát có thể lại được bổ sung lần tr−ng vËt lý bæ b¸o Ph©n tÝch thèng kª sung cña qu¸ ban ®Çu c¸c biÕn ↓ nữa dựa trên những bất cập phát hiện ra trong quá trình lý giải. xuÊt ph¸t tr×nh ¦íc l−îng ↓ ↓ Mối liên hệ hai chiều giữa chẩn đoán và dự báo thể hiện ý tưởng xây c¸c tham sè Lý gi¶i c¸c kÕt Ph©n tÝch ®a dù b¸o qu¶ chÈn ®o¸n dựng mối phụ thuộc dự báo dựa theo kết quả chẩn đoán, và ngược lại, chiÒu ↓ thèng kª ®Þnh chính xác hoá thêm những tính toán chẩn đoán căn cứ vào yêu cầu xây Ph©n tÝch c¸c l−îng KÕt hîp mèi liªn hÖ (tæng hîp) dựng các mô hình dự báo có đáp ứng mong muốn của chúng ta hay c¸c m« h×nh gi÷a c¸c biÕn dù b¸o bé cña qu¸ tr×nh không. Khi chất lượng các dự báo không đạt, giá trị dự báo của mô hình phËn ↓ ↓ kém, thì phải quay lại quá trình chẩn đoán. Khi chọn các mô hình, phải Ph©n tÝch cÊu tróc qu¸ tr×nh KiÓm tra c¸c hiểu rằng người nghiên cứu chọn một số kiểu mô hình ít nhiều phù hợp ↓ m« h×nh vμ ph©n tÝch Ph©n lo¹i tr¹ng với kết quả chẩn đoán. sai sè th¸i cña qu¸ tr×nh Một sơ đồ dự báo bất kỳ − đó là mô hình thống kê về sự phát triển ↓ §¸nh gi¸ quá trình. Nó cho khả năng nhìn vào tương lai căn cứ vào lý giải của mô ↓ tÝnh cã thÓ Tæng hîp hình về lịch sử phát triển của quá trình, và sự lý giải này nhiều khi không dù b¸o ®−îc b»ng hoàn toàn phù hợp với dữ liệu thực. Chính điều này dẫn tới những kết Hoμ hîp c¸c kÕt thèng kª qu¶ ph©n tÝch ↓ luận mâu thuẫn, theo đó khó mà phân biệt được tính ích lợi của những sơ ↓ Lý gi¶i dù đồ dự báo các đặc trưng hải dương học. Nguyên nhân của điều này là do Ph¸t biÓu m« h×nh b¸o vμ sai chÈn ®o¸n tèi −u mỗi mô hình có xu thế thích ứng với dự báo một kiểu quá trình nhất định. sè Khi các quá trình tiến triển sang một kiểu khác, thì mô hình không hoạt động được nữa, còn khi lặp lại kiểu quá trình xuất phát, thì nó lại cho kết Ng−êi dïng quả thoả mãn. Còn những mô hình khác thì lại dự báo các kiểu quá trình Hình 0.5. Sơ đồ chức năng chẩn đoán và dự báo các quá trình hải dương "của mình" một cách tốt hơn, nhưng chúng cũng có nhược điểm như vậy: Phân tích thống kê tác động qua lại trực tiếp với lý giải vật lý về không thể dự báo được những quá trình kiểu khác với kiểu nó thích ứng. những kết quả định lượng bộ phận nhận được nhờ áp dụng những phương Từ đó thấy rằng hiệu quả dự báo phụ thuộc không chỉ vào dạng mô pháp riêng rẽ. Nếu lý giải vật lý như vậy chưa đạt thì lặp lại các tính toán 16
  19. hình, mà quan trọng là vào kiểu quá trình được dự báo. Nhiều mô hình dự làm tăng tính khả báo thống kê có vị trí đặc biệt. Muốn tăng tính khả báo báo là những mô hình thích nghi (nguyên tắc thứ hai), và sự thay đổi cấu cần chọn mô hình tối ưu mô tả những quy luật ổn định trong thời gian của trúc của chúng, sự thay thế các tham số mô hình trực tiếp do quá trình sự biến thiên đặc trưng hải dương học được dự báo. Kết hợp một số mô quy định, tức ở đây nảy sinh tác động ảnh hưởng của quá trình tới mô hình khác nhau (bổ sung cho nhau) là một trong những cách làm tăng giới hình. Vì vậy, cần phải làm rõ: trong những tình huống nào thì sử dụng hạn tính khả báo, cũng như tăng độ xác thực của các dự báo. Điều này những mô hình dự báo này hay mô hình dự báo khác là có lợi. khá rõ: mô hình kết hợp phản ánh những đặc điểm cơ bản trong biến động của đặc trưng được dự báo và có thể điều chỉnh trong trường hợp Ta suy ra, trước khi tiến tới dự báo, phải phân tích và phân loại các thay thế kiểu của quá trình được dự báo. quá trình, với quá trình nào thì dự báo thành công, với quá trình nào thì thất bại, làm rõ bản chất vật lý của nó. Khối chẩn đoán phải bao gồm cả Những ước lượng về tính khả báo sẽ giúp sử dụng đúng đắn những chẩn đoán bản chất vật lý của các quá trình, lẫn chẩn đoán mối liên hệ mô hình dự báo trong khi dự báo nghiệp vụ, chọn ra những mô hình bộ của chúng với những phương pháp cụ thể chẩn đoán thống kê và dự báo. phận tối ưu và tối ưu hoá việc kết hợp, xác định và sử dụng khoảng báo Tiếp theo, theo mong muốn của người nghiên cứu, khối chẩn đoán có thể trước hiệu quả của dự báo ứng với độ chính xác đặt ra. bao gồm những mô hình nào mô tả được lớp quá trình một cách tốt nhất Lý giải các dự báo − giai đoạn cuối cùng của dự báo, là thể hiện các theo nghĩa cực tiểu sai số. giá trị dự báo bằng những thuật ngữ của người sử dụng dự báo, chỉ ra Như vậy là khía cạnh phương pháp luận đã trình bày trên đây dẫn tới những ước lượng khoảng tin cậy và giải thích vật lý về sự phát triển của một luận điểm rằng các mô hình dự báo chỉ vận hành với những kiểu quá quá trình đa chiều trong thời khoảng dự báo. trình "của mình", những quá trình này có thể phân biệt theo mức độ tất định và theo tính chất phát triển trong thời gian. Từ đây rút ra một kết luận có tính nguyên tắc rằng: không tồn tại một hệ phương pháp vạn năng duy nhất dự báo các đặc trưng hải dương học. Kết luận này cũng đúng với nhiều quá trình tự nhiên khác [135, 142, 143, 146, 151, 171, 215], điều đó làm cho chúng ta hiểu phải sử dụng đồng thời một số mô hình dự báo. Thủ tục này gọi là kết hợp các dự báo. Nhờ kết hợp mà có thể nâng cao được chất lượng dự báo khí tượng thủy văn [35, 36, 43, 44, 76, 206, 235]. Phương pháp luận xây dựng mô hình dự báo chung (mô hình cộng sinh) quy về bốn giai đoạn tính toán chính: 1) Tuyển chọn các mô hình xuất phát; 2) Lai tạo các mô hình (chọn phương pháp kết hợp); 3) Hiện thực hoá mô hình (ước lượng các tham số); 4) Kiểm chứng mô hình (phân tích so sánh sai số). Trong số những nhiệm vụ chính của dự báo thống kê thì nhiệm vụ 17
nguon tai.lieu . vn