Xem mẫu

  1. NGHIÊN CỨU ỨNG DỤNG KỸ THUẬT TRÍ TUỆ NHÂN TẠO DỰ BÁO ÁP LỰC TIỀN CỐ KẾT CỦA ĐẤT YẾU TẠI MỘT SỐ KHU VỰC Ở ĐỒNG BẰNG BẮC BỘ NGUYỄN ĐỨC MẠNH*, HỒ SỸ AN* NGUYỄN HẢI HÀ*, PHẠM BÁ KHẢI* NGUYỄN ĐÌNH TRUNG*, NGUYỄN ĐÌNH DŨNG* Prediction of pre-consolidation pressure of soft soil using artificial intelligence in some areas of northern delta Vietnam Abstract: Pre-consolidation pressure (Pc) of soft soil in some areas Northern Delta Vietnam has been predicted by using Artificial Intelligence - Machine Learning through 3 models: Support Vector Regression (SVR), Artificial Neural Network Mutilayer Perceptron (ANN MLP), Ridge Regression (RR). Those models were built by Python programming language and Scikit-learn software machine learning library. The data for this study is 159 soft soil samples which were collected from the construction site and full of physico- mechanical properties were achieved from experiments in laboratory at provinces Quang Ninh, Hai Phong, Thai Binh, Nam Dinh, Ninh Binh and Hai Duong. We use 15 physical properties of soil as inputs to analyze correlation with Pc. After removing parameters which have a weak correlation with Pc, we have 6 parameters which is strongly correlated with Pc: upper sampling depth (m), lower sampling depth (m), clay content (%), liquidity index, specific gravity (g/cm3), void ratio. For predicting Pc, the models were built with 70% training set and 30% testing set. Performance of the models were validated by using various statistical measures: Mean Absolute Error (MAE), Root Mean Square Error (RMSE) Correlation coefficient (R) and Coefficient of determination (R2). Results of predicting Pc models show that the performance of the models using different methods is much different where R2-value varies from 0.728 to 0.843. The present study suggested that the ANN-MLP model has the highest predictive capability in 3 models: R2 = 0.843, MAE = 0.143, RMSE = 0.187 and R=0.923. Keywords: artificial neural network mutilayer perceptron (ANN MLP), Artificial Intelligencemachine learning, ridge regression (RR), Pre- consolidation pressure, soft soil, support vector regression (SVR). 1. ĐẶT VẤN ĐỀ * ở độ sâu nào đó phải chịu [1,2,21]. Đây là một Áp lực tiền cố kết (Pc) là áp lực hữu hiệu lớn trong những thông số không thể thiếu khi dự nhất trong quá khứ của lớp đất phủ mà mẫu đất báo lún nền đất yếu cũng nhƣ phục vụ tính toán thiết kế giải pháp xử lý nền đất yếu dƣới tác * Tr ng Đ i học Giao thông vận tải dụng tải trọng đắp, đặc biệt trong xây dựng Số 3 phố Cầu Giấy, P.Láng Thượng, Q.Đống Đa, Hà N i. Email: nguyenducmanh@utc.edu.vn/ đƣờng giao thông [1,2,21,24]. Để có chỉ tiêu syannamanh1998@gmail.com này, phổ biến hiện nay là tiến hành bằng thí 26 ĐỊA KỸ THUẬT SỐ 3 - 2021
  2. nghiệm mẫu đất trong phòng đƣợc lấy từ các l mới có thể dự đoán P c với độ tin cậy cao từ các khoan khảo sát địa kỹ thuật. Tuy nhiên, phƣơng thông số vật lý có đƣợc từ những thí nghiệm của pháp truyền thống này có một hạn chế nhƣ chi các công trình thực tế, tiến tới xây dựng bộ dự phí cao hay kết quả thƣờng có sai số lớn khi liệu lớn trong tƣơng lai về l nh vực này. mẫu đất đƣợc lấy ở độ sâu lớn. Ngoài ra, chất 2. DỮ LIỆU VÀ THUẬT TOÁN SỬ lƣợng bảo quản mẫu đất nguyên trạng, tay nghề DỤNG DỰ BÁO của những ngƣời thực hiện và độ tin cậy của 2.1. Dữ liệu sử dụng thiết bị thí nghiệm cũng ảnh hƣởng không nhỏ Nghiên cứu này, bộ số liệu với đầy đủ các đến kết quả xác định Pc. chỉ tiêu cơ lý xác định trong phòng thí nghiệm Để thay thế cho các thí nghiệm trong phòng sử dụng làm dữ liệu xây dựng mô hình dự báo truyền thống này, một vài mô hình thuật toán dựa từ 159 mẫu đất yếu là bùn sét pha hay sét pha trên kinh nghiệm đã đƣợc phát triển nhằm dự trạng thái chảy đƣợc thu thập từ các công trình đoán Pc hay các thông số đất nền khác [2]. thực tế tin cậy thực hiện bởi các đơn vị uy tín Những mô hình này cơ bản dựa trên việc cải tiến nhƣ TEDI-HECO, TEDI-GIC, CIENCO1… kết phân tích hồi quy. Tuy nhiên, phƣơng pháp hồi hợp một số mẫu thí nghiệm kiểm chứng bổ sung quy này thƣờng bị giới hạn bởi số lƣợng hạn chế đƣợc lấy tại một số khu vực trung vùng nghiên nhất định phƣơng trình tuyến tính hoặc phi tuyến. cứu. Các thông số này đƣợc coi là các biến đầu Ngày nay, trí tuệ nhân tạo (Artificial vào độc lập cho máy học, tƣơng ứng X1, X2, intelligent) hay máy học (Machine learning) đã X3, X4, X5, X6, X7, X8, X9, X10, X11, X12, đƣợc áp dụng rộng rãi trong nhiều l nh vực bao X13, X14, X15 nhằm xác định biến đầu ra phụ gồm cả địa k thuật nhƣ là nhận diện hay dự báo thuộc Pc (Y) (kPa) (Bảng 1). Các thông số của trƣợt lở đất [3-7], dự đoán lũ lụt [8], đánh giá đất đƣợc xem xét sử dụng phân tích trong bài tiềm năng nƣớc ngầm [9, 10] và dự đoán tính báo này bao gồm: độ sâu lấy mẫu trên và dƣới chất vật liệu [11-20]. Trong nghiên cứu này, các (X1, X2, m), hàm lƣợng hạt sét (X3, %), hàm mô hình thuật toán SVR, ANN MLP và RR sử lƣợng hạt bụi (X4, %), giới hạn chảy (X5, %), dụng kết quả thí nghiệm gồm các chỉ tiêu vật lý giới hạn dẻo (X6, %), chỉ số dẻo (X7, %), độ sệt cơ bản của đất làm các biến đầu vào (X) để dự (X8), độ ẩm (X9, %), khối lƣợng thể tích tự báo áp lực tiền cố kết Pc của đất yếu (biến đầu nhiên (X10, g/cm3), khối lƣợng thể tích khô ra, Y) khu vực đồng bằng Bắc Bộ. Kết quả của (X11, g/cm3), khối lƣợng riêng hạt (X12, các mô hình dự báo đƣợc kiểm tra, đánh giá g/cm3), độ r ng (X13, %), độ bão hòa (X14, %), hiệu suất bằng các phƣơng pháp thống kê tiêu hệ số r ng (X15). Thông số dự báo là áp lực tiền chuẩn nhƣ giá trị trung bình của tổng các trị cố kết (Y, kPa). Bộ dữ liệu này đƣợc chia ngẫu tuyệt đối của sai số - Mean Absolute Error nhiên thành hai phần là tập dữ liệu học lấy 70%, (MAE); độ lệch tiêu chuẩn các sai số - Root dùng để tập luyện cho máy và tập dữ liệu kiểm Mean Square Error (RMSE); hệ số tƣơng quan tra sử dụng 30% còn lại nhằm đánh giá hiệu suất R - Correlation coefficient (R); và hệ số xác mô hình. Các mô hình này đƣợc xây dựng trên định - Coefficient of detemination (R2). Kết quả ngôn ngữ lập trình Python và thƣ viện h trợ nghiên cứu cho phép đề xuất một phƣơng pháp Scikit-learn. Bảng 1: Dữ liệu đầu vào và đầu ra sử dụng trong nghi n cứu nà STT Thông số Giá trị lớn nhất Giá trị nhỏ nhất Trung bình Độ lệch ti u chuẩn 1 X1 35,4 0,5 10,76 7,129003 2 X2 36 1,5 11,31465 7,090925 ĐỊA KỸ THUẬT SỐ 3 - 2021 27
  3. STT Thông số Giá trị lớn nhất Giá trị nhỏ nhất Trung bình Độ lệch ti u chuẩn 3 X3 69 4,5 26,96541 11,17561 4 X4 84,9 18 53,05535 13,59445 5 X5 77 21,71 51,09472 12,17120 6 X6 39,96 13,08 26,06862 5,296375 7 X7 47,15 6,11 25,02673 8,561346 8 X8 1,94 0,16 0,857799 0,280667 9 X9 70,65 22,12 46,78126 11,48550 10 X10 2,04 1,52 1,735094 0,113142 11 X11 1,67 0,91 1,194969 0,175484 12 X12 2,76 2,65 2,698176 0,022413 13 X13 66,3 37,23 55,71277 6,479979 14 X14 99,97 84,11 96,79566 2,758104 15 X15 1,967 0,593 1,303403 0,315885 16 Y 282,24 20,58 90,12923 0,549973 Phân tích phân phối 159 mẫu cho 15 thông số hình tiêu biểu 1, 2, 3, 4). Độ lệch tiêu chuẩn lớn là các biến đầu vào (X1-X15) và biến đầu ra (Y) nhất thuộc về thông số hàm lƣợng hạt bụi (X4, độ cho thấy, các thông số cơ lý của các mẫu đất biến lệch tiêu chuẩn 13,59445), nhỏ nhất là khối lƣợng thiên trong khoảng giá trị rất khác nhau (bảng 1 và riêng hạt (X12, độ lệch tiêu chuẩn 0,022413). Hình 1: Biểu đồ biến thiên giá trị Hình 2: Biểu đồ biến thiên giá trị của của độ sâu lấy mẫu trên hàm l ng h t sét Hình 3: Biểu đồ biến thiên giá trị của độ sệt Hình 4: Biểu đồ biến thiên của giá trị Pc t kết quả thí nghiệm mẫu đất 2.2. Công cụ và thuật toán sử dụng Python là một ngôn ngữ lập trình thông dịch Ngôn ngữ lập trình Python và th viện mở (interpreted), hƣớng đối tƣợng (object-oriented), Scikit-learn: và là một ngôn ngữ bậc cao (high-level) ngữ 28 ĐỊA KỸ THUẬT SỐ 3 - 2021
  4. ngh a động (dynamic semantics).. Trình thông phân loại tập dữ liệu thành các lớp riêng biệt dịch Python và thƣ viện chuẩn mở rộng có sẵn [25]. Bằng cách sử dụng “kernal” phi tuyến dƣới dạng mã nguồn hoặc dạng nhị phân miễn SVR ánh xạ không gian đầu vào sang không phí cho tất cả các nền tảng chính và có thể đƣợc gian nhiều chiều hơn [26]. Sau đó, siêu phẳng phân phối tự do [18, 23, 25, 27, 29]. Cùng với tối ƣu đƣợc xác định trong không gian đặc trƣng đó, Scikit-learn là một thƣ viện tài nguyên mở (feature space) bằng cách tối đa hóa biên của dùng cho máy học, cung cấp nhiều công cụ ranh giới các lớp (margins of class boundaries) dùng cho làm khớp mô hình (model fitting), tiền [28]. Các điểm đƣợc huấn luyện (trained points) xử lý dữ liệu (data preprocessing), lựa chọn mô gần nhất với mặt siêu phẳng tối ƣu đƣợc gọi là hình và nhiều tiện ích khác [23,25]. các véc tơ h trợ (support vectors). SVR đƣợc Thuật toán hỗ tr hồi qui V c tơ (Support coi là một trong những kỹ thuật lập mô hình Vector Regression - SVR): chính xác nhất và cũng đƣợc sử dụng rộng rãi H trợ hồi qui Véc tơ (Support Vector trong dự báo sụt trƣợt đất đá. Nghiên cứu này sử Regression - SVR) dựa trên lý thuyết học thống dụng SVR nhƣ một kỹ thuật hồi quy bằng cách kê lần đầu tiên đƣợc giới thiệu bởi Vapnik vào đề xuất một hàm mất mát (loss function) ε- năm 1995 [13, 28, 30]. Nguyên tắc của SVR là không nhạy cảm (ε-insensitive) đƣợc thể hiện xây dựng một mặt siêu phẳng (hyper plane) để trong phƣơng trình sau: Dữ liệu học đƣợc đƣa vào dạng (xi, yi), x ∈ Trong đó w ∈ rN và b ∈ r; w = véc tơ trọng rN, y ∈ r, trong đó x biến đầu vào, y biến đầu số có thể hiệu chỉnh (adjustable weight vector); và ra; rN = N là chiều không gian véc tơ (N - b = ngƣỡng vô hƣớng (scalar threshold). Để độ dimensional vector space); r - một chiều không dốc (slope) của hàm gần đến 0, giá trị của w phải gian véc tơ (r - one dimensional vector space) đƣợc tối thiểu hóa. Điều này có thể đạt đƣợc bằng và ε = vùng l i nhạy cảm (error insensitive cách tối thiểu hóa norm ‖w‖2 = 〈w,w〉. Đây là zone) (hình 5). Thuật toán SVR cho phép xác một bài toán tối ƣu lồi (convex optimization) đƣợc định một hàm có thể ƣớc tính các giá trị trong thể hiện trong phƣơng trình sau: tƣơng lai một cách chính xác [28,30]. Thuật toán hồi quy h trợ véc tơ cho phép hồi quy hàm (3) tuyến tính đƣợc thể hiện trong phƣơng trình sau: Với: (2) Mạng nơ ron nh n tạo đa lớp (Artificial N ural Network Mutilayer Perceptron - ANN MLP): Mạng nơ ron nhân tạo (ANN) là một tập hợp của các nút đƣợc liên kết với nhau nhằm giải thích và giải quyết các vấn đề có mối quan hệ phức tạp giữa các biến độc lập đầu vào và biến phụ thuộc đầu ra [25]. Mạng perceptron đa lớp (Mutilayer Perceptron - MLP) là một trong Hình 5: Sơ đồ nguyên lý thuật toán SVR những mạng nơ ron nhân tạo, hay một trong giải quyết bài toán hồi quy [26] những kỹ thuật mạng nơ ron nhân tạo hiệu quả ĐỊA KỸ THUẬT SỐ 3 - 2021 29
  5. nhất trong mô hình và dự đoán đối tƣợng. Do đó Mô hình Ridge Regression (RR) là phƣơng nó đƣợc sử dụng nhƣ một mô hình chuẩn của pháp áp dụng khi bộ dữ liệu gặp vấn đề về đa nhiều nhà nghiên cứu [25,27]. ANN MLP có cộng tuyến các biến độc lập x có mối liên hệ với khả năng mô phỏng các quá trình phi tuyến và nhau, và ảnh hƣởng lên kết quả dự báo của y, phức tạp của thế giới thực. Về cơ bản, có thể nói hay giải quyết các vấn đề về Overfifting (mô ANN MLP là một mô hình chuyển tiếp bao gồm hình áp dụng tốt cho dữ liệu học (training) một lớp đầu vào, một hay nhiều lớp ẩn và một nhƣng không hoạt động tốt trên dữ liệu kiểm tra lớp đầu ra nhƣ trên hình 6. (test) mà mô hình hồi quy tuyến tính thông thƣờng gặp phải [26,28]. Hình 7: Mối qua hệ đánh đổi giữa bias và variance [27] Hình 6: Minh họa một mô hình ANN MLP với 2 lớp ẩn [25] RR là mô hình hồi quy phân tích mối quan hệ giữa các biến độc lập và biến phụ thuộc sử dụng Số lƣợng của các nút đầu vào phụ thuộc và phƣơng pháp Regularization, điều chỉnh mô các thông số đƣợc lựa chọn trong nguồn dữ liệu hình sao cho giảm thiểu các vấn đề Overfitting, sử dụng để dự báo, và số lƣợng của số nơ ron ẩn tối ƣu hay kiểm soát mức độ phức tạp của mô đƣợc xác định dựa trên tập dữ liệu dùng cho hình để cân đối giữa Thiên vị (Biased) và máy học trong từng trƣờng hợp cụ thể. Số lƣợng Phƣơng sai (Variance), qua đó giảm sai số của lớp ẩn đƣợc sử dụng cho tính toán và lớp đầu ra mô hình. Do vậy, trong nghiên cứu này nhóm đại diện cho mục đích của mô hình. M i nút của tác giả sử dụng mô hình hồi quy sƣờn bên lớp ẩn phải kết nối với tất cả các nút của lớp đầu (Ridge Regression) vào việc dự báo áp lực tiền vào, và m i nút của lớp đầu ra phải đƣợc kết nối cố kết Pc của đất yếu khu vực nghiên cứu. với toàn bộ nút trong các lớp ẩn. Thông qua các 3. LỰA CHỌN THÔNG SỐ ĐẦU VÀO liên kết này, quá trình hoạt động của ANN MLP ĐỂ DỰ BÁO PC có thể chia ra hai bƣớc: truyền thẳng và truyền Tổng cộng 15 thông số đầu vào là các chỉ ngƣợc sử dụng thuật toán truyền ngƣợc [25]. tiêu vật lý của 159 mẫu đất yếu xác định từ thí Trong nghiên cứu này, để dự báo Pc sử dụng nghiệm trong phòng đƣợc lựa chọn (X1-X15). thuật toán ANN MLP có 2 lớp ẩn với số nút lần Tuy nhiên chỉ có một số biến đầu vào có mối lƣợt trong m i lớp ẩn là 8, 10 và sử dụng hàm quan hệ chặt chẽ với thông số cần dự báo Pc (kết kích hoạt Sigmoid. quả đầu ra, hay biến đầu ra Y). Thông qua quá Thuật toán hồi quy s n b n Ridge trình xác định mức độ tƣơng quan giữa 15 chỉ Regression - RR): tiêu vật lý của đất với áp lực tiền cố kết bằng 30 ĐỊA KỸ THUẬT SỐ 3 - 2021
  6. thống kê toán học, cho phép loại bỏ những biến nhiễu (159 mẫu đất có các chỉ tiêu thí nghiệm (chỉ tiêu vật lý) ít hoặc không có quan hệ chặt trong phòng tạo ra 15 thông số đầu vào từ X1 với kết quả đầu ra – biến đầu ra (Pc). Các làm đến X15 là các chỉ tiêu vật lý của đất và biến này cho phép rút ngắn thời gian xử lý của mô đầu ra phụ thuộc Y (Pc)); (2) Loại bỏ các biến hình và đồng thời hiệu suất của mô hình dự báo độc lập có mối quan hệ không chặt với biến phụ cũng sẽ đƣợc cải thiện. thuộc Y (từ 15 biến X ban đầu, sau xử lý rút Sử dụng công cụ “cây hồi qui bổ sung” xuống còn 6 biến X) (hình 8); (3) Tiến hành (Extra Trees Regressor) của thƣ viện Scikit- máy học bằng các thuật toán trí tuệ nhân tạo lựa learn nhằm tạo ra biểu đồ thể hiện trực quan chọn nghiên cứ để dự đoán Pc, đánh giá hiệu mức độ quan trọng của các biến độc lập X đối suất các mô hình dựa vào các thông số RMSE, với biến phụ thuộc Y (Pc) trong mô hình dự báo MAE, R và R2. (hình 8). Hình 9: Sơ đồ xây dựng mô hình máy học để dự báo Pc 4.2. Đánh giá hiệu suất mô hình Hình 8: Mức độ t ơng quan của biến độc lập Một mô hình đƣợc đánh giá tốt khi sử dụng (Xi đối với biến ph thuộc (Y - Pc) sử d ng các biến đầu vào X i cho ra các giá trị dự báo công c Extra Trees Regressor Ypred sát với giá trị của thực tế đã xác định Ytest [27,28,30]. Để đánh giá hiệu suất của các Hình 8 cho thấy, kết quả máy học chỉ ra đƣợc mô hình máy học, ở đây sử dụng các thông số 6 biến độc lập có mối quan hệ chặt chẽ nhất với (1) Root Mean Square Error (RMSE), (2) Pc gồm: X1, X2, X8, X3, X15 và X12, tƣơng ứng là độ sâu lấy mẫu đất trên (m), độ sâu lấy Mean Absolute Error (MAE), (3) Coefficient mẫu đất dƣới (m), và các chỉ tiêu vật lý của đất of Determine (R2 ) và (4) Correlation thí nghiệm trong phòng nhƣ độ sệt, hàm lƣợng Coefficient (R). hạt sét (%), khối lƣợng riêng hạt (g/cm3) và hệ RMSE thể hiện độ lệch tiêu chuẩn các sai số số r ng của đất. của mô hình dự đoán. Nó đƣợc xác định thông 4. THIẾT LẬP MÔ HÌNH VÀ ĐÁNH qua công thức [11]: GIÁ HIỆU SUẤT MÔ HÌNH 4.1. Thiết lập mô hình ; Trong nghiên cứu này, nhóm nghiên cứu trong đó m là số lƣợng mẫu kiểm tra, ytest là thực hiện 3 bƣớc cho mô hình máy học với các thuật toán trí tuệ nhân tạo lựa chọn để dự báo P c giá trị đúng đã xác định của y, ypred là giá trị do của đất yếu khu vực nghiên cứu nhu hình 9, mô hình dự đoán. gồm: (1) Chuẩn bị và tiền xử lý số liệu, loại bỏ MAE là giá trị trung bình của tổng các trị ĐỊA KỸ THUẬT SỐ 3 - 2021 31
  7. tuyệt đối của sai số mà mô hình dự đoán, đƣợc ; xác định thông qua công thức [29,30]: ; trong đó m trong đó m là số lƣợng mẫu kiểm tra, ytest là giá là số lƣợng mẫu kiểm tra, ytest là giá trị đúng trị đúng của y, ypred là giá trị do mô hình dự đoán, là giá trị trung bình của các mẫu đã xác định của y, ypred là giá trị do mô hình kiểm tra, là giá trị trung bình của các mẫu dự đoán. Hệ số xác định R2 là một thông số biến đổi từ dự đoán. 0 đến 1 nhằm thể hiện hiệu suất của mô hình dự 5. KẾT QUẢ DỰ BÁO ÁP LỰC TIỀN CỐ đoán [28]. Nó đƣợc xác định thông qua công KẾT VÀ PHÂN TÍCH Sử dụng 3 mô hình thuật toán SVR, ANN thức: ; trong đó m MLP và RR nhƣ đã giới thiệu trên, với bộ số là số lƣợng mẫu kiểm tra, ytest là giá trị đúng đã liệu sau chuẩn hóa gồm 6 biến độc lập (X1, xác định của y, ypred là giá trị do mô hình dự X2, X3, X8, X12, X15) có tƣơng quan chặt đoán, là giá trị trung bình của các mẫu với P c và tiến hành dự báo theo sơ đồ mô hình kiểm tra. máy học đã xây dựng nhƣ trình bày trên hình Hệ số tƣơng quan R đánh giá tƣơng quan 9, cho phép dự báo đƣợc P c. Kết quả dự báo giữa hai biến số trong quan hệ [30]. R đƣợc thể áp lực tiền cố kết P c của đất yếu khu vực hiện thông qua công thức sau: nghiên cứu đƣợc so sánh với giá trị thực tế thí nghiệm (hình 10, 11 và 12). Hình 10: So sánh giá trị dự đoán với giá trị thật của Pc khi sử d ng mô hình thuật toán SVR Hình 11: So sánh giá trị dự đoán với giá trị thật của Pc khi sử d ng mô hình thuật toán ANN MLP 32 ĐỊA KỸ THUẬT SỐ 3 - 2021
  8. Hình 12: So sánh giá trị dự đoán với giá trị thật của Pc khi sử d ng mô hình thuật toán RR Biểu đồ biến thiên kết quả dự báo Pc so với dự báo đã sử dụng, cụ thể: Khi dự báo Pc bằng giá trị thực thí nghiệm khá tƣơng đồng về hình mô hình SVR thì MAE=0,171, RMSE=0,231, thái, về trị số thậm chí trùng khớp nhau (hình 10, R=0,873, R2=0,760; với mô hình ANN MLP thì 11, 12). Kết quả đánh giá hiệu suất các mô hình MAE=0,143, RMSE=0,186, R=0,923, R2=0,843; sử dụng trong nghiên cứu này thu đƣợc giá trị tốt còn mô hình RR có MAE=0,193, RMSE=0,246, với tất cả các mô hình thuật toán trí tuệ nhân tạo R=0,856, R2=0,728 (bảng 2). Bảng 2: So sánh hiệu suất các mô hình thuật toán AI sử dụng dự báo Pc. STT Mô hình RMSE MAE R R2 1 SVR 0,171 0, 31 0,873 0,760 2 ANN MLP 0,143 0,186 0,923 0,843 3 RR 0,193 0,246 0,856 0,728 Bảng 2 cho thấy, kết quả đánh giá hiệu suất thí nghiệm nén cố kết mẫu đất trong phòng với dự báo của các mô hình trí tuệ nhân tạo sử chi phí khá tốn kém và phức tạp. Để thay thế dụng trong nghiên cứu này RMSE, MAE, R việc thí nghiệm này, một trong 3 mô hình thuật hay R2 đều có giá trị rất tích cực, chứng tỏ toán trí tuệ nhân tạo SVR, ANN-MLP và RR đƣợc độ tin cậy cao khi dự báo P c thông qua hoàn toàn có thể sử dụng để dự báo tốt đƣợc P c một số chỉ tiêu vật lý dễ xác định khác đã có của đất yếu. nhƣ: độ sâu lấy mẫu đất; hàm lƣợng hạt sét Kết quả nghiên cứu chỉ ra rằng, mô hình trong đất; độ sệt của đất; khối lƣợng riêng và ANN-MLP có khả năng dự đoán áp lực tiền cố hệ số r ng của đất. kết Pc của đất yếu tại một số khu vực ở đồng Phân tích hệ số xác định R2, kết quả của các bằng Bắc Bộ là tốt nhất (R2=0,843), trong khi mẫu kiểm tra thay đổi từ 0,728 đến 0,843. Kết các mô hình còn lại cũng thể hiện khả năng dự quả này cho thấy rằng, độ chính xác của cả 3 đoán khá tốt. mô hình thuật toán AI đã sử dụng trong dự đoán Với việc khai thác các nguồn số liệu khảo sát Pc của đất yếu một số khu vực đồng bằng Bắc đất nền từ các công trình thực tế nhiều năm qua, Bộ ở mức khá tốt, và mô hình RR có độ chính việc ứng dụng kỹ thuật trí tuệ nhân tạo để dự xác thấp nhất trong nghiên cứu này (R2=0,728), báo áp lực tiền cố kết của đất yếu nói riêng, các trong khi đó mô hình ANN-MLP đạt hiệu suất thông số đất nền quan trọng nói chung có thể cao nhất trong dự đoán Pc (R2=0,843). xem nhƣ một công cụ thay thế hiệu quả và đầy 6. KẾT LUẬN triển vọng nhằm giảm thời gian, chi phí và sai Áp lực tiền cố kết (Pc) của đất yếu là thông số do phải thí nghiệm xác định chúng trên từng số đất nền không thể thiếu, đƣợc sử dụng để lựa mẫu đất. Dựa trên kết quả của nghiên cứu này, chọn công thức khi phân tích lún cố kết nền đất có thể đề xuất rằng, cả 3 mô hình thuật toán yếu dƣới tác dụng tải trọng đắp. Nó thƣờng SVR, ANN-MLP và RR đều có thể sử dụng là đƣợc xác định bằng đồ giải theo Casagrande từ công cụ hữu dụng trong dự đoán Pc của đất yếu, ĐỊA KỸ THUẬT SỐ 3 - 2021 33
  9. tƣơng ứng các thông số vật lý quan trọng để dự [7]. Jie Dou, Ali P. Yunus, Yueren Xu, đoán Pc gồm: độ sâu lấy mẫu, hàm lƣợng hạt sét, Zhongfan Zhu, Chi-Wen Chen, Mehebub Sahana, độ sệt, khối lƣợng riêng và hệ số r ng. Khabat Khosravi, Yong Yang & Binh Thai Pham LỜI CẢM ƠN (2019), “Torrential rainfall-triggered shallow Nghiên cứu này đƣợc thực hiện với nguồn landslide characteristics and susceptibility kinh phí đƣợc cấp từ Bộ Giáo dục và Đào tạo assessment using ensemble data-driven models in thông qua đề tài mã số B2020-GHA-03 do the Dongjiang Reservoir Watershed, China”, trƣờng Đại học Giao thông vận tải chủ trì. Các Natural Hazards, volume 97, pp.579–609. tác giả xin trân trọng cảm ơn sự h trợ của Vụ http://dx.doi.org/10.1007 /s11069-019-03659-4. Khoa học công nghệ và Môi trƣờng (Bộ Giáo [8]. K. Khosravi, B.T. Pham, K. Chapi, A. dục và Đào tạo), trƣờng Đại học Giao thông vận Shirzadi, H. Shahabi, I. Revhaug, I. Prakash, tải và các đơn vị đã h trợ số liệu phục vụ cho and D. Tien Bui (2018), “A comparative nghiên cứu. assessment of decision trees algorithms for flash flood susceptibility modeling at Haraz TÀI LIỆU THAM KHẢO watershed, northern Iran”, Sci. Total Environ., vol. 627, pp.744-755. [PMID: 29426199] [1]. A. Casagrande (1936), “The determination http://dx.doi.org/10.1016/ j.scitotenv.2018.01.266. of the pre-consolidation load and its practical [9]. B.T. Pham, A. Jaafari, I. Prakash, S.K. significance”, Proceedings of the 1st International Singh, N.K. Quoc, and D.T. Bui (2019), “Hybrid Conference on Soil Mechanics, Harvard, Vol. 3. computational intelligence models for [2]. B. M. Das and K. Sobhan (2013), groundwater potential mapping”, Catena, vol.182, “Principles of Geotechnical Engineering”, .104101. http://dx.doi.org/10.1016/j .catena. Cengage Learning, 726p. 2019.104101. [3]. B.T. Pham (2018), “A novel classifier [10]. S. Miraki, S.H. Zanganeh, K. Chapi, V.P. based on composite hyper-cubes on iterated Singh, A. Shirzadi, and H. Shahabi (2019), random projections for assessment of landslide “Mapping groundwater potential using a novel susceptibility”, Journal of the Geological Society hybrid intelligence approach”, Water Resour. of India, Volume 91, pp.355-362. Manage., vol. 33, pp. 281-302. https://doi.org/10.1007/s12594-018-0862-5. http://dx.doi.org/10.1007/s11269-018-2102-6. [4]. B.T. Pham, I. Prakash, K. Khosravi, K. [11]. D.C. Camilo, L. Lombardo, P.M. Mai, J. Chapi, P.T. Trinh, and T.Q. Ngo (2018), “A Dou, and R. Huser (2017), “Handling high comparison of Support Vector Machines and predictor dimensionality in slope-unit-based Bayesian algorithms for landslide susceptibility landslide susceptibility models through LASSO- modelling”, Journal Geocarto International. 34, penalized Generalized Linear Model”, Environ. pp. 1385-1407. https://doi.org/10.1080/ Model. Softw., vol. 97, pp. 145-156. 10106049.2018.1489422. http://dx.doi.org/10.1016/j.envsoft.2017.08.003. [5]. P.T. Nguyen, T.T. Tuyen, A. Shirzadi, [12]. J. Dou, K-T. Chang, S. Chen, A.P. B.T. Pham, H. Shahabi, and E. Omidvar (2019), Yunus, J-K. Liu, and H. Xia (2015), “Automatic “Development of a Novel Hybrid Intelligence case-based reasoning approach for landslide Approach for Landslide Spatial Prediction”, detection: integration of object-oriented image Applied Sciences (Basel), vol. 9, p. 2824. analysis and a genetic algorithm”, Remote Sens., http://dx.doi.org/10.3390/app9142824. vol. 7, pp. 4318-4342. http://dx.doi.org/ [6]. Q. He, Z. Xu, S. Li, R. Li, S. Zhang, and 10.3390/rs70404318. N. Wang (2019), “Novel Entropy and Rotation [13]. B.T. Pham, T-A. Hoang, D-M. Nguyen, Forest-Based Credal Decision Tree Classifier for and D.T. Bui (2018), “Prediction of shear strength Landslide Susceptibility Modeling”, Entropy of soft soil using machine learning methods”, (Basel), vol. 21, p. 106. http://dx.doi.org/ Catena, vol. 166, pp. 181-191. 10.3390/e21020106. http://dx.doi.org/10.1016/j. catena. 2018.04.004. 34 ĐỊA KỸ THUẬT SỐ 3 - 2021
  10. [14]. P.G. Asteris, K.G. Kolovos, A. Geomorphology, vol. 249, pp. 119-136. Athanasopoulou, V. Plevris, and G. http://dx.doi.org/10.1016/j.geomorph.2015.06.001. Konstantakatos (2019), “Investigation of the [21]. B.M. Das (2007), “Principles of mechanical behaviour of metakaolin-based geotechnical engineering”, Thomson, 666p. sandcrete mixtures”, Eur. J. Environ. Civ. Eng., [22]. B. Sharma, and P.K. Bora (2003), vol. 23, pp. 300-324. http://dx.doi.org/10.1080/ “Plastic limit, liquid limit and undrained shear 19648189.2016.1277373. strength of soil – reappraisal”, J. Geotech. [15]. P.G. Asteris, and K.G. Kolovos (2019), Geoenviron. Eng., vol. 129, pp. 774-777. “Self-compacting concrete strength prediction https://doi.org/10.1061/(ASCE)1090- using surrogate models”, Neural Comput. Appl., 0241(2003)129:8(774). vol. 24, No. 2, pp. 137-150. http://dx.doi.org/ [23]. Manh Duc Nguyen, Binh Thai Pham, Tran 10.1007/s00521-017-3007-7. Thi Tuyen, Hoang Phan Hai Yen, Indra Prakash, [16]. P.G. Asteris, A. Moropoulou, A.D. Thanh Tien Vu, Kamran Chapi, Ataollah Shirzadi, Skentou, M. Apostolopoulou, A. Mohebkhah, and Himan Shahabi, Jie Dou, Nguyen Kim Quoc and L. Cavaleri (2019), “Stochastic Vulnerability Dieu Tien Bui (2019), “Development of an Artificial Assessment of Masonry Structures: Concepts, Intelligence Approach for Prediction of Modeling and Restoration Aspects”, Appl. Sci. Consolidation Coefficient of Soft Soil: A Sensitivity (Basel), vol. 9, p. 243. http://dx.doi.org/ Analysis”, The Open Construction and Building 10.3390/app9020243. Technology Journal, Volume 13, pp.178-188. [17]. H. Chen, P.G. Asteris, D. Jahed https://doi.org/ 10.2174/ 1874836801913010178. Armaghani, B. Gordan, and B.T. Pham (2019), [24]. J. A. Knappett and R. F. Craig (2012), “Assessing dynamic conditions of the retaining “Craig’s Soil Mechanics”, CRC Press, 584p. wall: Developing two hybrid intelligent [25]. https://www.python.org/doc/essays/blurb/ models”, Appl. Sci. (Basel), vol. 9, p. 1042. [26]. Debasish Basak, Srimanta Pal and Dipak http://dx.doi.org/ 10.3390/ app9061042. Chandra Patranabis (2007), “Support vector [18]. P. Sarir, J. Chen, P.G. Asteris, D.J. regression”, Neural Information Processing – Armaghani, and M. Tahir (2019), "Developing Letters and Reviews, Vol. 11, No. 10, pp.203. GEP tree-based, neuro-swarm, and whale [27]. Binh Thai Pham, Manh Duc Nguyen, optimization models for evaluation of bearing Kien-Trinh Thi Bui, Indra Prakashd, Kamran capacity of concrete-filled steel tube columns", Chapie, Dieu Tien Bui (2019), “A novel artificial Eng. Comput., pp. 1-19. http://dx.doi.org/ intelligence approach based on Multi-layer 10.1007/s00366-019-00808-y. Perceptron Neural Network and Biogeography- [19]. V. Rodriguez-Galiano, M. Sanchez- based Optimization for predicting coefficient of Castillo, M. Chica-Olmo, and M. Chica-Rivas consolidation of soil”, (2015), “Machine learning predictive models for CATENA, Vol. 166. pp.181-191, https://doi.org/ mineral prospectivity: An evaluation of neural 10.1016/j.catena.2018.04.004. networks, random forest, regression trees and [28]. https://bigdatauni.com/vi/tin-tuc/tong- support vector machines”, Ore Geol. Rev., vol. 71, quan-ve-regression-phan-tich-hoi-quy.html pp. 804-818. http://dx.doi.org/ [29]. Michael Bowles (2015), “Machine Learning 10.1016/j.oregeorev.2015.01.001. in Python”, John Wiley & Sons, Inc, 360p. [20]. A. Trigila, C. Iadanza, C. Esposito, and [30]. Sebastian Raschka and Vahid Mirjalili G. Scarascia-Mugnozza (2015), “Comparison of (2017), “Machine Learning and Deep Learning Logistic Regression and Random Forests with Python, scikit-learn, and TensorFlow”, Packt techniques for shallow landslide susceptibility Publishing, 622p. assessment in Giampilieri (NE Sicily, Italy)”, Ng i phản biện: TS. NGUYỄN HIẾU CƢỜNG ĐỊA KỸ THUẬT SỐ 3 - 2021 35
nguon tai.lieu . vn