- Trang Chủ
- Địa Lý
- Nghiên cứu ứng dụng kỹ thuật trí tuệ nhân tạo dự báo áp lực tiền cố kết của đất yếu tại một số khu vực ở đồng bằng Bắc Bộ
Xem mẫu
- NGHIÊN CỨU ỨNG DỤNG KỸ THUẬT TRÍ TUỆ NHÂN TẠO
DỰ BÁO ÁP LỰC TIỀN CỐ KẾT CỦA ĐẤT YẾU TẠI MỘT SỐ
KHU VỰC Ở ĐỒNG BẰNG BẮC BỘ
NGUYỄN ĐỨC MẠNH*, HỒ SỸ AN*
NGUYỄN HẢI HÀ*, PHẠM BÁ KHẢI*
NGUYỄN ĐÌNH TRUNG*, NGUYỄN ĐÌNH DŨNG*
Prediction of pre-consolidation pressure of soft soil using artificial
intelligence in some areas of northern delta Vietnam
Abstract: Pre-consolidation pressure (Pc) of soft soil in some areas Northern
Delta Vietnam has been predicted by using Artificial Intelligence - Machine
Learning through 3 models: Support Vector Regression (SVR), Artificial
Neural Network Mutilayer Perceptron (ANN MLP), Ridge Regression (RR).
Those models were built by Python programming language and Scikit-learn
software machine learning library. The data for this study is 159 soft soil
samples which were collected from the construction site and full of physico-
mechanical properties were achieved from experiments in laboratory at
provinces Quang Ninh, Hai Phong, Thai Binh, Nam Dinh, Ninh Binh and Hai
Duong. We use 15 physical properties of soil as inputs to analyze correlation
with Pc. After removing parameters which have a weak correlation with Pc, we
have 6 parameters which is strongly correlated with Pc: upper sampling depth
(m), lower sampling depth (m), clay content (%), liquidity index, specific
gravity (g/cm3), void ratio. For predicting Pc, the models were built with 70%
training set and 30% testing set. Performance of the models were validated by
using various statistical measures: Mean Absolute Error (MAE), Root Mean
Square Error (RMSE) Correlation coefficient (R) and Coefficient of
determination (R2). Results of predicting Pc models show that the performance
of the models using different methods is much different where R2-value varies
from 0.728 to 0.843. The present study suggested that the ANN-MLP model has
the highest predictive capability in 3 models: R2 = 0.843, MAE = 0.143, RMSE
= 0.187 and R=0.923.
Keywords: artificial neural network mutilayer perceptron (ANN MLP),
Artificial Intelligencemachine learning, ridge regression (RR), Pre-
consolidation pressure, soft soil, support vector regression (SVR).
1. ĐẶT VẤN ĐỀ * ở độ sâu nào đó phải chịu [1,2,21]. Đây là một
Áp lực tiền cố kết (Pc) là áp lực hữu hiệu lớn trong những thông số không thể thiếu khi dự
nhất trong quá khứ của lớp đất phủ mà mẫu đất báo lún nền đất yếu cũng nhƣ phục vụ tính toán
thiết kế giải pháp xử lý nền đất yếu dƣới tác
*
Tr ng Đ i học Giao thông vận tải dụng tải trọng đắp, đặc biệt trong xây dựng
Số 3 phố Cầu Giấy, P.Láng Thượng, Q.Đống Đa, Hà N i.
Email: nguyenducmanh@utc.edu.vn/
đƣờng giao thông [1,2,21,24]. Để có chỉ tiêu
syannamanh1998@gmail.com này, phổ biến hiện nay là tiến hành bằng thí
26 ĐỊA KỸ THUẬT SỐ 3 - 2021
- nghiệm mẫu đất trong phòng đƣợc lấy từ các l mới có thể dự đoán P c với độ tin cậy cao từ các
khoan khảo sát địa kỹ thuật. Tuy nhiên, phƣơng thông số vật lý có đƣợc từ những thí nghiệm của
pháp truyền thống này có một hạn chế nhƣ chi các công trình thực tế, tiến tới xây dựng bộ dự
phí cao hay kết quả thƣờng có sai số lớn khi liệu lớn trong tƣơng lai về l nh vực này.
mẫu đất đƣợc lấy ở độ sâu lớn. Ngoài ra, chất 2. DỮ LIỆU VÀ THUẬT TOÁN SỬ
lƣợng bảo quản mẫu đất nguyên trạng, tay nghề DỤNG DỰ BÁO
của những ngƣời thực hiện và độ tin cậy của 2.1. Dữ liệu sử dụng
thiết bị thí nghiệm cũng ảnh hƣởng không nhỏ Nghiên cứu này, bộ số liệu với đầy đủ các
đến kết quả xác định Pc. chỉ tiêu cơ lý xác định trong phòng thí nghiệm
Để thay thế cho các thí nghiệm trong phòng sử dụng làm dữ liệu xây dựng mô hình dự báo
truyền thống này, một vài mô hình thuật toán dựa từ 159 mẫu đất yếu là bùn sét pha hay sét pha
trên kinh nghiệm đã đƣợc phát triển nhằm dự trạng thái chảy đƣợc thu thập từ các công trình
đoán Pc hay các thông số đất nền khác [2]. thực tế tin cậy thực hiện bởi các đơn vị uy tín
Những mô hình này cơ bản dựa trên việc cải tiến nhƣ TEDI-HECO, TEDI-GIC, CIENCO1… kết
phân tích hồi quy. Tuy nhiên, phƣơng pháp hồi hợp một số mẫu thí nghiệm kiểm chứng bổ sung
quy này thƣờng bị giới hạn bởi số lƣợng hạn chế đƣợc lấy tại một số khu vực trung vùng nghiên
nhất định phƣơng trình tuyến tính hoặc phi tuyến. cứu. Các thông số này đƣợc coi là các biến đầu
Ngày nay, trí tuệ nhân tạo (Artificial vào độc lập cho máy học, tƣơng ứng X1, X2,
intelligent) hay máy học (Machine learning) đã X3, X4, X5, X6, X7, X8, X9, X10, X11, X12,
đƣợc áp dụng rộng rãi trong nhiều l nh vực bao X13, X14, X15 nhằm xác định biến đầu ra phụ
gồm cả địa k thuật nhƣ là nhận diện hay dự báo thuộc Pc (Y) (kPa) (Bảng 1). Các thông số của
trƣợt lở đất [3-7], dự đoán lũ lụt [8], đánh giá đất đƣợc xem xét sử dụng phân tích trong bài
tiềm năng nƣớc ngầm [9, 10] và dự đoán tính báo này bao gồm: độ sâu lấy mẫu trên và dƣới
chất vật liệu [11-20]. Trong nghiên cứu này, các (X1, X2, m), hàm lƣợng hạt sét (X3, %), hàm
mô hình thuật toán SVR, ANN MLP và RR sử lƣợng hạt bụi (X4, %), giới hạn chảy (X5, %),
dụng kết quả thí nghiệm gồm các chỉ tiêu vật lý giới hạn dẻo (X6, %), chỉ số dẻo (X7, %), độ sệt
cơ bản của đất làm các biến đầu vào (X) để dự (X8), độ ẩm (X9, %), khối lƣợng thể tích tự
báo áp lực tiền cố kết Pc của đất yếu (biến đầu nhiên (X10, g/cm3), khối lƣợng thể tích khô
ra, Y) khu vực đồng bằng Bắc Bộ. Kết quả của (X11, g/cm3), khối lƣợng riêng hạt (X12,
các mô hình dự báo đƣợc kiểm tra, đánh giá g/cm3), độ r ng (X13, %), độ bão hòa (X14, %),
hiệu suất bằng các phƣơng pháp thống kê tiêu hệ số r ng (X15). Thông số dự báo là áp lực tiền
chuẩn nhƣ giá trị trung bình của tổng các trị cố kết (Y, kPa). Bộ dữ liệu này đƣợc chia ngẫu
tuyệt đối của sai số - Mean Absolute Error nhiên thành hai phần là tập dữ liệu học lấy 70%,
(MAE); độ lệch tiêu chuẩn các sai số - Root dùng để tập luyện cho máy và tập dữ liệu kiểm
Mean Square Error (RMSE); hệ số tƣơng quan tra sử dụng 30% còn lại nhằm đánh giá hiệu suất
R - Correlation coefficient (R); và hệ số xác mô hình. Các mô hình này đƣợc xây dựng trên
định - Coefficient of detemination (R2). Kết quả ngôn ngữ lập trình Python và thƣ viện h trợ
nghiên cứu cho phép đề xuất một phƣơng pháp Scikit-learn.
Bảng 1: Dữ liệu đầu vào và đầu ra sử dụng trong nghi n cứu nà
STT Thông số Giá trị lớn nhất Giá trị nhỏ nhất Trung bình Độ lệch ti u chuẩn
1 X1 35,4 0,5 10,76 7,129003
2 X2 36 1,5 11,31465 7,090925
ĐỊA KỸ THUẬT SỐ 3 - 2021 27
- STT Thông số Giá trị lớn nhất Giá trị nhỏ nhất Trung bình Độ lệch ti u chuẩn
3 X3 69 4,5 26,96541 11,17561
4 X4 84,9 18 53,05535 13,59445
5 X5 77 21,71 51,09472 12,17120
6 X6 39,96 13,08 26,06862 5,296375
7 X7 47,15 6,11 25,02673 8,561346
8 X8 1,94 0,16 0,857799 0,280667
9 X9 70,65 22,12 46,78126 11,48550
10 X10 2,04 1,52 1,735094 0,113142
11 X11 1,67 0,91 1,194969 0,175484
12 X12 2,76 2,65 2,698176 0,022413
13 X13 66,3 37,23 55,71277 6,479979
14 X14 99,97 84,11 96,79566 2,758104
15 X15 1,967 0,593 1,303403 0,315885
16 Y 282,24 20,58 90,12923 0,549973
Phân tích phân phối 159 mẫu cho 15 thông số hình tiêu biểu 1, 2, 3, 4). Độ lệch tiêu chuẩn lớn
là các biến đầu vào (X1-X15) và biến đầu ra (Y) nhất thuộc về thông số hàm lƣợng hạt bụi (X4, độ
cho thấy, các thông số cơ lý của các mẫu đất biến lệch tiêu chuẩn 13,59445), nhỏ nhất là khối lƣợng
thiên trong khoảng giá trị rất khác nhau (bảng 1 và riêng hạt (X12, độ lệch tiêu chuẩn 0,022413).
Hình 1: Biểu đồ biến thiên giá trị Hình 2: Biểu đồ biến thiên giá trị của
của độ sâu lấy mẫu trên hàm l ng h t sét
Hình 3: Biểu đồ biến thiên giá trị của độ sệt Hình 4: Biểu đồ biến thiên của giá trị Pc
t kết quả thí nghiệm mẫu đất
2.2. Công cụ và thuật toán sử dụng Python là một ngôn ngữ lập trình thông dịch
Ngôn ngữ lập trình Python và th viện mở (interpreted), hƣớng đối tƣợng (object-oriented),
Scikit-learn: và là một ngôn ngữ bậc cao (high-level) ngữ
28 ĐỊA KỸ THUẬT SỐ 3 - 2021
- ngh a động (dynamic semantics).. Trình thông phân loại tập dữ liệu thành các lớp riêng biệt
dịch Python và thƣ viện chuẩn mở rộng có sẵn [25]. Bằng cách sử dụng “kernal” phi tuyến
dƣới dạng mã nguồn hoặc dạng nhị phân miễn SVR ánh xạ không gian đầu vào sang không
phí cho tất cả các nền tảng chính và có thể đƣợc gian nhiều chiều hơn [26]. Sau đó, siêu phẳng
phân phối tự do [18, 23, 25, 27, 29]. Cùng với tối ƣu đƣợc xác định trong không gian đặc trƣng
đó, Scikit-learn là một thƣ viện tài nguyên mở (feature space) bằng cách tối đa hóa biên của
dùng cho máy học, cung cấp nhiều công cụ ranh giới các lớp (margins of class boundaries)
dùng cho làm khớp mô hình (model fitting), tiền [28]. Các điểm đƣợc huấn luyện (trained points)
xử lý dữ liệu (data preprocessing), lựa chọn mô gần nhất với mặt siêu phẳng tối ƣu đƣợc gọi là
hình và nhiều tiện ích khác [23,25]. các véc tơ h trợ (support vectors). SVR đƣợc
Thuật toán hỗ tr hồi qui V c tơ (Support coi là một trong những kỹ thuật lập mô hình
Vector Regression - SVR): chính xác nhất và cũng đƣợc sử dụng rộng rãi
H trợ hồi qui Véc tơ (Support Vector trong dự báo sụt trƣợt đất đá. Nghiên cứu này sử
Regression - SVR) dựa trên lý thuyết học thống dụng SVR nhƣ một kỹ thuật hồi quy bằng cách
kê lần đầu tiên đƣợc giới thiệu bởi Vapnik vào đề xuất một hàm mất mát (loss function) ε-
năm 1995 [13, 28, 30]. Nguyên tắc của SVR là không nhạy cảm (ε-insensitive) đƣợc thể hiện
xây dựng một mặt siêu phẳng (hyper plane) để trong phƣơng trình sau:
Dữ liệu học đƣợc đƣa vào dạng (xi, yi), x ∈ Trong đó w ∈ rN và b ∈ r; w = véc tơ trọng
rN, y ∈ r, trong đó x biến đầu vào, y biến đầu số có thể hiệu chỉnh (adjustable weight vector); và
ra; rN = N là chiều không gian véc tơ (N - b = ngƣỡng vô hƣớng (scalar threshold). Để độ
dimensional vector space); r - một chiều không dốc (slope) của hàm gần đến 0, giá trị của w phải
gian véc tơ (r - one dimensional vector space) đƣợc tối thiểu hóa. Điều này có thể đạt đƣợc bằng
và ε = vùng l i nhạy cảm (error insensitive cách tối thiểu hóa norm ‖w‖2 = 〈w,w〉. Đây là
zone) (hình 5). Thuật toán SVR cho phép xác một bài toán tối ƣu lồi (convex optimization) đƣợc
định một hàm có thể ƣớc tính các giá trị trong thể hiện trong phƣơng trình sau:
tƣơng lai một cách chính xác [28,30]. Thuật
toán hồi quy h trợ véc tơ cho phép hồi quy hàm (3)
tuyến tính đƣợc thể hiện trong phƣơng trình sau: Với:
(2)
Mạng nơ ron nh n tạo đa lớp (Artificial N ural
Network Mutilayer Perceptron - ANN MLP):
Mạng nơ ron nhân tạo (ANN) là một tập hợp
của các nút đƣợc liên kết với nhau nhằm giải
thích và giải quyết các vấn đề có mối quan hệ
phức tạp giữa các biến độc lập đầu vào và biến
phụ thuộc đầu ra [25]. Mạng perceptron đa lớp
(Mutilayer Perceptron - MLP) là một trong
Hình 5: Sơ đồ nguyên lý thuật toán SVR những mạng nơ ron nhân tạo, hay một trong
giải quyết bài toán hồi quy [26] những kỹ thuật mạng nơ ron nhân tạo hiệu quả
ĐỊA KỸ THUẬT SỐ 3 - 2021 29
- nhất trong mô hình và dự đoán đối tƣợng. Do đó Mô hình Ridge Regression (RR) là phƣơng
nó đƣợc sử dụng nhƣ một mô hình chuẩn của pháp áp dụng khi bộ dữ liệu gặp vấn đề về đa
nhiều nhà nghiên cứu [25,27]. ANN MLP có cộng tuyến các biến độc lập x có mối liên hệ với
khả năng mô phỏng các quá trình phi tuyến và nhau, và ảnh hƣởng lên kết quả dự báo của y,
phức tạp của thế giới thực. Về cơ bản, có thể nói hay giải quyết các vấn đề về Overfifting (mô
ANN MLP là một mô hình chuyển tiếp bao gồm hình áp dụng tốt cho dữ liệu học (training)
một lớp đầu vào, một hay nhiều lớp ẩn và một nhƣng không hoạt động tốt trên dữ liệu kiểm tra
lớp đầu ra nhƣ trên hình 6. (test) mà mô hình hồi quy tuyến tính thông
thƣờng gặp phải [26,28].
Hình 7: Mối qua hệ đánh đổi giữa bias
và variance [27]
Hình 6: Minh họa một mô hình ANN MLP
với 2 lớp ẩn [25] RR là mô hình hồi quy phân tích mối quan hệ
giữa các biến độc lập và biến phụ thuộc sử dụng
Số lƣợng của các nút đầu vào phụ thuộc và phƣơng pháp Regularization, điều chỉnh mô
các thông số đƣợc lựa chọn trong nguồn dữ liệu hình sao cho giảm thiểu các vấn đề Overfitting,
sử dụng để dự báo, và số lƣợng của số nơ ron ẩn tối ƣu hay kiểm soát mức độ phức tạp của mô
đƣợc xác định dựa trên tập dữ liệu dùng cho hình để cân đối giữa Thiên vị (Biased) và
máy học trong từng trƣờng hợp cụ thể. Số lƣợng Phƣơng sai (Variance), qua đó giảm sai số của
lớp ẩn đƣợc sử dụng cho tính toán và lớp đầu ra mô hình. Do vậy, trong nghiên cứu này nhóm
đại diện cho mục đích của mô hình. M i nút của tác giả sử dụng mô hình hồi quy sƣờn bên
lớp ẩn phải kết nối với tất cả các nút của lớp đầu (Ridge Regression) vào việc dự báo áp lực tiền
vào, và m i nút của lớp đầu ra phải đƣợc kết nối cố kết Pc của đất yếu khu vực nghiên cứu.
với toàn bộ nút trong các lớp ẩn. Thông qua các 3. LỰA CHỌN THÔNG SỐ ĐẦU VÀO
liên kết này, quá trình hoạt động của ANN MLP ĐỂ DỰ BÁO PC
có thể chia ra hai bƣớc: truyền thẳng và truyền Tổng cộng 15 thông số đầu vào là các chỉ
ngƣợc sử dụng thuật toán truyền ngƣợc [25]. tiêu vật lý của 159 mẫu đất yếu xác định từ thí
Trong nghiên cứu này, để dự báo Pc sử dụng nghiệm trong phòng đƣợc lựa chọn (X1-X15).
thuật toán ANN MLP có 2 lớp ẩn với số nút lần Tuy nhiên chỉ có một số biến đầu vào có mối
lƣợt trong m i lớp ẩn là 8, 10 và sử dụng hàm quan hệ chặt chẽ với thông số cần dự báo Pc (kết
kích hoạt Sigmoid. quả đầu ra, hay biến đầu ra Y). Thông qua quá
Thuật toán hồi quy s n b n Ridge trình xác định mức độ tƣơng quan giữa 15 chỉ
Regression - RR): tiêu vật lý của đất với áp lực tiền cố kết bằng
30 ĐỊA KỸ THUẬT SỐ 3 - 2021
- thống kê toán học, cho phép loại bỏ những biến nhiễu (159 mẫu đất có các chỉ tiêu thí nghiệm
(chỉ tiêu vật lý) ít hoặc không có quan hệ chặt trong phòng tạo ra 15 thông số đầu vào từ X1
với kết quả đầu ra – biến đầu ra (Pc). Các làm đến X15 là các chỉ tiêu vật lý của đất và biến
này cho phép rút ngắn thời gian xử lý của mô đầu ra phụ thuộc Y (Pc)); (2) Loại bỏ các biến
hình và đồng thời hiệu suất của mô hình dự báo độc lập có mối quan hệ không chặt với biến phụ
cũng sẽ đƣợc cải thiện. thuộc Y (từ 15 biến X ban đầu, sau xử lý rút
Sử dụng công cụ “cây hồi qui bổ sung” xuống còn 6 biến X) (hình 8); (3) Tiến hành
(Extra Trees Regressor) của thƣ viện Scikit- máy học bằng các thuật toán trí tuệ nhân tạo lựa
learn nhằm tạo ra biểu đồ thể hiện trực quan chọn nghiên cứ để dự đoán Pc, đánh giá hiệu
mức độ quan trọng của các biến độc lập X đối suất các mô hình dựa vào các thông số RMSE,
với biến phụ thuộc Y (Pc) trong mô hình dự báo MAE, R và R2.
(hình 8).
Hình 9: Sơ đồ xây dựng mô hình máy học để
dự báo Pc
4.2. Đánh giá hiệu suất mô hình
Hình 8: Mức độ t ơng quan của biến độc lập Một mô hình đƣợc đánh giá tốt khi sử dụng
(Xi đối với biến ph thuộc (Y - Pc) sử d ng các biến đầu vào X i cho ra các giá trị dự báo
công c Extra Trees Regressor Ypred sát với giá trị của thực tế đã xác định
Ytest [27,28,30]. Để đánh giá hiệu suất của các
Hình 8 cho thấy, kết quả máy học chỉ ra đƣợc
mô hình máy học, ở đây sử dụng các thông số
6 biến độc lập có mối quan hệ chặt chẽ nhất với
(1) Root Mean Square Error (RMSE), (2)
Pc gồm: X1, X2, X8, X3, X15 và X12, tƣơng
ứng là độ sâu lấy mẫu đất trên (m), độ sâu lấy Mean Absolute Error (MAE), (3) Coefficient
mẫu đất dƣới (m), và các chỉ tiêu vật lý của đất of Determine (R2 ) và (4) Correlation
thí nghiệm trong phòng nhƣ độ sệt, hàm lƣợng Coefficient (R).
hạt sét (%), khối lƣợng riêng hạt (g/cm3) và hệ RMSE thể hiện độ lệch tiêu chuẩn các sai số
số r ng của đất. của mô hình dự đoán. Nó đƣợc xác định thông
4. THIẾT LẬP MÔ HÌNH VÀ ĐÁNH
qua công thức [11]:
GIÁ HIỆU SUẤT MÔ HÌNH
4.1. Thiết lập mô hình ;
Trong nghiên cứu này, nhóm nghiên cứu
trong đó m là số lƣợng mẫu kiểm tra, ytest là
thực hiện 3 bƣớc cho mô hình máy học với các
thuật toán trí tuệ nhân tạo lựa chọn để dự báo P c giá trị đúng đã xác định của y, ypred là giá trị do
của đất yếu khu vực nghiên cứu nhu hình 9, mô hình dự đoán.
gồm: (1) Chuẩn bị và tiền xử lý số liệu, loại bỏ MAE là giá trị trung bình của tổng các trị
ĐỊA KỸ THUẬT SỐ 3 - 2021 31
- tuyệt đối của sai số mà mô hình dự đoán, đƣợc ;
xác định thông qua công thức [29,30]:
; trong đó m trong đó m là số lƣợng mẫu kiểm tra, ytest là giá
là số lƣợng mẫu kiểm tra, ytest là giá trị đúng trị đúng của y, ypred là giá trị do mô hình dự
đoán, là giá trị trung bình của các mẫu
đã xác định của y, ypred là giá trị do mô hình
kiểm tra, là giá trị trung bình của các mẫu
dự đoán.
Hệ số xác định R2 là một thông số biến đổi từ dự đoán.
0 đến 1 nhằm thể hiện hiệu suất của mô hình dự 5. KẾT QUẢ DỰ BÁO ÁP LỰC TIỀN CỐ
đoán [28]. Nó đƣợc xác định thông qua công KẾT VÀ PHÂN TÍCH
Sử dụng 3 mô hình thuật toán SVR, ANN
thức: ; trong đó m
MLP và RR nhƣ đã giới thiệu trên, với bộ số
là số lƣợng mẫu kiểm tra, ytest là giá trị đúng đã liệu sau chuẩn hóa gồm 6 biến độc lập (X1,
xác định của y, ypred là giá trị do mô hình dự X2, X3, X8, X12, X15) có tƣơng quan chặt
đoán, là giá trị trung bình của các mẫu với P c và tiến hành dự báo theo sơ đồ mô hình
kiểm tra. máy học đã xây dựng nhƣ trình bày trên hình
Hệ số tƣơng quan R đánh giá tƣơng quan 9, cho phép dự báo đƣợc P c. Kết quả dự báo
giữa hai biến số trong quan hệ [30]. R đƣợc thể áp lực tiền cố kết P c của đất yếu khu vực
hiện thông qua công thức sau: nghiên cứu đƣợc so sánh với giá trị thực tế thí
nghiệm (hình 10, 11 và 12).
Hình 10: So sánh giá trị dự đoán với giá trị thật của Pc khi sử d ng mô hình thuật toán SVR
Hình 11: So sánh giá trị dự đoán với giá trị thật của Pc khi sử d ng mô hình thuật toán ANN MLP
32 ĐỊA KỸ THUẬT SỐ 3 - 2021
- Hình 12: So sánh giá trị dự đoán với giá trị thật của Pc khi sử d ng mô hình thuật toán RR
Biểu đồ biến thiên kết quả dự báo Pc so với dự báo đã sử dụng, cụ thể: Khi dự báo Pc bằng
giá trị thực thí nghiệm khá tƣơng đồng về hình mô hình SVR thì MAE=0,171, RMSE=0,231,
thái, về trị số thậm chí trùng khớp nhau (hình 10, R=0,873, R2=0,760; với mô hình ANN MLP thì
11, 12). Kết quả đánh giá hiệu suất các mô hình MAE=0,143, RMSE=0,186, R=0,923, R2=0,843;
sử dụng trong nghiên cứu này thu đƣợc giá trị tốt còn mô hình RR có MAE=0,193, RMSE=0,246,
với tất cả các mô hình thuật toán trí tuệ nhân tạo R=0,856, R2=0,728 (bảng 2).
Bảng 2: So sánh hiệu suất các mô hình thuật toán AI sử dụng dự báo Pc.
STT Mô hình RMSE MAE R R2
1 SVR 0,171 0, 31 0,873 0,760
2 ANN MLP 0,143 0,186 0,923 0,843
3 RR 0,193 0,246 0,856 0,728
Bảng 2 cho thấy, kết quả đánh giá hiệu suất thí nghiệm nén cố kết mẫu đất trong phòng với
dự báo của các mô hình trí tuệ nhân tạo sử chi phí khá tốn kém và phức tạp. Để thay thế
dụng trong nghiên cứu này RMSE, MAE, R việc thí nghiệm này, một trong 3 mô hình thuật
hay R2 đều có giá trị rất tích cực, chứng tỏ toán trí tuệ nhân tạo SVR, ANN-MLP và RR
đƣợc độ tin cậy cao khi dự báo P c thông qua hoàn toàn có thể sử dụng để dự báo tốt đƣợc P c
một số chỉ tiêu vật lý dễ xác định khác đã có của đất yếu.
nhƣ: độ sâu lấy mẫu đất; hàm lƣợng hạt sét Kết quả nghiên cứu chỉ ra rằng, mô hình
trong đất; độ sệt của đất; khối lƣợng riêng và ANN-MLP có khả năng dự đoán áp lực tiền cố
hệ số r ng của đất. kết Pc của đất yếu tại một số khu vực ở đồng
Phân tích hệ số xác định R2, kết quả của các bằng Bắc Bộ là tốt nhất (R2=0,843), trong khi
mẫu kiểm tra thay đổi từ 0,728 đến 0,843. Kết các mô hình còn lại cũng thể hiện khả năng dự
quả này cho thấy rằng, độ chính xác của cả 3 đoán khá tốt.
mô hình thuật toán AI đã sử dụng trong dự đoán Với việc khai thác các nguồn số liệu khảo sát
Pc của đất yếu một số khu vực đồng bằng Bắc đất nền từ các công trình thực tế nhiều năm qua,
Bộ ở mức khá tốt, và mô hình RR có độ chính việc ứng dụng kỹ thuật trí tuệ nhân tạo để dự
xác thấp nhất trong nghiên cứu này (R2=0,728), báo áp lực tiền cố kết của đất yếu nói riêng, các
trong khi đó mô hình ANN-MLP đạt hiệu suất thông số đất nền quan trọng nói chung có thể
cao nhất trong dự đoán Pc (R2=0,843). xem nhƣ một công cụ thay thế hiệu quả và đầy
6. KẾT LUẬN triển vọng nhằm giảm thời gian, chi phí và sai
Áp lực tiền cố kết (Pc) của đất yếu là thông số do phải thí nghiệm xác định chúng trên từng
số đất nền không thể thiếu, đƣợc sử dụng để lựa mẫu đất. Dựa trên kết quả của nghiên cứu này,
chọn công thức khi phân tích lún cố kết nền đất có thể đề xuất rằng, cả 3 mô hình thuật toán
yếu dƣới tác dụng tải trọng đắp. Nó thƣờng SVR, ANN-MLP và RR đều có thể sử dụng là
đƣợc xác định bằng đồ giải theo Casagrande từ công cụ hữu dụng trong dự đoán Pc của đất yếu,
ĐỊA KỸ THUẬT SỐ 3 - 2021 33
- tƣơng ứng các thông số vật lý quan trọng để dự [7]. Jie Dou, Ali P. Yunus, Yueren Xu,
đoán Pc gồm: độ sâu lấy mẫu, hàm lƣợng hạt sét, Zhongfan Zhu, Chi-Wen Chen, Mehebub Sahana,
độ sệt, khối lƣợng riêng và hệ số r ng. Khabat Khosravi, Yong Yang & Binh Thai Pham
LỜI CẢM ƠN (2019), “Torrential rainfall-triggered shallow
Nghiên cứu này đƣợc thực hiện với nguồn landslide characteristics and susceptibility
kinh phí đƣợc cấp từ Bộ Giáo dục và Đào tạo assessment using ensemble data-driven models in
thông qua đề tài mã số B2020-GHA-03 do the Dongjiang Reservoir Watershed, China”,
trƣờng Đại học Giao thông vận tải chủ trì. Các Natural Hazards, volume 97, pp.579–609.
tác giả xin trân trọng cảm ơn sự h trợ của Vụ http://dx.doi.org/10.1007 /s11069-019-03659-4.
Khoa học công nghệ và Môi trƣờng (Bộ Giáo [8]. K. Khosravi, B.T. Pham, K. Chapi, A.
dục và Đào tạo), trƣờng Đại học Giao thông vận Shirzadi, H. Shahabi, I. Revhaug, I. Prakash,
tải và các đơn vị đã h trợ số liệu phục vụ cho and D. Tien Bui (2018), “A comparative
nghiên cứu. assessment of decision trees algorithms for
flash flood susceptibility modeling at Haraz
TÀI LIỆU THAM KHẢO watershed, northern Iran”, Sci. Total Environ.,
vol. 627, pp.744-755. [PMID: 29426199]
[1]. A. Casagrande (1936), “The determination http://dx.doi.org/10.1016/ j.scitotenv.2018.01.266.
of the pre-consolidation load and its practical [9]. B.T. Pham, A. Jaafari, I. Prakash, S.K.
significance”, Proceedings of the 1st International Singh, N.K. Quoc, and D.T. Bui (2019), “Hybrid
Conference on Soil Mechanics, Harvard, Vol. 3. computational intelligence models for
[2]. B. M. Das and K. Sobhan (2013), groundwater potential mapping”, Catena, vol.182,
“Principles of Geotechnical Engineering”, .104101. http://dx.doi.org/10.1016/j .catena.
Cengage Learning, 726p. 2019.104101.
[3]. B.T. Pham (2018), “A novel classifier [10]. S. Miraki, S.H. Zanganeh, K. Chapi, V.P.
based on composite hyper-cubes on iterated Singh, A. Shirzadi, and H. Shahabi (2019),
random projections for assessment of landslide “Mapping groundwater potential using a novel
susceptibility”, Journal of the Geological Society hybrid intelligence approach”, Water Resour.
of India, Volume 91, pp.355-362. Manage., vol. 33, pp. 281-302.
https://doi.org/10.1007/s12594-018-0862-5. http://dx.doi.org/10.1007/s11269-018-2102-6.
[4]. B.T. Pham, I. Prakash, K. Khosravi, K. [11]. D.C. Camilo, L. Lombardo, P.M. Mai, J.
Chapi, P.T. Trinh, and T.Q. Ngo (2018), “A Dou, and R. Huser (2017), “Handling high
comparison of Support Vector Machines and predictor dimensionality in slope-unit-based
Bayesian algorithms for landslide susceptibility landslide susceptibility models through LASSO-
modelling”, Journal Geocarto International. 34, penalized Generalized Linear Model”, Environ.
pp. 1385-1407. https://doi.org/10.1080/ Model. Softw., vol. 97, pp. 145-156.
10106049.2018.1489422. http://dx.doi.org/10.1016/j.envsoft.2017.08.003.
[5]. P.T. Nguyen, T.T. Tuyen, A. Shirzadi, [12]. J. Dou, K-T. Chang, S. Chen, A.P.
B.T. Pham, H. Shahabi, and E. Omidvar (2019), Yunus, J-K. Liu, and H. Xia (2015), “Automatic
“Development of a Novel Hybrid Intelligence case-based reasoning approach for landslide
Approach for Landslide Spatial Prediction”, detection: integration of object-oriented image
Applied Sciences (Basel), vol. 9, p. 2824. analysis and a genetic algorithm”, Remote Sens.,
http://dx.doi.org/10.3390/app9142824. vol. 7, pp. 4318-4342. http://dx.doi.org/
[6]. Q. He, Z. Xu, S. Li, R. Li, S. Zhang, and 10.3390/rs70404318.
N. Wang (2019), “Novel Entropy and Rotation [13]. B.T. Pham, T-A. Hoang, D-M. Nguyen,
Forest-Based Credal Decision Tree Classifier for and D.T. Bui (2018), “Prediction of shear strength
Landslide Susceptibility Modeling”, Entropy of soft soil using machine learning methods”,
(Basel), vol. 21, p. 106. http://dx.doi.org/ Catena, vol. 166, pp. 181-191.
10.3390/e21020106. http://dx.doi.org/10.1016/j. catena. 2018.04.004.
34 ĐỊA KỸ THUẬT SỐ 3 - 2021
- [14]. P.G. Asteris, K.G. Kolovos, A. Geomorphology, vol. 249, pp. 119-136.
Athanasopoulou, V. Plevris, and G. http://dx.doi.org/10.1016/j.geomorph.2015.06.001.
Konstantakatos (2019), “Investigation of the [21]. B.M. Das (2007), “Principles of
mechanical behaviour of metakaolin-based geotechnical engineering”, Thomson, 666p.
sandcrete mixtures”, Eur. J. Environ. Civ. Eng., [22]. B. Sharma, and P.K. Bora (2003),
vol. 23, pp. 300-324. http://dx.doi.org/10.1080/ “Plastic limit, liquid limit and undrained shear
19648189.2016.1277373. strength of soil – reappraisal”, J. Geotech.
[15]. P.G. Asteris, and K.G. Kolovos (2019), Geoenviron. Eng., vol. 129, pp. 774-777.
“Self-compacting concrete strength prediction https://doi.org/10.1061/(ASCE)1090-
using surrogate models”, Neural Comput. Appl., 0241(2003)129:8(774).
vol. 24, No. 2, pp. 137-150. http://dx.doi.org/ [23]. Manh Duc Nguyen, Binh Thai Pham, Tran
10.1007/s00521-017-3007-7. Thi Tuyen, Hoang Phan Hai Yen, Indra Prakash,
[16]. P.G. Asteris, A. Moropoulou, A.D. Thanh Tien Vu, Kamran Chapi, Ataollah Shirzadi,
Skentou, M. Apostolopoulou, A. Mohebkhah, and Himan Shahabi, Jie Dou, Nguyen Kim Quoc and
L. Cavaleri (2019), “Stochastic Vulnerability Dieu Tien Bui (2019), “Development of an Artificial
Assessment of Masonry Structures: Concepts, Intelligence Approach for Prediction of
Modeling and Restoration Aspects”, Appl. Sci. Consolidation Coefficient of Soft Soil: A Sensitivity
(Basel), vol. 9, p. 243. http://dx.doi.org/ Analysis”, The Open Construction and Building
10.3390/app9020243. Technology Journal, Volume 13, pp.178-188.
[17]. H. Chen, P.G. Asteris, D. Jahed https://doi.org/ 10.2174/ 1874836801913010178.
Armaghani, B. Gordan, and B.T. Pham (2019), [24]. J. A. Knappett and R. F. Craig (2012),
“Assessing dynamic conditions of the retaining “Craig’s Soil Mechanics”, CRC Press, 584p.
wall: Developing two hybrid intelligent [25]. https://www.python.org/doc/essays/blurb/
models”, Appl. Sci. (Basel), vol. 9, p. 1042. [26]. Debasish Basak, Srimanta Pal and Dipak
http://dx.doi.org/ 10.3390/ app9061042. Chandra Patranabis (2007), “Support vector
[18]. P. Sarir, J. Chen, P.G. Asteris, D.J. regression”, Neural Information Processing –
Armaghani, and M. Tahir (2019), "Developing Letters and Reviews, Vol. 11, No. 10, pp.203.
GEP tree-based, neuro-swarm, and whale [27]. Binh Thai Pham, Manh Duc Nguyen,
optimization models for evaluation of bearing Kien-Trinh Thi Bui, Indra Prakashd, Kamran
capacity of concrete-filled steel tube columns", Chapie, Dieu Tien Bui (2019), “A novel artificial
Eng. Comput., pp. 1-19. http://dx.doi.org/ intelligence approach based on Multi-layer
10.1007/s00366-019-00808-y. Perceptron Neural Network and Biogeography-
[19]. V. Rodriguez-Galiano, M. Sanchez- based Optimization for predicting coefficient of
Castillo, M. Chica-Olmo, and M. Chica-Rivas consolidation of soil”,
(2015), “Machine learning predictive models for CATENA, Vol. 166. pp.181-191, https://doi.org/
mineral prospectivity: An evaluation of neural 10.1016/j.catena.2018.04.004.
networks, random forest, regression trees and [28]. https://bigdatauni.com/vi/tin-tuc/tong-
support vector machines”, Ore Geol. Rev., vol. 71, quan-ve-regression-phan-tich-hoi-quy.html
pp. 804-818. http://dx.doi.org/ [29]. Michael Bowles (2015), “Machine Learning
10.1016/j.oregeorev.2015.01.001. in Python”, John Wiley & Sons, Inc, 360p.
[20]. A. Trigila, C. Iadanza, C. Esposito, and [30]. Sebastian Raschka and Vahid Mirjalili
G. Scarascia-Mugnozza (2015), “Comparison of (2017), “Machine Learning and Deep Learning
Logistic Regression and Random Forests with Python, scikit-learn, and TensorFlow”, Packt
techniques for shallow landslide susceptibility Publishing, 622p.
assessment in Giampilieri (NE Sicily, Italy)”,
Ng i phản biện: TS. NGUYỄN HIẾU CƢỜNG
ĐỊA KỸ THUẬT SỐ 3 - 2021 35
nguon tai.lieu . vn