Xem mẫu

  1. Kỹ thuật Điều khiển – Tự động hóa MỘT PHƯƠNG PHÁP TỔNG HỢP BỘ ĐIỀU KHIỂN CHO LỚP ĐỐI TƯỢNG PHI TUYẾN BẤT ĐỊNH HÀM TRÊN CƠ SỞ ĐIỀU KHIỂN TRƯỢT VÀ MẠNG NƠ RON RBF Ngô Trí Nam Cường* Tóm tắt: Bài báo đề xuất một phương pháp tổng hợp bộ điều khiển cho một lớp đối tượng phi tuyến bất định trên cơ sở điều khiển trượt và mạng nơ ron RBF nhằm làm giảm hiện tượng rung trên mặt trượt. Trọng số mạng nơ ron được cập nhật thích nghi theo một tiêu chuẩn tối ưu. Kết quả mô phỏng đã một lần nữa xác nhận bằng thực nghiệm hiệu quả của luật cập nhật và bộ điều khiển đề xuất đảm bảo hệ bám tín hiệu đầu vào mong muốn. Từ khóa: Điều khiển trượt; Mạng nơ ron RBF; Hệ phi tuyến bất định. 1. ĐẶT VẤN ĐỀ Trong công nghiệp, giao thông vận tải và năng lượng thường gặp các đối tượng điều khiển phi tuyến có mô hình bất định hàm. Việc tổng hợp hệ thống điều khiển cho các đối tượng dạng này sao cho đầu ra của hệ bám theo được tín hiệu đặt mong muốn mà không phụ thuộc vào các thành phần bất định hàm đó cũng như chất lượng bám là tốt, không dao động hoặc nếu có thì cũng nằm trong phạm vi dao động cho phép là vấn đề thời sự hiện nay. Chúng thu hút sự chú ý của các nhà khoa học trong lĩnh vực điều khiển và tự động hóa. Trong các thập kỷ gần đây, có nhiều nghiên cứu để tổng hợp luật điều khiển cho các đối tượng phi tuyến bất định bằng các phương pháp khác nhau. Đặc biệt phương pháp tổng hợp luật điều khiển trên cơ sở ưu điểm của điều khiển trượt và mạng nơ ron đang được quan tâm, đã thu được nhiều kết quả, đơn cử [1, 2, 3]. Tuy vậy, các luật học của mạng nơ ron trong các công trình trên còn phụ thuộc vào mặt trượt S , trong khi đó tín hiệu điều khiển trên mặt trượt luôn dao động với tần số cao, do đó ảnh hưởng rất lớn đến quá trình hội tụ của thuật toán, thậm chí khi biên độ dao động của S lớn còn có thể gây mất ổn định của hệ thống, nhất là đối với các hệ bám. Dưới đây, bài báo đề xuất một phương pháp tổng hợp bộ điều khiển cho lớp đối tượng phi tuyến bất định trên cơ sở điều khiển trượt kết hợp mạng nơ ron RBF để khắc phục nhược điểm trên. 2. TỔNG HỢP LUẬT ĐIỀU KHIỂN Giả sử động học của đối tượng điều khiển được mô tả bằng hệ phương trình:  xi  xi 1 , i  1, 2,  , n  1   xn  f ( x)  bu , b  0 (1) y  x1 T  trong đó, x  x1 , x2 ,, xn  là véc tơ trạng thái; u là đầu vào, y là đầu ra và chúng đều có giá trị thực, f ( x) là hàm phi tuyến trơn bất định của mô hình, b là tham số động học của đối tượng đã biết. Với đối tượng đối tượng phi tuyến bất định nêu trên, luật điều khiển sau đây sẽ được thiết lập dưới dạng: u  usmc  u fb (2) với usmc là thành phần điều khiển được xây dựng trên cơ sở lý thuyết điều khiển trượt và u fb là thành phần điều khiển phản hồi trạng thái: 88 Ngô Trí Nam Cường, “Một phương pháp tổng hợp bộ điều khiển … và mạng nơ ron RBF.”
  2. Nghiên cứu khoa học công nghệ u fb   K x b (3) có K   k1 , k2 , , kn  với các hệ số k1 , k2 , , kn của một đa thức Hurwitz: P ( p )  p n  kn p n1    k2 p  k1 . (4) Tiếp đến, thay luật (2) cùng chú ý (3),(4) vào hệ (1), được:  xi  xi 1   xn  k1 x1  k2 x2    kn xn  busmc  f ( x) (5) y  x1. Bởi vậy nếu đặt:  0 1 ... 0  0  0               A , B    , F ( x)     0 0  1  0  0          k1 k2   kn  b   f ( x)  thì công thức (5) ở trên viết lại được thành:  x  Ax  Busmc  F ( x)  (6)  y  C x, C  1,0,  ,0. Cấu trúc hệ thống điều khiển được thể hiện ở hình vẽ dưới đây, trong đó, ĐT là đối tượng điều khiển; SMC là bộ điều khiển trượt; M là mô hình; K là ma trận phản hồi; ND là khối nhận dạng. Hình 1. Sơ đồ cấu trúc rút gọn của hệ thống điều khiển kết hợp SMC và mạng RBF. 2.1. Tổng hợp luật cập nhật trọng số mạng nơ ron Vấn đề đặt ra tiếp theo là xác định cấu trúc thuật toán của khối ND. Để bộ ND thực hiện chức năng nhận dạng véc tơ hàm phi tuyến bất định F ( x) trên cơ sở mạng nơ ron RBF. Kết quả nhận dạng này sẽ được ta ký hiệu bởi Fˆ ( x) với: Fˆ ( x)  [0,  ,0, fˆ ( x)]T . Giả sử đã có Fˆ ( x) . Thay kết Fˆ ( x) vào mô hình (6), khi đó do giữa F ( x) và Fˆ ( x) có sai số nên tương ứng ta sẽ không thu được x mà chỉ là x m có một sai lệch kéo theo so với x , tức là lúc này hệ (6) trở thành: Tạp chí Nghiên cứu KH&CN quân sự, Số Đặc san FEE, 08 - 2018 89
  3. Kỹ thuật Điều khiển – Tự động hóa x m  Ax m  Busmc  Fˆ ( x) (7) m m T trong đó, x m  [ x1 ,  , xn ] . Nhiệm vụ chỉnh định mạng nơ ron là phải làm cho sai lệch trạng thái E  x  x m giữa (6) và (7) tiến về 0. Sai lệch này được biểu diễn bởi: E  x  x m  AE  F ( x) (8) với: F ( x)  F ( x)  Fˆ ( x)  [0,  ,0, f ( x)  fˆ ( x)]T  [0,  ,0, f ( x)]T trong đó, f ( x)  f ( x)  fˆ ( x) là sai số nhận dạng. Vì f ( x) được giả thiết là hàm trơn, nên trong một miền compact và thông qua bộ cơ sở thích hợp, cùng các các trọng số lý tưởng w *i , nó luôn biểu diễn được bằng một mạng nơ ron RBF: m f ( x)   wi*  i ( x ) (9) i 1 có x là tổ hợp các đầu vào của nơ ron thứ i . Chọn các hàm cơ sở:  i ( x )  exp x  ci 2 2 i2 . (10) Trong đó: ci là véc tơ có chiều bằng chiều của véc tơ x ,  i là độ trải rộng của hàm cơ sở thứ i , i =1,2… m . Khi đó, việc nhận dạng hàm bất định f ( x) với bộ hàm cơ sở này là tương đương với việc hiệu chỉnh trọng số wˆ i của: m fˆ ( x)   wˆ i  i ( x ) (11) i 1 sao cho có được fˆ ( x)  f ( x) , tức là f ( x)  0 , hay hệ (8) là ổn định. Ký hiệu: w i  wi*  wˆ i (12) rồi sử dụng ứng hàm Lyapunov sau có ma trận đối xứng xác định dương P nào đó: m V  E T PE   w i2 , (13) i 1 ta sẽ có: m V  E T PE  E T PE  2 w i w i . (14) i 1 Tiếp theo, thay (8) vào (14) sẽ được: m V  E T ( AT P  PA) E  2 E T PF ( x)  2 w i w i (15) i 1 và cùng với (9),(11),(12) có: m m V  E T ( AT P  PA) E  2 E T P[0,.  ,0,  w i  i ( x )]T  2 w i w i . (16) i 1 i 1 90 Ngô Trí Nam Cường, “Một phương pháp tổng hợp bộ điều khiển … và mạng nơ ron RBF.”
  4. Nghiên cứu khoa học công nghệ Bởi vậy để có được V  0 là điều kiện hiệu chỉnh trọng số mạng nơ ron, ta cần có từ công thức (16) hai điều kiện sau: E T ( AT P  PA) E  0 (17) và m m 2 E T P[0,  ,0,  w i  i ( x )]T  2 w i w i  0 . (18) i 1 i 1 Xét điều kiện thứ nhất (17). Do A là Hurwitz nên phương trình Lyapunov: AT P  PA  Q với mọi ma trận đối xứng xác định dương cho trước Q luôn có nghiệm P cũng đối xứng xác định dương. Sử dụng ma trận P này cho hàm Lyapunov (13) ta sẽ có từ (17):  E T QE  0 . (19) Tiếp theo, từ điều kiện thứ hai (18) ta có: w i   E T Pni ( x ) * trong đó Pn là vector cột thứ n của P . Cuối cùng, do wi  const nên cùng với (12) ta có luật cập nhật trọng số wˆ i cho mạng nơ ron như sau: wˆ i  E T Pni ( x ) . (20) 2.2. Tổng hợp bộ điều khiển trượt Sau đây ta sẽ xây dụng luật điều khiển usmc của khối SMC. Trước tiên ta ký hiệu vector sai lệch giữa véc tơ trạng thái mong muốn x d  ( yd , y d ,  , yd ( n 1) T ) và véc tơ trạng thái x của hệ (6) là: e  xd  x . (21) Khi đó với mặt trượt: s  Se (22) có S   s1 ,  , sn  được chọn để từ s  0 suy ra được e  0 , cũng như khi sử dụng ứng hàm Lyapunov V  s 2 , thì để có s  0 rõ ràng ta phải có V  ss  0 . Hiển nhiên ta 2 sẽ có được điều kiện đủ này nếu có: s   sgn( s ) , (23) với   0 tùy chọn. Như vậy, sau khi đạo hàm hai vế (22) thì cùng với (23) ta được: s  Se  S ( x d  x )   sgn( s ) . (24) Cuối cùng, thay (6) vào (24) có: S  x d  Ax  Busmc  F ( x)    sgn( s ) , (25) hay: 1 usmc  SB   SAx  SF ( x)  S x d   sgn(s)  . (26) Tạp chí Nghiên cứu KH&CN quân sự, Số Đặc san FEE, 08 - 2018 91
  5. Kỹ thuật Điều khiển – Tự động hóa 2.3. Kết hợp bộ điều khiển trượt và mạng nơ ron Bộ điều khiển trượt (26) có chứa thành phần bất định hàm f ( x) nên không sử dụng được trực tiếp. Khi thay nó bằng kết quả nhận dạng (11) theo luật cập nhật (20) từ mạng nơ ron thì cùng với (2) ta sẽ có bộ điều khiển kết hợp (2) gồm (26) có thêm cơ cấu nhận dạng và (3) cho hệ (1) như sau: 1  m  1   SAx  S [0,  ,0,  wˆ i  i ( x )]  S x d   sgn( s )   K x . (27) T u SB  i 1  b Định lý: Bộ điều khiển (27) với luật cập nhật (20) sẽ đưa được đầu ra y của hệ phi tuyến bất định hàm (1) bám tiệm cận theo được tín hiệu mẫu yd khả vi n lần. Chứng minh: Ta thấy ngay rằng bộ điều khiển (27) đã cho chính là: 1 1 u SB    SAx  SFˆ ( x)  S x d   sgn( s )  K x . b (28) Tiếp theo, do (26) là bộ điều khiển trượt cho hệ (6) ứng với mọi hàm bất định F ( x) trơn nên nó cũng đúng khi F ( x) trong (6) được thay bởi Fˆ ( x) . Lúc này (26) sẽ trở thành: 1 usmc  SB   SAx  SFˆ ( x)  S x d   sgn( s )  và tất nhiên bộ điều khiển usmc đó sẽ làm cho đầu ra ym  C x m của hệ rõ (7), là hệ tương ứng với (6), bám tiệm cận theo được tín hiệu mẫu yd khả vi n lần. Suy ra, khi được kết hợp thêm thành phần u fb cho trong công thức (3) thì nó trở thành bộ điều khiển (28) ở trên và bộ điều khiển này cũng sẽ làm đầu ra ym của hệ rõ tương ứng với hệ bất định (1) ban đầu, được hiểu là hệ:  xim  xim1 , i  1, 2,  , n  1  m ˆ  xn  f ( x)  bu (29) ym  x1m bám tiệm cận theo được yd , hay ym  yd . Cuối cùng, do cơ cấu nhận dạng bằng mạng nơ ron với luật cập nhật (20) luôn làm cho sai lệch E  x  x m tiến tiệm cận về gốc nên nó cũng sẽ làm cho sai số đầu ra y và ym giữa hai hệ (1) và (29) tiến về 0, tức là có y  ym . Kết hợp với kết luận trên ta đên được y  ym  yd và đó là đ.p.c.m. 3. KẾT QUẢ MÔ PHỎNG Xét đối tượng có mô hình:  x1  x2   x2  2( x1  1) x2  ( x1  tanh( x1 ))  3u 4 (30) y  x1. 92 Ngô Trí Nam Cường, “Một phương pháp tổng hợp bộ điều khiển … và mạng nơ ron RBF.”
  6. Nghiên cứu khoa học công nghệ trong đó, f ( x)  2( x14  1) x2  ( x1  tanh( x1 )) được xem như hàm bất định của đối tượng. Sử dụng bộ điều khiển (27) cùng với luật cập nhật (20) có các tham số cụ thể là: k1  0.0002, k2  0.03, s1  2, s2  1,   0.1 ta sẽ thu đươc kết quả mô phỏng bằng phần mềm Matlab-Simulink như thể hiện ở hình 2 và 3, trong đó hình 2 là đồ thị hàm f ( x) cùng kết quả nhận dạng fˆ ( x ) của nó bằng mạng nơ ron RBF với luật cập nhật trọng số cho ở công thức (20), còn hình 3 là quỹ đạo đặt yd và tín hiệu đầu ra y của hệ khi sử dụng bộ điều khiển kết hợp (27). Hình 2 cho thấy kết quả nhận dạng fˆ ( x) cho hàm phi tuyến f ( x) hoàn toàn đúng như yêu cầu, tức là sai số nhận dạng đã tiệm cận về 0. Kết quả mô phỏng ở hình 3 khẳng định chất lượng điều khiển đã được đảm bảo, tức là đáp ứng của hệ thống y đã bám chặt theo được tín hiệu đặt mong muốn yd . Như vậy, những kết quả mô phỏng này đã lần nữa minh chứng bằng thực nghiệm tính hiệu quả của thuật toán điều khiển đề xuất. Hình 2. Kết quả nhận dạng. Hình 3. Đáp ứng của hệ thống. 4. KẾT LUẬN Với công cụ của lý thuyết điều khiển trượt và mạng nơ ron RBF bài báo đã tổng hợp được hệ thống điều khiển cho đối tượng có phương trình động học (1). Xây dựng được thuật toán nhận dạng cho hàm phi tuyến bất định f ( x) trên cơ sở sử dụng công cụ mạnh của mạng nơ ron nhân tạo. Luật nhận dạng đơn giản, hiệu quả, dễ thực hiện trong kỹ thuật. Đặc biệt, phương pháp nhận dạng bài báo đề xuất có ứu điểm quá trình hiệu chỉnh luật nhận dạng chỉ diễn ra khi f ( x) thay đổi, nghĩa là khi có sai lệch E giữa đối tượng và mô hình mà không phụ thuộc vào yếu tố nào khác; luật cập nhật trọng số mạng nơ ron khắc phục được một số nhược điểm hiện có ở [1, 2, 3]. Đã thiết lập được luật điều khiển trượt đảm bảo hệ thống kín hoạt động trong chế độ trượt trên mặt trượt s  0 . Kết quả mô phỏng thể hiện tính đúng đắn của phương pháp. TÀI LIỆU THAM KHẢO [1].T. Zhang, S. S. Ge, and C. C. Hang, “Stable Adaptive Control for a Class of Nonlinear Systems Using a Modified Lyapunov Function,” IEEE Transactions on automatic control, Vol. 45, No. 1, January 2000,pp 129-131. [2]. L. X. Wang, “A Course in Fuzzy Systems and Fuzzy Control”, Englewood Cliffs, NJ, USA: Prentice-Hall, 1997. [3]. Mou Chen, Shuzhi Sam Ge,” Direct Adaptive Neural Control for a Class of Uncertain Nonaffine Nonlinear Systems Based on Disturbance Observer”, IEEE Transactuons on cyberynetics, vol. 43, no. 4, august, pp.1213 -1225. Tạp chí Nghiên cứu KH&CN quân sự, Số Đặc san FEE, 08 - 2018 93
  7. Kỹ thuật Điều khiển – Tự động hóa [4]. Ngô Trí Nam Cường ,” Một phương pháp nhận dạng và bù trừ các thành phần bất định cho một lớp đối tượng phi tuyến,” Tạp chí Nghiên cứu khoa học và công nghệ Quân sự, số 50, tháng 08 năm 2017, trang 53-61. [5].Utkin, Vadim, “Sliding Modes in Control and Optimization,” Springer – Verlag Berlin, Heidelberg 1992. [6]. James M. Ortega ,“Matrix Theory,” Plenum Press 1987. ABSTRACT A METHOD OF SYNTHESIZING ADAPTIVE CONTROLLER FOR A CLASS OF UNCERTAIN NONLINEAR PLANTS BASED ON THE THEORY OF SLIDING MODE CONTROL AND NEURAL RBF NETWORK The paper proposes a method for the systhesis of adaptive control system for a class of uncertain nonlinear plants based on the theory of sliding mode control and neural RBF network to reduce the vibration in the sliding surface. Weights of the neural network are updated to adapt to an optimal standard. The simulation result has once again verified by experiment the effectiveness of proposed weight updating and control law rules in assuring the tracking desirable input signals of the system. Keywords: Sliding mode control; RBF neural network; Uncertain nonlinear systems. Nhận bài ngày 01 tháng 7 năm 2018 Hoàn thiện ngày 10 tháng 9 năm 2018 Chấp nhận đăng ngày 20 tháng 9 năm 2018 Địa chỉ: Công ty CP Systemtec, Phòng 2207 nhà CT1-B2 khu đô thị Xa La, phường Phúc La, Hà Đông, Hà Nội; * Email: ncuong792000@gmail.com. 94 Ngô Trí Nam Cường, “Một phương pháp tổng hợp bộ điều khiển … và mạng nơ ron RBF.”
nguon tai.lieu . vn