Xem mẫu

  1. KỈ YẾU HỘI NGHỊ SINH VIÊN NGHIÊN CỨU KHOA HỌC NĂM HỌC 2013-2014 ỨNG DỤNG NGUYÊN LÍ BIẾN PHÂN EKELAND TRONG BÀI TOÁN ĐIỀU KHIỂN TỐI ƢU Nguyễn Thị Tâm, Lớp K60C, Khoa Toán – Tin GVHD: TS. Nguyễn Như Thắng Tóm tắt: Báo cáo trình bày một ứng dụng của nguyên lí biến phân Ekeland trong lí thuyết điều khiển tối ưu. Cụ thể, chúng tôi sẽ thảo luận một mở rộng của nguyên lí cực tiểu Pontryagin cho điều khiển tối ưu xấp xỉ. Từ khóa: Phương pháp biến phân Ekerland, nguyên lí cực tiểu Pontryagin, hàm mục tiêu Bolza. I. MỞ ĐẦU Lí thuyết điều khiển tối ƣu xuất hiện từ những năm 50 của thế kỉ hai mƣơi với một loạt các công trình tiêu biểu của các nhà toán học Xô Viết. Bài toán điều khiển tối ƣu là bài toán tìm các quá trình tối ƣu cho các hệ điều khiển mô tả bởi các phƣơng trình toán học. Nền tảng của lí thuyết điều khiển tối ƣu là nguyên lí cực đại (cùng với các các dạng biến thể) và một loạt các công trình của các nhà toán học Xô Viết đứng đầu là L.C. Pontryagin. Nguyên lí cực đại cổ điển là một biểu thức cực trị toán học mà từ đó ta có thể đoán nhận đƣợc điều khiển là tối ƣu hay không, tức là cho ta một điều kiện cần của bài toán điều khiển tối ƣu, chi tiết có thể xem trong [5]. Tuy nhiên, không phải lúc nào ta cũng tìm đƣợc điều kiện cần của bài toán điều khiển tối ƣu. Mặt khác, theo nguyên lí cực đại cổ điển dù có tìm ra điều kiện tối ƣu thì theo quan điểm kiến thiết, việc xây dựng thuật toán để tìm các điều kiện tối ƣu cũng gặp rất nhiều khó khăn và có thể là không tìm ra cụ thể. Để phần nào giải quyết hai vấn đề đó, trong báo cáo này chúng tôi áp dụng nguyên lí Ekeland vào bài toán điều khiển tối ƣu để mở rộng nguyên lí cực đại Pontryagin cho trƣờng hợp nghiệm tối ƣu xấp xỉ, tức là các điều kiện có giá trị ngay cả khi bài toán tối ƣu ban đầu không có nghiệm chính xác. Vào đầu những năm 70, nhà toán học Ivar I. Ekeland trong bài báo [1] đã đề xuất nguyên lí biến phân suy rộng, mà ngày nay thƣờng gọi là nguyên lí biến phân Ekeland. Công trình này ngay lập tức nhận đƣợc sự quan tâm của cả cộng đồng toán học lí thuyết và ứng dụng, và tính đến nay (4/2014) đã có 1403 lƣợt trích dẫn (theo số liệu Google), còn theo cơ sở dữ liệu Hội toán học Mỷ có 473 bài báo khoa học đã trích dẫn và 57 lƣợt trích dẫn từ ngƣời viết nhận xét. Một trong những điểm thú vị của nguyên lí biến phân Ekeland là một mặt nó mở rộng nguyên lí biến phân cổ điển, nhƣng mặt khác nó xây dựng khái niệm lời giải xấp xỉ thích hợp ngay cả khi lời giải chính xác không tồn tại. Nội dung chính của báo cáo đƣợc trích từ tài liệu [1]. Chúng tôi hi vọng nguyên lí biến phân Ekeland sẽ là công cụ quan trọng chính, là bƣớc khởi đầu để nghiên cứu bài toán điều khiển tối ƣu trong đạo hàm riêng. II. NỘI DUNG 1. Kết quả tổng quan Định nghĩa 1.1: Cho X là không gian topo Hausdorff. Hàm số  : X  {+} đƣợc gọi là nửa liên tục dƣới tại x0 khi và chỉ khi: 30
  2. KỈ YẾU HỘI NGHỊ SINH VIÊN NGHIÊN CỨU KHOA HỌC NĂM HỌC 2013-2014 liminf ( x)  ( x0 ). x  x0 Hàm  đƣợc gọi là nửa liên tục dƣới trên X nếu  là nửa liên tục tại mọi điểm của X . Định lí 1.2 (Nguyên lí biến phân Ekeland): Cho ( X , d ) là không gian metric đầy và : X  {+} là hàm nửa liên tục dưới và bị chặn dưới. Cho   0 và u  X cho trước sao cho:  (u )  inf   . (1.1) X 2 Khi đó, với   0 bất kì, tồn tại u  X sao cho: (u )  (u), (1.2) d (u , u )   , (1.3)  (u )  (u )  d (u, u ), u  u . (1.4)  1 Chứng minh: Để đơn giản hóa kí hiệu ta đặt d (u, v)  d (u, v).  Ta xác định thứ tự bộ phận trên X nhƣ sau: u  v  (u)  (v)   d (u, v). Dễ dàng thấy đƣợc: (i) Tính phản xạ: u  u (ii) Tính phản đối xứng: u  v và v  u  u  v . (iii) Tính bắc cầu : u  v và v  w  u  w , với mọi u, v,w  X . Bây giờ, ta xây dựng ( Sn ) trong tập con của X nhƣ sau: Với u1  u ta có tập:  S1  {u  X:u  u1}; u2  S1 sao cho (u2 )  inf   . S1 22 Bằng phƣơng pháp quy nạp ta có:  Sn  {u  X:u  u n }; un1  Sn sao cho (un1 )  inf   . Sn 2n1 Rõ ràng, S1  S2  ...  Sn  ... và S n là các tập đóng, với mọi n . Thật vậy, cho x j  Sn với x j  x  X . Ta có ( x j )  (un )   d ( x j , un ). Mặt khác,  là nửa liên tục dƣới và d liên tục nên ta suy ra x  Sn . 31
  3. KỈ YẾU HỘI NGHỊ SINH VIÊN NGHIÊN CỨU KHOA HỌC NĂM HỌC 2013-2014 Bây giờ, ta chứng minh đƣờng kính của các tập S n tiến đến 0 (đƣợc kí hiệu là: diam Sn  0 ). Thật vậy, cho điểm x  Sn bất kì, x  un suy ra ( x)  (un )   d ( x, un ). (1.5) Mặt khác, vì Sn1  Sn nên x  Sn1 . Theo cách xác định của các tập S n và chọn un  Sn1 ta có:  (un )  ( x)  . (1.6) 2n Từ (1.5) và (1.6) ta đƣợc: d ( x, un )  2 n , với mọi x  Sn , Với diam Sn  2 n1 . Do S n là các tập đóng lồng nhau thắt dần có đƣờng kính tiến dần đến 0 trong không gian metric đầy theo định lí Cantor các tập S n có một điểm chung duy nhất và điểm chung ấy thỏa mãn các điều kiện (1.2), (1.3) và (1.4).  Đặt: Sn  {u  }. n 1 Chọn u1  u . Vì u  S1 nên suy ra (1.2) là hiển nhiên. Với u  u , ta có u  u (vì nếu u  u thì u  S1 với mọi n mâu thuẫn với tính duy nhất của u ) nghĩa là: (u)  (u )   d (u, u ). Ta đƣợc (1.4). Ta chứng minh (1.3). Do n 1 n 1 d (u, un )   d (u j , u j 1 )   2 j . j 1 j 1 Suy ra ta có: n 1 d (u, un )  lim  2 j  1  d (u, un )  . n j 1 Bổ đề 1.3 (Bất đẳng thức Gronwall): Cho hàm số liên tục không âm u :[a,b]  thỏa mãn: t u (t )  C   Ku ( )d , t [a,b], a trong đó C , K là các hằng số không âm. Khi đó, u(t )  Ce K (t a ) , t [a,b]. (1.7) Chứng minh của bổ đề có thể tìm thấy trong [2, 5]. 32
  4. KỈ YẾU HỘI NGHỊ SINH VIÊN NGHIÊN CỨU KHOA HỌC NĂM HỌC 2013-2014 2. Nguyên lí cực tiểu Pontryagin Xét hệ điều khiển xác định bởi phƣơng trình:  dx  (t )  ( x(t ), u (t ), t ),(h.k .n)  dt (2.1)  x(0)  x  n  0 trong đó x(t )  n mô tả trạng thái của hệ điều khiển, u (t ) là hàm điều khiển phụ thuộc thời gian t , và thuộc vào tập compact khả metric K . Cho T  0 và giả sử rằng: a)  và  'x  ( / x1 ,  / x2 ,...,  / xn ) là hàm liên tục trên n  K  [0,T]. x, (t , x, u)  c(1  x ) , với c là hằng số. 2 b) Cho trƣớc hàm điều khiển đo đƣợc u :[0,T]  K. Điều kiện a) đảm bảo tồn tại nghiệm duy nhất X của phƣơng trình vi phân (2.1) trên khoảng đủ nhỏ [0, ] . Từ điều kiện b) và bất đẳng thức Gronwall (Bổ đề 1.3) ta đƣợc: x(t )  ( x0  2cT )e2cT , 2 2 (2.2) Và do đó đảm bảo sự tồn tại nghiệm trên khoảng thời gian [0,T] . Hơn nữa, từ (2.2) ta có: dx (t )  max {(t,x,u) (t,x,u) [0,T]  B  K}, (2.3) dt  2cT )e2cT . Áp dụng định lí Ascoli, nhận 2 trong đó, B là hình cầu bán kính ( x0 thấy họ các quỷ đạo X của hệ điều khiển (2.1) đồng liên tục và bị chặn, do đó nó compact tƣơng đối trong topo đều. Xét phiếm hàm mục tiêu Bolza T J (u )   ( x(T ))   L( x, u, t )dt , 0 ở đó  : n  thuộc lớp hàm C 1 , L và L 'x liên tục trên n  K  [0,T]. Ta tìm hàm điều khiển đo đƣợc u sao cho quỷ đạo tƣơng ứng x làm cực tiểu hóa J (u ) trong số tất cả các nghiệm của (2.1). Định lí 2.1: Với mỗi   0, tồn tại một phiếm hàm điều khiển đo được u có quỹ đạo tương ứng là x , thỏa mãn: J (u )  inf J (u)   , (2.4) U 33
  5. KỈ YẾU HỘI NGHỊ SINH VIÊN NGHIÊN CỨU KHOA HỌC NĂM HỌC 2013-2014 ( x (t ), u (t ), t ),  (t )  L( x (t ), u (t ), t )  min ( x (t ), u(t ), t ),  (t)  L( x (t), u(t), t )   , (2.5) uK (2.5) trong đó,  là nghiệm của phương trình vi phân tuyến tính: d  (t )   t  'x ( x (t ), u (t ), t ). (t )  t L 'x ( x (t ), u (t ), t ). dt (2.6)  (T )  t  'x ( x (T )), trong đó, t  'x là chuyển vị của  'x . Nhận xét: Nếu ở (2.4) ta cho   0 thì ta có thể lấy   0 trong (2.5). Nói cách khác, nếu tồn tại một điều khiển tối ƣu, thì nguyên lí cực đại Pontryagin thỏa mãn. Hơn nữa, định lí còn đúng ngay cả khi không có nghiệm tối ƣu. Bổ đề 2.2: Giả sử U là tập hợp các hàm điều khiển đo được u : 0, T   K . Trên U xét hàm khoảng cách:  (u1 , u2 )  meas t  0, T  | u1 (t )  u2 (t ) (2.7) Khi đó (U ,  ) là một không gian metric đầy. Chứng minh: Đầu tiên, ta kiểm tra  là khoảng cách. Lấy u1 , u2 , u3 bất kì trong U : t | u1 (t )  u2 (t )  t | u1 (t )  u3 (t )  u2 (t )  u3 (t ) (2.8) meas t | u1 (t )  u2 (t )  meas t | u1 (t )  u3 (t )  meas u2 (t )  u3 (t ) (2.9)  (u1 , u2 )   (u1 , u3 )   (u3 , u2 ) (2.10) Lấy  un nN là dãy Cauchy trong U . Ta có thể lấy ra một dãy con unk   nN sao cho   un , un k k 1   21 . Ta sẽ chứng minh dãy con này hội tụ. Thật vậy, đặt: k Ak  pk t | u np (t )  un p 1   21 k (2.11) Ta có:  1 1 measAk   k  k 1 và Ak  Ak 1 p k p p Xác định u U nhƣ sau: t  Ak , u(t )  un (t ) k (2.12) Theo định nghĩa, dãy con (unk )kN hội tụ tới u . Dãy  un nN là Cauchy, nên nó hội tụ đến u 34
  6. KỈ YẾU HỘI NGHỊ SINH VIÊN NGHIÊN CỨU KHOA HỌC NĂM HỌC 2013-2014 Bổ đề 2.3: Ánh xạ U  u ( x(T )) , trong đó x là nghiệm tương ứng của (2.1) là liên tục trên U Chứng minh:Cho dãy  un nN hội tụ đến u trong U . Dãy quỷ đạo  xn nN compact tƣơng đối, do đó tồn tại dãy con xk hội tụ đều tới x . Ta có thể chứng minh là quỷ đạo tƣơng ứng với u . Biến đổi phƣơng trình (2.1) ta có: t xk (t )  x0   ( xk ( s), uk ( s), s)ds (2.13) 0 t Cho k  ; xk  x; uk  u (h.k.n) và tích phân  ( xk ( s), uk ( s), s)ds bị chặn 0 bởi (2.3). Áp dụng định lí hội tụ Lebesgue ta đƣợc: t x(t )  x0   ( x( s), u ( s), s)ds (2.14) 0 Bổ đề 2.4: d ( x (T )) | 0  ( x (t0 ), u0 , t0 )  ( x (t0 ), u (t0 ), t0 ),  (t0 ) d Chứng minh: Đây là một kết quả cổ điển chúng tôi chỉ trình bày vắn tắt chứng minh: t0 x (t0 )  x (t0   )   t0  ( x ( s), u0 , s)ds  x (t0 )   (dx / dt )(t0 )  ( x (t0 ), u0 , t0 )  O( ) (2.15)  x (t0 )   (( x (t0 ), u (t0 ), t0 )  ( x (t0 ), u0 , t0 ))  O( ) Nghĩa là:  d    x (t0 )) | 0  ( x (t0 ), u0 , t0 )  ( x (t0 ), u (t0 ), t0 ) (2.16)  d  Do đó:  d   x (T ) | 0  R(T , t0 )[( x (t0 ), u0 , t0 )  ( x (t0 ), u (t0 ), t0 )] (2.17)  d  Trong đó R(T , t0 ) là ma trận nghiệm cơ bản của phƣơng trình tuyến tính:  d    (t )   '( x (t ), u (t ), t ). (t ) (2.18)  dt   d   d  Ta có:    ( x(T )) | 0   '( x (T )),   x (T ) | 0  d   d  35
  7. KỈ YẾU HỘI NGHỊ SINH VIÊN NGHIÊN CỨU KHOA HỌC NĂM HỌC 2013-2014   '( x (T )), R(T , t0 )[( x (t0 ), u0 , t0 )  ( x (t0 ), u (t0 ), t0 )] (2.19)  t R(T , t0 ) '( x (T )) ,[( x (t0 ), u0 , t0 )  ( x (t0 ), u (t0 ), t0 )] Nhƣng t R(T , t0 ) '( x (T ))   (t0 ) trong đó  là nghiệm của (2.6). Do đó bổ đề đƣợc chứng minh. Chứng minh định lí 2.1. Bƣớc 1: Trƣớc hết giả sử L  0 tức là ta có hàm mực tiêu Meyer J (u)  ( x(T )) . Từ bổ đề 2.2; 2.3, áp dụng định lí 1.4, tồn tại hàm điều khiển đo đƣợc u U thỏa mãn: (u )  inf   2 (2.20) U u U , (u)  (u )   (u, u ) (2.21) Quỷ đạo tƣơng ứng x của u đƣợc cho bởi dx (t )  ( x (t ), u (t ), t );(h.k .n) dt (2.22) x (0)  x0 Lấy t0  (0, T ), u0  K và xác định v U với mỗi   0 theo các bƣớc sau: u0 ; t   0; T    t0   , t0  v (t )   (2.23) u (t ); t  0;T    t0   , t0  Rõ ràng  (v , u )   , trong đó  là đủ nhỏ. Kí hiệu x là quỷ đạo tƣơng ứng, áp dụng bổ đề 2.4 ta có: d ( x (T )) | 0  ( x (t0 ), u0 , t0 )  ( x (t0 ), u (t0 ), t0 ),  (t0 ) (2.24) dt Nhƣng theo (2.21) ta có: ( x (T ))  ( x (T ))   với   0 (2.25) Từ (2.24) và (2.25) ta đƣợc: ( x (t0 ), u0 , t0 )  ( x (t0 ), u (t0 ), t0 ),  (t0 )   (2.26) Cuối cùng, do là điểm u0 bất kì của K và t0 là điểm bất kì trong (0, T ) nên thu đƣợc điều kiện (2.5) , với hạn chế L  0 Bƣớc 2: Trƣờng hợp tổng quát L  0 đƣợc đƣa về trƣờng hợp trên bằng cách thêm biến. t Thật vậy, kí hiệu xn 1 (t )   L( x, u, s )ds 0 36
  8. KỈ YẾU HỘI NGHỊ SINH VIÊN NGHIÊN CỨU KHOA HỌC NĂM HỌC 2013-2014   y (t )  F ( y (t ), u (t ), t ); t  0, T  Khi đó ta có hệ điều khiển:  (2.27)  y (0)  ( x0 ,0); u U  Trong đó  ( x(t ), u (t ), t )  y  ( x(t ), xn1 (t )), F ( y (t ), u (t ), t )     L( x(t ), u (t ), t  Và hàm mục tiêu ( y(T ))  ( x(T ))  xn1 (T ) (2.28) Phƣơng trình liên hợp của bài toán theo biến mới có dạng  y  t Fy' ( y (t ), u (t ), t ) p(t ) (2.29) p(T ) t  'y ( y (T )) ở đó p  ( p, pn1 ) . Dễ thấy phƣơng trình này tƣơng đƣơng với phƣơng trình (2.6) và pn1  1 . Xét bài toán điều khiển tối ƣu của hệ (2.27) với hàm mục tiêu (2.28), bài toán đƣợc đƣa về bƣớc 1. Do đó định lí đƣợc chứng minh. III. KẾT LUẬN Trong báo cáo này chúng tôi trình bày mở rộng của nguyên lí cực đại Pontryagin cho bài toán điều khiển tối ƣu với hàm mục tiêu Bolza trong không gian hữu hạn chiều. Tuy đây không phải là kết quả hoàn toàn mới (xem [1] cho trƣờng hợp hàm mục tiêu Meyer) nhƣng là bƣớc đầu tiên để tiến tới nghiên cứu bài toán điều khiển tối ƣu trong không gian vô hạn chiều (điều khiển tối ƣu của bài toán phƣơng trình đạo hàm riêng). Một trong những khó khăn chính khi chuyển sang bài toán điều khiển tối ƣu trong không gian vô hạn chiều là thiếu vắng các bổ đề về tính compact hay những tính toán trên toán tử nghiệm cơ bản đòi hỏi những hiểu biết sâu sắc về lí thuyết nửa nhóm sinh bởi một toán tử tuyến tính không bị chặn. Do khả năng còn hạn chế với thời lƣợng nghiên cứu không nhiều, chúng tôi mới chỉ xét bài toán điều khiển tối ƣu trong không gian hữu hạn chiều. Trong tƣơng lai, chúng tôi sẽ dành nhiều thời gian để trả lời phần nào các câu hỏi mở trên. TÀI LIỆU THAM KHẢO [1] Ekenland, I., On the Variantionl Principle, Journal of Mathematiccal Analysis and Application 47, 324-353, 1974. [2] Evans, L.C., Partial differential equations, American Mathematical Soc., 2010. [3] De Figueiredo, D.G., Lectures on The Eleland Variational Principle with Applications and Detour, Tata Institute of Fundamental Research, Bombay 1989. [4] Zabczyk J., Mathematical control theory, Birkhauser, 1992. [5] Vũ Ngọc Phát, Nhập môn Lí thuyết điều khiển toán học, Nhà xuất bản ĐHQG Hà Nội, 2007. [6] Trần Đức Vân, Lí thuyết phương trình vi phân đạo hàm riêng, Nhà xuất bản ĐHQG Hà Nội, 2005. 37
nguon tai.lieu . vn