中国科技核心期刊      中国指挥与控制学会会刊     军事装备类重点期刊
理论研究

多智能体编队在时延约束下的动态跟踪控制

  • 戴国忠 ,
  • 王怀龙
展开
  • 中国人民解放军91655部队, 北京 100036

戴国忠(1971-),男,江苏无锡人,高级工程师,研究方向为指挥自动化。

王怀龙(1988-),男,博士,工程师。

收稿日期: 2017-02-15

  修回日期: 2017-03-12

  网络出版日期: 2022-05-18

Dynamic Tracking Control for the Multi-agent Formation Via Time Delay

  • DAI Guo-zhong ,
  • WANG Huai-long
Expand
  • The PLA Unit 91655, Beijing 100036, China

Received date: 2017-02-15

  Revised date: 2017-03-12

  Online published: 2022-05-18

摘要

针对时延约束下多智能体编队的动态跟踪问题,提出了一种与模型无关的控制算法,并运用实用稳定性理论、图论和矩阵分析等工具,实现了多跟随者在时延影响的有向通信图下对单动态领航者的实用跟踪。基于Matlab的线性矩阵不等式(Linear Matrix Inequality, LMI)工具箱,以三自由度(Three Degree of Freedom, 3-DOF)的无人水下航行器(Unmanned Underwater Vehicles, UUV)进行数值仿真实验,可证明算法的正确性。

本文引用格式

戴国忠 , 王怀龙 . 多智能体编队在时延约束下的动态跟踪控制[J]. 指挥控制与仿真, 2017 , 39(3) : 36 -39 . DOI: 10.3969/j.issn.1673-3819.2017.03.008

Abstract

For the dynamic tracking problem of the multi-agent formation with time delay, a model-independent control algorithm is proposed, and all followers can track a dynamic leader practically in a directed graph of time delay based on the practical stability theory, graph theory and matrix analysis. 3-DOF UUV as numerical simulations can prove the correctness of the algorithms based on the LMI toolbox of Matlab.

多智能体编队的协同控制可以分为无领航者[1]和有领航者[2]两种类型。无领航者的协同网络中,所有智能体的地位是相同的。它主要运用于多个智能体的集结或者蜂拥等控制目标[3]。有领航者的多智能体编队重点研究有期望的或特定的同步目标的实际应用。当前,一般考虑领航者的参考轨迹和速度,也就是对领航者运动状态的跟踪[4]。一方面,从控制器来归类,关于多智能体协同控制的研究主要集中在与模型相关控制器的同步[5],这类研究引入了航行体动力学补偿项或者航行体动力学参数线性化矩阵,控制器的结构较为复杂。如何设计结构比较简单的控制器,比如与智能体模型无关的控制器,是需要解决的一个关键问题。另一方面,要增加单次传输的比特数,就会加重通信负担,使得信道拥塞,造成通信时延。时延[6]使得智能体获取近邻个体的信息相对滞后。如何利用时延信息实现多智能体协同也是一个具有重要现实意义的问题。
本文针对存在时延的有向通信网络,基于图论、矩阵理论和实用稳定性理论,设计了一种与模型无关的控制器,研究了多跟随者对单动态领航者的跟踪控制。研究结果表明,多跟随者可实现对单动态领航者的实用跟踪。3个3-DOF的UUV作为跟随者进行数值仿真实验,也验证了算法的正确性。

1 基础知识

考虑n个跟随者,第i个的动力学模型可用拉格朗日方程表示为
Mi(qi) q ¨ i+Ci(qi, q · i) q · i+gi(qi)=τi i=1, 2,…,n
式中,τiRp为待设计的控制器;qiRp为广义坐标向量; q · iRp为广义速度向量;Mi(qi)∈Rp×pCi(qi, q · i)∈Rp×pgi(qi)∈Rp分别为惯性矩阵、科氏力与向心力矩阵以及重力约束力,并具有如下的性质[7]:0<kmIpMi(qi)≤kMIp,‖Ci(qi, q · i) q · i‖≤kc q · i2和‖gi(qi)‖≤kg,其中,IpRp×p为单位矩阵;‖·‖为Euclidean范数;km,kM,kckg为正常数。假定存在单领航者,标记为0,领航者的广义坐标、广义速度和广义加速度向量可分别定义为q0Rp q · 0Rp q ¨ 0Rp
首先,提出如下与模型无关的控制器
τi=- j = 0 naij(qi(t)-qj(t))-Yi j = 0 nbij( q · i(t)- q · j(t)) i=1, 2,…,n
式中,Yi为待定的正定矩阵;aij≥0和bij≥0,i,j=1, 2,…,n,分别表示跟随者i和跟随者j的广义坐标及广义速度的连接关系。GAGB分别为[5]广义坐标和广义速度的拓扑图。相应的邻接矩阵可定义[5]A=[aij]∈Rn×nB=[bij]∈Rn×n。Laplacian矩阵则为LA=[ l i j A]∈Rn×n,LB=[ l i j B]∈Rn×n,并令HA=LA+diag a 10 , a n 0,HB=LB+diag(b10, …, bn0),那么可分别定义跟随者及领航者之间的广义坐标和广义速度通信图为 G - A G - B
假定多跟随者之间时钟同步,且具备记忆能力,可根据自身需要获取其历史信息。那么,对于存在时延的有向通信网络,式(2)可改写为
τi=- j = 0 naij(qi(t-d(t))-qj (t-d(t)))-Yi j = 0 nbij( q · i(t-d(t))- q · j(t-d(t))) i=1, 2,…,n
q=( q 1 T,…, q n T)TRnp, q ·=( q · 1 T,…, q · n T)TRnp, q -=((q1-q0)T, …, (qn-q0)T)TRnp,v=(( q · 1 T- q · 0 T)T, …,( q · n T- q · 0 T)T)∈Rnp,Y=diag[Y1, …, Yn]∈Rnp×np,τ=( τ 1 T, …, τ n T)TRnp,M(q)=diag{M1(q1), …, Mn(qn)}∈Rnp×np,C(q, q ·)=diag{C1(q1, q · 1),…, Cn(qn, q · n)}∈Rnp×np,g(q)=[ g 1 T(q1), …, g n T(qn)]TRnp。式(3)和(1)分别改写为
τ=-(HA⊗IP) q -(t-d(t))-Y(HB⊗IP)v(t-d(t))
M(q) q ¨+C(q, q ·) q ·+g(q)=τ
定义误差向量:e=( e 1 T, e 2 T)T=( q - T, vT)TR2np。式(4)改写为
τ=-(HA⊗IP)e1(t-d(t))-Y(HB⊗IP)e2(t-d(t))
根据文献[8]的研究,提出实用跟踪的概念。
定义1 对于多智能体的任意初始状态qi(0), q · i(0)和 q ¨ i(0),i=0, 1, …,n,若给定一个常数δ>0,误差向量在区域Bδ上满足
e∈Bδ={e1, e2| ‖e 12+‖e222}
那么,多智能体实现了实用跟踪。
因此,本文的控制目标是随着t→∞,qi(t)和 q · i(t)分别有偏差地趋向于q0(t)和 q · 0(t),i=1, 2,…,n,即n个跟随者实现对单动态领航者的实用跟踪。
假设领航者0的加速度向量 q ¨ 0=( q ¨ 01,…, q ¨ 0 p)∈ Rp是有界的,跟随者i的速度向量 q · i=( q · i 1, q · i 2, …, q · i p)∈ Rp也是有界的,i=1, 2,…,n,即 q ¨ 0 kμk, q · i kρk,其中,μkρk均为已知的正常数,k=1, 2, …, p

2 理论结果

基于文献[9]的研究,式(5)和(6)可构造误差系统
$\begin{aligned} &\dot{e}=\left(\begin{array}{c} e_{2}(t) \\ -M^{-1}\left(\left(H_{A} \otimes I_{P}\right) e_{1}(t-d(t))+Y\left(H_{B} \otimes I_{P}\right) e_{2}(t-d(t))\right) \end{array}\right)+\left(\begin{array}{c} 0 \\ -M^{-1}(C \dot{q}+g(q))-\overrightarrow{1}_{n} \otimes \ddot{q}_{0} \end{array}\right)\\ &=W e(t)+P e(t-d(t))+N \end{aligned}$
式中,
$\begin{aligned}&W=\left(\begin{array}{cc} 0 & I_{n p} \\ 0 & 0 \end{array}\right) ; \\ &N=\left(\begin{array}{cc} 0 \\ -M^{-1}(C \dot{q}+g(q))-\overrightarrow{1}_{n} \otimes \ddot{q}_{0} \end{array}\right) ; \\ &P=\left(\begin{array}{cc} 0 & 0 \\ -M^{-1}\left(H_{A} \otimes I_{P}\right) & -M^{-1} Y\left(H_{B} \otimes I_{P}\right) \end{array}\right) 。\end{aligned}$
定理1GAGB是无向连接, G - A G - B具有有向生成树,且存在一个正常数θ和正定矩阵Y,使得D<0,则在控制器(3)的作用下,多跟随者完成了对单动态领航者的实用跟踪。其中,
D= W T + W + r - 2 W T W + θ I 2 n p - I 2 n p r - 2 W T P + I 2 n p + P r - 2 P T W + I 2 n p + P T r - 2 P T P + θ I 2 n p - I 2 n p
证明 考虑如下Lyapunov-Krasovskii函数
V=V1+V2
式中,V1=eT(t)e(t);V2= r - t - r - t (s-(t- r -))( e · T(s)-NT) ( e ·(s)-N)ds,其中, r -为时延的上界,即 r -=max{d(t)}。
依据文献[9]的研究方式,V1V2沿着误差系统(8)的导数为
$\begin{aligned} &\dot{V}_{1}=\left(e^{T}(t), e^{T}(t-d(t))\right)\left(\begin{array}{cc} W^{T}+W+\theta I_{2 n p} & P \\ P^{T} & \theta I_{2 n p} \end{array}\right) \text {. }\\ &\left(\begin{array}{c} e(t) \\ e(t-d(t)) \end{array}\right)+2 N^{T} e(t)-\theta e^{T}(t) e(t)-\theta e^{T}(t-d(t)) e(t-d(t)) \end{aligned}$
$\begin{aligned} &\dot{V}_{2} \leqslant \bar{r}^{2}(W e(t)+P e(t-d(t)))^{T}(W e(t)+P e(t-d(t)))-\\ &(e(t)-e(t-d(t)))^{T}(e(t)-e(t-d(t)))+\\ &2(e(t)-e(t-d(t)))^{T} \int_{t-d(t)}^{t} N d s\\ &=\left(e^{T}(t), e^{T}(t-d(t))\right)\left(\begin{array}{ll} \vec{r}^{2} W^{T} W-I_{2 n p} & \bar{r}^{2} W^{T} P+I_{2 n p} \\ \vec{r}^{2} P^{T} W+I_{2 n p} & \bar{r}^{2} P^{T} P-I_{2 n p} \end{array}\right).\\ &\left(\begin{array}{c} e(t) \\ e(t-d(t)) \end{array}\right)+2(e(t)-e(t-d(t)))^{T} \int_{t-d(t)}^{t} N d s \end{aligned}$
进一步地
$\begin{gathered} \dot{V}=\left(e^{T}(t), e^{T}(t-d(t))\right) \cdot \\ \left(\begin{array}{cc} W^{T}+W+\bar{r}^{2} W^{T} W+\theta I_{2 n p}-I_{2 n p} & \bar{r}^{2} W^{T} P+I_{2 n p}+P \\ \bar{r}^{2} P^{T} W+I_{2 n p}+P^{T} & \bar{r}^{2} P^{T} P+\theta I_{2 n p}-I_{2 n p} \end{array}\right) \cdot \\ \left(\begin{array}{c} e(t) \\ e(t-d(t)) \end{array}\right)-\theta e^{T}(t) e(t)-\theta e^{T}(t-d(t)) e(t-d(t))+ \\ 2 N^{T} e(t)+2(e(t)-e(t-d(t)))^{T} \int_{t-d(t)}^{t} N d s \end{gathered}$
GAGB无向连接, G - A G - B具有有向生成树,则HAHB为正定矩阵。那么,如果存在一个正定矩阵Y,使得D<0。式(12)可改写为
$\begin{aligned} &\dot{V}<-\theta e^{T}(t) e(t)-\theta e^{T}(t-d(t)) e(t-d(t))+ \\ &2 N^{T} e(t)+2(e(t)-e(t-d(t)))^{T} \int_{t-d(t)}^{t} N d s \end{aligned}$
参照文献[5]的证明,可知‖M-1‖≤ 1 k m,易得
$\begin{aligned} &\|N\| \leqslant\left\|M^{-1}\right\|\|C \dot{q}+g(q)\|+\left\|\overrightarrow{1}_{n} \otimes \ddot{q}_{0}\right\| \\ &\quad \leqslant \frac{1}{k_{m}}\left(n p k_{d} \rho_{k}^{2}+k_{g}\right)+\sqrt{n p} \mu_{k}=\alpha \end{aligned}$
式(13)改写为
$\begin{aligned} &\dot{V}<-\theta e^{T}(t) e(t)-\theta e^{T}(t-d(t)) e(t-d(t))+ \\ &2 \alpha\|e(t)\|+2 \alpha \bar{r}(\|e(t)\|+\|e(t-d(t))\|) \\ \end{aligned}$
通过定义1的实用跟踪概念,给定δ>0,如果e(t)和e(t-d(t))都在球体Bδ的外部,式(15)可改写为
$\begin{aligned}&\dot{V}<\left(-\theta+\frac{2 \alpha(1+\bar{r})}{\delta}\right) e^{T}(t) e(t)+\left(-\theta+\frac{2 \alpha \bar{r}}{\delta}\right) e^{T}(t- \\ &d(t)) e(t-d(t)) \end{aligned}$
因此,若给定的δ> 2 α ( 1 + r - ) θ,则存在一个正常数ϕ,使得
V ·≤-ϕ(eT(t)e(t)+eT(t-d(t))e(t-d(t)))
即多跟随者完成了对单动态领航者的实用跟踪。

3 数值仿真实验

本文基于Matlab软件,以3个3-DOF的UUV为实验对象,假定广义位置向量都为qi= q i 1 , q i 2 , q i 3 TR3,且3个跟随者和领航者的位置拓扑图和速度拓扑图是相同的,如图1所示。
图1 跟随者和领航者的拓扑图
UUV的基本参数和初始状态为
质量m=500,水动力系数 X · u = - 240, Y · v = - 240, N · r = - 300,Xu=-110, Yv=-110,Nr=-125。初始坐标(qi1(0), qi2(0), qi3(0))=(5i, 10i, 10i),初始速度 q · i 1 ( 0 ) , q · i 2 ( 0 ) , q · i 3 ( 0 )=(10i,i+1,i+1),i=1,2,3。需要注意的是,为了更好地凸显控制效果,初始速度第一自由度的值相较于第二和第三自由度的值较大。
d(t)∈(0, 0.6),则 r -=0.6。通过LMI工具箱,可得一个正定矩阵Yi=diag{30,20, 50}。图2~4分别描述了3个跟随者的广义位置qij,i, j=1, 2, 3和单领航者q0j,j=1, 2, 3的广义位置变化轨迹,可以看出:当领航者的广义位置变动时,跟随者都会以一定的偏差调整自身位置来紧随领航者,即跟随者的广义坐标可使用跟踪领航者的广义坐标。3个跟随者和单领航者广义位置的第一自由度误差轨迹如图5所示,可知:跟随者调整自身位置的偏差可以稳定到一个较小的有界误差值。
图2 跟随者和领航者广义位置第一自由度的变化轨迹
图3 跟随者和领航者广义位置第二自由度的变化轨迹
图4 跟随者和领航者广义位置第三自由度的变化轨迹
图5 跟随者和领航者广义位置第一自由度的误差轨迹
图6~8则为3个跟随者和单领航者的广义速度变化轨迹,可以知道:3个跟随者的速度随着领航者速度的变化而有小偏差地跟踪到领航者的速度。值得注意的是,虽然跟随者广义速度第一自由度的初始值较大,但是仍然可以较快地跟踪到领航者的速度,控制性能较好。进一步地,通过图9的广义速度第一自由度误差轨迹,易知跟随者的广义速度能很好地跟踪到领航者的广义速度,控制精度较高。综上,跟随者可实现对单领航者较小误差值的实用跟踪。
图6 跟随者和领航者广义速度第一自由度的变化轨迹
图7 跟随者和领航者广义速度第二自由度的变化轨迹
图8 跟随者和领航者广义速度第三自由度的变化轨迹
图9 跟随者和领航者广义速度第一自由度的误差轨迹

4 结束语

本文研究了多跟随者在时延影响下对单动态领航者的跟踪控制,提出了一个与模型无关的控制器,运用图论、实用稳定性理论以及矩阵分析等工具,实现了多跟随者对单动态领航者的实用跟踪,并基于Matlab软件,通过数值仿真实验,验证了理论结果的正确性。如何对跟踪误差值进行估计并优化或者实现完全跟踪等问题都将是下一步的研究方向。
[1]
Mei J, Ren W, Chen J, et al. Distributed adaptive coordination for multiple Lagrangian systems under a directed graph without using neighbors' velocity information[J]. Automatica, 2013, 49(6): 1723-1731.

DOI

[2]
Dong W J. On consensus algorithms of multiple uncertain mechanical systems with a reference trajectory[J]. Automatica, 2011, 47(9): 2023-2028.

DOI

[3]
Wang H L, Wu X F, Chen Y, et al. Distributed coordinated tracking for the Lagrange network systems via quantized data exchange[C]. Proceedings of 4th Chinese Automation Conference, Wuhan, 2015: 1086-1091.

[4]
梅杰, 张海博, 马广富. 有向图中网络Euler-Lagrange系统的自适应协调跟踪[J]. 自动化学报, 2011, 37(5): 596-603.

[5]
王怀龙, 吴晓锋, 陈云, 等. 量化和噪声约束条件下多Lagrange航行体编队的分布式跟踪控制[J]. 海军工程大学学报, 2016, 28(5): 51-56.

[6]
Abdessameud A, Polushin I G, Tayebi A. Synchronization of lagrangian systems with irregular communication delays[J]. IEEE Transactions on Automatic Control, 2014, 59(1): 187-193.

DOI

[7]
Chen G, Lewis F L. Distributed adaptive tracking control for synchronization of unknown networked Lagrangian systems[J]. IEEE Transactions on Systems, Man, and Cybernetics, 2011, 41(3): 805-816.

[8]
Li L L, Ho D W C, Lu J Q. A unified approach to practical consensus with quantized data and time delay[J]. IEEE Transactions on Circuits and Systems, 2013, 60(10): 2668-2678.

[9]
王怀龙, 吴晓锋, 陈云, 等. 多拉格朗日航行体编队在量化及噪声下的集结[J]. 华中科技大学学报(自然科学版), 2016, 44(8): 46-51.

文章导航

/