中国科技核心期刊      中国指挥与控制学会会刊     军事装备类重点期刊
Theory & Research

Backstepping RBF Network Adaptive Control for Quadrotor Unmanned Aerial Vehicle

  • SHEN Wei-hao ,
  • LI Zhong
Expand
  • School of Electronics and Information, Jiangsu University of Science and Technology, Zhenjiang 212003, China

Received date: 2019-08-19

  Request revised date: 2019-09-17

  Online published: 2022-04-28

Copyright

Copyright reserved © 2020

Abstract

For the quadrotor unmanned aerial vehicle system with external constant and variable disturbances, the traditional backstepping control does not have good anti-jamming and robustness. This paper proposes a control method which combines traditional backstepping control with RBF adaptive control. Based on the traditional backstepping control, the RBF neural network with radial basis function is constructed to approximate the external disturbance and compensate the disturbance. The adaptive law of weights is designed by Lyapunov method, and the weights of RBF neural network are estimated online. The stability of the system is proved by Lyapunov stability theorem. Fixed-point control experiments are carried out on the simulation platform. The simulation results show that compared with the traditional backstepping method, the method designed in this paper has shorter adjustment time and smaller error when external constant and variable disturbances are taken into account. It proves that the anti-interference performance of the backstepping RBF network adaptive control method are stronger.

Cite this article

SHEN Wei-hao , LI Zhong . Backstepping RBF Network Adaptive Control for Quadrotor Unmanned Aerial Vehicle[J]. Command Control and Simulation, 2020 , 42(2) : 89 -94 . DOI: 10.3969/j.issn.1673-3819.2020.02.017

四旋翼无人机作为新型的小型无人机,凭借其良好的机动性能,能够垂直起降,自由悬停。由于四旋翼具备这些优势,它被广泛应用于军事领域和民用领域,例如无人机群战场侦察[1]、快递投送、农业植保等[2]。就四旋翼的控制而言,其难点分为两个方面:第一,陀螺效应和外界干扰等因素的存在,使得建立准确的动力学模型异常困难;第二,四旋翼飞行器具有4个输入6个输出[3],其驱动、非线性、强耦合等特性[4]增加了设计高品质控制器的难度。针对四旋翼控制系统的设计,控制策略主要包括局部线性化、非线性控制和智能控制。局部线性化方法包括传统PID控制和最优LQR控制;非线性控制方法主要有反步法、滑模控制、预测控制、自适应控制、鲁棒控制等;智能控制方法有模糊控制、神经网络控制等。
针对四旋翼多变量、强耦合、复杂非线性的系统,反步法可以有效处理。但是,反步法对于模型中的不确定因素和外界干扰不具备良好的抵抗能力,所以通常将反步法和其他算法结合,提高其抗干扰性能。文献[5]运用自适应块反步控制法,设计了四旋翼飞行器姿态控制器。文献[6]设计了四旋翼无人机反步自适应控制器,在控制律中加入积分项,提高了系统的鲁棒性。文献[7]针对反步法的不足之处,提出一种将反步法与滑模自适应控制相结合的方法。文献[8]采用了积分饱和反步控制法,以此抵抗无人机所受的外界干扰。文献[9]利用滑模控制与RBF自适应相结合的方法,以此提高系统的抗干扰性。文献[10]为了提高四旋翼抗干扰性,将反步法与扩张状态观测器结合设计控制器。
本文从文献[7]、[9]中获得启发,在不考虑外界干扰时,利用反步法设计控制器;在考虑外界常值干扰和变值干扰时,在反步法的基础上,利用RBF网络逼近并补偿外界扰动,并通过Lyapunov方法设计RBF网络权值的自适应律,在线调整神经网络的权值。

1 四旋翼无人机的动力学模型

四旋翼无人机是欠驱动系统,因为它具有6个自由度,却仅含有4个控制输入。四旋翼的结构示意图如图1所示,其中地球坐标系为OE-XEYEZE,机体坐标系为OB-XBYBZB。调节4个电机的转速,无人机能够产生横滚、俯仰、偏航运动。相邻两对旋翼的旋转方向不同。保持旋翼1和旋翼3转速不变,增大旋翼2的转速,减小旋翼4的转速,将产生横滚运动;保持旋翼2和旋翼4转速不变,增大旋翼3的转速,减小旋翼1的转速,将产生俯仰运动;保持旋翼1和旋翼3转速不变,增大旋翼2和旋翼4的转速,将产生偏航运动。
图1 四旋翼结构示意图
建立较为准确、完整的描述系统运动的数学模型是设计控制器的前提条件。为了便于求解,给出下列假设:
1)四旋翼是刚体;
2)四旋翼的质量和转动惯量不变;
3)四旋翼的重心和几何中心一致[11]
四旋翼无人机的位置由相对于地球坐标系下的坐标[x y z]T以及两个坐标系之间的夹角[Φ θ Ψ]T确定,其中[x y z]T表示无人机的位移,[Φ θ Ψ]T表示无人机产生的横滚角、俯仰角、偏航角。在机体坐标系下,利用Newton-Euler[12]法对四旋翼建模并简化,可得其动力学模型为
x ¨ = ( cos φ sin θ cos ψ + sin φ cos ψ ) U 1 / m + Δ 1 y ¨ = ( cos φ sin θ sin ψ - sin φ cos ψ ) U 1 / m + Δ 2 z ¨ = ( cos φ cos θ ) U 1 / m - g + Δ 3 φ ¨ = l U 2 / I X + θ ˙ ψ · ( I Y - I Z ) / I X - J r θ ˙ Ω r / I X θ ¨ = l U 3 / I Y + φ · ψ · ( I Z - I X ) / I Y - J r φ · Ω r / I Y ψ ¨ = U 4 / I Z + φ · θ · ( I X - I Y ) / I Z
式中,m为机体质量,IXIYIZ为转动惯量,Ωr=Ω1-Ω2+Ω3-Ω4,Δi=f/m(i=1,2,3),f为风扰,m为四旋翼质量,l为旋翼中心至机体坐标系原点的距离,g为重力加速度,四旋翼的控制输入(U1,U2,U3,U4)与电机转速Ωi (i=1,2,3,4)之间的关系为
U 1 U 2 U 3 U 4= b b b b 0 - lb 0 lb - lb 0 lb 0 - d d - d d Ω 1 2 Ω 2 2 Ω 3 2 Ω 4 2

2 控制器设计

2.1 四旋翼状态方程

当不考虑x,y,z方向上的外界干扰时,可将四旋翼动力学方程式(1)表达为
X ·=f(X,U)
其中,控制输入量为U=[U1U2 U3U4]T,状态变量X
X=[ x 1 x 2 x 3 x 4 x 5 x 6 x 7 x 8 x 9 x 10 x 11 x 12 ] T=[ x x · y y ˙ z z · φ φ · θ θ · ψ ψ ·]T
结合式(2)、(3)、(4)可得
f(X,U)= x 2 u x U 1 / m x 4 u y U 1 / m x 6 - g + ( cos x 7 cos x 9 ) U 1 / m x 8 a 1 x 10 x 12 - a 2 Ω r x 10 + b 1 U 2 x 10 a 3 x 8 x 12 - a 4 Ω r x 8 + b 2 U 3 x 12 a 5 x 8 x 10 + b 3 U 4
表1 相关参数符号及含义
符号 表达式
a1 (IY-IZ)/IX
a2 Jr/IX
a3 (IZ-IX)/IY
a4 Jr/IY
a5 (IX-IY)/IZ
b1 l/IX
b2 l/IY
b3 1/IZ
ux (cos Φsin θcos Ψ+sin Φsin Ψ)
uy (cos Φsin θsin Ψ-sin Φcos Ψ)

2.2 控制策略

本设计的控制策略为双环控制。外环为位置控制,由位置期望值xdydzd与其实际值xyz作差,设计位置控制器U1uxuy。再进入内环姿态控制,由uxuy反解算出期望姿态角Φdθd,由期望姿态角ΦdθdΨd与实际值ΦθΨ作差,设计姿态控制器为U2U3U4。如此,整个控制流程如图2所示。
图2 控制流程框图

2.3 反步控制器设计

在无外界干扰的条件下,高度子系统的状态空间表达如下:
X · z= x 6 - g + ( cos x 7 cos x 9 ) U 1 / m
其中,
X · z=[ x · 5 x · 6]T
给定高度的期望值为zd=xd5,高度跟踪误差为
z1=xd5-x5
根据Lyapunov理论,假设高度子系统在点z1处达到平衡(z=zd),构造Lyapunov函数V(z1):
V(z1)= 1 2 z 1 2
沿着系统的轨迹V(z1)的时间导数为
V ·(z1)=z1( x · d 5-x6)
由Lyapunov稳定性定理,式(10)应为负半定,即 V ·(z1)<0,因此引入一个虚拟控制量 x 6 v
x 6 v= x · d 5+α1z1
式(11)中,α1为可调控制器参数。
定义速度跟踪误差为
z2=x6- x 6 v=x6- x · d 5-α1z1
取Lyapunov函数为
V(z1,z2)= 1 2 z 1 2+ 1 2 z 2 2
沿系统的轨迹V(z1,z2)的时间导数为
V ·(z1,z2)=-z1(α1z1+z2)+z2( x ¨ d 5+ x · 6-α1 z · 1)=-z1(α1z1+z2)+z2( x · 6- x ¨ d 5+α1(α1z1+z2))
所以,高度控制器U1设计为
U1=[ x ¨ d 5+g+z1-α1(α1z1+z2)-α2z2]m/(cosx7cosx9)
其中,α1>0,α2>0, x ¨ d 5=0使得 V ·(z1,z2)<0。
V ·(z1,z2)=-α1 z 1 2-α2 z 2 2
同理,可以设计其他通道控制器:
U2=[z3-a1x10x12+a2Ωrx10-α3(α3z3+z4)-α4z4]/b1
U3=[z5-a3x8x12+a4Ωrx8-α5(α5z5+z6)-α6z6]/b2
U4=[z7-a5x8x10-α7(α7z7+z8)-α8z8]/b3
水平位置控制器中采用两个虚拟控制量uxuy:
ux=(cosφsinθcosψ+sinφsinψ)uy=(cosφsinθsinψ-sinφcosψ)
由式(20)反解算出期望姿态角Φdθd:
φd=arcsin(uxsinx11-uycosx11d=arcsin[(ux-sinx9sinx11)/(cosx9cosx11)]
同理,运用反步法,控制律uxuy可表示为:
u x = m [ z 9 - α 9 ( α 9 z 9 + z 10 ) - α 10 z 10 ] / U 1 u y = m [ z 11 - α 11 ( α 11 z 11 + z 12 ) - α 12 z 12 ] / U 1

2.4 反步RBF网络自适应控制器设计

当存在外部干扰时,传统反步法不能有效抵抗干扰,所以需要加入辅助控制来估计干扰并进行补偿。在传统反步控制的基础上,引入RBF自适应算法对干扰进行逼近,以此来增强控制系统的抗干扰性。当存在外界干扰时,可将非线性动力学方程(3)改写成
X ·=f(X,U)+Δi
其中,Δi=f/m(i=1,2,3),fxyz方向上的风扰,m为四旋翼质量。
存在外界干扰时,高度子系统的状态空间形式为
X · z= x 6 - g + ( cos x 7 cos x 9 ) U 1 / m + Δ 3
由前文反步法设计的高度控制器将表达为
U1=[ x ¨ d 5+g+z1-α1(α1z1+z2)-α2z2+Δ3]m/(cosx7cosx9)
由于控制量U1中存在未知外界干扰Δ3,而传统反步法抗干扰能力较差,所以利用RBF网络的万能逼近特性,逼近外界干扰Δ3RBF网络算法为
hj=exp(‖x-cj2/(2 b j 2))
Δ3=f(x)=W*Th(x)+ε
其中,x是RBF网络输入,j是隐含层第j个节点,h=[hj]T是RBF网络的高斯基函数输出,W*RBF的理想权值,ε是RBF网络的逼近误差[13]
设计RBF网络权值自适应律为
W · ^=γz2h(x)
其中,γ为设计参数,且γ>0。
取RBF网络输入为z2,z2为高度速度跟踪误差,则RBF网络输出为
f ^(x)= W ^ Th(x)
由于f(x)- f ^(x)=W*Th(x)+ε- W ^ Th(x)=- W ~ Th(x)+ε
其中, W ~= W ^-W*
定理 考虑外界存在扰动的四旋翼无人机系统如式(23)所示,系统误差由式(31)控制,RBF网络权值的自适应律设计如式(27)所示,则四旋翼无人机系统将渐进稳定。
证明 为证明反步RBF网络自适应控制的稳定性,构造Lyapunov函数为
V= 1 2 z 1 2+ 1 2 z 2 2+ 1 2 γ( W ^-W*)2
V ·=z1 z · 1+z2 z · 2+ 1 γ( W ^-W*) d W ^ dt=-α1 z 1 2-z1z2+z2[-g+(cosx7cosx9)U1/m+f(x)- x ¨ d 5]+α1z2(α1z1+z2)+ 1 γ( W ^-W*) d W ^ dt
设计高度控制律为
U1=[ x ¨ d 5+g+z1-α1(α1z1+z2)-α2z2- f ^(x)]m/(cosx7cosx9)
V ·=-α1 z 1 2-α2 z 2 2+z2[f(x)- f ^(x)]+ 1 γ( W ^-W*) d W ^ dt=-α1 z 1 2-α2 z 2 2-z2( W ^-W*)h(x)+ 1 γ( W ^-W*) d W ^ dt
取网络权值自适应律为 W · ^=γz2h(x),则RBF网络输入为z2,则此时 V ·=-α1 z 1 2-α2 z 2 2<0,由Lyapunov稳定性定理可知,该系统是稳定的。
同理,可以设计其他通道的控制器。

3 仿真实验与分析

参考文献[12],选取四旋翼无人机的系统参数为m=0.5 kg,IX=0.006 kg·m2,IY=0.006 kg·m2,IY=0.012 kg·m2,b=3.13e-5 N·s2,d=7.5e-7 N·ms2,Jr=5e-5 kg·m2,l=0.3m,g=9.8 m/s2
首先,在不考虑外界干扰的条件下,给定期望姿态角和期望位置,根据姿态控制效果和位置控制效果,验证本文反步控制器设计的正确性。其次,在考虑外界常值干扰和变值干扰的条件下,给定期望位置,进行定点控制实验。根据四旋翼无人机的位置误差,比较反步控制器和反步RBF网络自适应控制器的抗干扰性能。
1)当不考虑干扰时,验证传统反步法的姿态控制效果,如图3所示。姿态控制仿真初始条件是:姿态角为Φ=0.5 rad,θ=0.5 rad,Ψ=0.5 rad,仿真时间为6 s。控制目标:使四旋翼无人机达到期望姿态角Φd=0 rad,θd=0 rad,Ψd=0 rad。
图3 无干扰时反步法姿态控制
2)当不考虑干扰时,验证传统反步法的位置控制效果,如图4所示。位置控制仿真初始条件是:x=2 m,y=2 m,z=5 m,姿态角均为零,仿真时间为6 s。控制目标:使四旋翼无人机到达期望位置xd=0 m,yd=0 m,zd=7 m。
图4 无干扰时反步法位置控制
图3图4可知,当不考虑外界干扰时,利用反步法可以达到期望的姿态控制和位置控制效果,由于运用反步法设计的控制量中存在误差和误差的微分项,通过合理选取误差微分项系数,能够减小超调量。因此,在没有干扰的条件下,通过合理选取反步控制器的控制参数,可使得四旋翼无人机无超调且平滑地达到期望位置。由此可验证反步法设计的正确性。
3)从第0 s开始,在xyz方向上分别施加f=2 N的常值风扰时,反步法与反步RBF网络自适应法比较如下图5所示。仿真初始条件是:x=2 m,y=2 m,z=5 m,姿态角均为零,仿真时间为10 s。控制目标:使四旋翼无人机到达期望的位置xd=0 m,yd=0 m,zd=7 m。
图5 常值干扰下位置跟踪
4)从第0 s开始,在xyz方向上分别施加f=0.5sin(t)N的变值风扰时,反步法与反步RBF网络自适应法比较如图6所示。仿真初始条件:x=2 m,y=2 m,z=5 m,姿态角均为零,仿真时间为10 s。控制目标:使四旋翼无人机到达期望位置xd=0 m,yd=0 m,zd=7 m。
图6 变值干扰下位置跟踪
图5可以看出,反步法是一种递归设计方法,将高阶系统分解成低阶子系统,设计Lyapunov函数并构造中间虚拟控制量保证子系统镇定,通过合理选取参数,可以使得调节过程平滑无波动。但是,当在x、y、z方向上施加常值干扰时,利用反步法反步法无法有效抵抗干扰,不能将实际位置调节至期望位置,存在较大的稳态误差,而采用本文设计的方法,RBF网络能对外界常值干扰进行有效估计和补偿,在3 s左右使得实际位置到达期望位置,且稳态误差较小。从图6中可以看出,当在xyz方向上施加变值干扰时,相比于反步法,由于RBF网络对时变干扰具有一定的补偿和抑制作用,反步RBF网络自适应法的调节时间更短,随干扰变化幅度更小。所以本文设计的方法比传统反步法抗干扰性能好。

4 结束语

1)将RBF网络引入传统反步法中,并设计神经网络权值自适应律,设计出了基于反步法的RBF网络自适应控制器,可用于四旋翼无人机飞行控制。
2)根据Lyapunov稳定性定理,证明运用反步RBF网络自适应方法控制的四旋翼无人机系统是渐进稳定的。
3)定点控制仿真实验表明,传统反步法抵抗常值干扰和变值干扰的能力较差。相反,本文设计的控制算法抗干扰性更好。
[1]
赵东见, 杨奕飞, 翟江涛. 基于JADE的多Agent协同仿真系统设计[J]. 江苏科技大学学报(自然科学版), 2017, 31(3): 316-320.

[2]
Fu Jun, Chai Tianyou, Su Chunyi, et al. Motion/force Tracking Control of Nonholonomic Mechanical Systems via Combining Cascaded Design and Backstepping[J]. Automatica, 2013, 49(12): 3682-3686.

DOI

[3]
魏青铜, 陈谋, 吴庆宪. 输入饱和与姿态受限的四旋翼无人机反步姿态控制[J]. 控制理论与应用, 2015, 32(10): 1361-1369.

[4]
杨荟憭, 姜斌, 张柯. 四旋翼直升机姿态系统的直接自修复控制[J]. 控制理论与应用, 2014, 31(8): 1053-1060.

[5]
甄红涛, 齐晓慧, 李杰. 四旋翼无人机L1自适应块控反步姿态控制器设计[J]. 控制与决策, 2014, 29(6): 1076-1082.

[6]
马正华, 张倩倩, 陈岚萍. 四旋翼飞行器自适应反演姿态控制[J]. 智能系统学报, 2015, 10(3): 454-458.

[7]
Jiang Xueying, Su Chengli, Xu Yapeng. An Adaptive Backstepping Sliding Mode Method for Flight Attitude of Quadrotor UAVs[J]. Journal of Central South University, 2018, 25:616-631.

[8]
周来宏, 窦景欣, 张居乾. 基于改进反步法的四旋翼无人机轨迹跟踪控制[J]. 东北大学学报(自然科学版), 2018, 39(1): 66-70.

[9]
韩业壮, 华容. 四旋翼飞行器的RBF网络自适应滑模控制[J]. 电光与控制, 2017, 24(11): 22-27.

[10]
窦立谦, 芦飞. 基于ESO和反步法的四旋翼飞行器轨迹跟踪控制[J]. 天津大学学报, 2017, 50(5): 500-506.

[11]
陈志旺, 张子振, 曹玉洁. 自抗扰fal函数改进及在四旋翼姿态控制中的应用[J]. 控制与决策, 2018, 33(10): 1901-1907.

[12]
岳基隆. 四旋翼无人机自适应控制方法研究[D]. 长沙:国防科学技术大学, 2010.

[13]
张伟, 滕延斌, 魏世琳, 等. 欠驱动UUV自适应RBF神经网络反步跟踪控制[J]. 哈尔滨工程大学学报, 2018, 39(1): 93-99.

Outlines

/