科学技术的发展给作战训练带来了深刻变革,如计算机模拟训练系统、仿真推演系统等数字化手段的出现为军队人员提升训练水平提供了有效途径,推动了军事领域信息化建设。蓝军行为建模作为仿真训练领域模型建设的重要环节,能够有效支撑对抗场景构建,对于提升受训人员战场认知和对抗能力具有现实意义。
行为树(Behavior Tree,BT)的引入为蓝军行为建模提供了一种高效工具,其诞生于计算机游戏领域,通过模块化的行为组合搭配来建模非玩家角色(Non-Player Character,NPC)的行为,伴随计算机游戏的发展被广泛运用
[1-2]。相较于另一种广泛使用的建模工具——有限状态机
[3-4](Finite State Machine,FSM),行为树在建模复杂行为时有独特优势。有限状态机通过描述状态演进建模实体行为,在状态空间扩展时,规则和条件的描述也变得十分复杂。同时,如果需要添加实体行为,由于状态变化的连续性,有限状态机对于状态转移的描述发生结构性改变,需要重新进行建模,适应性明显不足。相比之下,行为树各节点、子树之间相对独立,灵活性、可复用性好
[5],支持在保留原有结构的基础上增加节点或子树,得到了广泛研究和运用
[6]。特别是在无人系统控制领域,由于敏感性、安全性要求带来的反应性需求,行为树得到普遍重视
[7-10],节点类型与节点功能伴随应用需求不断创新
[11-12],并基于基本行为树衍生出PA-BT(Planning and Acting Using BTs)等一系列模型
[6]。也有不少研究将行为树与遗传算法、强化学习等结合
[13],提升建模过程或建模对象的自主化智能化水平。
在军事行为建模领域,基于BT或改进BT进行建模研究集中于两类方向,一类是研究不同类型军事行为的行为树建模框架
[14-16],另一类是在行为树中引入指标和数值,结合势力图等手段提升模型决策控制智能化程度
[17-18]。其中,前一类主要聚焦在仿真决策系统和评估决策系统两种设计应用模式
[19]。
当前蓝军兵力行为建模中常用的行为树是反应式行为树
[20]及其基础上的各种改进,其基本结构如
图1所示。主要是通过选择节点实现计划动作与临机判断决策的选择执行,当条件节点不满足时,执行计划动作节点并持续监控条件节点的状态。一旦满足判断条件,终止计划动作转而执行条件节点后的临机动作,直至该节点执行完毕向上返回成功,行为树运行结束。该类行为树中条件节点和满足条件时的临机动作节点构成的子树置于选择节点左侧,右侧为计划动作节点。其优点在于运行逻辑简单,但各节点只执行一次,因此,临机动作节点必须是独立于计划动作节点的持续性节点,需要对后续执行的所有动作进行描述与建模,节点功能设计工作量大。其常用于建模与计划动作不同的任务动作类型,如计划动作为“突防”、临机动作为“巡逻”。现实中,空中兵力在遂行突防等任务时,满足一定威胁判定条件时往往只在计划动作基础上临机调整高度、速度等个别或部分属性,不改变任务动作类型(“突防”),并未与计划动作完全解耦。反应式行为树在运用于该类行为建模时,实体模型在后一子树B中临机动作节点的运行结果状态应当与前一子树A中临机动作节点的开始状态匹配,否则在执行B子树切换到A子树时,易发生实体状态跳变。在仿真训练系统中,为避免多回合后受训人员对于场景具有先验知识,同时考虑蓝军在面临威胁时可采取行为有多种选择,需要通过蓝军行为的概率选择在不同回合间引入一定随机性。当概率选择下的临机动作空间比较大时,由于B子树动作空间扩展且在执行中依概率选择执行任一动作,按照临机动作节点状态的匹配需求,A子树中临机动作节点的功能设计复杂度显著提升。
针对上述问题,本文在提取“计划-实施”典型空中兵力行为流程的基础上,提出了一种自循环行为树(Self-Looping Behavior Tree,SL-BT)建模框架,将临机动作节点建模为瞬态性节点,在更加匹配实际兵力行为流程的同时,引入随机性后在临机动作节点设计时无需考虑其他临机动作节点运行的初始与结果状态,简化了节点设计工作量。通过黑板系统进行计划动作节点与临机动作节点间信息交互,实现对计划动作的临机调整。通过对节点运行状态配置,执行逻辑改进以控制行为树自循环启动与中止。引入了计数条件节点,解决固化结构影响BT结构灵活性的问题。最后,通过仿真实例,检验了所述模型和方法的有效性。