中国科技核心期刊      中国指挥与控制学会会刊     军事装备类重点期刊
多模态信息融合

人机指挥对抗系统规则设计研究

  • 任培中 ,
  • 王柱
展开
  • 陆军指挥学院, 江苏 南京 210045

任培中(1986—),男,讲师,研究方向为训练模拟。

王柱(1975—),男,副教授。

Office editor: 张培培

收稿日期: 2022-07-03

  修回日期: 2022-09-28

  网络出版日期: 2023-04-17

Research on rules design of human-machine command countermeasure system

  • REN Pei-zhong ,
  • WANG Zhu
Expand
  • Army Command College, Nanjing 210045, China

Received date: 2022-07-03

  Revised date: 2022-09-28

  Online published: 2023-04-17

摘要

针对现有人机指挥对抗系统在规则设计方面存在的不足,根据人机指挥对抗系统的典型结构和规则推理的运行机制,提出了人机指挥对抗系统的规则需求,设计了规则库的基本内容和结构,对其中的条件库、结论库、阵地编配规则库和指挥决策规则库的要素组成和内容构成进行了较为详细的阐述,并给出了部分示例;最后,对规则库在智能对抗模型构建中的应用进行了说明。设计方案能够为其他类似人机对抗系统及其规则库的建设提供借鉴,具有较强的可操作性。

本文引用格式

任培中 , 王柱 . 人机指挥对抗系统规则设计研究[J]. 指挥控制与仿真, 2023 , 45(2) : 130 -136 . DOI: 10.3969/j.issn.1673-3819.2023.02.021

Abstract

In view of the shortcomings of the existing human-machine command countermeasure system in the design research of the rules, according to the typical structure of human-machine command countermeasure system and rule reasoning operation mechanism, and the requirements of the rules of human-machine command countermeasure system are proposed. The basic contents and structures of the rules library are designed, and the composition and contents of the elements and contents of the rules library and the command decision rules library are expounded in this paper. For more, some examples are given. Finally, the application of the rule library in the construction of the intelligent countermeasures model is illustrated. The design solution can give other similar kinds of human-machine countermeasure system and rules construction a reference,and it has great operability.

近年来,随着人工智能的发展,人机对抗技术已成为军事仿真领域研究的热点。当前,在人机对抗领域,常用的人机对抗技术有两类。一是采用强化学习的博弈对抗方法,即通过大量对抗实例的训练来提高机方的对抗能力。如国内某机构研制的CASIA先知系统,在对抗中采用了一系列智能化算法,实现了博弈对抗与迁移能力的同步提升,在近几年的军事智能兵棋推演活动中连取佳绩[1]。强化学习方法能够较好地应对战争的巨复杂、高动态和不确定性,且灵活性较强,但该方法实现难度较大,规则透明度和可解释性不高,特别是在地面部队的聚合级仿真领域还处于探索阶段。二是通过构建完备的军事规则,采用规则推理的方法提升机方的对抗能力。如申耀德[2]等设计了基于规则的装备保障指挥决策模型,提高了装备保障仿真系统的运行效率;傅调平[3]等人设计实现了基于机器博弈的海战兵棋推演系统,能够用于海上红蓝编队的智能对抗。规则推理方法具有一定的局限性,如机方决策、行动方式需具有特殊性,若机方主体发生变化,则可能需要重新建立一套军事规则,但规则推理的方法实现难度较低,技术相对成熟,且在指挥对抗领域,蓝方对手和作战样式具有一定的确定性,采用此种方法可以较快地实现人机对抗功能。
采用规则推理的方法构建人机指挥对抗系统,其关键在于规则库的构建。只要设计者提出足够完善的军事规则,系统即可根据条件和规则库进行自动推理,实现机方的智能指挥。当前对人机指挥对抗系统规则库的构建研究,主要集中在规则匹配及规则推理的算法实现上。如雷洪涛等采用了基于规则驱动的规则匹配方法[4];孙海文等提出基于直觉模糊产生式规则推理的空袭目标威胁等级判断算法等[5],但在针对具体人机指挥对抗系统规则库的设计及规则在模型中的应用方面涉及不多。本文从人机对抗系统规则库需求出发,设计了一种红蓝人机指挥对抗系统规则库,给出了相关示例,且对其在智能对抗模型构建中的应用进行了研究。

1 基于规则推理的人机指挥对抗系统

1.1 典型结构

基于规则推理的人机指挥对抗系统典型结构如图1所示。由图1可知,除了具备传统指挥对抗系统各模块之外,该人机指挥对抗系统还具备智能化的蓝方指控模块。蓝方指控模块结合综合态势和规则库,采用规则推理的方法实现蓝方行动的智能化指挥。其中,规则库包含以规则形式编码的军事领域知识;推理机用来决定哪些规则的条件被满足;推理结论则用来生成相应的指挥命令。
图1 人机指挥对抗系统典型结构

Fig.1 Typical structure of human-machine command countermeasure system

1.2 规则推理的知识表示

规则推理是将相关领域的问题和解答用规则的形式串联在一起,并模仿专家思维进行推理求解的过程[6]。其工作过程是根据知识库存储的军事规则与实际决策条件进行匹配,由此选择相应决策结果,并推理出相应决策方案。其一般形式可表示如下:
i f   1 o r 2 M a n d M + 1 N t h e n 1 , 2 N
条件和结论可以是由逻辑运算符组成的多个条件和决策结果的逻辑组合,也可以是由函数、微分和积分公式等组成的数学表达式。为简化规则的结构和推理算法,多个条件之间或多个结论之间也可只采用“与”连接。当有“或”关系时,则可拆分为多条规则来表示,如下所示:
i f     1 a n d     2 t h e n     1 i f     1 a n d     2 t h e n     2

1.3 正向推理方式

规则推理技术中常用的推理方式有正向推理和逆向推理。正向推理是从if部分向then部分推理的过程,逆向推理则是从then部分向if部分推理的过程[7]。本文采用正向推理的方式,即if部分是决策条件,如对抗态势、请求报告、临机事件等,then部分是相应的决策结果即行动。其语义是:如果对抗态势或事件、请求报告或临机事件与已知规则相匹配,则需要执行相应一个或多个行动。图2所示为正向推理的直观描述。
图2 正向推理直观描述

Fig.2 Positive reasoning description

推理过程以初始条件集合为出发点,通过规则匹配在规则库中寻找对应条件的规则,如果有多条规则并发为真,则将这些规则放入冲突集加以处理,而后触发相应规则并形成决策结果,决策结果又可能会改变决策条件集合,然后再次进行正向推理过程,由此推进整个推理过程持续进行。

1.4 规则需求

人机指挥对抗主要实现红方作为进攻方,由真实的人指挥,蓝方作为防御方,由计算机进行智能指挥的人机指挥对抗训练需求。
通常来讲,红蓝双方作战对象相对固定,作战样式具备一定的典型性,蓝方的阵地配系和兵力、火力运用方法根据其作战条令相关知识,具有一般的可推理性。在以上前提下,要想实现人机对抗,从规则的角度至少需要满足以下两类需求。
一是能够支持蓝方作战方案的智能部署。规则库应当能够根据用户给定的作战样式、编组等信息,实现蓝方防御阵地区域的自动划分、各区域防御兵力的智能编配与部署。
二是能够支持对抗过程中蓝方智能指挥决策。规则库应支持根据战场态势条件实现对抗中的态势理解、任务分配和行动决策。

2 规则库设计

2.1 内容构成

本文主要针对红方作为进攻方,蓝方作为防御方的对抗训练需求,因此,规则库的内容主要是防御类作战样式下的规则,每类样式下,主要包括阵地编配规则库和指挥决策规则库两大类。阵地编配规则包含阵地划分规则和阵地部署规则;指挥决策规则库包含任务分配规则、指挥行动规则、请求响应规则和事件处置规则,其内容构成如图3所示。
图3 规则库内容构成

Fig.3 Content composition of rule base

2.2 结构设计

每条规则根据功能结构需求,均由规则编号、规则类型、条件、结论4部分组成。为了更好地描述本系统规则库的关系模型,可以将规则R描述为如下的四元组形式:
R=<ID,Name,PS,CS>
式中,ID为规则编号;Name为规则类型名称;PS为条件集合,PS= P i , i = 0 N;CS为结论集合,CS= C i , i = 0 N
同理,可以采用四元组的形式表达规则的条件P和结论C,如下所示:
P=<ID,E,M,V>
C=<ID,E,O,V>
式中,ID为条件或结论编号;E为条件或结论的属性;V为条件或结论的属性值;M为条件的匹配类型;O为针对结论的操作。

2.3 条件库

条件库是预定规则被触发执行的前提条件的集合,是智能决策模型中规则推理的依据。军事上则指采取某种行动必须具备的条件。条件库类别包括作战样式、我情、敌情、实体数量、时间、地域、战斗力比值条件。条件库的内容要全面,尽量覆盖所有可能。如表1所示为条件库类别及部分条件样例。
表1 条件库分类及样例

Tab. 1 Classification and samples of condition base

类别 条件名称
作战样式 A军作战样式1
B军作战样式2
我情条件 遭敌地面火力压制
战损(大于、等于、小于)XX
敌情条件 发现少许兵力活动
发现障碍区
实体数量 兵力(大于、等于、小于)XX
装甲车数量(大于、等于、小于)XX
时间条件 XX分钟后触发
X时X分X秒触发
地域条件 (A、B、C……)区域(左、中、右)翼
(前沿、阵中、后方……)XX千米
战斗力比值条件 战损率触发
敌我兵力对比触发
实际规则的调用中,条件信息可能是单个条件或多个条件的等式或不等式信息组合[8]。如某指挥规则的触发条件为:地域条件:(A区域;前沿0.4 km);红方条件:(敌情条件:发现少许兵力活动;实体数量:兵力少于10);蓝方条件:(我情条件:战损小于30%,实体数量:装甲车数量大于4)。在模型运转过程中,如果推演态势满足以上条件,就可以触发相应的动作。

2.4 结论库

结论库是预定规则被触发后执行的动作,是智能决策的结果。结论部分包括区域划分、部署位置、配系方法、作战任务和作战行动五大类。其中,作战任务指要达成的作战目的,如歼灭任务;作战行动指要达成该任务需要执行的一系列具体动作。结论库的内容同样要全面,尽量覆盖所有可能。表2所示为结论库分类及部分结论样例。
表2 结论库分类及样例

Tab. 2 Classification and samples of conclusion base

类别 结论名称
区域划分 7区域划分法
9区域划分法
部署位置 A区域左翼
B区域前沿
配系方法 前三角
前沿一线展开
作战任务 歼灭
占领
作战行动 直瞄射击
战术机动

2.5 阵地编配规则库

阵地编配规则库主要用来支持方案智能部署。阵地编配规则库是各作战样式下蓝方典型的阵地编配及部署规则,主要包括阵地区域划分规则和阵地部署规则。其中,根据作战样式的不同,可以建立典型作战样式下的阵地划分。如根据资料可知X军在作战样式1下,其典型的阵地可划分为ABCDEFG七个区域,不同区域内又可划分为一个或多个阵地,不同的阵地范围内,通常部署典型的作战分队。表3为某作战样式下的阵地划分规则样例,表4为该样式下阵地部署规则样例。
表3 阵地划分规则示例

Tab. 3 Samples of position division rule

作战样式 区域 阵地
X军作战样式1 A区域 A区域前哨阵地、A区域警戒阵地
X军作战样式1 B区域 B区域第一梯队排阵地
表4 阵地部署规则示例

Tab. 4 Samples of deployment rule

阵地 位置 编组 配系方法
A区域
警戒阵地
A区域前沿往后
延伸至XXX米
左翼警
戒分队
前三角部署
B区域第一
梯队排阵地
B区域前沿
线前XX-XX米
一梯队防
守分队
前沿一线展开

2.6 指挥决策规则库

指挥决策规则库的构建主要采用“事件(条件)+行动”的方法,即首先将各种作战行动的执行过程划分为若干阶段,阶段之间的过渡点、态势及各阶段之间的临机事件作为输入条件,制定针对事件的指挥规则,最后根据事件调用相应的处理规则,并执行相应的行动即可。指挥决策规则库包括任务分配规则、指挥行动规则、请求响应规则和事件处置规则四大类。
1)任务分配规则
任务分配规则主要描述不同对抗时节的任务分配规则,包含两个层面的内容。一是对抗时节判定规则,即当红方到达某区域并采取了何种行动时,可认为当前作战处于什么阶段。如在对抗开始后某一时刻,当在区域A首次发现红方实体活动时,可将当前阶段切换为区域A战斗时节。二是各对抗时节任务分配规则,即在某对抗时节,若前提条件满足,可由哪个指挥实体指挥下属分队应当执行何种任务。如在区域A战斗时节,区域A前沿左翼发现红方正在试图通过障碍区,则可赋予A区域指挥机构实施歼灭任务,如表5表6分别为对抗时节任务判定及任务分配规则示例。
表5 对抗时节判定规则示例

Tab. 5 Samples of confrontation phase division rule

作战样式 条件 对抗时节
X军作战样式1 A区域首次发现红方兵力活动 A区域战斗时节
X军作战样式1 AB区域被敌方占领 C区域战斗时节
表6 任务分配规则示例

Tab. 6 Samples of task dispatch rule

对抗时节 条件 编组 任务
X军作战样式1 A区域左翼发现红方正
在试图通过障碍区
A区域指
挥机构
歼灭
X军作战样式1 AB区域被敌方占领 C区域指
挥机构
逆袭
2)指挥行动规则
指挥行动规则主要描述指挥实体将作战任务分解为具体行动并指定执行单位的规则。如分配给A区域右翼指挥机构歼灭任务,若红方为步兵分队,则可以指派右翼坦克分队执行地点直瞄行动;若敌方为坦克分队,可以指派迫击炮分队执行炮兵射击行动。如表7所示。
表7 指挥行动规则示例

Tab. 7 Samples of action rule

对抗时节 任务 红方条件 蓝方条件 行动编组 目标区域 行动
A区域战斗时节 歼灭 A区域右翼红方步兵正试图通过障碍区 A区域左翼有防守步兵 A区域左翼防守步兵 A区域左翼前沿 直瞄射击
A区域战斗时节 歼灭 A区域右翼红方步兵正试图通过障碍区 A区域左翼有迫击炮分队 A区域左翼防守火力分队 A区域左翼前沿 压制射击
3)请求响应规则
请求响应规则主要描述下级的请求条件和上级的实体响应并指挥所属分队执行相关行动的规则。如区域A某指挥实体发现其任务区域出现大量红方装甲分队时,可以发出上级炮兵拦阻区域A大量装甲分队的请求,上级指挥实体接收到请求后,即可根据请求内容指派相应分队对该区域进行火力打击。表8为请求响应规则示例。
表8 请求响应规则示例

Tab. 8 Samples of request response rule

红方条件 蓝方
条件
请求编组 目标区域 行动
A区域发现大量红方装甲分队 忽略 上级炮兵 A区域阵中 火力压制
AB区域被敌方占领 忽略 上级航空兵 A区域阵中 航空轰炸
4)事件处置规则
事件处置规则主要描述各分队在遇到突发情况时的行动策略。如当区域A防守分队1遇到敌火力打击事件时,则可执行机动转移行动。表9为事件处置规则示例。
表9 事件处置规则示例

Tab. 9 Samples of event handling rule

红方
条件
蓝方条件 行动
编组
目标区域 行动
忽略 遭敌火力打击 自身 C区域后方 机动
忽略 遭敌持续攻击 自身 B区域阵中 强行撤离

3 基于规则的智能对抗模型

3.1 方案智能部署模型

方案智能部署模型以作战样式、编组、任务范围和防御方向为前提条件,基于阵地编配规则,采取正向推理的方式实现方案智能部署,其流程如图4所示。
图4 方案智能部署流程图

Fig.4 Intelligent COA deployment flow chart

一是将作战样式、任务范围及防御方向等数据作为初始推理条件。不同作战样式下,任务区域体系地幅、能力配系不同,如山地防御和岸滩防御,其阵地构成不尽相同。任务范围可以是整个防御阵地的大体区域。
二是进行区域识别并划分阵地区域。获取了基本条件后,可根据阵地划分规则首先识别出可部署兵力的区域,再根据任务地域近长方形的特点,从初始条件区域中选取8个点,即长方形4个角和4条线近中心点,并根据不同作战样式下防御体系构设特点对任务区域进行智能划分,如典型的前中后、左中右式的防御部署。
三是将实际编组与作战样式下的典型作战编组结构相关联,并根据区域配系规则,确定不同编组实体的实际部署位置和配系方法。
四是对未能匹配成功的编组或需要调整的内容进行人工调整。

3.2 智能指挥决策模型

智能决策模型按照OODA理论构建,在仿真运行的每个步长中,智能决策模型分为态势感知、态势理解、任务分配和行动决策四个大的步骤[9]。其中,态势感知作为整个决策过程中规则推理的初始条件集合,每一环节的输出作为后一环节的输入条件与相关规则进行匹配,最终形成行动指令,从而实现智能指挥的目的,其基本流程如图5所示。
图5 智能指挥决策模型基本流程

Fig.5 Basic flow of intelligent command decision

1)态势感知
态势感知过程实质是规则推理的条件获取部分,其主要目的是在某特定时刻环境下,将整个对抗区域中各单元的输入信息与历史态势和领域中事件模式类特征模板进行比较、分析、判断,从而提取出关心的态势要素,其目标是获得对态势估计有意义的事件[10]。态势感知的内容包括方案数据、红蓝方情况数据、环境数据和报告数据。
作战方案数据感知主要获取作战样式数据、任务区域数据(点、线、面)、进攻方向数据、防御方向数据、毁伤要求数据等。
红蓝方情况数据感知主要获取蓝方实体数据和侦察到的红方实体数据,包括各类战果、战损数据等。
环境数据感知主要获取地理信息环境数据,如工事、障碍、建筑数据等。
报告数据感知主要获取蓝方的各类报告信息。
2)态势理解
态势理解阶段可将感知阶段获得的数据作为规则匹配的条件,结合阵地区域划分,判断红方部署和行动企图,实现对红方意图和计划的识别。态势理解主要过程是根据区域划分,重点分析不同作战区域内红蓝双方的实体数量、情况报告等,结合区域环境形成对当前态势的理解结果数据,主要包括:
发展趋势类:包括统计计算红方N个步长内位置移动的方向、距离。
局部区域实体统计类:统计各区域内、外红蓝方实体数量、战斗力累计值。
蓝方实体侦察范围内实体统计类:统计蓝方实体侦察范围内、外红方实体数量、战斗力累计值。
蓝方实体打击范围内实体统计类:统计蓝方实体打击范围内、外红方实体数量、战斗力累计值。
态势理解后,将红方情况、环境数据、蓝方情况和双方态势输出作为任务分配的条件集合,用于支撑任务分配和行动决策。
3)任务分配
任务分配模型可将态势理解结果作为任务分配规则的输入条件,依据预定的任务分配规则对各指挥实体分配任务。其步骤如下:
一是根据红方进攻情况和对抗时节判定规则来确定对抗时节,明确当前处于何种作战阶段。
二是根据对抗时节、敌我情条件和各个时节的任务分配规则,确定当前态势下各编组应当采取的任务,如歼灭、火力拦阻等行动类任务或请求支援等相关请求响应类任务。
4)行动决策
行动决策模型可根据任务分配结果和临机事件,结合红蓝方态势条件进一步规则推理,确定要执行的具体行动指令。并根据行动参数要求和指令模板,生成结构化指令并下达,以实现蓝方的智能指挥决策。其步骤如下:
一是根据任务分配结果、红蓝条件和环境数据与相应规则库进行推理,行动类任务根据指挥行动规则进行判定,请求响应类任务根据请求响应规则进行判定,明确该任务下需要执行的具体单位和行动。
二是根据事件处置规则和态势感知中的临机事件、敌我情条件直接进行推理,明确下一步的行动。
三是结合行动参数及原有系统指令模板生成相应行动指令。指令内容主要包括任务执行单位、行动目标、行动路线、行动要求等。

4 结束语

本文对人机指挥对抗系统的规则设计进行了研究。首先,根据人机指挥对抗系统的典型结构和规则推理的运行机制,提出了人机对抗系统的规则需求;其次,设计了规则库的内容构成、基本结构、条件库、结论库、阵地编配规则库和指挥决策规则库,并给出了实例;最后,将以上规则库在方案智能部署模型及智能指挥决策模型构建中进行了应用。
[1]
黄凯奇, 兴军亮, 张俊格, 等. 人机对抗智能技术[J]. 中国科学: 信息科学, 2020, 50(4): 540-550.

HUANG K Q, XING J L, ZHANG J G, et al. Intelligent technologies of human-computer gaming[J]. Scientia Sinica(Informationis), 2020, 50(4): 540-550.

[2]
申耀德, 杜晓明, 葛涛, 等. 基于规则的装备保障指挥决策模型研究[J]. 计算机测量与控制, 2012, 20(1): 135-137.

SHEN Y D, DU X M, GE T, et al. Research of modeling equipment maintenance command decision based on formula[J]. Computer Measurement & Control, 2012, 20(1): 135-137.

[3]
傅调平, 张奥狄, 马滨强. 机器博弈海战兵棋推演系统的设计实现[J]. 计算机仿真, 2015, 32(3): 14-18.

FU T P, ZHANG A D, MA B Q. Design and realization of the naval war game system based on computer game[J]. Computer Simulation, 2015, 32(3): 14-18.

[4]
雷洪涛, 单小芬, 诸周亮. 基于知识驱动的船舶设备基座参数化设计方法[J]. 舰船科学技术, 2021, 43(17): 70-73.

LEI H T, SHAN X F, ZHU Z L. Parametric design method of ship equipment pedestal based on knowledge driven[J]. Ship Science and Technology, 2021, 43(17): 70-73.

[5]
孙海文, 谢晓方, 孙涛, 等. 基于直觉模糊产生式规则推理的空袭目标威胁等级判断[J]. 兵器装备工程学报, 2019, 40(5): 33-37.

SUN H W, XIE X F, SUN T, et al. Air raid targets threat level judgment method based on intuitionistic fuzzy production rule reasoning[J]. Journal of Ordnance Equipment Engineering, 2019, 40(5): 33-37.

[6]
卢文轩. 基于规则推理和多层实例库的组合夹具设计系统开发[D]. 南京: 南京航空航天大学, 2017.

LU W X. Development on modular fixture design system based on RBR and multilayer-case-base[D]. Nanjing: Nanjing University of Aeronautics and Astronautics, 2017.

[7]
李行洲. 基于规则推理的去中心化知识共享机制[D]. 武汉: 武汉科技大学, 2019.

LI X Z. Decentralized knowledge sharing mechanism based on rule reasoning[D]. Wuhan: Wuhan University of Science and Technology, 2019.

[8]
宋双. 基于RETE规则推理的告警关联分析子系统的设计与实现[D]. 北京: 北京邮电大学, 2019.

SONG S. Design and implementation of alarm correlation analysis subsystem based on RETE rule reasoning[D]. Beijing: Beijing University of Posts and Telecommunications, 2019.

[9]
吴志强, 张俊峰. 基于深度强化学习的自动态势估计研究[J]. 军事运筹与系统工程, 2018, 32(2): 42-46.

WU Z Q, ZHANG J F. A study on automatic situation assessment based on deep reinforcement learning[J]. Military Operations Research and Systems Engineering, 2018, 32(2): 42-46.

文章导航

/