Virtual commander’s operational decision-making model based on thinking simulation

JIA Chenxing, MING Yuewei, GE Chenglong

PDF(1587 KB)
中国科技核心期刊      中国指挥与控制学会会刊     军事装备类重点期刊
Command Control and Simulation ›› 2025, Vol. 47 ›› Issue (1) : 44-52. DOI: 10.3969/j.issn.1673-3819.2025.01.006
Command & Control

Virtual commander’s operational decision-making model based on thinking simulation

Author information +
History +

Abstract

Focusing on the urgent need of joint operational plan simulation experimentation, aiming at the lack of intelligent decision-making ability of command entity in the current joint operations simulation systems, and the difficulty of popularizing the simulation experimentation pattern of man-not-in-loop, this paper researches a joint campaign level simulation intelligence which named virtual commander in the simulation loop to simulate the thinking and behavior of human commander’s operation decision-making. This paper puts forward the definition and orientation of virtual commander’s operational decision-making, constructs a framework of virtual commander’s operational decision-making model, and designs the virtual commander’s operational decision-making thinking model, behavior model and simulation model based on the theory of natural decision-making, which provides a feasible solution to the bottleneck problem of simulation experimentation pattern of Man-Not-In-Loop.

Key words

virtual commander; decision-making modeling; natural decision-making theory; model framework; joint operational plan simulation experimentation

Cite this article

Download Citations
JIA Chenxing , MING Yuewei , GE Chenglong. Virtual commander’s operational decision-making model based on thinking simulation. Command Control and Simulation. 2025, 47(1): 44-52 https://doi.org/10.3969/j.issn.1673-3819.2025.01.006
联合作战方案仿真实验是联合作战筹划的必要环节,评估方案的可行性、完整性和适应性[1-6]。“人不在回路”是不可或缺的一种仿真实验模式,具有易实施、效率高、支持多次反复实验等优点,通过多样本统计分析帮助军事人员评估方案,以及洞察战场上各种随机不确定性因素[7-10]。当前,联合作战仿真系统由于缺少联合战役层级指挥实体,或指挥实体仅从技术层面抽象模拟作战人员决策行为,忽略了决策思维的核心主导地位,陷入“形似神不似”的困境,导致“人不在回路”仿真实验效果不佳。本文探索研究一类以决策思维模拟为核心的拟人仿真智能体,旨在实现决策思维与决策行为、仿真技术有机融合,为解决问题提供一种可行途径。

1 虚拟指挥员

“虚拟人”(virtual human)是一类由计算机生成的仿真实体,是研究人类生理、心理、行为以及与人类有关社会活动的一种有效方式。近年来,国内外基于智能技术的“虚拟人”在军事领域应用不断深入,主要集中在决策支持和虚拟训练,如美陆军“指挥员虚拟参谋(commander’s virtual staff)”、美辛辛那提大学虚拟飞行员“阿尔法”等。
“虚拟指挥员”(virtual commander)是一类面向联合作战方案仿真实验领域、应用于“人不在回路”仿真实验模式、由计算机生成的“虚拟人”,对人类指挥员认知与决策智能行为能力抽象模拟,具备态势认知、作战决策和行动控制等关键能力,在仿真回路中发挥联合战役层级指挥与控制职能作用。
在“人不在回路”仿真实验中,虚拟指挥员通过与其他仿真实体、战场环境进行交互,实时接收、处理战场信息,认知理解战场态势,依据作战方案指挥控制兵力实体实施作战行动,临机决策处置影响作战方案实施和作战目的达成的各种非预期战场情况,确保作战实际按照作战预想发展演进。

2 虚拟指挥员作战决策

2.1 虚拟指挥员作战决策定义

虚拟指挥员发挥指挥与控制职能作用应具备3大核心能力:态势认知、作战决策和行动控制,如图1所示,其中,作战决策是虚拟指挥员指挥与控制环路中极为重要的核心能力,是实现认知向决策、决策向行动转化的关键枢纽。
Fig.1 Three core capabilities of virtual commander based on OODA loop

图1 基于OODA环路的虚拟指挥员三大核心能力

Full size|PPT slide

虚拟指挥员作战决策以作战方案为基本依据和约束,在作战仿真过程中根据敌情、我情、战场环境等发展变化,在特定决策时机、为实现既定作战目的,制定、优选临机处置方案的决策活动。
虚拟指挥员作战决策模拟的是作战指挥员在作战实施过程中根据战场情况变化对作战方案进行调整或补充完善。具体而言,在“人不在回路”仿真实验过程中,作战方案可被解析为以时间为轴线、前后衔接、相互关联的一系列作战任务。虚拟指挥员实时跟踪监视作战进展、作战效果,掌握方案执行情况。当出现突发性非预期战场情况,导致方案中作战任务执行受阻或未达预期效果,威胁到作战目的达成、影响后续关联任务执行时,虚拟指挥员以目的和效果为输入,实施临机处置类作战决策,确保作战方案顺利实施、仿真实验进程不中断。
虚拟指挥员作战决策要与兵力实体行动决策区分认识。前者是将作战目的转化为一系列由兵力实体、目标、效果、行动序列等要素构成的作战任务,是一种方案级决策;后者则是以作战条令规则、行动方法为约束,根据上级任务对作战行动进行具体设计,如机动路线规划、目标分配、武器装备运用等,是一种行动级决策。

2.2 虚拟指挥员作战决策定位

2.2.1 决策时机

作战方案仿真实验是在预想的敌情、我情、战场环境等实验条件下,检验方案能否达成作战目的。理想状态是,方案中各类任务及其行动能在仿真过程中完整且不间断地执行,作战仿真进程按照预想条件顺利演进。但受限于有限预见性、仿真随机性等因素,敌我行动及其对抗结果会产生预想之外的非预期战场情况,即方案中未能提前预见、仿真过程中随机突发的,对作战任务及其行动和战局发展具有一定影响程度的战场情况。非预期战场情况可分为3个等级:
(1) 可容忍性非预期战场情况。战场局部出现的、不影响后续任务执行和目的达成的作战行动附带结果,方案仍可继续执行。
(2) 局部关键性非预期战场情况。方案中通常设有关键任务,对达成作战目的具有重要支撑作用,也是后续关联任务执行的必要前提。当关键任务不具备执行条件、执行受阻或未达预期效果时,方案无法继续执行,需要指挥员根据情况临机决策、及时纠偏。
(3) 全局重大性非预期战场情况。当多数关键作战任务无法执行或不能达成预期作战目的,战场情况与作战预想存在较大差异。如出现此类情况,则表明方案存在重大缺陷和不足,必须停止实验并修改方案。
虚拟指挥员作战决策,是在作战方案执行过程中出现局部关键性非预期战场情况时,基于任务目标、效果进行临机处置决策,确保关键性作战任务顺利执行、达成预期效果,避免作战仿真偏离实验设计。

2.2.2 决策方式

作战决策要求具有主体核心性、目标一致性、结果整体性。虽然作战指挥体系是典型的层级化架构,但最高层级指挥员是作战全局唯一的核心决策主体,具有最终的决策职责和权力。针对“人不在回路”作战方案仿真实验,虚拟指挥员作战决策适合采取单智能体集中式决策方式。一方面,符合虚拟指挥员决策层级定位,确保虚拟指挥员从作战全局考虑,获得全局最优解;另一方面,避开多智能体通信、交互协作等难点问题,降低仿真实现难度。此外,与基于智能体的即时博弈对抗不同,引入虚拟指挥员旨在实现无人为干预下作战方案自动化仿真,对作战决策的实时性要求适中,通过仿真进程自动控制,能够有效解决单智能体决策实时性问题,同时减少模型计算对仿真资源的需求。

2.2.3 决策能力

虚拟指挥员作战决策应具备以下能力:
一是威胁感知能力。作战仿真过程中,实时掌握关键任务执行情况和效果反馈。当任务执行受阻或效果不及预期,则判定出现威胁,及时触发临机决策。
二是方案生成能力。针对关键任务执行问题,在作战方案和作战资源约束下,依据作战规则合理选择作战力量,设计若干作战行动,形成一套或多套备选方案。
三是方案评估能力。在预测敌方可能行动的基础上,分析评估备选方案的执行效果、风险代价等,优选最佳方案作为决策结果。
四是学习进化能力。战争复杂性、仿真随机性决定了决策问题无法穷尽。如果虚拟指挥员决策知识相对固定,或者依赖于军事专家不断补充完善,则可用性大打折扣。虚拟指挥员必须具备不断更新优化、拓展完善决策知识的能力,才能实现对新问题的智能自主决策。

3 虚拟指挥员作战决策模型体系框架

决策思维是指挥员作战决策活动的核心主导,决策行为和方法技术是其外在表现。虚拟指挥员作战决策模型必须实现决策思维、决策行为和方法技术的有机融合,以决策思维主导决策行为、指导方法技术运用,才能实现“形似”与“神似”的统一。
虚拟指挥员作战决策模型体系框架及内部信息交互如图2所示,由思维活动模型、行为活动模型和仿真模型3部分构成。
Fig.2 System framework of virtual commander’s operational decision-making model

图2 虚拟指挥员作战决策模型体系框架

Full size|PPT slide

作战决策思维活动模型是对人类指挥员作战实施过程中复杂环境、高压力条件下基于直觉认知和经验知识的快速反应决策思维活动的抽象表示,其核心思想是通过相似问题的解决经验类比推理形成当前决策问题的解决策略,并经过评估优选后形成最终决策。同时,引入了学习进化机制,通过学习持续积累经验知识,优化智能决策能力水平。在框架中,作战决策思维模型是虚拟指挥员的“大脑”,是作战决策的内核驱动,向下主导作战决策行为活动。
作战决策行为活动模型是对虚拟指挥员作战决策行为过程和内容的抽象表示。根据决策思维方法和特点,作战决策行为分为威胁感知、决策生成、决策评估和决策确定四个基本步骤,依次完成决策问题认知、方案制定、方案评估和方案优选,并且在决策过程中以及根据决策结果反馈实现自身决策知识的拓展完善。
作战决策仿真模型是从仿真实现和应用层面提出的模型结构和功能模块设计,用于指导基于技术方法的仿真模型构建。作为框架的最底层,该模型最终实现决策思维、决策行为和技术方法的有机融合。根据作战决策行为过程和内容,相应地分为威胁感知、决策生成、决策评估和决策确定4大功能分区,每个功能分区中的功能模块对应实现一定的决策行为。

4 虚拟指挥员作战决策思维活动模型

4.1 指挥员作战决策思维活动分析

作战指挥员作战决策思维方式受时机、环境、条件等方面影响会有一定差异性。作战实施过程中,作战决策活动具有动态对抗性、博弈制约性、时间紧迫性、胜负决定性等特征。一方面,战场中“迷雾”层叠,交战双方施计用谋、隐真示假、佯动欺骗,指挥员作战决策面对的是不完全、不完美战场信息,充满不确定性因素;另一方面,战场情况动态发展、瞬息万变,决策环境高度复杂且决策时间紧迫,指挥员无法提前预判决策问题,也难以在时间紧迫情况下建立完全理性的决策模型。面对动态复杂环境和紧迫时间压力,为了能高效应对处置各种非预期战场情况,作战决策主要是依赖经验知识寻求相对优解,采取类似于模式识别方式从记忆中搜寻类似的决策场景,迅速制定一套可行方案。
美军在FM6-0号陆军野战条令中将指挥员作战决策分为两大类:分析式决策(analytic decision making)和直觉式决策(intuitive decision making)[11]。分析式决策体现在联合作战行动筹划与计划工作过程中,主要是在时间较为充裕条件下综合考虑各方面因素,运用作战决策模型计算分析找到最优方案,代表了一种基于计算分析的谨慎思维活动;直觉式决策主要发生在作战实施过程中,是在时间紧迫条件下聚焦当前情况,凭借指挥员的直觉认识和经验知识直接决策生成可行的解决方案,代表了一种基于直觉经验的快速反应思维活动。
综上所述,作战实施过程中指挥员是“有限理性人”,其作战决策符合直觉式决策活动特征,是一种基于直觉认知和经验知识的快速反应决策思维方法和过程。

4.2 基于NDM的作战决策思维活动模型

虚拟指挥员作战决策思维模型,抽象模拟的是指挥员在作战实施过程中基于直觉认知和经验知识的快速反应决策思维方法和过程。本文在自然决策理论(naturalistic decision making,NDM)[12]基础上,提出一种融合经验直觉式决策和学习进化机制的虚拟指挥员作战决策思维活动概念模型。
虚拟指挥员作战决策思维活动模型如图3所示,其核心思想是“相似问题有相似解”,充分利用经验知识的价值,并通过学习不断积累经验知识,实现决策能力与水平的动态成长。经验知识中包含了各类决策问题及其解决方案。在虚拟指挥员作战决策时,选择与当前决策问题完全相同或最为相似经验知识,生成当前决策问题的可行解决方案。具体来说,在实时战场态势认知和理解的基础上,虚拟指挥员提取关键任务执行情况、作战效果以及任务相关的敌方行动等动态决策信息,依据作战方案计划中明确的任务预期效果,分析判断关键任务执行是否出现问题、是否达成作战目的。如果判断出现非预期战场情况,则立即进行临机决策处置。根据当前决策问题检索、匹配经验知识,如果存在“完全匹配”的经验知识,则将其解决方案直接作为备选方案;否则,选取“相似度”满足阈值要求的一个或多个经验知识,通过智能推理生成可用于当前决策问题的备选方案。后续,以脑力推演方式检验评估备选方案的可行性。如果备选方案能够解决问题,则确定为最终方案。如果备选方案基本可行,则继续对方案修改完善直至完全可行。如果备选方案完全不可行或多次修改后仍不可行,则虚拟指挥员无法解决当前问题,需要中断仿真,即时补充完善经验知识。
Fig.3 Concept model of virtual commander’s operational decision-making thinking

图3 虚拟指挥员作战决策思维活动概念模型

Full size|PPT slide

为保证虚拟指挥员作战决策思维活动模型的适用性、可行性,提出两点基本假设:
假设一:虚拟指挥员是经过良好训练的决策者,具备丰富的决策知识。在仿真实验准备阶段,一项重要工作是将作战指挥员、军事专家的经验知识抽象转化为结构化的决策知识,为虚拟指挥员作战决策能力初始化赋能。决策知识应具有典型性、广泛适用性,虚拟指挥员才能在遇到突发非预期战场情况时运用知识快速决策。
假设二:虚拟指挥员是一个优秀的决策者,心理状态、风格偏好保持稳定。虚拟指挥员具有良好的心理素质和成熟稳重的性格,在作战决策时不会感情用事,也不会冲动、冒险激进,能够冷静地分析判断情况和决策,依据实验人员设定的评估准则选择风险效益最为适合的方案。

5 虚拟指挥员作战决策行为概念模型

在决策思维主导和支配下,虚拟指挥员作战决策行为活动被抽象表示为4个基本步骤:威胁感知、决策生成、决策评估和决策确定,如图4所示。
Fig.4 Concept model of virtual commander’s operational decision-making behavior

图4 虚拟指挥员作战决策行为概念模型

Full size|PPT slide

5.1 威胁感知

威胁感知阶段以分析判断关键任务执行情况、认知决策问题为目的,主要包括3项行为活动内容:任务决策信息获取、任务情况分析判断和任务问题场景生成。
任务决策信息获取以作战方案和实时战场态势为主要信息源,解析、提取关键任务的目标对象、期望效果和实际执行情况等信息,为分析判断关键任务是否达成目的提供支撑。根据决策信息的来源、作用以及其仿真特性,分为静态决策信息和动态决策信息。静态决策信息是指作战仿真过程中保持恒定不变的决策信息,其来源是作战方案,主要是描述关键任务的部队实体、目标、效果和行动等方面信息,反映了关键任务的预期目的,是虚拟指挥员作战决策的基本依据和约束。动态决策信息是指随仿真时间推进、任务执行而动态变化的决策信息,其来源是实时战场态势,主要是描述关键任务的执行状态、执行结果和任务时空范围内的局部态势,是虚拟指挥员作战决策的必要条件。动态决策信息获取是在仿真过程中实时、持续且循环反复的。
任务情况分析判断是在任务决策信息获取的基础上,根据一定的条件规则,分析判断关键任务是否执行完成、实际效果是否达到预期目的。通过动态决策信息中的任务执行状态能够了解关键任务是否执行、是否完成,通过对比分析动态决策信息中的实际效果和静态决策信息中的预期效果能够掌握任务完成度。经分析判断后,如果关键任务未能顺利完成或未达预期效果,则判定关键任务执行过程中出现非预期战场情况,需要进一步定位问题和临机决策处置。
任务问题场景生成是在判定关键任务已经出现非预期战场情况之后,对关键任务及其预期目的、执行情况、局部态势进行特征描述,构建能够客观反映决策对象、决策目标和决策环境的问题场景。任务问题场景中,决策对象是特定关键任务,既要对该任务的基本特征属性进行描述,也要对任务执行问题情况进行特征描述,如不满足执行条件、目标状态变化、敌方行动干扰、作战效果未达预期等;决策目标是实现关键任务的预期目的,即达到作战方案计划中明确的任务效果,要根据当前实际执行情况与预期目的之间的差距确定;决策环境是关键任务执行相关的、局部时空范围内的战场态势,应包括任务部队、目标实时状态和敌方行动、战场环境等方面特征描述。任务问题场景生成实现了虚拟指挥员对决策问题的基本认知。

5.2 决策生成

决策生成阶段是虚拟指挥员作战决策行为活动过程中最为核心的环节,其目的是以运用决策知识和决策方法生成决策问题的解决方案。虚拟指挥员作战决策抽象模拟的是人类指挥员利用经验知识,通过相似问题求解策略类比推理生成当前问题求解策略。决策知识是对作战指挥员经验知识的抽象表示,以“问题场景+解决方案”的结构化形式存储;决策方法是基于问题场景的类比推理,即从决策知识中检索匹配相似的问题场景及其解决方案,经过智能推理、适应性修改后生成当前问题的解决方案。另外,为了更好地模拟作战指挥员在实践过程中不断学习、积累经验的智能行为特性,虚拟指挥员也要具备决策知识学习进化能力,通过每一次作战决策不断更新优化、拓展完善决策知识,能更好地解决新问题。因此,决策生成阶段主要包括3项行为活动内容:决策知识检索匹配、决策方案智能生成、决策知识学习进化。
决策知识检索匹配是以关键任务的问题场景为牵引,根据问题场景的特征属性,依据一定的条件规则,从决策知识库中检索、匹配最为相似的若干知识单元,为决策方案智能生成提供必要知识基础。决策知识检索匹配是一个从众多历史经验方案中调取可用参考方案的过程,问题场景特征属性是检索与匹配的基本依据。
决策方案智能生成是以决策知识检索匹配得到、具有问题相似性的若干知识单元为基本依据,通过分析关键任务的预期目的、当前执行情况以及局部态势条件,对若干知识单元中的解决方案进行选择和适应性修改、补充完善,最终形成一套或多套备选方案。
决策知识学习进化是一个贯穿虚拟指挥员生命周期的持续性行为活动,其核心目的是实现决策知识的更新优化、拓展完善,即记录新知识、更新优化现有知识和遗忘无用知识。决策知识学习进化以决策评估阶段输出的方案评估结果和决策确定阶段输出的最终方案及其执行结果反馈为主要依据,将新问题及其可行解决方案作为新的知识单元存入决策知识库,更新决策知识库中被匹配、被重用的若干知识单元的价值特征。人类大脑对于经验知识的记忆能力是有限的。同理,虚拟指挥员的决策知识库也通常设有一定规模限制。当决策知识库达到规模边界时,虚拟指挥员会将价值效益低的知识单元淘汰剔除,保证决策知识检索匹配效率。

5.3 决策评估

决策生成阶段输出的若干备选方案构成了备选方案集。决策评估阶段是虚拟指挥员作战决策有效性的根本保证,其核心目的是分析评估备选方案的可行性和风险代价。可行性主要分析评估各方案解决当前问题、达成预期目的的概率;风险代价主要分析评估各方案的作战效益、代价和风险因素。方案评估方法有很多种,如兰彻斯特方程法、基于数学模型的解析计算方法,基于经验规则的逻辑推理法(模糊概率推理)等。但在作战仿真过程中,上述方法要么模型难以根据具体问题动态调整,要么仅依赖经验概率缺乏可信性,与作战仿真环境脱节。相比之下,采取仿真推演方法能更全面反映各种作战因素复合作用和动态随机性概率,也符合作战指挥员作战过程中脑力推演模式。因此,决策评估阶段适合采取仿真推演方法验证备选方案的可能结果,并基于仿真结果数据分析评估备选方案的可行性和风险代价。决策评估阶段主要包括两项行为活动内容:备选方案仿真推演和备选方案分析评估。
备选方案仿真推演,模拟的是作战指挥员通过作战仿真手段检验评估方案。以备选方案为仿真对象,依据任务问题场景构建与之相同的作战场景,通过执行备选方案、客观呈现作战结果。特殊之处在于,虚拟指挥员本身就处于作战仿真之中。因此,方案仿真推演是一种“仿真中的仿真”。方案仿真推演所构建的作战场景,并不是完整的战场环境及其全部作战要素,而是将与关键任务相关的实体、目标、局部战场环境、敌方行动等要素抽取出来构成的小规模作战场景,其是对任务问题场景的映射还原。在小规模作战场景中执行备选方案、记录仿真结果,为方案分析评估提供条件支撑。
备选方案分析评估是在备选方案仿真推演结果的基础上,分析评估备选方案的可行性和风险代价。为确保评估结果准确可信,可多次反复仿真并统计分析得出最终评估结论。如果备选方案能够解决当前问题,达成预期目的,则该备选方案被认定为可行方案,根据仿真结果计算方案的可行概率和战果、战损等风险代价;如果所有备选方案都不能解决问题,则将返回决策生成阶段,虚拟指挥员结合评估结论修改完善备选方案,如此反复直至找到可行方案。

5.4 决策确定

决策确定是虚拟指挥员作战决策的最后一个行为环节,其目的是根据方案分析评估结论,权衡利弊、优选最满意的方案作为最终方案。最终方案虽然经历了决策评估,但最终是否能够真正解决问题,还需要实践检验。因此,虚拟指挥员还需要关注和监控最终方案在作战仿真中的执行结果。决策确定阶段主要包括两项行动内容:可行方案决断优选和方案执行结果获取。
可行方案决断优选是指根据方案分析评估结论,按照一定规则将可行方案进行综合排序,确定最终方案。排序规则重点是考虑方案可行概率、战果、战损等方面因素。此外,排序规则是建立在虚拟指挥员决策风格偏好假设的基础上,如追求最稳妥可行的方案,或是不计风险代价追求利益最大化,建议寻求风险代价最小化等。因此,在必要时,可以在该环节中引入虚拟指挥员个性化决策因素。
方案执行结果获取是指在最终方案输出后,跟踪观察方案执行结果。如果方案成功解决问题,则记忆新问题及其解决方案,不断拓展完善决策知识库,实现虚拟指挥员作战决策能力水平的持续进化。如果最终方案无法解决问题,则再次触发虚拟指挥员作战决策,重新提取最新的决策信息,构建任务问题场景,再次决策生成解决方案,直至问题被有效解决。

6 虚拟指挥员作战决策仿真模型功能构成

虚拟指挥员作战决策仿真模型由4个功能分区构成:威胁感知、决策生成、决策评估、决策确定。
(1)威胁感知功能分区由任务信息解析器、任务情况监视器、任务问题感知器和关键任务信息库构成。任务信息解析器主要是从作战仿真系统中获取数据化的作战方案计划,从中提取关键任务的静态决策信息,如任务实体、任务目标、任务效果、行动计划等,存入关键任务信息库,作为分析判断关键任务执行情况和问题的基本依据。任务信息解析可以在仿真初始化时完成,在动态仿真过程中提升模型决策效率、减少计算资源占用率。任务情况监视器主要依据关键任务信息库提供的关键任务清单,从虚拟指挥员态势认知模型中获取实时战场态势,提取关键任务的动态决策信息,如任务状态、任务效果、局部态势等。任务问题感知器主要是通过静态和动态决策信息分析任务执行情况及其完成度,由此判断是否出现问题。当虚拟指挥员发现关键任务执行出现问题后,虚拟指挥员从静态和动态决策信息中提取能够客观反映问题情况的特征属性,以任务问题场景的形式表示决策问题。
(2)决策生成功能分区由决策知识适配器、决策方案生成器、决策知识学习器和决策知识库构成。决策知识库是实现虚拟指挥员智能自主决策的重要基础条件,库中以“问题场景+解决方案”的结构化形式存储知识单元。知识单元的初始化构建主要是依赖作战指挥员、军事专家的经验知识。决策知识适配器主要是根据任务问题场景,从决策知识库中检索匹配与当前任务问题场景具有一定程度相似性的若干知识单元,为决策方案生成提供必要知识。决策方案生成器主要是以决策目标为牵引,根据关键任务实际情况、局部态势条件,将经验方案进行合理组合、适应性修改和补充完善,最终形成一套或多套备选方案。决策知识学习器主要实现3个方面功能:一是知识更新优化,记录知识单元匹配、重用情况,并根据方案评估结果、方案执行结果更新知识单元的效益价值,从而优化决策知识检索匹配与推荐排序;二是知识拓展完善,将新问题及其解决方案存储入库,实现决策知识的增量积累;三是知识重组与遗忘,当决策知识库达到规模阈值时,对极为相似的知识单元进行聚类重组和归并,对效益价值处于末尾边缘的知识单元进行淘汰,提升高价值知识密度,减少知识冲突和冗余。
(3)决策评估功能分区由方案仿真器和方案评估器构成。方案仿真器主要是采取“仿真中仿真”的方式,对备选方案进行仿真推演,生成量化的仿真数据,为方案评估提供数据支撑。方案评估器主要是根据评估指标和规则,对备选方案的可行性和风险代价进行分析评估,给出评估结论,为方案优选提供依据。
(4)决策确定功能分区由方案选择器和方案观察器构成。方案选择器主要依据方案评估结果,根据预先设定的虚拟指挥员决策风格偏好,选择、确定符合其意图的方案作为最终方案,并输出至虚拟指挥员行动控制模型。后者将方案转化为行动指令输入作战仿真系统,实现决策执行。方案观察器是在最终方案输出执行后,通过接收作战仿真系统中的实时战场态势,观察方案实际执行结果,并将结果反馈至决策知识学习器。

7 结束语

本文聚焦联合作战方案仿真实验领域,提出了一种基于思维模拟的虚拟指挥员作战决策模型体系框架,基于自然决策理论构建了融合经验直觉式决策和学习进化机制的虚拟指挥员作战决策思维活动模型、行为模型和仿真模型,为解决“人不在回路”仿真实验技术难点问题提供了一种可行的解决途径。

References

[1]
李梦汶. 联合作战仿真实验的几个基本问题[J]. 军事运筹与系统工程, 2008, 22(1): 25-29.
LI M W. Several basic issues on joint operations simulation experimentation[J]. Military Operations Research and Systems Engineering, 2008, 22(1): 25-29.
[2]
胡红云, 郑世明. 联合作战方案仿真推演控制研究[J]. 军事运筹与系统工程, 2016, 30(1): 76-80.
HU H Y, ZHENG S M. Research on simulation deduction control of joint operations plan[J]. Military Operations Research and Systems Engineering, 2016, 30(1): 76-80.
[3]
刘兆鹏, 柳少军, 司光亚, 等. 面向推演分析的联合作战方案概念建模研究[J]. 系统仿真学报, 2018, 30(12): 4 563-4 573.
LIU Z P, LIU S J, SI G Y, et al. Research on the conceptual modeling of COA for analysis of wargaming[J]. Journal of System Simulation, 2018, 30(12): 4 563-4 573.
[4]
刘海洋, 唐宇波, 胡晓峰, 等. 基于兵棋推演的联合作战方案评估框架研究[J]. 系统仿真学报, 2018, 30(11): 4 115-4 122, 4 131.
LIU H Y, TANG Y B, HU X F, et al. Research on evaluation framework of COA based on wargaming[J]. Journal of System Simulation, 2018, 30(11): 4 115-4 122, 4 131.
[5]
秦园丽, 张训立, 高桂清, 等. 基于兵棋推演系统的作战方案评估方法研究[J]. 兵器装备工程学报, 2019, 40(6): 92-95.
QIN Y L, ZHANG X L, GAO G Q, et al. Research on evaluation method of operational plan based on tactical missile chess deduction system[J]. Journal of Ordnance Equipment Engineering, 2019, 40(6): 92-95.
[6]
李云龙, 张艳伟, 王增臣. 联合作战方案推演评估技术框架[J]. 指挥信息系统与技术, 2020, 11(4): 78-83.
LI Y L, ZHANG Y W, WANG Z C. Technical framework of joint operation scheme deduction and evaluation[J]. Command Information System and Technology, 2020, 11(4): 78-83.
[7]
温睿. 作战方案计划推演评估[M]. 北京: 兵器工业出版社, 2019.
WEN R. From simulation to estimation, developing the COA & OPLAN[M]. Beijing: The Publishing House of Ordnance Industry, 2019.
[8]
彭勇. 作战方案仿真实验自动指挥决策问题研究[J]. 军事运筹与系统工程, 2017, 31(3): 47-50.
PENG Y. Research on automatic command and decision-making in combat plan simulation experiment[J]. Military Operations Research and Systems Engineering, 2017, 31(3): 47-50.
[9]
李策, 杨博. 基于仿真的陆军合同战斗方案实验评估研究[J]. 计算机仿真, 2020, 37(9): 31-35,76.
LI C, YANG B. Research on assessment of experiment of army combined combat plan based on simulation[J]. Computer Simulation, 2020, 37(9): 31-35,76.
[10]
李策, 申天良, 彭勇, 等. 陆军合同战斗方案仿真实验自动控制研究[J]. 指挥控制与仿真, 2018, 40(1): 86-92.
摘要
针对仿真实验自动控制面临的困难问题,运用作战方案筹划中决策点概念,提出了实现方案仿真自动控制的思路和方法。首先,确定了决策点设计原则,构建了通用性决策点体系,并给出了决策点的格式化形式;其次,探讨了满足自动控制仿真所需要的战斗方案要素构成以及指挥信息元素的表格化表达方式;再次,建立了由数据化的作战方案、自动控制规则、仿真环境和仿真模型等组分等构成的仿真自动控制框架;最后,通过一个简化的陆军摩步旅进攻战斗想定验证了其可行性。
LI C, SHEN T L, PENG Y, et al. Research on simulation experiment automatic control of army combined combat plan[J]. Command Control & Simulation, 2018, 40(1): 86-92.
[11]
贺筱媛, 郭圣明, 吴琳, 等. 面向智能化兵棋的认知行为建模方法研究[J]. 系统仿真学报, 2021, 33(9):2037-2 047.
HE X Y, GUO S M, WU L, et al. Modeling research of cognition behavior for intelligent wargaming[J]. Journal of System Simulation, 2021, 33(9): 2 037-2 047.
[12]
Klein G A. Sources of power: how people make decisions[M]. Cambridge, Mass.: MIT Press, 1998.
PDF(1587 KB)

1063

Accesses

0

Citation

Detail

Sections
Recommended

/