中国科技核心期刊      中国指挥与控制学会会刊     军事装备类重点期刊
信息融合

基于大模型技术的可视化作战实验系统构建

  • 叶志祥 ,
  • 彭杰通 ,
  • 聂魏岳
展开
  • 武警指挥学院, 天津 300171

叶志祥(1982—),男,博士,副教授,研究方向为作战指挥、系统工程。

彭杰通(1984—),男,博士,讲师。

Office editor: 许韦韦

收稿日期: 2024-11-17

  修回日期: 2024-12-05

  网络出版日期: 2026-03-25

Construction of visual combat experiment system based on large model technology

  • YE Zhixiang ,
  • PENG Jietong ,
  • NIE Weiyue
Expand
  • Armed Police Command College, Tianjin 300171, China

Received date: 2024-11-17

  Revised date: 2024-12-05

  Online published: 2026-03-25

摘要

综合运用大语言模型(LLM)和大视觉模型(LVM)技术构建可视化作战实验系统是一项复杂的系统工程,不仅能够提升作战实验系统智能化分析能力、直观化可视功能,还能够揭示作战体系的涌现能力,提升作战实验系统泛化能力和自监督学习能力。在分析大模型技术可视化作战实验系统的关键技术基础上,构建了作战实验系统的总体框架,运用大语言模型(LLM)、大视觉模型(LVM)以及多智能体系统(MAS)来模拟作战实体与环境之间的复杂动态互动过程,实现以多种模态、可视化形式展示作战实验过程和智能化分析作战实验结果。

本文引用格式

叶志祥 , 彭杰通 , 聂魏岳 . 基于大模型技术的可视化作战实验系统构建[J]. 指挥控制与仿真, 2026 , 48(2) : 83 -88 . DOI: 10.3969/j.issn.1673-3819.2026.02.012

Abstract

It is a complex system engineering to construct a visual combat experimental system by using the technologies of LLM and LVM, which can not only improve the intelligent analysis ability and visual function of the combat experimental system, but also reveal the emerging ability of the combat system, and improve the generalization ability and self-monitoring learning ability of the combat experimental system. Based on the analysis of the key technologies of the visual combat experiment system with large model technology, this paper constructs the overall framework of the combat experiment system, and uses large language model (LLM), large visual model (LVM) and multi-Agent system (MAS) to simulate the complex dynamic interaction process between combat entities and the environment, so as to display the combat experiment process and intelligently analyze the combat experiment results in various modes and visual forms.

2017年,Google推出的Transformer架构极大地推动了自然语言处理领域的发展[1]。国外陆续发布了Speech Transformer、BERT、GPT、DALL-E、BART和LLaMA等模型,国内也相继发布了ERNIE、GLM、百川大模型等产品。大模型是指参数量达到百亿、千亿乃至更高数量级的超大规模机器学习模型[2]。2022年,OpenAI发布的大语言模型ChatGPT[3],其强大的生成能力与广泛适用性将大模型的热度推上高潮。除了民用领域,大模型在军事领域的应用已初见端倪,大模型以强大的自然语言理解、逻辑推理和内容生成等能力,成为战场上一种特别有前景的新兴人工智能技术[4],凭借强大的数据分析处理能力、模式识别能力、智能学习能力,显著提升了军事领域作战指挥、装备研发、后勤保障的智能化水平。

1 系统特点

大模型技术是在传统卷积神经网络(CNN)的基础上发展起来的,随着CNN的不断加深,模型也变得更加复杂[5],不仅包括大语言模型(LLM)技术,还包括大视觉模型(LVM)技术,该技术主要涉及构建具有超大规模参数的深度学习模型,是由深度神经网络组建而成,拥有的参数规模可达到上千万,甚至数十亿级别,使得模型具备了更为强大的表达能力和学习能力,能够处理更加复杂的任务和数据。基于大模型技术的可视化作战实验系统具有涌现能力、泛化能力、自监督学习等主要特点。

1.1 涌现能力

涌现是复杂系统具备的一种典型特征,使许多单个要素或实体在一定的环境条件下相互作用时,产生1+1>2的体系能力,实现了单个要素或实体所不具备的特性。大模型在经过一定规模的数据训练后,会涌现出各种小模型不具备的能力,能够实现对复杂的作战活动进行综合分析,展现出类似指挥人员的思维能力和智力水平,解决复杂系统的深层次问题。

1.2 泛化能力

泛化性是衡量系统或模型优劣的关键指标,大模型通常具有较强的泛化能力,它能够正确处理本地知识库中未出现的新数据,反映了模型或系统对新样本的适应能力。高泛化能力能够在新的、未知的数据处理上得到更为准确的预测和评判,大模型通过加噪声、采用模型正规化约束和因果推理等方法,防止参数过大,降低过拟合的风险,强化其泛化能力,使得系统具有高可靠性和强稳定性。

1.3 自监督学习能力

监督学习是指给系统或模型提供类别标签或者参考答案来训练模型,无监督学习则不依赖于类别标签或参考答案,而是自己从数据中关联分析特征进行学习。大模型的自监督学习则是无监督学习的一种特殊模式,它利用辅助任务(pretext)从大规模的无监督数据中挖掘自身的监督信息,自动生成类别标签或者特征,并依据原有类别标签和新的类别标签,进行自主训练,从而学习到对下游任务有价值的表征信息。

2 基于大模型技术的可视化作战实验系统关键技术

构建基于大模型技术的可视化试验系统是一项复杂的系统工程,综合运用大语言模型(LLM)和大视觉模型(LVM)技术,使得作战实验系统呈现智能化、可视化功能,其中涉及的关键技术主要有检索增强生成技术、多智能体代理技术、实体虚拟构造技术以及知识库构建技术等。

2.1 检索增强生成技术

大模型技术仍缺乏获取即时、专业以及私有信息的能力,为解决这一问题,检索增强生成(RAG)技术应运而生[6]。检索增强生成(RAG)技术是通过对数据信息的检索来实现大规模语言模型生成结果。检索增强生成技术综合运用了搜索技术和提示词功能,通过大模型的提示词功能,向系统提出相关作战问题或从想定材料中提取信息,运用搜索引擎找到的数据信息作为背景上下文,并整合这些数据信息,将其推送至大语言模型,它是一种结合了信息检索技术与语言生成模型的人工智能技术,其核心步骤和相关算法如图1所示。
图1 检索增强生成基本流程

Fig.1 Basic flow of retrieval enhancement generation

检索增强生成技术可以确保模型生成的结果更加准确、可靠,有效地减少系统生成结果的“幻觉”。在构建基于检索增强生成技术的作战实验系统时,研究人员可以采用当前流行的开源框架和模型,一方面可以增强作战试验系统的灵活性,降低技术门槛和运行成本,另一方面可以有效降低“更多的框架依赖”,使其更好地适应不断变化的数据信息,从而提升作战实验系统的适应能力、智能体响应的准确性和可靠性,便于拓展作战实验系统的应用领域,增强运行结果的可解释性。

2.2 多智能体代理技术

智能体代理(AI Agent)技术主要是以AI为核心,构建能够多模态感知、全域自主协同、实时精确调控、持续学习进化的智能系统,具有自治性、反应性、主动性、社会性和进化性等特征,其工作流程如图2所示。
图2 智能体工作流程

Fig.2 Cooperative action of Agent

用户可以是智能体的使用者,也可以是其他智能体传递输出的指令、目标等实验数据。智能体依据接收的实验数据,通过多种传感设备感知观测周围的环境状态,结合内置的本地知识库以及习得的知识,通过与环境交互来感知、观察环境参数的变化,并形成相应的任务规划、执行决策作用于工作环境,经过多次迭代强化学习,实现其最优执行结果。推理和规划是促进智能体不断学习的关键,也是智能体智能特征的主要体现,推理帮助智能体理解复杂的作战任务,规划帮助智能体处理复杂的作战任务,随着作战实验数据信息的增多,智能体通过推理和规划来更新或增强预置的知识,使其更好地应对环境信息的变化。行动和执行单元则是将智能体做出的决策转化为行动作用环境中的其他智能体,与其他智能体相互协同实现实验目标。多智能体强化学习在解决大规模场景问题中具有出色表现[7],在基于大模型的可视化作战实验系统中,运用智能体代理技术创建态势认知智能体、指挥决策智能体、作战平台控制智能体、后勤保障智能体、人力资源管理智能体以及模拟蓝军智能体,通过这些智能体的相互协同作用推动作战实验的运行,这些智能体的协同动作如图3所示。
图3 智能体协同动作

Fig.3 Cooperative action of Agent

2.3 实体虚拟构造技术

实体虚拟构造(LVC)技术主要是对作战实验可能涉及的战场环境、作战力量、武器平台、交战规则、打击效果等进行仿真建模。真实仿真(L)是指现实的作战人员操作真实的武器装备;虚拟仿真(V)是指现实的作战人员操作装备模拟器等设备;构造仿真(C)是指数字仿真技术,可使计算机程序生成大规模、高消耗的虚拟战场,模拟敌人操作敌方武器装备与我方进行对抗的场景,以增加试验时的战场环境真实性。LVC虚实合成试验环境具有通用可扩展性强、支持异构系统互联互操作、系统实时交互等优点[8]。通过对作战环境的仿真构造,能够实现在真实战场环境中影响作战行动和作战效果的主要因素的建模;通过态势认知智能体不断学习战场环境以及战场态势对作战行动的影响概率和影响方向,增强作战实验系统的学习能力;通过对作战力量、武器平台的构造仿真,能够生成虚拟作战单元、蓝军作战对手,实现实兵、虚兵在作战实验系统内的有机融合,从而支持多种行动样式、不同作战对象、不同作战方案下的作战实验,尤其是LVC技术的运用,通过传感器能够实时获取真实作战实体的作战数据;通过数字孪生技术,最大程度地构造近似真实的人员装备体系、作战环境、作战流程、作战对手,最真实地反映作战过程中的关键要素,如图4所示。作战实验系统通过大语言模型(LLM)和大视觉模型(LVM)的检索增强生成技术,提取战场环境数据、作战行动数据、打击效果数据等信息,基于各类虚拟构造仿真的实体库,可智能生成直观显示作战实验过程的文本、图片、声音、视频等可视化素材,从而实现作战实验的可视化。
图4 物理实体与数字孪生的镜像关系模型

Fig.4 The mirror image relationship model of physical entity and digital twins

2.4 知识库构建技术

知识库是支持作战实验系统智能学习的数据源,大多数的作战实验系统由于专业知识库的缺乏,导致系统出现幻觉信息,特别是在处理特定的、复杂的作战问题时,作战实验生成的结果容易偏离实际,系统缺乏适应性和泛化能力,知识库的构建对于强化系统的推理学习能力十分重要。知识库至少应包括战场环境知识库、敌我部署知识库、敌我状态知识库以及敌我行动知识库等[9]。大模型知识库是一个复杂且庞大的信息系统,通过大规模数据和机器学习算法来获取、更新、存取知识信息。目前常用的大规模知识库包括DBpedia、Freebase、YAGO、WikiData等[10],其原理是将预训练的数据与知识图谱相结合,形成大规模的知识网络,其包括知识图谱、文本语料、推理引擎、实体识别与链接、关系抽取、问题回答等技术模块,其中,推理引擎是构建知识库的核心,它运用逻辑推理、统计推理等算法,在知识库中用于对相关信息进行推理、推断,实现基于已有的知识信息来生成新的知识,从而推动系统智能学习,使知识库不断得到更新和补充,有利于提高知识的准确性,减少系统“幻觉”。在搭建知识库的过程中,主流的OpenAI等大语言模型、大视觉模型是在公有云上面部署的,考虑作战实验数据的信息安全,为防止信息泄露,要建立基于本地部署的私人知识库,在私人知识库中,向量数据库负责个性化知识存储和搜索知识,大语言模型、大视觉模型负责将知识组织成易于理解的文本、图形或视频。

3 基于大模型技术的可视化作战实验系统总体架构

基于大模型技术的可视化作战实验系统的新颖性主要体现在运用大语言模型(LLM)、大视觉模型(LVM)以及多智能体系统(MAS)来模拟作战实体与环境之间的复杂动态互动过程,还能够以多种模态的可视化实现对作战实验过程和结果的展示,其系统总体框架包括基础环境层、关键技术层、数据资源层、功能模块层、智能体代理层和实验应用层,如图5所示。
图5 可视化作战实验系统结构图

Fig.5 Structure diagram of visual combat experiment system

3.1 基础环境层

基础环境层为基于大模型技术的可视化作战实验系统提供运行所需的环境,通过实兵实装实验系统(L)、半实物仿真实验系统(V)、数字仿真实验系统(C)构造各类战场环境、人员体系、装备体系、虚拟模型、模型交战流程、作战对手对象,并为作战实验的可视化展示提供了不同类型的虚拟模型。

3.2 关键技术层

关键技术层是设计开发基于大模型技术的可视化作战实验系统所需要的技术,这些技术并非相互独立,而是共同发挥作用,支撑作战实验系统的智能化、可视化功能。运用大语言检索增强生成技术、大视频检索增强生成技术以及多模态检索增强生成技术不断丰富知识库的更新,促进系统持续学习能力。多智能体代理技术构建的态势认知智能体、指挥决策智能体、作战平台控制智能体、后勤保障智能体、人力资源管理智能体、模拟蓝军智能体通过调用实体、虚拟、构造的仿真对象和模型,使之相互发生作用,并不断与外界的战场环境进行反馈,通过智能体代理之间的作用以及与外界环境的作用来模拟仿真作战实验过程,并以文本、图形、语音、视频等多种模式呈现作战实验结果。

3.3 数据资源层

数据资源层为基于大模型技术的可视化作战实验系统提供内(外)场实验数据、战场环境数据、装备性能数据、作战实验想定数据、实验评估指标数据、交战规则数据以及战术战法数据库等资源。其中内(外)场实验数据库包括虚拟仿真作战实验产生的数据和实兵实装开展作战实验产生的数据;战场环境数据库包括虚拟仿真的各类战场地形、海洋、水文气象、电磁等环境数据,以支持不同作战环境下的作战实验;装备性能数据库主要包括参与作战实验的各类型武器装备平台的性能参数;作战实验想定数据库主要是针对各类不同的作战实验预先编写的实验想定;实验评估指标数据库主要包括单项指标作战能力和综合作战能力的作战实验结果;交战规则数据库主要包含各类智能体相互作用的交流机制、行动规则以及输出的结果。

3.4 功能模块层

功能模块层主要包括作战实验知识管理模块、作战实验想定编辑模块、作战实验战法管理模块、实验资源调度控制模块、虚拟场景构造生成模块、战场态势综合显示模块、实验结果评估分析模块和实验数据信息显示模块,通过这些功能模块实现对知识库、想定库、战法库的更新与管理,依据作战实验目的构造各类虚拟仿真模型,生成战场综合态势,评估作战实验结果,并依据用户需求实现作战实验的可视化展示。

3.5 智能体代理层

智能体代理层主要有态势认知智能体、指挥决策智能体、作战平台控制智能体、后勤保障智能体、人力资源管理智能体、模拟蓝军智能体,这些智能体相互协作,依据作战实验想定参与、观察、感知战场环境,并响应环境,根据感知做出决策,通过协作实现优势互补,提高解决作战问题的准确率。这些智能体运用大语言模型(LLM)或大视觉模型(LVM)来增强推理能力,解释作战命令以及模拟指挥员、参谋人员的计划、决策、控制过程,这些智能体均采用动态结构进行构建,实现智能化地开展作战实验。例如,态势认知智能体是针对战场环境以及综合态势的分析来构建的,战场环境和战场态势往往呈现高度动态和多变的特点,战场中会出现许多不确定性因素和各种复杂情况,针对这一特性,人们采用动态代理结构来构建智能体,使其能够根据当前的情况调整组织配置,能够支持多种自适应机制,其结构如图6所示。这种动态代理结构能够根据作战实验条件的变化灵活地进行自适应决策,以便应对可能出现的各种不可预测的情况。
图6 智能体框架结构

Fig.6 Agent frame structure

3.6 实验应用层

构建基于大模型技术的可视化作战实验系统的目的在于对作战筹划、作战组织以及作战控制活动进行实验,通过作战评估得出实验结果。针对作战筹划活动开展的实验,其实验应用包括作战任务的分析和理解、作战意图的识别、情报获取和处理分析、作战构想的确定以及作战方案的生成,验证其基于意图筹划决策的能力;针对部署准备活动开展的实验,其实验应用包括战场态势的预测预判、预案匹配度分析、作战体系结果分析、作战计划调整分析,验证其基于预案审慎决策的能力;针对执行监控活动开展的实验,其实验应用包括目标识别与威胁判断、态势感知与融合、协同决策与控制,验证其基于规则快速决策的能力;针对作战评估开展的实验,其实验应用包括作战转换的分析、作战总结的评估,验证其基于作战效果合理调整决策的能力。

3.7 可视化显示层

可视化显示作战实验过程和结果数据信息主要包括对作战环境、战场态势、筹划决策、行动控制、综合结果的显示,能够更为动态、直观地展示作战实验的全流程。作战环境的可视化主要通过虚拟现实、混合现实技术对典型作战行动的地理、天候等环境进行建模,用户根据需求定制全局、局部、3D、2D等作战环境的显示;战场态势的可视化显示通常采用数字地球和视景仿真的双平台架构,可表现全局和局部高精态势[11],并运用大模型技术实现对态势的发展动态进行预测,生成图形、视频等多模态显示信息;筹划决策的可视化显示主要运用工程化作业的方式演示筹划决策活动的过程,采用甘特图、树形图、表格、文书等形式显示作战实验中筹划决策数据信息;行动控制的可视化显示通过记录、采集、分析作战过程中不同阶段、不同时节的作战行动轨迹、行动效果,以网络图、态势图以及战果战损表等形式显示作战实验中的行动控制;综合结果的可视化显示则是综合运用上述作战实验中的作战环境数据、战场态势数据、筹划决策数据、行动控制数据实现对体系作战行动和效果评估的综合显示,主要有雷达图、柱状图、表格、视频等形式。

4 结束语

本文主要研究了基于大模型技术的可视化作战实验系统具备的主要特点,指出构建基于大模型技术的可视化实验系统是一项复杂的系统工程,涉及检索增强生成技术、多智能体代理技术、实体虚拟构造技术以及知识库构建技术等关键技术,并从基础环境层、关键技术层、数据资源层、功能模块层、智能体代理层和实验应用层5个主要层面构建了基于大模型技术的可视化作战实验系统总体框架。
[1]
高志强, 沈佳楠, 姬纬通, 等. 大模型技术的军事应用综述[J]. 南京航空航天大学学报, 2024, 56(5): 801-814.

GAO Z Q, SHEN J N, JI W T, et al. Review of military applications of foundation model technology[J]. Journal of Nanjing University of Aeronautics & Astronautics, 2024, 56(5): 801-814.

[2]
高新波, 孙宏滨. “大模型技术及应用” 专栏序言[J]. 数据采集与处理, 2024, 39(3): 501.

GAO X B, SUN H B. Special topic of large language model technology and its application preface[J]. Journal of Data Acquisition and Processing, 2024, 39(3): 501.

[3]
OpenAI. Introducing ChatGPT[EB/OL]. (2022-12-30). https://openai.com/blog/chatgpt.

[4]
季鹏飞, 华松逸, 张煜晨, 等. 军事大模型发展现状与算力基础设施需求分析[J]. 军民两用技术与产品, 2024(6): 36-44.

JI P F, HUA S Y, ZHANG Y C, et al. Current development status of military large models and analysis of computing infrastructure requirements[J]. Dual Use Technologies & Products, 2024(6): 36-44.

[5]
王静, 李沛橦, 赵容锋, 等. 融合卷积注意力和Transformer架构的行人重识别方法[J]. 北京航空航天大学学报, 2024, 50(2): 466-476.

WANG J, LI P T, ZHAO R F, et al. A person re-identification method for fusing convolutional attention and Transformer architecture[J]. Journal of Beijing University of Aeronautics and Astronautics, 2024, 50(2): 466-476.

[6]
田永林, 王兴霞, 王雨桐, 等. RAG-PHI: 检索增强生成驱动的平行人与平行智能[J]. 智能科学与技术学报, 2024, 6(1): 41-51.

DOI

TIAN Y L, WANG X X, WANG Y T, et al. RAG-PHI: RAG-driven parallel human and parallel intelligence[J]. Chinese Journal of Intelligent Science and Technology, 2024, 6(1): 41-51.

[7]
王宇琨, 王泽, 董力维, 等. 基于分层的智能建模方法的多机空战行为建模[J]. 系统仿真学报, 2023, 35(10): 2 249-2 261.

WANG Y K, WANG Z, DONG L W, et al. Research on multi-aircraft air combat behavior modeling based on hierarchical intelligent modeling methods[J]. Journal of System Simulation, 2023, 35(10): 2 249-2 261.

[8]
张安民, 崔连虎. LVC联合仿真可信度评估研究[J]. 兵工自动化, 2023, 42(6): 67-69.

ZHANG A M, CUI L H. Research on credibility evaluation of LVC co-simulation[J]. Ordnance Industry Automation, 2023, 42(6): 67-69.

[9]
刘网定, 张国宁, 郑世明. 基于深度强化学习的作战实体智能感知与决策研究[J]. 火力与指挥控制, 2023, 48(5): 164-169.

LIU W D, ZHANG G N, ZHENG S M. Research on intelligent perception and decision-making of combat entities based on deep reinforcement learning[J]. Fire Control & Command Control, 2023, 48(5): 164-169.

[10]
曹书林, 史佳欣, 侯磊, 等. 知识库问答研究进展与展望[J]. 计算机学报, 2023, 46(3): 512-539.

CAO S L, SHI J X, HOU L, et al. Question answering over knowledge base: an overview[J]. Chinese Journal of Computers, 2023, 46(3): 512-539.

[11]
张昊. 通用战场态势可视化系统的设计及实现[J]. 计算机工程与应用, 2018, 54(17):258-265.

DOI

ZHANG H. Design and implementation of general battlefield situation visualization system[J]. Computer Engineering and Application, 2018, 54(17):258-265.

文章导航

/