中国科技核心期刊      中国指挥与控制学会会刊     军事装备类重点期刊
Information Fusion

Space observation task derivation based on multidimensional data association

  • TAN Juan 1 ,
  • GUO Qi 2 ,
  • ZHANG Xueliang 3 ,
  • ZHANG Wenbao 2
Expand
  • 1 Beijing Institute of Tracking and Communication Technology, Beijing 100094, China
  • 2 Key Laboratory of Aerospace Information Applications of CETC, Shijiazhuang 050081, China
  • 3 The 54th Research Institute of CETC, Shijiazhuang 050081, China

Received date: 2024-11-05

  Revised date: 2024-12-09

  Online published: 2025-11-22

Abstract

With the increasing demand for remote sensing observation from users in various industries, the current application mode of "passive response to user demand" for space observation resources is becoming more and more limited. Therefore, research on space observation mission derivation technology based on multidimensional data association is carried out. Firstly, the differentiated space resources are modeled to accurately describe the capability attributes of various space resources and space observation mission knowledge. Secondly, for all kinds of explicit or implicit space observation requirements, the method based on large language model is used to understand the requirements and extract the task elements; Then, a multi-semantic inference network is constructed to implement the derived reasoning of aerospace observation tasks. After that, the change rules of the historical task resource supply and demand relationship of typical users are mined to automatically recommend space resources. Finally, the derivation process of space observation mission in emergency disaster relief scenario is taken as an example to verify the method. The example analysis shows that this method can not only ensure the accuracy, but also effectively improve the operation efficiency and use efficiency of the aerospace observation system.

Cite this article

TAN Juan , GUO Qi , ZHANG Xueliang , ZHANG Wenbao . Space observation task derivation based on multidimensional data association[J]. Command Control and Simulation, 2025 , 47(6) : 69 -75 . DOI: 10.3969/j.issn.1673-3819.2025.06.010

随着在轨卫星数量和能力的不断提高,用户的观测需求越来越旺盛,航天观测在农业生产、应急救灾等领域内的作用越来越重要。目前,航天观测任务规划生成 “先用户申请,后被动响应”的应用模式[1]在实际应用中的局限性越来越大。为此,本文面向航天观测任务的智能快速衍生现状,构建基于多维数据关联的航天观测任务衍生机制,重点解决多模态需求理解、观测任务衍生及资源推荐三个关键问题,及时、快速地响应用户观测需求。
目前,业内航天观测任务的生成多以用户主动提报的文本、语言等观测需求为基础,且多依靠领域专家进行规划设计。在处于复杂环境观测条件时,往往不可避免地引入专家主观因素,进而出现判断偏差或失误,难以持续保障任务方案的准确性与统一性[2]。同时,目前对于从热点新闻事件报道等中提取航天观测需求,主动生成航天观测任务的研究较少。
为此,本文针对航天观测系统常规与应急任务交织的工作模式与使用特点,以热点新闻事件中隐含的航天观测任务、用户提报的显式航天观测需求以及历史观测任务执行记录等多维异构数据为输入,开展基于多维数据关联的航天观测任务衍生技术的研究。

1 总体思路

为提高航天观测系统的运行效率和使用效益,增强系统的响应时效性,本文首先借助数字画像技术手段,对大规模差异化航天资源进行统一建模,实现对各类卫星能力属性的准确描述,并在此基础上增加观测任务执行过程中涉及的目标、场景、用户偏好等关联知识;然后针对用户提报的航天观测需求,结合航天观测全息数字画像以及基于大语言模型的方法,进行需求内容理解及任务要素抽取;其次,构建多元语义推理网络实现航天观测任务的自动衍生,生成满足用户需求的航天观测任务集;最后,基于时空规律匹配预测方法,挖掘典型用户历史任务-资源供需关系变化规律,并针对上述任务集进行航天资源自动推荐,具体技术思路如图1所示。
图1 总体方案示意图

Fig.1 Schematic diagram of overall scheme

(1)航天观测全息数字画像构建技术
构建航天观测全息数字画像, 对航天资源及航天观测领域知识进行完备描述和形式化表达。
(2)基于大语言模型的需求理解技术
借助大语言模型(large language model,LLM)[3]的语义理解及交互能力,对热点新闻事件中隐含的航天观测任务以及用户提报的显式航天观测需求进行解析,并基于数字画像中存储的多元关联知识,从目标/任务/事件等维度出发,实现任务要素快速识别。
(3)航天观测任务衍生技术
在航天观测任务自主生成结果的基础上,结合全息数字画像中的资源能力、观测目标、应用场景、用户偏好等关键要素知识,构建多元语义推理网络,从目标、任务、事件等维度衍生推理出潜在的观测任务集合。
(4)航天观测资源智能推荐
基于航天观测历史记录,借助数据挖掘手段发掘用户日常业务中观测活动以及相应航天资源存量的周期性和规律性变化,对相关用户未来观测需求以及未来航天观测资源供应情况进行估计,并对任务集中的航天资源进行智能推荐。

2 航天观测全息数字画像构建技术

为有效支撑航天观测任务衍生及航天资源的智能推荐,本文对各类航天资源的属性能力、航天观测任务衍生过程中所涉及的观测对象、行业背景、用户偏好等关联要素的辅助知识以及不同业务场景下的航天资源应用模式与使用需求进行统一建模[4]。为此,本文构建了包含航天资源及各类关联任务要素的航天观测全息数字画像,并对各类要素之间关联关系进行形式化表达。

2.1 航天资源能力建模

针对当前多种航天资源在建设体制、运行机制等方面存在差异的客观问题,研究差异化航天资源能力统一建模方法,本文面向卫星平台、载荷、接收站、天线等资源实体,采用共性属性+个性特征的建模方式[5]对其能力属性、使用约束及相互关系进行建模。
在具体航天资源能力建模中,基于上述建模思路,本文依据各类用户应用航天观测资源的场景,将航天观测资源属性划分为基础属性、日常调度属性及应急调度属性。
在上述三类属性中,基础属性主要包含各类航天观测资源的类别划分及从属关系。其中,航天观测资源可划分为卫星资源及地面资源。基于卫星数量可将卫星资源进一步划分为单星系统及星座系统;基于载荷类型,可将单星系统划分为光学卫星、雷达卫星等;星座系统中的卫星成员也根据载荷类型进行划分。地面资源可进一步划分为测控资源及数传资源;在此基础上,基于平台性质可将测控数传资源划分为固定资源及移动资源。
日常调度属性指在非应急、自身配套资源充裕的情况下,用户调度观测力量所关注的属性,包含幅宽、分辨率、重访时间、载荷类型、轨道高度、星上处理能力、需求响应时间、连续工作时间、星间引导能力等。
应急调度属性重点聚焦于当用户获得航天观测资源的控制权限后,进行卫星测控、数传过程中所关注的属性,包括测控体制及数传体制,其中测控体制包含测控天线频段、测控指令帧结构、卫星平台侧摆角、俯仰角、卫星工作模式等;数传体制包含数传天线频段、数传带宽、固存、数据编码方式等。

2.2 航天观测任务建模

航天资源观测任务影响要素众多,除资源能力外,还包括任务类型、观测区域、行业背景、用户偏好。航天观测任务主要是通过遥感卫星全面采集各种地面灾害和环境的信息,包括对台风、洪涝、干旱等大气圈和水圈灾害观测任务,对崩塌、滑坡、泥石流、地震等地质和地震灾害观测任务,森林和草原火灾、农作物病虫害等自然灾害观测任务等。观测区域描述内容涵盖基本信息,空间分辨率、光谱分辨率、时间分辨率、辐射分辨率等性能参数、时空位置及不同目标间的相互关系;行业背景要素包含城市治理、基础设施安全、数字农业、生态环保、自然资源对各行业对卫星、载荷等观测资源的应用模式要求;用户偏好要素包含用户的基本属性、任务使命、信息需求、行为偏好、任务周期性规律等信息。

3 基于大语言模型的需求理解技术

在航天资源任务保障应用场景下,将热点新闻事件中隐含的航天观测任务以及用户提报的显式航天观测需求作为大语言模型输入,提取此类非格式化的文电、报告等输入中蕴含的观测任务类型、时间要求、数据要求等任务要素。凭借LLM模型的语义理解及交互能力,对各类应用场景下产生的事件、报文以及观测需求进行智能理解,并将其转化为涵盖观测目标、时间要求、载荷类型等要素的航天观测任务要素,实现非格式化任务要素的快速识别。在此基础上,针对用户提交的应急突发综合保障业务需求,基于数字画像中存储的多元关联知识,从目标/任务/事件等维度进行观测区域、观测策略等任务要素填补,将航天资源综合保障业务需求具化为明确的航天观测任务。
尽管大语言模型在文本分类、命名实体识别、关系抽取等方面效果显著,但对于语料库中的事实与知识的应用过程并不明晰,输出结果有时会存在“机器幻觉”问题[6]。为此,本文构建航天观测领域任务数字画像,并以领域知识库的形式与大模型相结合,将航天观测领域内的先验知识信息嵌入到模型中,从而提升模型理解和处理航天观测领域内需求及任务要素提取能力[3],增强模型输出结果的准确性以及时效性。

3.1 大语言模型预训练

基于开源中文语料库以及项目组汇集整理得到的航天观测领域综合数据集实现对LLM模型的预训练。项目组整理的航天观测领域数据集包含国内外主流对地观测卫星或系列在自然资源、灾害应急、交通、农业、住建、环保、大气、智慧城市等行业进行服务应用的相关文献资料、新闻报道等综合语料,涵盖中巴系列、资源系列、环境系列、高分系列以及Landsat、Quickbird、Worldview、IKONOS、GeoEye、Pleiades、Radarsat等典型卫星或系列。
本研究以智谱AI和清华大学KEG(knowledge engineering group)实验室联合发布的开源双语对话语言模型ChatGLM3-6B为基础模型,对航天观测领域综合数据集进行预训练以及指令微调,提高模型在航天观测领域任务上的性能表现,实现航天观测需求理解大模型搭建。在预训练阶段,本研究采用多种自监督学习方法来指导模型的学习[7],包括掩码语言建模、语料对预测、文档摘要生成等。在航天观测需求理解大模型预训练阶段,主要包含三个方面,一是以开源语料数据集作为输入,通过训练掩码语言模型,使其能够学习到语料中的语义信息和上下文关系。二是以航天观测领域综合数据集为输入,以语料对训练任务为基础,对两个语料对之间蕴含、矛盾或中立等逻辑关系进行特征提取。三是融合开源语料数据集与航天观测领域综合数据集,通过构建大量的语料对样本,构建文档级训练任务,使其能够学习到语料之间的逻辑关系以及语料整体结构和主题信息,为后续的航天观测需求理解分析提供支持。
在预训练过程中,针对不同训练任务以及不同训练阶段,可以采用Adam、RMSprop等不同优化算法[8]、不同损失函数的构造、学习率等超参数设置以及Early-Stopping等训练策略的组合,实现网络参数的迭代训练。
此外,为进一步提升大语言模型在航天观测领域内的语义理解性能,基于国内“业务需求-航天观测任务”历史记录,本研究构建了航天观测领域任务数据集,并利用低秩适应(low-rank adaptation of large language models,LoRA)[9]策略,对其进行微调训练。

3.2 领域知识库搭建

为提升大语言模型在航天观测领域内学习的相关性和个性化程度,同时保证大语言模型输出结果的正确性与可解释性,本研究采用领域知识库与LLM进行协同应用的策略,将航天观测全息数字画像中实体、关系和属性等结构化知识,与LLM所掌握的语义和结构信息相结合,从而提升了LLM模型的决断力。
本研究通过对航天观测领域内以规则、数据、模型或其他形式存储的主题、观测任务等先验知识的解析处理,构建领域知识库。具体而言,首先,将航天观测知识库内容经过embedding存入向量知识库;然后,将搜集的隐性观测需求以及用户提报的显性需求经过embedding,利用向量相关性算法找到最匹配的top-k个知识片段;最后,以这些知识片段为上下文,与需求一起作为prompt提交给LLM得到结果。领域知识库流程图如图2所示。
图2 领域知识库应用流程图

Fig.2 Schematic diagram of domain knowledge database application

基于航天观测领域知识库来构建模型,可以在保证输出结果正确性的前提下,实现各类事件报文和需求文电中航天观测需求的理解和任务要素的有效提取,为后续任务衍生提供了基础。

4 航天观测任务衍生技术

为充分发挥航天观测资源信息保障效能,针对热点事件、新闻报道中蕴含的隐性观测需求以及各式常规或应急保障应用场景中用户航天观测需求复杂性以及需求要素模糊性,本文以多元语义深度神经网络[10]为基础框架,通过构建多元语义推理网络(multi-semantic inference network, MSIN),结合全息数字画像中的资源能力、观测目标、应用场景、用户偏好等关键要素知识,基于目标、任务、事件等信息衍生出潜在的航天观测任务。
MSIN网络同时提取航天观测任务知识图谱内实体领域的上下文语义与航天观测任务知识实体之间的语用链路,通过目标、任务、事件等实体的上下文语义获得其特征向量,并利用知识链路传播特征获得实体之间的语用逻辑关联,最后将这两种维度的信息进行结合,从而自动衍生出航天观测任务集。
MSIN的模型框架如图3所示,MSIN模型的实现目标是关系推理,即给定航天观测任务知识图谱以及对应的实体对(h,t),推断头实体h与尾实体t可能存在的关系,即已有历史观测任务与数字画像中其他观测目标的关系。MSIN主要包括四个模块:实体语义提取模块、关系链路语义特征提取模块、知识特征向量融合模块以及关系路径特征聚合模块。
图3 MSIN网络框架示意图

Fig.3 Schematic diagram of MSIN network framework

(1)实体语义提取模块:对于航天观测任务知识实体语义提取,沿用面向关系的卷积信息传播网络框架(Conv-MPNN),分别从头实体与尾实体两个方向出发,同步进行上下文语义特征抽取;
(2)关系链路语义特征提取模块:对于航天观测任务知识图谱的实体间关系,利用双向门控循环单元网络(bidirectional gated recurrent unit,BiGRU),基于随机游走算法策略,对实体之间潜在或直接关系路径的序列语义特征进行捕获。同时,针对航天观测领域知识图谱具备显著的层级分布的特点,设计基于长短期记忆网络(long short-term memory, LSTM)的特征提取链路,利用LSTM只关注“上文”语义的特性[11],对其航天观测知识单向层级传递的特征进行增强。
(3)知识特征向量融合模块:基于通道注意力结构,实现来自不同实体、不同关系的关系链路知识特征向量融合,建立不同实体特征之间、实体与语用链路之间的语义牵连。
(4)关系路径特征聚合模块:针对航天观测任务知识图谱中不同实体之间存在多条链路的特点,利用注意力聚合策略,根据实体的上下文特征将给定实体对的不同关系路径语义向量进行有效聚合,得到实体对最终的关系路径特征。
最后将上下文特征和最终的关系路径特征融合相加,并利用归一化指数函数推断给定实体对之间可能存在的关系,即基于已有观测知识衍生出的新观测任务集。

5 航天观测资源智能推荐技术

除实时输入的热点事件、新闻以及用户提报的常规或应急保障任务需求外,航天观测资源智能推荐技术基于积累的大量航天观测历史任务数据记录,借助数据挖掘手段进一步发掘用户日常业务中的周期性、规律性观测活动。另一方面,在常规+应急的任务应用模式下,各卫星资源占用情况存在峰谷变化,利用历史数据有效挖掘其中的变化规律,并对未来航天观测资源供应情况进行估计[12]。基于上述资源-任务挖掘结果,结合航天资源能力知识图谱实现针对衍生任务集的观测资源智能个性化推荐,进一步提高用户观测任务的满意度。
为此,本研究提出基于时空属性分析的航天观测资源智能推荐技术,具体流程如图4所示。
图4 基于时空属性分析的供需关系规律挖掘方法

Fig.4 Schematic diagram of the mining process of supply and demand relationship

(1)针对历史观测任务规律挖掘问题,本文以多用户需求提报记录及历史任务记录为输入数据,针对上述数据进行关键任务要素提取:面向格式化库表数据,利用数据转换、数据清洗、数据治理手段即可得到高质量历史数据;针对非格式化文本数据中记录的历史任务情况,基于自然语言处理手段,从文本中获取目标、时间、地点、卫星等关键要素。
(2)任务要素时空聚集模式挖掘。本文基于多源数据提取汇总的历史任务要素,重点在任务时间、任务地点等维度展开挖掘分析,并在时空挖掘结果基础上拓展关联目标类型、卫星要求等任务要素。任务要素时空聚集模式挖掘主要通过时空聚类手段实现。
(3)观测任务周期性预测。本文针对卫星任务时间属性和空间属性高度相关的特性提出“区域+模型”的卫星任务时序规律预测方案:基于不同聚类结果所形成任务目标给出适用性最好的时序规律预测模型核函数,所采用时序预测模型有线性模型/多项式模型/高斯模型/指数模型/傅里叶模型等,从而完成未来任务时间的预测,进而得到观测周期。
利用上述方法,可以针对航天观测衍生任务集进行航天观测资源的智能推荐,可以充分挖掘航天观测潜在能力,进一步优化用户使用体验,提升航天观测力量支撑常规与应急任务信息保障效能。

6 应用示例

本文提出的基于多维数据关联的航天观测任务衍生技术在应急救灾场景中的应用示例如图5所示。航天观测任务衍生过程如下。
图5 应急救灾场景下的应用示例

Fig.5 Application in emergency disaster relief scenario

(1)在输入“2024年5月21日7时39分,在四川甘孜州泸定县发生3.0级地震,震源深度11 km,震中位于北纬29.78°,东经102.02°”这一灾情事件的新闻简报后,汇总与此事件相关的报告及新闻报道,利用大模型智能理解航天观测任务需求,提取描述内容中的时间、地点、目标、优先级、环境等任务要素。
(2)基于提取的观测需求内容,基于航天观测全息数字画像及航天观测任务衍生技术,完成需求要素的细化。例如时间要素由“今天”转换为“从当前时刻至当日24时”;观测目标由“重点设施”转化为“水利设施”“机场”“居民区”等,进一步按照知识图谱中的行政区划及目标类型,从图谱中关联得到“泸定县”“瀑布沟水库”“甘孜康定机场”等具体目标;载荷要求依据“阴天”的环境描述推理为“SAR”。完成全部需求要素推理细化后,生成观测任务集。
(3)基于历史相关“需求-任务”供需关系挖掘得到的用户行为、资源与任务关联规律,为航天观测任务衍生而出的各项任务推荐航天观测资源。
(4)结合上述生成的任务要素集合与航天观测全息数字画像,将对应任务推送给用户“四川应急救灾中心”,由其进行观测任务确认,提升用户的使用体验以及航天资源的利用效率。

7 结束语

本文综合了近年来业务需求理解、任务智能规划等领域的研究成果及与人工智能、大模型相结合的发展趋势,设计基于多维数据关联的航天观测任务衍生机制,智能识别热点事件新闻及用户提报中的观测需求,并进行航天观测任务的自主衍生,有效提升了航天资源应用的广度、深度、频度。后续研究将在异构航天观测需求要素的多维识别提取、大语言模型与航天领域知识的跨尺度嵌入和航天观测任务的全要素衍生筹划等方向上进行深入探索。
[1]
朱光熙, 王港, 张超, 等. 基于多模态观测需求信息的遥感星群任务智能规划机制[J]. 天地一体化信息网络, 2022(3): 23-29.

DOI

ZHU G X, WANG G, ZHANG C, et al. Intelligent planning framework for star-walk mission based on multimodal observation requirements information[J]. Space-Integrated-Ground Information Networks, 2022(3): 23-29.

DOI

[2]
许宇栋, 周敬博, 尹嘉昭, 等. 对地观测卫星任务规划策略及应用研究综述[J]. 无线电工程, 2021, 51(8): 681-690.

XU Y D, ZHOU J B, YIN J Z, et al. Review of mission planning strategies and applications of earth observation satellites[J]. Radio Engineering, 2021, 51(8): 681-690.

[3]
张学飞, 张丽萍, 等. 知识图谱与大语言模型协同的个性化学习推荐[J/OL]. 计算机应用. 2024, 20241014.

ZHANG X F, ZHANG L P, et al. Personalized learning recommendation in collaboration with knowledge graph and large language model[J/OL]. Journal of Computer Applications. 2024, 20241014.

[4]
陈恒, 马鑫君, 梁艺多, 等. 基于知识图谱的航天器数字资源建设[J]. 科技和产业, 2024, 24(2): 42-49.

CHEN H, MA X J, LIANG Y D, et al. Construction of spacecraft digital resources based on knowledge graph[J]. Science Technology and Industry, 2024, 24(2): 42-49.

[5]
L. Ehrlinger. Towards a definition of knowledge graphs[J]. SEMANTICS, 2016, 48: 1-4

[6]
JI Z, LEE N, FRIESKE R, et al. Survey of hallucination in natural language generation[J]. ACM Computing Surveys, 2023, 55(12): 1-38.

[7]
王嘉宁. 面向预训练语言模型的提示调优方法[D]. 上海: 华东师范大学, 2024.

WANG J N. Methods on prompt tuning for pre-trained language models[D]. Shanghai: East China Normal University, 2024.

[8]
黄建勇. 基于深度学习的随机梯度下降优化算法研究[D]. 淮南: 安徽理工大学, 2024.

HUANG J Y. Research on random gradient descent optimization algorithm based on deep learning[D]. Huainan: Anhui University of Science & Technology, 2024.

[9]
谢思静, 文鼎柱. 基于联邦分割学习与低秩适应的RoBERTa预训练模型微调方法[J]. 数据采集与处理, 2024, 39(3): 577-587.

XIE S J, WEN D Z. Fine-tuning method for pre-trained model RoBERTa based on federated split learning and low-rank adaptation[J]. Journal of Data Acquisition & Processing, 2024, 39(3): 577-587.

[10]
黄云扬. 基于深度学习的知识图谱推理方法研究[D]. 成都: 电子科技大学, 2021.

HUANG Y Y. Research on knowledge graph reasoning method based on deep learning[D]. Chengdu: University of Electronic Science and Technology of China, 2021.

[11]
ZHANG Y, XIONG R, HE H, et al. Long short-term memory recurrent neural network for remaining useful life prediction of lithium-ion batteries[J]. IEEE Transactions on Vehicular Technology, 2018, 67(7):5695-5 705.

[12]
彭亚飞, 杨凡德. 基于贝叶斯网络的航天任务态势不确定性融合[J]. 兵工自动化, 2022, 41(8): 41-46, 51.

PENG Y F, YANG F D. Space mission situation uncertainty fusion based on Bayesian network[J]. Ordnance Industry Automation, 2022, 41(8): 41-46, 51.

Outlines

/