中国科技核心期刊      中国指挥与控制学会会刊     军事装备类重点期刊
研究论文

面向目标机动类型的数据标签生成方法

  • 汪其林 ,
  • 曹志敏 ,
  • 高静
展开
  • 江苏自动化研究所, 江苏 连云港 222061

汪其林(1999—),男,硕士研究生,研究方向为数据挖掘。

曹志敏(1965—),男,研究员。

Copy editor: 李楠

收稿日期: 2023-08-25

  修回日期: 2023-12-12

  网络出版日期: 2024-05-29

Target maneuver type oriented data label generation method

  • WANG Qilin ,
  • CAO Zhimin ,
  • GAO Jing
Expand
  • Jiangsu Automation Research Institute, Lianyungang 222061, China

Received date: 2023-08-25

  Revised date: 2023-12-12

  Online published: 2024-05-29

摘要

针对现有目标机动类型识别方法通用性不足、准确率较低等问题,提出基于改进K-medoids聚类的多层标签生成方法。以空中目标机动轨迹为例,设计多种数据预处理方法,采用动态时间规整作为聚类算法的距离度量,通过构建标签框架指导算法实施过程,进行迭代聚类以生成多层标签。在公开数据集上测试算法,实验结果表明,该方法在无监督情况下对第一层标签的识别准确率达到89.75%,接近传统有监督算法;同时,相对于没有引入标签框架的情况,能更有效地区分第二层模糊标签。该方法只需少量专家知识,便能简单地扩展到不同领域、不同机动类型。

本文引用格式

汪其林 , 曹志敏 , 高静 . 面向目标机动类型的数据标签生成方法[J]. 指挥控制与仿真, 2024 , 46(3) : 86 -94 . DOI: 10.3969/j.issn.1673-3819.2024.03.013

Abstract

Target maneuver type recognition is a key aspect in the fields such as object tracking and intention recognition. A multi-layer label generation method based on improved K-medoids clustering is proposed to address the problems of insufficient universality and low accuracy of existing maneuver type recognition methods. Taking the maneuver trajectory of aerial targets as an example, various data preprocessing methods are designed, and dynamic time warping is used as the distance metric for clustering algorithm. By constructing a label framework to guide the implementation process of the clustering algorithm, iterative clustering is carried out to generate multi-layer labels. The algorithm is tested on a public dataset, and the experimental results showed that the recognition accuracy of the first layer label achieved 89.75% under unsupervised conditions, which is closed to traditional supervised algorithms; Meanwhile, compared to the condition without introducing a label framework, it is more effective in distinguishing the second layer of fuzzy labels.This method requires only a small amount of expert knowledge and can be easily extended to different fields and different maneuver type.

随着现代信息技术的发展,各类传感器及智能设备广泛运用于演训过程中,产生并积累了大量演训数据,但是这些数据未被充分利用,造成了“数据丰富、知识匮乏”的局面,如何高效地从数据中挖掘有用信息是当前亟待解决的难题。
目标机动轨迹数据与雷达探测跟踪误差[1]、战术意图识别[2]等领域的知识密切相关。由于机动轨迹通常是反映目标空间运动的时序数据,具有产生频率快、数据量大的特点,若直接对机动轨迹数据进行挖掘,不仅效率低,且难以得到简洁的规则。如果能事先生成机动轨迹数据的类型标签,为目标跟踪、意图识别等后续领域提供先验知识,有助于提高知识挖掘的精度、效率。
目前的研究主要使用有监督算法进行机动类型识别[3-6],多采用分解、识别的思想。首先,分解机动轨迹为动作元,然后,识别动作元的类型,最后,将动作元序列映射到机动类型。出于不同的需求,各研究对动作元和机动类型的定义不一样,现有算法只能识别固定机动类型,若面向不同的领域加入新的待识别机动类型,需要重新设计分解方法,通用性不足。另外,当前研究主要采用有监督算法进行分类,如果后续面向不同领域进行数据挖掘,那么所需标注的机动类型可能不同。例如,面向雷达跟踪误差的数据挖掘,可能将数据标注为匀速直航、大角度转向等;而面向战术意图识别的数据挖掘,可能将数据标注为俯冲、爬升、筋斗等战术动作。若采用有监督算法,需要针对不同领域的数据挖掘需求分别标注数据,这一做法费时费力,在面对定义模糊的标签时,也无法保证标注的准确性。
也有一些研究使用无监督算法进行机动类型识别[7-9],主要包含基于模版匹配的方法和聚类算法。与有监督算法类似,基于模板匹配的方法同样使用分解、识别的思想,只适用于固定机动类型识别;由于现有聚类算法引入先验知识少,没有对聚类过程形成有效约束,导致簇心的意义和簇数不受人为控制,生成的标签可能不具备用于知识挖掘的价值。另外,现有聚类算法还存在准确率较低的问题。
本文提出了一种基于改进K-medoids聚类的多层标签生成方法,不需要消费有标注数据,仅需在标签框架构建及质心选取过程中引入少量专家知识便能简单地扩展到对其他领域目标的机动类型识别,同时,聚类后的质心意义与簇数具有良好的可解释性。

1 标签生成问题描述

目标机动类型识别是一类典型的模式识别问题,可以描述为建立从轨迹到机动类型的映射。给定样本集S={S1,S2,…,Sn },机动类型集T={t1,t2,…,tm },m<n,机动类型识别即寻找映射f使得f(Si )=tj,i=1,2,…,n,j=1,2,…,m。其中,n为样本数量,m为机动类型数量。几种典型的平面机动类型如图1所示,其中,交叉机动与其他机动类型的差异在于,交叉机动存在直行、左转、右转的交替运动,图1中,交叉机动的前半段是右转。后半段是左转,而其他机动类型的转弯方向不随时间变化。
图1 典型机动类型

Fig.1 Typical maneuver type

面向目标机动类型的标签生成比机动类型识别具有更丰富的内涵。单层次的机动类型粒度较粗,可能无法满足实际任务的需要,如果能将机动类型细化分解,产生多层次、细粒度的标签,则能根据实际任务需求选择使用何种粒度的标签,从而更好地服务于后续领域。

2 标签生成方法

标签生成的全流程如图2所示。首先,根据先验知识构建多层标签框架,再对机动轨迹数据实施特征提取、突变检测、特征归一化共3种预处理方法,最后,对特征数据逐层聚类,生成标签。
图2 标签生成流程图

Fig.2 Label generation flowchart

2.1 标签框架构建

针对现有聚类算法准确率低、质心意义不可控等问题,本文通过标签框架指定聚类簇数、质心以及聚类的先后顺序,从而避免出现虚假分类的情况,增强结果的可解释性。标签框架构建过程应考虑层次性、充要性。
1)层次性:标签框架应当具有分层结构,不同粒度的标签位于不同的层级,以满足不同领域的需要,灵活性更高;此外,分层结构应当准确描述标签之间的从属关系,以指导聚类算法实施先后顺序。
2)充要性:为了避免聚类后出现空簇以及聚类后的簇包含超出其标签范围的样本,标签框架的标签应当是样本集轨迹标签的充要条件。所以构建标签框架时,除了考虑所面向任务的需求,还应考虑样本集标签的实际情况。
空中目标意图的实现与机动类型紧密相关[10],本文面向意图识别领域,参考已有文献对机动类型的定义以及所用数据集包含的轨迹形状,采用自上而下的方法构建如图3所示的多层标签框架。标签框架的分层结构引入了先验知识,第一层的直线、左转向、右转向、交叉四个标签为区别显著的轨迹,第二层回转、大转向、小转向同属于左转向、右转向标签,是对转向更细粒度的描述。首先,使用聚类算法将所有样本划分到直线、左转向、右转向、交叉四个簇中,再将属于左、右转向的簇的样本分别划分到回转、大转向、小转向簇中。
图3 多层标签框架

Fig.3 Multi-layer framework

构建标签框架有3个好处:1)标签分层结构使得回转、大、小转向对应的簇只会由左、右转向簇中的样本聚类得到,而不是从样本全集聚类得到,从而降低聚类难度,有助于更好地学习特征。2)由于标签框架的构建引入了先验知识,在聚类前就知道了质心的自然语言意义,可以人工构造或是从样本集中选取初始聚类质心,相对于随机初始化方式,聚类效果、可解释性更好。3)通过向标签框架中添加新标签、新层级,并指定合适的聚类中心,来简单地扩展到后续不同领域目标或是不同机动类型,相对于以往算法分解、合成目标机动序列的做法,该方法对专家知识需求更少。

2.2 数据预处理

数据预处理是标签生成任务的关键,合适的预处理方法可以大大改善聚类效果。预处理方法的设计需要考虑原始数据特点、标签类型等多种因素,由于原始轨迹存在起点终点不统一、初始角度不统一等特点,若直接用原始轨迹进行聚类,无法取得良好的效果,所以需要先提取合适的特征。
本文的目标是生成直线、转向、交叉等标签,此类机动轨迹与速度、加速度无关,只与轨迹形状有关,所以采用基于欧拉角的特征表示方法,使用偏航角即可完整描述轨迹形状特征。偏航角指目标瞬时运动方向与x正半轴的夹角,由x正半轴顺时针转向为正,逆时针转向为负。由于轨迹平移不会改变偏航角,偏航角对原始轨迹具有平移不变性。偏航角的计算公式如式(1)所示。
ψ(t+1)= - a r c t a n Δ y Δ x , Δ x 0 - π - a r c t a n Δ y Δ x , Δ x < 0 , Δ y 0 π - a r c t a n Δ y Δ x , Δ x < 0 , Δ y < 0
式中,ψ为偏航角,Δy=y(t+1)-y(t),Δx=x(t+1)-x(t)。
本文不使用具有平移、旋转不变性的偏航角变化率描述轨迹形状特征,是因为所选用数据集的偏航角并不光滑,而偏航角变化率会进一步放大偏航角的波动,从而无法呈现稳定的规律,如果通过增加采样点来使偏航角变化率在全局上呈现一定的规律,那么后续聚类算法会花费更多的时间来运行。
使用偏航角描述轨迹特征存在角度突变的问题。如图4所示,箭头标识了机动方向,在轨迹左侧,机动方向由左下角指向右下角,偏航角从170°突变至-170°。这一突变对于聚类是不利的,因为将轨迹起点、终点互换以后,轨迹的标签理应不变,而突变问题的存在使得偏航角发生了较大变化,导致聚类算法无法正确识别这两种轨迹的特征。为解决该问题,增加突变检测模块,如果突变角度大于某个阈值,则将轨迹的起点与终点互换。由于现代飞机顺盘角速度只有几十度,而突变角度往往大于200°,所以设定阈值为220°,在不会误判突变的同时,也能保证大部分偏航角突变都能被检测到。
图4 偏航角突变问题

Fig.4 Yaw mutation problem

数据预处理常用到标准化技术,目的是消除量纲的影响,同时可以提高迭代求解精度,但是本文未对轨迹或是偏航角进行标准化处理,这是因为Min-Max、Z-Score标准化方法会缩放数据,无法保证不同数据之间的相对幅值变化趋势是一致的。例如,将图5a)所示的蓝色直线偏航角与红色转向偏航角进行Z-Score标准化处理,结果如图5b)所示,发现标准化后的直线偏航角表现出了转向的波谷特征,因为Z-Score标准化会使样本的标准差变为1,导致所有样本的波动性趋于一致,这会使聚类算法倾向于将他们归到同一个簇中,尽管他们的标签完全不同。类似地,Min-Max标准化会将数据缩放到固定区间中,同样会改变样本的标准差。也正因如此,只选择偏航角作为特征,从而避免出现多个量纲。
图5 标准化前后的偏航角

Fig.5 Yaw before and after standardization

本文针对轨迹旋转为聚类结果带来的影响采取了平移偏航角的归一化方式,使得特征表示对于原始轨迹具有旋转不变性。如图6a)所示,红色轨迹由蓝色轨迹逆时针旋转90°得到,图6b)为对应轨迹的偏航角。旋转轨迹后,偏航角增大90°,而轨迹形状不变。由于针对时序数据的距离度量方法,例如欧氏距离、SBD距离等,均会受数据幅值影响,具有相同标签的样本可能会因为幅值相差过大而被分到不同的簇中。为了消除轨迹旋转对聚类结果的影响,将所有偏航角的起点平移至原点。
图6 旋转前后的轨迹与偏航角

Fig.6 Trajectory and yaw before and after rotation

2.3 改进K-medoids聚类

本文采用聚类算法进行标签生成,目标是将n条时序数据划分到m个两两不相交的簇中,使得如式(2)所示的代价函数最小。
E= j = 1 m S i t j dist(Si,cj)
其中,E为聚类代价,Si为第i条时序数据,cj为簇tj的质心,dist()为算法采用的距离度量。
距离度量方法是聚类算法的核心,根据实际任务背景选择合适的距离度量甚至比聚类算法本身更加重要[11]。因此,时序数据聚类仍主要采用经典聚类方法,要么使用适用于时序数据的距离度量,要么将时序数据转换为单一向量,以便直接应用经典聚类算法。
欧氏距离是最经典、最广泛使用的距离度量方法,针对时序数据的欧氏距离计算方法如式(3)所示。
ED(S1,S2 )= i = 1 m ( s 1 i - s 2 i ) 2
式中,时序序列s1i={(x1,y1 ),(x2,y2 ),…,(xi,yi ) },m为序列长度。
欧氏距离不适合用于度量空中目标机动轨迹的相似性。标签生成任务中,一种机动动作对应的多条轨迹差异较大,特征峰值出现的位置往往不在时间上对齐,而欧氏距离是一对一映射的计算方式,在两条时序数据的峰值未对齐时,欧氏距离会夸大数据间的差异,无法准确评估时序数据间的相似性。
本文选用动态时间规整(Dynamic Time Warping,DTW)算法作为距离度量。DTW是一种基于形状的弹性度量方法,它将一条时间序列在时间轴上进行缩放,使其与另一条时间序列更好地对齐,并在最佳对齐位置计算两条时序数据的相似度,从而实现一对多映射。由于机动动作可能会开始于不同时间点,而标签生成任务希望将同一个机动动作的两条时序数据在峰值未对齐时,仍然归于一个簇,这种对齐后计算相似度的方法是有利的。设序列Q={q1,q2,…,qn },C={p1,p2,…,pm},DTW算法构造了一个n×m的矩阵,该矩阵的第ij个元素分别是两个序列的第ij点的欧氏距离,DTW算法试图在一定约束条件下,寻找一条从矩阵左下角到右上角的路径,使得代价最小。DTW使用动态规划算法求解式(4)所示的最优化问题。
DTW(Q,C)=min k = 1 K w k K
式中,K为路径长度,wk为第k个点对应点的欧氏距离。
当采用DTW距离度量时,质心更新的方式必须与DTW在时间轴上对齐序列的能力保持一致[12],否则可能会使聚类算法不收敛。最常见的质心更新方式是将簇中样本的算术平均值作为质心,该方法并不适用于时序数据,在特征峰值未对齐时,时序数据的算术平均会削平峰值,导致质心无法反应簇中样本的平均特征。
因此,本文选用K-medoids聚类算法,该算法直接选取现有样本作为质心,从而规避了质心平均的问题。首先,选取k个样本作为质心,基于DTW距离,将所有其他样本分配到最近的质心所代表的簇中,对每一个簇,分别计算簇中各个样本成为质心时到其他样本的距离之和,将距离总和最小的样本作为新的质心,完成所有簇的质心计算后,将所有样本重新分配到最近的簇中,如此迭代,直至到达预先指定的迭代次数或是质心不再发生变化。
对K-medoids算法的初始质心选择方式进行改进,并与标签框架相结合。一般采用随机选取的方式产生初始质心,这种方法无法保证聚类后每个簇的标签具有知识挖掘的价值,本文引入了先验知识,根据图3构建的标签框架指定质心。对标签框架的第一层聚类时,从现有样本选取直线、左转、交叉3个样本,然后取其特征的负值,将正负共6个轨迹样本作为质心。一方面,取负值改变了轨迹转向,从而不需要寻找右转样本;另一方面,对于偏航角特征处于第四象限的样本,这一改进使得样本不会被错误地归类到第一象限中离x轴最近的质心特征所代表的簇。随后,应用K-medoids算法收敛后得到6个簇,每个簇的质心标签都会与指定质心的标签相对应。

3 仿真验证

3.1 实验数据处理

为了保证实验的可重复性,本文使用公开航空轨迹数据集TrajAir[13]测试算法。简便起见,本文仅考虑二维情况下的标签生成,所以只取x轴、y轴二维坐标。将数据集导入Matlab,合并具有相同飞机编号的数据,删除时间长度过短、速度过低以及航迹波动较大的数据,最终获得400条长度为100的二维时序数据,部分轨迹如图7所示。图中,不同颜色曲线代表不同的平面轨迹,轨迹起点以黑色圆圈标识。
图7 TrajAir中的部分轨迹

Fig.7 Part of the trajectories in TrajAir

对400条数据进行标注,直线、左转、右转、交叉样本数量分别为152、99、105、44,直线与交叉样本比例超过3∶1,这一类别不平衡现象可能会影响评估的准确性。为了验证类别不平衡的影响,通过增加交叉样本数量,减少直线样本数量,产生10种类别比例进行实验,统计10次实验中,各个类别的精确度、召回率以及准确率,结果见表1。其中,样本比例为直线、左转、右转、交叉的样本数量比例,采用了随机欠采样以及人工少数类过采样方法(Synthetic Minority Over-Sampling Technique,SMOTE)改变样本数量。结果显示,增加交叉样本数量,使得直线与交叉的样本比例由5∶1缩小到1∶1时,交叉簇的精确率由58.33%提高至80.90%;减少直线样本数量,使得直线与交叉的样本比例由1∶1缩小到1∶3时,直线簇的精确率由84.85%下降至63.41%。可见,样本比例的改变对单个簇的精确率影响较大,随着某一类样本占比减少,精确率也迅速下降。
表1 样本比例与精确率/召回率、准确率的关系

Tab.1 Relationship between sample ratio and accuracy/recall

样本比例 直线/% 左转/% 右转/% 交叉/% 准确率/%
150∶90∶90∶30 93.24/92.00 96.59/94.44 94.32/92.22 58.33/70.00 90.83
150∶90∶90∶45 90.38/94.00 98.81/92.22 90.22/92.22 69.77/66.67 89.87
150∶90∶90∶60 86.42/93.33 95.51/94.44 84.38/93.33 82.00/68.33 89.74
150∶90∶90∶75 83.91/97.33 97.65/92.22 95.29/90.00 83.61/68.00 89.14
150∶90∶90∶90 90.60/90.00 94.44/94.44 91.30/93.33 80.90/80.00 89.52
90∶90∶90∶90 84.85/93.33 94.44/94.44 92.31/93.33 88.75/78.89 90.00
75∶90∶90∶90 82.35/93.33 94.44/94.44 92.31/93.33 89.87/78.89 89.96
60∶90∶90∶90 78.57/91.67 94.44/94.44 92.31/93.33 89.87/76.67 89.39
45∶90∶90∶90 69.49/91.11 94.44/94.44 92.31/93.33 92.00/76.67 88.57
30∶90∶90∶90 63.41/86.67 94.44/94.44 92.31/93.33 91.03/78.89 88.67
使用macro-F1综合评估算法性能,计算公式如式(5)、(6)、(7)所示。
macro_F1= 2 × P r e c i s i o n M a c r o × R e c a l l M a c r o P r e c i s i o n M a c r o + R e c a l l M a c r o
PrecisionMacro= 1 n i = 1 n T P i T P i + F P i
RecallMacro= 1 n i = 1 n T P i T P i + F N i
其中,PrecisionMacroRecallMacro分别为宏平均下的精确率、召回率。i为簇序号,n为类别总数,TP为正样本被正确识别的数量,FP为负样本被错误识别的数量,FN为正样本被错误识别的数量。
各样本比例下的macro-F1见表2,当样本比例为90∶90∶90∶90时,macro-F1最大,为90.04%。可见,当样本比例平衡时,算法能取得更好的综合性能。
表2 各样本比例下的F1值

Tab.2 F1 at each sample ratio

样本比例 macro-F1 样本比例 macro-F1
150∶90∶90∶30 86.39% 90∶90∶90∶90 90.04%
150∶90∶90∶45 86.78% 75∶90∶90∶90 89.87%
150∶90∶90∶60 87.22% 60∶90∶90∶90 89.19%
150∶90∶90∶75 88.47% 45∶90∶90∶90 87.96%
150∶90∶90∶90 89.38% 30∶90∶90∶90 86.79%
为了准确评估算法性能,使用随机欠采样以及SMOTE调整样本数量为100∶100∶100∶100,以此为基础开展后续实验。过采样增加的部分交叉轨迹如图8所示。
图8 SMOTE生成的交叉轨迹

Fig.8 Cross trajectories generated by SMOTE

3.2 实验结果及分析

3.2.1 第一层标签聚类结果分析

根据第一层标签,对经过数据预处理的400条时序数据进行聚类。在现有样本中寻找直线、左转向、交叉样本,并将其对应的偏航角及其负值指定为初始聚类中心。聚类完成后,合并直线及其负值、交叉及其负值所代表的簇,每个簇的前30条轨迹如图9所示,轨迹上的黑色圆圈为轨迹起点。图9包含4个簇,分别是直线、交叉、左转向、右转向,各个簇包含的轨迹形状与图1的典型机动类型保持一致。
图9 第一次聚类结果

Fig.9 Result of the first clustering

将本文方法与K-medoids聚类、反向传播神经网络(Back Propagation Neural Network,BPNN)、支持向量机(Supporting Vector Machine,SVM)进行对比。其中,K-medoids聚类采取随机选择的方式初始化簇心;BP神经网络为3层,每层节点数为15,选用ReLU激活函数;SVM是使用二次多项式核函数的1v1分类器,BP神经网络与SVM的训练集与测试集之比均为8∶2,并采用五折交叉验证。使用准确率、宏平均下的精确率和召回率三个指标评估算法性能,准确率的计算方式如式(8)所示。
Accuracy= T P 1 + T P 2 + T P 3 + T P 4 T P 1 + T N 1 + F P 1 + F N 1
其中,Accuracy为准确率,TN为负样本被正确识别的数量。
四种算法的评估结果见表3,所提方法的各项指标均高于未改进的K-medoids算法,表明改进的初始质心选择方法更适用于本文的任务场景;另外,所提方法的准确率分别比BP神经网络与SVM低0.25%、1.5%,表明在不使用有标签数据训练的情况下,本文方法仍然能达到接近传统SVM、BP神经网络的性能。
表3 四种算法的评估结果

Tab.3 Evaluation of four algorthms

K-medoids/
%
改进
K-medoids/%
BP
神经网络/%
SVM/%
准确率 83.25 89.75 90.00 91.25
精确率(宏平均) 85.22 89.90 91.53 93.52
召回率(宏平均) 83.25 89.75 90.00 91.25

3.2.2 第二层标签聚类结果分析

根据第二层标签,对经过数据预处理的转向样本进行聚类。由于转向大小与转向方向无关,所以将聚类所得的左、右转向簇合并,对合并后的198个转向样本进行聚类,指定回转、大转向、小转向样本对应的偏航角及其负值共6个初始聚类中心,聚类结果如图10所示,三个簇分别为回转、大转向、小转向。这里展示了各个簇的前20条轨迹。
图10 第二次聚类结果

Fig.10 Result of the second clustering

为了更直观地展示聚类结果,使用轨迹前三个点与后三个点的平均偏航角变化值衡量转向大小,转向大小与聚类结果的关系如图11所示,图a)为基于两层标签框架的聚类结果,图b)为直接对所有标签进行聚类的结果,图中红色圆圈、绿色加号、蓝色星号分别对应回转簇、大转向簇、小转向簇的样本。可见,图b)中大转向与小转向簇重叠较多,区分度差于图a)。
图11 偏航角变化量

Fig.11 Variation of yaw

由于转向标签为模糊标签,尚无明确定义,难以根据经验对介于大、小转向之间的轨迹进行标注,采用CH指数和轮廓系数评价聚类效果。轮廓系数是一种适用于样本实际类别未知情况下的评价指标,它衡量了聚类后各样本与其他簇的距离,值越高,相似程度越低,聚类效果越好。CH指数是簇间距离与簇内距离的比值,值越高,不同簇的差别越大,聚类效果越好。两种评价指标的计算结果见表4,引入标签框架后,轮廓数提高了30.4%,CH指数提高了140.45%,表明基于标签框架的多层聚类方式使各个簇更为紧凑,簇间差异更大,聚类效果更好。这是因为标签框架的构建过程引入了先验知识,在聚类时起到了筛选原始输入数据的作用,使得无需对显著无关的样本进行聚类。
表4 两种聚类方式的评价结果

Tab.4 Evaluation for the two clustering methods

轮廓系数 CH指数
基于标签
框架的聚类
0.471 8 89.419 6
直接聚类 0.368 1 37.188 7

4 结束语

本文针对现有机动识别算法通用性不足、准确率较低等问题,提出了一种基于改进K-medoids聚类的多层标签生成方法,通过构建标签框架,对机动轨迹数据进行迭代聚类以生成多层标签。主要结论有以下几点:1)合理的数据预处理过程至关重要,本文针对机动轨迹数据的特点以及任务要求,仅抽取了一种特征并为其量身定制了多种预处理方法,就能大大改善聚类效果;2)通过引入先验知识构建多层标签框架,可以筛选出与待聚类标签显著无关的样本,减少无关样本的干扰,提高聚类算法的性能;3)在合理选择质心的情况下,基于DTW距离度量的K-medoids算法能在无监督的情况下取得较好的聚类效果,可以有效识别轨迹方向、轨迹形状,准确率接近传统有监督算法。
[1]
陈星, 李战武, 徐安, 等. 基于目标机动模式识别的VSMM算法[J]. 系统工程与电子技术, 2020, 42(5): 999-1 006.

DOI

CHEN X, LI Z W, XU A, et al. VSMM algorithm based on target maneuver pattern recognition[J]. Systems Engineering and Electronics, 2020, 42(5): 999-1 006.

DOI

[2]
冷画屏, 吴晓锋, 王慕鸿. 空中目标战术机动类型的实时识别[J]. 火力与指挥控制, 2011, 36(1): 64-66.

LENG H P, WU X F, WANG M H. Real-time recognition of air target tactical maneuvering type[J]. Fire Control & Command Control, 2011, 36(1): 64-66.

[3]
徐西蒙, 杨任农, 于洋, 等. 基于运动分解和H-SVM的空战目标机动识别[J]. 控制与决策, 2020, 35(5): 1 265-1 272.

XU X M, YANG R N, YU Y, et al. Target maneuver recognition in air combat based on motion decomposition and H-SVM[J]. Control and Decision. 2020, 35(5): 1 265-1 272.

[4]
魏政磊, 董康生, 岑飞, 等. 一种在线飞机机动轨迹识别方法[C]// 中国航空学会. 第五届中国航空科学技术大会论文集. 北京航空航天大学出版社, 2021: 733-740.

WEI Z L, DONG K S, CEN F, et al. An online aircraft maneuver trajectory recognition method[C]// Chinese Society of Aeronautics and Astronautics. The 5th Chinese Aeronautics Science and Technology Conference Proceedings Collection, BEIHANG University Press, 2021: 733-740.

[5]
平宏达, 刘义海, 单连平. 基于双驱动模型的目标机动行为识别方法[J]. 指挥控制与仿真, 2021, 45(2): 733-740.

PING H D, LIU Y H, SHAN L P. Target maneuver behavior recognition method based on double drive model[J]. Command Control & Simulation, 2021, 45(2): 733-740.

[6]
贾镇泽, 樊晓光, 薛明浩, 等. 基于机动动作元的敌机战术机动在线识别方法[J]. 北京理工大学学报. 2018: 820-827.

JIA Z Z, FAN X G, XUE M H, et al. Online identification method for tactical maneuver of target based on air combat maneuver element[J]. Transactions of Beijing Institute of Technology. 2018: 820-827.

[7]
姚佩阳, 周旺旺, 张杰勇, 等. 基于动态时间规整的空中目标机动识别[J]. 火力与指挥控制, 2018, 43(9): 15-18, 24.

YAO P Y, ZHOU W W, ZHANG J Y, et al. Aerial target maneuvering recognition based on dynamic time warping[J]. Fire Control & Command Control, 2018, 43(9): 15-18, 24.

[8]
张夏阳, 殷之平, 刘飞, 等. 飞机机动划分的数据挖掘方法[J]. 西北工业大学学报, 2016, 34(1): 33-40.

ZHANG X Y, YIN Z P, LIU F, et al. An aircraft maneuver partition method based on data mining[J]. Journal of Northwestern Polytechnical University, 2016, 34(1): 33-40.

[9]
吴达, 吕锐, 杨宇, 等. 基于动态时间规整下密度聚类的轨迹识别研究[J]. 火力与指挥控制, 2021, 46(10): 73-78.

WU D, LV R, YANG Y, et al. Research on improvement of DTW maneuver trajectory recognition based on DBSCAN[J]. Fire Control & Command Control, 2021, 46(10): 73-78.

[10]
滕飞, 刘曙, 宋亚飞. BiLSTM-Attention: 一种空中目标战术意图识别模型[J]. 航空兵器, 2021, 28(5): 24-32.

TENG F, LIU S, SONG Y F. BiLSTM-Attention: An air target tactical intention recognition model[J]. Aero Weaponry, 2021, 28(5): 24-32.

[11]
BATISTA G E A P A, KEOGH E J, TATAW O M, et al. CID: an efficient complexity-invariant distance for time series[J]. Data Mining and Knowledge Discovery, 2014, 28(3): 634-669.

[12]
PETITJEAN F, KETTERLIN A, GANCARSKI P. A global averaging method for dynamic time warping, with applications to clustering[J]. Pattern Recognition, 2011, 44(3): 678-693.

[13]
PATRIKAR J, MOON B, OH J, et al. Predicting like a pilot: dataset and method to predict socially-aware aircraft trajectories in non-towered terminal airspace. 2021.

文章导航

/