中国科技核心期刊      中国指挥与控制学会会刊     军事装备类重点期刊
Multi-source Information Fusion

A ship type identification method based on modeling AIS data

  • MOU Fangli 1 ,
  • LIU Ying 2 ,
  • FAN Zide 1, ,
  • DENG Yawen 1 ,
  • ZHU Keqing 1 ,
  • ZHAO Xinyu 1
Expand
  • 1 Key Laboratory of Target Cognition and Application Technology, Aerospace Information Research Institute, Chinese Academy of Sciences, Beijing, 100084, China
  • 2 Unit 91977 of PLA, Beijing, 100089, China

Received date: 2024-09-05

  Revised date: 2024-09-13

  Online published: 2025-07-28

Abstract

With the continuous development of ship information technology, automatic identification system (AIS) plays an increasingly important role in marine traffic management and ship navigation safety. In this paper, a ship identification method based on AIS data is proposed to solve the problem of military-civilian type identification of ships. The method establishes a sensitive sea area model for the distribution of key points of ship trajectories, calculates the probability of military-civilian attributes of ships, and constructs a category classifier to judge the military-civilian attributes of ships. The proposed method uses cheap, all-domain coverage and high frequency AIS information to identify the military and civilian types of ships, which can detect and warn the threatening behaviors existing in the sea area in advance, provide support and auxiliary decision-making for subsequent response and disposal.

Cite this article

MOU Fangli , LIU Ying , FAN Zide , DENG Yawen , ZHU Keqing , ZHAO Xinyu . A ship type identification method based on modeling AIS data[J]. Command Control and Simulation, 2025 , 47(4) : 40 -48 . DOI: 10.3969/j.issn.1673-3819.2025.04.007

我国海域面积广阔,各项涉海事业发达,海上潜在威胁往往隐藏在繁忙的民事经济活动中,这给海域常态化监管、维护国家海洋权益带来了很大挑战。
舰船的军民类别是舰船具有的重要属性,直接体现了舰船目标在特定任务中的重要性和威胁程度,对进行海上目标监视、威胁分析评估以及后续任务的指挥筹划等方面具有重要意义。现有的舰船军民类别识别主要通过光学遥感、航侦影像判别的方式,即通过图像目标检测方法,根据提取的舰船图像特征进行舰船军民类别的自动判别。然而,光学遥感、航侦等基于图像的方法具有时效性与覆盖率有限、受天气影响大、观测成本高等缺陷。
自动识别系统(AIS)在如今的海上交通管理和船舶航行安全中愈发重要,AIS数据具有大覆盖区域、数据频率高、成本低廉等特点,包含各类舰船历史航行中的规律信息,具有很高的应用价值[1]。为解决现有基于遥感、航侦信息进行舰船军民类型识别的缺陷问题,实现对我国广阔海域的常态化管控,本文提出一种基于AIS数据的舰船军民类型识别方法。所提方法利用廉价、全域覆盖、高频率的AIS信息,能够对海域中存在的潜在威胁行为提前发现和预警,为后续的应对处置提供支撑和辅助决策,更好地保障国家海洋安全。
目前,对AIS数据的挖掘研究主要集中在以下两个方面[2]:一是基于AIS数据的航路聚类研究,二是基于AIS数据的舰船异常行为检测研究。AIS聚类分析是航迹分析预测、异常行为检测、碰撞预警等AIS数据挖掘分析的基础,该过程通过构建航迹相似度度量并利用聚类算法实现对船舶航行路线和交通流的分析[3]。舰船异常行为检测通常采用总结归纳方法建立舰船的异常行为库,朴素贝叶斯、卡尔曼滤波、核密度估计等是常见的舰船异常行为检测方法[4],一些基于时序网络的检测方法同样被提出用于进行舰船异常行为的检测[5]。舰船的加速度、平均速度和转向率则为构建判据的常见评价准则。现有的舰船异常行为检测主要针对特定检测场景,存在大多数因素无法直接量化以及异常特征知识库不具有广泛适用性的问题,对大范围内舰船的异常行为检测不适用[6]
以上研究展示了AIS数据在海洋管控等领域中的有效应用,但是在舰船的军民类型识别问题上,目前尚未有深入的研究报道。AIS数据作为典型的地理时空大数据,具有密度不均、分布复杂、频率差异大等特性。相较而言,民用舰船AIS数据具有数据量大、分布广、连续性强的特点;而军用舰船AIS数据具有数据稀疏、分布不均、分散性强的特点,故需要采用不同的分析方法。由于军用舰船与民用舰船在海域中执行任务目的具有显著差异,因此,如何从海量的民用舰船AIS信息中快速、有效识别出军用舰船的AIS信息对实现高效的海上目标监视、威胁分析以及后续任务的指挥筹划等方面具有重要意义。
面向国家需求,充分发挥现有民用资源潜力,本文针对舰船的军民类型识别问题,提出了一种基于AIS数据的舰船军民类型识别方法。该方法对AIS数据进行高效航路聚类分析,建立航迹关键点分布的敏感海域模型,以计算舰船的军民属性概率,并构建类别分类器实现对舰船军民属性的判断。实际AIS数据集中的验证结果表明,该方法可以实现基于AIS信息的舰船军民类型识别,能够对海域中存在的潜在威胁行为提前发现和预警,为后续的应对处置提供支撑和辅助决策,具有很好的应用价值。

1 基于AIS信息的舰船军民属性识别方法

基于AIS信息的舰船军民属性识别问题即从海量历史AIS数据中提取民用舰船和军用舰船具有的特征,设计判别器实现对给定AIS航迹的舰船军民属性识别。本文方法的整体思路如下:
首先,通过对AIS数据进行投影、压缩等方式剔除错误数据;之后,通过基于聚类的分析方法进行海域航路建模,实现对具有大数据占比的民用舰船AIS特征建模;接下来,通过基于高斯混合模型的方法实现对具有小数据占比的军用舰船AIS特征建模;最后,结合提取的民用、军用舰船AIS特征,设计基于支撑向量机的分类器完成对给定AIS航迹的舰船军民属性识别。
为了解决基于AIS数据的舰船军民类型识别中存在的海量AIS数据难以分析、军民舰船数据分布极度不均衡、军用舰船数据连续性差的难点问题,本文设计方法的基本流程如图1所示。
图1 本文方法基本流程

Fig. 1 General process of proposed method

1.1 AIS数据预处理

AIS数据是一种典型的地理时空大数据。通常一艘舰船完整的AIS航迹具有数据量大、报点时空间分布不均衡等特点,导致使用原始的AIS信息进行舰船航行状态分析具有较大的困难,也加大了算法的计算复杂度。因此,在分析AIS数据之前,需要对AIS数据进行预处理,本文采用的具体方法如下:
(1) 在读取原始的AIS数据后,我们首先将AIS数据的地理坐标转换为墨卡托投影下的坐标,计算公式如下[7]:
r 0 = a × c o s ( l a 0 ) 1 - ( e 1 2 × s i n 2 ( l a 0 ) ) q = l n t a n ( π 4 + l a 2 ) × ( 1 - e 1 × s i n ( l a 0 ) 1 + e 1 × s i n ( l a 0 ) ) e 1 2 x = r 0 × l o y = r 0 × q
其中,(lo,la)为AIS数据的地理经纬度坐标;(x,y)为墨卡托投影坐标;r0表示标准纬度平行圆的半径;la0表示墨卡托投影中的标准纬度;a表示地球椭球的赤道半径,e1为地球椭球的第一偏心率,q为等量纬度。
之后,我们根据投影后AIS的航行航向和船舶航行速度进行AIS数据清洗,排除具有错误位置、速度或加速度的航迹数据点并将具有同一MMSI (Maritime mobile service identity)代码的AIS点关联为同一舰船。
(2) 在完成AIS异常点清洗后,我们使用道格拉斯-普客(Douglas-Peucker,DP)算法实现AIS航迹的压缩[8]。DP算法是一种递归迭代的线状要素抽稀算法,是目前应用最广泛的轨迹压缩算法。其主要思想是从原始轨迹点集TS中抽取关键特征点集KS={K1,…,Kn},使得在一定保留阈值ε下,该特征点集与原始轨迹点集形状尽可能相似。其中,n为压缩后轨迹点的数目,且Ki=(xi,yi)。
DP算法流程如图2所示,其基本实现步骤为:
步骤1:将轨迹TS的起点和终点加入KS;
步骤2:遍历KS;
步骤2.1:记相邻两点KiKi+1之间的直线为基线,两点之间的线段为子轨迹线段SubT={T1,…,Tm} (其中,m为子轨迹线段的点数),计算子轨迹线段SubT中各点到基线的距离。
步骤2.2:取最大距离dmax,若dmaxε,则将最大距离对应的点Ti记录在集合KS中。
步骤3:令所有dmax中的最大值为Dmaxε,若Dmaxε,重复步骤2,否则结束算法。
图2 DP算法基本流程

Fig. 2 Schematic diagram of DP algorithm

算法中点与基线间的距离计算可以使用如下的海伦公式获得:
$d=\frac{2 S}{a}, S=\sqrt{p(p-a)(p-b)(p-c)}$
式中,a为曲线的基线长;bc分别为分析点到基线两端点的距离;p= a + b + c 2为半周长;S表示由点和基线构成三角形的面积。
至此,完成对AIS航迹数据的预处理,我们将经DP压缩后得到的AIS航迹点称为舰船的航行特征点。

1.2 海域航路建模

为便于进行海域特性分析,需要对AIS航迹进行聚类。针对AIS地理大数据的特点,我们基于交通密度图像的方法,将复杂AIS轨迹的聚类问题转化为图像处理问题。该方法不需要计算全部轨迹之间的相似性,综合考虑了轨迹的局部特征和全局特征,具有适应性强、效率高的优点,有效解决了在处理海量AIS数据时常规算法产生的维度灾难。
通过对每个网格中的AIS报点进行计数来构建航路密度图,航路密度图的像素值为像素区域内AIS报点的计数值,其过程如图3所示。
图3 海域AIS航路密度图建模过程

Fig.3 General process of constructing traffic density image

从构建过程可知,对于某一相关区域,构建得到的航路密度图具有以下线性特征:
$ {Img}(T)=\sum_{i} {Img}\left(t_{i}\right), T=\sum_{i} t_{i}$
式中,Img(t)是时间段t内构建的航路密度图。该特性保证了航路密度图具有时间上的线性可叠加性,便于进行AIS数据的增量分析。
根据上述构建过程可知,航路密度图中较亮的区域为舰船在海域中航行的主要干路。结合AIS数据特点可知,该区域反映了民用舰船的航行特点,可作为民用舰船模式(特征曲线)提取的依据。本节建模的主要目标如图4所示。
图4 海域航路建模目标 (a)为原始的航路密度图 (b)为建模后的海域航路

Fig.4 General purpose of modeling main sea-routes (a) shows the constructed traffic density image. (b) shows the modeling sea-routes

图4(a)所示,直接构建的海域AIS航路密度图具有大量的噪点。这些噪点反映的是少量非规律舰船的航迹,对应于航路密度图中的高频分量。为进行主要干路区域提取,获得具有鲁棒性的民用舰船航行特征,首先利用高斯滤波对航路密度图中的次要航行轨迹所在区域进行抑制:
$I m g_{1}=G_{f}(\sigma) * I m g_{0}$
高斯滤波器是一种线性滤波器,能够有效抑制图像噪声,达到平滑图像的目标。式中,Img1为高斯滤波后的航路密度图,滤波器的Gf方差为σ;Img0为原始的航路密度图。高斯滤波器的应用目的如图5所示,滤波后的航路密度图如图6(b)所示。
图5 高斯滤波器和Gabor滤波器应用目的

Fig.5 General purpose of using gaussian filter and Gabor filter

图6 海域航路聚类过程

Fig.6 General process of clustering main sea-routes

基于恒虚警率(Constant false alarm rate, CFAR)思想,主要干路区域的提取方法如下:
$R_{L}=\left\{x_{L}: x_{L} \geqslant T_{b}\right\}, P\left(T_{b}\right)=\alpha$
其中,RL为提取区域;xLImg1中的像素值;Tb为提取阈值;PImg1的经验累积分布函数;α为选取的显著性水平。
由于提取的区域也可能是主要航道以外的相交区域(如图4所示),我们采用形态学处理和连通域分析的方法来消除这些区域:
$A\left(\boldsymbol{x}_{L}\right) \leqslant A_{0} \text { OR } E c\left(\boldsymbol{x}_{L}\right) \leqslant E c_{0}$
式中,xLRL中的连通区域;A(xL)和Ec(xL)分别为区域xL的面积和偏心率;A0Ec0是对应的阈值常数。我们将处理后的航路密度图记为ImgM
至此,我们有了航路密度图中的所有主要航道区域,如图6(d)所示,下一步是将它们聚类并分割成不同的航行模式,获得可以量化计算的特征曲线。
在航路密度图中,主要干路航路的图像纹理反映了该区域内舰船的主要航行方向,航路的主要航行方向结合航路的空间位置便能形成该航路的航行模式特征。为便于获得受亮度影响小、便于聚类的方向特征(图4b中的特征曲线),构建可以进行计算的航行特征,我们使用Gabor滤波器提取航路密度图的纹理特征。Gabor滤波器是一种线性带通滤波器,被广泛应用于图像处理中的边缘检测、纹理分类、特征提取和视差估计。Gabor特征HG是将图像ImgM与Gabor滤波器{g(x,y|λ,θ,ψ,σ,γ)}进行卷积得到的具有相同滤波方向的响应向量hg之和:
$\begin{array}{l}\boldsymbol{H}_{G}=\left[\boldsymbol{h}_{g}(1), \cdots, \boldsymbol{h}(m)\right] \\\boldsymbol{h}_{g}(i)=\sum_{k} g\left(x, y \mid \lambda_{k}, \theta_{i}, \psi, \sigma, \gamma\right) * \operatorname{Img}_{M} \\g(x, y \mid \lambda, \theta, \psi, \sigma, \gamma)=\exp \left(-\frac{\tilde{x}^{2}+\gamma^{2} \tilde{y}}{2 \sigma^{2}}\right) \exp \left[i\left(2 \pi \frac{\tilde{x}}{\lambda}+\psi\right)\right] \\\tilde{x}=x \cos \theta+y \sin \theta, \tilde{y}=-x \sin \theta+y \cos \theta\end{array}$
此处,可以选择方向参数为θ=[0, π 6, π 3, π 2, 2 π 3, 5 π 6],波长为λ=[2,4,5],x表示像素的x坐标,y表示像素的y坐标,ψ表示相位偏移量,σ表示高斯包络函数方差参数,γ表示空间尺度纵横比。
在此基础上,我们使用基于密度的带噪声应用空间聚类(Density-based Spatial Clustering of Application with Noise, DBSCAN)方法利用Gabor特征对像素进行聚类。
DBSCAN算法的核心思想为构建数据点的ε邻域Nε(p)[9]:
$N_{\varepsilon}(p)=\left\{q \in X^{c} \mid \operatorname{dist}(p, q) \leqslant \varepsilon\right\}$
式中,Xc为聚类数据点集;dist为定义数据点间的距离函数,文中距离为L2范数距离。
之后,给定邻域数据密度阈值Mε来获得至少包含Mε个数据点的数据聚类结果。
我们将这些具有相似航行航向的航线聚类成一个相同的航行模式,如图6(e)所示。为反映航迹的空间距离,我们将位置加入图像特征中,对每个航路模式进行二次DBSCAN聚类,进一步得到在空间上被隔离的航路,如图6(f)所示。然而,由于一些相邻区域可能存在过度分割现象。因此,我们根据每个航迹的空间位置和密度对这些区域进行检查,以实现更精确的分割。
我们提出以下判断相邻航道区域是否合并的标准:
$M I=\prod_{i=1}^{n} I_{l}^{\frac{w_{i}}{n}}, M I \in[0,1]$
MI的数值越大,表示相邻航线之间的相似性越大。其中,Ii∈[0,1]表示由图像特征生成的归一化指标,wi为对应指标的权重。
本文用区域距离指标I1、路线相似度I2和密度相似度I3三个特征来计算航路间的相似度。区域距离指标I1使用最大-最小距离来计算两条相邻航路之间的空间距离;航向相似度I2是利用航路的平均航向角来防止获得的一类航道区域具有过大的航向差异;密度相似度I3利用航路的平均交通密度使得航道区域间的舰船流量尽量一致。
选择合并阈值MI0,并将满足MI>MI0的相邻航路合并,结果如图6(g)图6(h)所示。完整的海域航路聚类过程如图6所示。
在完成海域航路聚类后,图4(b)中海域航路的特征曲线便可由聚类区域的中心曲线定义。

1.3 敏感海域建模

图7所示,军用舰船与民用舰船的AIS数据具有明显不同形式分布的航行特征点。这里,我们将军用舰船航行特征点集中分布的海域称为敏感海域。同样可知,1.2节建模得到的海域多为非敏感海域。为提升类型判别的准确性,我们需要对军用舰船的航行特征点进行分析。
图7 不同军民属性舰船的分布情况

Fig.7 Distribution of ships with different military and civilian attributes

我们首先利用DBSCAN算法对航行特征点进行初步聚类,文中DBSCAN的参数取值为
$\varepsilon=1, M_{\varepsilon}=4$
经DBSCAN聚类后,航行特征点将被分为若干类别。我们将具有少于Mε个数据点的类称为孤立类,对应于DBSCAN结果中标签为-1的类别;将具有不少于Mε个数据点的类称为非孤立类,对应于DBSCAN结果中标签不为-1的类别。
之后,对每个非孤立类根据高斯混合模型(Gaussian mixture model,GMM[10])进行建模,即将每个非孤立类建模为
$P_{j}\left(x \mid \vartheta_{j}\right)=\sum_{k=1}^{K} \alpha_{k} \phi\left(x \mid \theta_{k}\right)$
式中,Pj(x|ϑj)为该高斯混合模型的概率分布,ϑj={[αk,θk],k=1,…,K}为模型参数;K为混合模型中子高斯模型的数量;αk≥0,Σαk=1为航行特征点隶属第k个子高斯模型的概率;ϕ(x|θk)为第k个子模型的高斯分布密度函数,形式如下:
$\phi\left(x \mid \theta_{k}\right)=\frac{1}{(2 \pi)^{D / 2}\left|\Sigma_{k}\right|^{1 / 2}} \exp \left(-\frac{\left(x-\mu_{k}\right)^{T} \sum_{k}^{-1}\left(x-\mu_{k}\right)}{2}\right)$
其中,θk=[μk,Σk]为子高斯模型参数;D为高斯模型的维度;μk为高斯模型的期望;Σk为高斯模型的协方差矩阵。
GMM模型是一个由K个子高斯模型组成的混合分布,表示观测数据在总体中的概率分布。GMM模型的参数可以通过Expectation-Maximum(EM)算法进行迭代求解[11]
模型中子高斯模型的数量K通过优化Akaike information criterion(AIC)信息准则[12]得到
$A I C=2 k_{m}-2 \ln \left(L_{m}\right)$
式中,km为模型的参数数量;Lm为似然函数。
至此,完成了对非孤立类敏感海域分布的建模。

1.4 孤立类处理方法

对于孤立类中的航行特征点,存在以下两种可能情况:
(1) 该孤立类中的航行特征点为原始航迹中的空间冗余点。
(2) 该孤立类中的航行特征点为原始航迹中的曲线特征点。
上述情况可以根据孤立类中航行特征点的平均速度进行判断,低速或静止的航行特征点为原始航迹中的空间冗余点;而高速的航行特征点为原始航迹中的曲线特征点。下面分别进行讨论:
对于情况1,此时该航行特征点对应于舰船的停泊点或驻点。故同样需要将航行特征点按敏感海域进行建模,并使用二维高斯分布ϕ(x|ηk)进行描述,模型参数ηk=[εk,σk]选择准则为:εk为孤立类中心坐标,σk为对角的协方差矩阵,其取值为进行轨迹压缩前该类附近AIS点的协方差。
对于情况2,此时该航行特征点对应于舰船航行曲线的近似转向点。此时,需要对该点的航行特征同构建的航路特征进行相似性计算,统计该点邻域内曲线的曲率和平均速度,记为辅助特征Fk

1.5 舰船属性识别

经过以上过程,我们实现了民用舰船航行特征和军用舰船特征点分布敏感海域的建模。
之后,可以利用获得的建模结果实现对给定舰船军民属性的判断,具体方法如下:
令舰船特征点处于敏感海域的概率PA
$P_{A}=\sum \phi\left(x \mid \theta_{k}\right)+\sum \phi\left(x \mid \eta_{k}\right)$
并记训练集中军用舰船航行特征点PA的集合为 P A | M;民用舰船航行特征点PA的集合为 P A | C;可按支撑向量机[13](Support vector machine,SVM)的方法求解最优的军民属性分界面判断函数:
$\begin{array}{ll}\min _{w, b, \xi_{i}} & \frac{1}{2}\|w\| 2^{2}+C \sum_{i=1}^{L} \xi_{i} \\\text { s.t. } & y_{i}\left[w f\left(p_{i}\right)+b\right] \geqslant 1-\xi_{i} \\& \xi_{i} \geqslant 0\end{array}$
其中,PA为舰船第i个航行特征点的PA,wf(pi)+b为最优的分界面判断函数;f(pi)为核函数,本文中选择为线性核;CR+为罚因子;ξi为允许样本的错误分类区域。
对舰船每个航行特征点的军民类别判断函数如下:
$\begin{array}{l}\text { if } \quad w f\left(p_{i}\right)+b \geqslant 0, y_{i}=1 \\\text { if } \quad w f\left(p_{i}\right)+b<0 y_{i}=-1\end{array}$
式中,1类代表军用舰船;-1类代表民用舰船。
对给定舰船军民属性的识别流程如图8所示,具体描述如下:
图8 舰船军民属性的识别流程

Fig.8 The identification process of ship's military and civilian attributes

(1)对舰船的AIS数据进行预处理和DP压缩,得到该舰船的航行特征点;
(2)计算该舰船所有航行特征点处于敏感海域的概率PA;
(3)根据军民类别判断函数判断每个舰船航行特征点的可能军民类别;
(4)根据投票法得到该舰船的军民属性,若投票法结果为军用舰船,退出识别算法;
(5)若投票法结果为民用舰船,则计算舰船航迹与海域航路间最小距离D1,以及舰船辅助特征Fk与训练集中军用舰船Fk的最小距离D2D1的计算过程如下:
$\begin{aligned}D_{1}= & \sum_{k} \alpha_{1} y_{k} \frac{\left|L_{1, k}-L_{2, k}\right|}{L_{1, k}+L_{2, k}}+\sum_{i} \alpha_{2} y_{i} \frac{\left|L_{1, i}-L_{2, i}\right|}{\left|L_{1, i}\right|+\left|L_{2, i}\right|}+ \\& \sum_{j} \alpha_{3} y_{j}+\frac{\max \left(L\left(\boldsymbol{F}_{1}\right), L\left(\boldsymbol{F}_{2}\right)\right)}{L\left(\boldsymbol{F}_{1}^{*}\right)}\end{aligned}$
式中,ykyiyj表示局部匹配不同条件的符号函数,当 F 1 *(k)= F 2 *(k)≠0时,yk=1;当ηk=[εk,σk]时,yi=1;当 F 1 *(k)≠ F 2 *(k)时,yj=1;此外,yk,yi,yj=0;α1,α2,α3为权值因子,L(F1),L(F2),L( F 1 *)分别表示F1F2 F 1 *的长度。
上述过程使用Smith-Waterman算法在获得的AIS轨迹的模式特征向量和之间寻找最合适的局部匹配,评分标准s定义为
$s\left(a_{i}, b_{i}\right)=\left\{\begin{array}{l}+1, \quad a_{i}=b_{j} \\-1, a_{i} \neq b_{j} \text { and } a_{i} b_{j}=0 \\-2, a_{i} \neq b_{j} \text { and } a_{i} b_{j} \neq 0\end{array}\right.$
其中,F1为海域的模式特征向量;F2为海域的数量特征向量;aibj代表F1( l 1)与F1( l 2)中的第i个元素和第j个元素,我们将 l 1 l 2最合适的局部匹配记为 F 1 * F 2 *
D1越小,则该航迹与民用舰船航迹越相似,D2越小,则该航迹与军用舰船航迹越相似。
综合最小距离Df定义为D2D1的加权结果:
$D_{f}=\varepsilon_{2} D_{2}-\varepsilon_{1} D_{1}$
式中,ε1,ε2为对民用匹配和军用匹配的置信因子。
若获得的综合最小距离小于给定阈值,则将该舰船标记为军用舰船。

2 实际AIS数据验证结果

验证中的AIS数据集来源于第二届“金海豚杯”算法竞赛数据集[14]。该数据集由全球开源AIS数据整理制备得到。其中,民用类别数据共1 915条,军用类别数据共351条。数据的分布情况如图1所示。
算法运行环境为Matlab 2021b,训练集与测试集的数据划分比为8∶2。研究中的对比算法为基于航行特征的舰船异常行为检测算法[15]和基于LSTM长短期神经网络的检测算法[5],训练集和测试集中算法对军民属性的识别结果分别如表1表2中数据所示。
表1 训练集中不同算法对舰船军民属性的识别情况

Tab.1 Recognition of military and civilian attributes of ships by different algorithms in training set

算法 民用识别
准确率p1
军用识别
准确率p2
综合识别
准确率pa
基于航行特征[15] 85.12% 42.75% 59.70%
基于LSTM[5] 86.34% 56.34% 68.34%
所提方法 90.27% 85.05% 87.14%
表2 测试集中不同算法对舰船军民属性的识别情况

Tab.2 Recognition of military and civilian attributes of ships by different algorithms in test set

算法 民用识别
准确率p1
军用识别
准确率p2
综合识别
准确率pa
基于航行特征[15] 80.98% 5.24% 35.54%
基于LSTM[5] 82.22% 12.11% 40.15%
所提方法 88.80% 74.29% 80.09%
表中的民用识别准确率p1、军用识别准确率p2和综合识别准确率pa分别定义如下:
$p_{1}=\frac{T P_{C i}}{P_{C i}}, p_{2}=\frac{T P_{M i}}{P_{M i}}, p_{a}=\lambda_{1} p_{1}+\lambda_{2} p_{2}$
式中,TPCi为检测算法判断为民用舰船的样本;TPMi为检测算法判断为军用舰船的样本;PCi为实际民用舰船的样本;PMi为实际军用舰船的样本;λ1,λ2为对民用检测和军用检测的关注程度,文中取λ1=0.4,λ2=0.6。
由表中数据可知,由于数据集样本量有限且类别不均、军用舰船的AIS数据分布较为稀疏等原因,传统的基于航行特征的舰船异常行为检测算法和基于LSTM的时序检测算法均难以实现对军用舰船的有效识别。在训练集上的军用识别率分别为42.75%和56.34%,综合识别率分别为59.70%和68.34%,对军用舰船的鉴别能力较差;所提方法在训练集上的军用识别率和综合识别率分别为85.05%和87.14%,对军用舰船的鉴别能力提升了15%以上。
在测试集上,传统的基于航行特征的舰船异常行为检测算法和基于LSTM的时序检测算法产生了显著的性能衰退,对军用舰船的检测率分别约5%与12%,几乎无法对军用舰船进行正确鉴别。所提方法在测试集上仍具有超过74%的军用舰船识别正确率和80%的综合识别准确率,该结果说明本文方法具备较好的应用效果。

3 结束语

本文针对舰船的军民类型识别问题,提出了一种基于AIS数据的建模分析方法。该方法对AIS数据进行高效航路聚类分析,建立航迹关键点分布的敏感海域模型,以计算舰船的军民属性概率,并构建类别分类器实现对舰船军民属性的判断。实际AIS数据集上的验证结果表明,所提方法可以利用廉价、全域覆盖、高频率的AIS信息识别舰船的军民类型,可以对海域中存在的威胁行为进行提前发现和预警,为后续的应对处置提供支撑和辅助决策,更好保障国家海洋安全,具有很好的应用价值。
[1]
YAN R, WANG S A, CAO J N, et al. Shipping domain knowledge informed prediction and optimization in port state control[J]. Transportation Research Part B: Methodological, 2021(149): 52-78.

[2]
MOU F L, FAN Z D, LI X H, et al. A method for clustering and analyzing vessel sailing routes efficiently from AIS data using traffic density Images[J]. J. Mar. Sci. Eng., 2024, 12(1):75.

[3]
YANG D, WU L, WANG S, et al. How big data enriches maritime research—a critical review of automatic identification system (AIS) data applications[J]. Transport Reviews, 2019(39):755-773.

[4]
ANNEKEN M, FISCHER Y, BEYERER J. Evaluation and comparison of anomaly detection algorithms in annotated datasets from the maritime domain[C]// Sai Intelligent Systems Conference. IEEE, 2015.

[5]
杨帆, 何正伟, 何帆. 基于LSTM神经网络的船舶异常行为检测方法[J]. 武汉理工大学学报(交通科学与工程版), 2019, 43(5):886-892.

YANG F, HE Z W, HE F. Detection method of abnormal ship behaviour based on LSTM neural network[J]. Journal of Wuhan University of Technology (Transportation Science & Engineering), 2019, 43(5):886-892.

[6]
RONG H, TEIXEIRA A P, GUEDES SOARES C. Data mining approach to shipping route characterization and anomaly detection based on AIS data[J]. Ocean Engineering, 2020(198): 106936.

[7]
FLETCHER S J. Numerical Modeling on the Sphere[J]. Data Assimilation for the Geosciences, 2017:483-554.

[8]
ZHAO L B, SHI G Y. A trajectory clustering method based on Douglas-Peucker compression and density for marine traffic pattern recognition[J]. Ocean Engineering, 2019(172): 456-467.

[9]
ESTER M, KRIEGEL H P, SANDER J, et al. A density-based algorithm for discovering clusters in large spatial databases with noise[J]. Proceedings of the second International Conference on Knowledge Discovery and Data Mining, 1996, 96(34):226-231.

[10]
HUANG Y H, ENGLEHART K B, HUDGINS B, et al. A Gaussian mixture model based classification scheme for myoelectric control of powered upper limb prostheses[J]. IEEE Transactions on Bio-Medical Engineering, 2005, 52(11): 1 801-1 811.

[11]
MOON T K. The expectation-maximization algorithm. IEEE signal process mag[J]. IEEE Signal Processing Magazine, 1996, 13(6):47-60.

[12]
POSADA D, BUCKLEY T R. Model selection and model averaging in phylogenetics: advantages of akaike information criterion and Bayesian approaches over likelihood ratio tests[J]. Systematic Biology, 2004, 53(5): 793-808.

DOI PMID

[13]
SUYKENS J A K, VANDEWALLE J. Least squares support vector machine classifiers[J]. Neural Processing Letters, 1999, 9(3): 293-300.

[14]
海军第二届“金海豚”杯算法挑战赛海情板块公告(含训练数据集、测试集)[EB/OL]. [2023-11-09].https://radars.ac.cn/web/data/getData?dataType=DatasetintheCompetition.

Announcement of the second "Gold Dolphin" cup algorithm challenge competition—oceanographic conditions section (including training dataset and test set). [EB/OL]. [2023-11-09]. https://radars.ac.cn/web/data/getData?dataType=DatasetintheCompetition.

[15]
段浩然. 基于AIS数据的渔船异常行为检测[D]. 大连海洋大学, 2023.

DUAN H R. Abnormal behavior detection of fishing boats based on AIS data[D]. Dalian Ocean University, 2023.

Outlines

/