中国科技核心期刊      中国指挥与控制学会会刊     军事装备类重点期刊
Multi-source Information Fusion

A trusted decision fusion ship recognition method based on improved evidence theory

  • XU Zhiyang 1 ,
  • LIU Jun 1 ,
  • CHEN Shuai 1 ,
  • LI Shuangshuang 1 ,
  • ZHOU Jihao 1 ,
  • HAN Li 2 ,
  • ZHANG Jie 2 ,
  • XUE Anke 1 ,
  • PENG Dongliang 1
Expand
  • 1 Hangzhou Dianzi University Communication Information Transmission and Fusion Technology Laboratory of the Defence of the Key Subjects, Hangzhou 310018
  • 2 Unit No.91039 of PLA, Beijing 102401, China

Received date: 2024-10-10

  Revised date: 2024-12-30

  Online published: 2025-07-28

Abstract

Aiming at the requirement of robust ship target recognition, multi-source information fusion recognition is an effective solution. This paper proposes a trusted decision level fusion ship target recognition method based on improved Dempster-Shafer theory. In this method, the problem of determining the initial confidence function is addressed by using HRRP and SAR recognition results, information entropy, and trust discount to comprehensively determine the initial confidence function. A quantitative evaluation method for uncertainty in decision level fusion results based on arithmetic mean density fusion is proposed. The experimental verification results show that through the decision level fusion of HRRP and SAR data, this method achieves a ship target recognition accuracy of 93.12%, which is superior to existing methods. It has achieved quantitative evaluation of recognition results, which objectively meets the needs of practical applications.

Cite this article

XU Zhiyang , LIU Jun , CHEN Shuai , LI Shuangshuang , ZHOU Jihao , HAN Li , ZHANG Jie , XUE Anke , PENG Dongliang . A trusted decision fusion ship recognition method based on improved evidence theory[J]. Command Control and Simulation, 2025 , 47(4) : 56 -64 . DOI: 10.3969/j.issn.1673-3819.2025.04.009

随着全球贸易和海洋运输的不断增加,舰船在世界各个海域的数量和活动水平持续增长和提高。这一趋势对海上安全、自然资源保护、海上犯罪打击以及潜在军事威胁防范提出了更高要求。因此,海上舰船目标识别技术,包括分类识别和重识别等,变得至关重要[1]。这些技术的发展对于维护国际海域的安全与秩序具有重要意义。
为了提高舰船识别的准确性和效率,多源传感器的数据融合技术进入了人们的视野。数据融合,也称为信息融合,通过整合来自不同传感器的数据,为模型决策提供更全面的信息,从而提高最终识别结果的准确率[2]。在单一传感器性能逐渐不能满足需求的当下,多传感器融合识别的优势愈发明显,它不仅提高了数据的准确性和实际应用价值[3],还在信息呈现和表达上展现出更强的鲁棒性[4]
尽管多源传感器数据融合技术展现出巨大潜力,但在实际应用中仍面临诸多挑战,需要找到对应的解决方法。证据理论(Dempster-Shafer theory,D-S),作为一种处理不确定性信息的有效方法[5],被广泛应用于决策支持、医学诊断、自动化控制等领域[6]。然而,D-S理论在信息融合过程中仍存在一些问题,如初始信度函数的分配、证据冲突、维度爆炸以及结果不确定性的定量分析等[7],这些问题尚未得到有效解决,限制了D-S理论在各个领域的应用效果。
近几年,AA融合作为一种新兴的融合方法被提出,主要用于解决目标跟踪问题,其核心为保守融合思想[8],在此基础上作者提出了几种方法用于确定AA融合时的权重:协方差一致(covariance consistency)、最小化均方误差(mean square error, MSE)、最大最小优化(max-min optimization)等。AA融合不仅适用于目标跟踪,也为其他信息融合问题提供了新的解决思路。因此本文也选择它来解决融合过程中的不确定性量化问题,方便后续开展可信度的研究。
在舰船识别领域,模型的可信度对于实现可靠、安全和有效的系统至关重要。一个可信的模型应当在其预测和决策过程中展现出一致性、稳定性和可预测性。杨小军等人[9]和Wang等人[10]的研究分别对仿真模型可信度的概念和评估方法,以及评估面临的挑战进行了深入分析。Chuan Guo等人[11]的研究进一步揭示了即使是最先进的模型也存在预测置信度与实际准确率不匹配的问题,这强调了结合识别结果的可信度研究的必要性。如果一个系统能在给出识别结果后,根据计算过程对这个结果做一个评估,告诉人们这个结果的可信度有多高,在实际应用中人们就能以此判断是否应该采信这个结果,这将有利于做出更加合理的决策。
鉴于此,本文提出了一种基于改进证据理论的可信决策融合舰船识别方法。该方法从海上舰船目标多源融合识别的任务需求出发,结合深度学习以及改进的D-S数据融合方法,进行融合分类识别。构建基于各个传感器预测概率分布的初始置信函数的做法,比原有的专家给定法更具有客观性,确保了后续D-S融合的准确性。此外,本文在原有融合结果的基础上引入了可信融合的思想与方法,为最终融合结果的不确定性提供了定量化的评价。这种方法不仅提升了分类识别的准确率,使之优于只有单输入的传统分类识别模型,还对输出结果的不确定性进行了定量化分析,为后续评估结果的可靠性提供了数据支撑。

1 基于HRRP与SAR数据的可信决策融合方法

1.1 总体融合框架

本文设计的总体融合框架如图1所示。该图中输入包括SAR数据与HRRP数据两个分支,二者分别通过CNN与MLP网络得到目标预测分类的概率分布。改进的D-S融合方法分为以下几步:(1)将两分支的概率分布与信息熵等要素、方法结合,构建出初始置信分配函数。(2)将初始置信函数输入D-S融合公式中计算,得到最终识别结果。(3)量化融合前后数据的不确定性。(4)使用AA融合的方法对这些不确定性做融合,量化出最终结果的不确定性。最终的输出包含融合后的识别结果与其不确定性的定量化评价,即识别结果与其可信度[12]
图1 舰船目标的融合识别方法总体框架图

Fig.1 Overall framework diagram of fusion recognition method for ship targets

1.2 SAR识别模块设计

本文选择以AlexNet模型为基础[13]搭建SAR识别模块。针对SAR训练过程中遇到的过拟合问题,引入正则化方法,减小过拟合,提升模型的泛化性,提高了该模型在本文数据集上的识别准确率,达到后续融合需求。搭建的CNN模型如图2所示。
图2 SAR舰船图像识别模型

Fig.2 SAR ship image recognition model

该模型以SAR图像作为输入,经过卷积层提取特征,池化层缩小特征图维度,展平层将特征图转化为一维特征向量,最后经过几层全连接层,根据特征计算出概率密度分布,即当所需要分类的数据集中目标类别数为N时,最后一层全连接层的隐藏单元数即为N,该模型的输出为长度为N的向量,即为SAR图像预测分类的概率密度分布,用于后续证据理论融合。
在该网络的最后加入softmax层,模型的输出变为SAR图像的预测分类结果,此时模型用于事先在本文搭建的训练用SAR数据集上训练测试,根据训练测试的结果计算出该模型的平均识别准确率,并通过计算识别结果的可能性与必要性,进一步计算出该模型在融合前的分类可信度,用于后续最终识别结果可信度的融合计算。模型参数设定见表1
表1 CNN网络模型参数设定

Tab.1 Parameter setting of CNN network model

层名称 卷积核
(数量,尺寸)
步长 隐藏单元数 策略 激活函数
Conv2D_1 96, (11,11) 4 / Padding=same Relu
MaxPool_1 (2,2) 4 / / /
Conv2D_2 256, (5,5) 1 / Padding=same Relu
MaxPool_2 (3,3) 1 / / /
Conv2D_3 384, (3,3) 1 / Padding=same Relu
Conv2D_4 384, (3,3) 1 / Padding=same Relu
Conv2D_5 256, (3,3) 1 / Padding=same Relu
MaxPool_3 (3,3) 1 / / /
Flatten / / / / /
Dense_1 / / 1 024 / Relu
Dropout_1 / / / Rate=0.5 /
Dense_2 / / 1 024 / Relu
Dropout_2 / / / Rate=0.5 /
Dense_3 / / 18 / Softmax
最终该模型在本文搭建的SAR训练用数据集中的平均识别准确率为86%。后续的基于改进D-S融合方法当中,将依据没有softmax层的CNN网络得到的概率密度分布,来构建源自SAR数据分支的初始置信函数。

1.3 HRRP识别模块设计

本文选择以MLP模型作为HRRP数据的分类识别器。传统HRRP分类识别模型选择手动提取特征作为输入,使得分类结果带有较强主观性,而为增强客观性,本文选择直接将原数据作为输入和放入模型中进行训练,提高准确率的同时使结果更具客观性。搭建的模型如图3所示,每一层都是全连接层,输入层接收一维距离像数据,经过两层隐藏层计算后,输出层输出长度为N的概率密度分布,用于后续证据理论融合。
图3 HRRP舰船数据识别模型

Fig.3 HRRP ship data recognition model

同SAR的CNN模型一样,输出层的概率密度分布再经过softmax函数可选出最大概率代表的类别,模型的输出变为HRRP数据的预测分类结果,此时模型用于事先在本文搭建的训练用HRRP数据集上训练测试,根据训练测试的结果计算出该模型的平均识别准确率,并通过计算识别结果的可能性与必要性,进一步计算出该模型在融合前的分类可信度,用于后续最终识别结果可信度的融合计算。模型参数设定见表2
表2 MLP相关参数设定

Tab.2 Parameter setting of MLP network model

名称
激活函数 Relu
优化器 adam
输入层神经元个数 2 000
第一层隐藏层神经元个数 3 000
第二层隐藏层神经元个数 3 000
输出层神经元个数 18
最大迭代次数 1 500
正则化项参数 1E-4
最终该模型在本文搭建的HRRP训练用数据集中的平均分类准确率为66%。后续的基于改进D-S融合方法当中,将依据MLP模块得到的概率密度分布来构建源自HRRP数据分支的初始置信函数。

1.4 基于改进D-S的可信融合方法

改进D-S的融合方法具体步骤如图4所示。
图4 改进D-S的具体融合步骤

Fig.4 Specific fusion steps for improving D-S

第一步是确定初始置信函数:包括熵的计算,以此确定信任折扣,再通过模糊度量方法处理概率分布与信任折扣,得到各分支的初始置信函数。
第二步是证据理论融合:使用D-S公式计算各分支的初始置信函数,输出融合后的置信函数,该函数不仅需要提取出识别结果作为输出,还需要作为计算可信度的输入。
第三步是各可信度计算:包括CNN与MLP模型的可信度计算,以及D-S融合过程中与融合后可信度的计算。
第四步是AA融合计算:对得到的四类可信度结果做AA融合,输出融合后识别结果的可信度值,最终与识别结果一同输出。

1.4.1 初始置信函数分配改进

传统的初始置信函数大部分由专家直接给定,通过个人经验给出目标属于哪一类别的概率大小,具有较强的主观性。对此,本文选择用深度学习模型代替人工,将模型给出目标预测类别的概率分布函数与信息熵等要素相结合,从而得到更具客观性的初始置信函数。
经过训练的深度学习模型能够给出目标被预测为不同类别的概率值,即图24中的概率分布。本文使用的信息熵能够量化信息的不确定性,可以用来度量概率分布的不确定性大小,熵值越大,不确定性越大,后续融合时对其分配的权重,也即信任折扣,就要更小,反之则更大。
在置信函数中,一般包含一项全集,表示无法确定目标类别的概率,Wang[13]提出可用模糊度量的方法来确定置信函数的全集,使输入的概率分布变为置信函数,从而符合证据理论的Dempster合成公式的输入要求。
为提高整体决策的准确率,本文提出了一种置信函数再分配的方法。在数学意义中,一串概率函数与其互补函数分别表示对某一事件的支持与不支持程度,对二者给予不同的权重后相加所得到的结果可视为对该事件的一种综合考量。将此思路应用于置信函数的再分配过程中,可使证据考虑得更加全面,提升初始置信函数的有效性,最终融合后的结果对该事件就能有一个更全面的概括与评估。
上述具体操作步骤及计算公式如下:
(1)计算熵:根据深度学习模型训练得到的概率密度分布函数,代入公式1中,计算得到香农信息熵。式中X代表概率密度分布函数,x代表其中的类别,m(x)代表该类别所对应的概率值,得到的熵H X的值越大,代表此样本的概率分布不确定性程度越高,后续给予的信任则越少,也即置信函数再分配时该部分的权重越少。
$H(\boldsymbol{X})=-\sum_{x \in X} m(x) \cdot \log m(x)$
(2)确定信任折扣系数:根据计算得到的熵值做分配,分配公式见式2和3,式中0.86与0.66的取值出自CNN与MLP两个模型的平均识别准确率,得到的T=[T(B),T(C)]视为对新得到的置信函数的信任折扣系数。其中Β=[b1,b2,…,bN]和C=[c1,c2,…,cN]分别代表来自HRRP与SAR数据分支的初始置信函数。
$T(\boldsymbol{B})=\left\{\begin{array}{ll}0, & 3 \leqslant H(\boldsymbol{B}) \\0.86, & 1 \leqslant H(\boldsymbol{B})<3 \\1, & H(\boldsymbol{B})<1\end{array}\right.$
$T(\boldsymbol{C})=\left\{\begin{array}{ll}0, & 3 \leqslant H(\boldsymbol{C}) \\0.66, & 1 \leqslant H(\boldsymbol{C})<3 \\1, & H(\boldsymbol{C})<1\end{array}\right.$
(3)添加全集:根据模糊度量方法在置信函数中添加第N+1项元素,也即全集。但由于Wang的方法适用存在五组或更多置信函数的情况,当组数过小时全集所占比重会过大,使得融合后的识别结果为空,针对该问题,本文选择为全集再赋予一个较低的权重,具体公式见式4。以MLP模型输出的B为例,计算出bN+1后可得到B'=[b1,b2,…,bN,bN+1],归一化后B'内部和为1。
$ b_{N+1}=0.4 \cdot H(\boldsymbol{B}) /(H(\boldsymbol{B})+H(\boldsymbol{C}))$
(4)置信函数再分配:以置信函数B'为例,计算公式见式5。B'T(B)的乘积确保了在融合过程中,融合前该分支的置信函数的权重与其信任折扣成正比。置信函数的补数(1-B')、信任折扣的补数(1-T(B))和系数0.1三者相乘部分,反映的是该分支识别结果的不支持、不确定程度,适度地保留这些信息,重构出的初始置信函数包含的信息就会更加全面,强化了低信任折扣置信函数在决策中的作用,避免了后续融合过程中受单一分支的初始置信函数影响过大的问题。实现更加全面和稳健的证据融合。bpa(C)的计算公式类似。
$ {bpa}(\boldsymbol{B})=\boldsymbol{B}^{\prime} \cdot T\left(\boldsymbol{B}^{\prime}\right)+0.1 \cdot\left(1-\boldsymbol{B}^{\prime}\right) \cdot(1-T(\boldsymbol{B}))$
(5)归一化处理:通过归一化使再分配好的初始信度函数bpa(B)内部元素的和为1,符合后续融合的输入要求。

1.4.2 证据理论融合公式

证据理论的Dempster合成公式具体如公式6所示。K为证据冲突指标,公式见式7。
$ m\left(a_{t}\right)=\left\{\begin{array}{ll}\frac{\sum_{b_{i} \cap c_{j}=a_{t}} m\left(b_{i}\right) m\left(c_{j}\right)}{1-K} & a_{t} \neq \Phi \\0 & a_{t}=\Phi\end{array}\right.$
$ K=\sum_{b_{i} \cap c_{j}=\Phi} m\left(b_{i}\right) m\left(c_{j}\right)$
其中,Β=[b1,b2,…,bN]和C=[c1,c2,…,cN]分别代表来自HRRP与SAR数据分支的初始置信函数。bicj(i,j=1,2,3,…,N)则是置信函数的焦元,N为识别框架的大小。m(bi)和m(cj)表示焦元对应的置信度值,A为融合后的置信函数,m(A)=[m(a1),m(a2),…,m(aN)]为融合后的新置信度值分布,其中t=1,2,3,…,N。融合后的m A经softmax函数取最大值代表的类别,输出最终识别结果。

1.4.3 不同模块的可信度计算

可信度的计算分为四个模块:CNN模型的类别可信度、MLP模型的类别可信度、DS融合的可信度、融合后函数分布的可信度。其中,CNN模型与MLP模型的类别可信度需要提前计算并存放在该模块中,依据各分支的初始置信函数中最大置信值所代表的类别来给定相对应的类别可信度。
(1)CNN模型的类别可信度计算。以CNN模型使用训练用数据集测试输出的一组识别结果为例,包含18类目标,CNN模型的可信度根据其测试识别结果来计算,计算公式见式8—10:
$ P_{p o s}(n)=\frac{S T_{n}}{S_{n}}$
$ P_{n e c}(n)=1-\frac{S F_{n}}{S-S_{n}}$
$ S A(n)=\left(P_{p o s}(n)+P_{n e c}(n)\right) / 2$
公式来源于文献[14]中可信度的计算方法:N为识别框架,nN中任一数值,代表识别框架下的某一类别,计算第n类样本被正确分类的可能性Ppos n与必要性Pnec n,再计算该类别的分类可信度SA nS为待测样本总数,Sn表示第n类样本的个数,STn表示第n类样本被正确划分到n类的个数,SFn表示其他类样本被错误划分为n类的个数。多次试验并求出平均分类可信度 S A n ¯,代表CNN模型预测结果为n类时,该结果的可信度。则针对任一样本s,其对应的CNN模型的类别可信度为 S A s n ¯,其中s代表S中任意一个样本。
(2)MLP模型类别可信度的计算。同CNN类似,得到其平均分类可信度 H A ( n ) ¯以及任一样本s的MLP模型的类别可信度为 H A s n ¯
(3)DS融合的可信度UAs具体计算如下:
$ U A_{s}=1-m_{s}\left(a_{N+1}\right)$
(4)融合后置信函数分布的可信度EAs的计算见下:
$ E A_{s}=\frac{-\sum_{a \in A} m(a) \cdot \log m(a)}{-\sum_{i=1}^{N} \frac{1}{N} \cdot \log \frac{1}{N}}$
至此,得到CNN模型的类别可信度 S A n ¯、MLP模型的类别可信度 H A ( n ) ¯、DS融合的可信度UAs和融合后函数分布的可信度EAs这四类可信度。

1.4.4 AA融合计算可信度

使用AA(arithmetic average,算数平均)方法对四个可信度值做融合。相比文献[8]中使用协方差作为范围估计得到融合权重,KL散度这一信息论方法物理意义上具备的衡量概率分布之间差异的特性[15]更适合用于计算不同可信度之间的融合权重。结合最大最小优化(max-min optimization)原则选择融合权重,最终使用加权融合四类可信度计算出最终结果的可信度值。
但是,KL散度计算针对的是概率分布,不是可信度这类单一数值。因此本文提出用计算补数的方法将单一可信度值转变为可计算KL散度的概率分布,运用对应概率分布计算出的KL散度来衡量可信度之间的相互影响的大小。因为概率分布中包含的信息全部来自对应的可信度值,所以基于概率分布计算出的融合权重同样可适用于可信度之间的加权融合计算。
融合权重的计算流程如下:
(1)初始化融合分布:假设初始融合分布FsAA=[0.5,0.5],初始权重w1,w2,w3,w4均为0.25。
(2)定义单个可信度的分布:对于样本s的每个可信度,先计算其分布Fsq,其中q=1,2,3,4依次代表先前计算出的四类可信度。以 S A s ( n ) ¯为例,通过计算其补数,从而得到一个基于 S A s ( n ) ¯的概率分布向量Fs1= S A s ( n ) ¯ , 1 - S A s ( n ) ¯,符合KL散度计算的格式要求,其余三个可信度的分布Fsq均按此求得。
(3)定义优化问题:希望找到权重w1,w2,w3,w4(w1+w2+w3+w4=1),使得所有可信度的KL散度之和最小化。
(4)计算单分布Fsq相对于融合分布FsAA的KL散度,见下
$ D K L\left(\boldsymbol{F}_{s q} \| \boldsymbol{F}_{s \mathrm{AA}}\right)=\sum \boldsymbol{F}_{s q} \log \left(\frac{\boldsymbol{F}_{s q}}{\boldsymbol{F}_{s \mathrm{AA}}}\right)$
(5)求解优化问题:
$ \begin{array}{l}\max _{w_{1}, w_{2}, w_{3}, w_{4}} \min \left\{D K L\left(F_{s 1} \| F_{s \mathrm{AA}}\right), D K L\left(F_{s 2} \|\right.\right. \\\left.\left.F_{s \mathrm{AA}}\right), D K L\left(F_{s 3} \| F_{s \mathrm{AA}}\right), D K L\left(F_{s 4} \| F_{s \mathrm{AA}}\right)\right\}\end{array}$
其中,FsAA=w1Fs1+w2Fs2+w3Fs3+w4Fs4
选择数值优化方法为SLSQP算法。
(6)更新融合分布:有了当前最优权重后,使用这些权重来更新融合分布FsAA
(7)迭代优化:重复(4)~(6),直到权重w1,w2,w3,w4收敛到稳定值。
样本s识别结果的最终可信度值为FinAs,由样本s对应的四个可信度值 S A s n ¯, H A s n ¯,UAs,EAs加权计算得到,权重分配通过上述计算流程获得,FinAs的计算公式如下
$ F i n A_{s}=w_{1} \overline{S A_{s}(n)}+w_{2} \overline{H A_{s}(n)}+w_{3} U A_{s}+w_{4} E A_{s}$
最终实现在得到融合识别结果的同时还能得到该结果的可信度值。

2 实验结果与分析

2.1 试验环境

2.1.1 数据集说明

为了验证本文提出方法在多源分类任务上的有效性,采用仿真获得的SAR图像数据集以及HRRP数据集,SAR图片与HRRP数据一一对应,共有18类,每一类各有168个样本,共3 024个样本。每一个样本分为SAR图片和HRRP数据:SAR图像为一张512*512大小的jpg图像,图像中仅有一个舰船目标;HRRP数据为长度是2 000的数据向量,csv格式。以3∶1的比例划分训练集和测试集,确保每一类别的舰船都有至少100个样本用于训练。

2.1.2 实验环境

本文使用的基础实验环境:Windows11操作系统,CPU参数为12th Gen Intel(R) Core(TM)i7-12700H 2.70 GHz,16 GB内存,显卡信息为NVIDIA GeForce RTX 3060 Laptop GPU,在Python3.6中编程实现,使用Keras搭建CNN模型训练SAR图像,用Scikit-Learn搭建MLP模型训练HRRP数据。

2.1.3 评价指标

通常的分类评价指标为精确率(precision),召回率(recall)以及F1分数。其中由于每个类别样本数目一致,召回率在求平均后的计算结果等于准确率(accuracy)的计算结果[16],而所有的结果都需要求平均。因此,本文的评价指标为精确率、召回率(等于准确率)以及F1分数。具体公式见式(16)—(18),其中,TP表示正类被正确判定为正类的数量,FN表示正类被错误判定为负类的数量,FP表示负类被错误判定为正类的数量。
$ \ { precision }=\frac{T P}{T P+F P} $
$ \ { recall }=\frac{T P}{T P+F N}$
$ F 1-\ { score }=\frac{2 T P}{2 T P+F P+F N}$

2.2 初始置信函数确定方法的实验结果与讨论

由于传统的初始置信函数确定方法是由专家分析后人为给定,存在依赖人工、主观性较强的问题,而本文方法用深度学习加信任折扣等处理替代了专家分析,由此给定的初始置信函数相比人为分析会更加客观。二者比对可参考表3,相比专家给定,深度学习给出的置信函数不确定性更低,数值更加精确。
表3 初始置信函数确定

Tab.3 Determination of initial credible function

方法 置信值分布 识别
结果
A B C D E
专家给定 0.5 0.3 0.1 0 0.1 A
深度学习 0.99 2.1e-12 6.9e-07 6.6e-09 2.6e-09
第二个改进点在于该方法能在输出识别结果的同时,对结果的不确定性做了定量化的分析,输出了该结果的可信度值,见表4中的两个置信函数样例A1A2,虽然二者最终的识别结果均为第A类,但是因为A1对A类的置信值明显高于其他类别,而A2不同类别之间的置信值相差较小,可以推出,前者识别结果的可信度比后者的要高,本文的方法正是对这种不确定性做了量化处理,作为可信度值输出,见表4中本文方法给出的识别结果样例,证明了这一改进点在实际应用中存在的有效性。
表4 置信函数分布

Tab.4 Credible function distribution

置信函数 置信值分布 识别结果
A B C D E 传统方法 本文方法
A1 0.900 0.025 0.025 0.025 0.025 A A,可信度值90%
A2 0.254 0.249 0.249 0.249 0.249 A A,可信度值60%

2.3 改进输出可信度值结果的实验与分析

本文使用的AA融合方法,实现了四个可信度值对最终可信度的贡献大致持平,避免其中任何一个对最终结果有过大的影响。文献[14]中认为可信度的融合方法有两种:串联和并联,并给出了各自的计算方式。
表5为几种情况下不同可信度计算结果的对比。
表5 可信度计算方式对比

Tab.5 Comparison of reliability calculation methods

样例 CNN模型类
别可信度
MLP模型类
别可信度
DS融合
可信度
融合后置信
函数分布可信度
串联 并联
(max)
并联
(min)
AA融合
1 0.90 0.65 0.88 0.82 0.22 0.90 0.50 0.78
2 0.75 0.85 0.91 0.88 0.50 0.91 0.70 0.84
3 0.91 0.90 0.95 0.41 0.39 0.95 0.41 0.70
其中样例1与样例2均为一般情况,是大部分样本输入本文方法后会计算出的四个可信度。前者是HRRP分支的模型类别,其可信度较低,后者是SAR分支的模型类别,其可信度较低,两分支的识别结果一致。而样例3则属于极端情况,两分支的识别结果并不一致,导致融合后的置信函数分布可信度较低。
分析表中的四种方法的可信度计算结果可知:串联方法得到的可信度会远低于融合前的任一可信度值,在实际应用中有悖于常识,并不适用于本文的情况;两种并联方法在一些极端情况下输出的结果也与常识相悖,例如样例3中,当SAR分支识别为1类,可信度为0.91,HRRP分支识别为2类,可信度为0.90,D-S融合后1、2类的置信度分布会变为0.49、0.51,即识别为二类,导致融合后可信度仅为0.41,这种情况下并联方法取min比取max更为合理;反之,样例1与样例2二分支的识别结果都为1类,融合后也是1类,融合后可信度较高,若识别出的1类结果是正确的,此时并联方法取max比min更符合常识,但是若实际类别并不是1类而都是2类,二分支与融合后的识别结果均错误,此时仍旧取max方法,其可信度结果就会过高,有悖于常识,应当适当降低可信度;AA融合在几个样例中同时兼顾了各个可信度,从而取得一个相对合理的中间值,相比其他方法更加符合常识和合理。
实际应用中,分析给出的这些情况都会出现,前三种方法都只满足了一种情况,缺乏良好的泛用性。因此本文最终选择使用AA融合方法,该方法综合了所有可信度值,通过衡量散度的方法找到了一个权重平衡点,使给出的最终结果更加客观合理,避免了在极端情况下输出有违常识的可信度值,在量化不确定性的基础上兼具了良好的泛用性。

2.4 综合应用实验结果与讨论

通过以下几组实验的结果对比可以证明本文方法的优势。各个实验所使用的数据集相同,评价指标为精确率、召回率和F1分数,且通过多次实验验证模型的稳定性。
(1)融合前后实验对比:使用该方法后模型的融合识别结果与不使用该方法的两个单独模型的识别结果,对比结果如表6所示。
表6 融合前后各模型实验结果

Tab.6 Experimental results of various models before and after fusion

使用模型 输入数据 精确率 召回率 F1分数
改进CNN SAR图像 87.28% 86.51% 86.89%
MLP HRRP 68.48% 66.40% 67.42%
本文模型 SAR图像+HRRP 93.78% 93.12% 93.45%
通过表格可以得知,引入了改进证据理论融合方法的本文模型,在准确度、精确度以及F1分数上均比使用单个模型的效果要好,可见采用本文方法融合后的识别结果在精确率与召回率方面均优于单个输入数据时模型的识别结果。
(2)改进DS解决证据冲突的极端情况:为了证明本文方法能在证据冲突较大的极端情况下仍能给出正确预测结果,给出表7这一极端情况,其中证据体M1M2给定的信任折扣系数分别为0.9和0.7。在表8中展示了几种融合方法,与本文方法形成对比。
表7 极端情况试验

Tab.7 Extreme situation test

证据体 命题BPA 正确
结果
A B C D E
M1 0.7 0 0.1 0.1 0.1 A
M2 0 0.7 0.1 0.1 0.1
表8 不同融合方法对比

Tab.8 Comparison of different fusion methods

分类方法 融合后BPA Θ 融合
结果
A B C D E
DS方法 0 0 0.33 0.33 0.33 0 C、D、E
Yager方法 0 0 0.01 0.01 0.01 0.97 Θ
Sun方法 0.13 0.13 0.05 0.05 0.05 0.59 Θ
Deng方法 0.44 0.44 0.04 0.04 0.04 0 A、B
本文模型 0.33 0.24 0.11 0.11 0.11 0.10 A
从表中可知,本文模型与其他方法相比,在极端情况下依然能融合出正确的结果,虽然最终结果的概率值可能不如Deng方法,但作为弥补,本文方法对输出结果的不确定性做了定量化分析并输出,在实用性上更具有优势。
(3)本文方法与几种单信号源识别方法的对比如表9所示,所用识别方法包括经典的Alexnet、ResNet、VGG16、K-means等,所用数据集为SAR或者HRRP数据集,评价指标为精确率、召回率和F1分数。根据对比实验的结果可知,该方法在相同数据集上具有更好的识别效果。
表9 不同单源识别模型的对比实验结果

Tab.9 Comparative experimental results of different single source recognition models

分类模型 使用数据 精确率 召回率 F1分数
AlexNet SAR 72.70% 71.93% 72.31%
ResNet50 SAR 77.95% 77.07% 77.50%
VGG16 SAR 83.26% 82.10% 82.68%
K-means HRRP 33.72% 29.68% 31.57%
SVDD HRRP 48.28% 46.93% 47.59%
LSTM HRRP 60.63% 60.08% 60.35%
本文模型 HRRP+SAR 93.78% 93.12% 93.45%
(4)几种融合方法在相同数据集中的对比如表10所示:所用数据集为SAR与HRRP数据集,评价指标为精确率、召回率和F1分数。其中特征级融合方法参考文献[17]。根据对比实验的结果可知,该方法在数据融合识别结果上达到了最优,证明了该方法在解决初始置信函数和证据冲突问题上优于已有方法。因此本文提出的方法更适用于处理多源舰船目标决策级融合识别任务。
表10 不同融合模型的对比实验结果

Tab.10 Comparative experimental results of different fusion models

分类模型 精确率 召回率 F1分数
DS方法 92.80% 92.46% 92.63%
Yager方法 58.02% 55.16% 56.55%
Sun方法 65.24% 63.62% 64.41%
Deng方法 92.74% 92.20% 92.47%
特征级融合 88.49% 86.97% 87.72%
本文模型 93.78% 93.12% 93.45%

3 结束语

本文针对具有多信号源的海上不同种类舰船目标的分类识别任务,设计了一种基于改进证据理论的可信的多源融合分类模型。首先针对信号源种类选择合适的两种模型,文中选择的是CNN模型与HRRP模型,用于分别处理SAR图像与HRRP数据。将两个模型输出的识别结果输入改进D-S融合模型,利用熵与信任折扣结合识别结果构建出初始置信函数,而后进行D-S融合计算,量化融合过程中的不确定性,输出部分可信度值与最终识别结果,通过AA融合方法对先前得到的可信度值做融合,计算出最终识别结果的可信度。最终实现在输出识别结果的同时给定该结果的可信度值。
试验结果表明,改进后的D-S融合在多类别舰船目标融合识别任务中准确率能够达到93.12%,证明了该方法在利用多源信号数据分类任务上的有效性,同时相比于其他传统方法,该方法量化了最终识别结果的不确定性并输出,可为海洋监管部门提供有效的技术支持。
[1]
莫倩倩, 刘俊, 管坚, 等. 基于深度学习的舰船目标重识别技术[J]. 指挥控制与仿真, 2024, 46(4): 88-96.

DOI

MO Q Q, LIU J, GUAN J, et al. Vessel reidentification technology based on deep learning[J]. Command Control & Simulation, 2024, 46(4): 88-96.

[2]
余辉, 梁镇涛, 鄢宇晨. 多来源多模态数据融合与集成研究进展[J]. 情报理论与实践, 2020, 43(11): 169-178.

YU H, LIANG Z T, YAN Y C. Review on multi-source and multi-modal data fusion and integration[J]. Information Studies: Theory & Application, 2020, 43(11): 169-178.

[3]
HALL D L, MCMULLEN S A H. Mathematical Techniques in Multisensor Data Fusion[M]. The USA: Artech House Publishers, 2004.

[4]
LAHAT D, ADALI T, JUTTEN C. Multimodal data fusion: an overview of methods, challenges, and prospects[J]. Proceedings of the IEEE, 2015, 103(9): 1 449-1 477.

[5]
刘永安, 程哲, 徐保国. 信息融合的D-S证据理论综述[C]// 2007中国控制与决策学术年会论文集. 无锡, 2007: 651-653, 658.

[6]
XIE X L, TIAN Y Z, WEI G. Deduction of sudden rainstorm scenarios: integrating decision makers' emotions, dynamic Bayesian network and DS evidence theory[J]. Natural Hazards, 2023, 116(3): 2 935-2 955.

[7]
LI R F, CHEN Z Y, LI H, et al. A new distance-based total uncertainty measure in Dempster-Shafer evidence theory[J]. Applied Intelligence, 2022, 52(2): 1 209-1 237.

[8]
LI T C. Some statistic and information-theoretic results on arithmetic average density fusion[J]. arXiv e-prints (2021): arXiv-2110.

[9]
杨小军, 徐忠富, 张星, 等. 仿真模型可信度评估研究综述及难点分析[J]. 计算机科学, 2019, 46(B06): 23-29.

YANG X J, XU Z F, ZHANG X, et al. Overview and difficulties analysis on credibility assessment of simulation models[J]. Computer Science, 2019, 46(B06): 23-29.

[10]
WANG Y, LI J, H S, et al. A survey on VV&A of large-scale simulations[J]. International Journal of Crowd Science, 2019, 3(1): 63-86.

[11]
GUO C, Pleiss G, SUN Y, et al. On calibration of modern neural networks[C]// International conference on machine learning. PMLR, 2017: 1 321-1 330.

[12]
崔福彬, 张茜, 雷俞承志, 等. 基于深度学习的SAR图像目标识别算法[J]. 长春理工大学学报(自然科学版), 2019, 42(4): 33-36.

CUI F B, ZHANG Q, LEI Y C Z, et al. Target recognition algorithm for SAR image based on deep learning[J]. Journal of Changchun University of Science and Technology(Natural Science Edition), 2019, 42(4): 33-36.

[13]
WANG J W, HU Y, XIAO F Y, et al. A novel method to use fuzzy soft sets in decision making based on ambiguity measure and Dempster-Shafer theory of evidence: an application in medical diagnosis[J]. Artificial Intelligence in Medicine, 2016(69): 1-11.

[14]
李建勋, 王军, 韩山, 等. 系统效能评估方法与应用[M]. 北京: 国防工业出版社, 2022.

LI J X, WANG J, HAN S, et al. System effectiveness evaluation method and application[M]. Beijing: National Defense Industry Press, 2022.

[15]
Ganegedara, Thushan. Intuitive guide to understanding kl divergence[M]. Dosegljivo: https://towardsdatascience.com/light-on-math-machine learning-intuitive-guide-to-understanding-kl-divergence-2b382ca2b2a8.[Dostopano: 31. 12. 2018]51 (2018): 52.

[16]
姚世祎, 杨盛腾, 李裕梅. 基于混淆矩阵的机器学习分类评价指标研究及Python实践[J]. 数据挖掘, 2022, 12(4): 351-367.

YAO S Y, YANG S T, LI Y M. Research on machine learning classification evaluation indicators based on confusion matrix and Python practice[J]. Data Mining, 2022, 12(4): 351-367.

[17]
代维凯, 陆河权, 等. 融合SAR和HRRP特征的船只目标识别[C]. 第十一届中国信息融合大会, https://www.csif.org.cn/web/23/list.html,2023: 627-631.

DAI W K, LU H Q, et al. Ship target recognition by fusing SAR and HRRP features[C]. The 11th China Conference on Information Fusion, https://www.csif.org.cn/web/23/list.html, 2023: 627-631.

Outlines

/