中国科技核心期刊      中国指挥与控制学会会刊     军事装备类重点期刊
信息融合

基于轻量化深度网络的水下声呐目标识别方法

  • 郑雨帆 ,
  • 王银涛 ,
  • 孙琦
展开
  • 西北工业大学航海学院, 陕西 西安 710072
王银涛(1979—),男,博士,教授。

郑雨帆(2000—),男,硕士研究生,研究方向为水下机器人控制。

收稿日期: 2025-03-12

  修回日期: 2025-03-28

  网络出版日期: 2026-05-25

Underwater sonar target recognition method based on lightweight deep network

  • ZHENG Yufan ,
  • WANG Yintao ,
  • SUN Qi
Expand
  • School of Marine Science and Technology, Northwestern Polytechnical University, Xi’an 710072, China

Received date: 2025-03-12

  Revised date: 2025-03-28

  Online published: 2026-05-25

摘要

针对水下声呐目标识别中检测精度有限和处理速度缓慢的问题,探索了一种基于YOLOv5的轻量级深度学习框架。该框架结合了MobileNetV3和ShuffleNetV2模块来优化网络架构,同时采用了增强的数据增强策略来缓解声呐图像数据集的稀缺性,并减轻训练过程中的过拟合。实验结果表明,轻量级网络大大减少了模型冗余。与基线YOLOv5相比,MobileNetV3优化网络实现了模型大小减少9.7 MB,计算负载减少12.7GFLOPS,参数减少4.88 M。同样,ShuffleNetV2变体将模型大小减少了2.2 MB,计算成本减少了13.4GFLOPS,参数减少了1.03M。值得注意的是,轻量级模型不仅提高了推理效率,还提高了召回率,同时保持了有竞争力的检测准确性。这些进步凸显了该框架在平衡计算效率和性能方面的潜力,显著提高了水下声呐目标识别系统的实用性。

本文引用格式

郑雨帆 , 王银涛 , 孙琦 . 基于轻量化深度网络的水下声呐目标识别方法[J]. 指挥控制与仿真, 2026 , 48(3) : 83 -91 . DOI: 10.3969/j.issn.1673-3819.2026.03.010

Abstract

A lightweight deep learning framework, based on YOLOv5, was explored to address issues of limited detection accuracy and slow processing speed in underwater sonar target recognition. This framework combines MobileNetV3 and ShuffleNetV2 modules to optimize the network architecture, while adopting enhanced data augmentation strategies to alleviate the scarcity of sonar image datasets and reduce overfitting during training. Experimental results show that lightweight networks greatly reduce model redundancy. Compared to the baseline YOLOv5, MobileNetV3 optimized the network by reducing the model size by 9.7MB, computational load by 12.7GFLOPS, and parameters by 4.88M. Similarly, the ShuffleNetV2 variant reduced the model size by 2.2MB, computational cost by 13.4GFLOPS, and parameters by 1.03M. It is worth noting that lightweight models not only improve inference efficiency but also increase recall while maintaining competitive detection accuracy. These advancements highlight the potential of the framework in balancing computational efficiency and performance, significantly improving the practicality of underwater sonar target recognition systems.

水下环境的复杂性和噪声的多样性使得声呐图像目标识别异常困难,常用的方法基于模式识别,由信息获取、预处理、特征提取、分类器设计和分类器组成。传统识别方法的核心在于找到对信噪比和使用环境宽容的特征提取算法[1]。与光学图像不同,声呐图像具有低分辨率、噪声多、轮廓模糊等特点,这使得找到适合声呐图像特征提取算法的难度进一步提高。研究者们提出了各种不同的方法来解决这个问题。
J.Sawas等人采用基于人脸检测的Viola和Jones分类器级联来识别海底地形的真实和合成图像,从而大大减少计算时间[2]。David M.Lane等人的分类方法是基于特征提取和先验特征库匹配的,需要有先验数据作为支持。Myer F和Fawcett J的分类方法是通过将目标图像的高光区域和阴影区域与计算模板进行匹配来实现的,但该方法要求对目标进行三维建模[3]。Scott Reed则提出了一种基于协同操作的统计模型,在利用声呐图像高亮和阴影之间的空间关系提取目标特征用于识别[4]。哈尔滨工程大学的陈强则针对蛙人和鱼群的声呐图像进行特征提取,并使用BP神经网络分类器进行训练[5]。Stack J R等学者优化了特征提取过程中的内核匹配追踪算法,使其既能提取学习过程中的参数,又能确定数据采集的先验参数[6]
在水下目标识别和检测方面,YOLO系列算法是一类高效的一阶段目标检测算法,通过将目标检测任务视为一个回归问题,直接在输入图像上预测边界框的坐标和类别概率,之前的研究大多基于YOLOv4及以下的版本[7-9],随着技术的发展和迭代,已经有更多版本的YOLO算法被提出并成为研究主流,目前常用的有YOLOv5、YOLOX、YOLOv7和YOLOv8等。研究人员首先尝试在YOLOv5算法的基础上加入不同的创新点来提升水下目标检测技术的性能,包括引入注意力机制[10]、改进特征融合模块[11]、优化损失函数等。YOLOX是YOLOv5的一个改进版本,引入了Anchor-free机制,去除了锚点框,简化了模型结构,使其在不影响目标检测准确性的情况下也能够满足水下无人平台的轻量级要求。在这些改进的基础上,研究人员提出了一个基于MobileViT视觉转换器和YOLOX的新型水下目标检测模型[12]。YOLOv5s是YOLOv5的一个小型化版本,专为资源受限的环境设计,牺牲了一定的检测精度以换取更快的速度。在YOLOv5s的基础上研究的主要创新点包括改进网络结构[13]、双向特征融合算法并引入全局注意力机制[14]、引入Mosaic-max数据增强方法[15]等,增强了特征提取能力和小目标检测精度。
然而,诸多水下声呐图像识别的网络在轻量化方面还有所欠缺。为了降低网络的参数量、计算量和推理时间,本文以体积仅有14M的YOLOv5s网络为基准模型,通过考虑融合两种网络结构,即MobileNetV3网络模块和ShuffleNetV2,在保证模型精度的前提下进一步轻量化网络。

1 基于YOLOv5的声学目标识别框架

在目标检测领域,YOLOv5算法凭借其卓越的检测精度与鲁棒的目标区域捕获能力,已成为当前最具竞争力的检测架构之一。基于此,本研究选取YOLOv5s作为水下声呐图像目标检测的基准模型,重点针对复杂水下场景下的模型部署需求开展网络轻量化研究。通过引入MobileNetV3与ShuffleNetV2两种轻量化网络架构,对YOLOv5的主干网络进行结构性重构:首先,采用深度可分离卷积替代传统标准卷积运算,构建高效的通道注意力机制;其次,通过通道重排技术优化特征复用效率;最后,建立多尺度特征融合机制以增强小目标检测能力。基于上述方法构建轻量化混合架构的实验结果表明,改进后的模型在精度损失可控的前提下,有效降低了计算复杂度和参数量。这一优化为水下声呐图像的实时识别提供了更加高效的技术路径。具体的目标识别框架见图1
图1 目标识别框架图

Fig.1 Target recognition framework diagram

1.1 YOLOv5模块

YOLOv5的网络模型由四个核心模块构成,包括输入端(Input)、主干网络(Backbone)、颈部(Neck)网络和输出端(Output)。其算法流程首先从输入端接收待检测的图像数据,随后通过Backbone网络进行多层次的卷积操作,提取出包含丰富语义信息的特征图。接着,这些特征图被传递到Neck部分通过特征金字塔结构实现多尺度特征融合,增强模型对不同尺度目标的检测能力。然后,Head部分基于聚合后的特征信息,通过预设的锚框(Anchor)机制进行目标定位与分类,生成初步的检测结果。最后,算法通过非极大值抑制等后处理技术,根据置信度阈值对预测框进行筛选和过滤,剔除冗余和低置信度的结果,输出最终的精准检测结果。这一流程确保了YOLOv5在目标检测任务中兼具高效性和准确性。其原理网络结构如图2所示。
图2 YOLOv5s结构图

Fig.2 YOLOv5s structure diagram

1.2 轻量化网络模块

随着移动设备和嵌入式系统的普及,轻量化卷积神经网络已成为近年来深度学习领域研究的热点之一。相较于传统的深层网络模型,轻量化网络在参数量、计算量和存储需求方面更加高效。此外,轻量化网络还可以更适合在移动设备等资源受限的环境中部署,可以提供更快的推理速度和更好的性能表现。本文考虑两种轻量化的网络模块。

1.2.1 MobileNetV3网络模块

MobileNetV3是一种高效的轻量级卷积神经网络,旨在为移动设备和嵌入式平台提供快速、准确的目标检测和分类。MobileNetV3通过优化网络架构,包括引入SE模块(Squeeze and Excitation)[16]、h-swish激活函数以及深度可分离卷积等策略,实现了模型精度和速度的高效平衡。MobileNetV3网络的层结构图如图3所示。
图3 MobileNetV3网络结构图

Fig.3 MobileNetV3 network architecture diagram

通过架构搜索,MobileNetV3找到了最优结构,结合MobileNetV3轻量化网络时,将原模型的主干网络替换为MobileNetV3网络模块进行特征值的提取,替换后的网络原理图如图4所示。
图4 YOLOv5s-MobileNetV3网络结构图

Fig.4 YOLOv5s-MobileNetV3 network architecture diagram

1.2.2 ShuffleNetV2网络模块

ShuffleNetV2是一种专为移动设备和嵌入式平台设计的高效轻量级卷积神经网络,旨在实现快速且准确的目标检测与分类任务。其核心在于采用了通道重排(Channel Shuffle)结构和深度可分离卷积(Depthwise Separable Convolution)等先进技术,显著提升了模型的计算效率和推理速度。为了进一步优化特征提取能力,ShuffleNetV2引入了一系列创新的单元模块,例如倒残差(Inverted Residual)结构和Ghost Bottleneck模块。这些模块通过灵活的特征变换与信息融合机制,有效增强了网络对多层次特征的捕捉能力,从而显著提升了分类与检测的综合性能。此外,ShuffleNetV2在保持轻量化的同时,通过优化网络架构和参数配置,实现了更高的精度与更低的计算开销,使其在资源受限的环境中表现出色。ShuffleNetV2网络的层结构图如图5所示。
图5 ShuffleNetV2网络结构图

Fig.5 ShuffleNetV2 network architecture diagram

ShuffleNetV2轻量化网络主要通过优化信息流和减少内存访问成本来提升性能。将原网络替换为ShuffleNetV2网络模块进行特征值的提取,替换后的网络原理图如图6所示。
图6 YOLOv5s-ShuffleNetV2网络结构图

Fig.6 YOLOv5s-ShuffleNetV2 network architecture diagram

2 数据增强方法

2.1 增强数据集

通过增加训练数据集,可以让数据集尽可能多样化。本节先对两种用于数据增强的库进行对比。
Augmentor使用基于流水线的方法,其中按顺序添加操作以生成管道。然后,图像通过此管道传递,每个操作在图像通过时应用于图像。此外,根据每个操作的用户定义的概率值,它在通过管道时随机应用操作。其允许创建扩充管道,该管道将随机应用的操作链接在一起,其中每个操作的参数也在用户指定的范围内随机选择。这意味着每次图像通过管道时,都会返回不同的图像。根据管道中的操作数量以及每个操作可用值的范围,可以用这种方式创建大量新图像数据。
在深度学习数据预处理领域,imgaug库为图像增强提供了多维度的解决方案。其核心功能可划分为几何变换与像素级操作两大类别:前者涵盖旋转、平移、尺度缩放、剪切及水平/垂直翻转等空间变换操作;后者包含高斯噪声注入、对比度线性调整以及色彩空间扰动等非线性变换。相较于Augmentor等传统工具,imgaug的核心优势体现在多模态数据协同处理机制——在执行图像增强时,可同步完成关键点(keypoints)坐标的仿射变换计算及边界框(bounding boxes)的几何校正,其坐标转换精度可达亚像素级。例如在目标检测任务中,通过建立图像矩阵与标注文件的关联映射,系统可自动生成与增强后图像严格匹配的XML/TXT标注文件。实验表明,该机制可有效保障数据增广过程中标注信息的空间一致性,避免因坐标偏移导致的标注失效问题。正确的转移标注框十分重要,两种方式的数据增强结果如图7所示。
图7 有无标识框转移的对比

Fig.7 Comparison of transfer with and without identification boxes

对于水下声呐数据集这种难以手动标注的图像数据,其标注过程通常具有较高的复杂性和时间成本,因此,同时生成图像的标识框以及对应的标识文件显得尤为重要。通过自动化生成标识框,不仅可以显著减少人工标注的工作量,还能有效避免人工标注带来的误差。为了实现这一目标,采用imgaug这一强大的图像增强工具库对数据集进行预处理和增强操作尤为关键,图8是具体增强的结果。
图8 数据增强结果

Fig.8 Data augmentation results

2.2 数据集优化

在分类模型的训练过程中,类别不平衡问题对模型的泛化性能产生了显著影响。在本研究涉及的三分类任务中,训练集呈现出明显的长尾分布特征:类别A、B、C的样本比例分别为70%、25%和5%,各类别之间的样本量级差异极为显著。实验结果表明,基准模型在未引入数据增强技术时,尽管类别A的样本数量占据绝对优势,但由于整体数据集规模有限,模型尚未表现出明显的过拟合与欠拟合的耦合现象。然而,在对数据集进行扩展和增强后,数据基数显著增加,此时类别不平衡问题被进一步放大,其影响呈指数级增长。这种分布畸变直接导致了模型的病理化学习倾向:模型对主导类别A的过拟合现象愈发严重,同时对稀有类别C的欠拟合问题也进一步加剧。具体表现为模型在训练过程中倾向于过度拟合类别A的特征,而无法充分学习类别C的判别信息,最终导致分类性能在类别C上的严重下滑。这种不平衡问题不仅限制了模型的泛化能力,还削弱了其在实际问题中的实用性,训练结果如图9所示。
图9 数据训练过拟合结果

Fig.9 Data training overfitting results

本文针对数据不平衡问题,结合数据扩充和重采样等多种策略,从数据分布调整的角度提出解决方案。下面是两种方法的介绍:
(1)扩充数据集:首先尝试获取更多数据,特别是针对小类别样本数量非常少的情况。更多的数据通常能够提供更多的分布信息。
(2)重采样数据集:过采样和欠采样是两种重采样方法。过采样是指对小类别样本进行增加,即采样数大于该类样本数。而欠采样则相反,对大类别样本进行减少,即采样数少于该类样本数。
针对前期数据增强处理后仍存在的类别间分布不均衡问题,本研究重点增强失事飞机和遇难者两类样本,以解决因其样本数量较少而导致的欠拟合现象。通过定向增强,本研究有效平衡了三类目标的样本分布。该处理方案不仅消除了类别间表征差异导致的偏置问题,更为后续开展的消融实验建立了可靠的基准框架。结果如图10所示。
图10 不平衡数据集处理后的结果

Fig.10 The result of processing imbalanced datasets

3 实验结果与分析

3.1 实验数据集与评价指标

本研究针对水下目标快速识别的实际需求,重点优化了数据集的选择策略,并通过合理的评价指标进行实验的验证。

3.1.1 数据集选择

由于获取水下声呐数据的难度较大,其模糊程度增加了标注难度,本文使用了公开的声呐数据集。根据数据集的要求,选择了常见的声呐数据集SCTD[17-19],该数据集共包含357张高分辨率图像,其中涉及596个目标。数据集中同时包括侧扫声呐图像、合成孔径声呐图像、干涉合成孔径声呐图像以及前视声呐图像。

3.1.2 评价指标

为评估实验效果,本研究采用了混淆矩阵、准确率(Precision)、召回率(Recall)、平均精度(Average Precision, AP)及平均精度均值(mean Average Precision, mAP)等指标来衡量模型的准确性,同时利用参数量、模型体积、每秒浮点计算次数(FLOPs)和检测速度(Frames Per Second, FPS)等指标来评估模型的计算复杂度、存储大小及推理效率。该评价体系确保了对模型性能的全面评估。

3.2 实验环境

本文实验环境首先在Windows10系统的基础上,建立以Anaconda3为背景的conda虚拟环境,其中的软件版本为Python 3.8.7、Pytorch 1.10.0、CUDA10.2,并在Pycharm中进行程序编译。

3.3 实验结果分析

本文选择YOLOv5作为水下声呐目标检测的基础算法,又在其中根据模型大小、检测速度选择了YOLOv5s模型,在数据增强、平衡数据集之后进行实验,验证基础模型的效果,识别结果如图11所示。
图11 YOLOv5s模型识别结果

Fig.11 YOLOv5s model recognition results

从可视化识别结果可以看出,在声呐图像仅存在单个目标且没有无效区域或多目标干扰的情况下,检测结果较为理想。然而,当出现无效区域时,原始模型存在以下问题:首先,被无效区域阻断的大目标被误识别为两个独立目标;其次,部分无效区域被误检为有效目标;此外,单目标框选未能一次性成功。这些问题将在后续改进实验中通过提升召回率和精确度的方式得到改善,并在结果中展示改进效果。原始模型的部分训练参数如图12所示。
图12 原始模型训练参数

Fig.12 Original model training parameters

上图展示了训练后的mAP值和召回率的变化曲线,图示反映了训练过程中上述两项参数的变化趋势,同时也呈现了三类目标各自的参数变化情况。这些参数的变化将在后续改进实验中进一步展示。在加入轻量化模块之后,相对于原网络的结果改进是在保证精度没有大幅下降的前提下减少了模型的参数量和模型权重的大小,轻量化网络的识别结果与原网络的结果对比如图13所示。
图13 轻量化网络识别结果对比

Fig.13 Comparison of lightweight network recognition results

图13展示了同一张侧扫声呐图片在三种网络下的识别结果,该图片具有模糊性和抽象性,是一张具有代表性的样本。从图中可以看出,原始网络的识别率较高,两种轻量化网络的识别结果也较为准确,这与前述提到的轻量化网络在基本不降低精度的前提下对模型本身有所改善的结果一致。从精确度角度来看,实验结果的直观可视化也表明轻量化网络的性能并未显著下降,轻量化网络部分训练参数对比结果见表1
表1 轻量化网络训练参数对比

Tab.1 Comparison of lightweight network training parameters

模型 Precision/% Recall/% mAP/% Params/M layers
MobileNetV3 95.3 96.7 98.7 2.14 287
ShuffleNetV2 95.8 94.4 96.5 5.99 193

3.4 消融实验

进行轻量化网络改进时,首先需要关注的是轻量化对原网络的影响,评价指标是衡量网络优劣的方法之一。当然,指标评判只是对网络性能的客观评价,还包括权重模型大小、检测速度等直观的评判标准。首先,我们对两种轻量化网络的损失函数数据进行了对比,如图14所示。
图14 轻量化网络损失函数对比

Fig.14 Comparison of lightweight network loss functions

图14可以观察到,MobileNetV3与ShuffleNetV2这两种轻量化卷积神经网络在损失函数的表现上呈现出显著的差异。具体而言,MobileNetV3的损失函数曲线在整个训练过程中变化较为平缓,损失值波动幅度较小,表明其优化过程具有较好的稳定性和收敛性;相比之下,ShuffleNetV2的损失函数曲线则表现出较大的波动幅度,其变化趋势更为剧烈,可能存在训练不稳定的现象。因此,从损失函数这一评价指标来看,MobileNetV3相比ShuffleNetV2展现出更优的优化特性,较小的损失函数值也预示着其具有更强的特征提取能力和区域捕获精度。然而,需要特别强调的是,损失函数仅仅是评估网络性能的一个方面,并不能全面反映目标检测模型的优劣。在实际应用中,目标检测网络的性能评估应当从多个维度进行综合考量。为了深入探究轻量化网络在目标检测任务中的性能表现,本文通过系统的消融实验展开了全面的对比分析。两种网络的参数情况与原YOLOv5网络的对比结果具体可见表2
表2 消融实验对比

Tab.2 Comparison of ablation experiments

模型 mAP/% Recall/% Params/M FLOPs/G Weights/MB
YOLOv5 98.7 96.8 7.02 15.8 14.4
YOLOv5-MobileNetV3 98.7 96.7 2.14 3.1 4.7
YOLOv5-ShuffleNetV2 96.5 94.4 5.99 2.4 12.2
消融实验表明,在模型权重方面,MobileNetV3网络比原网络降低了9.7 MB,使网络更加轻量化,而ShuffleNetV2网络对权重模型大小的优化较少,轻量化程度较低。召回率方面,MobileNetV3网络保持了原有水平,而ShuffleNetV2网络略有下降。其检测精度虽未超越原网络,但减少幅度不大,参数量的减少以及浮点数计算的降低对这方面有一定影响。总体来看,轻量化网络具有一定的优越性。

4 结束语

针对水下声呐图像的识别问题,论文以YOLOv5为基础模型,进行了轻量化网络的改进。在保证检测精度的同时引入MobileNetV3和ShuffleNetV2轻量化网络模块,减少了YOLOv5原模型中主干网络的结构层数,显著降低了训练权重模型的大小。参数量的减少使得模型的读取能力和训练能力更加轻便和快速。实验验证了所提出方法的有效性。
[1]
程玉胜, 李智忠, 邱家兴. 水声目标识别[M]. 北京: 科学出版社, 2018.

CHENG Y S, LI Z Z, QIU J X. Underwater acoustic target recognition[M]. Beijing: Science Press, 2018.

[2]
Sawas J, Petillot Y, Yan P. Cascade of boosted classifiers for rapid detection of underwater objects[C]// Proceedings of the European Conference on Underwater Acoustics, 2010: 1 507-1 516.

[3]
MYERS V, FAWCETT J. A template matching procedure for automatic target recognition in synthetic aperture sonar imagery[J]. IEEE Signal Processing Letters, 2010, 17(7): 683-686.

DOI

[4]
Scott R, Yvan P, Judith B. An automatic approach to the detection and extraction of mine features in sidescan sonar[J]. IEEE Journal of Oceanic Engineering, 2003, 28(1):90-105.

DOI

[5]
陈强. 基于水声图像水下目标识别的技术研究[D]. 哈尔滨: 哈尔滨工程大学, 2012.

CHEN Q. Research on underwater target recognition technology based on underwater acoustic image[D]. Harbin: Harbin Engineering University, 2012.

[6]
Stack J R, Arrieta R, Liao X, et al. A kernel machine framework for feature optimization in multi-frequency sonar imagery[C]// Oceans IEEE, 2007.

[7]
WANG G C, GAO J, XIANG Y F, et al. Deep learning-driven underwater polarimetric target detection based on the dispersion of polarization characteristics[J]. Optics & Laser Technology, 2024(174): 110 549.

[8]
邱峰. 基于深度学习的水下目标检测方法研究[D]. 桂林: 桂林电子科技大学, 2023.

QIU F. Research on underwater target detection method based on deep learning[D]. Guilin: Guilin University of Electronic Technology, 2023.

[9]
徐书博. 基于深度学习的轻量级水下目标检测方法研究[D]. 上海: 上海海洋大学, 2023.

XU S B. Research on lightweight underwater target detection method based on deep learning[D]. Shanghai: Shanghai Ocean University, 2023.

[10]
WANG X Y, XUE G, HUANG S T, et al. Underwater object detection algorithm based on adding channel and spatial fusion attention mechanism[J]. Journal of Marine Science and Engineering, 2023, 11(6):1 116.

DOI

[11]
韩发通. 基于深度学习的水下目标检测与分割算法研究[D]. 济南: 山东建筑大学, 2023.

HAN F T. Research on underwater target detection and segmentation algorithm based on deep learning[D]. Jinan: Shandong Jianzhu University, 2023.

[12]
SUN Y, ZHENG W X, DU X, et al. Underwater small target detection based on YOLOX combined with MobileViT and double coordinate attention[J]. Journal of Marine Science and Engineering, 2023, 11 (6):1 178.

DOI

[13]
张银胜, 杨宇龙, 胡宇翔, 等. 改进视觉注意力网络的水下目标检测算法[J]. 国外电子测量技术, 2023, 42(12): 132-143.

ZHANG Y S, YANG Y L, HU Y X, et al. Underwater target detection algorithm based on improved visual attention network[J]. Foreign Electronic Measurement Technology, 2023, 42(12): 132-143.

[14]
王立成. 基于深度神经网络YOLO的水下目标检测算法研究[D]. 桂林: 桂林电子科技大学, 2023.

WANG L C. Research on underwater target detection algorithm based on deep neural network YOLO[D]. Guilin: Guilin University of Electronic Technology, 2023.

[15]
李孟奇. 水下图像增强与目标检测算法研究[D]. 哈尔滨: 哈尔滨理工大学, 2022.

LI M Q. Research on underwater image enhancement and target detection algorithm[D]. Harbin: Harbin University of Science and Technology, 2022.

[16]
HU J, SHEN L, SUN G. Squeeze-and-excitation networks[C]// 2018 IEEE/CVF Conference on Computer Vision and Pattern Recognition. Salt Lake City: IEEE, 2018: 7 132-7 141.

[17]
周彦, 陈少昌, 吴可, 等. SCTD1.0: 声呐常见目标检测数据集[J]. 计算机科学, 2021, 48(S2): 334-339.

ZHOU Y, CHEN S C, WU K, et al. SCTD 1.0: sonar common target detection dataset[J]. Computer Science, 2021, 48(S2): 334-339.

[18]
刘旭, 林森, 陶志勇. 全局特征双注意力融合对抗网络的水下图像增强[J]. 电光与控制, 2022, 29(7):43-48.

LIU X, LIN S, TAO Z Y. Enhancement of underwater images via global feature dual attention fusion generative adversarial network[J]. Electronics Optics & Control, 2022, 29(7):43-48.

[19]
李瑜辉, 崔慧霞, 李耀敏, 等. 基于轻量化门控卷积网络的实时Transformer水下目标检测方法[J]. 水下无人系统学报, 2025, 33(2): 229-237.

LI Y H, CUI H X, LI Y M, et al. Real-time transformer detection of underwater objects based on lightweight gated convolutional network[J]. Journal of Unmanned Undersea Systems, 2025, 33(2): 229-237.

文章导航

/