超分辨率重建(SR)技术旨在从低分辨率(LR)图像中恢复出高分辨率(HR)图像,以补偿采集、传输或存储过程中丢失的细节。这项技术在图像处理、计算机视觉等领域广泛应用。有效的SR算法需精确恢复图像的高频细节,如边缘和纹理,同时保持图像自然,避免产生伪影。图像重建模型需具备泛化能力,能在不同场景下稳定工作,并对噪声和图像退化具有鲁棒性,确保在不理想条件下也能提供可靠的重建结果。此外,重建图像的感知质量需符合人眼视觉特性,且算法应适应不同放大因子和图像退化类型,满足多样化的应用需求。
深度学习技术的兴起极大地推动了图像超分辨率重建领域的发展。近年来,国内外众多学者在深度学习超分重建方面取得了众多进展:卢冰等
[1]提出了一种基于改进的超分辨率残差网络(SRResNet)的低照度图像超分辨率重建方法,该方法通过生成低照度低分辨率图像,并将其与高分辨率图像进行数据对比并输入学习模型;王孝天等
[2]针对CNN在SR任务上忽视提取多尺度特征的问题,提出了一种多尺度融合网络结构,该模型能够从不同空间尺寸的特征图中提取高频和低频特征,并引入注意力机制;董碧娜
[3]针对档案图像修复边缘模糊问题,提出了一种单帧图像超分辨率重建算法,该算法基于DCGAN,并结合MSANet提高重建质量;李永军等
[4]在ESRGAN网络的基础上,通过引入深度多尺度卷积模块、通道注意力模块和胶囊网络,构建了一种基于多尺度卷积、注意力机制和向量神经元的生成对抗网络图像超分辨网络AC-ESRGAN;陈冠豪等
[5]提出了基于转置注意力和CNN的图像超分辨率重建网络(TSA-SFNet),该网络通过调整窗口多头自注意力模块来缓解残差连接引起的振幅问题,并引入通道注意力来激活更多像素进行图像重建,KIM等
[6]提出的VDSR通过引入残差学习框架,使得网络能够专注于学习高分辨率图像和低分辨率图像之间的差异;DONG等
[7]提出的FSRCNN在VDSR的基础上,通过增加网络的深度,利用更多的层来学习更复杂的映射关系;KIM等
[8]又提出了基于递归网络结构的DRCN,通过递归应用相同的网络结构来减少参数数量,这种设计在保持模型复杂度的同时,也保持了较好的重建效果;LAI等
[9]提出的LAPSRN则利用了拉普拉斯金字塔的思想,通过多尺度的方式逐步重建图像;LI等
[10]提出的MSRN是通过结合多尺度特征提取、残差学习以及层次特征融合结构。
综上所述,基于CNN的SR模型相较于GAN网络SR模型不仅在运算速度上有一定优势,同时也有不俗的效果,在设计网络结构时,多尺度特征、残差结构、频域分析等思想也多次证明了其有效性。因此,本文提出了一种基于多尺度特征与注意力机制的图像超分辨率重建方法MSA-SR。该方法通过对时域和频域多尺度特征的分离提取,有效地获取了低分辨率图像的低频和高频特征。在此基础上,本文对高频特征进行了针对性地增强,同时对低频特征实施了保护性增强,以实现清晰且自然的图像超分辨率重建效果。MSA-SR在提升图像细节的同时,保持了图像整体的自然性和真实性。