一种用于SAR图像去噪的双分量深度学习网络

热门论文|一种用于SAR图像去噪的双分量深度学习网络

1.Intruction

    在目标识别、对象追踪和图像分类等领域,对高质量合成孔径雷达图像(SAR image)的需求十分迫切。然而,合成孔径雷达图像的质量天生就会受到多重信道噪声的影响,这极大地阻碍了图像的应用。

    2017年以来,基于深度学习的方法能很好地学习噪声图像和无噪声图像之间的底层映射,然而,与光学图像训练不同的是,在现实中无法直接获得无噪声的SAR图像。为了产生训练对,一般是利用乘性噪声模型的光学图像来模拟噪声SAR图像,这就产生了一个问题:在模拟过程中需要固定添加噪声的统量。一旦要添加的噪声是固定的,深度学习模型只能学习固定类型的噪声分布,这会导致过度平滑(oversmo-othing)或过于注重某些细节(fake details)而失去了泛化性。因此,使深度学习模型具有自校正能力,是实现SAR图像去噪优越性的关键。

     该论文引入了纹理层次图(TLM)的概念,设计了一个双分量深度学习网络来解决上述问题。TLM是一种热图,它显示了图像的模式分布的随机性、均匀性和比例尺。该网络由两个子网组成,即纹理估计子网和噪声去除子网。前者用于生成TLM,后者用于根据原始SAR图像和相应的TLM去除噪声。

2.Method

A.纹理层次图

    与测量光学图像去噪结果的质量不同,SAR图像中真实的去噪图像是不可获取的。因此,相比于结构相似度指数(SSIM)和峰值信噪比(PNSR),等效视数(ENL)是评价SAR图像去噪方法最常用的指标。但由于过平滑滤波器可以获得相对较高的ENL,因此只使用ENL作为评价指标是不够的。该论文使用的评价指标是灰度共生矩阵(GLMC)的二阶统计量,即同质性(homogen-eity)。纹理图案越随机,其同质性越低。利用固定尺寸和步长的滑动窗口策略,可以计算出图像的局部同质性。然后,用双三次插值对局部同质性进行采样,恢复到原始图像的大小。最后的输出为图像的纹理级映射(TLM)。

B.双分量深度学习网络

    为了将TLM嵌入到网络中,该论文设计了一个双分量的深度学习网络。FCNe(全卷积网络)为纹理估计子网,FCNd为去噪子网。FCNe将噪声图像作为输入,输出与噪声图像大小相同的TLM。然后,将TLM和噪声图像连接起来,形成FCNd的双通道输入,输出最终的滤波结果。网络架构如图1所示。 在这里插图1.网络架构入图片描述
图1.网络架构

    FCNe由五个卷积层和RELU激活层组成,它们遵循典型的FCN范式。卷积核的大小设置为3x3。FCNd为U型结构,利用跳跃连接(skip connections)和反褶积(deconvolution)来扩大接受域,探索多尺度特征。该网络包括降维路径(图1中的蓝色部分)和尺寸恢复路径(图1中的黄色部分)。FCNd的基本组成部分是致密块(dense block),由BN层、RELU激活层、2个卷积层和1个dropout层(防止过拟合)。FCNd中所有的卷积核尺寸都设置为3×3。在每个降维步骤中,使用maxpooling层(用来降维且增加感受野),并将输入的大小减少一半。降维路径以降低图像空间尺寸为代价提取多尺度内容特征,从而产生消失梯度问题。因此,尺寸恢复路径采用反褶积的方式来恢复输出的大小,并使用了跳跃连接的方式结合两条路径之间的特点,来维护细节,使得网络训练更加容易。

3. EXPERIMENTS & CONCLUSION

    该论文中的实验一共包含了两方面,分别是拟真SAR图像和真实SAR图像。在对拟真SAR图像的实验中,使用的是峰值信噪比(PSNR),结构相似性(SSIM)和边缘保持指数(edge preservation index:EPI)来进行测评。该模型分别和DnCNN, WNNM, GFCNN算法进行了对比,比较后得到的结果如下(黑体标识是最优指标)。 在这里插入图片描述     在该网络中,输入模式与之前自学习得到的标准模式进行比较。这种比较不是通过在一个大的窗口中直接进行模式匹配来进行的,而是通过在一些小的窗口中分段模式匹配来进行的。只有当两种模式之间的差异在任何一个小的窗口中都不超过一定的限度时,该网络才会判断出这些模式与其他模式是一致的。

    在对真实SAR图像的实验中,由于没有去噪的图像,使用的指标为UMQ和等效视数(ENL),将其分成UQME和UQMH两类进行评价。前者表示比率图的均匀性,后者量化比率图中的剩余结构,UQME和UQMH的值越小,表明滤波器的性能越好。

    从表2可以看出,由于WNNM和DnCNN具有过大的噪声抑制能力,因此它们获得了过高的ENL。该模型比GFCNN和FCNd获得更好的ENL。对于UMQE和UMQH,该方法的结果是理想的,在比率图像中保留了较少的剩余结构。总的来说,该方法在去除噪声的同时保留了大部分结构和细节,取得了很好的效果。 在这里插入图片描述 在这里插入图片描述