最新刊期

    2024 39 8

      图像分割

    • 在遥感图像地物分割领域,专家提出了一种基于轻量化网络的DeepLabV3+改进方法,有效解决了细节信息丢失和类别不均衡问题,显著提升了分割性能和准确性。
      马静,郭中华,马志强,马小艳,李迦龙
      2024, 39(8): 1001-1013. DOI: 10.37188/CJLCD.2023-0293
      摘要:针对DeepLabV3+在遥感图像地物分割中出现的细节信息丢失、类别不均衡等问题引起的误差,提出一种基于轻量化网络的DeepLabV3+遥感图像地物分割方法。首先,使用MobileNetV2替换原始基准网络中的骨干网络,提高训练效率并减少模型的复杂度。其次,增大ASPP结构中空洞卷积的膨胀率,并在ASPP最后一层使用最大池化,有效地捕获不同尺度的上下文信息,同时在ASPP每个分支中引入SE注意力机制,并在提取浅层特征之后引入ECA注意力机制,提高模型对不同类别和细节的感知能力。最后,使用加权的Dice-Focal联合损失函数进行优化,处理类别不均衡的问题。将改进的模型分别在CCF和华为昇腾杯竞赛数据集上进行验证,实验结果表明,本文所提出的方法相较于原始DeepLabV3+模型在两种测试集上的各个指标均有不同程度的提高。其中,mIoU达到了73.47%、63.43%,分别提高了3.24%和15.11%;准确率达到了88.28%、86.47%,分别提高了1.47%和7.83%;F1指数达到了84.29%和77.04%,分别提高了3.86%和13.46%。改进后的DeepLabV3+模型可以更好地解决细节信息丢失和类别不均衡的问题,提高遥感图像地物分割的性能和准确性。  
      关键词:MobileNetV2;空洞卷积;注意力机制;损失函数   
      47
      |
      9
      |
      0
      <HTML>
      <网络PDF><WORD><Meta-XML>
      <引用本文> <批量引用> 42811623 false
      发布时间:2024-08-16
    • 在中医舌诊领域,研究者提出了一种基于双模型互学习的半监督舌体图像分割方法,通过少量标签数据实现高精度分割,为中医舌象分析和诊疗数字化提供了新方案。
      李方旭,徐望明,徐雪,贾云
      2024, 39(8): 1014-1023. DOI: 10.37188/CJLCD.2023-0308
      摘要:舌体图像的准确分割是中医舌诊客观化分析的重要前提,目前广泛采用的全监督分割方法需要对大量像素级标注的样本进行训练,而基于单一模型的半监督分割方法对学习到的错误知识缺乏自我纠正能力。针对这一问题,本文提出一种新颖的基于双模型互学习的半监督舌体图像分割方法。首先,模型A、B分别在有标签数据集上进行监督训练。之后,模型A、B进入互学习阶段,使用本文设计的互学习损失函数,根据双模型对无标签数据预测的分歧而赋予不同的权重。先由模型A对无标签数据集生成伪标签,模型B在有标签数据集和伪标签数据集上进行微调,然后模型B再对无标签数据集生成伪标签,模型A以同样的方式进行微调。双模型微调结束后,选择性能更佳的一个作为最终的舌体图像分割模型。实验结果表明,本文方法的有标签数据比例为1/100、1/50、1/25、1/8时,mIoU分别达到96.67%、97.92%、98.52%、98.85%,优于对比的其他典型半监督方法。本文方法仅需少数标签数据便可达到较高的舌体图像分割精度,可为后续的中医舌色、舌形等舌象分析应用奠定坚实基础,推动中医诊疗数字化进程。  
      关键词:半监督;互学习;舌体图像分割;损失函数;中医数字化   
      42
      |
      10
      |
      0
      <HTML>
      <网络PDF><WORD><Meta-XML>
      <引用本文> <批量引用> 43464456 false
      发布时间:2024-08-16

      图像增强

    • 吴春林,张永爱,林志贤,郭太良,林鹏飞,林坚普
      2024, 39(8): 1024-1036. DOI: 10.37188/CJLCD.2023-0255
      摘要:基于深度学习的高动态范围(High Dynamic Range,HDR)图像处理算法在处理含有人像的图片时存在皮肤偏色问题。针对此问题,本文提出了一种基于多特征融合的人像HDR图像处理算法U²HDRnet。该算法由皮肤特征提取模块、三边特征提取模块、色彩重建模块3部分构成。首先,皮肤特征提取模块分离出皮肤区域的颜色和位置信息;其次,三边特征提取模块分别提取图片的局部特征、全局特征和语义特征,并与皮肤特征融合;最后,色彩重建模块对网格做空间和颜色深度上的插值。此外,本文引入改进的自注意力与卷积融合模块以提升HDR的处理效果;同时本文还制作了人像HDR数据集PortraitHDR,填补了该领域内数据集的空白。实验结果显示,U²HDRnet的PSNR达31.42 dB,SSIM达0.985,均优于目前常见的HDR算法,在获得高质量人像HDR图像的同时避免了皮肤的失真。  
      关键词:深度学习;高动态范围;皮肤特征提取;注意力机制;色彩重建   
      1
      |
      4
      |
      0
      <HTML>
      <网络PDF><WORD><Meta-XML>
      <引用本文> <批量引用> 43069136 false
      发布时间:2024-08-16
    • 在水下图像增强领域,研究者提出了一种基于像素级通道自适应的算法,通过分通道特征提取和色偏纠正,显著提升了图像质量。
      彭晏飞,张添淇,安彤
      2024, 39(8): 1037-1045. DOI: 10.37188/CJLCD.2023-0276
      摘要:现有基于深度学习的算法采用编解码方式在高维特征中对水下图像进行增强,没有考虑水下图像的通道差异性退化特点,导致增强效果普遍较差。针对这一问题,提出了一种基于像素级水平的通道自适应水下图像增强算法,将水下图像在像素级分R、G和B 三通道进行增强。此算法分4个阶段,通过4个阶段的分通道特征提取完成整个增强过程。首先,通过增强网络的局部和全局语义,优化通道衰减来修复上下文的颜色通道;其次,通过注意机制聚合空间和通道特征,并抑制不相关的颜色定位跳跃信息;然后,通过优化注意力机制调整自适应特征;最后,为提高算法色偏纠正能力,提出了一个色偏纠正模块,在第四阶段使用色偏调节模块进一步调整图像的色偏问题。在UIEB数据集和EUVP数据集上与其他算法进行对比,本文算法的PSNR指标提高了14.35%,SSIM提高了5.8%,UIQM提高了3.2%,UCIQE提高了13.7%,且主观效果最佳。  
      关键词:水下图像增强;通道增强;像素级增强;深度学习   
      96
      |
      14
      |
      0
      <HTML>
      <网络PDF><WORD><Meta-XML>
      <引用本文> <批量引用> 42232401 false
      发布时间:2024-08-16
    • 在水下图像增强领域,本研究基于Unet网络,通过多尺度输入和特征融合,引入颜色校正和双重注意力模块,有效提升了图像质量。实验结果显示,算法在多个数据集上显著优于其他方法。
      陶洋,武萍,刘羽婷,方文俊,周立群
      2024, 39(8): 1046-1056. DOI: 10.37188/CJLCD.2023-0274
      摘要:为了解决水下图像存在的颜色失真、细节模糊问题,本文算法以Unet网络为基本框架,同时在不同编码层中输入多尺度图像,通过融合上下层间的特征流来获得更优异的细节保持效果,实现了从粗到细的细节提取能力。此外,引入颜色校正模块和双重注意力模块,有效解决了水下图像色偏问题和细节恢复不均匀的问题。实验结果表明,在UFO、EUVP、UIEB数据集上,本文算法增强图像的PSNR和UIQM指标比原始图像平均分别提高了21.3%和25.6%。该算法能有效改善水下图像的视觉质量,在主观视觉和客观评价指标上优于其他算法。  
      关键词:水下图像增强;多尺度特征;颜色校正模块;注意力机制   
      134
      |
      17
      |
      0
      <HTML>
      <网络PDF><WORD><Meta-XML>
      <引用本文> <批量引用> 42811398 false
      发布时间:2024-08-16
    • 在光伏组件电致发光缺陷自动识别领域,研究者采用cycleGAN生成太阳电池EL缺陷图像,并通过与DCGAN的对比实验,验证了cycleGAN在图像有效性、相似性和多样性方面的显著优势,为该领域研究提供了有效解决方案。
      何翔,杨爱军,黎健生,陈彩云,游宏亮
      2024, 39(8): 1057-1069. DOI: 10.37188/CJLCD.2023-0234
      摘要:针对光伏组件电致发光缺陷自动识别研究中训练用图像不足以及生成图像质量不佳的问题,采用cycleGAN生成了太阳电池EL缺陷图像,并与DCGAN生成的图像进行了综合性对比。将拍摄到的EL图像进行分类和数据增强形成训练集。接着采用训练集对cycleGAN与DCGAN进行训练。最后,从生成图像的有效性、相似性和多样性3个角度对比了两个模型所生成的图像。实验结果表明,cycleGAN所生成的图像中,有效图像的占比显著高于DCGAN。与真实拍摄的图像相比,cycleGAN所生成图像的感官相似性极高,难以通过人眼分辨。cycleGAN所生成图像的FID指标显著低于DCGAN。采用cycleGAN生成图像训练的分类模型对真实拍摄图像的准确率达到93.45%,当训练集中混入少量真实拍摄图像时,该准确率提升至98.26%,显著高于DCGAN。cycleGAN生成图像的平均MS-SSIM指标显著低于DCGAN。采用cycleGAN进行太阳电池EL图像的数据增强是一种行之有效的方法,在有效性、相似性和多样性3方面显著优于DCGAN。  
      关键词:光伏组件;太阳电池;电致发光;cycleGAN;DCGAN   
      4
      |
      3
      |
      0
      <HTML>
      <网络PDF><WORD><Meta-XML>
      <引用本文> <批量引用> 67293254 false
      发布时间:2024-08-16
    • 最新研究进展:针对眼底视网膜图像去雾问题,专家提出基于暗通道理论结合Gamma变换的算法,有效提高图像清晰度,保留血管细节信息。
      盖俊帅,马玉婷,张运海,杨皓旻,刘玉龙,肖昀,魏通达
      2024, 39(8): 1070-1078. DOI: 10.37188/CJLCD.2023-0289
      摘要:针对眼底视网膜图像存在雾状杂散光导致血管细节不清晰的问题,本文提出了一种基于暗通道理论并结合Gamma变换的眼底视网膜图像去雾算法,在不丢失血管细节信息的同时提高了图像的清晰度。该算法通过分别处理R、G、B通道来对图像去雾。首先,通过自适应窗口最小值滤波算法计算暗通道图像,按照亮度取前最大0.1%像素的平均值作为大气光照强度值;然后,求解图像的粗略透射率,并此基础上使用改进后的导向滤波算法对透射率进行优化;最后,通过大气散射模型和Gamma变换复原出无雾图像。实验结果表明,不同视场复原图像的信息熵、平均梯度分别平均提高18%、24%。本算法能够快速有效地去除眼底视网膜图像中存在的雾状杂散光,复原后的图像清晰自然,保留了视网膜血管细节信息。  
      关键词:图像去雾;视网膜图像;暗通道先验;大气散射模型;Gamma变换   
      42
      |
      33
      |
      0
      <HTML>
      <网络PDF><WORD><Meta-XML>
      <引用本文> <批量引用> 43464365 false
      发布时间:2024-08-16

      目标跟踪与识别

    • 在视频目标跟踪领域,研究者提出了一种基于双分支在线优化和特征融合的算法,有效提升了跟踪目标的判别能力,精度和鲁棒性。
      李新鹏,王鹏,李晓艳,孙梦宇,陈遵田,郜辉
      2024, 39(8): 1079-1089. DOI: 10.37188/CJLCD.2023-0256
      摘要:针对D3S算法对跟踪目标的判别能力不足的问题,提出了一种基于双分支在线优化和特征融合的视频目标跟踪算法。首先,构建双分支的在线优化分类器,实现对目标的二次定位,得到更准确的目标位置响应图;然后,在特征层上实现响应图与搜索特征的融合,并通过encoder模块促进融合过程,进一步突出跟踪目标的特征;最后,通过encoder模块实现模板特征的更新,拟合特征间的差异,提高分割模块的判别能力。在VOT2018和UAV123数据集进行实验,改进后算法与原算法相比,在VOT2018数据集上EAO提高了2.9%,在UAV123数据集上成功率提高了2.4%,准确率提高了2.9%。实验结果表明,本文方法提高了算法的判别能力,并且进一步提升了精度和鲁棒性。  
      关键词:视频目标跟踪;目标分割;在线优化;特征融合;注意力机制   
      144
      |
      16
      |
      0
      <HTML>
      <网络PDF><WORD><Meta-XML>
      <引用本文> <批量引用> 40708198 false
      发布时间:2024-08-16
    • 欧卓林,吕晓琪,谷宇
      2024, 39(8): 1090-1102. DOI: 10.37188/CJLCD.2023-0278
      摘要:图像配准在脑部疾病的计算机辅助诊疗和远程手术等方面具有重要作用。U-Net及其变体网络广泛应用于医学图像配准领域,在配准精确度和配准时间上取得了较好效果。然而,现有的配准模型在处理复杂图像形变时,难以学习到图像中微小结构的边缘特征,且忽视了不同尺度上下文信息的关联。针对上述问题,本文提出了一种基于跨尺度点匹配结合多尺度特征融合的配准模型。首先,在模型的编码结构中引入跨尺度点匹配模块,增强对图像突出区域特征的表达以及对微小结构边缘细节特征的把握;然后,在解码结构中对多尺度特征进行融合,形成更全面的特征描述;最后,在多尺度特征融合模块中融入注意力模块,突出空间和通道的信息。在3个脑部核磁共振(Magnetic Resonance,MR)数据集上的实验结果表明,以OASIS-3数据集为例,本文方法的配准精确度相较于Affine、SyN、VoxelMorph以及CycleMorph等方法,本文方法分别提升了23.5%、12.4%、0.9%和2.1%;ASD值相较于各方法分别降低了1.074、0.434、0.043和0.076。本文提出的模型能更好地把握图像的特征信息,提升配准的精确度,对医学图像配准的发展具有重要意义。  
      关键词:医学图像配准;编码器-解码器结构;特征加权;特征匹配;注意力机制   
      2
      |
      3
      |
      0
      <HTML>
      <网络PDF><WORD><Meta-XML>
      <引用本文> <批量引用> 67591386 false
      发布时间:2024-08-16

      目标检测

    • 在图像篡改定位领域,本文提出了一种基于双流增强编码和注意优化解码的框架,有效提高了定位精度和鲁棒性,为图像篡改检测提供了新的解决方案。
      朱叶,赵晓祥,于洋
      2024, 39(8): 1103-1115. DOI: 10.37188/CJLCD.2023-0280
      摘要:主流图像篡改定位方法通常通过简单操作融合不同流的不一致特征,导致特征冗余且篡改区域的像素误检。基于此,本文提出基于双流增强编码和注意优化解码的图像篡改定位框架。首先,提出双流增强编码分别对图像和频域特征进行基于噪声和通道注意力的自增强和基于特征映射的交叉注意权重的交互增强。随后,引入多级感受野策略探索多尺度上下文信息,设计邻阶特征聚合模块融合多尺度相邻特征。最后,利用篡改区域和非篡改区域协同增强模型的篡改定位能力,提出注意优化解码模块,消除初始篡改区域预测中边缘像素的错误预测,逐步精确细化篡改定位。在4个主流公共基准数据集NIST16、Coverage、Columbia、CASIA和两个现实挑战数据集IMD20、Wild上与主流篡改定位方法进行对比,本文算法在无微调模型和微调模型两个设置下,在6个数据集上的性能最优,证明本文提出的篡改定位网络能够充分利用多种篡改线索,在不同的篡改数据集上实现篡改区域的有效定位,具有更高的定位精度和更强的鲁棒性。  
      关键词:图像篡改定位;双流增强编码;注意优化解码;邻阶特征聚合   
      81
      |
      18
      |
      0
      <HTML>
      <网络PDF><WORD><Meta-XML>
      <引用本文> <批量引用> 42811729 false
      发布时间:2024-08-16
    • 朱思宇,朱磊,王文武,乐华钢
      2024, 39(8): 1116-1127. DOI: 10.37188/CJLCD.2023-0304
      摘要:无监督学习是当前工业产品缺陷检测领域的主流研究方向,目前主要分为基于重建和基于特征的两类方法。前者构建基于内容感知的映射以将异常区域映射为正常区域并通过残差图像来检测缺陷,注重于图像整体的表现。后者利用高层语义特征以实现定位异常,更加注重图像细节呈现。根据两种方法的优缺点,本文提出一种基于特征与重建融合的方法,有效结合两者优点互补其不足并实现统一的端到端的学习与推理。首先训练一个重建模型,然后采用归一化流模型以充分学习输入正常样本的高可能性数据概率分布,使其与重建模型相融合,有效地提高重建模型缺陷检测以及缺陷定位的准确率。在广泛使用的MVTec AD数据集上,提出的融合模型的平均图像级AUROC达到了98.7%,平均像素级AUROC达到了94.2%,特别地,相比单一重建模型提升了3.3%。提出的特征与重建网络融合模型显著提高了重建网络部分对于缺陷定位的不足,使结果更为精确。  
      关键词:异常检测;重建;内存模块;流模型;融合算法   
      1
      |
      2
      |
      0
      <HTML>
      <网络PDF><WORD><Meta-XML>
      <引用本文> <批量引用> 43069195 false
      发布时间:2024-08-16
    • 在视频异常检测领域,研究者提出了一种结合混合卷积和多尺度注意力的算法,并引入结构相似性损失函数优化模型。实验结果显示,该算法在UCSD-Ped2和CUHK Avenue数据集上的AUC指标显著提升,验证了模型的有效性。
      杨大为,刘志权,王红霞
      2024, 39(8): 1128-1137. DOI: 10.37188/CJLCD.2023-0320
      摘要:基于U-net风格的无监督视频异常检测模型有着较好的检测效果,但由于普通卷积运算使用固有的局部特性,使U-Net风格的编码器无法有效地提取全局上下文信息,并且使用简单的跳跃连接无法获得有效的特征信息,使用的L2损失函数是仅考虑了像素级别的差异而无法捕捉图像的结构特征。对此提出了结合混合卷积和多尺度注意力的视频异常检测算法,并加入结构相似性损失函数(SSIM)优化模型。具体来说,在编码器最后一层添加混合卷积模块,混合空间和位置的特征来提取全局上下文信息。在编码器和解码器之间的跳跃连接中添加多尺度注意力模块,使模型能提取更有价值的特征,实现有效的跳跃连接。使用参数约束结构相似性损失函数与L2损失函数的权重,从而更准确地优化模型。实验结果表明,所提算法在UCSD-Ped2和CUHK Avenue公开数据集上的AUC指标达到96.7%和86.1%,与改进前的模型相比提高了1.6%和1.4%,证明了所提模型的有效性。  
      关键词:上下文信息;跳跃连接;混合卷积;多尺度注意力;结构相似性   
      44
      |
      7
      |
      0
      <HTML>
      <网络PDF><WORD><Meta-XML>
      <引用本文> <批量引用> 43464560 false
      发布时间:2024-08-16
    • 最新研究进展,科学家设计了改进的U-Net网络模型,通过引入注意力机制,显著提升了作物叶片病虫害程度检测的准确性和可靠性,为实现绿色防治提供了有效解决方案。
      刘林,林山驰,李相国,冯敏,许亮
      2024, 39(8): 1138-1144. DOI: 10.37188/CJLCD.2023-0247
      摘要:为了满足作物病虫害绿色防治对病虫害程度检测的需求,设计了一种改进的U-Net网络模型用于作物叶片病虫害程度的检测。首先,选择ResNet50网络作为模型的主干网络,借助迁移学习来提升训练收敛速度和降低计算成本。其次,引入注意力机制对U-Net网络的各层特征提取和融合进行优化,以提高网络模型接收关键信息的能力。实验结果表明,改进的U-Net512网络模型具有最优的检测性能,平均检测精度达到90.14%,平均绝对误差为276.3。通过分析模型不同采样深度下的各层特征图发现,注意力机制的引入使网络模型能够获取并融合叶片整体特征和病害区域特征两个维度的信息,进一步提升模型检测性能。这种方法不仅能够有效地检测作物叶片的病虫害程度,而且具有较高的准确性和可靠性,有助于实现作物病虫害的绿色防治。  
      关键词:病虫害检测;改进U-Net网络;注意力机制;病虫害防治   
      199
      |
      23
      |
      0
      <HTML>
      <网络PDF><WORD><Meta-XML>
      <引用本文> <批量引用> 40850271 false
      发布时间:2024-08-16
    0