最新刊期

    2023 11

      目标检测与识别

    • 刘颖,孙海江,赵勇先
      2023, 38(11): 1455-1467. DOI: 10.37188/CJLCD.2023-0030
      摘要:针对复杂场景下红外图像中弱小目标像素占比少、特征细节不明显致使目标特征提取困难、检测准确率低的问题,提出了一种基于注意力机制的复杂背景下红外弱小目标检测方法。该方法以YOLOv5网络为基础,设计SimAMC3注意力机制模块,优化网络的特征提取层;设计目标检测头,通过增加特征融合层来改变其开始进行特征提取的深度,获得新的弱小目标检测层,使浅层特征层更好地保留弱小目标的空间信息;改进预测框筛选方式,提高距离相近或重叠目标的检测精度。实验选取了两个SIRST红外弱小目标图像数据集,对其进行标注并训练。实验结果表明,改进后的算法与原YOLOv5算法相比,平均精度均值(mAP)分别提升了4.8%和7.1%,在不同复杂背景下均可有效检测出红外弱小目标,体现了良好的鲁棒性和适应性,可以有效应用于复杂背景中的红外弱小目标检测。  
      关键词:深度学习;红外弱小目标;目标检测;注意力机制   
      373
      |
      16
      |
      0
      <HTML>
      <网络PDF><WORD><Meta-XML>
      <引用本文> <批量引用> 33681731 false
      发布时间:2023-11-03
    • 肖振久,赵昊泽,张莉莉,夏羽,郭杰龙,俞辉,李成龙,王俐文
      2023, 38(11): 1468-1480. DOI: 10.37188/CJLCD.2023-0005
      摘要:在目标检测任务中,传统的边界框回归损失函数所回归的内容与评价标准IoU(Intersection over Union)之间存在不相关性,并且对于边界框的回归属性存在一定不合理性,使得回归属性不完整,降低了检测精度和收敛速度,甚至还会造成回归阻碍的情况。并且在回归任务中也存在样本不均衡的情况,大量的低质量样本影响了损失收敛。为了提高检测精度和回归收敛速度提出了一种新的边界框回归损失函数。首先确定设计思想并设计IoU系列损失函数的范式;其次在IoU损失的基础上引入两中心点形成矩形的周长和两框形成的最小闭包矩形周长的比值作为边界框中心点距离惩罚项,并且将改进的IoU损失应用到非极大值抑制(Non-Maximum Suppression,NMS)处理中。接着引入两框的宽高误差和最小外包框的宽高平方作为宽高惩罚项,确定CRIoU(Complete Relativity IoU,CRIoU)损失函数。最后在CRIoU的基础上加入自适应加权因子,对高质量样本的回归损失加权,定义了自适应聚焦CRIoU(Adaptive focal CRIoU,AF-CRIoU)。实验结果表明,使用AF-CRIoU损失函数对比传统非IoU系列损失的检测精度最高相对提升了8.52%,对比CIoU系列损失的检测精度最高相对提升了2.69%,使用A-CRIoU-NMS(Around CRIoU NMS)方法对比原NMS方法的检测精度提升0.14%。将AF-CRIoU损失应用到安全帽检测中,也达到了很好的检测效果。  
      关键词:目标检测;边界框回归;IoU损失函数;非极大值抑制;自适应聚焦损失   
      428
      |
      12
      |
      0
      <HTML>
      <网络PDF><WORD><Meta-XML>
      <引用本文> <批量引用> 33598329 false
      发布时间:2023-11-03
    • 王廷煜,王之一,杨永强,糜小涛,王建立,姚凯男,程雪
      2023, 38(11): 1481-1489. DOI: 10.37188/CJLCD.2023-0045
      摘要:为了解决传统激光差动共焦显微镜(LDCM)无法在测距的同时,进行高精度倾斜角度测量的问题,提出了一种基于差动共焦的倾角测量传感器。在对倾斜表面进行测量时,该传感器首先利用轴向扫描获取的差动响应信号精准定位其焦点位置,然后分析显微镜光瞳面场强分布并提取光斑图像的峰值位置,从而实现对倾角的精准测量。首先,建立聚焦光束经倾斜待测面反射后的光场分布模型,对不同倾斜角度下显微镜光瞳面的场强分布情况进行分析。然后,在分析倾斜光斑特征的基础上,提出了采用改进Meanshift算法进行光斑峰值位置提取的方法。最后,通过实验验证了传感器对倾角测量的有效性。实验结果表明,传感器对倾斜程度(0~8°)测量平均误差为0.011°,对倾斜方向(0~360°)的测量平均误差为0.128°,能够满足利用差动共焦非接触光学探针对三维表面进行检测的过程中,对待测表面倾斜角度测量的要求。该传感器为自由曲面的高精度轮廓测量提供了一种新的方法。  
      关键词:非接触光学探针;差动共焦;三维检测;倾斜测量;峰值提取   
      316
      |
      21
      |
      0
      <HTML>
      <网络PDF><WORD><Meta-XML>
      <引用本文> <批量引用> 35265772 false
      发布时间:2023-11-03
    • 张欣,乔继红,张慧妍,张雁,张鑫,许继平
      2023, 38(11): 1490-1502. DOI: 10.37188/CJLCD.2023-0007
      摘要:基于手机成像质量颜色评价的必要性,提出一种融合相机主观场景成像色彩和白平衡的自动评测方法(CIQA),以充分提取彩色图像相关特征并模拟人眼视觉感知特性来评价图像颜色。首先使用尺度不变特征变换(Scale-invariant feature transform, SIFT)与透射变换相结合的方法,标识主观图像中ColorChecker标准二十四色卡对应的位置;而后构建离差率最小二乘法模型,并采用专家赋权法和熵权法计算色彩还原和白平衡指标权重分配比例;最后,通过多指标权重值对TOPSIS(Technique for Order Preference by Similarity to an Ideal Solution)进行改进,确定各方案与典型正负理想方案的接近程度,实现对智能手机成像质量颜色的优劣排序。对真实场景采集的图片进行实验,并与现有的两种决策方法进行对比验证。结果表明,所提方法能提高评价效率、节省人力,并可以获得与人眼主观判断一致性较好的评价结果。  
      关键词:目标识别;指标;离差率最小二乘法;颜色;智能手机   
      261
      |
      10
      |
      0
      <HTML>
      <网络PDF><WORD><Meta-XML>
      <引用本文> <批量引用> 35178627 false
      发布时间:2023-11-03
    • 赵晓,杨晨,王若男,李玥辰
      2023, 38(11): 1503-1510. DOI: 10.37188/CJLCD.2023-0046
      摘要:针对ResNet18网络模型在面部表情识别时存在网络模型大、准确率低等问题,提出了一种基于注意力机制ResNet轻量网络模型(Multi-Scale CBAM Lightweight ResNet,MCLResNet),能够以较少的参数量、较高的准确率实现面部表情的识别。首先,采用ResNet18作为主干网络提取特征,引入分组卷积减少ResNet18的参数量;利用倒残差结构增加网络深度,优化了图像特征提取效果。其次,将CBAM(Convolutional Block Attention Module)通道注意力模块中的共享全连接层替换为1×3的卷积模块,有效减少了通道信息的丢失;在CBAM空间注意力模块中添加多尺度卷积模块获得了不同尺度的空间特征信息。最后,将多尺度空间特征融合的CBAM模块(Multi-Scale CBAM,MSCBAM)添加到轻量的ResNet模型中,有效增加了网络模型的特征表达能力,另外在引入MSCBAM的网络模型输出层增加一层全连接层,以此增加模型在输出时的非线性表示。该模型在FER2013和CK+数据集上的实验结果表明,本文提出的模型参数量相比ResNet18下降82.58%,并且有较好的识别准确率。  
      关键词:ResNet轻量网络;多尺度空间特征融合;面部表情识别;注意力机制   
      262
      |
      8
      |
      0
      <HTML>
      <网络PDF><WORD><Meta-XML>
      <引用本文> <批量引用> 35641900 false
      发布时间:2023-11-03
    • 许延龙,潘昊,丁柏圆
      2023, 38(11): 1511-1520. DOI: 10.37188/CJLCD.2023-0052
      摘要:合成孔径雷达(Synthetic Aperture Radar,SAR)图像目标识别是SAR图像解译的重要应用。为提高SAR目标识别的稳健性,本文提出基于深度信念网络(Deep Belief Network,DBN)的属性散射中心匹配方法。属性散射中心参数特征丰富,能够很好地反映目标的局部散射特性。DBN发挥深度学习优势,可以实现测试样本与模板样本散射中心集的稳健匹配,并且能够较好地适应噪声干扰、部分缺失等情形。在构建的属性散射中心匹配关系的基础上,定义相似度度量准则。基于最大相似度的原则确定测试样本所属类别。实验依托MSTAR数据集开展,经验证,所提方法对于SAR目标识别问题具有良好的有效性和稳健性。  
      关键词:合成孔径雷达;目标识别;属性散射中心;深度信念网络   
      267
      |
      7
      |
      0
      <HTML>
      <网络PDF><WORD><Meta-XML>
      <引用本文> <批量引用> 35178523 false
      发布时间:2023-11-03
    • 牛朝旭,孙海江
      2023, 38(11): 1521-1530. DOI: 10.37188/CJLCD.2023-0013
      摘要:为实现卷积神经网络在低功耗、边缘计算等场景中的加速计算,设计了一种基于现场可编程门阵列(FPGA)的Winograd算法卷积神经网络加速器。首先,将图像数据和权重数据量化为8位定点数,并设计了硬件卷积计算过程中的量化流程,提升了数据传输速度和计算速度。接着,设计了输入数据缓存复用模块,将多输入通道数据融合后传输,复用了行重叠数据。然后设计了Winograd流水线卷积模块,实现列数据的组合复用,从而最大化重用了片上数据,降低了片上数据存储的占用和带宽压力。最后将加速器在Xilinx的ZCU104开发板上部署。经过实验验证,加速器的卷积层计算性能达到354.5 GOPS,片上DSP计算效率达到0.69,与相关研究相比,实现了1.6倍以上的提升。该加速器能够以高能效比完成基于VGG-16网络的遥感图像分类任务。  
      关键词:卷积神经网络;现场可编程门阵列;Winograd算法;流水线;并行计算   
      298
      |
      11
      |
      0
      <HTML>
      <网络PDF><WORD><Meta-XML>
      <引用本文> <批量引用> 33681767 false
      发布时间:2023-11-03
    • 齐翌辰,赵伟超
      2023, 38(11): 1531-1541. DOI: 10.37188/CJLCD.2023-0056
      摘要:为了提高获取开源航天信息的效率并解决开源航天信息内容较长、数量较为有限、应用常用文本分类模型鲁棒性较差以及文本信息不够直观等问题,本文提出一种基于有监督对比学习的航天信息分类方法。该方法基于带有注意力机制(Attention)的双向长短期记忆网络(Bidirectional Long Short-Term Memory, BiLSTM),融合对比学习技术,对开源的信息进行处理并分析,进而高效地筛选出航天类的信息,利用unCLIP(un-Contrastive Language-Image Pre-Training)模型生成信息对应的图像。实验结果表明,对比CNN(Convolutional Neural Networks)、BiLSTM、Transformer和BiLSTM-Attention等常用的文本分类方法,该方法在准确率、召回率和F1-Score上均表现良好,其中F1-Score达到0.97,同时以图像的形式呈现信息,使信息更加清晰直观。本文方法可以充分使用网络公开的数据资源,有效地提取开源航天信息并生成对应图像,对航天信息的分析和研究具有重要价值。  
      关键词:有监督文本分类;对比学习;文本生成图像;航天信息   
      255
      |
      6
      |
      0
      <HTML>
      <网络PDF><WORD><Meta-XML>
      <引用本文> <批量引用> 35265732 false
      发布时间:2023-11-03
    • 张润江,郭杰龙,俞辉,兰海,王希豪,魏宪
      2023, 38(11): 1542-1553. DOI: 10.37188/CJLCD.2022-0419
      摘要:针对目前增量学习中所面向目标都是固定姿态这一现象,本文考虑了更严格的设定,即面向多姿态目标的在线类增量学习,并提出了无视姿态重放方法来缓解在线类增量学习中面对多姿态目标时的灾难性遗忘。首先,将2D/3D目标进行点云化处理,以方便提取目标的有效几何信息;其次,基于SE(d)(d=2,3)群对网络进行平移旋转等变性改进,使网络能够提取更丰富的几何信息,从而降低模型在每个任务中受目标姿态的影响;最后,根据损失变化采样特定样本用于重放来缓解灾难性遗忘。实验结果表明,在面对固定姿态目标MNIST、CIFAR-10时,本文方法的最终平均精度分别达到了88%和42.6%,与对比方法结果相近,但最终平均遗忘率明显优于对比方法,分别降低了约3%和15%。在面对多姿态目标RotMNIST、trCIFAR-10时,本文方法依旧能很好地保持在固定姿态目标中的表现,基本不受目标姿态的影响。此外,在3D数据集ModelNet40中的表现也依旧稳定。本文所提方法在在线类增量学习中能够不受目标姿态的影响,同时能缓解灾难性遗忘,具有很好的稳定性和可塑性。  
      关键词:在线类增量学习;灾难性遗忘;无视姿态重放;等变性;点云分类   
      317
      |
      7
      |
      0
      <HTML>
      <网络PDF><WORD><Meta-XML>
      <引用本文> <批量引用> 33681660 false
      发布时间:2023-11-03

      图像增强

    • 王德兴,杨钰锐,袁红春,高凯
      2023, 38(11): 1554-1566. DOI: 10.37188/CJLCD.2022-0382
      摘要:为解决由于光的吸收和散射现象导致拍摄的水下图像呈现出严重色偏,对比度低等质量问题,本文提出轻量级特征融合网络和多颜色模型校正相结合的水下图像增强方法。首先使用自构建块代替卷积层的编码器和解码器结构的特征融合网络对水下图像色偏进行校正,网络中改进的特征融合模块降低全连接层对图像空间结构的破坏,保护空间特征,减少模块的参数量。同时改进的注意力模块并行池化计算提取特征图纹理细节且保护背景信息。然后使用多颜色模型校正模块根据像素之间关系进行校正,进一步减少色偏,提高对比度和亮度。实验结果表明,与最新的图像增强方法对比,在有参考图像数据集上,本文方法的NRMSE、PSNR和SSIM评价指标的平均值分别比第二名提升了9.3%、3.7%和2.3%。在无参考图像数据集上,本文方法的UCIQE、IE和NIQE评价指标的平均值比第二名提升了6.0%、2.9%和4.5%。综合主观感知和客观评价,本文方法能校正水下图像色偏,提升对比度和亮度,提高图像质量。  
      关键词:图像处理;神经网络;注意力机制;颜色模型;编码解码结构   
      315
      |
      10
      |
      0
      <HTML>
      <网络PDF><WORD><Meta-XML>
      <引用本文> <批量引用> 33681694 false
      发布时间:2023-11-03
    • 黎明清,王宇庆,孙海江
      2023, 38(11): 1567-1579. DOI: 10.37188/CJLCD.2022-0423
      摘要:在红外焦平面阵列探测器(IRFPA)非均匀性校正问题中,传统的神经网络算法会出现图像边缘模糊、对比度低、“鬼影”等现象。针对此类现象,本文提出一种基于侧窗滤波改进的神经网络非均匀性校正算法。该算法首先对输入图像采用侧窗滤波获得期望图像,在去除非均匀性噪声的同时保护目标边缘细节达到提升图像质量的效果。在此基础上,通过饱和非线性函数抑制校正参数局部发散,能够有效避免校正后图像出现‘鬼影’问题。实验结果表明,使用本文提出的算法能够有效去除图像中的非均匀性噪声,且无明显“鬼影”现象。在3组测试图像序列中,平均图像粗糙度降低了30.17%。在实验计算机上连续处理400帧图像序列最大耗时为37.417 0 s,较基于双边滤波改进的对比算法耗时减少了95.05%,较基于小波主成分分析的对比算法耗时减少了45.81%。本文算法在非均匀性校正效果和算法运行效率方面具有明显优势,为小算力、低功耗移动平台实现实时非均匀性校正提供了新的研究思路。  
      关键词:红外焦平面阵列;非均匀性校正;侧窗滤波;神经网络   
      4
      |
      2
      |
      0
      <HTML>
      <网络PDF><WORD><Meta-XML>
      <引用本文> <批量引用> 43699243 false
      发布时间:2023-11-03
    • 宋巍,师丽彪,耿立佳,马振玲,杜艳玲
      2023, 38(11): 1580-1589. DOI: 10.37188/CJLCD.2022-0387
      摘要:图像几何畸变校正是许多计算机视觉应用的关键预处理步骤。当前基于深度学习的几何畸变校正方法主要解决图像的单一畸变校正问题,为此,本文提出一种改进U-Net网络的图像混合畸变校正方法。首先,提出了一种构建混合畸变的图像数据集的方法,解决了训练数据集稀缺以及畸变类型单一的问题。其次,采用U-Net网络结合空间注意力机制进行图像特征提取及畸变坐标图的重建,将图像校正问题转为畸变图像的逐像素点坐标位移变化的预测问题,并设计了结合坐标差损失和图像重采样损失的损失函数,有效提高校正的准确性。最后,通过消融实验验证了本文方法各模块的性能。与最新基于深度学习的畸变校正方法对比。实验结果表明,本文方法在定量指标和主观评价方面都有较好的表现,对畸变图像的空间坐标校正的平均绝对误差为0.251 9。本文还对GoPro相机获取的光学影像开展了校正实验,进一步验证了本文方法对畸变图像校正的有效性。  
      关键词:混合畸变校正;U-Net;空间注意力;坐标差损失;重采样损失   
      318
      |
      12
      |
      0
      <HTML>
      <网络PDF><WORD><Meta-XML>
      <引用本文> <批量引用> 33596549 false
      发布时间:2023-11-03

      图像分割

    • 蒋诗怡,徐杨,李丹杨,范润泽
      2023, 38(11): 1590-1599. DOI: 10.37188/CJLCD.2023-0010
      摘要:传统的语义分割知识蒸馏方法仍然存在知识蒸馏不完全、特征信息传递不显著等问题,且教师网络传递的知识情况复杂,容易丢失特征的位置信息。针对以上问题,本文提出了一种基于知识蒸馏的特征提炼语义分割模型FRKDNet。首先根据前景特征与背景噪声的特点,设计了一种特征提炼方法来将蒸馏知识中的前景内容进行分离,过滤掉教师网络的伪知识后将更准确的特征内容传递给学生网络,从而提高特征的表现能力。同时,在特征空间的隐式编码中提取类间距离与类内距离从而得到相应的特征坐标掩码,学生网络通过模拟特征位置信息来最小化与教师网络特征位置的差距,并分别和学生网络进行蒸馏损失计算,从而提高学生网络的分割精度,辅助学生网络更快地收敛。最后在公开数据集Pascal VOC和Cityscapes上实现了优秀的分割性能,MIoU分别达到74.19%和76.53%,比原始学生网络分别提高了2.04%和4.48%。本文方法相比于主流方法具有更好的分割性能和鲁棒性,为语义分割知识蒸馏提供了一种新方法。  
      关键词:语义分割;神经网络;知识蒸馏;特征提炼;深度学习   
      264
      |
      7
      |
      0
      <HTML>
      <网络PDF><WORD><Meta-XML>
      <引用本文> <批量引用> 35178660 false
      发布时间:2023-11-03
    • 黄聪,邹耀斌
      2023, 38(11): 1600-1614. DOI: 10.37188/CJLCD.2022-0427
      摘要:对灰度直方图呈现为双峰的图像,传统的二维直方图阈值分割方法虽然比较有效,但在灰度直方图呈现为无峰、单峰或多峰模式时,它们的分割结果较差。考虑到经过二维直方图映射得到的二维生存函数存在密度连续和形态统一等优点,本文基于图像二维生存函数提出一种快速二维累积剩余Tsallis熵阈值分割方法。该方法首先基于二维直方图构造二维生存函数,然后在二维生存函数的基础上定义计算分割阈值的二维累积剩余Tsallis熵目标函数。通过递推算法将计算目标函数的时间复杂度降为O(L2)。最后,基于递推形式的二维累积剩余Tsallis熵准则得到最优阈值向量以进行阈值分割。在26幅合成图像和76幅真实世界图像上将提出的方法与2种快速二维阈值分割方法、2种聚类分割方法以及1种活动轮廓分割方法分别在时间和误分类率(Misclassification Error,ME)2个指标下进行了比较。实验结果表明,在合成图像和真实世界图像中,相比于性能第2的方法,本文方法的时间平均缩短0.013 s,ME值平均降低0.051~0.089。提出的快速二维累积剩余Tsallis熵阈值分割方法不仅在计算效率方面优于对比的5种方法,而且在分割适应性和分割精度方面具有明显优势。  
      关键词:阈值分割;二维直方图;二维生存函数;累积剩余Tsallis熵;快速递推算法   
      232
      |
      14
      |
      0
      <HTML>
      <网络PDF><WORD><Meta-XML>
      <引用本文> <批量引用> 38194359 false
      发布时间:2023-11-03
    0